CN110964702A - 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用 - Google Patents

一种Diels-Alder反应酶的应用及其突变体的制备方法与应用 Download PDF

Info

Publication number
CN110964702A
CN110964702A CN201911136241.8A CN201911136241A CN110964702A CN 110964702 A CN110964702 A CN 110964702A CN 201911136241 A CN201911136241 A CN 201911136241A CN 110964702 A CN110964702 A CN 110964702A
Authority
CN
China
Prior art keywords
reaction
enzyme
diels
mutation
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911136241.8A
Other languages
English (en)
Other versions
CN110964702B (zh
Inventor
雷晓光
高磊
刘小晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201911136241.8A priority Critical patent/CN110964702B/zh
Publication of CN110964702A publication Critical patent/CN110964702A/zh
Application granted granted Critical
Publication of CN110964702B publication Critical patent/CN110964702B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/04Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y121/00Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21)
    • C12Y121/03Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21) with oxygen as acceptor (1.21.3)
    • C12Y121/03003Reticuline oxidase (1.21.3.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y121/00Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21)
    • C12Y121/03Oxidoreductases acting on X-H and Y-H to form an X-Y bond (1.21) with oxygen as acceptor (1.21.3)
    • C12Y121/03008Cannabidiolic acid synthase (1.21.3.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14041Use of virus, viral particle or viral elements as a vector
    • C12N2710/14043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供一种Diels‑Alder反应酶的应用及其突变体的制备方法与应用,属于基因工程技术领域。本发明发现氨基酸序列如SEQ ID No.1所示的Diels‑Alder反应酶,除了能催化底物合成天然D‑A产物,还能催化合成非天然D‑A产物,进一步发现该D‑A反应酶的底物二烯体还包括联苯类、黄酮类、苯并呋喃类。本发明扩宽了D‑A反应酶的底物适用范围,并提供了该酶的突变体,发现这些突变体也能够催化底物合成天然或非天然的D‑A产物。本发明提供的D‑A反应酶及其突变体有助于开发和利用D‑A产物的价值,为其他含有六元环的重要化工前体或天然产物的合成提供了可能性。

Description

一种Diels-Alder反应酶的应用及其突变体的制备方法与 应用
技术领域
本发明属于基因工程技术领域,具体地说,涉及一种来源于桑树的Diels-Alder(D-A)反应酶在利用非天然二烯体为底物合成非天然D-A产物中的应用,以及该酶的突变体在促进Diels-Alder反应中的应用。
背景技术
Diels-Alder(D-A)反应是共轭二烯(diene)与亲二烯体(dienophile)间发生的[4+2]环化反应,是有机化学中构建碳-碳键的重要方法之一,它能一步生成两个碳-碳键和多个手性中心,构建新的六元环和多个手性中心,迅速提高分子的复杂程度,在合成化学中扮演者重要的角色。自然界中存在大量含有六元环骨架的天然产物,这类分子往往结构复杂,但却具有良好的生物学活性,例如抗癌明星分子紫杉醇(taxol)以及dynemycin A。这类天然产物的全合成往往依赖D-A反应作为关键步骤来构建六元环骨架以及新的手性中心,但由于D-A反应缺乏良好催化剂来控制该反应的区域、endo/exo以及立体选择性,在合成过程中会出现很多副产物从而降低目标产物的产率以及立体选择性,如图1所示,这大大降低了D-A反应在全合成以及药物合成中的应用价值。因此开发和利用能够催化D-A反应进行的酶,使之能够选择性地产生某种特定立体结构(例如图1中圆框所示)的D-A产物不仅具有科学创新的价值,也具有很强的工业应用价值,但遗憾的是,目前从自然界中还未发现能够选择性催化分子间D-A反应的酶。
桑白皮(桑树的根皮或者茎皮)是传统中药,具有抗炎,利尿、平喘等等用途,同时也是治疗艾滋病的复方药物(司艾特散)中的有效成分。桑白皮中富含D-A类型的黄酮类天然产物,这些天然产物结构独特,具有良好的抗菌、抗病毒以及抗糖尿病等的生物活性,推测其是由桑树中的氧化酶以及D-A反应酶(DAase)共同参与而生成的,如图2所示。由于其结构复杂,含有多个手性中心,实现这类天然产物的不对称全合成面临着很大的挑战。相比于化学催化剂,酶具有高效性以及立体选择性,
虽然合成化学家们开发出多种不对称催化剂来实现不对称的D-A反应,并利用但到目前为止还未实现酶催化的高效不对称D-A反应。开发和利用能够催化分子间D-A反应的酶对于有机合成,特别是复杂天然产物的合成具有重要意义。在申请人课题组前期工作中,从桑树中鉴定出几种黄素腺嘌呤二核苷酸(FAD)依赖的Diels-Alder反应酶,并证明这些蛋白可以催化分子间D-A反应生成桑树中几种不同D-A类型天然产物。虽然前期工作已经证明了MaDA及其同源蛋白MaDA-1和MaDA-2有一定的底物耐受性,可以识别不同取代的查尔酮作为亲二烯体以及不同类型的二烯体,但其二烯体底物的适用范围比较有限,这限制了该类蛋白在多样化合成D-A类型天然产物及其类似物的应用。为了进一步拓宽MaDA在合成D-A类型化合物上的应用,有必要探讨MaDA是否能识别和催化非天然的亲二烯体与查尔酮之间的D-A反应,以及制备其活性更高的突变体以达到将MaDA开发成底物适用更广更高效的D-A反应酶的目的。
发明内容
本发明的第一个目的是提供一种Diels-Alder反应酶在合成非天然D-A产物中的应用。
本发明所述的D-A产物特指有机合成化学领域,Diels-Alder反应后的具有六元环结构和多个手性中心的产物。
本发明的第二个目的是提供Diels-Alder反应酶的突变体以及这类突变体在促进D-A反应中的应用。
第一方面,本发明提供的Diels-Alder反应酶来源于桑树,命名为MaDA酶,具有:
1)如SEQ ID No.1所示的氨基酸序列;或
2)SEQ ID No.1所示的氨基酸序列经取代、缺失和/或增加一个或多个氨基酸的序列与SEQ ID No.1同源性为80%、85%、90%、95%、98%、99%,且具有同等活性的由1)衍生的蛋白质。
本发明进一步提供编码所述Diels-Alder反应酶的基因,其具有:
1)SEQ ID No.2所示的核苷酸序列;或
2)SEQ ID No.2所示核苷酸序列经取代、缺失和/或增加一个或几个核苷酸;或
3)在严格条件下与1)限定的DNA序列杂交的核苷酸序列。
本发明从桑树中cDNA中扩增出MaDA基因,其核苷酸序列如SEQ ID No.2所示,该序列为一个完整的开放阅读框(ORF),该开放阅读框是从ATG起始,以TGA结束,共有1653个核苷酸。其中,前81个核苷酸ATGCAGTACTTTTCCTTCCCTTCATCGTTAGCCAAAATCACCATCTTTCTGATCTTTTCATTTGTATTCGCAAGTTCAGCT为信号肽序列。
如SEQ ID No.1所示Diels-Alder反应酶MaDA含有550个氨基酸,其中前27个氨基酸(MQYFSFPSSLAKITIFLIFSFVFASSA)为基因编码的信号肽,其在成熟酶蛋白分泌到细胞外的过程中会被切除。因此成熟的MaDA是从Asn28开始,共计523个氨基酸,其理论分子量(MWt)为59075.78,酶蛋白的理论等电点(pI)为6.62。
本发明提供了上述Diels-Alder反应酶在催化Diels-Alder反应合成含有六元环骨架的非天然D-A产物中的应用。
本发明提供了Diels-Alder反应酶的编码基因以及含有该编码基因的生物材料在催化Diels-Alder反应合成含有六元环骨架的非天然D-A产物中的应用。
所述生物材料为表达盒、质粒、载体、微生物、昆虫细胞、动物细胞、植物细胞。
优选地,所述生物材料为表达载体pI-sec-sumostar-tev2,其核苷酸序列如SEQID No.3所示。
本发明提供了表达载体pI-sec-sumostar-tev2在昆虫细胞中表达不含信号肽的成熟MaDA酶蛋白中的应用。
本发明实施例中构建包含MaDA基因序列的表达载体pI-sec-sumostar-tev2,并实现在昆虫细胞(Hi5)的大量表达。利用该载体在昆虫中表达出来的SUMO-MaDA蛋白在N端包含了信号肽、6×His标签以及SUMO标签,其氨基酸序列如SEQ ID No.4所示。
其中,前20个氨基酸(MVSAIVLYVLLAAAAHSAFA)为信号肽,HHHHHH为6×His标签,QDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLTFLYDGIEIQADQTP EDLDMEDNDIIEAHREQIGGSUMO标签,ENLYFQG为TEV酶切位点。利用昆虫表达体系表达纯化出来的成熟蛋白不含信号肽,其蛋白理论分子量(MWt)为73288.49,酶蛋白的理论等电点(pI)为5.76,利用TEV酶水解后,能得到MaDA不带信号肽的成熟蛋白。
具体而言,本发明提供的Diels-Alder反应酶、其编码基因以及含有该编码基因的生物材料在催化Diels-Alder反应合成含有六元环骨架的非天然D-A产物中的应用中,所述催化Diels-Alder反应是以亲二烯体和非天然二烯体为底物进行的合成反应,所述非天然二烯体为联苯类、黄酮类、苯并呋喃类。
进一步地,所述亲二烯体为查尔酮或其衍生物,其苯环上不同位置可以有不同的取代基。
本发明还提供一种D-A反应方法,以SEQ ID No.1所示的氨基酸序列的MaDA酶为反应酶,以查尔酮或其衍生物和非天然二烯体化合物为底物进行合成反应,所述非天然二烯体为苯酚类、联苯类、黄酮类、苯并杂环类。
第二方面,本发明提供了所述Diels-Alder反应酶MaDA的突变体,所述突变体为SEQ ID No.1所示氨基酸序列的以下一种或多种突变:
(1)第116位的H突变为A;(2)第177位的V突变为A;(3)第192位的Y突变为A;(4)第259位的I突变为A;(5)第292位的F突变为A;(6)第356位的F突变为A;(7)第357位的N突变为A;(8)第358位的L突变为A;(9)第358位的L突变为E;(10)第374位的N突变为A;(11)第375位的F突变为A;(12)第443位的R突变为A。
上述1-12号突变体,在与MaDA母体蛋白相比,相对活性依次为:8%,39%,9%,10%,97%,4%,102%,110%,24%,99%。
上述突变体的编码基因属于本发明的保护范围。
进一步地,含有所述编码基因的生物材料,所述生物材料为表达盒、质粒、载体、微生物、昆虫细胞、动物细胞、植物细胞。
本发明提供了上述突变体或其编码基因或含有其编码基因的生物材料在催化Diels-Alder反应中的应用。
本发明提供了上述突变体或其编码基因或含有其编码基因的生物材料在合成天然或非天然D-A产物中的应用。
本发明的有益效果在于,本发明发现来源于桑树的MaDA酶能够以查尔酮或其衍生物和非天然二烯体为底物,立体专一性合成endo构型非天然产物,能够在体外制备D-A类型非天然产物及其衍生物,其高效的endo选择性是目前化学方法达不到的。MaDA酶底物适应性良好,可识别不同取代的查尔酮及其衍生物作为亲二烯体底物,识别天然和非天然二烯体做底物,生成天然和非天然的D-A产物,转化率可达100%,通过碱性条件下水解原位生成不稳定二烯体以及MaDA催化的不对称D-A反应这两步串联反应,能够以较高的收率(最高可达62%)得到不同类型的D-A类型天然或非天然产物。为开发和利用D-A产物的药用价值奠定了基础,同时也为其他含有六元环的重要化工前体或天然产物的合成提供了新的可能性。
附图说明
图1为D-A反应以及其选择性示意图。当催化剂不能很好的控制D-A反应的选择性时,理论上会有八种不同异构体同时生成。
图2为桑科植物中代表性的D-A类型天然产物及其生物合成途径图。桑科植物来源的D-A类型天然产物是由相同的亲二烯体——查尔酮和不同二烯体,包括脱氢异戊烯基黄酮(dehydroprenyl flavonoids),脱氢异戊烯基查尔酮(dehydroprenyl chalcone),脱氢异戊烯基二苯乙烯(dehydroprenyl stilbenes),脱氢异戊烯基苯并呋喃(dehydroprenylbenzofurans)。
图3为昆虫表达载体pI-secSUMOstar的图谱。
图4为桑树愈伤组织粗提物的HPLC成分分析图。A为桑树愈伤组织化学成分的高效液相色谱(HPLC)分析图;B为天然产物chalcomoracin的标准品。
图5为不同纯化组分的活性测试结果图。A为阴性对照,该体系中没有任何蛋白;B中加入了桑树悬浮细胞粗酶液;C中加入了疏水柱纯化后的活性蛋白;D中加入了离子交换柱层析纯化后的活性蛋白;E中加入了分子筛柱层析纯化后的活性蛋白。
图6为不同蛋白活性组分的12%SDS-PAGE图。i)展示的是桑树悬浮细胞粗酶液中总蛋白;ii)展示的是桑树悬浮细胞粗酶液经过疏水柱层析纯化后的活性总蛋白;iii)展示的是在上一步疏水柱层析纯化中所得到的总蛋白又经过离子交换柱层析纯化后的活性总蛋白;iv)展示的桑树悬浮细胞粗酶液依次经过疏水柱层析、离子交换柱层析和分子筛柱层析纯化后得到的活性蛋白。
图7为被富集条带的质谱鉴定结果图。
图8为桑树中reticuline oxidase-like enzyme家族蛋白的转录水平。
图9为MaDA基因的琼脂糖凝胶电泳图。M为核酸marker,1为MaDA基因核酸。
图10为SUMO-MaDA蛋白SDS-PAGE图。M为蛋白marker,1为SUMO-MaDA蛋白。
图11为SUMO-MaDA活性检测结果。
图12为通过手性柱测定产物chalcomoracin的立体选择性。I)展示的是酶催化合成的chalcomoracin的手性HPLC分析图;II)展示的是外消旋的chalcomoracin的手性HPLC分析图。
图13为苯酚类二烯体的活性测试结果图。
图14为联苯类二烯体活性测试结果图。
图15为苯并杂环类二烯体的活性测试结果图。
图16为黄酮类二烯体的活性测试结果图。
图17为一些D-A产物的酶法制备图。
图18为MaDA突变体的活性测试结果图。
具体实施方式
以下实施例对本发明进行详细且具体的说明,但应理解本发明并不限定于以下的例子。若未特别说明,以下实施例所用的试剂、原料均为市售可得。以下实施例所用的菌株、载体、培养基和试剂主要为:
大肠杆菌E.coli DH5α以及DH10Bac的感受态细胞均买自庄盟生物有限公司。表达用昆虫细胞Sf21以及Hi5购买自invitrogen公司。
昆虫表达载体pI-secSUMOstar购买自LifeSensors公司,其谱图如图3所示,将上述pI-secSUMOstar载体中的一段核苷酸序列(AGAGACGATCTGCCGTCTCTCTAGAGCGGCC)置换成含有TEV酶切位点的核苷酸序列(GATTACGATATCCCAACGACCGAAAACCTGTATTTTCAGGGATCCGGAATTCAAAGGCCTACGTCGACGAGCTCACTAGTCGCGGCCGCTTTCGAATCTAGAGCCTGCAGTCTCGAGGCAT,SEQID No.15),从而构建出pI-sec-SUMOstar-tev2载体。使用pI-sec-SUMOstar-tev2载体表达蛋白时,SUMO标签蛋白和目标蛋白之间新增TEV酶切位点,方便后续切除N端的SUMO标签。该载体的核苷酸序列如SEQ ID NO.3所示。
LB固体培养基:蛋白胨10g/L,酵母粉5g/L,NaCl 10g/L,1.5%的琼脂。
LB液体培养基:蛋白胨10g/L,酵母粉5g/L,NaCl 10g/L。
植物总RNA提取试剂盒、质粒小提试剂盒、胶回收试剂盒均买自天根生化有限公司;逆转录试剂盒买自Thermo公司。同源重组酶买自诺唯赞公司。PCR高保真酶买自全是金公司。PCR引物合成及质粒测序由金唯智生物技术有限公司完成。MS培养基购自北京索莱宝科技有限公司。SIM SF培养基购买自北京义翘神州科技有限公司。
亲二烯体1(morachalcone A)根据文献(Romano,J.J.&Casillas,E.A shortsynthesis of morachalcone A.Tetrahedron Lett.2005,46,2323-2326)合成。Moracin C(2)购买自云南西力公司。4-甲氧基苯乙酮(42)购买自百灵威公司。二烯体3的合成:
Figure BDA0002279678380000061
5(191.5mg,0.39mmol)和6(301.2mg,1.53mmol)溶于二甲基甲酰胺(40mL)中,然后加入磷酸钾(823mg,3.9mmol),三苯基胂(16.6mg,0.054mmol)和三(二亚苄基茚丙酮)二钯(24.8mg,0.027mmol),向溶液中通入半小时氩气,然后50℃下搅拌5小时后,加入水淬灭反应,然后用乙酸乙酯萃取,无水硫酸钠干燥。旋干溶剂后,溶于二氯甲烷(20mL),之后加入三乙胺(539μL,3.9mmol)和乙酸酐(220μL,2.33mmol)。室温搅拌5小时后,加入水淬灭反应,然后用二氯甲烷萃取,无水硫酸钠干燥。柱色谱纯化(乙酸乙酯/石油醚=1/10)得到二烯体前体7(155.3mg,92%)。
1H NMR(400MHz,CDCl3)δ7.54(dd,J=8.6,4.8Hz,1H),7.45(d,J=5.2Hz,2H),7.45(s,1H),7.26(s,1H),7.08–6.96(m,2H),6.92(d,J=16.6Hz,1H),5.13(d,J=9.6Hz,2H),2.34(s,3H),2.33(s,6H),1.93(s,3H);
13C NMR(101MHz,CDCl3)δ169.7,168.8,154.8,153.0,149.5,148.3,142.1,138.3,129.8,126.8,124.3,121.2,119.1,117.8,117.4,116.9,116.5,105.2,102.6,21.0,18.0。
Figure BDA0002279678380000071
二烯体3不稳定,只能通过原位水解其乙酰基前体7来获取:将5体积的甲醇,3体积的水和1体积的碳酸钾水溶液(1M)混匀,然后加入1体积的二烯体前体7DMSO母液(100mM),混匀后静置反应35分钟左右得到10mM的二烯体3的溶液。该溶液直接用于活性测试。
Chalcomoracin(4)的合成:
Figure BDA0002279678380000072
化合物8参照文献(Han,J.,et al.Enantioselective biomimetic totalsyntheses of kuwanons I and J and brosimones A and B,Angew.Chem.Int.Ed.2014,53,9257-9261)进行合成。
(±)-BINOL(25.4mg,0.107mmol)溶解在1.5毫升THF中,然后加入BH3·THF(51.5μL,0.0515mmol)和醋酸(3.0μL,0.0515mmol)。该反应液在室温下搅拌25分钟,然后抽干。向该固体中加入2.5毫升THF中,然后加入200毫克
Figure BDA0002279678380000073
分子筛和亲二烯体8(20.0mg,0.0429mmol),随后室温反应1.5小时后加入二烯体前体7(22.4mg,0.0515mmol)。该混合物反应72小时后,用水淬灭。过滤后收集滤液,并用乙酸乙酯萃取后旋干。经过初步柱层析纯化后(乙酸乙酯/石油醚=1/5到1/2)得到9粗品。
将消旋体9(4.4mg,0.00489mmol)加入到0.5毫升甲醇和0.25毫升的THF混合溶液中,然后加入碳酸钾(6.7mg,0.0489mmol),室温下反应1小时后加入0.9毫升0.1N盐酸淬灭反应。该混合液用乙酸乙酯萃取后旋干。经柱层析纯化后(甲醇/二氯甲烷=5:95)得到外消旋天然产物chalcomoracin(4)。其NMR数据与文献一致(Takasugi,M.,Nagao,S.,Masamune,T.,Shirata,A.,Takahashi,K.Chalcomoracin,a natural Diels-Alder adduct fromdiseased mulberry.Chem.Lett.1980,9,1573-1576)。
实施例1
1、桑树愈伤组织的诱导和培养
将采集回来的幼叶用70%乙醇表面灭菌30s后,用饱和的次氯酸钠溶液灭菌10min,然后用5倍量的蒸馏水漂洗3次。将灭菌后的外植体剪成1cm2左右的小块,接种在MS+NAA(萘乙酸)0.5mg·L-1+6-BA(6-苄氨基腺嘌呤)0.5mg·L-1+2,4-D(2,4-二氯苯氧乙酸)0.2mg·L-1,pH 5.8固体培养基上,在黑暗条件下进行愈伤组织的诱导,将诱导出的愈伤组织接种于上述MS固体培养基进行扩大培养,每4周继代1次,培养温度为(25±1)℃。选择生长状况良好的愈伤组织接种到相同的MS液体培养基中,建立桑树悬浮细胞系于(25±1)℃黑暗条件下110r·min-1的摇床上培养。
2、桑树愈伤组织中D-A类型天然产物的成分分析。
称取烘干后的桑树愈伤组织0.1克,加入至1.5EP管中,然后加入1mL甲醇水溶液(甲醇:水=4:1)后超声2次,用0.22微米滤膜过滤后得到愈伤组织粗提物。该粗提物用HPLC分析,得到如图4的A所示的结果,通过与chalcomoracin标准品的对照(图4的B)可以看出,桑树愈伤组织中富含D-A类型天然产物chalcomoracin。这说明在我们的桑树愈伤组织中催化chalcomoracin合成的D-A反应酶存在且可能高表达。
3、活性导向蛋白分离
1)细胞粗酶液的制备
将新鲜桑树细胞培养物(200g)添加到由50μM磷酸钠、pH 7.4、1μM EDTA、3μm巯基乙醇和100μM PMSF按1:100(vol/vol)的比例组成的破碎缓冲液(400ml)中,并在4℃下用温拌机处理。混合物在9000g下离心4C,30min,将上清液收集到500ml锥形瓶中作为沉淀。将固体硫酸铵加入到上清中,使其达到80%的饱和。在4℃下轻轻搅拌12小时后,将混合物分配到试管中,并在4℃下在9000g下离心30分钟。所得颗粒再悬浮在含有20mM Tris HCl、pH7.4、2mM EDTA和3mm 2-巯基乙醇的缓冲液中,并转移到新试管中。将蛋白质样品在160,000g、4℃下离心2h以去除微粒体,收集上清液并使用Amicon Ultra-30K(微孔)浓缩管离心浓缩得到细胞粗酶液。
2)疏水柱层析纯化
Hitrap Butyl FF柱(5ml)先用50mM磷酸钠缓冲液(pH=7.0,含1.5M硫酸铵)平衡,然后再将上述细胞粗酶液装载到Hitrap Butyl FF柱(5ml)上,该柱使用50mM磷酸钠缓冲液(pH=7.0)进行蛋白质洗脱。洗脱的梯度为0-20min 0%50mM磷酸钠缓冲液(pH=7.0)(vol/vol),20-70min 20%50mM磷酸钠缓冲液(pH=7.0(vol/vol),70-120min 100%50mM磷酸钠缓冲液(pH=7.0)。流速为2mL/min。
3)离子交换柱层析纯化
将上述Hitrap Butyl FF色谱的活性组分收集,缓冲液交换至20mM Tris HCl,pH值8.0,并装载至事先用20mM Tris HCl,pH值8.0的缓冲液平衡后的Hitrap Q FF(5ml)柱(GE Healthcare,USA)上。蛋白质洗脱以2mL/min的流速进行,使用含有20mM Tris HCl、pH8.0和1M NaCl的缓冲液作为洗脱缓冲液,洗脱梯度为:0%(vol/vol)时梯度为0-20min,在10%(vol/vol)时梯度为20-40min,在20%(vol/vol)时梯度为40-60min,在100%时梯度为60-100min。
4)分子筛柱层析纯化
将上述Hitrap Q色谱的活性组分使用串联的SuperDextm 200Increase 10/300GL柱(GE Healthcare,USA)进行浓缩和分离。在0.25ml/min的流速下,使用含有20m m TrisHCl、pH 7.2、0.15M NaCl的缓冲液进行等比例蛋白质洗脱。用安捷伦1260高效液相色谱法测试洗脱部分的活性。使用NGCTM色谱系统(bio-rad)进行凝胶过滤层析(size-exclusionchromatography)。
5)将上述纯化之后的不同蛋白组分进行活性测试
向含有100μM亲二烯体1(morachalcone A)和100μM moracin C(2)的20mM Tris·HCl(pH 7.5)的反应液中加入9.8μg上述步骤1-4中的不同蛋白,最终体积为100μL。该反应混合物在30℃下孵育1小时后加入200μL冰甲醇终止反应,15000g离心30min,上清用HPLC-MS分析。当在反应液中不加入细胞粗酶液或者经过纯化后的活性蛋白组分时,亲二烯体1和二烯体前体2不会发生任何变化,如图5的A所示;加入细胞裂解液后,能检测到二烯体(diene)3以及对应的D-A天然产物chalcomoracin(4)的产生,如图5的B所示;将用疏水柱纯化后的活性蛋白组分加入反应液中,也能检测到二烯体(diene)3以及D-A天然产物chalcomoracin(4),如图5的C所示;将用离子交换柱纯化之后的活性蛋白组分加入反应液中,天然产物4的含量增加,如图5的D所示;将经过凝胶过滤层析后的活性蛋白成分加入到反应液中,天然产物4的含量明显增加,如图5的E所示,这说明在这个活性组分中,D-A反应酶可能被富集。4、不同蛋白活性组分的SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)
将各活性组份蛋白的浓度统一稀释到0.4μg/μL,取25μL的蛋白样品,加入5μLloading buffer,随后100℃处理5min后进行12%的SDS-PAGE电泳检测。结束电泳后,进行考马斯亮蓝染色,得到如图6所示的结果。通过比较不同组分中的蛋白条带,在凝胶柱纯化后的组分中看到明显的富集条带,如图6中箭头所示,该条带作为候选的蛋白条带,送交蛋白质谱检测。
5、LC-MS/MS蛋白质谱测定
将上述富集的条带切下后,送至北京生命科学研究所进行LC-MS/MS质谱鉴定,所得的肽段信息与川桑(Morus notabilis)蛋白序列做比对,从而得到该富集条带中的蛋白质信息,如图7所示。认为被富集出来的条带最有可能是桑树中一类reticuline oxidase-like protein,推测这类蛋白很可能就是催化分子间D-A反应的酶。
实施例2MaDA基因的扩增与表达
向生长了10天左右的桑树愈伤组织培养液中加入0.1mM的茉莉酸甲酯,诱导培养20小时后,将愈伤组织送去华大基因公司进行转录组测序。在所得的转录组序列信息中,共找到了14个注释为reticuline oxidase-like oxidase或其同源蛋白(Cannabidiolicacid synthase)的转录本,根据其fragments per kilobase of exon per million readsmapped(FPKM)的大小,将这些蛋白根据转录水平的高低进行排序,得到图8所示结果。
1、桑树愈伤组织总RNA的提取
取大约100克新鲜愈伤组织放入研钵中,加入液氮后研末至粉末状,然后依照天根生化公司的植物总RNA提取试剂盒说明书提取桑树叶片总RNA。
2、桑树愈伤组织cDNA的制备
提取的总RNA用DNAase37℃处理半个小时后,用RNA纯化试剂盒进行纯化,用nanodrop测定回收浓度。用Thermo Scientific RevertAid First Strand cDNASynthesis Kit逆转得到cDNA。
3、MaDA基因的扩增
上游引物序列:
5’-AACCTGTATTTTCAGGGATCCAACGACACTCATGAAGCCTTTCTTG-3’(SEQ ID No.5)
下游引物序列:
5’-CTCGAGACTGCAGGCTCTAGATCACATTGCTGAATGTAGAGGAGGAAGAG-3’(SEQ ID No.6)
PCR反应体系(50μL):
Figure BDA0002279678380000111
PCR循环条件(50μl体系):95℃2min;98℃30s,52℃30s,72℃1min,共32个循环,72℃5min。
PCR结束后,对PCR产物进行1%的琼脂糖凝胶电泳,如图9所示,并回收该特异性条带,纯化。
4、杆状病毒构建
采用Invivogen公司所开发的“Bac-to-bac”方法:
pI-sec-sumostar-tev2空载用BamHI和XbaI双酶切过夜,1%琼脂糖凝胶电泳后,用胶回收试剂盒回收单一条带,用nanodrop测定回收的DNA浓度。利用Vazyme同源重组酶构建pI-sec-sumostar-tev2-MaDA质粒,10μL连接体系包括:1μL Exnase II酶,2μL 5×CEbuffer,3μL线性化载体,4μL MaDA PCR产物。
上述连接体系中,MaDA与线性化pI-sec-sumostar-tev2载体的摩尔数之比大致为2:1。上述反应体系在37℃反应30min后,立即置于冰上,随后将连接产物加入100μL DH5α感受态中,冰浴30min后42℃热激1min,然后立即冰浴3min,加入1mL LB培养基37℃,220rpm培养。大约1小时后,离心弃900μL培养基,将菌体重悬在剩余的100μL培养基中,然后用移液枪全部取出并涂布于含有氨苄青霉素(100μg/mL)的固体LB平板。37℃过夜培养后,挑取固体培养基上的单克隆于LB液体培养基中培养12-16小时后提取质粒并送测序。
1μg pI-sec-sumostar-tev2-MaDA加入到100μL DH10Bac的感受态细胞中,冰浴30min后42℃热激1min,随后冰上放置大约3min后,加入1mL LB液体培养基,37℃,220rpm培养大约4小时后,将菌液用5mL液体LB稀释,取100μL稀释后的菌液涂布在含有卡那霉素(50μg/mL)、庆大霉素(7μg/mL)、四环素(10μg/mL)、IPTG(40μg/mL)以及Bluo-gal(100μg/mL)的固体LB平板上。37℃静置过夜培养后,挑取3-4个大的白色克隆接种到含有卡那霉素(50μg/mL)、庆大霉素(7μg/mL)、四环素(10μg/mL)的液体LB中过夜培养。收集上述过夜培养的大肠杆菌,利用异丙醇沉淀的方法提取杆粒并进行PCR鉴定,PCR所用引物序列为:
上游引物序列:5’-AAATGATAACCATCTCGC-3’(SEQ ID No.7)
下游引物序列:5’-GGAGGATAACGATATTATTGAGGC-3’(SEQ ID No.8)
PCR体系为:
Figure BDA0002279678380000121
将含有目的基因的杆粒(PCR验证为阳性)转染昆虫细胞sf21,使用SIM-SF培养基贴壁培养96小时后得到P1代杆状病毒。悬浮培养sf21细胞,当细胞密度达到1.5×106至2.5×106个每毫升时,按1:200的体积比加入P1代杆状病毒,96小时后得到P2代杆状病毒。
5、分泌蛋白表达
采用昆虫细胞Hi5作为蛋白表达体系。Hi5细胞采用SIM-HF培养基悬浮培养,细胞密度在1.5×105至2.5×106个每毫升时感染杆状病毒,48小时后离心去掉细胞,收集上清。利用Sartorius公司的viva flow 200浓缩装置对上清进行浓缩和缓冲液置换,然后通过镍离子螯合亲和层析纯化带有His标签的目的蛋白,如图10所示。
实施例3MaDA的酶活测试
向97μL反应缓冲液(20Mm Tris·HCl,pH=8.0)中加入1μL二烯体3(终浓度100μM)以及1μL亲二烯体1(终浓度100μM),然后加入1μL带有SUMO标签的MaDA蛋白(终浓度2.7nM),50℃下反应5分钟后,加入200μL甲醇淬灭反应,用HPLC分析该反应液。当不加MaDA时,二烯体3和亲二烯体1并不会自发形成对应任何D-A产物;加入MaDA后有且仅有一个新化合物出现,通过与化学合成的chalcomoracin标准品对照,确定其为天然产物chalcomoracin,如图11所示。通过测定产物chalcomoracin的ee值,证明了MaDA催化D-A反应除了具备endo选择性外,还具有立体专一性,如图12所示,这是以往的化学方法无法实现的,体现了MaDA在立体专一性地合成D-A类型天然产物中的应用价值。
HPLC分析的条件为:色谱柱:Shiseido MGIII C18(250mm×4.6mm,5μm);流动相:甲醇-水(0.1%甲酸)梯度洗脱,0~15min,40→70%甲醇;15~35min,70→100%甲醇,35~45min,100→40%甲醇;流速:1.0mL·min-1,检测波长:340nm,柱温:25℃;进样体积为10μL。
实施例4不同乙酰基保护的二烯体前体的制备
Figure BDA0002279678380000131
将中间体化合物10(70mg,0.22mmol)和中间体化合物6(128mg,0.66mmol)溶解在4毫升DMF中,然后加入磷酸钾(467mg,2.2mmol)和三苯基砷(9.4mg,0.031mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(14mg,0.0154mmol)。该反应液在50℃下反应5小时后过滤,收集滤液。滤液用乙酸乙酯萃取后旋干并溶解在4毫升二氯甲烷中,然后加入三乙胺(0.15mL,1.1mmol)和醋酸酐(62μL,0.66mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体11(50.0mg,87%)。
1H NMR(CDCl3,400MHz)δ7.25(t,J=8.2Hz,1H),7.00(d,J=8.2Hz,2H),6.84(d,J=16.5Hz,1H),6.28(d,J=16.5Hz,1H),5.11(s,1H),5.08(s,1H),2.28(s,6H)。
Figure BDA0002279678380000132
将中间体化合物12(100mg,0.287mmol)和中间体化合物6(180.4mg,0.929mmol)溶解在3毫升DMF中,然后加入磷酸钾(610mg,2.87mmol)和三苯基砷(12.3mg,0.0402mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(26.3mg,0.0287mmol)。该反应液在50℃下反应5小时后过滤,收集滤液。滤液用乙酸乙酯萃取旋干后溶解在4毫升二氯甲烷中,然后加入三乙胺(119.6μL,0.862mmol)和醋酸酐(65μL,0.690mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体13(47.3mg,57%)。
1H NMR(CDCl3,400MHz)δ9.91(s,1H),7.50(s,2H),6.98(d,J=16.5Hz,1H),6.31(d,J=16.5Hz,1H),5.20(s,1H),5.16(s,1H),2.32(s,6H),1.93(s,3H)。
Figure BDA0002279678380000141
将中间体化合物14(100mg,0.38mmol)和中间体化合物6(295mg,1.52mmol)溶解在4毫升DMF中,然后加入磷酸钾(807mg,3.8mmol)和三苯基砷(16.0mg,0.05mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(24mg,0.027mmol)。该反应液在50℃下反应5小时后过滤,收集滤液。滤液用乙酸乙酯萃取旋干后溶解在4毫升二氯甲烷中,然后加入三乙胺(0.16mL,1.14mmol)和醋酸酐(72μL,0.76mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体15(58mg,75%)。
1H NMR(CDCl3,400MHz)δ7.60(dd,J=7.6,1.9Hz,1H),7.25(d,J=7.6Hz,1H),7.22(dd,J=7.6,1.9Hz,1H),7.05(dd,J=7.6,1.5Hz,1H),6.86(d,J=16.2Hz,1H),6.53(d,J=16.2Hz,1H),5.14(s,1H),5.11(s,1H),2.35(s,3H),1.95(s,3H)。
Figure BDA0002279678380000142
将中间体化合物16(20mg,0.067mmol)和中间体化合物6(52mg,0.27mmol)溶解在1毫升DMF中,然后加入磷酸钾(142mg,0.67mmol)和三苯基砷(2.9mg,0.0094mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(4.0mg,0.0047mmol)。该反应液在50℃下反应5小时后过滤,收集滤液。滤液用乙酸乙酯萃取旋干后溶解在4毫升二氯甲烷中,然后加入三乙胺(19μL,0.13mmol)和醋酸酐(10μL,0.1mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体17(8mg,50%)。
1H NMR(CDCl3,400MHz)δ7.51(d,J=8.5Hz,1H),7.19(dd,J=8.5,2.0Hz,1H),7.09(d,J=2.1Hz,1H),6.83(d,J=16.2Hz,1H),6.45(d,J=16.2Hz,1H),5.14(s,1H),5.13(s,1H),2.34(s,3H),1.94(s,3H)。
Figure BDA0002279678380000151
将中间体化合物18(70mg,0.154mmol)和中间体化合物6(120mg,0.618mmol)溶解在2毫升DMF中,然后加入磷酸钾(328mg,1.54mmol)和三苯基砷(6.6mg,0.0216mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(9.9mg,0.0108mmol)。该反应液在50℃下反应5小时后过滤,收集滤液。滤液用乙酸乙酯萃取旋干后溶解在5毫升二氯甲烷中,然后加入三乙胺(107μL,0.772mmol)和醋酸酐(43.8μL,0.4632mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体17(44.2mg,73%)。
1H NMR(CDCl3,400MHz)δ7.67(s,2H),7.45–7.34(m,5H),6.94(d,J=16.5Hz,1H),6.28(d,J=16.5Hz,1H),5.34(s,2H),5.17(s,1H),5.14(s,1H),2.30(s,6H),1.92(s,1H);
13C NMR(CDCl3,100MHz)δ168.7,164.7,149.0,141.9,139.6,135.7,129.5,129.3,128.7,128.5,121.9,120.0,117.6,67.3,20.9,18.0。
Figure BDA0002279678380000152
将中间体化合物20(42.6mg,0.113mmol)和中间体化合物6(87.6mg,0.451mmol)溶解在3毫升DMF中,然后加入磷酸钾(239.2mg,1.13mmol)和三苯基砷(4.8mg,0.0158mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(7.2mg,0.00789mmol)。该反应液在50℃下反应5小时后过滤,收集滤液。滤液用乙酸乙酯萃取旋干后溶解在3毫升二氯甲烷中,然后加入三乙胺(78.3μL,0.564mmol)和醋酸酐(32μL,0.338mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体21(33.0mg,84%)。1HNMR(CDCl3,400MHz)δ7.64(s,2H),6.94(d,J=16.5Hz,1H),6.29(d,J=16.5Hz,1H),5.17(s,1H),5.13(s,1H),3.89(s,3H),2.30(s,6H),1.92(s,3H);
13C NMR(CDCl3,100MHz)δ168.7,165.3,149.0,141.9,139.6,129.5,129.0,121.8,120.0,117.6,52.5,20.9,18.0。
Figure BDA0002279678380000161
将中间体化合物22(9.5mg,0.027mmol)和中间体化合物23(14.0mg,0.041mmol)溶解在1毫升甲苯中,向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd(PPh3)4(3.1mg,0.0027mmol)。该反应液在110℃下反应2.5小时后直接旋干。利用硅胶柱层析纯化得到二烯体前体24(6.0mg,66%)。1H NMR(CDCl3,400MHz)δ7.66(d,J=8.2Hz,1H),7.58(d,J=8.8Hz,2H),7.43(dd,J=8.2,1.6Hz,1H),7.26(d,J=1.9Hz,1H),7.16(d,J=8.8Hz,2H),6.91(d,J=16.2Hz,1H),6.54(d,J=16.2Hz,1H),5.16(s,1H),5.13(s,1H),2.37(s,3H),2.33(s,3H),1.97(s,3H)。
13C NMR(CDCl3,100MHz)δ169.6,169.4,150.4,148.5,142.0,140.5,137.6,134.1,129.0,128.1,126.9,124.9,122.0,121.4,121.2,118.5,21.2,21.0,18.5。
Figure BDA0002279678380000162
将中间体化合物25(5mg,0.015mmol)和中间体化合物22(8mg,0.02mmol)溶解在1毫升甲苯中,向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd(PPh3)4(1.7mg,0.002mmol)。该反应液在110℃下反应2.5小时后旋干。利用硅胶柱层析纯化得到二烯体前体26(2.5mg,52%)。
1H NMR(400MHz,CDCl3)δ8.29(d,J=8.9Hz,2H),7.79–7.69(m,3H),7.50(dd,J=8.2,1.6Hz,1H),7.34(d,J=1.8Hz,1H),6.95(d,J=16.1Hz,1H),6.55(d,J=16.2Hz,1H),5.18(d,J=9.1Hz,2H),2.39(s,3H),1.98(s,3H)。
Figure BDA0002279678380000171
将中间体化合物27(1.59g,5.63mmol)和中间体化合物22(2.41g,11.3mmol)溶于甲苯中,向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd(PPh3)4(1.30g,1.13mmol)。该反应液在110℃下反应2小时后直接旋干。利用硅胶柱层析纯化得到二烯体28(160mg,13%)以及二烯体前体29(850mg,56%)。二烯体28数据表征:1H NMR(400MHz,CDCl3)δ7.90(d,J=7.6Hz,1H),7.89(s,1H),7.26(s,1H),7.85(d,J=16.4Hz,1H),6.71(d,J=16.4Hz,1H),6.55(d,J=9.6Hz,1H),5.37(d,J=9.6Hz,2H),2.55(s,3H),2.16(s,3H)。二烯体前体29数据表征:1H NMR(400MHz,Acetone-d6)δ7.88(d,J=9.6Hz,1H),7.83(s,1H),7.04(d,J=16Hz,1H),6.89(d,J=16Hz,1H),6.80(s,1H),6.19(d,J=9.6Hz,1H),5.11(d,J=17.2Hz,2H),1.97(s,3H)。
Figure BDA0002279678380000172
将中间体化合物30(77.0mg,0.18mmol)和中间体化合物6(142mg,0.73mmol)溶解在3毫升DMF中,然后加入磷酸钾(382mg,1.8mmol)和三苯基砷(8.0mg,0.025mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(12.0mg,0.013mmol)。该反应液在50℃下反应5小时后过滤收集滤液,滤液用乙酸乙酯萃取旋干后溶解在4毫升二氯甲烷中,然后加入三乙胺(63μL,0.45mmol)和醋酸酐(20μL,0.22mmol),室温反应3小时。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体31(13.5mg,21%)。
1H NMR(400MHz,CDCl3)δ13.64(s,1H),7.89(d,J=7.6Hz,2H),7.59-7.52(m,3H),7.32(d,J=16.5Hz,1H),6.84(s,1H),6.74(s,1H),6.52(d,J=16.5Hz,1H),5.14(s,1H),5.12(s,1H),2.38(s,3H),1.98(s,3H)。
Figure BDA0002279678380000181
将中间体化合物32(70.0mg,0.12mmol)和中间体化合物6(91mg,0.47mmol)溶解在2毫升DMF中,加入磷酸钾(255mg,1.2mmol)和三苯基砷(5.0mg,0.017mmol)。向该溶液中通入半小时氩气以除去溶液中氧气,加入Pd2(dba)3(8.0mg,0.0084mol)。该反应液在50℃下反应5小时后过滤收集滤液,滤液用乙酸乙酯萃取旋干后溶解在3毫升二氯甲烷中,然后加入三乙胺(170μL,1.2mmol)和醋酸酐(68μL,0.72mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体33(6.4mg,10%)。
1H NMR(400MHz,CDCl3)δ12.93(s,1H),7.73(s,1H),7.37(d,J=8.1Hz,1H),7.28(d,J=14.8Hz,1H),6.83(s,1H),6.50(d,J=16.5Hz,1H),5.14(s,1H),5.12(s,1H),2.37(s,3H),2.36(s,3H),2.34(s,3H),2.33(s,3H),1.97(s,3H)。
Figure BDA0002279678380000182
将中间体化合物43(60mg,0.11mmol)和中间体化合物6(85mg,0.44mmol)溶解在2毫升DMF中,然后加入磷酸钾(233mg,1.1mmol)和三苯基砷(5.0mg,0.015mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(7mg,0.008mmol)。该反应液在50℃下反应5小时后过滤收集滤液,滤液用乙酸乙酯萃取旋干后溶解在3毫升二氯甲烷中,然后加入三乙胺(0.1mL,0.77mmol)和醋酸酐(52μL,0.55mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体35(16mg,30%)。
1H NMR(400MHz,CDCl3)δ13.53(s,1H),7.81–7.72(m,2H),7.38(d,J=8.5Hz,1H),7.31(d,J=16.6Hz,1H),6.84(s,1H),6.69(s,1H),6.51(d,J=16.4Hz,1H),5.13(d,J=7.8Hz,2H),2.37(s,3H),2.35(s,3H),2.34(s,3H),1.98(s,3H)。
Figure BDA0002279678380000191
将中间体化合物36(58mg,0.15mmol)和中间体化合物6(120mg,0.6mmol)溶解在3毫升DMF中,然后加入磷酸钾(318mg,1.5mmol)和三苯基砷(6mg,0.02mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(10mg,0.01mmol)。该反应液在50℃下反应5小时后过滤收集滤液,滤液用乙酸乙酯萃取旋干后溶解在3毫升二氯甲烷中,然后加入三乙胺(63μL,0.45mmol)和醋酸酐(21μL,0.22mmol),室温反应过夜。反应结束后,加入水淬灭该反应,并用二氯甲烷萃取,旋干。利用硅胶柱层析纯化得到二烯体前体37(38mg,79%)。
1H NMR(400MHz,CDCl3)δ7.88–7.81(m,2H),7.76(s,1H),7.45(t,J=7.6Hz,2H),7.36(t,J=7.3Hz,1H),7.25(s,1H),6.99(s,1H),6.87(d,J=16.1Hz,1H),6.60(d,J=16.1Hz,1H),5.12(d,J=14.8Hz,2H),2.39(s,3H),1.98(s,3H)。
Figure BDA0002279678380000192
中间体化合物38(15.9mg,0.0322mmol)和中间体化合物22(17.0mg,0.0476mmol)溶解在0.6毫升DMF中,然后在氩气的保护下向该溶液中加入三苯基砷(1.4mg,4.5μmol)和Pd2(dba)3(2.1mg,2.2μmol)。该混合液室温反应3.5小时后用饱和氯化铵溶液淬灭,然后用乙醚萃取。有机相合并后旋干,经柱层析纯化后(乙酸乙酯/石油醚=1/4)得到二烯体前体39(13mg,0.03mmol,93%)。
1H NMR(400MHz,CDCl3)δ7.75(s,1H),7.45(d,J=2.1Hz,2H),7.22(s,1H),6.99(s,1H),6.93(t,J=2.0Hz,1H),6.86(d,J=16.1Hz,1H),6.58(d,J=16.1Hz,1H),5.14(s,1H),5.10(s,1H),2.38(s,3H),2.33(s,6H),1.97(s,3H);
13C NMR(101MHz,CDCl3)δ169.5,169.0,155.4,154.2,151.5,146.2,142.0,133.4,132.2,127.4,126.5,122.2,118.1,117.9,115.7,115.5,105.8,102.7,21.2,21.0,18.6;
Figure BDA0002279678380000201
将中间体化合物40(15mg,0.06mmol)和22(32mg,0.09mmol)溶解在0.5毫升DMF中,然后加入三苯基砷(3mg,0.0087mmol)和Pd2(dba)3(4mg,0.0043mmol),抽换气并用氩气保护,室温反应3.5小时。加水淬灭反应后,用乙醚萃取,有机相用无水硫酸钠干燥后浓缩,利用硅胶柱层析纯化得到二烯体41(8mg,71%)。
1H NMR(400MHz,CDCl3)δ8.12(s,1H),7.69(s,1H),7.41–7.32(m,2H),7.19(t,J=2.8Hz,1H),6.89(d,J=16.1Hz,1H),6.68(d,J=16.1Hz,1H),6.57–6.52(m,1H),5.06(d,J=25.7Hz,2H),2.01(s,3H)。
实施例5不同二烯体的活性检测
首先通过原位水解的方法制备10mM不同二烯体的溶液,制备方法如下:取1μL碳酸钾(1M水溶液)加入到3μL水中,然后加入5μL甲醇,最后加入1μL乙酰基保护的二烯体前体(100mM DSMO母液),混匀后室温静置30分钟即为10mM的二烯体溶液。该二烯体溶液立即用于活性检测。
酶活测定:将2μLMaDA蛋白(4.8mg/mL)加入到95.5μL溶液中,然后加入0.5μL4-甲氧基苯乙酮(42,100mM)作为内参,以及2μL亲二烯体morachalcone A(1,10mM)和1μL二烯体溶液(10mM),50℃下反应1小时后,加入200μL甲醇淬灭反应,然后12000rpm离心10分钟,取上清进行UPLC-MS分析。在空白对照中,所有条件与上述酶促反应相同,唯一的区别在于不加入MaDA蛋白。
UPLC-MS分析使用Waters ACQUITY UPLC-MS仪器,该仪器装有PDA紫外检测器以及Water Waters SQD 2质谱检测器,分析柱为ACQUITY
Figure BDA0002279678380000202
BEH C18column,50mm×2.1mmi.d.,1.7μm,流速为0.3mL/min,流动相为水(A)以及乙腈(B),洗脱条件为0-1min,30%B,1-7min,30%-100%,7-7.5min 100%B,7.5-8min,30%B。
对具有简单结构的二烯体44-48进行了酶活测试,结果如图13所示。与空白对照相比,加入MaDA后,均出现了新峰,该峰对应的分子量与预期的D-A反应之后的产物相同,该新峰以星号(*)标注出来。二烯体44-48的转化率分别为:8%、31%、54%、69%、95%。通过对比这些化合物得活性,可以认为,当苯环上二烯体的对位有取代基时,该类二烯体均有活性,且该位置取代基越大,该底物越容易被MaDA蛋白识别,其转化率越高。
对具有联苯结构的二烯体49,50进行了酶活测试,结果如图14所示。与空白对照相比,加入MaDA后,均出现了新峰,该峰对应的分子量与预期的D-A反应之后的产物相同,该新峰以星号(*)标注出来。二烯体49,50的转化率分别为98%、40%。这些结果可以看出,MaDA对于这种含有联苯结构的二烯体也具有较好得底物耐受性,且带有给电子基(羟基)的二烯体49比带有强吸电子基(硝基)的二烯体50具有更好的反应活性。
对具有苯并杂环结构的二烯体28、41、51、52进行了酶活测试,结果如图15所示。与空白对照相比,加入MaDA后,在这些二烯体的反应液中均出现了新峰,该峰对应的分子量与预期的D-A反应之后的产物相同,该新峰以星号(*)标注出来。二烯体28、41、51、52的转化率分别为:75%、24%、100%、28%。从这个结果可以看出,MaDA对于苯并杂环结构的二烯体有一定的底物选择性,结构更加复杂且邻位含有羟基的苯并呋喃二烯体51具有更好的转化率。
对具有黄酮结构的二烯体53-56进行了酶活测试,结果如图16所示。与空白对照相比,加入MaDA后,均出现了新峰,该峰对应的分子量与预期的D-A反应之后的产物相同,该新峰以星号(*)标注出来。二烯体53-56在实验组中基本转化完全,转化率为100%。由此结果可以看出,黄酮中苯环上的羟基取代对于该类化合物的活性没有显著影响,该类化合物均能被MaDA高效识别并特异性转化为endo类型天然产物及其类似物。
从以上活性测试结果中可以看出,MaDA对这些自然界不存在的人工合成的二烯体展现出了良好的底物适用性,特别是对于结构比较复杂的联苯类、黄酮类以及苯并呋喃类二烯体具有更高的催化活性。
实施例6 D-A产物的大量制备
为了进一步验证MaDA蛋白在合成endo构型D-A产物,本实施例选择性地对一些代表性的底物进行了酶法制备。
酶法制备D-A产物的方法如下:乙酰基保护的前体11、19、21、35(0.0262mmol,1.2eq.)加入到1毫升的甲醇水溶液中(甲醇/水=4:1),然后加入碳酸钾(11.1mg,0.105mmol)。该反应液在室温下反应大概35分钟后分别原位产生二烯体57、48、47、55,然后将该溶液加入到100毫升的反应液(118nM MaDA,20mM Tris-HCl,pH=8.0)中,最后加入亲二烯体1(7.4毫克,0.02176mmol溶解在0.37毫升的DMSO中)。该反应液在37℃下反应24小时后用乙酸乙酯萃取,合并有机相并旋干,最后通过HPLC纯化得到对应的D-A产物58、59、60、61,如图17所示。当使用比较简单的二烯体57时,也能成功制备出D-A产物,其回收产率比较低为21%,Total Turnover Number(TTN)为492。当使用结构更加复杂的二烯体48,47时,其回收产率(分别为36%和51%)和TTN(分别为700,1175)均有所提高。当使用黄酮类型二烯体55时,产率和TTN均为最高,分别为54%和2442,体现了MaDA对于结构更加复杂的二烯体具有更加高效的转化率,更加适合用于结构复杂的D-A类型天然产物及其衍生物的合成。
HPLC制备使用C18反向HPLC(Waters,XBridge@pre C18 OBDTM),分离柱为150mm×19mm i.d.,5μm,并在280nM下检测紫外吸收。HPLC的流动相为水(A)和乙腈(B),流动相梯度为:30%B,0-1min,30%-100%B,1-16min,100%B,16-17min,100%-30%B,18-19min,30%B,20min。
D-A产物的核磁数据:
Figure BDA0002279678380000221
1H NMR(600MHz,Acetone-d6)δ12.97(s,1H),8.72(s,1H),8.42(d,J=9.0Hz,1H),7.91(br.s,2H),6.98(d,J=8.4Hz,1H),6.76(t,J=8.0Hz,1H),6.49(d,J=2.4Hz,1H),6.44(d,J=9.0Hz,1H),6.30(dd,J=8.4,2.4Hz,1H),6.22(d,J=8.0Hz,2H),5.75(s,1H),5.21–5.14(m,1H),4.64–4.58(m,1H),4.08(br.s,1H),3.74–3.71(m,1H),3.27(d,J=7.2Hz,2H),2.48(d,J=18.1Hz,1H),2.16(d,J=15.6Hz,1H),1.92(s,3H),1.72(s,3H),1.59(s,3H)。
13C NMR(150MHz,Acetone-d6)δ210.0,164.7,163.2,157.9,157.5,156.4,133.4,132.2,131.5,128.7,128.3,124.8,123.1,121.9,116.1,115.9,113.5,108.8,108.0,107.4,103.5,47.7,36.5,33.0,32.2,25.8,23.8,22.2,17.9。
Figure BDA0002279678380000231
1H NMR(600MHz,Acetone-d6)δ12.87(s,1H),8.78(s,1H),8.41(d,J=9.0Hz,1H),8.27(br.s,2H),8.10(br.s,1H),7.96(br.s,1H),7.45–7.40(m,2H),7.40–7.35(m,2H),7.34–7.30(m,1H),6.97(d,J=8.4Hz,1H),6.95(s,2H),6.50(d,J=2.4Hz,1H),6.45(d,J=9.0Hz,1H),6.30(dd,J=8.4,2.4Hz,1H),5.73(br.s,1H),5.25(s,2H),5.16(dddd,J=7.2,5.9,2.7,1.3Hz,1H),4.67–4.62(m,1H),4.11(s,1H),3.77–3.75(m,1H),3.26(d,J=7.2Hz,2H),2.48(d,J=18.1Hz,1H),2.19(d,J=18.1Hz,1H),1.93(s,3H),1.72(s,3H),1.59(s,3H)。
13C NMR(150MHz,Acetone-d6)δ209.5,166.3,164.7,163.4,162.7,158.0,157.5,156.5,137.5,134.1,132.1,131.5,130.4,129.3,128.9,128.8,128.7,123.7,123.1,121.8,121.7,115.9,113.3,109.7,108.2,107.5,103.5,66.9,47.6,36.6,33.4,32.2,25.8,23.8,22.2,17.9。
Figure BDA0002279678380000232
1H NMR(600MHz,Acetone-d6)δ12.88(s,1H),9.51(br.s,1H),8.81(s,1H),8.42(d,J=9.0Hz,1H),8.28(br.s,1H),8.11(br.s,1H),6.97(d,J=8.4Hz,1H),6.91(s,2H),6.50(d,J=2.4Hz,1H),6.46(d,J=9.0Hz,1H),6.30(dd,J=8.4,2.4Hz,1H),5.73(s,1H),5.34(dt,J=8.1,4.0Hz,1H),5.19–5.14(m,1H),4.10(s,1H),3.76(s,3H),3.26(d,J=7.2Hz,2H),2.48(d,J=18.1Hz,1H),2.19(d,J=18.1Hz,1H),1.93(s,3H),1.72(s,3H),1.59(s,3H)。
13C NMR(150MHz,Acetone-d6)δ209.5,167.0,164.7,163.4,158.0,157.5,156.5,134.1,132.1,131.5,130.6,130.5,128.7,123.7,123.1,121.1,121.0,115.9,113.3,109.7,108.2,107.5,103.5,52.1,47.6,36.6,33.4,32.2,25.8,23.8,22.2,17.9。
Figure BDA0002279678380000241
1H NMR(400MHz,Acetone-d6)δ13.47(s,1H),12.86(s,1H),8.89(s,1H),8.68(s,1H),8.35(d,J=9.0Hz,1H),8.11(s,1H),7.46(d,J=2.1Hz,1H),7.43(dd,J=8.4,2.2Hz,1H),6.97(d,J=8.3Hz,2H),6.51(d,J=2.4Hz,1H),6.50(s,1H),6.44(d,J=8.8Hz,1H),6.43(s,1H),6.30(dd,J=8.4,2.4Hz,1H),5.66(s,1H),5.16(t,J=7.2Hz,1H),4.65(t,J=5.1Hz,1H),4.14(s,1H),3.89–3.81(m,1H),3.25(d,J=7.1Hz,2H),2.48(d,J=17.9Hz,1H),2.25(d,J=19.3Hz,1H),1.92(s,3H),1.70(s,3H),1.58(s,3H)。
13C NMR(150MHz,Acetone-d6)δ209.3,183.0,165.0,164.5,163.4,163.2,161.1,157.9,156.9,156.5,150.0,146.4,134.9,132.0,131.5,128.9,123.8,123.1,123.0,121.9,120.2,116.6,115.9,114.1,113.6,112.5,108.2,107.6,104.8,103.9,103.7,95.8,47.8,36.3,32.9,32.7,25.8,23.8,22.2,17.9。
实施例7突变体的制备以及活性检测
为了进一步提高MaDA的催化活性,本实施例对MaDA酶进行了突变,并对获得的突变体进行了活性测试。
1、MaDA突变体的构建与表达
MaDA突变体(H116A,V177A,Y192A,I259A,F292A,F356A,N357A,L358A,L358E,N374A,F375A,R443A)是通过对pI-sec-sumostar-tev2-MaDA质粒用表1中不同的引物进行定点PCR扩增突变(site-directed mutagenesis)而得到的,具体PCR扩增的体系为:
Figure BDA0002279678380000251
PCR循环(50μl体系)
95℃2min;98℃30s,52℃30s,72℃6min,32个循环;72℃5min。将PCR扩增后的产物用KpnI处理过夜后,转化至DH5α感受态细胞后提取质粒。随后依照MaDA蛋白的表达过程,利用昆虫细胞对这些蛋白进行表达和纯化。
表1定点突变PCR中所用的引物
Figure BDA0002279678380000252
Figure BDA0002279678380000261
2、MaDA突变体的活性检测
向97μL反应缓冲液(20mM Tris·HCl,pH=8.0)中加入1μL二烯体3(终浓度100μM)以及1μL亲二烯体(1,终浓度100μM),然后加入1μLMaDA蛋白、上述获得的MaDA蛋白的12种突变体(终浓度2.7nM),50℃下反应10分钟后,加入200μL甲醇淬灭反应,13,000rpm离心30min后,利用HPLC分析。每种突变体的活性测试重复测定3次,得到所图18所示的结果。H116A、V177A、Y192A、I259A、F292A、F356A、N357A、L358A、L358E、N374A、F375A、R443A突变体与MaDA母体蛋白相比,相对活性依次为:8%,39%,9%,10%,97%,4%,102%,110%,24%,99%。其中L358A突变提高相对酶活至110%,具有一定的应用价值。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 北京大学
<120> 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用
<130> KHP191115440.6
<160> 32
<170> SIPOSequenceListing 1.0
<210> 1
<211> 550
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Gln Tyr Phe Ser Phe Pro Ser Ser Leu Ala Lys Ile Thr Ile Phe
1 5 10 15
Leu Ile Phe Ser Phe Val Phe Ala Ser Ser Ala Asn Asp Thr His Glu
20 25 30
Ala Phe Leu Glu Cys Leu Thr Thr Arg Ile Pro Ser Asn Ser Thr Phe
35 40 45
Thr Pro Gln Ser Ile Ile Tyr Thr Pro Asp Asn Pro Ser Tyr Ser Thr
50 55 60
Ile Leu Asp Ser Thr Thr Gln Asn Pro Arg Phe Leu Ser Ser Ser Thr
65 70 75 80
Arg Asn Pro Phe Ala Ile Ile Thr Pro Leu His Ala Ser His Ile Gln
85 90 95
Ala Ala Leu Tyr Cys Ser Gln Lys His Gly Glu Gln Met Arg Ile Arg
100 105 110
Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Gln Ser Ser Val Pro
115 120 125
Phe Phe Ile Leu Asp Leu Arg Asn Leu Ser Ser Ile Ser Ile Asp Ala
130 135 140
Lys Ser Lys Ser Ala Trp Val Gln Ala Gly Ala Thr Ile Gly Glu Leu
145 150 155 160
Tyr Tyr Gly Ile Ala Lys Thr Ser Leu Asn Leu Ser Phe Pro Gly Gly
165 170 175
Val Ala His Thr Ile Gly Val Gly Gly Gln Leu Gly Gly Gly Gly Tyr
180 185 190
Gly Tyr Ser Thr Arg Lys Tyr Gly Leu Ala Ser Asp Asn Val Ile Asp
195 200 205
Ala Gln Leu Ile Asp Ala Arg Gly Arg Ile Leu Asp Arg Lys Thr Met
210 215 220
Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Ala Gly Ser Phe
225 230 235 240
Gly Ile Val Leu Ala Trp Lys Ile Arg Leu Val Asn Thr Pro Ser Thr
245 250 255
Val Thr Ile Phe Glu Ala Val Arg Ser Trp Glu Asn Asn Thr Thr Lys
260 265 270
Lys Phe Ile Arg Arg Tyr Gln Arg Arg Ala Ser Lys Thr Asp Lys Asp
275 280 285
Leu Thr Ile Phe Val Gly Phe Arg Thr Thr Ser Ser Thr Asp Glu Glu
290 295 300
Gly Asn Glu Arg Ile Ser Ile Leu Thr Ile Val Ser Ala Thr Phe His
305 310 315 320
Gly Ser Lys Asp Arg Leu Leu Gln Leu Val Gln Lys Glu Phe Pro Asp
325 330 335
Leu Gly Leu Val Ser Glu Glu Cys Thr Glu Met Ser Trp Val Arg Ser
340 345 350
Ile Ile His Phe Asn Leu Phe Gly Asp Glu Val Pro Leu Glu Val Leu
355 360 365
Leu Asn Arg Thr Leu Asn Phe Glu Met Lys Ala Phe Lys Leu Arg Ser
370 375 380
Asp Tyr Val Gln Lys Pro Ile Pro Asp Asp Val Leu Glu Lys Leu Leu
385 390 395 400
Ser Lys Leu Tyr Asp Glu Glu Thr Gly Glu Gly Tyr Ile Glu Phe Phe
405 410 415
Pro Tyr Gly Gly Lys Met Ser Lys Ile Ser Glu Ser Glu Ile Pro Phe
420 425 430
Pro Tyr Arg Ala Gly Asn Leu Tyr Asn Leu Arg Tyr Met Val Ser Trp
435 440 445
Lys Asp Asp Gly Asn Ile Thr Arg Thr Asn Met His Leu Ser Trp Ile
450 455 460
Lys Asp Ala Tyr Asp Tyr Met Thr Pro Tyr Val Ser Lys Asp Pro Arg
465 470 475 480
Gly Ala Tyr Leu Asn Phe Arg Asp Leu Asp Ile Gly Val Asn Val Asn
485 490 495
Glu Ser Asp Tyr Asp Tyr Val Ala Lys Ala Ser Val Trp Gly Thr Lys
500 505 510
Tyr Phe Arg Asn Asn Phe Tyr Arg Leu Val Asp Ile Lys Thr Ile Val
515 520 525
Asp Pro Thr Asn Phe Phe Lys Tyr Glu Gln Ser Ile Pro Pro Leu Pro
530 535 540
Pro Leu His Ser Ala Met
545 550
<210> 2
<211> 1653
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atgcagtact tttccttccc ttcatcgtta gccaaaatca ccatctttct gatcttttca 60
tttgtattcg caagttcagc taacgacact catgaagcct ttcttgagtg cctgaccact 120
cgtataccct ccaactccac cttcaccccg caatccatca tctacactcc agataatccg 180
tcgtattcaa ctatattgga ttcaacgact caaaatcctc gttttctttc ttcttcgaca 240
agaaatccat ttgccatcat cacaccactt cacgcctccc acatacaagc cgctctttat 300
tgttcccaga aacatggcga gcagatgaga atccgaagcg gcggccatga ttatgaaggc 360
ctttcttacc agtccagtgt gccgtttttc atacttgact tgagaaactt gagttctatt 420
agtattgacg cgaagagcaa gtctgcgtgg gttcaggccg gagcgacgat tggtgaactt 480
tattatggga tagctaaaac gagcctgaat cttagctttc ccggcggcgt tgctcacact 540
atcggcgttg ggggacagtt aggtggagga ggctatggct attcgacgag aaaatatggg 600
ctcgcgtccg ataacgtcat cgacgcacag ttaatcgatg ctcgaggaag aattctcgat 660
cgaaaaacca tgggggaaga tttgttttgg gccatccgcg gtggtggagc gggaagcttc 720
ggaatcgttc ttgcctggaa aattcgcctt gttaacacac catcgacagt gactatattt 780
gaagccgtga ggagttggga aaacaataca acaaaaaagt tcatccgtcg atatcaacgt 840
cgcgcttcca aaaccgataa ggatctaacc atcttcgtcg gattccgaac tacgagttct 900
acagatgaag aagggaatga gagaatttca atactaacta tcgtctcggc cacattccac 960
ggcagcaagg ataggctcct tcagttagtg caaaaggagt ttcccgactt gggtttggtt 1020
agtgaagagt gcaccgaaat gtcatgggtt cgatccatta tccatttcaa tttattcggg 1080
gacgaagtac ccttggaggt tctactcaat agaacgctca atttcgaaat gaaggctttt 1140
aaattgagat ctgactatgt acaaaagcct attccagatg acgtgttaga aaaattattg 1200
agtaagttgt atgatgaaga gacaggagaa ggttacatcg aattttttcc ttatggagga 1260
aaaatgagta agatttcaga atctgaaatc ccgttcccat accgagccgg aaacctctac 1320
aaccttcggt acatggtgtc atggaaggat gatggaaaca ttacaagaac caacatgcat 1380
cttagctgga taaaagatgc ttacgattac atgacacctt acgtgtcaaa agatccgagg 1440
ggcgcatatc tgaacttcag agatctcgac atcggagtta atgtcaatga gagcgactac 1500
gattacgtcg cgaaagcaag cgtttggggt actaagtatt ttaggaataa tttttataga 1560
ttagttgata taaagacaat agttgatcca actaatttct ttaaatacga gcaaagtatc 1620
ccacctcttc ctcctctaca ttcagcaatg tga 1653
<210> 3
<211> 5254
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg 2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg 2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct 2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga 2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag 2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt 2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga 2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac 2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg 2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg 2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca 2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact 3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc 3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta 3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacatca 3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg 3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg 3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca 3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa 3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa 3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca 3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac 3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc 3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg 3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt 3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt 3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa 3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt 3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca 4020
ccatcgggcg cggatctagg tatgctacta gtaaatcagt cacaccaagg cttcaataag 4080
gaacacacaa gcaagatggt aagcgctatt gttttatatg tgcttttggc ggcggcggcg 4140
cattctgcct ttgcggcagg tatgggtcat caccatcatc atcacgggtc cctgcaggac 4200
tcagaagtca atcaagaagc taagccagag gtcaagccag aagtcaagcc tgagactcac 4260
atcaatttaa aggtgtccga tggatcttca gagatcttct tcaagatcaa aaagaccact 4320
cctttaagaa ggctgatgga agcgttcgct aaaagacagg gtaaggaaat ggactcctta 4380
acgttcttgt acgacggtat tgaaattcaa gctgatcaga cccctgaaga tttggacatg 4440
gaggataacg atattattga ggctcacaga gaacagattg gaggtgatta cgatatccca 4500
acgaccgaaa acctgtattt tcagggatcc ggaattcaaa ggcctacgtc gacgagctca 4560
ctagtcgcgg ccgctttcga atctagagcc tgcagtctcg aggcatgcgg taccaagctt 4620
gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt tttacttgct 4680
ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt 4740
gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 4800
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 4860
tcttatcatg tctggatctg atcactgctt gagcctagga gatccgaacc agataagtga 4920
aatctagttc caaactattt tgtcattttt aattttcgta ttagcttacg acgctacacc 4980
cagttcccat ctattttgtc actcttccct aaataatcct taaaaactcc atttccaccc 5040
ctcccagttc ccaactattt tgtccgccca cagcggggca tttttcttcc tgttatgttt 5100
ttaatcaaac atcctgccaa ctccatgtga caaaccgtca tcttcggcta ctttttctct 5160
gtcacagaat gaaaattttt ctgtcatctc ttcgttatta atgtttgtaa ttgactgaat 5220
atcaacgctt atttgcagcc tgaatggcga atgg 5254
<210> 4
<211> 668
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Ala Gly Met Gly His His His His His His Gly Ser
20 25 30
Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro
35 40 45
Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser
50 55 60
Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu
65 70 75 80
Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr
85 90 95
Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp
100 105 110
Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile
115 120 125
Gly Gly Asp Tyr Asp Ile Pro Thr Thr Glu Asn Leu Tyr Phe Gln Gly
130 135 140
Ser Asn Asp Thr His Glu Ala Phe Leu Glu Cys Leu Thr Thr Arg Ile
145 150 155 160
Pro Ser Asn Ser Thr Phe Thr Pro Gln Ser Ile Ile Tyr Thr Pro Asp
165 170 175
Asn Pro Ser Tyr Ser Thr Ile Leu Asp Ser Thr Thr Gln Asn Pro Arg
180 185 190
Phe Leu Ser Ser Ser Thr Arg Asn Pro Phe Ala Ile Ile Thr Pro Leu
195 200 205
His Ala Ser His Ile Gln Ala Ala Leu Tyr Cys Ser Gln Lys His Gly
210 215 220
Glu Gln Met Arg Ile Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser
225 230 235 240
Tyr Gln Ser Ser Val Pro Phe Phe Ile Leu Asp Leu Arg Asn Leu Ser
245 250 255
Ser Ile Ser Ile Asp Ala Lys Ser Lys Ser Ala Trp Val Gln Ala Gly
260 265 270
Ala Thr Ile Gly Glu Leu Tyr Tyr Gly Ile Ala Lys Thr Ser Leu Asn
275 280 285
Leu Ser Phe Pro Gly Gly Val Ala His Thr Ile Gly Val Gly Gly Gln
290 295 300
Leu Gly Gly Gly Gly Tyr Gly Tyr Ser Thr Arg Lys Tyr Gly Leu Ala
305 310 315 320
Ser Asp Asn Val Ile Asp Ala Gln Leu Ile Asp Ala Arg Gly Arg Ile
325 330 335
Leu Asp Arg Lys Thr Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly
340 345 350
Gly Gly Ala Gly Ser Phe Gly Ile Val Leu Ala Trp Lys Ile Arg Leu
355 360 365
Val Asn Thr Pro Ser Thr Val Thr Ile Phe Glu Ala Val Arg Ser Trp
370 375 380
Glu Asn Asn Thr Thr Lys Lys Phe Ile Arg Arg Tyr Gln Arg Arg Ala
385 390 395 400
Ser Lys Thr Asp Lys Asp Leu Thr Ile Phe Val Gly Phe Arg Thr Thr
405 410 415
Ser Ser Thr Asp Glu Glu Gly Asn Glu Arg Ile Ser Ile Leu Thr Ile
420 425 430
Val Ser Ala Thr Phe His Gly Ser Lys Asp Arg Leu Leu Gln Leu Val
435 440 445
Gln Lys Glu Phe Pro Asp Leu Gly Leu Val Ser Glu Glu Cys Thr Glu
450 455 460
Met Ser Trp Val Arg Ser Ile Ile His Phe Asn Leu Phe Gly Asp Glu
465 470 475 480
Val Pro Leu Glu Val Leu Leu Asn Arg Thr Leu Asn Phe Glu Met Lys
485 490 495
Ala Phe Lys Leu Arg Ser Asp Tyr Val Gln Lys Pro Ile Pro Asp Asp
500 505 510
Val Leu Glu Lys Leu Leu Ser Lys Leu Tyr Asp Glu Glu Thr Gly Glu
515 520 525
Gly Tyr Ile Glu Phe Phe Pro Tyr Gly Gly Lys Met Ser Lys Ile Ser
530 535 540
Glu Ser Glu Ile Pro Phe Pro Tyr Arg Ala Gly Asn Leu Tyr Asn Leu
545 550 555 560
Arg Tyr Met Val Ser Trp Lys Asp Asp Gly Asn Ile Thr Arg Thr Asn
565 570 575
Met His Leu Ser Trp Ile Lys Asp Ala Tyr Asp Tyr Met Thr Pro Tyr
580 585 590
Val Ser Lys Asp Pro Arg Gly Ala Tyr Leu Asn Phe Arg Asp Leu Asp
595 600 605
Ile Gly Val Asn Val Asn Glu Ser Asp Tyr Asp Tyr Val Ala Lys Ala
610 615 620
Ser Val Trp Gly Thr Lys Tyr Phe Arg Asn Asn Phe Tyr Arg Leu Val
625 630 635 640
Asp Ile Lys Thr Ile Val Asp Pro Thr Asn Phe Phe Lys Tyr Glu Gln
645 650 655
Ser Ile Pro Pro Leu Pro Pro Leu His Ser Ala Met
660 665
<210> 5
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aacctgtatt ttcagggatc caacgacact catgaagcct ttcttg 46
<210> 6
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ctcgagactg caggctctag atcacattgc tgaatgtaga ggaggaagag 50
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aaatgataac catctcgc 18
<210> 8
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggaggataac gatattattg aggc 24
<210> 9
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
attatccatt tcaatgaatt cggggacgaa gta 33
<210> 10
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tacttcgtcc ccgaattcat tgaaatggat aat 33
<210> 11
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
agctttcccg gcggcgctgc tcacactatc ggc 33
<210> 12
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gccgatagtg tgagcagcgc cgccgggaaa gct 33
<210> 13
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ccatcgacag tgactgcctt tgaagccgtg agg 33
<210> 14
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
cctcacggct tcaaaggcag tcactgtcga tgg 33
<210> 15
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gttcgatcca ttatccatgc taatttattc ggggacgaa 39
<210> 16
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ttcgtccccg aataaattag catggataat ggatcgaac 39
<210> 17
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gataaggatc taaccatcgc tgtcggattc cgaactacg 39
<210> 18
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ctattcctag attggtagcg acagcctaag gcttgatgc 39
<210> 19
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cgatccatta tccatttcgc tttattcggg gacgaagta 39
<210> 20
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tacttcgtcc ccgaataaag cgaaatggat aatggatcg 39
<210> 21
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ctcaatagaa cgctcaatgc tgaaatgaag gcttttaaa 39
<210> 22
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tttaaaagcc ttcatttcag cattgagcgt tctattgag 39
<210> 23
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tccattatcc atttcaatgc tttcggggac gaagtaccc 39
<210> 24
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gggtacttcg tccccgaaag cattgaaatg gataatgga 39
<210> 25
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
cagttaggtg gaggaggcgc tggctattcg acgagaaaa 39
<210> 26
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ttttctcgtc gaatagccag cgcctcctcc acctaactg 39
<210> 27
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
ggaaacctct acaaccttgc ttacatggtg tcatggaag 39
<210> 28
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
cttccatgac accatgtaag caaggttgta gaggtttcc 39
<210> 29
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ccgaagcggc ggcgctgatt atgaaggcct ttc 33
<210> 30
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gaaaggcctt cataatcagc gccgccgctt cgg 33
<210> 31
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
ctactcaata gaacgctcgc tttcgaaatg aaggc 35
<210> 32
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gccttcattt cgaaagcgag cgttctattg agtag 35

Claims (10)

1.一种Diels-Alder反应酶或其编码基因或含有该编码基因的生物材料在催化Diels-Alder反应合成含有六元环骨架的非天然D-A产物中的应用,所述Diels-Alder反应酶来源于桑树,命名为MaDA酶,具有:
1)如SEQ ID No.1所示的氨基酸序列;或
2)SEQ ID No.1所示的氨基酸序列经取代、缺失和/或增加一个或多个氨基酸的序列与SEQ ID No.1同源性为80%、85%、90%、95%、98%、99%,且具有同等活性的由1)衍生的蛋白质;
所述生物材料为表达盒、质粒、载体、微生物、昆虫细胞、动物细胞、植物细胞。
2.如权利要求1所述的应用,其特征在于,编码所述Diels-Alder反应酶的基因,其具有:
1)SEQ ID No.2所示的核苷酸序列;2)SEQ ID No.2所示核苷酸序列经取代、缺失和/或增加一个或几个核苷酸。
3.如权利要求1或2所述的应用,其特征在于,所述催化Diels-Alder反应是以亲二烯体和非天然二烯体为底物进行的合成反应,所述非天然二烯体为苯酚类、联苯类、黄酮类、苯并杂环类。
4.如权利要求3所述的应用,其特征在于,所述生物材料为表达载体pI-sec-sumostar-tev2,其核苷酸序列如SEQ ID No.3所示。
5.一种D-A反应方法,其特征在于,以SEQ ID No.1所示的氨基酸序列的MaDA酶为反应酶,以查尔酮或其衍生物和非天然二烯体化合物为底物进行合成反应,所述非天然二烯体为苯酚类、联苯类、黄酮类、苯并杂环类。
6.一种Diels-Alder反应酶的突变体,所述Diels-Alder反应酶来源于桑树,命名为MaDA酶,其氨基酸序列如SEQ ID No.1所示;所述突变体为SEQ ID No.1所示氨基酸序列的以下一种或多种突变:
(1)第116位的H突变为A;
(2)第177位的V突变为A;
(3)第192位的Y突变为A;
(4)第259位的I突变为A;
(5)第292位的F突变为A;
(6)第356位的F突变为A;
(7)第357位的N突变为A;
(8)第358位的L突变为A;
(9)第358位的L突变为E;
(10)第374位的N突变为A;
(11)第375位的F突变为A;
(12)第443位的R突变为A。
7.权利要求6所述突变体的编码基因。
8.含有权利要求7所述编码基因的生物材料,所述生物材料为表达盒、质粒、载体、微生物、昆虫细胞、动物细胞、植物细胞。
9.权利要求6所述的突变体或其编码基因或权利要求8所述的生物材料在催化Diels-Alder反应中的应用。
10.权利要求6所述的突变体或其编码基因或权利要求8所述的生物材料在合成天然或非天然D-A产物中的应用。
CN201911136241.8A 2019-11-19 2019-11-19 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用 Active CN110964702B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911136241.8A CN110964702B (zh) 2019-11-19 2019-11-19 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911136241.8A CN110964702B (zh) 2019-11-19 2019-11-19 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用

Publications (2)

Publication Number Publication Date
CN110964702A true CN110964702A (zh) 2020-04-07
CN110964702B CN110964702B (zh) 2021-11-26

Family

ID=70030925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911136241.8A Active CN110964702B (zh) 2019-11-19 2019-11-19 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用

Country Status (1)

Country Link
CN (1) CN110964702B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113943716A (zh) * 2021-10-21 2022-01-18 北京大学 一种分子间exo选择性Diels-Alder反应酶及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4528373A (en) * 1982-03-02 1985-07-09 Plastics Engineering Company Vinylacetylene-terminated polyimide derivatives
US20090264317A1 (en) * 2008-04-18 2009-10-22 University Of Massachusetts Functionalized nanostructure, methods of manufacture thereof and articles comprising the same
WO2010077470A2 (en) * 2008-11-19 2010-07-08 University Of Washington Enzyme catalysts for diels-alder reactions
CN102271712A (zh) * 2008-10-31 2011-12-07 通用医疗公司 用于将物质递送至生物靶标的组合物和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4528373A (en) * 1982-03-02 1985-07-09 Plastics Engineering Company Vinylacetylene-terminated polyimide derivatives
US20090264317A1 (en) * 2008-04-18 2009-10-22 University Of Massachusetts Functionalized nanostructure, methods of manufacture thereof and articles comprising the same
CN102271712A (zh) * 2008-10-31 2011-12-07 通用医疗公司 用于将物质递送至生物靶标的组合物和方法
WO2010077470A2 (en) * 2008-11-19 2010-07-08 University Of Washington Enzyme catalysts for diels-alder reactions

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
傅铮铮: "桑叶中Diels-Alderase的提取与初步纯化", 《中国优秀硕士学位论文全文数据库医药卫生科技辑》 *
虞姣姣: "光酶诱导桑叶中Diels-Alderase的分离鉴定及克隆表达研究", 《中国优秀硕士学位论文全文数据库基础科学辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113943716A (zh) * 2021-10-21 2022-01-18 北京大学 一种分子间exo选择性Diels-Alder反应酶及其应用
CN113943716B (zh) * 2021-10-21 2023-12-26 北京大学 一种分子间exo选择性Diels-Alder反应酶及其应用

Also Published As

Publication number Publication date
CN110964702B (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN110951700B (zh) 一种Diels-Alder反应酶及其应用
CN110923183A (zh) 产羊毛甾醇大肠杆菌菌株的构建方法
CN110229838B (zh) 一种生物转化类固醇类化合物获取羟基化化合物的方法
CN110964702B (zh) 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用
CN112553176B (zh) 一种热稳定性提高的谷氨酰胺转氨酶
CN114426957B (zh) 一种糖醛酸脱氢酶突变体及其在制备糖二酸中的应用
CN106755031B (zh) 鼠李糖脂生产质粒及其构建方法与大肠杆菌工程菌和应用
CN115247173A (zh) 构建tmprss6基因突变的缺铁性贫血猪核移植供体细胞的基因编辑系统及其应用
CN113755512B (zh) 一种制备串联重复蛋白质的方法与应用
CN106715689B (zh) 裂解酶以及不对称合成(s)-苯基乙酰基甲醇的方法
CN107075495B (zh) 裂解酶和编码该裂解酶的dna、含该dna的载体以及用于不对称合成(s)-苯基乙酰基甲醇的方法
CN111748034A (zh) 一种滑液囊支原体单克隆抗体的制备方法
RU2774333C1 (ru) Рекомбинантная плазмида pET-GST-3CL-GPG, обеспечивающая синтез протеазы 3CL SARS-CoV-2 в клетках E.coli в растворимой форме
CN113980883B (zh) 一种高产羟基化甾体原料药的重组大肠杆菌及其应用
CN112553177B (zh) 一种热稳定性提高的谷氨酰胺转氨酶变体
CN114317473B (zh) 一种催化活性和热稳定性提高的谷氨酰胺转氨酶变体
RU2792132C1 (ru) Рекомбинантная плазмида pET-GST-3CL, обеспечивающая синтез протеазы 3CL SARS-CoV-2 в клетках E.coli в растворимой форме
KR101137021B1 (ko) 퓨조박테리움 뉴클레텀 유래의 신규 글리코실트랜스퍼라제및 이를 이용한 올리고당 제조방법
CN113234746B (zh) 一种农药诱导蛋白互作和诱导基因表达的方法
CN107354172B (zh) 重组表达载体及其构建方法和应用
CN115247191A (zh) 基因编辑系统及其在构建双基因突变的痣样基底细胞癌综合征猪核移植供体细胞中的应用
CN115232811A (zh) 用于构建hbb基因突变的镰刀型细胞贫血症模型猪核移植供体细胞的方法及应用
CN115232818A (zh) 构建dok7基因突变的先天性肌无力模型猪核移植供体细胞的基因编辑系统及其应用
CN115232814A (zh) 用于构建crybb2基因突变的先天性白内障疾病模型猪核移植供体细胞的方法和系统
CN116135880A (zh) 一株羊驼源纳米抗体s140及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant