CN117143838A

CN117143838A - 对棘白菌素类化合物氧磺酰化的酶及其应用

Info

Publication number: CN117143838A
Application number: CN202210570357.8A
Authority: CN
Inventors: 吕雪峰; 门萍; 黄雪年; 耿策; 谢丽; 张璇
Original assignee: Qingdao Institute of Bioenergy and Bioprocess Technology of CAS
Current assignee: Qingdao Institute of Bioenergy and Bioprocess Technology of CAS
Priority date: 2022-05-24
Filing date: 2022-05-24
Publication date: 2023-12-01

Abstract

本发明公开了能催化棘白菌素类化合物氧磺酰化的酶及其应用，具体公开了一种具有氧磺酰化功能的酶或包含所述酶的生物材料在对棘白菌素类化合物进行羟基化、磺酰化、或氧磺酰化中的应用；所述具有氧磺酰化功能的酶选自细胞色素P450单加氧酶和/或磺酰基转移酶；所述细胞色素P450单加氧酶与SEQ ID No.2相比具有至少70％的序列同一性；所述磺酰基转移酶与SEQ ID No.4相比具有至少70％的序列同一性；所述生物材料选自：所述酶的编码基因，或者包含所述编码基因的载体，或者包含所述载体的宿主细胞。

Description

对棘白菌素类化合物氧磺酰化的酶及其应用

技术领域

本发明属于生物制药技术领域，涉及一种可以对棘白菌素类化合物具有氧磺酰化的P450酶和磺酰基转移酶及其应用；更进一步地，涉及氧磺酰化纽莫康定B₀的形成。

背景技术

近年来随着老龄化人口的增多，器官移植治疗的临床应用推广，HIV病毒的蔓延等，免疫力低下患者数量不断增加，导致深部真菌感染率呈迅速上升的趋势。深部真菌感染逐渐成为免疫力低下患者发病和死亡的重要诱因，对人类社会健康造成了极大威胁。

目前临床上应用的传统抗真菌药物对人体存在毒副作用，并且真菌耐药性问题也日益突出，因此亟需开发新一代的高效、低毒且对耐药菌有效的抗真菌药物。棘白菌素类药物作为一类新型的环脂肽类抗真菌药物，作用机制独特，能够选择性地抑制真菌细胞壁中的β-1,3葡聚糖合成酶活性从而抑制真菌细胞壁的合成，导致真菌细胞裂解死亡，该类药物安全性高，抗菌谱宽且对耐药菌有效。

临床上应用的棘白菌素类抗真菌药物包括三种，分别是卡泊芬净、米卡芬净和阿尼芬净。其中，米卡芬净具有其独特性，与另外两种棘白菌素类抗真菌药物相比，米卡芬净具有磺酰基基团，磺酰基基团能赋予化合物极好的水溶性，进而增加其生物利用度。然而目前FR901379结构中的氧磺酰基基团形成机制仍然是未知的，这极大地限制了磺酰基转移酶在重要化合物生物活性修饰方面的应用。因此，解析米卡芬净前体FR901379中氧磺酰基基团合成机制，可以为生物信息学挖掘提供靶标，发现更多磺酰化的环脂肽类化合物，同时为棘白菌素类化合物氧磺酰化修饰提供了酶学元件和理论指导，有助于芬净类抗真菌药物的新药创制。

发明内容

一方面，本发明提供了一种细胞色素P450单加氧酶。

在一个实施方式中，所述细胞色素P450单加氧酶与SEQ ID No.2相比具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％的序列同一性；优选的，所述细胞色素P450单加氧酶来源于鞘茎点霉属真菌(Coleophoma sp.)；更优选的，所述细胞色素P450单加氧酶的氨基酸序列与SEQ ID No.2相比具有至少70％的序列同一性，并且所述细胞色素P450单加氧酶来源于鞘茎点霉属真菌；所述鞘茎点霉属真菌包括Coleophoma sp.或Coleophoma empetri，例如，鞘茎点霉(Coleophoma sp.)MEFC009。在其他的实施方式中，所述C.empetri为C.empetri F-11899。更优选的，所述细胞色素P450单加氧酶的氨基酸序列如SEQ ID No.2所示。

在其他的实施方式中，所述细胞色素P450单加氧酶的氨基酸序列如NCBI数据库中的序列号分别为RDW63434.1、RDW57263.1和XP_031866084.1所示的序列，分别来自于丝状真菌Coleophoma cylindrospora、Coleophoma crateriformis和Venustampullaechinocandica。

另一方面，本发明提供了一种磺酰基转移酶。

在一个实施方式中，所述磺酰基转移酶与SEQ ID No.4相比具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％的序列同一性；优选的，所述磺酰基转移酶来源于鞘茎点霉属真菌(Coleophoma sp.)；更优选的，所述磺酰基转移酶的氨基酸序列与SEQ ID No.4相比具有至少70％的序列同一性，并且所述磺酰基转移酶来源于鞘茎点霉属真菌；所述鞘茎点霉属真菌包括Coleophoma sp.或C.empetri，例如，鞘茎点霉(Coleophoma sp.)MEFC009。在其他的实施方式中，所述C.empetri为C.empetri F-11899。更优选的，所述磺酰基转移酶的氨基酸序列如SEQ ID No.4所示。

在其他的实施方式中，所述磺酰基转移酶的氨基酸序列如NCBI数据库中的序列号分别为RDW57264.1和XP_031866072.1所示的序列；其中，RDW57264.1的氨基酸序列如SEQID No.5所示，其来源于C.crateriformis；XP_031866072.1的氨基酸序列如SEQ ID No.6所示，其来源于V.echinocandica。

在其他的实施方式中，本发明所述磺酰基转移酶与SEQ ID No.5相比具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％的序列同一性；优选的，所述磺酰基转移酶来源于C.crateriformis；更优选的，所述磺酰基转移酶的氨基酸序列与SEQ ID No.5相比具有至少70％的序列同一性，并且所述磺酰基转移酶来源于C.crateriformis。更优选的，所述磺酰基转移酶的氨基酸序列如SEQ ID No.5所示。

因此，在其他的实施方式中，本发明所述磺酰基转移酶与SEQ ID No.6相比具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％的序列同一性；优选的，所述磺酰基转移酶来源于V.echinocandica；更优选的，所述磺酰基转移酶的氨基酸序列与SEQ ID No.6相比具有至少70％的序列同一性，并且所述磺酰基转移酶来源于V.echinocandica。更优选的，所述磺酰基转移酶的氨基酸序列如SEQ ID No.6所示。

本发明中，鞘茎点霉(Coleophoma sp.)MEFC009，保藏于中国微生物菌种保藏管理委员会普通微生物中心(CGMCC)，保藏编号为CGMCC No.21058，保藏日期为2020年11月18日，地址：北京市朝阳区北辰西路1号院3号中国科学院微生物研究所，电话：010-64807355。

另一方面，本发明还提供了包含上述细胞色素P450单加氧酶或磺酰基转移酶或其编码基因的生物材料。所述生物材料选自：包含上述细胞色素P450单加氧酶或磺酰基转移酶的载体，或者，包含上述细胞色素P450单加氧酶或磺酰基转移酶的宿主细胞。

另一方面，本发明还提供了编码上述细胞色素P450单加氧酶或磺酰基转移酶的基因。

另一方面，本发明还提供了包含上述基因的载体，或者，包含所述载体的宿主细胞。

在一个实施方式中，所述载体包括克隆载体和表达载体，例如，pET系列载体(如pET-14、pET-21、pET-22、pET-28、pET-30、pET-42、pET-GST、pET-His、pET-Trx、pET-GST、pET-CKS、pET-DsbA)、pMAL系列载体(如pMAL-2c)、pGEX系列载体(如pGEX-4T-2、pGEX-6T-1)、pBAD系列载体(如pBAD-His、pBAD-Myc)、pMBP系列载体(pMBP-P、pMBP-C)、pTYB2、pQE-9、pACYCDuet-1、pCDFDuet-1、pColADuet-1、pRSFDuet-1、pllP-OmpA、pUC系列载体(如pUC18、pUC19)、pQE-30、pXH2-1、pXH-43、pTRII、pGSF957。

在一个实施方式中，所述宿主细胞选自大肠杆菌(例如，大肠杆菌DH5α、大肠杆菌BL21(DE3)、Rosetta(DE3)、Codon Plus(DE3)-RIPL、BL21 Codon plus(DE3)、Top10、JM109)、酵母菌(例如，酿酒酵母、毕赤酵母、解酯耶氏酵母)、鞘茎点霉真菌、纽莫康定产生菌(Glarea lozoyensis)。

另一方面，本发明还提供了上述细胞色素P450单加氧酶和/或磺酰基转移酶、其编码基因、包含基因的载体、上述宿主细胞、或上述生物材料在棘白菌素类化合物羟基化、磺酰化或氧磺酰化中的应用。

在一个实施方式中，本发明提供了上述细胞色素P450单加氧酶、其编码基因、包含基因的载体、上述宿主细胞、或上述生物材料在棘白菌素类化合物羟基化中的应用。

在一个实施方式中，本发明提供了上述磺酰基转移酶、其编码基因、包含基因的载体、上述宿主细胞、或上述生物材料在棘白菌素类化合物磺酰化中的应用。

在一个实施方式中，本发明提供了上述细胞色素P450单加氧酶和磺酰基转移酶、其编码基因、包含基因的载体、上述宿主细胞、或上述生物材料在棘白菌素类化合物氧磺酰化中的应用。

本领域公知，棘白菌素类化合物的结构中通常包含L-高酪氨酸苯环，在抗真菌药物卡泊芬净和阿尼芬净前体纽莫康定B₀和棘白菌素B中都含有L-高酪氨酸苯环，同时在本发明中的FR901379、FR133302、化合物13a、化合物13、纽莫康定B₀、羟化纽莫康定B₀、氧磺酰化纽莫康定B₀、化合物4。

例如，FR901379为米卡芬净前体，其结构式如式(I)所示：

羟化纽莫康定B₀的结构式如式(II)所示：

氧磺酰化纽莫康定B₀的结构式如式(III)所示：

纽莫康定B₀的结构式如式(IV)所示：

FR133302的结构式如式(V)所示：

化合物13a的结构式如式(VI)所示：

化合物13的结构式如式(VII)所示：

化合物4的结构式如式(VIII)所示：

上述FR901379、FR133302、化合物13a、化合物13、纽莫康定B₀、羟基化纽莫康定B₀、氧磺酰化纽莫康定B₀或化合物4包括L-高酪氨酸苯环，并且，在L-高酪氨酸苯环上的C3’位置存在不同的修饰。例如，FR901379、化合物13和氧磺酰化纽莫康定B₀在L-高酪氨酸苯环上的C3’位置存在氧磺酰基修饰；FR133302、化合物13a和羟基化纽莫康定B₀在L-高酪氨酸苯环上的C3’位置存在羟基修饰；化合物4和纽莫康定B₀则在L-高酪氨酸苯环上的C3’位置上不存在任何修饰。

在一个实施方式中，所述对棘白菌素类化合物羟基化、磺酰化或氧磺酰化为对棘白菌素类化合物的L-高酪氨酸苯环上的C3’位进行羟基化、磺酰化或氧磺酰化。

在一个实施方式中，所述羟基化为在棘白菌素类化合物L-高酪氨酸苯环未羟基化的C3’位上添加羟基；优选的，所述未羟基化的C3’位上无任何修饰；

在一个实施方式中，所述磺酰化为在棘白菌素类化合物L-高酪氨酸苯环羟基化C3’位的羟基上添加磺酰基(SO₃ ^-)。

在一个实施方式中，所述氧磺酰化为在棘白菌素类化合物的L-高酪氨酸苯环无修饰的C3’位上添加氧磺酰基(OSO₃ ^-)。

上述棘白菌素类化合物包括但不限于FR901379、FR133302、化合物13a、化合物13、纽莫康定B₀、羟基化纽莫康定B₀、氧磺酰化纽莫康定B₀、化合物4中的一种或任意几种，上述化合物的结构域如式I-式VIII所示。

在一个实施方式中，所述羟基化为将式VIII所示的化合物羟基化为式V所示的化合物，或者，将纽莫康定B₀羟基化为式II所示的化合物。

在一个实施方式中，所述磺酰化为将式V所示的化合物磺酰化为式I所示的化合物，或者，将式II所示的化合物磺酰化为式III所示的化合物，或者，将式VI所示的化合物磺酰化为式VII所示的化合物。

在一个实施方式中，所述氧磺酰化为将式VIII所示的化合物氧磺酰化为式I所示的化合物，或者，将纽莫康定B₀氧磺酰化为式III所示的化合物。

在一个实施方式中，本发明提供了上述细胞色素P450单加氧酶在FR901379形成过程中L-高酪氨酸苯环上的C3’位的羟基化中的用途。

在一个实施方式中，本发明提供了上述磺酰基转移酶在FR901379形成过程中将磺酰基转移到L-高酪氨酸苯环上的C3’位的羟基中的用途。

在一个实施方式中，本发明提供了上述细胞色素P450单加氧酶和上述磺酰基转移酶在FR901379形成过程中在L-高酪氨酸苯环上的C3’位形成氧磺酰基团中的用途。

具体的，本发明提供了上述细胞色素P450单加氧酶和上述磺酰基转移酶在如式(I)所示的FR901379形成过程中催化形成式(I)中的氧磺酰基团(OSO3^-)中的用途。

在一个实施方式中，本发明提供了上述细胞色素P450单加氧酶在催化纽莫康定B₀形成羟基化纽莫康定B₀中的用途。

在一个实施方式中，本发明提供了上述细胞色素P450单加氧酶和磺酰基转移酶在催化纽莫康定B₀形成氧磺酰化纽莫康定B₀中的用途。

本发明中，所述细胞色素P450单加氧酶又称为P450酶。

另一方面，本发明还提供了一种对棘白菌素类化合物的L-高酪氨酸苯环上的C3’位进行羟基化、磺酰化或氧磺酰化的方法，所述方法包括利用上述细胞色素P450单加氧酶和/或磺酰基转移酶、其编码基因、包含基因的载体、上述宿主细胞、或上述生物材料对棘白菌素类化合物的L-高酪氨酸苯环上的C3’位进行羟基化、磺酰化或氧磺酰化的步骤。

另一方面，本发明还提供了一种纽莫康定产生菌(G.lozoyensis)基因工程菌株，所述工程菌株为在纽莫康定产生菌中引入上述细胞色素P450单加氧酶和/或磺酰基转移酶所得到的工程菌株。

优选的，所述引入为过表达。

所述的“引入”包括将上述目的基因在出发菌株中进行表达的步骤，优选，过表达。例如，将目的基因构建到表达载体上，将表达载体转入到宿主细胞中以表达目的基因，优选，过表达。在其他的实施方式中，所述的“引入”包括将目的基因插入到宿主细胞的基因组中；优选的，所述插入到宿主细胞的基因组中可以采用同源重组双交换的方法；在一个实施方式中，可以采用将目的基因以及同源臂插入到载体上，然后将载体转入到宿主细胞中，利用同源臂与宿主细胞基因组发生同源重组双交换从而将目的基因插入到合适的基因组的位置；在其他的实施方式中，还可以采用基因编辑的方式，例如，利用CRISPR/Cas系统在期望的基因组位点上进行切割，同时将目的基因作为外源供体插入到切割位点上。

另一方面，本发明还提供了上述基因工程菌株在生产羟基化纽莫康定B₀和/或氧磺酰化纽莫康定B₀中的应用。

所述羟基化纽莫康定B₀的结构式如式(II)所示，所述氧磺酰化纽莫康定B₀的结构式如式(III)所示。

另一方面，本发明还提供了一种制备羟基化纽莫康定B₀和/或氧磺酰化纽莫康定B₀的方法，所述方法包括利用上述基因工程菌株进行发酵的步骤。

本发明中的“过表达”是指基因工程菌与野生型的出发菌株相比，所述目的基因的表达量或活性要高于野生型的出发菌株。在一个实施方式中，上述过表达可以通过引入表达载体来过表达目的基因来实现；其他的实施方式中，上述过表达也可以通过在出发菌株中引入额外的目的基因的拷贝、通过增加目的基因的拷贝数来实现；其他的实施方式中，还可以通过对目的基因的启动子优化来实现，比如，通过将目的基因的原始启动子替换为启动子活性更高的启动子来实现目的基因的过表达。

本发明所述的突变包括通过基因缺失、基因插入或基因取代的方式导致基因功能或活性丧失。

在优选的实施方式中，基因突变为将目标基因进行基因敲除。

在一个实施方式中，所述基因突变可以采用本领域常规的技术操作来实现，例如，通过同源重组的方式进行基因敲入或基因敲除从而导致基因功能或活性丧失；或者，采用基因编辑的方式，如锌指核酸内切酶(ZFN)、类转录激活因子效应物核酸酶(TALEN)或CRIspR技术对上述基因进行突变从而导致基因功能或活性丧失。

另一方面，本发明还提供了上述基因工程菌的构建方法。

附图说明

图1为敲除mcfP基因所获转化子的基因组PCR验证结果；其中6#，8#，9#是基因mcfP缺失的转化子，WT-1为对照菌株Coleophoma sp.-Δku80。

图2为基因mcfP缺失菌株Coleophoma sp.-ΔmcfP发酵产物HPLC分析结果；其中Coleophoma sp.-ΔmcfP为基因mcfP缺失菌株，WT-1为Coleophoma sp.-Δku80。

图3为化合物4，5，6，7和8的LC-MS分析结果，其中A为化合物4，B为化合物5，C为化合物6，D为化合物7，E为化合物8。

图4为化合物4，5，6，7和8的结构。

图5为敲除mcfS基因所获转化子的基因组PCR验证结果；其中1#，3#，7#是基因mcfS缺失的转化子，WT-1为对照菌株Coleophoma sp.-Δku80。

图6为基因mcfS缺失菌株Coleophoma sp.-ΔmcfS发酵产物HPLC分析结果；其中Coleophoma sp.-ΔmcfS为基因mcfS缺失菌株，WT-1为Coleophoma sp.-Δku80。

图7为化合物9的LC-MS分析结果。

图8为重组质粒pCAMBIA1300-mcfP和pCAMBIA1300-mcfS图谱示意图；其中A为质粒pCAMBIA1300-mcfP，B为pCAMBIA1300-mcfS。

图9为异源表达P450酶McfP和磺酰基转移酶McfS的G.lozoyensis ATCC 74030转化子的基因组PCR验证结果；其中1-9为转化子基因组；WT-2为对照菌株G.lozoyensis ATCC74030基因组。

图10为工程菌株G.lozoyensis::mcfP::mcfS发酵产物HPLC分析结果；其中，G.lozoyensis::mcfP::mcfS为同时异源表达基因mcfP和mcfS的重组菌株，G.lozoyensisATCC74030为对照菌株。

图11为化合物11和12的LC-MS分析结果，其中A为化合物11，B为化合物12。

图12为化合物11和12的化学结构。

图13为异源表达P450酶McfP的G.lozoyensis ATCC 74030转化子的基因组PCR验证结果；其中1-18为转化子基因组；WT-2为对照菌株Glarea lozoyensis ATCC 74030基因组。

图14为工程菌株G.lozoyensis::mcfP发酵产物HPLC分析结果；其中，G.lozoyensis::mcfP为异源插入基因mcfP的重组菌株，G.lozoyensis ATCC 74030为对照菌株。

图15为质粒pET28a-SUMO-McfS图谱。

图16为蛋白SUMO-McfS的SDS-PAGE分析结果。

图17为磺酰基转移酶McfS催化FR133302的HPLC分析结果；i：FR901379标准品；ii：McfS催化的酶反应；iii：(ii)的对照，McfS煮沸失活；iv：(ii)的对照，不加供体PAPS。图18为磺酰基转移酶McfS催化FR133302功能示意图。

图19为蛋白RDW57264.1、XP_031866072.1和McfS催化化合物13a的HPLC分析结果。图20为化合物13a和13的LC-MS分析结果。A为化合物13a，B为化合物13。

图21为磺酰基转移酶McfS、RDW57264.1和XP_031866072.1催化化合物13a的功能示意图。

具体实施方式

下面结合具体实施例对本发明做进一步说明，但本发明不受实施例的限制。以下实施例中所用材料、试剂、仪器和方法，未经特殊说明，均为本领域中的常规材料、试剂、仪器和方法，均可通过商业渠道获得。

本发明中质粒提取采用OMEGA公司的Plasmid Mini Kit I试剂(D6942-01)；PCR片段纯化采用OMEGA公司DNA片段回收Cycle-Pure Kit试剂盒(D6492-01)；一步克隆酶Ultra One Step Cloning Kit购自南京Vazyme公司；限制性内切酶购自Thermo公司；T4连接酶购自New England Biolabs；RNA提取采用TAKARA公司的Mini BESTPlant RNA Extraction Kit试剂盒；cNDA反转录试剂盒购自TAKARA公司；大肠杆菌感受态细胞DH5α和BL21(DE3)购自南京Vazyme公司；农杆菌感受态细胞LBA4404购自上海唯地生物公司。

大肠杆菌培养基LB培养基：1％蛋白胨，0.5％酵母粉，1％NaCl，pH 7.0。

Coleophoma sp.MEFC009的种子培养基：15g/L可溶性淀粉，10g/L蔗糖，5g/L棉籽饼粉，10g/L蛋白胨，1g/L KH₂PO₄，2g/L CaCO₃，pH 6.0-8.0。

Coleophoma sp.MEFC009的发酵培养基：30g/L玉米淀粉，30g/L蛋白胨，6g/L(NH₄)₂SO₄，1g/L KH₂PO₄，0.3g/L FeSO₄·7H₂O，0.01g/L ZnSO₄·7H₂O，2g/L CaCO₃，pH6.0-8.0。

G.lozoyensis ATCC 74030的种子培养基：20g/L大豆粉，40g/L葡萄糖，1g/LKH₂PO₄，pH 5.0-8.0。

G.lozoyensis ATCC 74030的发酵培养基：100g/L甘露醇，20g/L葡萄糖，10g/L棉籽饼粉，10g/L蛋白胨，2.5g/L K₂HPO₄·3H₂O，pH 5.0-8.0。

STC：1M山梨醇，50mM Tris-HCl(pH 8.0)，50mM CaCl₂。

PSTC：40％PEG4000，1M山梨醇，50mM Tris-HCl(pH 8.0)，50mM CaCl₂。

顶层琼脂：PDB、1M山梨醇和4g/L琼脂糖，灭菌后48℃保温。

再生筛选培养基平板PDA-SH：PDA平板、1M山梨醇和100mg/L潮霉素B。

筛选培养基PDA-H：PDA平板和100mg/L潮霉素B。

质粒pXH2-1记载在Xuenian Huang,Xuefeng Lu,Jian-Jun Li.Cloning,characterization and application of a glyceraldehyde-3-phosphatedehydrogenase promoter from Aspergillus terreus,J Ind Microbiol Biotechnol(2014)41:585-592。

质粒pCAMBIAMBIA1300记载在HanaMartina Hujslová,MilanGryndler.Genetic transformation of extremophilic fungi Acidea extrema andAcidothrix acidophila,Folia Microbiol(Praha).2015,60(4),365-71.

质粒pPM-3记载在Ping Men,Min Wang,Jinda Li,Xuenian Huang,XuefengLu.Establishing an efficient genetic manipulation system for sulfatedechinocandin producing fungus Coleophoma empetri.Frontiers inMicrobiology.2021,12,734780。

质粒pCAMBIA1300-mcfP(本实验室自主构建)

质粒pCAMBIA1300-mcfS(本实验室自主构建)

鞘茎点霉属真菌(Coleophoma sp.)保藏于中国普通微生物菌种保藏管理中心，(该菌株保藏号是CGMCC NO:21058，地址：北京市朝阳区北辰西路1号院3号，中国科学院微生物研究所)。

G.lozoyensis ATCC 74030购自American type culture collection。

实施例1.构建敲除mcfP基因的工程菌株Coleophoma sp.-ΔmcfP

以野生型Coleophoma sp.MEFC009的基因组为模板，采用pfu DNA聚合酶(Fermentas,Catalog No.:EP0501)进行PCR扩增，用引物UmcfP-F(5’-tctcaaggagataactcccacac-3’)和UmcfP-R(5’-ctttacgcttgcgatcccgaaTCATTGGGATTGATGCGGATGATAGG-3’)可以扩增获得大小约为1.2kb的mcfP的上游序列U-mcfP，用引物DmcfP-F(5’-ccctgggttcgcaaagataattgCGTATCTTTCCACTAATACTGC-3’)和DmcfP-R(5’-caccgtacctgaatcctcat-3’)可以扩增获得大小为1.2kb的mcfP的下游序列D-mcfP。以质粒pXH2-1为模板，用引物hph-F(5’-ttcgggatcgcaagcgtaaag-3’)和hph-R(5’-caattatctttgcgaacccagg-3’)进行PCR扩增，获得大小约为2.2kb的潮霉素抗性筛选片段hph；通过融合PCR将hph片段、上游序列U-mcfP和下游序列D-mcfP进行融合，再以融合产物为模板，用巢式引物UmcfP-CS-F(5’-ggacaacgaatagctaaatgaaga-3’)和DmcfP-CS-R(5’-gctctgctattcataactcg-3’)通过PCR扩增出大小为4.4kb的敲除打靶元件UmcfP-hph-DmcfP。所述mcfP基因序列如SEQ ID No.1所示，所述McfP的氨基酸序列如SEQ ID No.2所示。

以Coleophoma sp.-Δku80为出发菌，首先从PDA平板上取少量菌丝，用手持匀浆器破碎，取1mL种子液接种到50mL的种子培养基，于250mL的三角瓶中，220rpm，25℃进行摇床培养。2天后，离心收集菌丝。5000rpm，4℃，5min。将菌丝体再次用匀浆器破碎，取0.5mL-2mL种子液接种到50mL的种子培养基，相同的条件下培养1天，将培养基与菌丝体一起倒入50mL的无菌离心管中，5000rpm，离心收集菌丝。用0.6M MgSO₄对菌丝体清洗2次。称取1g菌丝，加入10mL酶解液，30℃，100rpm处理1-4h。酶解液成分为：1％纤维素酶、0.6％溶壁酶、0.6％蜗牛酶、0.6M MgSO₄，经由0.22μm的无菌过滤器过滤除菌。将上述原生质体反应液通过无菌神奇滤布进行过滤。5000rpm，4℃离心收集原生质体。用冰预冷的STC，洗涤一次，把原生质体重悬于预冷的STC中，并用STC将原生质体浓度调整为5×10⁷个/mL，得到原生质体悬液。

向140μL上述原生质体悬液中加入10μL的UmcfP-hph-DmcfP片段，再加入50μL的PSTC，轻轻混匀，冰浴30min。加入1mL PSTC，混匀后室温放置20min；然后与10mL顶层琼脂混合后倾注于3块再生筛选培养基平板PDA-SH上，在30℃、黑暗条件下培养5-7天，得到转化子。

从转化筛选平板上挑取具有潮霉素抗性转化子转移至PDA-H上，在25℃培养4-6天进行传代培养，连续传代3代。选取稳定传代的3个转化子(6#，8#，9#)进行单孢分离纯化，并提取单孢分离之后的转化子基因组。利用外部引物UmcfP-F(5’-tctcaaggagataactcccacac-3’)和DmcfP-R(5’-caccgtacctgaatcctcat-3’)对转化子基因组进行PCR验证，能扩增出大小约为4.6kb的条带的为阳性转化子，而Coleophoma sp.-Δku80只能扩增出大小约为2.9kb的条带，图1说明6#，8#，9#转化子为阳性转化子，说明在基因mcfP位置发生了同源重组，整合了外源片段UmcfP-hph-DmcfP。

实施例2.mcfP基因缺失工程菌株Coleophoma sp.-ΔmcfP的发酵及产物分析

将3株mcfP基因缺失工程菌株Coleophoma sp.-ΔmcfP 6#，8#，9#和对照菌株Coleophoma sp.-Δku80接种于PDA固体平板上，25℃培养4-6天。挑取少量的菌丝，利用核酸提取仪(-24)对菌丝进行破碎，将破碎后的菌丝接种于50mL Coleophoma sp.的种子培养基(250mL三角瓶)，25℃，220rpm，摇床培养48h。将上述培养的种子液取5mL到Coleophoma sp.的发酵培养基，25℃，220rpm，摇床培养8天，每个菌株设置3个平行。从每一瓶发酵液中取1mL，加入等体积的甲醇，超声萃取1h，离心，取上清。用0.22μm的有机滤器过滤处理样品，并通过HPLC和LC-MS对处理后的样品进行分析。

HPLC分析方法为：液相色谱柱为Agilent C-18反向柱883975-902(4.6×150mm，5μm)；流动相为A：0.05％(体积比)三氟乙酸水溶液，流动相B：0.05％(体积比)三氟乙酸乙腈溶液，流速为1mL/min，紫外检测波长：210nm，30℃，总洗脱时间为37min。梯度洗脱条件：0-5min，流动相B占流动相的体积由5％线性上升到24％，5-35min，流动相B占流动相的体积由24％线性上升到62％，35-37min，流动相B占流动相的体积由62％线性上升到100％。结果如图2所示；与出发菌株Coleophoma sp.-Δku80相比，化合物1，2，3消失，相应的出现了紫外吸收与化合物1，2，3相同的另外4个化合物。进而对化合物4，5，6，7和8进行分离纯化，通过液质联用(LC-MS)和核磁共振(NMR)进行分析。LC-MS分析方法为：Agilent公司1290高效液相色谱，色谱柱为Agilent Zorbax Extend-C18的C18柱(2.1×50mm，1.8μm)；流动相总流速为0.6mL/min；流动相A：0.05％(体积比)甲酸水溶液，流动相B：0.05％(体积比)甲酸乙腈溶液，总洗脱时间为7.0min；洗脱条件为：梯度洗脱条件：0-1min，流动相B占流动相的体积由5％线性上升到20％，1-6min，流动相B占流动相的体积由20％线性上升到60％，6-7min，流动相B占流动相的体积由60％线性上升到100％。结果如图3所示；结合NMR分析结果可知，4(分子式：C₅₁H₈₂N₈O₁₇，理论值：[M+H]+1079.5871，实际值：1079.5873),5(分子式：C₅₀H₈₀N₈O₁₆，理论值：[M+H]+1049.5765，实际值：1049.5766)，6(分子式：C₅₁H₈₂N₈O₁₆，理论值：[M+H]+1063.5922，实际值1063.5921),7(分子式：C₅₁H₈₂N₈O₁₅，理论值：[M+H]+1047.5972，实际值：1047.5969)和8(分子式：C₅₁H₈₂N₈O₁₄，理论值：[M+H]+1031.6023，实际值：1031.6022)，根据分子量推测这些中间体少了氧磺酰基和一些羟基。进一步通过NMR对化合物4，5，6，7和8的结构进行了鉴定。他们有一个共同的特征：氧磺酰基消失，进而说明基因mcfP编码的P450酶负责FR901379结构中氧磺酰化模块形成的第一步——L-高酪氨酸苯环C3’位的羟基化。

以McfP的氨基酸序列作为参照，在另外3株产其他磺酰化的棘白菌素类化合物生产菌株Coleophoma cylindrospora、Coleophoma crateriform和Venustampullaechinocandica中找到了同源性大于75％的同源序列，在NCBI数据库中的序列号分别为RDW63434.1、RDW57263.1和XP_031866084.1。这3个蛋白很有可能与McfP具有相同的功能，负责氧磺酰基模块中第一步羟基的形成。

实施例3.构建敲除mcfS基因的工程菌株Coleophoma sp.-ΔmcfS

以野生型Coleophoma sp.MEFC009的基因组为模板，采用pfu DNA聚合酶(Fermentas,Catalog No.:EP0501)进行PCR扩增，用引物UmcfS-F(5’-gcgccttcgaagcgggcaac-3’)和UmcfS-R(5’-ctttacgcttgcgatcccgaaTCGAAGGCCTCTTTCCACAAC-3’)可以扩增获得大小约为1.2kb的mcfS的上游序列U-mcfS，用引物DmcfS-F(5’-cctgggttcgcaaagataattgACATATTCAAGTACAGCCCCC-3’)和DmcfS-R(5’-tagtccagaggatgacttcc-3’)可以扩增获得大小为1.2kb的mcfS的下游序列D-mcfS。以质粒pXH2-1为模板，用引物hph-F(5’-ttcgggatcgcaagcgtaaag-3’)和hph-R(5’-caattatctttgcgaacccagg-3’)进行PCR扩增，获得大小约为2.2kb的潮霉素抗性筛选片段hph；通过融合PCR将hph片段、上游序列U-mcfS和下游序列D-mcfS进行融合，再以融合产物为模板，用巢式引物UmcfS-CS-F(5’-gaatactttgctcgcaggtg-3’)和DmcfS-CS-R(5’-gccaatctataaagggaaagg-3’)通过PCR扩增出大小为4.4kb的敲除打靶元件UmcfS-hph-DmcfS。

向140μL上述原生质体悬液中加入10μL的UmcfS-hph-DmcfS片段，再加入50μL的PSTC，轻轻混匀，冰浴30min。加入1mL PSTC，混匀后室温放置20min；然后与10mL顶层琼脂混合后倾注于3块再生筛选培养基平板PDA-SH上，在30℃黑暗条件下培养5-7天，得到转化子。

从转化筛选平板上挑取具有潮霉素抗性转化子转移至PDA-H上，在25℃培养4-6天进行传代培养，连续传代3代。选取稳定传代的3个转化子(1#，3#，7#)进行单孢分离纯化，并提取单孢分离之后的转化子基因组。利用外部引物UmcfS-F(5’-gcgccttcgaagcgggcaac-3’)和DmcfS-R(5’-tagtccagaggatgacttcc-3’)对转化子基因组进行PCR验证，能扩增出大小约为4.9kb的条带的为阳性转化子，而Coleophoma sp.-Δku80只能扩增出大小约为3.1kb的条带，图5说明1#，3#，7#转化子为阳性转化子，说明在基因mcfS位置发生了同源重组，整合了外源片段UmcfS-hph-DmcfS。

实施例4.mcfS基因缺失工程菌株Coleophoma sp.-ΔmcfS的发酵及产物分析

将3株mcfS基因缺失工程菌株Coleophoma sp.-ΔmcfS 1#，3#，7#和对照菌株Coleophoma sp.-Δku80接种于PDA固体平板上，25℃培养4-6天。挑取少量的菌丝，利用核酸提取仪(-24)对菌丝进行破碎，将破碎后的菌丝接种于50mL Coleophoma sp的种子培养基(250mL三角瓶)，25℃，220rpm，摇床培养48h。将上述培养的种子液取5mL到Coleophoma sp的发酵培养基，25℃，220rpm，摇床培养8天，每个菌株设置3个平行。从每一瓶发酵液中取1mL，加入等体积的甲醇，超声萃取1h，离心，取上清。用0.22μm的有机滤器过滤处理样品，并通过HPLC和LC-MS对处理后的样品进行分析。

HPLC分析方法为：液相色谱柱为Agilent C-18反向柱883975-902(4.6×150mm，5μm)；流动相为A：0.05％(体积比)三氟乙酸水溶液，流动相B：0.05％(体积比)三氟乙酸乙腈溶液，流速为1mL/min，紫外检测波长：210nm，30℃，总洗脱时间为37min。梯度洗脱条件：0-5min，流动相B占流动相的体积由5％线性上升到24％，5-35min，流动相B占流动相的体积由24％线性上升到62％，35-37min，流动相B占流动相的体积由62％线性上升到100％。结果如图6所示；与出发菌株Coleophoma sp.-Δku80相比，化合物1，2，3消失，产生了少量的化合物6、7、8和9。通过LC-MS对Coleophoma sp.-ΔmcfS发酵产物进行分析。LC-MS分析方法为：Agilent公司1290高效液相色谱，色谱柱为Agilent Zorbax Extend-C18的C18柱(2.1×50mm，1.8μm)；流动相总流速为0.6mL/min；流动相A：0.05％(体积比)甲酸水溶液，流动相B：0.05％(体积比)甲酸乙腈溶液，总洗脱时间为7.0min；梯度洗脱条件：0-1min，流动相B占流动相的体积由5％线性上升到20％，1-6min，流动相B占流动相的体积由20％线性上升到60％，6-7min，流动相B占流动相的体积由60％线性上升到100％。结果如图7所示；通过LC-MS分析结果可知，当敲除基因mcfS之后，FR901379结构中的磺酰基消失，产生了化合物6、7、8和9。化合物6、7和8同样也在敲除株Coleophoma sp.-ΔmcfP中存在，这3个化合物有一个共同的特征，L-高酪氨酸苯环C3’位的氧磺酰基缺失。通过LC-MS对化合物9进行分析，化合物9分子式：C₅₁H₈₂N₈O₁₈，理论值：[M+H]⁺1095.5820实际值1095.5823，与化合物1相比，分子量小了80，推测应该少了磺酰基(SO₃ ^-)；进一步通过NMR对其进行确认，发现化合物9在L-高酪氨酸苯环的C3’位只有羟基。以上结果表明McfS在FR901379生物合成中负责将磺酰基转移到L-高酪氨酸苯环的C3’位的羟基上。mcfS基因序列如SEQ ID No.3所示，McfS的氨基酸序列如SEQ ID No.4所示。

以McfS的氨基酸序列作为参照，在其他磺酰化的棘白菌素类化合物生产菌株Coleophoma crateriformis和Venustampulla echinocandica中找到了同源性大于75％的同源序列，在NCBI数据库中的序列号分别为RDW57264.1和XP_031866072.1。这2个蛋白很有可能与McfS具有相同的功能，负责氧磺酰基模块中第二步磺酰基基团的形成。

实施例5产氧磺酰化纽莫康定B₀的G.lozoyensis ATCC 74030工程菌株的构建

1.P450酶编码基因mcfP和磺酰基转移酶编码基因mcfS表达质粒构建

所述P450酶编码基因mcfP的基因序列如SEQ ID No.1所示，其氨基酸序列如SEQID No.2所示。所述磺酰基转移酶编码基因mcfS的基因序列如SEQ ID No.3所示，其氨基酸序列如SEQ ID No.4所示。

提取Coleophoma sp.MEFC009的RNA，对其RNA进行反转录获得cDNA。以反转录后的cDNA为模板，利用引物mcfPCDS-F(5’-cttattcctttgaacctttcaATGATAAATCTTGCAAGTCCCCTC-3’)和mcfPCDS-R(5’-caaaattcttcatttatttattatgcttccacaagtattcttaa-3’)进行PCR扩增，获得大小约为1.5kb的mcfP的编码序列(mcfPCDS)；以G.lozoyensis ATCC 74030基因组为模板，利用引物PgpdGL-F(5’-ctgggttcgcaaagataattgtgttactcatatggattgaggg-3’)和PgpdGL-R(5’-GGGGACTTGCAAGATTTATCATattgttttctggtgaagattag-3’)进行PCR扩增，获得大小约为1.0kb的启动子片段PgpdGL；以质粒pPM3为模板，利用引物Tpgk-F(5’-taaataaatgaagaattttgtgaaacgag-3’)和Tpgk-R(5’-cacacattattatggagaaacattgcagcgcacaagtcagt-3’)进行PCR扩增，获得大小约为0.5kb大小的终止子片段Tpgk；以质粒pXH2-1为模板，利用引物hph-F(5’-ttcgggatcgcaagcgtaaag-3’)和hph-R(5’-caattatctttgcgaacccagg-3’)进行PCR扩增，获得大小约为2.2kb的潮霉素抗性筛选片段hph；利用限制性内切酶Bam H I和Xho I对质粒pCAMBIA1300进行双酶切，纯化回收后获得线性的质粒pCAMBIA1300。利用一步克隆试剂盒(Ultra One Step CloningKit)将线性质粒pCAMBIA1300与片段hph，PgpdGL，mcfPCDS和Tpgk进行连接，获得重组质粒pCAMBIA1300-mcfP。将重组后的质粒pCAMBIA1300-mcfP转化到大肠杆菌DH5α感受态细胞，通过卡那霉素抗性筛选阳性转化子，通过PCR和DNA测序获得正确的重组质粒pCAMBIA1300-mcfP，质粒图谱如图8A。

参照上述相同的方法构建质粒pCAMBIA1300-mcfS。以反转录后的cDNA为模板，利用引物mcfSCDS-F(5’-caactcatcaatcatcacaacATGGCTTTAGACCGCCAGAATGC-3’)和mcfSCDS-R(5’-cacaaaattcttcatttatttaCTACTTCCTAGCTAGCCAAACAGCC-3’)进行PCR扩增，获得大小约为0.8kb的mcfS的编码序列(mcfSCDS)；以质粒pXH2-1为模板，利用引物PgpdAt-F(5’-ccctgggttcgcaaagataattggttacactctgggaggatcc-3’)和PgpdAt-R(5’-gttgtgatgattgatgagttg-3’)进行PCR扩增，获得大小约为0.7kb的启动子片段PgpdAt；利用一步克隆试剂盒(Ultra One Step Cloning Kit)将线性质粒pCAMBIA1300与片段hph，PgpdAt，mcfSCDS和Tpgk进行连接，获得重组质粒pCAMBIA1300-mcfS。将重组后的质粒pCAMBIA1300-mcfS转化到大肠杆菌DH5α感受态细胞，通过卡那霉素抗性筛选阳性转化子，通过PCR和DNA测序获得正确的重组质粒pCAMBIA1300-mcfS，质粒图谱如图8B。

2.产氧磺酰化纽莫康定B₀菌株的构建

分别将重组质粒pCAMBIA1300-mcfP和pCAMBIA1300-mcfS转到农杆菌LBA4404感受态细胞，获得重组菌株LBA4404-pCAMBIA1300-mcfP和LBA4404-pCAMBIA1300-mcfS。通过根瘤农杆菌介导的转化，将片段hph-PgpdA-mcfP-Tpgk和hph-PgpdAt-mcfS-Tpgk共同转到两种方式转到G.lozoyensis ATCC 74030菌株中。

将具有潮霉素B抗性的转化子进行传代培养，连续传代3次，选取稳定传代的9个转化子进行分离纯化，25℃培养7-10天，对纯化后的单菌落提取基因组，分别利用引物PgpdGL-F(5’-ctgggttcgcaaagataattgtgttactcatatggattgaggg-3’)和mcfPCDS-R(5’-caaaattcttcatttatttattatgcttccacaagtattcttaa-3’)；PgpdAt-F(5’-ccctgggttcgcaaagataattggttacactctgggaggatcc-3’)和mcfSCDS-R(5’-cacaaaattcttcatttatttaCTACTTCCTAGCTAGCCAAACAGCC-3’)进行PCR验证，能同时扩增出大小约为3.0kb和2.1kb的条带为阳性转化子，由图9可知利用该方法获得的9个转化子为阳性转化子，基因组上同时整合了表达元件PgpdGL-mcfP-Tpgk和PgpdAt-mcfS-Tpgk，证明我们得到了表达mcfP和mcfS的G.lozoyensis菌株G.lozoyensis::mcfP::mcfS。

实施例6产氧磺酰化纽莫康定B₀的G.lozoyensis::mcfP::mcfS工程菌株的发酵验证

将工程菌株G.lozoyensis::mcfP::mcfS和对照菌株G.lozoyensis ATCC 74030接种于PDA固体平板上，25℃培养7-10天。挑取少量的菌丝，利用核酸提取仪(-24)对菌丝进行破碎，将破碎后的菌丝接种于50mL G.lozoyensis ATCC 74030的种子培养基(250mL三角瓶)，25℃，220rpm，摇床培养4-5天。将上述培养的种子液取5mL到G.lozoyensisATCC 74030的发酵培养基，25℃，220rpm，摇床培养12天，每个菌株设置3个平行。从每一瓶发酵液中取1mL，加入等体积的甲醇，超声萃取1h，离心，取上清。用0.22μm的有机滤器过滤处理样品，并通过HPLC和LC-MS对处理后的样品进行分析。

HPLC分析方法为：液相色谱柱为Agilent C-18反向柱883975-902(4.6×150mm，5μm)；流动相为A：0.05％(体积比)三氟乙酸水溶液，流动相B：0.05％(体积比)三氟乙酸乙腈溶液，流速为1mL/min，紫外检测波长：210nm，30℃，总洗脱时间为25min。梯度洗脱条件：0-5min，流动相B占流动相的体积由5％线性上升到40％，5-20min，流动相B占流动相的体积由40％线性上升到62％，20-25min，流动相B占流动相的体积由62％线性上升到100％。结果如图10所示；从HPLC结果可知，除了化合物10(纽莫康定B₀)外，在12.2min和13min出现了两个新的化合物，命名为化合物11和12。并且11和12和10具有相同的紫外吸收。猜测可能是羟化的纽莫康定B₀和氧磺酰化纽莫康定B₀的。为了进一步确认化合物的11和12结构，通过LC-MS进行分析。

LC-MS分析方法为：Agilent公司1290高效液相色谱，色谱柱为Agilent ZorbaxExtend-C18的C18柱(2.1×50mm，1.8μm)；流动相总流速为0.6mL/min；流动相A：0.05％(体积比)甲酸水溶液，流动相B：0.05％(体积比)甲酸乙腈溶液，总洗脱时间为7.5min；洗脱条件为：0-1min，流动相B占流动相的体积由5％线性上升到20％，1-6min，流动相B占流动相的体积由20％线性上升到60％，6-7min，流动相B占流动相的体积由60％线性上升到100％。结果如图11所示。从LC-MS分析结果可知，化合物11的质荷比[M+H]⁺为1081.5664(C₅₀H₈₀N₈O₁₈，理论值：1081.5663)，化合物12的质荷比[M+H]⁺为1161.5229(C₅₀H₈₀N₈O₂₁S，理论值：1161.5231)。进一步的NMR结果表明化合物11和12与化合物10相比(图12)，分别在L-高酪氨酸苯环的C3’位置多了一个羟基和一个氧磺酰基。说明P450酶McfP和McfS能够在G.lozoyensis ATCC 74030内催化纽莫康定B₀生成氧磺酰化的纽莫康定B₀。

实施例7产羟化纽莫康定B₀的G.lozoyensis ATCC 74030工程菌株的构建

1.P450酶编码基因mcfP表达质粒构建

所述P450酶编码基因mcfP的基因序列如SEQ ID No.1所示，其氨基酸序列如SEQID No.2所示。提取Coleophoma sp.MEFC009的RNA，对其RNA进行反转录获得cDNA。以反转录后的cDNA为模板，利用引物mcfPCDS-F(5’-cttattcctttgaacctttcaATGATAAATCTTGCAAGTCCCCTC-3’)和mcfPCDS-R(5’-caaaattcttcatttatttattatgcttccacaagtattcttaa-3’)进行PCR扩增，获得大小约为1.5kb的mcfP的编码序列(mcfPCDS)；以G.lozoyensis ATCC 74030基因组为模板，利用引物PgpdGL-F(5’-ctgggttcgcaaagataattgtgttactcatatggattgaggg-3’)和PgpdGL-R(5’-GGGGACTTGCAAGATTTATCATattgttttctggtgaagattag-3’)进行PCR扩增，获得大小约为1.0kb的启动子片段PgpdGL；以质粒pPM3为模板，利用引物Tpgk-F(5’-taaataaatgaagaattttgtgaaacgag-3’)和Tpgk-R(5’-cacacattattatggagaaacattgcagcgcacaagtcagt-3’)进行PCR扩增，获得大小约为0.5kb大小的终止子片段Tpgk；以质粒pXH2-1为模板，利用引物hph-F(5’-ttcgggatcgcaagcgtaaag-3’)和hph-R(5’-caattatctttgcgaacccagg-3’)进行PCR扩增，获得大小约为2.2kb的潮霉素抗性筛选片段hph；利用限制性内切酶Bam HI和Xho I对质粒pCAMBIA1300进行双酶切，纯化回收后获得线性的质粒pCAMBIA1300。利用一步克隆试剂盒(Ultra One Step CloningKit)将线性质粒pCAMBIA1300与片段hph、PgpdGL、mcfPCDS和Tpgk进行连接，获得重组质粒pCAMBIA1300-mcfP。将重组后的质粒pCAMBIA1300-mcfP转化到大肠杆菌DH5α感受态细胞，通过卡那霉素抗性筛选阳性转化子，通过PCR和DNA测序获得正确的重组质粒pCAMBIA1300-mcfP，质粒图谱如图8A。

2.产羟化纽莫康定B₀菌株的构建

将重组质粒pCAMBIA1300-mcfP转到农杆菌LBA4404感受态细胞，获得重组菌株LBA4404-pCAMBIA1300-mcfP通过根瘤农杆菌介导的转化，将片段hph-PgpdGL-mcfP-Tpgk转到G.lozoyensis ATCC 74030菌株中。

将具有潮霉素B抗性的转化子进行传代培养，连续传代3次，选取稳定传代的9个转化子进行分离纯化，25℃培养7-10天，对纯化后的单菌落提取基因组，分别利用引物PgpdGL-F(5’-ctgggttcgcaaagataattgtgttactcatatggattgaggg-3’)和mcfPCDS-R(5’-caaaattcttcatttatttattatgcttccacaagtattcttaa-3’)进行PCR验证，能同时扩增出大小约为2.5kb的条带为阳性转化子，由图13可知利用该方法获得15个阳性转化子，基因组上整合了表达元件PgpdGL-mcfP-Tpgk，证明我们得到了表达mcfP的G.lozoyensis菌株G.lozoyensis::mcfP。

实施例8产羟化纽莫康定B₀的G.lozoyensis::mcfP工程菌株的发酵验证

将工程菌株G.lozoyensis::mcfP和对照菌株G.lozoyensis ATCC 74030接种于PDA固体平板上，25℃培养7-10天。挑取少量的菌丝，利用核酸提取仪(-24)对菌丝进行破碎，将破碎后的菌丝接种于50mL G.lozoyensis ATCC 74030的种子培养基(250mL三角瓶)，25℃，220rpm，摇床培养4-5天。将上述培养的种子液取5mL到G.lozoyensisATCC74030的发酵培养基，25℃，220rpm，摇床培养12天，每个菌株设置3个平行。从每一瓶发酵液中取1mL，加入等体积的甲醇，超声萃取1h，离心，取上清。用0.22μm的有机滤器过滤处理样品，并通过HPLC和LC-MS对处理后的样品进行分析。

HPLC分析方法为：液相色谱柱为Agilent C-18反向柱883975-902(4.6×150mm，5μm)；流动相为A：0.05％(体积比)三氟乙酸水溶液，流动相B：0.05％(体积比)三氟乙酸乙腈溶液，流速为1mL/min，紫外检测波长：210nm，30℃，总洗脱时间为25min。梯度洗脱条件：0-5min，流动相B占流动相的体积由5％线性上升到40％，5-20min，流动相B占流动相的体积由40％线性上升到62％，20-25min，流动相B占流动相的体积由62％线性上升到100％。结果如图14所示；从HPLC结果可知，除了化合物10(纽莫康定B₀)外，在12.2min出现了一个新的化合物，命名为化合物11。并且11和10具有相同的紫外吸收。猜测可能是羟化的纽莫康定B₀。为了进一步确认化合物的11结构，通过LC-MS进行分析。

LC-MS分析方法为：Agilent公司1290高效液相色谱，色谱柱为Agilent ZorbaxExtend-C18的C18柱(2.1×50mm，1.8μm)；流动相总流速为0.6mL/min；流动相A：0.05％(体积比)甲酸水溶液，流动相B：0.05％(体积比)甲酸乙腈溶液，总洗脱时间为7.5min；洗脱条件为：0-1min，流动相B占流动相的体积由5％线性上升到20％，1-6min，流动相B占流动相的体积由20％线性上升到60％，6-7min，流动相B占流动相的体积由60％线性上升到100％。结果如图11所示。从LC-MS分析结果可知，化合物11的质荷比[M+H]⁺为1081.5664(C₅₀H₈₀N₈O₁₈，理论值：1081.5663)。进一步的NMR结果表明化合物11与纽莫康定B₀相比(图12)，在L-高酪氨酸苯环的C3’位置多了一个羟基。说明P450酶McfP能够在G.lozoyensis ATCC 74030内催化纽莫康定B₀生成羟化的纽莫康定B₀。

实施例9.磺酰基转移酶McfS的制备

1.磺酰基转移酶McfS表达菌株构建

将Coleophoma sp.MEFC009中基因mcfS编码的磺酰基转移酶的核苷酸序列进行合成，并克隆到载体pET28a-His-SUMO上，获得质粒pET28a-His-SUMO-McfS，质粒图谱如图15所示。将质粒pET28a-His-SUMO-McfS转化到大肠杆菌BL21感受态细胞中，得到能够表达磺酰基转移酶McfS的重组菌株BL21(DE3)。

2.磺酰基转移酶McfS的表达与纯化

挑取重组菌株BL21(DE3)的阳性单克隆于LB液体培养基中(含100μg/mL的卡那霉素)中，37℃，220rpm摇床培养26-30h获得种子发酵液；按照1％接种量将种子液接种到LB液体培养基中(含100μg/mL的卡那霉素)中，37℃，220rpm摇床培养至OD₆₀₀＝0.6-1.0，加入终浓度为0.2mM的IPTG进行诱导表达，并在18℃，180rpm摇床继续培养发酵24h。将发酵液于4℃，8000rpm进行离心，收集菌体。菌体用结合缓冲液(50mM Tris-HCl)洗涤一次，将菌体保存于-80℃超低温冰箱中。分别在用IPTG诱导前，诱导后进行取样，并对诱导表达后的样品超声破碎之后，进行离心，13000rpm，10min，将上清与菌体分离。

采用Ni-NTA琼脂糖(QIAGEN，Cat No.30230)对目的蛋白进行纯化，纯化过程中温度控制在4℃，步骤如下：(1)用蒸馏水洗净玻璃层析柱，将Ni-NTA琼脂糖摇匀后取5mL装柱，使溶液流出；(2)平衡：用10倍体积的结合缓冲液洗柱，对树脂进行平衡；(3)上样：将上清液用0.22μm滤器过滤后，以1mL/min的流速将样品流加至层析柱中；(4)洗涤：先流加10倍体积的结合缓冲液(50mM Tris-HCl，5mM咪唑，500mM NaCl，pH 8.0)对层析柱进行洗涤，然后用20倍体积的60mM咪唑溶液(结合缓冲液中溶解有5mM咪唑)进行洗涤，将吸附物质、杂蛋白以及结合力较弱蛋白清洗除去，洗涤过程中溶液流速为1.0mL/min；(5)洗脱：用20mL的250mM咪唑溶液(结合缓冲液中溶解有5mM咪唑)将结合在树脂上的蛋白进行洗脱，洗脱过程中流速为1.0mL/min，收集洗脱的蛋白液；(6)超滤：将收集的蛋白于超滤管中进行浓缩，浓缩后的蛋白利用去盐缓冲液(50mM Tris-HCl，10％甘油)进行置换，直至蛋白溶液中的咪唑浓度小于0.2mM。超滤全过程都于4℃进行；(7)浓度测定：将透析后的蛋白液进行收集，用Bradford方法测定蛋白质浓度，用SDS-PAGE分析蛋白质纯化结果(图16)。

实施例10磺酰基转移酶McfS的活性分析

分析磺酰基转移酶McfS是否可以对化合物FR133302(9)(其结构如图18所示)L-高酪氨酸苯环上的C3'位进行磺酰化。反应体系(200μL)：底物浓度为75μM，酶浓度5μM，供体3'-磷酸腺苷-5'-磷酰硫酸(PAPS)浓度0.4mM，MgCl₂浓度1mM，缓冲体系为50mM Tris-HCl，pH 8.0；对照组1：用50mM Tris-HCl，pH 8.0的缓冲液代替酶液；对照组2：用50mM Tris-HCl，pH 8.0缓冲液代替底物；30℃反应1-5h。加入等体积的甲醇终止反应，用0.22μm的有机过滤器过滤之后，通过HPLC和LC-MS对样品进行分析。HPLC分析方法为：液相色谱柱为Agilent C-18反向柱883975-902(4.6×150mm，5μm)；流动相为A：0.05％(体积比)三氟乙酸水溶液，流动相B：0.05％(体积比)三氟乙酸乙腈溶液，流速为1mL/min，紫外检测波长：210nm，30℃，总洗脱时间为25min。梯度洗脱条件：0-5min，流动相B占流动相的体积由5％线性上升到40％，5-20min，流动相B占流动相的体积由40％线性上升到62％，20-25min，流动相B占流动相的体积由62％线性上升到100％，HPLC分析结果如图17所示。结果表明磺酰基转移酶McfS可以对化合物FR133302进行催化，在L-高酪氨酸苯环上的C3’位的羟基上加上磺酰基，从而生成化合物FR901379，反应如图18所示。

实施例11磺酰基转移酶McfS同源蛋白的制备及活性分析

1、磺酰基转移酶McfS同源蛋白的制备

以McfS的氨基酸作为参照序列，通过生物信息学分析，在其他磺酰化棘白菌素生产菌株Coleophoma crateriformis和Venustampulla echinocandica菌株中找到了McfS的同源蛋白，编号分别是RDW57264.1和XP_031866072.1，这2个蛋白在NCBI数据库中都被注释为未知功能蛋白。通过Cluster W对这两个蛋白及McfS的氨基酸序列进行了对比，这3个蛋白的氨基酸序列具有超过75％的同源性。

将蛋白RDW57264.1和XP_031866072.1的氨基酸序列(分别如SEQ ID No.5和6所示)所编码的核苷酸序列进行合成，并克隆到载体pET28a-His-SUMO上，得到重组质粒pET28a-His-SUMO-RDW57264.1和pET28a-His-SUMO-XP_031866072.1。

挑取重组菌株BL21(DE3)的阳性单克隆于LB液体培养基中(含100μg/mL的卡那霉素)中，37℃，220rpm摇床培养26-30h获得种子发酵液；按照1％接种量将种子液接种到LB液体培养基中(含100μg/mL的卡那霉素)中，37℃，220rpm摇床培养至OD₆₀₀＝0.6-0.8，加入终浓度为0.2mM的IPTG进行诱导表达，并在18℃，180rpm摇床继续培养发酵24h。将发酵液于4℃，8000rpm进行离心，收集菌体。菌体用结合缓冲液(50mM Tris-HCl)洗涤一次，将菌体保存于-80℃超低温冰箱中。分别在用IPTG诱导前，诱导后进行取样，并对诱导表达后的样品超声破碎之后，进行离心，13000rpm，10min，将上清与菌体分离。

采用Ni-NTA琼脂糖(QIAGEN，Cat No.30230)对目的蛋白进行纯化，纯化过程中温度控制在4℃，步骤如下：(1)用蒸馏水洗净玻璃层析柱，将Ni-NTA琼脂糖摇匀后取5mL装柱，使溶液流出；(2)平衡：用10倍体积的结合缓冲液洗柱，对树脂进行平衡；(3)上样：将上清液用0.22μm滤器过滤后，以1mL/min的流速将样品流加至层析柱中；(4)洗涤：先流加10倍体积的结合缓冲液(50mM Tris-HCl，5mM咪唑，500mM NaCl，pH 8.0)对层析柱进行洗涤，然后用20倍体积的60mM咪唑溶液(结合缓冲液中溶解有5mM咪唑)进行洗涤，将吸附物质、杂蛋白以及结合力较弱蛋白清洗除去，洗涤过程中溶液流速为1.0mL/min；(5)洗脱：用20mL的250mM咪唑溶液(结合缓冲液中溶解有5mM咪唑)将结合在树脂上的蛋白进行洗脱，洗脱过程中流速为1.0mL/min，收集洗脱的蛋白液；(6)超滤：将收集的蛋白于超滤管中进行浓缩，浓缩后的蛋白利用去盐缓冲液(50mM Tris-HCl，10％甘油)进行置换，直至蛋白溶液中的咪唑浓度小于0.2mM。超滤全过程都于4℃进行；(7)浓度测定：将透析后的蛋白液进行收集，用Bradford方法测定蛋白质浓度。

2、磺酰基转移酶McfS同源蛋白的活性分析

以化合物13a作为底物，分别利用蛋白RDW57264.1和XP_031866072.1对其进行催化，反应体系与McfS的催化体系相同，反应体系(200μL)：底物浓度为75μM，酶浓度5μM，供体3'-磷酸腺苷-5'-磷酰硫酸(PAPS)浓度0.4mM，MgCl₂浓度1mM，缓冲体系为50mM Tris-HCl，pH 8.0；30℃反应1-5h。加入等体积的甲醇终止反应，用0.22μm的有机过滤器过滤之后，通过HPLC和LC-MS对样品进行分析。HPLC分析方法为：液相色谱柱为Agilent C18反向柱883975-902(4.6×150mm，5μm)；流动相为A：0.05％(体积比)三氟乙酸水溶液，流动相B：0.05％(体积比)三氟乙酸乙腈溶液，流速为1mL/min，紫外检测波长：210nm，30℃，总洗脱时间为25min。梯度洗脱条件：0-5min，流动相B占流动相的体积由5％线性上升到40％，5-20min，流动相B占流动相的体积由40％线性上升到62％，20-25min，流动相B占流动相的体积由62％线性上升到100％，HPLC分析结果如图19所示。进而通过LC-MS对酶反应产物进行分析。LC-MS分析方法为：Agilent公司1290高效液相色谱，色谱柱为Agilent ZorbaxExtend-C18的C18柱(2.1×50mm，1.8μm)；流动相总流速为0.6mL/min；流动相A：0.05％(体积比)甲酸水溶液，流动相B：0.05％(体积比)体积比甲酸乙腈溶液，总洗脱时间为7.0min；梯度洗脱条件：0-1min，流动相B占流动相的体积由5％线性上升到20％，1-6min，流动相B占流动相的体积由20％线性上升到60％，6-7min，流动相B占流动相的体积由60％线性上升到100％。化合物13a和13的LC-MS分析结果如图20所示。

磺酰基转移酶McfS、RDW57264.1和XP_031866072.1均可催化13a生产13；即是说，McfS、RDW57264.1和XP_031866072.1可以催化化合物13a，在L-高酪氨酸苯环上的C3’位的羟基上加上磺酰基，从而生成化合物13，其催化机理如图21所示。

虽然本发明已以较佳的实施例公开如上，但其并非用以限定本发明，在不脱离本发明精神和范围内，本领域技术人员都可以在此基础上做出各种改动与变型，因此，本发明的保护范围应该以权利要求书所界定的为准。

SEQUENCE LISTING

<110> 中国科学院青岛生物能源与过程研究所

<120> 对棘白菌素类化合物氧磺酰化的酶及其应用

<130> 11

<160> 6

<170> PatentIn version 3.5

<210> 1

<211> 1503

<212> DNA

<213> Artificial Sequence

<220>

<223> mcfP

<400> 1

atgataaatc ttgcaagtcc cctcttcgca acaacagcag ttctagtctg gctcagcagt 60

ctcataatct atcgcctata tctctctcca ctatctcgat ttcccggccc aaaactcgct 120

gctctaacag gatggtacga gacatacttc gacctcttta aacggggtcg ctactggatc 180

gagattgaac gcatgcacga agtctatggc cctatcatcc gcatcaatcc caatgagcta 240

catgttaatg acccagaatg gaatgagccc tacaagatca gcggccgcgt tgacaagtat 300

gactggtact acacctttgt tggtagttcc ggatcctcat ctgcattcgg aaccatagac 360

cacgacgttc atcgtggccg ccggaaagct caacagggct atttcaccac cgacgccatc 420

acgcgctttg aaccacattt agaaaccctg acagcaaagt tctgcgcaag actagacggc 480

ttcaagggga cgggaaagca tgttaatctc tccgatgcgt tccgatcaat cgcggtggat 540

gtggccgcga tgtttacatt gaatcaatcg tatggtttca tcgatgaccc ggatttcaag 600

gccgaggtcc atcaagggat ccgggcattt ccggatattg gagtgctgaa tcgccatttt 660

acgggtttgt tcgtggtttt ggagtcaatc catagatggg tgttgagtgt tatcaacccg 720

tcagaagaag ataatgggtt actcacaagt agaataaacc tgcattgtaa agctattatt 780

gccgactacg ccagtaagaa aggcgacgtc aagcccaata tcattcacag aatgctagac 840

gcaccagaac tatcgatgaa agataagaca gcgtggcgcc ttcaattgga ggcgcgcacc 900

cttataggag ctggaactga aacgacagga cacacattag ccgtcatagc attccatctg 960

ctagcaaatc cggagaaggc aaagaggttg aaggaggaga tcttagctac gaaagaaggg 1020

cgggaaaagc ctttaactta tcaggagtta caaatgcttc cgtatttatc ttctgtggtc 1080

cttgaaggtc atcgcatttc tagtgttgta tcaggtcgtc tgccacgggt caatacaaaa 1140

gagccgctca gatatggtga ctatagtatc cctattggca cacccgtcag caccacccaa 1200

cggttaacac actacaatgc caccatattc ccctccccaa acacattcct ccccgaacgt 1260

tggcttcagc cctcggaacg aaagcgcctg gagaaataca tccagccgtt cgggcgtggc 1320

tcaagatctt gtataggcat gcatcttgca aatgcagaga tttacaaaac attggcggag 1380

atgtttgcaa ggtttgacat gaagttatat gatacggagt tcgaggatat tatgcaagtg 1440

catgactttt ttacttcgtt tccatcgagc gagaggggtt taagaatact tgtggaagca 1500

taa 1503

<210> 2

<211> 500

<212> PRT

<213> Artificial Sequence

<220>

<223> mcfP

<400> 2

Met Ile Asn Leu Ala Ser Pro Leu Phe Ala Thr Thr Ala Val Leu Val

1 5 10 15

Trp Leu Ser Ser Leu Ile Ile Tyr Arg Leu Tyr Leu Ser Pro Leu Ser

20 25 30

Arg Phe Pro Gly Pro Lys Leu Ala Ala Leu Thr Gly Trp Tyr Glu Thr

35 40 45

Tyr Phe Asp Leu Phe Lys Arg Gly Arg Tyr Trp Ile Glu Ile Glu Arg

50 55 60

Met His Glu Val Tyr Gly Pro Ile Ile Arg Ile Asn Pro Asn Glu Leu

65 70 75 80

His Val Asn Asp Pro Glu Trp Asn Glu Pro Tyr Lys Ile Ser Gly Arg

85 90 95

Val Asp Lys Tyr Asp Trp Tyr Tyr Thr Phe Val Gly Ser Ser Gly Ser

100 105 110

Ser Ser Ala Phe Gly Thr Ile Asp His Asp Val His Arg Gly Arg Arg

115 120 125

Lys Ala Gln Gln Gly Tyr Phe Thr Thr Asp Ala Ile Thr Arg Phe Glu

130 135 140

Pro His Leu Glu Thr Leu Thr Ala Lys Phe Cys Ala Arg Leu Asp Gly

145 150 155 160

Phe Lys Gly Thr Gly Lys His Val Asn Leu Ser Asp Ala Phe Arg Ser

165 170 175

Ile Ala Val Asp Val Ala Ala Met Phe Thr Leu Asn Gln Ser Tyr Gly

180 185 190

Phe Ile Asp Asp Pro Asp Phe Lys Ala Glu Val His Gln Gly Ile Arg

195 200 205

Ala Phe Pro Asp Ile Gly Val Leu Asn Arg His Phe Thr Gly Leu Phe

210 215 220

Val Val Leu Glu Ser Ile His Arg Trp Val Leu Ser Val Ile Asn Pro

225 230 235 240

Ser Glu Glu Asp Asn Gly Leu Leu Thr Ser Arg Ile Asn Leu His Cys

245 250 255

Lys Ala Ile Ile Ala Asp Tyr Ala Ser Lys Lys Gly Asp Val Lys Pro

260 265 270

Asn Ile Ile His Arg Met Leu Asp Ala Pro Glu Leu Ser Met Lys Asp

275 280 285

Lys Thr Ala Trp Arg Leu Gln Leu Glu Ala Arg Thr Leu Ile Gly Ala

290 295 300

Gly Thr Glu Thr Thr Gly His Thr Leu Ala Val Ile Ala Phe His Leu

305 310 315 320

Leu Ala Asn Pro Glu Lys Ala Lys Arg Leu Lys Glu Glu Ile Leu Ala

325 330 335

Thr Lys Glu Gly Arg Glu Lys Pro Leu Thr Tyr Gln Glu Leu Gln Met

340 345 350

Leu Pro Tyr Leu Ser Ser Val Val Leu Glu Gly His Arg Ile Ser Ser

355 360 365

Val Val Ser Gly Arg Leu Pro Arg Val Asn Thr Lys Glu Pro Leu Arg

370 375 380

Tyr Gly Asp Tyr Ser Ile Pro Ile Gly Thr Pro Val Ser Thr Thr Gln

385 390 395 400

Arg Leu Thr His Tyr Asn Ala Thr Ile Phe Pro Ser Pro Asn Thr Phe

405 410 415

Leu Pro Glu Arg Trp Leu Gln Pro Ser Glu Arg Lys Arg Leu Glu Lys

420 425 430

Tyr Ile Gln Pro Phe Gly Arg Gly Ser Arg Ser Cys Ile Gly Met His

435 440 445

Leu Ala Asn Ala Glu Ile Tyr Lys Thr Leu Ala Glu Met Phe Ala Arg

450 455 460

Phe Asp Met Lys Leu Tyr Asp Thr Glu Phe Glu Asp Ile Met Gln Val

465 470 475 480

His Asp Phe Phe Thr Ser Phe Pro Ser Ser Glu Arg Gly Leu Arg Ile

485 490 495

Leu Val Glu Ala

500

<210> 3

<211> 849

<212> DNA

<213> Artificial Sequence

<220>

<223> mcfS

<400> 3

atggctttag accgccagaa tgcgaaagtt acaactttcg gtctgtcaaa gccgaaaacc 60

aatatagatc gccgatcatg tcagagaact gtccccatga aggttctctg cctaggacta 120

tgtcgaaccg gcacttcctc attgcgtgcg gctctctttg agcttggcct tgatgatgtc 180

tatcacatgt gtagtgtgac ggaagagaat cccctcgact ccaagttgtg gaaagaggcc 240

ttcgacgcga aatatgaagg gatcggcaag ccctacggaa gagctgaatt tgacgcactc 300

ttgggtcatt gcatggcaac ctcggatttc cccagcgttg ccttcgctcc agaactcatc 360

gccgcttacc ccgaggcaaa gataattctc actgtacgag ataacgccga tgtctggtat 420

gactccgttc tcaacacgat ctggagagtc tccaacttcc ttcgcgctcc tccgagaact 480

ttaacccaac gagtcgttca agcgattctt cccaagccgg atttcaacat attcaagtac 540

agcccccttg gcaactttcc tgaggaaggc tgtcagtggt atagtgactg gaatgaagag 600

attagaactc tagccaaagg gagggacttc ttggaattca atgtaaagga gggatggggt 660

ccactctgta gattcttgga ggtggagcag ccggagacgc catttccaag agtcaatgat 720

tcaaatacat tcaaggaatt tcatgataag ggtttggagc aggatattca aagactggta 780

ggcataagta ctaagcttgt cgccgctgtt ggtgtattgg gtttggctgt ttggctagct 840

aggaagtag 849

<210> 4

<211> 282

<212> PRT

<213> Artificial Sequence

<220>

<223> mcfS

<400> 4

Met Ala Leu Asp Arg Gln Asn Ala Lys Val Thr Thr Phe Gly Leu Ser

1 5 10 15

Lys Pro Lys Thr Asn Ile Asp Arg Arg Ser Cys Gln Arg Thr Val Pro

20 25 30

Met Lys Val Leu Cys Leu Gly Leu Cys Arg Thr Gly Thr Ser Ser Leu

35 40 45

Arg Ala Ala Leu Phe Glu Leu Gly Leu Asp Asp Val Tyr His Met Cys

50 55 60

Ser Val Thr Glu Glu Asn Pro Leu Asp Ser Lys Leu Trp Lys Glu Ala

65 70 75 80

Phe Asp Ala Lys Tyr Glu Gly Ile Gly Lys Pro Tyr Gly Arg Ala Glu

85 90 95

Phe Asp Ala Leu Leu Gly His Cys Met Ala Thr Ser Asp Phe Pro Ser

100 105 110

Val Ala Phe Ala Pro Glu Leu Ile Ala Ala Tyr Pro Glu Ala Lys Ile

115 120 125

Ile Leu Thr Val Arg Asp Asn Ala Asp Val Trp Tyr Asp Ser Val Leu

130 135 140

Asn Thr Ile Trp Arg Val Ser Asn Phe Leu Arg Ala Pro Pro Arg Thr

145 150 155 160

Leu Thr Gln Arg Val Val Gln Ala Ile Leu Pro Lys Pro Asp Phe Asn

165 170 175

Ile Phe Lys Tyr Ser Pro Leu Gly Asn Phe Pro Glu Glu Gly Cys Gln

180 185 190

Trp Tyr Ser Asp Trp Asn Glu Glu Ile Arg Thr Leu Ala Lys Gly Arg

195 200 205

Asp Phe Leu Glu Phe Asn Val Lys Glu Gly Trp Gly Pro Leu Cys Arg

210 215 220

Phe Leu Glu Val Glu Gln Pro Glu Thr Pro Phe Pro Arg Val Asn Asp

225 230 235 240

Ser Asn Thr Phe Lys Glu Phe His Asp Lys Gly Leu Glu Gln Asp Ile

245 250 255

Gln Arg Leu Val Gly Ile Ser Thr Lys Leu Val Ala Ala Val Gly Val

260 265 270

Leu Gly Leu Ala Val Trp Leu Ala Arg Lys

275 280

<210> 5

<211> 282

<212> PRT

<213> Coleophoma crateriformis

<400> 5

Met Ala Leu Asp Arg Gln Asn Ala Asn Ile Thr Thr Phe Gly Leu Ala

1 5 10 15

Arg Pro Lys Thr Asn Ile Asp Arg Arg Ser Cys Lys Arg Asn Val Pro

20 25 30

Met Lys Val Leu Cys Leu Gly Leu Cys Arg Thr Gly Thr Ser Ser Leu

35 40 45

Arg Ala Ala Leu Leu Glu Leu Gly Leu Asp Asp Val Tyr His Met Cys

50 55 60

Ser Val Thr Glu Glu Asn Pro Pro Asp Ala Asn Leu Trp Lys Glu Ala

65 70 75 80

Phe Asp Ala Lys Tyr Glu Gly Ile Gly Lys Pro Tyr Gly Lys Asp Glu

85 90 95

Phe Asp Ala Leu Leu Gly His Cys Met Ala Thr Ala Asp Phe Pro Ser

100 105 110

Ile Ser Phe Ala Pro Glu Leu Leu Ala Ala Tyr Pro Asp Ala Lys Val

115 120 125

Ile Leu Thr Val Arg Asp Asn Ala Asp Val Trp Tyr Asp Ser Val Leu

130 135 140

Asn Thr Ile Trp Lys Val Ser Asn Phe Leu Arg Ala Pro Pro Arg Thr

145 150 155 160

Leu Thr Gln Arg Ile Val Gln Ala Ile Leu Pro Lys Pro Ala Phe Asn

165 170 175

Ile Phe Lys Tyr Ser Pro Leu Gly Asn Phe Pro Glu Glu Gly Arg Gln

180 185 190

Trp Tyr Ser Asp Trp Asn Glu Glu Ile Lys Thr Leu Ala Lys Gly Arg

195 200 205

Glu Phe Leu Glu Phe Asn Val Lys Gln Gly Trp Gly Pro Leu Cys Lys

210 215 220

Phe Leu Glu Val Glu Gln Pro Lys Thr Ala Phe Pro Arg Val Asn Asp

225 230 235 240

Ser Asn Thr Phe Lys Glu Phe His His Lys Gly Leu Trp Leu Asp Val

245 250 255

Gln Arg Leu Val Gly Ile Ser Thr Lys Leu Val Ala Ala Leu Gly Val

260 265 270

Leu Gly Leu Ala Val Trp Leu Ala Lys Lys

275 280

<210> 6

<211> 275

<212> PRT

<213> Venustampulla echinocandica

<400> 6

Met Ala Ser Asp Leu Gln Asn Gly Gln Leu Thr Thr Met Gly Leu Leu

1 5 10 15

Arg Pro Lys Thr Asn Ile Asp Arg Arg Ser Cys Lys Arg Val Val Pro

20 25 30

Met Lys Val Ile Cys Leu Gly Leu Cys Arg Thr Gly Thr Ser Ser Leu

35 40 45

Arg Ala Ala Leu Phe Glu Leu Gly Leu Asn Asp Val Tyr His Met Phe

50 55 60

Ser Val Thr Thr Glu Asn Pro Leu Asp Ala Glu Leu Trp Lys Glu Ala

65 70 75 80

Tyr Asp Ala Lys Tyr Lys Gly Ile Gly Lys Pro Tyr Gly Lys Glu Glu

85 90 95

Phe Asp Ala Leu Leu Gly His Cys Met Ala Thr Thr Asp Phe Pro Gly

100 105 110

Ile Ser Phe Ala Pro Glu Leu Leu Ala Ala Tyr Pro Asp Ala Lys Val

115 120 125

Ile Leu Thr Val Arg Asp Asn Gly Asp Val Trp Tyr Asp Ser Val Phe

130 135 140

Asn Thr Ile Trp Thr Val Ser Asn Phe Leu Arg Ala Pro Pro Lys Thr

145 150 155 160

Leu Thr Gln Arg Leu Val Gln Ala Ile Leu Pro Lys Pro His Phe Asn

165 170 175

Val Phe Glu His Thr Pro Leu Gly Asn Phe Pro Val Glu Gly Arg Gln

180 185 190

Trp Tyr Asp Asp Trp Asn Glu Asp Ile Arg Thr Arg Ala Lys Gly Arg

195 200 205

Glu Phe Leu Glu Phe Asn Val Lys Gln Gly Trp Gly Pro Leu Cys Glu

210 215 220

Phe Leu Gly Val Glu Gln Pro Lys Ala Lys Phe Pro Arg Val Asn Asp

225 230 235 240

Ser Ala Ser Phe Lys Glu Thr His Asn Asn Asp Leu Leu Arg Val Gly

245 250 255

Ala Lys Val Val Ala Ala Leu Ser Val Leu Gly Leu Ala Val Trp Leu

260 265 270

Ala Lys Lys

275

Claims

1.选自以下i-ii任意一种或两种的酶，或包含所述酶的生物材料在对棘白菌素类化合物进行羟基化、磺酰化或氧磺酰化中的应用；

i、细胞色素P450单加氧酶，所述细胞色素P450单加氧酶与SEQ ID No.2相比具有至少75％的序列同一性；

ii、磺酰基转移酶，所述磺酰基转移酶与SEQ ID No.4相比具有至少70％的序列同一性；

所述生物材料选自：所述酶的编码基因，或者包含所述编码基因的载体，或者包含所述载体的宿主细胞。

2.根据权利要求1所述的应用，其特征在于，所述对棘白菌素类化合物进行羟基化、磺酰化或氧磺酰化包括对棘白菌素类化合物的L-高酪氨酸苯环上的C3’位进行羟基化、磺酰化或氧磺酰化。

3.根据权利要求1或2所述的应用，其特征在于，所述酶为细胞色素P450单加氧酶，所述应用为对棘白菌素类化合物进行羟基化。

4.根据权利要求1或2所述的应用，其特征在于，所述酶为磺酰基转移酶，所述应用为对棘白菌素类化合物进行磺酰化。

5.根据权利要求1或2所述的应用，其特征在于，所述酶为细胞色素P450单加氧酶和磺酰基转移酶，所述应用为对棘白菌素类化合物进行氧磺酰化。

6.根据权利要求1所述的应用，其特征在于，

所述细胞色素P450单加氧酶与SEQ ID No.2相比具有至少70％的序列同一性，优选的，所述细胞色素P450单加氧酶来源于鞘茎点霉属真菌(Coleophoma sp.)；

所述磺酰基转移酶与SEQ ID No.4相比具有至少70％的序列同一性，优选的，所述磺酰基转移酶来源于鞘茎点霉属真菌(Coleophoma sp.)；或者，所述磺酰基转移酶与SEQ IDNo.5相比具有至少70％的序列同一性，优选的，所述磺酰基转移酶来源于Coleophomacrateriformis；或者，所述磺酰基转移酶与SEQ ID No.6相比具有至少70％的序列同一性，优选的，所述磺酰基转移酶来源于Venustampulla echinocandica。

7.根据权利要求1所述的应用，其特征在于，所述棘白菌素类化合物选自FR133302或纽莫康定B₀或其衍生物。

8.根据权利要求1所述的应用，其特征在于，所述棘白菌素类化合物选自式I-式VIII中的一种或任意几种。

9.一种对棘白菌素类化合物进行羟基化、磺酰化或氧磺酰化的方法，所述方法包括利用权利要求1-8任意权利要求中的酶或包含所述酶的生物材料对棘白菌素类化合物进行羟基化、磺酰化或氧磺酰化的步骤。

10.根据权利要求9所述的方法，其特征在于，所述方法为对棘白菌素类化合物的L-高酪氨酸苯环上的C3’位进行羟基化、磺酰化或氧磺酰化。