CN107881205A - 双环霉素生物合成中氧化酶的功能及其应用 - Google Patents

双环霉素生物合成中氧化酶的功能及其应用 Download PDF

Info

Publication number
CN107881205A
CN107881205A CN201711184703.4A CN201711184703A CN107881205A CN 107881205 A CN107881205 A CN 107881205A CN 201711184703 A CN201711184703 A CN 201711184703A CN 107881205 A CN107881205 A CN 107881205A
Authority
CN
China
Prior art keywords
dioxygenase
ketoglutaric acid
arg
ala
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711184703.4A
Other languages
English (en)
Other versions
CN107881205B (zh
Inventor
唐功利
孟松
潘海学
赵娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Organic Chemistry of CAS
Original Assignee
Shanghai Institute of Organic Chemistry of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Organic Chemistry of CAS filed Critical Shanghai Institute of Organic Chemistry of CAS
Priority to CN201711184703.4A priority Critical patent/CN107881205B/zh
Publication of CN107881205A publication Critical patent/CN107881205A/zh
Application granted granted Critical
Publication of CN107881205B publication Critical patent/CN107881205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/02Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0077Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
    • C12N9/0079Steroid 11 beta monooxygenase (P-450 protein)(1.14.15.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin

Abstract

本发明公开了双环霉素生物合成中氧化酶的功能及其应用,具体地,本发明提供了双环霉素合成中的六个氧化酶BcmB,BcmC,BcmD,BcmE,BcmF和BcmG,以及其用于催化以异亮氨酸‑亮氨酸环二肽(cIL)为初始底物的多步氧化反应,最终生成双环霉素的用途。本发明的方法可以应用于在体外以环二肽作为起始原料,高效生产双环霉素或其结构类似物。

Description

双环霉素生物合成中氧化酶的功能及其应用
技术领域
本发明属于生物技术和工程领域,具体地,本发明涉及双环霉素生物合成途径中几个氧化酶的功能及其应用。
背景技术
双环霉素是1972年由日本科学家从札幌链霉菌Streptomyces sapporonensis中分离得到的一种抗生素,它对很多革兰氏阴性菌和至少一种革兰氏阳性菌都具有杀菌作用。在临床上,双环霉素被用来治疗人的腹泻以及小牛和猪的细菌性痢疾、鱼类的假结核病,也被用于促进小鸡和猪的生长。最近的研究表明,当双环霉素与四环素、氯霉素、利福平等目前广泛使用的抗生素一起使用时,可以产生非常强的协同作用,大大提高这些抗生素的抗菌活性。双环霉素(图1)的结构非常特殊,与已知的其他种类的抗生素没有结构相似性,其结构可以分为三部分:[4,2,2]-双环骨架、C-1三羟基基团以及C5-C5a环外亚甲基,这使其抗菌的作用机制也与其他种类抗生素不同。双环霉素抗菌机制极其独特,被认为是目前已知的唯一一个来源于天然产物的转录终止因子Rho蛋白的选择性抑制剂。
从双环霉素被发现开始,很多有机合成化学家就对它的体外全合成产生了很大的兴趣,双环霉素最简单且立体专一性的有机化学全合成由Williams等在1984年完成,但是整个合成路线经过了12步,总产率很低。因此,我们在获得双环霉素生物合成基因的基础上,采用化学合成前体加体外酶催化合成的方式,建立了全新的双环霉素制备方法。与传统的有机全合成相比,体外酶催化全合成具有独特的优势:首先,酶的高效性使得酶催化合成中每一步反应的催化效率都比较高;其次,酶催化反应一般都具有非常好的立体选择性和区域选择性,这样在合成复杂的天然产物时就可以轻松的构建多个手性中心,得到单一构型的目标产物;再者,由于酶催化反应的特异性,进行体外酶催化全合成时,体系内副反应和副产物都比较少,所以酶催化全合成比较容易实现体外一锅法,进一步提高了反应的效率;另外,体外酶催化所需的反应条件相对比较温和,能源消耗较少,更加绿色环保。
综上所述,本领域迫切需要开发一种双环霉素的体外酶催化合成方法。
发明内容
本发明的目的是提供一种双环霉素的体外酶催化合成方法。
在本发明的第一方面,提供了一种催化制备双环霉素(Biocyclomycin)的方法,所述方法包括步骤:
(i)在α-酮戊二酸依赖的双加氧酶BcmE和任选的辅酶存在的条件下,用式I化合物进行反应,得到式II化合物;
(ii)在α-酮戊二酸依赖的双加氧酶BcmC和任选的辅酶存在的条件下,用式II化合物反应,得到式III化合物;
(iii)在α-酮戊二酸依赖的双加氧酶BcmG和任选的辅酶存在的条件下,用式III化合物反应,得到式IV化合物;
(iv)在α-酮戊二酸依赖的双加氧酶BcmB和任选的辅酶存在的条件下,用式IV化合物反应,得到式V化合物;
(v)在辅酶和细胞色素P450单加氧酶BcmD存在的条件下,用式V化合物反应,得到式VI化合物;和
(vi)在α-酮戊二酸依赖的双加氧酶BcmF和任选的辅酶存在的条件下,用式VI化合物反应,形成双环霉素(Biocyclomycin):
在另一优选例中,所述的步骤(i)、(ii)、(iii)、(iv)、(v)和(vi)在同一反应体系中进行。
在另一优选例中,所述的步骤(i)、(ii)、(iii)、(iv)或(v)结束后,不分离产物,直接进行下一步反应。
在另一优选例中,所述的α-酮戊二酸依赖的双加氧酶BcmE、BcmC、BcmG、BcmB、BcmF和细胞色素P450单加氧酶BcmD来自于札幌链霉菌(Streptomyces sapporonensis);
优选地,
所述的α-酮戊二酸依赖的双加氧酶BcmE的序列如SEQ ID NO:1所示;
所述的α-酮戊二酸依赖的双加氧酶BcmC的序列如SEQ ID NO:3所示;
所述的α-酮戊二酸依赖的双加氧酶BcmG的序列如SEQ ID NO:5所示;
所述的α-酮戊二酸依赖的双加氧酶BcmB的序列如SEQ ID NO:7所示;
所述的α-酮戊二酸依赖的双加氧酶BcmF的序列如SEQ ID NO:11所示;
所述的细胞色素P450单加氧酶BcmD的序列如SEQ ID NO:9所示。
在另一优选例中,所述的α-酮戊二酸依赖的双加氧酶BcmE、BcmC、BcmG、BcmB、BcmF和/或细胞色素P450单加氧酶BcmD为在大肠杆菌中表达的重组蛋白。
在另一优选例中,所述的α-酮戊二酸依赖的双加氧酶BcmE、BcmC、BcmG、BcmB、BcmF和/或细胞色素P450单加氧酶BcmD为分离的或重组的。
在另一优选例中,所述的多步氧化反应可以分步完成,也可以在同一反应体系内完成(即一锅法完成)。
在另一优选例中,所述的步骤(i)、(ii)、(iii)、(iv)、(v)、(vi)各自独立地在具有选自下组的一个或多个特征的反应体系中进行反应:
(a)α-酮戊二酸依赖的双加氧酶BcmE、BcmC、BcmG、BcmB、BcmF和细胞色素P450单加氧酶BcmD的单酶浓度为0.001-100mM;
(b)反应体系的pH为6.0-9.0;
(c)反应温度为15-45摄氏度;和
(d)反应体系中,辅酶的浓度为0.01-100mM。
在另一优选例中,所述的方法在α-酮戊二酸存在下进行反应;优选地,所述的α-酮戊二酸的浓度为0.01-100mM。
在另一优选例中,所述的方法在抗坏血酸存在下进行反应;优选地,所述的抗坏血酸的浓度为0.01-100mM。
在另一优选例中,所述的方法在硫酸亚铁存在下进行反应;优选地,所述的硫酸亚铁的浓度为0.01-100mM。
在另一优选例中,所述的反应体系中,各个底物的浓度分别为0.01-100mM。
在另一优选例中,所述的辅酶选自下组:NADPH,Ferredoxin,FerredoxinReductase,或其组合。
本发明的第二方面,提供了一种α-酮戊二酸依赖的双加氧酶BcmE的用途,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmE来自于札幌链霉菌(Streptomycessapporonensis),并且
所述α-酮戊二酸依赖的双加氧酶BcmE的序列如SEQ ID NO:1所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmE由SEQ ID NO:2所示的核苷酸序列编码。
本发明的第三方面,提供了一种α-酮戊二酸依赖的双加氧酶BcmC的用途,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmC来自于札幌链霉菌(Streptomycessapporonensis),并且所述α-酮戊二酸依赖的双加氧酶BcmC的序列如SEQ ID NO:3所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmC由SEQ ID NO:4所示的核苷酸序列编码。
本发明的第四方面,提供了一种α-酮戊二酸依赖的双加氧酶BcmG的用途,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmG来自于札幌链霉菌(Streptomycessapporonensis),并且所述α-酮戊二酸依赖的双加氧酶BcmG的序列如SEQ ID NO:5所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmG由SEQ ID NO:6所示的核苷酸序列编码。
本发明的第五方面,提供了一种α-酮戊二酸依赖的双加氧酶BcmB的用途,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmB来自于札幌链霉菌(Streptomycessapporonensis),并且所述α-酮戊二酸依赖的双加氧酶BcmB的序列如SEQ ID NO:7所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmB由SEQ ID NO:8所示的核苷酸序列编码。
本发明的第六方面,提供了一种细胞色素P450单加氧酶BcmD的用途,它用于催化下述氧化反应:
其中,所述细胞色素P450单加氧酶BcmD来自于札幌链霉菌(Streptomycessapporonensis),并且所述细胞色素P450单加氧酶BcmD的序列如SEQ ID NO:9所示;和/或
所述的细胞色素P450单加氧酶BcmD由SEQ ID NO:10所示的核苷酸序列编码。
本发明的第七方面,提供了一种α-酮戊二酸依赖的双加氧酶BcmF的用途,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmF来自于札幌链霉菌(Streptomycessapporonensis),并且所述α-酮戊二酸依赖的双加氧酶BcmF的序列如SEQ ID NO:11所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmF由SEQ ID NO:12所示的核苷酸序列编码。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
下列附图用于说明本发明的具体实施方案,而不用于限定由权利要求书所界定的本发明范围。
图1显示了双环霉素的化学结构。
图2显示了双环霉素生物合成基因簇的基因分布图。
图3显示了纯化后的各蛋白的SDS-PAGE鉴定结果:泳道1和8为标准蛋白分子量泳道,泳道2为BcmG蛋白泳道,泳道3为BcmF蛋白泳道,泳道4为BcmE蛋白泳道,泳道5为BcmC蛋白泳道,泳道6为BcmB蛋白泳道,泳道7为BcmD蛋白泳道。
图4显示了环二肽底物cIL(化合物I)的1H NMR(500MHz,CD3OD)。
图5显示了环二肽底物cIL(化合物I)的13C NMR(125MHz,CD3OD)。
图6显示了BcmE催化cIL(化合物I)形成化合物II的反应式和HPLC-MS离子流图。
图7显示了化合物II的1H NMR(500MHz,CD3OD)。
图8显示了化合物II的13C NMR(125MHz,CD3OD)。
图9显示了化合物II的1H-1H COSY NMR(500MHz,CD3OD)。
图10显示了化合物II的HSQC NMR(500MHz,CD3OD)。
图11显示了化合物II的HMBC NMR(500MHz,CD3OD)。
图12显示了BcmC催化化合物II形成化合物III的反应式和HPLC-MS离子流图。
图13显示了化合物III的1H NMR(500MHz,CD3OD)。
图14显示了化合物III的13C NMR(125MHz,CD3OD)。
图15显示了化合物III的1H-1H COSY NMR(500MHz,CD3OD)。
图16显示了化合物III的HMBC NMR(500MHz,CD3OD)。
图17显示了BcmG催化化合物III形成化合物IV的反应式和HPLC-MS离子流图。
图18显示了化合物IV的1H NMR(500MHz,CD3OD)。
图19显示了化合物IV的13C NMR(125MHz,CD3OD)。
图20显示了化合物IV的1H-1H COSY NMR(500MHz,CD3OD)。
图21显示了化合物IV的HSQC NMR(500MHz,CD3OD)。
图22显示了化合物IV的HMBC NMR(500MHz,CD3OD)。
图23显示了BcmB催化化合物IV形成化合物V的反应式和HPLC-MS离子流图。
图24显示了化合物V的1H NMR(500MHz,CD3OD)。
图25显示了化合物V的13C NMR(125MHz,CD3OD)。
图26显示了化合物V的1H-1H COSY NMR(500MHz,CD3OD)。
图27显示了化合物V的HSQC NMR(500MHz,CD3OD)。
图28显示了化合物V的HMBC NMR(500MHz,CD3OD)。
图29显示了BcmD催化化合物V形成化合物VI的反应式和HPLC-MS离子流图。
图30显示了化合物VI的1H NMR(500MHz,CD3OD)。
图31显示了化合物VI的13C NMR(125MHz,CD3OD)。
图32显示了化合物VI的1H-1H COSY NMR(500MHz,CD3OD)。
图33显示了化合物VI的HSQC NMR(500MHz,CD3OD)。
图34显示了化合物VI的HMBC NMR(500MHz,CD3OD)。
图35显示了BcmF催化化合物VI形成双环霉素的反应式和HPLC-MS离子流图。
图36显示了双环霉素的1H NMR(500MHz,CD3OD)。
图37显示了双环霉素的1H-1H COSY(500MHz,CD3OD)。
图38显示了双环霉素的1H NMR NMR(500MHz,Dimethyl Sulfoxide-D6)。
图39显示了双环霉素的13C NMR NMR(125MHz,Dimethyl Sulfoxide-D6)。
图40显示了双环霉素的1H-1H COSY NMR(500MHz,Dimethyl Sulfoxide-D6)。
图41显示了双环霉素的HSQC NMR(500MHz,Dimethyl Sulfoxide-D6)。
图42显示了双环霉素的HMBC NMR(500MHz,Dimethyl Sulfoxide-D6)。
图43显示了BcmB/BcmC/BcmD/BcmE/BcmF/BcmG六个蛋白体外一锅法酶催化环二肽底物cIL形成双环霉素的反应式和HPLC-MS离子流图。
具体实施方式
本发明人经过广泛而深入的研究,从双环霉素产生菌札幌链霉菌Streptomycessapporonensis ATCC 21532中鉴定了双环霉素的生物合成基因,所述基因包括:bcmA、bcmB、bcmC、bcmD、bcmE、bcmF和bcmG。本发明人表达了双环霉素生物合成基因bcmB、bcmC、bcmD、bcmE、bcmF和bcmG所编码的六个氧化酶,合成了双环霉素前体分子环二肽,通过体外酶催化反应的方法在体外实现了各氧化酶的催化功能,并通过体外一锅法在体外实现了双环霉素的酶催化合成,在此基础上完成了本发明。
双环霉素
双环霉素是1972年由日本科学家从札幌链霉菌Streptomyces sapporonensis中分离得到的一种抗生素,它对很多革兰氏阴性菌和至少一种革兰氏阳性菌都具有杀菌作用,在日本作为临床用药并被开发为兽用抗生素。在临床上,双环霉素被用来治疗人的腹泻以及小牛和猪的细菌性痢疾、鱼类的假结核病,也被用于促进小鸡和猪的生长。双环霉素的结构(图1)非常特殊,与已知的其他种类的抗生素没有结构相似性,其结构可以分为三部分:[4,2,2]-双环骨架、C-1三羟基基团以及C5-C5a环外亚甲基,这使其抗菌的作用机制也与其他种类抗生素不同。双环霉素抗菌机制极其独特,被认为是目前已知的唯一一个来源于天然产物的转录终止因子Rho蛋白的选择性抑制剂。
双环霉素生物合成基因
本发明所述的双环霉素生物合成基因表示编码BcmA蛋白的基因、编码BcmB蛋白的基因、编码BcmC蛋白的基因、编码BcmD蛋白的基因、编码BcmE蛋白的基因、编码BcmF蛋白的基因以及编码BcmG蛋白的基因构成的基因集合。
在具体的实施方式中,所述的BcmA蛋白包括选自下组的多肽:(a)氨基酸序列如SEQ ID NO:13所示的多肽;或(b)包含(a)所限定的序列经过1-5个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽;所述的BcmB蛋白包括选自下组的多肽:(a)氨基酸序列如SEQ ID NO:7所示的多肽;或(b)包含(a)所限定的序列经过1-5个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽;所述的BcmC蛋白包括选自下组的多肽:所述的BcmB蛋白包括选自下组的多肽:(a)氨基酸序列如SEQ ID NO:3所示的多肽;或(b)包含(a)所限定的序列经过1-5个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽;所述的BcmD蛋白包括选自下组的多肽:(a)氨基酸序列如SEQ IDNO:9所示的多肽;或(b)包含(a)所限定的序列经过1-5个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽;所述的BcmE蛋白包括选自下组的多肽:(a)氨基酸序列如SEQ ID NO:1所示的多肽;或(b)包含(a)所限定的序列经过1-5个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽;所述的BcmF蛋白包括选自下组的多肽:(a)氨基酸序列如SEQ IDNO:11所示的多肽;或(b)包含(a)所限定的序列经过1-5个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽;所述的BcmG蛋白包括选自下组的多肽:(a)氨基酸序列如SEQ ID NO:5所示的多肽;或(b)包含(a)所限定的序列经过1-5个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽。
表达载体
本文所用的术语“表达载体”具有本领域普通技术人员通常理解的含义,即,能使插入/目的基因进入宿主细胞表达的克隆载体。表达载体可包括原核表达载体和真核表达载体,可以是质粒、噬菌体或病毒等。典型的表达载体带有能使基因表达的调控序列,并在适当位置有可插入外源基因的限制性内切酶位点。
在具体的实施方式中,本发明的表达载体含有本发明的双环霉素生物合成基因。
宿主细胞
本文所用的术语“宿主细胞”具有本领域普通技术人员通常理解的含义,即,包含外源性目的基因并能使之表达的细胞。例如,受体细胞可以是原核受体细胞(例如,大肠杆菌、枯草芽胞杆菌、链霉菌、假单胞菌)、真核受体细胞(例如,酵母菌、动物细胞和昆虫细胞),等等。
在具体的实施方式中,本发明的宿主细胞包含本发明的表达载体或染色体上整合有一拷贝或多拷贝的外源的本发明的双环霉素生物合成基因。
在优选的实施方式中,本发明的宿主细胞为大肠杆菌。
引物
如本文所用,术语“引物”指的是在与模板配对,在DNA聚合酶的作用下能以其为起点进行合成与模板互补的DNA链的寡居核苷酸的总称。引物可以是天然的RNA、DNA,也可以是任何形式的天然核苷酸。引物甚至可以是非天然的核苷酸如LNA或ZNA等。
引物“大致上”(或“基本上”)与模板上一条链上的一个特殊的序列互补。引物必须与模板上的一条链充分互补才能开始延伸,但引物的序列不必与模板的序列完全互补。比如,在一个3’端与模板互补的引物的5’端加上一段与模板不互补的序列,这样的引物仍大致上与模板互补。只要有足够长的引物能与模板充分的结合,非完全互补的引物也可以与模板形成引物-模板复合物,从而进行扩增。
本发明的应用及优点
双环霉素作为一种结构独特的抗生素,其生物活性、作用机制和生物合成路线有其独特的地方,这些机制的阐明对于发现新的药物作用靶点、作用机制有重要意义。利用本发明,可以实现双环霉素分子的酶催化全合成。并且在对其生物合成机制有着充分理解的基础上,有助于通过对生物合成途径的合理化修饰,来获得其它具有应用价值的结构类似物。
本发明以链霉菌来源的双环霉素为目标分子,从克隆其在S.sapporonensis ATCC21532中的生物合成基因簇出发,采用微生物学、分子生物学、生物化学及有机化学相结合的方法验证其负责双环霉素的生物合成。并通过体外酶催化的方式实现了双环霉素的酶催化全合成。
利用本发明的双环霉素生物合成基因簇可实现以下目的:
(1)可利用本发明提供的核苷酸序列或部分核苷酸序列,通过聚合酶链式反应(PCR)的方法或利用包含本发明序列的DNA作为探针进行Southern杂交从其它微生物中得到双环霉素生物合成基因的同源基因;
(2)本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达体系在外源宿主中表达以得到相应的酶或其它更高的生物活性或产量的酶。这些外源宿主包括链霉菌、假单孢菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等;
(3)本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化(DNAshuffling),或通过紫外线或化学试剂诱变等;
(4)本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备;
(5)本发明所提供的氨基酸序列或部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其它致力于得到的性质;
(6)本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其它所需性质;
(7)本发明所提供的氨基酸序列可以用来催化合成双环霉素生物合成途径中的中间体。并可以通过所有氨基酸序列的组合合成双环霉素。
总之,本发明所提供的包含双环霉素生物合成相关的所有基因和蛋白信息非常清晰的阐明双环霉素生物合成的分子机理,从而为进一步利用基因工程手段改造提供理论基础与材料。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1.基因组全测序获得双环霉素生物合成基因簇序列
(1)S.sapporonensis ATCC 21532基因组DNA的提取
将100μL S.sapporonensis ATCC 21532孢子悬液接种到3mL TSB(TSB30g,1L)液体培养基中,30℃,250rpm,振荡培养约24-36hr,达到对数生长期后期。取1mL接种到50mLTSB中(含5mM MgCl2,0.5%甘氨酸),30℃,250rpm培养,约24-36hr后达到稳定生长期前期,呈微黄浑浊,并有大量菌丝悬浮物。将菌液于4℃,3500rpm,离心10min收集菌丝,用裂解缓冲液洗涤两次,得到菌丝约2-4mL。向1mL菌丝中加入10mLSET裂解缓冲液(含溶菌酶5mg/mL),涡旋至均一,37℃水浴温育30min-60min。加入0.1mL蛋白酶K(10mg/mL,用裂解缓冲液新鲜配制)、混匀后加入0.6ml 10%的SDS,轻轻颠倒混匀后迅速放入70℃水浴,温育2hr,其间间隔一段时间轻轻摇一下,使其均匀,最后体系呈澄清状态。置冰上冷却,加入2.5mL5MKAc,冰上冷却15min。加入10mL饱和酚,混匀,10mL氯仿,混匀,10000rpm,4℃离心20min。用预先灭菌破口的枪头将水相轻轻吸出置于新的50mL离心管,加等当量的CHCl3/异戊醇(体积比24:1)抽提,10000rpm,4℃离心10min。用预先灭菌破口的枪头将水相吸出置于新的离心管,加0.6倍体积的异丙醇,混匀,DNA析出后,将其挑取置于新的离心管,加入5mL70%乙醇洗涤,轻轻晃动后用枪头抵住DNA,将液体慢慢倾出,然后用枪吸净余下的液体,加5mLTE溶解,加RNA聚合酶A使其终浓度为50μg/mL,37℃温育0.5小时。依次用等体积的饱和酚抽提两次,CHCl3/异戊醇(体积比24:1)抽提两次,向水相中加入0.1体积的3M NaAc,0.6体积的异丙醇,轻轻的混合充分,有絮状DNA出现。将DNA用枪头挑取至新的离心管,加入1mL70%乙醇洗涤后,加入1mL无水乙醇洗涤(带出水分),将乙醇吸出后,超净台中吹干,溶于适当体积的TE(pH 8.0)中。
(2)分析双环霉素的生物合成基因簇序列
本发明人对双环霉素产生菌S.sapporonensis ATCC 21532进行全基因组序列测定。通过对基因组测序结果的分析,找到了其中包含的双环霉素生物合成基因簇,该基因簇命名为bcm(图2)。发明人分析了基因组中包含双环霉素生物合成基因簇的9,651bp连续核苷酸序列(SEQ ID NO:15),其GC含量为71.13%,共包含7个与双环霉素生物合成相关的开放式读码框(open reading frame,orf)。各个基因功能的分析结果见表1。
表1:双环霉素生物合成基因的功能
实施例2.五个α-酮戊二酸依赖的双加氧酶和一个细胞色素P450单加氧酶的表达与纯化
以双环霉素产生菌S.sapporonensis ATCC 21532的基因组DNA为模板,以水,dNTP,DMSO,高保真Primestar DNA聚合酶及其缓冲液组成PCR反应体系,对五个α-酮戊二酸依赖的双加氧酶BcmB、BcmC、BcmE、BcmF、BcmG和一个细胞色素P450单加氧酶BcmD的编码基因进行PCR扩增。扩增各基因的引物序列如表2所示。通过PCR克隆得到6个基因片段,经凝胶电泳分离纯化后,分别加入限制性内切酶HindIII和NdeI酶切,将它们分别连入同样酶切处理的pET28a中,完成各蛋白表达载体的构建。再将各蛋白表达载体分别转入到大肠杆菌表达菌株E.coli BL21中,获得蛋白表达菌株。
将获得的蛋白表达菌株接种至3mL含有卡那霉素(Km)50μg/mL(下同)的液体LB培养基中,37℃培养过夜。将菌液全部转接至500mL含有Km的液体LB培养基中,37℃培养至OD600为0.6,将大摇瓶取出放到冰水浴中降温10min,再转移至16℃继续培养,并加入IPTG(100μM)进行诱导。16℃诱导表达24h,离心收菌。然后在冰水浴下超声破菌30min(超声10秒,间歇50秒,30次,功率200瓦)。4℃,12000rpm离心60min,转移上清至另一50mL管中,加入Ni-NTA填料(购买自QIAGEN)3mL,冰水浴下轻晃2h。填料装柱后,分别用含有不同咪唑浓度的洗脱缓冲液进行梯度洗:含25mM咪唑的洗脱缓冲液5mL,含50mM咪唑的洗脱缓冲液5mL,含100mM咪唑的洗脱缓冲液3mL,含150mM咪唑的洗脱缓冲液3mL,含300mM咪唑的洗脱缓冲液3mL。收取300mM咪唑的洗脱液,将收集得到的目标蛋白溶液转移至超滤管(10kDa)中,4℃,4000rpm,离心,直至溶液体积至2.5mL,最后脱盐,获得纯化的蛋白:BcmB、BcmC、BcmE、BcmF、BcmG和BcmD。
图3显示了纯化的BcmB、BcmC、BcmE、BcmF、BcmG和BcmD蛋白的SDA-PAGE的鉴定结果,表面在本实施例中,BcmB、BcmC、BcmE、BcmF、BcmG和BcmD蛋白获得了成功的表达与纯化。
表2:克隆各氧化酶编码基因所用的引物
实施例3.BcmE体外酶催化环二肽底物cIL生成II
(1)环二肽底物cIL的合成与鉴定
环二肽底物cIL合成步骤如下:
(a)缩合中间体的合成:H-Ile-Ome.HCl溶于CH2Cl2冰盐浴下加入TEA和Boc-Leu-OH.H2O,冰水浴下加入EDC.HCl和HOBT。冰水浴搅拌2小时,常温搅拌过夜。反应液用饱和NH4Cl溶液洗两次,有机相再用饱和NaCl溶液洗一次,分离有机相,无水MgSO4干燥。过滤,旋蒸,湿法上硅胶柱,乙酸乙酯与石油醚按比例洗脱。点板,钼酸铵显色,酒精灯烤干。收集产物,旋干得到缩合中间体。
(b)cIL的合成:取缩合中间体溶于CH2Cl2中,加入TFA,常温反应2-3h,点板检测反应物是否反应完全。反应结束后直接旋蒸至油状物产生,再加入CH2Cl2旋蒸,重复3次至旋蒸出固体。所得固体即为缩合中间体脱掉Boc保护基的产物。将得到的固体溶于0.1mol的醋酸2-丁醇溶液中,加热回流三小时,此时反应体系变浑浊,直接抽滤得到环二肽cIL的粗品。将固体溶于甲醇中,旋蒸,干法上硅胶柱。先用石油醚:乙酸乙酯=3:1洗,再用石油醚:乙酸乙酯=1:1冲。点板收集产物,旋蒸得到纯的环二肽化合物。通过与文献中化合物的标准核磁谱图对照,确定合成的化合物是环二肽cIL(图4,图5)。
(2)α-酮戊二酸依赖的双加氧酶BcmE催化环二肽底物cIL的活性测试
将化学合成的环二肽cIL作为底物,对蛋白BcmE进行了体外酶催化测试,反应体系的组成见下表(混合好后加无菌水至总体积为50ul):
体系组成(50ul) 原浓度 终浓度 加入体积
Tris-HCl(PH=7.5) 1M 50mM 2.5μl
α-酮戊二酸 0.1M 2mM 1μl
抗坏血酸 0.1M 2mM 1μl
硫酸亚铁 0.1mM 50μM 2.5μl
底物(cIL) 20mM 0.6mM 1.5μl
BcmE 25μM 根据原始浓度计算加入
随后,将配好的测活反应体系放在30℃水浴中,反应三个小时后加等体积的甲醇淬灭,涡旋,离心取上清,进行HPLC-MS分析。图6显示了BcmE催化cIL的HPLC-MS鉴定结果,结果表明,BcmE能够催化cIL生成化合物II。通过HPLC分离并累积催化产物II,通过核磁方法鉴定其结构。图7-图11显示了化合物II的核磁图谱,化合物II核磁数据归属见表3。经鉴定化合物II的结构如图6所示。
表3:化合物II的核磁数据
实施例4.BcmC体外酶催化底物II产生III
将上述BcmE催化反应中分离得到的化合物II作为底物,对α-酮戊二酸依赖的双加氧酶BcmC进行了体外酶催化测试,反应体系的组成见下表(混合好后加无菌水至总体积为50ul):
体系组成(50ul) 原浓度 终浓度 加入体积
Tris-HCl(PH=7.5) 1M 50mM 2.5μl
α酮戊二酸 0.1M 2mM 1μl
抗坏血酸 0.1M 2mM 1μl
硫酸亚铁 0.1mM 50μM 2.5μl
底物(II) 20mM 0.6mM 1.5μl
BcmC 25μM 根据原始浓度计算加入
随后,将配好的测活反应体系放在30℃水浴中,反应三个小时后加等体积的甲醇淬灭,涡旋,离心取上清,进行HPLC-MS分析。图12显示了BcmC催化II的HPLC-MS鉴定结果,结果表明,BcmC能够催化II生成化合物III。通过HPLC分离并累积催化产物III,通过核磁方法鉴定其结构。图13-图16显示了化合物III的核磁图谱,化合物III核磁数据归属见表4。经鉴定化合物III的结构如图12所示。
表4:化合物III的核磁数据
实施例5.BcmG体外酶催化底物III产生IV
将上述BcmC催化反应中分离得到的化合物III作为底物,对α-酮戊二酸依赖的双加氧酶BcmG进行了体外酶催化测试,反应体系的组成见下表(混合好后加无菌水至总体积为50ul):
体系组成(50ul) 原浓度 终浓度 加入体积
Tris-HCl(PH=7.5) 1M 50mM 2.5μl
α酮戊二酸 0.1M 2mM 1μl
抗坏血酸 0.1M 2mM 1μl
硫酸亚铁 0.1mM 50μM 2.5μl
底物(III) 20mM 0.6mM 1.5μl
BcmG 25μM 根据原始浓度计算加入
随后,将配好的测活反应体系放在30℃水浴中,反应三个小时后加等体积的甲醇淬灭,涡旋,离心取上清,进行HPLC-MS分析。图17显示了BcmG催化III的HPLC-MS鉴定结果,结果表明,BcmG能够催化III生成化合物IV。通过HPLC分离并累积催化产物IV,通过核磁方法鉴定其结构。图18-图22显示了化合物IV的核磁图谱,化合物IV核磁数据归属见表5。经鉴定化合物IV的结构如图17所示。
表5:化合物IV的核磁数据
实施例6.BcmB体外酶催化底物IV产生V
将上述BcmG催化反应中分离得到的化合物IV作为底物,对α-酮戊二酸依赖的双加氧酶BcmB进行了体外酶催化测试,反应体系的组成见下表(混合好后加无菌水至总体积为50ul):
随后,将配好的测活反应体系放在30℃水浴中,反应三个小时后加等体积的甲醇淬灭,涡旋,离心取上清,进行HPLC-MS分析。图23显示了BcmB催化IV的HPLC-MS鉴定结果,结果表明,BcmB能够催化IV生成化合物V。通过HPLC分离并累积催化产物V,通过核磁方法鉴定其结构。图24-图28显示了化合物V的核磁图谱,化合物V核磁数据归属见表6。经鉴定化合物V的结构如图23所示。
表6:化合物V的核磁数据
Position δH,mult(J in Hz) δC COSY HMBC
1 88.33
3.88,dd(13.9,7.0), 4,5,1
3.77,dd(13.9,9.3) 63.57
1.86,m 35.11 3α,5 3,5,5a,6
1.56,m 3β,5
5 2.30,m 42.20 4,5a,6 3,4,5a,6
6 3.71,d,(1.4) 60.90 5 4,5,5a,7,9
7 170.84
9 174.78
1’ 4.05,s 72.10 1,3’,7,9,11
2’ 78.34
3’α 3.64,d,(11.4) 68.74 1’,2’,11
3’β 3.49,d(11.4)
11 1.34,s 24.38 1’,2’,3’
5a 1.07,d(7.0) 20.05 5 4,5,6
实施例7.BcmD体外酶催化底物V产生VI
将上述BcmB催化反应中分离得到的化合物V作为底物,对细胞色素P450单加氧酶BcmD进行了体外酶催化测试,反应体系的组成见下表(混合好后加无菌水至总体积为50ul):
随后,将配好的测活反应体系放在30℃水浴中,反应三个小时后加等体积的甲醇淬灭,涡旋,离心取上清,进行HPLC-MS分析。图29显示了BcmD催化V的HPLC-MS鉴定结果,结果表明,BcmD能够催化V生成化合物VI。通过HPLC分离并累积催化产物VI,通过核磁方法鉴定其结构。图30-图34显示了化合物VI的核磁图谱,化合物VI核磁数据归属见表7。经鉴定化合物VI的结构如图29所示。
表7:化合物VI的核磁数据
实施例8.BcmF体外酶催化底物VI产生双环霉素
将上述BcmD催化反应中分离得到的化合物VI作为底物,对α-酮戊二酸依赖的双加氧酶BcmF进行了体外酶催化测试,反应体系的组成见下表(混合好后加无菌水至总体积为50ul):
体系组成(50ul) 原浓度 终浓度 加入体积
Tris-HCl(PH=7.5) 1M 50mM 2.5μl
α酮戊二酸 0.1M 2mM 1μl
抗坏血酸 0.1M 2mM 1μl
硫酸亚铁 0.1mM 50μM 2.5μl
底物(BcmD-305) 20mM 0.6mM 1.5μl
BcmF 25μM 根据原始浓度计算加入
随后,将配好的测活反应体系放在30℃水浴中,反应三个小时后加等体积的甲醇淬灭,涡旋,离心取上清,进行HPLC-MS分析。图35显示了BcmF催化VI的HPLC-MS鉴定结果,结果表明,BcmF能够催化VI生成化合物双环霉素。通过HPLC分离并累积催化产物,通过核磁解析和图谱对比鉴定其结构为双环霉素(图35)。图36-图42显示了双环霉素的核磁图谱,双环霉素在Dimethyl Sulfoxide-D6溶剂中的核磁数据归属见表8。
表8:双环霉素的核磁数据
实施例9.BcmB、BcmC、BcmD、BcmE、BcmF和BcmG体外一锅法酶催化环二肽底物cIL产生双环霉素
将化学合成的cIL作为底物,将纯化后的六个氧化酶BcmB、BcmC、BcmD、BcmE、BcmF和BcmG混合后加入反应体系,进行体外一锅法酶催化全合成双环霉素,反应体系的组成见下表(混合好后加无菌水至总体积为50ul):
随后,将配好的一锅法测活反应体系放在30℃水浴中,反应十二个小时后加等体积的甲醇淬灭,涡旋,离心取上清,进行HPLC-MS分析。图43显示了6个氧化酶一锅法催化cIL的HPLC-MS鉴定结果,通过与实施例8中的双环霉素质谱图对比可以得出,催化产生的新化合物为双环霉素。
实施例10.酶催化反应结果的HPLC-MS分析和化合物的HPLC法半制备分离
HPLC-MS分析条件如下:
仪器:LTQ Fleet液相色谱-质谱系统(美国ThermoFisher公司)
柱子:DiKMA,Diamonsil,5μM,C18column,4.6×250mm(迪马科技有限公司)
HPLC检测波长:UV=210nm
质谱检测和分析:正离子模式;从MS结果中提取出底物和目标产物分子量
流动相条件:
Time(min) Flow(ml/min) A(H2O+1‰HCOOH)% B(CH3CN)%
0 1 95 5
20 1 60 40
23 1 95 5
25 1 95 5
HPLC半制备分离方法如下:
仪器:岛津LC-20-AT(日本岛津公司)
柱子:YMC-Pack ODS-AQ,5μM,C18 column,10×250mm(日本YMC公司)
检测波长:UV=210nm
流动相条件:
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院上海有机化学研究所
<120> 双环霉素生物合成中氧化酶的功能及其应用
<130> P2017-2271
<160> 27
<170> PatentIn version 3.5
<210> 1
<211> 314
<212> PRT
<213> 人工序列(artificial sequence)
<400> 1
Met Ala Ser Pro Asp Ser Ala Thr Leu Arg Glu Pro Val Val Leu Pro
1 5 10 15
Pro Met Pro Gly Glu His Glu Ala Arg Ala Ala Tyr Pro Pro Ile Gly
20 25 30
Leu Glu Arg Ser Arg Val Thr Gly Gly Arg Leu Val Phe Asp Arg Asp
35 40 45
Glu Gly Phe Asp Arg Ala Leu Ala Gln Gly Phe Phe Leu Val Arg Ile
50 55 60
Pro Glu Gly Thr Asp Pro Ala Ala Gly Asp Arg Phe Ala Ala His Phe
65 70 75 80
His Glu Glu Arg Ala Gly Gly Asp Pro Leu Asp Ala Tyr Arg Gly Tyr
85 90 95
Arg His Val Arg Val Pro Gly Asp Tyr Gln Gly Tyr Phe Asp Arg Glu
100 105 110
His Asp Gln Trp Glu Asn Phe Tyr Val Glu Arg Asp Asn Trp Asp Val
115 120 125
Leu Pro Ser Glu Val Ala Arg Val Gly Arg Gly Met Ala Gly Leu Gly
130 135 140
Val Thr Ile Leu Arg Gly Val Leu Glu His Leu Arg Leu Pro Arg Glu
145 150 155 160
His Trp Ala Arg Val Thr Gly Gly Leu Thr Glu Asp Arg Gly His Gln
165 170 175
Met Leu Ala Phe Asn His Phe Arg Ser His Lys Gly Val Arg Gly Ser
180 185 190
Lys Phe His Arg Asp Ser Gly Trp Val Thr Val Leu Arg Ser Val Asp
195 200 205
Pro Gly Leu Leu Ala Leu Val Asp Gly Arg Leu Trp Ala Val Asp Pro
210 215 220
Glu Pro Gly His Phe Ile Val Asn Phe Gly Ser Ser Leu Glu Val Leu
225 230 235 240
Thr Glu Arg Leu Asp Arg Pro Val Arg Ala Asn Val His Gly Val Val
245 250 255
Ser Thr Glu Arg Ala Pro Gly Gln Pro Asp Arg Thr Ser Tyr Val Thr
260 265 270
Phe Leu Asp Ser Asp Leu Thr Gly Thr Val Tyr Arg Phe Glu Asn Gly
275 280 285
Thr Pro Arg Pro Leu Gln Ser Val Ala Glu Phe Ala Gly Gln Glu Val
290 295 300
Gly Arg Thr Tyr Asp Asp Ser Gly Ala Leu
305 310
<210> 2
<211> 945
<212> DNA
<213> 人工序列(artificial sequence)
<400> 2
atggcgtcac ccgattccgc caccctccgg gaaccggtcg tcctgcctcc catgcccggt 60
gagcacgagg cgcgggcggc gtatccgccg atcgggctgg agcgctcccg cgtcaccggt 120
ggccggctcg tcttcgaccg cgacgagggc ttcgaccgtg ccctcgcgca ggggttcttc 180
ctcgtacgga tccccgaggg cacggacccc gccgccggcg accgcttcgc ggcccacttc 240
cacgaggagc gggccggcgg ggacccgctg gacgcctacc gcggctaccg ccacgtgcgc 300
gtgcccggcg actaccaggg ctacttcgac cgcgagcacg accagtggga gaacttctac 360
gtcgagaggg acaactggga cgtgctgcca tccgaggtcg cccgggtggg ccggggcatg 420
gccggtctcg gggtcacgat cctgcgcggc gtcctggagc acctgcggct gccccgggag 480
cactgggcgc gcgtcacggg cgggctcacc gaggaccgcg gccaccagat gctcgccttc 540
aaccacttcc ggtcgcacaa gggcgtgcgc ggctcgaagt tccaccggga ctccggctgg 600
gtgacggtcc tgcggtccgt ggacccgggt ctgctcgccc tcgtcgacgg gcgcctgtgg 660
gccgtcgacc cggagcccgg ccacttcatc gtcaacttcg gcagctccct cgaagtgctg 720
accgaacgcc tcgaccgacc ggtgcgggcc aatgtgcacg gcgtcgtctc cacggaacgg 780
gcgccgggac aaccggaccg gacctcctac gtcaccttcc tcgactccga cctcaccggc 840
accgtctacc ggttcgagaa cggcacgccc cggcccctcc agtcggtggc cgagttcgcc 900
ggccaggaag tcggccggac ctacgacgac agcggtgcgc tctga 945
<210> 3
<211> 305
<212> PRT
<213> 人工序列(artificial sequence)
<400> 3
Val Ser Thr Glu Thr Leu Arg Leu Gln Lys Ala Arg Ala Thr Glu Glu
1 5 10 15
Gly Leu Ala Phe Glu Thr Pro Gly Gly Leu Thr Arg Ala Leu Arg Asp
20 25 30
Gly Cys Phe Leu Leu Ala Val Pro Pro Gly Phe Asp Thr Thr Pro Gly
35 40 45
Val Thr Leu Cys Arg Glu Phe Phe Arg Pro Val Glu Gln Gly Gly Glu
50 55 60
Ser Thr Arg Ala Tyr Arg Gly Phe Arg Asp Leu Asp Gly Val Tyr Phe
65 70 75 80
Asp Arg Glu His Phe Gln Thr Glu His Val Leu Ile Asp Gly Pro Gly
85 90 95
Arg Glu Arg His Phe Pro Pro Glu Leu Arg Arg Met Ala Glu His Met
100 105 110
His Glu Leu Ala Arg His Val Leu Arg Thr Val Leu Thr Glu Leu Gly
115 120 125
Val Ala Arg Glu Leu Trp Ser Glu Val Thr Gly Gly Ala Val Asp Gly
130 135 140
Arg Gly Thr Glu Trp Phe Ala Ala Asn His Tyr Arg Ser Glu Arg Asp
145 150 155 160
Arg Leu Gly Cys Ala Pro His Lys Asp Thr Gly Phe Val Thr Val Leu
165 170 175
Tyr Ile Glu Glu Gly Gly Leu Glu Ala Ala Thr Gly Gly Ser Trp Thr
180 185 190
Pro Val Asp Pro Val Pro Gly Cys Phe Val Val Asn Phe Gly Gly Ala
195 200 205
Phe Glu Leu Leu Thr Ser Gly Leu Asp Arg Pro Val Arg Ala Leu Leu
210 215 220
His Arg Val Arg Gln Cys Ala Pro Arg Pro Glu Ser Ala Asp Arg Phe
225 230 235 240
Ser Phe Ala Ala Phe Val Asn Pro Pro Pro Thr Gly Asp Leu Tyr Arg
245 250 255
Val Gly Ala Asp Gly Thr Ala Thr Val Ala Arg Ser Thr Glu Asp Phe
260 265 270
Leu Arg Asp Phe Asn Glu Arg Thr Trp Gly Asp Gly Tyr Ala Asp Phe
275 280 285
Gly Ile Ala Pro Pro Glu Pro Ala Gly Val Ala Glu Asp Gly Val Arg
290 295 300
Ala
305
<210> 4
<211> 918
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
gtgagcactg agacgctgcg cctccagaag gcgcgggcca ccgaggaggg cctggcgttc 60
gagacgcccg gcggcctgac ccgggccctg cgggacggct gcttcctcct cgccgtaccg 120
cccggcttcg acaccacgcc cggagtgacc ctgtgccgcg agttcttccg cccggtggag 180
cagggcggcg aaagcacgcg cgcctaccgg ggcttccggg acctggacgg cgtctacttc 240
gaccgcgagc acttccagac cgaacacgtc ctcatcgacg gaccggggcg ggagcgccac 300
ttcccgccgg agctccggcg catggccgag cacatgcacg agctggcccg gcacgtgctg 360
cgcacggtcc tgaccgagct gggggtggcc cgggagctgt ggagcgaggt caccggcggg 420
gccgtcgacg gccgcggcac ggagtggttc gccgccaacc actaccgctc cgagcgcgac 480
cggctcgggt gcgcgcccca caaggacacg ggcttcgtga ccgtcctcta catcgaggag 540
gggggactgg aggcggcgac gggcggttcc tggacgccgg tcgatcccgt accgggctgc 600
ttcgtggtca acttcggcgg ggccttcgaa ctgctcacct ccggcctgga ccgccccgtg 660
cgggccctgc tgcaccgggt ccggcagtgc gcgccgcggc cggagtccgc cgaccgcttc 720
tccttcgccg ccttcgtcaa cccaccgccg accggcgacc tctaccgcgt cggtgccgac 780
ggcacggcga cggtggcccg gagcaccgag gacttcctgc gcgacttcaa cgagcggacg 840
tggggcgacg gctacgccga cttcgggatc gcccctccgg agccggccgg cgtcgcggaa 900
gacggggtga gggcatga 918
<210> 5
<211> 300
<212> PRT
<213> 人工序列(artificial sequence)
<400> 5
Met Ser Thr Ala Gln Gly Tyr Gly Trp Gln Thr Ala Ala Leu Arg Gly
1 5 10 15
Gly Glu Leu Val Phe Ser Thr Pro Gly Gly Ile Glu Gln Ala Leu Arg
20 25 30
Asp Gly Phe Phe His Val Glu Gln Pro Glu Gly Leu Asp Leu Thr Ala
35 40 45
Gly Asp Arg Phe Ala Arg Gly Phe Tyr Leu Pro Gly Glu Pro Asp Ser
50 55 60
Thr Asp Pro Phe Arg Gly Phe Gln His Trp Thr Ser Glu Arg Leu Gly
65 70 75 80
Pro Arg Gln Gly Tyr Tyr Cys Arg Asp Asp Asp Gln Thr Glu Gln Phe
85 90 95
Phe Leu Glu Ser Ala His Trp Asp Ser Val Tyr Pro Gln Ala Leu Ala
100 105 110
Arg Gln Ala Glu Ala Met Arg Ser Leu Ala Leu Asp Val Leu Arg Ala
115 120 125
Val Leu Ala His Leu Glu Leu Pro Pro Glu Leu Trp Asp Glu Ala Thr
130 135 140
Gly Arg Cys Leu Ser Ala Arg Gly Thr Tyr Asn Leu Thr Phe Asn His
145 150 155 160
Phe Arg Pro Glu Val Pro Arg Arg Gly Leu Asn Val His Lys Asp Ser
165 170 175
Gly Trp Val Thr Val Leu Arg Ser Thr Asp Pro Gly Leu Glu Val Glu
180 185 190
Arg Asp Gly Ala Trp His Pro Ile Asp Pro Arg Pro Gly Thr Phe Ile
195 200 205
Val Asn Phe Gly Cys Ala Ile Glu Ile Leu Thr Arg Asp Thr Arg Thr
210 215 220
Pro Val Ala Ala Val Ala His Arg Val Val Gln Gln Pro Arg Thr Asp
225 230 235 240
Glu Arg Lys Pro Asp Arg Phe Ser Tyr Ala Leu Phe Val Asp Ser Ser
245 250 255
Leu Asp Glu Asp Ile Cys Pro Gly Leu Phe Arg Tyr Glu Pro Gly Thr
260 265 270
Gly Leu Arg Leu Glu Thr Asn Phe Gly Thr Phe Leu Asp Thr Ile Leu
275 280 285
His Asn Thr Tyr Gln Lys Asp Thr Ala Gly Leu Tyr
290 295 300
<210> 6
<211> 903
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
atgagcacgg cacagggata cggctggcag acggccgcac tgcgcggcgg agagctggtc 60
ttcagcacgc cgggagggat cgagcaggcc ctcagggacg gcttcttcca cgtcgaacaa 120
ccggagggcc tggacctcac ggccggggac cgcttcgcgc gcggcttcta cctccccggg 180
gaaccggact ccaccgaccc gttccgcggc ttccagcact ggacctcgga acggctcggc 240
ccccgccagg gctactactg ccgcgacgac gaccagaccg agcagttctt cctggagagc 300
gcccactggg actccgtgta cccgcaggcg ctggcgcggc aggcggaagc catgcggtca 360
ctggcactcg acgtcctcag ggccgtgctc gcccacctcg aactgccccc ggagctgtgg 420
gacgaggcca cgggccgctg cctgtcggca cggggcacct acaacctcac cttcaaccac 480
ttccgtccgg aagtcccccg gcgcggcctg aacgtccaca aggactccgg ctgggtgacc 540
gtgctgcggt ccaccgaccc cggcctcgaa gtcgagcgtg acggcgcctg gcaccccatc 600
gacccgaggc cgggcacgtt catcgtgaac ttcggctgcg ccatcgagat cctcacccgt 660
gacacgagaa ctcccgtggc ggccgtggcg caccgcgtcg tgcaacagcc ccggaccgac 720
gagcggaaac ccgacaggtt ctcctacgcg ctcttcgtcg acagcagcct ggacgaggac 780
atctgcccgg gcctcttccg ctacgagccg ggcaccggtc tccgcctgga gacgaacttc 840
ggcacgttcc tcgacaccat cctgcacaac acctaccaaa aggacaccgc cggcctgtac 900
tga 903
<210> 7
<211> 325
<212> PRT
<213> 人工序列(artificial sequence)
<400> 7
Met Ser Arg Ala Pro Gly Asn Thr Ala Ala Pro Glu Ile Arg Arg Gly
1 5 10 15
Arg Ile Tyr Arg Asp Leu Tyr Glu Lys Arg Ala Ser Gly Pro Ala Val
20 25 30
Gln Gly Asp Ala His Leu Glu Arg Ala Arg Ile Gln Gly Asp Arg Leu
35 40 45
Glu Phe Ala Gly Ser Arg Ala Arg Glu Thr Ala Leu Ala Asp Gly Val
50 55 60
Phe Leu Leu Glu Ile Pro Ala Asp Ile Asp Val Ala Ala Gly Asp Ala
65 70 75 80
Phe Ser Arg Gln Phe His Leu Gly Pro Asp Ser Pro Pro Tyr Gly Arg
85 90 95
Phe Arg Asp Leu Gly Ser Glu His Phe Gly Asp Pro Leu Leu Gly Phe
100 105 110
His Gln Arg Val Asn Gln Ile Glu Gln Phe Leu Leu Glu Arg Arg Phe
115 120 125
Trp Ala Ser Asp Tyr Pro Pro Glu Ile Ala Arg Leu Gly Glu Gln Leu
130 135 140
Thr Arg Leu Ser Gln Lys Val Leu Cys Ala Val Leu Ser His Val Gly
145 150 155 160
Val Pro Glu Arg Asp Arg Arg Arg Ala Thr Gly Gly Cys Ser Arg Ala
165 170 175
Ala Gly Ser Tyr His Leu Thr Phe Asn His Tyr Arg Pro Glu His Arg
180 185 190
Asp Val Gly Leu Ser Ser His Lys Asp Asp Gly Phe Leu Thr Ile Leu
195 200 205
Arg Thr Thr Thr Pro Gly Leu Glu Val Asn Arg Lys Asp Arg Trp Glu
210 215 220
Arg Val Pro Val Asp Pro Asp Cys Phe Val Ile Asn Phe Gly Leu Ser
225 230 235 240
Met Glu Ile Leu Thr Ala Pro Thr Lys Ala Pro Val Ala Ala Ile Met
245 250 255
His Arg Val Ala Arg Gln Gly Gly Asp Arg Ser Ser Phe Gly His Phe
260 265 270
Ser Ser Ser Gly Cys Ala Pro Gly Met Asp Glu Gly Val Phe Arg Tyr
275 280 285
Leu Pro Gly Ser Gly Leu Asp Arg Val Cys Gly Ser Arg Glu Leu Ile
290 295 300
Asp Glu Asn Asp His Glu Ile Tyr Ala Gly Thr Asp Ala Pro Gly Asp
305 310 315 320
Lys Arg Arg Glu His
325
<210> 8
<211> 978
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
atgtcccgtg cacccggcaa cacggccgca cccgaaatcc ggcgcggccg gatctaccgc 60
gacctctacg agaagcgcgc gagcgggccc gcggtccagg gcgacgccca cctcgaacgc 120
gcccgtatcc agggcgaccg cctggagttc gccggctccc gggcgcggga aaccgccctc 180
gccgacggcg tcttcctcct ggagataccc gcggacatcg acgtcgcggc cggcgatgcc 240
ttctcccgcc agttccacct cggcccggac tcccctccct acggaaggtt ccgcgacctc 300
ggcagcgagc atttcgggga tcccctgctg ggcttccacc agcgggtgaa ccagatcgaa 360
cagttcctcc tggagcggcg cttctgggcg agcgactacc cgcccgagat cgcccggctc 420
ggcgagcagc tgacccggtt gtcgcagaag gtcctctgcg cggtgctctc ccacgtcggc 480
gtccccgagc gggaccggcg acgcgccacc ggcggatgct cccgggcggc cggctcgtac 540
cacctgacct tcaaccacta ccgccccgag caccgggacg tcggtctgag ctcccacaag 600
gacgacgggt tcctcacgat cctgcgcacg acgaccccgg ggctggaggt caaccgcaag 660
gaccgctggg aacgggtccc cgtcgacccg gactgcttcg tcatcaactt cggtctgtcg 720
atggagattc tcacggcgcc cacgaaggcg cccgtggccg ccatcatgca ccgcgtcgcc 780
cggcagggag gcgaccgttc cagcttcggg cacttcagct ccagcggctg cgcccccggc 840
atggacgaag gcgtcttccg ctacctcccc ggcagtggac tcgaccgcgt ctgcggctcc 900
cgggaactca tcgacgagaa cgaccacgag atctacgccg gcaccgacgc cccgggggac 960
aagcgacgtg agcactga 978
<210> 9
<211> 488
<212> PRT
<213> 人工序列(artificial sequence)
<400> 9
Met Thr Ala Pro Ala His Pro Pro Ala Cys Pro Val Ser Gly Arg Ala
1 5 10 15
Pro Phe Pro Gly Val Leu Ala His His Pro Gly Pro Ser Pro Leu Asp
20 25 30
Gly His Glu Ser Ala Phe His Glu Ala Thr Val Val Arg Gly Thr Pro
35 40 45
Ala Ser Glu Tyr Phe Arg Ala Ser Gly Ile Ser Ala Cys Ala Glu Glu
50 55 60
Asn Gly Gly Leu Cys Thr Phe Arg Met Gly Pro Arg Leu Ala Val Tyr
65 70 75 80
Gln Ile Thr Asn Gly Pro Leu Leu Asp Asp Glu Asp Leu Ala Pro Ser
85 90 95
Thr Asp Ala Asn Arg Glu Leu Phe Gly Asp Phe Met Gly Ser Leu Pro
100 105 110
Gly Asp His Pro Asp Arg Pro Ala Lys Arg Ala Ala Val Glu Thr Thr
115 120 125
Leu Gly Asn Gly Arg Phe Val Glu Glu Leu Val Pro His Val Arg Arg
130 135 140
His Ala Ala Ala Phe Leu Asp Arg Ala Ala Gly Arg Glu Val Pro Leu
145 150 155 160
Asp Glu Phe Ala Leu Ser Leu Val Ala Gln Val Asp Ser Leu Val Pro
165 170 175
Gly Val Leu Asp Leu Thr Gln Arg Pro Leu Pro Asp Trp Leu Ala Ser
180 185 190
Pro Glu Tyr Gly Ala Val Val Arg Gly Phe Phe Asp Leu Ala Ser Asp
195 200 205
Val Ile Thr Asn Val Asn Pro Ala Ala Met Arg Glu Phe Asp Val Ile
210 215 220
Val Pro Phe Val Arg Glu Leu Leu Arg Ala Asn Ala Asp Ala Ile Ala
225 230 235 240
Ala Ala Pro Ala Ser Asn Val Ile Arg Arg Tyr Phe Ala Leu Trp Asp
245 250 255
Leu Pro Phe Ser Arg Glu Gly Val Asp Gly Leu Asp Ala Ala Gln Val
260 265 270
Lys Glu Leu Gly Thr Val Ile Val Ala Thr Tyr Asp Thr Thr Ala Leu
275 280 285
Ser Leu Leu Trp Ala Leu Ala Tyr Ile Glu Thr Thr Pro Ala Ala Lys
290 295 300
Arg Glu Ile Val Ala Glu Ala Arg Gly Gly Gln Pro Ser Ala Ser Pro
305 310 315 320
Ser Pro Leu Asp Leu Ala Val Leu Glu Ala Val Arg Leu Gly Gly Ser
325 330 335
Asn Pro Ser Ala Leu Trp Arg Arg Thr Thr Arg Pro Phe Thr Leu His
340 345 350
His Glu Gly Arg Ser Val Thr Val Pro Pro Gly Thr Met Met Trp Leu
355 360 365
Asp Arg Arg Gln Ala Asn Arg Asp Pro Ala Val Phe Pro His Pro Glu
370 375 380
Gly Phe Asp Pro Arg Asn Ile Arg Ala Leu Phe Arg Ser Gly Arg Glu
385 390 395 400
Thr Val Ser Ser Leu Ile Ser Arg Gly Arg His Glu Ile Asn Ser Phe
405 410 415
Ser Met Val Asn Ala Thr Arg Asn Pro Arg Lys Cys Pro Gly Arg Leu
420 425 430
Phe Ser Val Arg Val Gln Ser Val Leu Leu Ala Glu Leu Tyr Ser Arg
435 440 445
Tyr Glu Val Ser Ala Arg Gly Ile Asp Leu Ser Leu Lys Arg His Ala
450 455 460
Ala Met Pro Arg Pro Ala Arg Pro Gly Thr Val Leu Phe Asn Ala Leu
465 470 475 480
Pro Glu Arg Thr Lys Glu Gln Asn
485
<210> 10
<211> 1467
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
atgaccgcgc ccgcccaccc gccggcctgt cccgtgtccg ggcgggcccc cttccccggc 60
gtgctcgccc accatccggg cccgagcccg ctggacggcc acgagagcgc cttccacgag 120
gcgaccgtcg tccgcgggac accggcctcg gagtacttcc gcgcctcggg catcagcgcg 180
tgcgccgagg agaacggcgg cctctgcacg ttccgcatgg gcccgcgcct ggccgtgtac 240
cagatcacca acggccccct gctggacgac gaggacctgg cgccgtccac cgacgccaac 300
cgggagctgt tcggcgactt catgggctcc ctgcccggcg accacccgga ccggccggcc 360
aaacgggcgg ccgtggagac caccctgggc aacggcaggt tcgtggagga gctggtgccg 420
cacgtgcggc ggcacgccgc cgcgttcctc gaccgggcgg ccgggcggga ggtccccctg 480
gacgagttcg ccctgtccct ggtggcccag gtggacagcc tcgtgcccgg cgtgctggac 540
ctcacgcagc gccccctgcc cgactggctg gcctcgccgg agtacggcgc ggtggtgcgg 600
ggcttcttcg acctcgcctc ggacgtgatc accaacgtca accccgcggc catgcgggag 660
ttcgacgtca tcgtcccctt cgtccgcgaa ctcctgcggg ccaacgcgga cgcgatcgcg 720
gcggcccccg cgtccaacgt gatccggcgc tacttcgccc tgtgggacct gccgttctcc 780
cgggagggcg tggacgggct ggacgccgca caggtcaagg aactgggcac ggtgatcgtg 840
gccacgtacg acacgaccgc gctcagcctg ctgtgggccc tcgcctacat cgagacgacg 900
cccgccgcga agcgggagat cgtcgccgag gcgcgcggcg ggcagccgag cgcgtcgccc 960
tcgccgctgg acctggcggt cctggaggcc gtccggctgg gcggcagcaa ccccagcgcg 1020
ctctggcgcc ggacgacacg gcccttcacc ctgcaccacg agggccgttc ggtcaccgtt 1080
cccccgggca ccatgatgtg gctggaccgc cgccaggcga accgggaccc ggccgtcttc 1140
ccgcaccccg agggtttcga cccacgcaac atccgggcgc tgttccggtc cggccgcgag 1200
acggtctcgt ccctgatctc ccggggccgg cacgagatca actcgttcag catggtgaac 1260
gccacgcgga acccgcgcaa atgccccggc cggctgttct ccgtgcgcgt gcagtcggtc 1320
ctcctggccg agctgtactc ccgctacgag gtcagcgcgc gaggcatcga cctgagtctg 1380
aagaggcacg ccgccatgcc ccggcccgcc cggcccggca ctgtcctttt caacgccctg 1440
cccgagcgca cgaaggagca gaactga 1467
<210> 11
<211> 305
<212> PRT
<213> 人工序列(artificial sequence)
<400> 11
Val His Pro Pro Arg Glu Arg Thr Ala Met Thr Thr Val Val Asp Asn
1 5 10 15
Glu Gly His Leu His Leu Pro Thr Ala Arg Val Thr Ala Gly Arg Leu
20 25 30
Leu Phe Asp Ala Ala Glu Gly Ala Asp Gln Ala Leu Ala Leu Gly Ala
35 40 45
Phe Cys Leu Ala Val Pro Glu Asp Leu Asp Val Glu Pro Gly Leu Arg
50 55 60
Phe Cys Arg Ser Phe Tyr Glu Pro Ala Glu Pro Gly Thr Ala Asp Arg
65 70 75 80
Tyr Arg Gly His Arg Glu Asp Gly His Ala Asp Ser Lys Leu Gly Tyr
85 90 95
Glu Asp Arg Pro Asp Gln Val Glu Gln Leu Gln Leu Glu Ser His Leu
100 105 110
Trp Ser Arg Tyr Leu Pro Glu Glu Val Thr Ala Leu Leu Glu Arg Met
115 120 125
Lys Asp Leu Thr Leu Asp Ala Leu Tyr Gly Val Phe Asp Val Ala Gly
130 135 140
Ile Pro Glu His Asp Arg Glu Thr Val Thr Gly Gly Ala Arg Gln Asp
145 150 155 160
Thr Gly Leu Cys Tyr Thr Thr Val Asn His Tyr Arg Ala Asp Leu Ser
165 170 175
Asp Arg Ala Gly Ile Val Glu His Ser Asp Ser Gly Phe Ile Thr Leu
180 185 190
Ile Cys Thr Asp Gln Pro Gly Tyr Glu Ile Leu His Glu Gly Arg Trp
195 200 205
Arg Pro Val Arg Glu Glu Pro Gly His Phe Val Val Asn Leu Gly Asp
210 215 220
Ala Phe Arg Val Leu Thr Arg Lys Leu Pro Arg Pro Val Thr Ala Val
225 230 235 240
Tyr His Arg Val Pro Glu Leu Arg Pro Asp Gly Ala Ala His His Arg
245 250 255
Ser Ser Phe Thr Ile Tyr Met Gly Pro Arg Tyr Asp Met Met Leu His
260 265 270
Gln Tyr Ala Ala Asp Gly Thr Leu His Glu Tyr Gln Gly Phe Arg Asp
275 280 285
Phe Ser Val Glu Lys Ser Lys Lys Leu Gly Tyr Glu Phe His Ser Arg
290 295 300
Ile
305
<210> 12
<211> 918
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
gtgcaccccc ccagagaaag gactgcgatg acgacggtcg tcgacaacga aggacacctc 60
cacctcccca cggcgcgggt cacggccggc agactgctct tcgacgcggc cgagggggcg 120
gaccaggccc tcgcgctggg cgcgttctgc ctcgcggttc ccgaggacct cgacgtcgag 180
ccggggctga ggttctgccg cagcttctac gaaccggccg agccggggac ggccgaccgg 240
taccggggcc accgcgagga cgggcacgcc gactccaagc tcggctacga ggaccgcccc 300
gaccaggtcg agcagctcca gttggagtcc cacctgtgga gccggtacct gcccgaggag 360
gtcaccgccc tcctggagcg gatgaaggac ctgaccctgg acgcgctcta cggcgtgttc 420
gacgtggcgg gcatcccgga gcacgaccgc gagaccgtca ccggcggcgc ccgccaggac 480
accggcctgt gctacaccac ggtcaaccac taccgcgcgg acctgagcga ccgggcgggc 540
atcgtcgagc actccgacag cgggttcatc accctcatct gcaccgacca gcccggctac 600
gagatcctcc acgagggccg ctggcggccc gtccgcgagg agcccgggca cttcgtggtg 660
aacctgggtg acgcgttccg cgtcctgacg cggaagctcc cccggccggt gaccgccgtc 720
taccaccgcg ttcccgaact ccggccggac ggcgccgcgc accaccggtc atcgttcacg 780
atctacatgg ggccgcggta cgacatgatg ctccaccagt acgccgcgga cggcaccttg 840
cacgagtacc agggcttccg cgacttctcg gtggagaagt ccaagaagct gggctacgag 900
ttccactccc gcatatga 918
<210> 13
<211> 248
<212> PRT
<213> 人工序列(artificial sequence)
<400> 13
Met Ser Leu Glu Ala Gln Leu Met Glu Pro Arg Glu Glu Pro Ala Lys
1 5 10 15
Pro Val Phe Gly Arg Arg Tyr Lys Ala Glu Ile Gly Ser Val Ser Pro
20 25 30
Thr Thr Ser Arg Asp Thr Phe Glu Asp His Asp Thr Cys Phe Leu Gly
35 40 45
Val Ser Leu Glu Asn Ser Asn Phe Lys Pro Ala Lys Val Asp Ala Met
50 55 60
Ala Lys Trp Ile Ser Arg Arg Phe Ser Gln Cys Thr Val Leu Ile Gly
65 70 75 80
Asp Ser Ile His Arg Ile Thr Leu Glu Ser Thr Arg Ser Met Pro Pro
85 90 95
Arg Ala Ala Leu Asp Asp Ala Leu Arg Leu Gly Arg Glu Phe Val Glu
100 105 110
Ser Arg Gln Pro Val Phe Glu Ser Phe Arg Asp Arg Thr Lys Phe Thr
115 120 125
Phe Val Thr Cys Ser Glu Val Gln Ser Trp Gly Leu Tyr Gly Asp Tyr
130 135 140
His Glu Arg Leu Arg Gln His Tyr Asp Gln Asp Ala Ala Phe Arg Gly
145 150 155 160
Ser Val Glu Ala Phe Gly Arg Asp Tyr His Gly Lys Arg Ser Glu Gly
165 170 175
Val Ser Ala Gln Glu Leu Asp His Arg Ile Arg Lys Ser Ser Glu Tyr
180 185 190
Phe Leu Glu Glu Phe Ala Ile Phe Ala Cys Leu Gln Arg Thr Gly Ser
195 200 205
Pro Val Met Val Tyr Pro Gly Ser Phe Ser Thr Leu Ser Glu Ile Ala
210 215 220
Gln Gly Lys His Pro Gly Ala Pro Glu Glu Leu Arg Asp Leu Ile Val
225 230 235 240
Val Ser Leu His Leu Lys Gly Arg
245
<210> 14
<211> 747
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
atgtcgctag aagcgcagct gatggagcct cgggaagaac cggcaaagcc ggttttcggc 60
aggcgctaca aggcggagat aggatccgtc tccccgacca cgagccgcga tacgttcgag 120
gatcacgaca cctgtttcct cggagtgagc ctggagaaca gcaacttcaa accggccaag 180
gtcgacgcca tggccaagtg gatctcccgg cggttctccc agtgcaccgt cctcatcggt 240
gacagcattc accggatcac cctggagtcc acccgctcca tgccgccgcg ggcggccctc 300
gacgacgccc tgcggctcgg ccgcgagttc gtcgagagcc ggcaaccggt cttcgagtcc 360
ttccgcgacc ggaccaagtt caccttcgtg acctgctcgg aggtgcagag ctggggcctc 420
tacggcgact accacgagcg cctgcggcag cactacgacc aggacgccgc cttccgcggc 480
tcggtcgagg cgttcggccg cgactaccac ggcaaacgct ccgaaggcgt cagcgcccag 540
gaactcgacc accgcatcag gaaatcctcc gagtactttc tagaggaatt cgccatcttc 600
gcctgcctcc agcggaccgg cagtcccgtc atggtgtatc ccggatcgtt cagcactctc 660
tcggaaatag ctcagggaaa acacccggga gcccccgaag agctgcgcga cctcatcgtg 720
gtgtccctcc acctgaaagg gcgatga 747
<210> 15
<211> 9651
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
tctagagata tcggatcaga aacgcttcac cacgggctac ggcggccagc cgggagcgca 60
actggtcgca ctccgcggcg aaaaccaggg gagggtggaa gccctgctcc ttgcccgcgg 120
cgagcgcggc cggctcggac caccccgact gaggacccgc cggaggacac ggccacaagc 180
cgctctcctg gttccggccg gaatctgatg gtgaactgag gtcgatggca gtcatacggc 240
tacgcggcgg aagaagaacc gccgcattcc tttctggtac cggcccgtag aggtcccgcg 300
ggaagcatgt gggggcgctg caacctcgaa ggcgttgtgc aggtgtctcg tgcaggcggc 360
agtgcgggcc acggaacgac cggacttgac catgaacgaa cgccgaaatc gtgccgatcc 420
agcggaagtc cggtgctccc cgcttcgtca atcccgcctg tcgccatcag tgttgcccac 480
gagaggcgat cacggccgct tcggtgagaa acaccactcc gccttcttac ccgtggctga 540
ttgcggaagt gtgaattccg gcgggttctt ccccgctccc tttcccggct gtgacggcac 600
gatcgcctgc ggggcgcccg gcagcacggc cccggccacc gagcgcacgc ccgcttcccc 660
ctcaggacgt cggcacggcc cggggcctac ctccggcccg tccgggccat cgccctccgc 720
gtcctccccg cctccggccg cgtccggccg gtgcggtccg cccgcgcgcg ggccgcgctc 780
cacacgccca ggagaagccc cgccgcgagc gcggccagtc ccgtcgcggt gagggcgtgg 840
tccgccgccg ctgacgacgc aggcctgccg tcggggtcgg cgactgcacc ggacagcgcg 900
acgccgagcc cggcggcaac ggtgatgacc gtcttcgtca cccccgaggc ctccccggcc 960
cgttcgggcc ggatgaccgc ctgggtggcg atgagggtca gggcgttggc caggccgagc 1020
acaccgccgc acacggtcat cgtggcgagg tggacgggca gggccccgat ggccggggcc 1080
gcgcagagca tgcctccggc cagggccagc agcagcgcca tgacgttcac cgccgcgccg 1140
ggagtcaccc ggccggccag cggaccggcg acggccatca tcgcggccgg ggccaggaag 1200
gcgacgcccg ccgcgaacgc cgtgaggccc caggacccct gcagggcgag ggggaccacg 1260
aacaggaaca gcacggtcgc cgcgttcgcc acggctccgg cgacggtgag cacgacgaag 1320
gggccgttgc ggaacaggcc caggttcacc agggggtcgg cgacccggcc ctcgtgtcgc 1380
acgaaggcga cgagcagcac ggcggccgcg gccagcacga ggccgtcgcg gggggatgtc 1440
cagccccaca ccgggccgcg ttccacgaac acggcgacgg ccgcgagggc cgccgtggcg 1500
aaggccagcc cccgccagtc gacggccggg gcggcggcgg tgtcccggct cccgggcgtc 1560
cgcgaggccc acaccgccgc ggcgacggcc agcgggacgt tgatccagaa gatgacgcgc 1620
caggacgccg cctcggtcag cgccccgccg acgaacgggc cgcaggcggt ggcgacgcct 1680
cccatgccga gggcccatcc cgtggcacgg ccgcgctggt cagccgggta gacgttggtc 1740
agcagggcca ggccgaccgg catgatcagg gaggcgccgg cgccctgcgc cacccgcgcg 1800
ccgacgagca acggcagcga cggggcggtg gcacaggcca aggaggaggc gccgaacagg 1860
gccagcccga cgaccagcag ccggcggcgt ccccagaggt cgctcaggcg gccggcgccg 1920
agcatgagcg tgccggtgga cagcaggtac gcgctgacgg cccactgcag gctgccggtc 1980
gaggcgccga ggtcgtgacc gatgctcggc agggccaggt tcagggcgaa ggcgtccagt 2040
tggatgcaga acacccccag cgccacggcc gccagggccc ggcgctgtcc aggaggtccc 2100
ttcagcacag tcgtctcaca tccttcgggt ggcgggagcc acgtcgtcac gggggccggg 2160
cacggggcgc gcggtacgag ccgtacggca ccggggccgc tgtggcccgg tcgtccgcgg 2220
gcaacggcgc gtgctgcccg gccggttcgg gcaggcggtg aggggatgag gtgtcagaac 2280
ctgacgtgag tggccgccgg atgtgaaccg ggggcgccgc aacggctcca gatccgcgct 2340
ccccggggcg ccgtggagaa acgggtcgcc ttggtgcggg gtgcggcacg aagcgctcct 2400
cacgttagcc ggtccgcagc gctcgggcca cccccttccg ggcggatccg gtgcgcccgc 2460
atcccctacg gcggctttac tctcccccgt gtccggattg accgcacaat ccgtctgaca 2520
tcggttctcc cccgacaatc cctcttgctt ccacctaccg ctcctcacct caccgaccaa 2580
gtagtttcgg cctacatcta agttgcggag cggccgactc cgcaggtcat gcagcgatgc 2640
catccggtcc ggtccggctc aaaacaaacc tcgggcttgc ccagccatcc gggctcttgt 2700
tagcaatttc atcctgcata ttcggtcagc cattcggcca ttgaccccac cctcccccac 2760
gactaggcgg gttggcttta tgtcgctaga agcgcagctg atggagcctc gggaagaacc 2820
ggcaaagccg gttttcggca ggcgctacaa ggcggagata ggatccgtct ccccgaccac 2880
gagccgcgat acgttcgagg atcacgacac ctgtttcctc ggagtgagcc tggagaacag 2940
caacttcaaa ccggccaagg tcgacgccat ggccaagtgg atctcccggc ggttctccca 3000
gtgcaccgtc ctcatcggtg acagcattca ccggatcacc ctggagtcca cccgctccat 3060
gccgccgcgg gcggccctcg acgacgccct gcggctcggc cgcgagttcg tcgagagccg 3120
gcaaccggtc ttcgagtcct tccgcgaccg gaccaagttc accttcgtga cctgctcgga 3180
ggtgcagagc tggggcctct acggcgacta ccacgagcgc ctgcggcagc actacgacca 3240
ggacgccgcc ttccgcggct cggtcgaggc gttcggccgc gactaccacg gcaaacgctc 3300
cgaaggcgtc agcgcccagg aactcgacca ccgcatcagg aaatcctccg agtactttct 3360
agaggaattc gccatcttcg cctgcctcca gcggaccggc agtcccgtca tggtgtatcc 3420
cggatcgttc agcactctct cggaaatagc tcagggaaaa cacccgggag cccccgaaga 3480
gctgcgcgac ctcatcgtgg tgtccctcca cctgaaaggg cgatgaccat gtcccgtgca 3540
cccggcaaca cggccgcacc cgaaatccgg cgcggccgga tctaccgcga cctctacgag 3600
aagcgcgcga gcgggcccgc ggtccagggc gacgcccacc tcgaacgcgc ccgtatccag 3660
ggcgaccgcc tggagttcgc cggctcccgg gcgcgggaaa ccgccctcgc cgacggcgtc 3720
ttcctcctgg agatacccgc ggacatcgac gtcgcggccg gcgatgcctt ctcccgccag 3780
ttccacctcg gcccggactc ccctccctac ggaaggttcc gcgacctcgg cagcgagcat 3840
ttcggggatc ccctgctggg cttccaccag cgggtgaacc agatcgaaca gttcctcctg 3900
gagcggcgct tctgggcgag cgactacccg cccgagatcg cccggctcgg cgagcagctg 3960
acccggttgt cgcagaaggt cctctgcgcg gtgctctccc acgtcggcgt ccccgagcgg 4020
gaccggcgac gcgccaccgg cggatgctcc cgggcggccg gctcgtacca cctgaccttc 4080
aaccactacc gccccgagca ccgggacgtc ggtctgagct cccacaagga cgacgggttc 4140
ctcacgatcc tgcgcacgac gaccccgggg ctggaggtca accgcaagga ccgctgggaa 4200
cgggtccccg tcgacccgga ctgcttcgtc atcaacttcg gtctgtcgat ggagattctc 4260
acggcgccca cgaaggcgcc cgtggccgcc atcatgcacc gcgtcgcccg gcagggaggc 4320
gaccgttcca gcttcgggca cttcagctcc agcggctgcg cccccggcat ggacgaaggc 4380
gtcttccgct acctccccgg cagtggactc gaccgcgtct gcggctcccg ggaactcatc 4440
gacgagaacg accacgagat ctacgccggc accgacgccc cgggggacaa gcgacgtgag 4500
cactgagacg ctgcgcctcc agaaggcgcg ggccaccgag gagggcctgg cgttcgagac 4560
gcccggcggc ctgacccggg ccctgcggga cggctgcttc ctcctcgccg taccgcccgg 4620
cttcgacacc acgcccggag tgaccctgtg ccgcgagttc ttccgcccgg tggagcaggg 4680
cggcgaaagc acgcgcgcct accggggctt ccgggacctg gacggcgtct acttcgaccg 4740
cgagcacttc cagaccgaac acgtcctcat cgacggaccg gggcgggagc gccacttccc 4800
gccggagctc cggcgcatgg ccgagcacat gcacgagctg gcccggcacg tgctgcgcac 4860
ggtcctgacc gagctggggg tggcccggga gctgtggagc gaggtcaccg gcggggccgt 4920
cgacggccgc ggcacggagt ggttcgccgc caaccactac cgctccgagc gcgaccggct 4980
cgggtgcgcg ccccacaagg acacgggctt cgtgaccgtc ctctacatcg aggagggggg 5040
actggaggcg gcgacgggcg gttcctggac gccggtcgat cccgtaccgg gctgcttcgt 5100
ggtcaacttc ggcggggcct tcgaactgct cacctccggc ctggaccgcc ccgtgcgggc 5160
cctgctgcac cgggtccggc agtgcgcgcc gcggccggag tccgccgacc gcttctcctt 5220
cgccgccttc gtcaacccac cgccgaccgg cgacctctac cgcgtcggtg ccgacggcac 5280
ggcgacggtg gcccggagca ccgaggactt cctgcgcgac ttcaacgagc ggacgtgggg 5340
cgacggctac gccgacttcg ggatcgcccc tccggagccg gccggcgtcg cggaagacgg 5400
ggtgagggca tgaccgcgcc cgcccacccg ccggcctgtc ccgtgtccgg gcgggccccc 5460
ttccccggcg tgctcgccca ccatccgggc ccgagcccgc tggacggcca cgagagcgcc 5520
ttccacgagg cgaccgtcgt ccgcgggaca ccggcctcgg agtacttccg cgcctcgggc 5580
atcagcgcgt gcgccgagga gaacggcggc ctctgcacgt tccgcatggg cccgcgcctg 5640
gccgtgtacc agatcaccaa cggccccctg ctggacgacg aggacctggc gccgtccacc 5700
gacgccaacc gggagctgtt cggcgacttc atgggctccc tgcccggcga ccacccggac 5760
cggccggcca aacgggcggc cgtggagacc accctgggca acggcaggtt cgtggaggag 5820
ctggtgccgc acgtgcggcg gcacgccgcc gcgttcctcg accgggcggc cgggcgggag 5880
gtccccctgg acgagttcgc cctgtccctg gtggcccagg tggacagcct cgtgcccggc 5940
gtgctggacc tcacgcagcg ccccctgccc gactggctgg cctcgccgga gtacggcgcg 6000
gtggtgcggg gcttcttcga cctcgcctcg gacgtgatca ccaacgtcaa ccccgcggcc 6060
atgcgggagt tcgacgtcat cgtccccttc gtccgcgaac tcctgcgggc caacgcggac 6120
gcgatcgcgg cggcccccgc gtccaacgtg atccggcgct acttcgccct gtgggacctg 6180
ccgttctccc gggagggcgt ggacgggctg gacgccgcac aggtcaagga actgggcacg 6240
gtgatcgtgg ccacgtacga cacgaccgcg ctcagcctgc tgtgggccct cgcctacatc 6300
gagacgacgc ccgccgcgaa gcgggagatc gtcgccgagg cgcgcggcgg gcagccgagc 6360
gcgtcgccct cgccgctgga cctggcggtc ctggaggccg tccggctggg cggcagcaac 6420
cccagcgcgc tctggcgccg gacgacacgg cccttcaccc tgcaccacga gggccgttcg 6480
gtcaccgttc ccccgggcac catgatgtgg ctggaccgcc gccaggcgaa ccgggacccg 6540
gccgtcttcc cgcaccccga gggtttcgac ccacgcaaca tccgggcgct gttccggtcc 6600
ggccgcgaga cggtctcgtc cctgatctcc cggggccggc acgagatcaa ctcgttcagc 6660
atggtgaacg ccacgcggaa cccgcgcaaa tgccccggcc ggctgttctc cgtgcgcgtg 6720
cagtcggtcc tcctggccga gctgtactcc cgctacgagg tcagcgcgcg aggcatcgac 6780
ctgagtctga agaggcacgc cgccatgccc cggcccgccc ggcccggcac tgtccttttc 6840
aacgccctgc ccgagcgcac gaaggagcag aactgatggc gtcacccgat tccgccaccc 6900
tccgggaacc ggtcgtcctg cctcccatgc ccggtgagca cgaggcgcgg gcggcgtatc 6960
cgccgatcgg gctggagcgc tcccgcgtca ccggtggccg gctcgtcttc gaccgcgacg 7020
agggcttcga ccgtgccctc gcgcaggggt tcttcctcgt acggatcccc gagggcacgg 7080
accccgccgc cggcgaccgc ttcgcggccc acttccacga ggagcgggcc ggcggggacc 7140
cgctggacgc ctaccgcggc taccgccacg tgcgcgtgcc cggcgactac cagggctact 7200
tcgaccgcga gcacgaccag tgggagaact tctacgtcga gagggacaac tgggacgtgc 7260
tgccatccga ggtcgcccgg gtgggccggg gcatggccgg tctcggggtc acgatcctgc 7320
gcggcgtcct ggagcacctg cggctgcccc gggagcactg ggcgcgcgtc acgggcgggc 7380
tcaccgagga ccgcggccac cagatgctcg ccttcaacca cttccggtcg cacaagggcg 7440
tgcgcggctc gaagttccac cgggactccg gctgggtgac ggtcctgcgg tccgtggacc 7500
cgggtctgct cgccctcgtc gacgggcgcc tgtgggccgt cgacccggag cccggccact 7560
tcatcgtcaa cttcggcagc tccctcgaag tgctgaccga acgcctcgac cgaccggtgc 7620
gggccaatgt gcacggcgtc gtctccacgg aacgggcgcc gggacaaccg gaccggacct 7680
cctacgtcac cttcctcgac tccgacctca ccggcaccgt ctaccggttc gagaacggca 7740
cgccccggcc cctccagtcg gtggccgagt tcgccggcca ggaagtcggc cggacctacg 7800
acgacagcgg tgcgctctga gccgttccga ggcggtgcac ccccccagag aaaggactgc 7860
gatgacgacg gtcgtcgaca acgaaggaca cctccacctc cccacggcgc gggtcacggc 7920
cggcagactg ctcttcgacg cggccgaggg ggcggaccag gccctcgcgc tgggcgcgtt 7980
ctgcctcgcg gttcccgagg acctcgacgt cgagccgggg ctgaggttct gccgcagctt 8040
ctacgaaccg gccgagccgg ggacggccga ccggtaccgg ggccaccgcg aggacgggca 8100
cgccgactcc aagctcggct acgaggaccg ccccgaccag gtcgagcagc tccagttgga 8160
gtcccacctg tggagccggt acctgcccga ggaggtcacc gccctcctgg agcggatgaa 8220
ggacctgacc ctggacgcgc tctacggcgt gttcgacgtg gcgggcatcc cggagcacga 8280
ccgcgagacc gtcaccggcg gcgcccgcca ggacaccggc ctgtgctaca ccacggtcaa 8340
ccactaccgc gcggacctga gcgaccgggc gggcatcgtc gagcactccg acagcgggtt 8400
catcaccctc atctgcaccg accagcccgg ctacgagatc ctccacgagg gccgctggcg 8460
gcccgtccgc gaggagcccg ggcacttcgt ggtgaacctg ggtgacgcgt tccgcgtcct 8520
gacgcggaag ctcccccggc cggtgaccgc cgtctaccac cgcgttcccg aactccggcc 8580
ggacggcgcc gcgcaccacc ggtcatcgtt cacgatctac atggggccgc ggtacgacat 8640
gatgctccac cagtacgccg cggacggcac cttgcacgag taccagggct tccgcgactt 8700
ctcggtggag aagtccaaga agctgggcta cgagttccac tcccgcatat gagcacggca 8760
cagggatacg gctggcagac ggccgcactg cgcggcggag agctggtctt cagcacgccg 8820
ggagggatcg agcaggccct cagggacggc ttcttccacg tcgaacaacc ggagggcctg 8880
gacctcacgg ccggggaccg cttcgcgcgc ggcttctacc tccccgggga accggactcc 8940
accgacccgt tccgcggctt ccagcactgg acctcggaac ggctcggccc ccgccagggc 9000
tactactgcc gcgacgacga ccagaccgag cagttcttcc tggagagcgc ccactgggac 9060
tccgtgtacc cgcaggcgct ggcgcggcag gcggaagcca tgcggtcact ggcactcgac 9120
gtcctcaggg ccgtgctcgc ccacctcgaa ctgcccccgg agctgtggga cgaggccacg 9180
ggccgctgcc tgtcggcacg gggcacctac aacctcacct tcaaccactt ccgtccggaa 9240
gtcccccggc gcggcctgaa cgtccacaag gactccggct gggtgaccgt gctgcggtcc 9300
accgaccccg gcctcgaagt cgagcgtgac ggcgcctggc accccatcga cccgaggccg 9360
ggcacgttca tcgtgaactt cggctgcgcc atcgagatcc tcacccgtga cacgagaact 9420
cccgtggcgg ccgtggcgca ccgcgtcgtg caacagcccc ggaccgacga gcggaaaccc 9480
gacaggttct cctacgcgct cttcgtcgac agcagcctgg acgaggacat ctgcccgggc 9540
ctcttccgct acgagccggg caccggtctc cgcctggaga cgaacttcgg cacgttcctc 9600
gacaccatcc tgcacaacac ctaccaaaag gacaccgccg gcctgtactg a 9651
<210> 16
<211> 30
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
gaattccata tgagcacggc acagggatac 30
<210> 17
<211> 33
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
aagctttcac tcgaggtaca ggccggcggt gtc 33
<210> 18
<211> 29
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
gaattccata tgcacccccc cagagaaag 29
<210> 19
<211> 33
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
aagctttcac tcgagtatgc gggagtggaa ctc 33
<210> 20
<211> 32
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
gaattccata tggcgtcacc cgattccgcc ac 32
<210> 21
<211> 37
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
aagctttcac tcgaggagcg caccgctgtc gtcgtag 37
<210> 22
<211> 46
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
gaattccata tgaccgcgcc cgcccacccg ccggcctgtc ccgtgc 46
<210> 23
<211> 37
<212> DNA
<213> 人工序列(artificial sequence)
<400> 23
aagctttcac tcgaggttct gctccttcgt gcgctcg 37
<210> 24
<211> 33
<212> DNA
<213> 人工序列(artificial sequence)
<400> 24
gaattccata tgagcactga gacgctgcgc ctc 33
<210> 25
<211> 33
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
aagctttcac tcgagtgccc tcaccccgtc ttc 33
<210> 26
<211> 30
<212> DNA
<213> 人工序列(artificial sequence)
<400> 26
gaattccata tgtcccgtgc acccggcaac 30
<210> 27
<211> 34
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
aagctttcac tcgaggtgct cacgtcgctt gtcc 34

Claims (10)

1.一种催化制备双环霉素(Biocyclomycin)的方法,其特征在于,包括步骤:
(i)在α-酮戊二酸依赖的双加氧酶BcmE和任选的辅酶存在的条件下,用式I化合物进行反应,得到式II化合物;
(ii)在α-酮戊二酸依赖的双加氧酶BcmC和任选的辅酶存在的条件下,用式II化合物反应,得到式III化合物;
(iii)在α-酮戊二酸依赖的双加氧酶BcmG和任选的辅酶存在的条件下,用式III化合物反应,得到式IV化合物;
(iv)在α-酮戊二酸依赖的双加氧酶BcmB和任选的辅酶存在的条件下,用式IV化合物反应,得到式V化合物;
(v)在辅酶和细胞色素P450单加氧酶BcmD存在的条件下,用式V化合物反应,得到式VI化合物;和
(vi)在α-酮戊二酸依赖的双加氧酶BcmF和任选的辅酶存在的条件下,用式VI化合物反应,形成双环霉素(Biocyclomycin):
2.如权利要求1所述的方法,其特征在于,所述的α-酮戊二酸依赖的双加氧酶BcmE、BcmC、BcmG、BcmB、BcmF和细胞色素P450单加氧酶BcmD来自于札幌链霉菌(Streptomycessapporonensis);
优选地,
所述的α-酮戊二酸依赖的双加氧酶BcmE的序列如SEQ ID NO:1所示;
所述的α-酮戊二酸依赖的双加氧酶BcmC的序列如SEQ ID NO:3所示;
所述的α-酮戊二酸依赖的双加氧酶BcmG的序列如SEQ ID NO:5所示;
所述的α-酮戊二酸依赖的双加氧酶BcmB的序列如SEQ ID NO:7所示;
所述的α-酮戊二酸依赖的双加氧酶BcmF的序列如SEQ ID NO:11所示;
所述的细胞色素P450单加氧酶BcmD的序列如SEQ ID NO:9所示。
3.如权利要求1所述的方法,其特征在于,所述的α-酮戊二酸依赖的双加氧酶BcmE、BcmC、BcmG、BcmB、BcmF和/或细胞色素P450单加氧酶BcmD为在大肠杆菌中表达的重组蛋白。
4.如权利要求1所述的方法,其特征在于,所述的步骤(i)、(ii)、(iii)、(iv)、(v)、(vi)各自独立地在具有选自下组的一个或多个特征的反应体系中进行反应:
(a)α-酮戊二酸依赖的双加氧酶BcmE、BcmC、BcmG、BcmB、BcmF和细胞色素P450单加氧酶BcmD的单酶浓度为0.001-100mM;
(b)反应体系的pH为6.0-9.0;
(c)反应温度为15-45摄氏度;和
(d)反应体系中,辅酶的浓度为0.01-100mM。
5.一种α-酮戊二酸依赖的双加氧酶BcmE的用途,其特征在于,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmE来自于札幌链霉菌(Streptomycessapporonensis),并且
所述α-酮戊二酸依赖的双加氧酶BcmE的序列如SEQ ID NO:1所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmE由SEQ ID NO:2所示的核苷酸序列编码。
6.一种α-酮戊二酸依赖的双加氧酶BcmC的用途,其特征在于,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmC来自于札幌链霉菌(Streptomycessapporonensis),并且所述α-酮戊二酸依赖的双加氧酶BcmC的序列如SEQ ID NO:3所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmC由SEQ ID NO:4所示的核苷酸序列编码。
7.一种α-酮戊二酸依赖的双加氧酶BcmG的用途,其特征在于,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmG来自于札幌链霉菌(Streptomycessapporonensis),并且所述α-酮戊二酸依赖的双加氧酶BcmG的序列如SEQ ID NO:5所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmG由SEQ ID NO:6所示的核苷酸序列编码。
8.一种α-酮戊二酸依赖的双加氧酶BcmB的用途,其特征在于,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmB来自于札幌链霉菌(Streptomycessapporonensis),并且所述α-酮戊二酸依赖的双加氧酶BcmB的序列如SEQ ID NO:7所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmB由SEQ ID NO:8所示的核苷酸序列编码。
9.一种细胞色素P450单加氧酶BcmD的用途,其特征在于,它用于催化下述氧化反应:
其中,所述细胞色素P450单加氧酶BcmD来自于札幌链霉菌(Streptomycessapporonensis),并且所述细胞色素P450单加氧酶BcmD的序列如SEQ ID NO:9所示;和/或
所述的细胞色素P450单加氧酶BcmD由SEQ ID NO:10所示的核苷酸序列编码。
10.一种α-酮戊二酸依赖的双加氧酶BcmF的用途,其特征在于,它用于催化下述氧化反应:
其中,所述α-酮戊二酸依赖的双加氧酶BcmF来自于札幌链霉菌(Streptomycessapporonensis),并且所述α-酮戊二酸依赖的双加氧酶BcmF的序列如SEQ ID NO:11所示;和/或
所述的α-酮戊二酸依赖的双加氧酶BcmF由SEQ ID NO:12所示的核苷酸序列编码。
CN201711184703.4A 2017-11-23 2017-11-23 双环霉素生物合成中氧化酶的功能及其应用 Active CN107881205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711184703.4A CN107881205B (zh) 2017-11-23 2017-11-23 双环霉素生物合成中氧化酶的功能及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711184703.4A CN107881205B (zh) 2017-11-23 2017-11-23 双环霉素生物合成中氧化酶的功能及其应用

Publications (2)

Publication Number Publication Date
CN107881205A true CN107881205A (zh) 2018-04-06
CN107881205B CN107881205B (zh) 2021-06-08

Family

ID=61774778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711184703.4A Active CN107881205B (zh) 2017-11-23 2017-11-23 双环霉素生物合成中氧化酶的功能及其应用

Country Status (1)

Country Link
CN (1) CN107881205B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115074337A (zh) * 2021-03-12 2022-09-20 上海交通大学 α-酮戊二酸依赖型双加氧酶在催化合成环内过氧桥键中的应用
CN116463362A (zh) * 2023-06-15 2023-07-21 中国中医科学院中药研究所 一种细胞分裂抑制剂的制备方法
CN117384931A (zh) * 2023-12-06 2024-01-12 中国中医科学院中药研究所 一种GSK-3β抑制剂的制备方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4994898A (zh) * 1973-01-27 1974-09-09
JPS52108092A (en) * 1976-03-09 1977-09-10 Fujisawa Pharmaceut Co Ltd Preparation of bicyclomycin
CN104911196A (zh) * 2014-03-13 2015-09-16 中国科学院上海有机化学研究所 三欣卡辛的生物合成基因簇及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4994898A (zh) * 1973-01-27 1974-09-09
JPS52108092A (en) * 1976-03-09 1977-09-10 Fujisawa Pharmaceut Co Ltd Preparation of bicyclomycin
CN104911196A (zh) * 2014-03-13 2015-09-16 中国科学院上海有机化学研究所 三欣卡辛的生物合成基因簇及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BRADLEY, EL等: "The biosynthesis of the Streptomyces antibiotic bicyclomycin", 《TETRAHEDRON LETTERS》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115074337A (zh) * 2021-03-12 2022-09-20 上海交通大学 α-酮戊二酸依赖型双加氧酶在催化合成环内过氧桥键中的应用
CN115074337B (zh) * 2021-03-12 2023-11-28 上海交通大学 α-酮戊二酸依赖型双加氧酶在催化合成环内过氧桥键中的应用
CN116463362A (zh) * 2023-06-15 2023-07-21 中国中医科学院中药研究所 一种细胞分裂抑制剂的制备方法
CN116463362B (zh) * 2023-06-15 2023-09-19 中国中医科学院中药研究所 一种细胞分裂抑制剂的制备方法
CN117384931A (zh) * 2023-12-06 2024-01-12 中国中医科学院中药研究所 一种GSK-3β抑制剂的制备方法
CN117384931B (zh) * 2023-12-06 2024-03-08 中国中医科学院中药研究所 一种GSK-3β抑制剂的制备方法

Also Published As

Publication number Publication date
CN107881205B (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN110257348B (zh) 一种单加氧酶突变体及其制备方法和应用
CN104212784B (zh) 重组腈水解酶、编码基因、突变体、工程菌及应用
CN109750009A (zh) 一种草铵膦脱氢酶突变体及其应用
CN109266630B (zh) 一种脂肪酶及其在制备布瓦西坦中间体中的应用
CN105274070A (zh) 7β-羟基类固醇脱氢酶突变子及其应用和合成方法
CN107881205A (zh) 双环霉素生物合成中氧化酶的功能及其应用
CN110396508B (zh) 源自Nocardia cyriacigeorgica的L-泛解酸内酯脱氢酶及应用
CN113373125A (zh) 黄酮-o-甲基转移酶及其在汉黄芩素、异汉黄芩素和苏荠苧黄酮合成中的应用
CN101275141B (zh) 阿嗪霉素的生物合成基因簇
CN113604445B (zh) 一种酪氨酸酶及其制备与应用
CN110396507B (zh) 源自Cnuibacter physcomitrellae的L-泛解酸内酯脱氢酶
JP2014140361A (ja) ケトース3−エピメラーゼ酵素
CN103215282B (zh) 越野他汀的生物合成基因簇及其应用
CN110358751B (zh) 一种重组脂肪酶突变体、编码基因、重组工程菌及应用
CN103695364B (zh) 通过弱化5‑氨基乙酰丙酸脱水酶活性获得5‑氨基乙酰丙酸高产菌株及其应用
CN101586112B (zh) 诺丝七肽的生物合成基因簇
CN111440734A (zh) 生产黄芩素类化合物的基因工程酵母菌、其构建方法及应用
CN108795955B (zh) 一种硝基还原酶基因cnrB及其编码的蛋白和应用
JP5103597B2 (ja) 耐熱性l−リボースイソメラーゼとその製造方法並びに用途
CN112760298B (zh) 一种细胞色素p450bm3氧化酶突变体及其制备方法和应用
CN102061299A (zh) 磷氮霉素的生物合成基因簇
CN105950595B (zh) (-)-γ-内酰胺酶、基因、突变体、载体及其制备与应用
KR100984480B1 (ko) β-글루코시다아제를 코딩하는 유전자를 포함하는 형질전환미생물 및 그를 이용한 인디고 염료의 생산 방법
CN107779464A (zh) 一种人源铜锌超氧化物歧化酶的制备方法
KR102026836B1 (ko) 토양 메타게놈 유래 신규 리파아제 유전자 Lip-1420 및 이의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant