CN106754986A

CN106754986A - 创新霉素生物合成基因簇及其应用

Info

Publication number: CN106754986A
Application number: CN201710146841.7A
Authority: CN
Inventors: 卞小莹; 张友明; 许晓坤
Original assignee: SUZHOU RESEARCH INSTITUTE SHANDONG UNIVERSITY; Shandong University
Current assignee: SUZHOU RESEARCH INSTITUTE SHANDONG UNIVERSITY; Shandong University
Priority date: 2017-03-13
Filing date: 2017-03-13
Publication date: 2017-05-31
Anticipated expiration: 2037-03-13
Also published as: CN106754986B

Abstract

本发明公开了一种创新霉素的生物合成基因簇，该基因簇的核苷酸序列如SEQ ID No.1所示，命名为cxm；其包含编码创新霉素生物合成所涉及的10个基因，其中7个是与生物合成相关基因，1个是调控基因，1个抗性基因，1个是转运基因，所述基因的核苷酸序列如SEQ ID No.2～SEQ ID No.11所示。所述基因功能通过异源表达结合基因同框删除试验验证。本发明还公开了所述基因簇或其表达的编码蛋白在催化合成创新霉素或其类似物中的应用，实现了创新霉素的生物合成。本发明所提供的基因及其蛋白也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。

Description

创新霉素生物合成基因簇及其应用

技术领域

本发明属于微生物基因资源和基因工程领域，具体地，涉及一种创新霉素生物合成基因簇、包含其的载体、宿主及其应用。

背景技术

创新霉素(chuangxinmycin，CXM)与色氨酸(tryptophan)有结构上的相似性(见式(I))，是一种高效的细菌色氨酰tRNA合成酶(TrpRS)的选择性抑制剂。

比如创新霉素对大肠杆菌的TrpRS的IC50为30nM，但是其在30μM浓度下对绵羊的TrpRS没有抑制作用，显示了创新霉素是一种特异性的抑制剂(Brown et al,2002)。最近的研究表明色氨酰tRNA合成酶抑制剂(吲哚霉素和创新霉素)能够扰乱与氯霉素、红霉素和万古霉素抗性相关的富含色氨酸的蛋白的生物合成，从而减弱细菌对氯霉素、红霉素和万古霉素的抗性，因此色氨酰tRNA合成酶抑制剂与另外的抗生素联用可以降低细菌的多重抗药性。创新霉素是中国发现的第一个全新结构的新抗生素，由济南游动放线菌(Actinoplanestsinanensis)产生，其分子的主核为罕见的吲哚并噻喃三环结构，这在化学上是一个新的含硫的杂环体系。最初报道该抗生素对金黄色葡萄球菌、大肠杆菌和痢疾志贺菌有较强的抗菌活性，并对感染了痢疾志贺菌和大肠杆菌的小鼠模型显示出体内抗菌活性。初步临床试验表明它对于大肠杆菌引起的败血症、胆囊炎和尿路感染有显著的疗效(有效率达77.86％)。体外和体内的联合抗菌实验表明，创新霉素与庆大霉素、新霉素、巴龙霉素、卡那霉素B、多黏霉素、氨苄青霉素、青霉素和头孢菌素I等8种抗生素有不同程度的协同作用，提高创新霉素抗菌作用4～32倍，有可能提高临床疗效，防止或延缓耐药性的产生。但是由于其发酵单位太低导致生产成本高，抗菌谱较窄，仅能口服，且抗菌活性低于目前临床上其他抗菌药物，致使其仍未广泛用于临床。

关于创新霉素的生物合成机理及其相关重要的酶学研究还没有得到验证。从化学结构上来说，创新霉素属于吲哚类生物碱，很有可能是利用色氨酸作为起始单元进行生物合成的，但是它的具体的生物合成途径依然未知。我国学者曾对创新霉素的生物合成进行了初步的研究，利用同位素标记的方法发现创新霉素分子中噻喃环的硫直接来自半胱氨酸的巯基，应用标记甲基供体S-腺苷-L-[甲基-¹⁴C]甲硫氨酸(SAM)测定创新霉素产生菌无细胞提取物对吲哚丙酮酸的甲基化作用，发现创新霉素产生菌中存在吲哚丙酮酸碳甲基转移酶(indolepyruvate C-methyltransferase)可能负责C-2的甲基化，其分子量是55000±5000道尔顿。经对现有技术的文献检索，尚未发现有关创新霉素生物合成基因簇、包含其的载体及宿主和利用基因表达编码蛋白用于催化合成抗生素创新霉素或其类似物应用的报道。

发明内容

针对现有技术的不足，本发明的目的是提供一种创新霉素的生物合成基因簇、包含其的载体、宿主及其应用。利用本发明的基因簇可实施发酵生产创新霉素，实现创新霉素的生物合成。

本发明所述的创新霉素的生物合成基因簇，其特征在于，该基因簇的核苷酸序列如SEQ ID No.1所示，命名为cxm；其包含编码创新霉素生物合成所涉及的10个基因，其中7个是与生物合成相关基因，1个是调控基因，1个抗性基因，1个是转运基因，所述基因的核苷酸序列如SEQ ID No.2～SEQ ID No.11所示，具体是：

(1)抗性蛋白基因，该基因的核苷酸序列如SEQ ID No.2所示，命名为cxm0，其位于基因簇核苷酸序列第1-966个碱基处，长度为966个碱基对，编码一个色氨酰tRNA合成酶，321个氨基酸，序列如SEQ ID No.12所示；

(2)转录调控蛋白基因，该基因的核苷酸序列如SEQ ID No.3所示，命名为Cxm1，其位于基因簇核苷酸序列第1177-2199个碱基处，长度为1023个碱基对，编码一个LysR家族转录调控蛋白，340个氨基酸，序列如SEQ ID No.13所示；

(3)转运蛋白基因，该基因的核苷酸序列如SEQ ID No.4所示，命名为Cxm2，其位于基因簇核苷酸序列第2415-3905个碱基处，长度为1491个碱基对，编码一个转运蛋白，496个氨基酸，序列如SEQ ID No.14所示；

(4)巯基转运蛋白(sulfur carrier protein)激活蛋白基因，该基因的核苷酸序列如SEQ ID No.5所示，命名为cxm3，其位于基因簇核苷酸序列第3974-4690个碱基处，长度为717个碱基对，编码一个功能未知蛋白，238个氨基酸，序列如SEQ ID No.15所示；

(5)巯基转运蛋白(sulfur carrier protein)基因，该基因的核苷酸序列如SEQID No.6所示，命名为cxm4，其位于基因簇核苷酸序列第4694-4996个碱基处，长度为303个碱基对，编码一个巯基转运蛋白，100个氨基酸，序列如SEQ ID No.16所示；

(6)细胞色素P450酶基因，该基因的核苷酸序列如SEQ ID No.7所示，命名为cxm5，其位于基因簇核苷酸序列第4993-6207个碱基处，长度为1215个碱基对，编码一个细胞色素P450酶，404个氨基酸，序列如SEQ ID No.17所示；

(7)酮泛解酸还原酶基因，该基因的核苷酸序列如SEQ ID No.8所示，命名为cxm6，其位于基因簇核苷酸序列第6204-7160个碱基处，长度为957个碱基对，编码一个细胞色素P450酶，318个氨基酸，序列如SEQ ID No.18所示；

(8)5-磷酸吡哆醛(PLP)依赖型氨基转移酶基因，该基因的核苷酸序列如SEQIDNo.9所示，命名为cxm7，其位于基因簇核苷酸序列第7157-8245个碱基处，长度为1089个碱基对，编码一个PLP依赖型氨基转移酶，362个氨基酸，如SEQ ID No.19所示；

(9)自由基S-腺苷甲硫氨酸甲基转移酶基因，该基因的核苷酸序列如SEQ IDNo.10所示，命名为cxm8，其位于基因簇核苷酸序列第8318-10189个碱基处，长度为1872个碱基对，编码一个自由基S-腺苷甲硫氨酸甲基转移酶，623个氨基酸，序列如SEQ ID No.20所示；

(10)自由基S-腺苷甲硫氨酸蛋白基因，该基因的核苷酸序列如SEQ ID No.11所示，命名为cxm9，其位于基因簇核苷酸序列第10186-10917个碱基处，长度为732个碱基对，编码一个自由基S-腺苷甲硫氨酸蛋白，243个氨基酸，序列如SEQ ID No.21所示。

本发明所述创新霉素的生物合成基因簇核苷酸序列cxm的互补序列可根据DNA碱基互补原则随时得到。序列SEQ ID No.1的核苷酸序列或者部分核苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶酶切相应的DNA或使用Red/ET同源重组技术的线性重组LLHR得到。

本发明所述创新霉素的生物合成基因簇表达的编码蛋白。

其中，所述编码蛋白的氨基酸序列分别如SEQ ID No.12～SEQ ID No.21所示。

本发明所述创新霉素的生物合成基因簇或其表达的编码蛋白在催化合成创新霉素或其类似物中的应用。

创新霉素生物合成基因簇的直接克隆、异源表达和遗传操作证实，利用本发明所述创新霉素的生物合成基因簇通过生物技术表达编码蛋白(氨基酸序列如SEQ ID No.12～SEQ ID No.21所示)可用于催化合成抗生素创新霉素或其类似物、或者催化合成含噻喃或者吲哚并噻喃三环结构单元的化合物。

创新霉素为色氨酸结构类似物，根据基因单敲除实验推测其生物合成是以色氨酸起始，经氨基转移酶Cxm7的脱氨基作用，形成吲哚丙酮酸，吲哚丙酮酸在硫载体蛋白Cxm4及硫载体蛋白激活蛋白的共同催化加上硫原子形成不稳定的吲哚硫碳酸化合物，之后在细胞色素P450Cxm5和还原酶Cxm6的共同催化下含硫六元环闭合形成去甲基创新霉素，去甲基创新霉素在甲基转移酶Cxm8及其蛋白Cxm9的催化下加上甲基，形成创新霉素。

本发明所述的一种重组载体，其特征在于，该重组载体包含本发明所述的创新霉素生物合成基因簇。而且该载体中的创新霉素生物合成基因被中断、被置换或同框缺失，至少其中之一的基因包含有序列SEQ ID No.1中的核苷酸序列。

其中，上述重组载体优选是p15A-cm-apra-cxm。

本发明所述的一种宿主，其特征在于，该宿主包含上述的重组载体。

其中，所述宿主优选为链霉菌、假单胞菌、伯克氏菌、大肠杆菌、芽孢杆菌、酵母、植物或动物。最优选为天蓝色链霉菌A3(2)、白色链霉菌J1074或变铅青链霉菌K4-114。

与现有技术相比，本发明具有如下的有益效果：

利用本发明的基因簇可发酵生产创新霉素，实现创新霉素的生物合成；同时，本发明所提供的包含创新霉素生物合成相关的所有基因和蛋白信息有助于阐明与理解创新霉素类抗生素的生物合成的分子机理，为利用基因工程手段改造提供理论基础与材料。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。

附图说明

图1为创新霉素生物合成基因簇的基因组成。

其中：Resistance：抗性基因；Regulator:调控基因：Transporter:转运基因；Biosynthesis：合成基因。

图2为带有创新霉素生物合成基因簇的重组载体。

其中：Apra：安普霉素抗性基因；Cm：氯霉素抗性基因；Int：位点特异性重组酶integrase；P15A：P15A复制子。

图3为创新霉素生物合成基因簇的异源表达及与创新霉素生物合成相关的10个基因的同框缺失突变分析。

其中：CXM：创新霉素；Dem-CXM：去甲基创新霉素；A3(2)：天蓝色链霉菌A3(2)；J1074：白色链霉菌J1074；K4-114：变铅青链霉菌K4-114；A3(2)/cxm：重组有cxm基因簇的天蓝色链霉菌A3(2)；J1074/cxm：重组有cxm基因簇的白色链霉菌J1074；K4-114/cxm：重组有cxm基因簇的天变铅青链霉菌K4-114；

A3(2)/cxm△cxm0：为将cxm中的cxm0同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm1：为将cxm中的cxm1同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm2：为将cxm中的cxm2同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm3：为将cxm中的cxm3同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm4：为将cxm中的cxm4同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm5：为将cxm中的cxm5同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm6：为将cxm中的cxm6同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm7：为将cxm中的cxm7同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm8：为将cxm中的cxm8同框敲除后，转至天蓝色链霉菌A3(2)中；

A3(2)/cxm△cxm9：为将cxm中的cxm9同框敲除后，转至天蓝色链霉菌A3(2)中。

具体实施方式

下面结合附图和实施例对本发明保护内容作进一步阐述。实施例中所描述的内容仅用于解释和说明本发明，而不应当也不会限制本发明权利要求所界定的保护范围。

一般性说明：如下实施例所涉及的限制性内切酶均购自NEB公司，DNA聚合酶、T4连接酶均购自Takara公司，质粒提取试剂盒和琼脂糖凝胶回收DNA片段试剂盒购自Qiangen公司，操作完全按照相应说明书进行。质粒构建中基因测序及引物合成由上海生工公司完成。质粒p15A-cm-ccdB见文献(Wang H,et al.Improved seamless mutagenesis byrecombineering using ccdB for counterselection.Nucleic Acids Research,2014,42(5):e37)、菌株GB05，GB05dir，GB05Red见文献(Fu J.et al.Full-length RecE enhanceslinear-linear homologous recombination and facilitates direct cloning forbioprospecting.Nature Biotechnolgy,2012,30:440-446)，天蓝色链霉菌A3(2)见文献(Bentley SD,et al.Complete genome sequence of the model actinomyceteStreptomyces coelicolor A3(2).Nature,2002,417:141-147)、白色链霉菌J1074见文献(Zaburannyi N,et al.Insights into naturally minimised Streptomyces albusJ1074genome.BMC Genomics,2014,15:97)，变铅青链霉菌K4-114见文献(Ziermann R,etal.Recombinant Polyketide Synthesis in Streptomyces:Engineering of ImprovedHost Strains.BioTechniques,1999,26:106-110)。上述菌株均为科研实验常用宿主，均可通过公开的保藏机构购买或实验室分享等方式获得。济南游动放线菌购于中国医药集团总公司四川抗菌素工业研究所(CPCC240351)。实施例中的其他实验方法及试剂如无特殊说明，均为本领域常规方法与市售试剂。

实施例1：创新霉素产生菌济南游动放线菌基因组DNA的提取及测序

将济南游动放线菌菌株从-80℃接种至高氏固体平板中，30℃培养4天，刮取菌体接种至168G(葡萄糖22g，牛肉膏4g，蛋白胨5g，酵母提取物0.5g，酪胨3g，食盐1.5g，加水900mL高温灭菌，甘氨酸10g加入100mL水单独灭菌，使用时向培养基中添加十分之一体积的10％甘氨酸)培养基中50mL/250mL三角瓶，30℃，150rpm培养4天，菌体成乳白色小团状，分装1.8mL至2mL离心管中，13000rpm离心5分钟，倒掉上清后用1.6mL的水洗涤，13000rpm离心5分钟倒掉上清，用450μL pH8.0的10mM Tris-HCl重悬菌体，加入30μL 20mg/mL的蛋白酶K，混匀，加入40μL 10％SDS，旋转混匀，40℃水浴2小时，管内液体变为透明，加入500μL酚氯仿异戊醇(25:24:1)，将离心管旋转30次混匀，液体完全变为白色，14600rpm离心10分钟，用剪过的枪尖吸取上清，不要吸到白色层，转移至另一新的2mL离心管，加入500μL酚氯仿异戊醇(25:24:1)，将离心管旋转30次混匀，液体完全变为白色，14600rpm离心10分钟，用剪过的枪尖吸取上清300μL，不要吸到白色层，转移至另一新的2mL离心管，加入30μL pH7.5的3M醋酸钠，混匀后加入900μL的无水乙醇，混匀，有大团的DNA出现，将其钩出置于新的离心管，加1.8mL70％乙醇洗涤，10000rpm离心1分钟，加入200μl水溶解，加RNaseA使终浓度为10μg/mL，37℃温育1小时。依次用等体积的酚氯仿异戊醇抽提两次，向水相中加入0.1体积的3M醋酸，2体积的无水乙醇,轻轻的混合充分,有絮状DNA出现。将四管DNA合并到1管(每管中有1.8mL70％乙醇用于洗涤),将液体吸出，再加1mL无水乙醇洗涤，吸出乙醇,自然晾干，溶于200μL的水中。

基因组提取后构建10kb SMRTbell DNA文库，使用PacBio RS II单分子测序，获得50X的数据量，开发适用于细菌基因组分析的软件，原始数据经过预处理去除接头、引物及低质量数据后，对细菌基因组进行de novo组装和分析，基因功能注释采用BLAST软件与NCBI的蛋白质数据库(NR)及SwissProt、KEGG、GO等4个数据库进行比对。利用生物信息学工具antiSAMSH菌株中所有的次级代谢产物合成基因簇进行分析。

济南游动放线菌的基因组大小为8,397,261bp，GC含量为70.81％，其中包含7,673个基因，基因总长度为7,170,756，基因平均长度为935bp，共预测得到19个基因簇，其中PKS/NRPS类型基因簇有6个，细菌素基因簇3个。

通过抗性基因cxm0(核苷酸序列如SEQ ID No.2所示)寻找创新霉素的生物合成基因簇。

由于创新霉素的结构与色氨酸类似，推断其是由色氨酸作为底物合成，可能与创新霉素的结构类似物吲哚霉素的基因簇一样，基因簇内部包含tryptophanyl-tRNAsynthetase，通过对基因组进行搜索，发现2个tryptophanyl-tRNA synthetase的编码基因，其中第二个编码基因cxm0与吲哚霉素生物合成的抗性基因蛋白Ind0高度同源，相似度达74.4％，它位于一个基因簇中，这个基因簇包括10个基因，1个抗性基因cxm0(核苷酸序列如SEQ ID No.2所示)，1个转录调节蛋白cxm1(核苷酸序列如SEQ ID No.3所示)，1个转运蛋白cxm2(核苷酸序列如SEQ ID No.4所示)，7个结构基因，分别为cxm3可能为SCP(硫载体蛋白)激活蛋白基因(核苷酸序列如SEQ ID No.5所示)，cxm4为SCP(硫载体蛋白)基因(核苷酸序列如SEQ ID No.6所示)，cxm5为P450(核苷酸序列如SEQ ID No.7所示)，cxm6为还原酶(核苷酸序列如SEQ ID No.8所示)，cxm7氨基转移酶(核苷酸序列如SEQ ID No.9所示)，cxm8为自由基S-腺苷甲硫氨酸甲基转移酶(核苷酸序列如SEQ ID No.10所示)，cxm9可能为蛋白基因(核苷酸序列如SEQ ID No.11所示)，综上推断cxm0～9这一11Kb的序列为创新霉素的生物合成基因簇。(见图1)

实施例2：创新霉素生物合成基因簇的直接克隆

济南游动放线菌提取基因组DNA后，取200μl，约300μg/μl，用EcoRV和AscⅠ进行双酶切，400μl酶切体系，37℃温育3小时后，酚氯仿抽提DNA一次，然后乙醇沉淀回收，用少量ddH₂O溶解。线性克隆载体p15A-cm-HA，HA为创新霉素基因簇的同源臂，用质粒p15A-cm-tetR-ccdB-hgy扩增获得。5μg的基因组DNA与0.5μg的线性克隆载体共同电转至经过诱导重组酶表达的GB05dir中，37℃复苏1小时，涂布至含有cm的LB平板，37℃过夜培养，挑取克隆用含有cm的LB培养过夜，提取质粒后酶切鉴定，含有cxm基因簇的重组质粒p15A-cm-cxm进行酶切鉴定，挑取正确的克隆对整个基因簇进行测序，结果显示11Kb的基因序列无突变。

实施例3：创新霉素生物合成基因簇的异源表达

以pSET152为模板，扩增携带同源臂的intgrase-attP-oriT-apra，得到的PCR产物与基因簇直接克隆后的质粒p15A-cm-cxm共同转化至经过诱导表达重组酶的菌株GB05red中进行线环重组，挑取克隆酶切鉴定，得到整合有创新霉素基因簇的结合转移质粒p15A-cm-apra-cxm，将此质粒电转至结合转移供体菌ET12567/pUZ8002，质粒p15A-cm-apra-cxm通过结合转移移至天蓝色链霉菌A3(2)中并整合到其染色体的attB位点，37℃培养17h-18h后用l ml无菌水含适量抗生素和萘啶酮酸(用来抑制大肠杆菌的生长)来覆盖，倒置30℃培养7天后即可看到接合子生长，挑取克隆PCR验证，将正确的克隆接种至添加安普霉素(50μg/mL)和萘啶酮酸(25μg/mL)的M1(可溶性淀粉10g/L，酵母浸粉4g/L，蛋白胨2g/L)液体培养基进行发酵，50mL/250mL，200rpm，30℃培养7天。

创新霉素的分离纯化

用6M HCl将发酵液pH调至2～3，用等体积的乙酸乙酯萃取发酵液萃取三次，合并乙酸乙酯，减压蒸干，用1mL甲醇溶解，0.22μm膜过滤，-80℃保存。

创新霉素的分析

色谱-质谱联用(LC/MS)检测发酵产物使用的是布鲁克公司的impactHDmicroTOF-Q III系统。

LC条件：色谱柱为YMC-PACK ODS-A(C18,250×4.6mm,5μm,12nm)，流动相为(水：A；Merck HPLC级乙睛：B，分别添加0.1％甲酸，(0-5min 5％B，5-45min 5％-95％，45-60min95％B，60-65min 5％B))流速为0.75ml/min，检测器DAD，柱温为25℃，质谱检测是在离子阱的负离子模式下进行，扫描范围m/z＝100-1000，autoMS2，进样量3μL。

实施例4：与创新霉素生物合成相关的10个基因的同框缺失

以两侧携带PacI酶切位点的amp抗性基因为打靶载体，分别设计10对含有对应同源臂的引物，扩增后得到含有amp抗性基因、PacⅠ酶切位点及同源臂的PCR产物，与质粒p15A-cm-apra-cxm共同电转化至经过诱导表达重组酶的GB05red中，37℃复苏1小时，涂布至含有amp和apra的LB平板，37℃过夜培养，挑取克隆培养后酶切鉴定，选取正确的克隆培养后提取质粒，用PacⅠ酶切，将酶切体系用0.22μm滤膜除盐40min，用T4连接酶自身连接，4℃过夜，将T4连接体系用0.22μm滤膜除盐40min，全部涂布至含有apra的LB平板，37℃过夜培养，长出的克隆经过双划线筛选后得到除去amp抗性基因的克隆，酶切鉴定并测序，得到基因单敲除的质粒，通过结合转移转至天蓝色链霉菌A3(2)中，PCR鉴定，用M1培养基进行发酵，提取粗产物，进行LC-MS分析。

结果见图3。

序列表

<110>山东大学苏州研究院山东大学

<120>创新霉素生物合成基因簇及其应用

<141> 2017-02-16

<160> 21

<210> 1

<211> 10917

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>创新霉素的生物合成基因簇cxm

<222>（1）…（10917）

<400> 1

ctacttcaga ccggcaaggc tgagcgcacg atccaagcgg tctcgtgacc gcgcccgagc 60

acggtcggcc ccctcagccc ggatcttcgc cagctccgat cgctcttcga ggagctgcag 120

tgcccgctca cgcaccggtg cgatcaggga gatcactgcc tctgcggctg cttccttgag 180

gtcacggtag gaatcgatac ccttcgccgc atcgctcggg agcgtgtcag tgcaggcagc 240

cctgatctcc aggaggttgg caacgcccgg ctgttcgtcc ggggcgtagc ggacggtgtt 300

ttctccgtct gtcactgcgc gttggaactt ccggcgtacg gcctccgggc tgtccaggac 360

gtagacgatg ccgctgccgt ccgaggacga cttcgacatc ttccgcgtag gggcagcgag 420

atcacgtacc cgggctgcgg ctacgggcag gacggcttgc ggaaccgtga acacctcgcc 480

gtagtccgtg ttgaaccgcc gcgccaaggt ccgggccagc tccacatgct ggttctgatc 540

gtgaccgacg ggcacctctg aagcgccatg aagcaggatg tccgccgcca tgaggacggg 600

gtaggtgagc agaccaaggc gtacggagtt gctcccctgg gacttctcct tgaactgcac 660

catccttcga gcctccccga aggtgcaggt gcactcgaga agccacgtca acgccatgtg 720

ctcctggatg aggtccgact gcacgaagag acgttcctgg ggtacgcccg ccgcgatgag 780

taaagcgagt tggtggtcgg tcagttcctg gagacgttcg gggtcgtgct tggtcgtcat 840

ggcgtgcagg ttgctgacga aatacaggtc ttcggggccc gactgtgctg cccaacgacg 900

cactgcccca aggtagttac ccaggtgcgc cttacctgaa ggcgtgatcc cggaaagact 960

gaacattggc cctgatcctc tcgtcttgac cgcatcgacg aggcgggccg accaagttca 1020

gcagcccgtc cctcggagcg gctggctggc tcggtcgagc gcaggttctt gggccgccct 1080

aggcggccca ccaacaaaga ttcctgcgca acatgatcgc gaacgtacca caactggcag 1140

gggccatcag gaagttcctg acagcccctg ctctcatcag gccggagcgg ttccggttgg 1200

tcgaggttct ccgaagagcg tcctgacggc tggatcctgg gctgcggcct gagcgcacct 1260

gacggcgagg cgtaccagtt cggagtcgga accctcacgc caggcaaggg acaaccgggc 1320

ggcaggcaca tccgtcacag ggatgaagac gacgtcctga cggtgctgga ctgccatgac 1380

agagacgggg acgagcgcgg ctgcgttctc gagggccacg aggtcgatgg cctcgtcgag 1440

gcgcgtcgct gtgggaggtt ccttccaggt gcgcttgccg gggcacacct caccacccca 1500

gaagtcggac cactcgggcg acccgccggt ggggcgaatg atcggaacct cgctcaggtc 1560

gtcgatcgac acggagtcac gactggccag ctcgtgagcc gatggcagac agacgacccg 1620

gggtaacagg gccacggtgg ccctctcgag gcccacgtag tccgcgggct ccagcacgaa 1680

ggacacgtca gcgtcccctg cctccaggca tgctgtctgt tcggtccacg gtacgtaccg 1740

gggcactacc tgatactcag ggtgcttttc gcggatgagt tcaatggtcc ggtgtgccag 1800

agggcggctg acggccgggc ggaacgcgac gacgagccgt tcgacatcct gcgaccccgc 1860

ctgccgcatc ctctcgaccg tgacctgcca ctgctgcaac aagttcctcg cgtgagtcag 1920

gaagtcgcgc ccgaccgacg tgagttcgac tctgttgccc gttctgtcca aaagctggag 1980

acccagctct ctttcgagtt gacgaatcgc cacgctcaac ggcggctgtg tcatgtgcag 2040

gcgggccgcg gctcgcgtga acccgccttc ctcggctacg gcaacgaagt acctgaggtg 2100

ccgcaaatcc agttccatat gatcagtata tggccccata cgcaacgggt attggcgtgt 2160

atgtaggcgg ctacatacga tcacccatgc aaggtgcagc tatcgaatct cagccttgac 2220

tgcggggcct gtggaaaatt ccaccggagg tcttcttgtc tttgccgtac gaagtcgctt 2280

tcagcgggtg tatcgcccca aacacaattg acggattctt tgcgcaggca gtgtttaagc 2340

ctcagtgatg tggctccggc cagtggtctc gtgactcagt aaccgccccg accacatccc 2400

cacgggggtc ccccttgtcc tacaacggca cttcgccacg tccaccgtcg atcagcgcga 2460

cgatgacgct gatcgccacc ggcgtctccg tgctgtcgta cgcactcatg cagaccatgg 2520

tcgtcccggc cttgcacgta ctacaggtgc agttacacac ggcctcgacg tggtcggcgt 2580

ggatcctgag tgtgttcctg ctgaccagtg cggcgagcac gcccttgctg agccggctgg 2640

gggaccgcta cagcaagcgc aaagttttgc tgctggttct caccacctac ctgatcggca 2700

cggtcggttg tgctgtggca ggcaatatcg gggttctgat cgcatgccgt gccgtgcagg 2760

gagtcagcct cgcggccatc cccctgtcct tcggcatcct gcgcgacgta cttcctgagc 2820

agcggctgcg ttcgggcctc gggctggtgt cagggaccat cggtgtgggg gccggcatcg 2880

gcctggtcgt gggaggtctg gtcgtcgacc accagtcatg gcgctggctg ttcgccgtcg 2940

ccgcggtact gatcctgggc gcgatcgggc tcgttgcgaa gtacgttccg gaccagcggg 3000

gcgaagccgg cgaaccggtg gacgtgcccg gggcggtgct cctggccttg gtcctcgtcg 3060

cgctgttgct cgcgttgacc aagggcacct catgggggtg ggcgtccaca ggaacgctgg 3120

ctctgttcgg ggcctccgcg gttctcctgg gattgctggt cgtagtcgaa cgaaagtcgc 3180

ccgccccctt gatcgacccc gcggtcgtgg ccggtcgctc cttcgtctcg gtgcacggtg 3240

cggcgttcgt gttcggcgtg gtctcgttcg tgttctacgt cctgctgccg acgtacgccc 3300

agaccgcggc ggatcagcgg ctaccgggcg gagggaccat cggctacggg ctcggggccg 3360

atgtcaccat ggcgggtctg ctccttctgc ccggctcatt ggtgctgttg cctgcgggac 3420

cactagcagg tctgctgcag cgcctgacgt ccgtacgcgc gacgctcgca tcaggcttcg 3480

ccgtgatggc ggtcggggcg atctcgctct gggcgtggaa tgccaacggg tggcaagtgg 3540

cggtcggtta cctggtcgta ggtctcggtt ccggactggt gctgagcgga ctcccgtcgg 3600

tgatcagcga cttgacggag gcccgacgca ccgcaaccgc caatggcgtc aacacggtgg 3660

tgcgcacggc aggcggcgtc gtaggcagtc agctggctgt cgccttgctg gctgcctggc 3720

atatctccgg ttccgatacg ccggcgcgcg acggcttcac caccgccttc tggatcgctg 3780

ccgccgtagc ggcggccgga gggctgttgt gctgggtcgg catcaagacc tccacgctcc 3840

gcggccctcg tatgccaggg gtgactgacc tgcctcgcca gagcgcaggg ggcgtacgcc 3900

catgaacgct ccgcaattcc accgactgcc cagggcctaa ggatttcacc aggaaatctc 3960

agggagggtg taaatggcag gcgtgaaaga tgcccagtat gtgacagctg ctacggatga 4020

cggtctgggt ggcacagcag acagtgcagc cctgctcgac gatctgccgg tgaccgtccg 4080

atttgaaatc gaacccgtca ggcgtttcct gagcagcgca ctgggggagt accaaaaatg 4140

cctggacagc cgcgacgccg atggcgtccc gagccatctg ccgcgtgcat cgggtctgtt 4200

gttcgggcag gtgggcggcg ctgaaatagt gatcagcgat gtggaattcg tgccgaatgt 4260

ccgggacagt gacgagagtg tcatggccga attcgaagcg acgatcgccc cgcagttcgg 4320

cgacgtgtac aagaatccgg ggcgaggatt ctggtccgat gaacagggcg tcttgcaggc 4380

gatcaggcaa cagtcggcga acggcctgga gttgctgggc tccatacatt cacatccgaa 4440

ctggcatgaa atcggcccgc cgcacgaacg gcgccagcgc ctgagcgaac atccgacaca 4500

gatggatgaa taccttttcc ggcagtcatg ctggccagtg aacgtcatct ggtacgtgca 4560

tgagagtagt ggcggtatcg cacatcgggt agcggcctgg cggcccggtg ccgagcaatg 4620

cgacaggctt gacatacgga ttccggcggc gatccatgag cagttcgaag tcctactcga 4680

ggaggaataa gaaatgcccg atgtcaaact tcccgcagcc ttccacgtcc tgaccggcgg 4740

tcggcggcag ttgcctgtcg agggcgccaa tatccgggag gtccttgtcg gtctcgacca 4800

gacctgtccg ggggtcctcg agcgactcat ggaccaggaa gggtccgtga agcgctacgt 4860

caatgtctac cggaacgaca gcgacatcag gagcctcgac ggcctcgaaa cgaaagtgga 4920

gcaccacgac gtcatctgga tagtgccggc ggtagcaggt ggcagcgaag ccgcgcgagc 4980

cgaggagtca cgatgaccga cgtgattccc acggaattct tcaccgagcc cggttcgaat 5040

ccgcacgcga cagccgcgga gtacaggtcc aagtgtccgg tccatcggat caatgttccc 5100

cccggcgccg acgcgtacgc ggtcctcggg aacaaagtcg ttgaggaagc gctcggcgac 5160

tcgcgcctct ccaagcaagt cgagaacctg cccgcccgct atcgagacaa ggccgtggcc 5220

agcagtctcc tcgtggtcgg caacctggga ttcgccgacg cgcccaaaca cacccgcctg 5280

aagaagccca tcagccgggc attcctgccg gccacggtcg cccaactacg cccgcgcatc 5340

caggacatcg tcgacgatct catcgacacc tttccggaga acggcgaaat cgacctgctc 5400

agttccttcg ctctgccgat gccgctcacc gtcatctgcg aatacctggg gataccggtg 5460

gcggaccggc cgctgtttct ggagtggagc tacatcctca gccaggaccc gttgcagcac 5520

gacgaggcgg agctgaaagc cgcgagcgaa gagttcacgg actatttcac caagctcgtg 5580

gccgagcggc gcacggacct gcgggacgac ctgctgagcg agatcatcag ggccagggac 5640

gcaggcgtat acagcgaaac agagctcctt tcgacgctcc tcctgctgat catcgccggt 5700

cacaagacgg tcgccaacat gatcggcaac ggcacagcac tgttgctccg ccatccccag 5760

cagctcgaga tgctccgagc cacccccgag ctgatccctt cggcgatcga ggagatcctg 5820

cgctacgaag ggtcggccgc ctgggcctcg ctgcgggtcg cggcggagga catgcagctc 5880

gcgggagtgg acatacccaa ggggagcttc gtacacctgt cgctgtccag cgcgggtcgt 5940

gatcccgacg tgtacgacga cccggacggt ttcgacgtga cgcggtcacc gaaccgccat 6000

ctgtccttcg gccacggtcc ccacttctgc atcggcgctc cgctgggccg actccagggc 6060

gagatcgcct tctccacgct gttgcgccga ctgccgcgat tcgagctcgc cgtgcctccg 6120

gaagaggtcg cctggctctc cgacagttcg ctcagccggg gcctcgaggc cctcccgata 6180

cgagtgggag agaggttgcc gcgatgacgg aacaaggcgg tccgagcatt gctgtggtgg 6240

gagccggcgg agtaggcggc tatttcggcg gcctgctcgc cgccgccggg catgatgtgc 6300

ggttcctggc ccgcggcgag aacctcgccg cgctcaggcg acaggggctg cgcatcacca 6360

acggctcaag tgacttacgt gtgccggacg ttcgggcgtc ggccgacccg aaggacatcg 6420

gcgaggtcga cttcgtactg ctctgcgtca agacctcaca gctgccggcg gccctcgacg 6480

cgctgggccc gctggtcggc gagcacactg ccgtggtcac ggtgcagaac ggggtggaag 6540

cccctgagca ggtcgcagcc aggatcggcc gcggtcgggt actccccggc agcgtcaggg 6600

tcgtggcctc gacggccggt ccgggcgagt tgaggcacgt gggtcccccc ggcgctctgg 6660

ccttcaccga gtgggacagc actgtgtccg accgggtggc acgactgcgc gaggtgctgc 6720

gtgctgcctc ggtgtccgtg cccgagccga gcgacatctg ggccggcctt tgggcgaagt 6780

tcctgttggt ggtcccgatc ggcagccttg gagccgccac cggcggggcg accatcggcg 6840

agctccggtc gcgcaccggc acccgcaaca ttctgatcgc cggcatgcgg gagatctacg 6900

agaccgggat caagctcgga atcgcgctgc cggcagctgc cgtggacacc gcgacagagc 6960

tcatggacca gcagtcgccc gacgtcacct cctcgctgca acgggacatc ctggcgggac 7020

ggccgtcaga gctcgaagcg tggaccgggg ccgtggtccg cctcgcccgc ggggcgggcc 7080

tgaccgcgcc ggtccacgaa atgctctacg agctgctcgc cacccgcgaa tcacgcacgg 7140

cgaggagtct gcaggcgtga acgtgagatt cgcagaacgc agcaccctgc gggacatgcg 7200

ggcctaccgg gacaaggagt cgtcgaacgc cgaaggcagc tcgcggttca ccttcgacct 7260

gtccagcaac gagctggttc tccccccgct gcctaccgtg cttgccggta tcgaaaaagg 7320

cttgccgcga cttgctcgtt accccgaccc cacagcacgg gacctgaccg aggacattgc 7380

cgggcacttg tgcgtctccc cggatgaggt cgcggtcggc cccggaagcg cgggcgtgct 7440

ccagcagatc cttctcgcac tgtgcggcaa gggcgacgaa gtcgtccatg gctggccggg 7500

attcgatgcc tatccgctgt tggtcgccat ttcaggtgcc accggagtcc acgtgcccct 7560

gactgcgtcc ggcggccacg atctcgatga gatccgcacc cgggtgaatg cgcggaccag 7620

ggtggtgatc ctgtgctccc cgcacaatcc gaccggaacc gtgattgacc aagacgagct 7680

gcacggtttc ctgcgttcgc tgccggctca tgtggtcgcg gtcctcgacg aggcgtacgt 7740

ggagttcgac cggggcgcca atcctccggg tctgccggtg ttgctgagcg agcacagcaa 7800

caccgtggta cttcgaacgt tctccaaggc ctatggcctt gccggcctac gggtcggtta 7860

cgcggccggg ccacggcagg tcatggccac cgtccgcaag acggcaatcc ctttcggagt 7920

gacgcgcttc gcggaacaag ccgcaatgct ctcgctgcgc agcgaggacg aactgtgtga 7980

acgtctggca gcagtggctg cggcacgcga agaactgacc gcggaactca gggaactgag 8040

gctgcccgtc ctgctttccc gagccaactt cgtctggctc ccgctcgctt cggccgccga 8100

gtctttcgcc cggactgcgg ctaccgcagg ggtcaaggtc cgagcctttc cggggcacgg 8160

tgtacggatc tcagtgggag aggccgaggc acatcggacg ctgttggcgg cgctcggccg 8220

ggcggaccgt gggaactggt tctgagaact ctctgcggac aattcttttg cccgtcctca 8280

tacaactcat cgacagcaac tctggggtgg gaagtctgtg aaactcctga tgatcgccat 8340

gccgtggcaa gggctcgaca cgccgtccag cgcgctgggc gtactggggc catgcgtccg 8400

caagaacgcc gccgactgga ccgtcgatga gctgtacgcc aacctccgct gggccgaata 8460

cctgatgcgg gagagcaacg gctccgtcac ctgcgaggac tacgggaaca tcgcggatca 8520

agtcttccac ggcgtagggg actgggtgtt caccccagcg ctgtacgacg tcgacagtta 8580

tcaggtcgac gagtacgcga agttcctcga gcagcgggac atggacccga cacttcccgt 8640

tgagatgcac aagtacgccc ggggattcat ccgggatctc gcggccgaga tcgctgccga 8700

tcctcccgac gtggtcgggt tcacgagcac cttcatgcag aacgtcccgt cgctcgcact 8760

ggccagggag ctgaagaaac tcgcgccggg catccgcacg gtccttggcg gcagcaactg 8820

cgacggagca caaggtcccg cgttgcaccg gaatttcgag caactcgact tcgtgatcag 8880

cggtgagggc gaacgtgcgc tgcccgcgtt gctgaatcgc atcatccggg gcgagagcct 8940

cgccgacgtg ccggggctca gctggagggg ggatgacggg catccggtgg tgaatccacc 9000

ggccacggcg gcgctgccgt tcgccatggt gcccgcgccc ggttacgaca gctactttca 9060

ggccctcgaa aggtcacccg tccgtcacca cgtccgtccg atgctggtcc ttgagacctc 9120

ccgtggttgc tggtggggag aggctcacca atgcacgttc tgcggcctga acggatcgaa 9180

tatcgacttc cggagcaagg cccctgagcg catcgcccag gaagtccggg aactggccga 9240

gcgacaccag atcctcgacc tggtcatggt ggacaacatc ctcgacatga agtatctcaa 9300

tacggccatg cccgagatag ctgccctcga ctgcgatctg cgaattcact acgagatcaa 9360

gtccaatatg aaccgggagc agttgagtag gctgaaagag gcgaacgtcc tcttcgtgca 9420

gcccggtatc gagagcctga gcagccatgt gctgcgcctc atggacaagg gcgtcagtgc 9480

cgcgcacaac gtacggatgc tgcgtgacgg acaggatctc gggctcaacg tgacatggag 9540

catcctctac ggcttcccgg gcgagaccga ggacgactac cgcgggctgc tcaagaaatt 9600

ggccacgctc gagcacctgg agccgccaac cggggcttgg cgcatagccc ttgagcggtt 9660

cagtccctac ttcgaggacc ccacccaggg gttcatgttc cgccgcccct cggaaatata 9720

cgacttcatc taccagatcc cgcaggatca gctgtacgac atggtgttct tcttcgacac 9780

cagcgtccgg ggaatctcag ggcccatcga ggacgagatg aagcaggcct gcgaggaatg 9840

ggccaaggcc tatccgcagg gcaccctttc ctactggacc gatgaccgag gccgggtcgt 9900

catcgaagac cgccgtgcca gctggccgac ggaagtgatc gagctggacg aggtccgcag 9960

caatgtgtac ctcggcatgt tccagtgcgc cgcccgcgag ggcatacgcc ggcggcttgc 10020

cgacagcggg cacgtcgtcg gggaagcgga actcgaggaa atgctccgct acttcgtcga 10080

tcgcggcctg gcattcgagg acgaggggcg ctacgtaagc gtcgccctcg gggttgaccc 10140

gtatcgccga aagctggtcg gcggcaagga ggtggcggct tcgctatgag cgctttgctg 10200

gacatcgatg aactcaaggc ccgagattcg gacgagggac gggtaccggc cggtggccgt 10260

cccgcgaccg agacgctgac cctcggactc gaccgggccg aacttcccgt cgccaccgaa 10320

ctggcggcgc tactgcaccg ggtgcccgtc gccggggtac ggctgccgga gcccgccgac 10380

ttctcggcac tccccagtca cgtgatcgtg cggatcatcg cgttgattcg cgaatgttcc 10440

tcgatcggca ccagagtcac ctggtcactg accctgggcg ccgaacagct cgacctggtc 10500

ccccgtctcg atcaccttcc tgcccccgac agcatcacgg tgctggagac agggcatccg 10560

tccgtcggtg agtggcggtc ctccagcaat ttcggcctcc tctacttccg taagggcccg 10620

aagttcctgt ccgtcgtcga tcagcgcccc gaatccagcc gcgaaatcat cgtggacgat 10680

cccacccaga tggccgtctt cctcctgggc ctggagggat gcgcgtgggc cgaggtgacc 10740

cgaaactcgc aattcgccgc cgccgcacgc gatttggtga acaagggcct tgtgatgcgc 10800

gtcggggatc actgcgtgac cctccccgtg cacatgcgtt catggcccct gggcgcggcc 10860

ctattgggag gaaccttggc cgcagccggc aagaaatcgg acggtgctac ggagtag 10917

<210> 2

<211>840

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>抗性蛋白基因cxm0

<222>（1）…（840）

<400> 2

ctacttcaga ccggcaaggc tgagcgcacg atccaagcgg tctcgtgacc gcgcccgagc 60

acggtcggcc ccctcagccc ggatcttcgc cagctccgat cgctcttcga ggagctgcag 120

tgcccgctca cgcaccggtg cgatcaggga gatcactgcc tctgcggctg cttccttgag 180

gtcacggtag gaatcgatac ccttcgccgc atcgctcggg agcgtgtcag tgcaggcagc 240

cctgatctcc aggaggttgg caacgcccgg ctgttcgtcc ggggcgtagc ggacggtgtt 300

ttctccgtct gtcactgcgc gttggaactt ccggcgtacg gcctccgggc tgtccaggac 360

gtagacgatg ccgctgccgt ccgaggacga cttcgacatc ttccgcgtag gggcagcgag 420

atcacgtacc cgggctgcgg ctacgggcag gacggcttgc ggaaccgtga acacctcgcc 480

gtagtccgtg ttgaaccgcc gcgccaaggt ccgggccagc tccacatgct ggttctgatc 540

gtgaccgacg ggcacctctg aagcgccatg aagcaggatg tccgccgcca tgaggacggg 600

gtaggtgagc agaccaaggc gtacggagtt gctcccctgg gacttctcct tgaactgcac 660

catccttcga gcctccccga aggtgcaggt gcactcgaga agccacgtca acgccatgtg 720

ctcctggatg aggtccgact gcacgaagag acgttcctgg ggtacgcccg ccgcgatgag 780

taaagcgagt tggtggtcgg tcagttcctg gagacgttcg gggtcgtgct tggtcgtcat 840

<210> 3

<211> 942

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>转录调控蛋白基因cxm1

<222>（1）…（942）

<400> 3

tcaggccgga gcggttccgg ttggtcgagg ttctccgaag agcgtcctga cggctggatc 60

ctgggctgcg gcctgagcgc acctgacggc gaggcgtacc agttcggagt cggaaccctc 120

acgccaggca agggacaacc gggcggcagg cacatccgtc acagggatga agacgacgtc 180

ctgacggtgc tggactgcca tgacagagac ggggacgagc gcggctgcgt tctcgagggc 240

cacgaggtcg atggcctcgt cgaggcgcgt cgctgtggga ggttccttcc aggtgcgctt 300

gccggggcac acctcaccac cccagaagtc ggaccactcg ggcgacccgc cggtggggcg 360

aatgatcgga acctcgctca ggtcgtcgat cgacacggag tcacgactgg ccagctcgtg 420

agccgatggc agacagacga cccggggtaa cagggccacg gtggccctct cgaggcccac 480

gtagtccgcg ggctccagca cgaaggacac gtcagcgtcc cctgcctcca ggcatgctgt 540

ctgttcggtc cacggtacgt accggggcac tacctgatac tcagggtgct tttcgcggat 600

gagttcaatg gtccggtgtg ccagagggcg gctgacggcc gggcggaacg cgacgacgag 660

ccgttcgaca tcctgcgacc ccgcctgccg catcctctcg accgtgacct gccactgctg 720

caacaagttc ctcgcgtgag tcaggaagtc gcgcccgacc gacgtgagtt cgactctgtt 780

gcccgttctg tccaaaagct ggagacccag ctctctttcg agttgacgaa tcgccacgct 840

caacggcggc tgtgtcatgt gcaggcgggc cgcggctcgc gtgaacccgc cttcctcggc 900

tacggcaacg aagtacctga ggtgccgcaa atccagttcc at 942

<210> 4

<211> 1443

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>转运蛋白基因cxm2

<222>（1）…（1443）

<400> 4

atgacgctga tcgccaccgg cgtctccgtg ctgtcgtacg cactcatgca gaccatggtc 60

gtcccggcct tgcacgtact acaggtgcag ttacacacgg cctcgacgtg gtcggcgtgg 120

atcctgagtg tgttcctgct gaccagtgcg gcgagcacgc ccttgctgag ccggctgggg 180

gaccgctaca gcaagcgcaa agttttgctg ctggttctca ccacctacct gatcggcacg 240

gtcggttgtg ctgtggcagg caatatcggg gttctgatcg catgccgtgc cgtgcaggga 300

gtcagcctcg cggccatccc cctgtccttc ggcatcctgc gcgacgtact tcctgagcag 360

cggctgcgtt cgggcctcgg gctggtgtca gggaccatcg gtgtgggggc cggcatcggc 420

ctggtcgtgg gaggtctggt cgtcgaccac cagtcatggc gctggctgtt cgccgtcgcc 480

gcggtactga tcctgggcgc gatcgggctc gttgcgaagt acgttccgga ccagcggggc 540

gaagccggcg aaccggtgga cgtgcccggg gcggtgctcc tggccttggt cctcgtcgcg 600

ctgttgctcg cgttgaccaa gggcacctca tgggggtggg cgtccacagg aacgctggct 660

ctgttcgggg cctccgcggt tctcctggga ttgctggtcg tagtcgaacg aaagtcgccc 720

gcccccttga tcgaccccgc ggtcgtggcc ggtcgctcct tcgtctcggt gcacggtgcg 780

gcgttcgtgt tcggcgtggt ctcgttcgtg ttctacgtcc tgctgccgac gtacgcccag 840

accgcggcgg atcagcggct accgggcgga gggaccatcg gctacgggct cggggccgat 900

gtcaccatgg cgggtctgct ccttctgccc ggctcattgg tgctgttgcc tgcgggacca 960

ctagcaggtc tgctgcagcg cctgacgtcc gtacgcgcga cgctcgcatc aggcttcgcc 1020

gtgatggcgg tcggggcgat ctcgctctgg gcgtggaatg ccaacgggtg gcaagtggcg 1080

gtcggttacc tggtcgtagg tctcggttcc ggactggtgc tgagcggact cccgtcggtg 1140

atcagcgact tgacggaggc ccgacgcacc gcaaccgcca atggcgtcaa cacggtggtg 1200

cgcacggcag gcggcgtcgt aggcagtcag ctggctgtcg ccttgctggc tgcctggcat 1260

atctccggtt ccgatacgcc ggcgcgcgac ggcttcacca ccgccttctg gatcgctgcc 1320

gccgtagcgg cggccggagg gctgttgtgc tgggtcggca tcaagacctc cacgctccgc 1380

ggccctcgta tgccaggggt gactgacctg cctcgccaga gcgcaggggg cgtacgccca 1440

tga 1443

<210> 5

<211> 621

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>巯基转运蛋白（sulfur carrier protein）激活蛋白基因cxm3

<222>（1）…（621）

<400> 5

gtgaccgtcc gatttgaaat cgaacccgtc aggcgtttcc tgagcagcgc actgggggag 60

taccaaaaat gcctggacag ccgcgacgcc gatggcgtcc cgagccatct gccgcgtgca 120

tcgggtctgt tgttcgggca ggtgggcggc gctgaaatag tgatcagcga tgtggaattc 180

gtgccgaatg tccgggacag tgacgagagt gtcatggccg aattcgaagc gacgatcgcc 240

ccgcagttcg gcgacgtgta caagaatccg gggcgaggat tctggtccga tgaacagggc 300

gtcttgcagg cgatcaggca acagtcggcg aacggcctgg agttgctggg ctccatacat 360

tcacatccga actggcatga aatcggcccg ccgcacgaac ggcgccagcg cctgagcgaa 420

catccgacac agatggatga ataccttttc cggcagtcat gctggccagt gaacgtcatc 480

tggtacgtgc atgagagtag tggcggtatc gcacatcggg tagcggcctg gcggcccggt 540

gccgagcaat gcgacaggct tgacatacgg attccggcgg cgatccatga gcagttcgaa 600

gtcctactcg aggaggaata a 621

<210> 6

<211> 303

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>巯基转运蛋白（sulfur carrier protein）基因cxm4

<222>（1）…（303）

<400> 6

atgcccgatg tcaaacttcc cgcagccttc cacgtcctga ccggcggtcg gcggcagttg 60

cctgtcgagg gcgccaatat ccgggaggtc cttgtcggtc tcgaccagac ctgtccgggg 120

gtcctcgagc gactcatgga ccaggaaggg tccgtgaagc gctacgtcaa tgtctaccgg 180

aacgacagcg acatcaggag cctcgacggc ctcgaaacga aagtggagca ccacgacgtc 240

atctggatag tgccggcggt agcaggtggc agcgaagccg cgcgagccga ggagtcacga 300

tga 303

<210> 7

<211> 1215

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>细胞色素P450酶基因cxm5

<222>（1）…（1215）

<400> 7

atgaccgacg tgattcccac ggaattcttc accgagcccg gttcgaatcc gcacgcgaca 60

gccgcggagt acaggtccaa gtgtccggtc catcggatca atgttccccc cggcgccgac 120

gcgtacgcgg tcctcgggaa caaagtcgtt gaggaagcgc tcggcgactc gcgcctctcc 180

aagcaagtcg agaacctgcc cgcccgctat cgagacaagg ccgtggccag cagtctcctc 240

gtggtcggca acctgggatt cgccgacgcg cccaaacaca cccgcctgaa gaagcccatc 300

agccgggcat tcctgccggc cacggtcgcc caactacgcc cgcgcatcca ggacatcgtc 360

gacgatctca tcgacacctt tccggagaac ggcgaaatcg acctgctcag ttccttcgct 420

ctgccgatgc cgctcaccgt catctgcgaa tacctgggga taccggtggc ggaccggccg 480

ctgtttctgg agtggagcta catcctcagc caggacccgt tgcagcacga cgaggcggag 540

ctgaaagccg cgagcgaaga gttcacggac tatttcacca agctcgtggc cgagcggcgc 600

acggacctgc gggacgacct gctgagcgag atcatcaggg ccagggacgc aggcgtatac 660

agcgaaacag agctcctttc gacgctcctc ctgctgatca tcgccggtca caagacggtc 720

gccaacatga tcggcaacgg cacagcactg ttgctccgcc atccccagca gctcgagatg 780

ctccgagcca cccccgagct gatcccttcg gcgatcgagg agatcctgcg ctacgaaggg 840

tcggccgcct gggcctcgct gcgggtcgcg gcggaggaca tgcagctcgc gggagtggac 900

atacccaagg ggagcttcgt acacctgtcg ctgtccagcg cgggtcgtga tcccgacgtg 960

tacgacgacc cggacggttt cgacgtgacg cggtcaccga accgccatct gtccttcggc 1020

cacggtcccc acttctgcat cggcgctccg ctgggccgac tccagggcga gatcgccttc 1080

tccacgctgt tgcgccgact gccgcgattc gagctcgccg tgcctccgga agaggtcgcc 1140

tggctctccg acagttcgct cagccggggc ctcgaggccc tcccgatacg agtgggagag 1200

aggttgccgc gatga 1215

<210> 8

<211> 927

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>酮泛解酸还原酶基因cxm6

<222>（1）…（927）

<400> 8

gtggtgggag ccggcggagt aggcggctat ttcggcggcc tgctcgccgc cgccgggcat 60

gatgtgcggt tcctggcccg cggcgagaac ctcgccgcgc tcaggcgaca ggggctgcgc 120

atcaccaacg gctcaagtga cttacgtgtg ccggacgttc gggcgtcggc cgacccgaag 180

gacatcggcg aggtcgactt cgtactgctc tgcgtcaaga cctcacagct gccggcggcc 240

ctcgacgcgc tgggcccgct ggtcggcgag cacactgccg tggtcacggt gcagaacggg 300

gtggaagccc ctgagcaggt cgcagccagg atcggccgcg gtcgggtact ccccggcagc 360

gtcagggtcg tggcctcgac ggccggtccg ggcgagttga ggcacgtggg tccccccggc 420

gctctggcct tcaccgagtg ggacagcact gtgtccgacc gggtggcacg actgcgcgag 480

gtgctgcgtg ctgcctcggt gtccgtgccc gagccgagcg acatctgggc cggcctttgg 540

gcgaagttcc tgttggtggt cccgatcggc agccttggag ccgccaccgg cggggcgacc 600

atcggcgagc tccggtcgcg caccggcacc cgcaacattc tgatcgccgg catgcgggag 660

atctacgaga ccgggatcaa gctcggaatc gcgctgccgg cagctgccgt ggacaccgcg 720

acagagctca tggaccagca gtcgcccgac gtcacctcct cgctgcaacg ggacatcctg 780

gcgggacggc cgtcagagct cgaagcgtgg accggggccg tggtccgcct cgcccgcggg 840

gcgggcctga ccgcgccggt ccacgaaatg ctctacgagc tgctcgccac ccgcgaatca 900

cgcacggcga ggagtctgca ggcgtga 927

<210> 9

<211> 1089

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221> 5-磷酸吡哆醛（PLP）依赖型氨基转移酶基因cxm7

<222>（1）…（1089）

<400> 9

gtgaacgtga gattcgcaga acgcagcacc ctgcgggaca tgcgggccta ccgggacaag 60

gagtcgtcga acgccgaagg cagctcgcgg ttcaccttcg acctgtccag caacgagctg 120

gttctccccc cgctgcctac cgtgcttgcc ggtatcgaaa aaggcttgcc gcgacttgct 180

cgttaccccg accccacagc acgggacctg accgaggaca ttgccgggca cttgtgcgtc 240

tccccggatg aggtcgcggt cggccccgga agcgcgggcg tgctccagca gatccttctc 300

gcactgtgcg gcaagggcga cgaagtcgtc catggctggc cgggattcga tgcctatccg 360

ctgttggtcg ccatttcagg tgccaccgga gtccacgtgc ccctgactgc gtccggcggc 420

cacgatctcg atgagatccg cacccgggtg aatgcgcgga ccagggtggt gatcctgtgc 480

tccccgcaca atccgaccgg aaccgtgatt gaccaagacg agctgcacgg tttcctgcgt 540

tcgctgccgg ctcatgtggt cgcggtcctc gacgaggcgt acgtggagtt cgaccggggc 600

gccaatcctc cgggtctgcc ggtgttgctg agcgagcaca gcaacaccgt ggtacttcga 660

acgttctcca aggcctatgg ccttgccggc ctacgggtcg gttacgcggc cgggccacgg 720

caggtcatgg ccaccgtccg caagacggca atccctttcg gagtgacgcg cttcgcggaa 780

caagccgcaa tgctctcgct gcgcagcgag gacgaactgt gtgaacgtct ggcagcagtg 840

gctgcggcac gcgaagaact gaccgcggaa ctcagggaac tgaggctgcc cgtcctgctt 900

tcccgagcca acttcgtctg gctcccgctc gcttcggccg ccgagtcttt cgcccggact 960

gcggctaccg caggggtcaa ggtccgagcc tttccggggc acggtgtacg gatctcagtg 1020

ggagaggccg aggcacatcg gacgctgttg gcggcgctcg gccgggcgga ccgtgggaac 1080

tggttctga 1089

<210> 10

<211> 1872

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>自由基S-腺苷甲硫氨酸甲基转移酶基因cxm8

<222>（1）…（1872）

<400> 10

gtgaaactcc tgatgatcgc catgccgtgg caagggctcg acacgccgtc cagcgcgctg 60

ggcgtactgg ggccatgcgt ccgcaagaac gccgccgact ggaccgtcga tgagctgtac 120

gccaacctcc gctgggccga atacctgatg cgggagagca acggctccgt cacctgcgag 180

gactacggga acatcgcgga tcaagtcttc cacggcgtag gggactgggt gttcacccca 240

gcgctgtacg acgtcgacag ttatcaggtc gacgagtacg cgaagttcct cgagcagcgg 300

gacatggacc cgacacttcc cgttgagatg cacaagtacg cccggggatt catccgggat 360

ctcgcggccg agatcgctgc cgatcctccc gacgtggtcg ggttcacgag caccttcatg 420

cagaacgtcc cgtcgctcgc actggccagg gagctgaaga aactcgcgcc gggcatccgc 480

acggtccttg gcggcagcaa ctgcgacgga gcacaaggtc ccgcgttgca ccggaatttc 540

gagcaactcg acttcgtgat cagcggtgag ggcgaacgtg cgctgcccgc gttgctgaat 600

cgcatcatcc ggggcgagag cctcgccgac gtgccggggc tcagctggag gggggatgac 660

gggcatccgg tggtgaatcc accggccacg gcggcgctgc cgttcgccat ggtgcccgcg 720

cccggttacg acagctactt tcaggccctc gaaaggtcac ccgtccgtca ccacgtccgt 780

ccgatgctgg tccttgagac ctcccgtggt tgctggtggg gagaggctca ccaatgcacg 840

ttctgcggcc tgaacggatc gaatatcgac ttccggagca aggcccctga gcgcatcgcc 900

caggaagtcc gggaactggc cgagcgacac cagatcctcg acctggtcat ggtggacaac 960

atcctcgaca tgaagtatct caatacggcc atgcccgaga tagctgccct cgactgcgat 1020

ctgcgaattc actacgagat caagtccaat atgaaccggg agcagttgag taggctgaaa 1080

gaggcgaacg tcctcttcgt gcagcccggt atcgagagcc tgagcagcca tgtgctgcgc 1140

ctcatggaca agggcgtcag tgccgcgcac aacgtacgga tgctgcgtga cggacaggat 1200

ctcgggctca acgtgacatg gagcatcctc tacggcttcc cgggcgagac cgaggacgac 1260

taccgcgggc tgctcaagaa attggccacg ctcgagcacc tggagccgcc aaccggggct 1320

tggcgcatag cccttgagcg gttcagtccc tacttcgagg accccaccca ggggttcatg 1380

ttccgccgcc cctcggaaat atacgacttc atctaccaga tcccgcagga tcagctgtac 1440

gacatggtgt tcttcttcga caccagcgtc cggggaatct cagggcccat cgaggacgag 1500

atgaagcagg cctgcgagga atgggccaag gcctatccgc agggcaccct ttcctactgg 1560

accgatgacc gaggccgggt cgtcatcgaa gaccgccgtg ccagctggcc gacggaagtg 1620

atcgagctgg acgaggtccg cagcaatgtg tacctcggca tgttccagtg cgccgcccgc 1680

gagggcatac gccggcggct tgccgacagc gggcacgtcg tcggggaagc ggaactcgag 1740

gaaatgctcc gctacttcgt cgatcgcggc ctggcattcg aggacgaggg gcgctacgta 1800

agcgtcgccc tcggggttga cccgtatcgc cgaaagctgg tcggcggcaa ggaggtggcg 1860

gcttcgctat ga 1872

<210> 11

<211> 732

<212> DNA

<213>济南游动放线菌(Actinoplanes tsinanensis)

<221>自由基S-腺苷甲硫氨酸蛋白基因cxm9

<222>（1）…（732）

<400> 11

atgagcgctt tgctggacat cgatgaactc aaggcccgag attcggacga gggacgggta 60

ccggccggtg gccgtcccgc gaccgagacg ctgaccctcg gactcgaccg ggccgaactt 120

cccgtcgcca ccgaactggc ggcgctactg caccgggtgc ccgtcgccgg ggtacggctg 180

ccggagcccg ccgacttctc ggcactcccc agtcacgtga tcgtgcggat catcgcgttg 240

attcgcgaat gttcctcgat cggcaccaga gtcacctggt cactgaccct gggcgccgaa 300

cagctcgacc tggtcccccg tctcgatcac cttcctgccc ccgacagcat cacggtgctg 360

gagacagggc atccgtccgt cggtgagtgg cggtcctcca gcaatttcgg cctcctctac 420

ttccgtaagg gcccgaagtt cctgtccgtc gtcgatcagc gccccgaatc cagccgcgaa 480

atcatcgtgg acgatcccac ccagatggcc gtcttcctcc tgggcctgga gggatgcgcg 540

tgggccgagg tgacccgaaa ctcgcaattc gccgccgccg cacgcgattt ggtgaacaag 600

ggccttgtga tgcgcgtcgg ggatcactgc gtgaccctcc ccgtgcacat gcgttcatgg 660

cccctgggcg cggccctatt gggaggaacc ttggccgcag ccggcaagaa atcggacggt 720

gctacggagt ag 732

<210> 12

<211> 279

<212> PRT

<213> 人工序列

<221>抗性蛋白Cxm0氨基酸序列

<222>（1）…（279）

<400> 12

MTTKHDPERL QELTDHQLAL LIAAGVPQER LFVQSDLIQE HMALTWLLEC TCTFGEARRM 60

VQFKEKSQGS NSVRLGLLTY PVLMAADILL HGASEVPVGH DQNQHVELAR TLARRFNTDY 120

GEVFTVPQAV LPVAAARVRD LAAPTRKMSK SSSDGSGIVY VLDSPEAVRR KFQRAVTDGE 180

NTVRYAPDEQ PGVANLLEIR AACTDTLPSD AAKGIDSYRD LKEAAAEAVI SLIAPVRERA 240

LQLLEERSEL AKIRAEGADR ARARSRDRLD RALSLAGLK 279

<210> 13

<211> 313

<212> PRT

<213> 人工序列

<221>转录调控蛋白Cxm1氨基酸序列

<222>（1）…（313）

<400> 13

MELDLRHLRY FVAVAEEGGF TRAAARLHMT QPPLSVAIRQ LERELGLQLL DRTGNRVELT 60

SVGRDFLTHA RNLLQQWQVT VERMRQAGSQ DVERLVVAFR PAVSRPLAHR TIELIREKHP 120

EYQVVPRYVP WTEQTACLEA GDADVSFVLE PADYVGLERA TVALLPRVVC LPSAHELASR 180

DSVSIDDLSE VPIIRPTGGS PEWSDFWGGE VCPGKRTWKE PPTATRLDEA IDLVALENAA 240

ALVPVSVMAV QHRQDVVFIP VTDVPAARLS LAWREGSDSE LVRLAVRCAQ AAAQDPAVRT 300

LFGEPRPTGT APA 313

<210> 14

<211> 480

<212> PRT

<213> 人工序列

<221>转运蛋白Cxm2氨基酸序列

<222>（1）…（480）

<400> 14

MTLIATGVSV LSYALMQTMV VPALHVLQVQ LHTASTWSAW ILSVFLLTSA ASTPLLSRLG 60

DRYSKRKVLL LVLTTYLIGT VGCAVAGNIG VLIACRAVQG VSLAAIPLSF GILRDVLPEQ 120

RLRSGLGLVS GTIGVGAGIG LVVGGLVVDH QSWRWLFAVA AVLILGAIGL VAKYVPDQRG 180

EAGEPVDVPG AVLLALVLVA LLLALTKGTS WGWASTGTLA LFGASAVLLG LLVVVERKSP 240

APLIDPAVVA GRSFVSVHGA AFVFGVVSFV FYVLLPTYAQ TAADQRLPGG GTIGYGLGAD 300

VTMAGLLLLP GSLVLLPAGP LAGLLQRLTS VRATLASGFA VMAVGAISLW AWNANGWQVA 360

VGYLVVGLGS GLVLSGLPSV ISDLTEARRT ATANGVNTVV RTAGGVVGSQ LAVALLAAWH 420

ISGSDTPARD GFTTAFWIAA AVAAAGGLLC WVGIKTSTLR GPRMPGVTDL PRQSAGGVRP 480

<210> 15

<211> 206

<212> PRT

<213> 人工序列

<221>巯基转运蛋白激活蛋白Cxm3氨基酸序列

<222>（1）…（206）

<400> 15

VTVRFEIEPV RRFLSSALGE YQKCLDSRDA DGVPSHLPRA SGLLFGQVGG AEIVISDVEF 60

VPNVRDSDES VMAEFEATIA PQFGDVYKNP GRGFWSDEQG VLQAIRQQSA NGLELLGSIH 120

SHPNWHEIGP PHERRQRLSE HPTQMDEYLF RQSCWPVNVI WYVHESSGGI AHRVAAWRPG 180

AEQCDRLDIR IPAAIHEQFE VLLEEE 206

<210> 16

<211> 100

<212> PRT

<213> 人工序列

<221>巯基转运蛋白Cxm4氨基酸序列

<222>（1）…（100）

<400> 16

MPDVKLPAAF HVLTGGRRQL PVEGANIREV LVGLDQTCPG VLERLMDQEG SVKRYVNVYR 60

NDSDIRSLDG LETKVEHHDV IWIVPAVAGG SEAARAEESR 100

<210> 17

<211> 404

<212> PRT

<213> 人工序列

<221>细胞色素P450 Cxm5氨基酸序列

<222>（1）…（404）

<400> 17

MTDVIPTEFF TEPGSNPHAT AAEYRSKCPV HRINVPPGAD AYAVLGNKVV EEALGDSRLS 60

KQVENLPARY RDKAVASSLL VVGNLGFADA PKHTRLKKPI SRAFLPATVA QLRPRIQDIV 120

DDLIDTFPEN GEIDLLSSFA LPMPLTVICE YLGIPVADRP LFLEWSYILS QDPLQHDEAE 180

LKAASEEFTD YFTKLVAERR TDLRDDLLSE IIRARDAGVY SETELLSTLL LLIIAGHKTV 240

ANMIGNGTAL LLRHPQQLEM LRATPELIPS AIEEILRYEG SAAWASLRVA AEDMQLAGVD 300

IPKGSFVHLS LSSAGRDPDV YDDPDGFDVT RSPNRHLSFG HGPHFCIGAP LGRLQGEIAF 360

STLLRRLPRF ELAVPPEEVA WLSDSSLSRG LEALPIRVGE RLPR 404

<210> 18

<211> 308

<212> PRT

<213> 人工序列

<221>酮泛解酸还原酶Cxm6氨基酸序列

<222>（1）…（308）

<400> 18

VVGAGGVGGY FGGLLAAAGH DVRFLARGEN LAALRRQGLR ITNGSSDLRV PDVRASADPK 60

DIGEVDFVLL CVKTSQLPAA LDALGPLVGE HTAVVTVQNG VEAPEQVAAR IGRGRVLPGS 120

VRVVASTAGP GELRHVGPPG ALAFTEWDST VSDRVARLRE VLRAASVSVP EPSDIWAGLW 180

AKFLLVVPIG SLGAATGGAT IGELRSRTGT RNILIAGMRE IYETGIKLGI ALPAAAVDTA 240

TELMDQQSPD VTSSLQRDIL AGRPSELEAW TGAVVRLARG AGLTAPVHEM LYELLATRES 300

RTARSLQA 308

<210> 19

<211> 362

<212> PRT

<213> 人工序列

<221>5-磷酸吡哆醛（PLP）依赖型氨基转移酶Cxm7氨基酸序列

<222>（1）…（362）

<400> 19

VNVRFAERST LRDMRAYRDK ESSNAEGSSR FTFDLSSNEL VLPPLPTVLA GIEKGLPRLA 60

RYPDPTARDL TEDIAGHLCV SPDEVAVGPG SAGVLQQILL ALCGKGDEVV HGWPGFDAYP 120

LLVAISGATG VHVPLTASGG HDLDEIRTRV NARTRVVILC SPHNPTGTVI DQDELHGFLR 180

SLPAHVVAVL DEAYVEFDRG ANPPGLPVLL SEHSNTVVLR TFSKAYGLAG LRVGYAAGPR 240

QVMATVRKTA IPFGVTRFAE QAAMLSLRSE DELCERLAAV AAAREELTAE LRELRLPVLL 300

SRANFVWLPL ASAAESFART AATAGVKVRA FPGHGVRISV GEAEAHRTLL AALGRADRGN 360

WF 362

<210> 20

<211> 623

<212> PRT

<213> 人工序列

<221>自由基S-腺苷甲硫氨酸甲基转移酶Cxm8氨基酸序列

<222>（1）…（623）

<400> 20

VKLLMIAMPW QGLDTPSSAL GVLGPCVRKN AADWTVDELY ANLRWAEYLM RESNGSVTCE 60

DYGNIADQVF HGVGDWVFTP ALYDVDSYQV DEYAKFLEQR DMDPTLPVEM HKYARGFIRD 120

LAAEIAADPP DVVGFTSTFM QNVPSLALAR ELKKLAPGIR TVLGGSNCDG AQGPALHRNF 180

EQLDFVISGE GERALPALLN RIIRGESLAD VPGLSWRGDD GHPVVNPPAT AALPFAMVPA 240

PGYDSYFQAL ERSPVRHHVR PMLVLETSRG CWWGEAHQCT FCGLNGSNID FRSKAPERIA 300

QEVRELAERH QILDLVMVDN ILDMKYLNTA MPEIAALDCD LRIHYEIKSN MNREQLSRLK 360

EANVLFVQPG IESLSSHVLR LMDKGVSAAH NVRMLRDGQD LGLNVTWSIL YGFPGETEDD 420

YRGLLKKLAT LEHLEPPTGA WRIALERFSP YFEDPTQGFM FRRPSEIYDF IYQIPQDQLY 480

DMVFFFDTSV RGISGPIEDE MKQACEEWAK AYPQGTLSYW TDDRGRVVIE DRRASWPTEV 540

IELDEVRSNV YLGMFQCAAR EGIRRRLADS GHVVGEAELE EMLRYFVDRG LAFEDEGRYV 600

SVALGVDPYR RKLVGGKEVA ASL 623

<210> 21

<211> 243

<212> PRT

<213> 人工序列

<221>自由基S-腺苷甲硫氨酸蛋白基因Cxm9氨基酸序列

<222>（1）…（243）

<400> 21

MSALLDIDEL KARDSDEGRV PAGGRPATET LTLGLDRAEL PVATELAALL HRVPVAGVRL 60

PEPADFSALP SHVIVRIIAL IRECSSIGTR VTWSLTLGAE QLDLVPRLDH LPAPDSITVL 120

ETGHPSVGEW RSSSNFGLLY FRKGPKFLSV VDQRPESSRE IIVDDPTQMA VFLLGLEGCA 180

WAEVTRNSQF AAAARDLVNK GLVMRVGDHC VTLPVHMRSW PLGAALLGGT LAAAGKKSDG 240

ATE 243

1

Claims

1.一种创新霉素的生物合成基因簇，其特征在于，所述基因簇的核苷酸序列如SEQ IDNo.1所示，命名为cxm；其包含编码创新霉素生物合成所涉及的10个基因，其中7个是与生物合成相关基因，1个是调控基因，1个抗性基因，1个是转运基因，所述基因的核苷酸序列如SEQ ID No.2～SEQ ID No.11所示，具体是：

(5)巯基转运蛋白(sulfur carrier protein)基因，该基因的核苷酸序列如SEQ IDNo.6所示，命名为cxm4，其位于基因簇核苷酸序列第4694-4996个碱基处，长度为303个碱基对，编码一个巯基转运蛋白，100个氨基酸，序列如SEQ ID No.16所示；

(8)5-磷酸吡哆醛(PLP)依赖型氨基转移酶基因，该基因的核苷酸序列如SEQ ID No.9所示，命名为cxm7，其位于基因簇核苷酸序列第7157-8245个碱基处，长度为1089个碱基对，编码一个PLP依赖型氨基转移酶，362个氨基酸，序列如SEQ ID No.19所示；

(9)自由基S-腺苷甲硫氨酸甲基转移酶基因，该基因的核苷酸序列如SEQ ID No.10所示，命名为cxm8，其位于基因簇核苷酸序列第8318-10189个碱基处，长度为1872个碱基对，编码一个自由基S-腺苷甲硫氨酸甲基转移酶，623个氨基酸，序列如SEQ ID No.20所示；

2.权利要求1所述创新霉素的生物合成基因簇表达的编码蛋白。

3.根据权利要求2所述的编码蛋白，其特征在于，所述编码蛋白的氨基酸序列分别如SEQ ID No.12～SEQ ID No.21所示。

4.权利要求1所述创新霉素的生物合成基因簇或权利要求1所述创新霉素的生物合成基因簇表达的编码蛋白在催化合成创新霉素或其类似物中的应用。

5.一种重组载体，其特征在于，该重组载体包含权利要求1所述的创新霉素生物合成基因簇。

6.根据权利要求5所述的重组载体，其特征在于，所述重组载体是p15A-cm-apra-cxm或其的突变载体。

7.一种宿主，其特征在于，该宿主包含权利要求5或6所述的重组载体。

8.根据权利要求7所述的宿主，其特征在于，所述宿主为链霉菌、假单胞菌、伯克氏菌、大肠杆菌、芽孢杆菌、酵母、植物或动物。

9.根据权利要求8所述的宿主，其特征在于，所述宿主为天蓝色链霉菌A3(2)、白色链霉菌J1074或变铅青链霉菌K4-114。