CN106754986A - 创新霉素生物合成基因簇及其应用 - Google Patents
创新霉素生物合成基因簇及其应用 Download PDFInfo
- Publication number
- CN106754986A CN106754986A CN201710146841.7A CN201710146841A CN106754986A CN 106754986 A CN106754986 A CN 106754986A CN 201710146841 A CN201710146841 A CN 201710146841A CN 106754986 A CN106754986 A CN 106754986A
- Authority
- CN
- China
- Prior art keywords
- gene
- seq
- nucleotide sequence
- base
- creatmycin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明公开了一种创新霉素的生物合成基因簇,该基因簇的核苷酸序列如SEQ ID No.1所示,命名为cxm;其包含编码创新霉素生物合成所涉及的10个基因,其中7个是与生物合成相关基因,1个是调控基因,1个抗性基因,1个是转运基因,所述基因的核苷酸序列如SEQ ID No.2~SEQ ID No.11所示。所述基因功能通过异源表达结合基因同框删除试验验证。本发明还公开了所述基因簇或其表达的编码蛋白在催化合成创新霉素或其类似物中的应用,实现了创新霉素的生物合成。本发明所提供的基因及其蛋白也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
Description
技术领域
本发明属于微生物基因资源和基因工程领域,具体地,涉及一种创新霉素生物合成基因簇、包含其的载体、宿主及其应用。
背景技术
创新霉素(chuangxinmycin,CXM)与色氨酸(tryptophan)有结构上的相似性(见式(I)),是一种高效的细菌色氨酰tRNA合成酶(TrpRS)的选择性抑制剂。
比如创新霉素对大肠杆菌的TrpRS的IC50为30nM,但是其在30μM浓度下对绵羊的TrpRS没有抑制作用,显示了创新霉素是一种特异性的抑制剂(Brown et al,2002)。最近的研究表明色氨酰tRNA合成酶抑制剂(吲哚霉素和创新霉素)能够扰乱与氯霉素、红霉素和万古霉素抗性相关的富含色氨酸的蛋白的生物合成,从而减弱细菌对氯霉素、红霉素和万古霉素的抗性,因此色氨酰tRNA合成酶抑制剂与另外的抗生素联用可以降低细菌的多重抗药性。创新霉素是中国发现的第一个全新结构的新抗生素,由济南游动放线菌(Actinoplanestsinanensis)产生,其分子的主核为罕见的吲哚并噻喃三环结构,这在化学上是一个新的含硫的杂环体系。最初报道该抗生素对金黄色葡萄球菌、大肠杆菌和痢疾志贺菌有较强的抗菌活性,并对感染了痢疾志贺菌和大肠杆菌的小鼠模型显示出体内抗菌活性。初步临床试验表明它对于大肠杆菌引起的败血症、胆囊炎和尿路感染有显著的疗效(有效率达77.86%)。体外和体内的联合抗菌实验表明,创新霉素与庆大霉素、新霉素、巴龙霉素、卡那霉素B、多黏霉素、氨苄青霉素、青霉素和头孢菌素I等8种抗生素有不同程度的协同作用,提高创新霉素抗菌作用4~32倍,有可能提高临床疗效,防止或延缓耐药性的产生。但是由于其发酵单位太低导致生产成本高,抗菌谱较窄,仅能口服,且抗菌活性低于目前临床上其他抗菌药物,致使其仍未广泛用于临床。
关于创新霉素的生物合成机理及其相关重要的酶学研究还没有得到验证。从化学结构上来说,创新霉素属于吲哚类生物碱,很有可能是利用色氨酸作为起始单元进行生物合成的,但是它的具体的生物合成途径依然未知。我国学者曾对创新霉素的生物合成进行了初步的研究,利用同位素标记的方法发现创新霉素分子中噻喃环的硫直接来自半胱氨酸的巯基,应用标记甲基供体S-腺苷-L-[甲基-14C]甲硫氨酸(SAM)测定创新霉素产生菌无细胞提取物对吲哚丙酮酸的甲基化作用,发现创新霉素产生菌中存在吲哚丙酮酸碳甲基转移酶(indolepyruvate C-methyltransferase)可能负责C-2的甲基化,其分子量是55000±5000道尔顿。经对现有技术的文献检索,尚未发现有关创新霉素生物合成基因簇、包含其的载体及宿主和利用基因表达编码蛋白用于催化合成抗生素创新霉素或其类似物应用的报道。
发明内容
针对现有技术的不足,本发明的目的是提供一种创新霉素的生物合成基因簇、包含其的载体、宿主及其应用。利用本发明的基因簇可实施发酵生产创新霉素,实现创新霉素的生物合成。
本发明所述的创新霉素的生物合成基因簇,其特征在于,该基因簇的核苷酸序列如SEQ ID No.1所示,命名为cxm;其包含编码创新霉素生物合成所涉及的10个基因,其中7个是与生物合成相关基因,1个是调控基因,1个抗性基因,1个是转运基因,所述基因的核苷酸序列如SEQ ID No.2~SEQ ID No.11所示,具体是:
(1)抗性蛋白基因,该基因的核苷酸序列如SEQ ID No.2所示,命名为cxm0,其位于基因簇核苷酸序列第1-966个碱基处,长度为966个碱基对,编码一个色氨酰tRNA合成酶,321个氨基酸,序列如SEQ ID No.12所示;
(2)转录调控蛋白基因,该基因的核苷酸序列如SEQ ID No.3所示,命名为Cxm1,其位于基因簇核苷酸序列第1177-2199个碱基处,长度为1023个碱基对,编码一个LysR家族转录调控蛋白,340个氨基酸,序列如SEQ ID No.13所示;
(3)转运蛋白基因,该基因的核苷酸序列如SEQ ID No.4所示,命名为Cxm2,其位于基因簇核苷酸序列第2415-3905个碱基处,长度为1491个碱基对,编码一个转运蛋白,496个氨基酸,序列如SEQ ID No.14所示;
(4)巯基转运蛋白(sulfur carrier protein)激活蛋白基因,该基因的核苷酸序列如SEQ ID No.5所示,命名为cxm3,其位于基因簇核苷酸序列第3974-4690个碱基处,长度为717个碱基对,编码一个功能未知蛋白,238个氨基酸,序列如SEQ ID No.15所示;
(5)巯基转运蛋白(sulfur carrier protein)基因,该基因的核苷酸序列如SEQID No.6所示,命名为cxm4,其位于基因簇核苷酸序列第4694-4996个碱基处,长度为303个碱基对,编码一个巯基转运蛋白,100个氨基酸,序列如SEQ ID No.16所示;
(6)细胞色素P450酶基因,该基因的核苷酸序列如SEQ ID No.7所示,命名为cxm5,其位于基因簇核苷酸序列第4993-6207个碱基处,长度为1215个碱基对,编码一个细胞色素P450酶,404个氨基酸,序列如SEQ ID No.17所示;
(7)酮泛解酸还原酶基因,该基因的核苷酸序列如SEQ ID No.8所示,命名为cxm6,其位于基因簇核苷酸序列第6204-7160个碱基处,长度为957个碱基对,编码一个细胞色素P450酶,318个氨基酸,序列如SEQ ID No.18所示;
(8)5-磷酸吡哆醛(PLP)依赖型氨基转移酶基因,该基因的核苷酸序列如SEQIDNo.9所示,命名为cxm7,其位于基因簇核苷酸序列第7157-8245个碱基处,长度为1089个碱基对,编码一个PLP依赖型氨基转移酶,362个氨基酸,如SEQ ID No.19所示;
(9)自由基S-腺苷甲硫氨酸甲基转移酶基因,该基因的核苷酸序列如SEQ IDNo.10所示,命名为cxm8,其位于基因簇核苷酸序列第8318-10189个碱基处,长度为1872个碱基对,编码一个自由基S-腺苷甲硫氨酸甲基转移酶,623个氨基酸,序列如SEQ ID No.20所示;
(10)自由基S-腺苷甲硫氨酸蛋白基因,该基因的核苷酸序列如SEQ ID No.11所示,命名为cxm9,其位于基因簇核苷酸序列第10186-10917个碱基处,长度为732个碱基对,编码一个自由基S-腺苷甲硫氨酸蛋白,243个氨基酸,序列如SEQ ID No.21所示。
本发明所述创新霉素的生物合成基因簇核苷酸序列cxm的互补序列可根据DNA碱基互补原则随时得到。序列SEQ ID No.1的核苷酸序列或者部分核苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶酶切相应的DNA或使用Red/ET同源重组技术的线性重组LLHR得到。
本发明所述创新霉素的生物合成基因簇表达的编码蛋白。
其中,所述编码蛋白的氨基酸序列分别如SEQ ID No.12~SEQ ID No.21所示。
本发明所述创新霉素的生物合成基因簇或其表达的编码蛋白在催化合成创新霉素或其类似物中的应用。
创新霉素生物合成基因簇的直接克隆、异源表达和遗传操作证实,利用本发明所述创新霉素的生物合成基因簇通过生物技术表达编码蛋白(氨基酸序列如SEQ ID No.12~SEQ ID No.21所示)可用于催化合成抗生素创新霉素或其类似物、或者催化合成含噻喃或者吲哚并噻喃三环结构单元的化合物。
创新霉素为色氨酸结构类似物,根据基因单敲除实验推测其生物合成是以色氨酸起始,经氨基转移酶Cxm7的脱氨基作用,形成吲哚丙酮酸,吲哚丙酮酸在硫载体蛋白Cxm4及硫载体蛋白激活蛋白的共同催化加上硫原子形成不稳定的吲哚硫碳酸化合物,之后在细胞色素P450Cxm5和还原酶Cxm6的共同催化下含硫六元环闭合形成去甲基创新霉素,去甲基创新霉素在甲基转移酶Cxm8及其蛋白Cxm9的催化下加上甲基,形成创新霉素。
本发明所述的一种重组载体,其特征在于,该重组载体包含本发明所述的创新霉素生物合成基因簇。而且该载体中的创新霉素生物合成基因被中断、被置换或同框缺失,至少其中之一的基因包含有序列SEQ ID No.1中的核苷酸序列。
其中,上述重组载体优选是p15A-cm-apra-cxm。
本发明所述的一种宿主,其特征在于,该宿主包含上述的重组载体。
其中,所述宿主优选为链霉菌、假单胞菌、伯克氏菌、大肠杆菌、芽孢杆菌、酵母、植物或动物。最优选为天蓝色链霉菌A3(2)、白色链霉菌J1074或变铅青链霉菌K4-114。
与现有技术相比,本发明具有如下的有益效果:
利用本发明的基因簇可发酵生产创新霉素,实现创新霉素的生物合成;同时,本发明所提供的包含创新霉素生物合成相关的所有基因和蛋白信息有助于阐明与理解创新霉素类抗生素的生物合成的分子机理,为利用基因工程手段改造提供理论基础与材料。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
附图说明
图1为创新霉素生物合成基因簇的基因组成。
其中:Resistance:抗性基因;Regulator:调控基因:Transporter:转运基因;Biosynthesis:合成基因。
图2为带有创新霉素生物合成基因簇的重组载体。
其中:Apra:安普霉素抗性基因;Cm:氯霉素抗性基因;Int:位点特异性重组酶integrase;P15A:P15A复制子。
图3为创新霉素生物合成基因簇的异源表达及与创新霉素生物合成相关的10个基因的同框缺失突变分析。
其中:CXM:创新霉素;Dem-CXM:去甲基创新霉素;A3(2):天蓝色链霉菌A3(2);J1074:白色链霉菌J1074;K4-114:变铅青链霉菌K4-114;A3(2)/cxm:重组有cxm基因簇的天蓝色链霉菌A3(2);J1074/cxm:重组有cxm基因簇的白色链霉菌J1074;K4-114/cxm:重组有cxm基因簇的天变铅青链霉菌K4-114;
A3(2)/cxm△cxm0:为将cxm中的cxm0同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm1:为将cxm中的cxm1同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm2:为将cxm中的cxm2同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm3:为将cxm中的cxm3同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm4:为将cxm中的cxm4同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm5:为将cxm中的cxm5同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm6:为将cxm中的cxm6同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm7:为将cxm中的cxm7同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm8:为将cxm中的cxm8同框敲除后,转至天蓝色链霉菌A3(2)中;
A3(2)/cxm△cxm9:为将cxm中的cxm9同框敲除后,转至天蓝色链霉菌A3(2)中。
具体实施方式
下面结合附图和实施例对本发明保护内容作进一步阐述。实施例中所描述的内容仅用于解释和说明本发明,而不应当也不会限制本发明权利要求所界定的保护范围。
一般性说明:如下实施例所涉及的限制性内切酶均购自NEB公司,DNA聚合酶、T4连接酶均购自Takara公司,质粒提取试剂盒和琼脂糖凝胶回收DNA片段试剂盒购自Qiangen公司,操作完全按照相应说明书进行。质粒构建中基因测序及引物合成由上海生工公司完成。质粒p15A-cm-ccdB见文献(Wang H,et al.Improved seamless mutagenesis byrecombineering using ccdB for counterselection.Nucleic Acids Research,2014,42(5):e37)、菌株GB05,GB05dir,GB05Red见文献(Fu J.et al.Full-length RecE enhanceslinear-linear homologous recombination and facilitates direct cloning forbioprospecting.Nature Biotechnolgy,2012,30:440-446),天蓝色链霉菌A3(2)见文献(Bentley SD,et al.Complete genome sequence of the model actinomyceteStreptomyces coelicolor A3(2).Nature,2002,417:141-147)、白色链霉菌J1074见文献(Zaburannyi N,et al.Insights into naturally minimised Streptomyces albusJ1074genome.BMC Genomics,2014,15:97),变铅青链霉菌K4-114见文献(Ziermann R,etal.Recombinant Polyketide Synthesis in Streptomyces:Engineering of ImprovedHost Strains.BioTechniques,1999,26:106-110)。上述菌株均为科研实验常用宿主,均可通过公开的保藏机构购买或实验室分享等方式获得。济南游动放线菌购于中国医药集团总公司四川抗菌素工业研究所(CPCC240351)。实施例中的其他实验方法及试剂如无特殊说明,均为本领域常规方法与市售试剂。
实施例1:创新霉素产生菌济南游动放线菌基因组DNA的提取及测序
将济南游动放线菌菌株从-80℃接种至高氏固体平板中,30℃培养4天,刮取菌体接种至168G(葡萄糖22g,牛肉膏4g,蛋白胨5g,酵母提取物0.5g,酪胨3g,食盐1.5g,加水900mL高温灭菌,甘氨酸10g加入100mL水单独灭菌,使用时向培养基中添加十分之一体积的10%甘氨酸)培养基中50mL/250mL三角瓶,30℃,150rpm培养4天,菌体成乳白色小团状,分装1.8mL至2mL离心管中,13000rpm离心5分钟,倒掉上清后用1.6mL的水洗涤,13000rpm离心5分钟倒掉上清,用450μL pH8.0的10mM Tris-HCl重悬菌体,加入30μL 20mg/mL的蛋白酶K,混匀,加入40μL 10%SDS,旋转混匀,40℃水浴2小时,管内液体变为透明,加入500μL酚氯仿异戊醇(25:24:1),将离心管旋转30次混匀,液体完全变为白色,14600rpm离心10分钟,用剪过的枪尖吸取上清,不要吸到白色层,转移至另一新的2mL离心管,加入500μL酚氯仿异戊醇(25:24:1),将离心管旋转30次混匀,液体完全变为白色,14600rpm离心10分钟,用剪过的枪尖吸取上清300μL,不要吸到白色层,转移至另一新的2mL离心管,加入30μL pH7.5的3M醋酸钠,混匀后加入900μL的无水乙醇,混匀,有大团的DNA出现,将其钩出置于新的离心管,加1.8mL70%乙醇洗涤,10000rpm离心1分钟,加入200μl水溶解,加RNaseA使终浓度为10μg/mL,37℃温育1小时。依次用等体积的酚氯仿异戊醇抽提两次,向水相中加入0.1体积的3M醋酸,2体积的无水乙醇,轻轻的混合充分,有絮状DNA出现。将四管DNA合并到1管(每管中有1.8mL70%乙醇用于洗涤),将液体吸出,再加1mL无水乙醇洗涤,吸出乙醇,自然晾干,溶于200μL的水中。
基因组提取后构建10kb SMRTbell DNA文库,使用PacBio RS II单分子测序,获得50X的数据量,开发适用于细菌基因组分析的软件,原始数据经过预处理去除接头、引物及低质量数据后,对细菌基因组进行de novo组装和分析,基因功能注释采用BLAST软件与NCBI的蛋白质数据库(NR)及SwissProt、KEGG、GO等4个数据库进行比对。利用生物信息学工具antiSAMSH菌株中所有的次级代谢产物合成基因簇进行分析。
济南游动放线菌的基因组大小为8,397,261bp,GC含量为70.81%,其中包含7,673个基因,基因总长度为7,170,756,基因平均长度为935bp,共预测得到19个基因簇,其中PKS/NRPS类型基因簇有6个,细菌素基因簇3个。
通过抗性基因cxm0(核苷酸序列如SEQ ID No.2所示)寻找创新霉素的生物合成基因簇。
由于创新霉素的结构与色氨酸类似,推断其是由色氨酸作为底物合成,可能与创新霉素的结构类似物吲哚霉素的基因簇一样,基因簇内部包含tryptophanyl-tRNAsynthetase,通过对基因组进行搜索,发现2个tryptophanyl-tRNA synthetase的编码基因,其中第二个编码基因cxm0与吲哚霉素生物合成的抗性基因蛋白Ind0高度同源,相似度达74.4%,它位于一个基因簇中,这个基因簇包括10个基因,1个抗性基因cxm0(核苷酸序列如SEQ ID No.2所示),1个转录调节蛋白cxm1(核苷酸序列如SEQ ID No.3所示),1个转运蛋白cxm2(核苷酸序列如SEQ ID No.4所示),7个结构基因,分别为cxm3可能为SCP(硫载体蛋白)激活蛋白基因(核苷酸序列如SEQ ID No.5所示),cxm4为SCP(硫载体蛋白)基因(核苷酸序列如SEQ ID No.6所示),cxm5为P450(核苷酸序列如SEQ ID No.7所示),cxm6为还原酶(核苷酸序列如SEQ ID No.8所示),cxm7氨基转移酶(核苷酸序列如SEQ ID No.9所示),cxm8为自由基S-腺苷甲硫氨酸甲基转移酶(核苷酸序列如SEQ ID No.10所示),cxm9可能为蛋白基因(核苷酸序列如SEQ ID No.11所示),综上推断cxm0~9这一11Kb的序列为创新霉素的生物合成基因簇。(见图1)
实施例2:创新霉素生物合成基因簇的直接克隆
济南游动放线菌提取基因组DNA后,取200μl,约300μg/μl,用EcoRV和AscⅠ进行双酶切,400μl酶切体系,37℃温育3小时后,酚氯仿抽提DNA一次,然后乙醇沉淀回收,用少量ddH2O溶解。线性克隆载体p15A-cm-HA,HA为创新霉素基因簇的同源臂,用质粒p15A-cm-tetR-ccdB-hgy扩增获得。5μg的基因组DNA与0.5μg的线性克隆载体共同电转至经过诱导重组酶表达的GB05dir中,37℃复苏1小时,涂布至含有cm的LB平板,37℃过夜培养,挑取克隆用含有cm的LB培养过夜,提取质粒后酶切鉴定,含有cxm基因簇的重组质粒p15A-cm-cxm进行酶切鉴定,挑取正确的克隆对整个基因簇进行测序,结果显示11Kb的基因序列无突变。
实施例3:创新霉素生物合成基因簇的异源表达
以pSET152为模板,扩增携带同源臂的intgrase-attP-oriT-apra,得到的PCR产物与基因簇直接克隆后的质粒p15A-cm-cxm共同转化至经过诱导表达重组酶的菌株GB05red中进行线环重组,挑取克隆酶切鉴定,得到整合有创新霉素基因簇的结合转移质粒p15A-cm-apra-cxm,将此质粒电转至结合转移供体菌ET12567/pUZ8002,质粒p15A-cm-apra-cxm通过结合转移移至天蓝色链霉菌A3(2)中并整合到其染色体的attB位点,37℃培养17h-18h后用l ml无菌水含适量抗生素和萘啶酮酸(用来抑制大肠杆菌的生长)来覆盖,倒置30℃培养7天后即可看到接合子生长,挑取克隆PCR验证,将正确的克隆接种至添加安普霉素(50μg/mL)和萘啶酮酸(25μg/mL)的M1(可溶性淀粉10g/L,酵母浸粉4g/L,蛋白胨2g/L)液体培养基进行发酵,50mL/250mL,200rpm,30℃培养7天。
创新霉素的分离纯化
用6M HCl将发酵液pH调至2~3,用等体积的乙酸乙酯萃取发酵液萃取三次,合并乙酸乙酯,减压蒸干,用1mL甲醇溶解,0.22μm膜过滤,-80℃保存。
创新霉素的分析
色谱-质谱联用(LC/MS)检测发酵产物使用的是布鲁克公司的impactHDmicroTOF-Q III系统。
LC条件:色谱柱为YMC-PACK ODS-A(C18,250×4.6mm,5μm,12nm),流动相为(水:A;Merck HPLC级乙睛:B,分别添加0.1%甲酸,(0-5min 5%B,5-45min 5%-95%,45-60min95%B,60-65min 5%B))流速为0.75ml/min,检测器DAD,柱温为25℃,质谱检测是在离子阱的负离子模式下进行,扫描范围m/z=100-1000,autoMS2,进样量3μL。
实施例4:与创新霉素生物合成相关的10个基因的同框缺失
以两侧携带PacI酶切位点的amp抗性基因为打靶载体,分别设计10对含有对应同源臂的引物,扩增后得到含有amp抗性基因、PacⅠ酶切位点及同源臂的PCR产物,与质粒p15A-cm-apra-cxm共同电转化至经过诱导表达重组酶的GB05red中,37℃复苏1小时,涂布至含有amp和apra的LB平板,37℃过夜培养,挑取克隆培养后酶切鉴定,选取正确的克隆培养后提取质粒,用PacⅠ酶切,将酶切体系用0.22μm滤膜除盐40min,用T4连接酶自身连接,4℃过夜,将T4连接体系用0.22μm滤膜除盐40min,全部涂布至含有apra的LB平板,37℃过夜培养,长出的克隆经过双划线筛选后得到除去amp抗性基因的克隆,酶切鉴定并测序,得到基因单敲除的质粒,通过结合转移转至天蓝色链霉菌A3(2)中,PCR鉴定,用M1培养基进行发酵,提取粗产物,进行LC-MS分析。
结果见图3。
序列表
<110>山东大学苏州研究院 山东大学
<120>创新霉素生物合成基因簇及其应用
<141> 2017-02-16
<160> 21
<210> 1
<211> 10917
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>创新霉素的生物合成基因簇cxm
<222>(1)…(10917)
<400> 1
ctacttcaga ccggcaaggc tgagcgcacg atccaagcgg tctcgtgacc gcgcccgagc 60
acggtcggcc ccctcagccc ggatcttcgc cagctccgat cgctcttcga ggagctgcag 120
tgcccgctca cgcaccggtg cgatcaggga gatcactgcc tctgcggctg cttccttgag 180
gtcacggtag gaatcgatac ccttcgccgc atcgctcggg agcgtgtcag tgcaggcagc 240
cctgatctcc aggaggttgg caacgcccgg ctgttcgtcc ggggcgtagc ggacggtgtt 300
ttctccgtct gtcactgcgc gttggaactt ccggcgtacg gcctccgggc tgtccaggac 360
gtagacgatg ccgctgccgt ccgaggacga cttcgacatc ttccgcgtag gggcagcgag 420
atcacgtacc cgggctgcgg ctacgggcag gacggcttgc ggaaccgtga acacctcgcc 480
gtagtccgtg ttgaaccgcc gcgccaaggt ccgggccagc tccacatgct ggttctgatc 540
gtgaccgacg ggcacctctg aagcgccatg aagcaggatg tccgccgcca tgaggacggg 600
gtaggtgagc agaccaaggc gtacggagtt gctcccctgg gacttctcct tgaactgcac 660
catccttcga gcctccccga aggtgcaggt gcactcgaga agccacgtca acgccatgtg 720
ctcctggatg aggtccgact gcacgaagag acgttcctgg ggtacgcccg ccgcgatgag 780
taaagcgagt tggtggtcgg tcagttcctg gagacgttcg gggtcgtgct tggtcgtcat 840
ggcgtgcagg ttgctgacga aatacaggtc ttcggggccc gactgtgctg cccaacgacg 900
cactgcccca aggtagttac ccaggtgcgc cttacctgaa ggcgtgatcc cggaaagact 960
gaacattggc cctgatcctc tcgtcttgac cgcatcgacg aggcgggccg accaagttca 1020
gcagcccgtc cctcggagcg gctggctggc tcggtcgagc gcaggttctt gggccgccct 1080
aggcggccca ccaacaaaga ttcctgcgca acatgatcgc gaacgtacca caactggcag 1140
gggccatcag gaagttcctg acagcccctg ctctcatcag gccggagcgg ttccggttgg 1200
tcgaggttct ccgaagagcg tcctgacggc tggatcctgg gctgcggcct gagcgcacct 1260
gacggcgagg cgtaccagtt cggagtcgga accctcacgc caggcaaggg acaaccgggc 1320
ggcaggcaca tccgtcacag ggatgaagac gacgtcctga cggtgctgga ctgccatgac 1380
agagacgggg acgagcgcgg ctgcgttctc gagggccacg aggtcgatgg cctcgtcgag 1440
gcgcgtcgct gtgggaggtt ccttccaggt gcgcttgccg gggcacacct caccacccca 1500
gaagtcggac cactcgggcg acccgccggt ggggcgaatg atcggaacct cgctcaggtc 1560
gtcgatcgac acggagtcac gactggccag ctcgtgagcc gatggcagac agacgacccg 1620
gggtaacagg gccacggtgg ccctctcgag gcccacgtag tccgcgggct ccagcacgaa 1680
ggacacgtca gcgtcccctg cctccaggca tgctgtctgt tcggtccacg gtacgtaccg 1740
gggcactacc tgatactcag ggtgcttttc gcggatgagt tcaatggtcc ggtgtgccag 1800
agggcggctg acggccgggc ggaacgcgac gacgagccgt tcgacatcct gcgaccccgc 1860
ctgccgcatc ctctcgaccg tgacctgcca ctgctgcaac aagttcctcg cgtgagtcag 1920
gaagtcgcgc ccgaccgacg tgagttcgac tctgttgccc gttctgtcca aaagctggag 1980
acccagctct ctttcgagtt gacgaatcgc cacgctcaac ggcggctgtg tcatgtgcag 2040
gcgggccgcg gctcgcgtga acccgccttc ctcggctacg gcaacgaagt acctgaggtg 2100
ccgcaaatcc agttccatat gatcagtata tggccccata cgcaacgggt attggcgtgt 2160
atgtaggcgg ctacatacga tcacccatgc aaggtgcagc tatcgaatct cagccttgac 2220
tgcggggcct gtggaaaatt ccaccggagg tcttcttgtc tttgccgtac gaagtcgctt 2280
tcagcgggtg tatcgcccca aacacaattg acggattctt tgcgcaggca gtgtttaagc 2340
ctcagtgatg tggctccggc cagtggtctc gtgactcagt aaccgccccg accacatccc 2400
cacgggggtc ccccttgtcc tacaacggca cttcgccacg tccaccgtcg atcagcgcga 2460
cgatgacgct gatcgccacc ggcgtctccg tgctgtcgta cgcactcatg cagaccatgg 2520
tcgtcccggc cttgcacgta ctacaggtgc agttacacac ggcctcgacg tggtcggcgt 2580
ggatcctgag tgtgttcctg ctgaccagtg cggcgagcac gcccttgctg agccggctgg 2640
gggaccgcta cagcaagcgc aaagttttgc tgctggttct caccacctac ctgatcggca 2700
cggtcggttg tgctgtggca ggcaatatcg gggttctgat cgcatgccgt gccgtgcagg 2760
gagtcagcct cgcggccatc cccctgtcct tcggcatcct gcgcgacgta cttcctgagc 2820
agcggctgcg ttcgggcctc gggctggtgt cagggaccat cggtgtgggg gccggcatcg 2880
gcctggtcgt gggaggtctg gtcgtcgacc accagtcatg gcgctggctg ttcgccgtcg 2940
ccgcggtact gatcctgggc gcgatcgggc tcgttgcgaa gtacgttccg gaccagcggg 3000
gcgaagccgg cgaaccggtg gacgtgcccg gggcggtgct cctggccttg gtcctcgtcg 3060
cgctgttgct cgcgttgacc aagggcacct catgggggtg ggcgtccaca ggaacgctgg 3120
ctctgttcgg ggcctccgcg gttctcctgg gattgctggt cgtagtcgaa cgaaagtcgc 3180
ccgccccctt gatcgacccc gcggtcgtgg ccggtcgctc cttcgtctcg gtgcacggtg 3240
cggcgttcgt gttcggcgtg gtctcgttcg tgttctacgt cctgctgccg acgtacgccc 3300
agaccgcggc ggatcagcgg ctaccgggcg gagggaccat cggctacggg ctcggggccg 3360
atgtcaccat ggcgggtctg ctccttctgc ccggctcatt ggtgctgttg cctgcgggac 3420
cactagcagg tctgctgcag cgcctgacgt ccgtacgcgc gacgctcgca tcaggcttcg 3480
ccgtgatggc ggtcggggcg atctcgctct gggcgtggaa tgccaacggg tggcaagtgg 3540
cggtcggtta cctggtcgta ggtctcggtt ccggactggt gctgagcgga ctcccgtcgg 3600
tgatcagcga cttgacggag gcccgacgca ccgcaaccgc caatggcgtc aacacggtgg 3660
tgcgcacggc aggcggcgtc gtaggcagtc agctggctgt cgccttgctg gctgcctggc 3720
atatctccgg ttccgatacg ccggcgcgcg acggcttcac caccgccttc tggatcgctg 3780
ccgccgtagc ggcggccgga gggctgttgt gctgggtcgg catcaagacc tccacgctcc 3840
gcggccctcg tatgccaggg gtgactgacc tgcctcgcca gagcgcaggg ggcgtacgcc 3900
catgaacgct ccgcaattcc accgactgcc cagggcctaa ggatttcacc aggaaatctc 3960
agggagggtg taaatggcag gcgtgaaaga tgcccagtat gtgacagctg ctacggatga 4020
cggtctgggt ggcacagcag acagtgcagc cctgctcgac gatctgccgg tgaccgtccg 4080
atttgaaatc gaacccgtca ggcgtttcct gagcagcgca ctgggggagt accaaaaatg 4140
cctggacagc cgcgacgccg atggcgtccc gagccatctg ccgcgtgcat cgggtctgtt 4200
gttcgggcag gtgggcggcg ctgaaatagt gatcagcgat gtggaattcg tgccgaatgt 4260
ccgggacagt gacgagagtg tcatggccga attcgaagcg acgatcgccc cgcagttcgg 4320
cgacgtgtac aagaatccgg ggcgaggatt ctggtccgat gaacagggcg tcttgcaggc 4380
gatcaggcaa cagtcggcga acggcctgga gttgctgggc tccatacatt cacatccgaa 4440
ctggcatgaa atcggcccgc cgcacgaacg gcgccagcgc ctgagcgaac atccgacaca 4500
gatggatgaa taccttttcc ggcagtcatg ctggccagtg aacgtcatct ggtacgtgca 4560
tgagagtagt ggcggtatcg cacatcgggt agcggcctgg cggcccggtg ccgagcaatg 4620
cgacaggctt gacatacgga ttccggcggc gatccatgag cagttcgaag tcctactcga 4680
ggaggaataa gaaatgcccg atgtcaaact tcccgcagcc ttccacgtcc tgaccggcgg 4740
tcggcggcag ttgcctgtcg agggcgccaa tatccgggag gtccttgtcg gtctcgacca 4800
gacctgtccg ggggtcctcg agcgactcat ggaccaggaa gggtccgtga agcgctacgt 4860
caatgtctac cggaacgaca gcgacatcag gagcctcgac ggcctcgaaa cgaaagtgga 4920
gcaccacgac gtcatctgga tagtgccggc ggtagcaggt ggcagcgaag ccgcgcgagc 4980
cgaggagtca cgatgaccga cgtgattccc acggaattct tcaccgagcc cggttcgaat 5040
ccgcacgcga cagccgcgga gtacaggtcc aagtgtccgg tccatcggat caatgttccc 5100
cccggcgccg acgcgtacgc ggtcctcggg aacaaagtcg ttgaggaagc gctcggcgac 5160
tcgcgcctct ccaagcaagt cgagaacctg cccgcccgct atcgagacaa ggccgtggcc 5220
agcagtctcc tcgtggtcgg caacctggga ttcgccgacg cgcccaaaca cacccgcctg 5280
aagaagccca tcagccgggc attcctgccg gccacggtcg cccaactacg cccgcgcatc 5340
caggacatcg tcgacgatct catcgacacc tttccggaga acggcgaaat cgacctgctc 5400
agttccttcg ctctgccgat gccgctcacc gtcatctgcg aatacctggg gataccggtg 5460
gcggaccggc cgctgtttct ggagtggagc tacatcctca gccaggaccc gttgcagcac 5520
gacgaggcgg agctgaaagc cgcgagcgaa gagttcacgg actatttcac caagctcgtg 5580
gccgagcggc gcacggacct gcgggacgac ctgctgagcg agatcatcag ggccagggac 5640
gcaggcgtat acagcgaaac agagctcctt tcgacgctcc tcctgctgat catcgccggt 5700
cacaagacgg tcgccaacat gatcggcaac ggcacagcac tgttgctccg ccatccccag 5760
cagctcgaga tgctccgagc cacccccgag ctgatccctt cggcgatcga ggagatcctg 5820
cgctacgaag ggtcggccgc ctgggcctcg ctgcgggtcg cggcggagga catgcagctc 5880
gcgggagtgg acatacccaa ggggagcttc gtacacctgt cgctgtccag cgcgggtcgt 5940
gatcccgacg tgtacgacga cccggacggt ttcgacgtga cgcggtcacc gaaccgccat 6000
ctgtccttcg gccacggtcc ccacttctgc atcggcgctc cgctgggccg actccagggc 6060
gagatcgcct tctccacgct gttgcgccga ctgccgcgat tcgagctcgc cgtgcctccg 6120
gaagaggtcg cctggctctc cgacagttcg ctcagccggg gcctcgaggc cctcccgata 6180
cgagtgggag agaggttgcc gcgatgacgg aacaaggcgg tccgagcatt gctgtggtgg 6240
gagccggcgg agtaggcggc tatttcggcg gcctgctcgc cgccgccggg catgatgtgc 6300
ggttcctggc ccgcggcgag aacctcgccg cgctcaggcg acaggggctg cgcatcacca 6360
acggctcaag tgacttacgt gtgccggacg ttcgggcgtc ggccgacccg aaggacatcg 6420
gcgaggtcga cttcgtactg ctctgcgtca agacctcaca gctgccggcg gccctcgacg 6480
cgctgggccc gctggtcggc gagcacactg ccgtggtcac ggtgcagaac ggggtggaag 6540
cccctgagca ggtcgcagcc aggatcggcc gcggtcgggt actccccggc agcgtcaggg 6600
tcgtggcctc gacggccggt ccgggcgagt tgaggcacgt gggtcccccc ggcgctctgg 6660
ccttcaccga gtgggacagc actgtgtccg accgggtggc acgactgcgc gaggtgctgc 6720
gtgctgcctc ggtgtccgtg cccgagccga gcgacatctg ggccggcctt tgggcgaagt 6780
tcctgttggt ggtcccgatc ggcagccttg gagccgccac cggcggggcg accatcggcg 6840
agctccggtc gcgcaccggc acccgcaaca ttctgatcgc cggcatgcgg gagatctacg 6900
agaccgggat caagctcgga atcgcgctgc cggcagctgc cgtggacacc gcgacagagc 6960
tcatggacca gcagtcgccc gacgtcacct cctcgctgca acgggacatc ctggcgggac 7020
ggccgtcaga gctcgaagcg tggaccgggg ccgtggtccg cctcgcccgc ggggcgggcc 7080
tgaccgcgcc ggtccacgaa atgctctacg agctgctcgc cacccgcgaa tcacgcacgg 7140
cgaggagtct gcaggcgtga acgtgagatt cgcagaacgc agcaccctgc gggacatgcg 7200
ggcctaccgg gacaaggagt cgtcgaacgc cgaaggcagc tcgcggttca ccttcgacct 7260
gtccagcaac gagctggttc tccccccgct gcctaccgtg cttgccggta tcgaaaaagg 7320
cttgccgcga cttgctcgtt accccgaccc cacagcacgg gacctgaccg aggacattgc 7380
cgggcacttg tgcgtctccc cggatgaggt cgcggtcggc cccggaagcg cgggcgtgct 7440
ccagcagatc cttctcgcac tgtgcggcaa gggcgacgaa gtcgtccatg gctggccggg 7500
attcgatgcc tatccgctgt tggtcgccat ttcaggtgcc accggagtcc acgtgcccct 7560
gactgcgtcc ggcggccacg atctcgatga gatccgcacc cgggtgaatg cgcggaccag 7620
ggtggtgatc ctgtgctccc cgcacaatcc gaccggaacc gtgattgacc aagacgagct 7680
gcacggtttc ctgcgttcgc tgccggctca tgtggtcgcg gtcctcgacg aggcgtacgt 7740
ggagttcgac cggggcgcca atcctccggg tctgccggtg ttgctgagcg agcacagcaa 7800
caccgtggta cttcgaacgt tctccaaggc ctatggcctt gccggcctac gggtcggtta 7860
cgcggccggg ccacggcagg tcatggccac cgtccgcaag acggcaatcc ctttcggagt 7920
gacgcgcttc gcggaacaag ccgcaatgct ctcgctgcgc agcgaggacg aactgtgtga 7980
acgtctggca gcagtggctg cggcacgcga agaactgacc gcggaactca gggaactgag 8040
gctgcccgtc ctgctttccc gagccaactt cgtctggctc ccgctcgctt cggccgccga 8100
gtctttcgcc cggactgcgg ctaccgcagg ggtcaaggtc cgagcctttc cggggcacgg 8160
tgtacggatc tcagtgggag aggccgaggc acatcggacg ctgttggcgg cgctcggccg 8220
ggcggaccgt gggaactggt tctgagaact ctctgcggac aattcttttg cccgtcctca 8280
tacaactcat cgacagcaac tctggggtgg gaagtctgtg aaactcctga tgatcgccat 8340
gccgtggcaa gggctcgaca cgccgtccag cgcgctgggc gtactggggc catgcgtccg 8400
caagaacgcc gccgactgga ccgtcgatga gctgtacgcc aacctccgct gggccgaata 8460
cctgatgcgg gagagcaacg gctccgtcac ctgcgaggac tacgggaaca tcgcggatca 8520
agtcttccac ggcgtagggg actgggtgtt caccccagcg ctgtacgacg tcgacagtta 8580
tcaggtcgac gagtacgcga agttcctcga gcagcgggac atggacccga cacttcccgt 8640
tgagatgcac aagtacgccc ggggattcat ccgggatctc gcggccgaga tcgctgccga 8700
tcctcccgac gtggtcgggt tcacgagcac cttcatgcag aacgtcccgt cgctcgcact 8760
ggccagggag ctgaagaaac tcgcgccggg catccgcacg gtccttggcg gcagcaactg 8820
cgacggagca caaggtcccg cgttgcaccg gaatttcgag caactcgact tcgtgatcag 8880
cggtgagggc gaacgtgcgc tgcccgcgtt gctgaatcgc atcatccggg gcgagagcct 8940
cgccgacgtg ccggggctca gctggagggg ggatgacggg catccggtgg tgaatccacc 9000
ggccacggcg gcgctgccgt tcgccatggt gcccgcgccc ggttacgaca gctactttca 9060
ggccctcgaa aggtcacccg tccgtcacca cgtccgtccg atgctggtcc ttgagacctc 9120
ccgtggttgc tggtggggag aggctcacca atgcacgttc tgcggcctga acggatcgaa 9180
tatcgacttc cggagcaagg cccctgagcg catcgcccag gaagtccggg aactggccga 9240
gcgacaccag atcctcgacc tggtcatggt ggacaacatc ctcgacatga agtatctcaa 9300
tacggccatg cccgagatag ctgccctcga ctgcgatctg cgaattcact acgagatcaa 9360
gtccaatatg aaccgggagc agttgagtag gctgaaagag gcgaacgtcc tcttcgtgca 9420
gcccggtatc gagagcctga gcagccatgt gctgcgcctc atggacaagg gcgtcagtgc 9480
cgcgcacaac gtacggatgc tgcgtgacgg acaggatctc gggctcaacg tgacatggag 9540
catcctctac ggcttcccgg gcgagaccga ggacgactac cgcgggctgc tcaagaaatt 9600
ggccacgctc gagcacctgg agccgccaac cggggcttgg cgcatagccc ttgagcggtt 9660
cagtccctac ttcgaggacc ccacccaggg gttcatgttc cgccgcccct cggaaatata 9720
cgacttcatc taccagatcc cgcaggatca gctgtacgac atggtgttct tcttcgacac 9780
cagcgtccgg ggaatctcag ggcccatcga ggacgagatg aagcaggcct gcgaggaatg 9840
ggccaaggcc tatccgcagg gcaccctttc ctactggacc gatgaccgag gccgggtcgt 9900
catcgaagac cgccgtgcca gctggccgac ggaagtgatc gagctggacg aggtccgcag 9960
caatgtgtac ctcggcatgt tccagtgcgc cgcccgcgag ggcatacgcc ggcggcttgc 10020
cgacagcggg cacgtcgtcg gggaagcgga actcgaggaa atgctccgct acttcgtcga 10080
tcgcggcctg gcattcgagg acgaggggcg ctacgtaagc gtcgccctcg gggttgaccc 10140
gtatcgccga aagctggtcg gcggcaagga ggtggcggct tcgctatgag cgctttgctg 10200
gacatcgatg aactcaaggc ccgagattcg gacgagggac gggtaccggc cggtggccgt 10260
cccgcgaccg agacgctgac cctcggactc gaccgggccg aacttcccgt cgccaccgaa 10320
ctggcggcgc tactgcaccg ggtgcccgtc gccggggtac ggctgccgga gcccgccgac 10380
ttctcggcac tccccagtca cgtgatcgtg cggatcatcg cgttgattcg cgaatgttcc 10440
tcgatcggca ccagagtcac ctggtcactg accctgggcg ccgaacagct cgacctggtc 10500
ccccgtctcg atcaccttcc tgcccccgac agcatcacgg tgctggagac agggcatccg 10560
tccgtcggtg agtggcggtc ctccagcaat ttcggcctcc tctacttccg taagggcccg 10620
aagttcctgt ccgtcgtcga tcagcgcccc gaatccagcc gcgaaatcat cgtggacgat 10680
cccacccaga tggccgtctt cctcctgggc ctggagggat gcgcgtgggc cgaggtgacc 10740
cgaaactcgc aattcgccgc cgccgcacgc gatttggtga acaagggcct tgtgatgcgc 10800
gtcggggatc actgcgtgac cctccccgtg cacatgcgtt catggcccct gggcgcggcc 10860
ctattgggag gaaccttggc cgcagccggc aagaaatcgg acggtgctac ggagtag 10917
<210> 2
<211>840
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>抗性蛋白基因cxm0
<222>(1)…(840)
<400> 2
ctacttcaga ccggcaaggc tgagcgcacg atccaagcgg tctcgtgacc gcgcccgagc 60
acggtcggcc ccctcagccc ggatcttcgc cagctccgat cgctcttcga ggagctgcag 120
tgcccgctca cgcaccggtg cgatcaggga gatcactgcc tctgcggctg cttccttgag 180
gtcacggtag gaatcgatac ccttcgccgc atcgctcggg agcgtgtcag tgcaggcagc 240
cctgatctcc aggaggttgg caacgcccgg ctgttcgtcc ggggcgtagc ggacggtgtt 300
ttctccgtct gtcactgcgc gttggaactt ccggcgtacg gcctccgggc tgtccaggac 360
gtagacgatg ccgctgccgt ccgaggacga cttcgacatc ttccgcgtag gggcagcgag 420
atcacgtacc cgggctgcgg ctacgggcag gacggcttgc ggaaccgtga acacctcgcc 480
gtagtccgtg ttgaaccgcc gcgccaaggt ccgggccagc tccacatgct ggttctgatc 540
gtgaccgacg ggcacctctg aagcgccatg aagcaggatg tccgccgcca tgaggacggg 600
gtaggtgagc agaccaaggc gtacggagtt gctcccctgg gacttctcct tgaactgcac 660
catccttcga gcctccccga aggtgcaggt gcactcgaga agccacgtca acgccatgtg 720
ctcctggatg aggtccgact gcacgaagag acgttcctgg ggtacgcccg ccgcgatgag 780
taaagcgagt tggtggtcgg tcagttcctg gagacgttcg gggtcgtgct tggtcgtcat 840
<210> 3
<211> 942
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>转录调控蛋白基因cxm1
<222>(1)…(942)
<400> 3
tcaggccgga gcggttccgg ttggtcgagg ttctccgaag agcgtcctga cggctggatc 60
ctgggctgcg gcctgagcgc acctgacggc gaggcgtacc agttcggagt cggaaccctc 120
acgccaggca agggacaacc gggcggcagg cacatccgtc acagggatga agacgacgtc 180
ctgacggtgc tggactgcca tgacagagac ggggacgagc gcggctgcgt tctcgagggc 240
cacgaggtcg atggcctcgt cgaggcgcgt cgctgtggga ggttccttcc aggtgcgctt 300
gccggggcac acctcaccac cccagaagtc ggaccactcg ggcgacccgc cggtggggcg 360
aatgatcgga acctcgctca ggtcgtcgat cgacacggag tcacgactgg ccagctcgtg 420
agccgatggc agacagacga cccggggtaa cagggccacg gtggccctct cgaggcccac 480
gtagtccgcg ggctccagca cgaaggacac gtcagcgtcc cctgcctcca ggcatgctgt 540
ctgttcggtc cacggtacgt accggggcac tacctgatac tcagggtgct tttcgcggat 600
gagttcaatg gtccggtgtg ccagagggcg gctgacggcc gggcggaacg cgacgacgag 660
ccgttcgaca tcctgcgacc ccgcctgccg catcctctcg accgtgacct gccactgctg 720
caacaagttc ctcgcgtgag tcaggaagtc gcgcccgacc gacgtgagtt cgactctgtt 780
gcccgttctg tccaaaagct ggagacccag ctctctttcg agttgacgaa tcgccacgct 840
caacggcggc tgtgtcatgt gcaggcgggc cgcggctcgc gtgaacccgc cttcctcggc 900
tacggcaacg aagtacctga ggtgccgcaa atccagttcc at 942
<210> 4
<211> 1443
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>转运蛋白基因cxm2
<222>(1)…(1443)
<400> 4
atgacgctga tcgccaccgg cgtctccgtg ctgtcgtacg cactcatgca gaccatggtc 60
gtcccggcct tgcacgtact acaggtgcag ttacacacgg cctcgacgtg gtcggcgtgg 120
atcctgagtg tgttcctgct gaccagtgcg gcgagcacgc ccttgctgag ccggctgggg 180
gaccgctaca gcaagcgcaa agttttgctg ctggttctca ccacctacct gatcggcacg 240
gtcggttgtg ctgtggcagg caatatcggg gttctgatcg catgccgtgc cgtgcaggga 300
gtcagcctcg cggccatccc cctgtccttc ggcatcctgc gcgacgtact tcctgagcag 360
cggctgcgtt cgggcctcgg gctggtgtca gggaccatcg gtgtgggggc cggcatcggc 420
ctggtcgtgg gaggtctggt cgtcgaccac cagtcatggc gctggctgtt cgccgtcgcc 480
gcggtactga tcctgggcgc gatcgggctc gttgcgaagt acgttccgga ccagcggggc 540
gaagccggcg aaccggtgga cgtgcccggg gcggtgctcc tggccttggt cctcgtcgcg 600
ctgttgctcg cgttgaccaa gggcacctca tgggggtggg cgtccacagg aacgctggct 660
ctgttcgggg cctccgcggt tctcctggga ttgctggtcg tagtcgaacg aaagtcgccc 720
gcccccttga tcgaccccgc ggtcgtggcc ggtcgctcct tcgtctcggt gcacggtgcg 780
gcgttcgtgt tcggcgtggt ctcgttcgtg ttctacgtcc tgctgccgac gtacgcccag 840
accgcggcgg atcagcggct accgggcgga gggaccatcg gctacgggct cggggccgat 900
gtcaccatgg cgggtctgct ccttctgccc ggctcattgg tgctgttgcc tgcgggacca 960
ctagcaggtc tgctgcagcg cctgacgtcc gtacgcgcga cgctcgcatc aggcttcgcc 1020
gtgatggcgg tcggggcgat ctcgctctgg gcgtggaatg ccaacgggtg gcaagtggcg 1080
gtcggttacc tggtcgtagg tctcggttcc ggactggtgc tgagcggact cccgtcggtg 1140
atcagcgact tgacggaggc ccgacgcacc gcaaccgcca atggcgtcaa cacggtggtg 1200
cgcacggcag gcggcgtcgt aggcagtcag ctggctgtcg ccttgctggc tgcctggcat 1260
atctccggtt ccgatacgcc ggcgcgcgac ggcttcacca ccgccttctg gatcgctgcc 1320
gccgtagcgg cggccggagg gctgttgtgc tgggtcggca tcaagacctc cacgctccgc 1380
ggccctcgta tgccaggggt gactgacctg cctcgccaga gcgcaggggg cgtacgccca 1440
tga 1443
<210> 5
<211> 621
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>巯基转运蛋白(sulfur carrier protein)激活蛋白基因cxm3
<222>(1)…(621)
<400> 5
gtgaccgtcc gatttgaaat cgaacccgtc aggcgtttcc tgagcagcgc actgggggag 60
taccaaaaat gcctggacag ccgcgacgcc gatggcgtcc cgagccatct gccgcgtgca 120
tcgggtctgt tgttcgggca ggtgggcggc gctgaaatag tgatcagcga tgtggaattc 180
gtgccgaatg tccgggacag tgacgagagt gtcatggccg aattcgaagc gacgatcgcc 240
ccgcagttcg gcgacgtgta caagaatccg gggcgaggat tctggtccga tgaacagggc 300
gtcttgcagg cgatcaggca acagtcggcg aacggcctgg agttgctggg ctccatacat 360
tcacatccga actggcatga aatcggcccg ccgcacgaac ggcgccagcg cctgagcgaa 420
catccgacac agatggatga ataccttttc cggcagtcat gctggccagt gaacgtcatc 480
tggtacgtgc atgagagtag tggcggtatc gcacatcggg tagcggcctg gcggcccggt 540
gccgagcaat gcgacaggct tgacatacgg attccggcgg cgatccatga gcagttcgaa 600
gtcctactcg aggaggaata a 621
<210> 6
<211> 303
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>巯基转运蛋白(sulfur carrier protein)基因cxm4
<222>(1)…(303)
<400> 6
atgcccgatg tcaaacttcc cgcagccttc cacgtcctga ccggcggtcg gcggcagttg 60
cctgtcgagg gcgccaatat ccgggaggtc cttgtcggtc tcgaccagac ctgtccgggg 120
gtcctcgagc gactcatgga ccaggaaggg tccgtgaagc gctacgtcaa tgtctaccgg 180
aacgacagcg acatcaggag cctcgacggc ctcgaaacga aagtggagca ccacgacgtc 240
atctggatag tgccggcggt agcaggtggc agcgaagccg cgcgagccga ggagtcacga 300
tga 303
<210> 7
<211> 1215
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>细胞色素P450酶基因cxm5
<222>(1)…(1215)
<400> 7
atgaccgacg tgattcccac ggaattcttc accgagcccg gttcgaatcc gcacgcgaca 60
gccgcggagt acaggtccaa gtgtccggtc catcggatca atgttccccc cggcgccgac 120
gcgtacgcgg tcctcgggaa caaagtcgtt gaggaagcgc tcggcgactc gcgcctctcc 180
aagcaagtcg agaacctgcc cgcccgctat cgagacaagg ccgtggccag cagtctcctc 240
gtggtcggca acctgggatt cgccgacgcg cccaaacaca cccgcctgaa gaagcccatc 300
agccgggcat tcctgccggc cacggtcgcc caactacgcc cgcgcatcca ggacatcgtc 360
gacgatctca tcgacacctt tccggagaac ggcgaaatcg acctgctcag ttccttcgct 420
ctgccgatgc cgctcaccgt catctgcgaa tacctgggga taccggtggc ggaccggccg 480
ctgtttctgg agtggagcta catcctcagc caggacccgt tgcagcacga cgaggcggag 540
ctgaaagccg cgagcgaaga gttcacggac tatttcacca agctcgtggc cgagcggcgc 600
acggacctgc gggacgacct gctgagcgag atcatcaggg ccagggacgc aggcgtatac 660
agcgaaacag agctcctttc gacgctcctc ctgctgatca tcgccggtca caagacggtc 720
gccaacatga tcggcaacgg cacagcactg ttgctccgcc atccccagca gctcgagatg 780
ctccgagcca cccccgagct gatcccttcg gcgatcgagg agatcctgcg ctacgaaggg 840
tcggccgcct gggcctcgct gcgggtcgcg gcggaggaca tgcagctcgc gggagtggac 900
atacccaagg ggagcttcgt acacctgtcg ctgtccagcg cgggtcgtga tcccgacgtg 960
tacgacgacc cggacggttt cgacgtgacg cggtcaccga accgccatct gtccttcggc 1020
cacggtcccc acttctgcat cggcgctccg ctgggccgac tccagggcga gatcgccttc 1080
tccacgctgt tgcgccgact gccgcgattc gagctcgccg tgcctccgga agaggtcgcc 1140
tggctctccg acagttcgct cagccggggc ctcgaggccc tcccgatacg agtgggagag 1200
aggttgccgc gatga 1215
<210> 8
<211> 927
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>酮泛解酸还原酶基因cxm6
<222>(1)…(927)
<400> 8
gtggtgggag ccggcggagt aggcggctat ttcggcggcc tgctcgccgc cgccgggcat 60
gatgtgcggt tcctggcccg cggcgagaac ctcgccgcgc tcaggcgaca ggggctgcgc 120
atcaccaacg gctcaagtga cttacgtgtg ccggacgttc gggcgtcggc cgacccgaag 180
gacatcggcg aggtcgactt cgtactgctc tgcgtcaaga cctcacagct gccggcggcc 240
ctcgacgcgc tgggcccgct ggtcggcgag cacactgccg tggtcacggt gcagaacggg 300
gtggaagccc ctgagcaggt cgcagccagg atcggccgcg gtcgggtact ccccggcagc 360
gtcagggtcg tggcctcgac ggccggtccg ggcgagttga ggcacgtggg tccccccggc 420
gctctggcct tcaccgagtg ggacagcact gtgtccgacc gggtggcacg actgcgcgag 480
gtgctgcgtg ctgcctcggt gtccgtgccc gagccgagcg acatctgggc cggcctttgg 540
gcgaagttcc tgttggtggt cccgatcggc agccttggag ccgccaccgg cggggcgacc 600
atcggcgagc tccggtcgcg caccggcacc cgcaacattc tgatcgccgg catgcgggag 660
atctacgaga ccgggatcaa gctcggaatc gcgctgccgg cagctgccgt ggacaccgcg 720
acagagctca tggaccagca gtcgcccgac gtcacctcct cgctgcaacg ggacatcctg 780
gcgggacggc cgtcagagct cgaagcgtgg accggggccg tggtccgcct cgcccgcggg 840
gcgggcctga ccgcgccggt ccacgaaatg ctctacgagc tgctcgccac ccgcgaatca 900
cgcacggcga ggagtctgca ggcgtga 927
<210> 9
<211> 1089
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221> 5-磷酸吡哆醛(PLP)依赖型氨基转移酶基因cxm7
<222>(1)…(1089)
<400> 9
gtgaacgtga gattcgcaga acgcagcacc ctgcgggaca tgcgggccta ccgggacaag 60
gagtcgtcga acgccgaagg cagctcgcgg ttcaccttcg acctgtccag caacgagctg 120
gttctccccc cgctgcctac cgtgcttgcc ggtatcgaaa aaggcttgcc gcgacttgct 180
cgttaccccg accccacagc acgggacctg accgaggaca ttgccgggca cttgtgcgtc 240
tccccggatg aggtcgcggt cggccccgga agcgcgggcg tgctccagca gatccttctc 300
gcactgtgcg gcaagggcga cgaagtcgtc catggctggc cgggattcga tgcctatccg 360
ctgttggtcg ccatttcagg tgccaccgga gtccacgtgc ccctgactgc gtccggcggc 420
cacgatctcg atgagatccg cacccgggtg aatgcgcgga ccagggtggt gatcctgtgc 480
tccccgcaca atccgaccgg aaccgtgatt gaccaagacg agctgcacgg tttcctgcgt 540
tcgctgccgg ctcatgtggt cgcggtcctc gacgaggcgt acgtggagtt cgaccggggc 600
gccaatcctc cgggtctgcc ggtgttgctg agcgagcaca gcaacaccgt ggtacttcga 660
acgttctcca aggcctatgg ccttgccggc ctacgggtcg gttacgcggc cgggccacgg 720
caggtcatgg ccaccgtccg caagacggca atccctttcg gagtgacgcg cttcgcggaa 780
caagccgcaa tgctctcgct gcgcagcgag gacgaactgt gtgaacgtct ggcagcagtg 840
gctgcggcac gcgaagaact gaccgcggaa ctcagggaac tgaggctgcc cgtcctgctt 900
tcccgagcca acttcgtctg gctcccgctc gcttcggccg ccgagtcttt cgcccggact 960
gcggctaccg caggggtcaa ggtccgagcc tttccggggc acggtgtacg gatctcagtg 1020
ggagaggccg aggcacatcg gacgctgttg gcggcgctcg gccgggcgga ccgtgggaac 1080
tggttctga 1089
<210> 10
<211> 1872
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>自由基S-腺苷甲硫氨酸甲基转移酶基因cxm8
<222>(1)…(1872)
<400> 10
gtgaaactcc tgatgatcgc catgccgtgg caagggctcg acacgccgtc cagcgcgctg 60
ggcgtactgg ggccatgcgt ccgcaagaac gccgccgact ggaccgtcga tgagctgtac 120
gccaacctcc gctgggccga atacctgatg cgggagagca acggctccgt cacctgcgag 180
gactacggga acatcgcgga tcaagtcttc cacggcgtag gggactgggt gttcacccca 240
gcgctgtacg acgtcgacag ttatcaggtc gacgagtacg cgaagttcct cgagcagcgg 300
gacatggacc cgacacttcc cgttgagatg cacaagtacg cccggggatt catccgggat 360
ctcgcggccg agatcgctgc cgatcctccc gacgtggtcg ggttcacgag caccttcatg 420
cagaacgtcc cgtcgctcgc actggccagg gagctgaaga aactcgcgcc gggcatccgc 480
acggtccttg gcggcagcaa ctgcgacgga gcacaaggtc ccgcgttgca ccggaatttc 540
gagcaactcg acttcgtgat cagcggtgag ggcgaacgtg cgctgcccgc gttgctgaat 600
cgcatcatcc ggggcgagag cctcgccgac gtgccggggc tcagctggag gggggatgac 660
gggcatccgg tggtgaatcc accggccacg gcggcgctgc cgttcgccat ggtgcccgcg 720
cccggttacg acagctactt tcaggccctc gaaaggtcac ccgtccgtca ccacgtccgt 780
ccgatgctgg tccttgagac ctcccgtggt tgctggtggg gagaggctca ccaatgcacg 840
ttctgcggcc tgaacggatc gaatatcgac ttccggagca aggcccctga gcgcatcgcc 900
caggaagtcc gggaactggc cgagcgacac cagatcctcg acctggtcat ggtggacaac 960
atcctcgaca tgaagtatct caatacggcc atgcccgaga tagctgccct cgactgcgat 1020
ctgcgaattc actacgagat caagtccaat atgaaccggg agcagttgag taggctgaaa 1080
gaggcgaacg tcctcttcgt gcagcccggt atcgagagcc tgagcagcca tgtgctgcgc 1140
ctcatggaca agggcgtcag tgccgcgcac aacgtacgga tgctgcgtga cggacaggat 1200
ctcgggctca acgtgacatg gagcatcctc tacggcttcc cgggcgagac cgaggacgac 1260
taccgcgggc tgctcaagaa attggccacg ctcgagcacc tggagccgcc aaccggggct 1320
tggcgcatag cccttgagcg gttcagtccc tacttcgagg accccaccca ggggttcatg 1380
ttccgccgcc cctcggaaat atacgacttc atctaccaga tcccgcagga tcagctgtac 1440
gacatggtgt tcttcttcga caccagcgtc cggggaatct cagggcccat cgaggacgag 1500
atgaagcagg cctgcgagga atgggccaag gcctatccgc agggcaccct ttcctactgg 1560
accgatgacc gaggccgggt cgtcatcgaa gaccgccgtg ccagctggcc gacggaagtg 1620
atcgagctgg acgaggtccg cagcaatgtg tacctcggca tgttccagtg cgccgcccgc 1680
gagggcatac gccggcggct tgccgacagc gggcacgtcg tcggggaagc ggaactcgag 1740
gaaatgctcc gctacttcgt cgatcgcggc ctggcattcg aggacgaggg gcgctacgta 1800
agcgtcgccc tcggggttga cccgtatcgc cgaaagctgg tcggcggcaa ggaggtggcg 1860
gcttcgctat ga 1872
<210> 11
<211> 732
<212> DNA
<213>济南游动放线菌(Actinoplanes tsinanensis)
<221>自由基S-腺苷甲硫氨酸蛋白基因cxm9
<222>(1)…(732)
<400> 11
atgagcgctt tgctggacat cgatgaactc aaggcccgag attcggacga gggacgggta 60
ccggccggtg gccgtcccgc gaccgagacg ctgaccctcg gactcgaccg ggccgaactt 120
cccgtcgcca ccgaactggc ggcgctactg caccgggtgc ccgtcgccgg ggtacggctg 180
ccggagcccg ccgacttctc ggcactcccc agtcacgtga tcgtgcggat catcgcgttg 240
attcgcgaat gttcctcgat cggcaccaga gtcacctggt cactgaccct gggcgccgaa 300
cagctcgacc tggtcccccg tctcgatcac cttcctgccc ccgacagcat cacggtgctg 360
gagacagggc atccgtccgt cggtgagtgg cggtcctcca gcaatttcgg cctcctctac 420
ttccgtaagg gcccgaagtt cctgtccgtc gtcgatcagc gccccgaatc cagccgcgaa 480
atcatcgtgg acgatcccac ccagatggcc gtcttcctcc tgggcctgga gggatgcgcg 540
tgggccgagg tgacccgaaa ctcgcaattc gccgccgccg cacgcgattt ggtgaacaag 600
ggccttgtga tgcgcgtcgg ggatcactgc gtgaccctcc ccgtgcacat gcgttcatgg 660
cccctgggcg cggccctatt gggaggaacc ttggccgcag ccggcaagaa atcggacggt 720
gctacggagt ag 732
<210> 12
<211> 279
<212> PRT
<213> 人工序列
<221>抗性蛋白Cxm0氨基酸序列
<222>(1)…(279)
<400> 12
MTTKHDPERL QELTDHQLAL LIAAGVPQER LFVQSDLIQE HMALTWLLEC TCTFGEARRM 60
VQFKEKSQGS NSVRLGLLTY PVLMAADILL HGASEVPVGH DQNQHVELAR TLARRFNTDY 120
GEVFTVPQAV LPVAAARVRD LAAPTRKMSK SSSDGSGIVY VLDSPEAVRR KFQRAVTDGE 180
NTVRYAPDEQ PGVANLLEIR AACTDTLPSD AAKGIDSYRD LKEAAAEAVI SLIAPVRERA 240
LQLLEERSEL AKIRAEGADR ARARSRDRLD RALSLAGLK 279
<210> 13
<211> 313
<212> PRT
<213> 人工序列
<221>转录调控蛋白Cxm1氨基酸序列
<222>(1)…(313)
<400> 13
MELDLRHLRY FVAVAEEGGF TRAAARLHMT QPPLSVAIRQ LERELGLQLL DRTGNRVELT 60
SVGRDFLTHA RNLLQQWQVT VERMRQAGSQ DVERLVVAFR PAVSRPLAHR TIELIREKHP 120
EYQVVPRYVP WTEQTACLEA GDADVSFVLE PADYVGLERA TVALLPRVVC LPSAHELASR 180
DSVSIDDLSE VPIIRPTGGS PEWSDFWGGE VCPGKRTWKE PPTATRLDEA IDLVALENAA 240
ALVPVSVMAV QHRQDVVFIP VTDVPAARLS LAWREGSDSE LVRLAVRCAQ AAAQDPAVRT 300
LFGEPRPTGT APA 313
<210> 14
<211> 480
<212> PRT
<213> 人工序列
<221>转运蛋白Cxm2氨基酸序列
<222>(1)…(480)
<400> 14
MTLIATGVSV LSYALMQTMV VPALHVLQVQ LHTASTWSAW ILSVFLLTSA ASTPLLSRLG 60
DRYSKRKVLL LVLTTYLIGT VGCAVAGNIG VLIACRAVQG VSLAAIPLSF GILRDVLPEQ 120
RLRSGLGLVS GTIGVGAGIG LVVGGLVVDH QSWRWLFAVA AVLILGAIGL VAKYVPDQRG 180
EAGEPVDVPG AVLLALVLVA LLLALTKGTS WGWASTGTLA LFGASAVLLG LLVVVERKSP 240
APLIDPAVVA GRSFVSVHGA AFVFGVVSFV FYVLLPTYAQ TAADQRLPGG GTIGYGLGAD 300
VTMAGLLLLP GSLVLLPAGP LAGLLQRLTS VRATLASGFA VMAVGAISLW AWNANGWQVA 360
VGYLVVGLGS GLVLSGLPSV ISDLTEARRT ATANGVNTVV RTAGGVVGSQ LAVALLAAWH 420
ISGSDTPARD GFTTAFWIAA AVAAAGGLLC WVGIKTSTLR GPRMPGVTDL PRQSAGGVRP 480
<210> 15
<211> 206
<212> PRT
<213> 人工序列
<221>巯基转运蛋白激活蛋白Cxm3氨基酸序列
<222>(1)…(206)
<400> 15
VTVRFEIEPV RRFLSSALGE YQKCLDSRDA DGVPSHLPRA SGLLFGQVGG AEIVISDVEF 60
VPNVRDSDES VMAEFEATIA PQFGDVYKNP GRGFWSDEQG VLQAIRQQSA NGLELLGSIH 120
SHPNWHEIGP PHERRQRLSE HPTQMDEYLF RQSCWPVNVI WYVHESSGGI AHRVAAWRPG 180
AEQCDRLDIR IPAAIHEQFE VLLEEE 206
<210> 16
<211> 100
<212> PRT
<213> 人工序列
<221>巯基转运蛋白Cxm4氨基酸序列
<222>(1)…(100)
<400> 16
MPDVKLPAAF HVLTGGRRQL PVEGANIREV LVGLDQTCPG VLERLMDQEG SVKRYVNVYR 60
NDSDIRSLDG LETKVEHHDV IWIVPAVAGG SEAARAEESR 100
<210> 17
<211> 404
<212> PRT
<213> 人工序列
<221>细胞色素P450 Cxm5氨基酸序列
<222>(1)…(404)
<400> 17
MTDVIPTEFF TEPGSNPHAT AAEYRSKCPV HRINVPPGAD AYAVLGNKVV EEALGDSRLS 60
KQVENLPARY RDKAVASSLL VVGNLGFADA PKHTRLKKPI SRAFLPATVA QLRPRIQDIV 120
DDLIDTFPEN GEIDLLSSFA LPMPLTVICE YLGIPVADRP LFLEWSYILS QDPLQHDEAE 180
LKAASEEFTD YFTKLVAERR TDLRDDLLSE IIRARDAGVY SETELLSTLL LLIIAGHKTV 240
ANMIGNGTAL LLRHPQQLEM LRATPELIPS AIEEILRYEG SAAWASLRVA AEDMQLAGVD 300
IPKGSFVHLS LSSAGRDPDV YDDPDGFDVT RSPNRHLSFG HGPHFCIGAP LGRLQGEIAF 360
STLLRRLPRF ELAVPPEEVA WLSDSSLSRG LEALPIRVGE RLPR 404
<210> 18
<211> 308
<212> PRT
<213> 人工序列
<221>酮泛解酸还原酶Cxm6氨基酸序列
<222>(1)…(308)
<400> 18
VVGAGGVGGY FGGLLAAAGH DVRFLARGEN LAALRRQGLR ITNGSSDLRV PDVRASADPK 60
DIGEVDFVLL CVKTSQLPAA LDALGPLVGE HTAVVTVQNG VEAPEQVAAR IGRGRVLPGS 120
VRVVASTAGP GELRHVGPPG ALAFTEWDST VSDRVARLRE VLRAASVSVP EPSDIWAGLW 180
AKFLLVVPIG SLGAATGGAT IGELRSRTGT RNILIAGMRE IYETGIKLGI ALPAAAVDTA 240
TELMDQQSPD VTSSLQRDIL AGRPSELEAW TGAVVRLARG AGLTAPVHEM LYELLATRES 300
RTARSLQA 308
<210> 19
<211> 362
<212> PRT
<213> 人工序列
<221>5-磷酸吡哆醛(PLP)依赖型氨基转移酶Cxm7氨基酸序列
<222>(1)…(362)
<400> 19
VNVRFAERST LRDMRAYRDK ESSNAEGSSR FTFDLSSNEL VLPPLPTVLA GIEKGLPRLA 60
RYPDPTARDL TEDIAGHLCV SPDEVAVGPG SAGVLQQILL ALCGKGDEVV HGWPGFDAYP 120
LLVAISGATG VHVPLTASGG HDLDEIRTRV NARTRVVILC SPHNPTGTVI DQDELHGFLR 180
SLPAHVVAVL DEAYVEFDRG ANPPGLPVLL SEHSNTVVLR TFSKAYGLAG LRVGYAAGPR 240
QVMATVRKTA IPFGVTRFAE QAAMLSLRSE DELCERLAAV AAAREELTAE LRELRLPVLL 300
SRANFVWLPL ASAAESFART AATAGVKVRA FPGHGVRISV GEAEAHRTLL AALGRADRGN 360
WF 362
<210> 20
<211> 623
<212> PRT
<213> 人工序列
<221>自由基S-腺苷甲硫氨酸甲基转移酶Cxm8氨基酸序列
<222>(1)…(623)
<400> 20
VKLLMIAMPW QGLDTPSSAL GVLGPCVRKN AADWTVDELY ANLRWAEYLM RESNGSVTCE 60
DYGNIADQVF HGVGDWVFTP ALYDVDSYQV DEYAKFLEQR DMDPTLPVEM HKYARGFIRD 120
LAAEIAADPP DVVGFTSTFM QNVPSLALAR ELKKLAPGIR TVLGGSNCDG AQGPALHRNF 180
EQLDFVISGE GERALPALLN RIIRGESLAD VPGLSWRGDD GHPVVNPPAT AALPFAMVPA 240
PGYDSYFQAL ERSPVRHHVR PMLVLETSRG CWWGEAHQCT FCGLNGSNID FRSKAPERIA 300
QEVRELAERH QILDLVMVDN ILDMKYLNTA MPEIAALDCD LRIHYEIKSN MNREQLSRLK 360
EANVLFVQPG IESLSSHVLR LMDKGVSAAH NVRMLRDGQD LGLNVTWSIL YGFPGETEDD 420
YRGLLKKLAT LEHLEPPTGA WRIALERFSP YFEDPTQGFM FRRPSEIYDF IYQIPQDQLY 480
DMVFFFDTSV RGISGPIEDE MKQACEEWAK AYPQGTLSYW TDDRGRVVIE DRRASWPTEV 540
IELDEVRSNV YLGMFQCAAR EGIRRRLADS GHVVGEAELE EMLRYFVDRG LAFEDEGRYV 600
SVALGVDPYR RKLVGGKEVA ASL 623
<210> 21
<211> 243
<212> PRT
<213> 人工序列
<221>自由基S-腺苷甲硫氨酸蛋白基因Cxm9氨基酸序列
<222>(1)…(243)
<400> 21
MSALLDIDEL KARDSDEGRV PAGGRPATET LTLGLDRAEL PVATELAALL HRVPVAGVRL 60
PEPADFSALP SHVIVRIIAL IRECSSIGTR VTWSLTLGAE QLDLVPRLDH LPAPDSITVL 120
ETGHPSVGEW RSSSNFGLLY FRKGPKFLSV VDQRPESSRE IIVDDPTQMA VFLLGLEGCA 180
WAEVTRNSQF AAAARDLVNK GLVMRVGDHC VTLPVHMRSW PLGAALLGGT LAAAGKKSDG 240
ATE 243
1
Claims (9)
1.一种创新霉素的生物合成基因簇,其特征在于,所述基因簇的核苷酸序列如SEQ IDNo.1所示,命名为cxm;其包含编码创新霉素生物合成所涉及的10个基因,其中7个是与生物合成相关基因,1个是调控基因,1个抗性基因,1个是转运基因,所述基因的核苷酸序列如SEQ ID No.2~SEQ ID No.11所示,具体是:
(1)抗性蛋白基因,该基因的核苷酸序列如SEQ ID No.2所示,命名为cxm0,其位于基因簇核苷酸序列第1-966个碱基处,长度为966个碱基对,编码一个色氨酰tRNA合成酶,321个氨基酸,序列如SEQ ID No.12所示;
(2)转录调控蛋白基因,该基因的核苷酸序列如SEQ ID No.3所示,命名为Cxm1,其位于基因簇核苷酸序列第1177-2199个碱基处,长度为1023个碱基对,编码一个LysR家族转录调控蛋白,340个氨基酸,序列如SEQ ID No.13所示;
(3)转运蛋白基因,该基因的核苷酸序列如SEQ ID No.4所示,命名为Cxm2,其位于基因簇核苷酸序列第2415-3905个碱基处,长度为1491个碱基对,编码一个转运蛋白,496个氨基酸,序列如SEQ ID No.14所示;
(4)巯基转运蛋白(sulfur carrier protein)激活蛋白基因,该基因的核苷酸序列如SEQ ID No.5所示,命名为cxm3,其位于基因簇核苷酸序列第3974-4690个碱基处,长度为717个碱基对,编码一个功能未知蛋白,238个氨基酸,序列如SEQ ID No.15所示;
(5)巯基转运蛋白(sulfur carrier protein)基因,该基因的核苷酸序列如SEQ IDNo.6所示,命名为cxm4,其位于基因簇核苷酸序列第4694-4996个碱基处,长度为303个碱基对,编码一个巯基转运蛋白,100个氨基酸,序列如SEQ ID No.16所示;
(6)细胞色素P450酶基因,该基因的核苷酸序列如SEQ ID No.7所示,命名为cxm5,其位于基因簇核苷酸序列第4993-6207个碱基处,长度为1215个碱基对,编码一个细胞色素P450酶,404个氨基酸,序列如SEQ ID No.17所示;
(7)酮泛解酸还原酶基因,该基因的核苷酸序列如SEQ ID No.8所示,命名为cxm6,其位于基因簇核苷酸序列第6204-7160个碱基处,长度为957个碱基对,编码一个细胞色素P450酶,318个氨基酸,序列如SEQ ID No.18所示;
(8)5-磷酸吡哆醛(PLP)依赖型氨基转移酶基因,该基因的核苷酸序列如SEQ ID No.9所示,命名为cxm7,其位于基因簇核苷酸序列第7157-8245个碱基处,长度为1089个碱基对,编码一个PLP依赖型氨基转移酶,362个氨基酸,序列如SEQ ID No.19所示;
(9)自由基S-腺苷甲硫氨酸甲基转移酶基因,该基因的核苷酸序列如SEQ ID No.10所示,命名为cxm8,其位于基因簇核苷酸序列第8318-10189个碱基处,长度为1872个碱基对,编码一个自由基S-腺苷甲硫氨酸甲基转移酶,623个氨基酸,序列如SEQ ID No.20所示;
(10)自由基S-腺苷甲硫氨酸蛋白基因,该基因的核苷酸序列如SEQ ID No.11所示,命名为cxm9,其位于基因簇核苷酸序列第10186-10917个碱基处,长度为732个碱基对,编码一个自由基S-腺苷甲硫氨酸蛋白,243个氨基酸,序列如SEQ ID No.21所示。
2.权利要求1所述创新霉素的生物合成基因簇表达的编码蛋白。
3.根据权利要求2所述的编码蛋白,其特征在于,所述编码蛋白的氨基酸序列分别如SEQ ID No.12~SEQ ID No.21所示。
4.权利要求1所述创新霉素的生物合成基因簇或权利要求1所述创新霉素的生物合成基因簇表达的编码蛋白在催化合成创新霉素或其类似物中的应用。
5.一种重组载体,其特征在于,该重组载体包含权利要求1所述的创新霉素生物合成基因簇。
6.根据权利要求5所述的重组载体,其特征在于,所述重组载体是p15A-cm-apra-cxm或其的突变载体。
7.一种宿主,其特征在于,该宿主包含权利要求5或6所述的重组载体。
8.根据权利要求7所述的宿主,其特征在于,所述宿主为链霉菌、假单胞菌、伯克氏菌、大肠杆菌、芽孢杆菌、酵母、植物或动物。
9.根据权利要求8所述的宿主,其特征在于,所述宿主为天蓝色链霉菌A3(2)、白色链霉菌J1074或变铅青链霉菌K4-114。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710146841.7A CN106754986B (zh) | 2017-03-13 | 2017-03-13 | 创新霉素生物合成基因簇及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710146841.7A CN106754986B (zh) | 2017-03-13 | 2017-03-13 | 创新霉素生物合成基因簇及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106754986A true CN106754986A (zh) | 2017-05-31 |
CN106754986B CN106754986B (zh) | 2020-05-08 |
Family
ID=58961457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710146841.7A Active CN106754986B (zh) | 2017-03-13 | 2017-03-13 | 创新霉素生物合成基因簇及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106754986B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106916835A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN109266662A (zh) * | 2017-07-18 | 2019-01-25 | 中国医学科学院医药生物技术研究所 | 一组生物合成创新霉素或开环创新霉素的基因簇 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5876098A (ja) * | 1981-10-28 | 1983-05-09 | Kyowa Hakko Kogyo Co Ltd | チヤンギシンマイシンの製造法 |
CN101195828A (zh) * | 2007-12-06 | 2008-06-11 | 上海交通大学 | 多氧霉素生物合成基因簇及其应用 |
-
2017
- 2017-03-13 CN CN201710146841.7A patent/CN106754986B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5876098A (ja) * | 1981-10-28 | 1983-05-09 | Kyowa Hakko Kogyo Co Ltd | チヤンギシンマイシンの製造法 |
CN101195828A (zh) * | 2007-12-06 | 2008-06-11 | 上海交通大学 | 多氧霉素生物合成基因簇及其应用 |
Non-Patent Citations (1)
Title |
---|
左利杰,等: "济南游动防线菌CPCC 20056产生的3-去甲创新霉素发现与鉴定", 《药学学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106916835A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916835B (zh) * | 2015-12-24 | 2022-08-12 | 武汉合生科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN109266662A (zh) * | 2017-07-18 | 2019-01-25 | 中国医学科学院医药生物技术研究所 | 一组生物合成创新霉素或开环创新霉素的基因簇 |
Also Published As
Publication number | Publication date |
---|---|
CN106754986B (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Identification and utility of FdmR1 as a Streptomyces antibiotic regulatory protein activator for fredericamycin production in Streptomyces griseus ATCC 49344 and heterologous hosts | |
JP6882330B2 (ja) | カリマイシン(Carrimycin)生合成遺伝子クラスタ | |
CN102181470B (zh) | 提高链霉菌抗生素产量的方法及其质粒 | |
CN110218244A (zh) | 化合物ilamycin F及其应用 | |
Ji et al. | Top-down synthetic biology approach for titer improvement of clinically important antibiotic daptomycin in Streptomyces roseosporus | |
CN106754608B (zh) | 生产米尔贝霉素的重组链霉菌及其制备方法和应用 | |
CN106754986A (zh) | 创新霉素生物合成基因簇及其应用 | |
Hung et al. | Enhancement of clavulanic acid by replicative and integrative expression of ccaR and cas2 in Streptomyces clavuligerus NRRL3585 | |
CN102703495A (zh) | 提高链霉菌抗生素产量的方法及其质粒 | |
CN103215282A (zh) | 越野他汀的生物合成基因簇及其应用 | |
CN104911196B (zh) | 三欣卡辛的生物合成基因簇及其应用 | |
CN110563783A (zh) | 一种高效低毒四霉素b衍生物及其定向高产代谢工程方法 | |
CN102719388A (zh) | 提高链霉菌抗生素产量的方法及其质粒 | |
CN102174530A (zh) | 环肽ym-216391的生物合成基因簇 | |
WO2004015088A2 (en) | Transposon-based transformation system | |
La et al. | Effects of glycerol and shikimic acid on rapamycin production in Streptomyces rapamycinicus | |
CN105018514A (zh) | 一种链霉菌药物高效生物合成的构建方法 | |
CN106916834B (zh) | 化合物的生物合成基因簇及其应用 | |
CN106916835B (zh) | 化合物的生物合成基因簇及其应用 | |
CN101724672B (zh) | 通过对生物合成调控基因的遗传操作构建力达霉素高产菌株的方法 | |
CN105219830B (zh) | 一种头孢霉素c的制备方法及其所用的基因工程菌 | |
CN107881137A (zh) | 增强转录水平的高产安丝菌素菌株及其制备方法 | |
CN103966250A (zh) | 调控基因对核苷类抗生素生物合成的调节作用 | |
CN117051043B (zh) | 一种基于环状rna编码耐甲氧西林金黄色葡萄球菌内溶素及其应用 | |
CN114703171B (zh) | 酯酰辅酶a合成酶变体及其工程化微生物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |