技术背景:
可利霉素曾用名生技霉素、必特螺旋霉素,是利用合成生物学技术研制的16元环大环内酯类抗生素[专利号:ZL971044406、ZL021487715],是以4”-异戊酰螺旋霉素Ⅲ、Ⅱ、Ⅰ为主组分的在4”-位羟基多种酰基化的螺旋霉素,其中Ⅲ组分约占30%以上、Ⅱ组分25%左右,Ⅰ组分不超过10%。
可利霉素结构式
异戊酰螺旋霉素Ⅲ:R=COCH2CH3R′=COCH2CH(CH3)2
异戊酰螺旋霉素Ⅱ:R=COCH3R′=COCH2CH(CH3)2
异戊酰螺旋霉素Ⅰ:R=HR′=COCH2CH(CH3)2
可利霉素对革兰氏阳性菌有较强的活性,对红霉素和β-内酰胺类抗生素耐药菌、流感杆菌、淋球菌、军团菌、脆弱拟杆菌、产气荚膜梭菌有抗菌活性。尤其对肺炎支原体、沙眼衣原体和肺炎衣原体具有较强的活性[余兰香等,四川生理科学杂志;1998,20(3),专利号:2003101224209],有较好的抗生素后效应和抗生素亚抑菌浓度效应。其与同类药没有完全交叉耐药性。药代动力学研究表明,可利霉素有较高的亲脂性,在胞内抗菌活性强,口服吸收快,绝对生物利用度高,组织渗透性强,其组织浓度高于血浆浓度,组织分布广,消除半衰期长,在体内维持时间长[孙丽文等,中国药理学通报2000,16(6):694-8;钟大放等,JchromatographyB.2003,791:45;史向国等,AsianJournalofDrugMetabolismandPharmacokinetics.2003,3(2):134;史向国等,ChineseChemicalletter2004,15:431;史向国等,ActaPharmacologicaSinica,2004,25:1396]。药理、毒理及已完成的临床三期研究结果表明,可利霉素用于治疗呼吸道感染其疗效确切,不良反应率低,尤其对肝脏损害小,安全性好[林赴田等,第八次全国抗生素学术会议论文汇编1997,p.167;赵春燕等,中国抗生素杂志1998,23(4):306;孙涛等,中国抗生素杂志2001,26(1):49-51]。可利霉素是利用基因重组技术获得的基因工程菌发酵直接产物,制备工艺简便、可以有效地避免化学污染及节省能源。其口服制剂服用方便,每日只需服用一次,有利于提高患者的用药依从性,也便于进入基本医保药物系列。
可利霉素是利用基因重组技术,将碳霉素产生菌4”-异戊酰基转移酶基因在螺旋霉素产生菌(StreptomycesspiramyceticusF21)中进行克隆表达,获得基因工程菌(StreptomycesspiramyceticusWSJ-1)的发酵产物。所述螺旋霉素产生菌(StreptomycesspiramyceticusF21),是本实验室于1982年从中国甘肃永昌县土壤中分离得到的,该菌的形态培养特征、生理生化特征、细胞壁化学组成以及16SrRNA基因序列和5个看家基因蛋白水平在系统发育树分析中的地位,与国外报道的螺旋霉素产生菌StreptomycesambofaciensATCC23877和已报道的链霉菌均无共同之处,故极可能为一株链霉菌新种[戴剑漉等,微生物学通报2012,39(4):503-514]。
螺旋霉素产生菌StreptomycesambofaciensATCC23877中与螺旋霉素生物合成相关基因簇测序已经完成[KarrayF.Microbiology2007,153:4111-4122],其他大环内酯类抗生素如阿维菌素、刀豆霉素、红霉素、查耳霉素、泰洛菌素和麦迪霉素生物合成基因簇序列也已有报道[IkedaH.etalNat.Biotechnol.2003,21(5):526-531、HaydocketalMicrobiology2005,151,3161-3169;OliynykM.etalNat.Biotechnol.2007,25(4):447-453;WardsL.etalAntimicrob.Agents&Chemotherapy2004,48(12):4703-4712;CundiffeE.etalAntonieVanLeeuwenhoek2001,79(3-4):229-234;MidohNaokietalUSpatent7070980]。大环内酯类抗生素生物合成基因簇全长约50-80kb,其共同特征是,由编码16元大环内酯环生物合成模块式结构的聚酮合酶(PKS)、聚酮合成延长单位相关酶、负责内酯环不同基团修饰的酶、糖基合成和转移相关酶的基因以及与抗性和调控功能相关基因等组成。大环内酯是由模块结构形式组成的PKS催化,以类似脂肪酸生物合成的方式,通过连续缩合反应将一些简单的羧酸分子催化形成的。每一个模块在聚酮链形成过程中只负责一步缩合反应,它至少包含一个β-酮酯酰合成酶(KS)结构域,一个酰基转移酶(AT)结构域和一个酰基载体蛋白(ACP)结构域。此外,它还可能包含一个β-酮酯酰还原酶(KR)结构域,一个脱水酶(DH)结构域和一个酯酰还原酶(ER)结构域,它们决定了加入延伸单位的还原步骤。同时,还需要硫酯酶(TE)结构域的作用,以催化聚酮链的环化与释放。最后,还要经过羟基化、甲基化、甲氧基化和酰基化等修饰步骤,形成多种多样的大环内酯类抗生素的结构。通常大环内酯均与不同数量的糖基(或糖胺基)相连,如可利霉素含有三个糖基,分别是福洛糖胺、碳霉糖胺和碳霉糖。它们是由糖基合成和转移相关酶负责。抗性基因赋予产生菌拮抗自身产生抗生素的能力,通常与ABC转运蛋白相关。调控功能相关的基因参与自身生物合成抗生素的调控。
通过基因簇序列信息和结构分析,可以进一步对其产生菌进行遗传操作,获得新型、更有效的抗生素,如通过基因操作来改变其PKS合成模块式结构、进行内酯环后修饰的改变、糖基因的置换或修饰,创造新的大环内酯类抗生素;也可以通过对抗性基因或调节基因的遗传操作,提高抗生素的产量。[WilkinsonB.etalChemBiol2000,7(2):111-117;KalzL.etalMedResRev1999,19(6):543-58;GoodmanCDetalAntimicrobialAgentsandChemotherapy,2013,57(2):907–913;WangWetalProcNatlAcadSciUSA2014,111(15):5688-93;StratigopoulosGetalMolMicrobiol.2004,54(5):1326-34;NovakovaRetalFoliaMicrobiol.2011,56(3):276-82]。
发明内容:
本发明提供了可利霉素生物合成连锁基因簇,共有44个基因开放阅读框(orf),核苷酸序列全长89315bp(Seq.1),其中含有5个编码聚酮合酶(orf10-14),包括8个模块,37个结构域,以及与聚酮合成延长单位及修饰相关的orf有9个(1、4-6、15、36-39),与糖基合成相关的orf有16个(9、16-22、24、26、28、29、33-35、41),与糖基转移相关的orf有6个(7、8、30-32、40)。此外,还有与抗性相关的orf有2个(3和25),与调控可能相关的orf有4个(2、23、27、42)。这些核苷酸序列分别选自Seq.1中的orf1(1-645)、orf2(1810-1208)、orf3(3133-2285)、orf4(3614-4840)、orf5(4846-5511)、orf6(7150-5801)、orf7(8444-7179)、orf8(9729-8482)、orf9(10543-9830)、orf10(16215-10543)、orf11(21076-16328)、orf12(32511-21124)、orf13(38599-32585)、orf14(52259-38643)、orf15(53099-54310)、orf16(54495-54845)、orf17(54842-56041)、orf18(56038-56946)、orf19(56930-57967)、orf20(57937-60174)、orf21(60836-61984)、orf22(62796-62077)、orf23(63633-65645)、orf24(67379-66318)、orf25(69004-67352)、orf26(69349-70650)、orf27(72156-70708)、orf28(72422-73462)、orf29(74601-73561)、orf30(74913-76160)、orf31(76218-77486)、orf32(77606-78781)、orf33(78783-79775)、orf34(79772-80779)、orf35(82055-80823)、orf36(83164-82052)、orf37(84400-83279)、orf38(84713-84393)、orf39(85576-84710)、orf40(85825-87042)、orf41(87094-87702)、orf42(89315-88143)。此外,还含有与Seq1.不连锁的外源基因Seq.2全长2337bp中的orf43(866-60)和orf44(2337-1174)。
本发明还提供了一个4’磷酸泛酰巯基乙胺基转移酶(PPT)的氨基酸序列,由Seq.3序列中的214个氨基酸组成,命名为IA-W1,编码基因的核苷酸序列选自Seq.1中的1-645碱基。
本发明还提供了一个TetR家族转录调控因子的氨基酸序列,由Seq.4序列中的200个氨基酸组成,命名为IA-W2,编码基因的核苷酸序列选自Seq.1中的1810-1208碱基。
本发明还提供了一个23SrRNA甲基转移酶的氨基酸序列,由Seq.5序列中的282个氨基酸组成,命名为IA-W3,编码基因的核苷酸序列选自Seq.1中的3133-2285碱基。
本发明还提供了一个3-O-酰基转移酶的氨基酸序列,由Seq.6序列中的408个氨基酸组成,命名为IA-W4,编码基因的核苷酸序列选自Seq.1中的3614-4840碱基。
本发明还提供了一个O-甲基转移酶的氨基酸序列,由Seq.7序列中的221个氨基酸组成,命名为IA-W5,编码基因的核苷酸序列选自Seq.1中的4846-5511碱基。
本发明还提供了一个巴豆酰基辅酶A还原酶的氨基酸序列,由Seq.8序列中449个氨基酸组成,命名为IA-W6,编码基因的核苷酸序列选自Seq.1中的7150-5801碱基。
本发明还提供了一个糖苷转移酶的氨基酸序列,由Seq.9序列中的421个氨基酸组成,命名为IA-W7,编码基因的核苷酸序列选自Seq.1中的8444-7179碱基。
本发明还提供了一个糖苷转移酶辅助蛋白的氨基酸序列,由Seq.10序列中的415个氨基酸组成,命名为IA-W8,编码基因的核苷酸序列选自Seq.1中的9729-8482碱基。
本发明还提供了一个NDP-氨基己糖N-二甲基转移酶的氨基酸序列,由Seq.11序列中的237个氨基酸组成,命名为IA-W9,编码基因的核苷酸序列选自Seq.1中的10543-9830碱基。
本发明还提供了一个包括酮基合成酶(KS)8-酰基转移酶(AT)8-酮基还原酶(KR)8-酰基载体蛋白结构域(ACP)8-链释放硫酯酶(TE)的聚酮合酶结构域氨基酸序列,由Seq.12序列中1890个氨基酸组成,命名为IA-W10,编码基因的核苷酸序列选自Seq.1中的16215-10543碱基。
本发明还提供了一个包括KS7-AT7-KR7-ACP7的聚酮合酶结构域氨基酸序列,由Seq.13序列中的1582个氨基酸组成,命名为IA-W11,编码基因的核苷酸序列选自Seq.1中的21076-16328碱基。
本发明还提供了一个包括KS5-AT5-KR5-ACP5-KS6-AT6-DH6(脱水酶)-ER6(烯酰基还原酶)-KR6-ACP6的聚酮合酶结构域氨基酸序列,由Seq.14序列中的3795个氨基酸组成,命名为IA-W12,编码基因的核苷酸序列选自Seq.1中的32511-21124碱基。
本发明还提供了一个包括KS4-AT4-DH4-KR4-ACP4的聚酮合酶结构域氨基酸序列,由Seq.15序列中的2004个氨基酸组成,命名为IA-W13,编码基因的核苷酸序列选自Seq.1中的38599-32585碱基。
本发明还提供了一个包KS1-AT1-ACP1-KS2-AT2-KR2-ACP2-KS3-AT3-DH3-KR3-ACP3的聚酮合酶结构域氨基酸序列,由Seq.16序列中的4538个氨基酸组成,命名为IA-W14,编码基因的核苷酸序列选自Seq.1中的52259-38643碱基。
本发明还提供了一个细胞色素P-450氧化酶的氨基酸序列,由Seq.17序列中的403个氨基酸组成,命名为IA-W15,编码基因的核苷酸序列选自Seq.1中的53099-54310碱基。
本发明还提供了一个NDP-己糖异构酶的氨基酸序列,由Seq.18序列中的116个氨基酸组成,命名为IA-W16,编码基因的核苷酸序列选自Seq.1中的54495-54845碱基。
本发明还提供了一个NDP-己糖氨基转移酶的氨基酸序列,由Seq.19序列中的399个氨基酸组成,命名为IA-W17,编码基因的核苷酸序列选自Seq.1中的54842-56041碱基。
本发明还提供了一个NDP-葡萄糖合酶的氨基酸序列,由Seq.20序列中的302个氨基酸组成,命名为IA-W18,编码基因的核苷酸序列选自Seq.1中的56038-56946碱基。
本发明还提供了一个NDP-葡萄糖-4,6脱水酶的氨基酸序列,由Seq.21序列中的345个氨基酸组成,命名为IA-W19,编码基因的核苷酸序列选自Seq.1中的56930-57967碱基。
本发明还提供了一个NDP-己糖2,3脱水酶/硫酯酶的氨基酸序列,由Seq.22序列中的745个氨基酸组成,命名为IA-W20,编码基因的核苷酸序列选自Seq.1中的57937-60174碱基。
本发明还提供了一个NDP-己糖氨基转移酶的氨基酸序列,由Seq.23序列中的382个氨基酸组成,命名为IA-W21,编码基因的核苷酸序列选自Seq.1中的60836-61984碱基。
本发明还提供了一个NDP-氨基己糖N二甲基转移酶的氨基酸序列,由Seq.24序列中的239个氨基酸组成,命名为IA-W22,编码基因的核苷酸序列选自Seq.1中的62796-62077碱基。
本发明还提供了一个转录调控因子的氨基酸序列,由Seq.25序列中的670个氨基酸组成,命名为IA-W23,编码基因的核苷酸序列选自Seq.1中的63633-65645碱基。
本发明还提供了一个NDP-氨基己糖异构酶的氨基酸序列,由Seq.26序列中的354个氨基酸组成,命名为IA-W24,编码基因的核苷酸序列选自Seq.1中的67379-66318碱基。
本发明还提供了一个ABC转运蛋白的氨基酸序列,由Seq.27序列中的550个氨基酸组成,命名为IA-W25,编码基因的核苷酸序列选自Seq.1中的69004-67352碱基。
本发明还提供了一个NDP-己糖脱水酶的氨基酸序列,由Seq.28序列中的433个氨基酸组成,命名为IA-W26,编码基因的核苷酸序列选自Seq.1中的69349-70650碱基。
本发明还提供了一个类似于GTP酶的氨基酸序列,由Seq.29序列中的482个氨基酸组成,命名为IA-W27,编码基因的核苷酸序列选自Seq.1中的72156-70708碱基。
本发明还提供了一个NDP-糖异构酶的氨基酸序列,由Seq.30序列中的346个氨基酸组成,命名为IA-W28,编码基因的核苷酸序列选自Seq.1中的72422-73462碱基。
本发明还提供了一个NDP-己糖酮基还原酶的氨基酸序列,由Seq.31序列中的346个氨基酸组成,命名为IA-W29,编码基因的核苷酸序列选自Seq.1中的74601-73561碱基。
本发明还提供了一个糖基转移酶辅助蛋白的氨基酸序列,由Seq.32序列中415个氨基酸组成,命名为IA-W30,编码基因的核苷酸序列选自Seq.1中的74913-76160碱基。
本发明还提供了一个糖基转移酶的氨基酸序列,由Seq.33序列中的422个氨基酸组成,命名为IA-W31,编码基因的核苷酸序列选自Seq.1中的76218-77486碱基。
本发明还提供了一个糖基转移酶的氨基酸序列,由Seq.34序列中的391个氨基酸组成,命名为IA-W32,编码基因的核苷酸序列选自Seq.1中的77606-78781碱基。
本发明还提供了一个NDP-己糖酮基还原酶的氨基酸序列,由Seq.35序列中的330个氨基酸组成,命名为IA-W33,编码基因的核苷酸序列选自Seq.1中的78783-79775碱基。
本发明还提供了一个NDP-己糖还原酶的氨基酸序列,Seq.36由序列中的335个氨基酸组成,命名为IA-W34,编码基因的核苷酸序列选自Seq.1中的79772-80779碱基。
本发明还提供了一个NDP-己糖甲基转移酶的氨基酸序列,由Seq.37序列中的410个氨基酸组成,命名为IA-W35,编码基因的核苷酸序列选自Seq.1中的82055-80823碱基。
本发明还提供了一个甲氧基丙二酰合成酶的氨基酸序列,由Seq.38序列中的370个氨基酸组成,命名为IA-W36,编码基因的核苷酸序列选自Seq.1中的83164-82052碱基。
本发明还提供了一个脱氢酶的氨基酸序列,由Seq.39序列中的373个氨基酸组成,命名为IA-W37,编码基因的核苷酸序列选自Seq.1中的84400-83279碱基。
本发明还提供了一个酰基携带蛋白的氨基酸序列,由Seq.40序列中的106个氨基酸组成,命名为IA-W38,编码基因的核苷酸序列选自Seq.1中的84713-84393碱基。
本发明还提供了一个甲氧基丙二酰脱氢酶的氨基酸序列,由Seq.41序列中的288个氨基酸组成,命名为IA-W39,编码基因的核苷酸序列选自Seq.1中的85576-84710碱基。
本发明还提供了一个糖基转移酶的氨基酸序列,由Seq.42序列中的405个氨基酸组成,命名为IA-W40,编码基因的核苷酸序列选自Seq.1中的85825-87042碱基。
本发明还提供了一个NDP-己糖异构酶的氨基酸序列,由Seq.43序列中的202个氨基酸组成,命名为IA-W41,编码基因的核苷酸序列选自Seq.1中的87094-87702碱基。
本发明还提供了一个转录调控因子蛋白的氨基酸序列,由Seq.44序列中的390个氨基酸组成,命名为IA-W42,编码基因的核苷酸序列选自Seq.1中的89315-88143碱基。
本发明还提供了外源插入的23SrRNA甲基化酶(硫链丝菌素thiostrepton、tsr抗性标记相关)氨基酸序列,由Seq.45序列中的269个氨基酸组成,命名为IA-W43,编码基因的核苷酸序列选自Seq.2中的866-57碱基。
本发明还提供了外源插入的4”碳霉糖苷异戊酰转移酶氨基酸序列,由Seq.46序列中的388个氨基酸组成,命名为IA-W44,编码基因的核苷酸序列选自Seq.2中的2337-1171碱基。
在获得可利霉素生物合成基因簇信息、通过基因阻断及同源性比较分析各基因编码蛋白可能功能基础上,进一步描述本发明整个可利霉素生物合成基因簇共44个基因,其基因簇结构如图1所示,具体为:
(1)聚酮合酶基因orf10-14,共5个基因;
(2)与聚酮合成延长单位及修饰相关的基因orf1、orf4-6、15、36-39,共9个基因;
(3)与糖基合成相关基因orf9、16-22、24、26、28、29、33-35、41,共16个基因;
(4)与糖基转移相关基因orf7、8、30-32、40,共6个基因;
(5)与抗性相关基因orf3和25,共2个基因;
(6)与生物合成调控相关基因orf2、23、27、42,共4个基因;
(7)外源引入的基因工程菌标记基因orf43(硫链丝菌素-thiostrepton、tsr抗性基因)和与之连锁的碳霉糖4”-O-异戊酰转移酶基因orf44,共2个基因。
Seq.1中有5个聚酮合酶基因(orf10-14),核苷酸互补序列及其氨基酸序列,是可利霉素内酯环合成所必须的,其中,包含8个模块,37个结构域如图2所示。Orf14包含3个模块:加载结构域1以及模块2和3;加载模块域中,KS1、AT1和ACP1负责内酯环的起始合成,催化一个乙酸作为起始单位,模块2含有KS2、AT2、KR2和ACP2结构域;模块3含有KS3、AT3、DH3、KR3和ACP3结构域,负责引入另2个乙酸延伸单位,最终形成可利霉素C11-15碳链骨架。Orf13包括模块4,含有KS4、AT4、DH4、KR4、ACP4,负责第3个乙酸单位的延伸,最终形成可利霉素C9-10碳链骨架;Orf12包括模块5和6,模块5含有KS5-AT5-KR5-ACP5结构域,负责引入丙酸延伸单位;模块6含有KS6-AT6-DH6-KR6-ER6-KR6-ACP6结构域,负责引入丁酸延伸单位,最终形成可利霉素C5-C8碳链骨架。Orf11包括模块7,含有KS7-AT7-KR7-ACP7结构域,负责引入乙醇酸延伸单位,最终形成可利霉素C3-C4碳链骨架。Orf10包括模块8,含有KS8-AT8-KR8-ACP8-TE结构域,负责引入一个乙酸延伸单位,并在硫酯酶(TE)参与下完成碳链的环化及释放。可利霉素聚酮合酶基因结构示意图见图2。聚酮合酶基因各结构域及其氨基酸的位置如表1所示。
可利霉素聚酮合成延长单位及修饰相关基因orf1、orf4-6、15、36-39的核苷酸序列或互补序列及其相应的氨基酸序列:即IA-W1,编码PPT修饰聚酮体合成的酰基载体蛋白(ACP),使之成为有活性的蛋白;IA-W4编码3-O-酰基转移酶,负责可利霉素3位羟基酰基化;IA-W5和IA-W6分别编码O-甲基化酶和巴豆酰辅酶A还原酶,负责聚酮体延长单位的供应;IA-W15编码P450细胞色素单氧化酶,负责聚酮体碳链的氧化;IA-W36-39分别编码甲氧基丙二酰合成酶、脱氢酶、酰基携带蛋白和甲氧基丙二酰脱氢酶,它们均参与聚酮体延长单位的合成与修饰。
表1聚酮合酶基因各结构域及其氨基酸的位置:
表1.1聚酮合酶基因IA-W14各结构域及其氨基酸的位置
表1.2聚酮合酶基因IA-W13各结构域及其氨基酸的位置
表1.3聚酮合酶基因IA-W12各结构域及其氨基酸的位置
表1.4聚酮合酶基因IA-W11各结构域及其氨基酸的位置
表1.5聚酮合酶基因IA-W10各结构域及其氨基酸的位置
与可利霉素糖基合成相关基因orf9、16-22、24、26、28、29、33-35和41,共12个基因,其中:orf18,19和28编码参与可利霉素基本糖基单元合成、脱水和异构化酶;orf9、20、21、24、26和29编码参与福洛糖胺合成中NDP-氨基己糖N-二甲基化、2,3脱水、氨基化、异构化、脱水和酮基还原酶;orf16、17、22编码参与碳霉糖胺NDP-氨基己糖异构化、氨基化和N-二甲基化酶;orf33、34、35和41编码碳霉糖NDP-氨基己糖酮基还原、甲基化和异构化酶。
与可利霉素糖基转移相关基因orf7、8、30-32、40,共6个基因,其中:orf7编码碳霉糖胺糖基化酶;orf8编码其糖基化辅助蛋白;orf31和32编码福洛糖胺糖基化酶;orf30编码其糖基化辅助蛋白;orf40编码碳霉糖糖基化酶。
与可利霉素抗性相关基因orf3和25,共2个基因,其中:orf3编码23SrRNA甲基化酶;orf25编码ABC转运蛋白,它们通过对核糖体RNA甲基化以及泵出机制,赋予可利霉素产生菌对自身产生抗生素的抗性。
与可利霉素生物合成调控相关基因orf2、23、27、42,共4个基因,其中:orf2编码TetR家族转录调控抑制因子,可能参与可利霉素生物合成负调控;Orf23、42分别编码两个正调控转录因子,后者为途径特异正调控因子,对可利霉素的生物合成直接进行调控;orf27编码GTP酶,可能通过调控细胞的功能对可利霉素的生物合成进行调控。
与可利霉素生物合成相关,外源引入orf43和orf44,其中orf43编码与硫链丝菌素抗性相关的23SrRNA甲基化酶基因,该基因与碳霉糖4”-O-羟基异戊酰转移酶基因orf44连锁,其抗性表达可以为可利霉素基因工程菌提供鉴别性标记。
本发明Seq.1、2的互补序列可依据DNA碱基互补原则随时得到。Seq.1、2的核苷酸序列或部分核苷酸序列,可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶,酶切相应的DNA或使用其它合适的技术得到。通过本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的方法或包含本发明序列的DNA作为探针进行Southern杂交的方法,从其它生物体得到与可利霉素生物合成基因相似的基因。
本发明还提供了至少获得部分Seq.1、2中DNA序列构建重组DNA载体的途径。
本发明还提供了阻断可利霉素生物合成基因的途径,至少其中之一的基因包含有Seq.1中的核苷酸序列。
本发明所提供核苷酸序列或至少部分序列的克隆基因或DNA片段,可以通过阻断可利霉素生物合成的一个或几个步骤而得到新的可利霉素衍生物。包含DNA片段或基因,可以用来提高可利霉素或其衍生物的产量。
本发明所提供核苷酸序列或至少部分序列的克隆DNA,可用来从基因组文库中定位更多的文库质粒。这些文库质粒至少包含有本发明中的部分序列,也包含有可利霉素产生菌基因组中与之邻近区域的DNA。
本发明所提供的核苷酸序列可以被修饰或突变。其途径包括插入或置换、聚合酶链式反应、错误介导聚合酶链式反应、位点特异性突变、不同序列的重新连接或通过紫外线或化学试剂的突变。
本发明所提供的核苷酸序列,可以通过序列的不同部分或其它来源的同源序列进行直接进化(DNAshuffling)。
本发明的核苷酸序列或至少部分序列的片段或结构域或模块或基因,可以用来构建聚酮合酶库或聚酮合酶衍生库或组合库。通过缺失或失活来自相同或不同聚酮合酶系统的一个或多个聚酮合酶结构域、模块或基因,或增加一个或多个聚酮合酶结构域、模块或基因,产生新的聚酮化合物。
本发明的生物合成修饰基因、糖基合成及糖基转移酶基因的核苷酸序列,提供了通过缺失、置换或改造这些糖基合成、转移和修饰基因而得到可利霉素衍生物的途径。
本发明提供的核苷酸序列或至少部分序列的片段或结构域或模块或基因,可以通过加倍量来提高可利霉素或其衍生物的产量。
本发明的核苷酸序列或至少部分序列的克隆基因,可以通过合适的表达系统在外源宿主中表达,以得到修饰的或更高生物活性或更高产量的可利霉素。这些外源宿主包括链霉菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等。
本发明的核苷酸序列或至少部分序列的基因或基因簇,可以在异源宿主中表达并通过DNA芯片技术,了解它们在宿主代谢链中的功能。
本发明的氨基酸序列或至少部分序列的多肽,可能在去除或替代某个或某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化蛋白动力学特征或其它致力于得到的性质。通过合适的技术缺失,连接本发明中的氨基酸序列,可以得到新的蛋白或酶,进而产生新的或相关联的产物。
本发明所提供的氨基酸序列,可以用来分离需要的蛋白质并可用于抗体制备。
本发明所所述的氨基酸序列,提供了预测聚酮合酶三维结构的可能。
本发明所提供的基因及其蛋白质、抗体,也可用以筛选和发展用于医药、工业、农业的化合物或蛋白。
实施方案:
以下所提供实施例,仅为帮助本领域技术人员更好地理解本发明,但不以任何方式限制本发明。
《实施例1》可利霉素产生菌(S.spiramyceticus)总DNA提取
R2YE培养基配方(g/100ml):
加入微量元素溶液0.2ml,定容至100ml蒸馏水,pH6.5
微量元素溶液(g/100ml):
15磅灭菌,121℃,20min
S.spiramyceticus菌种接种于25mlR2YE培养基,28℃摇床培养48h,转种于100mlR2YE培养基,28℃摇床培养24h,离心5000rpm10-15min,收集菌体(约10g菌体),主要按UPTECHTMlifescience公司产品说明书操作。加入50ml的25mM的EDTA溶液震荡洗涤,离心,弃上清;用25ml溶菌酶溶液(10mg/ml,用10mM的pH8.0的Tris-HCl、2mMEDTA、1.2%TritonX-100配制,加入0.5ml100mg/mlRNase)悬浮菌丝体,37℃培养约1-2h,培养细胞至半透明状;加入2.5ml蛋白酶K溶液,55℃30min;加入20ml10%SDS溶液70℃10min;加入等体积无水乙醇,充分震荡;将溶液转移到DNA纯化柱,12000rpm离心1min;加入50ml含蛋白酶溶液洗柱,室温离心12000rpm1min;再用50ml漂洗液洗柱二次,每次离心12000rpm1min;加入5-10mlTE洗脱液,室温放置2-5min,12000rpm离心1min;收集溶液,-20℃保存总DNA。
《实施例2》通过基因阻断验证Seq.1基因信息的功能
选取基因簇两端IA-W1和IA-W42以及IA-W4、17、21、23和27等基因进行阻断,获得突变菌株,并通过实验证明,这些阻断菌株产生可利霉素能力发生变化,或者不再产生可利霉素。从而提示,所获得的基因簇信息是产生可利霉素所必须的。根据上述编码基因及其上下游序列设计引物,并插入合适的酶切位点,引物序列见表2。
表2基因阻断实验所设计使用的引物序列
经PCR扩增分别获得相应的同源基因片段,采用相应的酶切位点,并插入筛选标记抗性基因(阿普霉素-Am)连接到温敏型载体pKC1139[BiermanM.etalGene1992;116(1):43-9]或大肠杆菌/链霉菌载体pGH112[优宝生物公司],获得含有同源基因的重组质粒,经原生质体转化,转入可利霉素产生菌中,经培养后,进行单菌落分离,获得同源片段双交换基因阻断株。IA-W43-O-酰基转移酶基因阻断重组质粒构建及基因同源片段双交换示意见图3。IA-W42转录调控基因等阻断重组质粒构建示意见图4。
分别采用相应引物对阻断株及原株的总DNA进行PCR验证,如图5A和B所示。图5A结果表明,IA-W4基因阻断变株的编码基因orf4中缺失613bp。图5B中举例显示PCR验证结果,表明与原株相比,阻断变株相关编码基因由于插入筛选标记抗性基因,PCR产物长度呈现增加。
发酵实验及对产物的HPLC检测证明,IA-W4阻断变株不再产生4”-异戊酰螺旋霉素Ⅲ和Ⅱ,而是以4”-异戊酰螺旋霉素Ⅰ为主组分(图6)。证明本发明所提供Seq.1基因信息中的IA-W43-O-酰基转移酶基因,参与了可利霉素的生物合成,该基因的阻断,使变株丧失了可利霉素内酯环3位羟基被酰基化的功能。
其他基因阻断株经发酵实验及对产物抗菌活性和HPLC检测,证明阻断株已不再产生有活性的可利霉素。说明本发明所提供Seq.1基因簇参与可利霉素的生物合成。
《实施例3》可利霉素产生菌的基因转移及阻断株的筛选
3.1原生质体的制备:取新鲜的可利霉素产生菌斜面孢子接种于R2YE液体培养基中,28℃,220rpm摇瓶振荡培养48h,培养液以10%的转种量,转种于新鲜的补加了0.5%甘氨酸的R2YE液体培养基中,28℃振荡培养20h。取10ml菌液于离心管中,3000rpm离心收集菌丝体,沉淀用P-buffer
pH7.615磅灭菌,121℃,30min。
洗涤2次后用适量P-buffer悬浮,加入溶菌酶的P-buffer溶液(终浓度为2mg/ml),混合均匀,于37℃水浴中保温30-45min,每隔10-15min振荡一次。用10×40的相差显微镜观察原生质体的形成情况,当镜检显示绝大部分菌丝已形成原生质体时,停止酶解。经脱脂棉过滤,滤液用P-buffer离心洗涤2次。最后用1mlP-buffer悬浮原生质体,分装EP管、100μl/管,-70℃保存备用。
3.2质粒DNA转化原生质体:取100μl原生质体,加入10μl质粒DNA溶液,轻弹管壁混匀,迅速加入400μl含25%PEG-1000(英国Koch-light公司产品)的P-buffer,吹吸混匀,室温放置5min,取200μl涂布于失水的R2YE平板上,28℃培养20h,以50μg/mltsr的无菌水覆盖,28℃培养5~7天,挑取转化子。
3.3基因阻断变株的筛选
将转化子挑取在加有Tsr50μg/ml培养基
去离子水配制,自然pH值,15磅灭菌,121℃,30min。
28℃培养5~7天,在不加药的培养基传四-五代,分离单孢子,将单孢子分别对应地在加阿普霉素(Am50μg/ml)的培养基上进行筛选,筛选出在Am生长和不在Tsr生长的基因阻断株。挑取抗性标记表达稳定的阻断株,提取基因组DNA,采用实施例2中相应引物PCR扩增,根据产物大小及DNA测序判断基因阻断的正确性。
《实施例4》可利霉素产生菌及基因阻断株发酵、产物活性检测及鉴定
4.1发酵
菌株在斜面培养基(g/L):
去离子水配制,自然pH值,15磅灭菌,121℃,30min。
28℃培养10-12d,菌株长好后挖块接种到装量30ml发酵培养基的100mL三角瓶,28℃振荡培养96-120h。
发酵培养基(g/L):
去离子水配制,15磅灭菌,121℃,30min。
4.2发酵产物活性检测:
发酵液经离心取上清液稀释后,以枯草芽孢杆菌为检定菌,参考《中华人民共和国药典》2005年版(二部)乙酰螺旋霉素微生物检定法。采用杯碟法,用标准曲线法进行测定。
4.3发酵产物提取及鉴定:
发酵液室温3000rpm离心15min,上清液用1MNaOH调至pH8.5后,用1/2体积乙酸乙酯萃取,取出乙酸乙酯相于平皿中吹干,挥干后溶于色谱纯甲醇,过滤后进样10-20μl。色谱议:岛津LC-10ATvp液相色谱议,二级管阵列检测器,色谱柱:KromasilC18(4.5mm×150mm,5μm),流动相:CH3OH/1%NaH2PO4(55:45),检测波长:231nm,流速:1ml/min柱温:25℃。以可利霉素标准品作为对照(购自中国药品生物制品检定所),对变株发酵产物进行鉴定。
本发明所述基因和蛋白见序列表。