CN103215282A - 越野他汀的生物合成基因簇及其应用 - Google Patents

越野他汀的生物合成基因簇及其应用 Download PDF

Info

Publication number
CN103215282A
CN103215282A CN2013101217834A CN201310121783A CN103215282A CN 103215282 A CN103215282 A CN 103215282A CN 2013101217834 A CN2013101217834 A CN 2013101217834A CN 201310121783 A CN201310121783 A CN 201310121783A CN 103215282 A CN103215282 A CN 103215282A
Authority
CN
China
Prior art keywords
gene cluster
amino acid
nucleotide sequence
length
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101217834A
Other languages
English (en)
Other versions
CN103215282B (zh
Inventor
唐功利
马宏敏
周强
张转
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Organic Chemistry of CAS
Original Assignee
Shanghai Institute of Organic Chemistry of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Organic Chemistry of CAS filed Critical Shanghai Institute of Organic Chemistry of CAS
Priority to CN201310121783.4A priority Critical patent/CN103215282B/zh
Publication of CN103215282A publication Critical patent/CN103215282A/zh
Application granted granted Critical
Publication of CN103215282B publication Critical patent/CN103215282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及越野他汀的生物合成基因簇,具体地,是由一种小单孢菌Micromonospora sp.TP-A0468产生的具有抗肿瘤活性的蒽环类抗生素——越野他汀的生物合成基因簇的克隆、测序、分析、功能研究及其应用。整个基因簇共包含55个基因:17个II型聚酮合成酶(PKS)相关基因;8个非核糖体聚肽合成酶(NRPS)相关基因;9个糖基合成相关基因;6个特殊的后修饰基因;7个抗性基因;5个调节基因以及3个无明确功能的基因。通过对上述生物合成基因的遗传操作可阻断越野他汀的生物合成,或使其产量发生改变,或产生新的化合物。该基因簇可用于蒽环类化合物的基因工程、蛋白表达、酶催化反应等,也可用于寻找和发现用于医药、工业或农业的化合物或基因、蛋白。

Description

越野他汀的生物合成基因簇及其应用
技术领域
本发明属于微生物基因资源和基因工程领域,具体涉及抗肿瘤抗生素越野他汀(Kosinostatin)的生物合成基因簇的克隆、分析、功能研究及其应用。 
背景技术
越野他汀(Kosinostatin)是2002年由日本科学家Tamotsu Furumai从富山湾深海中分离得到的小单孢菌Micromonospora sp.TP-A0468所产生的具有良好抗肿瘤抗菌活性的天然产物[J.Antibiot.(Tokyo)55,128–133(2002)]。2007年埃及科学家El-Naggar,M.Y.再次从链霉菌Streptomyces violaceusniger strain HAL64中分离得到[J.Microbiol.45,262–267(2007)]。 
对于革兰氏阳性菌,越野他汀具有良好的生物活性(例如对于Bacillus subtilis ATCC6633,MIC=39ng/mL);对于革兰氏阴性菌和酵母,越野他汀具有中等的生物活性;对于肿瘤细胞,越野他汀具有良好的生物活性(IC50约为0.10μM),其抗肿瘤活性要优于阿霉素。 
越野他汀分子由三部分组成:蒽环骨架、含氮杂环以及酰基化的脱氧己糖单元。其中的蒽环骨架是以II型PKS的方式合成的。II型PKS由miniPKS以及相关的负责折叠、环化、氧化还原以及其他修饰的后修饰酶组成。 
阐明蒽环骨架的合成机理对于丰富人们对蒽环类天然产物的认识、改造蒽环类天然产物的合成路径以产生价值更高的“非天然”天然产物都有重要意义。 
分子的含氮杂环和脱氧糖基均是药效基团,而且结构比较新颖,但是目前的对其合成途径还不甚了解,推测其合成机制是比较独特的。因此,阐明这两个基团的合成过程,理解其生物合成的酶学机制,将大大提升人们对抗菌抗肿瘤天然产物构效关系及生物合成原理的认识。 
因此,本领域迫切需要阐明越野他汀生物合成的酶学机制,从而实现对越野他汀分子的改造,以期获得活性更高、专一性更强、毒性更低的中间体和衍生物。 
发明内容
本发明涉及具有良好抗肿瘤活性的越野他汀的生物合成基因簇的克隆、测序、分析、功能研究及其应用。 
本发明第一方面,提供了越野他汀的生物合成基因簇,所述基因簇包括编码越野他汀生物合成所涉及的55个基因,具体为: 
1)II型聚酮合成酶PKS相关基因:kstA1,kstA2,kstA3,kstD1,kstD2,kstD3,kstD4,kstD5,kstD6,kstD7,kstD8,kstD9,kstD10,kstD11,kstD12,kstD13,kstD14;共17个基因: 
kstA1位于基因簇核苷酸序列第9943-11505位,编码腺苷酰化酶,长度为 422个氨基酸; 
kstA2位于基因簇核苷酸序列第11507-11770位,编码肽酰载体蛋白(PCP),长度为402个氨基酸; 
kstA3位于基因簇核苷酸序列第26548-26805位,编码酰基载体蛋白,长度为85个氨基酸; 
kstD1位于基因簇核苷酸序列第9140-9946位,编码2,3-环环化酶,长度为268个氨基酸; 
kstD2位于基因簇核苷酸序列第20823-216026位,编码酮基还原酶,长度为259个氨基酸; 
kstD3位于基因簇核苷酸序列第22658-21699位,编码芳香化酶,长度为319个氨基酸; 
kstD4位于基因簇核苷酸序列第23481-22696位,编码C-9位酮基还原酶,长度为261个氨基酸; 
kstD5位于基因簇核苷酸序列第23591-24049位,编码单氧化酶,长度为152个氨基酸; 
kstD6位于基因簇核苷酸序列第26861-27295位,编码第四环环化酶,长度为144个氨基酸; 
kstD7位于基因簇核苷酸序列第27391-28233位,编码NAD(P)H:黄素氧化还原酶,长度为280个氨基酸; 
kstD8位于基因簇核苷酸序列第28260-29156位,编码单氧化酶,长度为298个氨基酸; 
kstD9位于基因簇核苷酸序列第32267-33358位,编码羧酸酯酶,长度为363个氨基酸; 
kstD10位于基因簇核苷酸序列第32267-33358位,编码第四环环化酶,长度为150个氨基酸; 
kstD11位于基因簇核苷酸序列第52203-51685位,编码脱氢酶,长度为172个氨基酸; 
kstD12位于基因簇核苷酸序列第54953-54498位,编码羟化酶,长度为151个氨基酸; 
kstD13位于基因簇核苷酸序列第60078-58579位,编码FAD依赖的或者包含BBE结构域的氧化还原酶,长度为499个氨基酸; 
kstD14位于基因簇核苷酸序列第60258-61118位,编码甲基转移酶,长度为286个氨基酸; 
2)非核糖体聚肽合成酶NRPS相关基因:kstB1,kstB2,kstE1,kstE2,kstE3,kstE4,kstE5,kstE6;共8个基因: 
kstB1位于基因簇核苷酸序列第9943-11505位,编码NRPS腺苷化酶,长度为520个氨基酸; 
kstB2位于基因簇核苷酸序列第11507-11770位,编码酰基载体蛋白,长度为87个氨基酸; 
kstE1位于基因簇核苷酸序列第13618-13992位,编码L-ectoine合成酶,长度为124个氨基酸; 
kstE2位于基因簇核苷酸序列第14017-15156位,编码酰基辅酶A脱氢酶, 长度为379个氨基酸; 
kstE3位于基因簇核苷酸序列第55079-55924位,编码羟化酶,长度为281个氨基酸; 
kstE4位于基因簇核苷酸序列第58555-57470位,编码双氧化酶,长度为361个氨基酸; 
kstE5位于基因簇核苷酸序列第61163-61852位,编码氨基转移酶,长度为229个氨基酸; 
kstE6位于基因簇核苷酸序列第63435-64280位,编码脱甲酰酶,长度为281个氨基酸; 
3)乙酰化的糖基合成相关基因:kstC1,kstC2,kstC3,kstC4,kstC5,kstC6,kstC7,kstC8,kstC9;共9个基因: 
kstC1位于基因簇核苷酸序列第19574-18678位,编码dTDP-葡萄糖合成酶,长度为298个氨基酸; 
kstC2位于基因簇核苷酸序列第19786-20775位,编码dTDP-葡萄糖-4,6-脱水酶,长度为329个氨基酸; 
kstC3位于基因簇核苷酸序列第37944-37360位,编码3,5-表异构酶,长度为194个氨基酸; 
kstC4位于基因簇核苷酸序列第38165-39175位,编码糖基转移酶辅助蛋白,长度为336个氨基酸; 
kstC5位于基因簇核苷酸序列第39198-40496位,编码糖基转移酶,长度为432个氨基酸; 
kstC6位于基因簇核苷酸序列第40496-41992位,编码2,3-己糖脱水酶,长度为498个氨基酸; 
kstC7位于基因簇核苷酸序列第41989-43014位,编码丙酮酸脱氢酶α亚基,长度为341个氨基酸; 
kstC8位于基因簇核苷酸序列第43031-44068位,编码丙酮酸脱氢酶β亚基,长度为345个氨基酸; 
kstC9位于基因簇核苷酸序列第53344-52361位,编码己糖-3-酮基还原酶,长度为327个氨基酸; 
4)负责吡咯吡咯二并环形成的后修饰基因:kstF1,kstF2,kstF3,kstF4,kstF5,kstF6;共6个基因: 
kstF1位于基因簇核苷酸序列第11773-12807位,编码邻氨基苯甲酸磷酸核糖转移酶,长度为344个氨基酸; 
kstF2位于基因簇核苷酸序列第12800-13621位,编码色氨酸合成酶α亚基,长度为273个氨基酸; 
kstF3位于基因簇核苷酸序列第15160-15855位,编码邻氨基苯甲酸磷酸核糖异构酶,长度为231个氨基酸; 
kstF4位于基因簇核苷酸序列第15920-16618位,编码吲哚甘油-3-磷酶合成酶,长度为232个氨基酸; 
kstF5位于基因簇核苷酸序列第54495-53452位,编码Enoyl还原酶,长度为347个氨基酸; 
kstF6位于基因簇核苷酸序列第61849-63372位,编码羧化酶,长度为507 个氨基酸; 
5)抗性基因:kstRs1,kstRs2,kstRs3,kstRs4,kstRs5,kstRs6,kstRs7;共7个基因 
kstRs1位于基因簇核苷酸序列第30224-31300位,编码ABC转运蛋白,长度为358个氨基酸; 
kstRs2位于基因簇核苷酸序列第31297-32130位,编码ABC转运蛋白,长度为277个氨基酸; 
kstRs3位于基因簇核苷酸序列第35584-34109位,编码外排蛋白,长度为491个氨基酸; 
kstRs4位于基因簇核苷酸序列第36608-35625位,编码转运蛋白,长度为327个氨基酸; 
kstRs5位于基因簇核苷酸序列第44236-47025位,编码SNF2/RAD54家族解螺旋酶,长度为929个氨基酸; 
kstRs6位于基因簇核苷酸序列第47037-48338位,编码抗性蛋白,长度为433个氨基酸; 
kstRs7位于基因簇核苷酸序列第57431-56853位,编码抗性蛋白,长度为192个氨基酸; 
6)调节基因:kstRg1,kstRg2,kstRg3,kstRg4,kstRg5,共5个基因: 
kgtRg1位于基因簇核苷酸序列第17553-16669位,编码转录激活因子,长度为294个氨基酸; 
kgtRg2位于基因簇核苷酸序列第29233-30021位,编码转录调节因子,长度为262个氨基酸; 
kgtRg3位于基因簇核苷酸序列第50317-49112位,编码调节因子,长度为401个氨基酸; 
kgtRg4位于基因簇核苷酸序列第51422-51649位,编码调节因子,长度为75个氨基酸; 
kgtRg5位于基因簇核苷酸序列第56007-56840位,编码调节因子,长度为277个氨基酸; 
7)其他基因:kstU1,kstU2,kstU3;共3个: 
kgtU1位于基因簇核苷酸序列第48388-48822位,编码未知功能蛋白,长度为144个氨基酸; 
kgtU2位于基因簇核苷酸序列第50774-50304位,编码未知功能蛋白,长度为156个氨基酸; 
kgtU3位于基因簇核苷酸序列第51216-50785位,编码未知功能蛋白,长度为143个氨基酸。 
在另一优选例中,所述基因簇包括以下II型聚酮合成酶PKS相关基因:kstA1,kstA2,kstA3,kstD1,kstD2,kstD3,kstD4,kstD5,kstD6,kstD7,kstD8,kstD9,kstD10,kstD11,kstD12,kstD13和kstD14;和/或 
以下非核糖体聚肽合成酶NRPS相关基因:kstB1,kstB2,kstE1,kstE2,kstE3,kstE4,kstE5和kstE6;和/或 
以下乙酰化的糖基合成相关基因:kstC1,kstC2,kstC3,kstC4,kstC5,kstC6,kstC7,kstC8和kstC9;和/或 
以下负责吡咯吡咯二并环形成的后修饰基因:kstF1,kstF2,kstF3,kstF4,kstF5,kstF6。 
在另一优选例中,所述基因簇包括以下抗性基因:kstRs1,kstRs2,kstRs3,kstRs4,kstRs5,kstRs6和kstRs7;和/或 
以下调节基因:kstRg1,kstRg2,kstRg3,kstRg4和kstRg5。 
在另一优选例中,所述基因簇的序列选自SEQ ID NO.:1中第1-64280位,第9140-64280位,或第1-67842位。 
本发明第二方面,提供了一种越野他汀的生物合成相关蛋白,所述的蛋白的氨基酸序列选自如SEQ ID NO.:2-56所示的氨基酸序列。 
在另一优选例中,所述的生物合成相关蛋白是SEQ ID NO.:3所示的腺苷酰化酶。 
在另一优选例中,所述的生物合成相关蛋白是SEQ ID NO.:4所示的肽酰载体蛋白。 
在另一优选例中,所述的生物合成相关蛋白是SEQ ID NO.:37所示的糖基转移酶。 
本发明第三方面,提供了一种越野他汀的生物合成相关基因,所述的合成相关基因编码权本发明第二方面所述的越野他汀的生物合成相关蛋白。 
在另一优选例中,所述的生物合成相关基因是选自以下基因的一种或多种: 
kstA1,kstA2,kstA3,kstD1,kstD2,kstD3,kstD4,kstD5,kstD6,kstD7,kstD8,kstD9,kstD10,kstD11,kstD12,kstD13,kstD14,kstB1,kstB2,kstE1,kstE2,kstE3,kstE4,kstE5,kstE6,kstC1,kstC2,kstC3,kstC4,kstC5,kstC6,kstC7,kstC8,kstC9,kstF1,kstF2,kstF3,kstF4,kstF5,kstF6,kstRs1,kstRs2,kstRs3,kstRs4,kstRs5,kstRs6,kstRs7,kstRg1,kstRg2,kstRg3,kstRg4,kstRg5。 
在另一优选例中,所述合成相关基因的核苷酸序列的信息见表1。 
本发明第四方面,提供了一种本发明第一方面所述的越野他汀生物合成基因簇,或本发明第二方面所述的生物合成相关蛋白的用途,用于催化合成抗生素越野他汀及类似物。 
本发明第五方面,提供了一种表达载体,所述表达载体含有本发明第一方面所述的越野他汀的生物合成基因簇或本发明第三方面所述的越野他汀的生物合成相关基因。 
本发明第六方面,提供了一种重组的宿主细胞,所述宿主细胞含有本发明第五方面所述的表达载体,或其染色体上整合有外源的本发明第一方面所述的越野他汀的生物合成基因簇或本发明第三方面所述的越野他汀的生物合成相关基因。 
在另一优选例中,所述重组的宿主细胞包括链霉菌、大肠杆菌。 
本发明第七方面,提供了一种产生越野他汀的方法,包括步骤:培养本发明第六方面所述的宿主细胞,从而表达越野他汀,以及从培养物中分离越野他汀。 
本发明第七方面,提供了一种小单胞菌((Micromonospora sp),所述的小单胞菌中,本发明第一方面所述的越野他汀的生物合成基因簇中一个或多个基 因被失活,从而不产生越野他汀。 
在另一优选例中,所述的被失活基因选自kstB1,kstB2,或kstC5。 
本发明第八方面,提供了一种kstB1基因或其蛋白的用途,用于制备腺苷酰化酶制剂,或用于催化腺苷酰化反应。 
在另一优选例中,所述的腺苷酰化酶选自下组: 
(a)氨基酸序列如SEQ ID NO.:3所示的蛋白; 
(b)包含(a)所限定的序列经过一个或多个(较佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽。 
本发明第九方面,提供了一种kstB2基因或其蛋白的用途,用于制备肽酰载体蛋白制剂。 
在另一优选例中,所述的肽酰载体蛋白选自下组: 
(a)氨基酸序列如SEQ ID NO.:4所示的蛋白; 
(b)包含(a)所限定的序列经过一个或多个(较佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽。 
本发明第十方面,提供了一种kstC5基因或其蛋白的用途,用于制备糖基转移酶制剂。 
在另一优选例中,所述的糖基转移酶选自下组: 
(a)氨基酸序列如SEQ ID NO.:37所示的蛋白; 
(b)包含(a)所限定的序列经过一个或多个(较佳地1-10个,更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽。 
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。 
附图说明
图1显示了越野他汀的化学结构式,其中,图1A为越野他汀(Kosinostatin,KST),图1B为其异构体异醌环素B(Isoquinocycline B,ISO)。 
图2显示了越野他汀生物合成基因簇的基因结构和限制性内切酶谱。 
其中,图2A显示了2个不交叠的黏粒fMHM6-10-18、fZQ3-7和一个亚克隆质粒pPsc6代表了小单孢菌Micromonospora sp.TP-A0468基因组已测序的82.5kb DNA区域,字母B代表限制性内切酶Bam HI; 
图2B显示了越野他汀生物合成基因簇的基因组成。 
图3显示了越野他汀在小单孢菌Micromonospora sp.TP-A0468中的生物合成途径。其中CoA:辅酶A;ACP:酰基载体蛋白;PCP:肽酰载体蛋白;1:越野他汀;2:异醌环素B。 
图4显示了Micromonospora sp.TP-A0468野生型菌株发酵产物的液相色谱-质谱(LC-MS)分析。其中ISO:异醌环素B;KST:越野他汀。 
图5显示了越野他汀生物合成基因簇相关性的证实与基因簇边界确定。 
其中ISO:异醌环素B;KST:越野他汀;WT:Micromonospora sp TP-A0468野生型菌株;ΔkstB1:kstB1基因置换突变株;Δorf(-2):orf(-2)基因中断突变株;Δorf(-1):orf(-1)基因中断突变株;Δorf(+1):orf(+1)基因中断突变株;Δorf(+2):orf(+2)基因中断突变株。 
由图5可见,敲除orf(-1)与orf(+1)之间的基因,对越野他汀的产生造成影响;相反,敲除其他基因,对越野他汀的产生没有影响。 
图6显示了糖基合成相关基因置换突变菌株发酵产物的高效液相-质谱联用(LC-MS)分析。图6A:野生型发酵产物;图6B:kstC8基因置换的突变体发酵产物;图6C:kstC3基因置换的突变体发酵产物;图6D:B中化合物1的[M+H]+分子量;图6E:B中化合物2的[M+H]+分子量;图6F:C中化合物1的[M+H]+分子量;图6G:C中化合物2的[M+H]+分子量。 
其中,ISO:异醌环素B;KST:越野他汀。1:化合物I,即异醌环素B脱糖基产物;2:化合物H,即越野他汀脱糖基产物。 
由图6可见,敲除kstB1、kstD3等基因之后,相关突变株不再产生越野他汀。敲除kstC3、kstC7、kstC8等基因之后,相关突变株能够产生越野他汀脱去糖基的类似物。 
图7显示了kstB1和kstB2基因功能的研究。图7A腺苷化酶保守区域氨基酸残基分析。A1-A10:腺苷酰化酶中的10个保守氨基酸基序。图7B腺苷酰化酶(KstB1)与肽酰载体蛋白(KstB2)在大肠杆菌中的异源表达。2,3:蛋白标准大小;1:异源表达纯化后的KstB1;4:异源表达纯化后的KstB2。图7C腺苷酰化酶KstB1活化烟酸并转移到KstB2上形成烟酰-KstB2。PCP:肽酰载体蛋白,及KstB2;1:apo形式的KstB2;2:holo形式的KstB2;3:烟酰-KstB2。 
由图7可见,KstB1能够活化烟酸并将烟酸转移到肽酰载体蛋白(PCP,KstB2)上形成烟酰-PCP,这是含氮边链合成的起始步骤。 
图8显示了越野他汀生物合成基因簇中部分基因的敲除实验结果:验证正确的基因敲除突变株与野生型同时进行发酵,发酵之后的提取液用HPLC检测。HPLC结果能够反映基因的敲除是否对越野他汀的产生造成影响,以及基因敲除突变株中是否有新化合物出现。 
WT:小单孢菌M.sp.TP-A0468野生型;ISO:异醌环素B;KST,越野他汀。 
由图8A-L可见,在各个基因敲除突变株中,有的完全中断了越野他汀的产生,有的产量有所变化,有的有新化合物出现。 
图9显示了越野他汀生物合成基因簇中部分基因在大肠杆菌中的异源表达结果,其中,纯化之后的基因表达产物用SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)检测大小与纯度。在每幅电泳图中M标示的条带表示蛋白标准分子量,相应的基因表达产物在条带的上方标出。 
图10显示了基因敲除重组质粒的构建方法。 
图11显示了糖基转移酶基因kstC5功能研究 
kstC5敲除的突变株(ΔkstC5)产生化合物22和化合物22a,与野生型的产物越野他汀、异醌环素B相比,化合物22和22a缺失了乙酰糖基单元;不含KstC5的突变株细胞裂解液不能催化22/22a转化为越野他汀/异醌环素B, 而包含KstC5的野生型细胞裂解液可以。 
由此可见,糖基转移酶基因kstC5编码产物的功能是将乙酰糖基单元转移到化合物22和22a上,形成最终的产物越野他汀(KST)和异醌环素B(ISO)。 
具体实施方式
本发明人经过广泛而深入的研究,以小单孢菌来源的越野他汀为目标分子,从克隆其在Micromonospora sp.TP-A0468中的生物合成基因簇出发,采用微生物学、分子生物学、生物信息学、生物化学及有机化学相结合的方法研究其生物合成,首次鉴定了越野他汀的生物合成基因簇,具体地,所述基因簇包括55个基因:17个II型聚酮合成酶PKS相关基因,8个非核糖体聚肽合成酶NRPS相关基因,9个与乙酰化的糖基合成相关的基因,6个负责吡咯吡咯二并环形成的后修饰基因,7个抗性基因,5个调节基因,3个对越野他汀的生物合成无明显作用的基因。在此基础上,完成了本发明。 
越野他汀 
越野他汀(Kosinostatin,结构如图1A所示)是2002年由日本科学家Tamotsu Furumai从富山湾深海中分离得到的小单孢菌Micromonospora sp.TP-A0468所产生的具有良好抗肿瘤抗菌活性的天然产物[J.Antibiot.(Tokyo)55,128–133(2002)]。 
越野他汀分子由三部分组成:蒽环骨架、含氮杂环以及酰基化的脱氧己糖单元。其中的蒽环骨架是以II型PKS的方式合成的。人们认为miniPKS一般由丙二酰-ACP经过脱羧产生的乙酸单元转移至KS活性位点而起始,而后KS催化ACP上丙二酰硫酯脱去二氧化碳形成碳负离子与KS上酰基发生Claisen缩合在ACP上形成相应的硫酯结构,接着转移至KS活性位点而完成两碳单元的延伸。当聚酮通道充满时,聚酮酰-ACP离开体系发生随后的酮基还原、环化、氧化等后修饰。 
在化学定义上,蒽环类抗生素为7,8,9,10-四氢-5,12-萘并醌的衍生物,一般呈现红色或橙色。从生物合成角度看,蒽环类抗生素是由II型PKS体系催化形成的。在这一催化体系中,KSα,KSβ与ACP是II型PKS的核心蛋白,它们通过相互作用形成minimalPKS异源复合物。其中的KSα负责催化合成砌块之间的Claisen缩合,从而将C链延长;而KSβ控制着Claisen缩合发生的次数,从而决定最终形成的C链的长度,因此又称为链延伸因子(CLF)。合成过程中的聚酮链结合在ACP上形成聚酮酰ACP。合成结束后的聚酮链与KSα、KSβ脱离,经环化、氧化、还原、甲基化以及其它一些后修饰形成成熟的蒽环骨架结构。(如图3所示) 
在越野他汀的生物合成过程中同时会产生它的异构体异醌环素B(如图1B所示),它们的不同之处在于螺环中心C原子的立体构型不同。二者纯化后在溶液中亦会发生缓慢的自发转化。 
体外生化实验显示越野他汀抑制人DNA拓扑异构酶I、II,其IC50分别为10-30μM和3-10μM[J.Antibiot.(Tokyo)55,128–133(2002)]。异醌环素B的抗菌活性只有越野他汀的十分之一,而越野他汀和异醌环素B脱去糖基之后的糖苷部分生物活性均急剧降低。推测原因是越野他汀与异醌环素及它们 的糖苷相比,具有更高的细胞通透性和更高的DNA亲和能力。 
对于革兰氏阳性菌,越野他汀具有良好的生物活性;对于革兰氏阴性菌和酵母,越野他汀具有中等的生物活性;对于肿瘤细胞,越野他汀具有良好的生物活性(IC50约为0.10μM),其抗肿瘤活性要优于阿霉素。 
越野他汀生物合成基因簇的确定 
首先,根据已经报道的蒽环类抗生素KSα和KSβ的氨基酸序列,分析它们的保守序列,设计了简并引物(For(KS):ATCACCGTGGCCTGYTTYGAYGCSATC-3'(SEQ ID NO.:57),Rev(CLF):CCGGTGTTGACSGSRTAGAACCANGC(SEQ ID NO.:58);其中,S=C或G,Y=C或T,R=A或G)进行PCR,从Micromonospora sp TP-A1304基因组DNA中扩增得到了1.1kb的片段,克隆入pGEM-T Easy载体。 
DNA序列分析表明插入片段的一端与诺加霉素生物合成中的链延伸因子Snoa2同源性最高[Identities=68%,Positives=78%],而另一端与诺加霉素生物合成中的酮基合成酶Snoa1同源性最高[Identities=79%,Positives=85%],因此,该片段很可能与越野他汀的生物合成相关。 
将上述克隆得到的基因片段进行地高辛标记,用于文库筛选。对筛选到的正确黏粒测序,利用已知序列信息进行染色体步移,直至得到的黏粒能够完整地覆盖整个基因簇。使用基因簇序列同源性在线分析软件FramePlot4.0beta(http://nocardia.nih.go.jp/fp4/),对所获得的82,504bp核苷酸序列进行的分析发现了75个orf和1个不完整的orf(图2B)。 
目的蛋白氨基酸序列同源性分析是使用美国国家生物信息中心提供的Blast搜索引擎(http://www.ncbi.nlm.nih.gov/blast/)。序列中各个基因对应的核苷酸位置和编码蛋白功能的生物信息学分析结果如表1所示(与越野他汀生物合成不相关的基因仅显示了一部分)。 
以上内容表明,越野他汀的生物合成基因簇是通过同源序列克隆得到,同时,越野他汀生物合成基因簇中的保守基因也可以用作同源探针或者其他形式的同源参考序列来筛选与越野他汀类似的次级代谢产物的生物合成基因簇。 
表1 
Figure BDA00003028445300091
Figure BDA00003028445300101
越野他汀生物合成基因簇相关性和完整性的确定 
由于微生物次级代谢产物的生物合成基因在染色体上是连锁成簇存在的,本发明人对已获得序列中的各个基因进行敲除实验,以验证所获得基因簇与越野他汀生物合成的相关性及其完整性。 
基因敲除kstB1完全中断了越野他汀的产生,证明筛选到的基因簇的确是与越野他汀生物合成相关的;基因敲除orf(-2)、orf(-1)、orf(+1)与orf(+2)对越野他汀的产生没有影响,证实得到的基因簇包含了越野他汀生物合成所需要的所有基因(图5)。敲除orf(-1)与orf(+1)之间的各个基因,对越野他汀及其异构体异醌环素B的产生都会有或多或少的影响;在各个基因敲除突变株中,有的完全中断了越野他汀的产生,有的产量有所变化,有的有新化合物出现。(图4,图8)。 
基于以上实验结果,并与同类化合物生物合成基因簇进行比较,本发明人确定越野他汀的生物合成基因簇包含从kstD1到kstE6的55个开放读码框(图2B),涵盖染色体55.141kb的区域。在整个基因簇中,17个基因编码II型聚酮合成酶(PKS)及其相关蛋白(kstA1-kstA3,kstD1-kstD14),;8个基因编码非核糖体聚肽合成酶(NRPS)及其相关蛋白(kstB1-kstB2,kstE1-E6);9个基因编码糖基合成相关蛋白(kstC1-kstC9);6个后修饰基因(kstF1-kstF6)编码色氨酸合成酶系类似蛋白,负责催化氮杂五元芳环形成吡咯吡咯二并环;还包括7个抗性基因(kstRs1-kstRs7),5个调节基因(kstRg1-kstRg5)以及3个无明显功能的基因(kstU1-kstU3)(表1,图1)。 
越野他汀分子中蒽环骨架的合成: 
负责合成越野他汀蒽环骨架的是II型PKS基因,包含三个重复利用的酶:KSα、KSβ及ACP,此三者相互作用形成复合体,构成miniPKS.KSα以丙二酰-CoA起始,并以丙二酰-CoA作为延伸单元进行9次延伸形成20C的聚酮酰-ACP。接下来在芳香化酶KstD3和C-9位酮基还原酶KstD4的催化下形成第一个环;在二三环环化酶KstD1和单氧化酶KstD5催化下形成第二、第三个环;在甲基转移酶KstD14催化下C-19位发生甲基取代,并由第四环环化酶KstD6或者KstD10催化形成第四个环;最后再KstD2、KstD12、KstD7和KstD8等氧化还原酶作用下形成成熟的蒽环骨架(图3)。 
含氮边链的合成 
在越野他汀生物合成基因簇中存在2个NRPS基因:kstB1和kstB2,它们分别编码独立的腺苷酰化酶和肽酰载体蛋白。一般情况下,在II型PKS合成的分子中出现的NRPS基因都是负责催化形成II型PKS前体的。但是越野他汀生物合成中II型PKS是以丙二酰-CoA作为起始底物的,并没有利用NRPS的产物。因此,这里的NRPS蛋白很可能只是活化一个氨基酸,为含氮边链的形成提供前体;而且这一前体的加工、成熟是平行于蒽环骨架形成过程的。 
实验证实,KstB1能够活化烟酸并将烟酸转移到肽酰载体蛋白(PCP,KstB2)上形成烟酰-PCP,这是含氮边链合成的起始步骤(图7)。其后,连接在PCP上的烟酸依次经历羟化酶KstE3催化的C-6位羟化、双氧化酶KstE4催化的N-C 键断裂、去甲酰化酶KstE6催化的脱去甲酰基、氨基转移酶KstE5催化的氨基化、四氢嘧啶合成酶催化的氨基与酮基碳的脱水环合以及酰基-CoA脱氢酶催化的氧化脱氢,最终形成一个氨基吡咯酰基-PCP结构。至此形成了含氮边链中的第一个氮杂五元环。 
氨基吡咯结构可能通过KstD13的作用与合成成熟的蒽环骨架发生缩合,吡咯的C-2位置形成手性中心,同时在蒽环骨架的第四环和吡咯环之间形成一个螺呋喃环。接下来的后修饰过程采取类似色氨酸生物合成的方式进行:首先在氨基的邻位发生羧化,继而通过糖基转移将5-磷酸呋喃核糖转移到游离氨基的N原子上,糖基异构化并通过2'位C原子与吡咯环上的C-4发生环合脱羧,形成一个类似吲哚甘油磷酸的结构,此结构在色氨酸合成酶α亚基的作用下脱去甘油磷酸基,再经过还原反应形成分子中成熟的含氮边链。含氮边链是结合在蒽环骨架上成熟的,它与蒽环骨架一起构成了越野他汀分子的糖苷配体(图3)。 
脱氧糖基单元的合成 
糖基单元的合成也是平行于蒽环骨架形成过程的。其合成过程起始于葡萄糖-6-磷酸向dNDP-葡萄糖的转化(N为尿嘧啶或胸腺嘧啶),继而在dTDP-葡萄糖-4,6-脱水酶KstC2的作用下脱去一分子水,在2,3-己糖脱水酶KstC6催化下又脱去一分子水,形成一个3,4-二酮基-2,6-双脱氧的dNDP-己糖结构;接下来这个双脱氧的糖基在糖基-3-酮还原酶的催化下C-3位酮基被还原成羟基并在3,5-表异构酶的催化下发生异构化。糖基的乙酰化步骤是在KstC7、KstC8两个酶催化下完成的。这两个酶分别与丙酮酸脱氢酶的α亚基和β亚基同源,而很多糖基的乙酰化都是由丙酮酸脱氢酶催化完成的。因此,KstC7催化硫胺素焦磷酸与丙酮酸缩合生成2-α-羟乙基硫胺素焦磷酸,再通过KstC8的转乙醛作用将羟乙基转移到脱氧糖基的4'位羰基碳上,最后通过异构化形成成熟的乙酰脱氧糖基单元。成熟的糖基单元能够被糖基转移酶KstC5识别,并在KstC5的辅助蛋白KstC4的共同作用下被转移到蒽环骨架上形成成熟的越野他汀分子(图3)。 
越野他汀生物合成基因簇的应用—通过基因敲除、基因簇重组等组合生物学手段得到越野他汀类似物或者衍生物,筛选新的、活性更好的化合物: 
在克隆、分析了完整的越野他汀生物合成基因簇,研究了各蛋白功能的基础上,本发明人对基因簇中部分基因进行了敲除实验。敲除kstB1、kstD3等基因之后,相关突变株不再产生越野他汀。敲除kstC3、kstC7、kstC8等基因之后,相关突变株能够产生越野他汀脱去糖基的类似物(图6)。敲除kstF1、kstF2等基因之后,相关突变株能够产生含氮边链不成熟的越野他汀类似物。这些敲除实验证实了该基因簇与越野他汀生物合成的相关性,同时也为对该基因簇进行进一步的遗传操作提供了技术基础;而且在相关突变株中产生的越野他汀合成中间体或类似物为筛选新的活性天然产物提供了丰富的材料。 
本发明中提到的越野他汀分子中的乙酰脱氧糖基单元是该分子的药效基团。在其他活性天然产物中也有一些糖基作为活性基团而存在,但在结构上与本发明中的糖基不尽相同。本发明人通过分析整个基因簇,找到了与糖基合成 相关的基因并分析了它们的功能,而且通过大肠杆菌异源表达纯化得到了糖基转移酶等蛋白。 
本发明的实验提示,通过糖基转移酶KstC5的作用,在体外将越野他汀分子中的独特糖基转移到其他活性天然产物的糖苷配体上,或者将越野他汀基因簇中的糖基合成相关基因整合进其他天然产物的生物合成基因簇中,可产生越野他汀的衍生物。 
越野他汀生物合成基因的集合 
本发明所述的越野他汀生物合成基因的集合(set),表示由编码如SEQ ID No.:2-56所示蛋白的基因构成的基因集合。 
如本文所用,“本发明多肽”或“本发明蛋白”可互换使用,指越野他汀生物合成相关蛋白,包括如SEQ ID No.:2-56所示的蛋白。 
本领域普通技术人员不难知晓,在多肽的某些区域(如非必要区域)改变(添加、缺失或取代)少数氨基酸残基基本上不会改变生物活性,例如适当替换氨基酸得到的序列并不会影响其活性(可参见Watson等,Molecular Biology of The Gene,第四版,1987,The Benjamin/Cummings Pub.Co.P224)。因此,就本领域普通技术人员而言,能够实施这种替换或改变并且仍获得具有所需生物活性的多肽。 
因此,所述的如SEQ ID No.:2-56所示的蛋白包括选自下组的多肽:(a)氨基酸序列如SEQ ID NO:2-56所示的多肽;或(b)包含(a)所限定的序列经过一个或多个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽;其中,一个或多个包括1-50个,较佳地1-20,更佳地1-10个,最佳地1-5个。 
在本发明中,本发明的“多肽”包括与氨基酸序列如SEQ ID NO:2-56所示的多肽相比,有至多20个,较佳地至多10个,更佳地至多5个,最佳地至多3个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异的多肽可根据,例如表2所示进行氨基酸替换而产生。 
表2 
Figure BDA00003028445300131
Figure BDA00003028445300141
本发明还提供了编码本发明多肽的多核苷酸。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。 
因此,本文所用的“含有”,“具有”或“包括”包括了“包含”、“主要由……构成”、“基本上由……构成”、和“由……构成”;“主要由……构成”、“基本上由……构成”和“由……构成”属于“含有”、“具有”或“包括”的下位概念。 
载体 
本文所用的术语“载体”包括能使插入目的基因进入宿主细胞表达的克隆载体以及其他载体。表达载体可包括原核表达载体和真核表达载体,可以是质粒、黏粒、噬菌体或病毒等。典型的表达载体带有能使基因表达的调控序列,并在适当位置有可插入外源基因的限制性内切酶位点。 
在具体的实施方式中,本发明表达载体含有本发明的越野他汀生物合成基因的集合,或含有本发明的越野他汀生物合成基因簇。 
在优选的实施方式中,本发明的表达载体上含有多拷贝的本发明的越野他汀生物合成基因的集合,或多拷贝的本发明越野他汀生物合成基因簇。 
宿主细胞 
本文所用的术语“宿主细胞”具有本领域普通技术人员通常理解的含义,即,包含外源性目的基因并能使之表达的细胞。例如,宿主细胞可以是原核宿主细胞(例如,大肠杆菌、枯草杆菌、链霉菌、小单胞菌)、真核宿主细胞(例如,酵母)、植物细胞等等。 
在具体的实施方式中,本发明的宿主细胞宜包含本发明的表达载体,或染色体上整合有单拷贝或多拷贝的外源的越野他汀生物合成基因的集合,或单拷贝或多拷贝的越野他汀生物合成基因簇。 
在优选的实施方式中,本发明的宿主细胞包括小单胞菌、链霉菌枯草芽孢杆菌、大肠杆菌。 
优选地,本发明的工程菌是通过小单胞菌(Micromonospora sp.TP-A0468)基因工程改造而获得。 
越野他汀生物合成基因簇中结构基因失活的突变链霉素 
本发明还提供一种链霉菌突变株,所述突变株中本发明的越野他汀生物合成基因的集合中的一个或多个基因失活,或本发明的越野他汀生物合成基因簇中的一个或多个基因失活,从而所述突变株不产生越野他汀。 
在具体的实施方式中,所述失活的一个或多个基因选自编码如SEQ ID NO.:2-56所示蛋白的基因。更佳地,所述的被失活基因选自kstB1,kstB2,kstC5。 
本发明提供的越野他汀生物合成基因簇中一个或多个结构基因被失活的链霉 菌突变株,可作为验证越野他汀基因簇中基因功能的模型或对照菌株,和/或用于外源表达越野他汀的宿主细胞。 
本发明的应用及优点 
利用本发明的基因簇可实现以下目的: 
(1)本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的方法或包含本发明序列的DNA作为探针进行Southern杂交的方法从其他微生物中得到越野他汀生物合成基因的同源基因; 
(2)包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从小单孢菌Micromonospora sp TP-A0468基因组文库中定位更多的文库质粒。这些文库质粒至少包含本发明中的部分序列,也包含有Micromonosporasp TP-A0468基因组中越野他汀基因簇邻近区域未克隆的DNA片段; 
(3)本发明所提供的核苷酸序列或部分核苷酸序列的克隆基因或DNA片段可以通过中断越野他汀生物合成的一个或几个步骤或者引入其他同源基因而得到新的越野他汀的前体或衍生物; 
(4)本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达体系在外源宿主中表达以得到相应的酶或其他更高的生物活性或产量。这些外源宿主包括链霉菌、假单孢菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等; 
(5)本发明所提供的核苷酸序列或部分核苷酸序列的基因或基因簇可以通过遗传重组来构建质粒以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径; 
(6)本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化(DNA shuffling),或通过紫外线或化学试剂诱变等; 
(7)本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备; 
(8)本发明所提供的氨基酸序列或部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其它致力于得到的性质; 
(9)本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质; 
(10)本发明所提供的核苷酸序列或部分核苷酸序列可以用来调节四霉素或其衍生物的产量; 
(11)本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能; 
(12)本发明提供的核苷酸序列或多个序列可以与载体序列融合而得到重组序列和相应的DNA分子。 
总之,本发明所提供的包含越野他汀生物合成相关的所有基因和蛋白信息有助于阐明与理解越野他汀生物合成的分子机理,从而为进一步利用基因工程 手段改造提供理论基础与材料。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。 
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:ColdSpring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计。 
实施例1越野他汀产生菌Micromonospora sp.TP-A0468基因组DNA的提取 
1)收集菌丝 
将100μL1×108个/mL的日本科学家Tamotsu Furumai文献报道的Micromonospora sp.TP-A0468孢子悬液接种到3mL ISP-2液体培养基中,30℃,230rpm培养约24hr后达到对数生长期后期,取2mL接种到50mL ISP-2中(含25mM氯化镁),30℃,250rpm培养约23hr后达到稳定生长期前期,呈乳黄色浑浊,将菌液4℃,3500rpm,离心15min收集菌丝,用溶菌缓冲液洗涤,收集淡乳黄色菌丝0.5mL。 
2)抽提基因组DNA 
向1mL菌丝中加入10mL溶菌缓冲液(含溶菌酶5mg/mL),涡旋至均一,37℃水浴15mim。加入0.1mL蛋白酶K溶液(10mg/mL,用溶菌缓冲液新鲜配制),1mL10%SDS,混匀后迅速放入70℃水浴15mim,呈澄清。置冰上冷却,加入2.5mL5M KAc,冰上冷却15min。加入10mL饱和酚,混匀,10mL氯仿,混匀,12000rpm,4℃离心20min。用破口的枪头将水相吸出置于新的离心管,加等当量的氯仿:异戊醇(24:1)抽提,12000rpm,4℃离心10min。用破口的枪头将水相吸出置于新的离心管,加2倍的无水乙醇,混匀,有大团的DNA出现。将其钩出置于新的离心管,加5mL70%乙醇洗涤,将液体倾出,用枪吸净,加5mL TE缓冲液溶解,加RNase A使终浓度为50μg/mL,37℃温育0.5小时。依次用等体积的饱和酚抽提两次,氯仿:异戊醇(24:1)抽提两次,向水相中加入0.1体积的3MNaAc,2体积的无水乙醇,轻轻的混合充分,有絮状DNA出现。将四管DNA合并到两管(每管中有1mL70%乙醇用于洗涤),将液体吸出,再加1mL无水乙醇洗涤,吸出乙醇,超净台中吹干,溶于适当体积的TE缓冲液(pH8.0)中。 
实施例2PCR克隆越野他汀生物合成基因 
50μL PCR体系的组成如表3所示: 
表3 
Figure BDA00003028445300161
Figure BDA00003028445300171
引物如表4所示: 
表4 
Figure BDA00003028445300172
Figure BDA00003028445300181
PCR程序: 
Taq酶 
循环1:94℃,3min,1轮循环; 
循环2:94℃,30s;55-65℃,30;72℃,1min/kb;35轮循环; 
循环3:72℃,5-10min;1轮循环。 
Primestar: 
步骤1:98℃,10s 
步骤2:58-65℃,15s 
步骤3:72℃,1min-3min 
步骤1-3循环30轮 
步骤4:72℃,10min 
不同引物的PCR条件都是以上述条件为基础进行优化的。 
PCR以后,将预期大小的DNA条带低熔点胶回收纯化,并连接到PCR克隆载体pGEM-T Easy载体中,转化E.coli DH5α,涂布在含有氨苄青霉素(ampicillin,Amp),异丙基硫代-β-D-半乳糖苷(isopropylβ-D-thiogalactoside,IPTG)和5-溴-4-氯-3-吲哚-β-D-半乳糖苷(5-Br-4-Cl-3-indole-β-D-galactoside,X-gal)的LB平板上进行蓝白斑筛选,挑取白色克隆进行鉴定。插入有预期大小DNA片段的质粒测序。 
有时引物两端设计有酶切位点,可以克隆入合适的载体中,酶切鉴定或测序。 
实施例3核酸分子杂交 
核酸分子杂交: 
1)地高辛DNA标记:将待标记的DNA用无菌水稀释至总体积15μL,沸水浴中加热变性10分钟,立即置于冰盐浴中冷却。接着加入2μL引物混合物,2μL dNTP混合物,1μL酶,混合均匀后,37℃水浴约16小时。加入0.8μL0.8M EDTA(pH8.0)以终止反应,加入2.5μL4M LiCl混合均匀,再加入75μL预冷的无水乙醇沉淀标记后的DNA,置于-80℃沉降40分钟。4℃,12000rpm离心20分钟收集DNA,用预冷的70%乙醇洗涤DNA沉淀,真空干燥后重新溶于50μL TE((pH8.0)中。 
2)菌落杂交(文库筛选)的膜转移:将保存于-80℃的基因文库稍融,取50μL,用450μL LB稀释得到10-1的稀释倍数,倍比稀释得到10-2,10-3,10-4,10-5,10-6。300μL涂平板(15cm×15cm,平板为LB/50μg/mL卡那霉素)。选取合适的比例,使每块平板约1200-1500个克隆。照选定的比例均匀涂布四块平板,37℃培养过夜。根据平板的大小剪取尼龙膜,小心地覆盖于平板表面不要产生气泡,做好位置标记,1分钟后取下尼龙膜置于干燥滤纸上,干燥10分钟直至菌落结合在尼龙膜上。原始的平板置于培养箱中4-5hr,使克隆重新生长作为原平板。将尼龙膜置于变性液(0.25M NaOH,1.5M NaCl)饱和的滤纸上 15分钟(不要浸过膜),转移至中和液(1.0M Tris.HCl,1.5M NaCl,pH7.5)饱和的滤纸上5分钟。转移至2×SSC(20xSSC储备液(L-1):NaCl,175.3g,柠檬酸钠,88.2g,pH=7.0)饱和的滤纸上自然风干。取下尼龙膜置于烘箱中,120℃固定45分钟。常温下于3×SSC/0.1%SDS溶液中振荡洗涤3小时,以除去细胞碎片。 
3)预杂交和杂交:预热杂交液(20mL/100cm2)至杂交温度68℃,放入杂交尼龙膜,轻轻振荡并保温30分钟。将DIG标记的DNA探针在沸水浴中变性5分钟,立即置于冰盐浴中冷却。冷却后,将DNA探针与合适体积的DIG杂交液(2.5mL/100cm2)混合均匀。去除预杂交液并立即把DNA探针/DIG杂交液加入,轻轻振荡保持杂交温度64℃或68℃约16小时。 
4)杂交后严紧洗脱:室温下用2×SSC/0.1%SDS漂洗两次,每次5分钟。68℃,用0.1×SSC/0.1%SDS振荡漂洗两次,每次15分钟。 
5)显色反应和检测:严紧洗脱后的尼龙膜在洗涤缓冲液(0.1M马来酸,0.15MNaCl,pH=7.5,0.3%(v/v)吐温20)中平衡1-5分钟,接着在封闭缓冲液(封闭试剂以10%的浓度溶于0.1M马来酸,0.15M NaCl,pH=7.5)中封闭30分钟,然后在抗体中浸泡30分钟。用洗涤缓冲液漂洗尼龙膜两次后,用检测缓冲液(0.1MTris-HCl,0.1M NaCl,pH=9.5)中平衡2-5分钟,最后将尼龙膜置于10mL新配制的显色溶液[NBT溶于70%DMF,浓度为70mg/mL,BCIP溶于水,浓度为50mg/mL。用时10mL显色溶液中加45μL NBT,35μL BCIP]中,置于黑暗中显色。显色合适后用去离子水漂洗以终止反应。 
实施例4越野他汀生物合成基因簇的克隆 
提取Micromonospora sp.TP-A0468的总DNA,利用试剂盒进行基因组文库构建,构建方法按照试剂盒的说明进行。所使用的试剂盒为CopyControlTMFosmid Library Production Kit,购自EPICENTRE Biotechnologies公司。 
如前文所述,根据KSα和KSβ的保守氨基酸序列设计了简并引物如SEQ IDNO.:57和SEQ ID NO.:58所示进行PCR,从Micromonospora sp.TP-A1304基因组DNA中扩增得到了1.1kb的片段,克隆入市售的pGEM-T Easy载体,测序验证其的确与II型PKS相关。用地高辛标记上述1.1kb片段作为探针,通过原位杂交从基因组文库中筛选阳性克隆,得到了黏粒fMHM6-10-18。对fMHM6-10-18进行全序列测定。对得到的序列进行分析发现,fMHM6-10-18只包含越野他汀生物合成所需的部分基因。根据已有的序列在fMHM6-10-18末端设计引物(ORF36D-F:TACGAATTC GGTTCGCGGTCGTCTTCGAG(SEQ ID NO.:59);ORF36D-R:TACAAGCTTCGCAGGT GCAGCGAGATGAC(SEQ ID NO.:60)),将PCR扩增得到的片段用地高辛标记,再次通过原位杂交筛库,得到黏粒fZQ3-5;再根据fZQ3-5端基测序结果设计探针进行染色体步移,得到黏粒fZQ3-7。由于fZQ3-5与另外两个黏粒重叠较大,故设计引物通过PCR扩增得到fMHM6-10-18与fZQ3-7之间不重叠的部分,大小约为3.5kb。将PCR片段克隆进载体pMD18-T得到亚克隆pPsc6.测序pPsc6和fZQ3-7并与fMHM6-10-18的序列进行拼接,共得到82,504bp序列,包含了完整的越野他汀生物合成基因簇(图2A)。 
实施例5越野他汀产生菌Micromonospora sp.TP-A0468基因敲除方法(以 kstRg1为例,其他基因用类似的方法进行敲除) 
(1)基因敲除质粒的构建 
设计引物ORF10D-F:TACGAATTCGTCGACGGAACCGACGCGAC(SEQ ID NO.:61)和ORF10D-R:TAC AAGCTT GGCACGTTCAGCGCCGGATC(SEQ ID NO.:62),以Micromonospora sp.TP-A0468总DNA为模板扩增得到kstRg1的754bp同源片段,用限制酶EcoRI和HindIIII消化上述片段以及载体pOJ260,用T4DNA连接酶将片段与载体连接(图10)。与载体链接成功的片段转化到大肠杆菌S17-1中,作为接合转移的供体菌。 
(2)通过接合转移获得基因中断突变株 
从经过转化的大肠杆菌(E.coli S17-1)培养平板上挑取单菌落接到试管中培养过夜,吸取500μl的菌液接到25ml LB中,置于37℃摇床中培养至OD600为0.4-0.6。将菌液离心沉淀,用15mL LB培养基洗涤两次,然后用5ml的LB培养基重悬,作为供体菌。 
取-80℃、20%甘油保存的小单孢菌A1304的菌丝体划线分离,30℃培养5-6天至长出单菌落。挑取单菌落接种到3mL V-22培养基中,30℃240rpm培养2-3d至培养物呈现较深的橙色。取500uL接种到50mL ISP-2或V-22培养基中(添加10mM MgCl2),28-30℃250rpm培养24-26hr。离心得菌体,15mL LB洗涤2次,加入2mL LB重悬菌体,匀浆20min作为受体菌。 
按20:l的体积比混合供体菌和受体菌,取100-200uL涂布到IWL-4培养基(含有10mM的MgCl2)。30℃培养12-15个小时后加入2ml含抗生素和萘啶酮酸(NA)的无菌H2O,轻轻摇动使无菌水覆盖整个平板表面。(培养基中抗生素最终浓度阿泊拉霉素:100μg/mL,萘啶酮酸:50μg/ml),吹干后放于30℃培养5-6天后挑取接合子。接合子如果能够在含有阿泊拉霉素50μg/ml的V-22培养基中生长,则为目标基因被敲除的突变株。 
实施例6Micromonospora sp.TP-A0468基因敲除突变株的发酵和产物鉴定 
(1)突变株的发酵 
挑取验证正确的基因敲除突变株单菌落接种到3mL V-22(可溶性淀粉1%,葡萄糖0.5%,酵母提取物0.2%,胰化蛋白胨0.5%,K2HPO40.1%,MgSO40.05%,CaCO30.3%,pH=7.0。)中,30℃240rpm培养2-3d至培养物呈现橙色。转接2%到40mL发酵培养基中,28℃240rpm培养36小时后加入质量比4%的大孔吸附树脂。继续培养2.5d至发酵结束。 
转移发酵液到50mL离心管中,3800rpm离心10min;弃上清,沉淀加入40mL丙酮,超声10min促溶。3800rpm离心10min,弃沉淀。上清转移到圆底烧瓶,低温旋蒸至残留少量水溶液。加入乙酸乙酯萃取1-2次,合并乙酸乙酯萃取液,旋蒸至完全干燥,用约2mL甲醇溶解,于-20℃保存。 
各突变株以及野生型Micromonospora sp.TP-A0468均采用相同的方法进行发酵和发酵液的处理。如果要分离突变株产生的化合物,则需要将发酵量扩大到2升,扩大的方法是增加发酵摇瓶的数量;菌体培养方法和发酵液处理方法与前面相同。 
(2)突变株发酵产物的鉴定 
高效液相色谱(HPLC)分析(图4,图8): 
将突变株的发酵提取液与野生型菌株的发酵提取液分别用HPLC检测,通过对比检测结果确定突变株是否产生新的化合物。具体做法是将发酵液提取物溶于甲醇中,取20μl进样,A相为水(含0.1%甲酸和10mM NH4Ac),B相为乙腈(含0.1%甲酸)。流速=1mL/min,紫外423nm处检测,柱子为NUCLEOSIL100-5C18,仪器为安捷伦1260。洗脱梯度如下: 
液相-质谱连用(LC-MS)与核磁共振(NMR)分析: 
若HPLC分析发现突变株能够产生新化合物,可以进一步将突变株的发酵提取液用LC-MS检测新化合物的分子量和部分结构信息,再通过大量发酵分离纯化化合物进行NMR分析,得到化合物完整的结构信息。 
实施例7证实kstC5基因编码的蛋白具有糖基转移酶功能 
参照实施例5中的基因敲除方法,利用引物kstC5s-For:5'-TAT TCTAGAACCTGACCGACGCGATCAC-3'(SEQ ID NO.:63),kstD5s-Re:5'-TAT AAGCTTCGTTGTACGGCACGTTGC-3'(SEQ ID NO.:64)扩增得到基因片段,与载体pOJ260连接,重组载体导入大肠杆菌S17-1。通过S17-1与野生型Micromonosparo sp.TP-A0468的接合转移得到kstC5基因敲除的突变株(ΔkstC5)。按照实施例6的方法进行突变株的发酵并对发酵产物进行结构鉴定,发现突变株不能将乙酰糖基单元加载到蒽环骨架上,结果产生了越野他汀和异醌环素B的脱糖基产物22和22a。说明kstC5编码的蛋白有可能负责越野他汀和异醌环素B的糖基化修饰。(图11) 
分别培养野生型Micromonosparo sp.TP-A0468和突变株ΔkstC5,通过离心收集两种菌株的细胞,用水洗涤细胞两次并用10mL水将细胞重新悬浮,用超声波破菌使细胞释放内容物,得到细胞裂解液。野生型裂解液中包含越野他汀生物合成所需的所有蛋白,而突变株仅比野生型缺少了kstC5编码的蛋白。将两种裂解液分别加入到化合物22/22a和乙酰糖基单元的混合液中,结果突变株的裂解液(缺少KstC5)不能催化形成越野他汀/异醌环素B,而野生型裂解液能够催化越野他汀/异醌环素B的形成。这说明kstC5的表达产物KstC5是一个糖基转移酶,能够将乙酰糖基单元加载到蒽环骨架上,形成越野他汀/异醌环素B分子。(图11) 
实施例8基因在大肠杆菌中表达及重组蛋白分离纯化 
以PCR方法获得待表达的目标基因,以EcoRI/HindIII克隆入市售的常规载体pSP72(Promega公司)中,经DNA顺序分析确定后,插入片段再经NdeI/HindⅢ切出,连入市售表达载体pET28a(Novagen公司)的相应酶切位点,获得了表达质粒。转化大肠杆菌BL21(DE3),挑取单菌落接入3mL LB(Kana,50μg/mL),37℃过夜培养。取30μL过夜培养物接入3mL LB(Kana50μg/mL)培养液,37℃培养两小时,加入IPTG至终浓度1mM/L,37℃继续培养四小 时后离心收集lmL菌体,加入50μL蛋白电泳缓冲液,涡旋后在沸水浴中煮沸3min,取出样品,12000rpm离心5min,取10μL上清上样,用SDS-PAGE蛋白电泳检查表达情况。大量表达将表达良好的2ml过夜培养物接种于500ml LB培养基(卡那霉素50μg/ml),37℃培养2.5小时(A600nm约0.5),转移至25℃继续培养0.5小时,加入IPTG至终浓度0.1mM,25℃表达6小时或15℃表达24小时以上。冰中冷却,4℃ 5000rpm离心5分钟收集菌体(取1ml菌液收集菌体作为SDS-PAGE样品分析全菌蛋白),STE缓冲液(10 mM Tris-HCl,10 mMNaCl,lmM EDTA,pH 8.0)洗涤1次,破菌缓冲液(50 mM NaH2P04,300 mM NaCl,10mM咪唑,以NaOH调pH为8.0)洗涤1次,加入10 ml(2 ml/g湿菌体)破菌缓冲液(加入溶菌酶至终浓度l mg/ml)重悬均匀,4℃(或冰中)放置30分钟。-80℃冻存30分钟后室温融化,冰浴状态下超声破碎10分钟(200-300W,超声10秒间歇50秒)。上清液转移至50 ml尖底离心管。加入1-2 mlNi-NTA亲和层析柱填料(视可溶性蛋白表达量及大小而定),冰浴状态下摇荡1-2小时(若蛋白大于150KD时间可延长,200 KD以上可过夜)。4℃ 2,000 rpm离心5分钟,倾去上清,用10-20 ml淋洗缓冲液(50 mM NaH2PO4,300 mM NaCl,25 mM咪唑,以NaOH调pH为8.0)轻轻旋起柱填料,冰浴状态下摇荡10分钟,4℃ 2,000rpm离心5分钟,倾去上清,加入10 ml淋洗缓冲液旋起柱填料,装柱,以10-20ml淋洗缓冲液淋洗2-3次。以0,5 ml x 6次洗脱缓冲液(50 mM NaH2PO4,300 mMNaCl,250 mM咪唑,以NaOH调pH为8.0)对目的蛋白进行洗脱。分析SDS-PAGE结果,若目的蛋白纯度达到90%以上,合并目的蛋白,4℃对透析液(50 mMTris-HCl,25 mM NaCl,5 mM B-巯基乙醇,10%甘油,0.02%NAN3)透析过夜后定量,分装保存于-80℃待测活;若纯度较差则合并目的蛋白,根据目的蛋白的性质结合其他方法(如凝胶过滤)进一步分离纯化。利用以上方法,本发明人对越野他汀生物合成基因簇中的各个基因进行了异源表达和表达产物纯化,纯化后的蛋白检测结果见图9。 
实施例9将纯化得到的可溶蛋白用于体外催化生化反应(以KstBl和KstB2为例) 
采用与实施例5类似的方法,将基因簇中的腺苷酰化酶基因kstB1和肽酰载体蛋白基因kstB2在大肠杆菌中表达,纯化得到了相应的可溶性蛋白KstBl和KstB2(图7)。根据蛋白序列分析,KstBl是一个腺苷酰化酶,能够识别一种氨基酸或者氨基酸类似物并将其与腺苷一磷酸(AMP)连接,进而转移到一个能够承载这一底物的肽酰载体蛋白(PCP)上。将KstB1可能的底物与KstBl、KstB2混合,同时加入必要的盐和辅因子进行体外。用HPLC和LC-MS等手段检测反应结果,既能够验证KstBl的功能,也能够获得KstB2被酰化之后的产物。本发明人依据以下配方进行体外反应,成功证实了KstBl的功能,并获得了KstB2被酰化之后的产物: 
成分 Tris-HCl MgCl2 ATP KstBl KstB2 烟酸 H2O
浓度(mM) 75 10 3 0.0l 0.1 1 加至25μL
以上体系在30℃水浴下反应30分钟,取20μL进行HPLC分析。检测所用仪器为安捷伦1260,柱子为Grace Vydac C18反相色谱柱,溶剂为A相=H2O+0.1% 甲酸,B相=乙腈+0.1%甲酸,流速=1mL/min,检测波长为220nm。洗脱条件如下: 
时间(min) 0 5 25 30 33 35
B相(%) 20 35 65 95 95 20
HPLC分析结果表明,KstB1识别的底物是烟酸,能够利用ATP将烟酸活化;KstB2能够接受活化之后的烟酸,与烟酸连接形成烟酰-KstB2。用LC-MS检测反应体系,分析得到KstB1、KstB2和烟酰-KstB2的分子量分别为56362Da、12032Da和12137Da与预期结果和HPLC分析结果均一致。通过体外生化反应,本发明人不仅证明了kstB1和kstB2两个基因的功能,也得到了催化产物烟酰-KstB2。 
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。 
Figure IDA00003028446100011
Figure IDA00003028446100021
Figure IDA00003028446100031
Figure IDA00003028446100041
Figure IDA00003028446100051
Figure IDA00003028446100061
Figure IDA00003028446100071
Figure IDA00003028446100081
Figure IDA00003028446100091
Figure IDA00003028446100101
Figure IDA00003028446100111
Figure IDA00003028446100131
Figure IDA00003028446100141
Figure IDA00003028446100151
Figure IDA00003028446100161
Figure IDA00003028446100171
Figure IDA00003028446100181
Figure IDA00003028446100191
Figure IDA00003028446100211
Figure IDA00003028446100221
Figure IDA00003028446100231
Figure IDA00003028446100241
Figure IDA00003028446100251
Figure IDA00003028446100261
Figure IDA00003028446100271
Figure IDA00003028446100281
Figure IDA00003028446100291
Figure IDA00003028446100301
Figure IDA00003028446100311
Figure IDA00003028446100321
Figure IDA00003028446100331
Figure IDA00003028446100341
Figure IDA00003028446100351
Figure IDA00003028446100361
Figure IDA00003028446100371
Figure IDA00003028446100401
Figure IDA00003028446100421
Figure IDA00003028446100431
Figure IDA00003028446100451
Figure IDA00003028446100461
Figure IDA00003028446100471
Figure IDA00003028446100481
Figure IDA00003028446100491
Figure IDA00003028446100501
Figure IDA00003028446100511
Figure IDA00003028446100521
Figure IDA00003028446100531
Figure IDA00003028446100551
Figure IDA00003028446100561
Figure IDA00003028446100571
Figure IDA00003028446100581
Figure IDA00003028446100591

Claims (14)

1.一种越野他汀的生物合成基因簇,其特征在于,所述基因簇包括编码越野他汀生物合成所涉及的55个基因,具体为:
1)II型聚酮合成酶PKS相关基因:kstA1,kstA2,kstA3,kstD1,kstD2,kstD3,kstD4,kstD5,kstD6,kstD7,kstD8,kstD9,kstD10,kstD11,kstD12,kstD13,kstD14;共17个基因:
kstA1位于基因簇核苷酸序列第9943-11505位,编码腺苷酰化酶,长度为422个氨基酸;
kstA2位于基因簇核苷酸序列第11507-11770位,编码肽酰载体蛋白(PCP),长度为402个氨基酸;
kstA3位于基因簇核苷酸序列第26548-26805位,编码酰基载体蛋白,长度为85个氨基酸;
kstD1位于基因簇核苷酸序列第9140-9946位,编码2,3-环环化酶,长度为268个氨基酸;
kstD2位于基因簇核苷酸序列第20823-216026位,编码酮基还原酶,长度为259个氨基酸;
kstD3位于基因簇核苷酸序列第22658-21699位,编码芳香化酶,长度为319个氨基酸;
kstD4位于基因簇核苷酸序列第23481-22696位,编码C-9位酮基还原酶,长度为261个氨基酸;
kstD5位于基因簇核苷酸序列第23591-24049位,编码单氧化酶,长度为152个氨基酸;
kstD6位于基因簇核苷酸序列第26861-27295位,编码第四环环化酶,长度为144个氨基酸;
kstD7位于基因簇核苷酸序列第27391-28233位,编码NAD(P)H:黄素氧化还原酶,长度为280个氨基酸;
kstD8位于基因簇核苷酸序列第28260-29156位,编码单氧化酶,长度为298个氨基酸;
kstD9位于基因簇核苷酸序列第32267-33358位,编码羧酸酯酶,长度为363个氨基酸;
kstD10位于基因簇核苷酸序列第32267-33358位,编码第四环环化酶,长度为150个氨基酸;
kstD11位于基因簇核苷酸序列第52203-51685位,编码脱氢酶,长度为172个氨基酸;
kstD12位于基因簇核苷酸序列第54953-54498位,编码羟化酶,长度为151个氨基酸;
kstD13位于基因簇核苷酸序列第60078-58579位,编码FAD依赖的或者包含BBE结构域的氧化还原酶,长度为499个氨基酸;
kstD14位于基因簇核苷酸序列第60258-61118位,编码甲基转移酶,长度为286个氨基酸;
2)非核糖体聚肽合成酶NRPS相关基因:kstB1,kstB2,kstE1,kstE2,kstE3,kstE4,kstE5,kstE6;共8个基因:
kstB1位于基因簇核苷酸序列第9943-11505位,编码NRPS腺苷化酶,长度为520个氨基酸;
kstB2位于基因簇核苷酸序列第11507-11770位,编码酰基载体蛋白,长度为87个氨基酸;
kstE1位于基因簇核苷酸序列第13618-13992位,编码L-ectoine合成酶,长度为124个氨基酸;
kstE2位于基因簇核苷酸序列第14017-15156位,编码酰基辅酶A脱氢酶,长度为379个氨基酸;
kstE3位于基因簇核苷酸序列第55079-55924位,编码羟化酶,长度为281个氨基酸;
kstE4位于基因簇核苷酸序列第58555-57470位,编码双氧化酶,长度为361个氨基酸;
kstE5位于基因簇核苷酸序列第61163-61852位,编码氨基转移酶,长度为229个氨基酸;
kstE6位于基因簇核苷酸序列第63435-64280位,编码脱甲酰酶,长度为281个氨基酸;
3)乙酰化的糖基合成相关基因:kstC1,kstC2,kstC3,kstC4,kstC5,kstC6,kstC7,kstC8,kstC9;共9个基因:
kstC1位于基因簇核苷酸序列第19574-18678位,编码dTDP-葡萄糖合成酶,长度为298个氨基酸;
kstC2位于基因簇核苷酸序列第19786-20775位,编码dTDP-葡萄糖-4,6-脱水酶,长度为329个氨基酸;
kstC3位于基因簇核苷酸序列第37944-37360位,编码3,5-表异构酶,长度为194个氨基酸;
kstC4位于基因簇核苷酸序列第38165-39175位,编码糖基转移酶辅助蛋白,长度为336个氨基酸;
kstC5位于基因簇核苷酸序列第39198-40496位,编码糖基转移酶,长度为432个氨基酸;
kstC6位于基因簇核苷酸序列第40496-41992位,编码2,3-己糖脱水酶,长度为498个氨基酸;
kstC7位于基因簇核苷酸序列第41989-43014位,编码丙酮酸脱氢酶α亚基,长度为341个氨基酸;
kstC8位于基因簇核苷酸序列第43031-44068位,编码丙酮酸脱氢酶β亚基,长度为345个氨基酸;
kstC9位于基因簇核苷酸序列第53344-52361位,编码己糖-3-酮基还原酶,长度为327个氨基酸;
4)负责吡咯吡咯二并环形成的后修饰基因:kstF1,kstF2,kstF3,kstF4,kstF5,kstF6;共6个基因:
kstF1位于基因簇核苷酸序列第11773-12807位,编码邻氨基苯甲酸磷酸核糖转移酶,长度为344个氨基酸;
kstF2位于基因簇核苷酸序列第12800-13621位,编码色氨酸合成酶α亚基,长度为273个氨基酸;
kstF3位于基因簇核苷酸序列第15160-15855位,编码邻氨基苯甲酸磷酸核糖异构酶,长度为231个氨基酸;
kstF4位于基因簇核苷酸序列第15920-16618位,编码吲哚甘油-3-磷酶合成酶,长度为232个氨基酸;
kstF5位于基因簇核苷酸序列第54495-53452位,编码Enoyl还原酶,长度为347个氨基酸;
kstF6位于基因簇核苷酸序列第61849-63372位,编码羧化酶,长度为507个氨基酸;
5)抗性基因:kstRs1,kstRs2,kstRs3,kstRs4,kstRs5,kstRs6,kstRs7;共7个基因
kstRs1位于基因簇核苷酸序列第30224-31300位,编码ABC转运蛋白,长度为358个氨基酸;
kstRs2位于基因簇核苷酸序列第31297-32130位,编码ABC转运蛋白,长度为277个氨基酸;
kstRs3位于基因簇核苷酸序列第35584-34109位,编码外排蛋白,长度为491个氨基酸;
kstRs4位于基因簇核苷酸序列第36608-35625位,编码转运蛋白,长度为327个氨基酸;
kstRs5位于基因簇核苷酸序列第44236-47025位,编码SNF2/RAD54家族解螺旋酶,长度为929个氨基酸;
kstRs6位于基因簇核苷酸序列第47037-48338位,编码抗性蛋白,长度为433个氨基酸;
kstRs7位于基因簇核苷酸序列第57431-56853位,编码抗性蛋白,长度为192个氨基酸;
6)调节基因:kstRg1,kstRg2,kstRg3,kstRg4,kstRg5,共5个基因:
kgtRg1位于基因簇核苷酸序列第17553-16669位,编码转录激活因子,长度为294个氨基酸;
kgtRg2位于基因簇核苷酸序列第29233-30021位,编码转录调节因子,长度为262个氨基酸;
kgtRg3位于基因簇核苷酸序列第50317-49112位,编码调节因子,长度为401个氨基酸;
kgtRg4位于基因簇核苷酸序列第51422-51649位,编码调节因子,长度为75个氨基酸;
kgtRg5位于基因簇核苷酸序列第56007-56840位,编码调节因子,长度为277个氨基酸;
7)其他基因:kstU1,kstU2,kstU3;共3个:
kgtU1位于基因簇核苷酸序列第48388-48822位,编码未知功能蛋白,长度为144个氨基酸;
kgtU2位于基因簇核苷酸序列第50774-50304位,编码未知功能蛋白,长度为156个氨基酸;
kgtU3位于基因簇核苷酸序列第51216-50785位,编码未知功能蛋白,长度为143个氨基酸。
2.如权利要求1所述的基因簇,其特征在于,所述基因簇包括以下II型聚酮合成酶PKS相关基因:kstA1,kstA2,kstA3,kstD1,kstD2,kstD3,kstD4,kstD5,kstD6,kstD7,kstD8,kstD9,kstD10,kstD11,kstD12,kstD13和kstD14;和/或
以下非核糖体聚肽合成酶NRPS相关基因:kstB1,kstB2,kstE1,kstE2,kstE3,kstE4,kstE5和kstE6;和/或
以下乙酰化的糖基合成相关基因:kstC1,kstC2,kstC3,kstC4,kstC5,kstC6,kstC7,kstC8和kstC9;和/或
以下负责吡咯吡咯二并环形成的后修饰基因:kstF1,kstF2,kstF3,kstF4,kstF5,kstF6。
3.如权利要求1所述的基因簇,其特征在于,所述基因簇包括以下抗性基因:kstRs1,kstRs2,kstRs3,kstRs4,kstRs5,kstRs6和kstRs7;和/或
以下调节基因:kstRg1,kstRg2,kstRg3,kstRg4和kstRg5。
4.如权利要求1所述的基因簇,其特征在于,所述基因簇的序列选自SEQID NO.:1中第1-64280位,第9140-64280位,或第1-67842位。
5.一种越野他汀的生物合成相关蛋白,其特征在于,所述的蛋白的氨基酸序列选自如SEQ ID NO.:2-56所示的氨基酸序列。
6.越野他汀的生物合成相关基因,其特征在于,所述的合成相关基因编码权利要求5所述的越野他汀的生物合成相关蛋白。
7.如权利要求1所述的越野他汀生物合成基因簇,或权利要求5所述的生物合成相关蛋白的用途,其特征在于,用于催化合成抗生素越野他汀及类似物。
8.一种表达载体,其特征在于,所述表达载体含有权利要求1所述的越野他汀的生物合成基因簇或权利要求6所述的越野他汀的生物合成相关基因。
9.一种重组的宿主细胞,其特征在于,所述宿主细胞含有权利要求8所述的表达载体,或其染色体上整合有外源的权利要求1所述的越野他汀的生物合成基因簇或权利要求6所述的越野他汀的生物合成相关基因。
10.一种产生越野他汀的方法,其特征在于,包括步骤:培养权利要求9所述的宿主细胞,从而表达越野他汀,以及从培养物中分离越野他汀。
11.一种小单胞菌((Micromonospora sp),其特征在于,所述的小单胞菌中,权利要求1所述的越野他汀的生物合成基因簇中一个或多个基因被失活,从而不产生越野他汀。
12.一种kstB1基因或其蛋白的用途,其特征在于,用于制备腺苷酰化酶制剂,或用于催化腺苷酰化反应。
13.一种kstB2基因或其蛋白的用途,其特征在于,用于制备肽酰载体蛋白制剂。
14.一种kstC5基因或其蛋白的用途,其特征在于,用于制备糖基转移酶制剂。
CN201310121783.4A 2013-04-09 2013-04-09 越野他汀的生物合成基因簇及其应用 Active CN103215282B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310121783.4A CN103215282B (zh) 2013-04-09 2013-04-09 越野他汀的生物合成基因簇及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310121783.4A CN103215282B (zh) 2013-04-09 2013-04-09 越野他汀的生物合成基因簇及其应用

Publications (2)

Publication Number Publication Date
CN103215282A true CN103215282A (zh) 2013-07-24
CN103215282B CN103215282B (zh) 2016-08-03

Family

ID=48813440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310121783.4A Active CN103215282B (zh) 2013-04-09 2013-04-09 越野他汀的生物合成基因簇及其应用

Country Status (1)

Country Link
CN (1) CN103215282B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104911196A (zh) * 2014-03-13 2015-09-16 中国科学院上海有机化学研究所 三欣卡辛的生物合成基因簇及其应用
CN106916835A (zh) * 2015-12-24 2017-07-04 武汉臻智生物科技有限公司 化合物的生物合成基因簇及其应用
CN106916834A (zh) * 2015-12-24 2017-07-04 武汉臻智生物科技有限公司 化合物的生物合成基因簇及其应用
CN110484576A (zh) * 2019-10-18 2019-11-22 广东省微生物研究所(广东省微生物分析检测中心) 一种提高榴菌素和榴菌素b产量的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002079465A2 (en) * 2000-11-28 2002-10-10 Sloan-Kettering Institute For Cancer Research Micromonospora echinospora genes encoding for biosynthesis of calicheamicin and self-resistance thereto
US6733998B1 (en) * 1998-12-07 2004-05-11 Sloan-Kettering Institute For Cancer Research Micromonospora echinospora genes coding for biosynthesis of calicheamicin and self-resistance thereto
US6861513B2 (en) * 2000-01-12 2005-03-01 Schering Corporation Everninomicin biosynthetic genes
US20070092944A1 (en) * 2000-04-13 2007-04-26 Leadlay Peter F Hybrid glycosylated products and their production and use

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6733998B1 (en) * 1998-12-07 2004-05-11 Sloan-Kettering Institute For Cancer Research Micromonospora echinospora genes coding for biosynthesis of calicheamicin and self-resistance thereto
US6861513B2 (en) * 2000-01-12 2005-03-01 Schering Corporation Everninomicin biosynthetic genes
US20070092944A1 (en) * 2000-04-13 2007-04-26 Leadlay Peter F Hybrid glycosylated products and their production and use
WO2002079465A2 (en) * 2000-11-28 2002-10-10 Sloan-Kettering Institute For Cancer Research Micromonospora echinospora genes encoding for biosynthesis of calicheamicin and self-resistance thereto

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李慧,唐功力,等: "越野他汀生物合成介导的海洋小单胞菌中一个新天然产物的发现", 《有机化学》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104911196A (zh) * 2014-03-13 2015-09-16 中国科学院上海有机化学研究所 三欣卡辛的生物合成基因簇及其应用
CN104911196B (zh) * 2014-03-13 2020-04-28 中国科学院上海有机化学研究所 三欣卡辛的生物合成基因簇及其应用
CN106916835A (zh) * 2015-12-24 2017-07-04 武汉臻智生物科技有限公司 化合物的生物合成基因簇及其应用
CN106916834A (zh) * 2015-12-24 2017-07-04 武汉臻智生物科技有限公司 化合物的生物合成基因簇及其应用
CN106916834B (zh) * 2015-12-24 2022-08-05 武汉合生科技有限公司 化合物的生物合成基因簇及其应用
CN106916835B (zh) * 2015-12-24 2022-08-12 武汉合生科技有限公司 化合物的生物合成基因簇及其应用
CN110484576A (zh) * 2019-10-18 2019-11-22 广东省微生物研究所(广东省微生物分析检测中心) 一种提高榴菌素和榴菌素b产量的方法
CN110484576B (zh) * 2019-10-18 2020-01-17 广东省微生物研究所(广东省微生物分析检测中心) 一种提高榴菌素和榴菌素b产量的方法

Also Published As

Publication number Publication date
CN103215282B (zh) 2016-08-03

Similar Documents

Publication Publication Date Title
Xu et al. Functional genome mining for metabolites encoded by large gene clusters through heterologous expression of a whole-genome bacterial artificial chromosome library in Streptomyces spp
Smanski et al. Engineered Streptomyces platensis strains that overproduce antibiotics platensimycin and platencin
Miao et al. Genetic engineering in Streptomyces roseosporus to produce hybrid lipopeptide antibiotics
Khaw et al. Mutational biosynthesis of novel rapamycins by a strain of Streptomyces hygroscopicus NRRL 5491 disrupted in rapL, encoding a putative lysine cyclodeaminase
Weinig et al. Melithiazol biosynthesis: further insights into myxobacterial PKS/NRPS systems and evidence for a new subclass of methyl transferases
JP2674998B2 (ja) 抗生物質産生微生物の改良
Sucipto et al. Exploring Chemical Diversity of α‐Pyrone Antibiotics: Molecular Basis of Myxopyronin Biosynthesis
Zhuang et al. Streptomycin‐induced ribosome engineering complemented with fermentation optimization for enhanced production of 10‐membered enediynes tiancimycin‐A and tiancimycin‐D
CN110218244B (zh) 化合物ilamycin F及其应用
Aroonsri et al. Pleiotropic control of secondary metabolism and morphological development by KsbC, a butyrolactone autoregulator receptor homologue in Kitasatospora setae
CN102181470B (zh) 提高链霉菌抗生素产量的方法及其质粒
Wang et al. Improved ε-poly-l-lysine production of Streptomyces sp. FEEL-1 by atmospheric and room temperature plasma mutagenesis and streptomycin resistance screening
CN105200072A (zh) 一种芳香聚酮类非典型角环素fluostatins的生物合成基因簇及其应用
CN101275141B (zh) 阿嗪霉素的生物合成基因簇
Liu et al. Identification and characterization of the ficellomycin biosynthesis gene cluster from Streptomyces ficellus
CN103215282A (zh) 越野他汀的生物合成基因簇及其应用
CN101157929B (zh) 番红霉素的生物合成基因簇
Hua et al. Offloading role of a discrete thioesterase in type II polyketide biosynthesis
Hou et al. Biosynthesis gene cluster and oxazole ring formation enzyme for inthomycins in Streptomyces sp. strain SYP-A7193
CN101445803A (zh) 硫链丝菌素的生物合成基因簇
CN103224905B (zh) 鉴定和表征来自生产多杀菌素的刺糖多孢菌的siponactin生物合成基因簇
Tang et al. A single gene cluster for chalcomycins and aldgamycins: genetic basis for bifurcation of their biosynthesis
CN104911196A (zh) 三欣卡辛的生物合成基因簇及其应用
US8207321B2 (en) Method of obtaining idolocarbazoles using biosynthetic rebeccamycin genes
CN102732534B (zh) 厦霉素a和氧厦霉素的生物合成基因簇及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant