CN102015756B

CN102015756B - Nrps-pks基因簇及其操纵和应用

Info

Publication number: CN102015756B
Application number: CN200980113971.4A
Authority: CN
Inventors: 谢尔盖·佐特切夫; 汉恩内·约尔根森; 阿瓦尔·斯列塔; 特龙德·厄尔灵·埃林森; 埃斯彭·夫加尔威克; 克里斯廷·弗勒格斯塔·德格涅斯; 吉尔·科林贝尔; 佩尔·布鲁海姆
Original assignee: Sinvent Co Ltd
Current assignee: Sintef Tto AS
Priority date: 2008-03-20
Filing date: 2009-03-20
Publication date: 2014-07-30
Anticipated expiration: 2029-03-20
Also published as: EP2271666A1; US10047363B2; WO2009115822A1; AU2009227740B2; AU2009227740A1; JP2011515086A; CA2718429C; DK2271666T3; US9217150B2; CA2718429A1; JP5514185B2; GB0805363D0; CN102015756A; EP2271666B1; ES2543203T3; US20160060636A1; US20110117606A1

Abstract

本发明提供一种核酸分子，所述核酸分子包含：(a)SEQ ID No.1所示的核苷酸序列；或(b)与SEQ ID No.1互补的核苷酸序列；或(c)与SEQID No.1简并的核苷酸序列；或(d)与SEQ ID No.1具有至少85％序列同一性(优选具有至少87％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性)的核苷酸序列；或(e)(a)～(d)中任一个的一部分，其中所述核酸分子编码一种或多种多肽，或与编码一种或多种多肽的核酸分子互补，或包含在聚酮化合物类分子或巨内酰胺分子的合成中具有活性的一种或多种遗传元件，或与包含在聚酮化合物类分子或巨内酰胺分子的合成中具有活性的一种或多种遗传元件的核酸分子互补。特别是，本发明涉及编码用于合成聚酮化合物巨内酰胺BE-14106的生物合成机构的本发明核酸分子的修饰，包括在微生物中表达经修饰的核酸分子。在某些方面所述修饰包括对编码一种或多种由所述核酸分子编码的活性或蛋白质的序列进行导入、突变、缺失、替换或失活。本发明的其它方面包括含有经修饰和未经修饰核酸的微生物，以及从所述微生物回收所述聚酮化合物类分子或巨内酰胺分子。

Description

NRPS-PKS基因簇及其操纵和应用

技术领域

本发明涉及编码用于合成聚酮化合物巨内酰胺(macrolactam)BE-14106的生物合成机构的基因簇的克隆和测序，所述生物合成机构基因簇包含非核糖体肽合成酶(NRPS)腺苷酰化结构域和模块型聚酮化合物生物合成酶或酶复合物(PKS；聚酮化合物合酶或酶复合物)。因此所述生物合成机构包含杂合NRPS-PKS酶系统。所以本发明涉及编码用于合成巨内酰胺BE-14106的生物合成机构的新型基因和核酸分子，包括涉及BE-14106生物合成的模块型NRPS-聚酮化合物生物合成酶或酶系统，并且所述生物合成机构包含模块型NRPS-聚酮化合物合酶酶系统或其复合物(以及其组分)。本发明还涉及这些基因、核酸分子、机构、酶和酶系统或其复合物在促进BE-14106生物合成中的应用以及在BE-14106衍生物合成和新型巨内酰胺结构合成中的应用。

背景技术

聚酮化合物或聚酮化合物类结构或聚酮化合物相关结构是由细菌、真菌、植物和动物合成的天然产物，或形成了上述天然产物的基础，其中许多具有作为药物或作为农业产品或兽医产品的应用潜力，例如作为抗生素、抗真菌剂、细胞生长抑制剂、抗胆甾醇血症药、抗寄生物剂、抗球虫剂、动物生长促进剂和天然杀虫剂。

革兰氏阳性细菌链霉菌(Streptomyces)是聚酮化合物和聚酮化合物类分子的主要生产者，并且这些生物体中聚酮化合物生物合成的遗传学和生物化学已得到较好的表征(McDaniel R等；Chem Rev.2005Feb；105(2)：543-58.)。

其它生产者包括其它放线菌。已知有多种不同聚酮化合物类(或聚酮化合物相关)分子，其中巨内酰胺代表一类。Ogasawara Y.等于Chem Biol.2004Jan；11(1)：79-98和Udwary等于Proc Natl Acad Sci USA 2007Jun 19；104(25)：10376-81已经分别报道了用于合成巨内酰胺文森他汀(vicenistatin)和萨利内酰胺(salinilactam)的生物合成基因簇。

BE-14106(另一名称为GT-32A)是具有如图1所示化学结构的巨内酰胺抗生素。其已经从类球形链霉菌(Streptomyces spheroide)菌株中得到分离，并且表明其具有针对白血病细胞系的细胞毒性作用，以及针对许多所测试生物体的抗微生物活性，针对H-ras转化BALB3T3细胞系的抗增殖活性和针对混合淋巴细胞反应的抑制活性(JP4001179，Kojiri等1992Journal of Antibiotics，868-74；Takahashi等1997，Journal of Antibiotics186-8)。还已经从未指明的链霉菌属(Streptomyces)物种分离出8-脱氧类似物(GT-32B)，并且显示其与BE-14106共有多种活性(Takahashi等，出处同上)。

巨内酰胺化合物如BE-14106可以如下形成：用激活的氨基酸激活和启动PKS系统，以与脂肪酸生物合成类似的方式通过使用聚酮化合物合酶(PKS)重复缩合简单的羧酸使氨基酸残基(氨酰基链)延伸。因此，与“起始单元”是羧酸残基的简单聚酮化合物链的情况不同，在这种情况下，PKS的起始单元是由氨基酸和酰基链合成的氨酰基中间体。PKS可以组织成以循环方式再利用结构域的迭代(iterative)PKS，或组织成含有一串分开模块(separate module)(或重复单元)并且不再利用结构域的模块型(I型)PKS。每一模块负责聚酮化合物链合成中的一个缩合循环，并且含有各种酶结构域。在BE-14106的情况下，严格而言，“聚酮化合物”链是杂合氨基酸-聚酮化合物链，或氨酰基链，但是本文称之为“聚酮化合物链”。因此，除了通过β-酮酰合酶(KS)结构域催化而将下一个羧酸缩合到生长中的聚酮化合物链的结构域之外，I型PKS的模块可以含有具有β-酮还原酶(KR)活性、脱水酶(DH)活性或烯酰基还原酶(ER)活性的结构域，其确定导入的延伸单元的还原状态。存在于每一模块中的酰基转移酶(AT)和酰基载体蛋白(ACP)结构域分别负责延伸单元的选择和PKS上生长中的聚酮化合物链的保持。一旦完成合成，通过硫酯酶(TE)的作用使聚酮化合物链从PKS释放，所述硫酯酶还可能涉及最终产物的环化。因此，I型PKS表示聚酮化合物生物合成的装配线，其可以通过改变模块的数量、其对羧酸的特异性，或通过失活或插入活性减少的结构域来操纵(Weissman和Leadlay，Nat.Rev.Microbiol.2005Dec；3(12)：925-36.)。聚酮化合物部分合成并环化形成大环内酯(macrolactone)(或巨内酰胺)环后，可以经由羟基化、糖基化、甲基化和/或酰基化对其修饰。这些修饰对于某些聚酮化合物类产物的生物活性可能是重要的。在导致本发明的工作中，编码BE-14106NRPS-PKS酶系统(BE-14016“基因簇”)的基因已被克隆和测序，并且已经确定BE-14106NRPS-PKS酶系统含有几个I型PKS，其中各PKS以模块方式组织，并且由重复单元(模块)组成，下文将对此进行更详细的描述。

链霉菌(Streptomyces)中聚酮化合物生物合成的基因通常以簇的形式组织，已经鉴定出许多这种簇，负责各种天然产物的合成。已经描述了链霉菌(Streptomyces)的几种大环内酯抗生素基因簇的分子克隆和完成的DNA测序，包括除虫霉素(avermectin)、苦霉素(pikromycin)和雷帕霉素(rapamycin)(Ikeda H.，Omura S.(2002).Biosynthesis，Regulation，andGenetics of Macrolide Production.在Macrolide Antibiotics：Chemistry，Biology and Practice，第二版(由S.Omura编)，第286-326页，AcademicPress，New York.)。如上所述，还已经报道了某些巨内酰胺抗生素的生物系统的基因簇。

如上指出以及如下所述，本发明基于用于迄今为止不可得到的BE-14106的生物合成的新型基因簇的鉴定、克隆和测序。克隆基因的分析进一步阐明BE-14106的生物合成途径。因此，现在提出BE-14106合成的正常过程通过合成起始单元(C17-C25)而启动，此处酰基部分从1个丙酸酯和2个乙酸酯单元合成。NRPS腺苷酰化结构域激活甘氨酸分子，并将激活的甘氨酸加载到肽基载体蛋白上，从而继续起始单元的合成。甘氨酸的氧化脱氨基释放铵，其对C-17羰基进行亲核攻击从而形成C-17亚氨基，该C-17亚氨基随后被还原成氨基。氨酰基链从肽基载体蛋白的释放导致羧酸的形成，该羧酸随后被腺苷酰化并与辅酶A(CoA)连接。所得的激活的氨酰基-CoA通过酰基转移酶将转移到PKS的ACP结构域，并通过以下更详细描述的PKS系统中的酶的顺续作用而延伸和修饰。各模块中的β-酮酰合酶(KS)酶结构域催化由酰基转移酶(AT)模块确定的合适的羧酸(例如乙酸酯或丙酸酯)的缩合。具有β-酮还原酶(KR)或脱水酶(DH)活性的酶结构域确定导入的延伸单元的还原状态。

BE-14106的C20-C25烃侧链由起始单元的部分组成，并由巨内酰胺环的环化产生。最后，巨内酰胺环的进一步修饰经由羟基化发生。

BE-14106生物合成基因簇还编码或包括各种调节元件和用于转运所合成分子的蛋白质。

由于诸如BE-14106等化合物的化学合成是高度复杂的，在实践中需要使用生物合成途径，因此需要从合适的宿主分离或纯化所述化合物。如本领域已经意识到的，这为操纵PKS基因簇的基因从而改变生物合成，并由此导致新型聚酮化合物或聚酮类化合物或经修饰的聚酮化合物或聚酮类化合物的合成提供了机会。虽然已经描述了修饰许多PKS基因簇可导致各种新型化合物的合成，但仍然需要并期望增加可获得化合物(特别是抗生素)的清单，和/或改进现有药物的性质(例如，功效，毒性，水溶性等)。本发明针对这些目标，并基于BE-14106生物合成基因簇的克隆和DNA测序。这首次提供了这些抗生素生物合成基因的序列，以及为修饰BE-14106的表达水平或性质和/或生产生物体，或为获得新型的潜在有用的化合物提供了遗传操纵工具。就此而言，虽然已知抗生素BE-14106，在链霉菌(Streptomyces)中合成的多种聚酮化合物类分子和相应地多种生物合成基因簇的背景下，鉴定和克隆正确的BE-14106基因簇不是简单的事情，需要序列分析和探针设计或选择方面的可观努力和独创性。

发明内容

本发明人已经从之前未知的来源，细菌分离株MP28-13，分离和纯化了BE-14106，据认为细菌分离株MP28-13为链霉菌属(Streptomyces)的新菌株(于2008年1月25日保藏于德国微生物菌种保藏中心(DeutscheSammlung von Mikroorganismem und Zellkulturen GmbH(DSMZ))，保藏号DSM21069)，该菌株分离自挪威的特隆赫姆峡湾(Trondheim fjord)中的浅水区沉淀物。该新型微生物的分离使得本发明人能够克隆和测序完整的BE-14106生物合成基因簇。该簇含有22个基因，这些基因编码推定参与BE-14106分子的生物合成的蛋白质(参见表1)。

为了进行该克隆，使用特别设计的寡核苷酸引物来扩增来自分离株MP28-13的KS结构域编码区，所述引物代表编码酮基合酶(ketosynthase)(KS)结构域的部分的序列。一旦获得并表征所扩增的序列，基于复杂深入的生物信息学分析，选择所述序列中的一个作为探针。使用该探针来筛选为MP28-13构建的基因组文库。分析以此方式鉴定的粘粒，并对其测序以提供完整的生物合成簇。如图2A和2B所示，已经对所述序列进行注释，并且说明了BE-14106生物合成的两部分途径。起始氨酰基单元的生物合成途径的第一部分示于图2A，第二部分，即氨酰基链的延伸、导致巨内酰胺环形成的所述链的环化和PKS后修饰，示于图2B。因此，提出了BE-14106生物合成基因簇编码第一酶系统或复合物，所述第一酶系统或复合物包含PKS和其它用于合成氨酰基链的酶或蛋白质；以及用于所述氨酰基链延伸的另外的PKS酶系统或酶复合物，以及用于所述分子的PKS后修饰的酶、用于调节所述途径的蛋白质，和抗性/外排蛋白(efflux protein)。

基于对所述序列的了解，开发了链霉菌属(Streptomyces)物种MP28-13的遗传操纵的方法。以此方式可以表明，所述新型序列确实负责BE-14106生物合成。

另外，对已经鉴定出的新型生物合成基因簇内的功能性DNA序列的操纵，可以导致合成功能或性质改变(例如改进)的新型分子结构，例如BE-14106衍生物或类似物，以下将进行更详细的描述。这样，可以操纵BE-14106基因簇，以不仅获得有益的新BE-14106衍生物或类似物，还可以改进和促进生物合成生产方法(例如改进产率，或生产条件，或扩展可利用的宿主细胞的范围)，或更优选提供具有新活性和/或性质的新型化合物。

BE-14106生物合成基因簇的完整编码序列(即，编码BE-14106生物合成基因簇的完整核苷酸序列)示于SEQ ID No.1。已经显示其含有许多基因或ORF，所述基因或ORF编码负责BE-14106生物合成所需的活性的各种蛋白质和多肽。

所述生物合成基因簇含有据认为编码正常BE-14106生物合成所需的所有蛋白质和多肽的基因和ORF。然而，不是所有的编码蛋白质和多肽都在生物合成中起作用，因此可能不是所有所述簇的编码蛋白质或多肽都是BE-14106生物合成所必需的。各种基因和ORF可以编码催化一种以上生化反应的酶，或编码不具有催化活性但是参予诸如调节BE-14106合成过程、或BE-14106转运过程等其它过程的蛋白质。

所述酶中的几种是聚酮化合物合酶(PKS)，并且虽然尚未确定，但是许多所述PKS可能物理相连以形成酶复合物。本文将这样的一组或一套酶称为聚酮化合物生物合成酶系统或聚酮化合物生物合成酶复合物或PKS酶系统或PKS酶复合物，虽然不需要所述系统/复合物中的所有酶/蛋白质都是实际的聚酮化合物合酶，即具有聚酮化合物合酶活性；它们可以在BE-14106合成中具有其它活性或功能作用。例如，非核糖体肽合成酶(NRPS)的离散腺苷酰化结构域(BecL)连同由所述簇编码的一些其它辅助蛋白(例如，BecJ、BecS、BecU)，通过激活一个氨基酸(推定为甘氨酸)而参与用于生物合成BE-14106的起始单元的合成，以及将其加载到几个BE-14106PKS模块中的一个上以进一步延伸。其它蛋白质，例如BecO，执行C-8处巨内酰胺的羟基化。包含所述NRPS结构域和PKS酶的一组酶或一套酶可以称为杂合NRPS-PKS酶系统或酶复合物。由基因簇编码的蛋白质和多肽的组作为一个整体总称为用于BE-14106生物合成的生物合成机构。

因此在一方面，本发明提供一种核酸分子，所述核酸分子包含：

(a)SEQ ID No.1所示的核苷酸序列；或

(b)与SEQ ID No.1互补的核苷酸序列；或

(c)与SEQ ID No.1简并的核苷酸序列；或

(d)与SEQ ID No.1具有至少85％序列同一性(优选具有至少87％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性)的核苷酸序列；或

(e)(a)～(d)中任一个的一部分，其中所述部分优选包含与BE-14106生物合成基因或开放阅读框(ORF)对应的序列，或与上述序列互补或与上述序列简并。

更具体而言，所述核酸分子编码一种以上多肽(或包含编码一种以上多肽的核苷酸序列)，或包含一种以上在合成聚酮化合物或巨内酰胺分子(特别是合成BE-1406或其衍生物，或BE-1406相关分子)中具有功能活性的遗传元件，或者其是所述核酸分子的互补物。这些功能活性可以是酶活性，例如涉及聚酮化合物或巨内酰胺分子合成或转运或转移(其可以是聚酮化合物链或巨内酰胺环合成，或有助于其的任何步骤，或巨内酰胺环或聚酮化合物链修饰等)的活性，和/或其可以是调节活性，例如调节涉及合成的基因(例如转录调节子)或蛋白质的表达，或调节合成过程，和/或其可以是“转运体活性”。因此，通常所包括的是涉及聚酮化合物或巨内酰胺部分转移或转运(例如将使所合成的分子转运或排出细胞内部或外部)的转运蛋白。

尽管根据本发明优选编码所期望产物的核苷酸序列，但还包括的是包含诸如启动子、启动子-操纵子区域、增强子、其它调节序列等功能性遗传元件的核苷酸序列。因此，本发明的核酸分子不必包含全部PKS基因簇，而是可以包含基因簇的一部分，例如编码具有特定功能的多肽或调节序列的部分。其可以包含一种以上基因，和/或调节序列，和/或一种以上模块，或酶结构域，或非编码功能性遗传元件或编码功能性遗传元件(例如，控制基因表达、转录、翻译等的元件)。通常而言，本发明的核酸分子会包含许多不同的可导致聚酮化合物类分子或巨内酰胺分子(例如BE-14106衍生物或经修饰的BE-14106分子)合成的基因和/或调节序列。

下面进一步定义“BE-14106生物合成基因或ORF”，但在以上章节(e)的情况下简单而言是指编码在BE-14106或BE-14106衍生物或类似物或BE-14106相关分子的生物合成过程中起作用的蛋白质或多肽的基因或OEF。如上所述，其可以是涉及起始氨基酸的激活、激活的氨基酸/氨酰基链到PKS酶的转移、聚酮化合物链或其修饰物的产生的酶，或调节所需的蛋白质、或在其生物合成的任何阶段转运或转移分子所需的蛋白质。

本发明的核酸分子可以是分离的核酸分子(换言之，与在自然中发现时通常与其在一起的成分分离或分开)，或其可以是重组核酸分子或合成核酸分子。

如本文其它本分所讨论的，BE-14106生物合成基因簇是较大的核酸分子，含有编码生物合成BE-14106分子或BE-14106衍生物或类似物或BE-14106相关分子所需的蛋白质或肽的各种遗传元件或不同基因或ORF。各BE-14106生物合成基因或ORF编码在BE-14106分子或BE-14106衍生物或类似物或BE-14106相关分子的生物合成中具有功能或据认为具有所述功能的单独的多肽链(作为选择还可描述为蛋白质)。已经鉴定出22个所述基因或ORF(参见表1)。如图2A和2B所示，这些中的14个在生物合成BE-14106中起直接作用。如下面进一步所解释的，据认为或提出某些其它基因或ORF在BE-14106生物合成中起作用。因此例如，据认为becH和M编码调节子，据认为BecL涉及甘氨酸激活，据认为BecU介导BecC和PCP BecS的ACP之间的蛋白质相互作用，据认为BecN涉及排出和/或抗性，据认为BecP辅助巨内酰胺环的环化，并且据认为BecQ涉及起始氨酰基链从BecC-BecU-BecS复合物的释放。

某些所述蛋白质具有酶活性，并因而可以被定义为酶。各种这些酶可以描述为聚酮化合物合酶(PKS)。所述酶包含一个或多于一个模块，并且各模块可以含有1～6个，优选2个、3个、4个或5个酶结构域，各结构域承担生物合成BE-14106分子或BE-14106衍生物或类似物或BE-14106相关分子中的不同活性。因此，在这些PKS中，多个活性位点可以存在于一个多肽或酶中。

例如，酶BecB是PKS，并且具有3个模块；模块1(图2B中的“加载模块”)具有单一活性位点或结构域(ACP)，模块2和3的每一个(图2B中的模块1和模块2)具有五个具有KS、AT、DH、KR和ACP活性的活性位点或结构域。由所述基因簇编码的其它PKS为BecA、BecC、BecD、BecG、BecF和BecE。所述PKS可以含有许多结构域，每个结构域拥有延伸和/或改变聚酮化合物结构的催化活性。所述聚酮化合物沿所述蛋白质行进，从而在生长中的聚酮化合物链上依次实施不同的活性。如上讨论，由所述基因簇编码的各种PKS可以相连，从而形成生物合成酶复合物。

本发明的核酸分子编码一些，或更优选全部的参与BE-14106分子或BE-14106衍生物或类似物或BE-14106相关分子的生物合成的多肽或蛋白质(或者本发明的核酸分子包含编码所述多肽或蛋白质的核苷酸序列)。例如，所述核酸分子可以含有22种基因或ORF中的每一个，因此编码表1中所示的参与BE-14106分子的生物合成的蛋白质中的每一个，或者其可以包含核苷酸序列SEQ ID No.1的部分，例如编码由BE-14106生物合成基因簇内的单一基因或ORF编码的单一蛋白质或多肽的序列。所涵盖的有包含例如至少11、12、13、14、15、16、17、18、19、20、21，或至多2、3、4、5、6、7、8、9、10、11(例如1～21、2～20、3～19、4～18、5～17、6～16、7～15、8～14、9～13、10～12)种基因或ORF的部分。优选本发明的核酸分子编码所有表1所示的参与BE-14106分子生物合成的蛋白质。作为选择，其可以包含除了becR和ORF6中的任一种或多种之外的所有表1中所示的ORF/基因。由于表1列出了所有已经被表征的基因或ORF，可以将表1中所示的编码所有参与BE-14106分子生物合成的蛋白质的核酸分子定义为包含BE-14106生物合成基因簇的序列。

因此，本发明的核酸分子编码一种或多种参与BE-14106或BE-14106衍生物或类似物或BE-14106相关分子的生物合成的多肽，或在BE-14106或BE-14106衍生物或类似物或BE-14106相关分子的合成中具有功能活性的多肽。作为选择，所述核酸分子可以编码一种或多种其功能等效变体或功能等效物。如上所限定，本发明的核酸分子可以包含SEQ ID No.1的功能等效变体，并且所述变体包括部分、简并序列或由与SEQ ID No.1的序列同一性百分比限定的同源物。所述功能等效变体编码具有如上所述功能活性的蛋白质/多肽。所述功能活性可以是酶活性，例如涉及聚酮化合物部分或巨内酰胺分子的合成或转运或转移(这可以是链或环合成或有助于其的任何步骤，或者生物合成的任何阶段的修饰等，例如BecA、BecU、BecB、BecJ、BecK、BecS、BecO、BecD、BecG、BecF、BecE、BecT、BecQ、BecP、BecC、BecI、BecL)的活性；和/或其可以是调节活性，例如调节参与合成的基因或蛋白质的表达，或调节合成过程，例如BecH，BecM；和/或其可以是“转运体活性”或抗性，例如BecN。因此，通常包括的是涉及将所合成分子转移入/转移出、转运入/转运出或排入/排出所述细胞的转运蛋白。还涵盖的是编码一个或多个模块或酶结构域的序列。

这些分子的长度可以是至少200个碱基，更优选至少300、500、600、700、800、900、1000、1500、2000、3000、5000、10000、15000、20000、30000或50000个碱基。因此代表性的片段长度可以包括长度为100bp～18000bp，例如100bp～3000bp、200bp～2500bp、2000bp～8000bp、3000bp～5000bp、4000bp～17000bp、7000bp～12000bp或8000bp～11000bp的片段。如上所述，在SEQ ID NO：1内已经鉴定出许多基因和ORF，包含所述基因或ORF的部分或片段代表SEQ ID NO：1的优选“部分”或片段。将这些在下表1中列出：

表1

在上表中，“C”表示所述蛋白质由互补链编码。

因此以上列出的序列代表BE-14106生物合成基因或ORF。换言之，发现所述基因/ORF位于BE-14106生物合成基因簇内，并且编码在链霉菌(Streptomyces)的BE-14106生物合成中起作用或提出在链霉菌(Streptomyces)的BE-14106生物合成中起作用的蛋白质或多肽。术语“BE-14106生物合成基因”或“BE-14106生物合成ORF”还包括编码与上述蛋白质具有相同活性或功能(例如如本文其他部分所讨论的，具有相同的高水平的序列同一性)的蛋白质的基因和ORF。作为选择可以将它们描述为“功能等效变体”或“功能等效物”。

通常术语“基因”包括编码蛋白质的ORF，以及诸如启动子等任何调节序列一起，而术语“ORF”仅指负责编码蛋白质的基因的部分。

本文涉及的“功能等效变体”或“功能等效物”保留与它们相关(或衍生它们)的实体的至少一种功能，例如编码具有基本上相同性质的蛋白质，或展示基本上相同的调节或其它功能性质或活性的蛋白质。可以使用本领域已知的标准技术测试所述性质或活性。

尽管根据本发明优选编码所期望产物的核苷酸序列，但还包括的是包含诸如启动子、启动子-操纵子区域、增强子、其它调节序列等功能性遗传元件的核苷酸序列。因此，本发明的核酸分子不必包含整个基因簇，而是可以包含其一部分，例如编码具有特定功能的多肽的部分或调节序列。其优选包含一种以上的基因和/或调节序列。还涵盖的是通常小于其并编码一个以上模块、或酶结构域的序列，或非编码功能遗传元件或编码功能遗传元件(例如控制基因表达、转录、翻译等的元件)的序列。

因此，本发明扩展到这样的核酸分子：该核酸分子包含选白SEQ IDNO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42和44的核苷酸序列(如表1所示，通过参考SEQ IDNo.1的核苷酸起始和终止位置而确定)或与上述核苷酸序列互补或与其简并的核苷酸序列。

还提供的是这样的核酸分子：该核酸分子包含展示与SEQ ID NO：2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42和44中任一种具有至少80％(优选至少85％、87％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％)序列同一性的核苷酸序列或与上述核苷酸序列互补或与其简并的核苷酸序列。

本发明还涉及这样的核酸分子：该核酸分子包含编码一种以上选自SEQ ID NO：3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或45的氨基酸序列的核苷酸序列或与上述核苷酸序列互补或与其简并的核苷酸序列。

还提供的是这样的核酸分子：该核酸分子包含编码一种以上展示与SEQ ID NO：3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43和45中任一种具有至少80％(优选至少85％、87％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％)序列同一性的氨基酸序列的核苷酸序列或与上述核苷酸序列互补或与其简并的核苷酸序列。

在每一情况下，所述核酸分子优选是如本文定义的BE-14106生物合成基因或ORF。

可以通过任何常规方法评价核苷酸或氨基酸序列同一性。然而，为了确定序列之间的序列同一性的程度，可使用进行序列多重比对的计算机程序，例如Clustal W(Thompson，J.D等.，1994，″CLUSTAL W：Improving the sensitivity of progressive multiple sequence alignment throughsequence weighting，position-specific gap penalties and weight matrix choice″.Nucleic Acids Res 22：4673-4680)。为此目的还可使用对序列对进行比较和比对的程序，例如ALIGN(E.Myers和W.Miller，1988，″OpticalAlignments in Linear Space″，CABIOS 4：11-17)、FASTA(W.R.Pearson和D.J.Lipman，1988，″Improved tools for biological sequence analysis″，PNAS 85：2444-2448，和W.R.Pearson，1990，″Rapid and sensitive sequencecomparison with FASTP and FASTA″Methods in Enzymology 183：63-98)和空位BLAST(Altschul，S.F.，等，1997，″Gapped BLAST and PSI-BLAST：a new generation of protein database search programs″.Nucleic Acids Res.25：3389-3402)。另外，位于欧洲生物信息学研究所(EuropeanBioinformatics institute)的Dali服务器提供蛋白质序列的基于结构的比对(Holm，1993，J.of Mol.Biology，233：123-38；Holm，1995，Trends inBiochemical Sciences，20：478-480；Holm，1998，Nucleic Acid Research，26：316-9)。

例如，可以使用来自威斯康星大学的Genetics Computer Group(GCG)Version 10软件包的BestFit程序确定核苷酸序列同一性。该程序使用Smith和Waterman的局部同源性算法，使用以下默认值：空位形成罚分＝50，空位延伸罚分＝3，平均匹配＝10,000，平均错配＝-9.000。

本发明的核苷酸序列可以展示与SEQ ID NO：1具有至少85％、87％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性，并且所述序列优选编码一些或所有参与BE-14106分子生物合成的蛋白质，或与编码一些或所有参与BE-14106分子生物合成的蛋白质的序列互补。满足本文定义的％序列同一性标准的核苷酸序列可以认为是“基本上同一的”序列。

本发明的另一方面提供由本文定义的本发明的核酸分子编码的多肽。

如上讨论，SEQ ID NO：1编码几种蛋白质或多肽，因此本发明的这一方面提供一种多肽，所述多肽包含：

(a)SEQ ID Nos.3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或45的任何一种或多种所示的氨基酸序列的全部或部分；

或

(b)与SEQ ID Nos.3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或45的任何一种或多种具有至少80％序列同一性的氨基酸序列的全部或部分。

具体而言，所述氨基酸序列可以展示与SEQ ID Nos.3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或45的任何一种的多肽具有至少80％、85％、87％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性。作为选择，所述氨基酸序列可以展示与SEQ ID Nos.3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或45的任何一种的多肽具有至少80％、85％、87％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相似性。

满足本文％序列同一性或相似性标准的氨基酸(多肽)序列被认为是“基本上同一”。

本发明的多肽可以是分离的多肽、纯化的多肽或合成的多肽。本文使用术语“多肽”来包括两个以上氨基酸的任何氨基酸序列，即包括短肽或长度较长的肽(即，多肽或蛋白质)。

上面提到用于确定氨基酸序列同一性的程序，例如可以使用来自威斯康星大学的Genetics Computer Group(GCG)Version 10软件包的BestFit程序确定氨基酸序列同一性或相似性。该程序使用Smith和Waterman的局部同源性算法，使用以下默认值：空位形成罚分-8，空位延伸罚分＝2，平均匹配＝2.912，平均错配＝-2.003。SEQ ID Nos.3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43或45的任何一种的氨基酸序列(或如上定义“基本上同一的”序列)的“部分”可以包含至少20个相邻的氨基酸，优选至少30、40、50、70、100、150、200、300、400、500、1,000、2,000、5,000或10,000个相邻的氨基酸。

所述多肽，以及优选其部分，根据上述定义具有功能活性，例如在BE-14106或BE-14106衍生物或其经修饰版本的生物合成中具有酶活性，或具有调节或转送功能活性。因此所述部分可以对应或包含如上讨论的活性位点或结构域或模块。

已经表征了本发明的核苷酸序列和多肽序列，并且已经鉴定出其内的各种功能区域。所述功能区域形成本发明的不同方面。因此本文定义的“部分”优选对应于至少一个模块或酶结构域或非编码功能遗传元件或编码功能遗传元件。下表2显示用编码PKS酶的SEQ ID No.1中鉴定出的ORF的翻译产物鉴定出的功能区域。

表2

BE-14106PKS蛋白中的结构域界限

BecA(SEO ID No.5)

分子：BecA，5582aas蛋白

分子特征：

BecB(SEO ID No.13)

分子：BecB，3527aas蛋白

分子特征：

BecC(SEO ID No.9)

分子：BecC，694aas蛋白

分子特征：

BecD(SEO ID No.29)

分子：BecD，3372aas蛋白

分子特征：

BecE(SEO ID No.37)

分子：BecE，1631aas蛋白

分子特征：

BecF(SEO ID No.35)

分子：BecF，3377aas蛋白

分子特征：

BecG(SEO ID No.33)

分子：BecG，1986aas蛋白

分子特征：

生物合成BE-14106的途径已经如下阐明，并且示于图2A和2B。

BE-14106生物合成通过由蛋白BecA(其具有序列SEQ ID NO：5并且由SEQ ID NO：4编码)和BecC(其具有SEQ ID NO：9并由SEQ IDNO：8编码)从1个丙酸酯和2个乙酸酯单元组装C17-C25酰基部分而开始。BecC中的KR结构域最有可能失活，留下位于所合成聚酮化合物链C19处的羰基。该氨酰基启动者的生物合成通过离散的NRPS腺苷酰化结构域BecL(其具有序列SEQ ID NO：21，并由SEQ ID NO：20编码)激活甘氨酸，和将激活的甘氨酸加载到离散的肽基载体蛋白BecS(其具有序列SEQ ID NO：19，并由SEQ ID NO：18编码)上而继续进行。据认为BecU(其具有序列SEQ ID NO：11，并由SEQ ID NO：10编码)介导BecC和BecS的ACP之间的相互作用，使底物彼此接近。据推测D-氨基酸氧化酶BecI催化甘氨酸的氧化性脱氨基，释放铵，其对C-17羰基进行亲核攻击从而提供C-17亚氨基，该C-17亚氨基随后被还原成氨基。据推测后一还原导致酰基链的氧化和双键的迁移。硫酯酶BecQ(其具有序列SEQ ID NO：41，并由SEQ ID NO：40编码)使氨酰基链从BecC-BecU-BecS复合物释放，导致氨酰基-羧酸的形成。推定的酰基CoA连接酶BecJ(其具有序列SEQ ID NO：15，并由SEQ ID NO：14编码)，假定通过腺苷酰化和随后与CoA连接而激活所获得的氨酰基-羧酸，使得氨酰基-CoA成为酰基转移酶BecK(其具有序列SEQ ID NO：17，并由SEQ ID NO：16编码)的可接受的底物。离散的酰基转移酶BecK将激活的氨酰基链转移到位于PKS BecB上的模块1中的ACP结构域，所述PKS BecB具有序列SEQ ID NO：13，并由SEQ ID NO：12编码。后一PKS缺乏模块1中的所有结构域，除了ACP之外(图2B的加载模块)。BecB的模块2和模块3(图2B中的模块1和模块2)分别将氨酰基部分从C17延伸1个乙酸酯单元和1个丙酸酯单元(C16-15和C14-13)。

然后生长链被传递给BecD(其具有序列SEQ ID NO：29，并由SEQ IDNO：28编码)，为了进一步延长和修饰，BecD含有模块4和5(图2B中的模块3和4)，其将所述链延长2个乙酸酯单元(C12-11和C10-9)。

然后所述链被传递给BecE，所述BecE具有序列SEQ ID NO：37，并由SEQ ID NO：36编码。BecE PKS的模块6(图2B中的模块5)将所述链延长1个乙酸酯单元(C8-7)。该模块中的DH结构域的失活是C-9羟基出现的原因。(据认为DH结构域在C末端区域含有缺失，这消除了活性)。

然后所述链被传递到BecF，所述BecF具有序列SEQ ID NO：35，并由SEQ ID NO：34编码。BecF PKS的模块7和模块8(图2B中的模块6和模块7)将所述链分别延长1个丙酸酯(C6-5)单元和一个乙酸酯单元(C4-3)。

然后所述链被传递到BecG，所述BecG具有序列SEQ ID NO：33，并由SEQ ID NO：32编码。BecG PKS的模块9(图2B中的模块8)将所述链延长1个乙酸酯单元，并且BecG的TE结构域负责硫酯键的水解和完整的胺化聚酮化合物链从PKS的释放。这可能在脯氨酸亚氨基肽酶BecP(其具有序列SEQ ID NO：31，并由SEQ ID NO：30编码)的推定同源物辅助下，引起巨内酰胺环的环化。通过P450单加氧酶BecO(其具有序列SEQ ID NO：27，并由SEQ ID NO：26编码)完成生物合成，所述BecO在C-8处使8-脱氧BE-14106羟基化。

对于BecT(其具有序列SEQ ID NO：39，并由SEQ ID NO：38编码)尚未定义其在BE-14106生物合成中的明确作用。BecR(其具有序列SEQID NO：43，并由SEQ ID NO：42编码)不参与BE-14106的生物合成，这被基因失活实验(实施例10)所证明。

据认为参与该途径调节的蛋白质包括LuxR-型蛋白BecH(其具有序列SEQ ID NO：3，并由SEQ ID NO：2编码)和TetR-型调节子BecM(其具有序列SEQ ID NO：23，并由SEQ ID NO：22编码)。

据认为MFS型外排泵BecN(其具有序列SEQ ID NO：25，并由SEQID NO：24编码)负责BE-14106外排/抗性。

本发明的核苷酸序列提供了可以以许多方式使用从而操纵BE-14106生物合成，进而合成新型BE-14106衍生物或类似物或新型聚酮化合物类或巨内酰胺分子或结构的重要工具和信息，并且还为所述新型聚酮化合物或巨内酰胺分子或结构的生物合成提供了新的或经修饰的PKS生物合成机构。PKS生物合成机构是指包含可以形成蛋白质复合体、集合体或组件的一种以上PKS的一组蛋白质(例如由基因簇编码的一组蛋白质)，该组蛋白质在聚酮化合物合成中起作用，但其不必须限于仅存在PKS酶或酶结构域，并且其还可以含有其它功能活性，例如其它酶活性(例如修饰活性)或转运体功能或调节性功能蛋白。因此由基因簇编码的蛋白质可以看作是“酶系统”或“酶复合物”或“蛋白质系统”或“蛋白质复合物”，而不需以任何方式暗示所述系统中的蛋白质是物理相连的。在构成BE-14106的生物合成机构的意义上，它们是“功能上”相关的。作为选择还可将它们命名为“生物合成系统”或“生物合成复合物”或“组件”。

因此，例如，可以对本文提供的整个BE-14106生物合成基因簇或生物合成机构或组成型酶或酶复合物，或其部分进行修饰。所述修饰可通过下述方式进行：对基因簇中的一个以上基因或ORF进行修饰使修饰发生，从而引起由一个以上所编码蛋白质或多肽(例如，酶或模块，或酶结构域，或所编码蛋白质/肽或酶内的功能序列)的修饰。因此，可以使酶活性改变或失活，从而导致所合成的分子(例如聚酮化合物或巨内酰胺结构)的修饰。因此所述修饰的或衍生的NRPS-PKS生物合成机构可用于合成新型的或经修饰的聚酮化合物或巨内酰胺部分，这将在以下更详细地描述。在这种情况下，本文所提供的BE-14106生物合成基因簇或酶复合物或酶的组，或其片段或部分，可以起到用于修饰的“原点”或“模板”或“源”系统或序列的作用。因此，可以将NRPS-PKS生物合成机构看作是NRPS-PKS生物合成系统，或“NRPS-PKS系统”。

如以下更详细的描述，在一种实施方式中，所述基因簇的修饰可以原位进行。换言之，可以通过例如基因替换或基因失活，对产生BE-14106的微生物中所包含的内源性基因簇进行修饰。因此，可以对微生物中天然存在的天然基因簇进行修饰。虽然本发明核酸分子的重组表达是可行的(即，将核酸分子导入宿主细胞(例如异源性宿主细胞)，并且在允许核酸分子表达和聚酮化合物或巨内酰胺分子产生的条件(即允许核酸分子的表达产物合成聚酮化合物/巨内酰胺分子的条件)下培养(或使生长)该宿主细胞)，但这并不优选。在所述重组表达系统中，在将所述核酸分子导入宿主细胞和表达之前可以对所述核酸分子进行修饰。

根据本发明以及下面进一步讨论的，可以使用所述系统(即基因簇或蛋白复合物或组件或生物合成机构)的非功能部分(例如，诸如非编码部分等非生物活性部分)作为“支架”，并且可以对剩下的未修饰的功能部分(例如编码酶部分的序列)进行修饰以产生衍生的或修饰的NRPS-PKS系统。在优选的实施方式中，可以对仅一个选择的，或几个选择的功能性(例如酶功能)区域、模块或结构域进行修饰，留下很大程度上完整的残留序列或结构。

本发明范围内所包括的有合成或重组的聚酮化合物合酶或其它酶或复合物或含有所述酶的系统，或生物合成机构的其它蛋白质，即从由BE-14106生物合成基因簇所编码的支架衍生的酶或蛋白质或复合物或系统，所述酶或蛋白质或复合物或系统被修饰以改变至少一种由BE-14106生物合成基因簇编码的蛋白质的性质。

例如所述修饰可以是包含有编码一种以上源自其它模块型酶的功能单元(例如模块或结构域或甚至全基因/ORF)的序列。作为选择，所述修饰可以是导入编码一个以上功能单元的序列，所述序列源自BE-14106生物合成基因簇但是发现位于天然存在的序列中的不同位置。所述修饰还可以是导致BE-14106生物合成机构中的所编码结构域、模块、酶或其它功能单元失活或缺失的修饰。

所述功能单元可以是催化或转运或调节蛋白结构域。为了进行所述操纵，所用的序列可以来自本发明的核酸分子，或编码结构域的合适序列可以源自编码以下物质的核苷酸分子：其它合成聚酮化合物合成酶、肽合成酶、杂合肽聚酮化合物合成酶、脂肪酸合成酶或本领域已知的其它酶结构域。

因此，在极广泛的意义上，本发明提供了本文所定义的本发明的核酸分子在制备经修饰的BE-14106生物合成基因簇、所编码的生物合成机构(或蛋白质系统)和从其合成的所得经修饰分子中的应用。

根据本发明，可以以随机或针对或设计方式使用本发明核酸分子的核苷酸序列，例如用来获得和测试特定的预定或预设计结构，或用来形成随机分子，如聚酮化合物结构的文库，以用于例如筛选。

经修饰的BE-14106分子或BE-14106衍生物是指BE-14106的化学结构相对于图1所示已经改变。所述修饰可以改变BE-14106的功能性质，从而使得所述分子的浓度或效力(例如细胞毒性作用或抗增殖活性)得以增强或降低，例如，它们可以影响所述化合物的选择性毒性、溶解度、药代动力学、对细胞靶的亲和性或其它性质。

作为选择，本文所述的修饰可用于改变BE-14106分子转运方式或生物合成的调节方式。

所述新型的或经修饰的生物合成基因簇、所编码的包括组成型蛋白或蛋白系统在内的生物合成机构和从其合成的所得经修饰分子各自形成本发明的单独方面。还包括在内作为本发明的一部分的是导入了生物合成基因簇的细胞，或含有或包含所述经修饰的生物合成基因簇或经修饰的编码生物合成机构的细胞。

可以被修饰的基因或遗传元件不仅包括实际的PKS基因或ORF(其编码BecA、BecB、BecC、BecD、BecE、BecF、BecG)或其个体模块或结构域，还包括编码参与BE-14106生物合成(例如其编码BecU、BecI、BecP、BecJ、BecK、BecS、BecL、BecO、BecT、BecQ)和转运(例如其编码BecN)或调节(例如其编码BecH、BecM)的其它酶或功能蛋白的基因或ORF，所有这些本文总称为“BE-14106生物合成基因”。

如下面更详细讨论的，关于实际的PKS基因，可以对其进行修饰以改变确定起始单元性质的加载模块结构域的性质、模块的数量、延伸物(extender)的性质，以及决定聚酮化合物链的结构的各种脱水酶、还原酶和合酶活性。

因此，例如，可以增加或减少PKS酶的模块数量，例如，可以缺失PKS酶的一个或多个模块；可以缺失、失活或(例如从相同的PKS基因或另一PKS基因)导入PKS酶的KS、DH和/或KR结构域，可以对PKS酶的AT结构域进行修饰以改变其对起始或延伸单元的特异性；可以对BecA(SEQ ID No.4/5)的KS^Q结构域进行修饰(例如使其失活)以改变组成侧链的部分的起始单元的性质。

BecO羟化酶特异性的改变可以为位于除C-8之外的BE-14106(或其类似物)的碳原子提供羟基化。

除了对NRPS或PKS酶进行修饰以改变所合成分子的性质之外，本发明的核酸分子还可用于操纵或促进生物合成过程，例如通过扩展宿主范围或增加产率或生产效率等。

为了使本发明的核酸分子能够重组表达，本发明还提供包含本发明核酸的载体(例如克隆载体或表达载体)和含有所述分子的宿主细胞。然而，如上指出，本发明的这方面是次选的。

实践中，有利的是可以通过在细胞(本文中可将其视为“宿主细胞”)中原位操纵BE-14106生物合成基因簇序列而进行修饰，从而例如改变编码酶活性的核苷酸序列，以使该活性失活或改变该活性，或者导入活性。可以产生合适的遗传构建体，该遗传构建体含有具有所需修饰的序列，该序列将被导入内源性核酸分子(换言之，宿主细胞中所含有的核酸分子)中所含有的BE-14106生物合成基因簇序列(例如导入SEQ ID No.1)。然后可以将具有该序列的载体(例如质粒)导入合适的宿主细胞。这最终导致经修饰的序列经由同源性重组在生物合成基因簇的相应(例如内源性存在或天然存在)部分附近整合到基因簇(例如在宿主细胞的基因组内的基因簇)中。第二重组事件发生时，基因簇的内源性部分被其经修饰版本代替，并且所述载体被除去。

因此所得经修饰宿主细胞含有经修饰的BE-14106生物合成基因簇，其编码经修饰的BE-14106酶系统。因此所述经修饰的BE-14106生物合成机构合成经修饰的BE-14106分子。

如上指出，对其进行修饰的基因簇可以是天然存在于宿主细胞(微生物)中的天然基因簇，其产生BE-14106或其衍生物(由此对天然核酸或内源性核酸分子进行修饰)。较不优选但仍包括在本发明内的是，可以在修饰前将本发明的核酸分子导入宿主细胞。作为选择，在修饰后将所述核酸分子导入宿主细胞。因此可以对外源性核酸分子进行修饰。

如果本发明提供BE-14106基因簇的全长序列，该基因替换策略对于修饰BE-14106基因簇是通常的应用。例如该策略可用于使基因簇的一部分缺失，用于导入活性或用于取代天然或野生型序列中的模块内发现的活性。该策略需要知道基因簇序列，但不必需要从宿主细胞分离的完整基因簇以进行操纵。

因此，在另一方面本发明提供用于制备编码经修饰的BE-14106NRPS-PKS生物合成机构(或经修饰的BE-14106NRPS-PKS系统)的核酸分子的方法，所述方法包括：对如上文定义的编码所述BE-14106NRPS-PKS生物合成机构(或经修饰的BE-14106NRPS-PKS系统)的核酸分子进行修饰。

对所述核酸分子通过修饰其序列进行修饰，特别是可以通过导入、突变、缺失、置换或失活编码一种以上由所述核酸分子编码的活性(或蛋白质)而对所述核酸分子进行修饰。因此，可以对一种以上编码酶活性或其它功能活性的序列进行修饰。所述修饰产生的核酸分子所编码的BE-14106NRPS-PKS生物合成机构(或BE-14106NRPS-PKS系统)，与天然或野生型BE-14106NRPS-PKS生物合成机构(BE-14106NRPS-PKS系统)相比，具有改变的功能或活性或改变的性质。因此经修饰的生物合成机构(或NRPS-PKS系统)可具有一种以上经改变或经修饰的酶活性，并且可以合成不同于由天然(即未经修饰)的生物合成机构(或NRPS-PKS系统)合成的分子(例如聚酮化合物或巨内酰胺分子)的分子。作为选择，如上指出，生物合成机构的修饰可以导致生物合成过程的改进，例如产率增加等。

被修饰的核酸可以包含在细胞或生物体内，所述细胞或生物体可以是用于生产由经修饰的生物合成机构合成的聚酮化合物/巨内酰胺分子的细胞或生物体。

如上指出，有利的是被修饰的核酸分子可以是内源性(或天然)存在于产生BE-14106(或其衍生物)的生物体内的核酸分子。因此，本发明的方法可以涉及对产生BE-14106或其衍生物的细胞或生物体(通常是微生物细胞或微生物)内的天然核酸分子原位进行修饰(特别是修饰核酸分子的序列)。所述核酸分子可以是或代表BE-14106生物合成基因簇或其一部分，因此可以被视为编码BE-14106生物合成机构或BE-14106NRPS-PKS系统或其一部分的核酸分子。

许多不同的微生物可以生产BE-14106，并且还已知某些微生物可以产生BE-14106的天然存在的衍生物，例如8-脱氧衍生物(Takahashi等，出处同上)。述及BE-14106基因簇或生物合成机构(或NRPS-PKS系统等)，应包括不仅产生BE-14106自身还产生诸如8-脱氧衍生物(命名为GT32-B)等天然存在的衍生物的基因簇或生物合成机构等。

本发明还提供了用于制备经修饰的BE-14106NRPS-PKS生物合成机构(或经修饰的BE-14106NRPS-PKS系统)的方法，所述方法包括表达如上所述而制备(或获得的)的经修饰的核酸分子。这可以简单地通过对细胞中所含有的核酸分子进行修饰(如上所述)，使细胞在可表达经修饰核酸分子的条件下生长而实现。因此，例如，可以对细胞中的天然核酸分子进行原位修饰，并使细胞生长。

本发明的这方面还提供通过所述方法获得的经修饰的BE-14106NRPS-PKS生物合成机构(或经修饰的BE-14106NRPS-PKS系统)。

本发明还提供用于制备经修饰聚酮化合物或巨内酰胺分子的方法，所述方法包括表达如上所述而制备(或获得)的经修饰核酸分子。

通常而言，在可以表达经修饰生物合成机构的条件下，核酸分子将在宿主细胞中表达。如上指出，这可以通过将核酸分子导入宿主细胞而实现，但是通常所述“宿主细胞”是其中天然或内源性存在核酸分子并且该核酸分子被修饰的细胞或生物体。在可使经修饰核酸分子和生物合成机构得以表达并且使由所述生物合成机构产生的分子得以合成的条件下，生长和培养宿主细胞。

因此，所述核酸分子可以在任何期望的宿主细胞表达，但优选在是(或可能是)所述核酸分子来源的和所述(未经修饰)分子天然存在的细胞或微生物中表达。

用于制备经修饰聚酮化合物或巨内酰胺分子的本发明的方法可以包括从例如宿主细胞生长的培养基中或所述宿主细胞中回收(例如分离或纯化)所述分子的另一步骤。因此，本发明这方面还可以提供通过所述方法获得的经修饰聚酮化合物或巨内酰胺分子。

因此本发明的另一方面提供含有核酸分子的细胞或微生物，所述核酸分子编码通过上文所述方法获得的经修饰的BE-14106NRPS-PKS生物合成机构(或经修饰的BE-14106NRPS-PKS系统)。作为选择，所述细胞或微生物可以含有通过上述方法获得的经修饰的BE-14106NRPS-PKS生物合成机构(或经修饰的BE-14106NRPS-PKS系统)。

在一种备选但较不优选的实施方式中，本发明还提供含有如上定义的核酸分子的宿主细胞，其中所述分子已被导入所述宿主细胞。

借助于代表性实例，可以想到，基因簇的所述操纵可以为了以下目的而进行：产生经修饰的BE-14106分子，所述经修饰的BE-14106分子中已经在BE-14106或其衍生物或修饰版本的C-2、3、4、7、11、13、15、17、21和23中的任一位置或多个位置导入羟基。这可以通过使BE-14106生物合成基因簇中的适当的DH结构域失活或缺失而实现。根据本文提出的生物合成途径，应该进行以下修饰：

表3

待导入-OH的位置	待失活/缺失的DH结构域
		3	BecG模块9DH结构域
5	BecF模块8DH结构域
		7	BecF模块7DH结构域
11	BecD模块5DH结构域
		13	BecD模块4DH结构域
15	BecB模块3DH结构域
		17	BecB模块2DH结构域
23	BecA模块1DH结构域

作为补充或作为备选，可以想到，基因簇的所述操纵可以为了以下目的而进行：产生经修饰的BE-14106分子，所述经修饰的BE-14106分子中已经在BE-14106或其衍生物或修饰版本的C-2、3、4、7、9、11、13、15、17、21和23中的任一位置或多个位置导入氧基(酮基)。这可以通过使BE-14106生物合成基因簇中的适当的KR结构域失活或缺失而实现。根据本文提出的生物合成途径，应该进行以下修饰：

表4

待导入氧基的位置	待失活/缺失的KR结构域
		3	BecG模块9KR结构域
5	BecF模块8KR结构域
		7	BecF模块7KR结构域
9	BecE模块6KR结构域
		11	BecD模块5KR结构域
13	BecD模块4KR结构域
		15	BecB模块3KR结构域
17	BecB模块2KR结构域
		23	BecA模块1KR结构域

因此，本发明另一方面提供BE-14106类似物，所述BE-14106类似物可以通过对BE-14106生物合成途径的基因/蛋白质进行修饰而产生。本发明的BE-14106类似物包括，但不限于，包含选自以下组的任一个或多个的修饰的分子，所述组包括8-脱氧BE-14106、3-、5-、7-、11-、13-、15-、17-或23-羟基BE-14106和3-、5-、7-、9-、11-、13-、15-、17-或23-氧代BE-14106或其组合。本发明的所述代表性BE-14106类似物的结构的选择，和为产生所述类似物而需要失活的模块示于表5。

表5-当对聚酮化合物合酶基因进行工程化时可以产生的BE-14106 类似物

作为上述修饰的补充方案或备选方案，可以通过使编码BecA PKS全部模块的becA中的DNA区域缺失而缩短C20-C25侧链。作为选择，可以使BecA的一个以上分子缺失来缩短侧链。例如，BecA的一个整体模块的缺失可以缩短所述侧链。

作为上述修饰的补充方案或备选方案，为了生产成环原子较少(例如18-、16-、14-、12-、10-和8-元环)的巨内酰胺环的类似物，可以使(例如BecA、BecB、BecD、BecE、BecF、BecG)的PKS模块的一个或多个缺失。

如表5所示，作为所述其它修饰或上述列表中的修饰的补充方案或备选方案，可以使BecO失活或缺失，从而消除8位的羟基。

作为上述修饰的补充方案或备选方案，可以进行的另外的修饰包括：用硫代-羰基(C＝S)或羧酰胺(C＝NH)来取代BE-14106的C-1羰基，从而增加所述分子的稳定性(例如抗蛋白酶降解，由于BE-14106中的-N-C＝O键与肽键类似，导致BE-14106容易遭受蛋白酶降解)；BE-14106的糖基化或经修饰的BE-14106分子的糖基化，例如具有单糖部分；游离羟基的酰化，和BE-14106的侧链中C21-C22双键的还原。

可以过度表达调节子蛋白从而增加诸如BE-14106或其衍生物或类似物等所合成分子的产生。

因此，提供了生产经修饰BE-14106生物合成基因簇的方法，所述方法中对本文定义的本发明的核酸分子进行上述修饰中的一种或多种。通常，可以通过在内源性含有本发明的核酸分子的宿主细胞中进行基因置换而进行所述修饰。

“基因置换”是指本发明核酸分子中发现的基因或ORF或其部分(例如模块、结构域或其它功能单元)被其修饰版本有效地置换或取代。其修饰版本可以是其中所述基因或ORF或其部分(例如编码蛋白或肽或其结构域或模块的序列)发生改变或变化(通过取代、缺失或插入一个或多个核苷酸残基等进行的突变)的版本。所述改变可以导致所编码多肽的活性改变，而且还包括导致一种或多种蛋白质或多肽或其结构域或模块缺失或失活的改变。优选的是，修饰版本是其中编码所述蛋白质或多肽或其一个或多个模块或结构域的序列失活或缺失的版本。

应该注意，所述方法不需要全部基因或ORF被物理性除去和置换，而是本发明核酸分子中发现的某些或全部序列被其修饰版本置换。

可以根据本领域已知的技术进行基因置换(参见例如Sekurova等.，1999FEMS Microbiol.Lett.，177，297-304)。

优选例如通过基因置换对内源性含有本发明核酸分子的宿主细胞(例如微生物)进行核酸分子的修饰，从而使存在于所述宿主细胞中的BE-14106生物合成基因簇发生改变或变化。如果通常在宿主细胞中可发现本发明的核酸分子，或其天然地存在于该宿主细胞中(即，所述核酸分子存在于宿主细胞的遗传物质中)，则宿主细胞内源性含有本发明的所述核酸分子。换言之，本发明的核酸分子不是仅仅以其在诸如质粒等重组DNA分子中导入(例如转染或转化)宿主细胞的方式，而存在于所述宿主细胞中。

宿主细胞是否含有本发明的核酸分子可以通过确定所述宿主细胞是否可以合成BE-14106或其衍生物来确定。作为选择或作为补充，可以进行分析宿主细胞中所存在的核酸分子的序列的基因技术(例如PCR、Southern印迹和其它本领域已知的标准技术)。可以使用所述基因技术来确定所述核酸分子是否内源性存在。

用于本发明方法的宿主细胞可以是任何期望的细胞或生物，无论是原核的还是真核的，但通常其会是微生物，特别是细菌。尤其是，宿主细胞是放线菌(actinomycete)。

优选的宿主细胞包括链霉菌属(Streptomyces)菌株，优选内源性含有本发明核酸分子的链霉菌属(Streptomyces)菌株。合适的实例是链霉菌属(Streptomyces)菌株espi-A14106(在JP4001179中还称为FERMB-11378)。特别优选以保藏号DSM21069保藏在DSMZ的已经对基因簇进行测序的上述新型分离株。

另外，提供了由BE-14106生物合成酶系统所编码的经修饰多肽的生产方法，其中在宿主细胞中表达通过上述方法获得的经修饰的BE-14106生物合成基因簇。一旦通过例如上述方法对BE-14106生物合成基因簇进行适当的修饰，就可以在允许由该经修饰基因表达多肽和蛋白质的条件下使宿主细胞生长或将其培养，从而产生经修饰的BE-14106生物合成多肽。

因此，含有经修饰的BE-14106生物合成基因簇的经修饰宿主细胞会表达由所述基因簇编码的多肽和蛋白质，并且这会导致经修饰多肽或蛋白质，以及由所述基因簇编码的其它蛋白质的产生。作为生物合成机构中一种以上经修饰多肽或蛋白质存在的结果，BE-14106的生物合成机构的性质会改变。取决于对BE-14106生物合成基因簇进行的修饰的性质，所编码的多肽、蛋白质和酶的性质会与野生型不同。

对于大多数目的，细胞内BE-14106生物合成机构的产生会是足够的。作为选择，可以将组成(make up)BE-14106生物合成机构的蛋白质从表达其的细胞中纯化。

本发明的另一方面提供经上述修饰的本发明的核酸分子编码的多肽。

还提供了产生经修饰BE-14106分子的方法。根据该方法，在宿主细胞中表达可通过上述方法获得的经修饰BE-14106生物合成基因簇。这可以通过在允许由所述经修饰BE-14106生物合成基因簇编码的多肽、蛋白质和酶的表达的条件下，使其中存在可通过上述方法获得的经修饰BE-14106生物合成基因簇的宿主细胞生长或将其培养而实现。因此所述细胞会含有经修饰BE-14106分子的生物合成所需的生物合成机构，因此确保了该分子的合成。

该方法可以进一步包括回收步骤，例如分离或纯化所述经修饰BE-14106分子。可以从其中已经转移有或分泌有(如果合适)所述分子的细胞培养基中，或否则从已经包括所述分子的宿主细胞中将其分离或纯化。因此，例如，可以通过诸如离心等收获产生生物体的细胞，并且可以例如用有机溶剂(例如甲醇或其它醇)将其提取。可以通过例如沉淀从所述提取物中回收所述分子。以此方式获得的粗产物的进一步纯化可以包括例如色谱，如HPLC。

为了根据上述原则使本发明能够付诸实施，本发明还提供含有如本文定义的核酸分子的宿主细胞，尤其是提供含有如上所述经修饰的本发明的核酸分子的细胞。

通常，可以对含有本发明核酸分子的任何宿主细胞(优选的是内源性含有所述分子的宿主细胞)实施本发明的方法。如上指出，优选的宿主细胞包括链霉菌(Streptomyces spp)的细胞。更优选的细胞是具有表6中所示的抗生素抗性和敏感特性的链霉菌(Streptomyces)细胞。

在极其优选的实施方式中，使用产生BE-14106或其衍生物的新型链霉菌株MP28-13或其突变体或经修饰菌株实施所述方法，所述MP28-13以保藏号DSM21069在DSMZ保藏。

因此本发明还提供可通过本文所述方法获得的微生物，特别是细菌，尤其是链霉菌(Streptomyces)。

在一个重要方面本发明还提供一种产生BE-14106或其衍生物的链霉菌属(Streptomyces)的菌株或其突变体或其经修饰菌株，所述链霉菌属(Streptomyces)的菌株以保藏号DSMZ 21069在DSMZ保藏。

本发明方法可以视为导致从上述定义的本发明核酸分子衍生的衍生核酸分子的产生。

衍生核酸分子可以在含有未经修饰核酸分子的宿主细胞或微生物中原位形成。作为选择但较不优选，它们可以在其中导入有所述核酸分子的宿主细胞中形成。含有本发明的衍生或经修饰核酸分子的所述“经修饰”微生物可以用于形成文库，例如聚酮化合物或聚酮化合物类或巨内酰胺分子的文库，其中文库成员通过本文提供的对源自天然存在的BE-1406系统的经修饰BE-14106生物合成机构或NRPS-PKS系统而合成。通常，这些文库的许多成员自身就可以是新型化合物，并且本发明还包括这些文库的新型成员(化合物)。因此本发明的方法可以涉及个体化合物的制备。所述化合物可以是新的，也可以不是新的，但该制备方法使得其制备以更方便方法来进行。可以通过例如糖基化对所得化合物(例如聚酮化合物)进一步修饰，例如以将其转换成其它活性分子，例如抗生素。本发明还包括通过筛选本发明的文库回收具有所期望活性的新型化合物的方法。

通过在BE-14106NRPS-PKS基因簇中形成修饰，从而使得由所述簇产生的蛋白质具有一方面或更多方面的改变的活性，并由此产生不同于由所述基因簇编码的NRPS-PKS系统的天然产物(即BE-14106)的化合物，本发明提供文库或个体的经修饰形式，即聚酮化合物类或巨内酰胺分子。因此使用该方法可以制备新型化合物，或更容易地制备现有化合物。通过提供源自天然存在的BE-14016基因簇的大量不同的基因或基因簇(其中各基因或基因簇都是以不同方式从天然簇修饰)，作为这些活性的多种改变的结果，可以产生化合物的有效组合文库。因此本发明所用的经修饰的NRPS-PKS编码序列和生物合成机构/系统代表“源自”天然存在的BE-14106NRPS-PKS生物合成机构或系统的编码序列和酶/蛋白质机构或系统。

“源自”BE-14106生物合成机构的生物合成机构或NRPS-PKS系统是指其中至少一种酶活性或功能活性突变、缺失、失活或置换，从而改变活性的生物合成机构或NRPS-PKS系统。当这些活性被缺失或被不同版本的活性置换，或简单突变时的改变导致由这些总的活性产生不同于天然产物的化合物(例如聚酮化合物或巨内酰胺)。这会发生是因为在产物化合物的相应位置处存在起始单元和/或延伸单元，和/或立体化学，和/或链长度或环化和/或还原性或脱水循环结果的所获得改变。当缺失活性被置换时，置换活性的来源可以来自不同的天然存在的NRPS或聚酮化合物合酶中的相应活性，或来自相同NRPS-PKS系统/机构的不同区域。

模块型NRPS-PKS的修饰或操纵可以包括截短，例如基因或结构域或模块缺失或结构域/基因/模块交换、添加或失活，其可以包括插入或缺失。作为选择，可以在选择部分的核苷酸序列中(例如在基因/结构域/模块等中)进行随机或定向修饰(即突变)。

有利的是，“源自”BE-14106机构或系统的生物合成机构或NRPS-PKS系统含有至少NRPS腺苷酰化结构域和至少两个PKS酶的模块，并且可以任选地含有这些功能性结构域或模块中的一种或多种活性的突变、缺失或置换，从而改变所获得化合物的性质。该定义适用于蛋白质水平或基因水平。特别优选的实施方式包括其中KS、AT、KR或DH已经失活或缺失或被来自不同机构或PKS/NRPS系统的或来自相同机构或PKS/NRPS系统的另一位置的活性版本置换的那些。还优选的是其中至少一个非缩合循环酶活性(例如KR或DH)已经缺失或其中这些活性的任一已经突变从而改变所合成的最终化合物的衍生物。

因此，就所产生的化合物而言，存在用于构建PKS生物合成机构或系统的五个自由度。第一，聚酮化合物链长由机构或系统中模块的数量决定。第二，聚酮化合物的碳骨架的性质由酰基转移酶的特异性决定，所述酰基转移酶确定各位置处的延伸单元(例如丙二酰基、甲基丙二酰基或乙基丙二酰基等)的性质。第三，加载结构域特异性也会对聚酮化合物的所得碳骨架具有影响。因此，加载结构域可以使用不同的起始单元，例如乙酰基、丙酰基等。第四，聚酮化合物的各种位置处的氧化状态由模块的脱水酶和还原酶确定。这会确定聚酮化合物中酮、醇、双键或单键的存在和定位。

最后，所得聚酮化合物的立体化学是合酶的各种方面的函数。第一方面涉及与作为延伸单元的取代苹果酰基相关的AT/KS特异性，所述取代苹果酰基仅当缺少还原性循环时或当其仅含有酮还原酶时影响立体化学，这是因为脱水酶会消除手性。第二，酮还原酶的特异性会决定任何β-OH的手性。

通过对涉及氨酰基“起始物”的生物合成的PKS进行修饰，可以改变所产生的化合物。

因此经修饰的机构或NRPS-PKS系统可以允许合成宽范围的化合物。

所合成产物的尺寸可以随着模块数量的变化而改变。

对经修饰生物合成机构的聚酮化合物/巨内酰胺产物可以通过例如糖基化或其它衍生方法进行进一步修饰，从而展示或改进诸如抗生素活性等活性。使聚酮化合物糖基化的方法在本领域广泛已知；可以通过提供适当的糖基化酶在细胞内进行糖基化，或可以使用化学合成方法体外地进行糖基化。

为了获得编码天然存在的BE-14016NRPS-PKS系统的各种衍生物(或类似物)(进而获得各种聚酮化合物巨内酰胺类化合物)的核酸分子，可以通过“混合和匹配”酶活性-编码部分获得所期望数量的构建体，并且可以将突变导入天然宿主核酸分子/基因簇或其部分中。

可以使用常规技术对天然序列进行突变。突变的底物可以是整簇基因，或其中的仅一个或两个；突变的底物还可以是一个或多个所述基因的一部分。突变技术是本领域众所周知的，并且在文献中有所描述。所述技术包括制备含有突变的合成寡核苷酸，和使用限制性内切核酸酶消化将突变序列插入基因。作为选择，可以使用错配引物(长度通常为15～30个核苷酸)进行突变，所述错配引物在低于错配双链(duplex)的熔融温度的温度下与天然核苷酸序列杂交。通过使引物长度和碱基组成保持在相对窄界限内和通过使突变碱基位于中心，可以使引物变得具有特异性。使用DNA聚合酶进行引物延伸，产物的克隆，通过使引物延伸链分离而衍生、选择含有突变DNA的克隆。该技术还适用于产生多点突变。PCR突变还会可用于进行所期望的突变。

用于进行各种操作来置换宿主基因或ORF中的酶活性，或者来支持宿主基因或ORF的这些区域中的突变的载体经选择可以包含控制序列，所述控制序列以在宿主中可实施编码序列的表达的方式可操作连接到所得编码区域。然而，也可以使用简单的克隆载体。

附图说明

现在参考附图，在以下非限制性实施例中更详细地描述本发明，其中：

图1显示巨内酰胺抗生素BE-14106的化学结构；

图2A显示所提出的BE-14106的生物合成途径的起始；

图2B显示所提出的BE-14106生物合成的完成。

具体实施方式

实施例1-分离株MP28-13(链霉菌属菌株DSM 21069的表征)

在ISP2琼脂生长培养基(Difco，USA)上：基内菌丝体是浅黄色的，与ISP2-琼脂板颜色相同。气生菌丝体是白色的，并且孢子几乎是白色的，仅稍微呈绿色。

在SFM琼脂生长培养基(豆粉，20g/l；甘露醇，20g/l；琼脂，20g/l)上：基内菌丝体比在ISP2上更呈米色(beige)，气生菌丝体和孢子与在ISP2上相同。

在ISP2板上，生长于2天后可见，但孢子形成需要约20天。孢子形成在两种培养基上都相当弱。

在液体培养基中的生长：在以225rpm摇晃并具有玻璃珠(3mm)的TSB液体生长培养基(Oxoid，UK)中生长良好。为了获得足够的菌丝体需要在25℃下2天。

菌株可在20℃、25℃和30℃下生长，但是最佳温度为约25℃。在30℃时孢子形成受影响。

菌株DSM 21069(分离株MP28-13)的16S RNA基因序列示于SEQ IDNo.46。

表6显示菌株DSM 21069的抗生素抗性特性。

表6抗生素抗性

实施例2-BE-14106生物合成基因簇的探针的产生

使用DNeasy Blood & Tissue Kit(QIAGEN)从DSM 21069(MP28-13)分离总DNA。使用Izumikawa等((2003)Bioorg.Med.Chem.，11，3401-3405)所述的简并引物KSMA-F(5′-TS GCS ATG GAC CCS CAG CAG-3′[SEQID No.47])和KSMB-R(5′-CC SGT SCC GTG SGC CTC SAC-3′[SEQ IDNo.48])扩增β-酮酰合酶(KS)结构域。50μl反应混合物含有分离自MP28-13的总DNA(10ng～20ng)、1x ThermoPol反应缓冲液(NewEngland Biolabs)、引物各400nM、dNTP各200μM和2,5U Taq DNA聚合酶(New England Biolabs)。使反应在95℃下运行5分钟；然后35个循环，每个循环为在95℃下1分钟，在60℃下1分钟和在72℃下2分钟；随后在72℃下延伸最后5分钟。

以50μl反应混合物进行凝胶电泳，使用QIAEX II Suspension(QIAGEN)对所得的约700bp的DNA片段进行纯化。使用QIAGEN PCR克隆试剂盒(QIAGEN)在大肠杆菌(E.coli)EZ细胞中的pDrive载体(QIAGEN)中克隆经纯化的PCR产物。使用Plus SV MiniprepsDNA纯化系统(Promega)分离来自转化体的质粒DNA。

使用QIAGEN PCR Cloning Handbook(QIAGEN，2001)中所述的pDrive-特异性引物M13正向(-20)(5′GTA AAA CGA CGG CCA GT 3′[SEQ ID No.49])和M13反向(5′AAC AGC TAT GAC CAT G 3′[SEQ IDNo.50])对8个重组质粒进行测序。使用Terminator v1.1CycleSequencing Kit(Applied Biosystems)进行测序。所获得的8个序列中的5个彼此不同。翻译成蛋白序列并进行BLAST检索，对于所有序列给出I型PKS的匹配(见表7)。

最令人感兴趣的序列是no.1、3、6、7和8。序列no.1与涉及紫黑链霉菌(S.violaceusniger)中美立霉素(meridamycin)的生物合成的PKS(Sun等，2006Microbiol.，152，3507-3515)匹配。序列no.3、7、8给出与涉及暗黑橄榄链霉菌(S.atroolivaceus)中雷拉霉素(leinamycin)的生物合成的LnmJ(Cheng等，2003Proc.Natl.Acad.Sci.USA，100，3149-3154)的匹配。序列no.6给出与涉及郝氏链霉菌(S.halstedii)中巨内酰胺文森他汀的生物合成的VinPl(Ogasawara等，2004Chem.&Biol.，11，79-86)和涉及除虫链霉菌(S.avermitilis)中大环内酯除虫霉素的生物合成的AVES 2(Ikeda等，1999Proc.Natl.Acad.Sci.USA，96，9509-9514)强烈匹配。

选择序列no.6(SEQ ID No.51)作为探针以筛选为了DSM21069(MP28-13)而构建的基因组文库。使用PCR DIG Probe Synthesis Kit(Roche Applied Science)和上述MI 3引物产生地高辛(digoxygenin)(DIG)标记的探针。使用含有序列no.6的质粒作为模板。使反应在95℃下运行3分钟；然后30个循环，每个循环为在95℃下45秒，在44℃下1分钟和在68℃下3分钟；随后在68℃下延伸最后7分钟。对所得的PCR产物进行凝胶电泳，并用QIAEXII Suspension(QIAGEN)纯化DNA片段。

表7.从DSM 21069PCR扩增的KS结构域的测序

实施例3-接合过程的优化

为了建立遗传修饰菌株DSM 21069(MP28-13)的过程，按照Flett等所述的步骤(1997FEMS Microbiol.Lett.，155，223-229)测试与大肠杆菌(E.coli)菌株ET12567(pSOK804+pUZ8002)(Sekurova等.，2004，J.Bacteriol.，186，1345-1354)接合。对所述步骤进行了一些改进。使大肠杆菌(E.coli)供体生长至OD₆₀₀为0.4～0.5。仅使用MP28-13的新鲜孢子悬浮液，并且用2×YT制备孢子悬浮液(Sambrook等.，2000Molecularcloning：a laboratory manual.Cold Spring Harbor Laboratory Press，NewYork，NY)。将孢子和供体细胞混合并通过离心使成球团，将球团以较少体积悬浮并在两个SFM板上铺平板。在添加抗生素(0.9mg/ml萘啶酸和1.5mg/ml阿泊拉霉素)之前使接合平板温育24小时。对温育温度和热休克温度以及时间进行变化，从而发现最佳方案。在温育温度为25℃和在50℃下热休克5分钟时获得最佳结果。

实施例4-基因失活实验

使用限制性酶BamH I和Hind III，将在pDrive载体中克隆的来自菌株DSM 21069(MP28-13)的PKS序列no.6从质粒切割下，并与来自载体pSOK201(Zotchev等.，2000Microbiol.，146，611-619)的3.1kb BamHI/Hind III片段连接，然后转化到大肠杆菌(E.coli)DH5α中。通过限制分析检查新构建体，然后转化到大肠杆菌(E.coli)ET12567(pUZ8002)中。按照上述步骤将所述构建体转移到DSM 21069中。来自载体pSOK201的3.1kb BamH I/Hind III片段不含有链霉菌(Streptomyces)中自主复制所需的遗传元件。因此，仅当载体的该部分与和DSM 21069中的染色体DNA片段具有高度同源性的片段连接时，才能获得转化接合子。所述同源性允许产生将整个载体整合到相应染色体区域的重组。如果克隆的片段不含有基因的起始密码子或终止密码子，所述整合会产生基因破坏，有效地使基因的染色体拷贝失活。

获得一个转化接合子，并分析其BE-14106产生。未观察到BE-14106产生，证明序列no.6属于BE-14106生物合成基因簇。

实施例5-基因组文库的构建

根据制造商说明(Stratagene，2005)在粘粒载体SuperCos 1(Stratagene)中构建DSM 21069的基因组文库。按照Kirby混合步骤(Kieser等，2000Practical Streptomyces Genetics，The John Innes Foundation，Norwich，England.)从DSM 21069分离基因组DNA，在与Xba I-，CIAP-和BamH I-处理的SuperCos 1连接前用Mbo I部分消化并脱磷酸。使用大肠杆菌(E.coli)XLl-Blue MR(Stratagene)作为构建文库所用宿主。

实施例6-基因组文库的筛选

将所述文库置于含有100ng/ml的氨苄青霉素的Luriana-Bertani(LB)琼脂板(Low Profile Square Bio Assay Dish)，以产生每个平板～2000个集落。使用Genetix QPixII Colony Picker挑选2304个集落，并转移到含有LB肉汤的24个96孔板(Nunc)和含有Reduced Hi+YE-培养基的24个96孔板(每孔120μl)。在摇晃(900rpm)下使所述孔板在30℃下温育过夜。向24个LB板添加甘油，以得到15％(v/v)的最终浓度，然后在-80℃下贮存。

使用Tecan Genesis RSP 200机器人液体处理系统将来自24个Reduced Hi+YE板的培养物转移到6个384孔板(Nunc)，然后使用GenetixQpixII Colony Picker压在滤膜(filter)上(4个复制压制品)。重复所述过程4次，以得到4个复制滤膜。在无菌罩下将所述滤膜干燥20分钟。

通过将滤膜置于用10％SDS饱和的3MM Whatman滤纸上5分钟，对培养物进行裂解。通过将所述滤膜置于用NaOH/氯化物缓冲液(1.5MNaCl，0.5M NaOH)饱和的3MM Whatman滤纸上10分钟，并用Tris/NaCl缓冲液(3M NaCl，1M Tris-Cl，pH 7.4)中和10分钟，而使DNA变性。最后将滤膜浸入2X SSCP缓冲液(2X SSC+0.1％(w/v)焦磷酸钠)中，以除去集落碎片，并在80℃下烘干2小时。将滤膜贮存于4℃下直到开始杂交。使用获自DSM 21069的探针按照DIG System(Roche AppliedScience)所述进行杂交。将滤膜暴露到X射线胶片，鉴定出3个候选粘粒，可以从在-80℃下贮存的LB-板中将其相应的宿主进行再划线培养。

使用Plus SV Minipreps DNA Purification System(Promega)从过夜培养物中分离粘粒DNA，并且使用为插入位点两侧的粘粒区域而设计的引物(SuperCos_forw；5′GGC CGC AAT TAA CCC TCA C 3′[SEQID No.52]和SuperCos_rev；5′GGC CGC ATA ATA CGA CTC AC 3′[SEQID No.53])进行末端测序。使用Terminator v 1.1Cycle SequencingKit(Applied Biosystems)进行测序。结果示于表8。

表8：粘粒1、2和3的末端测序

粘粒	SuperCos_forw引物	SuperCos_rev引物
			粘粒1	生物素合酶	PKS(AT-DH结构域连接物)
粘粒2	PKS(KS结构域)	PKS(AT结构域)
			粘粒3	肽去甲酰酶	PKS(DH结构域)

结果表明，粘粒1可能含有所述簇的一个末端，而粘粒3可能含有所述簇的另一末端。通过设计末端序列的引物和将这些引物用于对其它粘粒测序，测试3个粘粒以发现它们是否含有任何重叠序列。从这些结果推断出粘粒2和粘粒3是重叠的，但是粘粒1与粘粒2和3不具有任何重叠。针对粘粒2的正向引物末端序列而设计引物，以用于扩增所述簇丢失部分的新探针。使用PCR DIG Probe Synthesis Kit(Roche AppliedScience)，以粘粒2作为模板，产生地高辛(digoxygenin)(DIG)标记的探针。使反应在95℃下运行5分钟；然后35个循环，每个循环为在95℃下1分钟，在60℃下1分钟和在72℃下2分钟；随后在72℃下延伸最后5分钟。对所得的PCR产物进行凝胶电泳，并用QIAEXII Suspension(QIAGEN)纯化DNA片段。使用复制滤膜中的一个与新探针杂交，鉴定出2个新的候选粘粒(粘粒4和5)。重复进行使用末端测序和与其它粘粒交叉测序的过程，发现粘粒4与粘粒1和2都重叠。

实施例7BecA功能的验证

为了验证粘粒1～4中含有的基因簇负责BE-14106产生，进行另一基因失活实验。使用一个粘粒引物(SuperCos_forw[SEQ ID No.52]或SuperCos_rev[SEQ ID No.53])和KS结构域的一个简并引物(KSMA-F[SEQ ID No.47]或KSMB-R[SEQ ID No.48])，从粘粒2和3扩增PKS片段。获得粘粒2的1.2kb片段和粘粒3的3.7kb片段。如上所述在pDrive和pSOK201中克隆两个片段，并通过接合将构建体转移到MP28-13中。对于粘粒2片段，仅获得一个转化接合子。对于粘粒3片段，获得几个转化接合子，并选择了6个用于进一步分析。

表9敲除突变体中BE-14106产生的分析

	与WT相比的BE-14106产生(％)
		MP28-13(WT)	100
粘粒2突变体	0
		粘粒3突变体1	0,7
粘粒3突变体2	0,9
		粘粒3突变体3	0,6
粘粒3突变体4	0,6
		粘粒3突变体5	0,6
粘粒3突变体6	0,7

基于来自粘粒的交叉测序和基因失活实验的结果，对粘粒1、2、3和4进行测序。

实施例8-BE-14106的产生、纯化和鉴定

MP28-13的培养

标准接种物的制备

接种：将来自琼脂板的孢子转移到具有50ml补充有葡萄糖的改良TSB-培养基(组分在表9中给出)的摇瓶(250ml，带有挡板(baffled))中。为了增加摇瓶中的剪切力，添加3g的3mm的玻璃珠。

温育：在25℃下以225rpm温育所述培养物3天(InforsMultitron摇动温育器，轨道运动，振幅2.5cm)。

保存：向所述培养物添加甘油至浓度为15％。将所述混合物转移到冷冻瓶，并在-80℃下贮存。

用于生产的预培养物的制备

接种：将1.5ml标准接种物转移到具有50ml补充有葡萄糖的改良TSB-培养基(组分在表10中给出)和3g的3mm玻璃珠的摇瓶(250ml，带有挡板(baffled))中。

温育：在25℃下以200rpm温育所述培养物2天(InforsMultitron摇动温育器，轨道运动，振幅2.5cm)。

生产培养物

接种：将3ml用于生产的预接种物转移到具有100ml补充有葡萄糖的0.3x BPS-培养基(组分在表11中给出)和5g的3mm玻璃珠的摇瓶(500ml，带有挡板(baffled))中。

用于生产的培养基的组分

表10.补充有葡萄糖的改良TSB-培养基的组分

化合物	浓度(g/l)
		胰蛋白酶大豆肉汤	18,5
葡萄糖^a	20

^a)单独高压灭菌

表11.补充有葡萄糖的0.3x BPS培养基的组分

^a)单独高压灭菌。

^b)10mg/ml酚红溶液，用NaOH调节pH至8.2。

将所述成分添加到经预热的水中，在对培养基高压灭菌前使所述成分膨胀10分钟。高压灭菌后用HCl或NaOH调整培养基的pH，直到获得橙色，当酚红用作pH指示剂时该颜色出现在pH＝7。

BE-14106的纯化

细胞团的收获和匀质化

通过离心收获生产培养物中的细胞团，并将其冷冻干燥。用磁铁珠将经冷冻干燥的球团匀质化，直到成为细小的球团。

BE-14106的粗纯化

用240ml甲醇/g提取经冷冻干燥的细胞球团1小时。添加玻璃珠以增加剪切力。通过离心除去细胞球团，然后过滤以除去所有不可溶性物质。澄清的上清液添加水，并在冰上保持约30分钟以使BE-14106沉淀。通过离心收集沉淀物，用水洗涤以除去残留的甲醇并冷冻干燥。冷冻干燥产品表示粗产物。

粗产物的制备型HPLC纯化

将粗产物溶解于DMSO，并在反相柱上进行纯化。

制备方法：BIOP PREP BE14106_KFD.M

HPLC系统：具有级分收集系统的Agilent 1100系列制备型HPLC

柱：PREB-C18，10μm，50x250mm(PN410910)

柱温：室温

流动相：10mM pH4.0的乙酸铵(A)和甲醇(B)

洗脱流速：85ml/分钟

向级分中添加1％的2M NH3溶液，并贮存于-20℃下。

制备型HPLC级分中产物的浓缩

将级分中的大部分甲醇在50℃下在旋转真空蒸发器中蒸发。将残留的含有BE-14106的水相冷冻以增加沉淀物产率，并且通过离心使沉淀物成球团。用水洗涤所述球团两次，并冷冻干燥以获得最终产物。

通过制备型HPLC纯化的BE14106的LC-DAD-TOF分析

通过LC-DAD-TOF计算纯度

通过制备型LC纯化后，通过UV和TOF数据确定BE-14106在291nm处有吸收，显示BE-14106占样品中化合物的＞99％。设污染物的消光系数与BE-14106相同。

BE-14106的TOF-MS数据

TOF-MS能够获得经纯化的BE-14106的LCTOF图。从此可见BE-14106(C₂₇H₇₃NO₃)的理论精确m/z(阴离子)是422.2701。以可接受的精确度观察到该m/z，并且422峰与七烯化合物(heptaene)UV峰良好关联。

LCTOF方法：BIOP BE14106SE.M

柱：Zorbax Bonus-RP 2.1x50mm，3.5μm(Agilent Technologies)。

流动相A：10mM乙酸铵(Cat#：34674)，

流动相B：100％特级乙腈(acetonitrile supergrade)(Labscan UN 1648)

流速：0.3ml/分钟

柱温：室温

TOF-MS参数：

阴性API-ES离子化

干燥气体：10l/分钟

雾化器压力：40psig

干燥气体温度：350℃

毛细管电压：3000V

破碎电压(Fragmentor)：200V

实施例9-菌株DSM 21069抗真菌活性的表征

研究菌株DSM 21069抗真菌活性的产生，生长条件是25℃，在培养基PM2上(Bredholt等，2008，Marine Drugs，6(1)第12页-24页)生长7天，获得强的抗真菌活性。温育后，将培养基干燥，然后用DMSO提取。过滤后，使用DMSO提取物作为机器人生物检测过程中的样品，使用白色念珠菌(Candida albicans)CCUG3943和光滑念珠菌(C.glabrata)CCUG3942菌株作为指示生物体。后一菌株对多烯抗生素具有高水平的抗性，而白色念珠菌(C.albicans)菌株对多烯具有敏感性。生物检测中所用的培养基是AM19(B)(9.4g/l蛋白胨[Oxoid]，4.7g/l酵母提取物[Oxoid]，2.4g/l牛肉提取物[Difco]，10g/l葡萄糖[BDH]，蒸馏水)。

使用配备有二极管阵列检测器(DAD)和级分收集器的Agilent 1100系列HPLC系统对具有令人感兴趣的生物活性的DMSO-提取物的样品进行分级分离。使用2种不同类型的LC-柱：Agilent ZORBAX EclipseXDB-C18，5μm，4.6x 150mm和Agilent SB-CN 3.5μm，4.6x 75mm，对各样品平行地进行分级分离。对于两种类型的柱，使用去离子水中的0,005％甲酸和乙腈的混合物作为流动相，流速为1ml/分钟。在两种情况下，在第一分钟将乙腈的浓度保持在40％，然后在接下来的9分钟内从40％线性增加到95％，并在剩余的运行时间保持浓度为95％。使用级分收集器从注射开始的1分钟～13分钟收集12个级分的洗脱物。

在SpeedVac仪(Thermo Scientific)中对所述样品进行干燥，溶解于DMSO，并且测定级分的生物活性(如上所述检测)。

使用与二极管阵列检测器(DAD)和飞行时间(TOF)质谱仪连接的Agilent 1100系列HPLC系统对具有生物活性的级分进行分析。在该分析中使用与如上所述分级分离步骤相同的柱和缓冲液。以阴性(ESI-)模式进行电喷射离子化。使用DAD图来鉴定分级分离运行化合物中和LC-MS-TOF分析中的生物活性化合物的近似保留时间。比较相对应于来自平行分级分离(C18和CN柱)的生物活性样品中鉴定的有效峰的分子质量，并且确定出对来自C18和CN柱的级分而言相同的分子质量。将这些分子质量(10ppm窗口)提交到Dictionary of Natural Products的在线版本(http://dnp.chemnetbase.com/)，以对具有生物活性的此前表征的化合物进行检索。

生物活性级分的LCMS分析中，对具有与抗生素BE14106相应的分子质量的有效峰进行鉴定。LC-MS-TOF分析中观察到的分子质量位于DNP中给出分子质量的1ppm(精确分子量423.277344)内。另外，对于抗生素BE14106的UV-吸收光谱，将这些提取物的DAD曲线与DNP中给出的信息进行比较。在DNP中给出的数据和在提取物中鉴定的化合物的DAD图之间观察到良好的相关性。

实施例10-BecI、BecO、BecR、BecC和BecP功能的表征

为了验证某些基因在BE-14106生物合成中的作用，进行一系列基因失活实验。如上所述(实施例7)，已经完成使用来自粘粒2和粘粒3的PCR扩增片段的基因失活实验。这些片段的测序和与BE-14106簇的比较显示，这两种片段都为becA基因的部分，编码模块2的KS和AT结构域的部分的1.1kb片段和编码模块2的KS、AT和DH结构域的部分的3.7kb片段。在两种突变体中BE-14106的产生均明显受影响(表9)。

用于基因失活实验的载体的构建

becI替换载体：将来自粘粒2的3.63kb Bgl II-Kpn I片段克隆到用BamH I-Kpn I消化的pGEM3Zf(-)中，产生构建体pBIR1。从该构建体除去0.8kb Nru I-FspA I片段，对构建体进行再连接，产生构建体pBIR2。从该新构建体中切割下2.86kb EcoR I-Hind III片段，并与pSOK201的3.11kb EcoR I-HindIII片段连接，产生becI替换载体，pBIR3。

becO替换载体：将来自粘粒4的14.77kb Sph I片段克隆到用Sph I消化的pGEM3Zf(-)中，产生构建体pBOR1A。从pBOR1A切割下3.71kbSph I-Xba I片段，并连接到Sph I-Xba I消化的pGEM3Zf(-)中，产生构建体pBOR1B。用Klenow处理来自pBOR1B的6.37kb EcoN I-Age I片段以填补末端，并再连接成构建体pBOR2。从构建体pBOR2切割下3.23kbEcoR I-Hind III片段，并与来自pSOK201的3.11kb EcoR I-Hind III片段连接，产生becO替换载体pBOR3。

becR替换载体：将来自粘粒1的4.35kb Hind III-BamH I片段克隆到用Hind III-BamH I消化的pGEM3Zf(-)中，产生构建体pBRR1。将0.4kbSnaB I-BsaB I片段从pBRR1除去，并再连接，产生新构建体，pBRR2。将来自构建体pBRR2的3.96kb EcoR I-Hind III片段与pSOK201的3.11kb EcoR I-Hind III片段连接，产生becR替换载体，pBRR3。

becC替换载体：将来自粘粒4的5.24kb BamHI-Sac I片段克隆到用BamHI-Sac I消化的pGEM3Zf(-)中，产生构建体pBCR1。用Klenow处理来自pBCR1的7.48kb Not I-Acc65I片段以填补末端，并再连接成构建体pBCR2。从构建体pBCR2切割下4.33kb EcoR I-Hind III片段，并与来自pSOK201的3.11kb EcoR I-Hind III片段连接，产生becC替换载体pBCR3。

becP替换载体：将来自粘粒4的6.49kb Sac I-Sph I片段与用SacI-Sph I消化的pGEM3Zf(-)连接，产生构建体pBPR1A。从pBPR1A切割下3.74kb Hind III-Bcl I片段，并将其连接到Hind III-BamH I消化的pLITMUS28中，产生构建体pBPR1B。用Klenow处理来自pBPRIB的5.85kb Xmn I-BbvC I片段以填补末端，并再连接成构建体pBPR2。将来自pBPR2的1.82kb EcoR I-Apa I片段和1.23kb Hind III-Apa I片段与来自pSOK201的3.11kb EcoR I-Hind III片段连接，产生becP替换载体pBPR3。

按照Flett等，1997(FEMS Microbiol.Lett，155，第223页-229页)所述的步骤将所有替换载体导入ET12567(pUZ8002)，然后用于与链霉菌(Streptomyces sp.)DSM 21069接合，但不同之处在于使供体细胞生长到OD₆₀₀为0.4～0.5，热休克时间减少到5分钟。24小时温育后添加抗生素。

最初指定BecR的推定作用为将由BecA形成的C20-C25酰基侧链和巨内酰胺环连接在一起。对通过Southem印迹分析验证的突变体，通过发酵提取物的LC-MS测试BE-14106产生。在ΔbecR突变体中BE-14106产生不受影响，暗示其不参与生物合成。

除了BecR的作用之外，关于BecI、BecC和BecP在生物合成BE-14106中的作用也存在问题，所提出的BecO作为C-8羟化酶的作用需要验证。使用上述载体，对于所有基因获得第二交叉突变体(crossovermutant)，并通过Southern印迹分析进行验证。通过对发酵提取物进行LC-MS来测试各突变菌株的BE-14106产生。对于ΔbecO突变体，发现与所提出8-脱氧BE-14106的化学计量式(C₂₇H₃₇NO₂)相应的预期质量与理论质量相差1.0ppm，由此确认BecO的作用为使BE-14106羟基化的P450单加氧酶。C-8碳表示BecO的唯一可能的靶，这是因为在涉及生物合成巨内酰胺环的BecE PKS中DH结构域活性的缺乏导致出现C-9处羟基。

来自ΔbecI、ΔbecC和ΔbecP突变体的发酵提取物的LC-MS分析都显示BE-14106产生的完全不存在，并且鉴定出没有推定的BE-14106类似物/前体。这可能表明，所有三种酶在生物合成的很早期起作用，可能涉及起始氨酰基单元的合成。

实施例11-确定BE-14106中氨基酸掺入的饲养研究。

使用基于¹⁵N Silantes OD2培养基的确定成分的生产培养基(Silantespr.No.103202)进行DSM 21069的饲养研究。培养基的成分是¹⁵N SilantesOD2培养基536ml/l，以及另外以g/l为单位的以下成分：MgSO₄x7H₂O，0.4；CaCO₃，5.0；(¹⁵NH₄)₂SO₄，0.54；KH₂PO4，0.2和葡萄糖，10。所述培养基补充有痕量的无机盐溶液TMS1(Borgos等.，2006，Arch.Microbiol，185，第165页-171页)3ml/l。通过添加0.14g/l的D-天冬酰胺或0.10g/l的甘氨酸或0.10g/l的谷氨酸钠或不添加未标记的氨基酸来测试未标记氨基酸的掺入。用3％如上所述培养的0.5x TSB预培养物接种生产培养物，不同之处在于在接种之前用生长培养基洗涤所述细胞一次以除去预培养物的成分。生产培养物和预培养物都在如上所述具有玻璃珠的带有挡板的摇瓶中培养。

使用与二极管阵列检测器(DAD)和TOF质谱仪连接的Agilent 1100系列HPLC系统对来自培养物球团的甲醇提取物进行BE-14106和8-脱氧BE-14106的定量和定性LC-MS分析。基本按照之前所述(Bruheim等，2004，Antimicrob.Agents Chemother，48，第4120页-4129页)，以阴性(ESI-)或阳性(ESI+)模式进行电喷射离子化，但改进之处在于以下：在AgilentZORBAX Bonus-RP 2.1x50mm柱上进行LC分离。在第一个10分钟乙腈浓度从40％线性增加到70％，然后在剩余的运行时间中保持浓度为90％。使用通过制备型HPLC纯化的BE-14106作为标样通过在291nm处的UV峰吸收确定BE-14106的浓度。

在添加用于在生物合成中掺入的待测氨基酸之前，培养基中所有氮原子都是¹⁵N同位素标记的。待测氨基酸以¹⁴N形式添加。除了D-天冬酰胺和甘氨酸之外，将添加L-谷氨酸盐和不添加额外的氨基酸作为实验中的对照。培养基中相关¹⁵N氨基酸浓度为：天冬酰胺0μM(天冬氨酸盐54μM)、甘氨酸29μM(丝氨酸11μM)和谷氨酸盐29μM。对于D-天冬酰胺、甘氨酸和谷氨酸盐而言添加的未标记氨基酸分别为¹⁵N天冬氨酸盐浓度的20x，¹⁵N甘氨酸浓度的27x，¹⁵N谷氨酸盐浓度的20x。在DMSO中提取生产培养物，并且在LC-DAD-TOF上对提取物进行分析。BE-14106分子含有一个氮原子，因此预期如果来自所添加¹⁴N氨基酸之一的N得以掺入，则在LC-TOF-谱图中会观察到精确质量(M-H)为422.27的BE-14106分子，而¹⁵N标记的BE-14106的精确质量(M-H)为423.28。在DMSO中提取生产培养物，并且在LC-DAD-TOF上对提取物进行分析。TOF-质谱显示，未标记甘氨酸的加入产生¹⁴N的20％掺入，而由D-天冬酰胺和谷氨酸盐添加而得到的掺入比为3％，与对照相同。

Claims

1.一种核酸分子，所述核酸分子由以下(a)或(b)或(c)组成：

(a)SEQ ID No.1所示的核苷酸序列；

(b)与SEQ ID No.1互补的核苷酸序列；

(c)与SEQ ID No.1简并的核苷酸序列，

其中所述核酸分子编码一种或多种多肽，或与编码一种或多种多肽的核酸分子互补；或所述核酸分子包含在巨内酰胺分子的合成中具有功能活性的一种或多种遗传元件，或与包含在巨内酰胺分子的合成中具有功能活性的一种或多种遗传元件的核酸分子互补。

2.如权利要求1所述的核酸分子，其中所述分子编码用于巨内酰胺分子合成的NRPS-PKS生物合成系统。

3.制备编码经修饰BE-14106NRPS-PKS系统的核酸分子的方法，所述方法包括对编码所述BE-14106NRPS-PKS系统的权利要求1所述的核酸分子进行修饰，其中对选自以下核苷酸序列的一种或多种核苷酸序列进行修饰：SEQ ID Nos2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42或44中任一所示的核苷酸序列，或与其互补的核苷酸序列，或与其简并的核苷酸序列。

4.如权利要求3所述的方法，其中以以下方式中的一种或多种对所述核酸分子进行修饰：

(i)修饰PKS编码序列以改变脱水酶或酮还原酶结构域的活性，使DH或KR结构域失活或缺失；

(ii)修饰SEQ ID No.26所示的羟化酶编码序列以使所述羟化酶失活或改变其特异性；

(iii)使PKS编码序列缺失或修饰PKS编码序列以使所编码的PKS酶失活；

(iv)导入编码糖基化酶的核苷酸序列。

5.如权利要求4所述的方法，其中所述核苷酸分子的修饰包括以下一种或多种：

(i)使表3中所示的DH结构域编码核苷酸序列缺失或失活；

(ii)使表4中所示的KR结构域编码核苷酸序列缺失或失活；

(iii)使SEQ ID No.5所示的becA或其模块缺失或失活；

(iv)使编码表2中所示的核苷酸位置所定义的模块BecB、BecD、BecE、BecF或BecG的一种或多种核苷酸序列缺失或失活；

(v)使SEQ ID No.26所示的becO缺失或失活。

6.如权利要求3～5中任一项所述的方法，其中所述核酸分子内源性存在于产生BE-14106的微生物中，并且所述方法在所述微生物中进行。

7.如权利要求6所述的方法，其中所述微生物是2008年1月25日以保藏号DSM21069保藏在DSMZ的链霉菌(Streptomyces sp)。

8.制备经修饰BE-14106NRPS-PKS系统的方法，所述方法包括在微生物中表达根据权利要求3～7中任一项获得的经修饰核酸分子。

9.制备巨内酰胺分子的方法，所述方法包括在微生物中表达根据权利要求3～7中任一项获得的经修饰核酸分子。

10.如权利要求12所述的方法，所述方法还包括回收所述巨内酰胺分子。

11.一种微生物，所述微生物含有根据权利要求3～7中任一项获得的经修饰核酸分子。

12.一种以保藏号DSM21069保藏在DSMZ的链霉菌属(Streptomyces)菌株。

13.通过权利要求9所述方法产生或能够获得的BE-14106类似物，

其中，所述BE-14106类似物包含选自下组的任何一个或多个的修饰，所述组包括：3-、5-、7-、11-、13-、15-、17-或23-羟基BE-14106，3-、5-、7-，9-、11-、13-、15-、17-或23-氧代BE-14106或其组合；或包含8-脱氧基团与选自在3、5、7、11、13、15、17或23位导入羟基或氧基或在9位导入氧基的一种或多种修饰的组合的类似物。

14.一种克隆或表达载体，所述载体包含权利要求1所述的核酸分子。

15.一种宿主细胞，所述宿主细胞包含权利要求1所述的核酸分子或权利要求14所述的载体，其中所述分子或所述载体已被导入异源性宿主细胞。

16.一种产生BE-14106的方法，所述方法包括：

(i)在异源性宿主细胞中导入权利要求1所述的核酸分子或权利要求14所述的载体；和

(ii)在允许所述核酸分子或载体表达并且产生BE-14106分子的条件下培养所述宿主细胞。