CN101939328A - 用于羊毛硫抗生素107891的生物合成的基因和蛋白质 - Google Patents

用于羊毛硫抗生素107891的生物合成的基因和蛋白质 Download PDF

Info

Publication number
CN101939328A
CN101939328A CN2007801007769A CN200780100776A CN101939328A CN 101939328 A CN101939328 A CN 101939328A CN 2007801007769 A CN2007801007769 A CN 2007801007769A CN 200780100776 A CN200780100776 A CN 200780100776A CN 101939328 A CN101939328 A CN 101939328A
Authority
CN
China
Prior art keywords
ala
leu
arg
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2007801007769A
Other languages
English (en)
Inventor
S·多纳迪奥
M·索西奥
S·塞丽娜
D·梅尔科里洛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sentinella Pharmaceuticals Inc
Original Assignee
Sentinella Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sentinella Pharmaceuticals Inc filed Critical Sentinella Pharmaceuticals Inc
Publication of CN101939328A publication Critical patent/CN101939328A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/746Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for lactic acid bacteria (Streptococcus; Lactococcus; Lactobacillus; Pediococcus; Enterococcus; Leuconostoc; Propionibacterium; Bifidobacterium; Sporolactobacillus)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0077Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Veterinary Medicine (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明涉及羊毛硫抗生素领域,更特别地涉及编码羊毛硫抗生素107891和其同系物的生物合成途径所需的酶的核酸分子的分离。

Description

用于羊毛硫抗生素107891的生物合成的基因和蛋白质
概述
本发明涉及羊毛硫抗生素(lantibiotics)的领域,更特别地涉及编码羊毛硫抗生素107891和其同系物的生物合成途径所需的酶的核酸分子的分离。公开的是涉及107891产生的基因产物的功能。本发明提供了107891产生所必需的新的生物合成基因、编码的多肽、包含编码所述多肽的核酸序列的重组载体、用所述载体转化的宿主细胞以及利用所述转化的宿主细胞生产羊毛硫抗生素的方法,包括生产107891、其前体、其衍生物、或不同于107891的修饰的羊毛硫抗生素或其前体的方法。
发明背景
对现有抗生素有抗性的病原细菌的持续增多是全球性的卫生问题,因而存在着发现和开发对抗性细菌有活性的新化合物的迫切需求。这重新引起了对天然产物的兴趣,这些天然产物过去是抗生素如青霉素、大环内酯类和糖肽的丰富来源。吸引人的候选物还有抗微生物肽以及在它们之中被称为羊毛硫抗生素的那些,即含羊毛硫氨酸的抗生素。羊毛硫抗生素形成抗微生物肽内的特殊基团,通过几个特征来辨别,例如一级和立体结构特征、独特的生物合成途径以及肽修饰反应和强力的抗细菌活性。这些是由革兰氏阳性细菌分泌的、并主要作用于革兰氏阳性细菌的一组肽衍生的抗微生物化合物。羊毛硫抗生素作为前原肽(prepropeptide)由核糖体合成,所述前原肽被翻译后修饰为它们的生物学活性形式。前肽(prepeptide)由N-末端前导序列和C-末端区域(原肽(propeptide))组成,所述N-末端前导序列不经历任何翻译后修饰,在从细胞分泌期间或之后被裂解,所述C-末端区域被翻译后修饰。羊毛硫抗生素由不同的细菌产生:这些化合物的共同特征是一个或更多个羊毛硫氨酸残基的存在,羊毛硫氨酸残基由通过硫醚键共价交联的两个丙氨酸残基组成。当半胱氨酸残基与脱氢丙氨酸或脱氢氨基丁酸部分反应来分别形成羊毛硫氨酸或甲基羊毛硫氨酸残基时形成硫醚键。脱氢氨基酸残基依次分别通过丝氨酸和苏氨酸的脱水来形成。根据它们的结构和功能性质,羊毛硫抗生素通常被分为两类,A型和B型。A型羊毛硫抗生素是长度从20到34个氨基酸残基的长形的阳离子肽:乳链菌肽、枯草菌素、表皮素和Pep5是这个类别的成员。B型是具有净负电荷的球形的肽:这个羊毛硫抗生素类别的实例有mersacidin、肉桂霉素、乳链球菌素481和actagardine。这些结构上的不同反映在了作用的机制上。通过可能由或不由对细胞靶脂质II的先期对接所辅助的一种机制,A型化合物通过阻断细胞壁生物合成和通过在细胞膜中形成孔来发挥它们的抗微生物活性。B型羊毛硫抗生素还通过抑制肽聚糖生物合成来发挥它们的抗微生物活性,但是这些化合物在与脂质II结合时不形成孔。
羊毛硫抗生素已经显示了具有作为食品添加剂和抗菌剂的效力和用途。最多研究的羊毛硫抗生素乳链菌肽由乳酸乳球菌(Lactococcus lactis)产生,在低浓度(低纳摩尔MIC)下针对多种革兰氏阳性细菌包括药物抗性菌株和食物传染的病原体肉毒杆菌(Clostridium botulinum)和单核细胞增生利斯特氏菌(Listeria monocytogenes)具有活性。它已经广泛地用作食品防腐剂而没有细菌抗性的实质性发生。其他的羊毛硫抗生素显示了感兴趣的生物学活性:例如,表皮素显示了针对疮疱丙酸杆菌(Propionibacteriumacnes)的高效力;肉桂霉素和耐久霉素抑制磷脂酶A2和血管紧张肽转变酶,分别提供了作为抗炎剂和用于血压调节的应用潜力;mersacidin抑制许多革兰氏阳性细菌,包括甲氧西林抗性金黄葡萄球菌(Staphylococcus aureas)(MRSA)。
对羊毛硫抗生素的生物合成负责的基因以成为基因座符号lan的聚簇来组织,对每种羊毛硫抗生素具有更为具体的遗传型名称(例如,乳链菌肽为nis,gallidermin为gdm,肉桂霉素为cin)。许多lan基因已经被测序,证明了在基因结构上高水平的相似性。每个聚簇包括:编码前肽的结构基因lanA;以及在LanA的原肽部分中Ser和Thr残基的脱水和硫醚形成所需的一或多个基因。对于A型羊毛硫抗生素,LanB进行脱水反应,LanC致力于硫醚键连,而在B型羊毛硫抗生素中,单个LanM酶催化这两种反应。其他基因通常存在于羊毛硫抗生素聚簇中:lanT编码用于羊毛硫抗生素的分泌的ABC转运蛋白,通常与由lanEFG基因编码的第二转运系统组合;lanP编码加工蛋白酶,但是某些聚簇缺少这一基因,其可以是lanT的部分或它的功能由细胞的蛋白酶提供;lanI编码涉及自我保护的蛋白质;lanKR对调节lan基因的表达负责。
存在着通过操作天然化合物来获得改进的羊毛硫抗生素的可能性和实用性。然而,羊毛硫抗生素是结构上复杂的肽,它们对化学作用的可接近性限于分子中的一些位置。化学作用的主要局限性之一是改变肽主链中存在的氨基酸的类型或顺序。鉴于此,希望的是拥有对于在羊毛硫抗生素形成中重定向这些步骤有用的基因和酶,以获得通过化学手段难以或不可能制得的衍生物。因而,直接通过使用精确工程化的菌株的发酵过程来设计新的羊毛硫抗生素衍生物的一般方法将是高度期望的。
实际上,在羊毛硫抗生素中的异常氨基酸单独地促进了它们的生物学活性并且还增强它们的结构稳定性。涉及羊毛硫抗生素生物合成的酶表现了通过将异常氨基酸导入期望的肽中用于肽工程化的高度潜力。
羊毛硫抗生素107891显示了针对革兰氏阳性细菌包括甲氧西林和万古霉素抗性菌株的抗细菌活性,但是对革兰氏阴性细菌示出了有限的活性(例如某些莫拉氏菌属(Moraxella spp.)、奈瑟氏菌属(Neisseria spp.)和嗜血杆菌属(Haemophilus spp.))。107891分离自小双孢菌(Microbispora sp.)PTA-5024的发酵物(WO 2005/04628A1)。它由紧密相关的因子A1和A2的复合物组成,它的结构可以重新推导为肽骨架,长度24个氨基酸,含有羊毛硫氨酸和甲基羊毛硫氨酸作为组成部分。此外,氯原子和一个或两个-OH残基存在于分子上。107891复合物的组分的结构由图3的式1代表,其中R代表[OH]和因子A1(R=OH)、因子A2(R=-(OH)2)。107891看起来组合了A型和B型羊毛硫抗生素的元件:107891中的环A和B与A型化合物中的等价的环高度相关;然而,如在B型羊毛硫抗生素中的,107891是更为球形的,它缺少柔性C-末端尾部并且缺乏带电的氨基酸残基。因此,不能预测致力于107891形成的lan聚簇是编码单独的LanM酶还是独立的LanB和LanC蛋白。此外,对于含氯的羊毛硫抗生素没有先例,因而对这种翻译后修饰负责的基因无法从现有数据预测。
抗生素生产的工业过程的设计是相对成功的,产生了抗生素滴度达到每升几克的水平的大规模发酵。这主要是通过经验性的、尝试与错误的方法来实现的,缺少理论基础。因而新工艺的开发和现有技术的改进仍然是费时的,可能产生不稳定的细菌培养物、不一致地进行和积累不需要的副产品。近年来,已经成功地应用了理论方法来提高链霉菌属(Streptomycesspp.)产生的抗生素的水平,其通常涉及感兴趣的基因簇内存在的关键调节元件的操作或途径中限速步骤的过表达。因而,编码这样的聚簇相关的调节物或合成限制步骤的基因可能成为产量改进的有效工具。然而,迄今为止在放线菌中鉴定的聚簇相关的调节物属于几个不同的蛋白质家族。甚至在一个家族内部,存在着序列相同性方面相当大的变异。因而,聚簇相关的调节物的存在、性质、数量和序列不能通过与其他聚簇比较来预测,甚至是指定了相关抗生素的那些。举例来说,泰乐菌素基因簇编码四种不同的调节物,而在指定相关的大环内脂类抗菌素红霉素的聚簇中都没有发现。类似地,生物合成途径中限速步骤的性质和原因不能先验地确定。
因而,提高107891产量的工具是高度期望的。然而,没有来自小双孢菌属的其他成员的聚簇的实例。因而,不能预测生产者菌株保护自身免于107891作用、调节其他lan基因表达、或lan基因与它的其他细胞过程配合表达的机制。与这些相关的信息对于优化生产过程将是非常有用的。
发明描述
本发明提供了微生物中羊毛硫抗生素107891的生物合成所需的一组分离的多核苷酸分子。
因而,根据一个方面,本发明涉及选自连续DNA序列(SEQ ID NO:1)的多核苷酸分子,所述DNA序列代表了分离自小双孢菌(Microbisporasp.)PTA-5024的、由编码107891形成所需多肽的17个ORF组成的mlb基因簇。
由所述17个ORF编码的多肽的氨基酸序列在SEQ ID NO:2到18中提供。
本发明还提供了包含选自由以下组成的组中的核苷酸序列的分离的核酸:
a)编码107891和其同系物的合成所需的多肽的mlb基因簇(SEQ IDNO:1);
b)编码由mlb基因簇(SEQ ID NO:1)编码的相同多肽、与mlb基因簇自身的核苷酸序列不同的核苷酸序列;
c)mlb ORF 1到17的任何核苷酸序列,编码由SEQ ID NO:2到18编码的多肽;
d)编码由mlb OFR 1到17的任一个编码的相同的多肽(SEQ ID NO:2到18)、与所述ORF的核苷酸序列不同的核苷酸序列。
本发明的进一步的主题是提供了包含选自由以下组成的组中的核苷酸序列的分离的核酸:
e)编码一多肽的核苷酸序列,所述多肽在其全长上在氨基酸序列上与mlb ORF 1到17的任一个编码的多肽(SEQ ID NO:2到18)至少具有65%、优选86%、更优选90%、最优选95%或更高的相同性。
在一个实施方案中,本发明的分离的核酸包含选自ORF 1到17(SEQ IDNO:2到18)的ORF,其编码107891的前原肽的合成所需的多肽。
在另一个实施方案中,所述核酸包含选自ORF 1到17(SEQ ID NO:2到18)的ORF,其编码107891脱水酶的合成所需的多肽。在又一个实施方案中,所述核酸包含选自ORF 1到17(SEQ ID NO:2到18)的ORF,其编码107891的羊毛硫氨酸和甲基-羊毛硫氨酸残基的合成所需的多肽。
根据另一个实施方案,在本发明的核酸中,提供了选自ORF 1到17(SEQ ID NO:2到18)的ORF,其编码107891的氨基酸4的色氨酸残基的氯化所需的多肽。
在又一个实施方案中,提供了包含选自ORF 1到17(SEQ ID NO:2到18)的ORF的核酸,其编码107891的氨基酸14的脯氨酸残基的羟基化所需的多肽。
在又一个实施方案中,提供了包含选自ORF 1到17(SEQ ID NO:2到18)的ORF的核酸,其编码氧化脱羧作用所需的黄素蛋白,氧化脱羧作用在107891的位置21和24产生S-[(Z)-2-氨基乙烯基]-(3S)-3-甲基-D-半胱氨酸(AviMeCys)残基。
根据另一个实施方案,在本发明的核酸中,提供了选自ORF 1到17(SEQ ID NO:2到18)的ORF,其编码黄素蛋白还原所需的多肽。
根据又一个实施方案,提供了核酸,其包含选自ORF 1到17(SEQ IDNO:2到18)的ORF的组合,编码对107891的输出和抗性所需的多肽。
在又一个实施方案中,提供了核酸,其包含选自ORF 1到17(SEQ IDNO:2到18)的ORF的组合,编码调节mlb基因簇表达所需的多肽。
本领域技术人员理解的是,已经提供了编码107891生物合成途径的多肽的核苷酸序列,本发明还提供了编码来自这样的多肽的片段的核苷酸。根据本发明,本领域技术人员理解的是,由于遗传密码是简并性的,由SEQID NO:2到18所编码的相同的多肽可以由ORF 1到17的天然或人工变体编码,即由ORF 1到17所指定的基因组核苷酸序列之外的、但是编码相同的多肽的核苷酸序列编码。
此外,还要理解的是,天然发生的或人工制造的变体可以出自SEQ IDNO:2到18编码的多肽,所述变体具有与上述原始多肽相同的一或多种功能,但是含有对于折叠或催化功能非关键的氨基酸的添加、缺失或取代,或必需氨基酸的保守性取代。
本领域技术人员还理解的是,提供了107891生物合成所需的全部聚簇的核苷酸序列,本发明还提供了所述聚簇中存在的基因的表达所需的核苷酸序列。这样的调节序列包括但不限于启动子和增强子序列、反义序列、转录终止子和抗终止子序列。这些序列对于调节mlb基因簇中存在的基因的表达是有用的。带有单独的或与其他核苷酸序列融合的所述核苷酸序列的细胞也在本发明的范围之内。
在一个方面,本发明提供了包含核苷酸序列的分离的核酸,所述核苷酸序列编码ORF6多肽(SEQ ID NO:7)、或所述多肽的天然发生的变体或衍生物,编码107891的前原肽。
在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码ORF7多肽(SEQ ID NO:8)、或所述多肽的天然发生的变体或衍生物,对于羊毛硫抗生素前体中丝氨酸和苏氨酸残基的脱水化是有用的。
在又一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码ORF8多肽(SEQ ID NO:9)、或所述多肽的天然发生的变体或衍生物,对于羊毛硫抗生素前体中羊毛硫氨酸和甲基-羊毛硫氨酸形成是有用的。
在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码ORF9多肽(SEQ ID NO:10)、或所述多肽的天然发生的变体或衍生物,对于抗生素前体中AviMeCys形成是有用的。在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码ORF15多肽(SEQ IDNO:16)、或所述多肽的天然发生的变体或衍生物,对于羊毛硫抗生素前体中色氨酸残基的氯化是有用的。
在又一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码ORF2多肽(SEQ ID NO:3)、或所述多肽的天然发生的变体或衍生物,对于羊毛硫抗生素前体中脯氨酸残基的羟基化是有用的。
在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码ORF1、10到11、13到14和17(SEQ ID NO:2、11到12、14到15、和18)所指定的多肽,或所述多肽的天然或人工发生的变体或衍生物,对于107891或107891前体的细胞输出是有用的。
在另一个方面,本发明提供了包含核苷酸序列的核酸,所述核苷酸序列编码ORF3和5多肽(SEQ ID NO:4和6)、或所述多肽的天然或人工发生的变体或衍生物,对于调节羊毛硫抗生素产生是有用的。
在一个实施方案中,本发明提供了带有核苷酸序列的额外的拷贝的羊毛硫抗生素生产菌株,所述核苷酸序列指定选自ORF 1到17(SEQ ID NO:2到18)的任一个的至少一个ORF。
在一个优选的实施方案中,这样的羊毛硫抗生素生产菌株是属于放线菌目(Actinomycetales)的任何菌株。
在又一个优选的实施方案中,这样的羊毛硫抗生素生产菌株是小双孢菌属的成员。
在一个优选的实施方案中,本发明提供了小双孢菌菌株,其含有SEQ IDNO:1中指定的核苷酸序列中的一个或更多个变异,所述变异引起ORF 1到17(SEQ ID NO:2到18)的一个或更多个的提高或降低的表达。
在一个优选的实施方案中,本发明提供了携带在一个或更多个载体上的包含SEQ ID NO:1指定的核苷酸序列或其部分的核酸,对于通过其他细胞生产107891、一种或更多种的其前体或其衍生物是有用的。
在一个优选的实施方案中,所述核苷酸序列或其部分被携带在单个载体上。适合的载体是能够携带此处定义的完整mlb聚簇的任何粘粒、F粘粒、BAC、PAC、ESAC载体。适合的载体是本领域技术人员公知的,在文献(Kieser et al.,2000,以及其中描述的参考文献)中描述。
在一个方面,本发明提供了提高107891的产生的方法,所述方法包括以下步骤:
-用重组DNA载体转化微生物,所述微生物通过生物合成途径生产107891或其同系物或107891的前体或其同系物,所述载体包含DNA序列,所述DNA序列选自ORF 1到17(SEQ ID NO:2到18)的任一个,其编码所述途径中速率限制性的活性。
-在适合于细胞生长的条件下培养用所述载体转化的所述微生物,表达所述基因并产生所述抗生素或抗生素前体。
适合的宿主细胞是放线菌目,到链孢囊菌科(Streptosporangiaceae)、小单孢菌科(Micromonosporaceae)、假诺卡氏菌科(Pseudonocardiaceae)和链霉菌科(Streptomycetaceae),到小双孢菌属(Microbispora)、游动放线菌属(Actinoplanes)、游动单胞菌属(Planomonospora)、链霉菌属(Streptomyces)等等。
在另一个方面,本发明提供了生产107891的衍生物和其同系物的方法,所述方法包括以下步骤:
-在适合的载体中克隆选自SEQ ID NO:1所定义的核苷酸序列的片段,所述片段含有ORF 1到17(SEQ ID NO:2到18)之一的至少一部分,所述ORF编码多肽,所述多肽催化希望绕过的生物合成步骤;
-通过除去或置换一个或更多个指定氨基酸的密码子来失活所述ORF,所述氨基酸对于所述多肽的活性是必需的;
-用所述重组DNA载体转化微生物,所述微生物通过生物合成途径生产107891或其同系物或其107891前体;
-在所述产生的转化体中筛选出所述DNA序列被突变的拷贝置换的那些转化体;
-在适合于细胞生长的条件下培养突变细胞,表达所述途径并生产所述途径类似物。
在又一个方面,本发明提供了生产新的羊毛硫抗生素的方法,所述方法包括以下步骤:
-用重组DNA载体转化微生物,所述微生物通过生物合成途径生产羊毛硫抗生素或其同系物或其前体,所述载体包含一个或更多个ORF,所述ORF选自ORF 1到17(SEQ ID NO:2到18),其编码能够修饰所述羊毛硫抗生素或羊毛硫抗生素前体的一或多种酶;
-在适合于细胞生长的条件下培养用所述载体转化的所述微生物,表达所述基因并产生所述羊毛硫抗生素或其同系物或其羊毛硫抗生素前体。
在又一个方面,本发明提供了生产新的羊毛硫抗生素的方法,所述方法包括以下步骤:
-用重组DNA载体转化微生物,所述载体包含一个或更多个ORF,所述ORF选自ORF 1到17(SEQ ID NO:2到18),其编码能够修饰羊毛硫抗生素或羊毛硫抗生素前体的一或多种酶;
-在适合于细胞生长的条件下培养用所述载体转化的所述微生物,在存在所述羊毛硫抗生素或羊毛硫抗生素前体的情况下表达所述基因。
在又一个方面,本发明提供了生产新的羊毛硫抗生素的方法,所述方法包括以下步骤:
-用重组DNA载体转化微生物,所述载体包含一个或更多个ORF,所述ORF选自ORF 1到17(SEQ ID NO:2到18),其编码修饰羊毛硫抗生素或羊毛硫抗生素前体的一种或更多种多肽;
-在适合于一或多种活性多肽的存在的条件下制备所述微生物的细胞提取物或细胞级分,所述细胞提取物或细胞级分至少含有所述一或多种多肽;
-将羊毛硫抗生素或羊毛硫抗生素前体添加到所述细胞提取物或细胞级分中,在所述一或多种多肽可以修饰所述羊毛硫抗生素或羊毛硫抗生素前体的条件下保温所述混合物。
本发明的进一步的方面包括涉及107891的生物合成途径的分离的多肽,选自
-由mlb ORF 1到17(SEQ ID NO:2到18)的任一个编码的ORF多肽,和
-一多肽,所述多肽在其全长上在氨基酸序列上与mlb ORF 1到17(SEQID NO:2到18)的任一个、优选mlb ORF 1到3、5到11、13到17(SEQID NO:2到4、6到12、14到18)的任一个编码的多肽具有至少65%、优选95%或更高的相同性。
优选的多肽组包含由mlb ORF 1到3、5到11、13到17(SEQ ID NO:2到4、6到12、14到18)的任一个编码的任何ORF多肽,或在其全长上在氨基酸序列上与所述mlb ORF的任一个编码的多肽具有至少65%、优选86%、更优选90%、最优选95%或更高的相同性的任何多肽。
定义
术语“分离的核酸”在此是指DNA分子,作为基因组DNA或互补DNA(cDNA),其可以是单链或双链的、天然或合成来源的。该术语还指天然或合成来源的RNA分子。
术语“核苷酸序列”在此是指此处公开的ORF的全长或部分长度序列以及基因间区域。
术语“核苷酸序列”在此还指和/或包含序列表中所示的本发明的核苷酸序列的任一个。序列表的任一核苷酸序列是
A)编码序列,
B)来自(A)转录的RNA分子,
C)利用了遗传密码的简并性来编码相同多肽的编码序列,
D)基因间区域,含有启动子、增强子、终止子和抗终止子序列。
术语“基因簇”、“聚簇”和“生物合成聚簇”在此是指微生物的基因组的连续片段,其含有次级代谢产物的合成所需的全部基因。
术语“mlb”在此是指对小双孢菌PTA-5024中的107891生物合成负责的遗传元件。该术语是Microbispora LantiBiotic的简称。
术语“ORF”在此是指编码一个多肽的基因组核苷酸序列。在本发明的上下文中,术语ORF与“基因”同义。
术语“ORF多肽”在此是指由ORF编码的多肽。
术语“mlb ORF”在此是指包含在mlb基因簇之内的ORF。
术语“次级代谢产物”在此是指微生物通过由基因簇指定的一组基因的表达产生的生物学活性物质。
术语“载体”在此被定义为包括特别是任何质粒、粘粒、噬菌体,其可以通过整合到细胞基因组中或染色体外地存在(例如,具有复制起点的自主复制质粒)来转化原核宿主。
术语“生产宿主”、“宿主细胞”在此是微生物,其中次级代谢产物的形成由来自供体微生物的基因簇指导。
术语“同系物”在此是指由生物合成基因簇编码的多肽,其在其全长上与由mlb聚簇编码的任何多肽享有至少65%的序列相同性。
附图简述
附图1显示了来自小双孢菌PTA-5024的染色体的分离的DNA片段。粗线表示了SEQ ID NO:1中描述的片段。带有所述分离的DNA片段的粘粒被称为1G6和6H6。
附图2显示了mlb聚簇的遗传结构。每个ORF由箭头表示,如表1中的编号(附图4)。取向与附图1中相同。标尺条上的数字表示序列坐标(按照kb)。
附图3显示了107891复合物的成分的结构。
附图4显示了ORF的主要特征。
A.分离自小双孢菌的mlb基因
107891是小双孢菌PTA-5024产生的紧密相关的肽抗生素的复合物。本发明提供了用于107891生物合成的mlb基因簇的核酸序列和表征。mlb基因簇的物理组织与侧翼DNA序列一起在附图1中报告,其说明了来自小双孢菌PTA-5024的基因组的20-kb基因组片段、以及定义这样的片段的两个粘粒的物理图谱。调节107891生物合成的DNA片段的遗传组织结构在附图2中示出,它的核苷酸序列由SEQ ID NO:1报告。
聚簇的精确边界可以根据它的基因产物的功能来建立。因此,在左侧末端(附图1),mlb聚簇由mlb ORF1划界,编码ABC转运蛋白(SEQ IDNO:2),涉及107891的输出。在右侧,mlb聚簇由mlb ORF 17划界,一种膜离子反向转运蛋白(SEQ ID NO:18)。mlb聚簇跨越大约20,000个碱基对,含有17个ORF,称为mlb ORF1到mlb ORF17。SEQ ID NO:1的连续核苷酸序列(20000个碱基对)编码17种推断的蛋白质,列于SEQ IDNO:2到18中。
ORF1(SEQ ID NO:2)代表从核苷酸67到969翻译SEQ ID NO:1推断出的300个氨基酸。
ORF2(SEQ ID NO:3)代表从核苷酸966到2210翻译SEQ ID NO:1推断出的414个氨基酸。
ORF3(SEQ ID NO:4)代表从核苷酸2941到3723翻译SEQ ID NO:1推断出的260个氨基酸。
ORF4(SEQ ID NO:5)代表从核苷酸3948到4614翻译SEQ ID NO:1推断出的221个氨基酸。
ORF5(SEQ ID NO:6)代表在互补链上从核苷酸5283到4621翻译SEQ ID NO:1推断出的220个氨基酸。
ORF6(SEQ ID NO:7)代表从核苷酸5414到5587翻译SEQ ID NO:1推断出的57个氨基酸。
ORP7(SEQ ID NO:8)代表从核苷酸5706到9053翻译SEQ ID NO:1推断出的1115个氨基酸。
ORF8(SEQ ID NO:9)代表从核苷酸9080到10507翻译SEQ ID NO:1推断出的475个氨基酸。
ORF9(SEQ ID NO:10)代表从核苷酸10537到11184翻译SEQ ID NO:1推断出的215个氨基酸。
ORE 10(SEQ ID NO:11)代表从核苷酸11181到12131翻译SEQ IDNO:1推断出的316个氨基酸。
ORF11(SEQ ID NO:12)代表从核苷酸12253到12981翻译SEQ ID NO:1推断出的242个氨基酸。
ORF12(SEQ ID NO:13)代表从核苷酸13357到13992翻译SEQ ID NO:1推断出的211个氨基酸。
ORF13(SEQ ID NO:14)代表从核苷酸14795到15544翻译SEQ ID NO:1推断出的249个氨基酸。
ORF14(SEQ ID NO:15)代表从核苷酸15546到16256翻译SEQ ID NO:1推断出的236个氨基酸。
ORF15(SEQ ID NO:16)代表从核苷酸16370到17995翻译SEQ ID NO:1推断出的541个氨基酸。
0RF16(SEQ ID NO:17)代表从核苷酸17992到18528翻译SEQ ID NO:1推断出的178个氨基酸。
ORF17(SEQ ID NO:18)代表从核苷酸18525到19817翻译SEQ ID NO:1推断出的430个氨基酸。
mlb聚簇的基因组结构和一级序列将107891置于A型羊毛硫抗生素中。
mlb和其他羊毛硫抗生素基因簇之间的比较揭示了重要的不同。实际上,mlb聚簇的特征在于在其他羊毛硫抗生素聚簇中没有找到同系物的几种ORF的存在。这些包括ORF 1到6、12、15到18(SEQ ID NO:2到7、13、16到19)。总之,此处描述的mlb聚簇的结构实质上不同于其他羊毛硫抗生素的合成中所涉及的其他聚簇的结构。因而它代表了具有这样的基因组结构的聚簇的第一个实例。
B.mlb基因的作用
本发明公开了负责107891的前原肽前体的合成的DNA序列。107891前原肽由33-aa长度的前导肽和24-aa的原肽组成。在此所指的核酸序列是编码107891前原肽或其片段的那些。57-aa的107891前原肽代表了新的元件,其在它的全长上与来自鸡葡萄球菌(Staphylococcus gallinarum)的羊毛硫抗生素gallidermin的前原肽、UniProt登记号P21838仅具有41%的相同性。
mlb聚簇中存在的其他基因代表了对于提高107891的产生或合成新的代谢物有用的新的遗传元件。在这些之中,mlb ORF 7到8(SEQ ID NO:8到9)编码涉及mlb ORF6的翻译产物的翻译后修饰的蛋白质,在成熟的107891中导入羊毛硫氨酸残基。特别是,mlb ORF7多肽负责107891的前原肽部分中Ser和Thr残基的脱水,分别产生脱氢丙氨酸和脱氢氨基丁酸残基。mlb ORF8多肽催化前原肽内部半胱氨酸残基对脱氢氨基酸残基的亲核攻击。这些基因可以在异源宿主中克隆和表达以产生能够将羊毛硫氨酸残基导入其他前原肽的有活性的酶。
本发明的另一个优选的核酸分子包括mlb ORF9(SEQ ID NO:10),其编码在产生S-[(Z)-2-氨基乙烯基]-(3S)-3-甲基-D-半胱氨酸残基(式I)的氧化脱羧作用中涉及的蛋白质。
本发明的又一个优选的核酸分子包括mlb ORF16(SEQ ID NO:17),其编码色氨酸卤化酶(halogenase),负责将氯原子加到107891的氨基酸4。mlb ORF 16代表新的和独特的遗传元件,早先在其他羊毛硫抗生素聚簇中没有报道。实际上,氯化是107891在已知的羊毛硫抗生素中相当独特的特征。这个基因可以在异源宿主中克隆和表达,产生能够氯化羊毛硫抗生素分子的色氨酸残基的活性酶。或者,mlb ORP16可以在生产菌株中失活,导致缺乏附着于氨基酸4的氯的107891衍生物的形成。
本发明的又一个优选的核酸分子包括mlb ORF2(SEQ ID NO:3),其编码对107891前原肽的翻译后修饰负责的细胞色素P450羟化酶,通过添加一个或两个氧到位置14的脯氨酸残基。mlb ORF2代表新的和独特的遗传元件,在其他羊毛硫抗生素聚簇中从未被报道过。实际上,107891脯氨酸羟基化谱在羊毛硫抗生素中相当独特的。这个基因可以在异源宿主中克隆和表达,产生能够氧化羊毛硫抗生素分子中存在的脯氨酸残基的活性酶。或者,mlb ORP2可以在生产菌株中失活,导致氨基酸14处缺乏氧原子的107891衍生物的形成。
mlb聚簇还包括许多调节基因,对107891生产期间直接或间接地活化生物合成和抗性基因的表达负责。这些基因包括mlb ORF 3和5(SEQ IDNO:4和6):mlb ORF3(SEQ ID NO:4)代表独立的群体感应(quorum-sensing)肽,对107891生产的调节部分地负责;mlb ORF5(SEQID NO:6)是与Sigma-70高度相关的,Sigma-70是一种作为正转录调节物的RNA聚合酶sigma因子的细胞质外功能家族。mlb ORF 3和5代表了其他羊毛硫抗生素聚簇没有的新的遗传元件。这两个基因,mlb ORF 3和5可以单独地或按它们任何的组合在另一个羊毛硫抗生素生产者菌株中克隆和表达来提高形成的产物的产量。
宿主菌株包括但不限于属于放线菌目的菌株,属于链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科的菌株,属于小双孢菌属、游动放线菌属、游动单胞菌属、链霉菌属的菌株等等。或者,这些基因可以单独地或它们的任何组合在107891生产菌株中过表达来提高107891的产量。
mlb聚簇还包括对输出羊毛硫抗生素中间物或终产物到细胞质外负责的、以及对生产者细胞赋予抗性负责的许多基因。这些基因包括mlb ORF 1、10到11、13到14和17(SEQ ID NO:2、11到12、14到15和18)。mlb ORF1、10到11、13到14编码ABC类别的转运蛋白,对107891或它的中间物的ATP依赖性排出负责。mlb ORF17编码Na/K离子反向转运蛋白,对于对抗质子梯度输出107891或它的中间物负责。这些基因可以单独地或按它们任何组合在另一个羊毛硫抗生素生产者菌株中克隆和表达来提高形成的产物的产量。宿主菌株包括但不限于属于放线菌目的菌株,属于链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科的菌株,属于小双孢菌属、游动放线菌属、游动单胞菌属、链霉菌属的菌株等等。
或者,这些基因可以单独地或它们的任何组合地在107891生产菌株中过表达来提高107891的产量。
C.mlb聚簇的用途
本发明还提供了用于完整107891分子、其任何前体或其衍生物的表达的核酸。这样的核酸包括一或多个分离的基因簇,所述基因簇包含编码足以指导107891组装的多肽的ORF。在一个实例中,完整的mlb聚簇(SEQID NO:1)可以被导入适合的载体中,用于转化期望的生产宿主。在另一个方面,mlb聚簇作为两个独立的片段克隆到两个不同的载体中,所述载体在期望的生产宿主中是相容的。在又一个方面,mlb聚簇可以分成三个片段,各自克隆到独立的、相容的载体中。一、二或三载体系统的使用的实例已经在文献中描述了。
一旦mlb聚簇被适当地克隆到一个或更多个载体中,它可以被导入许多适合的生产宿主中,在其中羊毛硫抗生素的生产可以以比天然宿主中更高的效率发生。优选的宿主细胞是可以有效地表达放线菌基因的那些物种或菌株。这样的宿主包括但不限于属于放线菌目,链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科,小双孢菌属、游动放线菌属、游动单胞菌属、链霉菌属等等。或者,被克隆到一个或更多个适合的载体中的mlb聚簇的第二拷贝可以被导入107891生产菌株中,在其中mlb基因的第二拷贝将提高107891的产量。
生产能力向良好表征的宿主的转移可以实质上改善导致优化和发展的过程的几个部分:生产菌株中天然产物的滴度可以更有效地提高;天然产物的纯化可以在可能干扰活性的已知背景中进行;复合物的组成可以更有效地控制;天然产物的改变的衍生物可以通过发酵条件的操作或通过途径工程化来更有效地产生。
或者,生物合成基因簇可以被修饰,插入到宿主细胞中,用于合成或化学地修饰各种各样的代谢物:例如,开放阅读框可以被重新排序,修饰,和与其他羊毛硫抗生素生物合成基因簇组合。
使用在此提供的信息,107891核酸的克隆和表达可以利用常规和公知的方法实现。
在另一个可能的用途中,从mlb基因簇选择的ORF可以通过使用常规的分子生物学技术来分离和失活。克隆在含有DNA片段的适合的载体中的突变的ORF被导入所述小双孢菌菌株中,所述DNA片段侧翼于小双孢菌PTA-5024染色体中的所述ORF,其中同源重组的两次交叉事件引起所述生产者菌株中所述ORF的失活。这个过程对于以有效的方式生产107891的前体或衍生物是有用的。
在另一种可能的用途中,从mlb基因簇选择的ORF被分离并置于期望的启动子的控制下。克隆在适合的载体中的工程化的ORF然后被导入小双孢菌PTA-5024,通过如上所述置换原始ORF、或作为所述ORF的另外的拷贝。这个操作对于提高或降低对107891分子、其前体或衍生物的生产是关键的ORF的表达水平是有用的。
实验小节
以下实施例用来说明鉴定出107891基因簇的原理和方法,以及鉴定和分析所有mlb基因的原理和方法。这些实施例用来说明本发明的原理和方法,但是不意味着限制它的范围。
一般方法
除非另外指出,细菌菌株和克隆载体全部可以从公众保藏机构或商业来源获得。使用分子生物学的标准方法。小双孢菌属在HT琼脂和在V6培养基(20g/l葡萄糖,5g/l酵母提取物,3g/l酪蛋白水解物,5g/l肉类提取物,5g/l蛋白胨,1.5g/l NaCl,0.5%甘油)中生长。根据公开的过程分离羊毛硫抗生素。使用标准程序进行序列分析。在公众站点使用Blast或Fasta程序进行数据库检索。
实施例1-107891生物合成基因的分离
使用来自小双孢菌PTA-5024的DNA在接合粘粒载体Supercos 3中制备基因组文库。这通过将来自pSET152的aacIV-oriT-intΦC31盒插入Supercos 1(Stratagene,La Jolla,CA 92037)中来构建如下:aacIV-oriT-intΦC31盒通过PCR从载体pSET152作为3.8kb长的NruI片段获得,插入到supercosl的相同位点中。来自小双孢菌PTA-5024的总DNA用Sau3AI部分地消化以将片段大小优化在40kb范围内。部分消化的DNA用碱性磷酸酶处理,连接到早先用BamHI消化的Supercos3。连接混合物体外包装,用于转染大肠杆菌(E.coli)XL1Blue细胞。产生的粘粒文库通过与寡核苷酸探针5′-GTS ACS WSS TGG WSS YTS WSS ACS GGS CCS TGCACS WSS CCS GGS GGS WSS AAC WSS WSS TCC WSS TG-3′(SEQ IDNO:19)杂交来筛选。根据从107891的结构推测出的氨基酸序列设计寡核苷酸。分离出对于该探针为阳性的两个粘粒,用限制性内切酶物理作图。根据这样的实验,鉴定了附图1中报道的粘粒。由此从小双孢菌PTA-5024的基因组鉴定的片段含有对抗生素107891的合成负责的mlb基因簇。
以上实施例用来说明mlb聚簇被分离的原理和方法。本领域技术人员将想到的是mlb聚簇可以克隆在多种载体中。然而,本领域技术人员将理解,考虑到mlb聚簇的20-kb大小,优选的载体是能够携带大的插入物的那些,例如lambda、粘粒和BAC载体。本领域技术人员理解,其他探针可用于从这样的文库鉴定mlb聚簇。根据在SEQ ID NO:1中报告的序列,任何片段可以从小双孢菌PTA-5024DNA中PCR扩增,用于筛选使用这些DNA制得的文库。从所述文库可以鉴定出包括SEQ ID NO:1覆盖的任何片段的一个或更多个克隆。此外,还可能的是通过使用异源探针例如来自其他lan聚簇的那些利用表1中提供的信息鉴定mlb聚簇。或者,指导次级代谢产物的合成的其他基因簇含有与mlb基因足够相关的基因以允许异源杂交。所有这些变体属于本发明的范围。
实施例2-107891基因簇的序列分析
如实施例1所述鉴定的mlb聚簇通过鸟枪法测序。mlb聚簇的序列在此由SEQ ID NO:1提供。分析产生的DNA序列来鉴定可能的编码序列,编码序列与其他lan聚簇比较或针对GenBank来检索。每个ORF的确切起始密码子通过相关序列的多次比对或通过搜索上游核糖体结合位点来确定。总共鉴定了17个ORF,命名为mlb ORF 1到ORF 17。这些分析的结果在表1中概述,在此在序列表中作为SEQ ID NO:2到SEQ ID NO:18来提供。详述如下。
2A.107891前原肽的合成
mlb ORF 6对前原肽的合成负责。前原肽含有49-aa的前导序列和24-aa的原肽(SEQ ID NO:7),原肽被翻译后修饰来产生成熟的羊毛硫抗生素。羊毛硫抗生素前导肽的两个共同特征在107891中被保留:A型羊毛硫抗生素的保守序列(例如,F-D/N-L-D/E基序)和在位置-2的脯氨酸残基。前原肽(SEQ ID NO:7)的C-末端部分与公开的107891一级结构以及它的预定的原肽序列相一致。
2B.107891原肽的翻译后修饰
由mlb ORF 7到9和mlb ORF 17编码的四种蛋白质(SEQ ID NO:8到10和SEQ ID NO:18)涉及107891前原肽的翻译后修饰。这些基因产物的同系物在许多羊毛硫抗生素聚簇中发现。根据与其他羊毛硫抗生素聚簇中发现的脱水酶和环化酶的序列相同性以及它们的作用,可以进行以下的预测。mlb ORF7多肽对107891原肽的位置3、5、13、18和21处的丝氨酸残基以及位置2和8处的苏氨酸残基的脱水负责,产生相应的脱水的残基。mlb ORF8多肽催化107891原肽中存在的半胱氨酸残基向四个脱氢丙氨酸和一个脱氢氨基丁酸残基的区域和立体特异共轭加成,产生相应的五个硫醚。特别地,mlb ORF 8多肽涉及3-7、13-20、18-23和21-24羊毛硫氨酸的形成和8-11甲基羊毛硫氨酸的形成。
在表皮素和mersacidin聚簇编码的脱羧酶观察到的序列相同性的基础上,mlb ORF9编码对21-24羊毛硫氨酸部分的脱羧作用负责的酶。在其他抗生素聚簇编码的黄素还原酶观察到的序列相同性的基础上,mlb ORF16编码黄素蛋白还原酶。考虑到在表皮素和mersacidin形成期间氧化脱羧作用预计的作用,mlb ORF9和16多肽催化107891中存在的S-[(Z)-2-氨基乙烯基]-D-半胱氨酸残基的形成(式I)。
2C.β-羟脯氨酸和色氨酸氯化的形成
由mlb ORF 2和15(SEQ ID NO:3和16)编码的两种蛋白质涉及一个或两个β羟基基团向位置14处的脯氨酸残基的添加和107891原肽的位置4处的色氨酸残基的氯化。mlb ORF2多肽显示了与P450单加氧酶的显著的相同性(表1),涉及脯氨酸残基的羟基化。在其他羊毛硫抗生素聚簇中没有发现mlb ORF2的同系物,因而这个基因代表了涉及羊毛硫抗生素分子的羟基化的P450单加氧酶的独特实例。此外,在与其他卤化酶的相同性水平的基础上,mlb ORF15多肽涉及色氨酸氯化,代表了羊毛硫抗生素分子的修饰中涉及的卤化酶的独特实例。
2D.输出和抗性
由ORF 1、10、11、13、14和17(SEQ ID NO:2、11、12、14、15和18)编码的五种蛋白质涉及将107891或它的前体输出到细胞质外部,以及涉及为生产菌株赋予抗性。它们预测的作用如下。
ORF1(SEQ ID NO:2)的同系物在其他羊毛硫抗生素聚簇中不存在。这个基因编码另外的ABC型转运蛋白(表1),因而涉及在生产菌株小双孢菌PTA中赋予对107891的抗性。ORF 10、13到14和17(SEQ ID NO:11、14到15和18)的同系物存在于其他羊毛硫抗生素聚簇中(表1)。它们分别编码ABC-型和离子依赖性跨膜转运蛋白。因而它们涉及107891或其前体的输出或区室化。mlb ORF17编码Na/K离子反向转运蛋白,对抗质子梯度输出107891或它的中间物负责。
2E.调节
由ORF3和5(SEQ ID NO:4和6)编码的两种蛋白质涉及调节一种或更多种mlb基因的表达。mlb ORF5多肽(SEQ ID NO:6)代表新的遗传元件,其同系物在其他羊毛硫抗生素聚簇中没有发现。这种蛋白质属于作为正转录调节物起作用的sigma因子的细胞质外功能家族。ORF3多肽(SEQID NO:4)属于LuxR型转录调节物的家族。ORF3(SEQ ID NO:4)因而可能是一种或更多种mlb基因的表达所需的。
2F.其他功能
在mlb聚簇中存在两个另外的ORF:ORF4(SEQ ID NO:5)和ORF12(SEQ ID NO:13)。两个ORF分别与Salinispora tropica和产二素链霉菌(Streptomyces ambofaciens)中存在的未知功能的蛋白质相关(表1)。然而,它们在107891生物合成中的确切作用还不能预测。
实施例3-通过基因置换的107891途径的操作
使用实施例2中提供的信息,如下构建ORF2中的符合读框的缺失。通过用寡聚物5′-AAGCTTGCATCTGCGTGGGCGTCCTGC-3′(SEQ ID NO:20)和5′-TCTAGACGGTCCGAAGATCATGGCCGCGG-3′(SEQ ID NO:21)扩增获得片段A;用寡聚物5′-TCTAGATCCATGTGAACCGGCGGGTGGCCG-3′(SEQ ID NO:22)和5′-GAATTCCGGTCGCTCTCCTCGTCCTTTGCC-3′(SEQ ID NO:23)扩增片段B。
然后,用EcoRI和XbaI消化片段A,用XbaI和HindIII消化片段B,都连接到早先用EcoRI和HindIII消化的pSET152。在转化大肠杆菌DH5α细胞之后,产生的质粒称为pDM1,通过在用EcoRI和HindIII消化后4kb和1.5kb的片段的存在来识别。pDM1的等份转移到大肠杆菌ET12567(pUB307)细胞中,产生菌株DM1。然后,来自LB中的过夜培养物的约108CFU的DM1细胞与在Rare3培养基中生长约80h的约107CFU的小双孢菌PTA 5024混合。产生的混合物涂布在HT平板上,其然后在28℃保温约20h。在用水柔和洗涤除去过量的大肠杆菌细胞后,平板用含有200μg萘啶酸和15μg/ml安普霉素的3mL软琼脂覆盖。在28℃进一步保温3-5周后,小双孢菌外接合体在含有安普霉素的新鲜培养基上划线。一株这样的的外接合体,称为菌株Mb-DM1,被进一步处理。菌株Mb-DM1然后在没有安普霉素的HT培养基中生长几个传代,合适的稀释物平铺在没有安普霉素的HT琼脂上。然后使用寡聚物5′-CGCGCTGCTCGGGGCCAAC-3′(SEQID NO:24)和5′-AGGAAACGGCCAGCCCGTGG-3′(SEQ ID NO:25)通过PCR分析单独的菌落。含有ORF2的缺失的等位基因的菌落通过1.5kb条带的存在来识别。一种这样的菌落,称为Mb-DM2,在HT培养基中生长,通过与可信的标准比较来确认脱羟基-107891的形成。
上述实施例用来说明原理和方法,通过所述原理和方法在SEQ ID NO:2到18所指定的当中选择的ORF可以被107891生产菌株小双孢菌PTA5024中突变的拷贝来置换。本领域技术人员想得到的是ORF2(SEQ ID NO:3)是在SEQ ID NO:1说明的聚簇中产生符合读框的缺失的方法的实例。
本领域技术人员还理解的是,符合读框的缺失仅仅是产生突变的一种方法,包括但不限于移码突变、插入和定点突变的其他方法也可以用于产生SEQ ID NO:2到18所指定的任何ORF中的无效突变体。
本领域技术人员还理解,建立了在SEQ ID NO:1指定的任何ORF中产生突变的方法,这些相同的方法可以用于改变这些同样的ORF的表达水平。如何实现这一点的实例包括但不限于所述ORF的多个拷贝整合到小双孢菌PTA 5024基因组的任何地方,改变控制所述ORF的表达的启动子,除去干扰它们的表达的反义RNA或转录终止子。
最后,用于将突变的等位基因导入小双孢菌PTA5024中的载体、所述供体和接受体菌株的接合和培养的条件、挑选和筛选外接合体和它们的衍生物的方法中的改变都属于本发明的范围内。
实施例4-羊毛硫抗生素的体外卤化
使用实施例2中提供的信息,mlb ORF15(SEQ ID NO:16)在大肠杆菌中如下过表达。通过用寡聚物5′-TTTTTCATATGGGTGGGAGTGATCGGCGGCG-3′(SEQ ID NO:26)和5′-TTTTTGTCGACCTACTGCTGGCCGCGGTCCGGACT-3′(SEQ ID NO:27)扩增获得的1.6kb片段用NcoI和SalI消化,连接到预先用NcoI和XhoI消化的pET22b。在转化大肠杆菌DH5α细胞之后,可通过用NdeI和XhoI消化后5.5kb和1.6kb片段的存在来识别的、产生的质粒pHAL被导入大肠杆菌BL21(DE3)细胞。带有pHAL的大肠杆菌BL21(DE3)细胞的培养物在LB中在20℃生长到0.6的OD600。然后,IPTG添加到1mM,细胞进一步生长6h。收获细胞,通过超声处理破裂,从Ni-琼脂糖柱回收His标签标记的ORF15多肽。进行底物例如乳链球菌素481或97518的卤化,通过MS分析确定羊毛硫抗生素的氯衍生物的形成。
以上实施例用来说明原理和方法,通过所述原理和方法在SEQ ID NO:2到18指定的那些中选择的任何ORF可以在方便的宿主中过表达,产生过量生产的酶并用于将羊毛硫抗生素天然产物转化成不同的化合物。本领域技术人员将想到的是,ORF15(SEQ ID NO:16)仅仅是用作过量生产SEQID NO:1编码的任何多肽的方法的实例。本领域技术人员还理解的是,过量生产蛋白质的其他方法包括但不限于利用不同的亲和标签、利用不同的载体、不同的宿主菌株和诱导方法也可以用于过量产生ORF 1到17(SEQ IDNO:2到18)指定的多肽。
本领域技术人员将想到的是,含有或没有色氨酸残基的其他羊毛硫抗生素底物可以用于通过ORF15(SEQ ID NO:16)添加氯原子。本领域技术人员还将想到的是,mlb聚簇(SEQ ID NO:1)指定的其他ORF多肽可以用于其他羊毛硫抗生素前原肽的翻译后修饰。可以用于这个目的的ORF多肽包括但不限于ORF2(SEQ ID NO:3)。特别地,ORF 7和8(SEQ IDNO:8和9)可用于在其他羊毛硫抗生素前原肽中脱水和引入硫醚键;ORF9和16(SEQ ID NO:10和17)可以用于使其他含有C-末端Cys残基的羊毛硫抗生素脱羧基;ORF 2(SEQ ID NO:3)可以用于羟化其他含有脯氨酸的羊毛硫抗生素。
实施例5-mlb聚簇在异源宿主中的表达
使用实施例1和2中提供的信息,含有所有mlb聚簇(SEQ ID NO:1)的粘粒1G6(附图1)通过如Kieser et al.,2000所描述的接合来导入白色链霉菌(Streptomyces albus)中。安普霉素抗性接合后体在合适的条件下生长,如所述纯化107891。
本领域技术人员还理解白色链霉菌仅是一种生产者菌株,其他菌株也可以用于导入全部mlb聚簇(SEQ ID NO:1)和用于107891的生产。优选的宿主细胞是可以有效地表达放线菌基因的那些物种或菌株。这样的宿主包括但不限于放线菌目,链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科,小双孢菌属、游动放线菌属、游动单胞菌属、链霉菌属等等。本领域技术人员理解只要适合的启动子置于mlb操纵子前,生产宿主不必限于可有效地表达放线菌基因的那些细胞。这后一类别的适合的生产宿主可以在易于遗传学操作的那些、或天然地生产其他羊毛硫抗生素的那些中找到。这样的生产宿主的实例包括但不限于大肠杆菌和相关物种,芽胞杆菌、链球菌、乳杆菌、葡萄球菌等等。
本领域技术人员还理解,使用在该实施例中描述的方法,mlb聚簇可以作为第二拷贝被导入原始的107891生产者菌株小双孢菌PTA 5024,其中mlb基因的第二拷贝将提高107891的产量。
本领域技术人员还理解不同的载体、导入mlb聚簇的不同方法、选择带有mlb聚簇的重组克隆的不同的方法、生长所述重组克隆的不同方法和条件、检测107891生产的不同方法对于mlb聚簇在异源宿主中的表达是有效的。
实施例6-107891变体文库的产生
使用实施例2、3和5中提供的信息,如下修饰mlb ORF 6(SEQ ID NO:7)来产生107891的变体。首先,利用片段A的寡聚物5′-GCAGCCAGGCTCGCACCGGC-3′和CGCCCGTAACGAGCGA(SEQ ID NO 28和29)和片段B的寡聚物5′-GCAGCTTCTGCTGCTGA-3′和5′-TCCCGGCCAGCCACTT-3′(SEQ ID NO 30和31)根据实施例3的方法扩增ORF6来构建在ORF 6(SEQ ID NO:7)中带有符合读框的缺失的载体。产生的构建体用于根据实施例3的方法置换如实施例5中所描述获得的白色链霉菌菌株中的ORF6,产生SA-D6菌株。然后,通过用寡聚物5′-CCGGAAAGGAGCGAGCATATG-3′(SEQ ID NO:32)和5′-CAGATCTGCCAATACAGT-3′(SEQ ID NO:33)扩增获得的mlb ORF6(SEQ ID NO:7)的前肽部分用NdeI和BglII消化并连接到用NdeI和BglII预先消化的pIJ8600(Kieser et al.,2000)产生质粒pPREl。在平行的实验中,寡聚物A 5′-C GGT GTC GAG GAG ATC ACCGCC GGG CCG GCG NNN NNN AGC NNN NNN NNN TGC ACC NNNNNN TGC NNN AGC NNN NNN NNN NNN AGC NNN TGC AGC NNNTGC TGC TGA AGA TCT-3′和寡聚物B 5′-T TCA GCA GCA NNN GCT GCANNN GCT NNN NNN NNN NNN GCT NNN GCA NNN NNN GGT GCANNN NNN NNN GCT NNN NNN CGC CGG CCC GGC GGT GAT CTC CTCGAC ACC GAT CGA-3′(SEQ ID 34和35)被变性和退火来产生DNA片段(SEQ ID NO:36)的混合物,其编码多肽,所述多肽具有在预计涉及硫醚形成的ORF6多肽的原肽区域(特别是氨基酸3、7、8、11、13、18、20、21、23和24)的氨基酸序列中所有可能的改变。这种DNA片段的混合物连接到预先用BSA OI和BglII消化的质粒pPREl,来产生质粒的文库,所述质粒的文库带有融合到编码前导肽的ORF6片段的、编码原肽的ORF6片段的所有可能的变体形式(预期(甲基)羊毛硫氨酸桥)。该质粒文库被导入SA-D6菌株中,在存在μg/ml硫链丝菌肽的情况下生长产生的接合外体通过生物学分析或HPLC分析来筛选107891变体的产生。通过测序ORF6变体的原肽部分和通过结构推测来进一步表征感兴趣的变体。
本领域技术人员理解ORF6多肽的前导肽部分也可以被修饰,只要在翻译后修饰中涉及的酶(SEQ ID NO:8和9)可以识别所述不同的前导肽。在ORF6多肽的前导肽部分中的改变属于本发明的范围。
本领域技术人员将想到的是其他方法可以用于构建ORF 6变体的文库,包括但不限于使用不同的寡聚物、载体、诱导系统和宿主菌株。此外,本领域技术人员理解甲基羊毛硫氨酸残基可以被羊毛硫氨酸残基置换,反之亦然,产生另外的ORF 6变体。本领域技术人员还理解的是定点诱变可以用于产生导致指定的107891衍生物的生产的ORF 6的选定的变体。
序列表
<110>森蒂内拉制药公司
 
<120>用于羊毛硫抗生素107891的生物合成的基因和蛋白质
 
<130>07636M35
 
<160>36
 
<170>PatentIn version 3.5
 
<210>1
<211>20000
<212>DNA
<213>Microbispora sp.PTA-5024
 
<400>1
actcgtcgtg ctggcgtgca cgctggtgct gctggccgtg gctcggatct ggacggagcg     60
ttaccggtga acaccagcat cagcatcacc gacctgacga agcgttaccg gcgcggcggc    120
gagaggccgg ccctgaacgg ggtgagcctg accgtggacg gcgggatgac cgcgctgctc    180
ggggccaacg gcgccggcaa gacgaccctc atgcgcatct gcgtgggcgt cctgcggccg    240
gacggaggcc gcgtggtggt gggcggccac gacctcggta cggcggccgg ccggagggcg    300
gtcaagcgcg tcctgggcta cctgccgcag gagctgtcca tgtacgacga cctgaccggg    360
cgggagttcc tcgactacat cgccctgctg aagggcgtcg acgacaagcg tgtccgccgc    420
gaccagatcg agcagatgct cgagctgacc ggcctgtccg agcatgcggg ccggagactg    480
ggcggttact ccggcgggat gaagcggcgg ctgggaatcg cccaggcgct actcgccgag    540
ccggagctga tcgtcgtgga cgagcccacg gccgggctgg acccctccga acggatgcgg    600
ttccgctcct tgctggccgg cctcggcggg gcgcggcgta ccgtggtgct gtccacccac    660
atcctcgacg acgccgcgca gacctgcccc aacaccatcg tgctgcacca ggggcgggtc    720
gcctaccagg gcagcaccgc cgggctcgcc gcggtcgccg agggccgcac ctacctgctg    780
ccgcccggag cgcaggcgcc gcccgaggcc gtggtcgtga acgcggcggc ggaggtggag    840
gggacgcgct atcgcgtgat cagcgcgcga ccgccgatcg gcggcaccct catgacgccg    900
acgctcgaag acggatacgc ggcactgtta cagctcggcg aaccctcccc cacgggtccg    960
cggccatgat cttcggaccg gacttccacc gggaccccta tccggtctac cggcggctga   1020
gggacgaggc gccgtgccac cacgagccgg ccctcgggct ctacgccctg tccaggtacg   1080
aggacgtgct ggccgcgctc aggcagccgg cggtgttctc ctcggccgcc cgcgctgtgg   1140
cgagttcggc ggcgggcgcg gggccgtacc gcggagcgga taccgcgtcg ccggagcggg   1200
agaccgccgc ggaggggccg gcgcggtcgc tgctcttcct ggacccgccg gagcaccagg   1260
tgctgcggca ggcggtgtcg cgggggttca cgccccaggc ggtgctacgg cttgagccgg   1320
ccgtacggga catcgccgcc gggctggccg accggatcgc cgaccgcggc ggcggcgagt   1380
tcgtcaccga gttcgccgcc ccgctggcga tcgctgtgat cctgcgcctg ctcggcgtcc   1440
ccgaagccga ccgggcacgc gtgagcgagt tgctgtccgc ctccgccccc tccggcgccg   1500
aggccgaact gcgctcctac tggctcggcc tgagcgccct gctgcgtggc cgcgaggacg   1560
cgggcaaggg cgacggcgag gaccggggcg tggtggcgga actcgtccgg cccgatgccg   1620
gcctgaggga cgccgacgcg tcggcgggcc cggcctgccg cgcacccctg accgacgagc   1680
aggtcgccgc cttctgcgcg ctcgtcggcc aggccggcac cgagtcggtg gcgatggcgt    1740
tgtcgaacgc tctggtgctg ttcggccgcc accacgacca gtggcgcacg ctgtgcgcga    1800
ggcccgacgc gatccccgcc gccttcgagg aggtcctgag atattgggcg ccgacccagc    1860
accagggccg taccctcacc gccgatgtgc gcctgcacgg ccggctgctc ccagccggag    1920
cacacgtgct gctgctgacc ggatcggcgg gcagggacga gcgcgcctac cccgacccgg    1980
acgtcttcga catcggcagg ttccaccccg accggcgacc gagcacagcg ctcgggttcg    2040
gtctcggcgc gcacttctgc ctgggggcgg cgctcgcgcg gctgcaggcc agggtcgccc    2100
ttcgagaact gacgcgtcgc ttcccccgtt accggacgga cgaggagcgg accgtgcgat    2160
cggaggtcat gaacgggttc ggccacagcc gggtcccgtt ctccatgtga accggcgggt    2220
ggccggacgc tacgtacagg gcatgacgaa cacgaccaga gcccgcctgt ccggcgccgg    2280
tctcctcgcc gcggccctgc tgctggccgg ttgcacgggc ggcggcagag ccgatccggc    2340
gcacaggtcc cccgtgccgt tgccgagtcc cacgagcaac aagcaggaca tcagcgaggc    2400
gaacctcgcc tatctgtggc cgctcacggt cgaccacggc acgatcgagt gcctgccctc    2460
cgacaacgcc gtcttcgtgg cgcccgacgg cacgacctac gctctcaacg accgcgctga    2520
gaaggcgggg caccccccga tcacaccgat tcgcgccaag ggcagcggtg gcggatacat    2580
cagcctcggc gccctgctca gcaccaccct caatctctgc ggaaagggct gagaccagat    2640
ccgggaccac aggagacggg ccgtccggtg aggcggcggt ccgaaaactt acccgagtgt    2700
gggacggaaa atccggctcc tgcgtgaacc ttcgtgcgcc atctcgctac gtacacctcc    2760
gaaagatcga aactgccgga ggtaacaggg acaggtgcac gggggagata cgcgatgccg    2820
atggtgcgcg agtgcggtgc ggcacaaccg gccggaacgg aggcgatgtg cgcggcacgg    2880
acagggcctg tgacgggggg acgaccagcg acaccgggag ggacatcggg cacaccgggg    2940
gtgcccgacc ggcaaaggac gaggagagcg accgaggggt ccgccgacgc ccggggccgc    3000
ggcgaggtcg tcgtcgcatg cgccagcctg cgcgacacga acgcgccgtt ggcggagtgg    3060
ctgggagacc tggacgtcgg ctgcacgttc tgcggcgacg tctattcggc cgcggagacg    3120
tatgacccgc ggctggcctt gctgcccgtc ctcaccgagg cccaggcgca gcgcctgggc    3180
aggctgatgg agcggtgccc gggcacgtcg gtgctcggca tcgtcatgga cgtgaccggc    3240
caccatactc atcgggccat ccagaacggg gcgagctggg tgctcaacac gctgctcccg    3300
gccgcgtgct gccgcaacct gctgcgcatg gtcattcagg cggtggtgct cgggcccacg    3360
gtccccgagc cgctggtcgc cgagccggcg gttccggagg gcgcggagcc gcccacgcgg    3420
ccgggcgacc cccgtgcgga accgccggcg gaggcgcgga aggtcgccga cgcgcaggag    3480
gaggaactgc tcacgctgct gtgcgggccg gagtccatcg ccgagatcgc cagacgcttc    3540
tactgttccg aacggtcgat gtaccgtcag ctacgcgatc tgtaccgaag ttacggagtc    3600
accggacgcc gggagctccg ccgggagatc gctcttcgga gcgtcacgcg ccaccaggag    3660
acgctgtcgg cccaccttct cgccccgcct cggcccgtcc gccggggcgg tttgtcgtgc    3720
tgagggctgg cacaccgccg ggctgtggca caccacgacg ccgggttgcg gctggcagct    3780
ttggcagagc cggcagcgcg ccccggacgc cgggcgcggc gtcccgcgta gcgggccccc    3840
cgaacccgcc ccccgctccc gtcagccgtc cgacccggac agccgcggcc ggcgggccag    3900
ccagacggcc gcggccagca gtgccagagc gcacgagagc atccaggggt gcgtgccgga    3960
caccacggcg ttcgttccgg tccgcgtacc catccgagca gccagaccac gactcccgcc    4020
atcgttccga aggcgggtga ccgccagatc gcgaagacgg cgcccgcgcc cgccgccagg    4080
agggcgcggc cgagccagcc ggcgacgacg gcgagcatcc ccgtagtcgc accggcggac    4140
acgaggacgc ccgaggcgac gaccgagagc gcgaggtcga ttcccaggac gagcgcgagt    4200
ctggtggcga acgccgtggc gggagagacc ggcatcgccg acagcagctc caggcgtgga    4260
tcggatcggt gtgagcacgc cgtgaccgag ccgagcagca gcaccaccgt caccaccgag    4320
ctgaacaact gcacgaccgc tcccggggtc ggcgccgtgc gcgcgagcaa caccgccgcg    4380
accaggccca gagcggtcag cgggccgagc gaccgcggta tcagccgtgc ctgcgcccgc    4440
acgagaccgg tggtcagccg ccacgacgcg cgaagcgtgg ggccggtcac gggcgccttc    4500
cggtgtccgg cgatgtccgg caggcggccg aggagctcgt cgtacgccgg gaccgtgagc    4560
ggcccgatca gttcctcgtc ggcttcgcgg accgcggccg tcagggcgtc ctgatcctcg    4620
tcatctatca ccagtccgcc cccctttcgg atttgtcgtt tttgtcagtg cctccgtcag    4680
caaccggcgg gccatgtgca tccggctctt gaccgtgccg gttggaattc caagtattac    4740
ggccacctgt ggatagggga gatcctcggc gagcacgagc acgagcacct cgcgcaggtg    4800
ctcgggcagc tccgccaccg cggccaccag gtcccgccgc tcggcgcggg cgagcacctg    4860
ctcgtcgacc gccggctcca gatcgggcac gtccgcggcc ttctccagat ccacgaggac    4920
cggttcggcc cgccgtagcc ggttgtgcgc ctgacgccgt gccaccccca gcagccaggc    4980
tcgcaccggc gcctcgcccc ggaaactgcc ggccgagcgc cacaccgcca gccaggactc    5040
ctgaaggatc tcctccgcca cctcgcgctg ggaggtgagc cggcggatga gccgcagcat    5100
cccggcggcg tggcgttcgt acagcatacg gagcgccacc tcctcgccgt cggccacgcg    5160
tctcatgagg acggcatcct cggacacctc cgcggagagc tccggttcac gcaactgctg    5220
cacacgttcg tatgtagcgt cggctgccgt accggttcgg ggggatctgc ggcgtagcgg    5280
cacgagtgcg ctccgtcctc gtttctgtca ttcctgccat tcattgagcc gttattgaca    5340
ctagtagtcc gaaatgttcg actcaatgcg attccggaat cttgtccgaa cgaacaccgg    5400
aaaggagcga gcaatgcccg ctgacatcct ggagacccgg acttccgaga ccgaggacct    5460
gctcgacctc gacctctcga tcggtgtcga ggagatcacc gccgggccgg cggtgacgag    5520
ctggtcgctg tgcacccccg ggtgcaccag ccccggcggc ggcagcaact gcagcttctg    5580
ctgctgacat aaccgcagac gacaggggct gtagccagcc cgggccggag cgcgtcccgc    5640
cccggtccgg gccaccggcc ggaacacgag ccggcgcggg cagggcagaa aggaccaggt    5700
ggaaaatgac agattcgcca tttcgtgcgt gggatgtctt tatggtccgg gcaccggttg    5760
gttatgcata tcctactcca ctgccgaact ccgaattcga ttctccggca tcctcacctg    5820
gccttgacga agcggagttc ccgcctgacg cgcccgttct gtccgatgtc tccggacaca    5880
gagccggctc gtccgaggcg tccgcacgca cgtccgggcc gccgccggcc gacgatcatc    5940
tctcgctgct gcgggcggcg tgcgaagacg ggccgctgat ggaggccgtg gagctggcct    6000
cacccagcct ggccggtctg ctcgccaggg tcgcgcgcgg cgacacgggc gggctcaagg    6060
acaagcggct gcgccgggcc gccctcgcgc tcctgcgcta cgacatccgg atgcgaaccc    6120
ggccgactcc gttcggcctg ttcgccggcg tcagcggcgg ccggttcgac acgtccgcga    6180
agtggctggc cgggacgggt catcgcacca ggacgcgcgc cgacatggag tggctgctgt    6240
cggcggtgca ccggctcgaa cgggatcgtg tgctgctcgc cggcgtcacg gtgcaggcgc    6300
accagaccct gaccgtgcgc ggcgaccgga tcgtccttga ctgtccttcc gctctcggca    6360
aacccctcaa cggatccacc cgttcgaccg tctccgcgcg gcgctcgccg gtggtcgccg    6420
agatccttgg cgccgcccgg cgccccgtcc tcgcgggaag gctcgcgcag agcgtggcgc    6480
agcggttcga gctgccggtc gaccgggtga cgggcctcct cgcggacatg gccgcccagg    6540
aactgttgat caccgcgctg cggccgccct tggacggggg tgacccgctc cagcacgtgc    6600
tcgacgtcgt ggcgacggcg gaggcgaggg cgggttcgcc cgccgaggcg atgagctccg    6660
attcggccgc cctggtggcg gcgctgcgcg aggtggacgc gcgctgccac gcctacgatc    6720
ggaccgccgt cgggcagggg cgccgggagc tggccgagct gatccaggcc acgcggcggg    6780
tccacccgca cgacactccg ctgcacgtcg accttcggat cgacctggag gtgcgactcc    6840
ccgagatcgt gcgcacggag atcgagcggg cggccgaggc gctgtggcgg ttgtccccgc    6900
cgcggcgtgg catgcgggcc ctgcgccgtt accacgaggc gttcctggag aggtacggcg    6960
cggaccgtgc ggtgccgctg ctcgaactcc tcgacgacac gcgcggactc ggcccgcccg    7020
ccggctacaa gtggccgccg agcgagacac cggcgggccc gcaagaggag cctcgccgca    7080
gtgcggcgct cgcccggctg gtcgccacgg cggcccggca cggggagcgt gagatcgtca    7140
tcgacgagga gacgatcgcc gaactcgtct acgacgaggc ggctccggcc gatctgccga    7200
actccttgga gctgggggtg cacgtggtgg ccccgtcgct ggacgagctg tccgccggaa    7260
ccttccgagt cgtcctggcg cccgggccgg gctcgcacca cgcgggcgcg acgctcggca    7320
ggttcaccgg tctgctgccc gatgtggacg ccgagtcggc ggccaggcag gccggccggc    7380
ccctgcacat ccaggacgcg gtcgccgccg atgtcgcctt cattccgcgg tccggccggg    7440
cggccaacct cgcgcacacc ccctcgtact ccggccggcg catcagcgtg gggctcccgg    7500
acagcggacg cgcgcaggaa ctccccctcg acgagctggg ggtcgcggcc aacctggaac    7560
gtctctgcct cgtccacctg ccgacaggcc gtgaggtggt ccccgcactg ccgaacatgg    7620
tcagcgcctt cgcgcaggcc ccgaaccccg ctcgcctgtt gttcgagctg ggcctggagg    7680
ggcagcggct ctgggaaccg tgggactggg gggcgctgag cgagatgcca ttcctgcctg    7740
gtgtgcgtta cggccgtacg cttctggccg ctccgatctg gcggatggat cagctccgcg    7800
ggccggccgc cgactccggt ccggcggcgg actgggacgc ggcgctcgac cggtggcggg    7860
cggagtggaa cgtcccccgg cgggtgctcg ccgtcagcat ggaccagcgc ctgctcctcg    7920
acctcggcga cgcctggcac cgcgtactgc tccgcgacga actgcgcagg acacccgagc    7980
tgatcgcgca gcaggtggcc ggcgacgagg agggctggct ggaccgcggt gacgggggct    8040
ttcccgggca cctcgccgag atcgtggttc cgctggaacg ccgtgaccgc cacgccgccc    8100
ggcctccgca catcagggcc accgtcggcg gccgcgagcc gaccggagcg gggggaccgt    8160
ggctctacct caggctgcgg gtcccgcgcc ggaaccagga cgacttcctg cgcgaccagg    8220
tgcccgtcct ggtacgggcg gggatcgggc acggcgccga ccgctggttc ttcatccgct    8280
acagcgacac cgccggacag cacctgcggg tcaggttccg cggcgagcgg gagaaactgt    8340
gggccgggct gctccccgag atcggcgcgc ggctcgtcga gtggcagcgg caggggctgc    8400
tggcgggcca cgagctcggc cagtacgacc ccgagtacga gcgatacggc ggcgacgcgc    8460
tggccgagtt caccgaggcc gccttccagc acgacagcgc cgcggccatc tcgctcctgc    8520
gcctcaccag gcgcgccggg ttccgctaca cgctcgacga ggtgacggcg atctcggccg    8580
cggcgctggc gcacgccttc ggtcctcccg ccccggtcgt cgagccggtg ccgctggtgg     8640
gcggcctcca gtgggctccg gatctgttcg acggcgaccc ggccgccgcg tggatgagca     8700
ccaccggagc ccgcagggaa ctaccgcccg actaccggcg tgagccggcc cggtggcaga     8760
agctgatcga ccccaccgga ggctggcggg tgctgcgggc ggatgaggac ggctgtcagg     8820
tgctggcagc cctggaatcc agggatgagg ccgtccggcg gttcgggact gccttccgcg     8880
aggcgtccag acccacggac tccccgtcga cgcagctcag actggtcggc agcctgcttc     8940
acatgacctg caaccggctg atcggcggat ccgcggaacg agagcgaagc gtgctcgggc     9000
tcgcccgggg cgccgtccag gacaacctga accgcaggag gcaccgggca tgaccacagt     9060
cggtccgaca tcgtgcgggg tgacccctga ccggcacccg gcccggttcc tgcgcggcag     9120
cgcggcccgc cgggccgcgc gcctggtgcg gctggtcgcc gaacggctcg ccgacccgga     9180
cgaggtcgcc gggatcgcgg cccgccccgg caactccgtg ccggcgaacg ggctgtcgat     9240
gtggagcccg gccacgctgt cgcacggatt tccgggcatc gcggtcttct acgcggagct     9300
ggggcgggtc gaccccgcct ggtcggcgtt ggcacatcgc cacctcaggg cgggggccgc     9360
ggctgtggag acggcgcctt cgggcggact gttcgccggt ccggcctctc tcctggccgc     9420
cgcgcagagc tgcgcaggcc cggcggggca ctaccggggc ctgcgacgca cgctgaccgc     9480
atggctcgcc gctgatcacg ccggacggct cgccgccgcg cgtgaccggc ccggccccgg     9540
tgtcgcctgg accgactacg acgtcgttca cggactgtcc gggtccaccc gtctgctgct     9600
ggacgccgcg cgcgatcccg acgacgagac ggcggcaaag gcctccggcg cggtgaccga     9660
caccctgcgg cacctggtgc ggctcaccga gccgatcaca gtggacggac acgaggttcc     9720
cggctggtgg gtgccgtccc atctgcagcc ggtcgaacag gaccggcgcg actacccccg     9780
gggagacctg aacctgggat tggcccatgg agcggcgggg ccgctgtcgg tgctggccac     9840
ggccaccctt cacggggtgg aggtcccggg ccagcgtgag gccgtcgcgc ggctggccga     9900
atggctgctg ggctggacga tgaccgacga cacgggcgcc tactggccct gccgggtcag     9960
ctgggacgag cagatcgccg ccgtccgccc ggacacctcc ttcacccgta cggcctggtg    10020
ctacggggcc cccggagtct gcgcggcact ccaccgggcc ggactggcgc tcggcgtgac    10080
ggagtggcgc gaagtcgcgg tcaccgcgct gctggacggg ctgcgccgcg accggtccgc    10140
ctggcgggtg gacggctcga ccgtctgtca cgggtacgcg ggcctgctgc aggtgctgtc    10200
gcgggtcggc gccgagtccg gcgacccgcg gctgctggac ggctgcctgg acgtcgcgcg    10260
catggtcctc ggcgaggccg acgaatcggc tccgttcgtc ttcccccatc tcgtccccga    10320
ttcgcccgac gggtggcgca acgccacggg atacctgccg ctggacggcg ccggcttgct    10380
ggaaggggcg gccggagtcg cctgtgcgct gctctcggtc atcccgccgt cgtcgctcgg    10440
tggaacggac ccggccccgg agcgtgcgga cctcccgccc tgggacaggt gcctggccct    10500
gtgctgacgc ccccgaccca tcaggagagc cagaccatga cagcgcacag cgacgcgggc    10560
ggcgttccgc ggcccccgga gcggctgctg ctcggcgtga gcggctcggt cgccgcgctg    10620
aacctgcccg cctacgtcta cgcgttccgg gccgcgggcg tcgcccggct ggccgtcgtc    10680
ctgaccccgg cggccgaggg tttcctgccc gcgggcgcgc tgcgcccgat cgtcgacgcc    10740
gtccacacgg agcacgacca gggaaagggg cacgtggcgc tgtcccgatg ggcgcagcac    10800
ctgctcgtcc tgcccgcgac ggcgaacctg ctcggttgcg cggcgtcggg gctggcgccg    10860
aacttcctgg cgacagtgct gctggcggcc gactgcccga tcacgttcgt gcccgcgatg    10920
aacccggtga tgtggcgcaa gcccgccgta cggcggaacg tcgccaccct ccgcgcggac    10980
ggtcaccgtg tggtggaccc gctgcctggc gcggtgtacg aggcggcctc gcggtcgatc    11040
gtcgacggac tgaccatgcc tcggccggag gcgctggtcc ggttgctggg cggcggggac    11100
gacggcagcc cgtccggtca ggacggtccg gtcggcaggg cggagcacgc ggagcacgcg    11160
gaggccgcgg aggccttggc atgacggtcc cggcgttcga gctcagcgac ctgacggtcc    11220
gctacggccc ggtcacggcg gtcgacggcg tctcggccgg ttcggcgccc ggcctcgtca    11280
ccgccctgct cggacccaac ggtgcgggca agtccagcct gctccgggtg ctgtcgacgg    11340
tcgcgccgcc ctcatcgggc acggcgaggg tgttcggcca cgacacgcgc gcggagccgc    11400
tggccgcacg taggcggatc gggctggtct tccaggaacg cgcgctcgac accgacctgt    11460
ccgcggagca gaacctgcgc tttcacgcgc ggctgttcgg ggtggggcgg gcccgggccg    11520
cggaggacat cctcgtgctg ctggaacgct tcgggctggc cggccgcggc cgcgaccggg    11580
tcgagaccct ctccggcggg ctggcccgcc ggctggagat cgcgcgggcg ctgttgcacc    11640
ggcccggcct gctgatcctg gacgagccga ccaacggcct cgacccggag gcgcgccaga    11700
ccgtatggga cgacctcatc cggctgcgct ccgaactcgg cgtcacggtg ctgtactcca    11760
cgcactacat ggacgaggcc gagctggccg accagatcat catcctcagc gagggccgcg    11820
tcgcggggtt cggctcgccc ggccggctga agagcgagct gcgatcgtcg cgcatcgtgc    11880
tcgtcaccca cgacgacgac acggtgctcg cccggctcgc ggaggccggc ttcgacgctg    11940
tgatcgactc ggacggcgtc gccgtgcgct gccgcgaacc ggagagccgg atggcggagg    12000
tcatacgggc ggcggggccg ctcgtccgcg cggcgtccgt gcaccacccc tcgatgaacg    12060
acgtgttcct ggcccacacg gccgcgaacc gcgacaggga ggcggccgat ggcactgtca    12120
gctgtccgtg acaccggtgg cacggcgggg agtactcccg gcggccccgc cggaggcggg    12180
tcggccggcg cgggcgaggc gaggaggctc gtctctgcgg ccctgcggtc cggggtccgc    12240
ggaacgctcg tcgtggcgca ccgcgacgtg ctgcggcagg tgcggcaccc gggggtcgtg    12300
gtcgcccagg ccgcgcagat cgtctttttc gtcctcgtct acgccgtggg cttccggtcg    12360
atgatcggat ccgtcggcgg cgtgtcgttc ggcgcctacg tctatccggg gatcatcgcc    12420
atccaggtcg tcatgctggg cgtcggcacg ggcctgacgt acgcgatgga ccgcgagttc    12480
ggcgtgctgc gcgagatgca ggtcgcgccc gtgccacgca tgtgcctgcc cctcggaaag    12540
atccttgcga gctgcgtgct gctcaccgcg caggccatgc tcatgctcct gcccgccccg    12600
ctgctcgggc tgcccctgac gcccgcgcga tacgcggcgg gcgccgcggt ctacctggcc    12660
acggcggcgg ccttcagctt gatcggcctg ctgctcgcgg tgagcgtccg ccggatcgag    12720
acgctgcagg cgaccgtcca gctcgcgatg tacccgctgc tgttcctgtc gggttcggtg    12780
ttcaaacccg acgccgtgcc cggctggctg gcggccctca tgcggctcaa cccgatgacg    12840
tacgcggtcg atctggcgcg gcacgtgctg ctgccgtcgg ccccgggcgt gtcgtacctg    12900
cccgtctggc gggacctcct ggtgatcgcc gcgctggtgg cggccgcgtc ggcggcgctg    12960
cggctgcggg tggggaggtg accggccggt gaccaccgcg acgacgacag ggccgaccgg    13020
ccgcgagacg ctgcttgaag gcgcggtgtc ctggctcgcg gcacgactgc gctggttcga    13080
ccccgagcag tgggcgaggc atctgcagcc gagaggcttc gcgccgagcg cgctgctgga    13140
actccttatc atctgccgca acctgaactc ggtctacggc cctccgcgcc cgccggaccc    13200
ggaggacggc tcccgcgggt ccggcgtacg ggcgacgggt gcggccggcc cggccgtcga    13260
actgagcggg cgtgcgctgg acctggccga ggaggtcgtg ggacggcccg atttcggcgc    13320
ggccctctac cgcggcgacg ccgccttccc caccacgtgt ggctggtcgc gcttctcgcg    13380
gagggcggcc ggtccgtcga gccgtggcct gccgtcgccc agcggatcat cgacgcgggc    13440
tgcgccgagc cgatccggcc gggacggccg acggcggccc ggctggaggc ccgctacgtc    13500
ttcgacctcg ccggcctccg ccacgggctg cccgccatgg gcgaactggc cggtcgtacg    13560
gctctgggcc ccggtgcgga cccgctgcac ctcaccgacg cggacctcta tgtgatcacg    13620
cacatgctct tctacctcac cgacttcggg cggcgcccgt tctccgcgga cgaggccgaa    13680
agccggcggg tccgcgggct cgtcgaggtg ctcctcggcc gccagctcgc ggtcggcgac    13740
ctcgatctgg cggccgagct gctcgcctgc gcgggcctca ccggcgccga cgaccggctg    13800
tccggctgcg cgtggaaccg gttgtcggcc gcgcgccgtc cggacggctc ggtgcccagc    13860
ccgctgttcc ggcaagccgc gctggaccgg ctgagcgggg agaaggccga ggcgtacgcg    13920
ttcggaacct gctaccacac caccctcgcc atggtgctcg cggcgacgct gacggacggc    13980
gccgatggct gacccgttgc tgaccggggc cctcgcacgc gtcgtgccgg cgctggagaa    14040
gctggacggc gagcgcgccg cggcggtgct cctgctgtgc cgggcggctc tcgacggccc    14100
atcgcggccc aggccgggcg gccgccggcc tgaagcgccg ccggttcccg gatcggtgga    14160
cccggctttc cgacctgctc cacgacgctc ccggaaccgc gcagggcctc gccgggcaga    14220
tcgccgagac gaccgctttc ggggccgtcc ggcccgccgc cgccgtccgg gaggtctggg    14280
agctcgccgt gcccgcgctg ctggccgccg ccgcgcgcag ggccgacctg atgaccctgg    14340
ctccgctcgt ccgggccggc gtcttcctcc aggcggtctc gtccgccggc gacgtgcccg    14400
agcgggacga ccggcccgct cctgcgggcc tgaccacgcg cgccgcgtgg cgcctggcgg    14460
cgtggcagcg tccggacggc gggttcgggg cgccggccgc gaccgccgac tgtggctggg    14520
cgctcgcgga ggccgcggtt cccgggctga ccgcctcgca gcgcgagttc gccgtgcccc    14580
tcccggacgg gaagcctccg gcacggccgc gaaccgccca ctccccaccc gctacgtacg    14640
gcgggaagga gtgatgcaga tgaacgacca tgacgcggcc ggcgtcccgt ccggcagccc    14700
ggcccaccac cgaccggcgg accccgccgc caccctggcc gcggagacca cagggggccc    14760
aggcgggacc gccggcccga ccgactcccc gtcgatggcg gccctgatat ccacggagtt    14820
gctcagactg cgttccggct tcgtcggctg gtacatcctg ctgtcgccga tcgtgatcgc    14880
cattccgctc tacctggggt cgatcttctc cccggagggc cggtccggcc gcctctggga    14940
gaccttcagc aacgtgacgc tggagttctg gggcgtactg attccgatga cggccggtct    15000
gatcgcggcc ctcgcggtcc gtgccgacac cgaaccctgg cgtttcctgt tctcgtacgc    15060
gatcccacgc tggcgctact tcaccgcgaa ggtcgccgcg ctggccgtcg cccagttgct    15120
gtcggcgacc atcctggtcg tgatgctggc cgggggagcg ctgctgaccg ggcagctctc    15180
caacgccgcc tcgatgatcc tcaaagtcgc ctacctgccg tgggcggcgg ggttggcggc    15240
gaccgcgctc gccgtcctcg tctgcaccgt ctggggactg ggccccggca tcgcccttgg    15300
tgtggccggg atgatggcag gcgcgctcat ctccgacaag tcgttctggt acgccatccc    15360
gcccgcctgg ccgatgcggg tcatcctccc gctggcggac atccgcccca acggcctggc    15420
gctcgacgcg agcagcccgc tccacgacac ctcggtcatc ccgctggccg tcgcgctctc    15480
ggccgcggcg acgatcgtga tcctgctgat cggcggccgg cacatggcgc ggaaggaggt    15540
ctgacatggc cgctctcgag atcagggacc tgcacaagca ctacgacgac ttccacgcgc    15600
tcgacggcgc gaacctgacc gtgccggacg gctccctcta cggcctgctc ggcccgaacg    15660
gcgcgggcaa gaccaccctg atgaaggcgg tcaccgggct gcggcatccg acctcgggcc    15720
acatcagcct tttcgggcgg ccctacgaac ggcggctgct gacccaggtc ggcgcgctgc    15780
tcgagtcgcc gggcctgtgg acccagctcg acgcggtgtc ccacctgcgc atccacgccc    15840
ggctgcgcgg cgtgcccgag acacggatcg gcgaggtgct gagcctgatg aacctcaccg    15900
aggtcagcac ccgcaaggtg gcgaagtact ccctcggcat gcggtggcgt ctcggcatcg    15960
ccatcgccct gctcggccgg ccccggctgg tcgtgctcga cgagccgatg aacggactcg    16020
acccggtcgg catcagggac atgcgggcga cgctgcgcgc gctgaccgcc gccgggacca    16080
ccgtcatggt ctccagtcac cagctggcgg agatcgcgca catctgcgat cacgtcggcg    16140
tgctggtggc cgggcggacc gcgtacgagg gcccgctgcc cggcctcgcc gtggacggcg    16200
acctcgaaca gggcttcttc cgcctgctcg agaaggcggg ttccgcagtg agatgacctg    16260
acccacgaac ggaagggcga tcgggaacat ggcgaggtcc gaagagagca acaccctggc    16320
caggctgttc gacgtgctcg gcgacgacgc cgcggcggcg agggaatggg tgaccgagcc    16380
gcaccggctc atcgcctcga acgagaggct cggcaccgcc ccggaagcgc cggccgacga    16440
cgaccccggg gcgatccgca cggtgggagt gatcggcggc ggcaccgccg gttacctcac    16500
cgcgctggca ctcaaggcca agcgcccctg gttggatgtg gctctcgtcg agtccgccga    16560
catccccatc atcggcgtcg gcgaggcgac ggtctcgtac atggtgatgt tcctgcatca    16620
ctacctcggc atcgacccgg cggagttcta ccagcacgta cgccccacgt ggaagctcgg    16680
catcaggttc gagtggggca gccggccgga gggattcgtc gcgccgttcg actgggggac    16740
cggctctgtg ggactggtcg gctcgctgcg cgagacgggg aacgtcaacg aggccaccct    16800
gcaggccatg ctgatgaccg aggaccgcgt ccccgtctac cggggggagg gcgggcacgt    16860
ctccttgatg aagtacctgc ccttcgccta ccacatggac aacgcgcgcc tcgtccgcta    16920
tctcaccgag ctggcggctc ggcgcggcgt gcgccatgtg gacgcgacgg tcgccgaggt    16980
acggctcgac ggcccggacc acgtcggcgg cctgatcacc accgacggcc ggcggctgca    17040
ctacgacttc tacgtcgact gcacgggctt ccgctccctg ctgctggaga aggcgctggg    17100
catcccgttc gagagctacg cgagcagcct gttcaccgac gccgccgtca ccggcactct    17160
cgcgcacggc ggccacctca agccgtacac gacggcgacc acgatgaacg cggggtggtg    17220
ctggacgatc ccgacgcccg agagcgacca tctcggctac gtgttctcgt cggcggcgat    17280
cgatcccgac gacgcggcgg cggagatggc gcgccgattc ccgggggtca ccagggaggc    17340
gctcgtccgg ttccggtccg gacggcaccg ggaggcctgg cgcggcaacg tcatggcggt    17400
cggcaactcc tacgcgttcg tggagccgct ggagtccagc ggtctgctga tgatcgccac    17460
ggcggtgcag atcctggtga gtctgcttcc ctcctcccgc cgggacccgc tgcccagcga    17520
cgccgccaac caggccctgg cacaccgctg ggacgcgatc cgctggttcc tctcgatcca    17580
ctaccggttc aacggacggt tggacacccc gttctggaag gaggccaggg ccgagaccga    17640
catctccggg atcgagccgc tcctgcggct gttcgcggcc ggagcgccgc tgaccggccg    17700
cgactccttc acccgatacc tcgcggacgg ggcggcgccg ctgttctacg gtcttgaggg    17760
cgtcgacacg ctgctgctcg ggcaggaggt gccggcccgg ctgctgccac cccgcgagcc    17820
cccggagcag tggagggcac gggcggcggc ggccagaagc ctggcctcgc gggggctgcg    17880
gcagagcgag gcgctggacg cctacgccgc cgacccgtgc ctcaacgccg aactgctcag    17940
cgactccgac agctgggcgg gcgagcgggt cgccgtccgg gccggcctga gatgacgacc    18000
ggcgccacgg tcgcccatgt cgtcgaaccg gacgggttcc gggcggtcat ggccaccctt    18060
ccggcagccg tggcgatcgt caccgccgcg gccgcggacg ggaggccctg ggggatgacc    18120
tgcagttcgg tctgcagtgt gaccctgacg ccgccgaccc tgctggtctg cctgcggacg    18180
gcgagcccca ctctcgcggc cgtcgtctcc ggccgggcgt tctcggtgaa cctgctgtgc    18240
gcccggtcgt accccgtcgc ggagctgttc gcctcggcgg cggccgaccg cttcgaccgg    18300
gtccgctggc ggcggcccac cggtacgggc ggcccccacc tggccgacga cgcccgtgcc    18360
gtcctcgact gccggctctc ggagtccgcc gaggtgggag accacatggt ggtcttcggc    18420
gaagtgaggg cgatccgcag gctgtccgac gagccgccgc tgatgtacgg ctaccgccgc    18480
tacgccccct ggcccgccga ccggggaccg ggagcggtgg gggggtgaac gccgagcagc    18540
tcaccggtgt ggtcatcgcc gatctcgggg tgatcgtcgt cgtgtcggcg ctcttcgggg    18600
cactggcacg gcgatgcggc cacccgaccg tcatcggcca gatcgtcgcc gggatcgcgc    18660
tgggaccgac cctgctgggc cggctgcccg gcgacccggc cgggtggctg ttccccgccc    18720
aggtccggcc gtcgctgtcg gtcctgtccc agatcgccgt cgtgatcttc atgttcgcgg    18780
tgggttacga ggtcgacctg cggcttctgc gccggggtgg ccgcagcgcg ctctgcgtgg    18840
cgtcgctgtc gctggcggtg cccatgacgc tcggcgcggc ggtcgccgtg ctgttccgcg    18900
aggttttcac ggtcggctcc cctggggggc cgggaggccc gacgttcgtg ctgttcatgg    18960
ccgtggcgat ctcgatcacc gccctgccgg tgctggcggc gatcgtacgg gagcggggcc    19020
tcgcgggaac cgcggcggga accgtggcca cggcggccgc cgggctgatg gacgtggccg    19080
catggaccac actggccgcg gttctggccg agaccggcga tgccgatgag ccgacggtgt    19140
cacacgtgcc ctggatgctg gctcttccgg ccctcacggc gttcgcggtg gccatgttcc    19200
tggtcgtgcg tccccttctc gggtggttga ccaggaggcc cggagccatg tgggggcggc    19260
tgccggcggc gttcgcactg gcgctcggca gcgcctgggg caccgccgca cttggcctgc    19320
acccggtgtt cggcggtctg ctggccgggc tcgtcatgcc gcgccgcgac ggcgcccccg    19380
agccggaggt gctgcggccg atggagcaga ccgccgagtt gctcctgccg ctgttcttcg    19440
tgatgaccgg gctgtcggcc gacatatcgg cgatcgaacc gggtgggctg atcctgctgg    19500
cggtgctcct ggtcgccgcc atcgggggca agctcgtgcc cgcctacgcg gcctcccggc    19560
tgaccggtct cgactccggt gagtcggccg tggtcgccgt gctggtgaac acccggggcc    19620
tcaccgagct gatcgtgctc gatgtggggc tgtcggcgca cgtcatcgat gagcggctgt    19680
tcaccgtcct ggtcgtcatg gccctgatca ccacggccat gaccgcgcca ctgctgaccg    19740
cgctgagacg gcgcgaagag cggagacgcg gtcgtcaggc ggccccgctg tcgagggcga    19800
cggcctggcg gatgtagtcg cgcagggcgt cccggtcgag ggcgcccagg ttcttgatct    19860
tgacgtgcct cgtcgtcttg cccacgccct ccagcaggcc gtgcccgtcg tcgaactccg    19920
ccccccgggc gaaggcgaag gtgacgtgcg ttttgctgtg gctgatgatg gcgaggatct    19980
tgtcgccctt ccaggcgggc                                                20000
 
<210>2
<211>300
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>2
 
Val Asn Thr Ser Ile Ser Ile Thr Asp Leu Thr Lys Arg Tyr Arg Arg
1                5                  10                  15
Gly Gly Glu Arg Pro Ala Leu Asn Gly Val Ser Leu Thr Val Asp Gly
            20                  25                  30
Gly Met Thr Ala Leu Leu Gly Ala Asn Gly Ala Gly Lys Thr Thr Leu
        35                  40                  45
Met Arg Ile Cys Val Gly Val Leu Arg Pro Asp Gly Gly Arg Val Val
    50                  55                  60
Val Gly Gly His Asp Leu Gly Thr Ala Ala Gly Arg Arg Ala Val Lys
65                  70                  75                  80
Arg Val Leu Gly Tyr Leu Pro Gln Glu Leu Ser Met Tyr Asp Asp Leu
                85                  90                  95
Thr Gly Arg Glu Phe Leu Asp Tyr Ile Ala Leu Leu Lys Gly Val Asp
            100                 105                 110
Asp Lys Arg Val Arg Arg Asp Gln Ile Glu Gln Met Leu Glu Leu Thr
         115                 120                 125
Gly Leu Ser Glu His Ala Gly Arg Arg Leu Gly Gly Tyr Ser Gly Gly
    130                 135                 140
Met Lys Arg Arg Leu Gly Ile Ala Gln Ala Leu Leu Ala Glu Pro Glu
145                 150                 155                 160
Leu Ile Val Val Asp Glu Pro Thr Ala Gly Leu Asp Pro Ser Glu Arg
                165                  170                 175
Met Arg Phe Arg Ser Leu Leu Ala Gly Leu Gly Gly Ala Arg Arg Thr
            180                 185                 190
Val Val Leu Ser Thr His Ile Leu Asp Asp Ala Ala Gln Thr Cys Pro
        195                 200                 205
Asn Thr Ile Val Leu His Gln Gly Arg Val Ala Tyr Gln Gly Ser Thr
    210                 215                 220
Ala Gly Leu Ala Ala Val Ala Glu Gly Arg Thr Tyr Leu Leu Pro Pro
225                 230                 235                 240
Gly Ala Gln Ala Pro Pro Glu Ala Val Val Val Asn Ala Ala Ala Glu
                245                 250                 255
Val Glu Gly Thr Arg Tyr Arg Val Ile Ser Ala Arg Pro Pro Ile Gly
            260                 265                 270
Gly Thr Leu Met Thr Pro Thr Leu Glu Asp Gly Tyr Ala Ala Leu Leu
        275                 280                 285
Gln Leu Gly Glu Pro Ser Pro Thr Gly Pro Arg Pro
    290                 295                 300
 
<210>3
<211>414
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>3
 
Met Ile Phe Gly Pro Asp Phe His Arg Asp Pro Tyr Pro Val Tyr Arg
1               5                   10                  15
Arg Leu Arg Asp Glu Ala Pro Cys His His Glu Pro Ala Leu Gly Leu
            20                  25                  30
Tyr Ala Leu Ser Arg Tyr Glu Asp Val Leu Ala Ala Leu Arg Gln Pro
        35                  40                  45
Ala Val Phe Ser Ser Ala Ala Arg Ala Val Ala Ser Ser Ala Ala Gly
    50                  55                  60
Ala Gly Pro Tyr Arg Gly Ala Asp Thr Ala Ser Pro Glu Arg Glu Thr
65                  70                  75                  80
Ala Ala Glu Gly Pro Ala Arg Ser Leu Leu Phe Leu Asp Pro Pro Glu
                85                  90                  95
His Gln Val Leu Arg Gln Ala Val Ser Arg Gly Phe Thr Pro Gln Ala
            100                 105                 110
Val Leu Arg Leu Glu Pro Ala Val Arg Asp Ile Ala Ala Gly Leu Ala
        115                 120                 125
Asp Arg Ile Ala Asp Arg Gly Gly Gly Glu Phe Val Thr Glu Phe Ala
    130                 135                 140
Ala Pro Leu Ala Ile Ala Val Ile Leu Arg Leu Leu Gly Val Pro Glu
145                 150                 155                 160
Ala Asp Arg Ala Arg Val Ser Glu Leu Leu Ser Ala Ser Ala Pro Ser
                165                 170                 175
Gly Ala Glu Ala Glu Leu Arg Ser Tyr Trp Leu Gly Leu Ser Ala Leu
            180                 185                 190
Leu Arg Gly Arg Glu Asp Ala Gly Lys Gly Asp Gly Glu Asp Arg Gly
        195                 200                 205
Val Val Ala Glu Leu Val Arg Pro Asp Ala Gly Leu Arg Asp Ala Asp
    210                 215                 220
Ala Ser Ala Gly Pro Ala Cys Arg Ala Pro Leu Thr Asp Glu Gln Val
225                 230                 235                 240
Ala Ala Phe Cys Ala Leu Val Gly Gln Ala Gly Thr Glu Ser Val Ala
                245                 250                 255
Met Ala Leu Ser Asn Ala Leu Val Leu Phe Gly Arg His His Asp Gln
            260                 265                 270
Trp Arg Thr Leu Cys Ala Arg Pro Asp Ala Ile Pro Ala Ala Phe Glu
        275                 280                 285
Glu Val Leu Arg Tyr Trp Ala Pro Thr Gln His Gln Gly Arg Thr Leu
    290                 295                 300
Thr Ala Asp Val Arg Leu His Gly Arg Leu Leu Pro Ala Gly Ala His
305                 310                 315                 320
Val Leu Leu Leu Thr Gly Ser Ala Gly Arg Asp Glu Arg Ala Tyr Pro
                325                 330                 335
Asp Pro Asp Val Phe Asp Ile Gly Arg Phe His Pro Asp Arg Arg Pro
            340                 345                 350
Ser Thr Ala Leu Gly Phe Gly Leu Gly Ala His Phe Cys Leu Gly Ala
        355                 360                 365
Ala Leu Ala Arg Leu Gln Ala Arg Val Ala Leu Arg Glu Leu Thr Arg
    370                 375                 380
Arg Phe Pro Arg Tyr Arg Thr Asp Glu Glu Arg Thr Val Arg Ser Glu
385                 390                 395                 400
Val Met Asn Gly Phe Gly His Ser Arg Val Pro Phe Ser Met
                405                 410
 
<210>4
<211>260
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>4
 
Val Pro Asp Arg Gln Arg Thr Arg Arg Ala Thr Glu Gly Ser Ala Asp
1               5                   10                  15
Ala Arg Gly Arg Gly Glu Val Val Val Ala Cys Ala Ser Leu Arg Asp
            20                  25                  30
Thr Asn Ala Pro Leu Ala Glu Trp Leu Gly Asp Leu Asp Val Gly Cys
        35                  40                  45
Thr Phe Cys Gly Asp Val Tyr Ser Ala Ala Glu Thr Tyr Asp Pro Arg
    50                  55                  60
Leu Ala Leu Leu Pro Val Leu Thr Glu Ala Gln Ala Gln Arg Leu Gly
65                  70                  75                  80
Arg Leu Met Glu Arg Cys Pro Gly Thr Ser Val Leu Gly Ile Val Met
                85                  90                  95
Asp Val Thr Gly His His Thr His Arg Ala Ile Gln Asn Gly Ala Ser
            100                 105                 110
Trp Val Leu Asn Thr Leu Leu Pro Ala Ala Cys Cys Arg Asn Leu Leu
        115                 120                 125
Arg Met Val Ile Gln Ala Val Val Leu Gly Pro Thr Val Pro Glu Pro
    130                 135                 140
Leu Val Ala Glu Pro Ala Val Pro Glu Gly Ala Glu Pro Pro Thr Arg
145                 150                 155                 160
Pro Gly Asp Pro Arg Ala Glu Pro Pro Ala Glu Ala Arg Lys Val Ala
                165                 170                 175
Asp Ala Gln Glu Glu Glu Leu Leu Thr Leu Leu Cys Gly Pro Glu Ser
            180                 185                 190
Ile Ala Glu Ile Ala Arg Arg Phe Tyr Cys Ser Glu Arg Ser Met Tyr
       195                 200                 205
Arg Gln Leu Arg Asp Leu Tyr Arg Ser Tyr Gly Val Thr Gly Arg Arg
    210                 215                 220
Glu Leu Arg Arg Glu Ile Ala Leu Arg Ser Val Thr Arg His Gln Glu
225                 230                 235                 240
Thr Leu Ser Ala His Leu Leu Ala Pro Pro Arg Pro Val Arg Arg Gly
                245                 250                 255
Gly Leu Ser Cys
            260
 
<210>5
<211>221
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>5
 
Val Arg Ala Gly His His Gly Val Arg Ser Gly Pro Arg Thr His Pro
1               5                   10                  15
Ser Ser Gln Thr Thr Thr Pro Ala Ile Val Pro Lys Ala Gly Asp Arg
            20                  25                  30
Gln Ile Ala Lys Thr Ala Pro Ala Pro Ala Ala Arg Arg Ala Arg Pro
        35                  40                  45
Ser Gln Pro Ala Thr Thr Ala Ser Ile Pro Val Val Ala Pro Ala Asp
    50                  55                  60
Thr Arg Thr Pro Glu Ala Thr Thr Glu Ser Ala Arg Ser Ile Pro Arg
65                  70                  75                  80
Thr Ser Ala Ser Leu Val Ala Asn Ala Val Ala Gly Glu Thr Gly Ile
                85                  90                  95
Ala Asp Ser Ser Ser Arg Arg Gly Ser Asp Arg Cys Glu His Ala Val
            100                 105                 110
Thr Glu Pro Ser Ser Ser Thr Thr Val Thr Thr Glu Leu Asn Asn Cys
        115                 120                 125
Thr Thr Ala Pro Gly Val Gly Ala Val Arg Ala Ser Asn Thr Ala Ala
    130                 135                 140
Thr Arg Pro Arg Ala Val Ser Gly Pro Ser Asp Arg Gly Ile Ser Arg
145                 150                 155                 160
Ala Cys Ala Arg Thr Arg Pro Val Val Ser Arg His Asp Ala Arg Ser
                165                 170                 175
Val Gly Pro Val Thr Gly Ala Phe Arg Cys Pro Ala Met Ser Gly Arg
            180                 185                 190
Arg Pro Arg Ser Ser Ser Tyr Ala Gly Thr Val Ser Gly Pro Ile Ser
        195                 200                 205
Ser Ser Ser Ala Ser Arg Thr Ala Ala Val Arg Ala Ser
    210                 215                 220
 
<210>6
<211>220
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>6
 
Val Pro Leu Arg Arg Arg Ser Pro Arg Thr Gly Thr Ala Ala Asp Ala
1               5                   10                  15
Thr Tyr Glu Arg Val Gln Gln Leu Arg Glu Pro Glu Leu Ser Ala Glu
            20                  25                  30
Val Ser Glu Asp Ala Val Leu Met Arg Arg Val Ala Asp Gly Glu Glu
        35                  40                  45
Val Ala Leu Arg Met Leu Tyr Glu Arg His Ala Ala Gly Met Leu Arg
    50                  55                  60
Leu Ile Arg Arg Leu Thr Ser Gln Arg Glu Val Ala Glu Glu Ile Leu
65                  70                  75                  80
Gln Glu Ser Trp Leu Ala Val Trp Arg Ser Ala Gly Ser Phe Arg Gly
                85                  90                  95
Glu Ala Pro Val Arg Ala Trp Leu Leu Gly Val Ala Arg Arg Gln Ala
            100                 105                 110
His Asn Arg Leu Arg Arg Ala Glu Pro Val Leu Val Asp Leu Glu Lys
        115                 120                 125
Ala Ala Asp Val Pro Asp Leu Glu Pro Ala Val Asp Glu Gln Val Leu
    130                 135                 140
Ala Arg Ala Glu Arg Arg Asp Leu Val Ala Ala Val Ala Glu Leu Pro
145                 150                 155                 160
Glu His Leu Arg Glu Val Leu Val Leu Val Leu Ala Glu Asp Leu Pro
                165                 170                 175
Tyr Pro Gln Val Ala Val Ile Leu Gly Ile Pro Thr Gly Thr Val Lys
            180                 185                 190
Ser Arg Met His Met Ala Arg Arg Leu Leu Thr Glu Ala Leu Thr Lys
        195                 200                 205
Thr Thr Asn Pro Lys Gly Gly Arg Thr Gly Asp Arg
    210                 215                 220
 
<210>7
<211>57
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>7
Met Pro Ala Asp Ile Leu Glu Thr Arg Thr Ser Glu Thr Glu Asp Leu
1               5                   10                  15
Leu Asp Leu Asp Leu Ser Ile Gly Val Glu Glu Ile Thr Ala Gly Pro
            20                  25                  30
Ala Val Thr Ser Trp Ser Leu Cys Thr Pro Gly Cys Thr Ser Pro Gly
        35                  40                  45
Gly Gly Ser Asn Cys Ser Phe Cys Cys
    50                  55
 
<210>8
<211>1115
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>8
Met Thr Asp Ser Pro Phe Arg Ala Trp Asp Val Phe Met Val Arg Ala
1               5                   10                  15
Pro Val Gly Tyr Ala Tyr Pro Thr Pro Leu Pro Asn Ser Glu Phe Asp
            20                  25                  30
Ser Pro Ala Ser Ser Pro Gly Leu Asp Glu Ala Glu Phe Pro Pro Asp
        35                  40                  45
Ala Pro Val Leu Ser Asp Val Ser Gly His Arg Ala Gly Ser Ser Glu
    50                  55                  60
Ala Ser Ala Arg Thr Ser Gly Pro Pro Pro Ala Asp Asp His Leu Ser
65                  70                  75                  80
Leu Leu Arg Ala Ala Cys Glu Asp Gly Pro Leu Met Glu Ala Val Glu
                85                  90                  95
Leu Ala Ser Pro Ser Leu Ala Gly Leu Leu Ala Arg Val Ala Arg Gly
            100                 105                 110
Asp Thr Gly Gly Leu Lys Asp Lys Arg Leu Arg Arg Ala Ala Leu Ala
        115                 120                 125
Leu Leu Arg Tyr Asp Ile Arg Met Arg Thr Arg Pro Thr Pro Phe Gly
    130                 135                 140
Leu Phe Ala Gly Val Ser Gly Gly Arg Phe Asp Thr Ser Ala Lys Trp
145                 150                 155                 160
Leu Ala Gly Thr Gly His Arg Thr Arg Thr Arg Ala Asp Met Glu Trp
                165                 170                 175
Leu Leu Ser Ala Val His Arg Leu Glu Arg Asp Arg Val Leu Leu Ala
            180                 185                 190
Gly Val Thr Val Gln Ala His Gln Thr Leu Thr Val Arg Gly Asp Arg
        195                 200                 205
Ile Val Leu Asp Cys Pro Ser Ala Leu Gly Lys Pro Leu Asn Gly Ser
    210                 215                 220
Thr Arg Ser Thr Val Ser Ala Arg Arg Ser Pro Val Val Ala Glu Ile
225                 230                 235                 240
Leu Gly Ala Ala Arg Arg Pro Val Leu Ala Gly Arg Leu Ala Gln Ser
                245                 250                 255
Val Ala Gln Arg Phe Glu Leu Pro Val Asp Arg Val Thr Gly Leu Leu
            260                 265                 270
Ala Asp Met Ala Ala Gln Glu Leu Leu Ile Thr Ala Leu Arg Pro Pro
        275                 280                 285
Leu Asp Gly Gly Asp Pro Leu Gln His Val Leu Asp Val Val Ala Thr
    290                 295                 300
Ala Glu Ala Arg Ala Gly Ser Pro Ala Glu Ala Met Ser Ser Asp Ser
305                 310                 315                 320
Ala Ala Leu Val Ala Ala Leu Arg Glu Val Asp Ala Arg Cys His Ala
                325                 330                 335
Tyr Asp Arg Thr Ala Val Gly Gln Gly Arg Arg Glu Leu Ala Glu Leu
            340                 345                 350
Ile Gln Ala Thr Arg Arg Val His Pro His Asp Thr Pro Leu His Val
        355                 360                 365
Asp Leu Arg Ile Asp Leu Glu Val Arg Leu Pro Glu Ile Val Arg Thr
    370                 375                 380
Glu Ile Glu Arg Ala Ala Glu Ala Leu Trp Arg Leu Ser Pro Pro Arg
385                 390                 395                 400
Arg Gly Met Arg Ala Leu Arg Arg Tyr His Glu Ala Phe Leu Glu Arg
                405                 410                 415
Tyr Gly Ala Asp Arg Ala Val Pro Leu Leu Glu Leu Leu Asp Asp Thr
            420                 425                 430
Arg Gly Leu Gly Pro Pro Ala Gly Tyr Lys Trp Pro Pro Ser Glu Thr
       435                 440                 445
Pro Ala Gly Pro Gln Glu Glu Pro Arg Arg Ser Ala Ala Leu Ala Arg
    450                 455                 460
Leu Val Ala Thr Ala Ala Arg His Gly Glu Arg Glu Ile Val Ile Asp
465                 470                 475                 480
Glu Glu Thr Ile Ala Glu Leu Val Tyr Asp Glu Ala Ala Pro Ala Asp
                485                 490                 495
Leu Pro Asn Ser Leu Glu Leu Gly Val His Val Val Ala Pro Ser Leu
            500                 505                 510
Asp Glu Leu Ser Ala Gly Thr Phe Arg Val Val Leu Ala Pro Gly Pro
        515                 520                 525
Gly Ser His His Ala Gly Ala Thr Leu Gly Arg Phe Thr Gly Leu Leu
    530                 535                 540
Pro Asp Val Asp Ala Glu Ser Ala Ala Arg Gln Ala Gly Arg Pro Leu
545                 550                 555                 560
His Ile Gln Asp Ala Val Ala Ala Asp Val Ala Phe Ile Pro Arg Ser
                565                 570                 575
Gly Arg Ala Ala Asn Leu Ala His Thr Pro Ser Tyr Ser Gly Arg Arg
            580                 585                 590
Ile Ser Val Gly Leu Pro Asp Ser Gly Arg Ala Gln Glu Leu Pro Leu
        595                 600                 605
Asp Glu Leu Gly Val Ala Ala Asn Leu Glu Arg Leu Cys Leu Val His
    610                 615                 620
Leu Pro Thr Gly Arg Glu Val Val Pro Ala Leu Pro Asn Met Val Ser
625                 630                 635                 640
Ala Phe Ala Gln Ala Pro Asn Pro Ala Arg Leu Leu Phe Glu Leu Gly
                645                 650                 655
Leu Glu Gly Gln Arg Leu Trp Glu Pro Trp Asp Trp Gly Ala Leu Ser
            660                 665                 670
Glu Met Pro Phe Leu Pro Gly Val Arg Tyr Gly Arg Thr Leu Leu Ala
        675                 680                 685
Ala Pro Ile Trp Arg Met Asp Gln Leu Arg Gly Pro Ala Ala Asp Ser
    690                 695                 700
Gly Pro Ala Ala Asp Trp Asp Ala Ala Leu Asp Arg Trp Arg Ala Glu
705                 710                 715                 720
Trp Asn Val Pro Arg Arg Val Leu Ala Val Ser Met Asp Gln Arg Leu
                725                 730                 735
Leu Leu Asp Leu Gly Asp Ala Trp His Arg Val Leu Leu Arg Asp Glu
            740                 745                 750
Leu Arg Arg Thr Pro Glu Leu Ile Ala Gln Gln Val Ala Gly Asp Glu
       755                  760                 765
Glu Gly Trp Leu Asp Arg Gly Asp Gly Gly Phe Pro Gly His Leu Ala
    770                 775                 780
Glu Ile Val Val Pro Leu Glu Arg Arg Asp Arg His Ala Ala Arg Pro
785                 790                 795                 800
Pro His Ile Arg Ala Thr Val Gly Gly Arg Glu Pro Thr Gly Ala Gly
                805                 810                 815
Gly Pro Trp Leu Tyr Leu Arg Leu Arg Val Pro Arg Arg Asn Gln Asp
            820                 825                 830
Asp Phe Leu Arg Asp Gln Val Pro Val Leu Val Arg Ala Gly Ile Gly
        835                 840                 845
His Gly Ala Asp Arg Trp Phe Phe Ile Arg Tyr Ser Asp Thr Ala Gly
    850                 855                 860
Gln His Leu Arg Val Arg Phe Arg Gly Glu Arg Glu Lys Leu Trp Ala
865                 870                 875                 880
Gly Leu Leu Pro Glu Ile Gly Ala Arg Leu Val Glu Trp Gln Arg Gln
                885                 890                 895
Gly Leu Leu Ala Gly His Glu Leu Gly Gln Tyr Asp Pro Glu Tyr Glu
            900                 905                 910
Arg Tyr Gly Gly Asp Ala Leu Ala Glu Phe Thr Glu Ala Ala Phe Gln
        915                 920                 925
His Asp Ser Ala Ala Ala Ile Ser Leu Leu Arg Leu Thr Arg Arg Ala
    930                 935                 940
Gly Phe Arg Tyr Thr Leu Asp Glu Val Thr Ala Ile Ser Ala Ala Ala
945                 950                 955                 960
Leu Ala His Ala Phe Gly Pro Pro Ala Pro Val Val Glu Pro Val Pro
                965                 970                 975
Leu Val Gly Gly Leu Gln Trp Ala Pro Asp Leu Phe Asp Gly Asp Pro
            980                 985                 990
Ala Ala Ala Trp Met Ser Thr Thr Gly Ala Arg Arg Glu Leu Pro Pro
        995                 1000                1005
Asp Tyr Arg Arg Glu Pro Ala Arg Trp Gln Lys Leu Ile Asp Pro
    1010                1015                1020
Thr Gly Gly Trp Arg Val Leu Arg Ala Asp Glu Asp Gly Cys Gln
    1025                1030                1035
Val Leu Ala Ala Leu Glu Ser Arg Asp Glu Ala Val Arg Arg Phe
    1040                1045                1050
Gly Thr Ala Phe Arg Glu Ala Ser Arg Pro Thr Asp Ser Pro Ser
    1055                1060                1065
Thr Gln Leu Arg Leu Val Gly Ser Leu Leu His Met Thr Cys Asn
    1070                1075                1080
Arg Leu Ile Gly Gly Ser Ala Glu Arg Glu Arg Ser Val Leu Gly
    1085                1090                1095
Leu Ala Arg Gly Ala Val Gln Asp Asn Leu Asn Arg Arg Arg His
    1100                1105                1110
Arg Ala
    1115
 
<210>9
<211>475
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>9
 
Val Thr Pro Asp Arg His Pro Ala Arg Phe Leu Arg Gly Ser Ala Ala
1               5                   10                  15
Arg Arg Ala Ala Arg Leu Val Arg Leu Val Ala Glu Arg Leu Ala Asp
            20                  25                  30
Pro Asp Glu Val Ala Gly Ile Ala Ala Arg Pro Gly Asn Ser Val Pro
        35                  40                  45
Ala Asn Gly Leu Ser Met Trp Ser Pro Ala Thr Leu Ser His Gly Phe
    50                  55                  60
Pro Gly Ile Ala Val Phe Tyr Ala Glu Leu Gly Arg Val Asp Pro Ala
65                  70                  75                  80
Trp Ser Ala Leu Ala His Arg His Leu Arg Ala Gly Ala Ala Ala Val
                85                  90                  95
Glu Thr Ala Pro Ser Gly Gly Leu Phe Ala Gly Pro Ala Ser Leu Leu
            100                 105                 110
Ala Ala Ala Gln Ser Cys Ala Gly Pro Ala Gly His Tyr Arg Gly Leu
       115                 120                 125
Arg Arg Thr Leu Thr Ala Trp Leu Ala Ala Asp His Ala Gly Arg Leu
    130                 135                 140
Ala Ala Ala Arg Asp Arg Pro Gly Pro Gly Val Ala Trp Thr Asp Tyr
145                 150                 155                 160
Asp Val Val His Gly Leu Ser Gly Ser Thr Arg Leu Leu Leu Asp Ala
                165                 170                 175
Ala Arg Asp Pro Asp Asp Glu Thr Ala Ala Lys Ala Ser Gly Ala Val
            180                 185                 190
Thr Asp Thr Leu Arg His Leu Val Arg Leu Thr Glu Pro Ile Thr Val
       195                 200                 205
Asp Gly His Glu Val Pro Gly Trp Trp Val Pro Ser His Leu Gln Pro
    210                 215                 220
Val Glu Gln Asp Arg Arg Asp Tyr Pro Arg Gly Asp Leu Asn Leu Gly
225                 230                 235                 240
Leu Ala His Gly Ala Ala Gly Pro Leu Ser Val Leu Ala Thr Ala Thr
                245                 250                 255
Leu His Gly Val Glu Val Pro Gly Gln Arg Glu Ala Val Ala Arg Leu
            260                 265                 270
Ala Glu Trp  Leu Leu Gly Trp Thr Met ThrAsp Asp Thr Gly Ala Tyr
        275                 280                 285
Trp Pro Cys Arg Val Ser Trp Asp Glu Gln Ile Ala Ala Val Arg Pro
    290                 295                 300
Asp Thr Ser Phe Thr Arg Thr Ala Trp Cys Tyr Gly Ala Pro Gly Val
305                 310                 315                 320
Cys Ala Ala Leu His Arg Ala Gly Leu Ala Leu Gly Val Thr Glu Trp
                325                 330                 335
Arg Glu Val Ala Val Thr Ala Leu Leu Asp Gly Leu Arg Arg Asp Arg
            340                 345                 350
Ser Ala Trp Arg Val Asp Gly Ser Thr Val Cys His Gly Tyr Ala Gly
        355                 360                 365
Leu Leu Gln Val Leu Ser Arg Val Gly Ala Glu Ser Gly Asp Pro Arg
    370                 375                 380
Leu Leu Asp Gly Cys Leu Asp Val Ala Arg Met Val Leu Gly Glu Ala
385                 390                 395                 400
Asp Glu Ser Ala Pro Phe Val Phe Pro His Leu Val Pro Asp Ser Pro
                405                 410                 415
Asp Gly Trp Arg Asn Ala Thr Gly Tyr Leu Pro Leu Asp Gly Ala Gly
            420                 425                 430
Leu Leu Glu Gly Ala Ala Gly Val Ala Cys Ala Leu Leu Ser Val Ile
        435                 440                 445
Pro Pro Ser Ser Leu Gly Gly Thr Asp Pro Ala Pro Glu Arg Ala Asp
    450                 455                 460
Leu Pro Pro Trp Asp Arg Cys Leu Ala Leu Cys
465                 470                 475
 
<210>10
<211>215
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>10
 
Met Thr Ala His Ser Asp Ala Gly Gly Val Pro Arg Pro Pro Glu Arg
1               5                   10                  15
Leu Leu Leu Gly Val Ser Gly Ser Val Ala Ala Leu Asn Leu Pro Ala
            20                  25                  30
Tyr Val Tyr Ala Phe Arg Ala Ala Gly Val Ala Arg Leu Ala Val Val
        35                 40                  45
Leu Thr Pro Ala Ala Glu Gly Phe Leu Pro Ala Gly Ala Leu Arg Pro
    50                  55                  60
Ile Val Asp Ala Val His Thr Glu His Asp Gln Gly Lys Gly His Val
65                  70                  75                  80
Ala Leu Ser Arg Trp Ala Gln His Leu Leu Val Leu Pro Ala Thr Ala
                85                  90                  95
Asn Leu Leu Gly Cys Ala Ala Ser Gly Leu Ala Pro Asn Phe Leu Ala
            100                  105                 110
Thr Val Leu Leu Ala Ala Asp Cys Pro Ile Thr Phe Val Pro Ala Met
        115                 120                 125
Asn Pro Val Met Trp Arg Lys Pro Ala Val Arg Arg Asn Val Ala Thr
    130                 135                 140
Leu Arg Ala Asp Gly His Arg Val Val Asp Pro Leu Pro Gly Ala Val
145                 150                 155                 160
Tyr Glu Ala Ala Ser Arg Ser Ile ValAsp Gly Leu Thr Met Pro Arg
                165                 170                 175
Pro Glu Ala Leu Val Arg Leu Leu Gly Gly Gly Asp Asp Gly Ser Pro
            180                 185                 190
Ser Gly Gln Asp Gly Pro ValGly Arg Ala Glu His Ala Glu His Ala
        195                 200                 205
Glu Ala Ala Glu Ala Leu Ala
    210                 215
 
<210>11
<211>316
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>11
Met Thr Val Pro Ala Phe Glu Leu Ser Asp Leu Thr Val Arg Tyr Gly
1               5                   10                  15
Pro Val Thr Ala Val Asp Gly Val Ser Ala Gly Ser Ala Pro Gly Leu
            20                  25                  30
Val Thr Ala Leu Leu Gly Pro Asn Gly Ala Gly Lys Ser Ser Leu Leu
        35                  40                  45
Arg Val Leu Ser Thr Val Ala Pro Pro Ser Ser Gly Thr Ala Arg Val
    50                  55                  60
Phe Gly His Asp Thr Arg Ala Glu Pro Leu Ala Ala Arg Arg Arg Ile
65                  70                  75                  80
Gly Leu Val Phe Gln Glu Arg Ala Leu Asp Thr Asp Leu Ser Ala Glu
                85                  90                  95
Gln Asn Leu Arg Phe His Ala Arg Leu Phe Gly Val Gly Arg Ala Arg
            100                 105                 110
Ala Ala Glu Asp Ile Leu Val Leu Leu Glu Arg Phe Gly Leu Ala Gly
        115                 120                 125
Arg Gly Arg Asp Arg Val Glu Thr Leu Ser Gly Gly Leu Ala Arg Arg
    130                 135                 140
Leu Glu Ile Ala Arg Ala Leu Leu His Arg Pro Gly Leu Leu Ile Leu
145                 150                 155                 160
Asp Glu Pro Thr Asn Gly Leu Asp Pro Glu Ala Arg Gln Thr Val Trp
                165                 170                 175
Asp Asp Leu Ile Arg Leu Arg Ser Glu Leu Gly Val Thr Val Leu Tyr
            180                 185                 190
Ser Thr His Tyr Met Asp Glu Ala Glu Leu Ala Asp Gln Ile Ile Ile
        195                 200                 205
Leu Ser Glu Gly Arg Val Ala Gly Phe Gly Ser Pro Gly Arg Leu Lys
    210                 215                 220
Ser Glu Leu Arg Ser Ser Arg Ile Val Leu Val Thr His Asp Asp Asp
225                 230                  235                240
Thr Val Leu Ala Arg Leu Ala Glu Ala Gly Phe Asp Ala Val Ile Asp
                245                 250                 255
Ser Asp Gly Val Ala Val Arg Cys Arg Glu Pro Glu Ser Arg Met Ala
            260                 265                 270
Glu Val Ile Arg Ala Ala Gly Pro Leu Val Arg Ala Ala Ser Val His
        275                 280                 285
His Pro Ser Met Asn Asp Val Phe Leu Ala His Thr Ala Ala Asn Arg
    290                 295                 300
Asp Arg Glu Ala Ala Asp Gly Thr ValSer Cys Pro
305                 310                315
 
<210>12
<211>242
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>12
 
Val Ala His Arg Asp Val Leu Arg Gln Val Arg His Pro Gly Val Val
1               5                   10                  15
Val Ala Gln Ala Ala Gln Ile Val Phe Phe Val Leu Val Tyr Ala Val
            20                  25                  30
Gly Phe Arg Ser Met Ile Gly Ser Val Gly Gly Val Ser Phe Gly Ala
        35                  40                  45
Tyr Val Tyr Pro Gly Ile Ile Ala Ile Gln Val Val Met Leu Gly Val
    50                  55                  60
Gly Thr Gly Leu Thr Tyr Ala Met Asp Arg Glu Phe Gly Val Leu Arg
65                  70                  75                  80
Glu Met Gln Val Ala Pro Val Pro Arg Met Cys Leu Pro Leu Gly Lys
                85                  90                  95
Ile Leu Ala Ser Cys Val Leu Leu Thr Ala Gln Ala Met Leu Met Leu
            100                 105                 110
Leu Pro Ala Pro Leu Leu Gly Leu Pro Leu Thr Pro Ala Arg Tyr Ala
        115                 120                 125
Ala Gly Ala Ala Val Tyr Leu Ala Thr Ala Ala Ala Phe Ser Leu Ile
    130                 135                 140
Gly Leu Leu Leu Ala Val Ser Val Arg Arg Ile Glu Thr Leu Gln Ala
145                 150                 155                 160
Thr Val Gln Leu Ala Met Tyr Pro Leu Leu Phe Leu Ser Gly Ser Val
                165                 170                 175
Phe Lys Pro Asp Ala Val Pro Gly Trp Leu Ala Ala Leu Met Arg Leu
            180                 185                 190
Asn Pro Met Thr Tyr Ala Val Asp Leu Ala Arg His Val Leu Leu Pro
        195                 200                 205
Ser Ala Pro Gly Val Ser Tyr Leu Pro Val Trp Arg Asp Leu Leu Val
    210                 215                 220
Ile Ala Ala Leu Val Ala Ala Ala Ser Ala Ala Leu Arg Leu Arg Val
225                 230                 235                 240
Gly Arg
 
<210>13
<211>211
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>13
Val Trp Leu Val Ala Leu Leu Ala Glu Gly Gly Arg Ser Val Glu Pro
1               5                   10                  15
Trp Pro Ala Val Ala Gln Arg Ile Ile Asp Ala Gly Cys Ala Glu Pro
            20                  25                  30
Ile Arg Pro Gly Arg Pro Thr Ala Ala Arg Leu Glu Ala Arg Tyr Val
        35                  40                  45
Phe Asp Leu Ala Gly Leu Arg His Gly Leu Pro Ala Met Gly Glu Leu
    50                  55                  60
Ala Gly Arg Thr Ala Leu Gly Pro Gly Ala Asp Pro Leu His Leu Thr
65                  70                  75                  80
Asp Ala Asp Leu Tyr Val Ile Thr His Met Leu Phe Tyr Leu Thr Asp
                85                  90                  95
Phe Gly Arg Arg Pro Phe Ser Ala Asp Glu Ala Glu Ser Arg Arg Val
            100                 105                 110
Arg Gly Leu Val Glu Val Leu Leu Gly Arg Gln Leu Ala Val Gly Asp
        115                 120                 125
Leu Asp Leu Ala Ala Glu Leu Leu Ala Cys Ala Gly Leu Thr Gly Ala
    130                 135                 140
Asp Asp Arg Leu Ser Gly Cys Ala Trp Asn Arg Leu Ser Ala Ala Arg
145                 150                 155                 160
Arg Pro Asp Gly Ser Val Pro Ser Pro Leu Phe Arg Gln Ala Ala Leu
                165                 170                 175
Asp Arg Leu Ser Gly Glu Lys Ala Glu Ala Tyr Ala Phe Gly Thr Cys
           180                 185                 190
Tyr His Thr Thr Leu Ala Met Val Leu Ala Ala Thr Leu Thr Asp Gly
        195                 200                 205
Ala Asp Gly
    210
 
<210>14
<211>249
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>14
 
Met Ala Ala Leu Ile Ser Thr Glu Leu Leu Arg Leu Arg Ser Gly Phe
1               5                   10                  15
Val Gly Trp Tyr Ile Leu Leu Ser Pro Ile Val Ile Ala Ile Pro Leu
            20                  25                  30
Tyr Leu Gly Ser Ile Phe Ser Pro Glu Gly Arg Ser Gly Arg Leu Trp
        35                 40                 45
Glu Thr Phe Ser Asn Val Thr Leu Glu Phe Trp Gly Val Leu Ile Pro
    50                 55                 60
Met Thr Ala Gly Leu Ile Ala Ala Leu Ala Val Arg Ala Asp Thr Glu
65                 70                 75                 80
Pro Trp Arg Phe Leu Phe Ser Tyr Ala Ile Pro Arg Trp Arg Tyr Phe
                85                 90                 95
Thr Ala Lys Val Ala Ala Leu Ala ValAla Gln Leu Leu Ser Ala Thr
            100                 105                 110
Ile Leu Val Val Met Leu Ala Gly Gly Ala Leu Leu Thr Gly Gln Leu
        115                 120                 125
Ser Asn Ala Ala Ser Met Ile Leu Lys Val Ala Tyr Leu Pro Trp Ala
    130                 135                 140
Ala Gly Leu Ala Ala Thr Ala Leu Ala Val Leu Val Cys Thr Val Trp
145                 150                 155                 160
Gly Leu Gly Pro Gly Ile Ala Leu Gly Val Ala Gly Met Met Ala Gly
                165                 170                 175
Ala Leu Ile Ser Asp Lys Ser Phe Trp Tyr Ala Ile Pro Pro Ala Trp
            180                 185                 190
Pro Met Arg Val Ile Leu Pro Leu Ala Asp Ile Arg Pro Asn Gly Leu
        195                 200                 205
Ala Leu Asp Ala Ser Ser Pro Leu His Asp Thr Ser Val Ile Pro Leu
    210                 215                 220
Ala Val Ala Leu Ser Ala Ala Ala Thr Ile Val Ile Leu Leu Ile Gly
225                 230                 235                 240
Gly Arg His Met Ala Arg Lys Glu Val
                245
<210>15
<211>236
<212>PRT
<213>Microbispora sp.PTA-5024
<400>15
 
Met Ala Ala Leu Glu Ile Arg Asp Leu His Lys His Tyr Asp Asp Phe
1               5                   10                  15
His Ala Leu Asp Gly Ala Asn Leu Thr Val Pro Asp Gly Ser Leu Tyr
            20                  25                  30
Gly Leu Leu Gly Pro Asn Gly Ala Gly Lys Thr Thr Leu Met Lys Ala
        35                  40                  45
Val Thr Gly Leu Arg His Pro Thr Ser Gly His Ile Ser Leu Phe Gly
    50                  55                  60
Arg Pro Tyr Glu Arg Arg Leu Leu Thr Gln Val Gly Ala Leu Leu Glu
65                  70                  75                  80
Ser Pro Gly Leu Trp Thr Gln Leu Asp Ala Val Ser His Leu Arg Ile
                85                  90                  95
His Ala Arg Leu Arg Gly Val Pro Glu Thr Arg Ile Gly Glu Val Leu
            100                 105                 110
Ser Leu Met Asn Leu Thr Glu Val Ser Thr Arg Lys Val Ala Lys Tyr
        115                 120                 125
Ser Leu Gly Met Arg Trp Arg Leu Gly Ile Ala Ile Ala Leu Leu Gly
    130                 135                 140
Arg Pro Arg Leu Val Val Leu Asp Glu Pro Met Asn Gly Leu Asp Pro
145                 150                 155                 160
Val Gly Ile Arg Asp Met Arg Ala Thr Leu Arg Ala Leu Thr Ala Ala
                165                 170                 175
Gly Thr Thr Val Met Val Ser Ser His Gln Leu Ala Glu Ile Ala His
            180                 185                 190
Ile Cys Asp His Val Gly Val Leu Val Ala Gly Arg Thr Ala Tyr Glu
        195                 200                 205
Gly Pro Leu Pro Gly Leu Ala Val Asp Gly Asp Leu Glu Gln Gly Phe
    210                 215                 220
Phe Arg Leu Leu Glu Lys Ala Gly Ser Ala Val Arg
225                 230                 235
 
<210>16
<211>541
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>16
 
Val Thr Glu Pro His Arg Leu Ile Ala Ser Asn Glu Arg Leu Gly Thr
1               5                   10                  15
Ala Pro Glu Ala Pro Ala Asp Asp Asp Pro Gly Ala Ile Arg Thr Val
            20                  25                  30
Gly Val Ile Gly Gly Gly Thr Ala Gly Tyr Leu Thr Ala Leu Ala Leu
        35                  40                  45
Lys Ala Lys Arg Pro Trp Leu Asp Val Ala Leu Val Glu Ser Ala Asp
    50                  55                  60
Ile Pro Ile Ile Gly Val Gly Glu Ala Thr Val Ser Tyr Met Val Met
65                  70                  75                  80
Phe Leu His His Tyr Leu Gly Ile Asp Pro Ala Glu Phe Tyr Gln His
                85                  90                  95
Val Arg Pro Thr Trp Lys Leu Gly Ile Arg Phe Glu Trp Gly Ser Arg
            100                 105                 110
Pro Glu Gly Phe Val Ala Pro Phe Asp Trp Gly Thr Gly Ser Val Gly
        115                 120                 125
Leu Val Gly Ser Leu Arg Glu Thr Gly Asn Val Asn Glu Ala Thr Leu
    130                 135                 140
Gln Ala Met Leu Met Thr Glu Asp Arg Val Pro Val Tyr Arg Gly Glu
145                 150                 155                 160
Gly Gly His Val Ser Leu Met Lys Tyr Leu Pro Phe Ala Tyr His Met
                165                 170                 175
Asp Asn Ala Arg Leu Val Arg Tyr Leu Thr Glu Leu Ala Ala Arg Arg
            180                 185                 190
Gly Val Arg His Val Asp Ala Thr Val Ala Glu Val Arg Leu Asp Gly
        195                 200                 205
Pro Asp His Val Gly Gly Leu Ile Thr Thr Asp Gly Arg Arg Leu His
    210                 215                 220
Tyr Asp Phe Tyr Val Asp Cys Thr Gly Phe Arg Ser Leu Leu Leu Glu
225                 230                 235                 240
Lys Ala Leu Gly Ile Pro Phe Glu Ser Tyr Ala Ser Ser Leu Phe Thr
                245                 250                 255
Asp Ala Ala Val Thr Gly Thr Leu Ala His Gly Gly His Leu Lys Pro
            260                 265                 270
Tyr Thr Thr Ala Thr Thr Met Asn Ala Gly Trp Cys Trp Thr Ile Pro
        275                 280                 285
Thr Pro Glu Ser Asp His Leu Gly Tyr Val Phe Ser Ser Ala Ala Ile
    290                 295                 300
Asp Pro Asp Asp Ala Ala Ala Glu Met Ala Arg Arg Phe Pro Gly Val
305                 310                 315                 320
Thr Arg Glu Ala Leu Val Arg Phe Arg Ser Gly Arg His Arg Glu Ala
                325                 330                 335
Trp Arg Gly Asn Val Met Ala Val Gly Asn Ser Tyr Ala Phe Val Glu
            340                 345                 350
Pro Leu Glu Ser Ser Gly Leu Leu Met Ile Ala Thr Ala Val Gln Ile
        355                 360                 365
Leu Val Ser Leu Leu Pro Ser Ser Arg Arg Asp Pro Leu Pro Ser Asp
    370                 375                 380
Ala Ala Ash Gln Ala Leu Ala His Arg Trp Asp Ala Ile Arg Trp Phe
385                 390                 395                 400
Leu Ser Ile His Tyr Arg Phe Asn Gly Arg Leu Asp Thr Pro Phe Trp
                405                 410                 415
Lys Glu Ala Arg Ala Glu Thr Asp Ile Ser Gly Ile Glu Pro Leu Leu
            420                 425                 430
Arg Leu Phe Ala Ala Gly Ala Pro Leu Thr Gly Arg Asp  Ser Phe Thr
        435                 440                 445
Arg Tyr Leu Ala Asp Gly Ala Ala Pro Leu Phe Tyr Gly Leu Glu Gly
    450                 455                 460
Val Asp Thr Leu Leu Leu Gly Gln Glu Val Pro Ala Arg Leu Leu Pro
465                 470                 475                 480
Pro Arg Glu Pro Pro Glu Gln Trp Arg Ala Arg Ala Ala Ala Ala Arg
                485                 490                 495
Ser Leu Ala Ser Arg Gly Leu Arg Gln Ser Glu Ala Leu Asp Ala Tyr
            500                 505                 510
Ala Ala Asp Pro Cys Leu Asn Ala Glu Leu Leu Ser Asp Ser Asp Ser
        515                 520                 525
Trp Ala Gly Glu Arg Val Ala Val Arg Ala Gly Leu Arg
    530                 535                 540
 
<210>17
<211>178
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>17
 
Met Thr Thr Gly Ala Thr Val Ala His Val Val Glu Pro Asp Gly Phe
1               5                   10                  15
Arg Ala Val Met Ala Thr Leu Pro Ala Ala Val Ala Ile Val Thr Ala
            20                  25                  30
Ala Ala Ala Asp Gly Arg Pro Trp Gly Met Thr Cys Ser Ser Val Cys
        35                  40                  45
Ser Val Thr Leu Thr Pro Pro Thr Leu Leu Val Cys Leu Arg Thr Ala
    50                  55                  60
Ser Pro Thr Leu Ala Ala Val Val Ser Gly Arg Ala Phe Ser Val Asn
65                  70                  75                  80
Leu Leu Cys Ala Arg Ser Tyr Pro Val Ala Glu Leu Phe Ala Ser Ala
                85                  90                  95
Ala Ala Asp Arg Phe Asp Arg Val Arg Trp Arg Arg Pro Thr Gly Thr
            100                 105                 110
Gly Gly Pro His Leu Ala Asp Asp Ala Arg Ala Val Leu Asp Cys Arg
        115                 120                 125
Leu Ser Glu Ser Ala Glu Val Gly Asp His Met Val Val Phe Gly Glu
    130                 135                 140
Val Arg Ala Ile Arg Arg Leu Ser Asp Glu Pro Pro Leu Met Tyr Gly
145                 150                 155                 160
Tyr Arg Arg Tyr Ala Pro Trp Pro Ala Asp Arg Gly Pro Gly Ala Val
                165                 170                 175
Gly Gly
 
<210>18
<211>430
<212>PRT
<213>Microbispora sp.PTA-5024
 
<400>18
Val Asn Ala Glu Gln Leu Thr Gly Val Val Ile Ala Asp Leu Gly Val
1               5                   10                  15
Ile Val Val Val Ser Ala Leu Phe Gly Ala Leu Ala Arg Arg Cys Gly
            20                  25                  30
His Pro Thr Val Ile Gly Gln Ile Val Ala Gly Ile Ala Leu Gly Pro
        35                  40                  45
Thr Leu Leu Gly Arg Leu Pro Gly Asp Pro Ala Gly Trp Leu Phe Pro
    50                  55                  60
Ala Gln Val Arg Pro Ser Leu Ser Val Leu Ser Gln Ile Ala Val Val
65                  70                  75                  80
Ile Phe Met Phe Ala Val Gly Tyr Glu Val Asp Leu Arg Leu Leu Arg
                85                  90                  95
Arg Gly Gly Arg Ser Ala Leu Cys Val Ala Ser Leu Ser Leu Ala Val
            100                 105                 110
Pro Met Thr Leu Gly Ala Ala Val Ala Val Leu Phe Arg Glu Val Phe
        115                 120                 125
Thr Val Gly Ser Pro Gly Gly Pro Gly Gly Pro Thr Phe Val Leu Phe
    130                 135                 140
Met Ala Val Ala Ile Ser Ile Thr Ala Leu Pro Val Leu Ala Ala Ile
145                 150                 155                 160
Val Arg Glu Arg Gly Leu Ala Gly Thr Ala Ala Gly Thr Val Ala Thr
                165                 170                 175
Ala Ala Ala Gly Leu Met Asp Val Ala Ala Trp Thr Thr Leu Ala Ala
            180                 185                 190
Val Leu Ala Glu Thr Gly Asp Ala Asp Glu Pro Thr Val Ser His Val
        195                 200                 205
Pro Trp Met Leu Ala Leu Pro Ala Leu Thr Ala Phe Ala Val Ala Met
    210                 215                 220
Phe Leu Val Val Arg Pro Leu Leu Gly Trp Leu Thr Arg Arg Pro Gly
225                 230                 235                 240
Ala Met Trp Gly Arg Leu Pro Ala Ala Phe Ala Leu Ala Leu Gly Ser
                245                 250                 255
Ala Trp Gly Thr Ala Ala Leu Gly Leu His Pro Val Phe Gly Gly Leu
            260                 265                 270
Leu Ala Gly Leu Val Met Pro Arg Arg Asp Gly Ala Pro Glu Pro Glu
        275                 280                 285
Val Leu Arg Pro Met Glu Gln Thr Ala Glu Leu Leu Leu Pro Leu Phe
    290                 295                 300
Phe Val Met Thr Gly Leu Ser Ala Asp Ile Ser Ala Ile Glu Pro Gly
305                 310                 315                 320
Gly Leu Ile Leu Leu Ala Val Leu Leu Val Ala Ala Ile Gly Gly Lys
                325                 330                 335
Leu Val Pro Ala Tyr Ala Ala Ser Arg Leu Thr Gly Leu Asp Ser Gly
            340                 345                 350
Glu Ser Ala Val Val Ala Val Leu Val Asn Thr Arg Gly Leu Thr Glu
       355                 360                 365
Leu Ile Val Leu Asp Val Gly Leu Ser Ala His Val Ile Asp Glu Arg
    370                 375                 380
Leu Phe Thr Val Leu Val Val Met Ala Leu Ile Thr Thr Ala Met Thr
385                 390                 395                 400
Ala Pro Leu Leu Thr Ala Leu Arg Arg Arg Glu Glu Arg Arg Arg Gly
                405                 410                 415
Arg Gln Ala Ala Pro Leu Ser Arg Ala Thr Ala Trp Arg Met
            420                 425                 430
 
<210>19
<211>68
<212>PRT
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>19
 
Cly Thr Ser Ala Cys Ser Trp Ser Ser Thr Gly Gly Trp Ser Ser Tyr
1               5               10                      15
Thr Ser Trp Ser Ser Ala Cys Ser Gly Gly Ser Cys Cys Ser Thr Gly
            20                  25                  30
Cys Ala Cys Ser Trp Ser Ser Cys Cys Ser Gly Gly Ser Gly Gly Ser
        35                  40                  45
Trp Ser Ser Ala Ala Cys Trp Ser Ser Trp Ser Ser Thr Cys Cys Trp
    50                  55                  60
Ser Ser Thr Gly
65
<210>20
<211>27
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>20
aagcttgcat ctgcgtgggc gtcctgc                                           27
 
<210>21
<211>29
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>21
tctagacggt ccgaagatca tggccgcgg                                         29
                                                                                                                                                                                                                                             
<210>22
<211>30
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>22
tctagatcca tgtgaaccgg cgggtggccg                                        30
 
<210>23
<211>30
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>23
gaattccggt cgctctcctc gtcctttgcc                                        30
 
<210>24
<211>19
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>24
cgcgctgctc ggggccaac                                                    19
 
<210>25
<211>20
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>25
aggaaacggc cagcccgtgg                                                   20
 
<210>26
<211>31
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>26
tttttcatat gggtgggagt gatcggcggc g                                      31
 
<210>27
<211>35
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>27
tttttgtcga cctactgctg gccgcggtcc ggact                                  35
<210>28
<211>20
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>28
gcagccaggc tcgcaccggc                                                   20
 
<210>29
<211>16
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>29
cgcccgtaac gagcga                                                       16
 
<210>30
<211>17
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>30
gcagcttctg ctgctga                                                      17
 
<210>31
<211>16
<212>DNA
<213>artificial sequencer
 
<220>
<223>synthetic primer
 
<400>31
tcccggccag ccactt                                                       16
 
<210>32
<211>21
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>32
ccggaaagga gcgagcatat g                                                 21
 
<210>33
<211>18
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<400>33
cagatctgcc aatacagt                                                     18
 
<210>34
<211>112
<212>DNA
<213>artificial sequence
<220>
<223>synthetic primer
 
<220>
<221>misc_feature
<222>(32)..(37)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(41)..(49)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(56)..(61)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(65)..(67)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(71)..(82)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(86)..(88)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(95)..(97)
<223>n is a,c,g,or t
 
<400>34
cggtgtcgag gagatcaccg ccgggccggc gnnnnnnagc nnnnnnnnnt gcaccnnnnn       60
ntgcnnnagc nnnnnnnnnn nnagcnnntg cagcnnntgc tgctgaagat ct              112
 
<210>35
<211>112
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<220>
<221>misc_feature
<222>(11)..(13)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(20)..(22)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(26)..(37)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(41)..(43)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(47)..(52)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(59)..(67)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(71)..(76)
<223>n is a,c,g,or t
 
<400>35
ttcagcagca nnngctgcan nngctnnnnn nnnnnnngct nnngcannnn nnggtgcann       60
nnnnnnngct nnnnnncgcc ggcccggcgg tgatctcctc gacaccgatc ga              112
 
<210>36
<211>171
<212>DNA
<213>artificial sequence
 
<220>
<223>synthetic primer
 
<220>
<221>misc_feature
<222>(100)..(105)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(109)..(117)
<223>n  s a,c,g,or t
 
<220>
<221>misc_feature
<222>(124)..(129)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(133)..(135)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(139)..(150)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(154)..(156)
<223>n is a,c,g,or t
 
<220>
<221>misc_feature
<222>(163)..(165)
<223>n is a,c,g,or t
 
<400>36
atgcccgctg acatcctgga gacccggact tccgagaccg aggacctgct cgacctcgac       60
ctctcgatcg gtgtcgagga gatcaccgcc gggccggcgn nnnnnagcnn nnnnnnntgc      120
accnnnnnnt gcnnnagcnn nnnnnnnnnn agcnnntgca gcnnntgctg c               171

Claims (34)

1.一种分离的核酸,包含选自以下序列组成的组中的核苷酸序列:
a)编码107891和其同系物的合成所需的多肽的mlb基因簇(SEQ ID NO:1);
b)编码由mlb基因簇(SEQ ID NO:1)编码的相同多肽、与mlb基因簇的核苷酸序列不同的核苷酸序列;
c)mlb ORF 1到17的任何核苷酸序列,编码由SEQ ID NO:2到18编码的多肽;和
d)编码由mlb OFR 1到17的任一个编码的相同的多肽(SEQ ID NO:2到18)、与所述ORF的核苷酸序列不同的核苷酸序列。
2.一种分离的核酸,包含选自以下序列组成的组中的核苷酸序列:
e)编码一多肽的核苷酸序列,所述多肽在其全长上在氨基酸序列上与mlb ORF 2、6到9、15到16(SEQ ID NO:3、7到10、16到17)的任一个编码的多肽具有至少65%、至少86%、至少90%和至少95%或更高的相同性。
3.根据权利要求1或2的分离的核酸,包含编码由mlb ORF6(SEQ ID NO:7)组成的、107891前原肽的合成所需的多肽的核苷酸序列、或编码相同的多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
4.根据权利要求1或2的分离的核酸,包含由mlb ORF 9和16(SEQ IDNO:10和17)组成的、编码ORF6多肽的C-末端Cys残基的氧化脱羧作用所需的多肽的核苷酸序列、或编码相同的多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
5.根据权利要求1或2的分离的核酸,包含由mlb ORF 7和8(SEQ IDNO:8和9)组成的、编码107891原肽部分的脱水和(甲基)羊毛硫氨酸形成所需的多肽的核苷酸序列、或编码相同多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
6.根据权利要求1或2的分离的核酸,包含由mlb ORF 15(SEQ ID NO:16)组成的、编码氨基酸4的芳香族残基的氯化所需的多肽的核苷酸序列、或编码相同的多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
7.根据权利要求1或2的分离的核酸,包含由mlb ORF 2(SEQ ID NO:3)组成的、编码107891的氨基酸14的脯氨酸残基的羟基化所需的多肽的核苷酸序列、或编码相同的多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
8.根据权利要求1或2的分离的核酸,包含由mlb ORF 1、10、11、13、14和17(SEQ ID NO:2、11、14、15和18)组成的、编码107891或某些它的前体向细胞质外的输出所需的和赋予生产菌株对107891的抗性所需的多肽的核苷酸序列、或编码相同的多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
9.根据权利要求1或2的分离的核酸,包含由mlb ORF 3和5(SEQ ID NO:4和6)组成的、编码调节mlb基因簇的一个或更多个基因的表达所需的多肽的核苷酸序列、或编码相同的多肽的但不同于所述ORF的核苷酸序列的核苷酸序列的组合。
10.根据权利要求1或2的分离的核酸,包含由编码107891的合成所需的多肽的mlb基因簇组成的核苷酸序列,其中符合读框的缺失被导入到编码脯氨酸残基的羟基化所需的多肽的核苷酸序列中。
11.根据权利要求1或2的分离的核酸序列,包含带有以下序列的至少一个额外拷贝的核苷酸序列:mlb ORF 1到17(SEQ ID NO:2到18)中至少一个或编码与所述mlb ORF所编码的相同多肽的但不同于所述mlb ORF的核苷酸序列的核苷酸序列。
12.权利要求1到11任一项的分离的核酸,其中所述核苷酸序列是DNA序列。
13.重组DNA载体,其包含权利要求12中定义的DNA序列。
14.用权利要求13的载体转化的宿主细胞。
15.根据权利要求14的转化的宿上细胞,其属于放线菌目。
16.根据权利要求15的转化的宿主细胞,其属于选自链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科的科。
17.根据权利要求16的转化的宿主细胞,其属于选自小双孢菌属、游动放线菌属、游动单胞菌属、链霉菌属等等的属。
18.根据权利要求14的转化的宿主细胞,其属于芽孢杆菌目。
19.根据权利要求18的转化的宿主细胞,其属于选自芽胞杆菌科、乳杆菌科、链球菌科或葡萄球菌科的科。
20.根据权利要求19的转化的宿主细胞,其属于选自芽胞杆菌属、乳杆菌属、链球菌属、葡萄球菌属等等的属。
21.根据权利要求14的转化的宿主细胞,其属于大肠杆菌物种。
22.一种通过生物合成途径的方式通过能够生产107891或其前体的微生物提高107891或其同系物的生产的方法,所述方法包括:
-用权利要求13的重组DNA载体转化通过生物合成途径生产107891或107891前体的微生物,其中所述DNA载体编码在所述途径中速度限制型活性的表达;
-在适于细胞生长的条件下培养用所述载体转化的所述微生物,表达所述基因并产生所述抗生素或抗生素前体。
23.一种生产107891或其同系物或其前体或衍生物的转化的微生物,其中在其基因组中107891生物合成基因已经通过插入权利要求10的核苷酸序列而被修饰。
24.一种生产107891或其前体或衍生物的方法,其包括培养权利要求23的转化的107891生产微生物。
25.一种在基因组中具有107891生物合成基因的转化的107891生产微生物,其中选自mlb ORF 1到17(SEQ ID NO:2到18)的107891生物合成基因的至少一个被破坏。
26.根据权利要求25的转化的微生物,其中被破坏的生物合成基因是涉及氯残基的附着的基因。
27.一种生产107891前体或衍生物的方法,其包括权利要求25的转化的107891生产微生物。
28.一种生产不同于107891或其前体的羊毛硫抗生素的方法,所述方法包括:
-用重组DNA载体转化通过生物合成途径产生不同于107891或其前体的羊毛硫抗生素或羊毛硫抗生素前体的微生物,所述载体或其部分包含权利要求1到11任一项的核苷酸序列,所述核苷酸序列编码修饰所述羊毛硫抗生素或羊毛硫抗生素前体的酶活性的表达;和
-在适合于细胞生长的条件下培养用所述载体转化的所述微生物,表达所述基因并产生所述抗生素或抗生素前体。
29.分离的多肽,选自
-由mlb ORF 1到17(SEQ ID NO:2到18)的任一个编码的ORF多肽;和
-选自由在氨基酸序列上与mlb ORF 1到17(SEQ ID NO:2到18)的任一个编码的ORF多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和具有至少95%或更高的相同性的多肽组成的组中的多肽。
30.权利要求29的分离的多肽,其是mlb ORF 2、6到9、15到16(SEQ ID NO:3、7到10、16到17)的任一个。
31.权利要求29的分离的多肽,包含mlb ORF 2、6到9、15到16(SEQ ID NO:3、7到10、16到17)的任一个编码的mlb ORF多肽,或选自由在氨基酸序列上与所述mlb ORF的任一个编码的多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和具有至少95%或更高的相同性的多肽组成的组中的多肽。
32.权利要求29的分离的多肽,包含mlb ORF 1、10到11、13到14和17(SEQ ID NO:2、11到12、14到15和18)的任一个编码的mlb ORF多肽,或选自由在氨基酸序列上与所述mlb ORF的任一个编码的多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和具有至少95%或更高的相同性的多肽组成的组中的多肽。
33.权利要求29的分离的多肽,包含mlb ORF 3和5(SEQ ID NO:4和6)的任一个编码的mlb ORF多肽,或选自由在氨基酸序列上与所述mlbORF的任一个编码的多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和具有至少95%或更高的相同性的多肽组成的组中的多肽。
34.分离的多肽,包含选自权利要求1到12任一项的任何核酸所编码的多肽的、涉及107891的生物合成途径的多肽。
CN2007801007769A 2007-08-03 2007-08-03 用于羊毛硫抗生素107891的生物合成的基因和蛋白质 Pending CN101939328A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/IB2007/002270 WO2009019524A1 (en) 2007-08-03 2007-08-03 Genes and proteins for the biosynthesis of the lantibiotic 107891

Publications (1)

Publication Number Publication Date
CN101939328A true CN101939328A (zh) 2011-01-05

Family

ID=38983900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007801007769A Pending CN101939328A (zh) 2007-08-03 2007-08-03 用于羊毛硫抗生素107891的生物合成的基因和蛋白质

Country Status (8)

Country Link
US (2) US8609367B2 (zh)
EP (1) EP2190859A1 (zh)
JP (1) JP2010535492A (zh)
CN (1) CN101939328A (zh)
AU (1) AU2007357462B2 (zh)
BR (1) BRPI0721796A2 (zh)
CA (1) CA2695487A1 (zh)
WO (1) WO2009019524A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170492A (zh) * 2014-03-25 2016-11-30 兰硫代佩普有限公司 环状的Apelin类似物
CN106188253A (zh) * 2016-08-26 2016-12-07 上海交通大学 抗菌肽Lexapeptide及其制备方法和用途
CN106366168A (zh) * 2016-08-26 2017-02-01 上海交通大学 羊毛硫肽类抗菌肽及其脱氢衍生物的制备方法
CN110669113A (zh) * 2019-10-21 2020-01-10 河北省科学院生物研究所 一种羊毛硫肽前体肽amyA2及其制备方法和应用
CN110684087A (zh) * 2019-10-21 2020-01-14 河北省科学院生物研究所 一种羊毛硫肽前体肽amyA16及其制备方法和应用
CN113354718A (zh) * 2021-06-21 2021-09-07 重庆市畜牧科学院 一种哌尼生素前体、表达盒及其制备方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104024272B (zh) * 2011-10-12 2018-04-20 赛诺菲 用于浅灰霉素和甲基浅灰霉素的生物合成的基因簇
WO2023283342A2 (en) * 2021-07-08 2023-01-12 Temple University - Of The Commonwealth System Of Higher Education Oligonucleotides and viral untranslated region (utr) for increasing expression of target genes and proteins

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003076898A2 (en) * 2002-03-06 2003-09-18 Univ Minnesota MYCOBACTERIOLOGICAL DIAGNOSTICS
US20040101963A1 (en) * 2001-04-27 2004-05-27 Bibb Mervyn James Production of the lantibiotic cinnamycin with genes isolated from streptomyces cinnamoneus
CN1538813A (zh) * 2001-07-13 2004-10-20 对细菌芽孢和营养细胞具有抑菌和杀菌活性的组合物及其处理食品的方法
WO2005014628A1 (en) * 2003-07-18 2005-02-17 Vicuron Pharmaceuticals Inc. Antibiotic 107891, its factors a1 and a2, pharmaceutically acceptable salts and compositions, and use thereof.

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040101963A1 (en) * 2001-04-27 2004-05-27 Bibb Mervyn James Production of the lantibiotic cinnamycin with genes isolated from streptomyces cinnamoneus
CN1538813A (zh) * 2001-07-13 2004-10-20 对细菌芽孢和营养细胞具有抑菌和杀菌活性的组合物及其处理食品的方法
WO2003076898A2 (en) * 2002-03-06 2003-09-18 Univ Minnesota MYCOBACTERIOLOGICAL DIAGNOSTICS
WO2005014628A1 (en) * 2003-07-18 2005-02-17 Vicuron Pharmaceuticals Inc. Antibiotic 107891, its factors a1 and a2, pharmaceutically acceptable salts and compositions, and use thereof.

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KLEIN C等: "Analysis of Genes Involved In Biosynthesis of the Lantibiotic subtilin", 《APPLIED AND ENVIRONMENTAL MICROBIOLOGY》 *
SIEZEN RJ等: "Comparison of Lantibiotic Gene Clusters And Encoded Proteins", 《ANTONIE VAN LEEUWENHOEK》 *
WIDDICK DA等: "Cloning and Engineering of the Cinnamycin Biosynthetic Gene cluster from Strepmyces Cinnamoneus Cinnamoneus DSM 40005", 《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF USA》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170492A (zh) * 2014-03-25 2016-11-30 兰硫代佩普有限公司 环状的Apelin类似物
CN106170492B (zh) * 2014-03-25 2020-08-21 兰硫代佩普有限公司 环状的Apelin类似物
CN106188253A (zh) * 2016-08-26 2016-12-07 上海交通大学 抗菌肽Lexapeptide及其制备方法和用途
CN106366168A (zh) * 2016-08-26 2017-02-01 上海交通大学 羊毛硫肽类抗菌肽及其脱氢衍生物的制备方法
CN106188253B (zh) * 2016-08-26 2020-08-18 上海交通大学 抗菌肽Lexapeptide及其制备方法和用途
CN110669113A (zh) * 2019-10-21 2020-01-10 河北省科学院生物研究所 一种羊毛硫肽前体肽amyA2及其制备方法和应用
CN110684087A (zh) * 2019-10-21 2020-01-14 河北省科学院生物研究所 一种羊毛硫肽前体肽amyA16及其制备方法和应用
CN110684087B (zh) * 2019-10-21 2022-03-29 河北省科学院生物研究所 一种羊毛硫肽前体肽amyA16及其制备方法和应用
CN110669113B (zh) * 2019-10-21 2022-05-17 河北省科学院生物研究所 一种羊毛硫肽前体肽amyA2及其制备方法和应用
CN113354718A (zh) * 2021-06-21 2021-09-07 重庆市畜牧科学院 一种哌尼生素前体、表达盒及其制备方法

Also Published As

Publication number Publication date
WO2009019524A1 (en) 2009-02-12
EP2190859A1 (en) 2010-06-02
CA2695487A1 (en) 2009-02-12
AU2007357462B2 (en) 2013-02-21
BRPI0721796A2 (pt) 2012-03-13
JP2010535492A (ja) 2010-11-25
US8609367B2 (en) 2013-12-17
US20140038297A1 (en) 2014-02-06
US20120015418A1 (en) 2012-01-19
AU2007357462A1 (en) 2009-02-12

Similar Documents

Publication Publication Date Title
Bibb et al. Cloning, sequencing and deduced functions of a cluster of Streptomyces genes probably encoding biosynthesis of the polyketide antibiotic frenolicin
Stutzman-Engwall et al. Regulation of secondary metabolism in Streptomyces spp. and overproduction of daunorubicin in Streptomyces peucetius
Floriano et al. afsR is a pleiotropic but conditionally required regulatory gene for antibiotic production in Streptomyces coelicolor A3 (2)
CN101939328A (zh) 用于羊毛硫抗生素107891的生物合成的基因和蛋白质
Davis et al. The Streptomyces coelicolor whiB gene encodes a small transcription factor-like protein dispensable for growth but essential for sporulation
Mattheus et al. Isolation and purification of a new kalimantacin/batumin-related polyketide antibiotic and elucidation of its biosynthesis gene cluster
TWI237058B (en) Biosynthetic genes for Spinosyn insecticide production
WO1999005283A2 (fr) Genes de biosynthese et de transfert des 6-desoxyhexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
KR20100049580A (ko) 티오펩티드 전구체 단백질, 그를 코딩하는 유전자 및 그의 용도
Novakova et al. Cloning and characterization of a polyketide synthase gene cluster involved in biosynthesis of a proposed angucycline-like polyketide auricin in Streptomyces aureofaciens CCM 3239
Suwa et al. Identification of two polyketide synthase gene clusters on the linear plasmid pSLA2-L in Streptomyces rochei
WO2002059322A9 (en) Compositions and methods relating to the daptomycin biosynthetic gene cluster
CA2501393A1 (en) Genes and proteins for the biosynthesis of the glycopeptide antibiotic a40926
Perkins et al. Streptomyces genes involved in biosynthesis of the peptide antibiotic valinomycin
CA2387401C (en) Compositions, methods and systems for the production of enediynes
KR100882692B1 (ko) 부테닐-스피노신 살충제 생산을 위한 생합성 유전자
RU2441915C9 (ru) Гены и белки для биосинтеза лантибиотика 107891
Stratigopoulos et al. Inactivation of a transcriptional repressor during empirical improvement of the tylosin producer, Streptomyces fradiae
US20040086962A1 (en) Methods and materials relating to gene expression
Culebras et al. Cloning and characterization of a regulatory gene of the SARP family and its flanking region from Streptomyces ambofaciens
CN101278050A (zh) 参与噻可拉林生物合成的基因和噻可拉林的异源产生
WO2006111743A2 (en) Identifying lantibiotic gene clusters and novel lantibiotic genes
Nezbedová Secondary metabolism and its regulation in Streptomyces ambofaciens: the study of cryptic secondary metabolite biosynthetic gene clusters
Bell Analysis and manipulation of “actagardine” gene clusters from Actinoplanes
CA2445692A1 (en) Compositions, methods and systems for the discovery of enediyne natural products

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20110105

C20 Patent right or utility model deemed to be abandoned or is abandoned