CN1711355A - 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用 - Google Patents

参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用 Download PDF

Info

Publication number
CN1711355A
CN1711355A CNA2003801029666A CN200380102966A CN1711355A CN 1711355 A CN1711355 A CN 1711355A CN A2003801029666 A CNA2003801029666 A CN A2003801029666A CN 200380102966 A CN200380102966 A CN 200380102966A CN 1711355 A CN1711355 A CN 1711355A
Authority
CN
China
Prior art keywords
gene
sequence
microorganism
seq
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2003801029666A
Other languages
English (en)
Inventor
M-H·布隆德莱-鲁奥
H·多明格斯
E·达尔邦-龙热尔
C·热尔博
A·贡德朗
F·卡拉伊
P·拉克鲁瓦
N·厄斯特赖歇尔-梅尔梅-布维耶
J-L·佩尔诺代
K·蒂皮海尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Aventis Pharma SA
Original Assignee
Centre National de la Recherche Scientifique CNRS
Aventis Pharma SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Aventis Pharma SA filed Critical Centre National de la Recherche Scientifique CNRS
Publication of CN1711355A publication Critical patent/CN1711355A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • C12P19/62Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin the hetero ring having eight or more ring members and only oxygen as ring hetero atoms, e.g. erythromycin, spiramycin, nystatin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及螺旋霉素生物合成途径新基因的分 离和鉴定并且涉及参与该生物合成的新多肽。本发明还涉及产 生所述多肽的方法。它还涉及所述基因用于增加所产生的螺旋 霉素的产率和纯度的用途。本发明尤其涉及产生螺旋霉素I而 不产生螺旋霉素II和III的微生物,以及此种微生物的用途。 本发明还涉及螺旋霉素生物合成途径的基因用于构建能够导 致新抗生素合成或螺旋霉素衍生形式合成的突变体的用途。本 发明最后涉及过量表达所述基因所产生的分子并涉及过量表 达此类基因所产生的分子的药学活性组合物。

Description

参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用
本发明涉及螺旋霉素生物合成途径中新基因的分离和鉴定,并涉及参与该生物合成的新多肽。本发明还涉及这些基因用于增加所产生的螺旋霉素的产量和纯度水平的用途。
本发明还涉及这些基因用于构建能够导致新抗生素合成或螺旋霉素衍生形式的突变体的用途。本发明还涉及过量表达这些基因所产生的分子,并且最终涉及过量表达此类基因所产生的分子的药学活性组合物。
链霉菌属(Streptomyces)是革兰阳性丝状土壤细菌。由于它们分泌多种降解酶,所以在有机物质的分解和矿化中具有重要的作用。链霉菌属表现出形态学上的分化现象,这在原核生物中是唯一的,同时链霉菌属具有以产生化学结构和生物学活性显著不同的次级代谢物为特征的代谢上的分化。在这些代谢物中,存在由细菌生二素链霉菌(Streptomycesambofaciens)天然合成的螺旋霉素。
螺旋霉素是大环内酯类抗生素,在兽医药和人类医药方面都具有用途。大环内酯的特征在于存在其上连接有一个或多个糖的内酯环。生二素链霉菌天然产生螺旋霉素I、II和III(参照图1);然而,螺旋霉素I的抗生素活性明显高于螺旋霉素II和III的抗生素活性(Liu等,1999)。螺旋霉素I分子由基于内酯的大环(称为platenolide)和三个糖即forosamine、碳霉糖和mycarose组成(参照图1)。螺旋霉素的抗生素活性是由于在原核生物中通过有关将该抗生素结合到细菌核糖体上的机制而抑制蛋白质合成。
属于大环内酯家族成员并也具有内酯环的某些化合物在抗生素领域之外越来越多地被使用。因此,产物FK506具有免疫抑制剂作用并且在器官移植领域、类风湿关节炎领域,更加普遍的是对与自身免疫反应相关的病理疾病具有治疗应用前景。其他大环内酯,例如除虫菌素,具有杀虫和抗蠕虫活性。
到目前为止已对许多生物合成途径在链霉菌属中进行了研究,其中所述生物合成途径涉及不同类别的抗生素和其他次级代谢物的生物合成途径(综述见K,Chater,1990)。然而,到目前为止,螺旋霉素生物合成途径的了解还是非常有限的。
螺旋霉素生物合成是包括许多步骤并涉及许多酶的复杂过程(Omura等,1979a,Omura等,1979b)。螺旋霉素属于一大类聚酮化合物(polyketide),这类聚酮化合物包括在土壤中发现的微生物中特别丰富的复杂分子。这些分子归为一类不是由于结构类似,而是由于它们的生物合成途径的步骤中的某点相似性。具体而言,聚酮化合物是通过复杂的一系列反应产生的,其中共同的方面是,在它们的生物合成途径中,有一系列反应是由一种或多种称为“聚酮化合物合酶”(PKS)的酶催化的。在生二素链霉菌中,螺旋霉素基于内酯的大环(platenolide)的生物合成是通过一系列由五个PKS基因编码的八个组件进行的(S.Kuhstoss,1996,美国专利5,945,320)。螺旋霉素是从该内酯环得到的。然而,参与糖合成的多个步骤和酶,以及它们与内酯环连接并对该环进行修饰以至于获得螺旋霉素目前仍然是未知的。
美国专利5,514,544描述了生二素链霉菌中称为srmR的序列的克隆。在那个专利中,提出了srmR基因所编码的蛋白质调控参与大环内酯生物合成的基因的转录的假说。
1987年,Richardson及其同事(Richardson等,1987)研究表明生二素链霉菌的螺旋霉素抗性是由至少三个基因赋予的;所述基因称为srmA、srmB和srmC。美国专利4,886,757更加具体地描述了生二素链霉菌含有srmC基因的DNA片段的特点。然而,该基因的序列未公开。1990年,Richardson及其同事(Richardson等,1990)提出了srmB附近的三个基因参与螺旋霉素生物合成的假说。美国专利5,098,837报告了可能参与螺旋霉素生物合成的五个基因的克隆。这些基因命名为srmD、srmE、srmF、srmG和srmH。
产生诸如螺旋霉素的化合物的主要困难之一在于产生相对少量产物必需非常大的发酵量这样一个事实。因此期望能够增加此类分子产生的效率以降低其生产成本。
螺旋霉素生物合成途径是复杂的过程并且期望鉴定和去除在该过程中可能存在的伴生反应。此种操作的目的是获得更纯的抗生素和/或提高产量。在这方面,生二素链霉菌天然产生螺旋霉素I、II和III(参照图1);然而,螺旋霉素I的抗生素活性明显高于螺旋霉素II和III(Liu等,1999)。因此期望能够有仅产生螺旋霉素I的菌株。
由于大环内酯抗生素的商业价值,迫切需要产生新衍生物,特别是具有有利特性的螺旋霉素类似物。期望能够以足够的量产生螺旋霉素或螺旋霉素衍生物生物合成途径的生物合成中间体,特别是为了产生螺旋霉素衍生的杂化抗生素(hybrid antibiotics)。
发明概述
本发明涉及对其产物参与螺旋霉素生物合成的基因的克隆。首先,本发明涉及螺旋霉素生物合成途径的新基因和参与该生物合成的新多肽。
生物合成途径的基因和相关编码序列已经克隆并且已经确定了每个基因的DNA序列。下文中将所克隆的编码序列称为orf1*c,orf2*c,orf3*c,orf4*c,orf5*,orf6*,orf7*c,orf8*,orf9*,orf10*,orf1,orf2,orf3,orf4,orf5,orf6,orf7,orf8,orf9c,orf10,orf11c,orf12,orf13c,orf14,orf15c,orf16,orf17,orf18,orf19,orf20,orf21c,orf22c,orf23c,orf24c,orf25c,orf26,orf27,orf28c,orf29,orf30c,orf31,orf32c,orf33和orf34c。由这些序列所编码的蛋白质在螺旋霉素生物合成途径中的功能在下文中进行讨论,由图4、5、6和8图解说明。
1)本发明的第一主题涉及编码参与螺旋霉素生物合成的多肽的多核苷酸,其中所述多核苷酸的序列是:
(a)序列SEQ ID No.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一,
(b)由序列(a)的变体组成的序列之一,
(c)由于遗传密码简并性而衍生自序列(a)和(b)的序列之一。
2)本发明的主题还涉及在高严格杂交条件下,与至少一条根据以上段落1)的多核苷酸杂交的多核苷酸。
3)本发明还涉及与包含以上段落1)的多核苷酸中的至少10,12,15,18,20到25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850或1900个连续核苷酸的多核苷酸具有至少70%,80%,85%,90%,95%或98%核苷酸同一性的多核苷酸。
4)本发明还涉及根据以上段落2)或3)的多核苷酸,所述多核苷酸从链霉菌属的细菌分离。
5)本发明还涉及根据以上段落2)、3)或4)的多核苷酸,所述多核苷酸编码参与大环内酯生物合成的蛋白质。
6)本发明还涉及根据以上段落2)、3)或4)的多核苷酸,所述多核苷酸编码的蛋白质具有的活性类似于与其杂交或与其呈现同一性的多核苷酸所编码的蛋白质。
7)本发明还涉及表达根据以上段落1),2),3),4),5)或6)的多核苷酸所得到的多肽。
8)本发明的另一方面涉及参与螺旋霉素生物合成的多肽,其中所述多肽的序列是:
(a)序列SEQ ID No.4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150之一,
(b)如(a)中定义的序列之一,但是在所述全长序列中已对一个或多个氨基酸进行了替换、插入或删除而不影响其功能特性,
(c)由序列(a)和(b)的变体组成的序列之一。
9)本发明的另一主题涉及与包含以上段落8)的多肽中的至少10,15,20,30到40,50,60,70,80,90,100,120,140,160,180,200,220,240,260,280,300,320,340,360,380,400,420,440,460,480,500,520,540,560,580,600,620或640个连续氨基酸的多肽具有至少70%,80%,85%,90%,95%或98%氨基酸同一性的多肽。
10)本发明的另一方面还涉及根据以上段落9)的多肽,所述多肽从链霉菌属的细菌分离得到。
11)本发明的另一方面还涉及根据以上段落9)或10)的多肽,所述多肽编码参与大环内酯生物合成的蛋白质。
12)本发明的另一方面还涉及根据以上段落9),10)或11)的多肽,所述多肽具有的活性类似于与其呈现同一性的多肽所具有的活性。
13)本发明的另一方面还涉及重组DNA,其含有至少一条根据以上段落1),2),3),4),5)和6)之一的多核苷酸。
14)本发明的另一方面涉及根据以上段落13)的重组DNA,其中所述重组DNA包含于载体内。
15)本发明的另一方面涉及根据以上段落14)的重组DNA,其中所述载体选自噬菌体、质粒、噬菌粒、整合载体、fosmids、粘粒、穿梭载体、BAC和PAC。
16)本发明的另一方面涉及根据以上段落15)的重组DNA,该重组DNA选自pOS49.1,pOS49.11,pOSC49.12,pOS49.14,pOS49.16,pOS49.28,pOS44.1,pOS44.2,pOS44.4,pSPM5,pSPM7,pOS49.67,pOS49.88,pOS49.106,pOS49.120,pOS49.107,pOS49.32,pOS49.43,pOS49.44,pOS49.50,pOS49.99,pSPM17,pSPM21,pSPM502,pSPM504,pSPM507,pSPM508,pSPM509,pSPM1,pBXL1111,pBXL1112,pBXL1113,pSPM520,pSPM521,pSPM522,pSPM523,pSPM524,pSPM525,pSPM527,pSPM528,pSPM34,pSPM35,pSPM36,pSPM37,pSPM38,pSPM39,pSPM40,pSPM41,pSPM42,pSPM43,pSPM44,pSPM45,pSPM47,pSPM48,pSPM50,pSPM51,pSPM52,pSPM53,pSPM55,pSPM56,pSPM58,pSPM72,pSPM73,pSPM515,pSPM519,pSPM74,pSPM75,pSPM79,pSPM83,pSPM107,pSPM543和pSPM106。
17)本发明的另一方面涉及表达载体,其中含有至少一条编码根据以上段落7)、8)、9)、10)、11)或12)的多肽的核酸序列。
18)本发明还涉及表达系统,其包含适当的表达载体和允许一条或多条根据以上段落7)、8)、9)、10)、11)或12)的多肽表达的宿主细胞。
19)本发明还涉及根据以上段落18的表达系统,该系统选自原核表达系统和真核表达系统。
20)本发明还涉及根据以上段落19)的表达系统,该系统选自在细菌大肠杆菌(E.coli)中表达的系统、允许在昆虫细胞中表达的杆状病毒表达系统、允许在酵母细胞中表达的表达系统和允许在哺乳动物细胞中表达的表达系统。
21)本发明还涉及已经将根据以上段落1)、2)、3)、4)、5)、6)、13)、14)、15)、16)和17)之一的至少一条多肽和/或至少一条重组DNA和/或至少一个表达载体导入了的宿主细胞。
22)本发明还涉及产生根据以上段落7)、8)、9)、10)、11)或12)的多肽的方法,其中所述方法包括以下步骤:
a)将至少一条编码所述多肽的核酸插入适当的载体;
b)在适当的培养基中培养预先用步骤a)的载体转化或转染的宿主细胞;
c)回收条件培养基或细胞提取物;
d)从步骤c)获得的所述培养基中或者细胞提取物中分离并纯化所述多肽;
e)根据需要,表征所产生的重组多肽。
23)本发明的另一方面涉及阻断了至少一种大环内酯的生物合成步骤的微生物。
24)本发明的另一方面涉及根据以上段落23)的微生物,所述微生物是通过在产生这种(这些)大环内酯的微生物中失活至少一种参与这种(这些)大环内酯生物合成的蛋白质的功能而获得的。
25)本发明的另一方面涉及根据以上段落24)的微生物,其中这种(这些)蛋白质的失活是通过诱变编码所述蛋白质的基因或者过量表达一条或多条与编码所述蛋白质的信使RNA互补的反义RNA而实施的。
26)本发明的另一方面涉及根据以上段落25)的微生物,其中这种(这些)蛋白质的失活是通过辐射诱变、化学诱变剂、定点诱变或基因置换而实施的。
27)本发明的另一方面涉及根据以上段落25)或26)的微生物,其中一个诱变或多个诱变是在体外或在原位通过对特定基因中一个或多个碱基的抑制、替代、删除和/或添加或者通过基因失活而实施的。
28)本发明的另一方面涉及根据以上段落23)、24)、25)、26)或27)的微生物,其中所述微生物是链霉菌属的细菌。
29)本发明的另一方面涉及根据以上段落23)、24)、25)、26)、27)或28)的微生物,其中大环内酯是螺旋霉素。
30)本发明的另一方面涉及根据以上段落23)、24)、25)、26)、27)、28)或29)的微生物,其中所述微生物是生二素链霉菌菌株。
31)本发明的另一方面涉及根据以上段落23)、24)、25)、26)、27)、28)、29)或30)的微生物,其中诱变是在至少一个含有根据以上段落1)、2)、3)、4)、5)和6)之一的序列的基因中进行的。
32)本发明的另一方面涉及根据以上段落25)、26)、27)、28)、29)、30)或31)的微生物,其中诱变是在一个或多个含有对应于一个或多个序列SEQ ID No.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一的基因中进行的。
33)本发明的另一方面涉及根据以上段落25)、26)、27)、28)、29)、30)、31)或32)的微生物,其中诱变为对包含对应于序列SEQ ID No.13的序列的基因进行基因失活。
34)本发明的另一方面涉及生二素链霉菌菌株,所述菌株选自在国立微生物保藏中心[National Collection of Cultures and Microorganisms](CNCM)保藏的、保藏日为2002年7月10日、保藏号为I-2909,I-2911,I-2912,I-2913,I-2914,I-2915,I-2916或I-2917的菌株之一。
35)本发明的另一方面涉及制备大环内酯生物合成中间体的方法,该方法包括以下步骤:
a)在适当的培养基中,培养根据以上段落23),24),25),26),27),28),29),30),31),32),33)或34)之一的微生物,
b)回收条件培养基或细胞提取物,
c)从步骤b)中获得的所述培养基或者细胞提取物中分离并纯化所述生物合成中间体。
36)本发明的另一方面涉及制备衍生自大环内酯的分子的方法,其中生物合成中间体是按照以上段落35)的方法制备的并且如此所产生的中间体是经修饰的。
37)本发明的另一方面涉及根据以上段落36)的制备方法,其中所述中间体是经化学、生物化学、酶学和/或微生物学修饰的。
38)本发明的另一方面涉及根据以上段落36)或37)制备的方法,其中将一个或多个这样的基因导入所述微生物,其中所述基因编码的蛋白质能以中间体作为底物而对所述中间体进行修饰。
39)本发明的另一方面涉及根据以上段落36)、37)或38)制备的方法,其中大环内酯是螺旋霉素。
40)本发明的另一方面涉及根据以上段落36)、37)、38)或39)制备的方法,其中所使用的微生物是生二素链霉菌菌株。
41)本发明的另一方面涉及产生螺旋霉素I但不产生螺旋霉素II和III的微生物。
42)本发明的另一方面涉及根据以上段落41)的微生物,该微生物含有生物合成螺旋霉素I所需的全部基因,但是其中含有序列SEQ ID No.13或其变体之一、或者由于遗传密码简并性而由其衍生的序列之一、并且编码序列SEQ ID No.14或其变体之一的多肽的基因不表达或者已经被失活。
43)本发明的另一方面涉及根据以上段落42)的微生物,其中所述的失活是通过在编码所述蛋白质的基因内诱变或过量表达与编码所述蛋白质的信使RNA互补的反义RNA而进行的。
44)本发明的另一方面涉及根据以上段落43)的微生物,其中所述的诱变是该基因的启动子中、编码序列中或非编码序列中进行的,从而使编码的蛋白质失活或阻止由其表达或其翻译。
45)本发明的另一方面涉及根据以上段落43)或44)的微生物,其中诱变是通过辐射、化学诱变剂的作用、定点诱变或基因置换而进行的。
46)本发明的另一方面涉及根据以上段落43)、44)或45)的微生物,其中诱变是在体外或在原位通过对特定基因中一个或多个碱基的抑制、替代、删除和/或添加或者通过基因失活而进行的。
47)本发明的另一方面涉及根据以上段落41)或42)的微生物,其中所述微生物是过量表达螺旋霉素生物合成途径中的基因获得的,其中所述基因不包括含有对应于SEQ ID No.13或其变体序列、或由于遗传密码简并性而由其衍生的序列之一、并且编码序列SEQ ID No.14或其变体之一的多肽的基因的这些基因。
48)本发明的另一方面涉及根据以上段落41)、42)43)、44)、45)、46)或47)的微生物,其中所述微生物是链霉菌属的细菌。
49)本发明的另一方面涉及根据以上段落41)、42)43)、44)、45)、46)、47)或48)的微生物,其中所述微生物是由产生螺旋霉素I、II和III的起始菌株获得的。
50)本发明的另一方面涉及根据以上段落41)、42)43)、44)、45)、46)、47)、48)或49)的微生物,所述微生物是通过在含有对应于SEQ ID No.13或其变体序列、或由于遗传密码简并性而由其衍生的序列之一、并且编码序列SEQ ID No.14或其具有相同功能的变体之一的多肽的基因中进行诱变而获得的。
51)本发明的另一方面涉及根据以上段落41)、42)、43)、44)、45)、46)、47)、48)、49)或50)的微生物,其中所述微生物是从产生螺旋霉素I、II和III的生二素链霉菌菌株获得的,其中对含有对应于SEQ ID No.13或由于遗传密码简并性而由其衍生的序列之一的基因进行了基因失活。
52)本发明的另一方面涉及生二素链霉菌菌株,所述菌株是于2002年7月10日保藏在国立微生物保藏中心(CNCM)的菌株,保藏号为I-2910。
53)本发明的另一方面涉及产生螺旋霉素I的方法,该方法包括以下步骤:
(a)在适当的培养基中,培养根据以上段落41)、42)、43)、44)、45)、46)、47)、48)、49)、50)、51)和52)之一的微生物,
(b)回收条件培养基或细胞提取物,
(c)从步骤b)获得的所述培养基或者细胞提取物中分离并纯化螺旋霉素I。
54)本发明的另一方面涉及根据以上段落1)、2)、3)、4)、5)和6)之一的多核苷酸的用途,用于提高微生物的大环内酯生产量。
55)本发明的另一方面涉及产生大环内酯的突变微生物,该突变微生物在至少一个含有对应于根据以上段落1)、2)、3)、4)、5)和6)之一的序列的基因中进行了遗传修饰并且过量表达至少一个含有根据以上段落1)、2)、3)、4)、5)和6)之一的序列的基因。
56)本发明的另一方面涉及根据以上段落55)的突变微生物,其中遗传修饰由在特定基因中一个或多个碱基的抑制、替代、删除和/或添加组成,目的为表达一个或多个具有更高活性的蛋白质或表达更高水平的这种或这些蛋白质。
57)本发明的另一方面涉及根据以上段落55)的突变微生物,其中特定基因的过量表达是通过增加基因拷贝数和/或导入比野生型启动子活性更强的启动子而获得的。
58)本发明的另一方面涉及根据以上段落55)或57)的突变微生物,其中特定基因的过量表达是通过用根据以上段落13、14或17的重组DNA构建体转化产生大环内酯的微生物,允许该基因过量表达而获得的。
59)本发明的另一方面涉及根据以上段落55)、56)、57)或58)的突变微生物,其中遗传修饰是在一个或多个含有对应于一个或多个序列SEQ IDNo.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一或其变体之一或由于遗传密码简并性而由其衍生的序列之一的基因中进行的。
60)本发明的另一方面涉及根据以上段落55)、56)、57)、58)或59)的突变微生物,其中微生物过量表达一个或多个含有对应于一个或多个序列SEQ ID No.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一或其变体之一或由于遗传密码简并性而由其衍生的序列之一的基因。
61)本发明的另一方面涉及根据以上段落55)、56)、57)、58)、59)或60)的突变微生物,其中所述微生物是链霉菌属的细菌。
62)本发明的另一方面涉及根据以上段落55)、56)、57)、58)、59)、60)或61)的突变微生物,其中大环内酯是螺旋霉素。
63)本发明的另一方面涉及根据以上段落55)、56)、57)、58)、59)、60)、61)或62)的突变微生物,其中所述微生物是生二素链霉菌菌株。
64)本发明的另一方面涉及产生大环内酯的方法,该方法包括以下步骤:
(a)在适当的培养基中培养根据以上段落55)、56)、57)、58)、59)、60)、61)、62)、63)或64)之一的微生物,
(b)回收条件培养基或细胞提取物,
(c)自步骤b)获得的所述培养基或者细胞提取物中分离并纯化所产生的大环内酯。
65)本发明的另一方面涉及根据以上段落1)、2)、3)、4)、5)、6)、7)、8)、9)、10)、11)、12)、13)、14)、15)、16)和17)之一的序列和/或重组DNA和/或载体的用途,用于制备杂化抗生素。
66)本发明的另一方面涉及根据以上段落1)、2)、3)、4)、5)、6)、7)、8)、9)、10)、11)、12)、13)、14)、15)、16)、17)和21)之一的至少一条多核苷酸和/或至少一个重组DNA和/或至少一个表达载体和/或至少一条多肽和/或至少一种宿主细胞的用途,用于进行一种或多种生物转化。
67)本发明的另一方面涉及多核苷酸,所述多核苷酸是与根据以上段落1)、2)、3)、4)、5)或6)的多核苷酸之一互补的多核苷酸。
68)本发明的另一方面涉及产生至少一种螺旋霉素的微生物,所述微生物过量表达:
-通过聚合酶链式反应(PCR)使用以下序列引物对:
5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3’(SEQ IDNo.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA 3’(SEQID No.139)以及以粘粒pSPM36或生二素链霉菌总DNA作为模板能够获得的基因,
-或者由于遗传密码简并性而由其衍生的基因。
69)本发明的另一方面涉及根据段落68或90的微生物,该微生物是链霉菌属的细菌。
70)本发明的另一方面涉及根据段落68、69或90的微生物,该微生物是生二素链霉菌种的细菌。
71)本发明的另一方面涉及根据段落68、69、70或90的微生物,其中所述基因的过量表达是通过用表达载体转化所述微生物而获得的。
72)本发明的另一方面涉及生二素链霉菌菌株,所述菌株是菌株OSC2/pSPM75(1)或菌株OSC2/pSPM75(2),保藏在国立微生物保藏中心(CNCM)[National Collection of Cultures and Microorganisms]巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2003年10月6日,保藏号为I-3101。
73)本发明的另一方面涉及重组DNA,其包含:
-通过聚合酶链式反应(PCR)使用以下序列引物对:
5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3’(SEQ IDNo.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA 3’(SEQID No.139)以及以粘粒pSPM36或生二素链霉菌总DNA作为模板能够获得的多核苷酸,
-或者该多核苷酸中至少10,12,15,18,20至25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1460,1470,1480,1490或1500个连续核苷酸的片段。
74)本发明另一方面涉及根据段落73或91的重组DNA,所述重组DNA是载体。
75)本发明另一方面涉及根据段落73、74或91的重组DNA,所述重组DNA是表达载体。
76)本发明另一方面涉及已经将至少一个根据段落73、74、75或91的重组DNA导入其中的宿主细胞。
77)本发明另一方面涉及产生多肽的方法,其中所述方法包括以下步骤:
a)用至少一个根据段落75的表达载体转化宿主细胞;
b)在适当培养基中培养所述宿主细胞;
c)回收条件培养基或细胞提取物;
d)从步骤c)获得的所述培养基或者细胞提取物中分离并纯化所述多肽;
e)根据需要,表征所产生的重组多肽。
78)本发明另一方面涉及根据段落51的微生物,其中基因失活是通过同相(in-phase)删除含有对应于SEQ ID No.13的序列或由于遗传密码简并性而由其衍生的序列之一的基因或基因部分而进行的。
79)本发明另一方面涉及根据段落41、42、43、44、45、46、47、48、49、50、51和78之一的微生物,该微生物也过量表达:
-通过聚合酶链式反应(PCR)使用以下序列引物对:
5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3’(SEQ ID No.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA3’(SEQ ID No.139)以及以粘粒pSPM36或生二素链霉菌总DNA作为模板能够获得的基因,
-或者由于遗传密码简并性而由其衍生的基因。
80)本发明另一方面涉及表达载体,其中序列SEQ ID No.47的多核苷酸或由于遗传密码简并性而由其衍生的多核苷酸,是置于允许生二素链霉菌中由所述多核苷酸编码的蛋白质表达的启动子控制之下的。
81)本发明另一方面涉及根据段落80的表达载体,该载体是质粒pSPM524或pSPM525。
82)本发明另一方面涉及用根据段落80或81的载体转化了的生二素链霉菌菌株。
83)本发明另一方面涉及根据段落41、42、43、44、45、46、47、48、49、50、51、78、79和92之一的微生物,所述微生物也过量表达具有编码序列SEQ ID No.47或由于遗传密码简并性由其衍生的编码序列的基因。
84)本发明另一方面涉及根据段落83的微生物,该微生物是菌株SPM502 pSPM525,保藏在国立微生物保藏中心(CNCM)巴斯德研究所,25rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2003年2月26日,保藏号为I-2977。
85)本发明另一方面涉及产生螺旋霉素的方法,该方法包括以下步骤:
(a)在适当培养基中培养根据段落68、69、70、71、72、78、79、82、83、84、90和92之一的微生物,
(b)回收条件培养基或细胞提取物,
(c)从步骤b)获得的所述培养基或者细胞提取物中分离并纯化螺旋霉素。
86)本发明另一方面涉及多肽,其序列包括序列SEQ ID No.112或序列SEQ ID No.142。
87)本发明另一方面涉及多肽,其序列对应于从以下编码序列翻译的序列:
-通过聚合酶链式反应(PCR)使用以下序列引物对:
5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3’(SEQ IDNo.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA3’(SEQID No.139)以及以粘粒pSPM36或生二素链霉菌总DNA作为模板能够获得的基因的序列,
-或者由于遗传密码简并性而由其衍生的基因的序列。
88)本发明另一方面涉及允许根据段落86、87或93的多肽在生二素链霉菌中表达的表达载体。
89)本发明另一方面涉及根据段落88的表达载体,该表达载体是质粒pSPM75。
90)本发明另一方面涉及根据段落68的微生物,其中能够通过聚合酶链式反应获得的基因是编码序列SEQ ID No.141的基因或由于遗传密码简并性由其衍生的基因。
91)本发明另一方面涉及根据段落73的重组DNA,其中能够通过聚合酶链式反应获得的多核苷酸是序列SEQ ID No.141的多核苷酸。
92)本发明另一方面涉及根据段落79的微生物,其中能够通过聚合酶链式反应获得的基因是编码序列SEQ ID No.141的基因或由于遗传密码简并性由其衍生的基因。
93)本发明另一方面涉及多肽,其序列是SEQ ID No.142。
总体定义
为了本发明的目的,术语“分离的”表示已经从其原来的环境(其天然存在的环境)移出的生物物质(核酸或蛋白质)。
例如,以天然状态存在于植物或动物中的多核苷酸是未分离的。从其天然插入到植物或动物基因组中的相邻核酸分开的多核苷酸被认为是“分离的”。
此种多核苷酸能够包括在载体中和/或此种多核苷酸能够包括于组合物中,然而由于载体或组合物不构成其天然环境的事实此种多核苷酸依然为分离状态。
术语“纯化的”不要求物质以排除其它化合物存在的绝对纯形式存在。它更多地是一个相对的定义。
从起始物质或天然物质纯化之后处于“纯化的”状态的多核苷酸至少提高一个数量级,优选地为2或3,并且更加优选地为4或5个数量级。
对于本发明的目的,术语ORF(“开放阅读框”)已经用于具体地表示基因的编码序列。
对于本发明的目的,表述的“核苷酸序列”能够等同地用于表示多核苷酸或者核酸。表述的“核苷酸序列”包括遗传物质本身但并不因此而限于与其序列相关的信息。
术语“核酸”、“多核苷酸”、“寡核苷酸”或作为选择的“核苷酸序列”包括RNA、DNA或cDNA序列或者核苷酸的RNA/DNA杂合序列,同样包括单链形式或双链形式。
术语“核苷酸”即表示天然核苷酸(A,T,G,C)并且也表示包含至少一种修饰例如(1)嘌呤类似物、(2)嘧啶类似物或(3)糖类似物的核苷酸,此类修饰的例子描述于诸如PCT申请WO 95/04064中。
对于本发明的目的,当第一多核苷酸的每个碱基配对于第二多核苷酸的互补碱基,它们的方向是相反的,则认为第一多核苷酸与第二多核苷酸“互补”。互补碱基是A和T(或A和U),或C和G。
术语“螺旋霉素生物合成途径的基因”也包括调节基因和赋予生产者微生物抗性的基因。
根据本发明,术语参照核酸的“片段”意思是指比参照核酸短的核苷酸序列并且在相同的部分包含与参照核酸相同的核苷酸序列。
根据本发明,此种核酸“片段”,根据需要,可以作为其组分包括于更大的多核苷酸中。
此类片段包含或者可以说由根据本发明的核酸的长度范围从8,10,12,15,18,20到25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850或1900个连续核苷酸的多核苷酸组成。
根据本发明,术语多肽的“片段”意思是指比参照多肽短的多肽氨基酸序列并且在与参照多肽相同的所有部分包含相同的氨基酸序列。
此类片段,根据需要,可以作为其部分包括于更大的多肽中。
根据本发明的多肽的此类片段氨基酸长度可以是10,15,20,30到40,50,60,70,80,90,100,120,140,160,180,200,220,240,260,280,300,320,340,360,380,400,420,440,460,480,500,520,540,560,580,600,620或640。
对于本发明的目的,表达“高严格性杂交条件”意思是指不利于非同源核酸链杂交的杂交条件。例如,高严格性杂交条件可以描述为在Church和Gilbert(Church & Gilbert,1984)所述的缓冲液中温度在55℃和65℃之间的杂交条件;优选地为杂交温度是55℃,甚至更加优选地为杂交温度是60℃,并且最优选地为杂交温度是65℃,之后在2X SSC缓冲液(1X SSC缓冲液对应于0.15M NaCl,15mM柠檬酸钠的水溶液)中进行一次或多次洗涤,温度为55℃和65℃之间;优选地该温度是55℃,甚至更加优选地该温度是60℃,并且最优选地为该温度是65℃,之后在0.5X SSC缓冲液中进行一次或多次洗涤,温度为55℃和65℃之间;优选地该温度是55℃,甚至更加优选地该温度是60℃,并且最优选地为该温度是65℃。
不用说,根据本领域技术人员熟知的技术能够将上述的杂交条件能够调整为所寻找的杂交的核酸长度的函数。例如,可根据F.Ausubel等(2002)的工作调整适宜的杂交条件。
根据本发明术语核酸的“变体”意思是指与参照多核苷酸存在一个或多个碱基不同的核酸。变体核酸可以是天然来源的,例如天然发现的等位基因变体,或者也可以是诸如通过诱变技术获得的非天然变体。
一般而言,参照核酸与变体核酸之间的不同是很小的,以至于参照核酸的核苷酸序列与变体核酸的核苷酸序列非常相近,并且在一些区域是相同的。存在于变体核酸中的核苷酸修饰可以是沉默的,这意味着它们不改变由所述变体核酸编码的氨基酸序列。
然而,变体核酸中的核苷酸改变也可以导致与由参照核酸编码的肽相比由变体核酸编码的多肽中的替代、添加和/或删除。此外,编码区中的核苷酸修饰可以在氨基酸序列中产生保守或非保守的替代。
优选地,根据本发明变体核酸编码基本上保留与参照核酸的多肽相同的功能和生物学活性的多肽,或者所编码的多肽能被针对起始核酸所编码的多肽的抗体识别。
因此一些变体核酸编码突变形式的多肽,这方面的系统研究将可能推导出正在谈论的蛋白质的结构-活性关系。
根据本发明,术语多肽的“变体”意思主要是指其氨基酸序列与参照多肽的氨基酸序列相比,含有一个或多个至少一个氨基酸残基的替代、添加或删除的多肽,可以理解氨基酸替代可以随便是保守的或非保守的。
优选地,根据本发明的变体多肽基本上具有与参照多肽相同的功能或活性,或者保留被针对起始多肽的抗体识别的能力。
对于本发明的目的,与参照多肽“活性相似”的多肽意思是指在适于测定参照多肽生物学活性的生物学分析中进行测定时,具有与参照多肽活性相近但不必须完全相同的生物学活性的多肽。
对于本发明的目的,术语“杂化抗生素”意思是指通过使用重组DNA技术构建人工生物合成途径而产生的化合物。
发明详述
本发明的主题更加具体地是如以下发明详述所呈现的螺旋霉素生物合成途径的新基因和参与该生物合成的新多肽。
克隆了生物合成途径的基因并确定了这些基因的DNA序列。利用FramePlot程序(J.Ishikawa和K.Hotta,1999)分析所获得的序列。在这些开放阅读框中,鉴定了那些呈现典型链霉菌密码子选择的开放阅读框。该分析表明该区域含有44个定位于5个编码酶“聚酮化合物合酶”(PKS)的基因任意一侧的ORF,并且呈现了典型的链霉菌密码子选择。在这5个编码PKS的任意一侧,分别鉴定了下游和上游10和34个ORF(通过全部以相同方向定位的5个PKS基因的方向定义上游和下游)(参照图3和37)。因此,这种类型的34个开放阅读框,占据大约41.7kb的区域(见呈现含有25个ORF的31kb的第一个区域的SEQ ID No.1和呈现大约12.1kb的SEQ ID No.140,其中1.4kb重叠上述序列(SEQ ID No.1)并且其中大约10.7kb与随后的序列一致,大约10.7kb的后一部分含有9个额外ORF的部分(包括一个ORF的部分序列)也见下面的图3和37)鉴定为5个编码PKS的基因的上游,并且占据大约11.1kb区域的10个ORF(SEQ ID No.2和图3)鉴定为PKS基因的下游。定位于5个PKS基因下游的10个基因命名为orf1*c,orf2*c,orf3*c,orf4*c,orf5*,orf6*,orf7*c,orf8*,orf9*和orf10*(SEQ ID No.3,5,7,9,11,13,15,17,19和21)。对于正在讨论的ORF,基因名称中加入的“c”表示编码序列是反向的(因此编码链是与SEQ ID No.2中给出的这些基因的序列互补的链)。使用相同的命名法,PKS基因上游的34个ORF命名为orf1,orf2,orf3,orf4,orf5,orf6,orf7,orf8,orf9c,orf10,orf11c,orf12,orf13c,orf14,orf15c,orf16,orf17,orf18,orf19,orf20,orf21c,orf22c,orf23c,orf24c,orf25c,orf26,orf27,orf28c,orf29,orf30c,orf31,orf32c,orf33和orf34c(SEQ ID Nos 23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149)(参照图3和37)。
使用各种程序将从这些开放阅读框推导出的蛋白质序列与各种数据库中存在的蛋白质序列进行比较:BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索、COGs(Cluster of Orthologous Groups)(这三个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)获得)、FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),BEAUTY(K.C.Worley等,1995)),(这两个程序尤其可以从INFOBIOGEN资源中心,Evry,France获得)。这些比较使得能够明确描述关于这些基因产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。
定位于编码PKS的基因下游的基因
在图3中给出了该区域组成结构的图解说明。如下将阐明,在编码PKS的基因的下游鉴定的10个基因中,9个显示参与螺旋霉素生物合成或螺旋霉素抗性。它们是下面9个基因:orf1*c,orf2*c,orf3*c,orf4*c,orf5*,orf6*,orf7*c,orf8*和orf9*
在下面的表1中给出了在5个PKS基因下游鉴定出的10个基因的参照DNA序列和氨基酸序列。
                           表1
基因    在序列SEQ ID No.2中的位置 DNA序列 多肽序列
  orf1*c    10882-10172   SEQ ID No.3   SEQ ID No.4
  orf2*c    10052-8781   SEQ ID No.5   SEQ ID No.6
  orf3*c    8741-7476   SEQ ID No.7   SEQ ID No.8
  orf4*c    7459-6100   SEQ ID No.9   SEQ ID No.10
  orf5*    5302-5976   SEQ ID No.11   SEQ ID No.12
  orf6*    4061-5305   SEQ ID No.13   SEQ ID No.14
  orf7*c    3665-2817   SEQ ID No.15   SEQ ID No.16
  orf8*    1925-2755   SEQ ID No.17   SEQ ID No.18
  orf9*    1007-1888   SEQ ID No.19   SEQ ID No.20
  orf10*    710-937   SEQ ID No.21   SEQ ID No.22
基因名称中加入的“c”表示编码序列是反向的(因此编码链是与SEQID No.2中给出的这些基因的序列互补的链)。
为了测定所鉴定的多肽的功能,开展了三种类型的实验:将所鉴定的序列与已知功能的序列进行比较,基因失活实验导致构建突变菌株,和分析由这些突变菌株产生的螺旋霉素和螺旋霉素生物合成中间体。
首先使用不同程序将从这些开放阅读框推导出的蛋白质序列与不同数据库中存在的蛋白质序列进行比较:BLAST(Altschul等,1990)(Altschul等,1997)、CD-search、COGs(Cluster of Orthologous Groups)、FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),BEAUTY(K.C.Worley等,1995))。这些比较使得能够明确描述关于这些基因的产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。表2显示了与定位于5个PKS基因下游的10个基因的产物呈现强相似性的蛋白质。
                                          表2
基因产物 呈现显著相似性的蛋白质 GenBank登录号 BLAST*分值 所报告的功能
orf1*c TylMI(orf3*)(弗氏链霉菌(S.fradiae)) CAA57473 287 N-甲基转移酶
orf2*c dnrQ基因产物(波赛链霉菌(Streptomyces peucetius)) AAD15266 153 未知
orf3*c TylMII(orf2*)(弗氏链霉菌) CAA57472  448 糖基转移酶
orf4*c 巴豆酰辅酶A还原酶(天蓝色链霉菌(S.coelicolor)) NP_630556 772 巴豆酰辅酶A还原酶
orf5* MdmC(生米卡链霉菌(S.mycarofaciens)) B42719 355 O-甲基转移酶
orf6* 3-O-酰基转移酶(生米卡链霉菌) Q00718 494 酰基转移酶
orf7*c MdmA(生米卡链霉菌) A60725 380 参与麦迪霉素抗性的蛋白质
orf8* ABC-转运蛋白(灰色链霉菌(S.griseus)) CAC22119 191 ABC-转运蛋白
orf9* ABC-转运蛋白(灰色链霉菌) CAC22118  269 ABC-转运蛋白
orf10* 预测的小保守推定蛋白质(天蓝色链霉菌) NP_627432 109 未知
*较大的序列相似性与较高的BLAST分值有关(Altschul等,1990)。
为了确证这些结果进行了基因失活实验。所使用的方法在于进行基因置换。使用赋予其抗生素(例如阿泊拉霉素、遗传霉素或潮霉素)抗性的盒中断的该基因的拷贝替换要中断的靶基因。所使用的盒在任意一侧紧挨所有阅读框中的翻译终止密码子和在链霉菌中具活性的转录终止子。将盒插入靶基因可以伴有或者可以不伴有在该靶基因中的删除。盒两侧区域的大小可以从几百个到几千个碱基对。第二种类型的盒能够用于基因失活:盒称为“可切除盒”。这些盒在被导入生二素链霉菌基因组之后具有通过位点特异性重组在链霉菌中被切除的优点。目的是失活链霉菌菌株中的某些基因而不在最终的菌株中留下不属于该菌株的选择性标记或大的DNA序列。切除之后,仅大约30个碱基对的短序列(称为“瘢痕”位点)残存在菌株的基因组中(参照图10)。该系统的用途最初在于用已经将可切除盒插入到该靶基因中的构建体替换靶基因的野生型拷贝(由于两个同源重组事件,参照图9)。该盒的插入伴有靶基因中的删除(参照图9)。其次,引起从菌株的基因组切除可切除盒。可切除盒通过位点专一重组系统发挥作用并且具有能够获得最终不携带抗性基因的链霉菌突变体的优点。也避免了对定位于失活基因下游的基因表达可能产生的极性影响(参照图10)。如此构建的菌株用于测试它们的螺旋霉素产量。
由于序列比较实验使得能够确定orf1*c、orf2*c、orf3*c和orf4*c基因与参与较近似的抗生素生物合成的基因具有相对高的相似性,所以不失活orf1*c、orf2*c、orf3*c和orf4*c基因。因此,orf1*c基因编码与tylMI基因所编码的蛋白质呈现66%同一性(利用BLAST程序测定)的蛋白质,其中tylMI基因编码N-甲基转移酶,该酶参与泰乐菌素的生物合成并催化弗氏链霉菌的碳霉糖产生过程中3-N-甲基化作用(A.R.Gandecha等,1997;GenBank登录号:CAA57473;BLAST分值:287)。这种与参与另一种较相关抗生素生物合成途径的蛋白质的相似性,以及更加具体地参与碳霉糖生物合成,暗示出orf1*c基因编码负责forosamine或碳霉糖生物合成中N-甲基化作用的N-甲基转移酶(参照图5和6)。由orf1*c基因编码的蛋白质与其它有机体中其它具有相似功能的蛋白质呈现高度相似性这一事实支持这种假说(参照表3)。
                              表3
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
甲基转移酶(抗生链霉菌(S.antibioticus)) CAA05643 277 甲基转移酶
N,N-二甲基转移酶(委内瑞拉链霉菌(S.venezuelae)) AAC68678  268 N,N-甲基转移酶
可能的N-甲基化酶snogX(黑胡桃链霉菌(S.nogalater)) T46679  243 N-甲基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf2*c基因编码的蛋白质与编码在弗氏链霉菌中参与泰乐菌素生物合成的NDP己糖3,4-异构酶的tylMIII基因所编码的蛋白质呈现相对强相似性(35%同一性)(A.R.Gandecha等,1997;GenBank登录号:CAA57471;BLAST分值:130)。其与参与另一种相关抗生素生物合成途径,更加具体而言是参与碳霉糖生物合成的蛋白质的相似性,强烈暗示orf2*c基因编码在一种螺旋霉素的糖可能是碳霉糖生物合成过程中负责异构化作用的NDP己糖3,4-异构酶(参照图5和6)。
orf3*c基因编码的蛋白质与编码在弗氏链霉菌中参与泰乐菌素生物合成的糖基转移酶的tylMII基因所编码的蛋白质呈现相对强相似性(59%同一性)(A.R.Gandecha等,1997;GenBank登录号:CAA57472;BLAST分值:448)。其与参与另一种相关抗生素生物合成途径蛋白质的相似性强烈暗示orf3*c基因编码糖基转移酶。由orf3*c基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表4)。
                               表4
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
糖基转移酶(委内瑞拉链霉菌) AAC68677  426 糖基转移酶
糖基转移酶(抗生链霉菌) CAA05642  425 糖基转移酶
糖基转移酶(红色糖多孢菌(Saccharopolyspora erythraea)) CAA74710 395 糖基转移酶
糖基转移酶(抗生链霉菌) CAA05641  394 糖基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf4*c基因编码与巴豆酰-CoA还原酶呈现相对强相似性的蛋白质。具体而言,orf4*c编码的蛋白质与来自天蓝色链霉菌的巴豆酰-CoA还原酶(M.Redenbach等,1996;GenBank登录号:NP_630556;BLAST分值:772)具有相当高的相似性。其与参与另一种相关抗生素生物合成途径蛋白质的相似性强烈暗示orf4*c基因也编码巴豆酰-CoA还原酶。由orf4*c基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表5)。
                                    表5
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
反式-2-烯酰基-CoA还原酶(EC1.3.1.38)(丘链霉菌(S.collinus)) S72400 764 反式-2-烯酰基-CoA还原酶
巴豆酰-CoA还原酶(弗氏链霉菌) CAA57474 757 巴豆酰-CoA还原酶
巴豆酰-CoA还原酶(肉桂地链霉菌(S.cinnamonensis)) AAD53915 747 巴豆酰-CoA还原酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf6*基因与存在于生米卡链霉菌中产生大环内酯抗生素的mdmB基因(Hara和Hutchinson,1992;GenBank登录号:A42719;BLAST分值:489)呈现某种相似性。在该生产者中,所述基因参与内酯环的酰化作用。因此认为orf6*基因编码酰基转移酶。由orf6*基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表6)。
                                 表6
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
AcyA(耐热链霉菌(Streptomycesthermotolerans)) J4001 450 大环内酯3-O-酰基转移酶
麦迪霉素4”-O-丙酰转移酶(生米卡链霉菌) BAA09815 234 麦迪霉素4”-O-丙酰转移酶
Mycarose O-酰基转移酶(黑孢小单孢菌黑孢亚种(Micromonosporamegalomicea subsp.Nigra)) AAG13909 189 mycarose O-酰基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
通过同相删除/倒位可产生orf6*基因的失活并且表明所得到的菌株不再产生螺旋霉素II和III而仅产生螺旋霉素I(参照图1)。这证实orf6*基因确实参与螺旋霉素II和III的合成。由该基因编码的酶负责通过将乙酰基或丁酰基连接于3-位的碳上而形成螺旋霉素II和III。由于不再表达由orf6*基因编码的蛋白质的菌株不再产生螺旋霉素II和III而仅产生螺旋霉素I,所以它们是特别有利的。如上面所指出,螺旋霉素I的抗生素活性明显大于螺旋霉素II和III(Liu等,1999)。
orf5*基因编码与几种O-甲基转移酶呈现相对强相似性的蛋白质。具体而言,orf5*编码的蛋白质与来自生米卡链霉菌的O-甲基转移酶(EC 2.1.1.-)MdmC(Hara和Hutchinson,1992;GenBank登录号:B42719;BLAST分值:355)具有相当高的相似性。其与参与另一种抗生素生物合成途径的蛋白质的相似性强烈暗示orf5*基因也编码O-甲基转移酶。认为orf5*基因参与合并入内酯环的前体的形成。事实上,根据序列比较,orf5*基因的产物也相对近似于FkbG,依据文献FkbG负责羟基丙二酰-ACP的甲基化作用(Wu等,2000;Hoffmeister等,2000;GenBank登录号:AAF86386;BLAST分值:247)(参照图8)。由orf5*基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表7)。
                                 表7
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
可能的O-甲基转移酶(EC 2.1.1.-)safC(黄色粘球菌(Myxococcusxanthus)) T18553 223 O-甲基转移酶
4-O-甲基转移酶(EC 2.1.1.-)-(链霉菌属中的某些种) JC4004  222  O-甲基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
由于非切除盒插入orf6*基因的极性效应,已经可确定orf5*基因对于螺旋霉素的生物合成途径是必需的。更明确地讲,可切除盒插入orf6*基因的编码部分导致螺旋霉素产生完全停止。然而,一旦所插入的盒被切除(并因此当仅orf6*基因失活时,参照实施例14和15),则再次观察到螺旋霉素I产生。这表明orf5*基因对于螺旋霉素的生物合成途径是必需的,因此该基因的失活导致螺旋霉素产生完全停止。
orf5*基因编码与几种O-甲基转移酶呈现相对强相似性的蛋白质。认为orf5*基因是直接参与platenolide合成或者参与通过PKS合并入platenolide的甲基化前体(甲氧基丙二酰,参照图8)合成的O-甲基转移酶。为了证明该假说,对基因型为:orf6*∷att1Ωhyg+的生二素链霉菌菌株进行了LC/SM和NMR分析实验。在该菌株中,由于含有转录终止子的盒插入到orf6*基因中的极性效应,orf5*基因不表达(参照实施例27)。已经表明该菌株产生一种其紫外光谱看起来与螺旋霉素I紫外光谱相似的分子,但质谱在829处显示分子离子。与螺旋霉素质量相比存在的14个质量的差异能够解释为在内酯环4号碳负荷的氧上甲基的删除(在图39中给出了该化合物的结构)。由NMR所获得的结果与该假说相一致。在829处存在的化合物使得确认orf5*在螺旋霉素的作用的假说成为可能。此外,当在微生物藤黄微球菌(Micrococcus luteus)进行测试时,与未修饰的螺旋霉素相比,相应于不含甲基的螺旋霉素的产物呈现非常弱的微生物学活性(弱10倍)。
orf7*c基因编码与生米卡链霉菌的mdmA基因所编码的蛋白质呈现相对强相似性的蛋白质,后者基因编码生产者的酶中参与麦迪霉素抗性的蛋白质(Hara等,1990;GenBank登录号:A60725;BLAST分值:380)。这种与参与另一种抗生素生物合成途径的蛋白质的相似性强烈暗示orf7*c基因也编码参与螺旋霉素抗性的蛋白质。更加具体而言,由orf7*c基因所编码的酶具有甲基转移酶活性并且在生二素链霉菌中参与螺旋霉素抗性。已经证明该基因赋予MLS I型抗性,已知该抗性是由于在23S核糖体RNA的A2058位置单甲基化作用产生的(Pernodet等,1996)。由orf7*基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表8)。
                           表8
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
大环内酯-lincosamide-链阳菌素B抗性决定簇(弗氏链霉菌) JC5319 238 23S rRNA甲基转移酶
23S核糖体RNA甲基转移酶ErmML(藤黄微球菌) AAL68827 119 23S rRNA甲基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf8*基因编码与灰色链霉菌中ABC转运子型蛋白质呈现相对强相似性的蛋白质(Campelo,2002,GenBank登录号:CAC22119;BLAST分值:191)。这种与ABC转运子型蛋白质的相似性强烈暗示orf8*基因也编码可能参与螺旋霉素抗性的ABC转运子型蛋白质。由orf8*基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表9)。
                         表9
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
AcrW(加利利链霉菌(Streptomyces galilaeus)) BAB72060 94 ABC转运蛋白
柔红霉素抗性跨膜蛋白(波赛链霉菌) P32011 89 柔红霉素抗性
可能的ABC-转运蛋白,跨膜组分(天蓝色链霉菌) NP_626506 89 ABC转运蛋白
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf9*基因编码与灰色链霉菌中ABC转运子型蛋白质呈现相对强相似性的蛋白质(Campelo,2002,GenBank登录号:CAC22118;BLAST分值:269)。这种与ABC转运子型蛋白质的相似性强烈暗示orf9*基因也编码可能参与螺旋霉素抗性的ABC转运子型蛋白质。由orf9*基因所编码的蛋白质与其它有机体中具有相似功能的其他蛋白质呈现强相似性的事实支持该假说(参照表10)。
                         表10
呈现显著相似性的蛋白质 GenBank登录号   BLAST*分值  所报道的功能
可能的ABC-转运蛋白,ATP-结合组分(天蓝色链霉菌) NP_626505   231  ABC转运蛋白
预测的ABC转运蛋白ATP-结合组分(天蓝色链霉菌) NP_627624   228  ABC转运蛋白
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf10*基因编码与一种未知功能蛋白质呈现相对强相似性的蛋白质。然而,在参与抗生素生物合成的基因的几组基因中间发现了与orf10*相似的基因。因此,与orf10*近似的基因发现于天蓝色链霉菌(Redenbach等,1996,GenBank登录号:NP_627432,BLAST分值:109)。近似基因(CouY)也发现于利尻链霉菌(S.rishiriensis)中(Wang等,2000,GenBank登录号:AAG29779,BLAST分值97)。
             定位于编码PKS的基因上游的基因
在定位于编码PKS的基因上游的DNA序列中(通过全部以相同方向定位的5个PKS基因的方向定义下游和上游)(参照图3),已经鉴定了34个ORF(参照上面)。因此,该类型的34个开放阅读框占据了大约41.7kb的区域(参照SEQ ID No.1呈现含有25个ORF的31kb第一区和SEQID No.140呈现大约12.1kb的区域,其中1.4kb与先前序列(SEQ ID No.1)重叠并且其中大约10.7kb对应于随后的序列),大约10.7kb的较后面部分含有9个另外的ORF(包括ORF部分序列),也参照下面的图3和37)。在图5和37中图解说明了该区域的组成。所鉴定的34个基因命名为:orf1,orf2,orf3,orf4,orf5,orf6,orf7,orf8,orf9c,orf10,orf11c,orf12,orf13c,orf14,orf15c,orf16,orf17,orf18,orf19,orf20,orf21c,orf22c,orf23c,orf24c,orf25c,orf26,orf27,orf28c,orf29,orf30c,orf31,orf32c,orf33和orf34c。
下面表11中给出了在5个PKS基因上游所鉴定出的34个基因的参考DNA和氨基酸序列。
                            表11
基因1  在序列SEQ IDNo.1中的位置  DNA序列  多肽序列2
 orf1  658-1869  SEQ ID No.23  SEQ ID No.24
 orf2  1866-2405  SEQ ID No.25  SEQ ID No.26和27
 orf3  2402-3568  SEQ ID No.28  SEQ ID No.29
 orf4  3565-4473  SEQ ID No.30  SEQ ID No.31,32和33
 orf5  4457-5494  SEQ ID No.34  SEQ ID No.35
 orf6  5491-6294  SEQ ID No.36  SEQ ID No.37,38和39
 orf7  6296-7705  SEQ ID No.40  SEQ ID No.41和42
 orf8  8011-9258  SEQ ID No.43  SEQ ID No.44
 orf9c  10081-9362  SEQ ID No.45  SEQ ID No.46
 orf10  10656-12623  SEQ ID No.47  SEQ ID No.48
 orf11c  14482-12734  SEQ ID No.49  SEQ ID No.50,51和52
 orf12  14601-16031  SEQ ID No.53  SEQ ID No.54,55,56,57,58和59
 orf13c  17489-16092  SEQ ID No.60  SEQ ID No.61
 orf14  17809-18852  SEQ ID No.62  SEQ ID No.63
 orf15c  20001-18961  SEQ ID No.64  SEQ ID No.65
 orf16  20314-21552  SEQ ID No.66  SEQ ID No.67
 orf17  21609-22879  SEQ ID No.68  SEQ ID No.69
 orf18  22997-24175  SEQ ID No.70  SEQ ID No.71
 orf19  24177-25169  SEQ ID No.72  SEQ ID No.73
 orf20  25166-26173  SEQ ID No.74  SEQ ID No.75
 orf21c  27448-26216  SEQ ID No.76  SEQ ID No.77
 orf22c  28560-27445  SEQ ID No.78  SEQ ID No.79
 orf23c  29770-28649  SEQ ID No.80  SEQ ID No.81
 orf24c  30074-29763  SEQ ID No.82  SEQ ID No.83
 orf25c  30937-30071  SEQ ID No.84  SEQ ID No.85
 基因1  在序列SEQ IDNo.1中的位置  DNA序列  多肽序列2
 orf26  1647-2864  SEQ ID No.107  SEQ ID No.108
 orf27  2914-3534  SEQ ID No.109  SEQ ID No.110
 orf28c  4967-3804  SEQ ID No.141  SEQ ID No.142
 orf29  5656-6663  SEQ ID No.113  SEQ ID No.114
 orf30c  7723-66867534-6686  SEQ ID No.115SEQ ID No.143  SEQ ID No.116和117SEQ ID No.144
 orf31  7754-8728  SEQ ID No.118  SEQ ID No.119
 orf32c  10488-8977  SEQ ID No.145  SEQ ID No.146
 orf33  10562-10837  SEQ ID No.147  SEQ ID No.148
 orf34c  12134-10899  SEQ ID No.149  SEQ ID No.150
1基因名称中加的“c”表示编码序列是反向的(因此编码链与SEQ IDNo.1或SEQ ID No.140所给出的这些基因的序列互补)。
2当几个蛋白质序列表明处于同一个开放阅读框时,相应的蛋白质来自几个可能的翻译起始位点。
为了确定上面表11中所鉴定的多肽的功能,进行了三种类型的实验:比较所鉴定的具有已知功能序列的序列的同一性、基因失活实验、和通过这些突变株分析螺旋霉素的产生。
利用各种程序:BLAST(Altschul等,1990)(Altschul等,1997)、CD-查找、COGs(定向进化同源群聚类簇)、FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990)、BEAUTY(K.C.Worley等,1995))(参照上面),首先将从这些开放阅读框推导出的蛋白质序列与多种数据库已经存在的序列进行比较。这些比较使得能够明确描述关于这些基因产物功能的假说并鉴定那些倾向于参与螺旋霉素生物合成的基因。表12列出了与定位在5个PKF基因上游的34个基因呈现强相似性的蛋白质。
                           表12
基因 呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
orf1 细胞色素P450tylI(弗氏链霉菌) S49051 530 细胞色素P450
orf2 ORF15x4(鳗利斯顿氏菌(Listonella anguillarum)) AAB81630 113 未知
orf3 氨基转移酶样蛋白质(抗生链霉菌) AAF59939 431 氨基转移酶
orf4 α-D-葡萄糖-1-磷酸胸苷转移酶(委内瑞拉链霉菌) AAC68682 404 α-D-葡萄糖-1-磷酸胸苷转移酶
orf5 AprE(黑暗链霉菌(Streptomycestenebrarius)) AAG18457 476 dTDP-葡萄糖4,6-脱水酶
orf6 硫酯酶(除虫链霉菌(Streptomyces avermitilis)) BAB69315 234 硫酯酶
orf7 TylCVI(弗氏链霉菌) AAF29379 461 dNTP己糖2,3-脱水酶
orf8 可能的氨基转移酶(刺糖多孢菌(Saccharopolysporaspinosa)) AAG23279 465 氨基转移酶
orf9c SrmX(生二素链霉菌) S25204  445 甲基转移酶
orf10 SrmR(生二素链霉菌) S25203  1074 调节蛋白质
orf11c SrmB(生二素链霉菌) S25202  955 螺旋霉素抗性
orf12 UrdQ(弗氏链霉菌) AAF72550 634 NDP-己糖3,4-脱水酶
orf13c SC4H2.17(天蓝色链霉菌) T35116  619 未知
orf14 预测的还原酶(天蓝色链霉菌) CAB90862 147 还原酶
orf15c 可能的3-酮还原酶(抗生链霉菌) T51102 285 3-酮还原酶
orf16 推定的NDP己糖3,4-异构酶(弗氏链霉菌) CAA57471 209 NDP己糖3,4-异构酶
orf17 糖基转移酶(委内瑞拉链霉菌) AAC68677 400 糖基转移酶
orf18 糖基转移酶(利尻链霉菌) AAG29785  185 糖基转移酶
orf19 NDP-己糖4-酮还原酶TylCIV(弗氏链霉菌) AAD41822 266 NDP-己糖4-酮还原酶
orf20 EryBII(红色糖多孢菌) AAB84068  491 醛-酮还原酶
orf21c TylCIII(弗氏链霉菌) AAD41823 669 NDP-己糖3-C-甲基转移酶
orf22c FkbH(吸水链霉菌(Streptomyceshygroscopicus)) AAF86387 463 参与甲氧基丙二酰生物合成
orf23c FkbI(吸水链霉菌) AAF86388  387 脂酰-CoA脱氢酶
orf24c FkbJ(吸水链霉菌) AAF86389 87 参与甲氧基丙二酰生物合成
orf25c FkbK(吸水链霉菌) AAF86390  268 脂酰-CoA脱氢酶
orf26 TylCV(弗氏链霉菌) AAD41824 471 Mycarosyl-转移酶
orf27 TylCVII(弗氏链霉菌) AAD41825 243 NDP-己糖3,5-(或5-)差向异构酶
orf28c AcyB2(耐热链霉菌) JC2032  329 调节蛋白质
orf29 β-甘露聚糖酶(纤维素囊菌(Sorangium cellulosum)) AAK19890 139 糖基-水解酶
orf30c 二磷酸核苷糖差向异构酶(谷氨酸棒杆菌(Corynebacteriumglutamicum)) NP_600590 89 二磷酸核苷糖差向异构酶
orf31 氧化还原酶(天蓝色链霉菌) NP_631148 261 氧化还原酶
orf32c GntR家族的调节蛋白质(除虫链霉菌) NP_824604 282 调节蛋白质
orf33 推定蛋白质(野油菜黄单胞菌(Xanthomonas campes-tris)) NP_635564 54 未知
orf34c 阿拉伯呋喃糖苷酶(天蓝色链霉菌) NP_630049 654 阿拉伯呋喃糖苷酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
为了证实这些结果进行了基因失活实验。所用方法在于进行基因置换。用由赋予抗生素(例如阿泊拉霉素或潮霉素)抗性的盒打断的该基因的拷贝代替要打断的靶基因。所使用的盒在任意一侧紧挨所有阅读框中的翻译终止密码子和在链霉菌中具活性的转录终止子。将盒插入靶基因可能伴有或者也可能不伴有该靶基因中的删除。盒两侧区域的大小可以从几百到几千个碱基对。可以用于基因失活的第二种类型的盒是:称为“可切除盒”(参照上面)的盒。如此构建的菌株用于测定它们螺旋霉素的产生。
orf1基因编码与几种细胞色素P450呈现相对强相似性的蛋白质。具体而言,orf1基因编码蛋白质与弗氏链霉菌中参与泰乐菌素生物合成的tylI基因所编码的蛋白质(L.A.Merson-Davies等,1994;GenBank登录号:S49051;BLAST分值:530)具有相当高的相似性。这种与参与另一种相关抗生素生物合成途径的蛋白质的相似性强烈暗示orf1基因也编码细胞色素P450。orf1基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表13)。
                              表13
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
预测的细胞色素P450 YJIB(枯草芽孢杆菌(Bacillus subtilis)) O34374  248 细胞色素P450
细胞色素P450 113A1(红色糖多孢菌) P48635  237 细胞色素P450
细胞色素P-450羟化酶同系物(天青链霉菌(Streptomyces caelestis)) AAC46023 208 细胞色素P450羟化酶
细胞色素P450单加氧酶(委内瑞拉链霉菌) AAC64105 206 细胞色素P450单加氧酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
Orf2基因编码与嗜气热硫胺素芽孢杆菌(Aneurinibacillusthermoaerophilus)的dTDP-6-脱氧-3,4-酮己酮糖异构酶(Pfoestl,A等,2003,GenBank登录号:AAO06351;BLAST分值:118)呈现相对强相似性的蛋白质。这种相似性强烈暗示Orf2基因编码异构酶,其负责螺旋霉素分子中存在的一种糖生物合成所必需的异构化反应,该糖可能是mycarose(参照图5)。进行orf2基因失活。失活实验能够显示所得到的菌株不再产生螺旋霉素。这证实orf2基因确实参与螺旋霉素生物合成。
Orf3基因编码与几种氨基转移酶呈现相对强相似性的蛋白质。具体而言,orf3编码的蛋白质与参与竹桃霉素生物合成的抗生链霉菌氨基转移酶(G.Draeger等,1999;GenBank登录号:AAF59939;BLAST分值:431)具有相当高的相似性。这种与参与另一种相关抗生素生物合成途径的蛋白质的相似性强烈暗示orf3基因编码负责螺旋霉素一种氨基糖的生物合成所必需的氨基转移反应的3-氨基转移酶(参照图5)。Orf3基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表15)。
                            表15
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
氨基转移酶(抗生链霉菌) T51111  429 氨基转移酶
转氨酶(委内瑞拉链霉菌) AAC68680  419 转氨酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
失活orf3基因。因此有可能显示所得到的菌株不再产生螺旋霉素。这证实orf3基因确实参与螺旋霉素生物合成。因此由该基因编码的酶明确地负责螺旋霉素生物合成所必需的生物转化步骤。表达弗氏链霉菌的TylB蛋白质能够补偿螺旋霉素的产生(参照实施例23)。这表明orf3基因编码负责碳霉糖生物合成所必需的氨基转移反应的3-氨基转移酶(参照图5)。由于碳霉糖是第一个待连接到platenolide上的糖,所以预期orf3敲除菌株(OS49.67)可积累platenolide。
已经研究了orf3基因敲除菌株的生物合成中间体(参照实施例20)。这些实验使得能够证明该菌株产生两种形式的platenolide:platenolide A和platenolide B,图36中给出了所推导出的这两种分子的结构。该菌株也产生platenolide A+mycarose和platenolide B+mycarose(参照实施例20和图40)。这些化合物含有糖,但不含任何碳霉糖。此外,如果将它们与螺旋霉素相比较(参照图1),这些化合物含有mycarose而不含有碳霉糖。这些结果与orf3基因产物参与碳霉糖生物合成并且具有3氨基转移酶的作用以负责碳霉糖生物合成所必需的氨基转移反应是一致的(参照图5)。可以注意到,由于发现了一些分子其mycarose连接在正常情况应由碳霉糖占用的位置,所以显示出糖基化作用的特异性不是绝对的(参照图40)。
orf4基因编码与几种NDP-葡萄糖合成酶呈现相对强相似性的蛋白质。具体而言,orf4编码的蛋白质与委内瑞拉链霉菌的α-D-葡萄糖-1-磷酸胸苷转移酶(Y.Xue等,1998;GenBank登录号:AAC68682;BLAST分值:404)具有相当高的相似性。这种与参与另一种相关抗生素生物合成途径的蛋白质的相似性强烈暗示orf4基因编码NDP-葡萄糖合成酶,该酶负责合成掺入螺旋霉素分子的三种非典型糖生物合成所必需的NDP-葡萄糖(参照图4、5和6)。orf4基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表16)。
                            表16
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
葡萄糖-1-磷酸胸苷转移酶(除虫链霉菌) BAA84594 402 葡萄糖-1-磷酸胸苷转移酶
AclY(加利利链霉菌) BAB72036 400 dTDP-1-葡萄糖合成酶
预测的葡萄糖-1-磷酸胸苷转移酶(刺糖多孢菌) AAK83289 399 葡萄糖-1-磷酸胸苷转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
Orf5基因编码与几种葡萄糖脱水酶呈现相对强相似性的蛋白质。具体而言,orf5编码的蛋白质与黑暗链霉菌的dTDP-葡萄糖4,6-脱水酶(T.B.Li等,2001;GenBank登录号:AAG18457,BLAST分值:476)具有相当高的相似性。这种与参与另一种相关抗生素生物合成途径的蛋白质的相似性强烈暗示orf5基因编码NDP-葡萄糖脱水酶,该酶对于掺入螺旋霉素分子的三种非典型糖的生物合成是必需的(参照图4、5和6)。Orf5基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表17)。
                                表17
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
dTDP-葡萄糖4,6-脱水酶(刺糖多孢菌) AAK83290  464 dTDP-葡萄糖4,6-脱水酶
胸苷二磷酸葡萄糖4,6-脱水酶(红色糖多孢菌) AAA68211 445 胸苷二磷酸葡萄糖4,6-脱水酶
dTDP-葡萄糖4,6-脱水酶(EC 4.2.1.46)-(弗氏链霉菌) S49054  443 dTDP-葡萄糖4,6-脱水酶
TDP-葡萄糖4,6-脱水酶(委内瑞拉链霉菌) AAC68681  421 TDP-葡萄糖4,6-脱水酶
SgcA(球孢链霉菌(Streptomyces globisporus)) AAF13998  418 dNDP-葡萄糖4,6-脱水酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
Orf6基因编码与几种硫酯酶呈现相对强相似性的蛋白质。具体而言,orf6编码的蛋白质与除虫链霉菌硫酯酶(S.Omura等,2001;GenBank登录号:BAB69315;BLAST分值:234)具有相当高的相似性。这种与参与另一种相近抗生素生物合成途径的蛋白质的相似性强烈暗示orf6基因编码硫酯酶。Orf6基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表18)。
                               表18
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
RifR(地中海拟无枝酸菌(Amycolatopsis mediterranei)) AAG52991 216 硫酯酶
硫酯酶-(弗氏链霉菌) S49055  215 硫酯酶
硫酯酶(除虫链霉菌) BAB69188  213 硫酯酶
硫酯酶II(EC 3.1.2.-)-(委内瑞拉链霉菌) T17413  203 硫酯酶
PimI蛋白质(纳塔尔链霉菌(Streptomyces natalensis)) CAC20922 201 硫酯酶
硫酯酶(灰色链霉菌) CAC22116  200 硫酯酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
Orf7基因编码与几种己糖脱水酶呈现相对强相似性的蛋白质。具体而言,orf7编码的蛋白质与参与泰乐菌素生物合成的弗氏链霉菌的dNTP-己糖2,3-脱水酶(由TylCVI基因编码)(L.A.Merson-Davies等,1994;GenBank登录号:AAF29379;BLAST分值:461)具有相当高的相似性。这种与参与另一种相近抗生素生物合成途径的蛋白质的相似性强烈暗示orf7基因也编码己糖2-3-脱水酶,该酶对于掺入螺旋霉素分子的两种非典型糖的生物合成是必需的(参照图4和6)。Orf7基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表19)。
                              表19
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
Rif18(地中海拟无枝酸菌) AAG52988  459 己糖脱水酶
SimB3(抗生链霉菌) AAK06810 444 dNDP-4-酮-6-脱氧-葡萄糖2,3-脱水酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
Orf8基因编码与几种氨基转移酶呈现相对强相似性的蛋白质。具体而言,orf8编码的蛋白质与刺糖多孢菌中可能参与forosamine生物合成的氨基转移酶(C.Waldron等,2001;GenBank登录号:AAG23279;BLAST分值:465)具有相当高的相似性。这种与参与另一种相近抗生素生物合成途径的蛋白质的相似性强烈暗示orf8基因编码4-氨基转移酶,该酶负责forosamine生物合成所必需的氨基转移反应(参照图6)。Orf8基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表20)。
                             表20
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
预测的氨基糖生物合成蛋白质(支气管败血性包特氏菌(Bordetella bronchiseptica)) CAA07666 213 参与氨基糖生物合成的蛋白质
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
失活orf8基因。因此有可能显示所得到的菌株不再产生螺旋霉素。这证实orf8基因确实参与螺旋霉素生物合成。因此由该基因编码的酶明确地负责螺旋霉素生物合成所必需的生物转化步骤。orf8基因失活突变体产生forocidin,从而该突变体阻断于forocidin阶段且不产生任何新-螺旋霉素,这一事实对orf8基因产物在forosamine生物合成中具有作用的假说进行了证实(参照图7和实施例25)。这些结果与orf8基因产物参与forosamine生物合成是一致的(参照图6)。
已经鉴定了生二素链霉菌中的orf9c基因并由Geistlich等(M.Geistlich等,1992)命名为srmX。由该基因所编码的蛋白质与几种参与其它相近抗生素生物合成途径的甲基转移酶的这种相似性强烈暗示orf9c8基因编码甲基转移酶,该酶负责碳霉糖或forosamine生物合成所必需的甲基化反应(参照图5和6)。orf9c基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表21)。
                            表21
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
N,N-二甲基转移酶(委内瑞拉链霉菌) AAC68678  240 N,N-二甲基转移酶
甲基转移酶(抗生链霉菌) CAA05643  232 甲基转移酶
预测的氨基甲基化酶(黑胡桃链霉菌) AAF01819  219 氨基甲基化酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
已经鉴定了生二素链霉菌中的orf10基因并由Geistlich等(M.Geistlich等,1992)命名为srmR。由该基因所编码的蛋白质参与生二素链霉菌中螺旋霉素生物合成途径的调控。失活orf10基因。因此有可能显示所得到的菌株不再产生螺旋霉素。这证实orf10基因确实参与螺旋霉素生物合成。因此由该基因编码的蛋白对于螺旋霉素生物合成显然是必需的。
此外,确定了orf10的翻译起始位点并且有可能表明该基因的过量表达导致螺旋霉素产量的提高。翻译起始位点相当于定位在Geistlich等(M.Geistlich等,1992)所提出的ATG上游的ATG。由于5’-截短的信使是无活性的,还证明了该5’末端对于Orf10的功能是必需的(参照实施例17)。因此为了获得螺旋霉素产量方面的预期效果,过量表达有效的orf10而注意不表达orf10 5’-截短的信使是必要的。
已经鉴定了生二素链霉菌中的orf11c基因并由Geistlich等(M.Geistlich等,1992)和Schone等(B.Schoner等,1992)命名为srmB。由该基因所编码的蛋白质在生二素链霉菌中参与螺旋霉素抗性并且是ABC-型转运子。
Orf12基因编码与几种己糖脱水酶呈现相对强相似性的蛋白质。具体而言,orf12编码的蛋白质与弗氏链霉菌UrdQ基因所编码的NDP-己糖3,4-脱水酶具有相当高的相似性并参与乌达霉素生物合成(D.Hoffmeister等,2000;GenBank登录号:AAF72550;BLAST分值:634)。这种与参与另一种相近抗生素生物合成途径的蛋白质的相似性强烈暗示orf12基因编码3,4-脱水酶,该酶负责forosamine生物合成所必需的脱水反应(参照图6)。Orf12基因所编码的蛋白质与其他有机体中功能相似的其他蛋白质呈现强相似性的事实支持该假说(参照表22)。
                                  表22
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
AknP(加利利链霉菌) AAF73452  625 3-脱水酶
NDP-己糖3,4-脱水酶同系物(产蓝链霉菌(Streptomycescyanogenus)) AAD13547 624 NDP-己糖3,4-脱水酶
RdmI(浅绛红链霉菌(Streptomyces purpurascens)) AAL24451 608 己糖-C-3-脱水酶
可能的CDP-4-酮-6-去氧葡萄糖3-脱水酶(E1)(紫红链霉菌(Streptomyces violaceoruber)) T46528 602 CDP-4-酮-6-去氧葡萄糖3-脱水酶
可能的NDP-己糖3,4-脱水酶(刺糖多孢菌) AAG23278 582 NDP-己糖3,4-脱水酶
dNTP-己糖脱水酶(地中海拟无枝酸菌) AAC01730  576 dNTP-己糖脱水酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
失活orf12基因。有可能显示所得到的菌株不再产生螺旋霉素。这证实orf12基因确实参与螺旋霉素生物合成。因此由该基因编码的酶显然负责螺旋霉素生物合成所必需的生物转化步骤。orf12基因失活突变体不再产生forosamine的事实对Orf12在forosamine生物合成具有作用的假说提供证据。然而,突变体产生少量forocidin。因此该突变体在forocidin阶段阻断且不产生任何新-螺旋霉素(参照图7和实施例26)。该突变体也产生具有图38所示结构的化合物。后者化合物含有两种糖,即碳霉糖和mycarose,但不含有任何forosamine。此外,如果与螺旋霉素的结构相比较(参照图1),该化合物在forosamine的预期位置含有mycarose。这些结果与orf12基因产物参与forosamine生物合成是一致的(参照图6)。可以注意到,由于观察到一些分子中mycarose连接在通常情况下由forosamine占用的位置上,所以糖基化作用的特异性不是绝对的(见图38)。
orf13c基因编码与天蓝色链霉菌中一种未知功能蛋白质呈现相对强相似性的蛋白质。该蛋白质命名为SC4H2.17(GeneBank登录号:T35116;BLAST分值:619)。由orf13c基因所编码的蛋白质也与其它有机体的其它蛋白质呈现强相似性(参照表23)。
                              表23
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
hflX蛋白质(麻风分枝杆菌(Mycobacterium leprae)) S72938  473 未知
可能的ATP/GTP-结合蛋白(麻风分枝杆菌) NP_301739  470 ATP/GTP-结合蛋白
GTP-结合蛋白(结核分枝杆菌(Mycobacteriumtuberculosis)CDC1551) AAK47114  468 GTP-结合蛋白
ATP/GTP-结合蛋白(弗氏链霉菌) T44592  388 ATP/GTP-结合蛋白
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
仍然没有鉴定出与orf13c编码蛋白质接近的蛋白质的确切功能。为了研究该基因在生二素链霉菌螺旋霉素生物合成途径中的功能,对orf13c基因进行失活。有可能显示所得到的菌株产生螺旋霉素。这表明orf13c基因对于螺旋霉素生物合成不是必需的,并且该基因对于细菌的存活也是非必需的。因此由该基因编码的酶显然不负责螺旋霉素生物合成所必需的生物转化步骤。
orf14基因编码与推定的还原酶呈现相对强相似性的蛋白质(M.Redenbach等,1996;Bentley等,2002;GenBank登录号:CAB90862;BLAST分值:147)。
失活orf14基因。因此有可能显示所得到的菌株不再产生螺旋霉素。这证实orf14基因确实参与螺旋霉素生物合成。因此由该基因编码的酶显然负责螺旋霉素生物合成所必需的生物转化步骤。研究了orf14基因敲除菌株的生物合成中间体(参照实施例20)。这些实验使得有可能表明该菌株产生platenolide A而不产生platenolide B(参照图36)。
orf15c基因编码与几种酮还原酶呈现相对强相似性的蛋白质。具体而言,orf15c编码的蛋白质与抗生链霉菌3-酮还原酶(GenBank登录号:T51102,BLAST分值:285)具有相当高的相似性。这种相似性强烈暗示orf15c基因编码3-酮还原酶,该酶负责forosamine生物合成所必需的还原反应(参照图6)。orf15c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表24)。
                             表24
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
氧化还原酶同系物(产蓝链霉菌) AAD13550  272 氧化还原酶
D-oliose4-酮还原酶(Streptomyces argillaceus) CAB96550 265 D-oliose4-酮还原酶
AknQ(加利利链霉菌) AAF73453 263 推定的3-酮还原酶
可能的NDP-己糖3-酮还原酶(刺糖多孢菌) AAG23275 253 NDP-己糖3-酮还原酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf16基因编码与几种异构酶呈现相对强相似性的蛋白质。具体而言,orf16编码蛋白质与弗氏链霉菌NDP-己糖3,4-异构酶(Gandecha等,1997;GenBank登录号:CAA57471,BLAST分值:209)具有相当高的相似性。这种相似性强烈暗示orf16基因编码参与螺旋霉素的一种糖的生物合成的蛋白质(参照图5和6)。orf16基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表25)。
                             表25
呈现显著相似性的蛋白质 GenBank登录号   BLAST*分值 所报道的功能
推定的互变异构酶(委内瑞拉链霉菌) AAC68676   145 互变异构酶
TDP-4-酮-6-脱氧己糖3,4-异构酶(黑孢小单孢菌黑孢亚种) AAG13907   112 TDP-4-酮-6-脱氧己糖3,4-异构酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf17基因编码与几种糖基转移酶呈现相对强相似性的蛋白质。具体而言,orf17编码蛋白质与委内瑞拉链霉菌糖基转移酶(Y.Xue等,1998;GenBank登录号:AAC68677;BLAST分值:400)具有相当高的相似性。orf17基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种糖基转移酶的相似性强烈暗示该基因也编码糖基转移酶。orf17基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现某些相似性的事实支持该假说(参照表26)。
                      表26
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
糖基转移酶(弗氏链霉菌) CAA57472  399 糖基转移酶
糖基转移酶(抗生链霉菌) CAA05642  378 糖基转移酶
糖基转移酶(抗生链霉菌) CAA05641  360 糖基转移酶
糖基转移酶(红色糖多孢菌) CAA74710  344 糖基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf18基因编码与几种糖基转移酶呈现相对强相似性的蛋白质。具体而言,orf18编码蛋白质与利尻链霉菌糖基转移酶(Wang等,2000;GenBank登录号:AAG29785;BLAST分值:185)具有相当高的相似性。orf18基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种糖基转移酶的相似性强烈暗示该基因也编码糖基转移酶。orf18基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表27)。
                             表27
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
NovM(类球形链霉菌(Streptomyces spheroides)) AAF67506 184 糖基转移酶
可能的糖基转移酶(紫红链霉菌) T46519  169 糖基转移酶
糖基转移酶同系物(产蓝链霉菌) AAD13553  167 糖基转移酶
糖基转移酶同系物(产蓝链霉菌) AAD13555  163 糖基转移酶
dNTP-己糖糖基转移酶(地中海拟无枝酸菌) AAC01731  160 糖基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf19基因编码与几种酮还原酶呈现相对强相似性的蛋白质。具体而言,orf19编码的蛋白质与弗氏链霉菌NDP-己糖4-酮还原酶(TylCIV)(Bate等,2000;GenBank登录号:AAD41822;BLAST分值:266)具有相当高的相似性。orf19基因编码的蛋白质与参与其它相近抗生素生物合成途径的这种酮还原酶的相似性强烈暗示该基因也编码4-酮还原酶,该酶负责mycarose生物合成所必需的还原反应(参照图4)。orf19基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表28)。
                                  表28
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
NDP-4-酮-6-脱氧己糖4-酮还原酶(委内瑞拉链霉菌) AAL14256 251 NDP-4-酮-6-脱氧己糖4-酮还原酶
EryBIV(红色糖多孢菌) AAB84071 249 氧化还原酶
TDP-4-酮-6-脱氧己糖4-酮还原酶(黑孢小单孢菌黑孢亚种) AAG13916 218 TDP-4-酮-6-脱氧己糖4-酮还原酶
dTDP-4-酮-6-脱氧-L-己糖4-还原酶(除虫链霉菌) BAA84595 212 dTDP-4-酮-6-脱氧-L-己糖4-还原酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf20基因编码与几种己糖还原酶呈现相对强相似性的蛋白质。具体而言,orf20编码蛋白质与红色糖多孢菌编码dTDP-4-酮-L-6-脱氧己糖2,3-还原酶的EryBII(R.G.Summers等,1997),GenBank登录号:AAB84068;BLAST分值:491)具有相当高的相似性。orf20c基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种己糖还原酶的相似性强烈暗示该基因编码2,3-还原酶,该酶负责mycarose生物合成所必需的还原反应(参照图4)。orf20c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表29)。
                                表29
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
TylCII(弗氏链霉菌) AAD41821 464 NDP-己糖2,3-烯酰还原酶
TDP-4-酮-6-脱氧己糖2,3-还原酶(黑孢小单孢菌黑孢亚种) AAG13914  446 TDP-4-酮-6-脱氧己糖2,3-还原酶
dTDP-4-酮-6-脱氧-L-己糖2,3-还原酶(除虫链霉菌) BAA84599  377 dTDP-4-酮-6-脱氧-L-己糖2,3-还原酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf21c基因编码与几种己糖甲基转移酶呈现相对强相似性的蛋白质。具体而言,orf21c编码的蛋白质与弗氏链霉菌编码NDP-己糖3-C-甲基转移酶的TylCIII基因(N.Bate等,2000;GenBank登录号:AAD41823;BLAST分值:669)的EryBII具有相当高的相似性。orf21c基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种己糖甲基转移酶的相似性强烈暗示该基因编码己糖甲基转移酶,该酶负责mycarose生物合成所必需的甲基化反应(参照图4)。orf21c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表30)。
                         表30
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
eryH(红色糖多孢菌) 228448  592 红霉素生物合成基因
S-腺苷依赖性甲基转移酶(伯氏立克次氏体(Coxiella burnetii)) AAK71270  358 甲基转移酶
NovU(类球形链霉菌) AAF67514  184 C-甲基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf22c基因编码的蛋白质与吸水链霉菌子囊霉素变种(Streptomyceshygroscopicus var.ascomyceticus)中编码参与甲氧基丙二酰基生物合成的酶的fkbH基因所编码的蛋白质(K.Wu等,2000;GenBank登录号:AAF86387;BLAST分值:463)呈现相对强相似性。orf22c基因所编码的蛋白质与参与其它相关大环内酯生物合成途径的蛋白质的相似性强烈暗示该基因也编码生二素链霉菌中参与甲氧基丙二酰基生物合成的酶(参照图8)。
orf23c基因编码的蛋白质与吸水链霉菌子囊霉素变种中编码参与甲氧基丙二酰基生物合成的脂酰辅酶A脱氢酶的fkbI基因所编码的蛋白质(K.Wu等,2000;GenBank登录号:AAF86388;BLAST分值:387)呈现相对强相似性。orf23c基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种脂酰辅酶A脱氢酶的相似性强烈暗示该基因编码参与甲氧基丙二酰基生物合成的脂酰辅酶A脱氢酶(参照图8)。orf23c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表31)。
                               表31
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
脂酰辅酶A脱氢酶(纤维素多囊菌(Polyangium cellulosum)) AAK19892 171 脂酰辅酶A脱氢酶
可能的脂酰辅酶A脱氢酶-(天蓝色链霉菌) T36802 160 脂酰辅酶A脱氢酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf24c基因编码的蛋白质与吸水链霉菌子囊霉素变种中被认为编码参与甲氧基丙二酰基生物合成的酰基载体蛋白(ACP)的fkbJ基因所编码的蛋白质(K.Wu等,2000;GenBank登录号:AAF86389;BLAST分值:87)呈现相对强相似性。orf24c基因编码的蛋白质与参与另一种相近大环内酯生物合成途径的蛋白质的相似性强烈暗示该基因编码参与生二素链霉菌中甲氧基丙二酰基生物合成的蛋白质(参照图8)。
orf25c基因编码的蛋白质与吸水链霉菌子囊霉素变种中编码参与甲氧基丙二酰基生物合成的脂酰辅酶A脱氢酶的fkbK基因所编码的蛋白质(K.Wu等,2000;GenBank登录号:AAF86390;BLAST分值:268)呈现相对强相似性。orf25c基因编码的蛋白质与参与其它相近抗生素生物合成途径的几种脂酰辅酶A脱氢酶的相似性强烈暗示该基因编码参与甲氧基丙二酰基生物合成的脂酰辅酶A脱氢酶(参照图8)。orf25c基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表32)。
                                 表32
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
可能的3-羟丁酰基-CoA脱氢酶(枯草芽孢杆菌) P45856  177 3-羟丁酰基-CoA脱氢酶
3-羟丁酰基-CoA脱氢酶(苏云金芽孢杆菌(Bacillus thuringiensis serovarkurstaki)) AAL32270  174 3-羟丁酰基-CoA脱氢酶
3-羟丁酰基-CoA脱氢酶(耐放射异常球菌(Deinococcus radiodurans)) NP_294792  167 3-羟丁酰基-CoA脱氢酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf26基因所编码的蛋白质与弗氏链霉菌中编码参与泰乐菌素生物合成的mycarose糖基转移酶的tylCV基因所编码的蛋白质(N.Bate等,2000;GenBank登录号:AAD41824,BLAST分值:471)呈现65%的同一性(使用BLAST程序确定)。更加具体而言,TylCV是在泰乐菌素合成过程中结合mycarose分子的糖基转移酶。这种与参与另一相对相近抗生素生物合成途径的蛋白质更加具体而言是mycarose转运子的相似性暗示orf26基因是糖基转移酶。orf26基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表33)。
                           表33
呈现显著相似性的蛋白质 GenBank登录号   BLAST*分值 所报道的功能
糖基转移酶(除虫链霉菌) BAA84592   218 糖基转移酶
CalG4(刺孢小单孢菌(Micromonospora echinospora)) AAM70365   217 糖基转移酶
CalG2(刺孢小单孢菌) AAM70348   197 糖基转移酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
orf27基因所编码的蛋白质与弗氏链霉菌中编码参与泰乐菌素生物合成的NDP-己糖3,5-(或5-)差向异构酶的tylCVII基因所编码的蛋白质(N.Bate等,2000;GenBank登录号:AAD41825,BLAST分值:243)呈现70%的同一性(使用BLAST程序确定)。更加具体而言,TylCVII是参与mycarose生物合成的己糖3,5-(或5-)差向异构酶。这种与参与另一相对相近抗生素生物合成途径更加具体而言是mycarose生物合成的蛋白质的相似性暗示orf27基因是差向异构酶。orf27基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表34)。利用BLAST程序对所获得的相近序列进行的分析强烈暗示orf27基因编码5-差向异构酶,该酶负责mycarose生物合成所必需的差向异构反应(参照图4)。
                          表34
呈现显著相似性的蛋白质 GenBank登录号   BLAST*分值 所报道的功能
LanZ1(产蓝链霉菌) AAD13558   172 NDP-己糖3,5-差向异构酶
Epi(刺糖多孢菌) AAK83288   169 TDP-4-酮-6-去氧葡萄糖3,5-差向异构酶
dNTP-己糖3,5-差向异构酶(地中海拟无枝酸菌) AAC01732   166 dNTP-己糖3,5-差向异构酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
最初仅部分测定了orf28c的序列,大约450个碱基区域的序列是在重新序列分析后确定的(在不完全序列SEQ ID No.106中该区域用“N”表示)。虽然如此仍将该ORF的部分序列(SEQ ID No.111)用于使用如上所述多种计算机程序分析。因此可通过所确定的序列(SEQ ID No.112,该序列是Orf28c蛋白质的部分序列),确定orf28c基因编码的蛋白质与耐热链霉菌中编码参与碳霉素生物合成的调节蛋白质的acyB2基因所编码的蛋白质(A.Arisawa等,1993;GenBank登录号:JC2032,BLAST分值:329)呈现64%的同一性(使用BLAST程序确定)。这种与参与另一相对相近抗生素生物合成途径的蛋白质的相似性暗示orf28c基因编码参与螺旋霉素生物合成的调节蛋白质。orf28c基因所编码的蛋白质也与TylR蛋白质呈现强相似性的事实支持该假说,TylR蛋白质是弗氏链霉菌中参与泰乐菌素生物合成的调节蛋白质(N.Bate等,1999;GenBank登录号:AAF29380,BLAST分值:167)。
利用定位于未确定序列两侧的寡核苷酸扩增orf28c基因并将其亚克隆入表达载体是可能的。因此有可能证明orf28c基因过量表达显著提高OSC2菌株中螺旋霉素的产量(参照实施例24)。这表明过量表达orf28c导致螺旋霉素产量增加并证实了其作为螺旋霉素生物合成途径的调解子的作用。
随后完成了orf28c的部分序列并确定了大约450个碱基对的未知区域(参照SEQ ID No.140和SEQ ID No.141)。使用上述多种计算机程序将该ORF的完整序列(SEQ ID No.141)进行分析。因此有可能确定orf28c基因所编码的蛋白质与耐热链霉菌中编码参与碳霉素生物合成的调节蛋白质的acyB2基因所编码的蛋白质(Arisawa,A.等,1993;GenBank登录号:JC2032,BLAST分值:451)在所确定的序列上(SEQ ID No.142,该序列是Orf28c蛋白质的完整序列)呈现69%的同一性(利用BLAST程序确定)。这种与参与调节相对相近抗生素生物合成的蛋白质的相似性暗示orf28c基因编码参与螺旋霉素生物合成的调节蛋白质。orf28c基因所编码的蛋白质也与TylR蛋白质呈现强相似性的事实支持该假说,TylR蛋白质是弗氏链霉菌中参与调节泰乐菌素生物合成的调节蛋白质(N.Bate等,1999;GenBank登录号:AAF29380,BLAST分值:224)。过量表达该基因的结果证实了该基因作为螺旋霉素生物合成途径的调节子的作用(参照实施例24)。
失活orf28c基因。这样有可能显示所得到的菌株不再产生螺旋霉素。这证实orf28c基因显然参与螺旋霉素生物合成并且对于螺旋霉素生物合成是必需的。将这些结果结合该基因过量表达的结果(参照实施例24)表明Orf28c作为螺旋霉素生物合成所必需的激活子的作用。
orf29基因所编码的蛋白质与纤维素囊菌中定位于参与soraphen A(一种聚酮化合物类抗真菌剂)生物合成的基因群中的可能的糖基水解酶(J.Ligon等,2002;GenBank登录号:AAK19890,BLAST分值:139)呈现31%的同一性(使用BLAST程序确定)。这种与参与相对相近分子生物合成途径的蛋白质的相似性暗示orf29基因编码具有糖基水解酶活性的蛋白质。orf29基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表35)。利用CD-搜索程序(参照上面)对orf29所编码的蛋白质的序列进行分析也表明orf29基因编码糖基水解酶。
                           表35
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值  所报道的功能
ManA(解糖热解纤维素菌(Caldicellulosiruptorsaccharolyticus)) AAC44232  136  β-1,4-甘露聚糖酶
ManA(嗜热网球菌(Dictyoglomus thermophilum)) AAB82454  129  β-甘露聚糖酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
使用SignalP程序(http://www.cbs.dtu.dk/services/SignalP/)(Nielsen,H.等,1997),分析由orf29所推导出的蛋白质序列显示该蛋白质具有在30和31位(QSA/QA)之间含有预测切割位点的C-末端信号序列。可以预测该蛋白质是细胞外蛋白质。作为糖基水解酶,该蛋白质可能在通过糖基转移酶GimA和/或GimB进行糖基化作用而失活的螺旋霉素的再活化过程中具有作用(Gourmelen等,1998)。
Orf30c基因所编码的蛋白质与谷氨酸棒杆菌中的核苷-二磷酸糖差向异构酶(GenBank登录号:NP_600590,BLAST分值:89)呈现31%的同一性(使用BLAST程序确定)。这种相似性暗示orf30c基因编码差向异构酶。利用CD-搜索程序(参照上面)对该序列进行分析的事实支持该假说,也表明orf30c基因编码差向异构酶。
orf30c呈现两个可能的起始密码子(参照SEQ ID No.115),这使得可形成两种可能的分别为345和282个氨基酸的蛋白质(SEQ ID No.116和117)。然而,典型链霉菌的密码子选择仅从第二个ATG开始;此外,从第一个ATG和第二个之间的序列推导出的蛋白质序列不能与所鉴定的相近序列进行比对,反之最短的蛋白质序列(从第二个ATG起始:SEQ ID No.144)能与这些蛋白质正确比对。因此能够由此得出结论:第二个ATG是正确的起始密码子,并且该orf的序列如SEQ ID No.143所示,一旦进行翻译,其相应的蛋白质序列为SEQ ID No.144。
Orf31基因所编码的蛋白质与天蓝色链霉菌中的氧化还原酶(GenBank登录号:NP_631148,BLAST分值:261)呈现52%的同一性(使用BLAST程序确定)。这种相似性暗示orf31基因编码还原酶。利用CD-搜索程序(参照上面)对该序列进行分析的事实支持该假说,也表明orf31基因编码还原酶。由orf31基因所编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实也支持该假说(参照表36)。
                         表36
呈现显著相似性的蛋白质 GenBank登录号   BLAST*分值 所报道的功能
推定的氧化还原酶(灰色链霉菌) BAB79295   173 氧化还原酶
MocA(地毯草黄单胞菌(Xanthomonas axonopodis)) NP_640644   171 氧化还原酶
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
失活orf31基因。如此有可能显示所得到的菌株不再产生螺旋霉素。这证实orf31基因确实参与螺旋霉素生物合成。因此由该基因所编码的酶显然负责螺旋霉素生物合成所必需的生物转化步骤。
首先部分确定了orf32c的序列(参照实施例19),而5’位置的编码序列在第二步骤中才确定。然而,该orf的部分序列(SEQ ID No.120)已用上述的多种计算机程序进行了分析。因此有可能确定orf32c基因编码的蛋白质在已测定的序列范围内(SEQ ID No.121,该序列是Orf32c蛋白质的部分序列),与天蓝色链霉菌中GntR家族的调节蛋白质(GenBank登录号:NP_625576,BLAST分值:229)呈现47%的同一性(利用BLAST程序确定)。这种相似性暗示orf32c基因编码GntR家族的转录调节子。orf32c基因编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说。
随后又测定完成了orf32c的部分序列并测定了未知的区域(参照SEQID No.140和SEQ ID No.145)。该orf全部序列编码与除虫链霉菌中GntR家族的调节蛋白质(GenBank登录号:NP_824604,BLAST分值:282)呈现44%的同一性(利用BLAST程序确定)。这种相似性暗示orf32c基因编码GntR家族的转录调节子。orf32c基因编码的蛋白质与其它有机体中具有相似功能的其它蛋白质呈现强相似性的事实支持该假说(参照表37)。
                          表37
呈现显著相似性的蛋白质 GenBank登录号  BLAST*分值 所报道的功能
GntR家族的调节蛋白质(除虫链霉菌) NP_828241  270 GntR家族的调节蛋白质
GntR家族的调节蛋白质(天蓝色链霉菌) NP_625576  266 GntR家族的调节蛋白质
SC5G8.04(天蓝色链霉菌) NP_628991  258 GntR家族的调节蛋白质
转录调节子(委内瑞拉链霉菌) AAF01064  224 转录调节子
GntR家族调节蛋白质(除虫链霉菌) NP_827432  239 GntR家族的调节蛋白质
*较大的序列相似性与较高的BLAST分值相关(Altschul等,1990)。
为了研究该基因在生二素链霉菌的螺旋霉素生物合成途径中的功能,将orf32c基因进行失活。可显示所得到的菌株产生螺旋霉素。这表明orf32c基因对于螺旋霉素生物合成不是必需的并且该基因对于细菌的生存也不是必需的。
orf33基因所编码的蛋白质与野油菜黄单胞菌的推定蛋白质(GenBank登录号:NP_635564,BLAST分值:54)呈现49%的同一性(利用BLAST程序确定)。
orf34c的序列是部分序列。事实上,在该orf的产物与数据库之间进行的比较表明该蛋白质的C-末端部分不是由核苷酸序列推导出的产物,因此该orf应更长并含有已测序区域以外的部分。然而,将该ORF的部分序列用上述多种计算机程序进行了分析。有可能确定orf34c基因所编码的蛋白质,在全部已确定的序列范围内(SEQ ID No.150,该序列是Orf34c蛋白质的部分序列),与来自天蓝色链霉菌的阿拉伯呋喃糖苷酶(Bentley等,2002;GenBank登录号:NP_630049,BLAST分值:654)呈现91%的同一性(利用BLAST程序确定)。在天蓝色链霉菌中,编码该阿拉伯呋喃糖苷酶的基因显示不参与次级代谢物的生物合成。所以在生二素链霉菌中该基因可能不参与螺旋霉素生物合成。
本发明的主题也为这样的多核苷酸,在高度严格条件下,这些多核苷酸至少与序列SEQ ID Nos 3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149中的多核苷酸之一或其变体之一或由于遗传密码简并性从其衍生的序列之一进行杂交。优选地,这些所述多核苷酸是从链霉菌属细菌分离得到的,更加优选地这些多核苷酸编码参与大环内酯生物合成的蛋白质,并且甚至更加优选地这些多核苷酸所编码的蛋白质具有的活性类似于与其杂交的多核苷酸所编码的蛋白质。高严格杂交条件可以定义为不利于非同源核酸链进行杂交的杂交条件。例如,高严格杂交条件可以描述为这样的杂交条件:在Church和Gilbert(Church和Gilbert,1984)所述的缓冲液中温度在55℃和65℃之间;杂交温度优选地为55℃,杂交温度更加优选地为60℃,杂交温度最优选地为65℃,接下来用2X SSC缓冲液在55℃和65℃之间的温度进行一次或多次洗涤;该温度优选地为55℃,该温度更加优选地为60℃并且该温度最优选地为65℃,接下来用0.5X SSC缓冲液在55℃和65℃之间的温度进行一次或多次洗涤;该温度优选地为55℃,该温度更加优选地为60℃并且该温度最优选地为65℃。上述杂交条件能够根据预杂交核酸的长度,或根据所选标记类型而按照本领域技术人员熟知的技术进行调整。例如,适当的杂交条件可以按照F.Ausubel等,2002的工作进行调整。
本发明还涉及与包含选自核苷酸序列SEQ ID Nos 3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一的多核苷酸或者互补序列的多核苷酸中的至少10,12,15,18,20至25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850或1900个连续核苷酸的多核苷酸具有至少70%,更加优选地为80%,更加优选地为85%,甚至更加优选地为90%,甚至更加优选地为95%,并且最优选地为98%核苷酸同一性的多核苷酸。优选地,这些所述多核苷酸是从链霉菌属细菌分离得到的,更加优选地是这些多核苷酸编码参与大环内酯生物合成的蛋白质,并且甚至更加优选地是这些多核苷酸所编码的蛋白质具有的活性类似于与其呈现同一性的多核苷酸所编码的蛋白质。最优选地是,根据本发明的多核苷酸选自核苷酸序列SEQ ID Nos 3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149,或者互补序列的多核苷酸。
利用已知的算法,例如FASTA软件包的算法(W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),具体而言可由法国Evry的INFOBIOGEN资源中心得到,能够在计算机上对用于比较的序列进行最佳比对。通过举例说明,利用LFASTA(K.-M.Chao等,1992)或LALIGN(X.Huang和W.Miller,1991)软件可以确定序列同一性百分率。LFASTA和LALIGN程序是FASTA软件包的一部分。LALIGN提供最佳局部比对,该程序比LFASTA更加精确,但速度较慢。
本发明的另一方面涉及过量表达如上面所定义的核酸序列而得到的多肽。优选地是,根据本发明的这些多肽与包含选自SEQ ID No4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150、或在所述序列中已进行了一个或多个氨基酸替换、插入或删除而不影响其功能特性的这些序列之一、或这些序列的变体之一中的至少10,15,20,30至40,50,60,70,80,90,100,120,140,160,180,200,220,240,260,280,300,320,340,360,380,400,420,440,460,480,500,520,540,560,580,600,620或640个连续氨基酸的多肽呈现至少70%,更加优选地为80%,更加优选地为85%,甚至更加优选地为90%,甚至更加优选地为95%并且最优选地为98%的氨基酸同一性。优选地是,根据本发明的这些多肽由链霉菌属细菌以天然状态表达,更加优选地是这些多肽参与大环内酯的生物合成,并且甚至更加优选地是这些多肽具有的活性类似于与其具有同一性的多肽。优选地,根据本发明的所述多肽选自多肽序列SEQ ID No4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150、或在所述序列中已进行了一个或多个氨基酸替换、插入或删除而不影响其功能特性的这些序列之一、或这些序列的变体之一。更加优选地,根据本发明的所述多肽选自多肽序列SEQ ID No4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150。
利用已知的算法,例如FASTA软件包的算法(W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),具体而言可由法国Evry的INFOBIOGEN资源中心得到,能够在计算机上对用于比较的序列进行最佳比对。通过举例说明,利用LFASTA(K.-M.Chao等,1992)或LALIGN(X.Huang和W.Miller,1991)软件使用INFOBIOGEN资源中心,Evry,法国所定义的缺省参数可以确定序列同一性百分率。LFASTA和LALIGN程序是FASTA软件包的一部分。LALIGN提供最佳局部比对;该程序比LFASTA更精确,但速度较慢。
本发明的另一方面涉及含有至少一个上述多核苷酸的重组DNA。优选地是,该重组DNA是载体。甚至更加优选地是,该载体选自噬菌体、质粒、噬菌粒、整合载体、fosmids、粘粒、穿梭载体、BAC(细菌人工染色体)和PAC(P1-来源的人工染色体)。通过举例说明,λ噬菌体和M13噬菌体可以描述为细菌噬菌体。关于质粒,可提及的是在大肠杆菌(E.coli)中复制的质粒,例如pBR322及其衍生物、pUC18及其衍生物、pUC19及其衍生物、pGB2及其衍生物(G.Churchward等,1984)、pACYC177(GenBank登录号:X06402)及其衍生物、和pACYC184(GenBank登录号:X06403)及其衍生物。可提及的是在链霉菌中复制的质粒,例如pIJ101及其衍生物、pSG5及其衍生物、SLP1及其衍生物、和SCP2*及其衍生物(Kieser等,2000)。关于噬菌粒,通过举例说明,可提及的是pBluescript II及其衍生物(特别是由Stratagene(LaJolla,California,USA)公司出售)、pGEM-T及其衍生物(由Promega(Madison,Wisconsin,USA)公司出售)、[lacuna]IS117整合系统(Kieser等,2000)。关于fosmids,通过举例说明,可提及的是fosmid pFOS1(由New England Bioloabs有限公司,Beverly,Massachussetts,USA公司出售)及其衍生物。关于粘粒,通过举例说明,可提及的是粘粒SuperCos及其衍生物(特别是由Stratagene(LaJolla,California,USA)公司出售)和粘粒pWED15(Wahl等,1987)及其衍生物。关于穿梭载体,通过举例说明,可提及的是大肠杆菌/链霉菌穿梭质粒,例如,pIJ903及其衍生物、质粒pUWL、pCAO106、pWHM3和pOJ446系列及其衍生物(Kieser等,2000),以及大肠杆菌/链霉菌穿梭BAC,例如,在专利申请WO 01/40497中所述的穿梭BAC。关于BAC(细菌人工染色体),通过举例说明,可提及的是BAC pBeloBAC11(GenBank登录号:U51113)。关于PAC(P1-来源的人工染色体),通过举例说明,可提及的是载体pCYPAC6(GenBank登录号:AF133437)。最优选地是,根据本发明的载体选自pOS49.1,pOS49.11,pOSC49.12,pOS49.14,pOS49.16,pOS49.28,pOS44.1,pOS44.2,pOS44.4,pSPM5,pSPM7,pOS49.67,pOS49.88,pOS49.106,pOS49.120,pOS49.107,pOS49.32,pOS49.43,pOS49.44,pOS49.50,pOS49.99,pSPM17,pSPM21,pSPM502,pSPM504,pSPM507,pSPM508,pSPM509,pSPM1,pBXL1111,pBXL1112,pBXL1113,pSPM520,pSPM521,pSPM522,pSPM523,pSPM524,pSPM525,pSPM527,pSPM528,pSPM34,pSPM35,pSPM36,pSPM37,pSPM38,pSPM39,pSPM40,pSPM41,pSPM42,pSPM43,pSPM44,pSPM45,pSPM47,pSPM48,pSPM50,pSPM51,pSPM52,pSPM53,pSPM55,pSPM56,pSPM58,pSPM72,pSPM73,pSPM515,pSPM519,pSPM74,pSPM75,pSPM79,pSPM83,pSPM107,pSPM543和pSPM106。
本发明的另一方面涉及含有适当表达载体和允许一个或多个上述多肽在生物系统中表达的宿主细胞的表达系统。根据本发明的表达载体包含编码一个或多个上述多肽的核酸序列,并且表达载体可以有目的地在本领域技术人员熟知的多种宿主细胞中表达多种多肽。通过举例,可提及的是原核表达系统(例如在细菌大肠杆菌中的表达系统)和真核表达系统,例如允许在昆虫细胞中表达的杆状病毒表达系统、以及允许在酵母细胞中表达的表达系统、或者允许在哺乳动物细胞,尤其是人类细胞中表达的表达系统。能够用于此类系统的表达载体是本领域技术人员所熟知的,关于原核细胞,通过举例说明,可提及的是大肠杆菌中的表达载体,例如Stratagene(LaJolla,California,USA)公司出售的pET、Invitrogen(Carlsbad,California,USA)公司出售的GATEWAY系列载体、Invitrogen(Carlsbad,California,USA)公司出售的pBAD系列载体、New England Bioloabs有限公司(Beverly,Massachussetts,USA)公司出售的pMAL系列载体,以及在B.Wilms等(2001)的出版物中提及的鼠李糖-可诱导表达载体及其衍生载体;所提及的内容还包括链霉菌中的表达载体,例如载体pIJ4123,pIJ6021,pPM927,pANT849,pANT850,pANT851,pANT1200,pANT1201和pANT1202及其衍生物(Kieser等,2000)。关于酵母细胞,通过举例说明,所谈及的内容包括Stratagene(LaJolla,California,USA)公司出售的载体pESC。关于允许在昆虫细胞中表达的杆状病毒表达系统,通过举例说明,所谈及的内容包括BD Biosciences Clontech,(Palo Alto,California,USA)公司出售的载体BacPAK6。关于哺乳动物细胞,通过举例说明,所谈及的内容包括含有CMV(巨细胞病毒(Cytomegalovirus))早期即刻基因启动子的载体(例如由Stratagene(LaJolla,California,USA)公司出售的载体pCMV及其衍生物),或者猿猴空泡病毒(vacuolating simian virus)的SV40早期启动子(例如由Stratagene(LaJolla,California,USA)公司出售的载体pSG5)。
本发明还涉及产生如上所述多肽的方法,所述方法包括以下步骤:
a)将编码所述多肽的核酸插入适当的载体;
b)在适当的培养基中,培养预先用步骤a)中的载体转化或转染的宿主细胞;
c)回收条件培养基或细胞提取物,例如通过超声法或通过渗透压休克法;
d)从在步骤c)中获得的所述培养基中或细胞提取物中分离并纯化所述多肽;
e)根据需要,鉴定所产生的多肽的特性。
按照本领域技术人员熟知并在诸如F.Ausubel等,(2002)中所述的方法,通过穿过一系列适当的层析柱能够纯化本发明的重组多肽。通过举例说明,所谈及的内容包括“组氨酸-标签”技术,该技术在于将短的多聚组氨酸序列加到所产生的多肽上,使得该多肽有可能在镍柱上被纯化。根据本发明的多肽也可以通过体外合成技术进行制备。对此类技术的举例说明,利用由Roche Diagnostics France S.A.,Meylan,France公司出售的“快速翻译系统(RTS)”也可以制备本发明的多肽。
本发明的另一方面涉及已经将本发明的至少一个多核苷酸和/或至少一个重组DNA和/或至少一个表达载体导入其中的宿主细胞。
本发明的另一方面涉及阻断了至少一种大环内酯生物合成途径的步骤的微生物。优点首先在于研究突变蛋白质的功能并且,其次在于产生能产生生物合成中间体的微生物。通过向生产培养基中加入特殊成分,或者通过将突变了其它基因(这些基因编码通过利用中间体作为底物而能够对其进行修饰的蛋白质)导入微生物,能够修饰这些中间体,任选地在分离之后修饰。因此能够对这些中间体进行化学、生物化学、酶学和/或微生物学修饰。通过在产生该种或这些大环内酯的微生物中失活一种或多种参与该种或这些大环内酯生物合成的蛋白质的功能,能够获得大环内酯生物合成途径的步骤阻断的微生物。根据所失活的蛋白质,从而可以获得该种或这些大环内酯生物合成途径不同步骤阻断的微生物。通过本领域技术人员熟知的任意方法能够进行该种或这些蛋白质的失活,例如通过在编码所述蛋白质的基因中进行诱变或者通过表达与编码所述蛋白质的信使RNA互补的一条或多条反义RNA而失活。例如,通过辐射、通过诱变化学试剂的作用、通过定点诱变、通过基因置换或本领域技术人员熟知的任意其它方法,能够进行诱变。例如,按照T.Kieser等(2000)和Ausubel等(2002)所做工作中的教导,能够调整适合用于此种诱变的条件。通过在考虑的基因中进行抑制、替换、删除和/或添加一个或多个碱基,或者通过基因失活,能够在体外或原位进行诱变。在含有上述序列的基因中能够进行该种诱变。优选地是,大环内酯生物合成途径步骤阻断的微生物是链霉菌属的细菌。更加优选地是,通过诱变对参与所讨论的大环内酯生物合成的一种或多种蛋白质的功能进行失活。甚至更加优选地是,所讨论的大环内酯是螺旋霉素并且在其中进行一次诱变或多次诱变的微生物是生二素链霉菌菌株。更加优选地是,在含有对应于SEQ ID No3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149一个或多个序列的序列之一的一个或多个基因中进行诱变。优选地是,通过基因失活进行一次诱变或多次诱变。最优选地是,诱变由对含有对应于序列SEQ ID No.13的序列的基因进行基因失活组成。
通过举例说明,以下微生物可以作为此类微生物的例子被提及:OS49.16(orf3∷hyg,参照实施例2)、OS49.67(orf3同相删除,参照实施例6)、OS49.107(orf8∷hyg,参照实施例7)、OS49.50(orf10∷hyg,参照实施例8)、SPM21(orf2∷att3Ωaac-,参照实施例10)、SPM22(orf2∷att3同相删除,参照实施例10)、SPM501(orf6*∷att1 hyg+,参照实施例14)、SPM502(orf6*∷att1同相删除,参照实施例14)、SPM507(orf12∷att3Ωaac-,参照实施11)、SPM508(orf13c∷att3Ωaac-,参照实施例12),和SPM509(orf14∷att3Ωaac-,参照实施13),SPM107(orf28c∷att3aac+,参照实施例29)、SPM543(orf31∷att3aac+,参照实施30)、SPM106(orf32c∷att3aac+,参照实施例31)。
本发明的另一方面涉及制备大环内酯生物合成中间体的方法,该方法使用上述大环内酯生物合成途径的步骤阻断的微生物。该方法包括在适当的培养基中培养上述大环内酯生物合成途径的步骤阻断的微生物,回收条件培养基或细胞提取物,例如通过超声法或渗透压休克法,以及从先前步骤中获得的所述培养基或者细胞提取物中分离并纯化所述生物合成中间体。按照本领域技术人员熟知的技术可以确定培养此类微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域的技术人员尤其可以参照Kieser等,(2000)的工作。通过任意本领域技术人员熟知的技术都能够回收所产生的中间体。例如,本领域的技术人员可参照美国专利3,000,785中所教导的技术,并且更加具体而言是该专利中所述的提取螺旋霉素的方法。
本发明的另一个主题涉及制备衍生于大环内酯的分子的方法,该方法使用上述该大环内酯生物合成途径的步骤阻断的微生物。该方法包括按照上面的方法获得生物合成中间体和修饰如此产生的中间体,任选地在从培养基中分离出来之后修饰。按照本领域技术人员熟知的技术可以确定培养此类微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域熟知的技术具体而言可以参照Kieser等,(2000)的工作。通过在生产培养基中加入适当成分或者通过将其它基因(这些基因编码通过利用中间体作为底物而能够对其进行修饰的蛋白质)导入微生物,可以修饰所产生中间体,任选地在分离之后修饰。因此能够对这些中间体进行化学、生物化学、酶学和/或微生物学修饰。更加优选地是,所讨论的大环内酯是螺旋霉素并且在其中进行一次或多次诱变的微生物是生二素链霉菌菌株。
本发明还涉及产生螺旋霉素I但不产生螺旋霉素II和III的微生物。该微生物含有生物合成螺旋霉素I但不产生螺旋霉素II和III所必需的所有基因,这是由于含有对应于SEQ ID No.13的序列或其变体之一或由于遗传密码简并性而由其衍生的序列之一、并且编码序列SEQ ID No.14的多肽或其变体之一的基因是不表达的或者已经被失活。通过任意本领域技术人员熟知的任一方法能够进行该蛋白质的失活,例如通过在编码所述蛋白质的基因中进行诱变,或者过量表达与编码所述蛋白质的信使RNA互补的反义RNA,这可以理解为:如果由该操作影响orf5*的表达,将必须进行另一种修饰从而使orf5*基因正确表达。为了使所编码的蛋白质失活或者阻止其表达或由其翻译,可以在编码序列中或非编码序列中进行诱变。通过定点诱变、基因置换或任意本领域技术人员熟知的其它方法,可以进行诱变。例如,按照T.Kieser等(2000)和Ausubel等2002的工作中所教授的内容,可以调整适于此种诱变的条件。通过在所考虑的基因中进行一个或多个碱基的抑制、替换、删除和/或添加或者通过基因失活,可以在体外或原位进行诱变。过量表达螺旋霉素生物合成途径的基因,而不表达含有序列SEQ ID No.13、或其变体之一、或由于遗传密码简并性而由衍生的序列之一、并编码序列SEQ ID No.14的多肽或其变体之一的基因,也可以获得该微生物。优选地是,微生物是链霉菌属的细菌。更加优选地是,该种仅产生螺旋霉素I而不产生螺旋霉素II和III的微生物是从产生螺旋霉素I、II和III的起始微生物获得的。甚至更加优选地是,通过在含有对应于SEQ ID No.13的序列,或其变体之一,或由于遗传密码简并性而由其衍生的序列之一,并编码序列SEQ ID No.14的多肽或其具有相同功能的变体之一,的基因中进行诱变获得该微生物。甚至更加优选地是,通过基因失活进行该诱变。优选地,从产生螺旋霉素I、II和III的生二素链霉菌菌株获得所述微生物,其中对含有对应于SEQ ID No.13的序列或由于遗传密码简并性而由其衍生的序列之一的基因进行了基因失活。最优选地,通过同相删除含有对应于SEQ ID No.13的序列或由于遗传密码简并性而由其衍生的序列之一的基因或基因的一部分,进行基因失活。通过举例说明,菌株SPM502(orf6*∷att1,参照实施例14)可以描述为产生螺旋霉素I而不产生螺旋霉素II和III的微生物。
本发明还涉及上述的产生螺旋霉素I而不产生螺旋霉素II和III的微生物,该微生物也过量表达:
-利用以下序列的引物对:5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3’(SEQ ID No.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA3’(SEQ IDNo.139),并以粘粒pSPM36或生二素链霉菌总DNA作为模板,通过聚合酶链式反应能够获得的基因,更加优选地是编码序列SEQ ID No.141的基因,
-或者由于遗传密码的简并性而由其衍生的基因。
在SEQ ID No.111(DNA)中给出了此种基因的序列的例子;然而,由于该序列不含相应编码序列的3’部分,所以该序列是部分序列。SEQ ID No.112给出了该编码序列部分所翻译成的蛋白质。具体而言利用实施例24中所教授的内容,本领域的技术人员将能够容易地完成这项工作。在第二步骤中确定了SEQ ID No.111中未确定的序列,并且在SEQ ID No.141中给出了该orf(orf28c)的完整序列。SEQ ID No.142给出了该编码序列所翻译成的蛋白质。实施例24给出了克隆orf28c基因的方法和产生允许orf28c表达的表达载体的方法。该实施例还表明在菌株OSC2中过量表达orf28c基因导致该菌株中螺旋霉素产量增加。通过增加该基因的拷贝数和/或通过导入比野生型启动子活性更强的启动子,能够获得orf28c基因过量表达。优选地,通过将允许该基因过量表达的重组DNA构建体导入微生物获得所述基因的过量表达。优选地,该重组DNA构建体增加所述基因的拷贝数并使得能够获得所述基因的过量表达。在该重组DNA构建体中,能够将该基因的编码序列置于比野生型启动子活性更强的启动子的控制之下。通过举例说明,所谈及的内容包括在生二素链霉菌中具有活性的ptrc启动子(E.Amann等,1988)及ermE*启动子。因此,优选地,所导入的一个或多个orf28c基因拷贝置于ermE*启动子的控制之下,如在构建体pSPM75中的情况(参照实施例24)。
本发明还涉及如上所述产生螺旋霉素I而不产生螺旋霉素II和III的微生物,该微生物也过量表达具有编码序列SEQ ID No.47或具有由于遗传密码简并性而由其衍生的编码序列的基因。优选地是,该微生物是菌株SPM502 pSPM525,其保藏于国立微生物保藏中心[National Collection ofCultures and Microorganisms](CNCM)巴斯德研究所,25,rue duDocteur Roux 75724 Paris Cedex 15,法国,保藏日为2003年2月26日,保藏号为I-2977。
本发明还涉及产生螺旋霉素I的方法;该方法包括在适当的培养基中,培养如上所述螺旋霉素I而不产生螺旋霉素II和III的微生物,回收条件培养基或细胞提取物,以及从先前步骤中获得的所述培养基或者细胞提取物中分离并纯化螺旋霉素I。按照本领域技术人员熟知的技术可以确定培养此种微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域的技术人员具体而言可以参照Kieser等,2000的工作。通过任意本领域技术人员熟知的技术都能够回收所产生的螺旋霉素I。例如,本领域的技术人员可参照美国专利3,000,785中所教授的技术,并且更加具体而言是该专利中所述的提取螺旋霉素的方法。
本发明的另一方面涉及根据本发明的核苷酸序列用于增加微生物大环内酯产量的用途。因此,本发明涉及产生大环内酯的突变微生物,该微生物在至少一个含有上述序列的基因中进行了遗传修饰,并且/或者该微生物过量表达至少一个含有上述序列的基因。为了表达一个或多个具有更高活性的蛋白质或者表达更高水平的该蛋白质或这些蛋白质,遗传修饰可以包括在所讨论的基因中进行一个或多个碱基的抑制、替换、删除和/或添加。通过增加该基因的拷贝数和/或通过导入比野生型启动子活性更强的启动子,能够获得所讨论的基因的过量表达。通过举例说明,所谈及的内容包括在生二素链霉菌中具有活性的ptrc启动子(E.Amann等,1988)和ermE*启动子(Bibb等,1985),(Bibb等,1994)。因此,通过将根据本发明的允许该基因过量表达的重组DNA构建体导入所考虑的产生大环内酯的微生物,能够获得所考虑的基因的过量表达。具体而言,大环内酯生物合成的某些步骤是是限制步骤并且,如果表达了参与这些限制步骤的一种或多种比野生型蛋白质具有更高活性或更高表达水平的蛋白质,有可能提高所涉及的大环内酯的产量。例如,通过复制编码限制性甲基转移酶(该酶将大菌素转化成泰乐菌素)的基因,已经在弗氏链霉菌中获得了增加了的泰乐菌素产率(R.Baltz,1997)。尤其是通过诱变能够获得活性更高的蛋白质的表达;例如,本领域的技术人员可以参照F.Ausubel等,(2002)的相关工作。优选地是,大环内酯产量得到提高的这些突变微生物是链霉菌属细菌。更加优选地是,所讨论的大环内酯是螺旋霉素并且在其中进行了一次或多次诱变的微生物是生二素链霉菌菌株。更加优选地是,在一个或多个含有对应于一个或多个序列SEQ ID No3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149的序列之一、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一的基因中进行了遗传修饰。优选地,该微生物过量表达一个或多个含有对应于一个或多个序列SEQ ID No3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149的序列之一、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一的基因。优选地,该微生物过量表达含有对应于SEQ ID No.111或141的序列、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一的基因。SEQ ID No.111中给出的序列是部分序列;然而,本领域的技术人员尤其可利用实施例24中所给出的技术将能够容易地完成该序列。在第二步骤中确定了SEQ IDNo.111中未确定的序列,并且在SEQ ID No.141中给出了该orf(orf28c)的完整序列。SEQ ID No.142给出了该编码序列所翻译成的蛋白质。实施例24给出了克隆orf28c基因的方法和产生允许orf28c表达的表达载体的方法。该实施例还表明在菌株OSC2中过量表达orf28c基因导致该菌株中螺旋霉素产量增加。通过增加该基因的拷贝数和/或通过导入比野生型启动子活性更强的启动子,能够获得orf28c基因过量表达。优选地,通过将允许该基因过量表达的重组DNA构建体导入微生物获得所述基因的过量表达。优选地,该重组DNA构建体增加所述基因的拷贝数并使得能够获得所述基因的过量表达。在该重组DNA构建体中,能够将该基因的编码序列置于比野生型启动子活性更强的启动子的控制之下。通过举例说明,所谈及的内容包括在生二素链霉菌中具有活性的ptrc启动子(E.Amann等,1988)及ermE*启动子。因此,优选地,所导入的一个或多个orf28c基因拷贝置于ermE*启动子的控制之下,如在构建体pSPM75中的情况(参照实施例24)。
本发明的另一方面涉及利用先前段落中所述的微生物产生大环内酯的方法。该方法包括在适当的培养基中培养先前段落中所定义的微生物,回收条件培养基或细胞提取物,以及从先前步骤中获得的所述培养基或者细胞提取物中分离并纯化所产生的大环内酯。按照本领域技术人员熟知的技术可以确定培养此类微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域的技术人员尤其可以参照Kieser等,2000的工作。通过任意本领域技术人员熟知的技术能够回收所产生的大环内酯。例如,本领域的技术人员可参照美国专利3,000,785中所教授的技术,并且更加具体而言是该专利中所述的提取螺旋霉素的方法。优选地是,在此种方法中所使用的微生物是链霉菌属的细菌。更加优选地是,所讨论的大环内酯是螺旋霉素,并且其螺旋霉素产量得到提高的突变微生物是生二素链霉菌菌株。
本发明的另一方面涉及根据本发明的序列和/或载体用于制备杂化抗生素的用途。具体而言,根据本发明的多核苷酸可以用于获得微生物,这些微生物表达一个或多个在底物特异性方面产生修饰的突变蛋白质,或者为了产生杂化抗生素可以在许多产生抗生素的微生物中表达这些多核苷酸。因此,通过生产微生物之间的基因转移,可以使得根据本发明的多核苷酸能够产生具有有利药理学特性的杂化抗生素(Hopwood等,1985a,Hopwood等,1985b,Hutchinson等,1989)。Hopwood(Hopwood 1981)首先提议利用该原则,基因工程能够引起产生杂化抗生素。因此提出参与抗生素生物合成的酶常常接受结构上相关但不同于其天然底物的底物。普遍认为抗生素生物合成途径的基因所编码的酶比基本代谢的酶具有更不严格的底物特异性(Hopwood 1981,Hutchinson 1988,Robinson 1988)。因此已经表明有可能通过产抗生素微生物、其突变体或所纯化的这些抗生素生物合成途径的酶转化大量非天然底物(Hutchinson 1988)。利用该教导,本领域的技术人员可以构建表达一种或多种在底物特异性上产生修饰的突变蛋白质的微生物,以产生杂化抗生素。
本发明还涉及根据本发明的至少一条多核苷酸和/或至少一个重组DNA和/或至少一个表达载体和/或至少一条多肽和/或至少一种宿主细胞用于进行一种或多种生物转化的用途。因此,本发明使得有可能构建这样的细菌或真菌菌株,其中根据本发明的一个或多个蛋白质在适当表达信号的控制下进行表达。然后此类菌株能够用于进行一种或多种生物转化。使用全细胞或者使用所述细胞的无细胞提取物,可以进行这些生物转化。这些生物转化使得有可能利用生物合成途径的酶将分子转化成衍生形式。例如,Carreras等(Carreras等,2002)描述了红色糖多孢菌和天蓝色链霉菌菌株用于产生新的红霉素衍生物的用途。Walczak等(Walczak等,2001)描述了链霉菌P450单加氧酶用于将desacetyladriamycin(蒽环霉素类似物)生物转化成新的蒽环霉素的用途。Olonao等(Olonao等,1999)描述了浅青紫链霉菌(Streptomyces lividans)修饰的菌株用于将ε-紫红霉酮生物转化成紫红菌素D的用途。本领域的技术人员可以将这些原则应用于任意生物合成中间体。
本发明还涉及这样的重组DNA,其包含:
-利用具有以下序列的引物对:5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3’(SEQ ID No.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA3’(SEQ ID No.139),并以粘粒pSPM36或生二素链霉菌的总DNA为模板,通过聚合酶链式反应能够获得的多核苷酸,更加优选地该多核苷酸是序列SEQ ID No.141的多核苷酸,
-或者至少有所述多核苷酸中的10,12,15,18,20至25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1460,1470,1480,1490或1500个连续核苷酸的片段。优选地是,该重组DNA是载体。甚至更优选地是,该载体选自噬菌体、质粒、噬菌粒、整合载体、fosmids、粘粒、穿梭载体、BAC(细菌人工染色体)和PAC(P1-来源的人工染色体)。通过举例说明,λ噬菌体和M13噬菌体可以描述为细菌噬菌体。作为质粒,可提及的是在大肠杆菌中复制的质粒,例如pBR322及其衍生物、pUC18及其衍生物、pUC19及其衍生物、pGB2及其衍生物(G.Churchward等,1984)、pACYC177(GenBank登录号:X06402)及其衍生物、和pACYC184(GenBank登录号:X06403)及其衍生物。还可提及的是在链霉菌中复制的质粒,例如pIJ101及其衍生物、pSG5及其衍生物、SLP1及其衍生物、和SCP2*及其衍生物(Kieser等,2000)。关于噬菌粒,通过举例说明,可提及的是pBluescript II及其衍生物(尤其是由Stratagene(LaJolla,California,USA)公司出售)、pGEM-T及其衍生物(由Promega(Madison,Wisconsin,USA)公司出售)、和λZAPII及其衍生物(尤其是由Stratagene(LaJolla,California,USA)公司出售)。关于整合载体,通过举例说明,可提及的是在链霉菌中整合的载体,例如来源于SLP1的载体(Kieser等,2000)、来源于pSAM2的载体(Kieser等,2000)、使用PhiC31噬菌体整合系统(Kieser等,2000)(例如pSET152(Bierman等,1992))或VWB整合系统(L.van Mellaert等,1998)的载体,并且还包括使用IS117整合系统(Kieser等,2000)的载体。关于fosmids,通过举例说明,可提及的是fosmid pFOS1(由New England Bioloabs有限公司,Beverly,Massachussetts,USA公司出售)及其衍生物。关于粘粒,通过举例说明,可提及的是粘粒SuperCos及其衍生物(尤其是由Stratagene(LaJolla,California,USA)公司出售)和粘粒pWED15(Wahl等,1987)及其衍生物。关于穿梭载体,通过举例说明,可提及的是大肠杆菌/链霉菌穿梭质粒,例如,pIJ903及其衍生物、质粒pUWL、pCAO106、pWHM3和pOJ446系列及其衍生物(Kieser等,2000),以及大肠杆菌/链霉菌穿梭BAC,例如,在专利申请WO 01/40497中所述的穿梭BAC。关于BAC(细菌人工染色体),通过举例说明,可提及的是BAC pBeloBAC11(GenBank登录号:U51113)。作为PAC(P1-来源的人工染色体),通过举例说明,可提及的是载体pCYPAC6(GenBank登录号:AF133437)。更加优选地是,该重组DNA是表达载体。能够用于此类系统的表达载体是本领域技术人员所熟知的;关于原核细胞,通过举例说明,可提及的是大肠杆菌中的表达载体,例如Stratagene(LaJolla,California,USA)公司出售的pET、Invitrogen(Carlsbad,California,USA)公司出售的GATEWAY系列载体、Invitrogen(Carlsbad,California,USA)公司出售的pBAD系列载体、New EnglandBioloabs有限公司(Beverly,Massachussetts,USA)公司出售的pMAL系列载体,以及在B.Wilms等(2001)的出版物中提及的鼠李糖-可诱导表达载体及其衍生载体;所提及的内容还包括链霉菌中的表达载体,例如载体pIJ4123,pIJ6021,pPM927,pANT849,pANT850,pANT851,pANT1200,pANT1201和pANT1202及其衍生物(Kieser等,2000)。关于酵母细胞,通过举例说明,所谈及的内容包括Stratagene(LaJolla,California,USA)公司出售的载体pESC。关于允许在昆虫细胞中表达的杆状病毒表达系统,通过举例说明,所谈及的内容包括BD Biosciences Clontech,(Palo Alto,California,USA)公司出售的载体BacPAK6。关于哺乳动物细胞,通过举例说明,所谈及的内容包括含有CMV(巨细胞病毒(Cytomegalovirus))早期即刻基因启动子的载体(例如由Stratagene(LaJolla,California,USA)公司出售的载体pCMV及其衍生物),或者猿猴空泡病毒的SV40早期启动子(例如由Stratagene(LaJolla,California,USA)公司出售的载体pSG5)。本发明的另一方面涉及已经将至少一个该段落中所述的重组DNA导入其中的宿主细胞。
本发明还涉及产生多肽的方法,其中所述方法包括以下步骤:
a)用至少一个上面段落中所述的表达载体转化宿主细胞;
b)在适当的培养基中培养所述宿主细胞;
c)回收条件培养基或细胞提取物;
d)从步骤c)中获得的所述培养基中或细胞提取物中分离并纯化所述多肽;
e)根据需要,鉴定所产生的重组多肽的特性。
按照本领域技术人员熟知并在诸如F.Ausubel等,(2002)中所述的方法,通过穿过一系列适当的层析柱,能够纯化所产生的重组多肽。通过举例说明,所谈及的内容包括“组氨酸-标签”技术,该技术在于将短的多聚组氨酸序列加到所产生的多肽上,使得该多肽有可能在镍柱上被纯化。通过体外合成技术也可以制备多肽。通过此类技术的举例说明,利用“快速翻译系统(RTS)”,尤其是由Roche Diagnostics France S.A.,Meylan,France公司出售,也可以制备多肽。
本发明的另一方面涉及产生至少一种螺旋霉素的微生物,该微生物过量表达:
-利用以下序列的引物对:5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3’(SEQ ID No.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA3’(SEQ ID No.139),并以粘粒pSPM36或生二素链霉菌总DNA作为模板,通过聚合酶链式反应能够获得的基因,更加优选地是编码序列SEQ ID No.141的基因,
-或者由于遗传密码简并性而由其衍生的基因。
在SEQ ID No.111(DNA)中给出了此种基因的序列的例子;然而,由于该序列不含相应编码序列的3’部分,所以该序列是部分序列。SEQ ID No.112给出了该编码序列部分所翻译成的蛋白质。尤其是利用实施例24中所教授的内容,本领域的技术人员将能够容易地完成该序列。因此该实施例给出了用于克隆orf28c基因的方法和用于产生允许orf28c表达的表达载体的方法。该实施例还表明在菌株OSC2中过量表达orf28c基因导致该菌株中螺旋霉素产量增加。优选地,过量表达以下基因
-利用以下序列的引物对:5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3’(SEQ ID No.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA3’(SEQ ID No.139),并以粘粒pSPM36或生二素链霉菌总DNA作为模板,通过聚合酶链式反应能够获得的基因,更加优选地是编码预序列SEQ ID No.141的基因,-或者由于遗传密码简并性而由其衍生的基因,的微生物是链霉菌属细菌;甚至更加优选地是,该微生物是生二素链霉菌物种的细菌。优选地,通过用表达载体转化所述微生物获得所述基因的过量表达;最优选地,微生物菌株是菌株OSC2/pSPM75(1)或菌株OSC2/pSPM75(2),保藏于国立微生物保藏中心(CNCM)[NationalCollection of Cultures and Microorganisms]巴斯德研究所,25,rue duDocteur Roux 75724 Paris Cedex 15,法国,保藏日为2003年10月6日,保藏号为I-3101。
本发明的另一方面涉及产生螺旋霉素的方法,该方法使用先前段落中所述的微生物。该方法包括在适当的培养基中培养先前段落中所定义的微生物,回收条件培养基或细胞提取物,以及从所述培养基或者从先前步骤中获得的细胞提取物中分离并纯化螺旋霉素。按照本领域技术人员熟知的技术可以确定培养此类微生物的条件。例如,培养基可以是用于链霉菌,尤其是用于生二素链霉菌的MP5培养基或SL11培养基(Pernodet等,1993)。关于链霉菌的培养,本领域的技术人员尤其是可以参照Kieser等,(2000)的工作。通过任意本领域技术人员熟知的技术都能够回收所产生的螺旋霉素。例如,本领域的技术人员可参照美国专利3,000,785中所教授的技术,并且更加具体而言是该专利中所述的提取螺旋霉素的方法。优选地是,用于此种方法的微生物是链霉菌属细菌。更加优选地是,该微生物是生二素链霉菌菌株。
本发明的另一方面涉及表达载体,其中序列SEQ ID No.47的多核苷酸或由于遗传密码简并性而由其衍生的多核苷酸置于允许所述多核苷酸所编码的蛋白质在生二素链霉菌中表达的启动子的控制之下。上面已经给出了能够用于链霉菌的表达载体的例子。优选地是,此种表达载体为质粒pSPM524或pSPM525。
本发明的另一方面涉及用先前段落中所定义的载体转化了的生二素链霉菌菌株。
本发明的另一方面涉及其序列包括序列SEQ ID No.112的多肽。本发明还涉及其序列对应于从以下编码序列所翻译的序列的多肽:
-利用以下序列引物对:5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3’(SEQ ID No.138)和5’GGATCCCGCGACGGACACGACCGCCGCGCA3’(SEQ ID No.139),并以粘粒pSPM36或生二素链霉菌总DNA作为模板,通过聚合酶链式反应能够获得的基因的多肽,更加优选地是编码序列SEQ ID No.141的基因,
-或者由于遗传密码简并性而由其衍生的基因。
优选地是,由链霉菌属细菌以天然状态表达这些多肽,更加优选地是,这些多肽参与螺旋霉素生物合成。
本发明的另一方面涉及允许先前段落中所定义的多肽在生二素链霉菌中表达的表达载体。上面已经给出了能够用于链霉菌的表达载体的例子。优选地是,所讨论的表达载体是质粒pSPM75。
附图简述:
图1:螺旋霉素I、II和III的化学结构。
图2:用于对区域进行序列分析的粘粒。
图3:参与螺旋霉素生物合成途径的基因群的组成图。
图4:所提出的mycarose生物合成途径。
图5:所提出的碳霉糖生物合成途径。
图6:所提出的forosamine生物合成途径。
图7:将糖添加到螺旋霉素分子和中间体上的优选顺序。
图8:所提出的生二素链霉菌中甲氧基丙二酰的生物合成途径。通过与吸水链霉菌子囊霉素变种中甲氧基丙二酰的生物合成(K.Wu等,2000)类比提出该途径。
图9:导致基因失活的步骤:
A)将靶基因克隆入在大肠杆菌中复制而不在链霉菌中复制的载体中;
B)将抗性盒插入靶基因(通过短相同序列之间的克隆或重组);
C)将质粒导入生二素链霉菌(通过转化或与大肠杆菌接合)和选择具有整合盒的克隆,然后筛选丢失载体部分从而具有基因置换的克隆;
D)突变体菌株的染色体区域,其中靶基因已通过基因置换失活。
图10:根据图9中所述方法进行基因失活之后的任选步骤,如果可切除盒已经用于打断靶基因,可以实施这些步骤;
E)将携带有pSAM2的xis和int基因的质粒pOSV508导入突变体菌株,其产物通过盒边侧的attL和attR序列之间的定点重组将允许进行有效的切除;
F)产生已丢失可切除盒并对针对盒所提供抗性敏感的抗生素的克隆;
G)在不含抗生素的固体培养基上生长和形成芽孢之后,质粒pOSV508以高频率被丢失。因此有可能获得硫链丝菌肽敏感的克隆,其中靶基因含有同相删除。通过PCR扩增和PCR产物的序列分析能够控制删除靶基因的序列。
图11:扩增可切除盒以将其用于同源重组实验。Chaveroche等,2000已经描述了通过短同源序列进行同源重组的技术。定位于这些寡核苷酸5’末端的39或40个脱氧核苷酸包含对应于将要失活的基因序列的序列,并且定位于大部分3’末端的20个脱氧核苷酸对应于可切除盒末端之一的序列。
图12:利用Chaveroche等,2000所述的技术产生用于失活靶基因的构建体。
图13:质粒pWHM3的图谱。Strepto ori:链霉菌复制起点。
图14:质粒pOSV508的图谱。
图15:可切除盒结构的例子。它包括边侧是attR和attL位点(Raynal等,1998)的Ωhyg盒(Blondelet-Rouault等,1997),由于xis和int基因的表达,在attR和attL位点之间的重组事件将允许盒的切割。
图16:质粒pBXL1111的图谱。
图17:质粒pBXL1112的图谱。
图18:微生物学测试螺旋霉素产量,基于藤黄微球菌菌株对螺旋霉素的敏感性。所用藤黄微球菌菌株是天然对螺旋霉素敏感而对杀刚锥虫素具抗性的菌株。所测试的多株链霉菌菌株培养于含有70ml MP5培养基的500ml锥形瓶中,以2.5×106芽孢/ml的起始浓度接种并以250转/分钟定轨振荡在27℃生长。培养48、72和96小时之后,取出发酵液样本并离心。将用无菌培养基10倍稀释的这些上清用于测试。抗杀刚锥虫素但对螺旋霉素敏感的藤黄微球菌指示菌(Gourmelen等,1998)培养于面积为12×12cm的平皿中。用70μl10倍稀释的每种上清浸湿Whatman AA滤纸盘并放置于平皿表面。将用不同浓度(MP5培养基中2-4-8μg/ml)的螺旋霉素溶液浸湿的盘稀释为标准范围。将皿在37℃孵育24-48小时。如果滤纸盘含有螺旋霉素,它将扩散进入琼脂并抑制藤黄微球菌指示菌的生长。这种抑制在滤纸盘周围产生“晕”,晕反映了藤黄微球菌菌株不生长的区域。因此这种晕的存在是存在螺旋霉素的指示并且使得能够确定所讨论的生二素链霉菌菌株是否是或者不是螺旋霉素生产菌。将所获得的抑制直径与标准范围进行比较使得能够获得对该菌株所产生的螺旋霉素量的指示。
图19:菌株OSC2的经过滤培养上清液的HPLC色谱图。
图20:菌株SPM501的经过滤培养上清液的HPLC色谱图。
图21:菌株SPM502的经过滤培养上清液的HPLC色谱图。
图22:菌株SPM507的经过滤培养上清液的HPLC色谱图。
图23:菌株SPM508的经过滤培养上清液的HPLC色谱图。
图24:菌株SPM509的经过滤培养上清液的HPLC色谱图。
图25:使用FASTA程序对所产生的弗氏链霉菌的TylB蛋白质(SEQ IDNo.87)与Orf3蛋白质(SEQ ID No.29)的比对。
图26:使用FASTA程序产生的SrmD蛋白质(SEQ ID No.16)与生米卡链霉菌的MdmA蛋白质(SEQ ID No.88)的比对。
图27:可切除盒切除后残余位点的序列的例子。以粗体表示的是Raynal等,1998中所定义的最小att26位点。SEQ ID No.104中给出了相位1(att1)33个核苷酸的序列,SEQ ID No.105中给出了相位2(att2)34个核苷酸的序列,并且SEQ ID No.95中给出了相位3(att3)35个核苷酸的序列。
图28:orf10基因、所用PCR引物的定位和由每对引物所获得的构建体的图解说明。
图29:pac-oritT盒的构建。
图30:粘粒pWED2的图谱。
图31:图解说明参与螺旋霉素生物合成途径的基因群和用于分离大肠杆菌中生二素链霉菌OSC2菌株的基因组DNA文库的粘粒的三个探针的定位(参照实施例19)。
图32:从大肠杆菌中生二素链霉菌OSC2菌株的基因组DNA文库分离的粘粒的插入位点(参照实施例19)。
图33:粘粒pSPM36 PstI-PstI片段的亚克隆(质粒pSPM58插入),粘粒pSPM36 StuI-StuI片段的亚克隆(质粒pSPM72插入)和EcoRI-StuI片段的亚克隆(质粒pSPM73插入)。
图34:质粒pSPM58的PstI-PstI插入和质粒pSPM73的EcoRI-StuI插入中所鉴定的开放阅读框的定位。
图35:在238和280nm产生的菌株OS49.67经过滤培养上清液的HPLC色谱图的叠置(上面)和33.4分钟和44.8分钟时洗脱的分子的UV谱(下面)。
图36:platenolide A和platenolide B分子的分子结构。
图37:参与螺旋霉素生物合成途径的基因群的组成图。
图38:菌株SPM507所产生的生物合成中间体的分子结构。
图39:来自过度产生螺旋霉素菌株的基因型为orf6*∷att1Ωhyg+的生二素链霉菌菌株所产生的生物合成中间体的结构。将盒att1Ωhyg+插入orf6*产生阻止orf5*表达的极性效应。
图40:由菌株OS49.67所产生的platenolide A+mycarose和platenolideB+mycarose分子的分子结构。
图41:粘粒pSPM36 PstI-PstI片段的亚克隆(质粒(pSPM79)插入),质粒pSPM79的PstI-PstI插入中所鉴定的开放阅读框的定位和序列SEQ IDN°140的定位。
通过以下实施例对本发明进行说明,这些实施例可视为非限制性举例说明。
总之,螺旋霉素生物合成途径的基因是从生二素链霉菌的基因组DNA文库中分离得到的。通过使用BamHI限制性酶对生二素链霉菌基因组DNA进行部分消化获得了该文库。将大的DNA片段,平均35-45kb,克隆入由粘粒pWED15(Wahl等,1987)衍生的粘粒pWED1(Gourmelen等,1998)中。使用噬菌体颗粒将这些粘粒导入大肠杆菌。将如此获得的文库用对应于弗氏链霉菌tylB基因(Merson-Davies和Cundliffe,1994,GenBank登录号:U08223)部分的探针(序列SEQ ID No.86)进行杂交。杂交之后,在与探针杂交的4个粘粒中更加具体地选择一个粘粒。然后用SacI消化命名为pOS49.1的该粘粒,并将包含与该探针杂交区域的3.3kb片段亚克隆入载体pUC19并测序。鉴定出了4个开放阅读框并且其中一个编码与弗氏链霉菌TylB蛋白质(SEQ ID No.87)呈现强相似性的蛋白质(SEQ ID No.29)(参照图25)。该基因命名为orf3(SEQ ID No.28)并在生二素链霉菌中失活该基因。有可能证明其中orf3基因失活的克隆不再产生螺旋霉素。这表明orf3基因或定位于下游的基因参与螺旋霉素生物合成。
一旦上述方面已经得到确认,将粘粒pOS49.1的较大区域,即以前研究的SacI片段的任意一侧,进行测序。因此,有可能从粘粒pOS49.1获得包含7个完整开放阅读框和定位于这7个完整开放阅读框任意一侧的其它2个不完整开放阅读框区域的序列。通过在数据库中搜索,可表明一个不完整开放阅读框对应于srmG基因座(编码称为“聚酮化合物合酶”(PKS)的酶的区域)。利用S.Burgett等,1996(美国专利5,945,320)的方法将相应基因进行亚克隆。而且,在数据库中没有发现其它开放阅读框,命名为:orf1,orf2,orf3,orf4,orf5,orf6和orf7(SEQ ID No.23,25,28,30,34,36,40)的7个完整的ORF和命名为orf8(序列SEQ ID No.43)的第8个ORF的起点。
随后,为了克隆参与螺旋霉素生物合成的其它基因,分离了在该相同区域中含有生二素链霉菌基因组片段的其它粘粒。为此,使用3个探针在菌落上进行了另外一系列杂交。第1个探针对应从pOS49.1亚克隆的包含orf1,orf2和orf3起点的3.7kb DNA片段。第2个探针对应从pOS49.1亚克隆的包含orf7一部分和orf8一部分的2kb DNA片段。还使用了第3个探针。后一探针对应含有srmD基因的1.8kb DNA片段。srmD基因是从生二素链霉菌分离得到的能够赋予螺旋霉素抗性的基因。具体而言,先前的研究已使得能够克隆生二素链霉菌的几个抗性决定簇,所述抗性决定簇赋予灰浅红黄链霉菌菌株(螺旋霉素-敏感菌株)螺旋霉素抗性(Pernodet等,1993)(Pernodet等,1999)。为了分离抗性基因,已经在粘粒pKC505中产生了生二素链霉菌菌株基因组DNA的粘粒文库(Richardson MA等,1987)。已经将该粘粒库导入天然对螺旋霉素敏感的灰浅红黄链霉菌。如此已经获得了5个能够赋予灰浅红黄链霉菌阿泊拉霉素抗性和螺旋霉素抗性的粘粒。在这5个粘粒中,命名为pOS44.1的粘粒,在其插入片段中含有srmD基因,该基因编码的蛋白质与生米卡链霉菌mdmA基因所编码的且在该生产者中参与麦迪霉素抗性的蛋白质(Hara等,1990,GenBank登录号:A60725)(图26)呈现某种相似性。用于定位螺旋霉素生物合成基因的第3个探针是包含srmD基因的大约1.8kb片段的插入。
将这三个探针用于杂交上述的基因组DNA文库并且有可能选出两个粘粒(pSPM7和pSPM5),它们倾向于含有最长的插入片段并且没有共同的条带。粘粒pSMP5与第一和第二个探针杂交,但不与第三个探针杂交,而粘粒pSPM7仅与第三个探针杂交。使用“鸟枪法序列分析”技术对这两个粘粒进行完全测序。这两个粘粒:pSPM7和pSPM5插入的序列能够进行组合,尽管它们不重叠,但每个插入片段在其一个末端都包含已知的序列。具体而言,每个插入片段都包含一个编码称为“聚酮化合物合酶”(PKS)的基因的序列片段。S.Burgett等,1996(美国专利5,945,320)克隆了这五个基因(参照图2)。因此,有可能确定单一生二素链霉菌基因组DNA序列。SEQ ID No.1中给出了在5’位置从EcoRI位点起始定位于第一个PKS基因并且延伸至3’位置BamHI位点的30 943个核苷酸的序列(参照图2和3)。SEQ ID No.2中给出了在5’位置从PstI位点起始并延伸至3’位置BstEII位点、定位于第五个PKS基因的11171个核苷酸的第二个区域。该区域是PKS基因下游区域(下游和上游由5个PKS基因的方向定义或以相同方向定向)(参照图2和3)。
然后,为了克隆参与螺旋霉素生物合成的其它基因,分离了在该相同区域中含有生二素链霉菌基因组片段的其它粘粒(参照实施例18和19)。实施例1:大肠杆菌中生二素链霉菌菌株ATCC23877的基因组DNA文库的构建
1.1.生二素链霉菌菌株ATCC23877基因组DNA的提取。
生二素链霉菌菌株ATCC23877(尤其可由美国典型培养物保藏中心(ATCC)(Manassas,Virginia,USA)获得,保藏号为23877)培养于YEME(酵母提取物-麦芽浸膏)(Kieser,T等,2000),并按照裂解和沉淀的标准技术(Kieser T等,2000)提取并纯化该菌株的基因组DNA。
1.2.基因组DNA文库的构建
用BamHI限制性酶部分消化如上分离的生二素链霉菌菌株ATCC23877基因组DNA,从而获得大小在大约35和45kb之间的DNA片段。将这些片段克隆入预先用BamHI消化了的粘粒pWED1(Gourmelen等,1998)。通过删除含有在哺乳动物中具活性的表达模件的4.1kbHpaI-HpaI片段(Gourmelen等,1998),从粘粒pWE15(Wahl等,1987)得到粘粒pWED1。然后,利用Promega公司出售的“Packagene_λDNA包装系统”,按照制造商推荐的步骤,在体外将连接混合物包装入λ噬菌体颗粒内。将所得到的噬菌体颗粒用于感染Stratagene公司(LaJolla,California,USA)出售的大肠杆菌SURE_菌株。由于粘粒pWED1赋予了氨苄青霉素抗性,所以在LB培养基+氨苄青霉素(50μg/ml)的平板上筛选克隆。
实施例2:生二素链霉菌中参与螺旋霉素生物合成的基因的分离和表征
2.1生二素链霉菌ATCC23877基因组文库大肠杆菌克隆的菌落杂交
将上面得到的文库的大约2000个大肠杆菌克隆转移到滤膜上进行杂交。用于杂交的探针包含弗氏链霉菌一部分tylB基因的NaeI-NaeI DNA片段(SEQ ID No.86)。该片段对应于L.A.Merson-Davies和E.Cundliffe所述的核苷酸2663-3702的DNA片段(L.A.Merson-Davies和E.Cundliffe,1994,GenBank登录号:U08223),其中tylB基因的编码序列对应于核苷酸2677-3843。
使用随机引物技术(Roche公司出售的试剂盒)用32P标记弗氏链霉菌tylB基因部分的NaeI-NaeI DNA片段(SEQ ID No.86),并将其作为探针杂交文库的2000个克隆,转移至滤膜上。所用的膜是Amersham公司(Amersham Biosciences,Orsay,France)出售的Hybond N尼龙膜并且在Church和Gilbert(Church和Gilbert,1984)所述的缓冲液中在55℃进行杂交。在2X SSC中55℃洗涤15分钟,然后55℃在0.5X SSC中连续洗两次,每次15分钟。在这些杂交和洗涤条件下,在2000个杂交克隆中有4个克隆呈现强杂交信号。将这4个克隆培养于LB培养基+氨苄青霉素(50μ/ml)中,并且通过标准碱性裂解(Sambrook等,1989)提取相应的4个粘粒。然后证明了杂交确实是由于存在于这4个粘粒中插入的DNA片段。为此,分别用几种酶(BamHI,PstI和SacI)消化粘粒。在琼脂糖凝胶上分离消化产物,转移到尼龙膜上,并且在上述相同的条件下与包含弗氏链霉菌tylB基因部分(参照上面)的NaeI-NaeI DNA片段杂交。这有可能验证这4个粘粒并且更加具体而言是选择这些粘粒中的一个且命名为pOS49.1。
2.2验证所鉴定区域的参与和对粘粒pOS49.1插入部分的序列分析
亚克隆粘粒pOS49.1插入部分的几个片段并确定它们的序列。用SacI酶消化粘粒pOS49.1,并且通过在上述条件下进行的Southern印迹表明3.3kb片段包含与tylB探针杂交的区域。通过从0.8%琼脂糖凝胶上电洗脱分离该3.3kb片段,然后将其克隆入载体pUC19(GenBank登录号:M77789)并测序。如此得到的质粒命名为pOS49.11。使用FramePlot程序(J.Ishikawa和K.Hotta,1999),在该片段中能够鉴定出4个呈现典型的链霉菌密码子选择的开放阅读框(两个完整的和两个截短的开放阅读框)。利用FASTA程序(参见(W.R.Pearson & D.J Lipman,1988)和(W.R.Pearson,1990),尤其可自法国Evry的INFOBIOGEN资源中心获得)进行的序列比较使得能够表明由这4个开放阅读框之一推导出的蛋白质与弗氏链霉菌TylB蛋白质(SEQ ID No.87;GenBank登录号:U08223)呈现强序列相似性(参照图25)。该蛋白质命名为Orf3(SEQ ID No.29)。
为了测试相应基因(orf3基因(SEQ ID No.28))是否参与生二素链霉菌中的螺旋霉素生物合成,用Ωhyg盒(M-H.Blondelet-Rouault等,1997,GenBank登录号:X99315)打断该基因。为此,用XhoI酶消化质粒pOS49.11,并将包含这4个开放阅读框(两个完整的和两个截短的开放阅读框,包括全长orf3)的片段亚克隆入Stratagene公司(LaJolla,California,USA)出售的载体pBC SK+的XhoI位点。如此得到的质粒命名为pOS49.12。为了失活orf3,通过钝末端克隆将Ωhyg盒克隆入后一质粒以代替orf3内的PmlI-BstEII片段。为此,用PmlI和BstEII酶消化质粒pOS49.12,在orf3基因编码序列中仅有一个PmlI和BstEII位点。通过用Klenow酶(DNA聚合酶I大片段)处理相应载体片段的末端产生钝末端。通过用BamHI酶消化质粒pHP45Ωhyg(Blondelet-Rouault等,1997,GenBank登录号:X99315)得到Ωhyg盒。在琼脂糖凝胶上回收相应Ωhyg盒的片段,并且通过用Klenow酶处理使其末端成为钝末端。将如此获得的两个钝末端片段(Ωhyg盒和质粒pOS49.12)连接并将连接产物用于转化大肠杆菌细菌。如此得到的质粒命名为pOS49.14并且该质粒包含用已Ωhyg盒间断的orf3基因。
将以XhoI-XhoI片段形式存在且其两端通过Klenow酶处理形成非粘性末端的质粒pOS49.14插入片段克隆入质粒pOJ260的EcoRV位点(质粒pOJ260是能够在大肠杆菌中复制而不能在生二素链霉菌中复制的接合质粒(M.Bierman等,1992)。该质粒在大肠杆菌和链霉菌中赋予阿泊拉霉素抗性)。所得到的质粒(将质粒pOS49.14的插入片段克隆入质粒pOJ260)命名为pOS49.16。使用接合的大肠杆菌菌株S17-1,如Mazodier等(Mazodier et al.,1989)所述,通过接合将后一质粒转移入生二素链霉菌菌株ATCC23877。大肠杆菌菌株S17-1来源于大肠杆菌菌株294(Simon等,1983)(Simon等,1986)。有可能获得反式接合克隆,这些克隆具有Ωhyg盒所携带的潮霉素抗性标记并且已丢失了载体pOJ260所携带的阿泊拉霉素抗性标记。为此,接合之后,选择具有潮霉素抗性的克隆。然后将潮霉素-抗性克隆分别传代培养于具有潮霉素(抗生素B)和具有阿泊拉霉素(抗生素A)的培养基上(参照图9)。大体而言,对潮霉素(HygR)具有抗性且对阿泊拉霉素(ApraS)敏感的克隆是那些其中已经发生了双重重组事件并因此而拥有被Ωhyg盒间断的orf3基因的克隆。通过两个连续的杂交证明野生型orf3拷贝已由间断的拷贝所替换。因此,为了证明在所得克隆的基因组DNA中存在盒,用多种酶消化所得克隆的总DNA,在琼脂糖凝胶上进行分离,将其转移到膜上并与对应Ωhyg盒(参照上面)的探针进行杂交。使用含有四个开放阅读框(两个完整的和两个截短的,包含全部orf3)的质粒pOS49.11的XhoI-XhoI片段作为探针,进行第二次杂交。通过本领域技术人员熟知的任意方法,且尤其是通过利用适当寡核苷酸的PCR和对PCR产物的序列分析,也能够进行基因型的验证。选择了如此得到的一个orf3∷Ωhyg克隆并将其命名为OS49.16,对该克隆的基因型已经进行了验证。
使用下述的生产量测试方法测定了如此所得OS49.16克隆的螺旋霉素产量(参照实施例15)。因此有可能证明该菌株不再产生螺旋霉素,证实orf3和/或定位于下游的基因例如orf4参与螺旋霉素生物合成。
一旦已经得到这种证实,就对粘粒pOS49.1的较大区域,在以前研究的SacI片段任意一侧,进行了序列分析。因此,有可能从粘粒pOS49.1获得这个区域的序列,该区域包含七个完整开放阅读框和其它两个定位于这七个开放阅读框任意一侧的不完整开放阅读框。通过在数据库中搜索,有可能表明不完整开放阅读框之一对应于srmG基因座(编码称为“聚酮化合物”(PKS)的酶的区域)。S.Burgett等,1996(美国专利5,945,320)克隆了相应基因。而且,在数据库中没发现其它开放阅读框:七个完整ORF命名为:orf1,orf2,orf3,orf4,orf5,orf6和orf7(SEQ ID No23,25,28,30,34,36和40),和命名为orf8的第八个ORF的起点(SEQ ID No.43中给出了该orf的全部序列)。
实施例3:参与生二素链霉菌中螺旋霉素生物合成的其它基因的分离和表征
其次,为了克隆参与螺旋霉素生物合成的其它基因,分离了在该相同区域中含有生二素链霉菌基因组片段的其它粘粒。为此,使用以下三个探针进行了另外一系列菌落杂交:
-所使用的第一条探针对应3.7kb的含有PKS基因片段的BamHI-PstIDNA片段(S.Burgett等,1996(美国专利5,945,320)克隆了相应PKS基因),从pOS49.1亚克隆的orf1、orf2和orf3起点,涵盖定位于SEQ ID No.1中定义为位置1的EcoRI位点上游1300个碱基对的BamHI位点,到定位于2472位置(SEQ ID No.1)的PstI位点。将该BamHI-PstI片段从pOS49.1亚克隆入质粒pBC SK+,这使得有可能得到质粒pOS49.28。
-所使用的第二条探针对应大约2kb的含有orf7和orf8片段的PstI-BamHIDNA片段,该片段是从pOS49.1亚克隆得到的,涵盖从定位于SEQ ID No.1的6693位置的PstI位点到定位于SEQ ID No.1的8714位置的BamHI位点。将该PstI-BamHI片段从pOS49.1亚克隆入质粒pBC SK+,这使得有可能得到质粒pOS49.76。
-还使用了第三条探针。该探针对应1.8kb的包含srmD基因的EcoRI-HindIII DNA片段。srmD基因是从生二素链霉菌分离得到的能够赋予螺旋霉素抗性的基因。具体而言,先前的研究已经使得能够克隆生二素链霉菌的几个抗性决定簇,所述抗性决定簇赋予灰浅红黄链霉菌(S.griseofuscus)菌株(螺旋霉素敏感菌株)螺旋霉素抗性(Pernodet等,1993)(Pernodet等,1999)。为了分离抗性基因,已经在粘粒pKC505中制备了生二素链霉菌菌株ATCC23877基因组DNA的粘粒文库(M.A.Richardson等,1987)。因此,为了得到大小在大约30和40kb之间的片段,已经用Sau3AI对生二素链霉菌菌株ATCC23877基因组DNA进行了部分消化。已经将如此消化的基因组DNA(3μg)与预先用BamHI酶消化的1μg pKC505进行连接(Pernodet等,1999)。然后将连接混合物体外包装入噬菌体颗粒中。所获得的噬菌体颗粒已经用于感染大肠杆菌菌株HB101(尤其可自美国典型培养物保藏中心(ATCC)(Manassas,Virginia,USA)获得,保藏号为33694)。已经收集了大约20 000个阿泊拉霉素抗性大肠杆菌克隆并且已经提取了这些克隆的粘粒。通过原生质体转化已经将该粘粒库导入灰浅红黄链霉菌菌株DSM 10191(K.L.Cox和R.H.Baltz,1984),该菌株天然对螺旋霉素敏感(R.N.Rao等,1987,该菌株尤其是从德国微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikro-organismen und ZellkulturenGmbH,DSMZ),(Braunschweig,Germany)获得的,编号为DSM 10191)。在含有阿泊拉霉素的培养基上筛选了转化体。已经将1300个在含有阿泊拉霉素的培养基上生长的克隆转移到含5μg/ml螺旋霉素的培养基上。有几个阿泊拉霉素抗性克隆生长于含螺旋霉素的培养基上,并且已经提取了这些菌落的粘粒并将其用于转化大肠杆菌和灰浅红黄链霉菌(Pernodet等,1999)。因此已经获得了5个能够赋予大肠杆菌阿泊拉霉素抗性并赋予灰浅红黄链霉菌阿泊拉霉素和螺旋霉素共同抗性的粘粒。在这5个粘粒中,确定了命名为pOS44.1的粘粒,在其插入片段中,含有基因(SEQ ID No.15),该基因所编码的蛋白质(SEQ ID No.16)与生米卡链霉菌mdmA基因所编码的蛋白质(SEQ ID No.88)呈现某种相似性;该基因命名为srmD(参照图26中所示的使用FASTA程序进行的比对(参照W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),尤其可获自法国Evry的INFOBIOGEN资源中心))。
为了分离包含于质粒pOS44.1中的抗性决定簇,用Sau3AI限制性酶部分消化该质粒以获得大小为大约1.5-3kb的片段,并将这些片段连接入用BamHI酶线性化的载体pIJ486中(Ward等,1986)。根据其在天然对螺旋霉素敏感的灰浅红黄链霉菌菌株DSM 10191(参照上面)中赋予螺旋霉素抗性的能力选择质粒(R.N.Rao等,1987)。为此,通过原生质体转化,将相应的已连接入载体pIJ486中的pOS44.1 Sau3AI片段的质粒库(参照上面)导入菌株DSM 10191,并筛选其硫链丝菌肽抗性(由于pIJ486携带的tsr基因)。将生长于含硫链丝菌肽培养基上的克隆转移至含螺旋霉素培养基上。几个硫链丝菌肽抗性克隆也生长于含螺旋霉素的培养基上并提取这些菌落的质粒。选择能赋予抗性且含有大约1.8kb插入片段的质粒并命名为pOS44.2。由于载体中插入部分两侧存在HindIII位点和EcoRI位点,所以能够容易地切除该1.8kb插入片段。将该1.8kb HindIII-EcoRI插入片段进行序列分析并将其含有的抗性基因命名为srmD。因此能够容易地将含有srmD基因的该片段亚克隆入用EcoRI-HindIII切开的载体pUC19(GenBank登录号:M77789)中并将所得质粒命名为pOS44.4。该质粒中含有srmD基因的1.8kb HindHIII-EcoRI插入片段用作探针以定位螺旋霉素生物合成基因(参照下面)。
含有质粒pOS44.4的大肠杆菌DH5α菌株的样本保藏于国立微生物保藏中心[National Collection of Cultures and Microorganisms](CNCM)巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2918。
按照常规技术(Sambrook等,1989),将上面(参照实施例1)所获得的文库的大约2000个克隆转移至滤膜上以进行菌落杂交。
使用随机引物技术(Roche出售的试剂盒)用32P标记上述三个探针并用于杂交文库的2000个克隆,然后转移至滤膜上。在Church和Gilbert(Church和Gilbert,1984)所述的缓冲液中在65℃进行杂交。用2XSSC 65℃洗涤15分钟且然后用0.5X SSC 65℃连续洗涤两次,每次洗涤15分钟。在这些杂交和洗涤条件下,所杂交的2000个克隆中的16个克隆与至少一个探针呈现强杂交信号。然而,没有与三个探针均杂交的粘粒。提取这16个粘粒并用BamHI限制性酶消化。将这些不同粘粒的限制性酶切图谱彼此进行比较使得选择出两个粘粒,它们倾向于含有最大插入区并且没有相同的条带。因此,选择这两个粘粒,一个命名为pSPM5并且另一个命名为pSPM7。粘粒pSPM5与探针orf1-orf4和探针orf8杂交,但不与探针srmD杂交。pSPM7仅与探针srmD杂交而不与其它两个探针杂交。
使用“鸟枪序列分析”技术对这2个粘粒进行完全序列分析。尽管这2个粘粒:pSPM7和pSPM5,插入部分的序列不重叠,但在每个插入部分的一个末端都包含已知序列,所以能够将这2个粘粒插入部分的序列进行组合排列。具体而言,每个插入部分都包含一个编码称为“聚酮化合物合酶”(PKS)的酶的基因的序列片段。S.Burgett等,1996(美国专利5,945,320)克隆了这5个基因(参照图2)。因此,有可能确定单个生二素链霉菌基因组DNA序列。SEQ ID N°1中给出了30 943个核苷酸的序列,该序列在5’位置从定位于第一个PKS基因中的EcoRI位点起始并延伸至3’位置的BamHI位点。该序列对应PKS基因上游的区域(参照图2和3)。SEQ ID No.2中给出了11 171个核苷酸的第二序列区域,该区域从5’位置PstI位点起始并延伸至3’位置定位于第五个PKS基因中的NcoI位点。该第二序列区域是PKS基因下游的区域(由全部以相同方向定位的5个PKS基因的方向定义下游和上游)(参照图2和3)。
实施例4:参与螺旋霉素生物合成的基因的核苷酸序列分析、开放阅读框的确定和表征
使用FramePlot程序分析所得序列(J.Ishikawa和K.Hotta 1999)。这有可能从开放阅读框中鉴定出呈现典型的链霉菌密码子选择的开放阅读框。该分析有可能确定该区域包含定位于编码“聚酮化合物合酶”(PKS)的5个基因任意一侧的35个ORF。在这些基因的下游和上游分别鉴定出10个和25个ORF(由全部以相同方向定位的5个PKS基因的方向定义下游和上游)(参照图3)。因此,在5个PKS基因上游鉴定出占据大约31kb区域的该类型25个开放阅读框(SEQ ID No.1和图3)并且在PKS基因下游鉴定出占据大约11.1kb区域的该类型10个开放阅读框(SEQ ID No.2和图3)。上游区域的基因命名为orf1,orf2,orf3,orf4,orf5,orf6,orf7,orf8,orf9c,orf10,orf11c,orf12,orf13c,orf14,orf15c,orf16,orf17,orf18,orf19,orf20,orf21c,orf22c,orf23c,orf24c和orf25c(SEQ ID No23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82和84)。下游区域的基因命名为orf1*c,orf2*c,orf3*c,orf4*c,orf5*,orf6*,orf7*c,orf8*,orf9*和orf10*(SEQ ID No3,5,7,9,11,13,15,17,19和21)。对于所讨论的ORF,加到基因名称中的“c”意思是指编码序列是反方向的(因此编码链是与SEQ ID No.1或SEQ ID No.2中所给出的这些基因的序列互补的链)(参照图3)。
使用各种程序将由这些开放阅读框所推导出的蛋白质序列与多种数据库中所存在的那些序列进行比较:BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索、COGs(Cluster of Orthologous Groups)(这三个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)得到)、FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990),BEAUTY(K.C.Worley等,1995)),(这两个程序尤其可以从INFOBIOGEN资源中心,Evry,France得到)。这些比较使得能够明确描述关于这些基因产物的功能假说和鉴定那些可能参与螺旋霉素生物合成的基因。
实施例5:基因失活:构建敲除生二素链霉菌菌株的原则
所用方法包括进行基因置换。如图9中所示,用能赋予抗生素(例如阿泊拉霉素或潮霉素)抗性的盒打断的靶基因的拷贝替换要打断的靶基因。所使用的盒在任意一侧紧挨所有阅读框中的翻译终止密码子和在链霉菌中具活性的转录终止子。
将盒插入靶基因可以伴有或者可以不伴有在该靶基因中的删除。盒两侧区域的大小可以从几百个到几千个碱基对。
用盒失活基因所需的构建体是在大肠杆菌中获得的,大肠杆菌是获得重组DNA构建体的参照有机体。在能够在大肠杆菌中复制而不能在链霉菌中复制的质粒中得到被打断的基因。
然后将构建体亚克隆入载体以允许转化和生二素链霉菌中目的基因的失活。为此,使用了两种质粒:
pOJ260(M.Bierman等,1992)(参照实施例2),该质粒在大肠杆菌和链霉菌中赋予阿泊拉霉素抗性并且当靶基因用能赋予潮霉素抗性的盒打断时使用该质粒。
pOSK1205(4726bp)。该质粒来源于质粒pBK-CMV(由Stratagene公司(LaJolla,California,USA)出售),其中含有编码新霉素/卡那霉素抗性的序列的AvrII片段已经由编码潮霉素抗性的序列代替,而同时保留了PSV40启动子。为此,用NotI和PflmI酶消化质粒pHP45-Ωhyg(Blondelet-Rouault等,1997),并且当已经用Klenow酶处理使所有末端成为钝末端后,将赋予潮霉素抗性的片段亚克隆入载体pBK-CMV的AvrII位点。在pOSK1205中,pSV40启动子在赋予潮霉素抗性的盒前面。该质粒在大肠杆菌和链霉菌中赋予潮霉素抗性并且在靶基因被赋予阿泊拉霉素抗性的盒打断时使用。
通过该靶基因中存在的限制性酶切位点进行克隆,或者通过上述短的相同序列之间的重组,例如通过Chaveroche等(M.K.Chaveroche et al.,2000)的方法,将盒导入靶基因中。
然后,例如通过大肠杆菌和链霉菌之间的接合作用(P.Mazodier等,1989),能够将携带着被盒打断的基因的质粒导入生二素链霉菌。当基本载体是载体pOJ260时使用该技术。为了增加如Oh和Chater(Oh & Chater,1997)所述重组的频率,也可以使用第二个技术:通过碱处理变性DNA(T.Kieser等,2000)后的原生质体转化技术。当基本载体是pOJ260或pOSK1205时使用该技术(参照下面)。然后用相应于靶基因中所存在的盒的抗生素(参照图9,抗生素B)筛选这些转化体。如此选择出克隆混合物,其中已经通过一次或两次重组事件进行了整合。接下来,找出了对载体中所存在的抗性基因(重组盒之外)的抗生素(参照图9,抗生素A)敏感的克隆。因此原则上有可能筛选出一些这样的克隆,其中已经进行了两次重组事件,导致野生型基因由被盒打断的拷贝所替换。这些步骤图解显示于图9。
几个盒能够用于打断靶基因。例如能够使用赋予潮霉素抗性的Ωhyg盒(Blondelet-Rouault等,1997,GenBank登录号:X99315)。
实施例6:在orf3基因中具有同相敲除的生二素链霉菌菌株的构建
已经用Ωhyg盒打断orf3基因(参照实施例2.2),并且有可能证明orf3∷Ωhyg菌株不再产生螺旋霉素,这证实所克隆区域的一个或多个基因参与螺旋霉素生物合成(参照实施例2.2)。考虑到它们的方向,可共转录ORF1-7(参照图3),并且所观察到的表现型(非螺旋霉素生产菌)可能是由于一个或多个与orf3共转录的基因的失活。为了证实orf3参与螺旋霉素生物合成,进行了orf3基因的另一次失活,后一失活是同相进行的。为此,删除了orf3内504个碱基对的DraIII片段。将由pOS49.1得到的DNA片段克隆入质粒pOJ260(M.Bierman等,1992),该DNA片段涵盖从位于位置1(SEQ ID No.1)的EcoRI位点到位于位置5274(SEQ ID No.1)的SacI位点,并且在位置2563和3067的两个DraIII位点之间包含删除(去除了504个核苷酸)。如此获得的质粒命名为pOS49.67。
所以pOS49.67的插入部分包括生二素链霉菌的下述DNA片段,该片段包含orf1基因、orf2基因、具有同相删除的orf3基因、orf4基因和orf5的一部分。其中对该插入部分进行亚克隆的载体是pOJ260,因此质粒pOS49.67可赋予阿泊拉霉素抗性并通过原生质体转化将其导入菌株OS49.16(参照实施例2)。由于菌株OS49.16是潮霉素抗性的,得到了hygR和apraR转化体。将此类克隆在非选择培养基上传代两次后,就找到了对阿泊拉霉素和潮霉素(apraS和hygS)敏感的克隆。在一些克隆中,同源序列之间的重组事件事实上预期导致用载体上存在的具有同相删除的orf3拷贝替换用Ωhyg盒打断的orf3拷贝(包含于菌株OS49.16基因组中)。除去载体序列后期望由该重组得到的克隆是apraS和hygS。通过杂交或者通过PCR和PCR产物序列分析能够获得该菌株的基因型(证明在所得克隆的基因组中仅存在一个同相删除的orf3拷贝)。因此获得了仅具有同相删除的orf3拷贝的克隆并证实了它们的基因型。更加特别地是还筛选到呈现预期特性的克隆并命名为OS49.67。
菌株OS49.67的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2916。
实施例7:具有orf8基因中的敲除的生二素链霉菌菌株的构建
为了进行orf8基因失活,获得了其中将Ωhyg盒导入orf8编码序列的构建体。为此,首先构建了质粒pOS49.88。通过将含有orf7末端、orf8和orf9起始端的3.7kb片段(从粘粒pSPM5得到的PstI-EcoRI片段)克隆入pUC19的PstI-EcoRI位点,从pUC19(GenBank登录号:M77789)得到质粒pOS49.88。通过用Klenow酶处理使所有末端钝末端化后,将Ωhyg盒(以通过用Klenow酶处理钝末端化的BamHI片段的形式)克隆入定位于orf8的pOS49.88的唯一SalI位点。
由于克隆是钝末端的,依赖于盒插入的方向获得了两种类型的质粒:pOS49.106,其中hyg和orf8基因是同向的,和pOS49.120,其中hyg和orf8基因是反向的。然后将质粒pOS49.106的插入部分亚克隆入质粒pOJ260,以产生pOS49.107。为此,用Asp718I酶消化质粒pOS49.106并且通过用Klenow酶处理使末端钝末端化;用PstI酶再次消化该消化产物并且将含有其中已插入Ωhyg盒的orf8基因的片段克隆入载体pOJ260(参照上面)。为此,用EcoRV和PstI酶消化载体pOJ260并用于连接。由于这两个片段中的每一片段均为一侧是钝末端而另一侧是PstI酶切末端,因此该操作使得能够获得定向连接。所得质粒命名为pOS49.107。
通过原生质体转化将质粒pOS49.107导入生二素链霉菌菌株ATCC23877(T.Kieser等,2000)。原生质体转化之后,筛选具有潮霉素抗性的克隆。然后分别在含有潮霉素(抗生素B)的培养基和含有阿泊拉霉素(抗生素A)的培养基上传代培养这些潮霉素-抗性克隆(参照图9)。基本上,对潮霉素(HygR)具有抗性而对阿泊拉霉素(ApraS)敏感的克隆是那些其中已经发生双交换事件并且含有由Ωhyg盒打断的orf8基因的克隆。通过Southern印迹法验证了由Ωhyg盒打断的orf8拷贝代替了orf8野生型拷贝。因此,为了验证所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应Ωhyg盒的探针进行杂交。使用质粒pOS49.88的PstI-EcoRI插入部分作为探针,该部分大小为大约3.7kb,包含orf7末端、orf8和orf9起始部分,进行第二次杂交。通过本领域技术人员熟知的任意方法,且尤其是通过利用适当寡核苷酸进行的PCR和对PCR产物进行序列分析,能够进行基因型的验证。
筛选出orf8∷Ωhyg克隆并命名为OS49.107。菌株OS49.107的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du DocteurRoux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2917。
实施例8:构建orf10基因中具有敲除的生二素链霉菌菌株
通过以生二素链霉菌基因组DNA为模板,使用以下引物进行PCR获得了orf10基因内1.5kb DNA片段:
SRMR1:5’CTGCCAGTCCTCTCCCAGCAGTACG3’(SEQ ID No.89)
SRMR2:5’TGAAGCTGGACGTCTCCTACGTCGG3’(SEQ ID No.90)
将来自PCR的DNA片段克隆入Invitrogen公司(Carlsbad,California,USA)所出售的载体pCR2.1。如此获得的质粒命名为pOS49.32。通过用Klenow酶处理将所有末端钝末端化之后,将Ωhyg盒(以BamHI片段形式,参照上面)克隆入orf10基因片段内唯一的BstEII位点。由于克隆是钝末端的,根据盒插入的方向获得了两种类型的质粒:pOS49.43,其中hyg和orf10基因是同向的,和pOS49.44,其中hyg和orf10基因是反向的。将质粒pOS49.43的插入部分(以Asp718I-XbaI片段形式,通过用Klenow酶处理已将其末段钝末端化了)转移入质粒pOJ260的EcoRV位点,这使得有可能获得质粒pOS49.50。将含有已由Ωhyg盒打断的orf10基因片段的质粒pOS49.50导入生二素链霉菌菌株ATCC23877。转化后,筛选具有潮霉素抗性的克隆。然后分别在含有潮霉素(抗生素B)的培养基和含有阿泊拉霉素(抗生素A)的培养基上传代培养这些潮霉素-抗性克隆(参照图9)。原则上,对潮霉素(HygR)具有抗性而对阿泊拉霉素(ApraS)敏感的克隆是那些其中已经发生双交换事件并且含有由Ωhyg盒打断的orf10基因的克隆。如此获得了含有盒携带的潮霉素抗性标记而丢失了载体pOJ260携带的阿泊拉霉素抗性标记的克隆。通过Southern印迹法验证了由orf10∷Ωhyg盒打断的orf10拷贝代替orf8野生型拷贝的事件。因此,为了验证所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应Ωhyg盒的探针进行杂交。以orf10基因中1.5kb PCR产物作为探针进行第二次杂交(参照上面)。
更加特别地是筛选到了呈现出预期特性(orf10∷Ωhyg)的克隆并命名为OS49.50。通过两轮杂交,实际上有可能验证Ωhyg盒确实存在于该克隆的基因组中,并且验证了当双重组事件之后,在该克隆的基因组中用由Ωhyg盒打断的拷贝替换野生型基因的情况下,确实获得了预期的消化谱。通过本领域技术人员熟知的任意方法,且具体而言是通过利用适当寡核苷酸的PCR和对PCR产物的序列分析,也能够进行基因型的验证。
实施例9:基因失活:按照“可切除盒”技术构建敲除的生二素链霉菌菌株的原理(参照图9和10)
能够用于基因失活的第二种类型的盒:称为“可切除盒”的盒。这些盒具有这样的优点:在被导入生二素链霉菌基因组后,通过位点专一重组事件能够在链霉菌中将其切除。目的是失活链霉菌菌株中的某些基因而在最终的菌株中不丢失选择标记或存在不属于该菌株的大DNA序列。切除后,仅大约30左右碱基对(称为“瘢痕”位点)的短序列保留在菌株基因组中(参照图10)。
实施该系统首先包括将野生型靶基因拷贝用其中已插入可切除盒的构建体(通过两个同源重组事件,参照图9)替代。该盒的插入同时伴随有靶基因中的删除(参照图9)。其次,进行从菌株基因组切除可切除盒。可切除盒通过位点专一重组系统行使功能,并且具有获得最终不携带抗性基因的链霉菌突变体的优点。也避免了表达定位于失活基因下游的基因的极性效应(参照图10)。
已经描述了可切除盒的应用并且可切除盒可用于多种有机体,包括哺乳动物细胞和酵母细胞、以及大肠杆菌中(Bayley等,1992;Brunelli和Pall,1993;Camilli等,1994;Dale和Ow,1991;Russell等,1992;Lakso等,1992)。这些可切除盒全部使用对lox位点起作用的Cre位点专一重组酶。该重组系统源于P1细菌噬菌体。
为了在链霉菌中构建“可切除盒”型系统,开发了用于生二素链霉菌可动遗传因子pSAM2(Boccard等,1989a和b)的位点专一重组系统。该系统的建立最初包括构建含有被打断基因的重组载体,其中插入了可切除盒。将可切除盒插入靶基因伴随有靶基因中的删除。通过使用靶基因中所存在的限制性酶切位点进行克隆,或者通过例如Chaveroche等(ChaverocheMK等,2000)所述的短相同序列之间的重组,能够进行这种插入。例如,使用Ωhyg盒能够构建可切除盒(Blondelet Rouault等,1997)。该盒边缘是attR和attL序列,这两个序列正常情况下位于整合的pSAM2拷贝的侧翼(参照图15)。attR和attL序列包含允许切除pSAM2或位于这两个区域之间的任意DNA片段的位点专一重组所需的全部位点(Sezonov等,1997,Raynal等,1998)。很明显,此种盒的构建不局限于使用Ωhyg盒,其它抗性盒也可以用作基本盒以构建此种盒(例如Ωaac或Ωvph盒(BlondeletRouault等,1997))。
已经获得该构建体后,用该重组质粒转化链霉菌菌株。然后使用针对靶基因中所存在的盒的抗生素筛选转化体(参照图9,抗生素B,例如如果可切除盒来源于Ωhyg盒,这涉及使用潮霉素筛选)。因此筛选了其中已经通过单一或两次重组事件进行整合的克隆混合物。随后,找到了对针对载体中存在的抗性基因(重组盒外面)的抗生素(参照图9,抗生素A)敏感的克隆。因此由可能筛选到这样一些克隆,其中基本上已经进行了两次重组事件,导致野生型基因被由盒打断的基因拷贝所替换。图9中图解说明了这些步骤;通过Southern印迹法验证了如此所得克隆的基因型并筛选出了呈现预期特性(由可切除盒打断的拷贝替换了野生型基因)的菌株。
其次,用允许xis和int基因表达的质粒转化上面所筛选到的菌株,xis和int基因对于attR和attL位点之间的位点专一重组都是必需的。该重组导致可切除盒通过重组事件离开菌株基因组(参照图10)(Raynal等,1998)。从在链霉菌中相对稳定的载体(例如来源于链霉菌载体pWHM3的载体,(Vara等,1989))中选择携带xis和int基因的载体是有利的,这使得有可能获得这样的菌株,在缺乏选择压力条件下进行几个芽孢形成循环后,该菌株丢失了后一载体。
为了切除盒,例如有可能使用质粒pOSV508(参照图14),通过原生质体转化将该质粒导入含有可切除盒打断的基因的生二素链霉菌菌株。质粒pOSV508来源于质粒pWHM3(J.Vara等,1989)(参照图13),在该质粒中已经加入了pSAM2的xis和int基因(F.Boccard等,1989b),并置于ptrc启动子的控制之下(E.Amann等,1988)。将置于ptrc启动子控制之下的xis和int基因从质粒pOSint3亚克隆入质粒pWHM3(Raynal等,1998)(参照图14)。将携带有pSAM2 xis和int基因的质粒pOSV508导入突变体菌株,将允许通过位点专一重组,在盒两侧的attL和attR位点之间进行可切除盒的有效切除(A.Raynal等,1998)(图10)。在这些转化体中,选择对硫链丝菌肽产生抗性并对盒存在所产生抗性的抗生素敏感的转化体,其中硫链丝菌肽抗性由pOSV508携带的tsr基因所产生(参照图10)。切除是有效的并且观察到90%以上的转化体属于该种类型。在缺乏硫链丝菌肽的固体培养基上经过一轮以上生长和芽孢形成循环后,获得了已丢失质粒pOSV508的克隆。通过它们对硫链丝菌肽的敏感性能够检测这些克隆。通过PCR和对PCR产物的序列分析能够验证所删除的靶基因的序列。
最后,所得到的菌株,在失活的靶基因内(例如内部删除),携带一个对应最小attB位点的“瘢痕”att位点(Raynal等,1998),该位点来源于attR和attL位点之间的重组。该残余的最小attB位点与生二素链霉菌、始旋链霉菌(Streptomyces pristinaespiralis)和浅青紫链霉菌中天然存在的该位点相似(Sezonov等,1997)。
期望其失活的基因能够与定位于下游的其它基因共转录。为了避免对操纵子下游基因的表达具有极性效应的基因之一的失活,重要的是切除盒之后获得同相删除。上述可切除盒系统使得有可能满足该需求。实际上,本领域的技术人员可以很容易地构建三个不同的可切除盒,所述盒在切除之后分别残存33、34或35个核苷酸的序列,且在任何阅读框中都不含终止密码子。如果知道了靶基因的序列和与盒插入部分相关的删除部分的大小,则有可能在这三个可切除盒之间进行选择以至于切除产生同相删除。在所加入的33、34或35个核苷酸中有26个核苷酸对应于最小attB序列(参照图27)。
关于本申请,使用了两个可切除盒。这两个盒如下:att1Ωhyg+(SEQID No.91)和att3Ωaac-(SEQ ID No.92);切除后这些盒分别残存33和35个核苷酸。它们分别包含Ωhyg盒或Ωaac盒,+和-符号对应抗性盒的方向。构建这两个盒并将其克隆入载体pBC SK+的EcoRV位点,其HindIII位点被预先删除。所得质粒分别命名为patt1Ωhyg+和patt3Ωaac-。通过用EcoRV消化质粒,能够很容易地获得可切除盒。
实施例10:构建orf2基因中具有敲除的生二素链霉菌菌株
使用可切除盒技术进行orf2基因的失活(参照上面)。所用起始菌株是来源于菌株ATCC23877的生二素链霉菌菌株OSC2。然而,菌株OSC2不同于菌株ATCC23877,因为菌株OSC2已经丢失了可移动的遗传因子pSAM2(Boccard等,1989a和b)。在原生质化作用(溶菌酶消化细菌壁和片段化菌丝体的作用(Kieser et al.,2000))和菌株ATCC23877原生质体再生期间,可能自发性丢失该可移动因子。为了选择已经丢失了pSAM2元件的克隆,基于KorSA转录抑制子对pra基因的抑制作用,建立了一种筛选(Sezonov等,1995)(G.Sezonov等,2000)。为此,将含有置于aph基因(赋予卡那霉素抗性并缺乏其自己的启动子)上游的pra基因启动子的DNA片段克隆入不稳定载体pWHM3Hyg,后者来源于质粒pWHM3(Vara等,1989),其中tsr基因已经由hyg基因(赋予潮霉素抗性)所替换。如此获得的质粒命名为pOSV510。当对菌株ATCC23877进行原生质体化作用后,用质粒pOSV510转化菌株ATCC23877。启动子Pra是一种受KorSA阻遏物阻遏的启动子,编码后者的基因被置于pSAM2可移动元件中(SezonovG.等,2000)。当用质粒pOSV510转化后,转化后的细菌由于其具有卡那霉素抗性(源于由pOSV510携带的aph基因)而被筛选出来。具有pSAM2整合元件丢失的克隆已经丢失了KorSA阻遏物,并且Pra启动子不再被阻遏并允许表达aph卡那霉素抗性基因。用质粒pOSV510转化后再用卡那霉素筛选使得有可能筛选出那些已丢失pSAM2整合元件(并且因此而丢失KorSA)并含有质粒pOSV510的克隆。由于质粒pOSV510不稳定,在不含抗生素条件下经过几轮芽孢形成之后,在含卡那霉素的培养基上、含潮霉素的培养基上和不含抗生素的培养基上传代培养所分离到的克隆。对卡那霉素和潮霉素敏感的克隆已经丢失了pOSV510。通过杂交和PCR验证了pSAM2元件的删除。选择到呈现预期特性的克隆并命名为OSC2。
菌株OSC2的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2908。
使用可切除盒技术进行orf2基因的失活(参照上面和图10)。为此,将4.5kb插入部分,其序列起始于定位于位置1的EcoRI位点,终止于定位于位置4521(SEQ ID No.1)的BamHI位点,亚克隆入来自粘粒pSPM5的质粒pUC19(GenBank登录号:M77789)的EcoRI和BHamHI位点。如此所得质粒命名为pOS49.99。
将该质粒导入大肠杆菌菌株KS272,该菌株已含有质粒pKOBEG(Chaveroche等,2000)(参照图12)。
与此平行,利用质粒pOSK1102(质粒pOSK1102是来源于载体pGP704Not的质粒(Chaveroche等,2000)(V.L.Miller和J.J.Mekalanos,1988),其中att3Ωaac-盒已经作为EcoRV片段克隆入pGP704Not中唯一的EcoRV位点)作为模板并利用如下引物,通过PCR扩增att3Ωaac-可切除盒(SEQ ID No.92,参照上面):
ORF2A
5’CCCGCGCGGCAGCCTCTCCGTGATCGAGTCCGGCGTGACCATCGCGCGCGCTTCGTTCGG-3’(SEQ ID No.93)
ORF2B
5’GCTCCGTGCGTCATGCAGGAAGGTGTCGTAGTCGCGGTAGATCTGCCTCTTCGTCCCGAA-3’(SEQ ID No.94)
定位于这些寡核苷酸5’末端的40个脱氧核苷酸包含对应于靶基因(本例子中是orf2)中序列的序列,并且定位于最3’位置的20个脱氧核苷酸(上面粗体所示)对应att3Ωaac-可切除盒一个末端的序列(参照图11)。
将如此获得的PCR产物用于转化含有上述质粒pKOBEG和pOS49.99的大肠杆菌菌株(Chaveroche等,2000)(参照图12)。因此,通过电穿孔转化细菌并筛选其阿泊拉霉素抗性。提取所得克隆的质粒并用几种限制性酶消化,目的是为了验证如果盒(att3Ωaac-)已经插入靶基因(orf2),即如果在PCR产物和靶基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化谱与预期消化谱相符合。通过本领域技术人员已知的方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行构建体的验证。选择到其中质粒具有预期消化谱的克隆并将相应质粒命名为pSPM17。该质粒来源于pOS49.99,其中orf2已由阿泊拉霉素盒打断(参照图12)。盒的插入伴随着orf2中编码部分的核苷酸211和492之间的删除。用EcoRI酶消化质粒pSPM17并通过用Klenow酶处理将末端钝末端化;然后用XbaI酶消化该消化该产物并将含有经删除orf2基因的插入部分克隆入载体pOSK1205(参照上面)。为此,用BamHI酶消化载体pOSK1205并通过用Klenow酶处理将末端钝末端化;然后用XbaI酶消化该消化该产物并将其与如上从pSPM17获得插入部分连接。由于这两个片段的每一个在一侧是钝末端且另一侧是XbaI末端,因此该操作使得有可能获得定向连接。如此获得的质粒命名为pSPM21;它携带潮霉素抗性基因(载体部分)和其中具经删除的orf2基因已由att3Ωaac-盒替换的插入部分。
通过原生质体转化(T.Kieser等,2000)将载体pSPM21导入生二素链霉菌菌株OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后分别在含阿泊拉霉素(抗生素B)的培养基上和含潮霉素(抗生素A)的培养基上传代培养这些阿泊拉霉素-抗性克隆(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生一个双交换事件并含有由att3Ωaac-盒间断orf2基因的克隆。选择到这些克隆并验证了盒打断拷贝对orf2野生型拷贝的替换。通过菌落PCR验证了att3Ωaac-盒的存在。还进行了杂交。为此,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应质粒pOS49.99插入部分EcoRI-BamHI片段的探针进行杂交(参照上面)。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。
选择呈现预期特性的克隆并命名为SPM21。利用PCR和杂交,有可能证明该克隆基因组中确实存在att3Ωaac-盒并且确实获得了在该克隆基因组中由于双重组事件后用att3Ωaac-盒打断拷贝替换野生型基因后所预期得到的消化谱。因此该克隆具有基因型:orf2∷att3Ωaac-。
菌株SPM21的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2914。
为了产生盒的切除,通过原生质体转化法,用载体pOSV508转化菌株SPM21(参照图14)。质粒pOSV508来源于质粒pWHM3(J.Vara等,1989)(参照图13),其中已经加入了pSAM2(F.Boccard等,1989b)的xis和int基因并置于ptrc启动子的控制之下(E.Amann等,1988)(参照图14)。通过位点专一重组,将携带pSAM2 xis和int基因的质粒pOSV508导入菌株SPM21允许有效切除该盒两侧attL和attR位点之间的可切除盒(A.Raynal等,1998)(图10)。在这些转化体中,选择对硫链丝菌肽产生抗性并对阿泊拉霉素敏感的转化体,其中硫链丝菌肽抗性由pOSV508携带的tsr基因所产生,阿泊拉霉素抗性由att3Ωaac-盒所携带的抗性基因赋予;事实上切除导致阿泊拉霉素抗性基因的删除(参照图10)。质粒pOSV508是不稳定的并且,在不含抗生素的培养基上进行两轮连续传代之后,在含硫链丝菌肽的培养基上和不含硫链丝菌肽的培养基上传代培养所分离的克隆。硫链丝菌肽敏感克隆已经丢失了pOSV508。通过PCR和PCR产物序列分析,验证了切除该盒确实导致orf2基因中的同相删除;切除盒事实上留下了特征“瘢痕”att3序列(attL和attR位点之间发生重组之后,该序列与attB的起始位点相似):
5’ATCGCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT3’(SEQ ID No.95)。如此获得的具有预期基因型(orf2∷att3)的菌株命名为SPM22。
菌株SPM22的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2915。
实施例11:构建orf12基因中具有敲除的生二素链霉菌菌株
为了失活orf12、orf13c和orf14,相同的起始质粒(pSPM504)用于在不同的位置导入“可切除盒”类型的盒。该质粒包含对应从orf7到orf17区域的15.1kb插入部分。为了构建该质粒,将从消化粘粒pSPM7(参照上面)得到的15.1kb BglII片段克隆入用BamHI消化的质粒pMBL18(Nakano等,1995)。由于BamHI和BglII末端是兼容的,连接后得到质粒pSPM502。然后将pSPM502的全部插入部分(以HindIII/NheI片段形式)亚克隆入质粒pOSK1205(用HindIII/NheI消化),这使得有可能获得质粒pSPM504。
将该质粒导入已经含有质粒pKOBEG的大肠杆菌菌株KS272(Chaveroche等,2000)(参照图12)。
与此平行,利用质粒pOSK1102(质粒pOSK1102是来源于载体pGP704Not的质粒(Chaveroche等,2000)(V.L.Miller和J.J.Mekalanos,1988),其中att3Ωaac-盒已经作为EcoRV片段克隆入pGP704Not中唯一的EcoRV位点)作为模板并利用如下引物,通过PCR扩增att3Ωaac-可切除盒:
EDR8:5’
CGGGATGATCGCTTGTCCGGCGGCCGGATGCCTAGCCTCATCGCGCGCGCTTCGTTCGG3’(SEQ ID No.96)
EDR9:5’
CCCGATCCAGAACGTCTGGTCGGTGATCAGGTCGCTGTTCATCTGCCTCTTCGTCCCGAA3’(SEQ ID No.97)
定位于这些寡核苷酸5’末端的40个(对于EDR8仅39个)脱氧核苷酸包含对应于靶基因(本例子中是orf12)中序列的序列,并且定位于最3’位置的20个脱氧核苷酸(上面粗体所示)对应于att3Ωaac-可切除盒一个末端的序列(参照图11)。
将如此获得的PCR产物用于转化含有Chaveroche等(Chaveroche等,2000)所述质粒pKOBEG和pSPM504的大肠杆菌菌株KS272(参照图12,原则上,质粒pOS49.99将由质粒pSPM504代替,并且所得质粒不再是pSPM17而是pSPM507)。因此,通过电穿孔转化细菌并筛选其阿泊拉霉素抗性。提取所得克隆的质粒并用几种限制性酶消化,目的是为了验证如果盒(att3Ωaac-)已经插入靶基因(orf12),即如果在PCR产物和靶基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化谱与预期消化谱相符合。通过本领域技术人员已知的方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行构建体的验证。选择到其中质粒具有预期消化谱的克隆并将相应质粒命名为pSPM507。该质粒来源于pSPM504,其中orf12已由att3Ωaac-盒打断(参照图12)。盒的插入伴随着orf12中的删除,打断开始于orf12的第三十个密码子。盒后面保存了orf12最后46个密码子。
通过原生质体转化(T.Kieser等,2000)将载体pSPM507导入生二素链霉菌菌株OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后分别在含阿泊拉霉素(抗生素B)的培养基上和含潮霉素(抗生素A)的培养基上传代培养这些阿泊拉霉素-抗性克隆(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生双交换事件并含有由att3Ωaac-盒打断的orf12基因的克隆。更加特别的是选择到这些克隆并通过杂交验证了盒打断拷贝对orf12野生型拷贝的替换。因此,为了证明所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3Ωaac-盒的探针进行杂交。以通过PCR获得的且对应orf12基因编码序列非常大部分的DNA片段作为探针,进行了第二次杂交。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。
更加具体而言筛选到呈现预期特性的克隆(orf12∷att3Ωaac-)并命名为SPM507。通过两轮杂交,事实上有可能证明该克隆基因组中确实存在att3Ωaac-盒并且确实获得了在该克隆基因组中由于双重组事件后用att3Ωaac-盒打断的拷贝替换野生型基因后所预期得到的消化谱。因此该克隆具有基因型:orf12∷att3Ωaac-并命名为SPM507。给出了这些基因的方向(参照图3),不需要切除该盒以研究orf12失活的效应。具体而言,orf13c与orf12以相反方向定位的事实表明这些基因不是共转录。另一方面,使用可切除盒使得在任何时刻去除筛选标记的可能性成为可能,尤其是通过转化质粒pOSV508。菌株SPM507的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2911。
实施例12:构建orf13c基因中具有敲除的生二素链霉菌菌株
利用质粒pOSK1102(参照上面)作为模板,并使用以下引物,通过PCR扩增att3Ωaac-可切除盒:
EDR3:5’
ACCGGGGCGGTCCTCCCCTCCGGGGCGTCACGGCCGCGGAATCTGCCTCTTCGTCCCGAA3’(SEQ ID No.98)
EDR4:5’
CACGCAGCGAGCCGACGCACTGATGGACGACACGATGGCCATCGCGCGCGCTTCGTTCGG3’(SEQ ID No.99)
定位于这些寡核苷酸5’末端的40个脱氧核苷酸包含对应靶基因(本例子中是orf13c)中序列的序列,并且定位于最3’位置的20个脱氧核苷酸(上面粗体所示)对应att3Ωaac-可切除盒一个末端的序列(参照图11)。
将如此获得的PCR产物用于转化含有Chaveroche等(Chaveroche等,2000)所述质粒pKOBEG和pSPM504的大肠杆菌菌株KS272(参照图12,原则上,质粒pOS49.99将由质粒pSPM504代替,并且所得质粒不再是pSPM17而是pSPM508)。因此,通过电穿孔法用该PCR产物转化细菌并筛选阿泊拉霉素抗性的克隆。提取所得克隆的质粒并用几种限制性酶消化,目的是为了验证如果盒(att3Ωaac-)已经插入靶基因(orf13c),即如果在PCR产物和靶基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化谱与预期消化谱相符合。通过本领域技术人员已知的方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行构建体的验证。选择到其中质粒具有预期消化谱的克隆并将相应质粒命名为pSPM508。该质粒来源于pSPM504,其中orf13c已由阿泊拉霉素盒打断(参照图12)。盒的插入伴随着orf13c基因中的删除,打断开始于orf13c的第六个密码子。盒后面保留了orf13c最后3个密码子。
通过原生质体转化(T.Kieser等,2000)将载体pSPM508导入生二素链霉菌菌株OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后分别在含阿泊拉霉素(抗生素B)的培养基上和含潮霉素(抗生素A)的培养基上传代培养这些阿泊拉霉素-抗性克隆(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生双交换事件并含有由att3Ωaac-盒打断的orf13c基因的克隆。更加具体而言是选择到这些克隆并通过杂交验证了盒打断拷贝对orf13c野生型拷贝的替换。因此,为了证明所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3Ωaac-盒的探针进行杂交。以对应涵盖orf13c编码序列上游和下游大约一百个碱基对序列的PCR产物作为探针,进行了第二次杂交。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCT产物序列分析,也能够进行基因型的验证。
更加具体而言筛选到呈现预期特性的克隆(orf13c∷att3Ωaac-)并命名为SPM508。通过两轮杂交,事实上有可能证明该克隆基因组中确实存在att3Ωaac-盒并且确实获得了在该克隆基因组中由于双重组事件后用att3Ωaac-盒打断拷贝替换野生型基因后所预期得到的消化谱。因此该克隆具有基因型:orf13c∷att3Ωaac-并命名为SPM508。给出了这些基因的方向(参照图3),不需要切除该盒以研究orf13c失活的效应。orf14与orf13c以相反方向定位的事实表明这些基因不是共转录。另一方面,使用可切除盒使得在任何时刻去除筛选标记的可能性成为可能。菌株SPM508的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du DocteurRoux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2912。
实施例13:构建orf14基因中具有敲除的生二素链霉菌菌株
利用质粒pOSK1102(参照上面)作为模板,并使用以下引物,通过PCR扩增att3Ωaac-可切除盒:
EDR5:
5’GGGCGTGAAGCGGGCGAGTGTGGATGTCATGCGAGTACTCATCGCGCGCGCTTCGTTCGG3’(SEQ ID No.100)
EDR6:
5’CGGGAAACGGCGTCGCACTCCTCGGGGGCCGCGTCAGCCCATCTGCCTCTTCGTCCCGAA3’(SEQ ID No.101)
定位于这些寡核苷酸5’末端的40个脱氧核苷酸包含对应靶基因(本例子中是orf14)中序列的序列,并且定位于最3’位置的20个脱氧核苷酸(上面粗体所示)对应att3Ωaac-可切除盒一个末端的序列(参照图11)。
将如此获得的PCR产物用于转化含有Chaveroche等(Chaveroche等,2000)所述质粒pKOBEG和pSPM504的大肠杆菌菌株KS272(参照图12,原则上,质粒pOS49.99将由质粒pSPM504代替,并且所得质粒不再是pSPM17而是pSPM509)。因此,通过电穿孔法用该PCR产物转化细菌并筛选阿泊拉霉素抗性的克隆。提取所得克隆的质粒并用几种限制性酶消化,目的是为了验证如果盒(att3Ωaac-)已经插入靶基因(orf14),即如果在PCR产物和靶基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化谱与预期消化谱相符合。通过本领域技术人员已知的方法,且尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行构建体的验证。选择到其中质粒具有预期消化谱的克隆并将相应质粒命名为pSPM509。该质粒来源于pSPM504,其中orf14已由阿泊拉霉素盒打断(参照图12)。盒的插入伴随着orf14基因中的删除,打断开始于orf14的第四个密码子。盒后面保留了orf13c最后的密码子。
通过原生质体转化(T.Kieser等,2000)将载体pSPM509导入生二素链霉菌菌株OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后分别在含阿泊拉霉素(抗生素B)的培养基上和含潮霉素(抗生素A)的培养基上传代培养这些阿泊拉霉素-抗性克隆(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生双交换事件并含有由att3Ωaac-盒打断的orf14基因的克隆。更加具体而言是选择到这些克隆并通过杂交验证了盒打断拷贝对orf14野生型拷贝的替换。因此,为了证明所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3Ωaac-盒的探针进行杂交。以对应涵盖orf14编码序列上游和下游大约一百个碱基对序列的PCR产物作为探针,进行了第二次杂交。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCT产物序列分析,也能够进行基因型的验证。
更加具体而言筛选到呈现预期特性的克隆(orf14∷att3Ωaac-)并命名为SPM509。通过两轮杂交,事实上有可能证明该克隆基因组中确实存在att3Ωaac-盒并且确实获得了在该克隆基因组中由于双重组事件后用att3Ωaac-盒打断拷贝替换野生型基因后所预期得到的消化谱。因此该克隆具有基因型:orf14∷att3Ωaac-并命名为SPM509。给出了这些基因的方向(参照图3),不需要切除该盒以研究orf14失活的效应。orf15c与orf14以相反方向定位的事实表明这些基因不是共转录。另一方面,使用可切除盒使得在任何时刻去除筛选标记的可能性成为可能。菌株SPM509的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du Docteur Roux75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2913。
实施例14:构建orf6*基因中具有敲除的生二素链霉菌菌株
使用可切除盒技术进行orf6*基因的失活(参照上面和图10)。为此,使用粘粒pSPM7作为模板并使用以下寡核苷酸扩增orf6*基因的片段:
C9583:5’CTGCAGGTGCTCCAGCGCGTCGATCT3’(有意寡核苷酸)(SEQ ID No.102)
C9584:5’CTGCAGACGGAGGCGGACCTGCGGCT3’(反义寡核苷酸)(SEQ ID No.103)
定位于这些寡核苷酸3’末端的20个脱氧核苷酸对应定位于orf6*基因编码部分的序列(SEQ ID No.13)并且定位于最5’位置的6个脱氧核苷酸对应利于克隆的PstI位点的序列。扩增的DNA片段大小为约1.11kb。将PCR产物克隆入载体pGEM-T Easy(由Promega公司(Madison,Wisconsin,USA)出售),这使得有可能获得命名为pBXL1111的质粒(参照图16)。
然后将att1Ωhyg+可切除盒导入orf6*基因编码序列。为此,用SmaI和Asp718I限制性酶消化质粒pBXL1111并用Klenow酶处理消化产物。该操作使得有可能在orf6*基因编码序列内产生120bp的内部删除(参照图15)。此外,在限制性酶切位点的两侧,分别保留了511bp和485bp的orf6*序列,这将允许进行同源重组以失活orf6*基因。通过用EcoRV消化该质粒,从质粒patt1Ωhyg+(参照上面)制备得到att1Ωhyg+可切除盒。然后将后者亚克隆入如上所述预先制备(SmaI和Asp718I消化并且然后用Klenow酶处理)的载体pBXL1111。所得质粒命名为pBXL1112(参照图17)。在该构建体中,orf6*基因包含120bp的删除并被att1Ωhyg+盒打断。
然后用PstI酶(该位点在盒边侧,从而存在于PCR寡核苷酸中)消化质粒pBXL1112,并且然后将含有已由att1Ωhyg+盒打断的orf6*部分的3.7kbPstI插入片段克隆入质粒pOJ260的PstI位点(参照上面)。如此得到的质粒命名为pBXL1113。
通过原生质体转化(T.Kieser等,2000)将载体pBXL1113导入生二素链霉菌菌株OSC2(参照上面)。转化后,通过其潮霉素抗性筛选这些克隆。然后分别在含有潮霉素(抗生素B)的培养基上和含阿泊拉霉素(抗生素A)的培养基上传代培养这些潮霉素-抗性克隆(参照图9)。原则上,对潮霉素具有抗性(HygR)并对阿泊拉霉素敏感(ApraS)的克隆是那些其中已经发生双交换事件并含有由att1Ωhyg+盒打断的orf6*基因的克隆。更加具体而言是选择到这些克隆并通过Southern印迹技术验证了盒打断拷贝对orf6*野生型拷贝的替换。因此,为了证明所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应hyg基因的探针(通过PCR获得)进行杂交。利用由质粒pBXL1111获得的含有orf6*基因的PstI-PstI插入片段(大小为大约1.1kb)作为探针,进行了第二次杂交(参照上面和图16)。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。
更加具体而言筛选到呈现预期特性(orf6*∷att1Ωhyg+)的克隆并命名为SPM501。通过两轮杂交,事实上有可能证明该克隆基因组中确实存在att1Ωhyg+盒并且确实获得了在该克隆基因组中由于双重组事件后用att1Ωhyg+盒打断拷贝替换野生型基因后所预期得到的消化谱。因此该克隆具有基因型:orf6*∷att1Ωhyg+并命名为SPM501。菌株SPM501的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du DocteurRoux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2909。
为了切除盒,通过原生质体转化,用载体pOSV508转化菌株SPM501(参照图14)。质粒pOSV508来源于质粒pWHM3(J.Vara等,1989)(参照图13),在该质粒中已经加入了pSAM2的xis和int基因(F.Boccard等,1989b),并置于ptrc启动子的控制之下(E.Amann等,1988)。将携带有pSAM2 xis和int基因的质粒pOSV508导入菌株SPM501,将允许通过位点专一重组,在盒两侧的attL和attR位点之间进行可切除盒的有效切除(A.Raynal等,1998)(图10)。在这些转化体中,选择对硫链丝菌肽产生抗性并对潮霉素敏感的转化体,其中硫链丝菌肽抗性由pOSV508携带的tsr基因所产生,潮霉素抗性由att1Ωhyg+盒所携带的抗性基因赋予;事实上该切除导致抗性基因的删除(参照图10)。质粒pOSV508是不稳定的并且,在不含抗生素的培养基上经过两轮连续传代后,将所分离到的克隆在含硫链丝菌肽的培养基上和不含硫链丝菌肽的培养基上传代培养。硫链丝菌肽敏感克隆已经丢失了pOSV508。通过PCR和PCR产物序列分析,验证了在orf6*基因中确实同相发生了盒的切除。打断开始于第158个密码子,删除了40个密码子(120bp),盒的切除保留了33bp的特征性“瘢痕”att1序列:
5’ATCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT3’(SEQ ID No.104)。
如此获得的且具有预期基因型(orf6*∷att1)的菌株命名为SPM502。
菌株SPM502的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2002年7月10日,保藏号为I-2910。
实施例15:在orf2、orf3、orf8、orf10、orf12、orf13c、orf14或orf6*基因内具有敲除的生二素链霉菌菌株的分析
为了测试所获得的多株菌株的螺旋霉素产量,研发了基于藤黄微球菌菌株敏感性的微生物学测试(参照(A.Gourmelen等,1998))。所用藤黄微球菌菌株衍生自天然对螺旋霉素敏感的菌株DSM1790(该菌株尤其可获自德国微生物和细胞培养物保藏中心(Deutsche Sammlung vonMikro-organismen und Zellkulturen GmbH,DSMZ),(Braunschweig,Germany),保藏号为DSM1790);因为本测试中所用菌株对杀刚锥虫素具有抗性,所以不同于菌株DSM1790。该菌株是通过在含有渐增剂量杀刚锥虫素的培养基上进行选择而获得的自发突变株。鉴于生二素链霉菌产生螺旋霉素和杀刚锥虫素二者的事实,筛选到了该菌株。由于目的是为了使用基于藤黄微球菌菌株敏感性的微生物学测试对所获得的多株菌株的螺旋霉素产量进行测定,所以有必要得到杀刚锥虫素-抗性菌株。
将所要测试的多株链霉菌菌株培养于含有70ml MP5培养基的具档板500ml锥形瓶(带档板的锥形瓶)中(Pernodet等,1993)。将多株生二素链霉菌菌株以2.5×106芽孢/ml的起始浓度接种于带档板的锥形瓶中并在27℃250转/分钟定轨振荡生长。培养48、72和96小时后取出2ml悬浮液样本并离心。然后将各种上清液冻存于-20℃。将用无菌培养基10倍稀释的这些上清液用于测试(参照图18)。
将对杀刚锥虫素具有抗性而对螺旋霉素敏感的藤黄微球菌指示菌在含有5μg/ml杀刚锥虫素的2TY培养基(Sambrook等,1989)中37℃培养48小时。测定培养物的光密度(OD)并稀释该培养物以将光密度调整至4。将0.4ml该预培养物稀释于40ml DAM5培养基(Difco抗生素培养基5,由Difco公司出售)中,预先使温度达到大约45℃。然后将该培养基倒入12×12cm平皿中并将其置于室温。
一旦培养基冷却并凝固,将直径为12mm的Whatman AA滤纸盘(参照A.Gourmelen等,1998)用70μl10倍稀释的每种上清液浸湿,并放置于平皿表面。将用不同浓度(在MP5培养基中2-4-8μg/ml)螺旋霉素溶液浸湿的滤纸盘用作标准滤纸盘。为了允许抗生素分散入琼脂,将这些平皿置于4℃2小时并且然后在37℃孵育24-48小时。
如果该滤纸盘含有螺旋霉素,螺旋霉素扩散进入琼脂并抑制藤黄微球菌指示菌的生长。这种抑制作用在滤纸盘周围产生“晕”,该晕反映了藤黄微球菌菌株不生长的区域。因此该晕的存在是螺旋霉素存在的指示,并且使得有可能确定对应所讨论的滤纸盘的生二素链霉菌菌株是否是或者不是螺旋霉素生产菌。将所获得的抑制直径与标准滤纸盘的抑制直径相比较使得有可能获得由该菌株产生的螺旋霉素的量的指示。
为了检测其螺旋霉素产量,该测试中使用了先前实施例中所述的多株菌株。所得结果归纳于表38。
                                 表38
    菌株     失活的基因  描述该菌株的实施例   表现型:螺旋霉素生产菌(+)或非生产菌(-)
  ATCC23877   无     1     (+)
  OS49.16   orf3∷Ωhyg     2     (-)
  OS49.67   同相删除orf3     6     (-)
  OS49.107   orf8∷Ωhyg     7     (-)
  OS49.50   orf10∷Ωhyg     8     (-)
  OSC2   无     10     (+)
  SPM21   orf2∷att3Ωaac-     10     (-)
  SPM22   同相删除orf2∷att3     10     (-)
  SPM501   orf6*∷att1Ωhyg+     14     (-)
  SPM502   同相删除orf6*∷att1     14     (+)
  SPM507   orf12∷att3Ωaac-     11     (-)
  SPM508   orf13c∷att3Ωaac-     12     (+)
  SPM509   orf14∷att3Ωaac-     13     (-)
这些结果使得有可能得出与参与螺旋霉素生物合成的各种基因的功能相关的一定数量的结论。因此,orf3基因对于螺旋霉素生物合成是必需的。具体而言,该基因内的同相失活导致形成不再产生螺旋霉素的菌株(OS49.67,(参照实施例6))。同相失活使得有可能放弃导入的盒有可能影响定位于orf3下游的基因表达这一假说。
同样地,由于菌株OS49.107和OS49.50具有非生产菌表现型,所以orf8和orf10基因编码螺旋霉素生物合成所必需的蛋白质。此外,在这两个菌株中,由于考虑到不同orf的方向(参照图3),很明显负责该非生产菌表现型的相应基因是失活的,所导入的构建体不可能具有极性效应。
对具有可切除盒的菌株的研究使得有可能得出一定数量与被打断基因的功能相关的结论。菌株SPM507具有基因型:orf12∷att3Ωaac-。考虑到基因的方向(参照图3),认为没有必要切除盒以研究orf12失活的效应。orf13c与orf12以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用使得有可能获得在任何时刻去除筛选标记的可能性。菌株SPM507的表现型是非生产菌;因此可以由其推断出orf12基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。
菌株SPM508具有基因型:orf13c∷att3Ωaac-。考虑到基因的方向(参照图3),认为没有必要切除盒以研究orf13c失活的效应。orf14与orf13c以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用使得有可能获得在任何时刻去除筛选标记的可能性。菌株SPM508的表现型是生产菌;因此可以由其推断出orf13c基因不是生二素链霉菌中螺旋霉素生物合成所必需的基因。
菌株SPM509具有基因型:orf14∷att3Ωaac-。考虑到基因的方向(参照图3),认为没有必要切除盒以研究orf14失活的效应。orf15c与orf14以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用使得有可能获得在任何时刻去除筛选标记的可能性。菌株SPM509的表现型是非生产菌;因此可以由其推断出orf14基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。
菌株SPM21具有基因型:orf2∷att3Ωaac-。该菌株具有螺旋霉素非生产菌表现型。然而,基因orf1到orf8的方向暗示这些基因是共转录的。因此,所观察到的表现型可能是由于导入orf2的盒对定位于该操纵子下游的基因的表达具有极性效应。菌株SPM22具有基因型orf2∷att3,并且是所导入的盒同相切除后获得的。盒的切除仅残留了特征性“瘢痕”序列(参照实施例10)。由于菌株SPM22也具有非生产菌表现型,可以由其得出结论orf2基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。这里仅观察了由orf2失活引起的效应。
菌株SPM501具有基因型:orf6*∷att1Ωhyg+。该菌株具有螺旋霉素非生产菌表现型。然而,由于orf5*和orf6*基因(参照图3)具有相同的方向,所观察到的表现型可能是由于导入orf6*的盒对orf5*的表达具有极性效应。这些基因的排列暗示它们可能是共转录的。为了回答该问题,同相切除所导入的盒后获得了菌株SPM502。在该菌株中,仅观察了由orf6*失活引起的效应。该菌株具有基因型orf6*∷att1(参照实施例14)。盒的切除仅残留了同相“瘢痕”序列(参照实施例14)。菌株SPM502具有生产菌表现型(然而,该菌株仅产生螺旋霉素I(参照*实施例16))。因此可以由其得出结论orf5*基因是生二素链霉菌中螺旋霉素生物合成所必需的基因,由于在菌株SPM501中将它间接失活导致非生产菌表现型。另一方面,orf6*基因不是生二素链霉菌中螺旋霉素I生物合成所必需的基因(另一方面,它是产生螺旋霉素II和III所必需的(参照实施例16))。
实施例16:所获得的突变体菌株中螺旋霉素I、II和III产量的测定
将所要测试的多株菌株各自培养于7个含有70ml MP5培养基(Pernodet等,1993)的500ml具档板锥形瓶中。将多株生二素链霉菌菌株以2.5×106芽孢/ml接种于锥形瓶中并在27℃250转/分钟定轨振荡生长72小时。收集对应相同克隆的培养物,任选地通过打褶的滤器过滤,并7000转/分钟离心15分钟。然后将各种上清液储存于-30℃。
通过离子配对高压液相色谱(HPLC)进行测定。培养基的HPLC分析使得有可能精确测定三种形式螺旋霉素的浓度。用Nucleosil辛基接枝的二氧化硅相填充所用柱子(Macherey-Nagel)。颗粒大小为5μm并且孔大小为100_。柱子的内径为4.6mm且长度为25cm。流动相是H3PO4缓冲液(pH2.2)和含有6.25g/L NaClO4高氯酸盐的乙腈以70/30(v/v)混合的混合物。以固定的1ml/分钟的流速在恒溶剂系统中进行分析。将柱子温控于23℃。在238nm通过紫外分光光度计检测。在+10℃冷藏样品并通过峰的面积测定定量(通过外部校准)。在这些情况下,螺旋霉素I、II和III的保留时间分别是大约17;21和30分钟,这使用含有三种形式螺旋霉素的商品化样本能够进行证明。
菌株OSC2具有螺旋霉素生产菌表现型。使用它作为亲本菌株以获得具有可切除盒的菌株(参照实施例15)。因此该菌株用作产生三种形式螺旋霉素的阳性对照。很明显该菌株产生三种形式的螺旋霉素,通过HPLC证明了这一点(参照图19)。
研究具有可切除盒的菌株使得有可能得出一定数量有关所打断基因的功能的结论。菌株SPM507具有基因型:orf12∷att3Ωaac-。菌株SPM507的表现型是非生产菌(参照实施例15);因此可以由此推断出orf12基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。该菌株不再产生螺旋霉素,这通过HPLC可以证明(参照图22)。该结果证实螺旋霉素生物合成中orf12基因的必要性。
菌株SPM508具有基因型:orf13c∷att3Ωaac-。菌株SPM508的表现型是螺旋霉素生产菌表现型(参照实施例15);因此可以由此推断出orf13c基因不是生二素链霉菌中螺旋霉素生物合成所必需的基因。该菌株产生螺旋霉素I、II和III,这通过HPLC可以证明(参照图23)。该结果证实orf13c基因不是生二素链霉菌中螺旋霉素I、II和III生物合成所必需的基因。
菌株SPM509具有基因型:orf14∷att3Ωaac-。菌株SPM509的表现型是非生产菌;因此可以由此推断出orf14基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。该菌株不再产生螺旋霉素,这通过HPLC可以证明(参照图24)。该结果证实螺旋霉素生物合成中orf14基因的必要性。
菌株SPM501具有基因型:orf6*∷att1Ωhyg+。该菌株具有螺旋霉素非生产菌表现型。该菌株不再产生螺旋霉素,这通过HPLC可以证明(参照图20)。然而,由于orf5*和orf6*基因(参照图3)具有相同的方向,所观察到的表现型可能是由于导入orf6*的盒对操纵子中orf5*表达的极性效应。这暗示这些基因是共转录的。为了回答该问题,通过切除导入的盒,使得在or6*基因中产生同相删除而恢复orf5*的表达,获得了菌株SPM502。该菌株具有基因型orf6*∷att1(参照实施例14和15)。盒的切除仅残留了同相“瘢痕”att序列(参照实施例14)。菌株SPM502具有螺旋霉素生产菌表现型。然而,如通过HPLC所证明,该菌株仅产生螺旋霉素I而不产生螺旋霉素II和III(参照图21)。因此由这些结果可以推论出orf5*基因是生二素链霉菌中螺旋霉素生物合成所必需的基因,由于在菌株SPM501中将它间接失活导致螺旋霉素非生产菌表现型(参照图20)。另一方面,orf6*基因不是生二素链霉菌中螺旋霉素I生物合成所必需的基因,由于失活该基因导致螺旋霉素I生产菌表现型(参照图21)。然而,orf6*是产生螺旋霉素II和III所必需的(参照实施例16)。因此很明显orf6*基因编码负责在位置3修饰platenolide的酰基转移酶(参照图1)。
实施例17:确定orf10的翻译起始位点和提高螺旋霉素产量
17.1质粒pSPM523、pSPM524和pSPM525的构建:
在生二素链霉菌中鉴定了orf10基因并由Geistlich等(M.Geistlich等,1992)命名为srmR。进行了orf10基因的失活(参照实施例8)。因此有可能表明所得菌株不再产生螺旋霉素(参照实施例15)。这证实orf10基因显然参与螺旋霉素生物合成。因此显然由该基因所编码的蛋白质对于螺旋霉素生物合成是必需的。然而,序列分析显示定位于相同阅读框中的2个ATG密码子可以用于orf10的翻译(参照图28)。2个可能的密码子之一(最上游的密码子)起始于SEQ ID No.1中所给出序列的10656位置,而另一个可能的密码子,定位于较下游,起始于10809位置(参照SEQ ID No.1)。在测试过量表达srmR对螺旋霉素产量的可能作用之前,重要地是首先确定翻译起始位点。
为了确定翻译起始位点,产生了含有三种形式orf10的三个构建体。通过利用含有HindIII限制性酶切位点或含有BamHI限制性酶切位点的寡核苷酸的PCR获得了这几种形式。
用于扩增的第一对引物对应以下寡核苷酸:
EDR39:
5’CCCAAGCTTGAGAAGGGAGCGGACATTCATGGCCCGCGCCGAACGC3’(SEQ ID No.122)(粗体表示HindIII位点)
EDR42:
5’CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3’(SEQ ID No.123)(粗体表示BamHI位点)该对引物EDR39-EDR42允许扩增orf10片段,其含有定位于最3’位置的ATG(SEQ ID No.1中所给出序列的10809位置)(参照图28)。所得片段大小为大约2kb并且后来被称为“短orf10”;该片段不含orf10启动子。将该2kb片段克隆入载体pGEM-T easy,以产生质粒pSPM520。
用于扩增的第二对引物对应以下寡核苷酸:
EDR40:
5’CCCAAGCTTGAGAAGGGAGCGGACATTCAATGCTTTGGTAAAGCAC3’(SEQ ID No.124)(粗体表示HindIII位点)
EDR42:
5’CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3’(SEQ ID No.123)(粗体表示BamHI位点)
该对引物EDR40-EDR42允许扩增orf10片段,其含有定位于最5’位置的ATG(SEQ ID No.1中所给出序列的10656位置)(参照图28)。将该2.2kb片段,后来被称为“长orf10”克隆入载体pGEM-T easy,以产生质粒pSPM521;该质粒不含orf10启动子。
用于扩增的第三对引物对应以下寡核苷酸:
EDR41:
5’-CCCAAGCTTTCAAGGAACGACGGGGTGGTCAGTCAAGT-3’(SEQ ID No.125)(粗体表示HindIII位点)
EDR42:
5’CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3’(SEQ ID No.123)(粗体表示BamHI位点)
该对引物EDR41-EDR42允许扩增具有两个ATG的orf10基因,并且还含有其自己的启动子(参照图28)。将该2.8kb片段,下文中被称为“原orf10”克隆入载体pGEM-T easy,以产生质粒pSPM522。
利用菌株OSC2染色体DNA作为模板获得了“原orf10”片段。利用预先纯化的“原orf10”片段DNA作为模板获得了“短orf10”和“长orf10”片段自身。
然后将质粒pSPM520、pSPM521和pSPM522的HindIII-BamHI插入片段亚克隆入用HindIII-BamHI酶预先消化了的载体pUWL201(来源于质粒pUWL199(U.F.Wehmeier,1995)的质粒,其中已经导入了ermE启动子区域的KpnI-BamHI片段(参照Bibb等,1985,具体而言是图2),该片段携带有增加启动子强度的突变(ermE*启动子)(Bibb等,1994)(参照Doumith等,2000))。因此,获得了三个质粒:pSPM523(来源于pUWL201,其具有“短orf10”形式的插入部分)、pSPM524(来源于pUWL201,其具有“长orf10”形式的插入部分)和pSPM525(来源于pUWL201,其具有“原orf10”形式的插入部分)(图28)。
17.2用构建体pSPM523、pSPM524和pSPM525转化菌株OS49.50:
通过原生质体转化作用(T.Kieser等,2000),分别用质粒pSPM523、pSPM524和pSPM525转化菌株OS49.50(在orf10基因中具有敲除的菌株,参照实施例8)。通过用不含插入部分的质粒pUWL201转化菌株OS49.50也制备了阴性对照。原生质体转化之后,通过其硫链丝菌肽抗性筛选了这些克隆。通过提取这些质粒验证了使用每一种质粒转化的克隆。因此,获得了4株新菌株:菌株OSC49.50 pUWL201,来源于使用不含插入部分的质粒pUWL201进行的转化;菌株OSC49.50 pSPM523,来源于使用质粒pSPM523进行的转化;菌株OSC49.50 pSPM524,来源于使用质粒pSPM524进行的转化;和最后菌株OS49.50 pSPM525,来源于使用质粒pSPM525进行的转化。
通过HPLC测试这四株菌株中每一株的螺旋霉素产量。为此,将所要测试的多株链霉菌菌株培养于含有70ml MP5培养基(Pernodet等,1993)的具档板的500ml锥形瓶(带档板的锥形瓶)中。当菌株含有质粒pUWL201或其衍生物之一时,加入5μg/ml硫链丝菌肽。将各种生二素链霉菌菌株以2.5×106芽孢/ml的起始浓度接种于带档板的锥形瓶中,并在27℃以250转/分钟定轨振荡孵育这些培养物96小时。然后通过离心从培养基中分离细胞并通过HPLC(参照实施例16)分析上清液以测定所产生的螺旋霉素的量。根据标准样品和测量峰的面积,有可能测定由这些菌株所产生的每种螺旋霉素的量。表39中给出了该分析的结果,数据表示为mg每升上清液。结果对应螺旋霉素的总产量(通过将螺旋霉素I、II和III的产量相加获得)。
表39.来源于OS49.50的菌株的螺旋霉素产量,(结果表示为mg/l)。
    菌株     螺旋霉素产量
    OS49.50 pUWL201     0
    OS49.50 pSPM523     0
    OS49.50 pSPM524     93
    OS49.50 pSPM525     149
如表39中给出的结果所示,阴性对照(用质粒pUWL201转化的菌株OS49.50)不产生螺旋霉素。当将质粒pSPM523(其含有“短orf10”形式)导入菌株OS49.50时,观察到无螺旋霉素产生。另一方面,存在质粒pSPM524(其含有“长orf10”形式)和质粒pSPM525(其含有“原orf10”形式)可恢复宿主菌株OS49.50中螺旋霉素的产生。因此,仅含有最上游ATG的orf10片段使得有可能恢复螺旋霉素合成作用。
为了证实这些结果,用XhoI限制性酶(该酶在该质粒中具有唯一一个位点,定位于两个ATG之间(参照图28))消化质粒pSPM521(含有“长orf10”形式的质粒pGEM-T easy)。然后通过Klenow酶处理使XhoI末端钝末端化。然后通过T4 DNA连接酶的作用使质粒自身闭合,以形成质粒pSPM527。如果最上游的ATG(SEQ ID No.1中给出的序列位置10656)确实用作翻译起始位点,该处理将导致阅读框中在XhoI位点的移位并且将具有产生呈现无激活活性的蛋白质的作用。另一方面,如果翻译起始发生于最下游的ATG(SEQ ID No.1中给出的序列位置10809),该处理对Orf10(已给出转录起始位点)的表达将具有很小或没有作用,并且对所产生的蛋白质也没有作用。
然后pSPM527的BamHI-HindIII插入片段亚克隆入载体pUWL201,以产生质粒pSPM528。将该质粒导入菌株OS49.50并且更加具体而言是筛选到了具有预期质粒的克隆。然后通过HPLC测试所得菌株的螺旋霉素产量(参照实施例16和上面)。不同于使用质粒pSPM524所观察到的结果(参照表39),菌株OS49.50中存在质粒pSPM528不恢复螺旋霉素产量。这证实orf10基因的翻译起始位点是定位于最下游位置的ATG(ATG 1,参照图28)。
17.3提高生二素链霉菌菌株OSC2中的螺旋霉素产量:
为了测试过量表达orf10基因对螺旋霉素产量的影响,将质粒pSPM523、pSPM524、pSPM525和pSPM528导入菌株OSC2。为此,用质粒pSPM523、pSPM524、pSPM525和pSPM528分别独立地转化菌株OSC2的原生质体(T.Kieser等,2000)。通过用不含插入部分的质粒pUWL201转化菌株OSC2也制备了阴性对照。原生质体转化之后,通过其硫链丝菌肽抗性筛选了这些克隆。通过提取这些质粒验证了使用每一种质粒转化的克隆。这样,获得了五个新的菌株:菌株OSC2 pUWL201,来源于使用不含插入部分的质粒pUWL201进行的转化;菌株OSC2pSPM523,来源于使用质粒pSPM523进行的转化;菌株OSC2 pSPM524,来源于使用质粒pSPM524进行的转化;菌株OSC2 pSPM525,来源于使用质粒pSPM525进行的转化;和,最后,菌株OSC2 pSPM528,来源于使用质粒pSPM528进行的转化。然后通过HPLC(以与实施例17.2相同的方式)分析了这些菌株的螺旋霉素产量。为了平行比较还进行了菌株OSC2螺旋霉素产量的分析。表40中给出了该分析的结果,数据表示为mg每升上清液。结果对应螺旋霉素的总产量(通过将螺旋霉素I、II和III的生产量相加获得)。
表40.来源于OSC2的菌株的螺旋霉素产量,(结果表示为mg/l).
    菌株     螺旋霉素产量
    OSC2     69
    OSC2 pUWL201     103
    OSC2 pSPM523     19
    OSC2 pSPM524     135
    OSC2 pSPM525     278
    OSC2 pSPM528     68
因此,观察到质粒pSPM524或质粒pSPM525的存在显著增加菌株OSC2的螺旋霉素产量。这清楚地证明过量表达Orf10对螺旋霉素产量具有正效应。另一方面,质粒pSPM528对螺旋霉素产量没有作用。
以相同的方式,将质粒pSPM525和pUWL201导入菌株SPM502(参照实施例14)。这样,获得了两个新的菌株:菌株SPM502 pUWL201,来源于使用不含插入部分的质粒pUWL201进行的转化;和菌株SPM502pSPM525,来源于使用质粒pSPM525进行的转化。
菌株SPM502 pSPM525(该菌株含有质粒pSPM525,参照上面)的样本保藏于国立微生物保藏中心(CNCM)巴斯德研究所,25,rue du DocteurRoux 75724 Paris Cedex 15,法国,保藏日为2003年2月26日,保藏号为I-2977。
通过HPLC(以与实施例17.2相同的方式)分析了这些菌株SPM502UWL201和SPM502 pSPM525的螺旋霉素产量。为了平行比较还进行了菌株SPM502螺旋霉素产量的分析。表41中给出了该分析的结果,数据表示为mg每升上清液。结果对应螺旋霉素I的生产量。事实上,这些菌株中没有产生螺旋霉素II和III的菌株。
表41.来源于SPM502的菌株的螺旋霉素I产量(结果表示为mg/l).
    菌株     螺旋霉素I
    SPM502     47
    SPM502 pUWL201     72
    SPM502 pSPM525     130
因此,有可能观察到在菌株SPM502中过量表达orf10基因显著增加螺旋霉素I的产量。
实施例18:在大肠杆菌中构建位于粘粒pWED2中的生二素链霉菌菌株OSC2的基因组DNA文库。
18.1粘粒pWED2的构建:
为了促进链霉菌中基因的失活,构建了携带质粒RK2 oriT序列(该序列允许通过接合从适当的大肠杆菌菌株导入链霉菌)并携带在链霉菌中赋予可检测表现型的针对抗生素的抗性基因的粘粒。此种含有较大的生二素链霉菌基因组DNA插入片段的粘粒能够用于基因失活实验。
为了构建该载体,将pac-oriT盒(EcoRV片段)在唯一的HpaI位点导入来源于粘粒pWED15(Wahl等,1987)的粘粒pWED1(Gourmelen等,1998)。通过PCR获得了pac-oriT盒。为此,通过PCR从质粒pVF 10.4(Vara等,1985;Lacalle等,1989)扩增了pac基因,使用了作为第一引物的引物A(序列为5’-CCAGTA GATATCCCGCCAACCCGGAGCTGCAC-3’(SEQ ID No.126),EcoRV限制性酶切位点已在下面划线并且粗体的20个核苷酸序列对应pac基因启动子的上游区域),和作为第二引物的引物B(序列为5’- GAAAAGATCCGTCATGGGGTCGTGCGCTCCTT-3’(SEQ IDNo.127),在其5’末端,包含对应oriT序列起始端的12个核苷酸序列(双下划线)和对应pac基因末端的20个核苷酸序列(粗体)(参照图29,第一轮PCR)。
关于oriT基因,通过PCR从质粒pPM803(P.Mazodier等,1989)扩增了该基因,使用了作为第一引物的引物C(序列为5’-CACGACCCCATG ACGGATCTTTTCCGCTGCAT-3’(SEQ ID No.128)),该引物在其5’末端包含对应pac基因编码序列下游序列的12个核苷酸序列(粗体)和对应oriT序列起始端的20个核苷酸序列,和作为第二引物的引物D(序列为5’GAGCCG GATATCATCGGTCTTGCCTTGCTCGT-3’(SEQ IDNo.129)),该引物包含EcoRV限制性酶切位点(单下划线)和对应oriT序列末端的20个核苷酸序列(双下划线)(参照图29,第二轮PCR)。
使用引物A和B获得的扩增产物和使用引物C和D获得的扩增产物,在它们的一个末端,含有24个核苷酸的共同序列。通过混合先前获得的这两个扩增产物和使用引物A和D作为引物,进行了第三轮PCR(参照图29,第三轮PCR)。这使得有可能获得对应pac+oriT组合的扩增产物。然后将pac-oriT片段克隆入载体pGEM-T Easy(由Promega公司(Madison,Wisconsin,USA)出售),这使得有可能获得质粒pGEM-T-pac-oriT。然后将该质粒的插入部分亚克隆入粘粒pWED1。为此,用EcoRV酶消化质粒pGEM-pac-oriT并将含有组合pac+oriT的EcoRV插入部分插入预先用HpaI酶切开的粘粒pWED1。如此所得粘粒命名为pWED2(参照图30)。
该粘粒使得其可利于链霉菌中基因的失活。具体而言,该粘粒携带oriT序列,该序列不仅允许通过接合从适当的大肠杆菌菌株导入链霉菌,还携带在链霉菌中赋予可检测表现型的针对抗生素的抗性基因。此种含有较大的生二素链霉菌基因组DNA插入片段的粘粒能够用于基因失活实验。
因此,按照Chaveroche等,2000所述的技术,例如可以将含有靶基因的衍生自pWED2的粘粒导入含有质粒pKOBEG的大肠杆菌菌株KS272(参照Chaveroche等,2000)并且盒将导入靶基因中。然后可以将通过该技术获得的粘粒(其中靶基因失活的粘粒)导入诸如S17.1菌株的大肠杆菌菌株或者使得有可能通过接合将含有oriT序列的质粒转移入链霉菌的任意其它菌株。
大肠杆菌和链霉菌之间进行接合后,如实施例12中所述可以获得链霉菌克隆,其中靶基因的野生型拷贝已经由打断的拷贝所替换。
存在于该新粘粒上的在链霉菌中表达的抗性基因是白黑链霉菌(Streptomyces alboniger)的pac基因(J.Vara等,1985;Lacalle等,1989),该基因编码嘌呤霉素N-乙酰基转移酶并赋予嘌呤霉素抗性。在基因失活实验中,找到了其中已经发生了双重组事件的克隆。这些克隆将已经去除了粘粒pWED2并且将因此已经变得又对嘌呤霉素敏感。
18.2在大肠杆菌中构建位于粘粒pWED2中的生二素链霉菌菌株OSC2基因组的DNA文库
为了获得大小在大约35和45kb之间的DNA片段,使用BamHI限制性酶部分消化生二素链霉菌菌株OSC2的基因组DNA。然后将这些片段克隆入粘粒pWED2,后者已经预先用BamHI消化了,并且用碱性磷酸酶处理。然后利用Promega公司(Madison,Wisconsin,USA)出售的“Packagene_λDNA包装系”,按照制造商的推荐,将连接混合物体外包装于λ噬菌体颗粒中。将所获得的噬菌体颗粒用于感染Stratagene公司(LaJolla,California,USA)出售的大肠杆菌菌株SURE_。在LB培养基+氨苄青霉素(50μg/ml)平板上筛选这些克隆,粘粒pWED2赋予氨苄青霉素抗性。
实施例19:分离包含覆盖螺旋霉素生物合成途径区域的新文库的粘粒、这些粘粒中片段的亚克隆和序列分析。
19.1对生二素链霉菌OSC2基因组文库的菌落进行的杂交:
分离了生二素链霉菌OSC2的新文库的粘粒(参照实施例18),该文库覆盖orf1*到orf10*或覆盖orf1到orf25c的部分或全部,或覆盖orf25c更上游区域。为此,使用以下3个探针对按照实施例18所获得的大肠杆菌的菌落进行了依次杂交(参照图31):
-所用的第一条探针对应通过PCR扩增到的大约0.8kb DNA片段,其中所述PCR使用粘粒pSPM5为模板,并使用了以下引物:
ORF23c:5’-ACGTGCGCGGTGAGTTCGCCGTTGC-3’(SEQ ID No.130)和
ORF25c:5’-CTGAACGACGCCATCGCGGTGGTGC-3’(SEQ ID No.131)。
如此获得的PCR产物包含含有orf23c起始端、orf24c全部和orf25c末端部分的片段(参照图31,探针I)。
-所用的第二条探针对应通过PCR扩增到的大约0.7kb DNA片段,其中所述PCR使用生二素链霉菌菌株ATCC23877总DNA为模板,并使用了以下引物:
ORF1*c:5’-GACCACCTCGAACCGTCCGGCGTCA-3’(SEQ ID No.132)和
ORF2*c:5’-GGCCCGGTCCAGCGTGCCGAAGC-3’(SEQ ID No.133)。
如此获得的PCR产物包含含有orf1*c末端和orf2*c起始端部分的片段(参照图31,探针II)。
-所用的第三条探针对应通过消化质粒pOS49.99所获得的含有orf1、orf2和orf3的大约3kb的EcoRI-BamHI片段(参照图31,探针III)。
按照常规技术(Sambrook等,1989),将实施例18.2中所获得文库的大约2000个克隆转移到滤膜上用于菌落杂交。
转移到滤膜上之后,通过随机引物技术(Roche公司出售的试剂盒)用32P标记第一条探针(参照图31,探针I)并将该探针用于对文库的2000个克隆进行杂交。在Church和Gilbert(Church和Gilbert,1984)所述的缓冲液中65℃时进行杂交。在含有0.1%SDS的2×SSC中65℃时进行两次洗涤,第一次洗涤10分钟且第二次20分钟,然后在含有0.1%SDS的0.2X SSC中65℃时进行持续30分钟的第三次洗涤。在这些杂交和洗涤条件下,在所杂交的2000个克隆中有20个克隆与第一条探针呈现强杂交信号。将这20个克隆培养于LB+氨苄青霉素(50μg/ml)培养基中并通过碱裂解法(Sambrook等,1989)提取相应的20个粘粒并用BamHI限制性酶进行消化。然后将消化产物在琼脂糖凝胶上进行分离,转移至尼龙膜上并在上述相同条件下与第一条探针进行杂交(参照上面:PCR产物ORF23c-ORF25c,探针I)。12个粘粒包含与所用探针强杂交的BamHI片段。这12个粘粒命名为pSPM34,pSPM35,pSPM36,pSPM37,pSPM38,pSPM39,pSPM40,pSPM41,pSPM42,pSPM43,pSPM44和pSPM45。用BamHI消化后,将这12个粘粒的消化谱彼此相比较并与粘粒pSPM5的消化谱相比较。此外,使用对应在orf1-orf25c区域内已鉴定出来的不同基因的不同引物进行的PCR扩增实验使得有可能定位这些彼此相关的粘粒的插入部分并且也有可能确定已知orf1-orf25c区域内这些插入部分的位置(参照图32)。更加具体而言是选择到了粘粒pSPM36,该粘粒倾向于含有较大的orf25c上游区域(参照图31和32)。
其次,使用与上述条件相同的条件,用对应PCR产物:ORF1*c-ORF2*c的第二条探针(参照图31,探针II)与生二素链霉菌OSC2文库的2000个克隆进行杂交。该杂交使得有可能分离到其插入部分定位于从orf1*c到orf10*c区域内的粘粒。在所用杂交条件下,在所杂交的2000个克隆中有16个克隆与第二条探针呈现强杂交信号。将这16个克隆培养于LB+氨苄青霉素(50μg/ml)培养基中并通过碱裂解法(Sambrook等,1989)提取相应的16个粘粒并用BamHI限制性酶进行消化。将这16个粘粒的消化谱(用BamHI消化之后)彼此相比较并与粘粒pSPM7的消化谱相比较。使用引物ORF1*c和ORF2*c进行的PCR扩增实验使得有可能选择到两个明显含有orf1*c和orf2*c基因的粘粒并且它们的消化谱既有相同的条带也有不同的条带。此外,使用对应在orf1*c到orf10*c区域内已鉴定出来的不同基因的不同引物进行PCR扩增实验使得有可能定位这些彼此相关的粘粒的插入部分并且也有可能确定已知orf1*c到orf10*区域内这些插入部分的位置(参照图32)。更加具体而言筛选到的这2个粘粒命名为pSPM47和pSPM48(参照图32)。
使用与上述相同的条件,用对应质粒pOS49.99 EcoRI-BamHI DNA片段的第三条探针(参照图31,探针III)与生二素链霉菌OSC2文库的2000个克隆进行杂交。该杂交使得有可能分离到含有从orf1至orf3区域的粘粒,并且这些粘粒倾向于含有PKS基因的较大部分或者含有螺旋霉素生物合成途径基因orf1到orf25c的较大部分。在这些杂交条件下,在所杂交的2000个克隆中有35个克隆与第三条探针呈现强杂交信号。将这35个克隆培养于LB+氨苄青霉素(50μg/ml)培养基中并通过碱裂解法(Sambrook等,1989)提取相应的35个粘粒并用BamHI限制性酶进行消化。用BamHI消化之后,将这35个粘粒的消化谱彼此相比较并与粘粒pSPM5的消化谱相比较。此外,使用对应在orf1到orf25c区域内所鉴定出来的不同基因的不同引物进行的PCR扩增实验使得有可能确证这些粘粒已包含来自区域orf1到orf25c的插入片段,并且使得有可能定位这些粘粒的插入片段相互间的及相对于已知区域orf1到orf25c的位置(参照图32)。更加具体而言筛选到了5个粘粒,它们命名为pSPM50,pSPM51,pSPM53,pSPM55和pSPM56(参照图32)。
19.2部分粘粒pSPM36插入片段的亚克隆和序列分析
使用引物ORF23c和ORF25c通过PCR获得的大约0.8kb的探针(参照上面和图31,探针I)也用于对用PstI酶消化了的生二素链霉菌OSC2总DNA进行Southern印迹实验。在上述杂交条件下,当对用PstI酶消化了的生二素链霉菌OSC2总DNA进行杂交时,该探针显示单一一个大约6kb的PstI片段。PstI位点存在于orf23c区域内(参照SEQ ID No.80),但是直到已知序列的末端(BamHI位点)都不存在其它PstI位点(参照SEQID No.1)。该PstI-BamHI片段大小为大约1.4kb。因此该与用PstI酶消化了的生二素链霉菌OSC2总DNA进行杂交的6kb PstI片段含有定位于orf25c上游的大约4.6kb区域。该区域倾向于含有其产物参与螺旋霉素生物合成途径的其它基因。通过消化验证了粘粒pSPM36确实含有该6kbPstI片段。为了确定orf25c更上游的序列,从pSPM36分离得到该片段。为此,用PstI限制性酶消化粘粒pSPM36。通过电洗脱从0.8%琼脂糖凝胶上分离得到大小为大约6kb的PstI-PstI片段,并且然后将其克隆入载体pBK-CMV(4512bp)(由Stratagene公司(La Jolla,California,USA)出售)。如此获得的质粒命名为pSPM58(参照图33)并确定了其插入部分的序列。SEQ ID No.134中给出了该插入部分的序列。然而,并非所有序列都确定了,还有大约450个核苷酸的缺口未确定,在相应序列中序列未确定的部分用连续的“N”表示。
19.3新核苷酸序列的分析、开放阅读框的确定和参与螺旋霉素生物合成的基因的表征
使用FramePlot程序(J.Ishikawa和K.Hotta 1999)分析了所得粘粒pSPM58的插入部分的序列。这使得有可能在开放阅读框中鉴定呈现典型链霉菌密码子选择的开放阅读框。该分析使得有可能确定该插入部分包含orf25c上游的4个新ORF(参照图34)。这些基因命名为orf26(SEQ ID No.107)、orf27(SEQ ID No.109)、orf28c(SEQ ID No.111,该orf的序列未完全确定而在pSPM58插入部分的序列分析中还有大约450个核苷酸的缺口未测序,这450个核苷酸以一系列“N”的形式出现于序列SEQ ID No.111)和orf29(对该orf的插入部分,序列是不完整的)。基因名称中加入“c”意思是指,对于所讨论的ORF,该编码序列是反方向的(参照图34)。
使用各种程序将由这些开放阅读框所推导出的蛋白质序列与多种数据库中所存在的那些序列进行比较:BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索(这两个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)获得),FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990)(该程序尤其可以从法国Evry的INFOBIOGEN资源中心获得)。这些比较使得能够明确描述关于这些基因产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。
19.4另一部分粘粒pSPM36插入片段的亚克隆和序列分析
使用引物ORF23c和ORF25c通过PCR获得的大约0.8kb的探针(参照上面和图31,探针I)也用于与用StuI酶消化了的菌株OSC2总DNA进行Southern印迹实验。在上述用于该探针的杂交条件下,当对用StuI酶消化了的菌株OSC2总DNA进行杂交时,该探针显示单一一个大约10kb的StuI片段。由于orf23c中存在StuI位点(参照SEQ ID No.80)并且该位点的定位与PstI位点相关,所以该10kb片段包括先前研究的所有PstI片段(pSPM58插入部分)并且使得有可能获得约4kb仍未研究的区域(参照图33)。通过消化验证了粘粒pSPM36确实含有该10kb的StuI片段。为了确定orf29末端的序列和orf29更上游其它基因的序列,从pSPM36分离得到该片段。为此,用StuI限制性酶消化粘粒pSPM36。通过电洗脱从0.8%琼脂糖凝胶上分离得到大小为大约10kb的StuI-StuI片段,并且然后将其克隆入载体pBK-CMV(4512bp)(由Stratagene公司(La Jolla,California,USA)出售)。如此获得的质粒命名为pSPM72(参照图33)。然后用EcoRI(pSPM58插入部分中的EcoRI位点)和HindIII(载体多克隆位点中的HindIII位点,紧接着插入部分末端的StuI位点之后)消化后一质粒(参照图33)。如此获得的EcoRI-HindIII DNA片段对应质粒pSPM72插入部分的片段(参照图33)并将其亚克隆入预先用EcoRI和HindIII消化了的载体pBC-SK+(由Stratagene公司(La Jolla,California,USA)出售)。如此所得质粒命名为pSPM73并确定了其插入部分的序列。SEQ ID No.135中给出了该插入部分的序列。
SEQ ID No.106中给出了pSPM58和pSPM73插入部分的序列的组合排列。该序列起始于orf23c中的PstI位点(参照SEQ ID No.80)并延伸至orf32c中的StuI位点(参照图34)。由于orf28c的序列(SEQ ID No.111)是不完整的(参照实施例19.3),其中大约450个核苷酸的区域未进行序列分析,在序列SEQ ID No.106中这450个核苷酸以一系列“N”的形式出现。
19.5新核苷酸序列的分析、开放阅读框的确定和参与螺旋霉素生物合成的基因的表征
使用FramePlot程序(J.Ishikawa和K.Hotta 1999)分析了所得粘粒pSPM73的插入部分的部分序列。这使得有可能在开放阅读框中鉴定呈现典型链霉菌密码子选择的开放阅读框。该分析使得有可能确定包含4个ORF(一个不完整的和三个完整的ORF)的该插入部分(参照图34)。不完整的ORF对应orf29编码序列的3’部分,这使得有可能根据在质粒pSPM58插入部分序列分析中获得的同一orf的部分序列(参照实施例19.2和19.3),完成该基因的序列;因此两个序列的组合使得有可能获得orf29的完整序列。因此这4个基因命名为orf29(SEQ ID No.113),orf30c(SEQID No.115),orf31(SEQ ID No.118)和orf32c(SEQ ID No.120)。基因名称中加入“c”意思是指,对于所讨论的ORF,该编码序列是反方向的(参照图34)。
使用各种程序将由这些开放阅读框所推导出的蛋白质序列(对应orf29的SEQ ID No.114,对应orf30c的SEQ ID No.116和117,对应orf31的SEQ ID No.119和对应orf32c的SEQ ID No.121)与各种数据库中所存在的那些序列进行比较:BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索(这两个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)获得),FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990)(该程序尤其可以从法国Evry的INFOBIOGEN资源中心获得)。这些比较使得能够明确描述关于这些基因产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。
19.6粘粒pSPM36插入片段第三部分的亚克隆和序列分析。
通过PCR获得了对应orf32c内部序列的探针(0.8kb DNA片段),PCR反应使用生二素链霉菌菌株总DNA为模板并使用以下引物:
KF36:5′-TTGCCGTAGCCGAGGACCAGCG-3′(SEQ ID No.151)和
KF37:5′-CACATGGCCCTGGAGGACCCTG-3′(SEQ ID No.152)。
如此获得的PCR产物代表orf32c内部序列。该探针用于与用PstI酶消化了的菌株OSC2染色体DNA和粘粒pSPM36 DNA进行Southern印迹实验。使用与上述条件相同的杂交条件(参照实施例19.1),当对用PstI酶消化了的菌株OSC2总DNA和粘粒pSPM36 DNA进行杂交时,该探针显示大约为3.4kb和2.5kb的两个PstI片段。由于所用探针中存在PstI位点,能够解释这些结果。第一个DNA片段,大小为大约3.4kb,是其序列已经完全已知的片段。2.5kb片段的序列仅部分已知,对700bp的区域已知。为了确定orf32c末端的序列和后者上游其它基因的序列,从粘粒pSPM36分离得到该片段。为此,用PstI限制性酶消化粘粒pSPM36。通过纯化从0.8%琼脂糖凝胶上分离得到大小为大约2.5kb的PstI-PstI片段,并且然后将其克隆入载体pBK-CMV(4518bp)(由Stratagene公司(LaJolla,California,USA)出售)。如此获得的质粒命名为pSPM79(参照图41)并确定了其插入部分的序列。
orf28c的序列(SEQ ID No.111)是不完整的(参照实施例19.3)。具体而言,已经不可能确定大约450个核苷酸的区域,在序列SEQ ID No.106中这450个核苷酸以一系列“N”的形式出现。通过对该区域再次进行序列分析,确定了该全部未知区域的序列。因此,全部确定了pSPM58和pSPM73插入部分的序列。SEQ ID No.141中给出了orf28c编码部分的完整序列并且SEQ ID No.142中给出了由该序列推导出的蛋白质。SEQ ID No.161中给出了质粒pSPM79插入部分的序列。
SEQ ID No.140中给出了pSPM58,pSPM73和pSPM79插入部分的序列的组合(参照图41)。该序列起始于orf23c中的PstI位点(参照SEQ ID No.80)并延伸至orf34c中的PstI位点(参照图41)。
19.7新核苷酸序列的分析、开放阅读框的确定和参与螺旋霉素生物合成的基因的表征
使用FramePlot程序(J.Ishikawa和K.Hotta 1999)分析了所得质粒pSPM79的插入部分的序列。这使得有可能在开放阅读框中鉴定呈现典型链霉菌密码子选择的开放阅读框。该分析使得有可能确定包含3个ORF的该插入部分,两个不完整的ORF(orf32c和orf34c)和一个完整的ORF(orf33)(参照图41)。
第一个不完整的ORF对应orf32c编码序列的5’部分。这使得有可能根据在质粒pSPM73插入部分的序列分析中获得的同一orf的部分序列(参照实施例19.4和19.5),完成该基因的序列,因此两个序列的组合使得有可能获得orf32c的完整序列(SEQ ID No.145)。基因名称中加入“c”意思是指,对于所讨论的ORF,该编码序列是反方向的(参照图41)。完整orf称为orf33(SEQ ID No.147)。第三个ORF称为orf34c(SEQ ID No.149)。基因名称中加入“c”意思是指,对于所讨论的ORF,该编码序列是反方向的(参照图37)。在该orf的产物和数据库之间进行的比较表明该蛋白质C-末端部分不在由核苷酸序列所推导出的产物中,并且因此还表明该orf更长且持续至已进行序列分析的区域之后。
使用多种程序将由这些开放阅读框所推导出的蛋白质序列与多种数据库中所存在的那些序列进行比较:BLAST(Altschul等,1990)(Altschul等,1997)、CD-搜索(这两个程序尤其可以从国家生物技术信息中心(NCBI)(Bethesda,Maryland,USA)获得),FASTA((W.R.Pearson和D.J.Lipman,1988)和(W.R.Pearson,1990)(该程序尤其可以从法国Evry的INFOBIOGEN资源中心获得)。这些比较使得能够明确描述关于这些基因产物的功能的假说和鉴定那些可能参与螺旋霉素生物合成的基因。
实施例20:分析产生的螺旋霉素生物合成中间体:
20.1样品制备:
将所要测试的多株菌株各自培养于7个含有70ml MP5培养基(Pernodet等,1993)的500ml具档板锥形瓶中。将多株生二素链霉菌菌株以2.5×106芽孢/ml接种于锥形瓶中并在27℃250转/分钟定轨振荡生长96小时。收集对应相同克隆的培养物,任选地通过打褶的滤器过滤,并7000转/分钟离心15分钟。
然后用氢氧化钠将上清液的pH值调整至9并用甲基异丁酰酮(MIBK)抽提上清液。然后回收有机相(MIBK)并蒸发干燥。然后将干提取物溶于1ml乙腈,然后在用于液相色谱/质谱测量(LC/MS)分析之前,稀释至1/10(用水将100μl稀释至1ml)。
20.2通过LC/MS分析样本:
为了测定由所测试的菌株合成的多种产物的质量,通过LC/MS分析样本。
所用高效液相色谱法柱是Kromasil C8 150*4.6mmm,5mmm,100_柱子。流动相是由乙腈和0.05%三氟乙酸水溶液的混合物组成的梯度溶液,流速固定为1ml/分钟。柱恒温器的温度维持在30℃。在两个不同的波长:238nm和280nm下,在柱流出口进行UV检测。连接到色谱柱上的质谱仪是Agilent公司出售的Single Quadripole设备,锥体电压在30和70V。
20.3分析由菌株OS49.67产生的生物合成中间体:
其中orf3基因已通过同相删除被失活的菌株OS49.67不产生螺旋霉素(参照实施例6和15)。按照上述方法(参照段落20.1)制备样品并如上述通过LC/MS进行分析(参照段落20.2)。更加具体而言,在梯度溶剂相中通过色谱法进行分析,如流动相:从时间为T=0到5分钟为20%的乙腈,然后在T=35分钟时线性增加至30%,随后维持至T=50分钟。
在这些条件下,更加显著地观察到两个产物:238nm处的吸收(保留时间为33.4分钟)和280nm处的吸收(保留时间为44.8分钟)(参照图35)。图35显示了在238和280nm处产生的HPLC色谱图的叠合(顶部)并显示了在33.4分钟和44.8分钟时洗脱出的分子的UV光谱(底部)。
联用的质谱测量法分析条件如下:以扫描方式进行扫描,涵盖质量范围在100和1000Da之间。电子倍增器的增益为1V。关于电子喷雾源,雾化气体的压力是35psig,干燥气体的流速是12.0l/分钟,干燥气体的温度是350℃,且毛细管电压为+/-3000V。这些实验使得有可能确定所分离到的两种产物的质量。其质量分别为第一洗脱产物([M-H2O]+=353主要产物)370g/mol和第二产物368g/mol([M-H2O]+=351主要产物)。
为了得到它们的结构,分离上述产物并在以下条件下进行纯化:流动相是0.05%三氟醋酸水溶液和乙腈的70/30(v/v)混合物。在恒溶剂系统中以固定流速1ml/分钟进行色谱分析。在这些条件下,2个产物的保留时间分别为8和13.3分钟。此外,在这种情况下,注射入10μl样品之前不用水稀释所制备的样品(参照段落20.1)。
在色谱柱的输出口回收这2个产物并在以下条件下进行分离:依次用1ml乙腈、1ml水/乙腈(20v/80v)和1ml80/20水/乙腈平衡Oasls HLB 1 cc30mg柱(Waters)。然后加入样品并依次用1ml水/乙腈(95/5)和1ml水/氘化乙腈(95/5)洗涤柱,然后用600μl 40/60的1ml水/氘化乙腈洗脱。然后通过NMR直接分析回收的溶液。
对于这两个化合物,所获得的NMR光谱如下:
-第一洗脱产物:Platenolide A:(谱9646V)
CD3CN中的1H谱(化学迁移ppm):0.90(3H,t,J=6Hz),0.93(3H,d,J=5Hz),1.27(3H,d,J=5Hz),1.27和1.40之间(3H,m),1.51(1H,m),1.95(1H,m),2.12(1H,m),2.30(1H,d,J=12Hz),2.50(1H,d,J=11Hz),2.58(1H,dd,J=9和12Hz),2.96(1H,d,J=7Hz),3.43(3H,s),3.70(1H,d,J=9Hz),3.86(1H,d,J=7Hz),4.10(1H,m),5.08(1H,m),5.58(1H,dt,J=3和12Hz),5.70(1H,dd,J=8和12Hz),6.05(1H,dd,J=9和12Hz),6.24(1H,dd,J=9和12Hz)。
-第二洗脱产物:Platenolide B:(谱9647V)
CD3CN中的1H谱(化学迁移ppm):0.81(3H,t,J=6Hz),0.89(1H,m),1.17(3H,d,J=5Hz),1.30(4H,m),1.47(2H,m),1.61(1H,t,J=10Hz),2.20(1H,m),2.38(1H,d,J=13Hz),2.52(1H,m),2.58(1H,m),2.68(1H,dd,J=8和13Hz),3.10(1H,d,J=7Hz),3.50(3H,s),3.61(1H,d,J=8Hz),3.82(1H,d,J=7Hz),5.09(1H,m),6,20(1H,m),6.25(1H,dd,J=9和12 Hz),6.58(1H,d,J=12Hz),7.19(1H,dd,J=9和12Hz)。
这些实验使得有可能确定这两个化合物的结构。第一洗脱产物是platenolide A且第二洗脱产物是platenolide B;图36中给出了所推导出的这两个分子的结构。
使用结合NMR的LC/MS技术,在略微不同于上述那些条件的条件下,但这些条件的确立是本领域技术人员所熟知的,还有可能确定除了platenolide A和B之外,菌株OS49.67还产生这两种化合物的衍生物。它们是platenolide A+mycarose和platenolide B+mycarose(图40中给出了这两种化合物的结构)。表42中给出了对菌株OS49.67的上清液进行分析的结果。
表42.菌株OS49.67的上清液的LC/MS分析结果
鉴定物  [](mg/l) 离子质量  最大吸收
Platenolide A精确质量=370分子式=C20H34O6  16.1 [M+Na]+393.0[M+K]+408.9[M-H2O+H]+353.0[2M+Na]+763.2  231nm
Platenolide B精确质量=368分子式=C20H32O6  1.4 [M-H2O+H]+351.0[M+Na]+391.0[M+K]+406.9[2M+Na]+759.1  283nm
Platenolide A+‘mycarose’精确质量=514分子式=C27H46O9  4.27 [M+Na]+537.0[M+K]+553.0  230nm
Platenolide B+‘mycarose’精确质量=512分子式=C27H44O9  ND [M+Na]+535.0[M+K]+550.9[PlatB-H2O+H]+350.9  284nm
20.4分析由菌株SPM509所产生的生物合成中间体:
其中orf14基因已失活(orf14∷att3Ωaac-)的菌株SPM509不产生螺旋霉素(参照实施例13、15和16)。按照上述方法(参照段落20.1)制备样品并如上述通过LC/MS进行分析(参照段落20.2和20.3)。对在MP5培养基中培养的菌株SPM509的培养上清液中存在的生物合成中间体的分析表明该菌株仅产生形式B的platenolide(“platenolide B”,参照图36)而不产生形式A的platenolide(“platenolide A”,参照图36)。
实施例21:在具有orf3基因内敲除的菌株(OS49.67)中间断orf14基因
orf14基因的产物是螺旋霉素生物合成所必需的(参照实施例13,15和16:其中该基因被打断的菌株SPM509不再产生螺旋霉素)。对在MP5培养基中培养的菌株SPM509的培养上清液中存在的生物合成中间体的分析表明该菌株仅产生形式B的platenolide而不产生形式A的platenolide(参照实施例20)。可以解释该观察结果的假说之一是orf14的产物参与通过酶还原步骤将形式B platenolide转化为形式A platenolide。为了验证该假说,将orf14基因在不产生螺旋霉素但是产生形式A和B的platenolide的突变体中失活。这就是菌株OS49.67的情况(参照实施例6和20),该菌株中通过同相删除失活了orf3基因(Δorf3)。为了失活该菌株中的orf14基因,通过原生质体转化将质粒pSPM509导入菌株OS49.67(T.Kieser等,2000)。orf14基因的失活已经描述于菌株OSC2的例子中(参照实施例13)并且相同步骤也用于失活菌株OS49.67中的orf14基因。用质粒pSPM509转化之后,通过其阿泊拉霉素抗性对这些克隆进行了筛选。然后,将阿泊拉霉素抗性的克隆分别在含有阿泊拉霉素的培养基上和含有潮霉素的培养基上传代培养。原则上,对阿泊拉霉素具有抗性(ApraR)并对潮霉素敏感(HygS)的克隆是那些其中已经发生了双交换事件并且其中orf14基因已被由att3Ωaac-盒打断的orf14拷贝所替换的那些克隆。更加具体而言是筛选到了这些克隆并且通过杂交验证了盒打断拷贝对野生型orf14拷贝的替换。因此,为了验证确实发生了基因替换,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上进行分离,转移至膜上并用对应att3Ωaac-盒的探针进行杂交。通过本领域技术人员熟知的任意方法,并且尤其是通过使用适当寡核苷酸的PCR和对PCR产物进行序列分析,也能够进行基因型的验证。
更加具体而言是筛选到了呈现预期特性(Δorf3,orf14∷att3Ωaac-)的克隆被命名为SPM510。通过两轮杂交事实上有可能验证att3Ωaac-盒确实存在于该克隆的基因组中,并且有可能验证确实获得了所预期的消化谱,即在该克隆的基因组中,经过两轮重组事件之后,由att3Ωaac-盒打断的拷贝替换了野生型orf14基因后的消化谱。
实施例22:打断orf14基因的功能性补偿
22.1构建质粒pSPM519:
使用以下寡核苷酸对:EDR31:5’CCCAAGCTTCTGCGCCCGCGGGCGTGAA3’(SEQ ID No.136)和EDR37:5’GCTCTAGAACCGTGTAGCCGCGCCCCGG3’(SEQ ID No.137),以菌株OSC2染色体DNA为模板,通过PCR扩增orf14基因。寡核苷酸EDR31和EDR37分别携带HindIII和XbaI限制性酶切位点(粗体序列)。将如此获得的1.2kb片段克隆入载体pGEM-T easy(由Promega公司(Madison,Wisconsin,USA)出售),以形成质粒pSPM515。然后用HindIII和XbaI限制性酶消化该质粒。将所获得的1.2kb HindIII/XbaI插入部分克隆入预先用相同的酶消化了的载体pUWL201(参照实施例17.1)。如此所得质粒命名为pSPM519。
22.2用质粒pSPM519转化菌株SPM509和SPM510:
通过原生质体转化(T.Kieser等,2000)将质粒pSPM519导入菌株SPM509(参照实施例13)和SPM510(参照实施例17)。转化之后,通过其硫链丝菌肽抗性筛选这些克隆。然后将这些克隆在含有硫链丝菌肽的培养基上传代培养。
菌株SPM509是螺旋霉素非生产菌菌株(参照实施例13,15和16和图24)。通过在存在硫链丝菌肽的MP5培养基中培养该菌株,分析了用载体pSPM519转化的菌株SPM509(菌株命名为SPM509 pSPM519)的螺旋霉素产量。然后通过HPLC分析培养上清液(参照实施例16和17)。表43中给出了该分析的结果,数据表示为mg每升上清液。结果对应总螺旋霉素产量(通过将螺旋霉素I,II和III的产量相加获得)。观察到菌株SPM509中存在的载体pSPM519可恢复螺旋霉素产量(参照表43)。
表43.用载体pSPM519转化的菌株SPM509的螺旋霉素产量(结果表示为mg/l上清液)。
  菌株     螺旋霉素产量
  SPM509 pSPM519     58
用质粒pSPM519转化的菌株SPM510命名为SPM510 pSPM509。实施例23:通过弗氏链霉菌的tylB基因功能性补偿orf3基因的打断
23.1构建质粒pOS49.52:
质粒pOS49.52对应允许在生二素链霉菌中表达TylB蛋白质的质粒。为了构建该质粒,将弗氏链霉菌tylB基因的编码序列(Merson-Davies和Cundliffe,1994,GenBank登录号:U08223(该区域的序列),SFU08223(DNA序列)和AAA21342(蛋白质序列))导入质粒pKC1218(Bierman等,1992,Kieser等,2000,含有该质粒的大肠杆菌菌株尤其可从ARS(NRRL)Agricultural Research Service Culture Collection)(Peoria,Illinois,USA)获得,保藏号为B-14790)。此外,该编码序列置于ermE*启动子控制之下(参照上面,具体而言是实施例17.1,Bibb等,1985,Bibb等,1994)
23.1用质粒pOS49.52转化菌株OS49.67:
其中orf3基因通过同相删除被失活的菌株OS49.67不产生螺旋霉素(参照实施例6和15)。通过原生质体转化(T.Kieser等,2000)将质粒pOS49.52导入菌株OS49.67。转化之后,通过其阿泊拉霉素抗性筛选这些克隆。然后将这些克隆在含有阿泊拉霉素的培养基上传代培养。更加特异地筛选到该克隆并命名为OS49.67 pOS49.52。
如上所阐明,菌株OS49.67不产生螺旋霉素(参照实施例6和15)。通过实施例15中所述的技术分析用载体pOS49.52转化的菌株OS49.67的螺旋霉素产量。因此有可能证明该菌株具有螺旋霉素生产菌表现型。因此,TylB蛋白质允许功能性补偿orf3基因的打断。
实施例24:通过过量表达orf28c基因提高螺旋霉素产量
24.1构建质粒pSPM75:
使用含有HindIII限制性酶切位点或BamHI限制性酶切位点的一对寡核苷酸,通过PCR扩增orf28c基因。这些引物具有如下序列:
KF30:5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC3’(SEQ ID No.138),具有HindIII限制性酶切位点(粗体所示)
KF31:5’GGATCCCGCGACGGACACGACCGCCGCGCA3’(SEQ ID No.139),具有BamHI限制性酶切位点(粗体所示)。
引物KF30和KF31分别携带HindIII和BamHI限制性酶切位点(粗体序列)。KF30和KF31引物对使得有可能扩增含有orf28c基因大小为大约1.5kb的DNA片段,利用粘粒pSPM36作为模板(参照上面)。将如此获得的1.5kb片段克隆入载体pGEM-T easy(由Promega公司(Madison,Wisconsin,USA)出售)以产生质粒pSPM74。然后用HindIII和BamHI限制性酶消化质粒pSPM74并将所获得的约1.5kb HindIII/BamHI插入部分亚克隆入预先用相同酶消化了的载体pUWL201(参照实施例17.1)。如此所得质粒命名为pSPM75;该质粒包含置于ermE*启动子控制之下的orf28c全部编码序列。
24.2用质粒pSPM75转化菌株OSC2:
通过原生质体转化(T.Kieser等,2000)将质粒pSPM75导入菌株OSC2。原生质体转化之后,通过其硫链丝菌肽抗性筛选这些克隆。然后将这些克隆在含有硫链丝菌肽的培养基上传代培养并通过质粒提取验证了用质粒进行的转化。更加显著地筛选到两个克隆并命名为OSC2/pSPM75(1)和OSC2/pSPM75(2)。
菌株OSC2/pSPM75(2)的样本保藏于国立微生物保藏中心(CNCM)[National Collection of Cultures and Microorganisms]巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏日为2003年10月6日,保藏号为I-3101。
为了测试过量表达orf28c基因对螺旋霉素产量的影响,通过实施例15中所述的技术测试OSC2/pSPM75(1)和OSC2/pSPM75(2)克隆的螺旋霉素产量。与此平行还分析了菌株OSC2的螺旋霉素产量以进行比较。因此有可能观察到质粒pSPM75的存在显著增加菌株OSC2的螺旋霉素产量。这证明orf28c过量表达导致螺旋霉素产量增加并且证实该基因作为调节子的作用。
还通过HPLC分析了OSC2/pSPM75(1)和OSC2/pSPM75(2)克隆的螺旋霉素产量(以与实施例17.2中相同的方式)。与此平行还分析了菌株OSC2的螺旋霉素产量以进行比较。表44中给出了该分析的结果,数据表示为mg每升上清液。结果对应螺旋霉素总产量(通过将螺旋霉素I,II和III的生产量相加获得)。
表43.来源于OSC2的用载体pSPM75转化的菌株的螺旋霉素产量(结果表示为mg/l)。
  菌株     螺旋霉素
  OSC2     50
  OSC2/pSPM75(1)     120
  OSC2/pSPM75(2)     155
因此,观察到质粒pSPM75的存在显著增加菌株OSC2的螺旋霉素产量。这清楚地证明orf28c过量表达对螺旋霉素产量具有正效应。
实施例25:通过其orf8基因已经失活的菌株分析螺旋霉素生物合成中间体的产量:
菌株OS49.107,其中orf8基因通过插入Ωhyg盒而失活,不产生螺旋霉素(参照实施例7和15)。orf8基因编码与几种氨基转移酶呈现相对强相似性的蛋白质并且强烈暗示orf8基因编码负责forosamine生物合成所必需的氨基转移反应的4-氨基转移酶(参照图6)。因此预期螺旋霉素生物合成将阻断于forocidin阶段(参照图7)。因此螺旋霉素非生产菌菌株OS49.107将产生forocidin。
按照上述方法制备菌株OS49.107的上清液样品(参照实施例16,不进行MIBK抽提)并且如上述通过LC/MS进行分析(参照段落20.2和20.3)。在SIM模式下,选择了对应forocidin分子离子的质量558并检测到几个峰。质量558化合物的存在与orf8在forosamine合成中具有作用的假说相一致。
实施例26:通过其orf12基因已经失活的菌株分析螺旋霉素生物合成中间体的产量:
菌株SPM507,其中orf12基因失活,不产生螺旋霉素(参照实施例11和15)。认为orf12基因编码负责forosamine生物合成所必需的脱水反应的3,4-脱水酶(参照图6)。因此预期螺旋霉素生物合成将阻断于forocidin阶段(参照图7)。因此螺旋霉素非生产菌菌株SPM507将产生forocidin。
按照上述方法制备菌株SPM507的上清液样品(参照实施例16,不进行MIBK抽提)并且如上述通过LC/MS进行分析(参照段落20.2和20.3)。在这些条件下,forocidin保留时间为大约12.9分钟。在SIM模式下,选择了对应forocidin分子离子[M+H]+的质量558并检测到几个峰。558处化合物的存在使得有可能验证orf12的产物在螺旋霉素生物合成中具有作用的假说。
然而,forocidin以相对低的量存在并且,在这些条件下,更加显著地观察到了在238nm处有吸收的产物(保留时间是17.1分钟)。LC/MS分析使得有可能确定该化合物的质量,为744.3g/mol([M+H]+=744.3,主要产物)。
为了获得结构,分离上述产物并在上述条件下纯化(参照段落20.1)。然后回收有机相(MIBK)并蒸发干燥。将干燥的提取物溶于水并用庚烷进行抽提。然后通过结合到Oasis HLB 1g柱(Waters SAS,St-Quentinen-Yvelines,France)抽提该水溶液。通过用30/70水/乙腈混合物洗脱回收该化合物。然后将该溶液注射(100μl)入分析柱并在Oasis HLB 1cc 30mg柱(Waters)上回收级分。在使用之前,将Oasis HLB 1cc 30mg柱(Waters)依次用乙腈、然后是水/乙腈混合物(20v/80v)和80/20水/乙腈混合物进行调节。
然后依次用1ml水/乙腈(95/5)和1ml水/氘化乙腈(95/5)洗涤OasisHLB 1cc 30mg柱(Waters),然后用600μl 40/60水/氘化乙腈洗脱。然后将回收的溶液直接通过NMR进行分析。
所得该化合物的NMR谱如下(19312V NMR谱):
CD3CN/D2O中的1H谱(化学迁移ppm):0.92(3H,d,J=6Hz),1.10(1H,未分辨峰),1.14(3H,s),1.17(3H,d,J=6Hz),1.22(3H,d,J=6Hz),1.25(3H,d,J=6Hz),1.40(1H,未分辨峰),1.75(1H,dd,J=12和2Hz),1.81(1H,未分辨峰),1.90(1H,d,J=12Hz),2.05(1H,未分辨峰),2.12(3H,s),2.15(1H,未分辨峰),2.35(2H,未分辨峰),2.45(6H,宽s),2.53(1H,未分辨峰),2.64(1H,dd,J=12和9Hz),2.80(1H,dd,J=9和16Hz),2.95(1H,d,J=8Hz),3.23(2H,未分辨峰),3.34(1H,d,J=7Hz),3.45(3H,s),3.49(1H,未分辨峰),3.93(1H,dd,J=7and 3Hz),4.08(1H,未分辨峰),4.37(1H,d,J=6Hz),4.88(1H,未分辨峰),5.05(2H,未分辨峰),5.65(2H,未分辨峰),6.08(1H,dd,J=8和12Hz),6.40(1H,dd,J=12和9Hz),9.60(1H,s)。
这些实验使得有可能确定该化合物的结构,图38中给出了该结构。实施例27:通过其orf5*基因已经失活的菌株分析螺旋霉素生物合成中间体的产生:
菌株SPM501具有基因型orf6*∷att1Ωhyg+。根据att1Ωhyg+盒插入到orf6*基因的极性效应,有可能确定orf5*基因是螺旋霉素生物合成途径所必需的。具体而言,根据对orf5*基因表达的极性效应,可切除盒插入到orf6*基因编码序列导致螺旋霉素生产完全阻断。然而,一旦切除了插入的盒(并且因此当仅失活orf6*基因时,参照实施例14和15),螺旋霉素I的产生恢复。这证明orf5*基因是螺旋霉素生物合成所必需的,因为该基因的失活导致螺旋霉素产生完全阻断。
orf5*基因编码与几种O-甲基转移酶呈现相对强相似性的蛋白质。认为orf5*基因是参与platenolide生物合成的O-甲基转移酶。为了验证该假说,对从过量生产螺旋霉素的菌株获得的、基因型为orf6*∷att1Ωhyg+的生二素链霉菌菌株进行了LC/MS和NMR分析实验。
按照上述方法制备菌株上清液的样品(参照实施例16,不进行MIBK抽提)并通过上述的LC/MS进行分析(参照段落20.2和20.3)。然而,所用柱子为X-Terra柱(Waters SAS,St-Quentin en-Yvelines,法国),光谱计的锥体电压(cone voltage)设置为380V以获得所分析化合物的发酵。在这些条件下,观察到保留时间为大约13.1分钟的产物。该化合物的质谱与螺旋霉素I的质谱具有表观相似性,但分子离子是829。与螺旋霉素的质量相比有14质量的差异能够解释为:在内酯环4号碳所负荷的氧上缺乏甲基(图39中给出了该化合物的结构)。在829处存在化合物使得有可能确认orf5*在螺旋霉素生物合成中具有作用的假说。利用敏感菌株藤黄微球菌进行微生物学测试,证明了菌株orf6*∷Ωatthyg+所产生的中间体分子(不含甲基的螺旋霉素,图39中给出了该结构)比位置4处具有甲基的螺旋霉素活性弱(弱10倍)。
实施例28:构建新的“可切除盒”:
构建了新的可切除盒。这些盒与实施例9中已经描述的可切除盒非常相似。前者盒与新盒之间的主要不同是在后者中缺乏对应Ω插入子(interposon)末端的序列,该序列包含来源于T4噬菌体的转录终止子。
在不含终止子的盒中,赋予抗生素抗性的基因的两侧是允许切除的attR和attL序列。抗性基因是编码赋予阿泊拉霉素抗性的乙酰基转移酶的aac(3)IV基因。该基因存在于Ωaac盒(GenBank登录号:X99313,Blondelet-Rouault,M.H.等,1997)并通过PCR扩增获得,PCR反应以质粒pOSK1102(参照上面)作为模板,以分别在5′位置含有HindIII限制性酶切位点(粗体)(AAGCTT)的寡核苷酸KF42和KF43作为引物:
KF42:5′-AAGCTTGTACGGCCCACAGAATGATGTCAC-3′(SEQ IDNo.153),和
KF43:5′-AAGCTTCGACTACCTTGGTGATCTCGCCTT-3′(SEQ IDNo.154)。
将所获得的大约1kb的PCR产物克隆入大肠杆菌载体pGEMT Easy,以产生质粒pSPM83。
用HindIII限制性酶消化载体pSPM83。通过纯化从0.8%琼脂糖凝胶上分离HindIII-HindIII片段,然后将其克隆入定位于多种携带不同可切除盒的质粒的attL和attR序列之间的HindIII位点(参照实施例9和图27),以便用仅对应aac基因的HindIII片段替换对应Ωacc的HindIII片段。这使得有可能获得att1aac,att2aac和att3aac盒(根据目的,参照实施例9)。根据aac基因相对attL和attR序列的方向不同,att1aac+,att1aac-,att2aac+,att2aac-,att3aac+和att3aac-是有区别的(按照在实施例9中所采用的相同的惯例)。
实施例29:构建orf28c基因中具有敲除的生二素链霉菌菌株:
利用可切除盒技术失活orf28c基因。通过PCR扩增可切除盒att3aac+(参照实施例28),PCR反应以质粒pSPM101(质粒pSPM101是来源于载体pGP704Not的质粒(Chaveroche等,2000)(Miller VL和Mekalanos JJ,1988),其中att3aac+盒作为EcoRV片段已克隆入pGP704Not中唯一的EcoRV位点)为模板,并使用如下引物:
KF32:
5′CAACCGCTTGAGCTGCTCCATCAACTGCTGGGCCGAGGT ATCGCG CGCGCTTCGTTCGGGACGAA3′(SEQ ID No.155)
和KF33:
5′TGGGTCCCGCCGCGCGGCACGACTTCGACTCGCTCGTCT ATCTGC CTCTTCGTCCCGAAGCAACT3′(SEQ ID No.156)
定位于这些寡核苷酸序列5’末端的39个核苷酸包含对应orf28c基因中序列的序列并且定位于最3’位置的26个核苷酸(上面用粗体加下划线表示)对应可切除盒att3aac+一个末端的序列。将如此所得PCR产物用于转化含有粘粒pSPM36的超重组大肠杆菌菌株DY330(Yu等,2000)(该菌株含有λ噬菌体的exo,bet和gam基因,整合入其染色体,这些基因在42℃时表达,该菌株用于代替大肠杆菌菌株KS272(Chaveroche等,2000))。因此,通过电传孔用该PCR产物转化细菌并通过其阿泊拉霉素抗性筛选这些克隆。提取所得克隆的粘粒并用BamHI限制性酶消化,目的是为了验证如果盒(att3aac+)已经插入orf28c基因,即如果在PCR产物和靶基因的末端之间确实发生了同源重组(Chaveroche等,2000),则所得到的消化谱与预期消化谱相符合。通过本领域技术人员已知的方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够验证该构建体。选择到其中粘粒具有预期消化谱的克隆并将相应粘粒命名为pSPM107。该粘粒是pSPM36的衍生物,其中orf28c已由att3aac+盒打断。盒的插入伴随着orf28c基因中的删除,打断起始于orf28c的第28个密码子。盒后面保留了orf28c的最后137个密码子。
在第一步中,将粘粒pSPM107导入大肠杆菌菌株DH5α,并且然后通过原生质体转化导入生二素链霉菌菌株OSC2。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后将阿泊拉霉素-抗性克隆分别在含有阿泊拉霉素(抗生素B)的培养基上和含有嘌呤霉素(抗生素A)的培养基上传代培养(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对嘌呤霉素敏感的(PuroS)克隆是那些其中已经发生一个双交换事件并含有由att3aac+盒打断orf28c基因的克隆。更加特别的是选择到这些克隆并通过杂交验证了盒打断拷贝对野生型orf28c拷贝的替换。因此,为了证明在所得克隆的基因组DNA中的预期基因座存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3aac+盒的探针进行杂交。通过本领域技术人员已知的任意方法,尤其是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。
更加具体而言筛选到呈现预期特性(orf28c∷att3aac+)的克隆并命名为SPM107。因此该克隆具有基因型:orf28c∷att3aac+并命名为SPM107。考虑到基因的方向(参照图3),没有必要切除盒以研究orf28c失活的效应。orf29与orf28c以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用,尤其是通过同质粒pOSV508进行转化,使得有可能获得在任何时刻去除筛选标记的可能性。
为了测试关闭orf28c基因对螺旋霉素产量的影响,通过实施例15中所述的技术测试菌株SPM107的螺旋霉素产量。因此有可能证明该菌株具有螺旋霉素非生产菌表现型。这证明orf28c基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。
实施例30:构建在orf31基因中具有敲除的生二素链霉菌菌株:
利用可切除盒技术失活orf31基因。通过PCR扩增可切除盒att3aac+,PCR反应以质粒pSPM101为模板并且以寡核苷酸EDR71和EDR72为引物。
EDR71:
5’CGTCATCGACGTGCGGGGAAGACAGAGGTGATACCGATG ATCGC GCGCGCTTCGTTCGGGACGAA3’(SEQ ID No.157)
EDR72:
5’GCCAGCACCTCGTCCAGCTGCTCGACGGAACTCACCCCC ATCTGC CTCTTCGTCCCGAAGCAACT3’(SEQ ID No.158)
定位于这些寡核苷酸序列5’末端的39个核苷酸包含对应orf31基因中序列的序列并且定位于最3’位置的26个核苷酸(上面用粗体加下划线表示)对应可切除盒att3aac+一个末端的序列。
如Chaveroche等(Chaveroche et al.,2000)所述,将如此所得PCR产物用于转化含有质粒pKOBEG和粘粒pSPM36的大肠杆菌菌株KS272(参照图12的原理,质粒pOS49.99将由粘粒pSPM36替换并且所得质粒不再是pSPM17而是pSPM543)。因此,通过电传孔用该PCR产物转化细菌并通过其阿泊拉霉素抗性筛选这些克隆。提取所得克隆的粘粒并用几种限制性酶消化,目的是为了验证如果盒(att3aac+)已经插入orf31基因,即如果在PCR产物和靶基因的末端之间确实发生了同源重组,则所得到的消化谱与预期消化谱相符合。通过本领域技术人员已知的方法,具体而言是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够验证该构建体。选择到其中粘粒具有预期消化谱的克隆并将相应粘粒命名为pSPM543。该粘粒是pSPM36的衍生物,其中orf31已由att3aac+盒打断(参照图12)。盒的插入伴随着orf31基因中的删除,该打断起始于orf31第36个密码子。盒后面保留了orf31最后33个密码子。
通过原生质体转化(Kieser,T等,2000)将pSPM543导入生二素链霉菌菌株OSC2(参照上面)。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后将阿泊拉霉素-抗性克隆分别在含有阿泊拉霉素(抗生素B)的培养基上和含有嘌呤霉素(抗生素A)的培养基上传代培养(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对嘌呤霉素敏感(PuroS)的克隆是那些其中已经发生一个双交换事件并含有由att3aac+盒打断orf31基因的克隆。更加特别的是选择到这些克隆并通过杂交验证了盒打断拷贝对野生型orf31拷贝的替换。因此,为了证明在所得克隆的基因组DNA中的预期基因座存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3aac+盒的探针进行杂交。以通过PCR获得且对应orf31基因编码序列非常大部分的DNA片段作为探针,进行了第二轮杂交。
通过本领域技术人员已知的任意方法,具体而言是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。
更加具体而言筛选到呈现预期特性(orf31c∷att3aac+)的克隆并命名为SPM543。通过两轮杂交,事实上有可能验证att3aac+盒确实存在于该克隆的基因组中并且验证当双重组事件之后,在该克隆的基因组中用由att3aac+盒打断的拷贝替换野生型基因的情况下,确实获得了预期的消化谱。因此该克隆具有基因型:orf31∷att3aac+并命名为SPM543。考虑到基因的方向(参照图3),没有必要切除盒以研究orf31失活的效应。orf32c与orf31以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用,尤其是通过用质粒pOSV508进行转化,使得有可能获得在任何时刻去除筛选标记的可能性。
为了测试关闭orf31基因对螺旋霉素产量的影响,通过实施例15中所述的技术测试了菌株SPM543的螺旋霉素产量。因此有可能证明该菌株具有螺旋霉素非生产菌表现型。这证明orf31基因是生二素链霉菌中螺旋霉素生物合成所必需的基因。
实施例31:构建在orf32c基因中具有敲除的生二素链霉菌菌株:
利用可切除盒技术失活orf32c基因。通过PCR扩增可切除盒att3aac+,PCR反应以质粒pSPM101为模板并且使用以下引物:
KF52:
5′GATCCGCCAGCCTCACGTCACGCCGCGCCGCCTCCCTGAC ATCGC GCGCGCTTCGTTCGGGACGAA3′(SEQ ID No.159).
和KF53:
5′GAGGCGGACGTCGGTACGCGGTGGGAGCCGGAGTTCGACA ATCT GCCTCTTCGTCCCGAAGCAACT3′(SEQ ID No.160).
定位于这些寡核苷酸序列5’末端的40个核苷酸包含对应orf32c基因中序列的序列并且定位于最3’位置的26个核苷酸(上面用粗体加下划线表示)对应可切除盒att3aac+一个末端的序列。
将如此所得PCR产物用于转化含有粘粒pSPM36的超重组大肠杆菌菌株DY330(Yu等,2000)。因此,通过电传孔用该PCR产物转化细菌并通过其阿泊拉霉素抗性筛选这些克隆。提取所得克隆的粘粒并用BamHI限制性酶消化,目的是为了验证如果盒(att3aac+)已经插入orf32c基因,即如果在PCR产物和靶基因的末端之间确实发生了同源重组,则所得到的消化谱与预期消化谱相符合。通过本领域技术人员已知的方法,具体而言是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够验证该构建体。选择到其中粘粒具有预期消化谱的克隆并将相应粘粒命名为pSPM106。该粘粒是pSPM36的衍生物,其中orf32c已由att3aac+盒打断。盒的插入伴随着orf32c基因中的删除,该打断起始于orf32c第112个密码子。盒后面保留了orf32c最后91个密码子。
在第一步中,将粘粒pSPM106导入大肠杆菌菌株DH5α,并且然后通过转化将其导入生二素链霉菌菌株OSC2。转化后,通过其阿泊拉霉素抗性筛选这些克隆。然后将阿泊拉霉素-抗性克隆分别在含有阿泊拉霉素(抗生素B)的培养基上和含有嘌呤霉素(抗生素A)的培养基上传代培养(参照图9)。原则上,对阿泊拉霉素具有抗性(ApraR)并对嘌呤霉素敏感(PuroS)的克隆是那些其中已经发生一个双交换事件并含有由att3aac+盒打断orf32c基因的克隆。更加具体而言是选择到这些克隆并通过杂交验证了盒打断拷贝对野生型orf32c拷贝的替换。因此,为了证明在所得克隆的基因组DNA中存在盒,用几种酶消化所得克隆的总DNA,在琼脂糖凝胶上分离,转移到膜上并与对应att3aac+盒的探针进行杂交。通过本领域技术人员已知的任意方法,具体而言是通过利用适当寡核苷酸的PCR和PCR产物序列分析,也能够进行基因型的验证。
更加具体而言筛选到呈现预期特性(orf32c∷att3aac+)的克隆。因此该克隆具有基因型:orf32c∷att3aac+并命名为SPM106。考虑到基因的方向(参照图3),没有必要切除盒以研究orf32c失活的效应。orf33与orf32c以相反方向定位的事实表明这些基因不是共转录的。另一方面,可切除盒的使用,尤其是通过用质粒pOSV508进行转化,使得有可能获得在任何时刻去除筛选标记的可能性。
为了测试关闭orf32c基因对螺旋霉素产量的影响,通过实施例15中所述的技术测试了菌株SPM106的螺旋霉素产量。因此有可能证明该菌株具有螺旋霉素生产菌表现型。这证明orf32c基因不是生二素链霉菌中螺旋霉素生物合成所必需的基因。
本申请中所述的构建体的列表
缩略语列表:Am:氨苄青霉素;Hyg:潮霉素;Sp:螺旋霉素;Ts:硫链丝菌肽;Cm:氯霉素;Kn:卡那霉素;Apra:阿泊拉霉素。
构建体名称 筛选标记 主要特性 参考文献
pWE15  Am (Wahl等,1987)
pWED1  Am 其中已经删除了4.1kb的HpaI-HpaI片段的pWE15 (Gourmelen等,1998)
pOJ260  Apra 接合的,在链霉菌中不复制 (Bierman等,1992)
pHP45Ωhyg  Hyg pHP45中的Ωhyg盒 (Blondelet-Rouault等,1997)
pKC505  Apra 粘粒 (Richardson MA等,1987)
pIJ486  Ts 链霉菌的多拷贝复制型质粒 (Ward等,1986)
pOSint3  Am pTrc99A中的ptrc-xis-int (Raynal等,1998)
pWHM3  Am,Ts 大肠杆菌/链霉菌复制型穿梭载体 (Vara等,1989)
pKOBEG  Cm (Chaveroche等,2000)
pGP704Not  Am (Chaveroche等,2000)
pMBL18  Am (Nakano等,1995)
pGEM-TEasy  Am 用于克隆PCR产物的大肠杆菌载体 Mezei等,1994
pOS49.1  Am 在BamHI位点具有插入的pWED1 实施例2
pOS49.11  Am pUC19中pOS49.1的SacI片段 实施例2
pOSC49.12  Ch pBC SK+中pOS49.11的XhoI片段 实施例2
pOS49.14  Cm,Hyg 具有由Ωhyg盒打断orf3基因的pOSC49.12 实施例2
 pOS49.16  Apra,Hyg pOJ260中pOS49.14的插入部分 实施例2
 pOS49.28  Cm pBC SK+中pOS49.1的3.7kb BamHI-PstI片段 实施例3
 pOS44.1  Apra,Sp 含有灰浅红黄链霉菌中赋予螺旋霉素抗性的插入部分的pKC505 (Pernodet等,1999)
 pOS44.2  Ts,Sp pIJ486中pOS44.1的1.8kbSau3AI片段 实施例3
 pOS44.4  Am pUC19中pOS44.2的插入部分 实施例3
 pSPM5  Am 在BamHI位点具有生二素链霉菌DNA插入部分的pWED1 实施例3
 pSPM7  Am 在BamHI位点具有生二素链霉菌DNA插入部分的pWED1 实施例3
 pOSK1205  Hyg 其中hyg代替neo的pBK-CMV 实施例5
 pOS49.67  Apra pOJ260中pOS49.1的EcoRI-SacI片段,含有504个核苷酸的内部删除 实施例6
 pOS49.88  Am pUC19中pOS49.1的3.7kbPstI-EcoRI片段 实施例7
 pOS49.106  Am 在orf8中具有hyg的pO49.88(hyg和orf8方向相同) 实施例7
 pOS49.120  Am 在orf8中具有hyg的pO49.88(hyg和orf8方向相反) 实施例7
 pOS49.107  Apra,Hyg pOJ260中pOS49.106的插入部分 实施例7
 pOS49.32  Am,Kn pCR2.1-topO中的orf10内1.5kb片段 实施例8
 pOS49.43  Am,Kn 在orf10中具有hyg的pOS49.32(hyg和orf10方向相同) 实施例8
 pOS49.44  Am,Kn 在orf10中具有hyg的pOS49.32(hyg和orf10方向相反) 实施例8
 pOS49.50  Apra,Hyg pOJ260中pOS49.43的插入部分 实施例8
 pWHM3Hyg  Am,Hyg 其中tsr由hyg替代的pWHM3 实施例10
 pOSV508  Am,Ts pWHM3中的ptrc-xis-int 实施例9
 patt1Ωhyg+  Cm,Hyg pBC SK+中的att1Ωhyg+盒,其中已经删除了HindIII位点 实施例9
 patt3Ωaac-  Cm,Gn pBC SK+中的att3Ωaac-盒,其中已经删除了HindIII位点 实施例9
 pOSV510  Am,Hyg pWHM3Hyg中的propra-Amh 实施例10
 pOS49.99  Am pUC19中pSPM5的4.5kbEcoRI-BamHI片段 实施例10
 pOSK1102  Am,Apra 含有att3Ωaac-盒的pGP704Not 实施例10
 pSPM17  Am,Apra 其中orf2由att3Ωaac-盒打断的pOS49.99 实施例10
 pSPM21  Hyg,Apra 含有pSPM17 EcoRI-XbaI插入部分的pOSK1205(其中orf2由att3Ωaac-盒打断) 实施例10
 pSPM502  Am pMBL18中pSPM7的15.1kb BglII片段 实施例11
 pSPM504  Hyg pOSK1205中pSPM502的插入部分 实施例11
 pSPM507  Hyg,Apra 其中orf12由att3Ωaac-盒打断的pSPM504 实施例11
 pSPM508  Hyg,Apra 其中orf13c由att3Ωaac-盒打断的pSPM504 实施例12
 pSPM509  Hyg,Apra 其中orf14由att3Ωaac-盒打断的pSPM504 实施例13
 pBXL1111  Am 载体pGEM-T Easy中,通过PCR扩增的含有orf6*的1.11kb片段 实施例14
 pBXL1112  Am,Hyg 在删除了orf6*基因120bp后将att1Ωhyg+盒导入orf6*基因编码序列的pBXL1111 实施例14
 pBXL1113  Apra,Hyg pOJ260中pBXL1112的3.7kb PstI插入部分 实施例14
 pSPM520  Am pGEM-T Easy中通过寡核苷酸EDR39-EDR42扩增的PCR片段 实施例17
 pSPM521  Am pGEM-T Easy中通过寡核苷酸EDR40-EDR42扩增的PCR片段 实施例17
 pSPM522  Am pGEM-T Easy中通过寡核苷酸EDR41-EDR42扩增的PCR片段 实施例17
pUWL201  Am,Ts (Doumith等,2000)
pSPM523  Am,Ts 载体pUWL201中质粒pSPM520插入部分的HindIII-BamHI片段 实施例17
pSPM524  Am,Ts 载体pUWL201中质粒pSPM521插入部分的HindIII-BamHI片段 实施例17
pSPM525  Am,Ts 载体pUWL201中质粒pSPM522插入部分的HindIII-BamHI片段 实施例17
pSPM527  Am 在XhoI位点具有阅读框移位的pSPM521 实施例17
pSPM528  Am,Ts 载体pUWL201中质粒pSPM527插入部分的HindIII-BamHI片段 实施例17
pVF10.4 (Vara等,1985;Lacalle等,1989)
pPM803  Ts (Mazodier,P.等,1989)
pGEM-T-pac-oriT  Am pGEM-T Easy中的pac-oriT盒(通过PCR从pVF 10.4和pPM803扩增到) 实施例18
pWED2  Am 从插入到pWED1中的pGEM-T-pac-oriT获得的pac-oriT盒 实施例18
pSPM34  Am 在BamHI位点具有插入的pWED2 实施例19
pSPM35  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM36  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM37  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM38  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM39  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM40  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM41  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM42  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM43  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM44  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM45  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM47  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM48  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM50  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM51  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM52  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM53  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM55  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM56  Am 在BamHI位点具有插入的pWED2 实施例19
 pSPM58  Kn pBK-CMV中pSPM36的大约6kb的PstI-PstI片段 实施例19
 pSPM72  Kn pBK-CMV中pSPM36的大约10kb的StuI-StuI片段 实施例19
 pSPM73  Cm pBC-SK+中pSPM72插入部分的EcoRI-HindIII片段 实施例19
 pSPM515  Am pGEM-T easy中通过EDR31-EDR37扩增的PCR片段 实施例22
 pSPM519  Am,Ts pUWL201中pSPM515的HindIII/XbaI插入部分 实施例22
 pOS49.52  Apra 质粒pKC1218中在ermE*启动子控制下的tylB编码序列 实施例23
 pSPM74  Am pGEM-T easy中通过KF30-KF31扩增的PCR片段 实施例24
 pSPM75  Am,Ts pUWL201中pSPM74的HindIII/BamHI插入部分 实施例24
 pSPM79  Kn pBK-CMV中pSPM36插入部分的大约2.5kb的PstI-PstI片段 实施例19
 pSPM83  Am pGEM-T easy中通过KF42-KF43扩增的PCR片段 实施例28
 pSPM107  Am,Apra 其中orf28c由att3aac+盒打断的pSPM36 实施例29
 pSPM543  Am,Apra 其中orf31由att3aac+盒打断的pSPM36 实施例30
 pSPM106  Am,Apra 其中orf32c由att3aac+盒打断的pSPM36 实施例31
生物材料的保藏
以下生物体根据布达佩斯条约于2002年7月10日保藏在国立微生物保藏中心[National Collection of Cultures and Microorganisms](CNCM),25 rue du Docteur Roux,75724 Paris Cedex 15,法国。
-菌株OSC2,保藏号为I-2908。
-菌株SPM501,保藏号为I-2909。
-菌株SPM502,保藏号为I-2910。
-菌株SPM507,保藏号为I-2911。
-菌株SPM508,保藏号为I-2912。
-菌株SPM509,保藏号为I-2913。
-菌株SPM21,保藏号为I-2914。
-菌株SPM22,保藏号为I-2915。
-菌株OS49.67,保藏号为I-2916。
-菌株OS49.107,保藏号为I-2917。
-含有质粒pOS44.4的大肠杆菌菌株DH5α,保藏号为I-2918。
以下生物体根据布达佩斯条约于2003年2月26日保藏在国立微生物保藏中心(CNCM),25 rue du Docteur Roux,75724 Paris Cedex 15,法国。
-菌株SPM502 pSPM525,保藏号为I-2977。
以下生物体根据布达佩斯条约于2003年10月6日保藏在国立微生物保藏中心(CNCM),25 rue du Docteur Roux,75724 Paris Cedex 15,法国。
-菌株OSC2/pSPM75(2),保藏号为I-3101。
所有出版物和专利在本申请中引用作为参考。
参考文献:
-Altschul SF,Gish W,Miller W,Myers EW,Lipman DJ.局部比对的基础搜索工具.J Mol Biol.(1990).215(3):403-410.
-Altschul SF,Madden TL,Schaffer AA,Zhang J,Zhang Z,Miller W,Lipman DJ.缺口BLAST和PSI-BLAST:蛋白质数据库的新基因配给搜索程序.Nucleic Acids Res.(1997).25(17):3389-402.
-Amann,E.,Ochs,B.和Abel,K.J.在大肠杆菌中用于未融合的和融合的蛋白质表达的紧密调节tac启动子载体.Gene(1988)69(2),301-315.
-Arisawa,A.,Kawamura,N.,Tsunekawa,H.,Okamura,K.,Tone,H.和Okamoto,R.来自耐热链霉菌参与大环内酯抗生素4”-O-酰化作用的两个基因的克隆和核苷酸序列.Biosci.Biotechnol.Biochem.(1993).57(12):2020-2025.
-Arisawa A,Kawamura N,Takeda K,Tsunekawa H,Okamura K,Okamoto R.来自耐热链霉菌编码3-O-酰基转移酶的大环内酯抗生素生物合成基因acyA的克隆及其对于杂交大环内酯抗生素的直接发酵产品的用途.Appl Environ Microbiol.(1994).60(7):2657-2660.
-August,P.R.,Tang,L.,Yoon,Y.J.,Ning,Streptomyces,Mueller,R.,Yu,T.W.,Taylor,M.,Hoffmann,D.,Kim,C.G.,Zhang,X.,Hutchinson,C.R.和Floss,H.G.袢霉素(ansamycin)抗生素利福霉素的生物合成:推导自地中海拟无枝酸菌S699 rif生物合成基因簇分子分析.Chem.Biol.(1998)5(2),69-79.
-Ausubel Fred M.,Brent Roger,Kingston Robert E.,Moore David D.,Seidman J.G.,Smith John A.,Struhl Kevin(Editeurs).分子生物学最新方法,John Wiley & Sons In c.Current Protocols Customer Service,605Third Avenue,9th Floor New York,NY 10158 USA出版(最新版本,2002年3月).
-Baltz RH,McHenney MA,Cantwell CA,Queener SW,Solenberg PJ.转座诱变在产抗生素链霉菌中的应用.Antonie Van Leeuwenhoek.(1997).71(1-2):179-187.
-Bate N,Butler AR,Gandecha AR,Cundliffe E.弗氏链霉菌泰乐菌素生物合成基因簇中的多重调控基因.Chem Biol.(1999).6(9):617-624.
-Bate,N.,Butler,A.R.,Smith,I.P.和Cundliffe,E.泰乐菌素生产菌弗氏链霉菌的mycarose-生物合成基因.Microbiology(2000).146(Pt 1),139-146.
-Bayley C.,Morgan,Dale E.C.,Ow D.W.通过Cre-lox位点专一系统催化形成的转基因植物中基因活性的互换.Plant Mol.Biol(1992).18:353-361.
-Bentley,S.D.,Chater,K.F.,Cerdeno-Tarraga,A.M.,Challis,G.L.,Thomson,N.R.,James,K.D.,Harris,D.E.,Quail,M.A.,Kieser,H.,Harper,D.,Bateman,A.,Brown,S.,Chandra,G.,Chen,C.W.,Collins,M.,Cronin,A.,Fraser,A.,Goble,A.,Hidalgo,J.,Hornsby,T.,Howarth,S.,Huang,C.H.,Kieser,T.,Larke,L.,Murphy,L.,Oliver,K.,O’Neil,S.,Rabbinowitsch,E.,Rajandream,M.A.,Rutherford,K.,Rutter,S.,Seeger,K.,Saunders,D.,Sharp,S.,Squares,R.,Squares,S.,Taylor,K.,Warren,T.,Wietzorrek,A.,Woodward,J.,Barrell,B.G.,Parkhill,J.和Hopwood,D.A.模式放线菌:天蓝色链霉菌A3(2)的全基因组序列.Nature(2002).417(6885),141-147.
-Bibb MJ,Findlay PR,Johnson MW.细菌基因中碱基组成和密码子选择之间的关系及其用于简单并可靠鉴定蛋白质编码序列的用途.Gene.(1984)30(1-3):157-166.
-Bibb MJ,Janssen GR,Ward JM.红霉素链霉菌(Streptomyceserythraeus)中红霉素抗性基因(ermE)启动子区域的克隆和分析.Gene.(1985).38(1-3):215-26.
-Bibb MJ,White J,Ward JM,Janssen GR.缺乏常规核糖体结合位点时翻译红色糖多孢菌ermE基因编码的23S rRNA甲基化酶的mRNA.MolMicrobiol.(1994).14(3):533-45.
-Bierman M,Logan R,O’Brien K,Seno ET,Rao RN,Schoner BE.用于将DNA从大肠杆菌接合转移至链霉菌物种的质粒克隆载体.Gene.1992;116(1):43-9.
-Blondelet-Rouault M-H.,Weiser J.,Lebrihi A.,Branny P.和Pernodet J-L.来源于Ω插入子的抗生素抗性基因盒用于大肠杆菌和链霉菌.Gene(1997)190:315-317.
-Boccard F.,Smokvina T.,J.-L.,Pernodet Fridmann A.,和Gu6rineauM.,链霉菌中参与pSAM2位点专一整合的基因座的结构分析.Plasmid,(1989a).21:59-70.
-Boccard F.,Smokvina T.,J.-L.,Pernodet Fridmann A.,和GuérineauM..与温和噬菌体相关的生二素链霉菌的整合型接合质粒pSAM2.EMBOJ.(1989b)8:973-980.
-Brunelli J.P.,Pall M.L.,设计用于cDNA定向克隆和cre/lox介导的质粒切除的一系列酵母/大肠杆菌λ表达载体.Yeast.(1993)9:1309-1318.
-Camilli A.,Beattie D.T.和Mekalanos J.J.遗传重组作为基因表达报告子的用途.Proc.Natl.Acad.Sci.USA(1994)91(7),2634-2638.
-Campelo,A.B.和Gil,J.A.来自灰色链霉菌IMRU 3570的杀假丝菌素基因簇.Microbiology(2002)148(Pt 1),51-59.
-Carreras C,Frykman S,Ou S,Cadapan L,Zavala S,Woo E,Leaf T,Carney J,Burlingame M,Patel S,Ashley G,Licari P.红色糖多孢菌-催化的6-脱氧红诺霉素B类似物转化为新红霉素产物的生物转化作用.JBiotechnol.(2002).92(3):217-28.
-Chao K.-M.,Pearson W.R.,Miller W.在特定斜角带中比对两个序列.Comput.Appl.Biosci.(1992)8:481-487.
-Chater K.F.越来越多的在产抗生素链霉菌类中通过基因工程增加产量的展望.Biotechnology.(1990).8(2):115-121.
-Chaveroche MK,Ghigo JM,d’Enfert C.在丝状真菌构巢曲霉(Aspergillus nidulans)中进行有效基因替换的快速方法.Nucleic AcidsRes.2000;28(22):E97.
-Church GM,Gilbert W.基因组序列分析.Proc Natl Acad Sci U S A.(1984)81(7):1991-5.
-Churchward G,Belin D,Nagamine Y.与其他通常所用的克隆载体不具有序列同一性的pSC101衍生质粒.Gene.(1984)31(1-3):165-71.
-Comstock,L.E.,Coyne,M.J.,Tzianabos,A.O.和Kasper,D.L.脆弱拟杆菌(Bacteroides fragilis)多糖B生物合成基因座的菌株内变化:菌株638R该区域的特征.J.Bacteriol.(1999).181(19):6192-6196.
-Cox KL,Baltz RH.链霉菌物种中噬菌斑形成的局限.J Bacteriol.(1984)159(2):499-504.
-Dale E.C.,Ow D.W.,通过随后从宿主基因组中去除选择基因进行的基因转移.Proc.Natl.Acad.Sci.USA(1991).88:10558-10562.
-Doumith M,Weingarten P,Wehmeier UF,Salah-Bey K,Benhamou B,Capdevila C,Michel JM,Piepersberg W,Raynal MC.参与6-脱氧己糖生物合成并转移至红色糖多孢菌的基因的分析.Mol Gen基因t.(2000)264(4):477-485.
-Draeger,G.,Park,Streptomyces-H.H.和Floss,H.G.抗生素榴菌素和竹桃霉素脱氧己糖部分生物合成中的2-脱氧作用步骤的机制.J.Am.Chem.Soc.(1999)121:2611-2612.
-Gandecha,A.R.,Large,S.L.和Cundliffe,E.来自弗氏链霉菌基因组tylLM区域的4个泰乐菌素生物合成基因的分析.Geng.(1997).184(2):197-203.
-Geistlich,M.,Losick,R.,Turner,J.R.和Rao,R.N.生二素链霉菌中控制聚酮化合物合酶基因表达的新调控基因的特性.Mol.Microbiol.(1992).6(14):2019-2029.
-Gourmelen A,Blondelet-Rouault MH,Pernodet JL.来自生二素链霉菌由gimA编码的可失活大环内酯的糖基转移酶的特性.AntimicrobAgents Chemother.(1998).42(10):2612-9.
-Huang X.和Miller W.时间-效率、线性-空间局部相似性的算法.Adv.Appl.Math.(1991).12:337-357.
-Hara O和Hutchinson CR.来自生米卡链霉菌、浅青紫链霉菌和天蓝色链霉菌A3(2)的麦迪霉素(MLS)-抗性基因的克隆.J Antibiot(Tokyo).(1990).43(8):977-991.
-Hara O和Hutchinson CR.来自产麦迪霉素的生米卡链霉菌的3-O-酰基转移酶基因.J Bacteriol.(1992).174(15):5141-5144.
-Hoffmeister D,Ichinose K,Domann S,Faust B,Trefzer A,Drager G,Kirschning A,Fischer C,Kunzel E,Bearden D,Rohr J和Bechthold A.NDP-糖共同底物的浓度和酶表达水平影响糖基转移酶的底物特异性:乌达霉素生物合成基因簇脱氧糖生物合成基因的克隆和特性.Chem Biol.(2000).7(11):821-831.
-Hopwood,D.A.在β-内酰胺抗生素中通过遗传工程发现新抗生素的未来可能性.由M.R.J.Salton和G.D.Shockman编辑.New York:AcademicPress.(1981).585-598.
-Hopwood D.A.,Malpartida F.,Kieser H.M.,Ikeda H.,Duncan J.,Fujii I.,Rudd A.M.,Floss H.G.和Omura S.通过遗传工程产生‘杂化’抗生素.Nature.(1985a).314(6012):642-644.
-Hopwood D.A.,Malpartida F.,Kieser H.M.,Ikeda H.和Omura S.(1985b)微生物学(S.Silver编辑).美国微生物协会,Washington D.C.,409-413.
-Houben Weyl,1974,Methode der Organischen Chemie[有机化学方法],E.Wunsch编辑,15-I和15-II卷.
-Hutchinson,C.R.通过产抗生素细菌的遗传工程发现新(杂化)抗生素的展望.Med Res Rev.(1988).8(4):557-567.
-Hutchinson C.R.,Borell C.W.,Otten S.L.,Stutzman-Engwall K.J.和Wang Y.通过产抗生素微生物的遗传工程进行药物发现和研发.J.Med.Chem.(1989)32(5):929-937.
-Ishikawa J,Hotta K.FramePlot:对高G+C含量细菌DNA中通过新的框架分析预测蛋白质编码区域.FEMS Microbiol Lett.(1999)174(2):251-3.
-Kieser,T,Bibb,MJ,Buttner MJ,Chater KF,Hopwood DA.实用链霉菌遗传学.2000.The John Innes Foundation,Norwich UK.
-Kuhstoss等,通过构建杂化聚酮化合物合酶产生新的聚酮化合物.Gene.(1996).183(1-2):231-236.
-Lacalle RA,Pulido D,Vara J,Zalacain M,Jimenez A.分子分析来自白黑链霉菌的编码嘌呤霉素N-乙酰基转移酶的pac基因.Gene.(1989).79(2):375-380.
-Lakso M,Sauer B,Mosinger B Jr,Lee EJ,Manning RW,Yu SH,Mulder KL,Westphal H.在转基因鼠中通过位点专一重组靶向活化癌基因.Proc Natl Acad Sci USA.(1992)89(14):6232-6.
-Li,T.B.,Shang,G.D.,Xia,H.Z.和Wang,Y.G.克隆来自黑暗链霉菌H6的糖相关生物合成基因簇.Sheng Wu Gong Cheng Xue Bao(2001).17(3):329-331.
-Ligon,J.,Hill,S.,Beck,J.,Zirkle,R.,Molnar,I.,Zawodny,J.,Money,S.和Schupp,T.来自纤维素囊菌So ce26的抗真菌聚酮化合物soraphen A生物合成基因簇的特性.Gene(2002).285(1-2),257-267.
-Liu L,Saevels J,Louis P,Nelis H,Rico S,Dierick K,Guyomard S,Roets E,Hoogmartens J.比较螺旋霉素I,II和III微生物学潜能的实验室研究.J Pharm Biomed Anal.(1999).20(1-2):217-24.
-Mazodier P,Petter R,Thompson C.大肠杆菌和链霉菌之间的基因间接合.J Bacteriol.(1989).171(6):3583-5.
-Merrifield RB,1965a,Nature,207(996):522-523.
-Merrifield RB.,1965b,Science,150(693):178-185.
-Merson-Davies,L.A.和Cundliffe,E.来自弗氏链霉菌基因组tyllBA区域的5个泰乐菌素生物合成基因的分析,Moleculor Microbiology.(1994).13(2):349-355.
-Miller VL,Mekalanos JJ.一种新自杀载体及其在构建插入突变中的用途:霍乱弧菌(Vibrio cholerae)中外膜蛋白质的渗透调节和毒力决定簇需要toxR.J Bacteriol.(1988)170(6):2575-83.
-Nakano,Y.,Yoshida,Y.,Yamashita,Y.& Koga,T.一系列pACYC-来源的质粒载体的构建.Gene(1995).162:157-8.
-Nielsen H.,Engelbrecht J.,Brunak S.et von Heijne G.原核和真核信号肽的鉴定和其切割位点的预测.Protein Engineering.(1997).10:1-6.
-Oh SH,Chater KF.环状和线性DNA的变性作用有利于天蓝色链霉菌A3(2)的靶向性整合型转化:与其他有机体可能的相关性.J Bacteriol.1997;179(1):122-7.
-Olano C,Lomovskaya N,Fonstein L,Roll JT,Hutchinson CR.一种用于聚酮化合物抗生素糖基化作用的双质粒系统:ε-紫红霉酮生物转化为紫红菌素D,Chem Biol.(1999).6(12):845-55.
-Omura S,Kitao C,Hamada H,Ikeda H.16元环大环内酯抗生素的生物转化和生物合成.X.在螺旋霉素生物合成的最后步骤使用酶抑制剂:浅蓝菌素.Chem Pharm Bull(Tokyo).(1979a).27(1):176-82.
-Omura S,Ikeda H,Kitao C.来自生二素链霉菌的螺旋霉素I 3-羟基酰基酶的分离和特性.J Biochem(Tokyo).(1979b).86(6):1753-8.
-Omura,S.,Ikeda,H.,Ishikawa,J.,Hanamoto,A.,Takahashi,C.,Shinose,M.,Takahashi,Y.,Horikawa,H.,Nakazawa,H.,Osonoe,T.,Kikuchi,H.,Shiba,T.,Sakaki,Y.和Hattori,M.工业微生物除虫链霉菌的基因组序列:推断其产生次级代谢物的能力.Proc.Natl.Acad.Sci.U.S.A.(2001).98(21),12215-12220.
-Pearson W.R.和D.J.Lipman.用于生物学序列分析的改良工具.Proc.Natl.Acad.Sci.USA 1988,85:2444-2448.
-Pearson W.R.使用FASTP和FASTA进行快速和灵敏的序列比较.Methods in Enzymology.1990,183:63-98.
-Pernodet JL,Simonet JM,Guerineau M.在生二素链霉菌不同菌株中的质粒:质粒pSAM2的游离和整合形式.Mol Gen Genet.(1984);198(1):35-41.
-Pernodet JL,Alegre MT,Blondelet-Rouault MH,Guerineau M.在生产微生物生二素链霉菌中,对螺旋霉素的抗性涉及到至少两种不同的机制.J Gen Microbiol.(1993);139(Pt 5):1003-11.
-Pernodet JL,Fish S,Blondelet-Rouault MH,Cundliffe E.通过使用特定删除的浅青紫链霉菌抗生素敏感菌株赋予大环内酯-lincosaide-链阳性菌素B抗性表现型.Antimicrob Agents Chemother.(1996),40(3):581-5.
-Pernodet JL,Gourmelen A,Blondelet-Rouault MH,Cundliffe E.在螺旋霉素生产菌生二素链霉菌中由srmA赋予对螺旋霉素的非必需核糖体抗性.Microbiology.(1999),145(Pt 9):2355-64.
-Pfoestl,A.,Hofinger,A.,Kosma,P.和Messner,P.嗜气热硫胺素芽孢杆菌L420-91T中dTDP-3-乙酰胺-3,6-二脱氧-α-D-半乳糖的生物合成.J.Biol.Chem.(2003),278(29):26410-26417.
-Rao RN,Richardson MA,Kuhstoss S.用于克隆和分析链霉菌DNA的粘粒穿梭载体.Methods Enzymol.(1987);153:166-98.
-Raynal A,Tuphile K,Gerbaud C,Luther T,Guerineau M,和Pernodet JL.染色体用于pSAM2插入位点的结构:在大肠杆菌中的功能分析.Molecular Microbiology(1998)28(2)333-342.
-Redenbach,M.,Kieser,H.M.,Denapaite,D.,Eichner,A.,Cullum,J.,Kinashi,H.和Hopwood,D.A.一组有序粘粒和8Mb天蓝色链霉菌A3(2)染色体的详细遗传图谱和物理图谱.Mol.Microbiol.(1996).21(1):77-96.
-Richardson MA,Kuhstoss S,Solenberg P,Schaus NA,Rao RN.用于链霉菌类的一种新的穿梭粘粒载体pKC505:其在从生二素链霉菌文库中克隆三个不同螺旋霉素-抗性基因的用途.Gene.(1987);61(3):231-41.
-Robinson,J.A.微生物中次生代谢的酶.Chem Soc Rev.(1988).17:383-452.
-Russell SH,Hoopes JL,Odell JT.从植物基因组进行直接的转基因切除.Mol Gen Genet.(1992).234(1):49-59.
-Sambrook J,Frisch EF,Maniatis T.分子克隆:实验指南第二版.ColdSpring Harbor Laboratory Press,Cold Sprmg Harbor,New York USA(1989).
-Schoner B,Geistlich M,Rosteck P Jr,Rao RN,Seno E,Reynolds P,Cox K,Burgett S和Hershberger C.大环内酯-抗性决定簇和ATP-结合转运蛋白质的序列相似性.Gene.(1992).115(1-2),93-96.
-Sezonov G,Hagege J,Pernodet JL,Friedmann A和Guerineau M.作为pSAM2中复制控制基因及生二素链霉菌整合元件的pra的特性.MolMicrobiol.(1995).17(3):533-44.
-Sezonov G.,Blanc V.,Bamas-Jacques N.,Friedmann A.,Pernodet J.L.和M.Guerineau,通过过量表达始旋链霉菌生物合成基因使抗生素前体完全转化为普那霉素IIA,Nature Biotechnology.(1997)15:349-353.
-Sezonov G,Possoz C,Friedmann A,Pernodet JL,Guerineau M.来自链霉菌整合元件pSAM2的KorSA是一种中心转录抑制子:靶基因和结合位点.J Bacteriol.(2000).182(5):1243-50.
-Simon R.,Priefer U和Pühler.用于体内遗传工程的一种广谱宿主范围可动系统:革兰氏阴性细菌中的转座子诱变.Bio/Technology(1983).1:784-791.
-Simon等,用于根瘤菌(rhizobia)和其他革兰氏阴性细菌的遗传分析和操作的质粒载体,在A.Weissbach,和H.Weissbach(编辑)的酶学方法,118卷,Academic Press,Inc.,Orlando,1986一书中的640-659页.
-Summers,R.G.,Donadio,Staver,M.J.,Wendt-Pienkowski,E.,Hutchinson,C.R.和Katz,L.对红色糖多孢菌中红霉素生物合成基因簇中涉及L-mycarose和D-红霉脱氧糖胺产生的基因的序列分析和诱变Microbiology(1997).143(Pt 10):3251-3262.
-Van Mellaert L,Mei L,Lammertyn E,Schacht S,Anne J.噬菌体VWB基因组对委内瑞拉链霉菌的位点专一整合和基于VWB的整合载体的构建.Microbiology.(1998).144(Pt 12):3351-8.
-Vara J,Lewandowska-Skarbek M,Wang YG,Donadio S,HutchinsonCR.红色糖多孢菌(红霉素链霉菌)中控制红霉素生物合成途径中脱氧糖部分的基因的克隆.J Bacteriol.(1989).171(11):5872-81.
-Vara J,Malpartida F,Hopwood DA,Jimenez A.来自白黑链霉菌的嘌呤霉素N-乙酰基转移酶基因在浅青紫链霉菌和大肠杆菌中的克隆和表达.Gene.(1985).33(2):197-206.
-Wahl,G.M.,K.A.Lewis,J.C.Ruiz,B.Rothenberg,J.Zhao,和G.A.Evans.用于快速基因组步移、限制性酶图谱和基因转移的粘粒载体.Proc.Natl.Acad.Sci.USA(1987).84:2160-2164.
-Waldron,C.,Matsushima,P.,Rosteck,P.R.,Broughton,M.C.,Turner,J.,Madduri,K.,Crawford,K.P.,Merlo,D.J.和Baltz,R.H.刺糖多孢菌(1)中spinosad生物合成基因簇的克隆和分析.Chem.Biol.(2001)8(5):487-499.
-Walczak RJ,Hines JV,Strohl WR,Priestley ND.,通过重组DoxA,一种来源于链霉菌菌株C5的P450-单加氧酶,对蒽环霉素类似物desacetyladriamycin的生物转化作用.Org Lett.(2001).3(15):2277-9.
-Wang,Z.X.,Li,S.M.和Heide,L.利尻链霉菌DSM 40489香豆霉素A(1)生物合成基因簇的鉴定.Antimicrob.Agents Chemother.(2000)44(11),3040-3048.
-Ward,J.M.,Janssen,G.R.,Kieser,T,Bibb,M.J.,Buttner,M.J.&Bibb,M.J.使用源于Tn5的氨基糖甙磷酸转移酶作为指示剂,用于链霉菌的一系列多拷贝启动子探针质粒载体的构建和表征.Mol Gen Genet(1986).203:468-478.
-Wehmeier UF.新的允许在XGal板上进行兰-白斑筛选的多功能大肠杆菌-链霉菌穿梭载体.Gene.(1995).165(1):149-150.
-Wilms B,Hauck A,Reuss M,Syldatk C,Mattes R,Siemann M,Altenbuchner J.使用一种基于大肠杆菌启动子的表达系统进行高细胞密度发酵以产生L-N-氨甲酰基酶.Biotechnol Bioeng.(2001).73(2):95-103.
-Worley K.C.,Wiese B.A.,和Smith R.F.BEAUTY:将多种生物学信息资源与序列相似性查找结果相结合产生的一种加强型基于BLAST的搜索工具.Genome Research(1995).5:173-184.
-Wu K,Chung L,Revill WP,Katz L和Reeves CD.吸水链霉菌子囊霉素变种(ATCC 14891)的FK520基因簇含有用于罕见聚酮化合物延伸单位生物合成的基因.Gene.(2000).251(1):81-90.
-Xue Y,Zhao L,Liu HW和Sherman DH.委内瑞拉链霉菌中用于大环内酯抗生素生物合成的基因簇:代谢多样性的体系结构.Proc Natl AcadSci USA.(1998).95(21):12111-12116.
Yu D,Ellis HM,Lee EC,Jenkins NA,Copeland NG et Court DL.一种用于在大肠杆菌中进行染色体工程的有效重组系统.Proc Natl Acad SciUSA.(2000).97(11):5978-83.
                                 序列表
<110>安万特医药股份有限公司
    科学研究国家中心
<120>参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用
<130>螺旋霉素生物合成(2)
<140>
<141>
<150>FR0212489
<151>2002-10-08
<160>139
<170>PatentIn版本2.1
<210>1
<211>30943
<212>DNA
<213>生二素链霉菌(Streptomyces ambofaciens)
<400>1
gaattcggca attcccgggg cgccgggaaa ccggcacgcc attccgacca cggcaacggc 60
gtcggaccgg tcgtcactgc gggaaatcgc gagttctcca gacacctgca tccctcatat 120
gttcgccgta ccacgccgtg gcttttctgc cttttcttga tcttcccgag cgtacagcgg 180
gcgaactgcc gggcgacagg aacggccggt gaacgacaat caattgtgtc aagttcggag 240
attgtccacc gattctcgtc accggagacg gcgcgggatc atgcgggacc acacggcatc 300
gcaccaggtc cgcagggtcg gcgctccgac gtcccggccg gtcgcgcact ccggtgacct 360
gcacgcggag tcctgggcga gcggagaaga tttcagtacc tcgcggcgcg ggacaaccac 420
ttcgcgacga atatgtcagg tctccccgag cggtccgtgc cgccccgccc tgacccgtcc 480
gcgcccgtcc cgctccgccc cggtcgtcat ctcggccgga atttcagtcg gcagctcatt 540
gtgtcaggtt cgccttgccg acattctccg gagattccta agctctgccg gtaaccggga 600
ccggaaccac cgtgccgcgc gttcggtcca cacaccgctt ttcgaggagt ccgactgatg 660
ggtgaggccg tgacgggacc gatggagctg agcaaggacg cggacgcccg ggggctgctt 720
gagtggttcg cgtacaacag gacgcgtcat ccggtgttct gggacgagac ccgacaggcg 780
tggcaggtct tcggctacga cgactacgtg acggtgtcga acaacccgca gttcttctcc 840
tcggacttca acatggtgat gccgacgccg cccgaactgg agatgatcat cggtccgggc 900
acgatcggcg cgctggaccc gcccgcgcac ggaccgatgc gcaagctggt gagccaggcg 960
ttcacccccc gacggatcgc ccggctggag cccagggtgc gcgcgatcac cgaggagctc 1020
ctggacaagg tggggcagca ggacgtcgtc gacgccgtgg gtgacctgtc ctacgcgctg 1080
ccggtcatcg tgatcgccga actgctgggc atacccgccg gcgaccgtga cctgttccgg 1140
gagtgggtcg acaccctgct gacgaacgag ggcctggagt acccgaacct cccggacaac 1200
ttcaccgaga cgatcgcgcc cgcgctcaag gagatgaccg actacctcct gaagcagatc 1260
cacgccaagc gggacgcgcc cgccgacgac ctggtcagcg ggctggtcca ggcggagcag 1320
gacggccgcc ggctgaccga cgtcgagatc gtcaacatcg tcgcgctgct cctgacggcg 1380
gggcacgtct cctccagcac cctgctcagc aacctgttcc tggtcctgga ggagaacccg 1440
caggcgctgg aggacctgcg ggccgatcgc tccctggtgc ccggcgcgat cgaggagacg 1500
ctgcgctacc gcagcccctt caacaacatc ttccggttcg tcaaggagga caccaccgtc 1560
ctcggtccgc tcatggagaa gggccagatg gtgatcgcct ggagccagtc cgccaaccgg 1620
gacccccggc acttcccgga cccggacacc ttcgacatcc gccgctcgga cggcacccgg 1680
cacatggcct tcgggcacgg catccaccac tgcctgggtg ccgccctcgc ccgcctggag 1740
ggcaaggtca tgctcgaact cctcctggac cgggtccaag gcttccgcat cgaccacgag 1800
cacaccgtgt tctacgaggc cgaccagctc actccgaagt acctgcccgt ccgggtcgac 1860
tggaactgaa cccgagggtc tcgtcccgga gtccagggcc gtcccgagcc ggccctggac 1920
ctcacgaccg cccgataagg agcgccgcca tcgccgagaa cacagccgag ctccctgccc 1980
ggcgggtcgg caggatcaag ccgtgccggc tgatcaggct cgagcagcac atcgacccgc 2040
gcggcagcct ctccgtgatc gagtccggcg tgaccgtgga cttccccgtc cgacgcgtct 2100
actacatgca tggccagacc cagtcctctc ccccgcgcgg cctgcacgcg caccgcaccc 2160
tggaacaact cgtcatcgcc gtccacggcg ccttctccat caccctcgac gacggcttcc 2220
agcacgccac ctaccgtctg gacgaacccg gagccggact ctgcatcggc cccatggtct 2280
ggcgcgtcct gaaggacttc gaccccgaca ccgtggccct ggtcctcgcc tcgcagcact 2340
acgaggagtc cgactactac cgcgactacg acaccttcct gcatgacgca cggagcctca 2400
catgaccatc cccttcctcg acgcgggcgc cggctaccgg gagttgcgag ccgagatcga 2460
cgcggccctg cagcgggtgt ccgcctccgg ccgctatctg ctcgacgcgg aactcgcggc 2520
cttcgaggag gagttcgccg cgtactgcga caacgaccac tgtgtggcgg tgggcagtgg 2580
ctgcgacgcg ctggagctgt ccctgcgggc gctggacatc ggtcccgggg acgaggtggt 2640
ggtgcccgcg cacaccttca tcgggacctg gctggccgtg tccgctaccg gggcacggcc 2700
ggtggccgtc gacccgacgc cggacgggct ctccctcgac ccggcgctgg tggaggcggc 2760
gctcacccct cggaccagag ccctgatgcc ggtgcacctg cacgggcacc cggccgacct 2820
cgacccgcta ctggcgatcg ccggacggca cggcctggcc gtggtcgagg acgccgcgca 2880
ggcccacggc gcccgttacc ggggccgcag gatcggctcg ggccacgtgg tcgcgttcag 2940
cttctacccc ggcaagaacc tcggcgccat gggggacggc ggcgcggtgg tcacgggtga 3000
ctccggtgtg gccgagcgga tccggttgct gcgcaactgc ggctcgcggg agaagtaccg 3060
gcacgaggtg cgctcgaccc actcccggct cgacgagttc caggcggccg tgctgcgggc 3120
caaactgccg cggctcgacg cgtggaacgc ccgccgggcc ggcacggccg aacggtacgg 3180
gcgggccctg ggtccggtac cgcagatcgc cgtcccggtc accgctccct gggccgaccc 3240
ggtgtggcac ctgtacgtga tccgctgcgc ggagcgcgac gagctgcgcc gccggctgga 3300
acgagccggg gtccagaccc tgatccacta ccccgtgccc ccgcaccggt ccccggccta 3360
cgccgacgac ccggccggcg caccggcggg gacccacccg ctcagtgagc gcctggcggc 3420
gcagagcctc agccttcccc tgggaccgca cctcggggag gacgaggccc gcgccgtcgt 3480
ggcggcggtc cgggcggcgt ccgcagggct ggcggcgtac ccgacgccgg acggccagcg 3540
ttttcctcta gtgacggaga aacgatgacc gaggtcatgt cagggcgtcc cggaatgaaa 3600
gggatcatcc tcgcaggcgg cggagggacc cgcctacgcc ccttgaccgg cacgctgtcc 3660
aagcaactgc tgcccgtcta cgacaagccg atgatctact acccgctgtc cgtcctgatg 3720
ctgggcggca tccgcgagat cctcgtcgtc tcctccaccc agcacatcga gctgttccag     3780
cggctgctgg gcgacggctc ccgcctcggc ctcgacatca cctacgccga acaggccgag     3840
cccgagggca tagcgcaggc catcaccatc ggcaccgacc acatcggcga ctcaccggtc     3900
gcgctcatcc tgggcgacaa catcttccac ggccccggct tctcggccgt gctccagggc     3960
agcatccgcc acctcgacgg ctgtgtgctg ttcggctacc cggtcagcga cccgaagcgc     4020
tacggcgtcg gcgagatcga cgaccagggc gtactgctgt ccctggagga gaaaccggcc     4080
cggccccgct ccaacctcgc cgtcaccggc ctctacctct acgacaacga cgtggtcgac     4140
atcgccaaga acatccggcc ctcggcgcgc ggcgaactcg agatcacgga cgtcaacagg     4200
acctacctgg agcagaaacg cgcccggctc atcgaactgg gccacggctt cgcctggctc     4260
gacatgggca cccacgactc cctcctccag ggcggccagt acgtccagct catcgagcag     4320
cgccagggag tgcggatcgc ctgcatcgag gagatcgccc tgcgcatggg cttcatcgac     4380
gccgacaccc tccaccggct cggccgcgaa ctgggcacct ccggatacgg cgcgtacctg     4440
atggaggtgg ccacccgtgc aggcaccgaa tgagacgccg cgccggcccg cccgctccgc     4500
cggccgacgg ccgccggccc ggatcctcgt caccgggggc gccggcttca tcggctcgcg     4560
cttcgtgaac gcgctgctgg acggctccct gccggagttc ggcaaacccg aggtgagggt     4620
gctcgacgcg ctcacctacg cgggcaacct ggccaatctg gccccggtgg gcgactgtcc     4680
ccggctgcgg atcttcccgg gggacatccg cgaccgcggc gcggtcaccc aggcgatggc     4740
gggggtcgac ctggtggtgc acttcgcggc cgagtcgcac gtggaccgct cgatcgacga     4800
cgccgacgcc ttcgtgcgca ccaacgtgct gggcacccag gtcctcctcc aggaggcact     4860
ggccgtacgc cccgggctgt tcgtgcacgt ctcgacggac gaggtgtacg gctccatcga     4920
ggaggggtcc tggcccgagg agcacccgct gaaccccaac tcgccctacg ccgcctcgaa     4980
ggcgtcctcc gacctgctgg cgctggccca ccaccgcacg cacggactgc cggtgtgcgt     5040
cacccgctgc tccaacaact acgggcccta ccagtacccg gagaagatca tcccgctgtt     5100
caccagcagc ctcctcgacg gcgggaccgt cccgctctac ggggacggcg gcaaccggcg     5160
cgactggctg cacgtggacg accactgccg gggcatcgcc ctggtggccc ggggcggccg     5220
gcccggcgag gtctacaaca tcggcggcgg caccgagctg agcaacgtcg agctcacgga     5280
gcgtctgctg aaactgtgcg gagccgactg gtcggcggtg cggcgggtgc ccgaccgcaa     5340
gggccacgac cggcgctact ccgtcgacta caccaagatc gcggacgagc tgggttacgc     5400
gccgcggatc accatcgacg aagggctgga gcggaccgtg cactggtacc gggagaaccg     5460
cgcgtggtgg gcgcccgcga agagggggcg atgacggtga cgaccgcatc cgtggacccg     5520
ctcgacctgt ggctccgccg gtaccagccg tccgcgtcac ccgccgtccg gctggtgtgc     5580
ttcccgcacg cgggcggctc ggcgagttcg ttcctgccgt tcacccggca gctgccggac     5640
cggatcgagg tcgtggccgt ccagtacccc gggcgccagg accgcaggag cgaaccgctg     5700
gtcgacacca tcgagggact ggccgagccc ctggccggcc tgctggaggc gcaggccggc     5760
cccccggtgg tgctgttcgg gcacagcatg ggcgcgctgg tggcctacga ggtcgcccgc     5820
gcgctccagc ggcggggagc ggctccggtg cgcctggtgg tctccgggcg ccgggccccc     5880
gccgtcgacc ggccgatgac cgtgcacctc tacgacgacg accggctggt cgaggaactc     5940
cgcaagctcg acggcaccga cagccaggtg ttcgccgatc cggagctgct ccggctggtg     6000
ctgcccgtga tccgcaacga ctaccgggcc gtggcggcct acgcccaccg cccgggggcg     6060
ccgctggact gccccctcac cgtgttcacc ggcgccgacg accccaccgt gaccgcggcc     6120
gaggcggcgg cctggcacga ggcggcggcg tccgacgtcg agacgcgcac cttccccggt     6180
ggccacttct tcccgtacca gcggaccgcg gaggtgtgcg gggccctggt cgacacgctc     6240
gagccgctgc tgtcggccgg gacgcgcggt gtccggcggg tccgcccggg gtgacgtggg     6300
cacggtcgag tacgccgtcc accggcgtac cgcggaacgg gtgagggtct ccgccgacac     6360
cctggacagc ccggtcaccg cgctggcgga ggtgccccgc tggctggagg aataccaccg    6420
ggcgcaccgc ttccacgtcg agccgatccc cttcgaccgg ctccggcggt ggtccttcga    6480
gccgggcacc ggcgacctgc ggcacgagac gggccgcttc ttctccgtgg aggggctgcg    6540
caccagctcg gacgccgatc cggtcgcccg tgtccagccg atcatcgtgc agcccgaggt    6600
ggggctgctc ggcatcctgg cccgggagtt cgacggggtg ctgcacttcc tgatgcaggc    6660
caaacccgag cccggcaacg tcaacgggct gcagatctcc cccacggtgc aggccacgcg    6720
cagcaacttc gacgaggtgc accacggccg gtccaccccg ttcctcgacc acttcatcca    6780
ccgccccggc cgccgggtcc tgatcgacag catccagtcc gaacagggcg actggttcct    6840
gcacaagcgc aaccgcaaca tggtcgtcga gatcgacacc gacatcgagg ccgacgccgc    6900
gttccgctgg ctgaccctcg ggcagatccg ccggctgatg ctccaggacg acctcgtcaa    6960
catggacacc cgcagtgtgc tggcctgtct gcccaccgcg cacggcacgc ccgacgacgg    7020
tgacgactcc ttcccggcgg cgctgcgccg ctccctctac ggggagaccg cgccgttgca    7080
cgatctgcac gccatcacca gctgcctcac cgacgtccgg gcgctgcggg tgctgcgcca    7140
gcagagcgtg ccgctcgacg acgcccggcg ggacggctgg gagcggaccg ggagcgcgat    7200
ccggcatcgc agcggcaggc atttcgagat catggcggtg gaggtgaccg cggagcgccg    7260
tgaagtggcc tcgtggaccc agccgttgct gcgcccgtgc tcgcagggac tggcggccct    7320
gatcacccgg cggatcaacg gggtgctgca cgccctggtg gcggcgcggt cggaggtcgg    7380
cacgctcaac gtcgccgagt tcggaccgac cgtccagtgc cggcccgacg aggcggacgg    7440
ccagtcgccc ccgtacctgg accgggtgct gacggccgga gccgaccgcg tccgctacga    7500
cgtggtgcag tcggaggagg gcgggcgctt ctaccacgcg cgcaaccgct atctggtggt    7560
cgaggcgggg ccggagctcg acacgggctg cccgcccggc ttctgctggg ctaccttcgg    7620
ccagctcacc gaactgctcg cgcacggcaa ctatctcaac gtcgaactcc gcaccctcat    7680
ggcgtgcgca cacgcctcct actgaatggt cacgaaagct gcaccgcgcg ggagaatcgg    7740
cagcgcgcca ccggccggcc ggcacccgga aggtaaagcg ccgttctccc gcatcggcgc    7800
cctgcgggaa acggcggaac ggccggcccg gaccgcgcgc aattcccggc gggacacggt    7860
gggagcccgc acgaggaacc gctttccccg ccttcggtgc gcccggccgc gggaccaccc    7920
ccgcctcccg gccgggccgc ggaatacgac gggggcggcc gaggacattc ctttcccgcc    7980
tccggaaaag cgcgccccga gggcccccga atgccgggcg ggacggacgg cgactgcgcg    8040
cggacggcgg cccggcgtcg aacgcacctg cccgagtccg gacgagacag cgcgacgcga    8100
gaggcgaaaa tgatcaatct cttccagccc cagatggggg ccgaggaact ggcggcggtg    8160
tccgaggtct tcgacgacca atggctcggt cacggacccc ggaccgcggc gttcgagtcc    8220
gcgttcgccg agcacctcgg ggtcggcccc gagcacgtcg tcttcctcaa ctcgggcacc    8280
gccggcctct tcctggccct ggagtcgctc ggcctgcggc ccggcgacga ggtcgtgctc    8340
ccctcgccca gcttcctcgc cgcggcgaac gccgtacagc tctcgggagc gcgcccggtg    8400
ttctgcgaca ccgacccgcg gacgctgaac cccgccctgg agcacatcga ggcggccgtc    8460
accccgcgca ccagggccgt catcgcgctc cactacggcg gccaccccgg cgacatcgtg    8520
cgcatcgccg agcgctgccg ggagcggggc atcaccctga tcgaggacgc cgcgtgctcc    8580
gtggcctccc gcgtcgacgg ccgaccggtc ggcaccttcg gcgacctcgc catgtggagc    8640
ttcgacgcca tgaaggtcct ggtcaccggc gacggaggga tgatctacgt caaggacccc    8700
ggggcggccg cccggatccg gcgcctcgcc taccacggcc tcacgcggtc cagcggcctg    8760
ggatacgcca gggtctcggc gcgctggtgg gagatggacg tccccgaacc gggccgccgc    8820
gtcatcggga acgacctcac cgcggccatc ggcgcggtcc agttgcgccg gcttcccggc    8880
ttcgtggccc gccgcaggga gatcgtcgcc ctgtacgaca gcgaactgag ctcgctggag    8940
ggcgtgctga caccgcccgc gccacccgcg gggcacgagt ccacgcacta cttctactgg    9000
atccagctgg cccccggcgt ccgggaccgg gtggcacgcg acctgctcac cgacggcatc    9060
tacaccacct tccgctacgc acctctgcac aaggtgcccg cctacggcca caccggaggc    9120
gaactgcccg gcgtggagcg ggcgtccgaa cggaccctgt gcctgcccct gcaccccggc    9180
ctgtcggacg ccgacgtccg caccgtcgtg tcctccctgc gcagagccct gagcgccgcg    9240
gatccggccc ccgcctgacg cgcgcacgcg ccacggcccc tgtcccggcg gtgaccgccg    9300
ggacaggggc cgtggcgcgt cctgcggacg gtccgggcca ccccgccgtc ccgtcggtgc    9360
gtcagcgacg cgtgccgagg aagaagcccg gtgagccctc gcccgtcacg acgtactcga    9420
cgtccaggcc ggccttgcgg tacgcggcct cgtactccgc acgcgagaac agcgtgaggt    9480
agtccacctc gctgcggtgc cggatgccct ccgcggtgtg cgcgatcagg tagtggatct    9540
ccatccgggt ccgcccgccc tcccgggtcg agtgggagac acgggcgacg ccctggtcgc    9600
ccggtgccgt ccgcagggcg tgggtggaga cgtggccgtc caggaaggtg tcggggaagt    9660
accacggttc gacggccagg acaccgtccg cggtcaggtg ccgcgccatg gcggcgacgg    9720
cgtcctccag gtcggccgtg gtctccaggt acccgatcga gctgaacatg cagaccacgg    9780
cgtcgaacgt ctcgccgagg tcgaacgccc gcatgtcacc gcggtggagg gtgacgccgg    9840
ggagccgctc ctcggcgcgg gccgccatcc actcggacag ctccaggccg ctcacgcggt    9900
cgtagagctt ggcgaaggcc tccaggtggg taccggtgcc gcacgcgatg tcgagcaggc    9960
tggccgcgtc cggcgtacgt tcccggatca ggtcggtgac ccgggcggcc tcacccgcgt   10020
agtccttgcg gtcctggtag agcaggtcgt agacctcggc ggcactgtcg ttctcgtaca   10080
tgggaatcct ccgggccgtg aagggggaac cgtgggtctg tcgaagagga gtgcgccgtg   10140
cgctcggggc gggggcggcc tgccgccggc ccctcgcgat gatctccgta cggacaccca   10200
acagttcacg ccgagccggg gtcaaggaac gacggggtgg tcagtcaagt cgggcgctcc   10260
gcccccgggg cggggcgcgc cggcgacgcg cacggattcg gccaaccggt tgctcgttcc   10320
gccggaaatc acggtgtggc ccccgggcca ccgggtagct tatgcctcgt tcaccgcagc   10380
ggttgaagag gcagccttca accccggccc ggcctttatg gaattcattt ccaccgtgcc   10440
gcaacaccca ctgaaggacg gccggatatc ggccatgaag ccccggcctt tcagccaggc   10500
accctctctt gtcgaataga gtatgtcctc cgctgaagcc gccgaagacg gacgaagggg   10560
acgaacggtc acctcggtcg atctagacgg aatccttgaa agcgtaatag cctgtcaatg   10620
ctttggtaaa gcacagggat gggggtgcct gcgggatgag tgacctgggt tctggtgaag   10680
aagggtccga agaagacgag tcggacgacg cactcgcctt cctcgagttc atcgcccggt   10740
cggcaccacg gagcgaatac gaccggctca tggcccgcgc cgaacgctcg ggcgccgacg   10800
aggaccggat gcgccgactg gagcgcttca accggctcgc cctcaccgcg cagtcgatga   10860
tcgagtaccg ccgcgaccgg gaggcggagc tcgcggccct ggtcgacgcc gcgcacgagt   10920
tcgtcgccgc ccggcggggc aaggacctgc tggagtccat cgcccgcaga gcacggctgc   10980
tgctgaagct ggacgtctcc tacgtcggcc tgcacgagga ggaccggccc ggcacggtgg   11040
tgctgagcgc cgacggcaac gcggtcaagg tcgccgagag ctaccggctg ccggccgacg   11100
gcggactggg cgccatggtg cgcacctgcc gcgctccctt ctggaccccg gactacctcg   11160
gggacaacag cttcacgcac gtcgaggccg tcgacgacat cgtccgcgcc gaaggcctgc   11220
gcgcggtcct ggccgtcccg ctgtgcgccg ggggcgaacc gatgggggtc ctctacgtcg   11280
ccgaccgtca ggtgcggcat ctgaccccca acgaggtcac cctgctgtgc tcgctcgccg   11340
atctggccgc ggtggcgatc gagcgcaacc ggctggtcga ggagctccac gacaccatcg   11400
ggcaactgcg ccaggacatc ggcgaggccc gcaccgccct cgcgcgcacc cgcaggtccg   11460
ccgacctcca gtcgcacctg gtcacgcagg tgatggacag gcgcggcgcc gactcgttac   11520
tcgcgacggc cgccgaggcg ctcggcggcg gagccggcct gtgcagcccg ctcgggcgcc   11580
cgctcgccga gtacgggacc ctgcgccccg tcgcccccac ggaactgcgc gcggcgtgcc   11640
gccgggccgc cgagaccggc cggcccacct ccgtggcccc gggggtctgg acggtgcccc   11700
tgcttcccgg gggcaacgcc ggcttcctgc tgaccgacct cggtccggac gcggaccaca   11760
ccgccgtccc cctgctcccg atggtcgccc gcaccctcgc gctgcacctg cgcgtccagc   11820
acgacgactc ccccaaggcg cagagccacc aggagttctt cgacgacctg atcggggcgc   11880
cccgctcacc cacgctcctc agggaacgcg ccctgatgtt ctccctcagc ttccgccgcc   11940
cgcacgtggt gctggtggcg gacggacccc gcgggacctc gccgcggctg gaggcctccg   12000
gcgccgacta cgcgaaggag ctcggcgggc tgtgcagcgt gcgggacggc gccgtcgtcc   12060
tgctgctgcc cggcgacgac cccgtcgccg tggcgcagac cgccgccccg gagctgaccg   12120
accgcgccgg gcaccccgtc accgtggggg tcgcgggccc cgcctcgacc gtcgacggca   12180
tcgccgacgc gcaccgtgag gccgcgaagt gtctggagac cctccgcgcg ctcggcggcg   12240
acggcggcac cgcgtgcgcc tccgacctgg gtttcctcgg catgctcctc gccgaggaga   12300
acgacgtccc cggttacatc aggacgacga tcggccccgt ggtcgactac gacacccacc   12360
gcttcacgga tctggttccc actctgaggg tgtacctgga gtcgggcagg agccccacgc   12420
gtgccgcaga gacactgcgc gtgcacccga acaccgtctc acggcggctg gagcgcatcg   12480
gcgtactgct gggagaggac tggcagtcac cggagcgggt gctggacata caactggccc   12540
tgcggctcta tcaggtgcgc tcggcgctct cctcgcaacc ggcgtccgag acccgggccg   12600
tgctcggatc gctgcgcgag tgacctctcc ggcacgggcg gcgccccgcc cgtcggcgcg   12660
gatcgcgccg acaggcgggc gttgaccacc ggccaccggt cccccgtacg acgaggtccc   12720
gggcccgcgt ggttcagccg gcgctgaact cggcgatgcg cccgtctccc atggtcagcc   12780
gggcgccggt gaaccgggac cgcatccgac ggtcgtgggt gacgaccacg acggcgccgc   12840
ggtagtccgc gagtgcctgc tccaactcct ccaccagcac cggggtgagg tggttggtgg   12900
gctcgtccag cagcagcagg tccatcgggt cgctcaccag ccgggcgatc tcgatccggc   12960
ggcgctgccc gtaggacaga tccttcacgc gtcgccgcag gtcggacggg ctgaacaggc   13020
cgagcgacag cagtttctcc gcgtggtcct ccaggtagcc ctcccggccc tgggcgaagg   13080
cccgcagcac ggtcagtccg ggcgcccagg gcgtctcgtc ctgccgcaga tgaccgaccc   13140
ggcagccgac gcgcaccgag ccgccgtccg gctccagttc cccggacagc acccgcaaca   13200
aggtggactt gcccgcaccg ttgggacctg tgacgagcag ccgttcgccg ggccggatcg   13260
tcagggagtc cacggcgagc cgacccgcga cgcgcacgtc ggtgagttcg gccaccgcct   13320
cctccgcctc cgggcccgcg gtgtcgatgc gggcggcgaa ggacaacggg tcggcgggag   13380
cgtggaccgg gttctcggtc agctgcgcca cgcgttgctt cgcgttgcgg atccgcacca   13440
tcgcgccgtg gtcgcgccct cgcctgcggt aggcgccgtg gccgaacacg gagagggaca   13500
tcttgcgcgg gatgccgtcc atccgcgcca cgttggaggt gatcagcccg cggttgcggt   13560
cgagttcggc acgccactcc tcgtactccc gcagccgccg ctcgcgttcc acggccttgg   13620
ccgtcaggta gccctcgtag ccgttgccgt agcgggtgac gctgccggag tcgacctcca   13680
ggatcgtggt ggtgagccgg tcgaggaaga cccggtcgtg ggtgaccgcg atcaccgtgc   13740
cgcggtggcc ggccaggtgg tcctccagcc attccatcgc ccggtcgtcg aggtcgttgg   13800
tcggttcgtc caggagcagc agctccggcg acgaggcgag ggtcgcggcg agcgcgaggc   13860
gggagcgttc gccaccggag agggttccga gcttgcggtc gcggtccagg ctcggcagtc   13920
cgaggccgtg cagcgcgacc tccacgcgca cgtcggcctc gtagccgcca cgcgcctggt   13980
actgctcgac cagagcggcg tagcgctgga ggccggcgga cagctcgcgc tcggagccgt   14040
tctcgtcgct ctcgcccagc tccgcctcgg cctcgcgcat cgccgcttcg agctcgcgca   14100
ggtcggacag ggccaggtcg acggcgtcct ggacggtggc gtcgaggggc agttccagtg   14160
tctgcgccag gtagccgacg ccgccgggag cgaccacggt gagcgcgccg ttgtcgggct   14220
ccacgcggcc ggcgaggatc ttgagcagcg tggacttgcc ggaaccgttg tcgccgatca   14280
cgccgacctt ctcgcccggc ttgatgctga aaccgacccg gtcgagcacg acacagtcgt   14340
ggtagcgctt cgtgatgtcg tgtagggcgt attgcgcaat cgacacgcgt aagtctcctg   14400
tttccacgat gaggatgagt ggatgcgtga gcgcgctcgc agaaagaacg gaaagcagaa   14460
gggacgccac cactgcggac atggccggtc agggggtgtc acgagcacgc tgctggatgc   14520
ggcaggcgga gtcagctcaa cgccgggcat cctcatctat cacagagatc ccatgcgaag   14580
aactatagcc gtgctacccg gtgccgcgca acggtatgcg tgtcgcaccg gccgacgtga   14640
tgcagtcgga ccgggatgat cgcttgtccg gcggccggat gcctagcctc gggagcaacc   14700
acagcggtct ttcacgagag gggtcgacca tgggcgatct caggaaccgc atcaccgagc   14760
tggtccgcgc gtaccaccgg gaacaggcgc ccgggggctt cgttcccggg acgacgcacg   14820
taccggtctc cggcgcggtg ctgagcgagg aggaccggct ggcgctggtg gagacggcgc   14880
tggagatgcg gatcgcggcc ggcccggcct cccggggctt cgagcggcag ttcgcccggt   14940
acctcgggct ccggaaggcg cacctgacca actccggttc ctccgccaac ctcctcgccc   15000
tcggcgcgct cacctcgccg cagctggagg agagacggct gcgtccgggg gacgaggtcg   15060
tcacggtcgc cgccgggttc cccacgacgg tcaacccgat cttccacaac gggctggtgc   15120
ccgtcttcgt ggacgtcgag ctcggcacgt acaacacgac gcccgagcgc atcgagcggg   15180
ccatcggccc ccggaccagg gcgatcatga tcgcgcacgc cctgggcaac cccttcgagg   15240
ccgaagaggt ggcccgcctc gcggacgagc gggagctgtt cctcatcgag gacaactgcg   15300
acgcggtggg gtcccgctac cggggcaggc tcaccggctc cttcggcgac ctgtcgaccg   15360
tcagcttcta tcccgcgcac cacatcgcga tgggtgaggg gggctgcgtg ctcaccgaca   15420
acctggccct ggcgcggatc gtggaatcac tgcgcgactg ggggcgcgac tgctggtgcg   15480
agccgggtga ggacaaccgc tgcctcaagc ggttcgacca gaagatgggt gacctgccgc   15540
ccgggtacga ccacaagtac atcttctcgc acgtcggtta caacctgaag tcgaccgacc   15600
tgcaggcggc cctcgggctg tcccagctga cccggatcga ggagttcacc gaggccaggc   15660
gcgccaactg gcggcatctg cgcgccgcgt tggacgggct gcccggtctg ctgctgcctc   15720
atgccacacc gggcagcgat ccgagctggt tcgggttcct catcaccgtg gacccggacg   15780
ccgcgtacag cagggcggcc ctggtcgacc acctggaatc gcgccggatc agcacccgcc   15840
gcctgttcgg gggcaacctc gtgcggcacc ccgcctacac cgaccgtcgg taccgggtgt   15900
ccggctccct ggagaacagc gacctgatca ccgaccagac gttctggatc ggggtcttcc   15960
ccggcatcac cccggagatg atcgcctacg tcggcgacac gatccgggag tgcgtgctca   16020
agcactcctg aggggcggcg gtacgggggt gcgcgtggag gggaggaccg gggcggtcct   16080
cctccggggc gtcacggccg cggaagcgtc cgaagctccg aggcgaggtc ggggtggacc   16140
cgcgcggtga gcagggtgcc ctccggcgtg tgctcggtgc tgagcacctc gccctcgtcg   16200
tgcacccgcg ccaccaggct cccctcgtcg taggggatca cgacctccac ctccacctcg   16260
gggtgcggca gcaggcggtc gatcagttcc cgcagctcgt cgatgccccg acccgaacgg   16320
gcggacacga cgatcgcgtc cggctcctgc tccagcagac gggcgaggac gtccgggtcc   16380
gcgacatcgg ccttgttgac gaccacgacc tcggtggact cgccggcgcc cacgtcccgc   16440
agcacctcgc gcaccgaggc cagctgcgcg ccggggtccg ggtgcgaacc gtcgaccacg   16500
tgcagcacca gatgcgcgtc cgcgacctct tcgatcgtgg aacggaacgc ctccaccagg   16560
tggtgcggga ggtggcgtac gaagcccacg gtgtcggcga tggtgtaggg gcgcccgctc   16620
ggcgtcgtcg cccgccgcac ggtcgtgtcc agggtggcga acagggcgtt ctccaccagc   16680
acgccggctc cggtgaggcg gttgagcagc gatgacttgc cggcgttggt gtagccggcg   16740
agggcgaccg acagcacctt gttgcgccgt cgctcctccc ggttcacgtc ccggccggtc   16800
ttcagctgct ccagctcccg gcggagcctg gccatcttgt cgttgatccg ccgccggtcc   16860
gtctcgatct tcgtctcacc gggaccgcgc gtggccatgc caccgccgcc accgccgccc   16920
atctgccggg acagcgactg gccccagccg cgcagccgcg gcagcatgta ctgcatctgc   16980
gccagcgcca cctgcgcctt gccctcccgg gactgggcgt gctgcgcgaa gatgtccagg   17040
atcagggccg tgcggtccac gaccttgacc ccgacgacct cctccaggtg catcagctga   17100
ctggggctca gttccccgtc gcacaccacg gtgtcggcgc cggtctcctc gacgatgtcg   17160
cgcagctgcg acgccttgcc cgagccgatg tacgtcgccg ggtccggctt ctgccggcgc   17220
tgcacgacgc cgtccagcac gagggcgccc gcggtctcgg cgagcgccgc cagctcggcg   17280
agcgaactgt cggcctccgc ggccgttccc gaggtccaga tgccgacgag caccacccgc   17340
tcgagtcgca gctggcggta ctcgacctcg gagacgtcgg tcagttcggt ggagagcccc   17400
gcgacgcggc ggagggaggc ccggtcctcg cggtctaact gatcgccgtc ccattcctcg   17460
gcgtcggcgc cggccatcgt gtcgtccatc agtgcgtcgg ctcgctgcgt gccggcgaag   17520
tcctcgggat gcgtcaaagt acttccaatc tggggggttc gagagcgttc cggggcgggg   17580
cgcgtccggc ctgcggggcc gggcgcgggg ccggggggtc ggggccgacg tgtccgcacc   17640
tcgccgtcgg gggccggtgc cgtggaggtc gctgccggaa ctcacatgcc gtccacccta   17700
gccatgtcgc cggggtgtgc aaggacgtat cggcgatcac ctccccagct gacagagtgt   17760
gcaccgggta ctgcgcccgc gggcgtgaag cgggcgagtg tggatgtcat gcgagtactc   17820
attatcgggg gttcacagtt cgtgggccgg gccttcgccg ccgaggcact ggccgcgggg   17880
caccgggtca ccacgttcaa ccggggtgtc agcggcaccg acctgcccgg cgtcgaggcg   17940
gtcaggggcg accgcgaggt ggccggcgac ctggagcggc tggtgtccgg aaggcactgg   18000
gacgcggtcg tggacacctg cggttacgtg ccccgcacgg tgggggcctc ggccgcggcg   18060
ctgtccgggc acgcggacac ctacctctac gtctccagca tcgcctgcct gcccgactgg   18120
gcgcaggcgg tccgtccggt ggacgacgac tcacctgccc acgactgccc gccggacgcc   18180
ggaccggacc acgccgacgg tgactacggc gtcctgaagg ccggctgcga gcgcgccgtg   18240
gaccggcact tcgcgggccg gaccctgcac ctgcgggccg gtgtcatcct cgggccgcac   18300
gacaccatgc gcatgctcga cgcctggctg tggcgcatgc gcgtcgccga gggggagcac   18360
cgccgggtgc tcgccccggg caaccccgag gtgggcatgc gcctgatcga cgtacgcgat   18420
gtcgccgtct tcggcctcga ctgcctcgcg gacggccgta ccggcgcctt catcgtcaac   18480
ccgccggaga agaacaccac cttcggggag ttgctcacgg agtgcgtcaa ggccaccggt   18540
tcggccgcgg agccggtgtg ggtcgacgag gggttcctcg ccgagcacgg cgtgagtccg   18600
tggacggacc tgccgatgtg ggtgcccgac accgcgcggg acaccctcgt gtgggcggcc   18660
ggagcaccgc gcgcccgggc cgcgggtctg gcctgccggc ccttctccga caccgtgcgg   18720
gacgcctggg aggtcgtccg ggaccggccc gtcccggaac tgccgctcgc ggccggctgc   18780
ggcctgtccc tgagccggga gaaggagctg ctcgccgcct gggacgctcg cggcggtgcg   18840
gcggcgggct gacgcggccc ccgaggagtg cgacgccgtt tcccgctcgc ggggagcggc   18900
gctcgcgtgt ccgccccgcg gcccggcggc gcgtcctgtg tcccggcgcc cggggcgcgg   18960
ctacacggtg aaggtctcgg cgcgggccac gatctcgtcg accagccccg cctggcgcag   19020
cgcggcgtac gactcggcgg agacgtcctc ggcccggatc accgcacggc ggaagaccga   19080
caggatgttc acgaagtgcc ggtccacggg caggacgcgc tcctcccggt ggtcctggcg   19140
ggacagccgc agtacggggt ggtggctgtc cggggtcgtg aagacgtggc tcagggcgag   19200
cgagccggtg ctgccgtgca gctcgtacgc cgagcggtag ccgtgttcca tgccgaaggc   19260
gaggtgggcg gccacgccct ggggggcggc gagcaggacg ctgccggaga ccacgacgcc   19320
ccggcggcgg tcacggcgca gcacggcgcc ggtcaggcgc agttcgggtc cgaggaagtg   19380
cagcgcggcc cgcagcgggt agacgccgtt gtcgagcagt gcgccgccgc cgatgtcggg   19440
tcggtagcgc atgtcgtcgt cggcgcgcgg cgggatggtg aaggcggcgg agaaggtgcg   19500
cagctctccg atggcaccgg cctccaacag ggctttgacg gtggcgtgtt gagagtggtg   19560
gaggaacatg aagttctcca tcagtaccag tccgcgctcc cgggccatgg cgaacaggcg   19620
ggccgcgtcg gcgtggttgg cggcggcggg cttctccacg aggacgtgtt tgcccgcccg   19680
cagcgccgcc gcggcccatt cggcgtgcag catgctgggc accgcgatgt agacggcgtc   19740
cacgtcgggg cgttccagca gggcctcgta gggcgcgacc gcctcgcagt cgaagtgcct   19800
gcccagggcc ttggcccggt ccgcgtcgcg gctgccgacg caggtcagca cggtgccggg   19860
ggtggagagc agggcgggca gggtgcgacg gcccgcgatg tcgccgcagc cgatcgctcc   19920
gaagcgcagc accggggacg cttccggccg cggcgggccg ggtgcggcga acggttcagc   19980
agaagtaccc agggcggtca tggatggttc cgtcaatcgg tccggatggt cacggcacag   20040
cgtggtgaac ggccggcgca cacccacgag tcgcttccgg caatgggcgg ccctgaagct   20100
acccggcggc ccgacgcgac ggcaaggccg atctgacaca gtgccgcgcc gagggaccgt   20160
cggtgccccg cgtacccgct gacctgacac tacgccgacc aatctgtgga cggggcggtg   20220
gccgcccggg ttaggtgagc gcggcgcccg cggtgaccgc gacgccggtc cgaagcggcc   20280
ctcggggcac gccgttggag agaggagacg cgggtgacgg acgcgatcac gaccgagctg   20340
gccgaccgcg aactggggcg cagactgcac cggatacgcg gcgtccactg gtatttcggc   20400
aaccacggtg acccgtacgc cctcatcctg cgcggtcaga ccgacgaccc gtcggtgtac   20460
gaggagcggg tccgcgaggg cgggccgctg ttccgcagcc gtaccgggac ctgggtgacc   20520
gcggacccgg aggtggccgc ggccgtgctg ggcgactcgc gcttcggtgc gctggaccgc   20580
gccggacggc gcccggagga gtacctccag ccgtcgcccg ccacgtacct ggggctggac   20640
cgcgccgcgt acgcgcgtct gcggcgggtg gccgagcccg tgctgggcgc ggacgccgcc   20700
gccgcgtggc gccggctcgg cgaggacgtc gggcgccggc tgctcgccgg ccgcggttcc   20760
ggcctcgacc tgacggcgga cttcgcccgc cggctgccgg cattggtcct ggccgcgtgg   20820
ctcggggtgc cgggcgaacg gtgcgacgag tgggaggagt cgctgcgggc ggcggggccg   20880
ctgctggacg gtctgctgtg tccgcagacg ctggcggcca cccgtgcggc ggactcggcc   20940
gccgaggggc tgcgcgcgct gttggacgag gtggtcgccg cgcgtcccgg cgggtccggc   21000
gagggtgcgg tggcccgcat ggtcggcgcc ggagccgccc ccgacgacgc ggtggccgcc   21060
gccgtgtgcc tggcgctctc ggccgtcgaa ccgacgacga ccctggtgtg cgaagcggtc   21120
cggctgctgc tcgaccgacc cgagtggtgg cggcggttgt gcgactcccc cgctctggcg   21180
ccggccgcgg tccggcacac cctgcggcac gcgcccccgg tgcggctgga gagccgggtg   21240
gcccacgagg acgtgacggt ggcggatcgt ccgctgcccg ccgggagcca cgtggtggtg   21300
ctcgtgggcg cggcacggcg cgcgggcgcc ccggccgcgg agccggcgga cctggcgggc   21360
gcaccggcgg cggagctgcc ggacgacctg tggttcgcgc tgtccgggga gttcgtcggc   21420
cgtgccgccg agaccgcgct gggcgtgctg gccgaggccg ccccgggact gcggcgggac   21480
ggcgacatcg tccggcggcg ccgttccccg gtcctcggca ggtacgcgcg gttccccgtc   21540
gcgtactcct gacgggcccg cggccggcgt cccctcagtc ccccacgacg tttcatgaaa   21600
ggagtgccgt gcgcgtcctg gtgacctcca tcccgcacca cacgcactac taccacctgg   21660
taccgctgat ctgggctctg cgtgcctcgg ggcacgaggt ggtggcggcc ggccagccgt   21720
cgctggtcga cgccatcacc gccagcggca tcccggcgtt cgccctggcc gaggaggagt   21780
cgctggcgca gatcttcgag gaggtcgagg gcgatctcca gccgtatcag cacggcatcg   21840
acgagttcga cttcttcggc accctgaagg acgagctgga ctgggagaag ctgctcgccc   21900
agcaggtgat cctgtccggc ctgtggctgg aaccgctcaa cggcgccacg accctcgaca   21960
gcatcgtcga cttcgcccgg gcctggaagc ccgacctggt gctgtgggag ccgttcacct   22020
atgcggggcc ggtggcggcc cgggcgtgcg gggccgcgca cgcccgcgtc ctgtgggggc   22080
cggacacgat cgggctgctg cggacgaagt tccttcaggc ccaggcgcgt cagcccgagg   22140
agcaccggga cgacccggtc gcggagtgga tgacctgggc cctggcgcgc tacgggtgcg   22200
acttccggga ggaggacgtg ctcggtcagt ggagcgtgga cccgatggcg gagggcgtca   22260
gtctgggcct cgacctgccg accgtcccga tgcgctacac cccgtacaac gggtcggcgg   22320
tgatccccga ctggctgacc gaggaaccga aacggcctcg ggtctgcctg accctggggg   22380
tgtcctcgcg ggagcacagt gaggacgagg tcccggtgca gaggtttatc gaggcgctgg   22440
ccgatctcga catcgagctg gtggcgaccc tggacgacgc ccagcgggac ctgctgccga   22500
ggatcccgga caacacgcgc atcgtcgact tcgtgcccat ggacgcgttg ctgccgacgt   22560
gctcggcgat catcaaccac agcggttcgg gcacgtgcaa caccgccgcg ctgcacgggg   22620
tgccgcagat catcctcggc ggcatcctgg acgccgccgt acggcagcac atgttcgcgc   22680
agaactccgc cgccctcacc ttcgctccgg aggaggtgac cggcgcgtcg ctgaggagcg   22740
cgctggtgcg cctgctcgag gagccgcggt tccgcgacgg cgcgcggcgg ctgaaggagc   22800
ggatgcgggc catgcccagc ccggccggga tcgtgccgac cctggagcgc ctcacggccc   22860
agcaccgccg ggcgtgttga accggcgcgc gggcccgtgc cggcggtgac cgcccgaccc   22920
gactctcgcg tgtgatcgat ctcgtcgact cagccgtgga ccggttcgcc tgtccgcgcc   22980
cgacactgga gtgctgatgc gggccctctt cacgaccgcg ccgctcgcgg gccacctgct   23040
tccgctggtg cccatcgcgt gggccctgcg ggcggccggc cacgaggtac tggtggcgac   23100
ccgggaggac ttcgtgccgg tcgccctgcg gtcggggctg ccgtccgcct cgtgcgggcc   23160
gcccgccgcg gacctggcgg gcgcggccga ggcgggggcg ctcgcgcggc cccgcggagc   23220
ggcggaggct cggggggtcc tgagcggggc gctggcgcgc gtcgcccggg gcagtctggc   23280
gggggtgcgg cggctggcgg acgcctggcg gccggatctg atcgtcagcg aacgggccga   23340
gttcgccggg ccgctggtcg cggcggccct cggggtcccg tgggtccgct accactggtc   23400
ggtctcgtcc ctggaggagt accggcgagc ggccgaggcc gagttcgcgc ccgagctggc   23460
ggcgctcggc ctcgaccggt tcccggaggc ggcgcgcgtg ctcgatccgt ggccggtgtc   23520
gctgcgccgg ccggacgcgg tcgcccacga cggggtccgg cacgtaccgg cccacgggga   23580
cgcccccgtc cccgactggg cgttcacgcg cggtcgcggg ccgcggatct gcgtgacgct   23640
cggcaccatg ctgccccggt acggcgccgc cgggatggcc gacttcctga cggagctggt   23700
ggcggagacc cgcggagggg actgcgaact gctcgtggcg gtcgacgacg acgtcgtcgc   23760
gcggtggccg tcgctgccct ccgcggtgcg gtacgccggc cggctgccgc tggcggaggt   23820
gctgcccgcg tgcgacgcgg tggtgcacca cggcgggcag ggcacgtccc tgaccgcgct   23880
ggccgcgggt cggccgcagg tcgtcatggc gcggctcgac gaccagttcg acaacgcgcg   23940
ggcactggcg gcggcggggg cggccctgct cgtaccgccg tcccgggcca ctcccgcggc   24000
cgtggccgcg gggtgcgccg aagtgctgga gaacgccctg tatgccaagg cggcagccgg   24060
gctcgccgag gagatggcgc tgctgccgtc gccgtcggcg gcggtcggac tcctggaaca   24120
cccggggccc gggccggaca tgccgcggag ttacccgaac gaggatgcgg tgtgacgtga   24180
atctggaagt actcaaccgt tcgaacgatc cgcgcgggcc ggtgatcacg gtggtcggcg   24240
cgtccggctt catcgggtcc gccctggtcg ccgagctggc gcgcatgccg gtgcggctgc   24300
gggcggtggc ccggcgcgag acccccgttc ccgcgggggc acgggccgcc gtcgaggtcc   24360
gccgggcgga cctcgcccgg ccggacgagg tcggggccgc cgtcgagggg gcggacgccg   24420
tcgtgcacct cgccgcccac atcggcggcg cgcggtcgtg gcgcgcggcc gacgagcggt   24480
cgctgcgggt gaacgtcggt ctgctgcgcg acgtggccga cgcgttccgg gaccgctcgg   24540
ggcccgcccc ggccgtggtc ctggccagta ccctccaggc cggcgtcgag ctgtcccggc   24600
agggcccgta cgcccggcag aagtcggcgg ccgaggaggt cctgctgcgg gccgcctccg   24660
aggaggtggt ccgcggcgtc gtgctgcggc tgccgaccgt ctacgggcgc agcccgctga   24720
ccgggtggac gggccgcggg gtggtcgcgt cggtggcacg gcaggccgtc tcgggcgagc   24780
cggtcacgat gtggcacgac ggcacggtcg ggcgcgatct gctccacgtg gaggacgcgg   24840
cccgcgcctt cgcggcggcg ctcggtcacg tggagcggct ggacggcggc acgtggtccg   24900
tcggtacggg ccggctggag cccttgggag aggtgttctc ggccctcgcc gggctggtgg   24960
ccgagcggac ggggaggccc cccgtaccgg tggtctccac ggagccgccc gaccatgccg   25020
aggcgggcga cttcgagagc gcggtctgtg acccctccgc gttccgcgcg gtgaccgggt   25080
ggtctcccct cgttccgttg cgggcggggc tcggcgccgt ggtggagacg atggtggccg   25140
acggagcgag gggtgggatc cgaacgtgag cacggaccgg gagcaggccg cgcacacgcg   25200
gctcggtcgc agcgcgaccc tggtgagccg gctctggctg ggcaccgtga acttcagcgg   25260
ccgggtcgag gacggtgacg cgatgcagct gatggaggcg gcggtcgacc gcggcatcaa   25320
ctgcatcgac accgcggaca tctacggctg gcggatccac aagggccaca ccgaggaact   25380
ggtgggccgg tggctggcca agagcgccgc gcggcgggag gacgtcctgc tggccaccaa   25440
ggtcggcggg gacatgagcg aacggctcaa cgacggcggc ctgtcggcgc ggcacatcgt   25500
cacggcctgc gagcagtcgc tgcggcgcct gggcgtggac cacatcgacc tgtaccagat   25560
gcaccgcgtc gaccacgccg cgccgtggga cgagatctgg caggcgatgg accgtctggt   25620
ggcgagcggc aaggtgacct acgtggggtc gtcgaacttc gccggctgga acgtcgccgc   25680
cgcgcaggac gcggcccggc ggcgccagtc cctcggtctg gtgtccgagc agtgcctgta   25740
caacctggcg gtgcgccacg ccgagctgga actgctgccg gccgcccagg cgtacggact   25800
gggcgtgttc gcctggtcgc cgctgcacgg cgggctgctc agcggggtgc tgcgcaagct   25860
cgcggcgggc gtcgcggtga agtcggcaca ggggcgggcc cagctgctgc tgcccgagct   25920
gcgcgcgacg atcgaggcgt acgaggggtt ctgcggccgg atcggcgcgg atccggccga   25980
ggtcggtctg gcctgggtgc tgtcccggcc ggggatcagc ggcgcggtga tcggtccgcg   26040
cacggtggac cagctggact cggcgctgcg gtccctggac ctggtcctcg gggaggccga   26100
actggccgag ctggacgcca tcttcccgcc cctgggcaag ggcggccggg cgccggacgc   26160
gtggatcagc tgaagggggt gcatcggccg acgtcacgcc ggccgatgcc gccggtcaca   26220
cgacgtcgag cgcgggcagc gggaagacca gtcggccgcc gccgtcgagg aactcccgct   26280
cccgttcgac gaacccgtcc cggtagatcc agggcaggac cagcaactgg tccggcttct   26340
gcgccttcgc gtcctcctcg gacacgatgg ggatgcccgt cccgggggtg aaacgccccg   26400
ccttctcctc gctcacctcg ccgatgcacg gcaggtcccg ttcggtgatc ccgcagtact   26460
ggaggatgac gttgcccttg gtggaggcgc cgtacccgag ggtcagcagg ccctcttggc   26520
gggagcggtc caggaagccg cgcagggcgt cccgctggtc ggcgacgcgg cgggcgaagg   26580
cctcgaacgg tgccatgccg tccagtcccg cggcggcctc ggcggcccgg atgcgggcca   26640
ggcccgcctc gtccctcggg tgccgggaac cggtcctggc gagcgtgacg cacaggctgc   26700
cgccgtacac ctcggtgagc tcggcccgga tgacggtgag gccgacgcgt tccgccatcc   26760
actcgatctg gcgcagcgcg tagtactcca ggtgctcgtg gcagacgatg tcgtacgcgt   26820
cggcttcgag catggcgggc aggtagctct gctccatcat ccagacgccg tcctcggcga   26880
ggacgtcgcg gacgtcgctc atgaagcgca gcgggtccgg caggtcgtag aacatcgcga   26940
tggaggtgac ggccttcgcc cgccgcgccc cgaagcggtt ctcgaaggtc gcgcgggtga   27000
agtagtccac gaccaactcg gcgttcggcg ggtacaggtc gcggaacttg ccgccggtcg   27060
ggtcgatgcc gaccagtcgc gggccgtcgg cggggtagcc cttgaggagc gtggcgtcgt   27120
tgctgccgat gtcgaggacc aggtcgtccg ggccgaggtc caccagccgg cggacggcgg   27180
cgaccttgcc atgcaggtgg tcgaccatga agggccggat gcccgagcgg tagccgtagc   27240
cctcgccgta catgaggtcc gggtcggggg tgtggcgcag ttgcacgagg ccgcatccgg   27300
ccggggaaca cgcgacgagt tccagcggga ccgacggcac gacctcgtcg cggtcggccg   27360
ggaacacccc ggtgagcgcc tgttcgccca ggtcgagtac ggagagcagc tccttgttgc   27420
cgcagacgcg gcacgcggtg gcaatcatgg ggtcctttcg ggatcctggc cggggcgccg   27480
ccggcccgtg gccaggtcgg gagcttccag acggagggtg tcgggggcgg gccgggggga   27540
cggcaccagg tgcaggcggc cgatcgcgcc ggtggcggcg gaggcgtcct ggcacgggca   27600
gggatcgtcg gtgaatccgg cgaagcggta ggccacttcc atcatccggt tgcgttcggt   27660
ggcccggaag tcggctccga ggtgcacccc ggcccggtgc gcctggtccg tcagccagcg   27720
caggatcacc gtgccggccc ccagcgacac cacccggcac gaggtggcca gcagcttgat   27780
ccgccaggcc tcggggccgc gccgcagcag cacgacgccg accgcgccgt agggaccgaa   27840
gcgatcggtg acggtggtga ccagcacctc gtggtcgggg tcgtcgatga gggcgcgcag   27900
ctcgtcctcg gagtagtgca ctccggtggc gttcatctgg ctggtgcgca gggtcagttc   27960
ctcgacccgc gacagctcca ggggcgtggc gcggctgatc cgcatccgga tgtccagcga   28020
gcgcaggaag tccgcgtcgg gtccggtgaa gtcggaccgc tcggcgtccc ggcggaagga   28080
cgcctggtac atggagcggc ggcgggtcga gtcgacggtg acggtgcccg ggctgaactc   28140
cgggaggccg gtcagccggg tcgcctgctc ggcggcgtag gtgcggacct ccggcagttc   28200
gtgggtgacc tcggcccgtt cgaagggctg gtcgtcgatg aaggcgaggg tgctcggcgc   28260
gaagttcagc cggtcggcga tctcgcggac cgacttcgac ttcgggcccc agccgatcct   28320
cgggagcacg aagtactcgg cgacgccgag ctgttcgagc ttcgcccagg cgtgatcgtg   28380
gtcgttcttg ctggccaccg cctgcaggat gccgcgcgcg tccagctcgg tgatggtccg   28440
caggacgtcc ggggcgagcc ggacctcgtc ctcctcgagg agggtgccct gccagagggt   28500
gttgtccagg tcccagacca ggcatttgac caacggctcg gcggcgttgt cccggtgcac   28560
gtcgttccct tctctcgata cggcggttgc gaccgcgact cctcgacagg gcgtacgcgg   28620
cccgcggccg gcggggacac gggccggttc acccggccgc ggacatcacg tgccgggcca   28680
ggaccagttc gcagatctcg ttgctgccct cgatgatctc catgagcttg gcgtcgcggt   28740
gcgcccgtgc gacgacgtgt ccctcccgcg ccccggccga cgccagcacc tgcacggccc   28800
gttcggcccc gcgtgcggcg ccggtggccg cgacgtgctt ggccaggacg gcggcgacca   28860
ccatgtcggg gctgccctcg tcccactggg cgctggcgtg ctcgcacgcc cgggcggcgt   28920
gctgttcggc gacgaacagt tcggcgaggt gccgggcgac gagctggtgg tccgagagcc   28980
gcgtgccgaa ctgctcccgt ccgccggcgt gacgtgcggc ggcggccagg caggcgcgca   29040
ggatgcccag ggagccccag gccaccgaca tccggccgta gctcagcgcg gtggtgacca   29100
gcagggcggg ggtgcggtcg tggccctgga gcagggcgtc tgccggcagc cggaccccgt   29160
ccaggtggat gtcggcgtgt ccggccgcgc ggcagccgtg cgcgtcggtg atgcgctcga   29220
cgcgtacgcc gggggccgag gcgggcacca cgacggcgcc cgcgccctgc tccgtgcggc   29280
cgaagaccac cagcaggtcc gcgtacgcgg cgttggtcgc ccacaccttg acgccgtcga   29340
cgacgacttc gtcgccgtcg gaggtgatgc gggtgcgcag ggcggacagg tcgctgccgg   29400
cgccggcctc ggtgaacgcc acggcggcca gttcgccgcc ggtcaaccgg ggcaccaggg   29460
aggcctgctg gtccgctccg gcgagccggc gcagcgtcca ggcggccatg ccctgcgagg   29520
tcatgacgct ccgcaacgag ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc   29580
gccggctggt ccagccgagg ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc   29640
gggagccgag gtcgtgcagc aggccgaggg gcagctcgcc cgtccggtcc cactcggccg   29700
cccggtcgcc gaccagcgcg gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg   29760
tgtcagccac ctgcgtgccc ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg   29820
accatcgcgt cgacggtgcg gaagttgtcg agcatcaggt cggcgccgct gatgacgatg   29880
ccgtaggtct tctccaggtg cacgacgagc tgcatggcga acagcgagga catcccgccg   29940
acggcgaaca ggtcctggtc gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg   30000
agcagttccc cggcgacctc gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg   30060
gacgtcgtgg tcatcgcgtg gcctcctggt agtcgtagaa tccccggccg ctcttgcggc   30120
cgagcaggcc ctggcggacc ttgtccagca gcagctcgct cgggcggagc gccggatcgc   30180
cggtccgttc gtgcatcacc cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg   30240
ccgtggccag gggtccggtg cggtggccga tgcagtcgcg catcagcgcg tccacggtct   30300
ccggggtggc ccggccctcg tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca   30360
ggcggctggt cacgaagccg gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg   30420
acagcaggtc ccgggtggcc cgggcggccg cctctccgct gcgcggtccg aggaccacct   30480
cgaccgtggg gatcacgtac gcggggttca tgaagtgcac gccgacgagg tcctcggggc   30540
gggggacggc gtcggccagc tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg   30600
tccccgggcg cgccacggac gccaggtccg ccagcacctc ggccttccgc tcggggtcct   30660
cggtgacggc ctcgatcacg gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg   30720
tcagctcccc gggcgggcgg tcgtggggca gcgcgcccat cagccgggcc gtccgcagat   30780
gcagcgcgac cgcgtcgggg gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga   30840
ccgggtgccc gtgtccgacg gcgagtgccg cgatggccgt gcccatgacg cccgcgccga   30900
gcacgacgag cggagaattt tccttggaat cgggcacgga tcc                     30943
<210>2
<211>11171
<212>DNA
<213>生二素链霉菌
<400>2
ctgcaggcgc gcgggctgct cgggcaggag gcgcccgccg agagcctcga cgcgatgatc      60
gacgactact gcgcgcagat ccgcgaggtc cagcccgagg gcccgtaccg gctgctcggc     120
tggtccatgg gcgggctgct cgcgcaccgg gtcgccaccc gcctccagcg ggcggggcag     180
cgcgtcgacc tgctcgcgat cgtcgacgcc tatccgcccg cctcggtgcg ggccgactgg     240
gacgcggcgg agatggtggc gcggatcggt gaggaactgg gcttcgacgt ggaccgggtc     300
ggccccggcc aggaggaggc gctgctcgcg gatctgcggg cgaaggggca tcccctgggg     360
catctgccgg gcggtgacat cggcgcggcg gtccgcgtgt acgtcaacag ctcgcgcctg     420
acgaggaacc tgcggcccga ggcgttcgac ggggacgtcc tcttcttcgc ctccgggacc     480
tcgttcgccg aggacgacca ggttcacgac gtcgccgcct ggcggccgta cgtcaccggg     540
cagatcaccg agcacgtgat cgaccacctc cacgaggacc tcttgatcga accggccgcg     600
gtcacggcca tctccgacgt gctcgtcggg catctgcccg cggacgacac accccgcgcg     660
tccggcgcac cccgcgcacc tcgcgcatcc cgatgaggaa ggaaacatca tgagcaaccc     720
gttcgaggac acggaagcca cctacgtcgt gctggtcaac gacgaggggc agcactcgct     780
gtggccgtcg ttcgcggagg tcccggcggg ctggtccgtc gtggtgccgg agacggaccg     840
gcagtcgtgc ctggactaca tcaacgagaa ctggaccgac atgcgcccca agagcctcgt     900
cgaggcgatg gcgacggccg ggcaggacgc cccttgagcc aggacgccat gatccgggcg     960
gtcggcgtcc gcaagagctt gcggcgacgt ccacgccctc gacggcgtgg acatcgaggt    1020
cgaacggggc cgggtgctcg ggctgctggg tcacaacggg gccggcaaga cgaccttggt    1080
gaacatcctt gccacggtct ccccggcgtc cgcgggcacg gtgaccgtcg ccggtttcga    1140
cgtcgcgacg cagggcgccg agatccgcgc gcgcatcggg gtgaccggcc agttcgcgtc    1200
ggtggacgag tacctgagcg gattccgcaa cctcgtcctg atcggccgcc tcctcggggc    1260
gggacggcgt gaggcggcgg cccgggccac cgagctcctg gagctgttcg agctgaccgg    1320
ggcggcccac cagccctccc gcacctactc gggcgggatg cgccgacggc tcgacctcgc    1380
cgccagcctg gtcggccggc cggacgtgct gttcctcgac gagccgacga ccgggctgga    1440
cccggcgacc cggatcgccc tgtgggagac ggtggagaag ctggtggcgg gcggcacgac    1500
cgtcctgctg accacccagt acctggacga ggcggaccgg ctggccgact ggatcaccgt    1560
cctgtcgaag ggccgggtgg tggcctcgga caccaccgac cggctcaagg ccgacctggg    1620
ccaccggtcg gtgcgggtgg tccttccgcc cgccgccgac ctgacggccg ccgccgccgc    1680
gctcaccgcc ggcgggttcc gtccgcggtc cgacgccggg gagcacgcgc tgaccacgcc    1740
cgtggacacc tcggccggta tcgcgggcgt catccgcgcg ctggacaccg tcggaacgca    1800
ggccgtcgag ctgaccgtca aggagccgtc cctggacgac gtctacctgg cgctcaccca    1860
tccctcaccc gccgccgacg cggcctgatc cccaggagtt ccgttggcca tccaggagcg    1920
cgccgtgaag gaggtggcgg tcgacaccgg taccccggcc ggccccgtgt ggcgtggtgc    1980
cggcctcggc acccagctgt gggtactgac cgcgcggcag atccgttcca tgtacggcga    2040
ccgccgcctg gcgctgttca gcctgatgca accggtgatc atgctgttgc tgctgagcga    2100
gatcttcggc agcatggccg acccggacga cttcccgcag ggcgtgcgct acatcgacta    2160
cgtggtgccc gcgctgctgg tcaccaccgg catcggctcg gcccagggcg cgggggtggg    2220
cctggtcagg gacatggaca acgggatggt ggcgcgcttc cgcgtcctgc cggcccggct    2280
gttcctggtg ctggtcgccc ggtcgctggc cgatctggtc cgtgtgttca ccgagttggt    2340
cgtcctcgtg gccgtcggtg tgatcctgct gggcttccgt ccggccgggg gtttgtgggg    2400
cacgtccgcc gccctgttgc tcaccctgtt cgtcatctgg tcgctgatct gggggttcat    2460
cgccctcgcg gcgtggctgc gcagcgtgga ggtgatgtcc agcctcgcgg ttctggtgat    2520
gttcccgctc atgttcgcct ccagtgcgtt cgtcccgctg gacgccctcc cggagtggct    2580
gcgctcggtg gcgcacctca accccgtgac gtacgcggtc gacagcgccc gccgcctggc    2640
gctggactgg gacccggggt ggagcgtgcc cggcgcgctg ctgaccagca ccgcgctcat    2700
ggcggtgggg atgtacgtcg ccgggcgttc cttcaagagg cccccgaacg aatgattccg    2760
gcgaacgggt ccgtcgcctg cccctccggg ctcgcccggg ggaggcgggc gcggtctcag    2820
cggtcggccg tccgcccgta ggcgcggaag agtgcggtcc actccgggac cgtgaggtcc    2880
ttgacccggt cggccggcct cacgcccgcc ccgcgcacga actgggcgtg tccgcggcgc    2940
agcaccttcc gcgcggcgtc gcccaccgtc atctggccgg tgtcgaagac ccgttggacg    3000
aaccgctggt aggcggcctt ctcacgccag ggcacggacg gcctgcggtg cggggcgacc    3060
atcagggtct gggtgtccgc gcgcggtacg ggggtgaagt cctggcgtga gaaggccagg    3120
ccccggtcga acgagtacca cggctcccac tgggcgttga agaggtttcc gccccaggct    3180
ccggtccgct ttcccacgta ctcccgctgc aacaggaaca cgccctgccg catgcgcgcc    3240
ggacccatgt cgaggcagcg cctcagcatt ctggtgccgg tgacgaaggg aagattcccg    3300
atgagtctga ccggctgccc gggcagttgc agggtcagga aatcctcgtt caccaccgtg    3360
acgtccggca gcgattcggc ggccagccgc cgagcccagc ggggatctat ttccaccgcg    3420
agtaaaggcg tcccgggtga ggcgagcact ttggtcaccc gccctgatcc cgcgcctatt    3480
tcgacggtca tcaggtcatt cggagaatcg ggcggaatgg tgtccgaacc gtccagctga    3540
gcggagaaac gacaggccgc ggcggctgta cgaaagaagt tctgacccca ttctctccgc    3600
gcggtgctgc gtgaatcagc gggtgcggag acggattgcg gtggcagtgg ggatttcaat    3660
gtcacctcgg cgacattacc aagtcttgac ccaacggtcc atcaaccacc ggtatacccc    3720
atgcaattca gccaccgtcc ggcccgatcc cgacgttcgg ccgcgggcct ttcgggcccg    3780
accggtgacc agcgcgcgaa ccggagttcc cggcgatatt tccggctcct ggcgactcgc    3840
cacagtctcg tcgggggcgg ccggcgccat gactccgacg ggggcgattc ccggccgact    3900
tcgtcaggtc cggagggtcc cccgggcggc gcgggccgat ggccgctgac tgtgtcatct    3960
gcgggttgtc ggccgaacac accgcgcccc aggatgactc agccgttcct gcggtcgtcc    4020
cgaccccggt cccacccccg aaaagaggag cgagaatcca gtgctccagc gcgtcgatct    4080
gtcgtcactc accggcctcc gctggtatgc ggcgctgacg gtattcgcct gtcacatcgc    4140
ccagcagggc ttcttcgccg accagcaggt gggcagcgca ctgctgcaca tcaccccgct    4200
cggttccatg gcggtctcga tcttcttcat actgagtgga ttcgtcctcg cctggtcggc    4260
ccgcgacgag gactccgtgc cgactttctg gcggcgccgc atcgcgaaga tctatccgct    4320
gcatctcgcg acgttcggca tcgcggctct catcattttc tccctgtcgg agccggtact    4380
tcccggcggt tccgtatggg acgggctggt gcccaatgtt ctgctcgtgc agtcctggct    4440
tcccgacgcg accctcacgg ccagtttcaa cacgcccagc tggtcgctct cctgtgagat    4500
cgccttctat ctgtcgttcc cgctgtggta ccggctggtg cgcaggattc ccgcacggcg    4560
gctgtggtgg tgcgccgcgg ggatcgccgt ggccgtgacg tgtgtgcccc tgctggcggg    4620
cctgctcccg gcgagcgagg aggtggcccc cgggatgtcg ctcaacgagg tctggttcgc    4680
gtactggctt ccgccggtgc gcatgctgga gttcgtcctc ggcatcgtga tggcgctgat    4740
cctgcgcgcg gggatctgga agggccccgg tccggcggtc tgcacggcgc tcctcgccgc    4800
gagttacggc ctcacccaga tggtgccccc gatcttcacc ctcgtcgcct gctccgtcgt    4860
accggccgcg ctgctgatca cggcgctggc cgacgccgac gtgcacggcc ggcgcacggg    4920
gctgcgttcg gcgacgctgg tgcggctggg ccagtggtcc ttcgccttct acctggtcca    4980
cttcctgatc atccgctacg gacaccggct gatgggcggc gatctgggct acgagcggca    5040
gtggagcacc ccggccgcga tcgcgctgtc cctggggatg ctgggggtgg cggtcctggc    5100
cggcggtctg ctgcacaccg tcgtcgaaca gccctgcatg cgcctgttcg gcagccgcag    5160
gtccgcctcc cgtccgaagc ccggcgccac cgcggctccc cggaactcac ccgcggccga    5220
cgcggccggc gtgcccctgc tcccgggcgt acccgggccc gcgcacaccc ccgcagcgac    5280
gaacgaaccc accccgagag gatgatgagc gtggcagacc agacggctct cagccccgcg    5340
ctgctggagt acgcccggag cgtcgcgctg cgggacgacg gcctgctgcg cgaactgcac    5400
gaggtgaccg ccgggctccc cggcggccgg gccatgcaga tcatgcccga ggaggcgcag    5460
ttcctcgccc tgctgatccg gctcgtcggt gcccggcggg tgctggagat cggcaccttc    5520
acggggtaca gcacgctgtg catggcgcgg gcactgcccg ccgacggcac cgtcgtcacc    5580
tgcgacatca gcgacaggtg gcccggcgtc ggcgcaccgt actggcgccg ggccggggtg    5640
gagtcccgga tcgacctgcg cgtcggcgac gccgtccgga ccctcgccga gctccgcgag    5700
cacgaggggg acggctcgtt cgacctggtc ttcgtcgacg ccgacaagac cgggtacccg    5760
cactactacg agcaggcgct ggccctggta cgccccggcg gactggtggc ggtcgacaac    5820
accctgttct tcggccgggt ggccgacccg gccgtcgagg acgccgacac cgtcgccgtg    5880
cgcgcgctca acgagctgct gcgcgacgac gaacgcgtgg acatcgccct gctgacggtc    5940
gccgacggga tcactctggc ccgccggcgg gagtgagtcc gcacggggtg cggagcacct    6000
ggtgccgtca ccggcccgca cacgtccgcc gccgacctgc ccgggcaggt cgccgagctg    6060
ctgccctggc gtggccggcc ctcgtcgagg gccgcgcggt cagcggaacc ggttgatcgc    6120
gtcgatgtgc cgcgcccgct tctcctcgtc gcgcacgccc agcccctccg tgggcgccag    6180
gcagagcacg ccgaccttgc cctggtgctg gttgccgtgc acgtcgtgca cggcaaccgc    6240
cgtgtcggcc agcgggtagg tgcgcgagag ggtggggtgg atcctcccct tggcgacgag    6300
ccggttcgcc tcccacgcct cgcggtagtt ggcgaagtgg gtgccgacga tacgcttgag    6360
gtgcatccag aggtagcggt tgtcgaactc gtggcggaag cccgaggtgg aggcgcaggt    6420
gacgatcgtg ccgcccctgc gggtgacgta gacggacgcc ccgaaggtct cccggccggg    6480
gtgctcgaag acgatgtcga cgtcctcgcc cccggtgacc tcgcggatgc gcttgccgaa    6540
gcgcttccac tcccgcgggt cctgggtgtc ctcgtcgctc cagaagcggt agtcctcggc    6600
ggagcggtcg atgatggcct ccgcgcccat ggcccggcac acctcggcct tgcgcgcgct    6660
ggagaccacg cagacggggt gggccccgcc ggcgagggcc agctgggtgg cgtacgagcc    6720
caggccgccg ctggcgcccc agatcagcac gttgtcgccc tgcttcatgc cggcgccgtt    6780
gcgggagacc agctggcggt aggcggtgga gttgaccaga ccgggcgcgg cggcctcctc    6840
ccaggtcaga tgggccgcct tgggcatcag ctggttggac ttgacgaggg ccacctcggc    6900
caggcccccg aagttggtct cgaagcccca gatgcgctgg gccgggtcga gcatggtgtc    6960
gtcgtgcccg tcggggctct ccagctccac cgacagacag tgcgcgacga cctcgtcacc    7020
gggtttccag acgttcacgc cgggtcccgt gcgcagcacc acgccggaca ggtcggaacc    7080
gaggatgtgg tacggcaggt cgtggcgcgc ggccagcggc gaggtgcgcc cgtagcgctc    7140
caggaagccg aacgtcggga ggggctcgaa gatggaggac cagaccgtgt tgtagttgac    7200
ggagctggcc atcaccgcga ccagcgcctc cccgggcccc acttcgggca gcggcacctc    7260
gtcgacgtgc agggacttgc gcgggtcctt gtccgcgctc ggcatcccgc ggaacatgtc    7320
ggtgtcctct ttgcggacgg tcacggcgcg gaaggactcg ggcaggggca gcgccgcgat    7380
gtcctcgggg gtgcggtccg cggcggtgat cgcggcgagc agcgcgctct gcgcatggct    7440
ttcgggcatg gaacggtctc cgatcgctcg tgtcgtcagg tggcccggtg cagggcggtg    7500
aggcgctcca gggtggggat gatcccggcg ggcgtggggt cggcgagcat ctcctcgctc    7560
agccgccgcg cgcccgccct gatcgcgggg tcgtgcacgg ccgtgtgcac cgcgtcggcc    7620
agaccgcgcg ccgtgagcgt cgccgcgggc aggtcgaacc cggcggacag gcgctggagt    7680
tgctgcgcct tgagcggcgc gtcccacagg gagggcagca ggatctgcgg cactccgtgg    7740
cgcagggcgg tggaccaggt gcccgctccg ccgtggtgga tgatcgcggc gcagctcggc    7800
agcagcgcgt cgagcggtac gaagtccacg ggcacgacgt tgtcggggag ggtgcccagg    7860
cggtcgagct gggaggtgtc cagggtggcc accacctcga tgtccagccg gccgagcgcc    7920
tccagcagtt cggagtagga gaccgcgtcg cggccgtagg tctcgcgggc ggacacgccg    7980
agggtgaggc agacgcgggg gcggtcgggc ttcttgccga gccagggttc gatcacggag    8040
cgcccgttgt agggcacgta gcacatgggc accgtggtct ggcccaggtc gaggcgggtg    8100
ctgcgcgggc ccgggtcgat cacccagtgg ccgagcacgt cgcgttcgtc gaaggcgagc    8160
ccgtaccggt ccagcgtcca gccgagccat tcggcgatgg ggtcctcgcg cagttcctcc    8220
ggcatcccgt cgagggcggc gaggaagcgc aggcgggagc gtccgatggc gtcggggccc    8280
cacaggatgc gcgcgtgggc ggcaccgcag gcgcgggccg cgaccggccc cgcgtaggtc    8340
cagggttccc acacgaccag gtcgggccgc cagccacggg cgaagtcgac gatctcgtcc    8400
atcgtggcgg cgccgttgaa cggggcgaag cacagggcgg ccatcatgct ctgctggccg    8460
agcaggtact cccaggtggt ctcctcctcg ctctccacct caccgaactc gaagccccgc    8520
tggtagggga cgaggtcgct gcccatctcg gcgagcagct ccgcggccgg tcggtcgtcg    8580
cccaccggta cggcggtcag gccggtggag gtgatgacgt cggtgaggga gggcgggctc    8640
gccacccgta cctcgtgccc ggcggcgcgc agcgcccagg cgaggggcac cagactgtag    8700
tagtgggtgt tgtgggcgag ggatgtcagc aggacgcgca cagcggctcc ggtctgggag    8760
ggggcgtacg gacggcgggg tcatcccggg tggacccgga ggcgggcgca ggcgcccagg    8820
accggtgacc gcggccgggt caggggcggt ccctcggccc gcaggccggg caggcggccg    8880
gccgtgacct ggaccgcggt ggtggcggcc aggcggatca gcgggagggc gagcgccagg    8940
tgcggtccgt cggcgccccc gagcggctcc ggcccgggga tctcccgtcc ggcggcggcc    9000
agcaccacga cgtgctcgtc ggcggtgatc cggcggccgc cgagttcgag gccggtgtgc    9060
gcgacccggt tctccagccg ggccgggggg cgctcgcgca gcacctggtc gacggcgttc    9120
gccgcggccg gcgtccggcg ggccctctcc cactcccccg gccggccgag cagccggtgg    9180
accgtgtgcg cgacggcggt gacgacgggt tcgggtgcgc cgaccgcgag gagcagcgcg    9240
atgcgctcga cgtcgccggg ggcgacgccg tcgtgcagga ggagggcgag cacgtcgtcg    9300
ggccggggct cggcgttccc gaggccccgg gacttctccg cgacgagctc ggggaccagg    9360
tcggccagtg tgcggacggc gtcggcggac tcccgggcca cggtcagcag ttgcggggcc    9420
atccgggcgt cgagctgggg gccgcaggcg gcgagtgccc gcgcggcggt ggcgcggtcg    9480
cggcccggca ctccgaggag cctgagcatc agctcgacgg cgtagggccg ggcgacctcg    9540
ccgacaaggt cgaacccggc gtcaccggtg ggcagcaggc ggccgagcac tctgcgggcg    9600
gtggtgcgcg ccgcgcaggg cgcctgggcc ggggcgtacc ggctgagcac cggggcggcc    9660
agcgcccgca ggcgtacgag ctccgcgcgt tcgtggtggg ggaacgcctc ggcgaggggc    9720
agcagttcct cgtccgggcg gcgtccggcc cggtccagcg tgccgaagcg cgggtcggcc    9780
aggacggccg ccgccacctc ggggtccgcg gtcacccagg cgtccagctg ttcgctgcgg    9840
aaccacggtc cgcgggcccg gatctcccgt tcgaacggct cggggtcggc gacggcgcgc    9900
aggatcagcg cgtacgggtc gccctggttg ccggcgcacc agtgtgcggc ccgggtcagc    9960
tggagccgac ggccgagcgc acggacgccc gtgctcgtgt ccgcgctcgt gctcgtgctc   10020
gcgggggccg tttccgtggc aagggtgggc atggctgccc tgcctttctt ctcgggtcga   10080
tgggggcgct cgcacgatcg ggggacccgg gtgtgccggg tgggtcgggg caacccgcct   10140
ccgggccgcg gcggtccgcg tcggcaccgg gtcagcggcg ggtgccgatg aacagcccgc   10200
gaccggacgg gccgccttcc tggtagacca cgtcgcagcc ggcgcgctcg aaggccgcct   10260
cgtagtcggc gcgcgggaac agggtgatgg tgtggtcctc ggtcaggtga cggacgccgc   10320
cgggtccggc gaggaggtag tgcacctcga tgcgggtggc gttcccctcc cgtacggagt   10380
gcgagacccg gcagacggtg cgctcgcccg cctccgtgat gctggcgccg acgtaaccgg   10440
gggtgaagga ctcggggaac caccagggtt cgacgacgat gacgccggac ggttcgaggt   10500
ggtcggtgaa ggcccgcagc gtgctgtcga gttcgtcggt ggtccgcagg tggcctatgg   10560
agctgaacat gcaggtcacc gcgtcgaacc ggcgtcccag ggagaacgag cgcatgtccc   10620
cttggtggaa ggtgacaccg gggttccggc cggtcgcgag ggccagcatg tcggcggaga   10680
gttccaggcc ctcgacgtgg tcgaagaggc cgtccaggtg gtgcaggtgc tggccggtgc   10740
cgcaggccac gtcgagcagg gtccgggcgc ccggccggtg gacgcgcacg agtgcggcga   10800
tctcctcggc ctcctgccgg tagtccttcc ccttcccctc gtggaccagg tcgtagacgg   10860
ccgcgatgtc gtcggcgtac atcagtgttt ccctccggtg agcggggcgg gaccgggctg   10920
gtgcgggagg ctgtccagcc attcgtgcac cagggacgcg gtgtgccggg cgtgttcggt   10980
gagcatggtg aagtggttgc cgggcacgtc ggcgacggtc cgtgcgaacg ggacctggga   11040
ccgccagtcg ccccgcgccc cgcccgcggg cggccacgcg cacaggggtt cggacgcccg   11100
ggccagcagg acgggggctt cgagggcggt gagccgggtt ccgagcacca gccgctgata   11160
gccggccatg g                                                        11171
<210>3
<211>711
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(711)
<400>3
atg tac gcc gac gac atc gcg gcc gtc tac gac ctg gtc cac gag ggg        48
Met Tyr Ala Asp Asp Ile Ala Ala Val Tyr Asp Leu Val His Glu Gly
  1               5                  10                  15
aag ggg aag gac tac cgg cag gag gcc gag gag atc gcc gca ctc gtg        96
Lys Gly Lys Asp Tyr Arg Gln Glu Ala Glu Glu Ile Ala Ala Leu Val
             20                  25                  30
cgc gtc cac cgg ccg ggc gcc cgg acc ctg ctc gac gtg gcc tgc ggc        144
Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cys Gly
         35                  40                  45
acc ggc cag cac ctg cac cac ctg gac ggc ctc ttc gac cac gtc gag        192
Thr Gly Gln His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu
     50                  55                  60
ggc ctg gaa ctc tcc gcc gac atg ctg gcc ctc gcg acc ggc cgg aac        240
Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn
65                  70                  75                  80
ccc ggt gtc acc ttc cac caa ggg gac atg cgc tcg ttc tcc ctg gga        288
Pro Gly Val Thr Phe His Gln Gly Asp Met Arg Ser Phe Ser Leu Gly
                 85                  90                  95
cgc cgg ttc gac gcg gtg acc tgc atg ttc agc tcc ata ggc cac ctg        336
Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser Ile Gly His Leu
            100                 105                 110
cgg acc acc gac gaa ctc gac agc acg ctg cgg gcc ttc acc gac cac        384
Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His
        115                 120                 125
ctc gaa ccg tcc ggc gtc atc gtc gtc gaa ccc tgg tgg ttc ccc gag        432
Leu Glu Pro Ser Gly Val Ile Val Val Glu Pro Trp Trp Phe Pro Glu
    130                 135                 140
tcc ttc acc ccc ggt tac gtc ggc gcc agc atc acg gag gcg ggc gag        480
Ser Phe Thr Pro Gly Tyr Val Gly Ala Ser Ile Thr Glu Ala Gly Glu
145                 150                 155                 160
cgc acc gtc tgc cgg gtc tcg cac tcc gta cgg gag ggg aac gcc acc  528
Arg Thr Val Cys Arg Val Ser His Ser Val Arg Glu Gly Asn Ala Thr
                165                 170                 175
cgc atc gag gtg cac tac ctc ctc gcc gga ccc ggc ggc gtc cgt cac  576
Arg Ile Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His
            180                 185                 190
ctg acc gag gac cac acc atc acc ctg ttc ccg cgc gcc gac tac gag  624
Leu Thr Glu Asp His Thr Ile Thr Leu Phe Pro Arg Ala Asp Tyr Glu
        195                 200                 205
gcg gcc ttc gag cgc gcc ggc tgc gac gtg gtc tac cag gaa ggc ggc  672
Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gln Glu Gly Gly
    210                 215                 220
ccg tcc ggt cgc ggg ctg ttc atc ggc acc cgc cgc tga              711
Pro Ser Gly Arg Gly Leu Phe Ile Gly Thr Arg Arg
225                 230                 235
<210>4
<211>236
<212>PRT
<213>生二素链霉菌
<400>4
Met Tyr Ala Asp Asp Ile Ala Ala Val Tyr Asp Leu Val His Glu Gly
  1               5                 10                  15
Lys Gly Lys Asp Tyr Arg Gln Glu Ala Glu Glu Ile Ala Ala Leu Val
             20                  25                  30
Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cys Gly
         35                  40                  45
Thr Gly Gln His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu
     50                  55                  60
Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn
 65                  70                  75                  80
Pro Gly Val Thr Phe His Gln Gly Asp Met Arg Ser Phe Ser Leu Gly
                 85                  90                  95
Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser Ile Gly His Leu
            100                 105                 110
Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His
        115                 120                 125
Leu Glu Pro Ser Gly Val Ile Val Val Glu Pro Trp Trp Phe Pro Glu
    130                 135                 140
Ser Phe Thr Pro Gly Tyr Val Gly Ala Ser Ile Thr Glu Ala Gly Glu
145                 150                 155                 160
Arg Thr Val Cys Arg Val Ser His Ser Val Arg Glu Gly Asn Ala Thr
                165                 170                 175
Arg Ile Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His
            180                 185                 190
Leu Thr Glu Asp His Thr Ile Thr Leu Phe Pro Arg Ala Asp Tyr Glu
        195                 200                 205
Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gln Glu Gly Gly
    210                 215                 220
Pro Ser Gly Arg Gly Leu Phe Ile Gly Thr Arg Arg
225                 230                 235
<210>5
<211>1272
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1272)
<400>5
atg ccc acc ctt gcc acg gaa acg gcc ccc gcg agc acg agc acg agc        48
Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser
  1               5                  10                  15
gcg gac acg agc acg ggc gtc cgt gcg ctc ggc cgt cgg ctc cag ctg        96
Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gln Leu
             20                  25                  30
acc cgg gcc gca cac tgg tgc gcc ggc aac cag ggc gac ccg tac gcg        144
Thr Arg Ala Ala His Trp Cys Ala Gly Asn Gln Gly Asp Pro Tyr Ala
         35                  40                  45
ctg atc ctg cgc gcc gtc gcc gac ccc gag ccg ttc gaa cgg gag atc        192
Leu Ile Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu Ile
     50                  55                  60
cgg gcc cgc gga ccg tgg ttc cgc agc gaa cag ctg gac gcc tgg gtg        240
Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gln Leu Asp Ala Trp Val
 65                  70                  75                  80
acc gcg gac ccc gag gtg gcg gcg gcc gtc ctg gcc gac ccg cgc ttc        288
Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe
                 85                  90                  95
ggc acg ctg gac cgg gcc gga cgc cgc ccg gac gag gaa ctg ctg ccc        336
Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro
            100                 105                 110
ctc gcc gag gcg ttc ccc cac cac gaa cgc gcg gag ctc gta cgc ctg       384
Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu
        115                 120                 125
cgg gcg ctg gcc gcc ccg gtg ctc agc cgg tac gcc ccg gcc cag gcg       432
Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gln Ala
    130                 135                 140
ccc tgc gcg gcg cgc acc acc gcc cgc aga gtg ctc ggc cgc ctg ctg        480
Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu
145                 150                 155                 160
ccc acc ggt gac gcc ggg ttc gac ctt gtc ggc gag gtc gcc cgg ccc        528
Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro
                165                 170                 175
tac gcc gtc gag ctg atg ctc agg ctc ctc gga gtg ccg ggc cgc gac        576
Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp
            180                 185                 190
cgc gcc acc gcc gcg cgg gca ctc gcc gcc tgc ggc ccc cag ctc gac        624
Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gln Leu Asp
        195                 200                 205
gcc cgg atg gcc ccg caa ctg ctg acc gtg gcc cgg gag tcc gcc gac        672
Ala Arg Met Ala Pro Gln Leu Leu Thr Val Ala Arg Glu Ser Ala Asp
    210                 215                 220
gcc gtc cgc aca ctg gcc gac ctg gtc ccc gag ctc gtc gcg gag aag        720
Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys
225                 230                 235                 240
tcc cgg ggc ctc ggg aac gcc gag ccc cgg ccc gac gac gtg ctc gcc        768
Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala
                245                 250                 255
ctc ctc ctg cac gac ggc gtc gcc ccc ggc gac gtc gag cgc atc gcg        816
Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg Ile Ala
            260                 265                 270
ctg ctc ctc gcg gtc ggc gca ccc gaa ccc gtc gtc acc gcc gtc gcg        864
Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala
        275                 280                 285
cac acg gtc cac cgg ctg ctc ggc cgg ccg ggg gag tgg gag agg gcc        912
His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala
    290                 295                 300
cgc cgg acg ccg gcc gcg gcg aac gcc gtc gac cag gtg ctg cgc gag        960
Arg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gln Val Leu Arg Glu
305                 310                 315                 320
cgc ccc ccg gcc cgg ctg gag aac cgg gtc gcg cac acc ggc ctc gaa        1008
Arg Pro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu
                325                 330                 335
ctc ggc ggc cgc cgg atc acc gcc gac gag cac gtc gtg gtg ctg gcc        1056
Leu Gly Gly Arg Arg Ile Thr Ala Asp Glu His Val Val Val Leu Ala
            340                 345                 350
gcc gcc gga cgg gag atc ccc ggg ccg gag ccg ctc ggg ggc gcc gac        1104
Ala Ala Gly Arg Glu Ile Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp
        355                 360                 365
gga ccg cac ctg gcg ctc gcc ctc ccg ctg atc cgc ctg gcc gcc acc        1152
Gly Pro His Leu Ala Leu Ala Leu Pro Leu Ile Arg Leu Ala Ala Thr
    370                 375                 380
acc gcg gtc cag gtc acg gcc ggc cgc ctg ccc ggc ctg cgg gcc gag        1200
Thr Ala Val Gln Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu
385                 390                 395                 400
gga ccg ccc ctg acc cgg ccg cgg tca ccg gtc ctg ggc gcc tgc gcc        1248
Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala
                405                 410                 415
cgc ctc cgg gtc cac ccg gga tga                                        1272
Arg Leu Arg Val His Pro Gly
            420
<210>6
<211>423
<212>PRT
<213>生二素链霉菌
<400>6
Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser
  1               5                  10                  15
Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gln Leu
             20                  25                  30
Thr Arg Ala Ala His Trp Cys Ala Gly Ash Gln Gly Asp Pro Tyr Ala
         35                  40                  45
Leu Ile Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu Ile
     50                  55                  60
Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gln Leu Asp Ala Trp Val
 65                  70                  75                  80
Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe
                 85                  90                  95
Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu pro
            100                 105                 110
Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu
        115                 120                 125
Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gln Ala
    130                 135                 140
Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu
145                 150                 155                 160
Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro
                165                 170                 175
Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp
            180                 185                 190
Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gln Leu Asp
        195                 200                 205
Ala Arg Met Ala Pro Gln Leu Leu Thr Val Ala Arg Glu Ser Ala Asp
    210                 215                 220
Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys
225                 230                 235                 240
Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala
                245                 250                 255
Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg Ile Ala
            260                 265                 270
Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala
        275                 280                 285
His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala
    290                 295                 300
Arg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gln Val Leu Arg Glu
305                 310                 315                 320
Arg Pro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu
                325                 330                 335
Leu Gly Gly Arg Arg Ile Thr Ala Asp Glu His Val Val Val Leu Ala
            340                 345                 350
Ala Ala Gly Arg Glu Ile Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp
        355                 360                 365
Gly Pro His Leu Ala Leu Ala Leu Pro Leu Ile Arg Leu Ala Ala Thr
    370                 375                 380
Thr Ala Val Gln Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu
385                 390                 395                 400
Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala
                405                 410                 415
Arg Leu Arg Val His Pro Gly
            420
<210>7
<211>1266
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1266)
<400>7
gtg cgc gtc ctg ctg aca tcc ctc gcc cac aac acc cac tac tac agt         48
Val Arg Val Leu Leu Thr Ser Leu Ala His Asn Thr His Tyr Tyr Ser
  1               5                  10                  15
ctg gtg ccc ctc gcc tgg gcg ctg cgc gcc gcc ggg cac gag gta cgg        96
Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg
             20                  25                  30
gtg gcg agc ccg ccc tcc ctc acc gac gtc atc acc tcc acc ggc ctg        144
Val Ala Ser Pro Pro Ser Leu Thr Asp Val Ile Thr Ser Thr Gly Leu
        35                  40                  45
acc gcc gta ccg gtg ggc gac gac cga ccg gcc gcg gag ctg ctc gcc        192
Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala
     50                  55                  60
gag atg ggc agc gac ctc gtc ccc tac cag cgg ggc ttc gag ttc ggt        240
Glu Met Gly Ser Asp Leu Val Pro Tyr Gln Arg Gly Phe Glu Phe Gly
 65                  70                  75                  80
gag gtg gag agc gag gag gag acc acc tgg gag tac ctg ctc ggc cag        288
Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gln
                 85                  90                  95
cag agc atg atg gcc gcc ctg tgc ttc gcc ccg ttc aac ggc gcc gcc        336
Gln Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala
            100                 105                 110
acg atg gac gag atc gtc gac ttc gcc cgt ggc tgg cgg ccc gac ctg        384
Thr Met Asp Glu Ile Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu
        115                 120                 125
gtc gtg tgg gaa ccc tgg acc tac gcg ggg ccg gtc gcg gcc cgc gcc        432
Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala
    130                 135                 140
tgc ggt gcc gcc cac gcg cgc atc ctg tgg ggc ccc gac gcc atc gga        480
Cys Gly Ala Ala His Ala Arg Ile Leu Trp Gly Pro Asp Ala Ile Gly
145                 150                 155                 160
cgc tcc cgc ctg cgc ttc ctc gcc gcc ctc gac ggg atg ccg gag gaa        528
Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu
                165                 170                 175
ctg cgc gag gac ccc atc gcc gaa tgg ctc ggc tgg acg ctg gac cgg        576
Leu Arg Glu Asp Pro Ile Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg
            180                 185                 190
tac ggg ctc gcc ttc gac gaa cgc gac gtg ctc ggc cac tgg gtg atc        624
Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val Ile
        195                 200                 205
gac ccg ggc ccg cgc agc acc cgc ctc gac ctg ggc cag acc acg gtg        672
Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gln Thr Thr Val
    210                 215                 220
ccc atg tgc tac gtg ccc tac aac ggg cgc tcc gtg atc gaa ccc tgg        720
Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val Ile Glu Pro Trp
225                 230                 235                 240
ctc ggc aag aag ccc gac cgc ccc cgc gtc tgc ctc acc ctc ggc gtg        768
Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val
                245                 250                 255
tcc gcc cgc gag acc tac ggc cgc gac gcg gtc tcc tac tcc gaa ctg        816
Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu
            260                 265                 270
ctg gag gcg ctc ggc cgg ctg gac atc gag gtg gtg gcc acc ctg gac        864
Leu Glu Ala Leu Gly Arg Leu Asp Ile Glu Val Val Ala Thr Leu Asp
        275                 280                 285
acc tcc cag ctc gac cgc ctg ggc acc ctc ccc gac aac gtc gtg ccc        912
Thr Ser Gln Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro
    290                 295                 300
gtg gac ttc gta ccg ctc gac gcg ctg ctg ccg agc tgc gcc gcg atc        960
Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala Ile
305                 310                 315                 320
atc cac cac ggc gga gcg ggc acc tgg tcc acc gcc ctg cgc cac gga       1008
Ile His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly
                325                 330                 335
gtg ccg cag atc ctg ctg ccc tcc ctg tgg gac gcg ccg ctc aag gcg       1056
Val Pro Gln Ile Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala
            340                 345                 350
cag caa ctc cag cgc ctg tcc gcc ggg ttc gac ctg ccc gcg gcg acg       1104
Gln Gln Leu Gln Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr
        355                 360                 365
ctc acg gcg cgc ggt ctg gcc gac gcg gtg cac acg gcc gtg cac gac       1152
Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp
    370                 375                 380
ccc gcg atc agg gcg ggc gcg cgg cgg ctg agc gag gag atg ctc gcc       1200
Pro Ala Ile Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala
385                 390                 395                 400
gac ccc acg ccc gcc ggg atc atc ccc acc ctg gag cgc ctc acc gcc        1248
Asp Pro Thr Pro Ala Gly Ile Ile Pro Thr Leu Glu Arg Leu Thr Ala
                405                 410                 415
ctg cac cgg gcc acc tga                                                1266
Leu His Arg Ala Thr
            420
<210>8
<211>421
<212>PRT
<213>生二素链霉菌
<400>8
Val Arg Val Leu Leu Thr Ser Leu Ala His Ash Thr His Tyr Tyr Ser
  1               5                  10                  15
Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg
             20                  25                  30
Val Ala Ser Pro Pro Ser Leu Thr Asp Val Ile Thr Ser Thr Gly Leu
         35                  40                  45
Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala
     50                  55                  60
Glu Met Gly Ser Asp Leu Val Pro Tyr Gln Arg Gly Phe Glu Phe Gly
 65                  70                  75                  80
Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gln
                 85                  90                  95
Gln Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala
            100                 105                 110
Thr Met Asp Glu Ile Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu
        115                 120                 125
Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala
    130                 135                 140
Cys Gly Ala Ala His Ala Arg Ile Leu Trp Gly Pro Asp Ala Ile Gly
145                 150                 155                 160
Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu
                165                 170                 175
Leu Arg Glu Asp Pro Ile Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg
            180                 185                 190
Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val Ile
        195                 200                 205
Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gln Thr Thr Val
    210                 215                 220
Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val Ile Glu Pro Trp
225                 230                 235                 240
Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val
                245                 250                 255
Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu
            260                 265                 270
Leu Glu Ala Leu Gly Arg Leu Asp Ile Glu Val Val Ala Thr Leu Asp
        275                 280                 285
Thr Ser Gln Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro
    290                 295                 300
Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala Ile
305                 310                 315                 320
Ile His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly
                325                 330                 335
Val Pro Gln Ile Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala
            340                 345                 350
Gln Gln Leu Gln Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr
        355                 360                 365
Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp
    370                 375                 380
Pro Ala Ile Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala
385                 390                 395                 400
Asp Pro Thr Pro Ala Gly Ile Ile Pro Thr Leu Glu Arg Leu Thr Ala
                405                 410                 415
Leu His Arg Ala Thr
            420
<210>9
<211>1350
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1350)
<400>9
atg ccc gaa agc cat gcg cag agc gcg ctg ctc gcc gcg atc acc gcc  48
Met Pro Glu Ser His Ala Gln Ser Ala Leu Leu Ala Ala Ile Thr Ala
  1               5                  10                  15
gcg gac cgc acc ccc gag gac atc gcg gcg ctg ccc ctg ccc gag tcc  96
Ala Asp Arg Thr Pro Glu Asp Ile Ala Ala Leu Pro Leu Pro Glu Ser
                 20                  25                  30
ttc cgc gcc gtg acc gtc cgc aaa gag gac acc gac atg ttc cgc ggg  144
Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly
             35                 40                 45
atg ccg agc gcg gac aag gac ccg cgc aag tcc ctg cac gtc gac gag  192
Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu
         50                  55                  60
gtg ccg ctg ccc gaa gtg ggg ccc ggg gag gcg ctg gtc gcg gtg atg  240
Val Pro Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met
 65                  70                  75                  80
gcc agc tcc gtc aac tac aac acg gtc tgg tcc tcc atc ttc gag ccc  288
Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser Ile Phe Glu Pro
                 85                  90                  95
ctc ccg acg ttc ggc ttc ctg gag cgc tac ggg cgc acc tcg ccg ctg    336
Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu
            100                 105                 110
gcc gcg cgc cac gac ctg ccg tac cac atc ctc ggt tcc gac ctg tcc    384
Ala Ala Arg His Asp Leu Pro Tyr His Ile Leu Gly Ser Asp Leu Ser
        115                 120                 125
ggc gtg gtg ctg cgc acg gga ccc ggc gtg aac gtc tgg aaa ccc ggt    432
Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly
    130                 135                 140
gac gag gtc gtc gcg cac tgt ctg tcg gtg gag ctg gag agc ccc gac    480
Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp
145                 150                 155                 160
ggg cac gac gac acc atg ctc gac ccg gcc cag cgc atc tgg ggc ttc    528
Gly His Asp Asp Thr Met Leu Asp Pro Ala Gln Arg Ile Trp Gly Phe
                165                 170                 175
gag acc aac ttc ggg ggc ctg gcc gag gtg gcc ctc gtc aag tcc aac    576
Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn
            180                 185                 190
cag ctg atg ccc aag gcg gcc cat ctg acc tgg gag gag gcc gcc gcg    624
Gln Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala
        195                 200                 205
ccc ggt ctg gtc aac tcc acc gcc tac cgc cag ctg gtc tcc cgc aac    672
Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gln Leu Val Ser Arg Asn
    210                 215                 220
ggc gcc ggc atg aag cag ggc gac aac gtg ctg atc tgg ggc gcc agc    720
Gly Ala Gly Met Lys Gln Gly Asp Asn Val Leu Ile Trp Gly Ala Ser
225                 230                 235                 240
ggc ggc ctg ggc tcg tac gcc acc cag ctg gcc ctc gcc ggc ggg gcc    768
Gly Gly Leu Gly Ser Tyr Ala Thr Gln Leu Ala Leu Ala Gly Gly Ala
            245                 250                 255
cac ccc gtc tgc gtg gtc tcc agc gcg cgc aag gcc gag gtg tgc cgg    816
His Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg
            260                 265                 270
gcc atg ggc gcg gag gcc atc atc gac cgc tcc gcc gag gac tac cgc    864
Ala Met Gly Ala Glu Ala Ile Ile Asp Arg Ser Ala Glu Asp Tyr Arg
        275                 280                 285
ttc tgg agc gac gag gac acc cag gac ccg cgg gag tgg aag cgc ttc    912
Phe Trp Ser Asp Glu Asp Thr Gln Asp Pro Arg Glu Trp Lys Arg Phe
    290                 295                 300
ggc aag cgc atc cgc gag gtc acc ggg ggc gag gac gtc gac atc gtc    960
Gly Lys Arg Ile Arg Glu Val Thr Gly Gly Glu Asp Val Asp Ile Val
305                 310                 315                 320
ttc gag cac ccc ggc cgg gag acc ttc ggg gcg tcc gtc tac gtc acc    1008
Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr
                325                 330                 335
cgc agg ggc ggc acg atc gtc acc tgc gcc tcc acc tcg ggc ttc cgc    1056
Arg Arg Gly Gly Thr Ile Val Thr Cys Ala Ser Thr Ser Gly Phe Arg
            340                 345                 350
cac gag ttc gac aac cgc tac ctc tgg atg cac ctc aag cgt atc gtc    1104
His Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg Ile Val
        355                 360                 365
ggc acc cac ttc gcc aac tac cgc gag gcg tgg gag gcg aac cgg ctc    1152
Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu
    370                 375                 380
gtc gcc aag ggg agg atc cac ccc acc ctc tcg cgc acc tac ccg ctg    1200
Val Ala Lys Gly Arg Ile His Pro Thr Leu Ser Arg Thr Tyr Pro Leu
385                 390                 395                 400
gcc gac acg gcg gtt gcc gtg cac gac gtg cac ggc aac cag cac cag    1248
Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gln His Gln
                405                 410                 415
ggc aag gtc ggc gtg ctc tgc ctg gcg ccc acg gag ggg ctg ggc gtg    1296
Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val
            420                 425                 430
cgc gac gag gag aag cgg gcg cgg cac atc gac gcg atc aac cgg ttc    1344
Arg Asp Glu Glu Lys Arg Ala Arg His Ile Asp Ala Ile Asn Arg Phe
        435                 440                 445
cgc tga                                                            1350
Arg
   450
<210>10
<211>449
<212>PRT
<213>生二素链霉菌
<400>10
Met Pro Glu Ser His Ala Gln Ser Ala Leu Leu Ala Ala Ile Thr Ala
  1               5                  10                  15
Ala Asp Arg Thr Pro Glu Asp Ile Ala Ala Leu Pro Leu Pro Glu Ser
             20                  25                  30
Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly
         35                  40                  45
Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu
     50                  55                  60
Val Pro Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met
 65                  70                  75                  80
Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser Ile Phe Glu Pro
                 85                  90                  95
Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu
            100                 105                 110
Ala Ala Arg His Asp Leu Pro Tyr His Ile Leu Gly Ser Asp Leu Ser
        115                 120                 125
Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly
    130                 135                 140
Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp
145                 150                 155                 160
Gly His Asp Asp Thr Met Leu Asp Pro Ala Gln Arg Ile Trp Gly Phe
                165                 170                 175
Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn
            180                 185                 190
Gln Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala
        195                 200                 205
Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gln Leu Val Ser Arg Asn
    210                 215                 220
Gly Ala Gly Met Lys Gln Gly Asp Asn Val Leu Ile Trp Gly Ala Ser
225                 230                 235                 240
Gly Gly Leu Gly Ser Tyr Ala Thr Gln Leu Ala Leu Ala Gly Gly Ala
                245                 250                 255
His Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg
            260                 265                 270
Ala Met Gly Ala Glu Ala Ile Ile Asp Arg Ser Ala Glu Asp Tyr Arg
        275                 280                 285
Phe Trp Ser Asp Glu Asp Thr Gln Asp Pro Arg Glu Trp Lys Arg Phe
    290                 295                 300
Gly Lys Arg Ile Arg Glu Val Thr Gly Gly Glu Asp Val Asp Ile Val
305                 310                 315                 320
Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr
                325                 330                 335
Arg Arg Gly Gly Thr Ile Val Thr Cys Ala Ser Thr Ser Gly Phe Arg
            340                 345                 350
His Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg Ile Val
        355                 360                 365
Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu
    370                 375                 380
Val Ala Lys Gly Arg Ile His Pro Thr Leu Ser Arg Thr Tyr Pro Leu
385                 390                 395                 400
Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gln His Gln
                405                 410                 415
Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val
            420                 425                 430
Arg Asp Glu Glu Lys Arg Ala Arg His Ile Asp Ala Ile Asn Arg Phe
        435                 440                 445
Arg
<210>11
<211>675
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(675)
<400>11
atg atg agc gtg gca gac cag acg gct ctc agc ccc gcg ctg ctg gag  48
Met Met Ser Val Ala Asp Gln Thr Ala Leu Ser Pro Ala Leu Leu Glu
  1               5                  10                  15
tac gcc cgg agc gtc gcg ctg cgg gac gac ggc ctg ctg cgc gaa ctg  96
Tyr Ala Arg Ser Val Ala Leu Arg Asp Asp Gly Leu Leu Arg Glu Leu
             20                  25                  30
cac gag gtg acc gcc ggg ctc ccc ggc ggc cgg gcc atg cag atc atg  144
His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gln Ile Met
         35                  40                  45
ccc gag gag gcg cag ttc ctc gcc ctg ctg atc cgg ctc gtc ggt gcc  192
Pro Glu Glu Ala Gln Phe Leu Ala Leu Leu Ile Arg Leu Val Gly Ala
 50                  55                  60
cgg cgg gtg ctg gag atc ggc acc ttc acg ggg tac agc acg ctg tgc  240
Arg Arg Val Leu Glu Ile Gly Thr Phe Thr Gly Tyr Ser Thr Leu Cys
 65                  70                  75                  80
atg gcg cgg gca ctg ccc gcc gac ggc acc gtc gtc acc tgc gac atc    288
Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp Ile
                 85                  90                  95
agc gac agg tgg ccc ggc gtc ggc gca ccg tac tgg cgc cgg gcc ggg    336
Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly
            100                 105                 110
gtg gag tcc cgg atc gac ctg cgc gtc ggc gac gcc gtc cgg acc ctc    384
Val Glu Ser Arg Ile Asp Leu Arg Val Gly Asp Ala Val Arg Thr Leu
        115                 120                 125
gcc gag ctc cgc gag cac gag ggg gac ggc tcg ttc gac ctg gtc ttc    432
Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe
    130                 135                 140
gtc gac gcc gac aag acc ggg tac ccg cac tac tac gag cag gcg ctg    480
Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gln Ala Leu
145                 150                 155                 160
gcc ctg gta cgc ccc ggc gga ctg gtg gcg gtc gac aac acc ctg ttc    528
Ala Leu Val Arg Pro Gly GIy Leu Val Ala Val Asp Asn Thr Leu Phe
                165                 170                 175
ttc ggc cgg gtg gcc gac ccg gcc gtc gag gac gcc gac acc gtc gcc    576
Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala
            180                 185                 190
gtg cgc gcg ctc aac gag ctg ctg cgc gac gac gaa cgc gtg gac atc    624
Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp Ile
        195                 200                 205
gcc ctg ctg acg gtc gcc gac ggg atc act ctg gcc cgc cgg cgg gag    672
Ala Leu Leu Thr Val Ala Asp Gly Ile Thr Leu Ala Arg Arg Arg Glu
    210                 215                 220
tga                                                                675
225
<210>12
<211>224
<212>PRT
<213>生二素链霉菌
<400>12
Met Met Ser Val Ala Asp Gln Thr Ala Leu Ser Pro Ala Leu Leu Glu
  1               5                  10                  15
Tyr Ala Arg Ser Val Ala Leu Arg Asp Asp Gly Leu Leu Arg Glu Leu
             20                  25                  30
His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gln Ile Met
         35                  40                  45
Pro Glu Glu Ala Gln Phe Leu Ala Leu Leu Ile Arg Leu Val Gly Ala
     50                  55                  60
Arg Arg Val Leu Glu Ile Gly Thr Phe Thr Gly Tyr Ser Thr Leu Cys
 65                  70                  75                  80
Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp Ile
                 85                  90                  95
Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly
            100                 105                 110
Val Glu Ser Arg Ile Asp Leu Arg Val Gly Asp Ala Val Arg Thr Leu
        115                 120                 125
Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe
    130                 135                 140
Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gln Ala Leu
145                 150                 155                 160
Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe
                165                 170                 175
Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala
            180                 185                 190
Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp Ile
        195                 200                 205
Ala Leu Leu Thr Val Ala Asp Gly Ile Thr Leu Ala Arg Arg Arg Glu
    210                 215                 220
<210>13
<211>1245
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1245)
<400>13
gtg ctc cag cgc gtc gat ctg tcg tca ctc acc ggc ctc cgc tgg tat  48
Val Leu Gln Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr
  1               5                  10                  15
gcg gcg ctg acg gta ttc gcc tgt cac atc gcc cag cag ggc ttc ttc  96
Ala Ala Leu Thr Val Phe Ala Cys His Ile Ala Gln Gln Gly Phe Phe
             20                  25                  30
gcc gac cag cag gtg ggc agc gca ctg ctg cac atc acc ccg ctc ggt  144
Ala Asp Gln Gln Val Gly Ser Ala Leu Leu His Ile Thr Pro Leu Gly
         35                  40                  45
tcc atg gcg gtc tcg atc ttc ttc ata ctg agt gga ttc gtc ctc gcc  192
Ser Met Ala Val Ser Ile Phe Phe Ile Leu Ser Gly Phe Val Leu Ala
     50                  55                  60
tgg tcg gcc cgc gac gag gac tcc gtg ccg act ttc tgg cgg cgc cgc  240
Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg
 65                  70                  75                  80
atc gcg aag atc tat ccg ctg cat ctc gcg acg ttc ggc atc gcg gct  288
Ile Ala Lys Ile Tyr Pro Leu His Leu Ala Thr Phe Gly Ile Ala Ala
                 85                  90                  95
ctc atc att ttc tcc ctg tcg gag ccg gta ctt ccc ggc ggt tcc gta  336
Leu Ile Ile Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val
            100                 105                 110
tgg gac ggg ctg gtg ccc aat gtt ctg ctc gtg cag tcc tgg ctt ccc  384
Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gln Ser Trp Leu Pro
        115                 120                 125
gac gcg acc ctc acg gcc agt ttc aac acg ccc agc tgg tcg ctc tcc    432
Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser
    130                 135                 140
tgt gag atc gcc ttc tat ctg tcg ttc ccg ctg tgg tac cgg ctg gtg    480
Cys Glu Ile Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val
145                 150                 155                 160
cgc agg att ccc gca cgg cgg ctg tgg tgg tgc gcc gcg ggg atc gcc    528
Arg Arg Ile Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly Ile Ala
                165                 170                 175
gtg gcc gtg acg tgt gtg ccc ctg ctg gcg ggc ctg ctc ccg gcg agc    576
Val Ala Val Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser
            180                 185                 190
gag gag gtg gcc ccc ggg atg tcg ctc aac gag gtc tgg ttc gcg tac    624
Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr
        195                 200                 205
tgg ctt ccg ccg gtg cgc atg ctg gag ttc gtc ctc ggc atc gtg atg    672
Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly Ile Val Met
    210                 215                 220
gcg ctg atc ctg cgc gcg ggg atc tgg aag ggc ccc ggt ccg gcg gtc    720
Ala Leu Ile Leu Arg Ala Gly Ile Trp Lys Gly Pro Gly Pro Ala Val
225                 230                 235                 240
tgc acg gcg ctc ctc gcc gcg agt tac ggc ctc acc cag atg gtg ccc    768
Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gln Met Val Pro
                245                 250                 255
ccg atc ttc acc ctc gtc gcc tgc tcc gtc gta ccg gcc gcg ctg ctg    816
Pro Ile Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu
            260                 265                 270
atc acg gcg ctg gcc gac gcc gac gtg cac ggc cgg cgc acg ggg ctg    864
Ile Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu
        275                 280                 285
cgt tcg gcg acg ctg gtg cgg ctg ggc cag tgg tcc ttc gcc ttc tac    912
Arg Ser Ala Thr Leu Val Arg Leu Gly Gln Trp Ser Phe Ala Phe Tyr
    290                 295                 300
ctg gtc cac ttc ctg atc atc cgc tac gga cac cgg ctg atg ggc ggc  960
Leu Val His Phe Leu Ile Ile Arg Tyr Gly His Arg Leu Met Gly Gly
305                 310                 315                 320
gat ctg ggc tac gag cgg cag tgg agc acc ccg gcc gcg atc gcg ctg  1008
Asp Leu Gly Tyr Glu Arg Gln Trp Ser Thr Pro Ala Ala Ile Ala Leu
                325                 330                 335
tcc ctg ggg atg ctg ggg gtg gcg gtc ctg gcc ggc ggt ctg ctg cac  1056
Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His
            340                 345                 350
acc gtc gtc gaa cag ccc tgc atg cgc ctg ttc ggc agc cgc agg tcc  1104
Thr Val Val Glu Gln Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser
        355                 360                 365
gcc tcc cgt ccg aag ccc ggc gcc acc gcg gct ccc cgg aac tca ccc  1152
Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Ash Ser Pro
    370                 375                 380
gcg gcc gac gcg gcc ggc gtg ccc ctg ctc ccg ggc gta ccc ggg ccc  1200
Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro
385                 390                 395                 400
gcg cac acc ccc gca gcg acg aac gaa ccc acc ccg aga gga tga      1245
Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly
                405                 410                 415
<210>14
<211>414
<212>PRT
<213>生二素链霉菌
<400>14
Val Leu Gln Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr
  1               5                  10                  15
Ala Ala Leu Thr Val Phe Ala Cys His Ile Ala Gln Gln Gly Phe Phe
             20                  25                  30
Ala Asp Gln Gln Val Gly Ser Ala Leu Leu His Ile Thr Pro Leu Gly
         35                  40                  45
Ser Met Ala Val Ser Ile Phe Phe Ile Leu Ser Gly Phe Val Leu Ala
     50                  55                  60
Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg
 65                  70                  75                  80
Ile Ala Lys Ile Tyr Pro Leu His Leu Ala Thr Phe Gly Ile Ala Ala
                 85                  90                  95
Leu Ile Ile Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val
            100                 105                 110
Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gln Ser Trp Leu Pro
        115                 120                 125
Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser
    130                 135                 140
Cys Glu Ile Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val
145                 150                 155                 160
Arg Arg Ile Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly Ile Ala
                165                 170                 175
Val Ala Val Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser
            180                 185                 190
Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr
        195                 200                 205
Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly Ile Val Met
    210                 215                 220
Ala Leu Ile Leu Arg Ala Gly Ile Trp Lys Gly Pro Gly Pro Ala Val
225                 230                 235                 240
Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gln Met Val Pro
                245                 250                 255
Pro Ile Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu
            260                 265                 270
Ile Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu
        275                 280                 285
Arg Ser Ala Thr Leu Val Arg Leu Gly Gln Trp Ser Phe Ala Phe Tyr
    290                 295                 300
Leu Val His Phe Leu Ile Ile Arg Tyr Gly His Arg Leu Met Gly Gly
305                 310                 315                 320
Asp Leu Gly Tyr Glu Arg Gln Trp Ser Thr Pro Ala Ala Ile Ala Leu
                325                 330                 335
Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His
            340                 345                 350
Thr Val Val Glu Gln Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser
        355                 360                 365
Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro
    370                 375                 380
Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro
385                 390                 395                 400
Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly
               405                  410
<210>15
<211>849
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(849)
<400>15
gtg aca ttg aaa tcc cca ctg cca ccg cga tcc gtc tcc gca ccc gct  48
Val Thr Leu Lys Ser Pro Leu Pro Pro Gln Ser Val Ser Ala Pro Ala
  1               5                  10                  15
gat tca cgc agc acc gcg cgg aga gaa tgg ggt cag aac ttc ttt cgt    96
Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gln Asn Phe Phe Arg
             20                  25                  30
aca gcc gcc gcg gcc tgt cgt ttc tcc gct cag ctg gac ggt tcg gac    144
Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gln Leu Asp Gly Ser Asp
         35                  40                  45
acc att ccg ccc gat tct ccg aat gac ctg atg acc gtc gaa ata ggc    192
Thr Ile Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu Ile Gly
    50                   55                  60
gcg gga tca ggg cgg gtg acc aaa gtg ctc gcc tca ccc ggg acg cct    240
Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro
 65                  70                  75                  80
tta ctc gcg gtg gaa ata gat ccc cgc tgg gct cgg cgg ctg gcc gcc    288
Leu Leu Ala Val Glu Ile Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala
                 85                  90                  95
gaa tcg ctg ccg gac gtc acg gtg gtg aac gag gat ttc ctg acc ctg    336
Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu
            100                 105                 110
caa ctg ccc ggg cag ccg gtc aga ctc atc ggg aat ctt ccc ttc gtc    384
Gln Leu Pro Gly Gln Pro Val Arg Leu Ile Gly Asn Leu Pro Phe Val
        115                 120                 125
acc ggc acc aga atg ctg agg cgc tgc ctc gac atg ggt ccg gcg cgc    432
Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg
    130                 135                 140
atg cgg cag ggc gtg ttc ctg ttg cag cgg gag tac gtg gga aag cgg    480
Met Arg Gln Gly Val Phe Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg
145                 150                 155                 160
acc gga gcc tgg ggc gga aac ctc ttc aac gcc cag tgg gag ccg tgg    528
Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp
                165                 170                 175
tac tcg ttc gac cgg ggc ctg gcc ttc tca cgc cag gac ttc acc ccc    576
Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gln Asp Phe Thr Pro
            180                 185                 190
gta ccg cgc gcg gac acc cag acc ctg atg gtc gcc ccg cac cgc agg  624
Val Pro Arg Ala Asp Thr Gln Thr Leu Met Val Ala Pro His Arg Arg
        195                 200                 205
ccg tcc gtg ccc tgg cgt gag aag gcc gcc tac cag cgg ttc gtc caa  672
Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gln Arg Phe Val Gln
    210                 215                 220
cgg gtc ttc gac acc ggc cag atg acg gtg ggc gac gcc gcg cgg aag  720
Arg Val Phe Asp Thr Gly Gln Met Thr Val Gly Asp Ala Ala Arg Lys
225                 230                 235                 240
gtg ctg cgc cgc gga cac gcc cag ttc gtg cgc ggg gcg ggc gtg agg  768
Val Leu Arg Arg Gly His Ala Gln Phe Val Arg Gly Ala Gly Val Arg
                245                 250                 255
ccg gcc gac cgg gtc aag gac ctc acg gtc ccg gag tgg acc gca ctc  816
Pro Ala Asp Arg Val Lys Asp Leu Thr Val Pro Glu Trp Thr Ala Leu
            260                 265                 270
ttc cgc gcc tac ggg cgg acg gcc gac cgc tga                      849
Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg
        275                 280
<210>16
<211>282
<212>PRT
<213>生二素链霉菌
<400>16
Val Thr Leu Lys Ser Pro Leu Pro Pro Gln Ser Val Ser Ala Pro Ala
  1               5                  10                  15
Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gln Asn Phe Phe Arg
             20                  25                  30
Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gln Leu Asp Gly Ser Asp
         35                  40                  45
Thr Ile Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu Ile Gly
     50                  55                  60
Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro
 65                  70                  75                  80
Leu Leu Ala Val Glu Ile Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala
                 85                  90                  95
Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu
            100                 105                 110
Gln Leu Pro Gly Gln Pro Val Arg Leu Ile Gly Asn Leu Pro Phe Val
        115                 120                 125
Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg
    130                 135                 140
Met Arg Gln Gly Val Phe Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg
145                 150                 155                 160
Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp
                165                 170                 175
Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gln Asp Phe Thr Pro
            180                 185                 190
Val Pro Arg Ala Asp Thr Gln Thr Leu Met Val Ala Pro His Arg Arg
        195                 200                 205
Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gln Arg Phe Val Gln
    210                 215                 220
Arg Val Phe Asp Thr Gly Gln Met Thr Val Gly Asp Ala Ala Arg Lys
225                 230                 235                 240
Val Leu Arg Arg Gly His Ala Gln Phe Val Arg Gly Ala Gly Val Arg
                245                 250                 255
Pro Ala Asp Arg Val Lys Asp Leu Thr Val Pro Glu Trp Thr Ala Leu
            260                 265                 270
Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg
    275                 280
<210>17
<211>831
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(831)
<400>17
gtg aag gag gtg gcg gtc gac acc ggt acc ccg gcc ggc ccc gtg tgg  48
Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp
  1               5                  10                  15
cgt ggt gcc ggc ctc ggc acc cag ctg tgg gta ctg acc gcg cgg cag  96
Arg Gly Ala Gly Leu Gly Thr Gln Leu Trp Val Leu Thr Ala Arg Gln
             20                  25                  30
atc cgt tcc atg tac ggc gac cgc cgc ctg gcg ctg ttc agc ctg atg  144
Ile Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met
         35                  40                  45
caa ccg gtg atc atg ctg ttg ctg ctg agc gag atc ttc ggc agc atg  192
Gln Pro Val Ile Met Leu Leu Leu Leu Ser Glu Ile Phe Gly Ser Met
    50                  55                  60
gcc gac ccg gac gac ttc ccg cag ggc gtg cgc tac atc gac tac gtg  240
Ala Asp Pro Asp Asp Phe Pro Gln Gly Val Arg Tyr Ile Asp Tyr Val
 65                  70                  75                  80
gtg ccc gcg ctg ctg gtc acc acc ggc atc ggc tcg gcc cag ggc gcg  288
Val Pro Ala Leu Leu Val Thr Thr Gly Ile Gly Ser Ala Gln Gly Ala
                 85                  90                  95
ggg gtg ggc ctg gtc agg gac atg gac aac ggg atg gtg gcg cgc ttc  336
Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe
            100                 105                 110
cgc gtc ctg ccg gcc cgg ctg ttc ctg gtg ctg gtc gcc cgg tcg ctg  384
Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu
        115                 120                 125
gcc gat ctg gtc cgt gtg ttc acc gag ttg gtc gtc ctc gtg gcc gtc  432
Ala Asp Leu Val Arg Val Phe Thr Glu Leu Val Val Leu Val Ala Val
    130                 135                 140
ggt gtg atc ctg ctg ggc ttc cgt ccg gcc ggg ggt ttg tgg ggc acg  480
Gly Val Ile Leu Leu Gly Phe Arg Pro Ala Gly Gly Leu Trp Gly Thr
145                 150                 155                 160
tcc gcc gcc ctg ttg ctc acc ctg ttc gtc atc tgg tcg ctg atc tgg  528
Ser Ala Ala Leu Leu Leu Thr Leu Phe Val Ile Trp Ser Leu Ile Trp
                165                 170                 175
ggg ttc atc gcc ctc gcg gcg tgg ctg cgc agc gtg gag gtg atg tcc  576
Gly Phe Ile Ala Leu Ala Ala Trp Leu Arg Ser Val Glu Val Met Ser
            180                 185                 190
agc ctc gcg gtt ctg gtg atg ttc ccg ctc atg ttc gcc tcc agt gcg  624
Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala
        195                 200                 205
ttc gtc ccg ctg gac gcc ctc ccg gag tgg ctg cgc tcg gtg gcg cac  672
Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala His
    210                 215                 220
ctc aac ccc gtg acg tac gcg gtc gac agc gcc cgc cgc ctg gcg ctg  720
Leu Asn Pro Val Thr Tyr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu
225                 230                 235                 240
gac tgg gac ccg ggg tgg agc gtg ccc ggc gcg ctg ctg acc agc acc  768
Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr
                245                 250                 255
gcg ctc atg gcg gtg ggg atg tac gtc gcc ggg cgt tcc ttc aag agg  816
Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg
            260                 265                 270
ccc ccg aac gaa tga                                              831
Pro Pro Asn Glu
        275
<210>18
<211>276
<212>PRT
<213>生二素链霉菌
<400>18
Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp
  1               5                  10                  15
Arg Gly Ala Gly Leu Gly Thr Gln Leu Trp Val Leu Thr Ala Arg Gln
             20                  25                  30
Ile Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met
         35                  40                  45
Gln Pro Val Ile Met Leu Leu Leu Leu Ser Glu Ile Phe Gly Ser Met
     50                  55                  60
Ala Asp Pro Asp Asp Phe Pro Gln Gly Val Arg Tyr Ile Asp Tyr Val
 65                  70                  75                  80
Val Pro Ala Leu Leu Val Thr Thr Gly Ile Gly Ser Ala Gln Gly Ala
                 85                  90                  95
Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe
            100                 105                 110
Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu
        115                 120                 125
Ala Asp Leu Val Arg Val Phe Thr Glu Leu Val Val Leu Val Ala Val
    130                 135                 140
Gly Val Ile Leu Leu Gly Phe Arg Pro Ala Gly Gly Leu Trp Gly Thr
145                 150                 155                 160
Ser Ala Ala Leu Leu Leu Thr Leu Phe Val Ile Trp Ser Leu Ile Trp
                165                 170                 175
Gly Phe Ile Ala Leu Ala Ala Trp Leu Arg Ser Val Glu Val Met Ser
            180                 185                 190
Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala
        195                 200                 205
Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala His
    210                 215                 220
Leu Asn Pro Val Thr Tyr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu
225                 230                 235                 240
Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr
                245                 250                 255
Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg
            260                 265                 270
Pro Pro Asn Glu
        275
<210>19
<211>882
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(882)
<400>19
gtg gac atc gag gtc gaa cgg ggc cgg gtg ctc ggg ctg ctg ggt cac  48
Val Asp Ile Glu Val Glu Arg Gly Arg Val Leu Gly Leu Leu Gly His
  1               5                  10                  15
aac ggg gcc ggc aag acg acc ttg gtg aac atc ctt gcc acg gtc tcc  96
Asn Gly Ala Gly Lys Thr Thr Leu Val Asn Ile Leu Ala Thr Val Ser
             20                  25                  30
ccg gcg tcc gcg ggc acg gtg acc gtc gcc ggt ttc gac gtc gcg acg  144
Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr
         35                  40                  45
cag ggc gcc gag atc cgc gcg cgc atc ggg gtg acc ggc cag ttc gcg  192
Gln Gly Ala Glu Ile Arg Ala Arg Ile Gly Val Thr Gly Gln Phe Ala
     50                  55                  60
tcg gtg gac gag tac ctg agc gga ttc cgc aac ctc gtc ctg atc ggc  240
Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu Ile Gly
 65                  70                  75                  80
cgc ctc ctc ggg gcg gga cgg cgt gag gcg gcg gcc cgg gcc acc gag    288
Arg Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu
                 85                  90                  95
ctc ctg gag ctg ttc gag ctg acc ggg gcg gcc cac cag ccc tcc cgc    336
Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gln Pro Ser Arg
            100                 105                 11O
acc tac tcg ggc ggg atg cgc cga cgg ctc gac ctc gcc gcc agc ctg    384
Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu
        115                 120                 125
gtc ggc cgg ccg gac gtg ctg ttc ctc gac gag ccg acg acc ggg ctg    432
Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu
    130                 135                 140
gac ccg gcg acc cgg atc gcc ctg tgg gag acg gtg gag aag ctg gtg    480
Asp Pro Ala Thr Arg Ile Ala Leu Trp Glu Thr Val Glu Lys Leu Val
145                 150                 155                 160
gcg ggc ggc acg acc gtc ctg ctg acc acc cag tac ctg gac gag gcg    528
Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gln Tyr Leu Asp Glu Ala
                165                 170                 175
gac cgg ctg gcc gac tgg atc acc gtc ctg tcg aag ggc cgg gtg gtg    576
Asp Arg Leu Ala Asp Trp Ile Thr Val Leu Ser Lys Gly Arg Val Val
            180                 185                 190
gcc tcg gac acc acc gac cgg ctc aag gcc gac ctg ggc cac cgg tcg    624
Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser
        195                 200                 205
gtg cgg gtg gtc ctt ccg ccc gcc gcc gac ctg acg gcc gcc gcc gcc    672
Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala
    210                 215                 220
gcg ctc acc gcc ggc ggg ttc cgt ccg cgg tcc gac gcc ggg gag cac    720
Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His
225                 230                 235                 240
gcg ctg acc acg ccc gtg gac acc tcg gcc ggt atc gcg ggc gtc atc    768
Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly Ile Ala Gly Val Ile
                245                 250                 255
cgc gcg ctg gac acc gtc gga acg cag gcc gtc gag ctg acc gtc aag 816
Arg Ala Leu Asp Thr Val Gly Thr Gln Ala Val Glu Leu Thr Val Lys
            260                 265                 270
gag ccg tcc ctg gac gac gtc tac ctg gcg ctc acc cat ccc tca ccc 864
Glu Pro Ser Leu Asp Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro
        275                 280                 285
gcc gcc gac gcg gcc tga                                         882
Ala Ala Asp Ala Ala
    290
<210>20
<211>293
<212>PRT
<213>生二素链霉菌
<400>20
Val Asp Ile Glu Val Glu Arg Gly Arg Val Leu Gly Leu Leu Gly His
  1               5                  10                  15
Asn Gly Ala Gly Lys Thr Thr Leu Val Asn Ile Leu Ala Thr Val Ser
             20                  25                  30
Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr
         35                  40                  45
Gln Gly Ala Glu Ile Arg Ala Arg Ile Gly Val Thr Gly Gln Phe Ala
     50                  55                  60
Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu Ile Gly
 65                  70                  75                  80
Arg Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu
                 85                  90                  95
Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gln Pro Ser Arg
            100                 105                 110
Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu
        115                 120                 125
Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu
    130                 135                 140
Asp Pro Ala Thr Arg Ile Ala Leu Trp Glu Thr Val Glu Lys Leu Val
145                 150                 155                 160
Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gln Tyr Leu Asp Glu Ala
                165                 170                 175
Asp Arg Leu Ala Asp Trp Ile Thr Val Leu Ser Lys Gly Arg Val Val
            180                 185                 190
Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser
        195                 200                 205
Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala
    210                 215                 220
Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His
225                 230                 235                 240
Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly Ile Ala Gly Val Ile
                245                 250                 255
Arg Ala Leu Asp Thr Val Gly Thr Gln Ala Val Glu Leu Thr Val Lys
            260                 265                 270
Glu Pro Ser Leu Asp Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro
        275                  280                 285
Ala Ala Asp Ala Ala
    290
<210>21
<211>228
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(228)
<400>21
atg agc aac ccg ttc gag gac acg gaa gcc acc tac gtc gtg ctg gtc  48
Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val
  1               5                  10                  15
aac gac gag ggg cag cac tcg ctg tgg ccg tcg ttc gcg gag gtc ccg  96
Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro
             20                  25                  30
gcg ggc tgg tcc gtc gtg gtg ccg gag acg gac cgg cag tcg tgc ctg  144
Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gln Ser Cys Leu
         35                  40                  45
gac tac atc aac gag aac tgg acc gac atg cgc ccc aag agc ctc gtc  192
Asp Tyr Ile Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val
     50                  55                  60
gag gcg atg gcg acg gcc ggg cag gac gcc cct tga                  228
Glu Ala Met Ala Thr Ala Gly Gln Asp Ala Pro
 65                  70                  75
<210>22
<211>75
<212>PRT
<213>生二素链霉菌
<400>22
Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val
  1               5                  10                  15
Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro
             20                  25                  30
Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gln Ser Cys Leu
         35                  40                  45
Asp Tyr Ile Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val
     50                  55                  60
Glu Ala Met Ala Thr Ala Gly Gln Asp Ala Pro
 65                  70                  75
<210>23
<211>1212
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1212)
<400>23
atg ggt gag gcc gtg acg gga ccg atg gag ctg agc aag gac gcg gac  48
Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp
  1               5                  10                  15
gcc cgg ggg ctg ctt gag tgg ttc gcg tac aac agg acg cgt cat ccg  96
Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro
             20                  25                  30
gtg ttc tgg gac gag acc cga cag gcg tgg cag gtc ttc ggc tac gac  144
Val Phe Trp Asp Glu Thr Arg Gln Ala Trp Gln Val Phe Gly Tyr Asp
         35                  40                  45
gac tac gtg acg gtg tcg aac aac ccg cag ttc ttc tcc tcg gac ttc  192
Asp Tyr Val Thr Val Ser Asn Ash Pro Gln Phe Phe Ser Ser Asp Phe
     50                  55                  60
aac atg gtg atg ccg acg ccg ccc gaa ctg gag atg atc atc ggt ccg  240
Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met Ile Ile Gly Pro
 65                  70                  75                  80
ggc acg atc ggc gcg ctg gac ccg ccc gcg cac gga ccg atg cgc aag  288
Gly Thr Ile Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arg Lys
                 85                  90                  95
ctg gtg agc cag gcg ttc acc ccc cga cgg atc gcc cgg ctg gag ccc  336
Leu Val Ser Gln Ala Phe Thr Pro Arg Arg Ile Ala Arg Leu Glu Pro
            100                 105                 110
agg gtg cgc gcg atc acc gag gag ctc ctg gac aag gtg ggg cag cag  384
Arg Val Arg Ala Ile Thr Glu Glu Leu Leu Asp Lys Val Gly Gln Gln
        115                 120                 125
gac gtc gtc gac gcc gtg ggt gac ctg tcc tac gcg ctg ccg gtc atc  432
Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val Ile
    130                 135                 140
gtg atc gcc gaa ctg ctg ggc ata ccc gcc ggc gac cgt gac ctg ttc    480
Val Ile Ala Glu Leu Leu Gly Ile Pro Ala Gly Asp Arg Asp Leu Phe
145                 150                 155                 160
cgg gag tgg gtc gac acc ctg ctg acg aac gag ggc ctg gag tac ccg    528
Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro
                165                 170                 175
aac ctc ccg gac aac ttc acc gag acg atc gcg ccc gcg ctc aag gag    576
Asn Leu Pro Asp Asn Phe Thr Glu Thr Ile Ala Pro Ala Leu Lys Glu
            180                 185                 190
atg acc gac tac ctc ctg aag cag atc cac gcc aag cgg gac gcg ccc    624
Met Thr Asp Tyr Leu Leu Lys Gln Ile His Ala Lys Arg Asp Ala Pro
        195                 200                 205
gcc gac gac ctg gtc agc ggg ctg gtc cag gcg gag cag gac ggc cgc    672
Ala Asp Asp Leu Val Ser Gly Leu Val Gln Ala Glu Gln Asp Gly Arg
    210                 215                 220
cgg ctg acc gac gtc gag atc gtc aac atc gtc gcg ctg ctc ctg acg    720
Arg Leu Thr Asp Val Glu Ile Val Asn Ile Val Ala Leu Leu Leu Thr
225                 230                 235                 240
gcg ggg cac gtc tcc tcc agc acc ctg ctc agc aac ctg ttc ctg gtc    768
Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val
                245                 250                 255
ctg gag gag aac ccg cag gcg ctg gag gac ctg cgg gcc gat cgc tcc    816
Leu Glu Glu Asn Pro Gln Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser
            260                 265                 270
ctg gtg ccc ggc gcg atc gag gag acg ctg cgc tac cgc agc ccc ttc    864
Leu Val Pro Gly Ala Ile Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe
        275                 280                 285
aac aac atc ttc cgg ttc gtc aag gag gac acc acc gtc ctc ggt ccg    912
Asn Asn Ile Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro
    290                 295                 300
ctc atg gag aag ggc cag atg gtg atc gcc tgg agc cag tcc gcc aac    960
Leu Met Glu Lys Gly Gln Met Val Ile Ala Trp Ser Gln Ser Ala Asn
305                 310                 315                 320
cgg gac ccc cgg cac ttc ccg gac ccg gac acc ttc gac atc cgc cgc  1008
Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp Ile Arg Arg
                325                 330                 335
tcg gac ggc acc cgg cac atg gcc ttc ggg cac ggc atc cac cac tgc  1056
Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly Ile His His Cys
            340                 345                  350
ctg ggt gcc gcc ctc gcc cgc ctg gag ggc aag gtc atg ctc gaa ctc  1104
Leu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu Leu
        355                 360                 365
ctc ctg gac cgg gtc caa ggc ttc cgc atc gac cac gag cac acc gtg  1152
Leu Leu Asp Arg Val Gln Gly Phe Arg Ile Asp His Glu His Thr Val
    370                 375                 380
ttc tac gag gcc gac cag ctc act ccg aag tac ctg ccc gtc cgg gtc  1200
Phe Tyr Glu Ala Asp Gln Leu Thr Pro Lys Tyr Leu Pro Val Arg Val
385                 390                 395                 400
gac tgg aac tga                                                  1212
Asp Trp Asn
<210>24
<211>403
<212>PRT
<213>生二素链霉菌
<400>24
Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp
  1               5                  10                  15
Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro
             20                  25                  30
Val Phe Trp Asp Glu Thr Arg Gln Ala Trp Gln Val Phe Gly Tyr Asp
         35                  40                  45
Asp Tyr Val Thr Val Ser Asn Asn Pro Gln Phe Phe Ser Ser Asp Phe
     50                  55                  60
Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met Ile Ile Gly Pro
 65                  70                  75                  80
Gly Thr Ile Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arg Lys
                 85                  90                  95
Leu Val Ser Gln Ala Phe Thr Pro Arg Arg Ile Ala Arg Leu Glu Pro
            100                 105                 110
Arg Val Arg Ala Ile Thr Glu Glu Leu Leu Asp Lys Val Gly Gln Gln
        115                 120                 125
Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val Ile
    130                 135                 140
Val Ile Ala Glu Leu Leu Gly Ile Pro Ala Gly Asp Arg Asp Leu Phe
145                 150                 155                 160
Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro
                165                 170                 175
Asn Leu Pro Asp Asn Phe Thr Glu Thr Ile Ala Pro Ala Leu Lys Glu
            180                 185                 190
Met Thr Asp Tyr Leu Leu Lys Gln Ile His Ala Lys Arg Asp Ala Pro
        195                 200                 205
Ala Asp Asp Leu Val Ser Gly Leu Val Gln Ala Glu Gln Asp Gly Arg
    210                 215                 220
Arg Leu Thr Asp Val Glu Ile Val Asn Ile Val Ala Leu Leu Leu Thr
225                 230                 235                 240
Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val
                245                 250                 255
Leu Glu Glu Asn Pro Gln Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser
            260                 265                 270
Leu Val Pro Gly Ala Ile Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe
        275                 280                 285
Asn Asn Ile Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro
    290                 295                 300
Leu Met Glu Lys Gly Gln Met Val Ile Ala Trp Ser Gln Ser Ala Asn
305                 310                 315                 320
Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp Ile Arg Arg
                325                 330                 335
Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly Ile His His Cys
            340                 345                 350
Leu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu Leu
        355                 360                 365
Leu Leu Asp Arg Val Gln Gly Phe Arg Ile Asp His Glu His Thr Val
    370                 375                 380
Phe Tyr Glu Ala Asp Gln Leu Thr Pro Lys Tyr Leu Pro Val Arg Val
385                 390                 395                 400
Asp Trp Asn
<210>25
<211>540
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(540)
<220>
<221>CDS
<222>(190)..(540)
<400>25
ctg aac ccg agg gtc tcg tcc cgg agt cca ggg ccg tcc cga gcc ggc  48
Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly
  1               5                  10                  15
cct gga cct cac gac cgc ccg ata agg agc gcc gcc atc gcc gag aac  96
Pro Gly Pro His Asp Arg Pro Ile Arg Ser Ala Ala Ile Ala Glu Asn
             20                  25                  30
aca gcc gag ctc cct gcc cgg cgg gtc ggc agg atc aag ccg tgc cgg    144
Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg Ile Lys Pro Cys Arg
         35                  40                  45
ctg atc agg ctc gag cag cac atc gac ccg cgc ggc agc ctc tcc gtg    192
Leu Ile Arg Leu Glu Gln His Ile Asp Pro Arg Gly Ser Leu Ser Val
     50                  55                  60
atc gag tcc ggc gtg acc gtg gac ttc ccc gtc cga cgc gtc tac tac    240
Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr
 65                  70                  75                  80
atg cat ggc cag acc cag tcc tct ccc ccg cgc ggc ctg cac gcg cac    288
Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala His
                 85                  90                  95
cgc acc ctg gaa caa ctc gtc atc gcc gtc cac ggc gcc ttc tcc atc    336
Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser Ile
            100                 105                 110
acc ctc gac gac ggc ttc cag cac gcc acc tac cgt ctg gac gaa ccc    384
Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu Pro
        115                 120                 125
gga gcc gga ctc tgc atc ggc ccc atg gtc tgg cgc gtc ctg aag gac    432
Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys Asp
    130                 135                 140
ttc gac ccc gac acc gtg gcc ctg gtc ctc gcc tcg cag cac tac gag    480
Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr Glu
145                 150                 155                 160
gag tcc gac tac tac cgc gac tac gac acc ttc ctg cat gac gca cgg    528
Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala Arg
                165                 170                 175
agc ctc aca tga                                                    540
Ser Leu Thr
            180
<210>26
<211>179
<212>PRT
<213>生二素链霉菌
<400>26
Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly
  1               5                  10                  15
Pro Gly Pro His Asp Arg Pro Ile Arg Ser Ala Ala Ile Ala Glu Asn
             20                  25                  30
Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg Ile Lys Pro Cys Arg
         35                  40                  45
Leu Ile Arg Leu Glu Gln His Ile Asp Pro Arg Gly Ser Leu Ser Val
     50                  55                  60
Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr
 65                  70                  75                  80
Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala His
                 85                  90                  95
Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser Ile
            100                 105                 110
Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu Pro
        115                 120                 125
Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys Asp
    130                 135                 140
Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr Glu
145                 150                 155                 160
Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala Arg
                165                 170                 175
Ser Leu Thr
<210>27
<211>116
<212>PRT
<213>生二素链霉菌
<400>27
Val Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr
  1               5                  10                  15
Tyr Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala
             20                  25                  30
His Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser
         35                  40                  45
Ile Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu
     50                  55                  60
Pro Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys
 65                  70                  75                  80
Asp Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr
                 85                  90                  95
Glu Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala
            100                 105                 110
Arg Ser Leu Thr
        115
<210>28
<211>1167
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1167)
<400>28
atg acc atc ccc ttc ctc gac gcg ggc gcc ggc tac cgg gag ttg cga  48
Met Thr Ile Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg
  1               5                  10                  15
gcc gag atc gac gcg gcc ctg cag cgg gtg tcc gcc tcc ggc cgc tat  96
Ala Glu Ile Asp Ala Ala Leu Gln Arg Val Ser Ala Ser Gly Arg Tyr
             20                  25                  30
ctg ctc gac gcg gaa ctc gcg gcc ttc gag gag gag ttc gcc gcg tac    144
Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr
         35                  40                  45
tgc gac aac gac cac tgt gtg gcg gtg ggc agt ggc tgc gac gcg ctg    192
Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu
     50                  55                  60
gag ctg tcc ctg cgg gcg ctg gac atc ggt ccc ggg gac gag gtg gtg    240
Glu Leu Ser Leu Arg Ala Leu Asp Ile Gly Pro Gly Asp Glu Val Val
 65                  70                  75                  80
gtg ccc gcg cac acc ttc atc ggg acc tgg ctg gcc gtg tcc gct acc    288
Val Pro Ala His Thr Phe Ile Gly Thr Trp Leu Ala Val Ser Ala Thr
                 85                  90                  95
ggg gca cgg ccg gtg gcc gtc gac ccg acg ccg gac ggg ctc tcc ctc    336
Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu
            100                 105                 110
gac ccg gcg ctg gtg gag gcg gcg ctc acc cct cgg acc aga gcc ctg    384
Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu
        115                 120                 125
atg ccg gtg cac ctg cac ggg cac ccg gcc gac ctc gac ccg cta ctg    432
Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu
    130                 135                 140
gcg atc gcc gga cgg cac ggc ctg gcc gtg gtc gag gac gcc gcg cag    480
Ala Ile Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gln
145                 150                 155                 160
gcc cac ggc gcc cgt tac cgg ggc cgc agg atc ggc tcg ggc cac gtg    528
Ala His Gly Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Val
                165                 170                 175
gtc gcg ttc agc ttc tac ccc ggc aag aac ctc ggc gcc atg ggg gac    576
Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp
            180                 185                 190
ggc ggc gcg gtg gtc acg ggt gac tcc ggt gtg gcc gag cgg atc cgg    624
Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg Ile Arg
        195                 200                 205
ttg ctg cgc aac tgc ggc tcg cgg gag aag tac cgg cac gag gtg cgc    672
Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Val Arg
    210                 215                 220
tcg acc cac tcc cgg ctc gac gag ttc cag gcg gcc gtg ctg cgg gcc    720
Ser Thr His Ser Arg Leu Asp Glu Phe Gln Ala Ala Val Leu Arg Ala
225                 230                 235                 240
aaa ctg ccg cgg ctc gac gcg tgg aac gcc cgc cgg gcc ggc acg gcc    768
Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala
                245                 250                 255
gaa cgg tac ggg cgg gcc ctg ggt ccg gta ccg cag atc gcc gtc ccg    816
Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gln Ile Ala Val Pro
            260                 265                 270
gtc acc gct ccc tgg gcc gac ccg gtg tgg cac ctg tac gtg atc cgc    864
Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val Ile Arg
        275                 280                 285
tgc gcg gag cgc gac gag ctg cgc cgc cgg ctg gaa cga gcc ggg gtc    912
Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val
    290                 295                 300
cag acc ctg atc cac tac ccc gtg ccc ccg cac cgg tcc ccg gcc tac    960
Gln Thr Leu Ile His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr
305                 310                 315                 320
gcc gac gac ccg gcc ggc gca ccg gcg ggg acc cac ccg ctc agt gag    1008
Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu
                325                 330                 335
cgc ctg gcg gcg cag agc ctc agc ctt ccc ctg gga ccg cac ctc ggg    1056
Arg Leu Ala Ala Gln Ser Leu Ser Leu Pro Leu Gly Pro His Leu Gly
            340                 345                 350
gag gac gag gcc cgc gcc gtc gtg gcg gcg gtc cgg gcg gcg tcc gca    1104
Glu Asp Glu Ala Arg Ala Val Val Ala Ala Val Arg Ala Ala Ser Ala
        355                 360                 365
ggg ctg gcg gcg tac ccg acg ccg gac ggc cag cgt ttt cct cta gtg    1152
Gly Leu Ala Ala Tyr Pro Thr Pro Asp Gly Gln Arg Phe Pro Leu Val
    370                 375                 380
acg gag aaa cga tga                                              1167
Thr Glu Lys Arg
385
<210>29
<211>388
<212>PRT
<213>生二素链霉菌
<400>29
Met Thr Ile Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg
  1               5                  10                  15
Ala Glu Ile Asp Ala Ala Leu Gln Arg Val Ser Ala Ser Gly Arg Tyr
             20                  25                  30
Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr
         35                  40                  45
Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu
    50                  55                  60
Glu Leu Ser Leu Arg Ala Leu Asp Ile Gly Pro Gly Asp Glu Val Val
 65                  70                  75                  80
Val Pro Ala His Thr Phe Ile Gly Thr Trp Leu Ala Val Ser Ala Thr
                 85                  90                  95
Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu
            100                 105                 110
Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu
        115                 120                 125
Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu
    130                 135                 140
Ala Ile Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gln
145                 150                 155                 160
Ala His Gly Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Val
                165                 170                 175
Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp
            180                 185                 190
Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg Ile Arg
        195                 200                 205
Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Val Arg
    210                 215                 220
Ser Thr His Ser Arg Leu Asp Glu Phe Gln Ala Ala Val Leu Arg Ala
225                 230                 235                 240
Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala
                245                 250                 255
Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gln Ile Ala Val Pro
            260                 265                 270
Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val Ile Arg
        275                 280                 285
Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val
    290                 295                 300
Gln Thr Leu Ile His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr
305                 310                 315                 320
Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu
                325                 330                 335
Arg Leu Ala Ala Gln Ser Leu Ser Leu Pro Leu Gly Pro His Leu Gly
            340                 345                 350
Glu Asp Glu Ala Arg Ala Val Val Ala Ala Val Arg Ala Ala Ser Ala
        355                 360                 365
Gly Leu Ala Ala Tyr Pro Thr Pro Asp Gly Gln Arg Phe Pro Leu Val
    370                 375                 380
Thr Glu Lys Arg
385
<210>30
<211>909
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(909)
<220>
<221>CDS
<222>(10)..(909)
<220>
<221>CDS
<222>(28)..(909)
<400>30
atg acc gag gtc atg tca ggg cgt ccc gga atg aaa ggg atc atc ctc 48
Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu
  1               5                  10                  15
gca ggc ggc gga ggg acc cgc cta cgc ccc ttg acc ggc acg ctg tcc 96
Ala Gly Gly Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser
             20                  25                  30
aag caa ctg ctg ccc gtc tac gac aag ccg atg atc tac tac ccg ctg 144
Lys Gln Leu Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu
         35                  40                  45
tcc gtc ctg atg ctg ggc ggc atc cgc gag atc ctc gtc gtc tcc tcc 192
Ser Val Leu Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser
     50                  55                  60
acc cag cac atc gag ctg ttc cag cgg ctg ctg ggc gac ggc tcc cgc  240
Thr Gln His Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp Gly Ser Arg
 65                  70                  75                  80
ctc ggc ctc gac atc acc tac gcc gaa cag gcc gag ccc gag ggc ata  288
Leu Gly Leu Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile
                  85                 90                  95
gcg cag gcc atc acc atc ggc acc gac cac atc ggc gac tca ccg gtc    336
Ala Gln Ala Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val
            100                 105                 110
gcg ctc atc ctg ggc gac aac atc ttc cac ggc ccc ggc ttc tcg gcc    384
Ala Leu Ile Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala
        115                 120                 125
gtg ctc cag ggc agc atc cgc cac ctc gac ggc tgt gtg ctg ttc ggc    432
Val Leu Gln Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly
    130                 135                 140
tac ccg gtc agc gac ccg aag cgc tac ggc gtc ggc gag atc gac gac    480
Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp
145                 150                 155                 160
cag ggc gta ctg ctg tcc ctg gag gag aaa ccg gcc cgg ccc cgc tcc    528
Gln Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser
                165                 170                 175
aac ctc gcc gtc acc ggc ctc tac ctc tac gac aac gac gtg gtc gac    576
Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp
            180                 185                 190
atc gcc aag aac atc cgg ccc tcg gcg cgc ggc gaa ctc gag atc acg    624
Ile Ala Lys Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr
        195                 200                 205
gac gtc aac agg acc tac ctg gag cag aaa cgc gcc cgg ctc atc gaa    672
Asp Val Asn Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu
    210                 215                 220
ctg ggc cac ggc ttc gcc tgg ctc gac atg ggc acc cac gac tcc ctc    720
Leu Gly His Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu
225                 230                 235                 240
ctc cag ggc ggc cag tac gtc cag ctc atc gag cag cgc cag gga gtg    768
Leu Gln Gly Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val
                245                 250                 255
cgg atc gcc tgc atc gag gag atc gcc ctg cgc atg ggc ttc atc gac    816
Arg Ile Ala Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp
            260                 265                 270
gcc gac acc ctc cac cgg ctc ggc cgc gaa ctg ggc acc tcc gga tac 864
Ala Asp Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr
        275                 280                 285
ggc gcg tac ctg atg gag gtg gcc acc cgt gca ggc acc gaa tga     909
Gly Ala Tyr Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu
    290                 295                 300
<210>31
<211>302
<212>PRT
<213>生二素链霉菌
<400>31
Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu
  1               5                  10                  15
Ala Gly Gly Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser
             20                  25                  30
Lys Gln Leu Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu
         35                  40                  45
Ser Val Leu Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser
     50                  55                  60
Thr Gln His Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp Gly Ser Arg
 65                  70                  75                  80
Leu Gly Leu Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile
                 85                  90                  95
Ala Gln Ala Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val
            100                 105                 110
Ala Leu Ile Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala
        115                 120                 125
Val Leu Gln Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly
    130                 135                 140
Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp
145                 150                 155                 160
Gln Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser
                165                 170                 175
Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp
            180                 185                 190
Ile Ala Lys Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr
        195                 200                 205
Asp Val Asn Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu
    210                 215                 220
Leu Gly His Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu
225                 230                 235                 240
Leu Gln Gly Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val
                245                 250                 255
Arg Ile Ala Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp
            260                 265                 270
Ala Asp Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr
        275                 280                 285
Gly Ala Tyr Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu
    290                 295                 300
<210>32
<211>299
<212>PRT
<213>生二素链霉菌
<400>32
Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu Ala Gly Gly
  1               5                  10                  15
Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser Lys Gln Leu
             20                  25                  30
Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu Ser Val Leu
         35                  40                  45
Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser Thr Gln His
     50                  55                  60
Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp GIy Ser Arg Leu Gly Leu
 65                  70                  75                  80
Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile Ala Gln Ala
                 85                  90                  95
Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val Ala Leu Ile
            100                 105                 110
Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala Val Leu Gln
        115                 120                 125
Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly Tyr Pro Val
    130                 135                 140
Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp Gln Gly Val
145                 150                 155                 160
Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala
                165                 170                 175
Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp Ile Ala Lys
            180                 185                 190
Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr Asp Val Asn
        195                 200                 205
Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu Leu Gly His
    210                 215                 220
Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu Leu Gln Gly
225                 230                 235                 240
Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val Arg Ile Ala
                245                 250                 255
Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp Ala Asp Thr
            260                 265                 270
Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr Gly Ala Tyr
        275                 280                 285
Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu
    290                 295
<210>33
<211>293
<212>PRT
<213>生二素链霉菌
<400>33
Gly Met Lys Gly Ile Ile Leu Ala Gly Gly Gly Gly Thr Arg Leu Arg
  1               5                  10                  15
Pro Leu Thr Gly Thr Leu Ser Lys Gln Leu Leu Pro Val Tyr Asp Lys
             20                  25                  30
Pro Met Ile Tyr Tyr Pro Leu Ser Val Leu Met Leu Gly Gly Ile Arg
         35                  40                  45
Glu Ile Leu Val Val Ser Ser Thr Gln His Ile Glu Leu Phe Gln Arg
     50                  55                  60
Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu Asp Ile Thr Tyr Ala Glu
 65                  70                  75                  80
Gln Ala Glu Pro Glu Gly Ile Ala Gln Ala Ile Thr Ile Gly Thr Asp
                 85                  90                  95
His Ile Gly Asp Ser Pro Val Ala Leu Ile Leu Gly Asp Asn Ile Phe
            100                 105                 110
His Gly Pro Gly Phe Ser Ala Val Leu Gln Gly Ser Ile Arg His Leu
        115                 120                 125
Asp Gly Cys Val Leu Phe Gly Tyr Pro Val Ser Asp Pro Lys Arg Tyr
    130                 135                 140
Gly Val Gly Glu Ile Asp Asp Gln Gly Val Leu Leu Ser Leu Glu Glu
145                 150                 155                 160
Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala Val Thr Gly Leu Tyr Leu
                165                 170                 175
Tyr Asp Asn Asp Val Val Asp Ile Ala Lys Asn Ile Arg Pro Ser Ala
            180                 185                 190
Arg Gly Glu Leu Glu Ile Thr Asp Val Asn Arg Thr Tyr Leu Glu Gln
        195                 200                 205
Lys Arg Ala Arg Leu Ile Glu Leu Gly His Gly Phe Ala Trp Leu Asp
    210                 215                 220
Met Gly Thr His Asp Ser Leu Leu Gln Gly Gly Gln Tyr Val Gln Leu
225                 230                 235                 240
Ile Glu Gln Arg Gln Gly Val Arg Ile Ala Cys Ile Glu Glu Ile Ala
                245                 250                 255
Leu Arg Met Gly Phe Ile Asp Ala Asp Thr Leu His Arg Leu Gly Arg
            260                 265                 270
Glu Leu Gly Thr Ser Gly Tyr Gly Ala Tyr Leu Met Glu Val Ala Thr
        275                 280                 285
Arg Ala Gly Thr Glu
    290
<210>34
<211>1038
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1038)
<400>34
gtg cag gca ccg aat gag acg ccg cgc cgg ccc gcc cgc tcc gcc ggc 48
Val Gln Ala Pro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly
  1               5                  10                  15
cga cgg ccg ccg gcc cgg atc ctc gtc acc ggg ggc gcc ggc ttc atc 96
Arg Arg Pro Pro Ala Arg Ile Leu Val Thr Gly Gly Ala Gly Phe Ile
            20                  25                  30
ggc tcg cgc ttc gtg aac gcg ctg ctg gac ggc tcc ctg ccg gag ttc    144
Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe
         35                  40                  45
ggc aaa ccc gag gtg agg gtg ctc gac gcg ctc acc tac gcg ggc aac    192
Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn
     50                  55                  60
ctg gcc aat ctg gcc ccg gtg ggc gac tgt ccc cgg ctg cgg atc ttc    240
Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg Ile Phe
 65                  70                  75                  80
ccg ggg gac atc cgc gac cgc ggc gcg gtc acc cag gcg atg gcg ggg    288
Pro Gly Asp Ile Arg Asp Arg Gly Ala Val Thr Gln Ala Met Ala Gly
                 85                  90                  95
gtc gac ctg gtg gtg cac ttc gcg gcc gag tcg cac gtg gac cgc tcg    336
Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser
            100                 105                 110
atc gac gac gcc gac gcc ttc gtg cgc acc aac gtg ctg ggc acc cag    384
Ile Asp Asp Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gln
        115                 120                 125
gtc ctc ctc cag gag gca ctg gcc gta cgc ccc ggg ctg ttc gtg cac    432
Val Leu Leu Gln Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val His
    130                 135                 140
gtc tcg acg gac gag gtg tac ggc tcc atc gag gag ggg tcc tgg ccc    480
Val Ser Thr Asp Glu Val Tyr Gly Ser Ile Glu Glu Gly Ser Trp Pro
145                 150                 155                 160
gag gag cac ccg ctg aac ccc aac tcg ccc tac gcc gcc tcg aag gcg    528
Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala
                165                 170                 175
tcc tcc gac ctg ctg gcg ctg gcc cac cac cgc acg cac gga ctg ccg    576
Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro
            180                 185                 190
gtg tgc gtc acc cgc tgc tcc aac aac tac ggg ccc tac cag tac ccg    624
Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gln Tyr Pro
        195                 200                 205
gag aag atc atc ccg ctg ttc acc agc agc ctc ctc gac ggc ggg acc  672
Glu Lys Ile Ile Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr
    210                 215                 220
gtc ccg ctc tac ggg gac ggc ggc aac cgg cgc gac tgg ctg cac gtg  720
Val Pro Leu Tyr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val
225                 230                 235                 240
gac gac cac tgc cgg ggc atc gcc ctg gtg gcc cgg ggc ggc cgg ccc  768
Asp Asp His Cys Arg Gly Ile Ala Leu Val Ala Arg Gly Gly Arg Pro
                245                 250                 255
ggc gag gtc tac aac atc ggc ggc ggc acc gag ctg agc aac gtc gag  816
Gly Glu Val Tyr Asn Ile Gly Gly Gly Thr Glu Leu Ser Ash Val Glu
            260                 265                 270
ctc acg gag cgt ctg ctg aaa ctg tgc gga gcc gac tgg tcg gcg gtg  864
Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val
        275                 280                 285
cgg cgg gtg ccc gac cgc aag ggc cac gac cgg cgc tac tcc gtc gac  912
Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp
    290                 295                 300
tac acc aag atc gcg gac gag ctg ggt tac gcg ccg cgg atc acc atc  960
Tyr Thr Lys Ile Ala Asp Glu Leu Gly Tyr Ala Pro Arg Ile Thr Ile
305                 310                 315                 320
gac gaa ggg ctg gag cgg acc gtg cac tgg tac cgg gag aac cgc gcg  1008
Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala
                325                 330                 335
tgg tgg gcg ccc gcg aag agg ggg cga tga                          1038
Trp Trp Ala Pro Ala Lys Arg Gly Arg
            340                 345
<210>35
<211>345
<212>PRT
<213>生二素链霉菌
<400>35
Val Gln Ala Pro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly
l                5                   10                  15
Arg Arg Pro Pro Ala Arg Ile Leu Val Thr Gly Gly Ala Gly Phe Ile
             20                  25                  30
Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe
         35                  40                  45
Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn
     50                  55                  60
Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg Ile Phe
 65                  70                  75                  80
Pro Gly Asp Ile Arg Asp Arg Gly Ala Val Thr Gln Ala Met Ala Gly
                 85                  90                  95
Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser
            100                 105                 110
Ile Asp Asp Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gln
        115                 120                 125
Val Leu Leu Gln Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val His
    130                 135                 140
Val Ser Thr Asp Glu Val Tyr Gly Ser Ile Glu Glu Gly Ser Trp Pro
145                 150                 155                 160
Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala
                165                 170                 175
Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro
            180                 185                 190
Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gln Tyr Pro
        195                 200                 205
Glu Lys Ile Ile Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr
    210                 215                 220
Val Pro Leu Tyr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val
225                 230                 235                 240
Asp Asp His Cys Arg Gly Ile Ala Leu Val Ala Arg Gly Gly Arg Pro
                245                  250                255
Gly Glu Val Tyr Asn Ile Gly Gly Gly Thr Glu Leu Ser Asn Val Glu
            260                 265                 270
Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val
        275                 280                 285
Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp
    290                 295                 300
Tyr Thr Lys Ile Ala Asp Glu Leu Gly Tyr Ala Pro Arg Ile Thr Ile
305                 310                 315                 320
Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala
                325                 330                 335
Trp Trp Ala Pro Ala Lys Arg Gly Arg
            340                 345
<210>36
<211>804
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(804)
<220>
<221>CDS
<222>(7)..(804)
<220>
<221>CDS
<222>(22)..(804)
<400>36
atg acg gtg acg acc gca tcc gtg gac ccg ctc gac ctg tgg ctc cgc    48
Met Thr Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg
  1               5                  10                  15
cgg tac cag ccg tcc gcg tca ccc gcc gtc cgg ctg gtg tgc ttc ccg    96
Arg Tyr Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro
             20                  25                  30
cac gcg ggc ggc tcg gcg agt tcg ttc ctg ccg ttc acc cgg cag ctg    144
His Ala Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu
         35                  40                  45
ccg gac cgg atc gag gtc gtg gcc gtc cag tac ccc ggg cgc cag gac    192
Pro Asp Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp
     50                  55                  60
cgc agg agc gaa ccg ctg gtc gac acc atc gag gga ctg gcc gag ccc    240
Arg Arg Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro
 65                  70                  75                  80
ctg gcc ggc ctg ctg gag gcg cag gcc ggc ccc ccg gtg gtg ctg ttc    288
Leu Ala Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe
             85                      90                  95
ggg cac agc atg ggc gcg ctg gtg gcc tac gag gtc gcc cgc gcg ctc    336
Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu
        100                     105                 110
cag cgg cgg gga gcg gct ccg gtg cgc ctg gtg gtc tcc ggg cgc cgg    384
Gln Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg
        115                 120                 125
gcc ccc gcc gtc gac cgg ccg atg acc gtg cac ctc tac gac gac gac    432
Ala Pro Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp
    130                 135                 140
cgg ctg gtc gag gaa ctc cgc aag ctc gac ggc acc gac agc cag gtg    480
Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val
145                 150                 155                 160
ttc gcc gat ccg gag ctg ctc cgg ctg gtg ctg ccc gtg atc cgc aac    528
Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn
                165                 170                 175
gac tac cgg gcc gtg gcg gcc tac gcc cac cgc ccg ggg gcg ccg ctg  576
Asp Tyr Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu
            180                 185                190
gac tgc ccc ctc acc gtg ttc acc ggc gcc gac gac ccc acc gtg acc  624
Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr
        195                 200                 205
gcg gcc gag gcg gcg gcc tgg cac gag gcg gcg gcg tcc gac gtc gag  672
Ala Ala Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu
    210                 215                 220
acg cgc acc ttc ccc ggt ggc cac ttc ttc ccg tac cag cgg acc gcg  720
Thr Arg Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala
225                 230                 235                 240
gag gtg tgc ggg gcc ctg gtc gac acg crc gag ccg ctg ctg tcg gcc  768
Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala
                245                 250                 255
ggg acg cgc ggt gtc cgg cgg gtc cgc ccg ggg tga                  804
Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly
            260                 265
<210>37
<211>267
<212>PRT
<213>生二素链霉菌
<400>37
Met Thr Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg
  1               5                  10                  15
Arg Tyr Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro
             20                  25                  30
His Ala Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu
         35                  40                  45
Pro Asp Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp
     50                  55                  60
Arg Arg Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro
 65                  70                  75                  80
Leu Ala Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe
                 85                  90                  95
Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu
            100                 105                 110
Gln Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg
        115                 120                 125
Ala Pro Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp
    130                 135                 140
Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val
145                 150                 155                 160
Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn
                165                 170                 175
Asp Tyr Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu
            180                 185                 190
Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr
        195                 200                 205
Ala Ala Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu
    210                 215                 220
Thr Arg Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala
225                 230                 235                 240
Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala
                245                 250                 255
Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly
            260                 265
<210>38
<211>265
<212>PRT
<213>生二素链霉菌
<400>38
Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr
  1               5                  10                  15
Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro His Ala
             20                  25                  30
Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu Pro Asp
         35                  40                  45
Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp Arg Arg
     50                  55                  60
Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro Leu Ala
 65                  70                  75                  80
Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe Gly His
                 85                  90                  95
Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu Gln Arg
            100                 105                 110
Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro
        115                 120                 125
Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp Arg Leu
    130                 135                 140
Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val Phe Ala
145                 150                 155                 160
Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn Asp Tyr
                165                 170                 175
Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu Asp Cys
            180                 185                 190
Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala
        195                 200                 205
Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg
    210                 215                 220
 Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala Glu Val
 225                 230                 235                 240
 Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr
                 245                 250                 255
 Arg Gly Val Arg Arg Val Arg Pro Gly
             260                 265
<210>39
<211>260
<212>PRT
<213>生二素链霉菌
<400>39
Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr Gln Pro Ser Ala Ser
  1               5                  10                  15
Pro Ala Val Arg Leu Val Cys Phe Pro His Ala Gly Gly Ser Ala Ser
             20                  25                  30
Ser Phe Leu Pro Phe Thr Arg Gln Leu Pro Asp Arg Ile Glu Val Val
         35                  40                  45
Ala Val Gln Tyr Pro Gly Arg Gln Asp Arg Arg Ser Glu Pro Leu Val
     50                  55                  60
Asp Thr Ile Glu Gly Leu Ala Glu Pro Leu Ala Gly Leu Leu Glu Ala
 65                  70                  75                  80
Gln Ala Gly Pro Pro Val Val Leu Phe Gly His Ser Met Gly Ala Leu
                 85                  90                  95
Val Ala Tyr Glu Val Ala Arg Ala Leu Gln Arg Arg Gly Ala Ala Pro
            100                 105                 110
Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro Ala Val Asp Arg Pro
        115                 120                 125
Met Thr Val His Leu Tyr Asp Asp Asp Arg Leu Val Glu Glu Leu Arg
    130                 135                 140
Lys Leu Asp Gly Thr Asp Ser Gln Val Phe Ala Asp Pro Glu Leu Leu
145                 150                 155                 160
Arg Leu Val Leu Pro Val Ile Arg Asn Asp Tyr Arg Ala Val Ala Ala
                165                 170                 175
Tyr Ala His Arg Pro Gly Ala Pro Leu Asp Cys Pro Leu Thr Val Phe
            180                 185                 190
Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala Glu Ala Ala Ala Trp
        195                 200                 205
His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg Thr Phe Pro Gly Gly
    210                 215                 220
His Phe Phe Pro Tyr Gln Arg Thr Ala Glu Val Cys Gly Ala Leu Val
225                 230                 235                 240
Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr Arg Gly Val Arg Arg
                245                 250                 255
Val Arg Pro Gly
            260
<210>40
<211>1410
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1410)
<220>
<221>CDS
<222>(46)..(1410)
<400>40
gtg ggc acg gtc gag tac gcc gtc cac cgg cgt acc gcg gaa cgg gtg  48
Val Gly Thr Val Glu Tyr Ala Val His Arg Arg Thr Ala Glu Arg Val
  1               5                  10                  15
agg gtc tcc gcc gac acc ctg gac agc ccg gtc acc gcg ctg gcg gag    96
Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala Glu
             20                  25                  30
gtg ccc cgc tgg ctg gag gaa tac cac cgg gcg cac cgc ttc cac gtc    144
Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His Val
         35                  40                  45
gag ccg atc ccc ttc gac cgg ctc cgg cgg tgg tcc ttc gag ccg ggc    192
Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly
     50                  55                  60
acc ggc gac ctg cgg cac gag acg ggc cgc ttc ttc tcc gtg gag ggg    240
Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly
 65                  70                  75                  80
ctg cgc acc agc tcg gac gcc gat ccg gtc gcc cgt gtc cag ccg atc    288
Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro Ile
                 85                  90                  95
atc gtg cag ccc gag gtg ggg ctg ctc ggc atc ctg gcc cgg gag ttc    336
Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu Phe
            100                 105                 110
gac ggg gtg ctg cac ttc ctg atg cag gcc aaa ccc gag ccc ggc aac    384
Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly Asn
        115                 120                 125
gtc aac ggg ctg cag atc tcc ccc acg gtg cag gcc acg cgc agc aac    432
Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser Asn
    130                 135                 140
ttc gac gag gtg cac cac ggc cgg tcc acc ccg ttc ctc gac cac ttc    480
Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe
145                 150                 155                 160
atc cac cgc ccc ggc cgc cgg gtc ctg atc gac agc atc cag tcc gaa    528
Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser Glu
                165                 170                 175
cag ggc gac tgg ttc ctg cac aag cgc aac cgc aac atg gtc gtc gag    576
Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu
            180                 185                 190
atc gac acc gac atc gag gcc gac gcc gcg ttc cgc tgg ctg acc ctc    624
Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu
        195                 200                 205
ggg cag atc cgc cgg ctg atg ctc cag gac gac ctc gtc aac atg gac    672
Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met Asp
    210                 215                 220
acc cgc agt gtg ctg gcc tgt ctg ccc acc gcg cac ggc acg ccc gac    720
Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp
225                 230                 235                 240
gac ggt gac gac tcc ttc ccg gcg gcg ctg cgc cgc tcc ctc tac ggg    768
Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly
                245                 250                 255
gag acc gcg ccg ttg cac gat ctg cac gcc atc acc agc tgc ctc acc    816
Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu Thr
            260                 265                 270
gac gtc cgg gcg ctg cgg gtg ctg cgc cag cag agc gtg ccg ctc gac    864
Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu Asp
        275                 280                 285
gac gcc cgg cgg gac ggc tgg gag cgg acc ggg agc gcg atc cgg cat    912
Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg His
    290                 295                 300
cgc agc ggc agg cat ttc gag atc atg gcg gtg gag gtg acc gcg gag    960
Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala Glu
305                 310                 315                 320
cgc cgt gaa gtg gcc tcg tgg acc cag ccg ttg ctg cgc ccg tgc tcg    1008
Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys Ser
                325                 330                 335
cag gga ctg gcg gcc ctg atc acc cgg cgg atc aac ggg gtg ctg cac    1056
Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu His
            340                 345                 350
gcc ctg gtg gcg gcg cgg tcg gag gtc ggc acg ctc aac gtc gcc gag    1104
Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu
        355                 360                 365
ttc gga ccg acc gtc cag tgc cgg ccc gac gag gcg gac ggc cag tcg  1152
Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln Ser
    370                 375                 380
ccc ccg tac ctg gac cgg gtg ctg acg gcc gga gcc gac cgc gtc cgc  1200
Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg
385                 390                 395                 400
tac gac gtg gtg cag tcg gag gag ggc ggg cgc ttc tac cac gcg cgc  1248
Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg
                405                 410                 415
aac cgc tat ctg gtg gtc gag gcg ggg ccg gag ctc gac acg ggc tgc  1296
Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys
            420                 425                 430
ccg ccc ggc ttc tgc tgg gct acc ttc ggc cag ctc acc gaa ctg ctc  1344
Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu Leu
        435                 440                 445
gcg cac ggc aac tat ctc aac gtc gaa ctc cgc acc ctc atg gcg tgc  1392
Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys
    450                 455                 460
gca cac gcc tcc tac tga                                          1410
Ala His Ala Ser Tyr
465                 470
<210>41
<211>469
<212>PRT
<213>生二素链霉菌
<400>41
Val Gly Thr Val Glu Tyr Ala Val His Arg Arg Thr Ala Glu Arg Val
  1                   5                  10                  15
Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala Glu
             20                  25                  30
Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His Val
         35                  40                  45
Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly
    50                   55                  60
Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly
 65                  70                  75                  80
Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro Ile
                 85                  90                  95
Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu Phe
            100                 105                 110
Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly Asn
        115                 120                 125
Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser Asn
    130                 135                 140
Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe
145                 150                 155                 160
Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser Glu
                165                 170                 175
Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu
            180                 185                 190
Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu
        195                 200                 205
Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met Asp
    210                 215                 220
Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp
225                 230                 235                 240
Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly
                245                 250                 255
Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu Thr
            260                 265                 270
Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu Asp
        275                 280                 285
Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg His
    290                 295                 300
Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala Glu
305                 310                 315                 320
Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys Ser
                325                 330                 335
Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu His
            340                 345                 350
Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu
        355                 360                 365
Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln Ser
    370                 375                 380
Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg
385                 390                 395                 400
Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg
                405                 410                 415
Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys
            420                 425                 430
Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu Leu
        435                 440                 445
Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys
    450                 455                 460
Ala His Ala Ser Tyr
465
<210>42
<211>454
<212>PRT
<213>生二素链霉菌
<400>42
Val Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala
  1               5                  10                  15
Glu Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His
             20                  25                  30
Val Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro
         35                  40                  45
Gly Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu
     50                  55                  60
Gly Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro
 65                  70                  75                  80
Ile Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu
                 85                  90                  95
Phe Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly
            100                 105                 110
Asn Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser
        115                 120                 125
Asn Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His
    130                 135                 140
Phe Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser
145                 150                 155                 160
Glu Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val
                165                 170                 175
Glu Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr
            180                 185                 190
Leu Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met
        195                 200                 205
Asp Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro
    210                 215                 220
Asp Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr
225                 230                 235                 240
Gly Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu
                245                 250                 255
Thr Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu
            260                 265                 270
Asp Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg
        275                 280                 285
His Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala
    290                 295                 300
Glu Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys
305                 310                 315                 320
Ser Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu
                325                 330                 335
His Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala
            340                 345                 350
Glu Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln
        355                 360                 365
Ser Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val
    370                 375                 380
Arg Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala
385                 390                 395                 400
Arg Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly
                405                 410                 415
Cys Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu
            420                 425                 430
Leu Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala
        435                 440                 445
Cys Ala His Ala Ser Tyr
    450
<210>43
<211>1248
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1248)
<400>43
atg ccg ggc ggg acg gac ggc gac tgc gcg cgg acg gcg gcc cgg cgt  48
Met Pro Gly Gly Thr Asp Gly Asp Cys Ala Arg Thr Ala Ala Arg Arg
  1                   5                  10                  15
cga acg cac ctg ccc gag tcc gga cga gac agc gcg acg cga gag gcg  96
Arg Thr His Leu Pro Glu Ser Gly Arg Asp Ser Ala Thr Arg Glu Ala
             20                  25                  30
aaa atg atc aat ctc ttc cag ccc cag atg ggg gcc gag gaa ctg gcg  144
Lys Met Ile Asn Leu Phe Gln Pro Gln Met Gly Ala Glu Glu Leu Ala
         35                  40                  45
gcg gtg tcc gag gtc ttc gac gac caa tgg ctc ggt cac gga ccc cgg  192
Ala Val Ser Glu Val Phe Asp Asp Gln Trp Leu Gly His Gly Pro Arg
     50                  55                  60
acc gcg gcg ttc gag tcc gcg ttc gcc gag cac ctc ggg gtc ggc ccc  240
Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro
 65                  70                  75                  80
gag cac gtc gtc ttc ctc aac tcg ggc acc gcc ggc ctc ttc ctg gcc  288
Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala
                 85                  90                  95
ctg gag tcg ctc ggc ctg cgg ccc ggc gac gag gtc gtg ctc ccc tcg  336
Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser
            100                 105                 110
ccc agc ttc ctc gcc gcg gcg aac gcc gta cag ctc tcg gga gcg cgc  384
Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gln Leu Ser Gly Ala Arg
        115                 120                 125
ccg gtg ttc tgc gac acc gac ccg cgg acg ctg aac ccc gcc ctg gag    432
Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu
    130                 135                 140
cac atc gag gcg gcc gtc acc ccg cgc acc agg gcc gtc atc gcg ctc    480
His Ile Glu Ala Ala Val Thr Pro Arg Thr Arg Ala Val Ile Ala Leu
145                 150                 155                 160
cac tac ggc ggc cac ccc ggc gac atc gtg cgc atc gcc gag cgc tgc    528
His Tyr Gly Gly His Pro Gly Asp Ile Val Arg Ile Ala Glu Arg Cys
                165                 170                 175
cgg gag cgg ggc atc acc ctg atc gag gac gcc gcg tgc tcc gtg gcc    576
Arg Glu Arg Gly Ile Thr Leu Ile Glu Asp Ala Ala Cys Ser Val Ala
            180                 185                 190
tcc cgc gtc gac ggc cga ccg gtc ggc acc ttc ggc gac ctc gcc atg    624
Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met
        195                 200                 205
tgg agc ttc gac gcc atg aag gtc ctg gtc acc ggc gac gga ggg atg    672
Trp Ser Phe Asp Ala Met Lys Val Leu Val Thr Gly Asp Gly Gly Met
    210                 215                 220
atc tac gtc aag gac ccc ggg gcg gcc gcc cgg atc cgg cgc ctc gcc    720
Ile Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg Ile Arg Arg Leu Ala
225                 230                 235                 240
tac cac ggc ctc acg cgg tcc agc ggc ctg gga tac gcc agg gtc tcg    768
Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser
                245                 250                 255
gcg cgc tgg tgg gag atg gac gtc ccc gaa ccg ggc cgc cgc gtc atc    816
Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val Ile
            260                 265                 270
ggg aac gac ctc acc gcg gcc atc ggc gcg gtc cag ttg cgc cgg ctt    864
Gly Asn Asp Leu Thr Ala Ala Ile Gly Ala Val Gln Leu Arg Arg Leu
        275                 280                 285
ccc ggc ttc gtg gcc cgc cgc agg gag atc gtc gcc ctg tac gac agc    912
Pro Gly Phe Val Ala Arg Arg Arg Glu Ile Val Ala Leu Tyr Asp Ser
    290                 295                 300
gaa ctg agc tcg ctg gag ggc gtg ctg aca ccg ccc gcg cca ccc gcg  960
Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala
305                 310                 315                 320
ggg cac gag tcc acg cac tac ttc tac tgg atccag ctg gcc ccc ggc   1008
Gly His Glu Ser Thr His Tyr Phe Tyr Trp Ile Gln Leu Ala Pro Gly
                325                 330                 335
gtc cgg gac cgg gtg gca cgc gac ctg ctc acc gac ggc atc tac acc  1056
Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly Ile Tyr Thr
            340                 345                 350
acc ttc cgc tac gca cct ctg cac aag gtg ccc gcc tac ggc cac acc  1104
Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr
        355                 360                 365
gga ggc gaa ctg ccc ggc gtg gag cgg gcg tcc gaa cgg acc ctg tgc  1152
Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys
    370                 375                 380
ctg ccc ctg cac ccc ggc ctg tcg gac gcc gac gtc cgc acc gtc gtg  1200
Leu Pro Leu His Pro Gly Leu Ser Asp Ala Asp Val Arg Thr Val Val
385                 390                 395                 400
tcc tcc ctg cgc aga gcc ctg agc gcc gcg gat ccg gcc ccc gcc tga  1248
Ser Ser Leu Arg Arg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala
                405                 410                 415
<210>44
<211>415
<212>PRT
<213>生二素链霉菌
<400>44
Met Pro Gly Gly Thr Asp Gly Asp Cys Ala Arg Thr Ala Ala Arg Arg
  1               5                  10                 15
Arg Thr His Leu Pro Glu Ser Gly Arg Asp Ser Ala Thr Arg Glu Ala
             20                  25                  30
Lys Met Ile Asn Leu Phe Gln Pro Gln Met Gly Ala Glu Glu Leu Ala
         35                  40                  45
Ala Val Ser Glu Val Phe Asp Asp Gln Trp Leu Gly His Gly Pro Arg
     50                  55                  60
Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro
 65                  70                  75                  80
Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala
                 85                  90                  95
Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser
            100                 105                 110
Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gln Leu Ser Gly Ala Arg
        115                 120                 125
Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu
    130                 135                 140
His Ile Glu Ala Ala yal Thr Pro Arg Thr Arg Ala Val Ile Ala Leu
145                 150                 155                 160
His Tyr Gly Gly His Pro Gly Asp Ile Val Arg Ile Ala Glu Arg Cys
                165                 170                 175
Arg Glu Arg Gly Ile Thr Leu Ile Glu Asp Ala Ala Cys Ser Val Ala
            180                 185                 190
Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met
        195                 200                 205
Trp Ser Phe Asp Ala Met Lys Val Leu Val Thr Gly Asp Gly Gly Met
    210                 215                 220
Ile Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg Ile Arg Arg Leu Ala
225                 230                 235                 240
Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser
                245                 250                 255
Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val Ile
            260                 265                 270
Gly Asn Asp Leu Thr Ala Ala Ile Gly Ala Val Gln Leu Arg Arg Leu
        275                 280                 285
Pro Gly Phe Val Ala Arg Arg Arg Glu Ile Val Ala Leu Tyr Asp Ser
    290                 295                 300
Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala
305                 310                 315                 320
Gly His Glu Ser Thr His Tyr Phe Tyr Trp Ile Gln Leu Ala Pro Gly
                325                 330                 335
Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly Ile Tyr Thr
            340                 345                 350
Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr
        355                 360                 365
Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys
    370                 375                 380
Leu Pro Leu His Pro Gly Leu Ser Asp Ala Asp Val Arg Thr Val Val
385                 390                 395                 400
Ser Ser Leu Arg Arg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala
                405                 410                 415
<210>45
<211>720
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(720)
<400>45
atg tac gag aac gac agt gcc gcc gag gtc tac gac ctg ctc tac cag  48
Met Tyr Glu Ash Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gln
  1               5                  10                  15
gac cgc aag gac tac gcg ggt gag gcc gcc cgg gtc acc gac ctg atc    96
Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu Ile
             20                  25                  30
cgg gaa cgt acg ccg gac gcg gcc agc ctg ctc gac atc gcg tgc ggc    144
Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp Ile Ala Cys Gly
         35                  40                  45
acc ggt acc cac ctg gag gcc ttc gcc aag ctc tac gac cgc gtg agc    192
Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser
     50                  55                  60
ggc ctg gag ctg tcc gag tgg atg gcg gcc cgc gcc gag gag cgg ctc    240
Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu
 65                  70                  75                  80
ccc ggc gtc acc ctc cac cgc ggt gac atg cgg gcg ttc gac ctc ggc    288
Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly
                 85                  90                  95
gag acg ttc gac gcc gtg gtc tgc atg ttc agc tcg atc ggg tac ctg    336
Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser Ile Gly Tyr Leu
            100                 105                 110
gag acc acg gcc gac ctg gag gac gcc gtc gcc gcc atg gcg cgg cac    384
Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His
        115                 120                 125
ctg acc gcg gac ggt gtc ctg gcc gtc gaa ccg tgg tac ttc ccc gac    432
Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp
    130                 135                 140
acc ttc ctg gac ggc cac gtc tcc acc cac gcc ctg cgg acg gca ccg    480
Thr Phe Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro
145                 150                 155                 160
ggc gac cag ggc gtc gcc cgt gtc tcc cac tcg acc cgg gag ggc ggg    528
Gly Asp Gln Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Gly Gly
                165                 170                 175
cgg acc cgg atg gag atc cac tac ctg atc gcg cac acc gcg gag ggc    576
Arg Thr Arg Met Glu Ile His Tyr Leu Ile Ala His Thr Ala Glu Gly
            180                 185                 190
atc cgg cac cgc agc gag gtg gac tac ctc acg ctg ttc tcg cgt gcg  624
Ile Arg His Arg Ser Glu Val Asp Tyr Leu Thr Leu Phe Ser Arg Ala
        195                 200                 205
gag tac gag gcc gcg tac cgc aag gcc ggc ctg gac gtc gag tac gtc  672
Glu Tyr Glu Ala Ala Tyr Arg Lys Ala Gly Leu Asp Val Glu Tyr Val
    210                 215                 220
gtg acg ggc gag ggc tca ccg ggc ttc ttc ctc ggc acg cgt cgc tga  720
Val Thr Gly Glu Gly Ser Pro Gly Phe Phe Leu Gly Thr Arg Arg
225                 230                 235                 240
<210>46
<211>239
<212>PRT
<213>生二素链霉菌
<400>46
Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gln
  1               5                  10                  15
Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu Ile
             20                  25                  30
Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp Ile Ala Cys Gly
         35                  40                  45
Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser
     50                  55                  60
Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu
 65                  70                  75                  80
Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly
                 85                  90                  95
Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser Ile Gly Tyr Leu
            100                 105                 110
Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His
        115                 120                 125
Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp
    130                 135                 140
Thr Phe Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro
145                 150                 155                 160
Gly Asp Gln Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Gly Gly
                165                 170                 175
Arg Thr Arg Met Glu Ile His Tyr Leu Ile Ala His Thr Ala Glu Gly
            180                 185                 190
Ile Arg His Arg Ser Glu Val Asp Tyr Leu Thr Leu Phe Ser Arg Ala
        195                 200                 205
Glu Tyr Glu Ala Ala Tyr Arg Lys Ala Gly Leu Asp Val Glu Tyr Val
    210                 215                 220
Val Thr Gly Glu Gly Ser Pro Gly Phe Phe Leu Gly Thr Arg Arg
225                 230                 235
<210>47
<211>1968
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1968)
<400>47
atg agt gac ctg ggt tct ggt gaa gaa ggg tcc gaa gaa gac gag tcg  48
Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser
  1               5                  10                  15
gac gac gca ctc gcc ttc ctc gag ttc atc gcc cgg tcg gca cca cgg  96
Asp Asp Ala Leu Ala Phe Leu Glu Phe Ile Ala Arg Ser Ala Pro Arg
             20                  25                  30
agc gaa tac gac cgg ctc atg gcc cgc gcc gaa cgc tcg ggc gcc gac  144
Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp
         35                  40                  45
gag gac cgg atg cgc cga ctg gag cgc ttc aac cgg ctc gcc ctc acc    192
Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr
     50                  55                  60
gcg cag tcg atg atc gag tac cgc cgc gac cgg gag gcg gag ctc gcg    240
Ala Gln Ser Met Ile Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala
 65                  70                  75                  80
gcc ctg gtc gac gcc gcg cac gag ttc gtc gcc gcc cgg cgg ggc aag    288
Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys
                 85                  90                  95
gac ctg ctg gag tcc atc gcc cgc aga gca cgg ctg ctg ctg aag ctg    336
Asp Leu Leu Glu Ser Ile Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu
            100                 105                 110
gac gtc tcc tac gtc ggc ctg cac gag gag gac cgg ccc ggc acg gtg    384
Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val
        115                 120                 125
gtg ctg agc gcc gac ggc aac gcg gtc aag gtc gcc gag agc tac cgg    432
Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg
    130                 135                 140
ctg ccg gcc gac ggc gga ctg ggc gcc atg gtg cgc acc tgc cgc gct    480
Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala
145                 150                 155                 160
ccc ttc tgg acc ccg gac tac ctc ggg gac aac agc ttc acg cac gtc    528
Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr His Val
                165                 170                 175
gag gcc gtc gac gac atc gtc cgc gcc gaa ggc ctg cgc gcg gtc ctg    576
Glu Ala Val Asp Asp Ile Val Arg Ala Glu Gly Leu Arg Ala Val Leu
            180                 185                 190
gcc gtc ccg ctg tgc gcc ggg ggc gaa ccg atg ggg gtc ctc tac gtc    624
Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val
        195                 200                 205
gcc gac cgt cag gtg cgg cat ctg acc ccc aac gag gtc acc ctg ctg    672
Ala Asp Arg Gln Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu
    210                 215                 220
tgc tcg ctc gcc gat ctg gcc gcg gtg gcg atc gag cgc aac cgg ctg    720
Cys Ser Leu Ala Asp Leu Ala Ala Val Ala Ile Glu Arg Asn Arg Leu
225                 230                 235                 240
gtc gag gag ctc cac gac acc atc ggg caa ctg cgc cag gac atc ggc    768
Val Glu Glu Leu His Asp Thr Ile Gly Gln Leu Arg Gln Asp Ile Gly
                245                 250                 255
gag gcc cgc acc gcc ctc gcg cgc acc cgc agg tcc gcc gac ctc cag    816
Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gln
            260                 265                 270
tcg cac ctg gtc acg cag gtg atg gac agg cgc ggc gcc gac tcg tta    864
Ser His Leu Val Thr Gln Val Met Asp Arg Arg Gly Ala Asp Ser Leu
        275                 280                 285
ctc gcg acg gcc gcc gag gcg ctc ggc ggc gga gcc ggc ctg tgc agc    912
Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser
    290                 295                 300
ccg ctc ggg cgc ccg ctc gcc gag tac ggg acc ctg cgc ccc gtc gcc    960
Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala
305                 310                 315                 320
ccc acg gaa ctg cgc gcg gcg tgc cgc cgg gcc gcc gag acc ggc cgg    1008
Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg
                325                 330                 335
ccc acc tcc gtg gcc ccg ggg gtc tgg acg gtg ccc ctg ctt ccc ggg    1056
Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly
            340                 345                 350
ggc aac gcc ggc ttc ctg ctg acc gac ctc ggt ccg gac gcg gac cac    1104
Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His
        355                 360                 365
acc gcc gtc ccc ctg ctc ccg atg gtc gcc cgc acc ctc gcg ctg cac    1152
Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His
    370                 375                 380
ctg cgc gtc cag cac gac gac tcc ccc aag gcg cag agc cac cag gag    1200
Leu Arg Val Gln His Asp Asp Ser Pro Lys Ala Gln Ser His Gln Glu
385                 390                 395                 400
ttc ttc gac gac ctg atc ggg gcg ccc cgc tca ccc acg ctc ctc agg    1248
Phe Phe Asp Asp Leu Ile Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg
                405                 410                 415
gaa cgc gcc ctg atg ttc tcc ctc agc ttc cgc cgc ccg cac gtg gtg    1296
Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val
            420                 425                 430
ctg gtg gcg gac gga ccc cgc ggg acc tcg ccg cgg ctg gag gcc tcc    1344
Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser
        435                 440                 445
ggc gcc gac tac gcg aag gag ctc ggc ggg ctg tgc agc gtg cgg gac    1392
Gly Ala Asp Tyr Ala Lys Glu Leu Gly Gly Leu Cys Ser Val Arg Asp
    450                 455                 460
ggc gcc gtc gtc ctg ctg ctg ccc ggc gac gac ccc gtc gcc gtg gcg    1440
Gly Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala
465                 470                 475                 480
cag acc gcc gcc ccg gag ctg acc gac cgc gcc ggg cac ccc gtc acc    1488
Gln Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr
                485                 490                 495
gtg ggg gtc gcg ggc ccc gcc tcg acc gtc gac ggc atc gcc gac gcg    1536
Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly Ile Ala Asp Ala
            500                 505                 510
cac cgt gag gcc gcg aag tgt ctg gag acc ctc cgc gcg ctc ggc ggc    1584
His Arg Glu Ala Ala Lys Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly
        515                 520                 525
gac ggc ggc acc gcg tgc gcc tcc gac ctg ggt ttc ctc ggc atg ctc    1632
Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu
    530                 535                 540
ctc gcc gag gag aac gac gtc ccc ggt tac atc agg acg acg atc ggc    1680
Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr Ile Arg Thr Thr Ile Gly
545                 550                 555                 560
ccc gtg gtc gac tac gac acc cac cgc ttc acg gat ctg gtt ccc act    1728
Pro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr
                565                 570                 575
ctg agg gtg tac ctg gag tcg ggc agg agc ccc acg cgt gcc gca gag  1776
Leu Arg Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu
            580                 585                 590
aca ctg cgc gtg cac ccg aac acc gtc tca cgg cgg ctg gag cgc atc  1824
Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg Ile
        595                 600                 605
ggc gta ctg ctg gga gag gac tgg cag tca ccg gag cgg gtg ctg gac  1872
Gly Val Leu Leu Gly Glu Asp Trp Gln Ser Pro Glu Arg Val Leu Asp
    610                 615                 620
ata caa ctg gcc ctg cgg ctc tat cag gtg cgc tcg gcg ctc tcc tcg  1920
Ile Gln Leu Ala Leu Arg Leu Tyr Gln Val Arg Ser Ala Leu Ser Ser
625                 630                 635                 640
caa ccg gcg tcc gag acc cgg gcc gtg ctc gga tcg ctg cgc gag tga  1968
Gln Pro Ala Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu
                645                 650                 655
<210>48
<211>655
<212>PRT
<213>生二素链霉菌
<400>48
Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser
  1               5                  10                  15
Asp Asp Ala Leu Ala Phe Leu Glu Phe Ile Ala Arg Ser Ala Pro Arg
             20                  25                  30
Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp
         35                  40                  45
Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr
     50                  55                  60
Ala Gln Ser Met Ile Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala
 65                  70                  75                  80
Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys
                     85              90                  95
Asp Leu Leu Glu Ser Ile Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu
            100                 105                 110
Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val
        115                 120                 125
Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg
    130                 135                 140
Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala
145                 150                 155                 160
Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr His Val
                165                 170                 175
Glu Ala Val Asp Asp Ile Val Arg Ala Glu Gly Leu Arg Ala Val Leu
            180                 185                 190
Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val
        195                 200                 205
Ala Asp Arg Gln Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu
    210                 215                 220
Cys Ser Leu Ala Asp Leu Ala Ala Val Ala Ile Glu Arg Asn Arg Leu
225                 230                 235                 240
Val Glu Glu Leu His Asp Thr Ile Gly Gln Leu Arg Gln Asp Ile Gly
                245                 250                 255
Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gln
            260                 265                 270
Ser His Leu Val Thr Gln Val Met Asp Arg Arg Gly Ala Asp Ser Leu
        275                 280                 285
Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser
    290                 295                 300
Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala
305                 310                 315                 320
Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg
                325                 330                 335
Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly
            340                 345                 350
Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His
        355                 360                 365
Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His
    370                 375                 380
Leu Arg Val Gln His Asp Asp Ser Pro Lys Ala Gln Ser His Gln Glu
385                 390                 395                 400
Phe Phe Asp Asp Leu Ile Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg
                405                 410                 415
Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val
            420                 425                 430
Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser
        435                 440                 445
Gly Ala Asp Tyr Ala Lys Glu Leu Gly Gly Leu Cys Ser Val Arg Asp
    450                 455                 460
Gly Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala
465                 470                 475                 480
Gln Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr
                485                 490                 495
Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly Ile Ala Asp Ala
            500                 505                 510
His Arg Glu Ala Ala Lys Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly
        515                 520                 525
Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu
    530                 535                 540
Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr Ile Arg Thr Thr Ile Gly
545                 550                 555                 560
Pro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr
                565                 570                 575
Leu Arg Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu
            580                 585                 590
Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg Ile
        595                 600                 605
Gly Val Leu Leu Gly Glu Asp Trp Gln Ser Pro Glu Arg Val Leu Asp
    610                 615                 620
Ile Gln Leu Ala Leu Arg Leu Tyr Gln Val Arg Ser Ala Leu Ser Ser
625                 630                 635                 640
Gln Pro Ala Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu
                645                 650                 655
<210>49
<211>1749
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1749)
<220>
<221>CDS
<222>(76)..(1749)
<220>
<221>CDS
<222>(97)..(1749)
<400>49
atg tcc gca gtg gtg gcg tcc ctt ctg ctt tcc gtt ctt tct gcg agc  48
Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser
  1               5                  10                  15
gcg ctc acg cat cca ctc atc ctc atc gtg gaa aca gga gac tta cgc    96
Ala Leu Thr His Pro Leu Ile Leu Ile Val Glu Thr Gly Asp Leu Arg
             20                  25                  30
gtg tcg att gcg caa tac gcc cta cac gac atc acg aag cgc tac cac    144
Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His
         35                  40                  45
gac tgt gtc gtg ctc gac cgg gtc ggt ttc agc atc aag ccg ggc gag    192
Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu
     50                  55                  60
aag gtc ggc gtg atc ggc gac aac ggt tcc ggc aag tcc acg ctg ctc    240
Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu
 65                  70                  75                  80
aag atc ctc gcc ggc cgc gtg gag ccc gac aac ggc gcg ctc acc gtg    288
Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val
                 85                  90                  95
gtc gct ccc ggc ggc gtc ggc tac ctg gcg cag aca ctg gaa ctg ccc    336
Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro
            100                 105                 110
ctc gac gcc acc gtc cag gac gcc gtc gac ctg gcc ctg tcc gac ctg    384
Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu
        115                 120                 125
cgc gag ctc gaa gcg gcg atg cgc gag gcc gag gcg gag ctg ggc gag    432
Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu
    130                 135                 140
agc gac gag aac ggc tcc gag cgc gag ctg tcc gcc ggc ctc cag cgc    480
Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg
145                 150                 155                 160
tac gcc gct ctg gtc gag cag tac cag gcg cgt ggc ggc tac gag gcc    528
Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala
                165                 170                 175
gac gtg cgc gtg gag gtc gcg ctg cac ggc ctc gga ctg ccg agc ctg    576
Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu
            180                 185                 190
gac cgc gac cgc aag ctc gga acc ctc tcc ggt ggc gaa cgc tcc cgc    624
Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg
        195                 200                 205
ctc gcg ctc gcc gcg acc ctc gcc tcg tcg ccg gag ctg ctg ctc ctg    672
Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu
    210                 215                 220
gac gaa ccg acc aac gac ctc gac gac cgg gcg atg gaa tgg ctg gag    720
Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu
225                 230                 235                 240
gac cac ctg gcc ggc cac cgc ggc acg gtg atc gcg gtc acc cac gac    768
Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp
                245                 250                 255
cgg gtc ttc ctc gac cgg ctc acc acc acg atc ctg gag gtc gac tcc    816
Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser
            260                 265                 270
ggc agc gtc acc cgc tac ggc aac ggc tac gag ggc tac ctg acg gcc    864
Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala
        275                 280                 285
aag gcc gtg gaa cgc gag cgg cgg ctg cgg gag tac gag gag tgg cgt    912
Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg
    290                 295                 300
gcc gaa ctc gac cgc aac cgc ggg ctg atc acc tcc aac gtg gcg cgg    960
Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg
305                 310                 315                 320
atg gac ggc atc ccg cgc aag atg tcc ctc tcc gtg ttc ggc cac ggc    1008
Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly
                325                 330                 335
gcc tac cgc agg cga ggg cgc gac cac ggc gcg atg gtg cgg atc cgc    1056
Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg
            340                 345                 350
aac gcg aag caa cgc gtg gcg cag ctg acc gag aac ccg gtc cac gct    1104
Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala
        355                 360                 365
ccc gcc gac ccg ttg tcc ttc gcc gcc cgc atc gac acc gcg ggc ccg    1152
Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro
    370                 375                 380
gag gcg gag gag gcg gtg gcc gaa ctc acc gac gtg cgc gtc gcg ggt    1200
Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly
385                 390                 395                 400
cgg ctc gcc gtg gac tcc ctg acg atc cgg ccc ggc gaa cgg ctg ctc    1248
Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu
                405                 410                 415
gtc aca ggt ccc aac ggt gcg ggc aag tcc acc ttg ttg cgg gtg ctg    1296
Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu
            420                 425                 430
tcc ggg gaa ctg gag ccg gac ggc ggc tcg gtg cgc gtc ggc tgc cgg    1344
Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg
        435                 440                 445
gtc ggt cat ctg cgg cag gac gag acg ccc tgg gcg ccc gga ctg acc    1392
Val Gly His Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr
    450                 455                 460
gtg ctg cgg gcc ttc gcc cag ggc cgg gag ggc tac ctg gag gac cac    1440
Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His
465                 470                 475                 480
gcg gag aaa ctg ctg tcg ctc ggc ctg ttc agc ccg tcc gac ctg cgg    1488
Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg
                485                 490                 495
cga cgc gtg aag gat ctg tcc tac ggg cag cgc cgc cgg atc gag atc    1536
Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile
            500                 505                 510
gcc cgg ctg gtg agc gac ccg atg gac ctg ctg ctg ctg gac gag ccc    1584
Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro
        515                 520                 525
acc aac cac ctc acc ccg gtg ctg gtg gag gag ttg gag cag gca ctc    1632
Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu
    530                 535                 540
gcg gac tac cgc ggc gcc gtc gtg gtc gtc gcc cac gac cgt cgg atg  1680
Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met
545                 550                 555                 560
cgg tcc cgg ttc acc ggc gcc cgg ctg acc atg gga gac ggg cgc atc  1728
Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile
                565                 570                 575
gcc gag ttc agc gcc ggc tga                                      1749
Ala Glu Phe Ser Ala Gly
            580<210>50<211>582<212>PRT<213>生二素链霉菌<400>50
Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser
  1               5                  10                  15
Ala Leu Thr His Pro Leu Ile Leu Ile Val Glu Thr Gly Asp Leu Arg
             20                  25                  30
Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His
         35                  40                  45
Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu
     50                  55                  60
Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu
 65                  70                  75                  80
Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val
                 85                 90                  95
Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro
            100                 105                 110
Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu
        115                 120                 125
Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu
    130                 135                 140
Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg
145                 150                 155                 160
Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala
                165                 170                 175
Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu
            180                 185                 190
Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg
        195                 200                 205
Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu
    210                 215                 220
Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu
225                 230                 235                 240
Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp
                245                 250                 255
Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser
            260                 265                 270
Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala
        275                 280                 285
Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg
    290                 295                 300
Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg
305                 310                 315                 320
Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly
                325                 330                 335
Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg
            340                 345                 350
Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala
        355                 360                 365
Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro
    370                 375                 380
Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly
385                 390                 395                 400
Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu
                405                 410                 415
Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu
            420                 425                 430
Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg
        435                 440                 445
Val Gly His Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr
    450                 455                 460
Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His
465                 470                 475                 480
Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg
                485                 490                 495
Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile
            500                 505                 510
Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro
        515                 520                 525
Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu
    530                 535                 540
Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met
545                 550                 555                 560
Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile
                565                 570                 575
Ala Glu Phe Ser Ala Gly
            580
<210>51
<211>557
<212>PRT
<213>生二素链霉菌
<400>51
Va1 Glu Thr Gly Asp Leu Arg Val Ser Ile Ala Gln Tyr Ala Leu His
  1               5                  10                  15
Asp Ile Thr Lys Arg Tyr His Asp Cys Val Val Leu Asp Arg Val Gly
             20                  25                  30
Phe Ser Ile Lys Pro Gly Glu Lys Val Gly Val Ile Gly Asp Asn Gly
         35                  40                  45
Ser Gly Lys Ser Thr Leu Leu Lys Ile Leu Ala Gly Arg Val Glu Pro
     50                  55                  60
Asp Asn Gly Ala Leu Thr Val Val Ala Pro Gly Gly Val Gly Tyr Leu
 65                  70                  75                  80
Ala Gln Thr Leu Glu Leu Pro Leu Asp Ala Thr Val Gln Asp Ala Val
                 85                  90                  95
Asp Leu Ala Leu Ser Asp Leu Arg Glu Leu Glu Ala Ala Met Arg Glu
            100                 105                 110
Ala Glu Ala Glu Leu Gly Glu Ser Asp Glu Asn Gly Ser Glu Arg Glu
        115                 120                 125
Leu Ser Ala Gly Leu Gln Arg Tyr Ala Ala Leu Val Glu Gln Tyr Gln
    130                 135                 140
Ala Arg Gly Gly Tyr Glu Ala Asp Val Arg Val Glu Val Ala Leu His
145                 150                 155                 160
Gly Leu Gly Leu Pro Ser Leu Asp Arg Asp Arg Lys Leu Gly Thr Leu
                165                 170                 175
Ser Gly Gly Glu Arg Ser Arg Leu Ala Leu Ala Ala Thr Leu Ala Ser
            180                 185                 190
Ser Pro Glu Leu Leu Leu Leu Asp Glu Pro Thr Asn Asp Leu Asp Asp
        195                 200                 205
Arg Ala Met Glu Trp Leu Glu Asp His Leu Ala Gly His Arg Gly Thr
    210                 215                 220
Val Ile Ala Val Thr His Asp Arg Val Phe Leu Asp Arg Leu Thr Thr
225                 230                 235                 240
Thr Ile Leu Glu Val Asp Ser Gly Ser Val Thr Arg Tyr Gly Asn Gly
                245                 250                 255
Tyr Glu Gly Tyr Leu Thr Ala Lys Ala Val Glu Arg Glu Arg Arg Leu
            260                 265                 270
Arg Glu Tyr Glu Glu Trp Arg Ala Glu Leu Asp Arg Asn Arg Gly Leu
        275                 280                 285
Ile Thr Ser Asn Val Ala Arg Met Asp Gly Ile Pro Arg Lys Met Ser
    290                 295                 300
Leu Ser Val Phe Gly His Gly Ala Tyr Arg Arg Arg Gly Arg Asp His
305                 310                 315                 320
Gly Ala Met Val Arg Ile Arg Asn Ala Lys Gln Arg Val Ala Gln Leu
                325                 330                 335
Thr Glu Asn Pro Val His Ala Pro Ala Asp Pro Leu Ser Phe Ala Ala
            340                 345                 350
Arg Ile Asp Thr Ala Gly Pro Glu Ala Glu Glu Ala Val Ala Glu Leu
        355                 360                 365
Thr Asp Val Arg Val Ala Gly Arg Leu Ala Val Asp Ser Leu Thr Ile
    370                 375                 380
Arg Pro Gly Glu Arg Leu Leu Val Thr Gly Pro Asn Gly Ala Gly Lys
385                 390                 395                 400
Ser Thr Leu Leu Arg Val Leu Ser Gly Glu Leu Glu Pro Asp Gly Gly
                405                 410                 415
Ser Val Arg Val Gly Cys Arg Val Gly His Leu Arg Gln Asp Glu Thr
            420                 425                 430
Pro Trp Ala Pro Gly Leu Thr Val Leu Arg Ala Phe Ala Gln Gly Arg
        435                 440                 445
Glu Gly Tyr Leu Glu Asp His Ala Glu Lys Leu Leu Ser Leu Gly Leu
    450                 455                 460
Phe Ser Pro Ser Asp Leu Arg Arg Arg Val Lys Asp Leu Ser Tyr Gly
465                 470                 475                 480
Gln Arg Arg Arg Ile Glu Ile Ala Arg Leu Val Ser Asp Pro Met Asp
                485                 490                 495
Leu Leu Leu Leu Asp Glu Pro Thr Asn His Leu Thr Pro Val Leu Val
            500                 505                 510
Glu Glu Leu Glu Gln Ala Leu Ala Asp Tyr Arg Gly Ala Val Val Val
        515                 520                 525
Val Thr His Asp Arg Arg Met Arg Ser Arg Phe Thr Gly Ala Arg Leu
    530                 535                 540
Thr Met Gly Asp Gly Arg Ile Ala Glu Phe Ser Ala Gly
545                 550                 555
<210>52
<211>550
<212>PRT
<213>生二素链霉菌
<400>52
Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His
  1           5                     10                   15
Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu
             20                  25                  30
Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu
         35                  40                  45
Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val
     50                  55                  60
Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro
 65                  70                  75                  80
Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu
                 85                  90                  95
Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu
            100                 105                 110
Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg
        115                 120                 125
Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala
    130                 135                 140
Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu
145                 150                 155                 160
Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg
                165                 170                 175
Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu
            180                 185                 190
Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu
        195                 200                 205
Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp
    210                 215                 220
Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser
225                 230                 235                 240
Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala
                245                 250                 255
Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg
            260                 265                 270
Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg
        275                 280                 285
Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly
    290                 295                 300
Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg
305                 310                 315                 320
Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala
                325                 330                 335
Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro
            340                 345                 350
Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly
        355                 360                 365
Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu
    370                 375                 380
Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu
385                 390                 395                 400
Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg
                 405                 410                 415
Val Gly Hi s Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr
            420                 425                 430
Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His
         435                440                 445
Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg
    450                 455                 460
Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile
465                 470                 475                 480
Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro
                485                 490                 495
Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu
            500                 505                 510
Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met
        515                 520                 525
Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile
    530                 535                 540
Ala Glu Phe Ser Ala Gly
 545                 550
<210>53
<211>1431
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1431)
<220>
<221>CDS
<222>(16)..(1431)
<220>
<221>CDS
<222>(37)..(1431)
<220>
<221>CDS
<222>(40)..(1431)
<220>
<221>CDS
<222>(79)..(1431)
<220>
<221>CDS
<222>(130)..(1431)
<400>53
gtg ccg cgc aac ggt atg cgt gtc gca ccg gcc gac gtg atg cag tcg  48
Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gln Ser
  1               5                  10                  15
gac cgg gat gat cgc ttg tcc ggc ggc cgg atg cct agc ctc ggg agc  96
Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser
             20                  25                  30
aac cac agc ggt ctt tca cga gag ggg tcg acc atg ggc gat ctc agg  144
Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg
         35                  40                  45
aac cgc atc acc gag ctg gtc cgc gcg tac cac cgg gaa cag gcg ccc    192
Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro
     50                  55                  60
ggg ggc ttc gtt ccc ggg acg acg cac gta ccg gtc tcc ggc gcg gtg    240
Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val
 65                  70                  75                  80
ctg agc gag gag gac cgg ctg gcg ctg gtg gag acg gcg ctg gag atg    288
Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met
                 85                  90                  95
cgg atc gcg gcc ggc ccg gcc tcc cgg ggc ttc gag cgg cag ttc gcc    336
Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala
            100                 105                 110
cgg tac ctc ggg ctc cgg aag gcg cac ctg acc aac tcc ggt tcc tcc    384
Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser
        115                 120                 125
gcc aac ctc ctc gcc ctc ggc gcg ctc acc tcg ccg cag ctg gag gag    432
Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu
    130                 135                 140
aga cgg ctg cgt ccg ggg gac gag gtc gtc acg gtc gcc gcc ggg ttc    480
Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe
145                 150                 155                 160
ccc acg acg gtc aac ccg atc ttc cac aac ggg ctg gtg ccc gtc ttc    528
Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val Pro Val Phe
                165                 170                 175
gtg gac gtc gag ctc ggc acg tac aac acg acg ccc gag cgc atc gag    576
Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu
            180                 185                 190
cgg gcc atc ggc ccc cgg acc agg gcg atc atg atc gcg cac gcc ctg    624
Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu
        195                 200                 205
ggc aac ccc ttc gag gcc gaa gag gtg gcc cgc ctc gcg gac gag cgg    672
Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg
    210                 215                 220
gag ctg ttc ctc atc gag gac aac tgc gac gcg gtg ggg tcc cgc tac    720
Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr
225                 230                 235                 240
cgg ggc agg ctc acc ggc tcc ttc ggc gac ctg tcg acc gtc agc ttc    768
Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe
                245                 250                 255
tat ccc gcg cac cac atc gcg atg ggt gag ggg ggc tgc gtg ctc acc    816
Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr
            260                 265                 270
gac aac ctg gcc ctg gcg cgg atc gtg gaa tca ctg cgc gac tgg ggg    864
Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly
        275                 280                 285
cgc gac tgc tgg tgc gag ccg ggt gag gac aac cgc tgc ctc aag cgg    912
Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg
    290                 295                 300
ttc gac cag aag atg ggt gac ctg ccg ccc ggg tac gac cac aag tac    960
Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr
305                 310                 315                 320
atc ttc tcg cac gtc ggt tac aac ctg aag tcg acc gac ctg cag gcg    1008
Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala
                325                 330                 335
gcc ctc ggg ctg tcc cag ctg acc cgg atc gag gag ttc acc gag gcc    1056
Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala
            340                 345                 350
agg cgc gcc aac tgg cgg cat ctg cgc gcc gcg ttg gac ggg ctg ccc    1104
Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro
        355                 360                 365
ggt ctg ctg ctg cct cat gcc aca ccg ggc agc gat ccg agc tgg ttc    1152
Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe
    370                 375                 380
ggg ttc ctc atc acc gtg gac ccg gac gcc gcg tac agc agg gcg gcc    1200
Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala
385                 390                 395                 400
ctg gtc gac cac ctg gaa tcg cgc cgg atc agc acc cgc cgc ctg ttc  1248
Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe
                405                 410                 415
ggg ggc aac ctc gtg cgg cac ccc gcc tac acc gac cgt cgg tac cgg  1296
Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg
            420                 425                 430
gtg tcc ggc tcc ctg gag aac agc gac ctg atc acc gac cag acg ttc  1344
Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe
        435                 440                 445
tgg atc ggg gtc ttc ccc ggc atc acc ccg gag atg atc gcc tac gtc  1392
Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val
    450                 455                 460
ggc gac acg atc cgg gag ttc gtg ctc aag cac tcc tga              1431
Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser
465                 470                 475
<210>54
<211>476
<212>PRT
<213>生二素链霉菌
<400>54
Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gln Ser
  1               5                  10                  15
Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser
             20                  25                  30
Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg
         35                  40                  45
Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro
     50                  55                  60
Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val
 65                  70                  75                  80
Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met
                 85                  90                  95
Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala
            100                 105                 110
Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser
        115                 120                 125
Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu
    130                 135                 140
Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe
145                 150                 155                 160
Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val Pro Val Phe
                165                 170                 175
Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu
            180                 185                 190
Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu
        195                 200                 205
Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg
    210                 215                 220
Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr
225                 230                 235                 240
Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe
                245                 250                 255
Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr
            260                 265                 270
Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly
        275                 280                 285
Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg
    290                 295                 300
Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr
305                 310                 315                 320
Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala
                325                 330                 335
Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala
            340                 345                 350
Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro
        355                 360                 365
Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe
    370                 375                 380
Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala
385                 390                 395                 400
Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe
                405                 410                 415
Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg
            420                 425                 430
Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe
        435                 440                 445
Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val
    450                 455                 460
Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser
465                 470                 475
<210>55
<211>471
<212>PRT
<213>生二素链霉菌
<400>55
Met Arg Val Ala Pro Ala Asp Val Met Gln Ser Asp Arg Asp Asp Arg
  1               5                  10                  15
Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser Asn His Ser Gly Leu
         20                      25                  30
Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg Asn Arg Ile Thr Glu
         35                  40                  45
Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro Gly Gly Phe Val Pro
     50                  55                  60
Gly Thr Thr His Val Pro Val Ser Gly Ala Val Leu Ser Glu Glu Asp
 65                  70                  75                  80
Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met Arg Ile Ala Ala Gly
                 85                  90                  95
Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu
            100                 105                 110
Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala
        115                 120                 125
Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro
    130                 135                 140
Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn
145                 150                 155                 160
Pro Ile Phe His Asn Gly Leu Val Pro Val Phe Val Asp Val Glu Leu
                165                 170                 175
Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro
            180                 185                 190
Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu Gly Asn Pro Phe Glu
        195                 200                 205
Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile
    210                 215                 220
Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr
225                 230                 235                 240
Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe Tyr Pro Ala His His
                245                 250                  255
Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu
            260                 265                 270
Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys
        275                 280                 285
Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg Phe Asp Gln Lys Met
    290                 295                 300
Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr Ile Phe Ser His Val
305                 310                 315                 320
Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser
                325                 330                335
Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp
            340                 345                 350
Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro
        355                 360                 365
His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr
    370                 375                 380
Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu
385                 390                 395                 400
Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val
                405                 410                 415
Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu
            420                 425                 430
Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe Trp Ile Gly Val Phe
        435                 440                 445
Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val Gly Asp Thr Ile Arg
    450                 455                 460
Glu Phe Val Leu Lys His Ser
465                 470
<210>56
<211>464
<212>PRT
<213>生二素链霉菌
<400>56
Val Met Gln Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro
  l               5                  10                  15
Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met
             20                  25                  30
Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg
         35                  40                  45
Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val
     50                  55                  60
Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr
 65                  70                  75                  80
Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu
                 85                  90                  95
Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn
            100                 105                 110
Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro
        115                 120                 125
Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val
    130                 135                 140
Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu
145                 150                 155                 160
Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro
                165                 170                 175
Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile
            180                 185                 190
Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu
        195                 200                 205
Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val
    210                 215                 220
Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser
225                 230                 235                 240
Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly
                245                 250                 255
Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu
            260                 265                 270
Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg
        275                 280                 285
Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr
    290                 295                 300
Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr
305                 310                 315                 320
Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu
                325                 330                 335
Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu
            340                 345                 350
Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp
        355                 360                 365
Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr
    370                 375                 380
Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr
385                 390                 395                 400
Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp
            405                     410                 415
Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr
        420                     425                 430
Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met
    435                     440                 445
Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser
    450                 455                 460
<210>57
<211>463
<212>PRT
<213>生二素链霉菌
<400>57
Met Gln Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser
  1               5                  10                  15
Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly
             20                  25                  30
Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu
         35                  40                  45
Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser
     50                  55                  60
Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala
 65                 70                  75                  80
Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg
                 85                  90                  95
Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser
            100                 105                 110
Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln
        115                 120                 125
Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala
    130                 135                 140
Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val
145                 150                 155                 160
Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu
                165                 170                 175
Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala
            180                 185                 190
His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala
        195                 200                 205
Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala yal Gly
    210                 215                 220
Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr
225                 230                 235                 240
Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys
                245                 250                 255
Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg
            260                 265                 270
Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys
        275                 280                 285
Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp
    290                 295                 300
His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp
305                 310                 315                 320
Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe
                325                 330                 335
Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp
            340                 345                 350
Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro
        355                 360                 365
Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser
    370                 375                 380
Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg
385                 390                 395                 400
Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg
                405                 410                 415
Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp
            420                 425                 430
Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile
        435                 440                 445
Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser
    450                 455                 460
<210>58
<211>450
<212>PRT
<213>生二素链霉菌
<400>58
Met Pro Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser
  1               5                  10                  15
Thr Met Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr
             20                  25                  30
His Arg Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val
         35                  40                  45
Pro Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val
     50                  55                  60
Glu Thr Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly
 65                  70                  75                  80
Phe Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu
                 85                  90                  95
Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr
            100                 105                 110
Ser Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val
        115                 120                 125
Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn
    130                 135                 140
Gly Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr
145                 150                 155                 160
Thr Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile
                165                 170                 175
Met Ile Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala
            180                 185                 190
Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp
        195                 200                 205
Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp
    210                 215                 220
Leu Ser Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu
225                 230                 235                 240
Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu
                245                 250                 255
Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp
            260                 265                 270
Asn Arg Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro
        275                 280                 285
Gly Tyr Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys
    290                 295                 300
Ser Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile
305                 310                 315                 320
Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala
                325                 330                 335
Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly
            340                 345                 350
Ser Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala
        355                 360                 365
Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile
    370                 375                 380
Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr
385                 390                 395                 400
Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu
                405                 410                 415
Ile Thr Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro
            420                 425                 430
Glu Met Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys
        435                 440                 445
His Ser
    450
<210>59
<211>433
<212>PRT
<213>生二素链霉菌
<400>59
Met Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His
  1               5                  10                  15
Arg Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro
             20                  25                  30
Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu
         35                  40                  45
Thr Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe
     50                 55                  60
Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr
 65                  70                  75                  80
Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser
                 85                  90                  95
Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr
            100                 105                 110
Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly
        115                 120                 125
Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr
    130                 135                 140
Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met
145                 150                 155                 160
Ile Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg
                165                 170                 175
Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala
            180                 185                 190
Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu
        195                 200                 205
Ser Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly
    210                 215                 220
Gly Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser
225                 230                 235                 240
Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn
                245                 250                 255
Arg Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly
            260                 265                 270
Tyr Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser
        275                 280                 285
Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu
    290                 295                 300
Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala
305                 310                 315                 320
Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser
                325                 330                 335
Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala
            340                 345                 350
Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser
        355                 360                 365
Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr
    370                 375                 380
Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile
385                 390                 395              400
Thr Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu
                405                 410                 415
Met Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His
            420                 425                 430
Ser
<210>60
<211>1398
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1398)
<400>60
atg gac gac acg atg gcc ggc gcc gac gcc gag gaa tgg gac ggc gat  48
Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp
  1               5              10                  15
cag tta gac cgc gag gac cgg gcc tcc ctc cgc cgc gtc gcg ggg ctc  96
Gln Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu
             20                  25                  30
tcc acc gaa ctg acc gac gtc tcc gag gtc gag tac cgc cag ctg cga  144
Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gln Leu Arg
         35                  40                  45
ctc gag cgg gtg gtg ctc gtc ggc atc tgg acc tcg gga acg gcc gcg    192
Leu Glu Arg Val Val Leu Val Gly Ile Trp Thr Ser Gly Thr Ala Ala
     50                  55                  60
gag gcc gac agt tcg ctc gcc gag ctg gcg gcg ctc gcc gag acc gcg    240
Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala
  65                 70                  75                  80
ggc gcc ctc gtg ctg gac ggc gtc gtg cag cgc cgg cag aag ccg gac    288
Gly Ala Leu Val Leu Asp Gly Val Val Gln Arg Arg Gln Lys Pro Asp
                 85                  90                  95
ccg gcg acg tac atc ggc tcg ggc aag gcg tcg cag ctg cgc gac atc    336
Pro Ala Thr Tyr Ile Gly Ser Gly Lys Ala Ser Gln Leu Arg Asp Ile
            100                 105                 110
gtc gag gag acc ggc gcc gac acc gtg gtg tgc gac ggg gaa ctg agc    384
Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser
        115                 120                 125
ccc agt cag ctg atg cac ctg gag gag gtc gtc ggg gtc aag gtc gtg    432
Pro Ser Gln Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val
    130                 135                 140
gac cgc acg gcc ctg atc ctg gac atc ttc gcg cag cac gcc cag tcc    480
Asp Arg Thr Ala Leu Ile Leu Asp Ile Phe Ala Gln His Ala Gln Ser
145                 150                 155                 160
cgg gag ggc aag gcg cag gtg gcg ctg gcg cag atg cag tac atg ctg    528
Arg Glu Gly Lys Ala Gln Val Ala Leu Ala Gln Met Gln Tyr Met Leu
                165                 170                 175
ccg cgg ctg cgc ggc tgg ggc cag tcg ctg tcc cgg cag atg ggc ggc    576
Pro Arg Leu Arg Gly Trp Gly Gln Ser Leu Ser Arg Gln Met Gly Gly
            180                 185                 190
ggt ggc ggc ggt ggc atg gcc acg cgc ggt ccc ggt gag acg aag atc    624
Gly Gly Gly Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys Ile
        195                 200                 205
gag acg gac cgg cgg cgg atc aac gac aag atg gcc agg ctc cgc cgg    672
Glu Thr Asp Arg Arg Arg Ile Asn Asp Lys Met Ala Arg Leu Arg Arg
    210                 215                 220
gag ctg gag cag ctg aag acc ggc cgg gac gtg aac cgg gag gag cga    720
Glu Leu Glu Gln Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg
225                 230                 235                 240
cgg cgc aac aag gtg ctg tcg gtc gcc ctc gcc ggc tac acc aac gcc    768
Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala
                245                 250                 255
ggc aag tca tcg ctg ctc aac cgc ctc acc gga gcc ggc gtg ctg gtg    816
Gly Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val
            260                 265                 270
gag aac gcc ctg ttc gcc acc ctg gac acg acc gtg cgg cgg gcg acg    864
Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr
        275                 280                 285
acg ccg agc ggg cgc ccc tac acc atc gcc gac acc gtg ggc ttc gta    912
Thr Pro Ser Gly Arg Pro Tyr Thr Ile Ala Asp Thr Val Gly Phe Val
    290                 295                 300
cgc cac ctc ccg cac cac ctg gtg gag gcg ttc cgt tcc acg atc gaa    960
Arg His Leu Pro His His Leu Val Glu Ala Phe Arg Ser Thr Ile Glu
305                 310                 315                 320
gag gtc gcg gac gcg cat ctg gtg ctg cac gtg gtc gac ggt tcg cac    1008
Glu Val Ala Asp Ala His Leu Val Leu His Val Val Asp Gly Ser His
                325                 330                 335
ccg gac ccc ggc gcg cag ctg gcc tcg gtg cgc gag gtg ctg cgg gac    1056
Pro Asp Pro Gly Ala Gln Leu Ala Ser Val Arg Glu Val Leu Arg Asp
            340                 345                 350
gtg ggc gcc ggc gag tcc acc gag gtc gtg gtc gtc aac aag gcc gat    1104
Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp
        355                 360                 365
gtc gcg gac ccg gac gtc ctc gcc cgt ctg ctg gag cag gag ccg gac    1152
Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gln Glu Pro Asp
    370                 375                 380
gcg atc gtc gtg tcc gcc cgt tcg ggt cgg ggc atc gac gag ctg cgg    1200
Ala Ile Val Val Ser Ala Arg Ser Gly Arg Gly Ile Asp Glu Leu Arg
385                 390                 395                 400
gaa ctg atc gac cgc ctg ctg ccg cac ccc gag gtg gag gtg gag gtc  1248
Glu Leu Ile Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val
                405                 410                 415
gtg atc ccc tac gac gag ggg agc ctg gtg gcg cgg gtg cac gac gag  1296
Val Ile Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu
            420                 425                 430
ggc gag gtg ctc agc acc gag cac acg ccg gag ggc acc ctg ctc acc  1344
Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr
        435                 440                 445
gcg cgg gtc cac ccc gac ctc gcc tcg gag ctt cgg acg ctt ccg cgg  1392
Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg
    450                 455                 460
ccg tga                                                          1398
Pro
465
<210>61
<211>465
<212>PRT
<213>生二素链霉菌
<400>61
Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp
  1               5                  10                  15
Gln Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu
             20                  25                  30
Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gln Leu Arg
         35                  40                  45
Leu Glu Arg Val Val Leu Val Gly Ile Trp Thr Ser Gly Thr Ala Ala
     50                  55                  60
Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala
 65                  70                  75                  80
Gly Ala Leu Val Leu Asp Gly Val Val Gln Arg Arg Gln Lys Pro Asp
                 85                  90                  95
Pro Ala Thr Tyr Ile Gly Ser Gly Lys Ala Ser Gln Leu Arg Asp Ile
            100                 105                 110
Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser
        115                 120                 125
Pro Ser Gln Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val
    130                 135                 140
Asp Arg Thr Ala Leu Ile Leu Asp Ile Phe Ala Gln His Ala Gln Ser
145                 150                 155                 160
Arg Glu Gly Lys Ala Gln Val Ala Leu Ala Gln Met Gln Tyr Met Leu
                165                 170                 175
Pro Arg Leu Arg Gly Trp Gly Gln Ser Leu Ser Arg Gln Met Gly Gly
            180                 185                 190
Gly Gly Gly Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys Ile
        195                 200                 205
Glu Thr Asp Arg Arg Arg Ile Asn Asp Lys Met Ala Arg Leu Arg Arg
    210                 215                 220
Glu Leu Glu Gln Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg
225                 230                 235                 240
Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala
                245                 250                 255
Gly Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val
            260                 265                 270
Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr
        275                 280                 285
Thr Pro Ser Gly Arg Pro Tyr Thr Ile Ala Asp Thr Val Gly Phe Val
    290                 295                 300
Arg His Leu Pro His His Leu Val Glu Ala Phe Arg Ser Thr Ile Glu
305                 310                 315                 320
Glu Val Ala Asp Ala His Leu Val Leu His Val Val Asp Gly Ser His
                325                 330                 335
Pro Asp Pro Gly Ala Gln Leu Ala Ser Val Arg Glu Val Leu Arg Asp
            340                 345                 350
Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp
        355                 360                 365
Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gln Glu Pro Asp
    370                 375                 380
Ala Ile Val Val Ser Ala Arg Ser Gly Arg Gly Ile Asp Glu Leu Arg
385                 390                 395                 400
Glu Leu Ile Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val
                405                 410                 415
Val Ile Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu
            420                 425                 430
Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr
        435                 440                 445
Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg
    450                 455                 460
Pro
465
<210>62
<211>1044
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1044)
<400>62
atg cga gta ctc att atc ggg ggt tca cag ttc gtg ggc cgg gcc ttc  48
Met Arg Val Leu Ile Ile Gly Gly Ser Gln Phe Val Gly Arg Ala Phe
  1               5                  10                  15
gcc gcc gag gca ctg gcc gcg ggg cac cgg gtc acc acg ttc aac cgg    96
Ala Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg
             20                  25                  30
ggt gtc agc ggc acc gac ctg ccc ggc gtc gag gcg gtc agg ggc gac    144
Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp
         35                  40                  45
cgc gag gtg gcc ggc gac ctg gag cgg ctg gtg tcc gga agg cac tgg    192
Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp
     50                  55                  60
gac gcg gtc gtg gac acc tgc ggt tac gtg ccc cgc acg gtg ggg gcc    240
Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala
 65                  70                  75                  80
tcg gcc gcg gcg ctg tcc ggg cac gcg gac acc tac ctc tac gtc tcc    288
Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser
                 85                  90                  95
agc atc gcc tgc ctg ccc gac tgg gcg cag gcg gtc cgt ccg gtg gac    336
Ser Ile Ala Cys Leu Pro Asp Trp Ala Gln Ala Val Arg Pro Val Asp
            100                 105                 110
gac gac tca cct gcc cac gac tgc ccg ccg gac gcc gga ccg gac cac    384
Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His
        115                 120                 125
gcc gac ggt gac tac ggc gtc ctg aag gcc ggc tgc gag cgc gcc gtg    432
Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val
    130                 135                 140
gac cgg cac ttc gcg ggc cgg acc ctg cac ctg cgg gcc ggt gtc atc    480
Asp Arg His Phe Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val Ile
145                 150                 155                 160
ctc ggg ccg cac gac acc atg cgc atg ctc gac gcc tgg ctg tgg cgc    528
Leu Gly Pro His Asp Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg
                165                 170                 175
atg cgc gtc gcc gag ggg gag cac cgc cgg gtg ctc gcc ccg ggc aac    576
Met Arg Val Ala Glu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn
            180                 185                 190
ccc gag gtg ggc atg cgc ctg atc gac gta cgc gat gtc gcc gtc ttc    624
Pro Glu Val Gly Met Arg Leu Ile Asp Val Arg Asp Val Ala Val Phe
        195                 200                 205
ggc ctc gac tgc ctc gcg gac ggc cgt acc ggc gcc ttc atc gtc aac    672
Gly Leu Asp Cys Leu Ala Asp Gly Arg Thr Gly Ala Phe Ile Val Asn
    210                 215                 220
ccg ccg gag aag aac acc acc ttc ggg gag ttg ctc acg gag tgc gtc    720
Pro Pro Glu Lys Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val
225                 230                 235                 240
aag gcc acc ggt tcg gcc gcg gag ccg gtg tgg gtc gac gag ggg ttc    768
Lys Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe
                245                 250                 255
ctc gcc gag cac ggc gtg agt ccg tgg acg gac ctg ccg atg tgg gtg    816
Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val
            260                 265                 270
ccc gac acc gcg cgg gac acc ctc gtg tgg gcg gcc gga gca ccg cgc    864
Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg
        275                 280                 285
gcc cgg gcc gcg ggt ctg gcc tgc cgg ccc ttc tcc gac acc gtg cgg    912
Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg
    290                 295                 300
gac gcc tgg gag gtc gtc cgg gac cgg ccc gtc ccg gaa ctg ccg ctc    960
Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu
305                 310                 315                 320
gcg gcc ggc tgc ggc ctg tcc ctg agc cgg gag aag gag ctg ctc gcc    1008
Ala Ala Gly Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala
                325                 330                 335
gcc tgg gac gct cgc ggc ggt gcg gcg gcg ggc tga                    1044
Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly
            340                 345
<210>63
<211>347
<212>PRT
<213>生二素链霉菌
<400>63
Met Arg Val Leu Ile Ile Gly Gly Ser Gln Phe Val Gly Arg Ala Phe
  1               5                  10                  15
Ala Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg
             20                  25                  30
Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp
         35                  40                  45
Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp
     50                  55                  60
Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala
 65                  70                  75                  80
Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser
                 85                  90                  95
Ser Ile Ala Cys Leu Pro Asp Trp Ala Gln Ala Val Arg Pro Val Asp
            100                 105                 110
Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His
        115                 120                 125
Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val
    130                 135                 140
Asp Arg His Phe Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val Ile
145                 150                 155                 160
Leu Gly Pro His Asp Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg
                165                 170                 175
Met Arg Val Ala Glu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn
            180                 185                 190
Pro Glu Val Gly Met Arg Leu Ile Asp Val Arg Asp Val Ala Val Phe
        195                 200                 205
Gly Leu Asp Cys Leu Ala Asp Gly Arg Thr Gly Ala Phe Ile Val Asn
    210                 215                 220
Pro Pro Glu Lys Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val
225                 230                 235                 240
Lys Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe
                245                 250                 255
Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val
            260                 265                 270
Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg
        275                 280                 285
Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg
    290                 295                 300
Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu
305                 310                 315                 320
Ala Ala Gly Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala
                325                 330                 335
Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly
            340                 345
<210>64
<211>1041
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1041)
<400>64
atg acc gcc ctg ggt act tct gct gaa ccg ttc gcc gca ccc ggc ccg  48
Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro
  1               5                  10                  15
ccg cgg ccg gaa gcg tcc ccg gtg ctg cgc ttc gga gcg atc ggc tgc  96
Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala Ile Gly Cys
             20                  25                  30
ggc gac atc gcg ggc cgt cgc acc ctg ccc gcc ctg ctc tcc acc ccc    144
Gly Asp Ile Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro
         35                  40                  45
ggc acc gtg ctg acc tgc gtc ggc agc cgc gac gcg gac cgg gcc aag    192
Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys
     50                  55                  60
gcc ctg ggc agg cac ttc gac tgc gag gcg gtc gcg ccc tac gag gcc    240
Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala
 65                  70                  75                  80
ctg ctg gaa cgc ccc gac gtg gac gcc gtc tac atc gcg gtg ccc agc    288
Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr Ile Ala Val Pro Ser
                 85                  90                  95
atg ctg cac gcc gaa tgg gcc gcg gcg gcg ctg cgg gcg ggc aaa cac    336
Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His
            100                 105                 110
gtc ctc gtg gag aag ccc gcc gcc gcc aac cac gcc gac gcg gcc cgc    384
Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg
        115                 120                 125
ctg ttc gcc atg gcc cgg gag cgc gga ctg gta ctg atg gag aac ttc    432
Leu Phe Ala Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe
    130                 135                 140
atg ttc ctc cac cac tct caa cac gcc acc gtc aaa gcc ctg ttg gag    480
Met Phe Leu His His Ser Gln His Ala Thr Val Lys Ala Leu Leu Glu
145                 150                 155                 160
gcc ggt gcc atc gga gag ctg cgc acc ttc tcc gcc gcc ttc acc atc    528
Ala Gly Ala Ile Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr Ile
                165                 170                 175
ccg ccg cgc gcc gac gac gac atg cgc tac cga ccc gac atc ggc ggc    576
Pro Pro Arg Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp Ile Gly Gly
            180                 185                 190
ggc gca ctg ctc gac aac ggc gtc tac ccg ctg cgg gcc gcg ctg cac    624
Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His
        195                 200                 205
ttc ctc gga ccc gaa ctg cgc ctg acc ggc gcc gtg ctg cgc cgt gac  672
Phe Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp
    210                 215                 220
cgc cgc cgg ggc gtc gtg gtc tcc ggc agc gtc ctg ctc gcc gcc ccc  720
Arg Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro
225                 230                 235                 240
cag ggc gtg gcc gcc cac ctc gcc ttc ggc atg gaa cac ggc tac cgc  768
Gln Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg
                245                 250                 255
tcg gcg tac gag ctg cac ggc agc acc ggc tcg ctc gcc ctg agc cac  816
Ser Ala Tyr Glu Leu His Gly Ser Thr Gly Ser Leu Ala Leu Ser His
            260                 265                 270
gtc ttc acg acc ccg gac agc cac cac ccc gta ctg cgg ctg tcc cgc  864
Val Phe Thr Thr Pro Asp Ser His His Pro Val Leu Arg Leu Ser Arg
        275                 280                 285
cag gac cac cgg gag gag cgc gtc ctg ccc gtg gac cgg cac ttc gtg  912
Gln Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val
    290                 295                 300
aac atc ctg tcg gtc ttc cgc cgt gcg gtg atc cgg gcc gag gac gtc  960
Asn Ile Leu Ser Val Phe Arg Arg Ala Val Ile Arg Ala Glu Asp Val
305                 310                 315                 320
tcc gcc gag tcg tac gcc gcg ctg cgc cag gcg ggg ctg gtc gac gag  1008
Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gln Ala Gly Leu Val Asp Glu
                325                 330                 335
atc gtg gcc cgc gcc gag acc ttc acc gtg tag                      1041
Ile Val Ala Arg Ala Glu Thr Phe Thr Val
            340                 345
<210>65
<211>346
<212>PRT
<213>生二素链霉菌
<400>65
Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro
  1               5                  10                  15
Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala Ile Gly Cys
             20                  25                  30
Gly Asp Ile Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro
         35                  40                  45
Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys
     50                  55                  60
Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala
 65                  70                  75                  80
Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr Ile Ala Val Pro Ser
                 85                  90                  95
Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His
            100                 105                 110
Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg
        115                 120                 125
Leu Phe Ala Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe
    130                 135                 140
Met Phe Leu His His Ser Gln His Ala Thr Val Lys Ala Leu Leu Glu
145                 150                 155                 160
Ala Gly Ala Ile Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr Ile
                165                 170                 175
Pro Pro Arg Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp Ile Gly Gly
            180                 185                 190
Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His
        195                 200                 205
Phe Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp
    210                 215                 220
Arg Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro
225                 230                 235                 240
Gln Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg
                245                 250                 255
Ser Ala Tyr Glu Leu His Gly Ser Thr Gly Ser Leu Ala Leu Ser His
            260                 265                 270
Val Phe Thr Thr Pro Asp Ser His His Pro Val Leu Arg Leu Ser Arg
        275                 280                 285
Gln Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val
    290                 295                 300
Asn Ile Leu Ser Val Phe Arg Arg Ala Val Ile Arg Ala Glu Asp Val
305                 310                 315                 320
Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gln Ala Gly Leu Val Asp Glu
                325                 330                 335
Ile Val Ala Arg Ala Glu Thr Phe Thr Val
            340                 345
<210>66
<211>1239
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1239)
<400>66
gtg acg gac gcg atc acg acc gag ctg gcc gac cgc gaa ctg ggg cgc  48
Val Thr Asp Ala Ile Thr Thr Glu Leu Ala Asp Arg Glu Leu Gly Arg
  1               5                  10                  15
aga ctg cac cgg ata cgc ggc gtc cac tgg tat ttc ggc aac cac ggt  96
Arg Leu His Arg Ile Arg Gly Val His Trp Tyr Phe Gly Asn His Gly
             20                  25                  30
gac ccg tac gcc ctc atc ctg cgc ggt cag acc gac gac ccg tcg gtg    144
Asp Pro Tyr Ala Leu Ile Leu Arg Gly Gln Thr Asp Asp Pro Ser Val
         35                  40                  45
tac gag gag cgg gtc cgc gag ggc ggg ccg ctg ttc cgc agc cgt acc    192
Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr
     50                  55                  60
ggg acc tgg gtg acc gcg gac ccg gag gtg gcc gcg gcc gtg ctg ggc    240
Gly Thr Trp Val Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Gly
 65                  70                  75                  80
gac tcg cgc ttc ggt gcg ctg gac cgc gcc gga cgg cgc ccg gag gag    288
Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu
                 85                  90                  95
tac ctc cag ccg tcg ccc gcc acg tac ctg ggg ctg gac cgc gcc gcg    336
Tyr Leu Gln Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala
            100                 105                 110
tac gcg cgt ctg cgg cgg gtg gcc gag ccc gtg ctg ggc gcg gac gcc    384
Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala
        115                 120                 125
gcc gcc gcg tgg cgc cgg ctc ggc gag gac gtc ggg cgc cgg ctg ctc    432
Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu
    130                 135                 140
gcc ggc cgc ggt tcc ggc ctc gac ctg acg gcg gac ttc gcc cgc cgg    480
Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg
145                 150                 155                 160
ctg ccg gca ttg gtc ctg gcc gcg tgg ctc ggg gtg ccg ggc gaa cgg    528
Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg
                165                 170                 175
tgc gac gag tgg gag gag tcg ctg cgg gcg gcg ggg ccg ctg ctg gac    576
Cys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp
            180                 185                 190
ggt ctg ctg tgt ccg cag acg ctg gcg gcc acc cgt gcg gcg gac tcg    624
Gly Leu Leu Cys Pro Gln Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser
        195                 200                 205
gcc gcc gag ggg ctg cgc gcg ctg ttg gac gag gtg gtc gcc gcg cgt    672
Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg
    210                 215                 220
ccc ggc ggg tcc ggc gag ggt gcg gtg gcc cgc atg gtc ggc gcc gga    720
Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly
225                 230                 235                 240
gcc gcc ccc gac gac gcg gtg gcc gcc gcc gtg tgc ctg gcg ctc tcg    768
Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser
                245                 250                 255
gcc gtc gaa ccg acg acg acc ctg gtg tgc gaa gcg gtc cgg ctg ctg    816
Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu
            260                 265                 270
ctc gac cga ccc gag tgg tgg cgg cgg ttg tgc gac tcc ccc gct ctg    864
Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu
        275                 280                 285
gcg ccg gcc gcg gtc cgg cac acc ctg cgg cac gcg ccc ccg gtg cgg    912
Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro Val Arg
    290                 295                 300
ctg gag agc cgg gtg gcc cac gag gac gtg acg gtg gcg gat cgt ccg    960
Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro
305                 310                 315                 320
ctg ccc gcc ggg agc cac gtg gtg gtg ctc gtg ggc gcg gca cgg cgc    1008
Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg
                325                 330                 335
gcg ggc gcc ccg gcc gcg gag ccg gcg gac ctg gcg ggc gca ccg gcg    1056
Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala
            340                 345                 350
gcg gag ctg ccg gac gac ctg tgg ttc gcg ctg tcc ggg gag ttc gtc    1104
Ala Glu Leu Pro Asp Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val
        355                 360                 365
ggc cgt gcc gcc gag acc gcg ctg ggc gtg ctg gcc gag gcc gcc ccg    1152
Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro
    370                 375                 380
gga ctg cgg cgg gac ggc gac atc gtc cgg cgg cgc cgt tcc ccg gtc  1200
Gly Leu Arg Arg Asp Gly Asp Ile Val Arg Arg Arg Arg Ser Pro Val
385                 390                 395                 400
ctc ggc agg tac gcg cgg ttc ccc gtc gcg tac tcc tga              1239
Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser
                405                 410
<210>67
<211>412
<212>PRT
<213>生二素链霉菌
<400>67
Val Thr Asp Ala Ile Thr Thr Glu Leu Ala Asp Arg Glu Leu Gly Arg
  1               5                  10                  15
Arg Leu His Arg Ile Arg Gly Val His Trp Tyr Phe Gly Asn His Gly
             20                  25                  30
Asp Pro Tyr Ala Leu Ile Leu Arg Gly Gln Thr Asp Asp Pro Ser Val
         35                  40                  45
Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr
     50                  55                  60
Gly Thr Trp Val Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Gly
 65                  70                  75                  80
Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu
                 85                  90                  95
Tyr Leu Gln Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala
            100                 105                 110
Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala
        115                 120                 125
Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu
    130                 135                 140
Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg
145                 150                 155                 160
Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg
                165                 170                 175
Cys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp
            180                 185                 190
Gly Leu Leu Cys Pro Gln Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser
       195                 200                 205
Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg
    210                 215                 220
Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly
225                 230                 235                 240
Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser
                245                 250                 255
Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu
            260                 265                 270
Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu
        275                 280                 285
Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro Val Arg
    290                 295                 300
Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro
305                 310                 315                 320
Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg
                325                 330                 335
Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala
            340                 345                 350
Ala Glu Leu Pro Asp Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val
        355                 360                 365
Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro
    370                 375                 380
Gly Leu Arg Arg Asp Gly Asp Ile Val Arg Arg Arg Arg Ser Pro Val
385                 390                 395                400
Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser
                405                 410
<210>68
<211>1272
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1272)
<400>68
gtg cgc gtc ctg gtg acc tcc atc ccg cac cac acg cac tac tac cac  48
Val Arg Val Leu Val Thr Ser Ile Pro His His Thr His Tyr Tyr His
  1               5                  10                  15
ctg gta ccg ctg atc tgg gct ctg cgt gcc tcg ggg cac gag gtg gtg  96
Leu Val Pro Leu Ile Trp Ala Leu Arg Ala Ser Gly His Glu Val Val
             20                  25                  30
gcg gcc ggc cag ccg tcg ctg gtc gac gcc atc acc gcc agc ggc atc  144
Ala Ala Gly Gln Pro Ser Leu Val Asp Ala Ile Thr Ala Ser Gly Ile
         35                  40                  45
ccg gcg ttc gcc ctg gcc gag gag gag tcg ctg gcg cag atc ttc gag  192
Pro Ala Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gln Ile Phe Glu
     50                  55                  60
gag gtc gag ggc gat ctc cag ccg tat cag cac ggc atc gac gag ttc  240
Glu Val Glu Gly Asp Leu Gln Pro Tyr Gln His Gly Ile Asp Glu Phe
 65                  70                  75                  80
gac ttc ttc ggc acc ctg aag gac gag ctg gac tgg gag aag ctg ctc  288
Asp Phe Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu
                 85                  90                  95
gcc cag cag gtg atc ctg tcc ggc ctg tgg ctg gaa ccg ctc aac ggc  336
Ala Gln Gln Val Ile Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly
            100                 105                 110
gcc acg acc ctc gac agc atc gtc gac ttc gcc cgg gcc tgg aag ccc    384
Ala Thr Thr Leu Asp Ser Ile Val Asp Phe Ala Arg Ala Trp Lys Pro
        115                 120                 125
gac ctg gtg ctg tgg gag ccg ttc acc tat gcg ggg ccg gtg gcg gcc    432
Asp Leu Val Leu Trp Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala
    130                 135                 140
cgg gcg tgc ggg gcc gcg cac gcc cgc gtc ctg tgg ggg ccg gac acg    480
Arg Ala Cys Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr
145                 150                 155                 160
atc ggg ctg ctg cgg acg aag ttc ctt cag gcc cag gcg cgt cag ccc    528
Ile Gly Leu Leu Arg Thr Lys Phe Leu Gln Ala Gln Ala Arg Gln Pro
                165                 170                 175
gag gag cac cgg gac gac ccg gtc gcg gag tgg atg acc tgg gcc ctg    576
Glu Glu His Arg Asp Asp Pro Val Ala Glu Trp Met Thr Trp Ala Leu
            180                 185                 190
gcg cgc tac ggg tgc gac ttc cgg gag gag gac gtg ctc ggt cag tgg    624
Ala Arg Tyr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu Gly Gln Trp
        195                 200                 205
agc gtg gac ccg atg gcg gag ggc gtc agt ctg ggc ctc gac ctg ccg    672
Ser Val Asp Pro Met Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro
    210                 215                 220
acc gtc ccg atg cgc tac acc ccg tac aac ggg tcg gcg gtg atc ccc    720
Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val Ile Pro
225                 230                 235                 240
gac tgg ctg acc gag gaa ccg aaa cgg cct cgg gtc tgc ctg acc ctg    768
Asp Trp Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu
                245                 250                 255
ggg gtg tcc tcg cgg gag cac agt gag gac gag gtc ccg gtg cag agg    816
Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gln Arg
            260                 265                 270
ttt atc gag gcg ctg gcc gat ctc gac atc gag ctg gtg gcg acc ctg    864
Phe Ile Glu Ala Leu Ala Asp Leu Asp Ile Glu Leu Val Ala Thr Leu
        275                 280                 285
gac gac gcc cag cgg gac ctg ctg ccg agg atc ccg gac aac acg cgc  912
Asp Asp Ala Gln Arg Asp Leu Leu Pro Arg Ile Pro Asp Asn Thr Arg
    290                 295                 300
atc gtc gac ttc gtg ccc atg gac gcg ttg ctg ccg acg tgc tcg gcg  960
Ile Val Asp Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala
305                 310                 315                 320
atc atc aac cac agc ggt tcg ggc acg tgc aac acc gcc gcg ctg cac  1008
Ile Ile Asn His Ser Gly Ser Gly Thr Cys Asn Thr Ala Ala Leu His
                325                 330                 335
ggg gtg ccg cag atc atc ctc ggc ggc atc ctg gac gcc gcc gta cgg  1056
Gly Val Pro Gln Ile Ile Leu Gly Gly Ile Leu Asp Ala Ala Val Arg
            340                 345                 350
cag cac atg ttc gcg cag aac tcc gcc gcc ctc acc ttc gct ccg gag  1104
Gln His Met Phe Ala Gln Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu
        355                 360                 365
gag gtg acc ggc gcg tcg ctg agg agc gcg ctg gtg cgc ctg ctc gag  1152
Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu
    370                 375                 380
gag ccg cgg ttc cgc gac ggc gcg cgg cgg ctg aag gag cgg atg cgg  1200
Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg
385                 390                 395                 400
gcc atg ccc agc ccg gcc ggg atc gtg ccg acc ctg gag cgc ctc acg  1248
Ala Met Pro Ser Pro Ala Gly Ile Val Pro Thr Leu Glu Arg Leu Thr
                405                 410                 415
gcc cag cac cgc cgg gcg tgt tga                                  1272
Ala Gln His Arg Arg Ala Cys
            420
<210>69
<211>423
<212>PRT
<213>生二素链霉菌
<400>69
Val Arg Val Leu Val Thr Ser Ile Pro His His Thr His Tyr Tyr His
  1               5                  10                  15
Leu Val Pro Leu Ile Trp Ala Leu Arg Ala Ser Gly His Glu Val Val
             20                  25                  30
Ala Ala Gly Gln Pro Ser Leu Val Asp Ala Ile Thr Ala Ser Gly Ile
         35                  40                  45
Pro Ala Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gln Ile Phe Glu
     50                  55                  60
Glu Val Glu Gly Asp Leu Gln Pro Tyr Gln His Gly Ile Asp Glu Phe
 65                  70                  75                  80
Asp Phe Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu
                 85                  90                  95
Ala Gln Gln Val Ile Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly
            100                 105                 110
Ala Thr Thr Leu Asp Ser Ile Val Asp Phe Ala Arg Ala Trp Lys Pro
        115                 120                 125
Asp Leu Val Leu Trp Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala
    130                 135                 140
Arg Ala Cys Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr
145                 150                 155                 160
Ile Gly Leu Leu Arg Thr Lys Phe Leu Gln Ala Gln Ala Arg Gln Pro
                165                 170                 175
Glu Glu His Arg Asp Asp Pro Val Ala Glu Trp Met Thr Trp Ala Leu
            180                 185                 190
Ala Arg Tyr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu Gly Gln Trp
        195                 200                 205
Ser Val Asp Pro Met Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro
    210                 215                 220
Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val Ile Pro
225                 230                 235                 240
Asp Trp Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu
                245                 250                 255
Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gln Arg
            260                 265                 270
Phe Ile Glu Ala Leu Ala Asp Leu Asp Ile Glu Leu Val Ala Thr Leu
        275                 280                 285
Asp Asp Ala Gln Arg Asp Leu Leu Pro Arg Ile Pro Asp Asn Thr Arg
    290                 295                 300
Ile Val Asp Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala
305                 310                 315                 320
Ile Ile Asn His Ser Gly Ser Gly Thr Cys Asn Thr Ala Ala Leu His
                325                 330                 335
Gly Val Pro Gln Ile Ile Leu Gly Gly Ile Leu Asp Ala Ala Val Arg
            340                 345                 350
Gln His Met Phe Ala Gln Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu
        355                 360                 365
Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu
    370                 375                 380
Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg
385                 390                 395                 400
Ala Met Pro Ser Pro Ala Gly Ile Val Pro Thr Leu Glu Arg Leu Thr
                405                 410                 415
Ala Gln His Arg Arg Ala Cys
            420
<210>70
<211>1179
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1179)
<400>70
atg cgg gcc ctc ttc acg acc gcg ccg ctc gcg ggc cac ctg ctt ccg    48
Met Arg Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro
  1               5                  10                  15
ctg gtg ccc atc gcg tgg gcc ctg cgg gcg gcc ggc cac gag gta ctg    96
Leu Val Pro Ile Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu
             20                  25                  30
gtg gcg acc cgg gag gac ttc gtg ccg gtc gcc ctg cgg tcg ggg ctg    144
Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu
         35                  40                  45
ccg tcc gcc tcg tgc ggg ccg ccc gcc gcg gac ctg gcg ggc gcg gcc    192
Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala
     50                  55                  60
gag gcg ggg gcg ctc gcg cgg ccc cgc gga gcg gcg gag gct cgg ggg    240
Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly
 65                  70                  75                  80
gtc ctg agc ggg gcg ctg gcg cgc gtc gcc cgg ggc agt ctg gcg ggg    288
Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly
                 85                  90                  95
gtg cgg cgg ctg gcg gac gcc tgg cgg ccg gat ctg atc gtc agc gaa    336
Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu Ile Val Ser Glu
            100                 105                 110
cgg gcc gag ttc gcc ggg ccg ctg gtc gcg gcg gcc ctc ggg gtc ccg    384
Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro
        115                 120                 125
tgg gtc cgc tac cac tgg tcg gtc tcg tcc ctg gag gag tac cgg cga    432
Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg
    130                 135                 140
gcg gcc gag gcc gag ttc gcg ccc gag ctg gcg gcg ctc ggc ctc gac    480
Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp
145                 150                 155                 160
cgg ttc ccg gag gcg gcg cgc gtg ctc gat ccg tgg ccg gtg tcg ctg    528
Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu
                165                 170                 175
cgc cgg ccg gac gcg gtc gcc cac gac ggg gtc cgg cac gta ccg gcc    576
Arg Arg Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala
            180                 185                 190
cac ggg gac gcc ccc gtc ccc gac tgg gcg ttc acg cgc ggt cgc ggg    624
His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly
        195                 200                 205
ccg cgg atc tgc gtg acg ctc ggc acc atg ctg ccc cgg tac ggc gcc    672
Pro Arg Ile Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala
    210                 215                 220
gcc ggg atg gcc gac ttc ctg acg gag ctg gtg gcg gag acc cgc gga    720
Ala Gly Met Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly
225                 230                 235                 240
ggg gac tgc gaa ctg ctc gtg gcg gtc gac gac gac gtc gtc gcg cgg    768
Gly Asp Cys Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg
                245                 250                 255
tgg ccg tcg ctg ccc tcc gcg gtg cgg tac gcc ggc cgg ctg ccg ctg    816
Trp Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu
            260                 265                 270
gcg gag gtg ctg ccc gcg tgc gac gcg gtg gtg cac cac ggc ggg cag    864
Ala Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gln
        275                 280                 285
ggc acg tcc ctg acc gcg ctg gcc gcg ggt cgg ccg cag gtc gtc atg    912
Gly Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gln Val Val Met
    290                 295                 300
gcg cgg ctc gac gac cag ttc gac aac gcg cgg gca ctg gcg gcg gcg    960
Ala Arg Leu Asp Asp Gln Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala
305                 310                 315                 320
ggg gcg gcc ctg ctc gta ccg ccg tcc cgg gcc act ccc gcg gcc gtg    1008
Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val
                325                 330                 335
gcc gcg ggg tgc gcc gaa gtg ctg gag aac gcc ctg tat gcc aag gcg  1056
Ala Ala Gly Cys Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala
            340                 345                 350
gca gcc ggg ctc gcc gag gag atg gcg ctg ctg ccg tcg ccg tcg gcg  1104
Ala Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala
        355                 360                 365
gcg gtc gga ctc ctg gaa cac ccg ggg ccc ggg ccg gac atg ccg cgg  1152
Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg
    370                 375                 380
agt tac ccg aac gag gat gcg gtg tga                              1179
Ser Tyr Pro Asn Glu Asp Ala Val
385                 390
<210>71
<211>392
<212>PRT
<213>生二素链霉菌
<400>71
Met Arg Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro
  1               5                  10                  15
Leu Val Pro Ile Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu
             20                  25                  30
Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Set Gly Leu
         35                  40                  45
Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala
     50                  55                  60
Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly
 65                  70                  75                  80
Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly
                 85                  90                  95
Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu Ile Val Ser Glu
            100                 105                 110
Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro
        115                 120                 125
Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg
    130                 135                 140
Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp
145                 150                 155                 160
Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu
                165                 170                 175
Arg Arg Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala
            180                 185                 190
His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly
        195                 200                 205
Pro Arg Ile Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala
    210                 215                 220
Ala Gly Met Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly
225                 230                 235                 240
Gly Asp Cys Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg
                245                 250                 255
Trp Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu
            260                 265                 270
Ala Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gln
        275                 280                 285
Gly Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gln Val Val Met
    290                 295                 300
Ala Arg Leu Asp Asp Gln Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala
305                 310                 315                 320
Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val
                325                 330                 335
Ala Ala Gly Cys Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala
            340                 345                 350
Ala Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala
        355                 360                 365
Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg
    370                 375                 380
Ser Tyr Pro Asn Glu Asp Ala Val
385                 390
<210>72
<211>993
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(993)
<400>72
gtg aat ctg gaa gta ctc aac cgt tcg aac gat ccg cgc ggg ccg gtg  48
Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val
  1               5                  10                  15
atc acg gtg gtc ggc gcg tcc ggc ttc atc ggg tcc gcc ctg gtc gcc  96
Ile Thr Val Val Gly Ala Ser Gly Phe Ile Gly Ser Ala Leu Val Ala
             20                  25                  30
gag ctg gcg cgc atg ccg gtg cgg ctg cgg gcg gtg gcc cgg cgc gag  144
Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu
         35                  40                  45
acc ccc gtt ccc gcg ggg gca cgg gcc gcc gtc gag gtc cgc cgg gcg  192
Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg Ala
     50                  55                  60
gac ctc gcc cgg ccg gac gag gtc ggg gcc gcc gtc gag ggg gcg gac  240
Asp Leu Ala Arg Pro Asp Glu Val Gly Ala Ala Val Glu Gly Ala Asp
 65                  70                  75                  80
gcc gtc gtg cac ctc gcc gcc cac atc ggc ggc gcg cgg tcg tgg cgc    288
Ala Val Val His Leu Ala Ala His Ile Gly Gly Ala Arg Ser Trp Arg
                 85                  90                  95
gcg gcc gac gag cgg tcg ctg cgg gtg aac gtc ggt ctg ctg cgc gac    336
Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp
            100                 105                 110
gtg gcc gac gcg ttc cgg gac cgc tcg ggg ccc gcc ccg gcc gtg gtc    384
Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val
        115                 120                 125
ctg gcc agt acc ctc cag gcc ggc gtc gag ctg tcc cgg cag ggc ccg    432
Leu Ala Ser Thr Leu Gln Ala Gly Val Glu Leu Ser Arg Gln Gly Pro
    130                 135                 140
tac gcc cgg cag aag tcg gcg gcc gag gag gtc ctg ctg cgg gcc gcc    480
Tyr Ala Arg Gln Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala
145                 150                 155                 160
tcc gag gag gtg gtc cgc ggc gtc gtg ctg cgg ctg ccg acc gtc tac    528
Ser Glu Glu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr
                165                 170                 175
ggg cgc agc ccg ctg acc ggg tgg acg ggc cgc ggg gtg gtc gcg tcg    576
Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser
            180                 185                 190
gtg gca cgg cag gcc gtc tcg ggc gag ccg gtc acg atg tgg cac gac    624
Val Ala Arg Gln Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp
        195                 200                 205
ggc acg gtc ggg cgc gat ctg ctc cac gtg gag gac gcg gcc cgc gcc    672
Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala
    210                 215                 220
ttc gcg gcg gcg ctc ggt cac gtg gag cgg ctg gac ggc ggc acg tgg    720
Phe Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp
225                 230                 235                 240
tcc gtc ggt acg ggc cgg ctg gag ccc ttg gga gag gtg ttc tcg gcc    768
Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala
                245                 250                 255
ctc gcc ggg ctg gtg gcc gag cgg acg ggg agg ccc ccc gta ccg gtg  816
Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val
            260                 265                 270
gtc tcc acg gag ccg ccc gac cat gcc gag gcg ggc gac ttc gag agc  864
Val Ser Thr Glu Pro Pro Asp His Ala Glu Ala Gly Asp Phe Glu Ser
        275                 280                 285
gcg gtc tgt gac ccc tcc gcg ttc cgc gcg gtg acc ggg tgg tct ccc  912
Ala Val Cys Asp Pro Ser Ala Phe Arg Ala Val Thr Gly Trp Ser Pro
    290                 295                 300
ctc gtt ccg ttg cgg gcg ggg ctc ggc gcc gtg gtg gag acg atg gtg  960
Leu Val Pro Leu Arg Ala Gly Leu Gly Ala Val Val Glu Thr Met Val
305                 310                 315                 320
gcc gac gga gcg agg ggt ggg atc cga acg tga                      993
Ala Asp Gly Ala Arg Gly Gly Ile Arg Thr
                325                 330
<210>73
<211>330
<212>PRT
<213>生二素链霉菌
<400>73
Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val
  1               5                  10                  15
Ile Thr Val Val Gly Ala Ser Gly Phe Ile Gly Ser Ala Leu Val Ala
             20                  25                  30
Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu
         35                  40                  45
Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg Ala
     50                  55                  60
Asp Leu Ala Arg Pro Asp Glu Val Gly Ala Ala Val Glu Gly Ala Asp
 65                  70                  75                  80
Ala Val Val His Leu Ala Ala His Ile Gly Gly Ala Arg Ser Trp Arg
                 85                  90                  95
Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp
            100                 105                 110
Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val
        115                 120                 125
Leu Ala Ser Thr Leu Gln Ala Gly Val Glu Leu Ser Arg Gln Gly Pro
    130                 135                 140
Tyr Ala Arg Gln Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala
145                 150                 155                 160
Ser Glu Glu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr
                165                 170                 175
Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser
            180                 185                 190
Val Ala Arg Gln Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp
        195                 200                 205
Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala
    210                 215                 220
Phe Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp
225                 230                 235                 240
Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala
                245                 250                 255
Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val
            260                 265                 270
Val Ser Thr Glu Pro Pro Asp His Ala Glu Ala Gly Asp Phe Glu Ser
        275                 280                 285
Ala Val Cys Asp Pro Ser Ala Phe Arg Ala Val Thr Gly Trp Ser Pro
    290                 295                 300
Leu Val Pro Leu Arg Ala Gly Leu Gly Ala Val Val Glu Thr Met Val
305                 310                 315                 320
Ala Asp Gly Ala Arg Gly Gly Ile Arg Thr
                325                 330
<210>74
<211>1008
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1008)
<400>74
gtg agc acg gac cgg gag cag gcc gcg cac acg cgg ctc ggt cgc agc  48
Val Ser Thr Asp Arg Glu Gln Ala hla His Thr Arg Leu Gly Arg Ser
   1              5                  10                  15
gcg acc ctg gtg agc cgg ctc tgg ctg ggc acc gtg aac ttc agc ggc  96
Ala Thr Leu Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly
             20                  25                  30
cgg gtc gag gac ggt gac gcg atg cag ctg atg gag gcg gcg gtc gac  144
Arg Val Glu Asp Gly Asp Ala Met Gln Leu Met Glu Ala Ala Val Asp
         35                  40                  45
cgc ggc atc aac tgc atc gac acc gcg gac atc tac ggc tgg cgg atc  192
Arg Gly Ile Asn Cys Ile Asp Thr Ala Asp Ile Tyr Gly Trp Arg Ile
     50                  55                  60
cac aag ggc cac acc gag gaa ctg gtg ggc cgg tgg ctg gcc aag agc  240
His Lys Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser
 65                  70                  75                  80
gcc gcg cgg cgg gag gac gtc ctg ctg gcc acc aag gtc ggc ggg gac  288
Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp
                 85                  90                  95
atg agc gaa cgg ctc aac gac ggc ggc ctg tcg gcg cgg cac atc gtc  336
Met Ser Glu Arg Leu Asn Asp Gly Gly Leu Ser Ala Arg His Ile Val
            100                 105                 110
acg gcc tgc gag cag tcg ctg cgg cgc ctg ggc gtg gac cac atc gac  384
Thr Ala Cys Glu Gln Ser Leu Arg Arg Leu Gly Val Asp His Ile Asp
        115                 120                 125
ctg tac cag atg cac cgc gtc gac cac gcc gcg ccg tgg gac gag atc    432
Leu Tyr Gln Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu Ile
    130                 135                 140
tgg cag gcg atg gac cgt ctg gtg gcg agc ggc aag gtg acc tac gtg    480
Trp Gln Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Thr Tyr Val
145                 150                 155                 160
ggg tcg tcg aac ttc gcc ggc tgg aac gtc gcc gcc gcg cag gac gcg    528
Gly Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Ala Ala Gln Asp Ala
                165                 170                 175
gcc cgg cgg cgc cag tcc ctc ggt ctg gtg tcc gag cag tgc ctg tac    576
Ala Arg Arg Arg Gln Ser Leu Gly Leu Val Ser Glu Gln Cys Leu Tyr
            180                 185                 190
aac ctg gcg gtg cgc cac gcc gag ctg gaa ctg ctg ccg gcc gcc cag    624
Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gln
        195                 200                 205
gcg tac gga ctg ggc gtg ttc gcc tgg tcg ccg ctg cac ggc ggg ctg    672
Ala Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu
    210                 215                 220
ctc agc ggg gtg ctg cgc aag ctc gcg gcg ggc gtc gcg gtg aag tcg    720
Leu Ser Gly Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser
225                 230                 235                 240
gca cag ggg cgg gcc cag ctg ctg ctg ccc gag ctg cgc gcg acg atc    768
Ala Gln Gly Arg Ala Gln Leu Leu Leu Pro Glu Leu Arg Ala Thr Ile
                245                 250                 255
gag gcg tac gag ggg ttc tgc ggc cgg atc ggc gcg gat ccg gcc gag    816
Glu Ala Tyr Glu Gly Phe Cys Gly Arg Ile Gly Ala Asp Pro Ala Glu
            260                 265                 270
gtc ggt ctg gcc tgg gtg ctg tcc cgg ccg ggg atc agc ggc gcg gtg    864
Val Gly Leu Ala Trp Val Leu Ser Arg Pro Gly Ile Ser Gly Ala Val
        275                 280                 285
atc ggt ccg cgc acg gtg gac cag ctg gac tcg gcg ctg cgg tcc ctg    912
Ile Gly Pro Arg Thr Val Asp Gln Leu Asp Ser Ala Leu Arg Ser Leu
    290                 295                 300
gac ctg gtc ctc ggg gag gcc gaa ctg gcc gag ctg gac gcc atc ttc  960
Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala Ile Phe
305                 310                 315                 320
ccg ccc ctg ggc aag ggc ggc cgg gcg ccg gac gcg tgg atc agc tga  1008
Pro Pro Leu Gly Lys Gly Gly Arg Ala Pro Asp Ala Trp Ile Ser
                325                 330                 335
<210>75
<211>335
<212>PRT
<213>生二素链霉菌
<400>75
Val Ser Thr Asp Arg Glu Gln Ala Ala His Thr Arg Leu Gly Arg Ser
  1               5                  10                  15
Ala Thr Leu Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly
             20                  25                  30
Arg Val Glu Asp Gly Asp Ala Met Gln Leu Met Glu Ala Ala Val Asp
         35                  40                  45
Arg Gly Ile Asn Cys Ile Asp Thr Ala Asp Ile Tyr Gly Trp Arg Ile
     50                  55                  60
His Lys Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser
 65                  70                  75                  80
Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp
                 85                  90                  95
Met Ser Glu Arg Leu Asn Asp Gly Gly Leu Ser Ala Arg His Ile Val
            100                 105                 110
Thr Ala Cys Glu Gln Ser Leu Arg Arg Leu Gly Val Asp His Ile Asp
        115                 120                 125
Leu Tyr Gln Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu Ile
    130                 135                 140
Trp Gln Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Thr Tyr Val
145                 150                 155                 160
Gly Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Ala Ala Gln Asp Ala
                165                 170                 175
Ala Arg Arg Arg Gln Ser Leu Gly Leu Val Ser Glu Gln Cys Leu Tyr
            180                 185                 190
Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gln
        195                 200                 205
Ala Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu
    210                 215                 220
Leu Ser Gly Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser
225                 230                 235                 240
Ala Gln Gly Arg Ala Gln Leu Leu Leu Pro Glu Leu Arg Ala Thr Ile
                245                 250                 255
Glu Ala Tyr Glu Gly Phe Cys Gly Arg Ile Gly Ala Asp Pro Ala Glu
            260                 265                 270
Val Gly Leu Ala Trp Val Leu Ser Arg Pro Gly Ile Ser Gly Ala Val
        275                 280                 285
Ile Gly Pro Arg Thr Val Asp Gln Leu Asp Ser Ala Leu Arg Ser Leu
    290                 295                 300
Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala Ile Phe
305                 310                 315                 320
Pro Pro Leu Gly Lys Gly Gly Arg Ala Pro Asp Ala Trp Ile Ser
                325                 330                 335
<210>76
<211>1233
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1233)
<400>76
atg att gcc acc gcg tgc cgc gtc tgc ggc aac aag gag ctg ctc tcc    48
Met Ile Ala Thr Ala Cys Arg Val Cys Gly Asn Lys Glu Leu Leu Ser
  1               5                  10                  15
gta ctc gac ctg ggc gaa cag gcg ctc acc ggg gtg ttc ccg gcc gac    96
Val Leu Asp Leu Gly Glu Gln Ala Leu Thr Gly Val Phe Pro Ala Asp
             20                  25                  30
cgc gac gag gtc gtg ccg tcg gtc ccg ctg gaa ctc gtc gcg tgt tcc    144
Arg Asp Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser
         35                  40                  45
ccg gcc gga tgc ggc ctc gtg caa ctg cgc cac acc ccc gac ccg gac    192
Pro Ala Gly Cys Gly Leu Val Gln Leu Arg His Thr Pro Asp Pro Asp
     50                  55                  60
ctc atg tac ggc gag ggc tac ggc tac cgc tcg ggc atc cgg ccc ttc    240
Leu Met Tyr Gly Glu Gly Tyr Gly Tyr Arg Ser Gly Ile Arg Pro Phe
 65                  70                  75                  80
atg gtc gac cac ctg cat ggc aag gtc gcc gcc gtc cgc cgg ctg gtg    288
Met Val Asp His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val
                 85                  90                  95
gac ctc ggc ccg gac gac ctg gtc ctc gac atc ggc agc aac gac gcc    336
Asp Leu Gly Pro Asp Asp Leu Val Leu Asp Ile Gly Ser Asn Asp Ala
            100                 105                 110
acg ctc ctc aag ggc tac ccc gcc gac ggc ccg cga ctg gtc ggc atc    384
Thr Leu Leu Lys Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly Ile
        115                 120                 125
gac ccg acc ggc ggc aag ttc cgc gac ctg tac ccg ccg aac gcc gag    432
Asp Pro Thr Gly Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu
    130                 135                 140
ttg gtc gtg gac tac ttc acc cgc gcg acc ttc gag aac cgc ttc ggg    480
Leu Val Val Asp Tyr Phe Thr Arg Ala Thr Phe Glu Asn Arg Phe Gly
145                 150                 155                 160
gcg cgg cgg gcg aag gcc gtc acc tcc atc gcg atg ttc tac gac ctg    528
Ala Arg Arg Ala Lys Ala Val Thr Ser Ile Ala Met Phe Tyr Asp Leu
                165                 170                 175
ccg gac ccg ctg cgc ttc atg agc gac gtc cgc gac gtc ctc gcc gag    576
Pro Asp Pro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu
            180                 185                 190
gac ggc gtc tgg atg atg gag cag agc tac ctg ccc gcc atg ctc gaa    624
Asp Gly Val Trp Met Met Glu Gln Ser Tyr Leu Pro Ala Met Leu Glu
        195                 200                 205
gcc gac gcg tac gac atc gtc tgc cac gag cac ctg gag tac tac gcg    672
Ala Asp Ala Tyr Asp Ile Val Cys His Glu His Leu Glu Tyr Tyr Ala
    210                 215                 220
ctg cgc cag atc gag tgg atg gcg gaa cgc gtc ggc ctc acc gtc atc    720
Leu Arg Gln Ile Glu Trp Met Ala Glu Arg Val Gly Leu Thr Val Ile
225                 230                 235                 240
cgg gcc gag ctc acc gag gtg tac ggc ggc agc ctg tgc gtc acg ctc    768
Arg Ala Glu Leu Thr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr Leu
                245                 250                 255
gcc agg acc ggt tcc cgg cac ccg agg gac gag gcg ggc ctg gcc cgc    816
Ala Arg Thr Gly Ser Arg His Pro Arg Asp Glu Ala Gly Leu Ala Arg
            260                 265                 270
atc cgg gcc gcc gag gcc gcc gcg gga ctg gac ggc atg gca ccg ttc    864
Ile Arg Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro Phe
        275                 280                 285
gag gcc ttc gcc cgc cgc gtc gcc gac cag cgg gac gcc ctg cgc ggc    912
Glu Ala Phe Ala Arg Arg Val Ala Asp Gln Arg Asp Ala Leu Arg Gly
    290                 295                 300
ttc ctg gac cgc tcc cgc caa gag ggc ctg ctg acc ctc ggg tac ggc    960
Phe Leu Asp Arg Ser Arg Gln Glu Gly Leu Leu Thr Leu Gly Tyr Gly
305                 310                 315                 320
gcc tcc acc aag ggc aac gtc atc ctc cag tac tgc ggg atc acc gaa    1008
Ala Ser Thr Lys Gly Asn Val Ile Leu Gln Tyr Cys Gly Ile Thr Glu
                325                 330                 335
cgg gac ctg ccg tgc atc ggc gag gtg agc gag gag aag gcg ggg cgt  1056
Arg Asp Leu Pro Cys Ile Gly Glu Val Ser Glu Glu Lys Ala Gly Arg
            340                 345                 350
ttc acc ccc ggg acg ggc atc ccc atc gtg tcc gag gag gac gcg aag  1104
Phe Thr Pro Gly Thr Gly Ile Pro Ile Val Ser Glu Glu Asp Ala Lys
        355                 360                 365
gcg cag aag ccg gac cag ttg ctg gtc ctg ccc tgg atc tac cgg gac  1152
Ala Gln Lys Pro Asp Gln Leu Leu Val Leu Pro Trp Ile Tyr Arg Asp
    370                 375                 380
ggg ttc gtc gaa cgg gag cgg gag ttc ctc gac ggc ggc ggc cga ctg  1200
Gly Phe Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu
385                 390                 395                 400
gtc ttc ccg ctg ccc gcg ctc gac gtc gtg tga                      1233
Val Phe Pro Leu Pro Ala Leu Asp Val Val
               405                  410
<210>77
<211>410
<212>PRT
<213>生二素链霉菌
<400>77
Met Ile Ala Thr Ala Cys Arg Val Cys Gly Asn Lys Glu Leu Leu Ser
  1               5                  10                  15
Val Leu Asp Leu Gly Glu Gln Ala Leu Thr Gly Val Phe Pro Ala Asp
             20                  25                  30
Arg Asp Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser
         35                  40                  45
Pro Ala Gly Cys Gly Leu Val Gln Leu Arg His Thr Pro Asp Pro Asp
     50                  55                  60
Leu Met Tyr Gly Glu Gly Tyr Gly Tyr Arg Ser Gly Ile Arg Pro Phe
 65                  70                  75                  80
Met Val Asp His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val
                 85                  90                  95
Asp Leu Gly Pro Asp Asp Leu Val Leu Asp Ile Gly Ser Asn Asp Ala
            100                 105                 110
Thr Leu Leu Lys Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly Ile
        115                 120                 125
Asp Pro Thr Gly Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu
    130                 135                 140
Leu Val Val Asp Tyr Phe Thr Arg Ala Thr Phe Glu Asn Arg Phe Gly
145                 150                 155                 160
Ala Arg Arg Ala Lys Ala Val Thr Ser Ile Ala Met Phe Tyr Asp Leu
                165                 170                 175
Pro Asp Pro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu
            180                 185                 190
Asp Gly Val Trp Met Met Glu Gln Ser Tyr Leu Pro Ala Met Leu Glu
        195                 200                 205
Ala Asp Ala Tyr Asp Ile Val Cys His Glu His Leu Glu Tyr Tyr Ala
    210                 215                 220
Leu Arg Gln Ile Glu Trp Met Ala Glu Arg Val Gly Leu Thr Val Ile
225                 230                 235                 240
Arg Ala Glu Leu Thr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr Leu
                245                 250                 255
Ala Arg Thr Gly Ser Arg His Pro Arg Asp Glu Ala Gly Leu Ala Arg
            260                 265                 270
Ile Arg Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro Phe
        275                 280                 285
Glu Ala Phe Ala Arg Arg Val Ala Asp Gln Arg Asp Ala Leu Arg Gly
    290                 295                 300
Phe Leu Asp Arg Ser Arg Gln Glu Gly Leu Leu Thr Leu Gly Tyr Gly
305                 310                 315                 320
Ala Ser Thr Lys Gly Asn Val Ile Leu Gln Tyr Cys Gly Ile Thr Glu
                325                 330                 335
Arg Asp Leu Pro Cys Ile Gly Glu Val Ser Glu Glu Lys Ala Gly Arg
            340                 345                 350
Phe Thr Pro Gly Thr Gly Ile Pro Ile Val Ser Glu Glu Asp Ala Lys
        355                 360                 365
Ala Gln Lys Pro Asp Gln Leu Leu Val Leu Pro Trp Ile Tyr Arg Asp
    370                 375                 380
Gly Phe Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu
385                 390                 395                 400
Val Phe Pro Leu Pro Ala Leu Asp Val Val
                405                 410
<210>78
<211>1116
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1116)
<400>78
gtg cac cgg gac aac gcc gcc gag ccg ttg gtc aaa tgc ctg gtc tgg  48
Val His Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp
  1               5                  10                  15
gac ctg gac aac acc ctc tgg cag ggc acc ctc ctc gag gag gac gag  96
Asp Leu Asp Asn Thr Leu Trp Gln Gly Thr Leu Leu Glu Glu Asp Glu
             20                  25                  30
gtc cgg ctc gcc ccg gac gtc ctg cgg acc atc acc gag ctg gac gcg  144
Val Arg Leu Ala Pro Asp Val Leu Arg Thr Ile Thr Glu Leu Asp Ala
         35                  40                  45
cgc ggc atc ctg cag gcg gtg gcc agc aag aac gac cac gat cac gcc    192
Arg Gly Ile Leu Gln Ala Val Ala Ser Lys Asn Asp His Asp His Ala
     50                  55                  60
tgg gcg aag ctc gaa cag ctc ggc gtc gcc gag tac ttc gtg ctc ccg    240
Trp Ala Lys Leu Glu Gln Leu Gly Val Ala Glu Tyr Phe Val Leu Pro
 65                  70                  75                  80
agg atc ggc tgg ggc ccg aag tcg aag tcg gtc cgc gag atc gcc gac    288
Arg Ile Gly Trp Gly Pro Lys Ser Lys Ser Val Arg Glu Ile Ala Asp
                 85                  90                  95
cgg ctg aac ttc gcg ccg agc acc ctc gcc ttc atc gac gac cag ccc    336
Arg Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe Ile Asp Asp Gln Pro
            100                 105                 110
ttc gaa cgg gcc gag gtc acc cac gaa ctg ccg gag gtc cgc acc tac    384
Phe Glu Arg Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr
        115                 120                 125
gcc gcc gag cag gcg acc cgg ctg acc ggc ctc ccg gag ttc agc ccg    432
Ala Ala Glu Gln Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro
    130                 135                 140
ggc acc gtc acc gtc gac tcg acc cgc cgc cgc tcc atg tac cag gcg    480
Gly Thr Val Thr Val Asp Ser Thr Arg Arg Arg Ser Met Tyr Gln Ala
145                 150                 155                 160
tcc ttc cgc cgg gac gcc gag cgg tcc gac ttc acc gga ccc gac gcg    528
Ser Phe Arg Arg Asp Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala
                165                 170                 175
gac ttc ctg cgc tcg ctg gac atc cgg atg cgg atc agc cgc gcc acg    576
Asp Phe Leu Arg Ser Leu Asp Ile Arg Met Arg Ile Ser Arg Ala Thr
            180                 185                 190
ccc ctg gag ctg tcg cgg gtc gag gaa ctg acc ctg cgc acc agc cag    624
Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gln
        195                 200                 205
atg aac gcc acc gga gtg cac tac tcc gag gac gag ctg cgc gcc ctc    672
Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu
    210                 215                 220
atc gac gac ccc gac cac gag gtg ctg gtc acc acc gtc acc gat cgc    720
Ile Asp Asp Pro Asp His Glu Val Leu Val Thr Thr Val Thr Asp Arg
225                 230                 235                 240
ttc ggt ccc tac ggc gcg gtc ggc gtc gtg ctg ctg cgg cgc ggc ccc    768
Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro
                245                 250                 255
gag gcc tgg cgg atc aag ctg ctg gcc acc tcg tgc cgg gtg gtg tcg    816
Glu Ala Trp Arg Ile Lys Leu Leu Ala Thr Ser Cys Arg Val Val Ser
            260                 265                 270
ctg ggg gcc ggc acg gtg atc ctg cgc tgg ctg acg gac cag gcg cac    864
Leu Gly Ala Gly Thr Val Ile Leu Arg Trp Leu Thr Asp Gln Ala His
        275                 280                 285
cgg gcc ggg gtg cac ctc gga gcc gac ttc cgg gcc acc gaa cgc aac    912
Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn
    290                 295                 300
cgg atg atg gaa gtg gcc tac cgc ttc gcc gga ttc acc gac gat ccc    960
Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro
305                 310                 315                 320
tgc ccg tgc cag gac gcc tcc gcc gcc acc ggc gcg atc ggc cgc ctg    1008
Cys Pro Cys Gln Asp Ala Ser Ala Ala Thr Gly Ala Ile Gly Arg Leu
                325                 330                 335
cac ctg gtg ccg tcc ccc cgg ccc gcc ccc gac acc ctc cgt ctg gaa    1056
His Leu Val Pro Ser Pro Arg Pro Ala Pro Asp Thr Leu Arg Leu Glu
            340                 345                 350
gct ccc gac ctg gcc acg ggc cgg cgg cgc ccc ggc cag gat ccc gaa    1104
Ala Pro Asp Leu Ala Thr Gly Arg Arg Arg Pro Gly Gln Asp Pro Glu
        355                 360                 365
agg acc cca tga                                                    1116
Arg Thr Pro
    370
<210>79
<211>371
<212>PRT
<213>生二素链霉菌
<400>79
Val His Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp
  1               5                  10                  15
Asp Leu Asp Asn Thr Leu Trp Gln Gly Thr Leu Leu Glu Glu Asp Glu
             20                  25                  30
Val Arg Leu Ala Pro Asp Val Leu Arg Thr Ile Thr Glu Leu Asp Ala
         35                  40                  45
Arg Gly Ile Leu Gln Ala Val Ala Ser Lys Asn Asp His Asp His Ala
     50                  55                  60
Trp Ala Lys Leu Glu Gln Leu Gly Val Ala Glu Tyr Phe Val Leu Pro
 65                  70                  75                  80
Arg Ile Gly Trp Gly Pro Lys Ser Lys Ser Val Arg Glu Ile Ala Asp
                 85                  90                  95
Arg Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe Ile Asp Asp Gln Pro
            100                 105                 110
Phe Glu Arg Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr
        115                 120                 125
Ala Ala Glu Gln Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro
    130                 135                 140
Gly Thr Val Thr Val Asp Set Thr Arg Arg Arg Ser Met Tyr Gln Ala
145                 150                 155                 160
Ser Phe Arg Arg Asp Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala
                165                 170                 175
Asp Phe Leu Arg Ser Leu Asp Ile Arg Met Arg Ile Ser Arg Ala Thr
            180                 185                 190
Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gln
        195                 200                 205
Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu
    210                 215                 220
Ile Asp Asp Pro Asp His Glu Val Leu Val Thr Thr Val Thr Asp Arg
225                 230                 235                 240
Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro
                245                 250                 255
Glu Ala Trp Arg Ile Lys Leu Leu Ala Thr Ser Cys Arg Val Val Ser
            260                 265                 270
Leu Gly Ala Gly Thr Val Ile Leu Arg Trp Leu Thr Asp Gln Ala His
        275                 280                 285
Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn
    290                 295                 300
Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro
305                 310                 315                 320
Cys Pro Cys Gln Asp Ala Ser Ala Ala Thr Gly Ala Ile Gly Arg Leu
                325                 330                 335
His Leu Val Pro Ser Pro Arg Pro Ala Pro Asp Thr Leu Arg Leu Glu
            340                 345                 350
Ala Pro Asp Leu Ala Thr Gly Arg Arg Arg Pro Gly Gln Asp Pro Glu
        355                 360                 365
Arg Thr Pro
    370
<210>80
<211>1122
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1122)
<400>80
gtg gct gac acc tcc cac gcc gac ggc acc gag gcc gag gag ctg ttc  48
Val Ala Asp Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe
  1               5                  10                  15
acc gcg ctg gtc ggc gac cgg gcg gcc gag tgg gac cgg acg ggc gag    96
Thr Ala Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu
             20                  25                  30
ctg ccc ctc ggc ctg ctg cac gac ctc ggc tcc cgg ggc ctg ctg tgc    144
Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys
         35                  40                  45
gca cag gcg ccc gcg gtc cac ggc ggc ctc ggc tgg acc agc cgg cgc    192
Ala Gln Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg
     50                  55                  60
aac ggc gaa ctc acc gcg cac gtc ggc gcc ctc tgc agc tcg ttg cgg    240
Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg
 65                  70                  75                  80
agc gtc atg acc tcg cag ggc atg gcc gcc tgg acg ctg cgc cgg ctc    288
Ser Val Met Thr Ser Gln Gly Met Ala Ala Trp Thr Leu Arg Arg Leu
                 85                  90                  95
gcc gga gcg gac cag cag gcc tcc ctg gtg ccc cgg ttg acc ggc ggc    336
Ala Gly Ala Asp Gln Gln Ala Ser Leu Val Pro Arg Leu Thr Gly Gly
            100                 105                 110
gaa ctg gcc gcc gtg gcg ttc acc gag gcc ggc gcc ggc agc gac ctg    384
Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu
        115                 120                 125
tcc gcc ctg cgc acc cgc atc acc tcc gac ggc gac gaa gtc gtc gtc    432
Ser Ala Leu Arg Thr Arg Ile Thr Ser Asp Gly Asp Glu Val Val Val
    130                 135                 140
gac ggc gtc aag gtg tgg gcg acc aac gcc gcg tac gcg gac ctg ctg    480
Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu
145                 150                 155                 160
gtg gtc ttc ggc cgc acg gag cag ggc gcg ggc gcc gtc gtg gtg ccc    528
Val Val Phe Gly Arg Thr Glu Gln Gly Ala Gly Ala Val Val Val Pro
               165                  170                 175
gcc tcg gcc ccc ggc gta cgc gtc gag cgc atc acc gac gcg cac ggc    576
Ala Ser Ala Pro Gly Val Arg Val Glu Arg Ile Thr Asp Ala His Gly
            180                 185                 190
tgc cgc gcg gcc gga cac gcc gac atc cac ctg gac ggg gtc cgg ctg    624
Cys Arg Ala Ala Gly His Ala Asp Ile His Leu Asp Gly Val Arg Leu
        195                 200                 205
ccg gca gac gcc ctg ctc cag ggc cac gac cgc acc ccc gcc ctg ctg    672
Pro Ala Asp Ala Leu Leu Gln Gly His Asp Arg Thr Pro Ala Leu Leu
    210                 215                 220
gtc acc acc gcg ctg agc tac ggc cgg atg tcg gtg gcc tgg ggc tcc    720
Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser
225                 230                 235                 240
ctg ggc atc ctg cgc gcc tgc ctg gcc gcc gcc gca cgt cac gcc ggc    768
Leu Gly Ile Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly
                245                 250                 255
gga cgg gag cag ttc ggc acg cgg ctc tcg gac cac cag ctc gtc gcc    816
Gly Arg Glu Gln Phe Gly Thr Arg Leu Ser Asp His Gln Leu Val Ala
            260                 265                 270
cgg cac ctc gcc gaa ctg ttc gtc gcc gaa cag cac gcc gcc cgg gcg    864
Arg His Leu Ala Glu Leu Phe Val Ala Glu Gln His Ala Ala Arg Ala
        275                 280                 285
tgc gag cac gcc agc gcc cag tgg gac gag ggc agc ccc gac atg gtg    912
Cys Glu His Ala Ser Ala Gln Trp Asp Glu Gly Ser Pro Asp Met Val
    290                 295                 300
gtc gcc gcc gtc ctg gcc aag cac gtc gcg gcc acc ggc gcc gca cgc    960
Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg
305                 310                 315                 320
ggg gcc gaa cgg gcc gtg cag gtg ctg gcg tcg gcc ggg gcg cgg gag    1008
Gly Ala Glu Arg Ala Val Gln Val Leu Ala Ser Ala Gly Ala Arg Glu
                325                 330                 335
gga cac gtc gtc gca cgg gcg cac cgc gac gcc aag ctc atg gag atc    1056
Gly His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu Ile
            340                 345                 350
atc gag ggc agc aac gag atc tgc gaa ctg gtc ctg gcc cgg cac gtg  1104
Ile Glu Gly Ser Asn Glu Ile Cys Glu Leu Val Leu Ala Arg His Val
    355                 360                 365
atg tcc gcg gcc ggg tga                                          1122
Met Ser Ala Ala Gly
    370
<210>81
<211>373
<212>PRT
<213>生二素链霉菌
<400>81
Val Ala Asp Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe
  1               5                  10                  15
Thr Ala Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu
             20                  25                  30
Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys
         35                  40                  45
Ala Gln Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg
     50                  55                  60
Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg
 65                  70                  75                  80
Ser Val Met Thr Ser Gln Gly Met Ala Ala Trp Thr Leu Arg Arg Leu
                 85                  90                  95
Ala Gly Ala Asp Gln Gln Ala Ser Leu Val Pro Arg Leu Thr Gly Gly
            100                 105                 110
Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu
        115                 120                 125
Ser Ala Leu Arg Thr Arg Ile Thr Ser Asp Gly Asp Glu Val Val Val
    130                 135                 140
Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu
145                 150                 155                 160
Val Val Phe Gly Arg Thr Glu Gln Gly Ala Gly Ala Val Val Val Pro
                165                 170                 175
Ala Ser Ala Pro Gly Val Arg Val Glu Arg Ile Thr Asp Ala His Gly
            180                 185                 190
Cys Arg Ala Ala Gly His Ala Asp Ile His Leu Asp Gly Val Arg Leu
        195                 200                 205
Pro Ala Asp Ala Leu Leu Gln Gly His Asp Arg Thr Pro Ala Leu Leu
    210                 215                 220
Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser
225                 230                 235                 240
Leu Gly Ile Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly
                245                 250                 255
Gly Arg Glu Gln Phe Gly Thr Arg Leu Ser Asp His Gln Leu Val Ala
            260                 265                 270
Arg His Leu Ala Glu Leu Phe Val Ala Glu Gln His Ala Ala Arg Ala
        275                 280                 285
Cys Glu His Ala Ser Ala Gln Trp Asp Glu Gly Ser Pro Asp Met Val
    290                 295                 300
Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg
305                 310                 315                 320
Gly Ala Glu Arg Ala Val Gln Val Leu Ala Ser Ala Gly Ala Arg Glu
                325                 330                 335
Gly His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu Ile
            340                 345                 350
Ile Glu Gly Ser Asn Glu Ile Cys Glu Leu Val Leu Ala Arg His Val
        355                 360                 365
Met Ser Ala Ala Gly
    370
<210>82
<211>312
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(312)
<400>82
atg acc acg acg tcc ggt cgg ccc gac ccc acc ggc acg acc ccc acc  48
Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr
  1               5                  10                  15
gcc gac gag gtc gcc ggg gaa ctg ctc ggg ttc ctc gag gac cgc acc  96
Ala Asp Glu Val Ala Gly Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr
             20                  25                  30
aag acc acc tgg gag cgc gac cag gac ctg ttc gcc gtc ggc ggg atg  144
Lys Thr Thr Trp Glu Arg Asp Gln Asp Leu Phe Ala Val Gly Gly Met
         35                  40                  45
tcc tcg ctg ttc gcc atg cag ctc gtc gtg cac ctg gag aag acc tac  192
Ser Ser Leu Phe Ala Met Gln Leu Val Val His Leu Glu Lys Thr Tyr
     50                  55                  60
ggc atc gtc atc agc ggc gcc gac ctg atg ctc gac aac ttc cgc acc  240
Gly Ile Val Ile Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr
 65                  70                  75                  80
gtc gac gcg atg gtc cgg ctg gtc gga cgg ctg gcc gcg ccc ggc gag  288
Val Asp Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu
                 85                  90                  95
gcg acc ggg cac gca ggt ggc tga                                  312
Ala Thr Gly His Ala Gly Gly
            100
<210>83
<211>103
<212>PRT
<213>生二素链霉菌
<400>83
Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr
  1               5                  10                  15
Ala Asp Glu Val Ala Gly Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr
             20                  25                  30
Lys Thr Thr Trp Glu Arg Asp Gln Asp Leu Phe Ala Val Gly Gly Met
         35                  40                  45
Ser Ser Leu Phe Ala Met Gln Leu Val Val His Leu Glu Lys Thr Tyr
     50                  55                  60
Gly Ile Val Ile Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr
 65                  70                  75                  80
Val Asp Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu
                 85                  90                  95
Ala Thr Gly His Ala Gly Gly
            100
<210>84
<211>867
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(867)
<400>84
gtg ccc gat tcc aag gaa aat tct ccg ctc gtc gtg ctc ggc gcg ggc  48
Val Pro Asp Ser Lys Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly
  1               5                  10                  15
gtc atg ggc acg gcc atc gcg gca ctc gcc gtc gga cac ggg cac ccg  96
Val Met Gly Thr Ala Ile Ala Ala Leu Ala Val Gly His Gly His Pro
             20                  25                  30
gtc aca ctg gtc gac acc tcc gcc ggg gcg cgc gcg gcc gcc ccc gac  144
Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp
         35                  40                  45
gcg gtc gcg ctg cat ctg cgg acg gcc cgg ctg atg ggc gcg ctg ccc    192
Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro
     50                  55                  60
cac gac cgc ccg ccc ggg gag ctg acc gtc gag gag gcg ccg gcc gcc    240
His Asp Arg Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala
 65                  70                  75                  80
gtc gcc acc gcg acc gcc gtg atc gag gcc gtc acc gag gac ccc gag    288
Val Ala Thr Ala Thr Ala Val Ile Glu Ala Val Thr Glu Asp Pro Glu
                 85                  90                  95
cgg aag gcc gag gtg ctg gcg gac ctg gcg tcc gtg gcg cgc ccg ggg    336
Arg Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val Ala Arg Pro Gly
            100                 105                 110
acg ctg ctc gtc agc aac acc tcg ggc gtc ccc atc gac gag ctg gcc    384
Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro Ile Asp Glu Leu Ala
        115                 120                 125
gac gcc gtc ccc cgc ccc gag gac ctc gtc ggc gtg cac ttc atg aac    432
Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn
    130                 135                 140
ccc gcg tac gtg atc ccc acg gtc gag gtg gtc ctc gga ccg cgc agc    480
Pro Ala Tyr Val Ile Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser
145                 150                 155                 160
gga gag gcg gcc gcc cgg gcc acc cgg gac ctg ctg tcc ggc ctg ggc    528
Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly
                165                 170                 175
cgc cgg ggc atc gtc gtc ggc gac ggc gcc ggc ttc gtg acc agc cgc    576
Arg Arg Gly Ile Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg
            180                 185                 190
ctg ctg cac cgg atg ctg aac gac gcc atc gcg gtg gtg cac gag ggc    624
Leu Leu His Arg Met Leu Asn Asp Ala Ile Ala Val Val His Glu G1y
        195                 200                 205
cgg gcc acc ccg gag acc gtg gac gcg ctg atg cgc gac tgc atc ggc  672
Arg Ala Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys Ile Gly
    210                 215                 220
cac cgc acc gga ccc ctg gcc acg gcc gac ctg atc gga ctg gac aac  720
His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu Ile Gly Leu Asp Asn
225                 230                 235                 240
ctg gcc gac tcg ctg cgg gtg atg cac gaa cgg acc ggc gat ccg gcg  768
Leu Ala Asp Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala
                245                 250                 255
ctc cgc ccg agc gag ctg ctg ctg gac aag gtc cgc cag ggc ctg ctc  816
Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gln Gly Leu Leu
            260                 265                 270
ggc cgc aag agc ggc cgg gga ttc tac gac tac cag gag gcc acg cga  864
Gly Arg Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Gln Glu Ala Thr Arg
        275                 280                 285
tga                                                              867
<210>85
<211>288
<212>PRT
<213>生二素链霉菌
<400>85
Val Pro Asp Ser Lys Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly
  1               5                  10                  15
Val Met Gly Thr Ala Ile Ala Ala Leu Ala Val Gly His Gly His Pro
             20                  25                  30
Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp
         35                  40                  45
Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro
     50                  55                  60
His Asp Arg Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala
 65                  70                  75                  80
Val Ala Thr Ala Thr Ala Val Ile Glu Ala Val Thr Glu Asp Pro Glu
                 85                  90                  95
Arg Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val Ala Arg Pro Gly
            100                 105                 110
Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro Ile Asp Glu Leu Ala
        115                 120                 125
Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn
    130                 135                 140
Pro Ala Tyr Val Ile Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser
145                 150                 155                 160
Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly
                165                 170                 175
Arg Arg Gly Ile Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg
            180                 185                 190
Leu Leu His Arg Met Leu Asn Asp Ala Ile Ala Val Val His Glu Gly
        195                 200                 205
Arg Ala Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys Ile Gly
    210                 215                 220
His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu Ile Gly Leu Asp Asn
225                 230                 235                 240
Leu Ala Asp Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala
                245                 250                 255
Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gln Gly Leu Leu
            260                 265                 270
Gly Arg Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Gln Glu Ala Thr Arg
        275                 280                 285
<210>86
<211>1040
<212>DNA
<213>弗氏链霉菌(Streptomyces fradiae)
<400>86
ggcaggagcc acccgtgaca gggctgccgc ggcccgccgt ccgggtgccg ttccacgatc 60
tgcgggacgt gcacgcggcc acgggggtgg agtcggagat cggcggcgcg ctgctgcgcg 120
tcgccgcgcg cgggcgctat ctgctgggtg ccgaactcgc cgcgttcgag gagcggttcg 180
ccgagtactg cggcaacgcc cactgtgtcg ccgtgggcag cgggctcgac gacgctcgtc 240
tggcgctgtg ggcgctcggg gtgggcgagg gcgacgaggt gatcgtgccc tcgcacacgt 300
tcatcgcgtc ctggctcgcg gtgtcggcga cgggtgccac cccggtgccg gtcgagcccg 360
gtgatcccgg cgagccgggg cccggggcgt tcctgctcga cccggaccgg ctggaggccg 420
cgctgacccc gcggaccagg gccgtgatgc ccgtgcatct ctacgggcac ccggtggatc 480
tggacccggt cggggcgttc gcggagccgc acgggctggc cgtcgtggag gacgcggcgc 540
aggccacggc ccgttaccgc gggaggcgga tcggcagcgg ccaccgcacg gcgttcagct 600
tctacccggg gaagaacctg ggcgcgctcg gcgacggcgg tgccgtggtc acctcggacc 660
cggaactcgc ggaccggctg cggctgttgc gcaactacgg cgcccgggag aagtaccggc 720
acgaggagcg gggcaccaac tcccgcctgg acgagctgca ggcggccgtg ctgtcggtca 780
agctgccgta cctggacgcc tggaacaccc gccgccggga gatcgccgcc cgctacggcg 840
aggcgctggc cggtctgccg ggcgtcaccg tgccggaggg ccgcgtggcg gagccggtct 900
ggcatcagta cgtgctgcgc agcccgtacc gcgaccggtt gcggcggcgg ctggccgagg 960
cgggggtgga gaccctggtc cactatccgg tggccgtgca cgcgtcgggc gcgtacgcgg 1020
gcgcggggcc gtgtcccgcc                                             1040
<210>87
<211>388
<212>PRT
<213>弗氏链霉菌
<400>87
Met Thr Gly Leu Pro Arg Pro Ala Val Arg Val Pro Phe His Asp Leu
  1               5                  10                  15
Arg Asp Val His Ala Ala Thr Gly Val Glu Ser Glu Ile Gly Gly Ala
             20                  25                  30
Leu Leu Arg Val Ala Ala Arg Gly Arg Tyr Leu Leu Gly Ala Glu Leu
         35                  40                  45
Ala Ala Phe Glu Glu Arg Phe Ala Glu Tyr Cys Gly Asn Ala His Cys
     50                  55                  60
Val Ala Val Gly Ser Gly Leu Asp Asp Ala Arg Leu Ala Leu Trp Ala
 65                  70                  75                  80
Leu Gly Val Gly Glu Gly Asp Glu Val Ile Val Pro Ser His Thr Phe
                 85                  90                  95
Ile Ala Ser Trp Leu Ala Val Ser Ala Thr Gly Ala Thr Pro Val Pro
            100                 105                 110
Val Glu Pro Gly Asp Pro Gly Glu Pro Gly Pro Gly Ala Phe Leu Leu
        115                 120                 125
Asp Pro Asp Arg Leu Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Val
    130                 135                 140
Met Pro Val His Leu Tyr Gly His Pro Val Asp Leu Asp Pro Val Gly
145                 150                 155                 160
Ala Phe Ala Glu Pro His Gly Leu Ala Val Val Glu Asp Ala Ala Gln
                165                 170                 175
Ala Thr Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Arg Thr
            180                 185                 190
Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Leu Gly Asp Gly
        195                 200                 205
Gly Ala Val Val Thr Ser Asp Pro Glu Leu Ala Asp Arg Leu Arg Leu
    210                 215                 220
Leu Arg Asn Tyr Gly Ala Arg Glu Lys Tyr Arg His Glu Glu Arg Gly
225                 230                 235                 240
Thr Asn Ser Arg Leu Asp Glu Leu Gln Ala Ala Val Leu Ser Val Lys
                245                 250                 255
Leu Pro Tyr Leu Asp Ala Trp Asn Thr Arg Arg Arg Glu Ile Ala Ala
            260                 265                 270
Arg Tyr Gly Glu Ala Leu Ala Gly Leu Pro Gly Val Thr Val Pro Glu
        275                 280                 285
Gly Arg Val Ala Glu Pro Val Trp His Gln Tyr Val Leu Arg Ser Pro
    290                 295                 300
Tyr Arg Asp Arg Leu Arg Arg Arg Leu Ala Glu Ala Gly Val Glu Thr
305                 310                 315                 320
Leu Val His Tyr Pro Val Ala Val His Ala Ser Gly Ala Tyr Ala Gly
                325                 330                 335
Ala Gly Pro Cys Pro Ala Gly Gly Leu Pro Arg Ala Glu Arg Leu Ala
            340                 345                 350
Gly Glu Val Leu Ser Leu Pro Ile Gly Pro His Leu Pro Asp Glu Ala
        355                 360                 365
Val Glu Val Val Ile Ala Ala Val Gln Ser Ala Ala Leu Asp Ser Trp
    370                 375                 380
Glu Glu Gly Pro
385
<210>88
<211>271
<212>PRT
<213>生米卡链霉菌(Streptomyces mycarofaciens)
<400>88
Met Ser Pro Ile Ser Ala Ser Ala Pro Ala Ala Ser Arg Ser Thr Ala
  1               5                  10                  15
Arg Arg Glu Leu Gly Gln Asn Phe Phe Arg Ser Ala Ala Ala Ala Cys
             20                  25                  30
Arg Phe Ser Asp Gln Leu Asp Ala Phe Cys Ala Asp Leu Pro Gly Ser
         35                  40                  45
Leu Ala Asp Val Leu Thr Val Glu Ile Gly Ala Gly Ser Gly Arg Val
     50                  55                  60
Thr Lys Ala Leu Ala Ser Ala Gly Arg Ser Leu Leu Ala Val Glu Ile
 65                  70                  75                  80
Asp Ala Tyr Trp Ala Arg Arg Leu Thr Ala Glu Ser Leu Pro Asp Val
                 85                  90                  95
Thr Val Val Asn Glu Asp Phe Leu Asn Leu Gln Leu Pro Arg Gln Pro
            100                 105                 110
Ile Arg Leu Ile Gly Asn Leu Pro Phe Val Ser Gly Thr Lys Ile Leu
        115                 120                 125
Arg Arg Cys Leu Glu Leu Gly Pro Asn Arg Met Cys Gln Ala Val Phe
    130                 135                 140
Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg Thr Gly Ala Trp Gly Gly
145                 150                 155                 160
Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp Tyr Thr Phe Glu Gly Gly
                165                 170                 175
Leu Ala Phe Ser Arg Asn Glu Phe Ser Pro Val Pro Arg Ala Asp Thr
            180                 185                 190
Gln Thr Leu Val Val Met Pro Arg Arg Arg Pro Ser Val Pro Trp Arg
        195                 200                 205
Glu Arg Thr Asp Tyr Gln Arg Phe Thr Gln Gln Ile Phe Asp Thr Gly
    210                 215                 220
Gln Met Thr Ile Gly Glu Ala Ala Arg Lys Val Leu Arg Arg Gly His
225                 230                 235                 240
Ala Gln Phe Val Arg Ser Ala Gly Val Arg Pro Ala Asp Arg Val Lys
                245                 250                 255
Asp Leu Thr Val Arg Asp Trp Ala Ala Leu Phe Arg Ala Asn Pro
            260                 265                 270
<210>89
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸SRMR1
<400>89
ctgccagtcc tctcccagca gtacg                                       25
<210>90
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸SRMR2
<400>90
tgaagctgga cgtctcctac gtcgg                                       25
<210>91
<211>2755
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:可切除盒
<400>91
gatatctacc tcttcgtccc gaagcaactt gggtgggcgc tcgaccttgg gccagtgtgc 60
ttctcacctg cggcgccagt ccatgggtgc tcgcggttgt ccgccgctgt gcgctggcgt 120
tgtcacgcag ttagacactc accttcccac gggcggtgtc gtagggctcg gctaagttgc 180
ccgcatgact gacagggatc cctcgagaag ctttatgctt gtaaaccgtt ttgtgaaaaa 240
atttttaaaa taaaaaaggg gacctctagg gtccccaatt aattagtaat ataatctatt 300
aaaggtcatt caaaaggtca tccaccggat caattcccct gctcgcgcag gctgggtgcc 360
aagctctcgg gtaacatcaa ggcccgatcc ttggagccct tgccctcccg cacgatgatc 420
gtgccgtgat cgaaatccag atccttgacc cgcagttgca aaccctcact gatccgtaat 480
gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 540
ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 600
gccaagctgc ggtggcgtac accgtcgcct cggtcggccc gtagagattg gcgatcccga 660
ccgcagcacc accgagaacg tccccgacgt ggccgaccag cccgtcatcg tcaacgcctg 720
accgcggtgc ggacaggccg tgtcgcgacc ggccgtgcgg aattaagccg gcccgtaccc 780
tgtgaataga ggtccgctgt gacacaagaa tccctgttac ttctcgaccg tattgattcg 840
gatgattcct acgcgagcct gcggaacgac caggaattct gggagccgct ggcccgccga 900
gccctggagg agctcgggct gccggtgccg ccggtgctgc gggtgcccgg cgagagcacc 960
aaccccgtac tggtcggcga gcccgacccg gtgatcaagc tgttcggcga gcactggtgc 1020
ggtccggaga gcctcgcgtc ggagtcggag gcgtacgcgg tcctggcgga cgccccggtg 1080
ccggtgcccc gcctcctcgg ccgcggcgag ctgcggcccg gcaccggagc ctggccgtgg 1140
ccctacctgg tgatgagccg gatgaccggc accacctggc ggtccgcgat ggacggcacg 1200
accgaccgga acgcgctgct cgccctggcc cgcgaactcg gccgggtgct cggccggctg 1260
cacagggtgc cgctgaccgg gaacaccgtg ctcacccccc attccgaggt cttcccggaa 1320
ctgctgcggg aacgccgcgc ggcgaccgtc gaggaccacc gcgggtgggg ctacctctcg 1380
ccccggctgc tggaccgcct ggaggactgg ctgccggacg tggacacgct gctggccggc 1440
cgcgaacccc ggttcgtcca cggcgacctg cacgggacca acatcttcgt ggacctggcc 1500
gcgaccgagg tcaccgggat cgtcgacttc accgacgtct atgcgggaga ctcccgctac 1560
agcctggtgc aactgcatct caacgccttc cggggcgacc gcgagatcct ggccgcgctg 1620
ctcgacgggg cgcagtggaa gcggaccgag gacttcgccc gcgaactgct cgccttcacc 1680
ttcctgcacg acttcgaggt gttcgaggag accccgctgg atctctccgg cttcaccgat 1740
ccggaggaac tggcgcagtt cctctggggg ccgccggaca ccgcccccgg cgcctgacgc 1800
cccgggccgc ccggcgccgc ccccggcccc cggcggccgc ccggagcccc gcccgcgctc 1860
gggagccccg ggcccgcgcc gaagcccgct gctgcgagcc cggagcgggc cggccgacgg 1920
cggtgcgggc ccggcggcgg acgctcagca gcggcgggcg tgaaaggccc tggcatcctc 1980
gatcatctcc tccagggtgg tcggccgagc ttccatccca gctcggcaag gatcgatccg 2040
cgcagatcag ttggaagaat ttgtccacta cgtgaaaggc gagatcacca aggtagtcgg 2100
caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc ttaactcaag 2160
cgttagatgc actaagcaca taattgctca cagccaaact atcaggtcaa gtctgctttt 2220
attattttta agcgtgcata ataagcccta cacaaattgg gagatatatc atgaaaggct 2280
ggctttttct tgttatcgca atagttggcg aagtaatcgc aacatccgca ttaaaatcta 2340
gcgagggctt tactaagctg atccggtgga tgaccttttg aatgaccttt aatagattat 2400
attactaatt aattggggac cctagaggtc ccctttttta ttttaaaaat tttttcacaa 2460
aacggtttac aagcataaag cttgttaaca gatctcccgg ctcgtcggac actccggtac 2520
ggccgtgact gaggaggtct accggaagca gatccggccc gtcatccaga ccggcgctgt 2580
ggtcatggac ggcatcttca agcggggtcc ggcgcgatag tcacgcagat agacacgcac 2640
agaaaacagg tgaggcagac cgtaacgtta cggtctgcct cacctggtgt ttctctgtcg 2700
gggtggcggg atttgaaccc acgacctctt cgtcccgaac gaagcgcgcg atatc      2755
<210>92
<211>2208
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:可切除盒
<400>92
gatatcgcgc gcgcttcgtt cgggacgaag aggtcgtggg ttcaaatccc gccaccccga 60
cagagaaaca ccaggtgagg cagaccgtaa cgttacggtc tgcctcacct gttttctgtg 120
cgtgtctatc tgcgtgacta tcgcgccgga ccccgcttga agatgccgtc catgaccaca 180
gcgccggtct ggatgacggg ccggatctgc ttccggtaga cctcctcagt cacggccgta 240
ccggagtgtc cgacgagccg ggagatctgt taacaagctt tatgcttgta aaccgttttg 300
tgaaaaaatt tttaaaataa aaaaggggac ctctagggtc cccaattaat tagtaatata 360
atctattaaa ggtcattcaa aaggtcatcc accggatcaa ttcccctgct cgcgcaggct 420
gggtgccaag ctctcgggta acatcaaggc ccgatccttg gagcccttgc cctcccgcac 480
gatgatcgtg ccgtgatcga aatccagatc cttgacccgc agttgcaaac cctcactgat 540
ccggctcacg gtaactgatg ccgtatttgc agtaccagcg tacggcccac agaatgatgt 600
cacgctgaaa atgccggcct ttgaatgggt tcatgtgcag ctccatcagc aaaaggggat 660
gataagttta tcaccaccga ctatttgcaa cagtgccgtt gatcgtgcta tgatcgactg 720
atgtcatcag cggtggagtg caatgtcgtg caatacgaat ggcgaaaagc cgagctcatc 780
ggtcagcttc tcaaccttgg ggttaccccc ggcggtgtgc tgctggtcca cagctccttc 840
cgtagcgtcc ggcccctcga agatgggcca cttggactga tcgaggccct gcgtgctgcg 900
ctgggtccgg gagggacgct cgtcatgccc tcgtggtcag gtctggacga cgagccgttc 960
gatcctgcca cgtcgcccgt tacaccggac cttggagttg tctctgacac attctggcgc 1020
ctgccaaatg taaagcgcag cgcccatcca tttgcctttg cggcagcggg gccacaggca 1080
gagcagatca tctctgatcc attgcccctg ccacctcact cgcctgcaag cccggtcgcc 1140
cgtgtccatg aactcgatgg gcaggtactt ctcctcggcg tgggacacga tgccaacacg 1200
acgctgcatc ttgccgagtt gatggcaaag gttccctatg gggtgccgag acactgcacc 1260
attcttcagg atggcaagtt ggtacgcgtc gattatctcg agaatgacca ctgctgtgag 1320
cgctttgcct tggcggacag gtggctcaag gagaagagcc ttcagaagga aggtccagtc 1380
ggtcatgcct ttgctcggtt gatccgctcc cgcgacattg tggcgacagc cctgggtcaa 1440
ctgggccgag atccgttgat cttcctgcat ccgccagagg gcgggatgcg aagaatgcga 1500
tgccgctcgc cagtcgattg gctgagctca tgagcggaga acgagatgac gttggagggg 1560
caaggtcgcg ctgattgctg gggcaacacg tgaaaggcga gatcaccaag gtagtcggca 1620
aataatgtct aacaattcgt tcaagccgac gccgcttcgc ggcgcggctt aactcaagcg 1680
ttagatgcac taagcacata attgctcaca gccaaactat caggtcaagt ctgcttttat 1740
tatttttaag cgtgcataat aagccctaca caaattggga gatatatcat gaaaggctgg 1800
ctttttcttg ttatcgcaat agttggcgaa gtaatcgcaa catccgcatt aaaatctagc 1860
gagggcttta ctaagctgat ccggtggatg accttttgaa tgacctttaa tagattatat 1920
tactaattaa ttggggaccc tagaggtccc cttttttatt ttaaaaattt tttcacaaaa 1980
cggtttacaa gcataaagct tctcgaggga tccctgtcag tcatgcgggc aacttagccg 2040
agccctacga caccgcccgt gggaaggtga gtgtctaact gcgtgacaac gccagcgcac 2100
agcggcggac aaccgcgagc acccatggac tggcgccgca ggtgagaagc acactggccc 2160
aaggtcgagc gcccacccaa gttgcttcgg gacgaagagg cagatatc              2208
<210>93
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸ORF2A
<400>93
cccgcgcggc agcctctccg tgatcgagtc cggcgtgacc atcgcgcgcg cttcgttcgg 60
<210>94
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸ORF2B
<400>94
gctccgtgcg tcatgcagga aggtgtcgta gtcgcggtag atctgcctct tcgtcccgaa 60
<210>95
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:瘢痕
     att3
<400>95
atcgcgcgcg cttcgttcgg gacgaagagg tagat                            35
<210>96
<211>59
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR8
<400>96
cgggatgatc gcttgtccgg cggccggatg cctagcctca tcgcgcgcgc ttcgttcgg 59
<210>97
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR9
<400>97
cccgatccag aacgtctggt cggtgatcag gtcgctgttc atctgcctct tcgtcccgaa 60
<210>98
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR3
<400>98
accggggcgg tcctcccctc cggggcgtca cggccgcgga atctgcctct tcgtcccgaa 60
<210>99
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR4
<400>99
cacgcagcga gccgacgcac tgatggacga cacgatggcc atcgcgcgcg cttcgttcgg 60
<210>100
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR5
<400>100
 gggcgtgaag cgggcgagtg tggatgtcat gcgagtactc atcgcgcgcg cttcgttcgg 60
<210>101
<211>60
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR6
<400>101
cgggaaacgg cgtcgcactc ctcgggggcc gcgtcagccc atctgcctct tcgtcccgaa 60
<210>102
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸C9583
<400>102
ctgcaggtgc tccagcgcgt cgatct                                       26
<210>103
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸C9584
<400>103
ctgcagacgg aggcggacct gcggct                                         26
<210>104
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:瘢痕
     att1
<400>104
atcgcgcgct tcgttcggga cgaagaggta gat                               33
<210>105
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:瘢痕
     att2
<400>105
atcggcgcgc ttcgttcggg acgaagaggt agat                             34
<210>106
<211>10325
<212>DNA
<213>生二素链霉菌
<400>106
ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60
ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc 120
aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180
gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240
ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 300
gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360
cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 420
gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480
gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540
gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600
ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc 660
cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 720
cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780
tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg 840
gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 900
cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960
gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 1020
tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 1080
gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140
gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200
tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 1260
gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320
gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380
tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440
tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500
gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560
tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620
ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680
ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740
tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800
tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860
acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920
tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980
acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2040
tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100
cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160
tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220
cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280
accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340
acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400
acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460
tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520
acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580
tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2640
cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700
actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 2760
cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2820
cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2880
acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2940
gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000
gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3060
tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120
caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180
gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240
gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300
atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360
gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420
gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480
tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540
ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600
ccgtggacgg agcgcgtccn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc cgccacaccc 4080
cccagcagcg tcagcgtccg cctcgggacc acacccggca ggacgacggg gtgcggggcg 4140
acgaggctga gggagccccg caactccacg gggcggctca accgcttgag ctgctccatc 4200
aactgctggg ccgaggtggt ccccgtgtgg tggtccaccg ggccgcggcc gctcgccgag 4260
gccagccgga ggttcccgcc cacccgcacc atgaagggca ggcccgcgag accgagccct 4320
cgcaccagtc gtggcagcac ggccgcgcgt gcgtccatca ccacggggcg ggccaaggag 4380
cggttggcct gagcggcttc ggccaccagg cggacgatgt tctcctcctc accgggtgcg 4440
ccggggtgcc ggggtgtgcc ctccccgctc cggccgccgc ccagcgtcag gcgccagctg 4500
accggggcgg ccgtcgtgcc cgaggccagc cacagcccgt gactctgctg gcagctcacc 4560
acccggccca ggtcggagac gaagcgccgg ctcaccccga cggagcgcac ccccgccttg 4620
gagaccacca tcggccagat cacccaggcg tcgggggtca gcctgtcgtc cacgtagcgg 4680
gccagcgcgg cccgcacctc gccccagtcc caggtcgacc cggcgacgaa gtggtgcagg 4740
ctctgttccg ccgcgccctc tccgacgaag gcggcgaggt tccgggcggt cttgcgtccc 4800
tgtgccgtga gcagcccgcg tatgtactgc tcacctcttc tgcgctggtc cgcccggcgg 4860
agcgaaccga gtaactccgc acatgcgtcg gagacgagcg agtcgaagtc gtgccgcgcg 4920
gcgggaccca cggggggcgc cgcgccggcg ggtcgaagcg tgcgtaaggt cataggagtc 4980
ctcgtggggg cctcgtcatc actgcgagtg gactgcgacc agcatcgcca attcacccgt 5040
tgctccccag gtacaccggg cacactcgtt ccgcttcgct cccccggcgg cacggcccgc 5100
gtgtggagca ctccccgctc tccggacggt gggggggaag cccaccgcac gcgcgccggt 5160
agcggtgccg gggccccaca acccctcacc gacggggtcc gttcgaccac atgccgtgat 5220
gatgccttcg ccgcacggcc tccttgaatg acggaccgtc agaaagacgt cactccgcgc 5280
gcgcccgctc ccgccccgac cccgcccggc cgccgtcccg cccccgcgac cctgtgggcc 5340
gacgccctct tgacggaccc ggaatcccgg gccgcgggac gggacggcga ggaactcgat 6400
gccgcaaagg ttccgcgtcc tcaccggcac ctccgagatc cagcgcaacg gcatcgccaa 5460
gctcctggct ttccaccact gagccgcacc ccctggcgag cagatccggg acaagacgcc 5520
accttcgcga cagtgtttag gaaaagttaa gtaaagaatt ccgcgagcgg attgccaggg 5580
agaacaaccc attgacgcgc accggtgcag cggccacatt gacggcacct gtcaagttca 5640
cccccaggag cttggaatcc catgcaggca attcggcatc acgtcatgct cgtcatggcc 5700
ttcgtgaccg tcgccacgac tttccttctc tggccgtcga cgcaatccgc gcaagcgttt 5760
cccccgaccc cgaagcagac ggtactgaac cacctccgcg ccatttccgg gaatcacatc 5820
gtctccggac agcacaacaa ggagcccgcc tccgccccgg gccagtacac ccagcaggtc 5880
aaggacgtca ccgggcagta ccccggcctg tggggcggtg acctgatgtt cgccgcggcg 5940
gacgtggccg gccgccagcg cgtcgtcgac caggccagga ccgagtgggc gaacggatcg 6000
ctggtctcgc tcacctggca cgtctgcccg ccgaccggcg gcagcacctg tgcgttcgag 6060
ggcggcgtca agtccacgct gacgaacgcg cagttctcgc aggtcctcac ggagggcagt 6120
gccctgaaca gcgcatggaa gcggcgcctg gacgaggtcg tcccgtacct gcagcagctg 6180
gagaacgcgg gcgtccccgt cctcttccgg ccgctgcacg agatgaacga atcctggaac 6240
tggtggggaa accggcccgg agcgaacggc agcgcacgcc tctaccagat cacccgcgat 6300
cacctcgccg ggacgaaagg gctggacaat ctgatctggg tctggaacgt ccaggacaat 6360
ccggcgggaa actggaacag ctactatccg ggagatcagt acgtggacgt cgtttcgctg 6420
gacgtctggt acaagagcca cccgagttcc gccgactacc agcagatgcg gagcatcgcg 6480
ggaacaaaac ccatggccct cgcggagctg ggcaaaatgc cgaccgccgc gctgctggac 6540
agccagacgc ggtggacatg gttcatgatg tggtccgagc atctgcgcgg gaacaattcc 6600
aacgccgaaa tacagacggc gtatttccac ccccgtgtac tgaaccaggg ggaggtcgca 6660
ctgccctgac gctcggcgct gcccggctct ctcacgcgcg ttctgacagg acgtcgcgga 6720
gagtgcgggg caagcggccg gtgagctggg cgcagtcgtc gcggacccga tcccagcgct 6780
gttcgcgtac cgaggcgaac agggaggaga aggcgtagag ccaccaggga tccaggccgg 6840
tcgccgctgt ttcggcagag tacgtgtcgg ccgggatgtc cacgtaggcg accggtgtcc 6900
gccacacctc cgccgccgtg gaggcgatgc ctgccaggtc cgtcgactcg ggtcccgtga 6960
tgtcgtggtg acggccggtc ggcccgccca ccgcgagggc ggcgagggcg cgggccacgt 7020
cgtcgcgcgc caccagggac acccggccat cggctgccgg cagcctcagc agcccggtcg 7080
agcgcgcctg ggtgagccag cctaggaaga actcgatgta cagcgaggcc ctggcgaacg 7140
agcacggcac gccggaggcg agcagcagat cctcggtgag ccggttgacg acggcgtagc 7200
agaacgggga ggccgagtcg gcgtcgacgc tgctcagtgc cgcgacatgg ccgacgcgct 7260
cggccaccac ggcggcgacg acgttgcggt ggtgcagcag cacccgtgcg tcgggcccgt 7320
cgctggagac gaggaccaga gtgtccacgc ccttcagcgc cgcacgcaga gcgggcgggt 7380
cggcgtagtc ggcgacggcg cactccaccc ccggcggtag tgcctcggca ggcagcttcc 7440
gcctggtcat cgccacgacg tccacgtcgg cccggtccgc gagcagctgc accacccgcc 7500
tgcccagact gcccgccgcc cctgtcaccg cgatacgcat cgtcgccccc gtcgccttgt 7560
cgtcggtcgt accaccgtag ggggccaacc gcgaccaggg cttggaacga gccggcccgc 7620
cagggcacag acgcgcgatc ggtccggttt tcccgtgctc ttttggaccg ggacgccgga 7680
ccgcttcctt tctacggtgg agccgttccc gcccgagccc gcacgtcatc gacgtgcggg 7740
gaagacagag gtgataccga tgctccgacg ccgtctcgga gggccgtcag gccccctcgt 7800
cagtgccctg tgcctgggcg cgatgccctt cggcaccacc gtcgacgaga agacgtcctt 7860
cgccatcctc gaccggttcg tcgaggccgg cggcagtctc gtcgacaccg ccgacaacta 7920
cgcgttctgg gctcccggcg ggaccgggga cgagagcgag aacaccgtcg ggcgctggct 7980
ggcgagccgc cgccgccgcg acgaggtggt gatctccacc aaggtgggtg cccgccccac 8040
cgtccccggc agcggcctgg agaccgccga agggctgtcg gctcccgtca tacggaaggc 8100
cgcggaggac agcctgcgac gcctgggcac cgatcgcatc gatctgtact ggacccacat 8160
cgaggaccgg accgtccctc tggaggagac gctcggagct ctcgacgagc tggtcggcgg 8220
cggcaaggtg gcggtgctgg gctgctccaa ccacgcgggc tggcgcatcg aacgggcccg 8280
cgcgctcgcc cggaccaacg gctggacggc gtacacctgc gtccagcagc gctactccta 8340
ccttcagccg cgcttcgacg tcggactgcc ggagagcgga cacgtccacg cgacctccga 8400
actcctcgac cacgtacgca gcgagcccga cctgacgctg ctggcctact cgtccctgct 8460
ctcgggcgcg tacacccggc cggacaagac cctgtccgcc gcctacgacc acccgggcac 8520
cgggcagcgg ctgaccgtgc tgcgggaggt ggccgccgag ctcggtgcca ccgccaacca 8580
ggtggtgctg tcctggttgc tcggaggtga tccgccggtg atcccgatcg tgggggtgag 8640
ttccgtcgag cagctggacg aggtgctggc cgccgtcgag ctggagctgc cccgggagac 8700
gagggcacgg ctggacctcg ccgggcgggg ctgacgggcc acacaccgcc cctcgcccgg 8760
gacgggctga ccggccgcac accgtccctc agccgggacg ggctgacggc cacacacccg 8820
cccctcagcc cggctgggct gggctgacgg ccacacaccc gctcctcagc ccggctgggc 8880
tgggctgacg gccacacacc cgcccctcag cccggctggg ctgggctgac ggccacacgc 8940
cgtccctcgc ccgggtcggg ctgaccagcc acacgccgtc cctcagtcgg cccgctcccc 9000
ggcccgcccg gcgtcgacgt gccgccggtc gtggcgccgg gccgcgtcga tggcctgtgc 9060
caggcgccgc acggctccgg gcacggcgtg gtccgccaga ttgccgtagc cgaggaccag 9120
cgcggggccg gcggcggcca cggcccgcgc cccgccggag tcgccggccc gggccgtcgg 9180
gtggtgctcg gcccgcgcca tccggtaggc gtcgagatcc gccagcctca cgtcacgccg 9240
cgccgcctcc ctgacgacgg tgggcgccga gcagtccgtc agggacagca gcaggtggaa 9300
gccggccgcc gcaccggaca cctggaaccc cggcagcgac gccgcgagtt ctcccatgag 9360
gtgatcgcgg cgccgtttgt agcgcagccg tgccgcccgc aggtaccggt cgtaggaccc 9420
gcgggccagg aaccgggcga acgcctcctg gtcgatgacg ggcggtggta cgcccccgac 9480
gtgctccgcg cccagggcct cggtccagcg cggcggggtc accgcccagc cgatccgcag 9540
ggccggcgag agcgtcttgc tgaccgaccc cagcagcgcg acgtgctccg gtgccatgcc 9600
ctgcagggcg cccacggggt ggcggtcgta tcggaactcg gcgtcgtagt cgtcctccag 9660
caccaggccg tcgacctcgc gggcccaggc gaccagctcg ccgcgacggg ccggggcgag 9720
gaccacaccg gtcgggaact ggtgggcggg agcgacgatc accgaccgga cctgaggcgc 9780
gcgccgcagc aggtcgaccc gcaggccgtc gccgtccacg ggaaccggga cgggcaccag 9840
cccctccgcc ccgaccgtgg cgctcagccg cgaccagcca gggtcctcca gggccatgtg 9900
ggtgtggccc tcggtccgca ggacccggca cagcctgcgc accgcgtcca gcgtgcccgc 9960
gcagacgacg agctgccggg cttccagcga cgcgccgcgt ccccgcacga ggtaggccgc 10020
gagccgctgc cggagccggg cgagaccggc cggatcgggg tagccgagct cgccccaggt 10080
cagtgcgccg gtggcctccc gcaccgcgtc cgcccaccgt ccgcggggaa aggcccgcag 10140
gtcgggtatg ccgggcagca tgtcgaactc cggctcccac cgcgtaccga cgtccgcctc 10200
gggcgtcacc ggagcgggga cggcctgcgc cctgacccgg gtggccgagc cgctgcgcgc 10260
ctccaggtac ccctccgcga cgagctgcgc gtagggggga tcctctagag tcgacctgca 10320
ggcct                                                             10325
<210>107
<211>1218
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1218)
<400>107
atg gct cat atc gca ttc ttc atc ctt ccg gtt gcc ggg cat gtg aat    48
Met Ala His Ile Ala Phe Phe Ile Leu Pro Val Ala Gly His Val Asn
  1               5                  10                  15
ccg acc ctg gga gtc gcc gag gaa ctg gtc gcg cgc ggc cac cgg gtg    96
Pro Thr Leu Gly Val Ala Glu Glu Leu Val Ala Arg Gly His Arg Val
             20                  25                  30
acg ttc gcg ctg tcc gag gac ctc gcc gag cgg gcc cgg ctg atc ggc    144
Thr Phe Ala Leu Ser Glu Asp Leu Ala Glu Arg Ala Arg Leu Ile Gly
         35                  40                  45
gcc gag gtg gtc acc tat ccg gtg gac agg caa cgg ttc ctg gac cag    192
Ala Glu Val Val Thr Tyr Pro Val Asp Arg Gln Arg Phe Leu Asp Gln
     50                  55                  60
atg gtg ccg cgg cag gac gcg gac gag tac acg gac gag gac gag ttc    240
Met Val Pro Arg Gln Asp Ala Asp Glu Tyr Thr Asp Glu Asp Glu Phe
 65                  70                  75                  80
gtc cgg gtc ctg gag tgg ctg ctg gac atg acg gtg cag acc atg gaa    288
Val Arg Val Leu Glu Trp Leu Leu Asp Met Thr Val Gln Thr Met Glu
                 85                  90                  95
ccg ctg gag agg cac ttc gcc ggg gac cgg ccc gac gtc gtc gtc aac    336
Pro Leu Glu Arg His Phe Ala Gly Asp Arg Pro Asp Val Val Val Asn
            100                 105                 110
gat ccg tcg tcg ctg tgg acg gga cgg ctg ctg gcg gac cgg tgg ggc    384
Asp Pro Ser Ser Leu Trp Thr Gly Arg Leu Leu Ala Asp Arg Trp Gly
        115                 120                 125
atc ccg gtc atc cgc agc act ccg acc tat gcc gcc aac gaa cac tgg    432
Ile Pro Val Ile Arg Ser Thr Pro Thr Tyr Ala Ala Asn Glu His Trp
    130                 135                 140
tcg ctg cat ccg ccg gtc gac tcg gcc gag ccg ccg gac gac ccc gag    480
Ser Leu His Pro Pro Val Asp Ser Ala Glu Pro Pro Asp Asp Pro Glu
145                 150                 155                 160
ctg cac aag ctg ctc gcg cgg atc gag cgg ctg ctg gag gag cag ggc    528
Leu His Lys Leu Leu Ala Arg Ile Glu Arg Leu Leu Glu Glu Gln Gly
                165                 170                 175
gtc gag cac gac ctg gcc ggc ttc acc ggg gtc ctg cac ggc ggt ccg    576
Val Glu His Asp Leu Ala Gly Phe Thr Gly Val Leu His Gly Gly Pro
            180                 185                 190
gcc ctg ctg tac atg ccc cgc tcg ttc cag tac gcg ggc gag acc ttc    624
Ala Leu Leu Tyr Met Pro Arg Ser Phe Gln Tyr Ala Gly Glu Thr Phe
        195                 200                 205
gac gca cag cac cac ttc gtc ggc ccc tgc ccg ccc cgc acc gcg ttc    672
Asp Ala Gln His His Phe Val Gly Pro Cys Pro Pro Arg Thr Ala Phe
    210                 215                 220
cac ggc gag tgg agg ccg ggg gac gac gac ggc cgg ccc ctg gtg ctg    720
His Gly Glu Trp Arg Pro Gly Asp Asp Asp Gly Arg Pro Leu Val Leu
225                 230                 235                 240
gtg agt ctc gga acc ctg tac aac gac cgg ccg gac ttc ttc cgc acc    768
Val Ser Leu Gly Thr Leu Tyr Asn Asp Arg Pro Asp Phe Phe Arg Thr
                245                 250                 255
tgc ctg gag gcg ttc ggc gac gag ccc tgg aac gtg ctt ctg gtg ctg    816
Cys Leu Glu Ala Phe Gly Asp Glu Pro Trp Asn Val Leu Leu Val Leu
            260                 265                 270
ggc ggc ggg gtg ccc gcg gcc gac ctg ggc ccg ctt ccc ggc aat gtc    864
Gly Gly Gly Val Pro Ala Ala Asp Leu Gly Pro Leu Pro Gly Asn Val
        275                 280                 285
cgg gtg acc gac ttc gtg tcg ctg cgc gac gtc ctg ccg cac acg gcg    912
Arg Val Thr Asp Phe Val Ser Leu Arg Asp Val Leu Pro His Thr Ala
    290                 295                 300
gtg gtg gtg aac cac ggt ggg atg agc acc gcc atg gag gtg ttc tcg    960
Val Val Val Asn His Gly Gly Met Ser Thr Ala Met Glu Val Phe Ser
305                 310                 315                 320
cac ggt gtg ccg gtg gtg gcg atc ccg gtg atg ccg gag ccc cgg gcc    1008
His Gly Val Pro Val Val Ala Ile Pro Val Met Pro Glu Pro Arg Ala
                325                 330                 335
acc gcg cgg cgg atc gtc gaa ctg ggc ctg ggc gac cag ctg ctg aac    1056
Thr Ala Arg Arg Ile Val Glu Leu Gly Leu Gly Asp Gln Leu Leu Asn
            340                 345                 350
tcg gag ctg acg gcc gag tcc ctg cgt gcc acg gta cgg cgg gtg ctg  1104
Ser Glu Leu Thr Ala Glu Ser Leu Arg Ala Thr Val Arg Arg Val Leu
        355                 360                 365
gcg gac tcc gcg atc ccg ggg aac atg cgc ggg ttc cgg gag cag atc  1152
Ala Asp Ser Ala Ile Pro Gly Asn Met Arg Gly Phe Arg Glu Gln Ile
    370                 375                 380
agg gcg gcc ggc ggg gcg ccc gcg gcg gcc gac gcg atc gag gga ctg  1200
Arg Ala Ala Gly Gly Ala Pro Ala Ala Ala Asp Ala Ile Glu Gly Leu
385                 390                 395                 400
ctg ccc cgg gtg ggc tga                                          1218
Leu Pro Arg Val Gly
                405
<210>108
<211>405
<212>PRT
<213>生二素链霉菌
<400>108
Met Ala His Ile Ala Phe Phe Ile Leu Pro Val Ala Gly His Val Asn
  1               5                  10                  15
Pro Thr Leu Gly Val Ala Glu Glu Leu Val Ala Arg Gly His Arg Val
             20                  25                  30
Thr Phe Ala Leu Ser Glu Asp Leu Ala Glu Arg Ala Arg Leu Ile Gly
         35                  40                  45
Ala Glu Val Val Thr Tyr Pro Val Asp Arg Gln Arg Phe Leu Asp Gln
     50                  55                  60
Met Val Pro Arg Gln Asp Ala Asp Glu Tyr Thr Asp Glu Asp Glu Phe
 65                  70                  75                  80
Val Arg Val Leu Glu Trp Leu Leu Asp Met Thr Val Gln Thr Met Glu
                 85                  90                  95
Pro Leu Glu Arg His Phe Ala Gly Asp Arg Pro Asp Val Val Val Asn
            100                 105                 110
Asp Pro Ser Ser Leu Trp Thr Gly Arg Leu Leu Ala Asp Arg Trp Gly
        115                 120                 125
Ile Pro Val Ile Arg Ser Thr Pro Thr Tyr Ala Ala Asn Glu His Trp
    130                 135                     140
Ser Leu His Pro Pro Val Asp Ser Ala Glu Pro Pro Asp Asp Pro Glu
145                 150                 155                 160
Leu His Lys Leu Leu Ala Arg Ile Glu Arg Leu Leu Glu Glu Gln Gly
                165                 170                 175
Val Glu His Asp Leu Ala Gly Phe Thr Gly Val Leu His Gly Gly Pro
            180                 185                 190
Ala Leu Leu Tyr Met Pro Arg Ser Phe Gln Tyr Ala Gly Glu Thr Phe
        195                 200                 205
Asp Ala Gln His His Phe Val Gly Pro Cys Pro Pro Arg Thr Ala Phe
    210                 215                 220
His Gly Glu Trp Arg Pro Gly Asp Asp Asp Gly Arg Pro Leu Val Leu
225                 230                 235                 240
Val Ser Leu Gly Thr Leu Tyr Asn Asp Arg Pro Asp Phe Phe Arg Thr
                245                 250                 255
Cys Leu Glu Ala Phe Gly Asp Glu Pro Trp Asn Val Leu Leu Val Leu
            260                 265                 270
Gly Gly Gly Val Pro Ala Ala Asp Leu Gly Pro Leu Pro Gly Asn Val
        275                 280                 285
Arg Val Thr Asp Phe Val Ser Leu Arg Asp Val Leu Pro His Thr Ala
    290                 295                 300
Val Val Val Asn His Gly Gly Met Ser Thr Ala Met Glu Val Phe Ser
305                 310                 315                 320
His Gly Val Pro Val Val Ala Ile Pro Val Met Pro Glu Pro Arg Ala
                325                 330                 335
Thr Ala Arg Arg Ile Val Glu Leu Gly Leu Gly Asp Gln Leu Leu Asn
            340                 345                 350
Ser Glu Leu Thr Ala Glu Ser Leu Arg Ala Thr Val Arg Arg Val Leu
        355                 360                 365
Ala Asp Ser Ala Ile Pro Gly Asn Met Arg Gly Phe Arg Glu Gln Ile
    370                 375                 380
Arg Ala Ala Gly Gly Ala Pro Ala Ala Ala Asp Ala Ile Glu Gly Leu
385                 390                 395                 400
Leu Pro Arg Val Gly
                405
<210>109
<211>621
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(621)
<400>109
atg ctc atc acc gaa aca gca gtg ccc gac gtg ttc cgc atc gat ccg  48
Met Leu Ile Thr Glu Thr Ala Val Pro Asp Val Phe Arg Ile Asp Pro
  1                   5                  10                  15
gaa ccg ctg ccg gac cac cgg ggc cgg ttc tac gaa gcg gtg cgc cgc  96
Glu Pro Leu Pro Asp His Arg Gly Arg Phe Tyr Glu Ala Val Arg Arg
             20                  25                  30
ggg ccg ctg gag gcc gcc gtc ggg cac tcg gtc gag gtc cgg cag gtc  144
Gly Pro Leu Glu Ala Ala Val Gly His Ser Val Glu Val Arg Gln Val
         35                  40                  45
cac tgc acc gtc tcc ggg cgc aac gta ctg cgc ggc ctg cac gcc acc  192
His Cys Thr Val Ser Gly Arg Asn Val Leu Arg Gly Leu His Ala Thr
     50                  55                  60
acc ctg ccg ccg ggc cag gcc aag atc ctc acc tgt gtg cgg ggt gcg  240
Thr Leu Pro Pro Gly Gln Ala Lys Ile Leu Thr Cys Val Arg Gly Ala
 65                  70                  75                  80
gcg ctg act atg gtg gtc gac atg agg gtc ggg tca ccg ggc ttc gga  288
Ala Leu Thr Met Val Val Asp Met Arg Val Gly Ser Pro Gly Phe Gly
                 85                  90                  95
cgg tac gag gcg gtg cgg cag gat gcc ccg tcg ggc acc gcg ctc tac  336
Arg Tyr Glu Ala Val Arg Gln Asp Ala Pro Ser Gly Thr Ala Leu Tyr
            l00                 105                 110
ctg ccg gac ggc atc ggc ctg ggc tac gtg gcc ctc gcg gac gac aca  384
Leu Pro Asp Gly Ile Gly Leu Gly Tyr Val Ala Leu Ala Asp Asp Thr
        115                 120                 125
tgc atg aac tac ctg tgc acc gag gag tac gtc ccg ggc atg gtc atc  432
Cys Met Asn Tyr Leu Cys Thr Glu Glu Tyr Val Pro Gly Met Val Ile
    130                 135                 140
gac gtg gac gcc ctg gac ccc gaa ctc ggc ctg ccg tgg gga ctg acc  480
Asp Val Asp Ala Leu Asp Pro Glu Leu Gly Leu Pro Trp Gly Leu Thr
145                 150                 155                 160
ggg gat ccc gtc cgc tcc gcc cgg gac gcg gcg gcg ccg tcc ctg cgg  528
Gly Asp Pro Val Arg Ser Ala Arg Asp Ala Ala Ala Pro Ser Leu Arg
                165                 170                 175
gcg gcc gcg gcg gcg gga att ctg ccc acg tac gag gac tgc tta cgg  576
Ala Ala Ala Ala Ala Gly Ile Leu Pro Thr Tyr Glu Asp Cys Leu Arg
            180                 185                 190
 gtg cgc acg tcc gtg ccc gcc cct ccc gac cgg act cgg ctc tga     621
 Val Arg Thr Ser Val Pro Ala Pro Pro Asp Arg Thr Arg Leu
         195                 200                 205
<210>110
<211>206
<212>PRT
<213>生二素链霉菌
<400>110
Met Leu Ile Thr Glu Thr Ala Val Pro Asp Val Phe Arg Ile Asp Pro
  1               5                  10                      15
Glu Pro Leu Pro Asp His Arg Gly Arg Phe Tyr Glu Ala Val Arg Arg
             20                  25                  30
Gly Pro Leu Glu Ala Ala Val Gly His Ser Val Glu Val Arg Gln Val
         35                  40                  45
His Cys Thr Val Ser Gly Arg Asn Val Leu Arg Gly Leu His Ala Thr
     50                  55                  60
Thr Leu Pro Pro Gly Gln Ala Lys Ile Leu Thr Cys Val Arg Gly Ala
 65                  70                  75                  80
Ala Leu Thr Met Val Val Asp Met Arg Val Gly Ser Pro Gly Phe Gly
                 85                  90                  95
Arg Tyr Glu Ala Val Arg Gln Asp Ala Pro Ser Gly Thr Ala Leu Tyr
            100                 105                 110
Leu Pro Asp Gly Ile Gly Leu Gly Tyr Val Ala Leu Ala Asp Asp Thr
        115                 120                 125
Cys Met Asn Tyr Leu Cys Thr Glu Glu Tyr Val Pro Gly Met Val Ile
    130                 135                 140
Asp Val Asp Ala Leu Asp Pro Glu Leu Gly Leu Pro Trp Gly Leu Thr
145                 150                 155                 160
Gly Asp Pro Val Arg Ser Ala Arg Asp Ala Ala Ala Pro Ser Leu Arg
                165                 170                 175
Ala Ala Ala Ala Ala Gly Ile Leu Pro Thr Tyr Glu Asp Cys Leu Arg
            180                 185                 190
Val Arg Thr Ser Val Pro Ala Pro Pro Asp Arg Thr Arg Leu
        195                 200                 205
<210>111
<211>960
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(903)
<400>111
atg acc tta cgc acg ctt cga ccc gcc ggc gcg gcg ccc ccc gtg ggt    48
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly
  1               5                  10                  15
ccc gcc gcg cgg cac gac ttc gac tcg ctc gtc tcc gac gca tgt gcg    96
Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala
             20                  25                  30
gag tta ctc ggt tcg ctc cgc cgg gcg gac cag cgc aga aga ggt gag    144
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu
         35                  40                  45
cag tac ata cgc ggg ctg ctc acg gca cag gga cgc aag acc gcc cgg    192
Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg
     50                  55                  60
aac ctc gcc gcc ttc gtc gga gag ggc gcg gcg gaa cag agc ctg cac    240
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His
 65                  70                  75                  80
cac ttc gtc gcc ggg tcg acc tgg gac tgg ggc gag gtg cgg gcc gcg    288
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala
                 85                  90                  95
ctg gcc cgc tac gtg gac gac agg ctg acc ccc gac gcc tgg gtg atc    336
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile
            100                 105                 110
tgg ccg atg gtg gtc tcc aag gcg ggg gtg cgc tcc gtc ggg gtg agc    384
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser
        115                 120                 125
cgg cgc ttc gtc tcc gac ctg ggc cgg gtg gtg agc tgc cag cag agt    432
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser
    130                 135                 140
cac ggg ctg tgg ctg gcc tcg ggc acg acg gcc gcc ccg gtc agc tgg    480
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp
145                 150                 155                 160
cgc ctg acg ctg ggc ggc ggc cgg agc ggg gag ggc aca ccc cgg cac    528
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His
                165                 170                 175
ccc ggc gca ccc ggt gag gag gag aac atc gtc cgc ctg gtg gcc gaa    576
Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu
            180                 185                 190
gcc gct cag gcc aac cgc tcc ttg gcc cgc ccc gtg gtg atg gac gca    624
Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala
        195                 200                 205
cgc gcg gcc gtg ctg cca cga ctg gtg cga ggg ctc ggt ctc gcg ggc    672
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly
    210                 215                 220
ctg ccc ttc atg gtg cgg gtg ggc ggg aac ctc cgg ctg gcc tcg gcg    720
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala
225                 230                 235                 240
agc ggc cgc ggc ccg gtg gac cac cac acg ggg acc acc tcg gcc cag    768
Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln
                245                 250                 255
cag ttg atg gag cag ctc aag cgg ttg agc cgc ccc gtg gag ttg cgg    816
Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg
            260                 265                 270
ggc tcc ctc agc ctc gtc gcc ccg cac ccc gtc gtc ctg ccg ggt gtg    864
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val
        275                 280                 285
gtc ccg agg cgg acg ctg acg ctg ctg ggg ggt gtg gcg gnnnnnnnnn     913
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Gly Val Ala
    290                 295                 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnn                960
<210>112
<211>301
<212>PRT
<213>生二素链霉菌
<400>112
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly
  1               5                  10                  15
Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala
             20                  25                  30
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu
         35                  40                  45
Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg
     50                  55                  60
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His
65                   70                  75                  80
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala
                 85                  90                  95
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile
            100                 105                 110
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser
        115                 120                 125
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser
    130                 135                 140
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp
145                 150                 155                 160
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His
                165                 170                 175
Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu
            180                 185                 190
Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala
        195                 200                 205
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly
    210                 215                 220
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala
225                 230                 235                 240
Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln
                245                 250                 255
Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg
            260                 265                 270
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val
        275                 280                 285
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Gly Val Ala
    290                 295                 300
<210>113
<211>1008
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1008)
<400>113
atg cag gca att cgg cat cac gtc atg ctc gtc atg gcc ttc gtg acc  48
Met Gln Ala Ile Arg His His Val Met Leu Val Met Ala Phe Val Thr
  1               5                  10                  15
gtc gcc acg act ttc ctt ctc tgg ccg tcg acg caa tcc gcg caa gcg  96
Val Ala Thr Thr Phe Leu Leu Trp Pro Ser Thr Gln Ser Ala Gln Ala
             20                  25                  30
ttt ccc ccg acc ccg aag cag acg gta ctg aac cac ctc cgc gcc att  144
Phe Pro Pro Thr Pro Lys Gln Thr Val Leu Asn His Leu Arg Ala Ile
         35                  40                  45
tcc ggg aat cac atc gtc tcc gga cag cac aac aag gag ccc gcc tcc  192
Ser Gly Asn His Ile Val Ser Gly Gln His Asn Lys Glu Pro Ala Ser
     50                  55                  60
gcc ccg ggc cag tac acc cag cag gtc aag gac gtc acc ggg cag tac    240
Ala Pro Gly Gln Tyr Thr Gln Gln Val Lys Asp Val Thr Gly Gln Tyr
 65                  70                  75                  80
ccc ggc ctg tgg ggc ggt gac ctg atg ttc gcc gcg gcg gac gtg gcc    288
Pro Gly Leu Trp Gly Gly Asp Leu Met Phe Ala Ala Ala Asp Val Ala
                 85                  90                  95
ggc cgc cag cgc gtc gtc gac cag gcc agg acc gag tgg gcg aac gga    336
Gly Arg Gln Arg Val Val Asp Gln Ala Arg Thr Glu Trp Ala Asn Gly
            100                 105                 110
tcg ctg gtc tcg ctc acc tgg cac gtc tgc ccg ccg acc ggc ggc agc    384
Ser Leu Val Ser Leu Thr Trp His Val Cys Pro Pro Thr Gly Gly Ser
        115                 120                 125
acc tgt gcg ttc gag ggc ggc gtc aag tcc acg ctg acg aac gcg cag    432
Thr Cys Ala Phe Glu Gly Gly Val Lys Ser Thr Leu Thr Asn Ala Gln
    130                 135                 140
ttc tcg cag gtc ctc acg gag ggc agt gcc ctg aac agc gca tgg aag    480
Phe Ser Gln Val Leu Thr Glu Gly Ser Ala Leu Asn Ser Ala Trp Lys
145                 150                 155                 160
cgg cgc ctg gac gag gtc gtc ccg tac ctg cag cag ctg gag aac gcg    528
Arg Arg Leu Asp Glu Val Val Pro Tyr Leu Gln Gln Leu Glu Asn Ala
                165                 170                 175
ggc gtc ccc gtc ctc ttc cgg ccg ctg cac gag atg aac gaa tcc tgg    576
Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met Asn Glu Ser Trp
            180                 185                 190
aac tgg tgg gga aac cgg ccc gga gcg aac ggc agc gca cgc ctc tac    624
Asn Trp Trp Gly Asn Arg Pro Gly Ala Asn Gly Ser Ala Arg Leu Tyr
        195                 200                 205
cag atc acc cgc gat cac ctc gcc ggg acg aaa ggg ctg gac aat ctg    672
Gln Ile Thr Arg Asp His Leu Ala Gly Thr Lys Gly Leu Asp Asn Leu
    210                 215                 220
atc tgg gtc tgg aac gtc cag gac aat ccg gcg gga aac tgg aac agc    720
Ile Trp Val Trp Asn Val Gln Asp Asn Pro Ala Gly Asn Trp Asn Ser
225                 230                 235                 240
tac tat ccg gga gat cag tac gtg gac gtc gtt tcg ctg gac gtc tgg  768
Tyr Tyr Pro Gly Asp Gln Tyr Val Asp Val Val Ser Leu Asp Val Trp
                245                 250                 255
tac aag agc cac ccg agt tcc gcc gac tac cag cag atg cgg agc atc  816
Tyr Lys Ser His Pro Ser Ser Ala Asp Tyr Gln Gln Met Arg Ser Ile
            260                 265                 270
gcg gga aca aaa ccc atg gcc ctc gcg gag ctg ggc aaa atg ccg acc  864
Ala Gly Thr Lys Pro Met Ala Leu Ala Glu Leu Gly Lys Met Pro Thr
        275                 280                 285
gcc gcg ctg ctg gac agc cag acg cgg tgg aca tgg ttc atg atg tgg  912
Ala Ala Leu Leu Asp Ser Gln Thr Arg Trp Thr Trp Phe Met Met Trp
    290                 295                 300
tcc gag cat ctg cgc ggg aac aat tcc aac gcc gaa ata cag acg gcg  960
Ser Glu His Leu Arg Gly Asn Asn Ser Asn Ala Glu Ile Gln Thr Ala
305                 310                 315                 320
tat ttc cac ccc cgt gta ctg aac cag ggg gag gtc gca ctg ccc tga  1008
Tyr Phe His Pro Arg Val Leu Asn Gln Gly Glu Val Ala Leu Pro
                325                 330                 335
<210>114
<211>335
<212>PRT
<213>生二素链霉菌
<400>114
Met Gln Ala Ile Arg His His Val Met Leu Val Met Ala Phe Val Thr
  1               5                  10                  15
Val Ala Thr Thr Phe Leu Leu Trp Pro Ser Thr Gln Ser Ala Gln Ala
             20                  25                  30
Phe Pro Pro Thr Pro Lys Gln Thr Val Leu Asn His Leu Arg Ala Ile
         35                  40                  45
Ser Gly Asn His Ile Val Ser Gly Gln His Asn Lys Glu Pro Ala Ser
     50                  55                  60
Ala Pro Gly Gln Tyr Thr Gln Gln Val Lys Asp Val Thr Gly Gln Tyr
 65                  70                  75                  80
Pro Gly Leu Trp Gly Gly Asp Leu Met Phe Ala Ala Ala Asp Val Ala
                 85                  90                  95
Gly Arg Gln Arg Val Val Asp Gln Ala Arg Thr Glu Trp Ala Asn Gly
            100                 105                 110
Ser Leu Val Ser Leu Thr Trp His Val Cys Pro Pro Thr Gly Gly Ser
        115                 120                 125
Thr Cys Ala Phe Glu Gly Gly Val Lys Ser Thr Leu Thr Asn Ala Gln
    130                 135                 140
Phe Ser Gln Val Leu Thr Glu Gly Ser Ala Leu Asn Ser Ala Trp Lys
145                 150                 155                 160
Arg Arg Leu Asp Glu Val Val Pro Tyr Leu Gln Gln Leu Glu Asn Ala
                165                 170                 175
Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met Asn Glu Ser Trp
            180                 185                 190
Asn Trp Trp Gly Asn Arg Pro Gly Ala Asn Gly Ser Ala Arg Leu Tyr
        195                 200                 205
Gln Ile Thr Arg Asp His Leu Ala Gly Thr Lys Gly Leu Asp Asn Leu
    210                 215                 220
Ile Trp Val Trp Asn Val Gln Asp Asn Pro Ala Gly Asn Trp Asn Ser
225                 230                 235                 240
Tyr Tyr Pro Gly Asp Gln Tyr Val Asp Val Val Ser Leu Asp Val Trp
                245                 250                 255
Tyr Lys Ser His Pro Ser Ser Ala Asp Tyr Gln Gln Met Arg Ser Ile
            260                 265                 270
Ala Gly Thr Lys Pro Met Ala Leu Ala Glu Leu Gly Lys Met Pro Thr
        275                 280                 285
Ala Ala Leu Leu Asp Ser Gln Thr Arg Trp Thr Trp Phe Met Met Trp
    290                 295                 300
Ser Glu His Leu Arg Gly Asn Asn Ser Asn Ala Glu Ile Gln Thr Ala
305                 310                 315                 320
Tyr Phe His Pro Arg Val Leu Asn Gln Gly Glu Val Ala Leu Pro
                325                 330                 335
<210>115
<211>1038
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1038)
<220>
<221>CDS
<222>(190)..(1038)
<400>115
atg acg tgc ggg ctc ggg cgg gaa cgg ctc cac cgt aga aag gaa gcg  48
Met Thr Cys Gly Leu Gly Arg Glu Arg Leu His Arg Arg Lys Glu Ala
  1               5                  10                  15
gtc cgg cgt ccc ggt cca aaa gag cac ggg aaa acc gga ccg atc gcg  96
Val Arg Arg Pro Gly Pro Lys Glu His Gly Lys Thr Gly Pro Ile Ala
             20                  25                  30
cgt ctg tgc cct ggc ggg ccg gct cgt tcc aag ccc tgg tcg cgg ttg  144
Arg Leu Cys Pro Gly Gly Pro Ala Arg Ser Lys Pro Trp Ser Arg Leu
         35                  40                  45
gcc ccc tac ggt ggt acg acc gac gac aag gcg acg ggg gcg acg atg  192
Ala Pro Tyr Gly Gly Thr Thr Asp Asp Lys Ala Thr Gly Ala Thr Met
     50                  55                  60
cgt atc gcg gtg aca ggg gcg gcg ggc agt ctg ggc agg cgg gtg gtg  240
Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val Val
 65                  70                  75                  80
cag ctg ctc gcg gac cgg gcc gac gtg gac gtc gtg gcg atg acc agg  288
Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr Arg
                 85                 90                  95
cgg aag ctg cct gcc gag gca cta ccg ccg ggg gtg gag tgc gcc gtc   336
Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala Val
            100                 105                 110
gcc gac tac gcc gac ccg ccc gct ctg cgt gcg gcg ctg aag ggc gtg   384
Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly Val
        115                 120                 125
gac act ctg gtc ctc gtc tcc agc gac ggg ccc gac gca cgg gtg ctg   432
Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val Leu
    130                 135                 140
ctg cac cac cgc aac gtc gtc gcc gcc gtg gtg gcc gag cgc gtc ggc   480
Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val Gly
145                 150                 155                 160
cat gtc gcg gca ctg agc agc gtc gac gcc gac tcg gcc tcc ccg ttc   528
His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro Phe
                165                 170                 175
tgc tac gcc gtc gtc aac cgg ctc acc gag gat ctg ctg ctc gcc tcc   576
Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala Ser
            180                 185                 190
ggc gtg ccg tgc tcg ttc gcc agg gcc tcg ctg tac atc gag ttc ttc   624
Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe Phe
        195                 200                 205
cta ggc tgg ctc acc cag gcg cgc tcg acc ggg ctg ctg agg ctg ccg   672
Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu Pro
    210                 215                 220
gca gcc gat ggc cgg gtg tcc ctg gtg gcg cgc gac gac gtg gcc cgc   720
Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala Arg
225                 230                 235                 240
gcc ctc gcc gcc ctc gcg gtg ggc ggg ccg acc ggc cgt cac cac gac   768
Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His Asp
                245                 250                 255
atc acg gga ccc gag tcg acg gac ctg gca ggc atc gcc tcc acg gcg    816
Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr Ala
            260                 265                 270
gcg gag gtg tgg cgg aca ccg gtc gcc tac gtg gac atc ccg gcc gac  864
Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala Asp
        275                 280                 285
acg tac tct gcc gaa aca gcg gcg acc ggc ctg gat ccc tgg tgg ctc  912
Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp Leu
    290                 295                 300
tac gcc ttc tcc tcc ctg ttc gcc tcg gta cgc gaa cag cgc tgg gat  960
Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp Asp
305                 310                 315                 320
cgg gtc cgc gac gac tgc gcc cag ctc acc ggc cgc ttg ccc cgc act  1008
Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg Thr
                325                 330                 335
ctc cgc gac gtc ctg tca gaa cgc gcg tga                          1038
Leu Arg Asp Val Leu Ser Glu Arg Ala
            340                 345
<210>116
<211>345
<212>PRT
<213>生二素链霉菌
<400>116
Met Thr Cys Gly Leu Gly Arg Glu Arg Leu His Arg Arg Lys Glu Ala
  1               5                  10                  15
Val Arg Arg Pro Gly Pro Lys Glu His Gly Lys Thr Gly Pro Ile Ala
             20                  25                  30
Arg Leu Cys Pro Gly Gly Pro Ala Arg Ser Lys Pro Trp Ser Arg Leu
         35                  40                  45
Ala Pro Tyr Gly Gly Thr Thr Asp Asp Lys Ala Thr Gly Ala Thr Met
     50                  55                  60
Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val Val
 65                  70                  75                  80
Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr Arg
                 85                  90                  95
Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala Val
            100                 105                 110
Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly Val
        115                 120                 125
Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val Leu
    130                 135                 140
Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val Gly
145                 150                 155                 160
His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro Phe
                165                 170                 175
Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala Ser
            180                 185                 190
Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe Phe
        195                 200                 205
Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu Pro
    210                 215                 220
Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala Arg
225                 230                 235                 240
Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His Asp
                245                 250                 255
Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr Ala
            260                 265                 270
Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala Asp
        275                 280                 285
Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp Leu
    290                 295                 300
Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp Asp
305                 310                 315                 320
Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg Thr
                325                 330                 335
Leu Arg Asp Val Leu Ser Glu Arg Ala
            340                 345
<210>117
<211>282
<212>PRT
<213>生二素链霉菌
<400>117
Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val
  1               5                  10                  15
Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr
             20                  25                  30
Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala
         35                  40                  45
Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly
     50                  55                  60
Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val
 65                  70                  75                  80
Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val
                 85                  90                  95
Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro
            100                 105                 110
Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala
        115                 120                 125
Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe
    130                 135                 140
Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu
145                 150                 155                 160
Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala
                165                 170                 175
Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His
            180                 185                 190
Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr
        195                 200                 205
Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala
    210                 215                 220
Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp
225                 230                 235                 240
Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp
                245                 250                 255
Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg
            260                 265                 270
Thr Leu Arg Asp Val Leu Ser Glu Arg Ala
        275                 280
<210>118
<211>975
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(975)
<400>118
atg ctc cga cgc cgt ctc gga ggg ccg tca ggc ccc ctc gtc agt gcc  48
Met Leu Arg Arg Arg Leu Gly Gly Pro Ser Gly Pro Leu Val Ser Ala
  1               5                  10                  15
ctg tgc ctg ggc gcg atg ccc ttc ggc acc acc gtc gac gag aag acg  96
Leu Cys Leu Gly Ala Met Pro Phe Gly Thr Thr Val Asp Glu Lys Thr
             20                  25                  30
tcc ttc gcc atc ctc gac cgg ttc gtc gag gcc ggc ggc agt ctc gtc    144
Ser Phe Ala Ile Leu Asp Arg Phe Val Glu Ala Gly Gly Ser Leu Val
         35                  40                  45
gac acc gcc gac aac tac gcg ttc tgg gct ccc ggc ggg acc ggg gac    192
Asp Thr Ala Asp Asn Tyr Ala Phe Trp Ala Pro Gly Gly Thr Gly Asp
     50                  55                  60
gag agc gag aac acc gtc ggg cgc tgg ctg gcg agc cgc cgc cgc cgc     240
Glu Ser Glu Asn Thr Val Gly Arg Trp Leu Ala Ser Arg Arg Arg Arg
 65                  70                  75                  80
gac gag gtg gtg atc tcc acc aag gtg ggt gcc cgc ccc acc gtc ccc     288
Asp Glu Val Val Ile Ser Thr Lys Val Gly Ala Arg Pro Thr Val Pro
                 85                  90                  95
ggc agc ggc ctg gag acc gcc gaa ggg ctg tcg gct ccc gtc ata cgg     336
Gly Ser Gly Leu Glu Thr Ala Glu Gly Leu Ser Ala Pro Val Ile Arg
            100                 105                 110
aag gcc gcg gag gac agc ctg cga cgc ctg ggc acc gat cgc atc gat     384
Lys Ala Ala Glu Asp Ser Leu Arg Arg Leu Gly Thr Asp Arg Ile Asp
        115                 120                 125
ctg tac tgg acc cac atc gag gac cgg acc gtc cct ctg gag gag acg     432
Leu Tyr Trp Thr His Ile Glu Asp Arg Thr Val Pro Leu Glu Glu Thr
    130                 135                 140
ctc gga gct ctc gac gag ctg gtc ggc ggc ggc aag gtg gcg gtg ctg     480
Leu Gly Ala Leu Asp Glu Leu Val Gly Gly Gly Lys Val Ala Val Leu
145                 150                 155                 160
ggc tgc tcc aac cac gcg ggc tgg cgc atc gaa cgg gcc cgc gcg ctc     528
Gly Cys Ser Asn His Ala Gly Trp Arg Ile Glu Arg Ala Arg Ala Leu
                165                 170                 175
gcc cgg acc aac ggc tgg acg gcg tac acc tgc gtc cag cag cgc tac     576
Ala Arg Thr Asn Gly Trp Thr Ala Tyr Thr Cys Val Gln Gln Arg Tyr
            180                 185                 190
tcc tac ctt cag ccg cgc ttc gac gtc gga ctg ccg gag agc gga cac     624
Ser Tyr Leu Gln Pro Arg Phe Asp Val Gly Leu Pro Glu Ser Gly His
        195                 200                 205
gtc cac gcg acc tcc gaa ctc ctc gac cac gta cgc agc gag ccc gac  672
Val Hi s Ala Thr Ser Glu Leu Leu Asp His Val Arg Ser Glu Pro Asp
    210                 215                 220
ctg acg ctg ctg gcc tac tcg tcc ctg ctc tcg ggc gcg tac acc cgg  720
Leu Thr Leu Leu Ala Tyr Ser Ser Leu Leu Ser Gly Ala Tyr Thr Arg
225                 230                 235                 240
ccg gac aag acc ctg tcc gcc gcc tac gac cac ccg ggc acc ggg cag  768
Pro Asp Lys Thr Leu Ser Ala Ala Tyr Asp His Pro Gly Thr Gly Gln
                245                 250                 255
cgg ctg acc gtg ctg cgg gag gtg gcc gcc gag ctc ggt gcc acc gcc  816
Arg Leu Thr Val Leu Arg Glu Val Ala Ala Glu Leu Gly Ala Thr Ala
            260                 265                 270
aac cag gtg gtg ctg tcc tgg ttg ctc gga ggt gat ccg ccg gtg atc  864
Asn Gln Val Val Leu Ser Trp Leu Leu Gly Gly Asp Pro Pro Val Ile
        275                 280                 285
ccg atc gtg ggg gtg agt tcc gtc gag cag ctg gac gag gtg ctg gcc  912
Pro Ile Val Gly Val Ser Ser Val Glu Gln Leu Asp Glu Val Leu Ala
    290                 295                 300
gcc gtc gag ctg gag ctg ccc cgg gag acg agg gca cgg ctg gac ctc  960
Ala Val Glu Leu Glu Leu Pro Arg Glu Thr Arg Ala Arg Leu Asp Leu
305                 310                 315                 320
gcc ggg cgg ggc tga                                              975
Ala Gly Arg Gly
                325
<210>119
<211>324
<212>PRT
<213>生二素链霉菌
<400>119
Met Leu Arg Arg Arg Leu Gly Gly Pro Ser Gly Pro Leu Val Ser Ala
  1               5                  10                  15
Leu Cys Leu Gly Ala Met Pro Phe Gly Thr Thr Val Asp Glu Lys Thr
             20                  25                  30
Ser Phe Ala Ile Leu Asp Arg Phe Val Glu Ala Gly Gly Ser Leu Val
         35                  40                  45
Asp Thr Ala Asp Asn Tyr Ala Phe Trp Ala Pro Gly Gly Thr Gly Asp
     50                  55                  60
Glu Ser Glu Asn Thr Val Gly Arg Trp Leu Ala Ser Arg Arg Arg Arg
 65                  70                  75                  80
Asp Glu Val Val Ile Ser Thr Lys Val Gly Ala Arg Pro Thr Val Pro
                 85                  90                  95
Gly Ser Gly Leu Glu Thr Ala Glu Gly Leu Ser Ala Pro Val Ile Arg
            100                 105                 110
Lys Ala Ala Glu Asp Ser Leu Arg Arg Leu Gly Thr Asp Arg Ile Asp
        115                 120                 125
Leu Tyr Trp Thr His Ile Glu Asp Arg Thr Val Pro Leu Glu Glu Thr
    130                 135                 140
Leu Gly Ala Leu Asp Glu Leu Val Gly Gly Gly Lys Val Ala Val Leu
145                 150                 155                 160
Gly Cys Ser Asn His Ala Gly Trp Arg Ile Glu Arg Ala Arg Ala Leu
                165                 170                 175
Ala Arg Thr Asn Gly Trp Thr Ala Tyr Thr Cys Val Gln Gln Arg Tyr
            180                 185                 190
Ser Tyr Leu Gln Pro Arg Phe Asp Val Gly Leu Pro Glu Ser Gly His
        195                 200                 205
Val His Ala Thr Ser Glu Leu Leu Asp His Val Arg Ser Glu Pro Asp
    210                 215                 220
Leu Thr Leu Leu Ala Tyr Ser Ser Leu Leu Ser Gly Ala Tyr Thr Arg
225                 230                 235                 240
Pro Asp Lys Thr Leu Ser Ala Ala Tyr Asp His Pro Gly Thr Gly Gln
                245                 250                 255
Arg Leu Thr Val Leu Arg Glu Val Ala Ala Glu Leu Gly Ala Thr Ala
            260                 265                 270
Asn Gln Val Val Leu Ser Trp Leu Leu Gly Gly Asp Pro Pro Val Ile
        275                 280                 285
Pro Ile Val Gly Val Ser Ser Val Glu Gln Leu Asp Glu Val Leu Ala
    290                 295                 300
Ala Val Glu Leu Glu Leu Pro Arg Glu Thr Arg Ala Arg Leu Asp Leu
305                 310                 315                 320
Ala Gly Arg Gly
<210>120
<211>1227
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1227)
<400>120
gtg acg ccc gag gcg gac gtc ggt acg cgg tgg gag ccg gag ttc gac  48
Val Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp
  1               5                  10                  15
atg ctg ccc ggc ata ccc gac ctg cgg gcc ttt ccc cgc gga cgg tgg  96
Met Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp
             20                  25                  30
gcg gac gcg gtg cgg gag gcc acc ggc gca ctg acc tgg ggc gag ctc  144
Ala Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu
         35                  40                  45
ggc tac ccc gat ccg gcc ggt ctc gcc cgg ctc cgg cag cgg ctc gcg  192
Gly Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala
     50                  55                  60
gcc tac ctc gtg cgg gga cgc ggc gcg tcg ctg gaa gcc cgg cag ctc  240
Ala Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu
65                  70                  75                  80
gtc gtc tgc gcg ggc acg ctg gac gcg gtg cgc agg ctg tgc cgg gtc    288
Val Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val
                 85                  90                  95
ctg cgg acc gag ggc cac acc cac atg gcc ctg gag gac cct ggc tgg    336
Leu Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp
            100                 105                 110
tcg cgg ctg agc gcc acg gtc ggg gcg gag ggg ctg gtg ccc gtc ccg    384
Ser Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro
        115                 120                 125
gtt ccc gtg gac ggc gac ggc ctg cgg gtc gac ctg ctg cgg cgc gcg    432
Val Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala
    130                 135                 140
cct cag gtc cgg tcg gtg atc gtc gct ccc gcc cac cag ttc ccg acc    480
Pro Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr
145                 150                 155                 160
ggt gtg gtc ctc gcc ccg gcc cgt cgc ggc gag ctg gtc gcc tgg gcc    528
Gly Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala
                165                 170                 175
cgc gag gtc gac ggc ctg gtg ctg gag gac gac tac gac gcc gag ttc    576
Arg Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe
            180                 185                 190
cga tac gac cgc cac ccc gtg ggc gcc ctg cag ggc atg gca ccg gag    624
Arg Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu
        195                 200                 205
cac gtc gcg ctg ctg ggg tcg gtc agc aag acg ctc tcg ccg gcc ctg    672
His Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu
    210                 215                 220
cgg atc ggc tgg gcg gtg acc ccg ccg cgc tgg acc gag gcc ctg ggc    720
Arg Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly
225                 230                 235                 240
gcg gag cac gtc ggg ggc gta cca ccg ccc gtc atc gac cag gag gcg    768
Ala Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala
                245                 250                 255
ttc gcc cgg ttc ctg gcc cgc ggg tcc tac gac cgg tac ctg cgg gcg    816
Phe Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala
            260                 265                 270
gca cgg ctg cgc tac aaa cgg cgc cgc gat cac ctc atg gga gaa ctc    864
Ala Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu
        275                 280                 285
gcg gcg tcg ctg ccg ggg ttc cag gtg tcc ggt gcg gcg gcc ggc ttc    912
Ala Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe
    290                 295                 300
cac ctg ctg ctg tcc ctg acg gac tgc tcg gcg ccc acc gtc gtc agg    960
His Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg
305                 310                 315                 320
gag gcg gcg cgg cgt gac gtg agg ctg gcg gat ctc gac gcc tac cgg    1008
Glu Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg
                325                 330                 335
atg gcg cgg gcc gag cac cac ccg acg gcc cgg gcc ggc gac tcc ggc    1056
Met Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly
            340                 345                 350
ggg gcg cgg gcc gtg gcc gcc gcc ggc ccc gcg ctg gtc ctc ggc tac    1104
Gly Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr
        355                 360                 365
ggc aat ctg gcg gac cac gcc gtg ccc gga gcc gtg cgg cgc ctg gca    1152
Gly Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala
    370                 375                 380
cag gcc atc gac gcg gcc cgg cgc cac gac cgg cgg cac gtc gac gcc    1200
Gln Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala
385                 390                 395                 400
ggg cgg gcc ggg gag cgg gcc gac tga                                1227
Gly Arg Ala Gly Glu Arg Ala Asp
                405
<210>121
<211>408
<212>PRT
<213>生二素链霉菌
<400>121
Val Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp
1               5                   10                  15
Met Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp
            20                  25                  30
Ala Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu
        35                  40                  45
Gly Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala
    50                  55                  60
Ala Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu
65                  70                  75                  80
Val Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val
                85                  90                  95
Leu Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp
            100                 105                 110
Ser Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro
        115                 120                 125
Val Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala
    130                 135                 140
Pro Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr
145                 150                 155                 160
Gly Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala
                165                 170                 175
Arg Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe
            180                 185                 190
Arg Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu
        195                 200                 205
His Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu
    210                 215                 220
Arg Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly
225                 230                 235                 240
Ala Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala
                245                 250                 255
Phe Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala
            260                 265                 270
Ala Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu
        275                 280                 285
Ala Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe
    290                 295                 300
His Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg
305                 310                 315                 320
Glu Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg
                325                 330                 335
Met Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly
            340                 345                 350
Gly Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr
        355                 360                 365
Gly Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala
    370                 375                 380
Gln Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala
385                 390                 395                 400
Gly Arg Ala Gly Glu Arg Ala Asp
                405
<210>122
<211>46
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR39
<400>122
cccaagcttg agaagggagc ggacattcat ggcccgcgcc gaacgc                   46
<210>123
<211>46
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR42
<400>123
cgggatccgg ctgaccatgg gagacgggcg catcgccgag ttcagc                   46
<210>124
<211>46
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR40
<400>124
cccaagcttg agaagggagc ggacattcaa tgctttggta aagcac                   46
<210>125
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR41
<400>125
cccaagcttt caaggaacga cggggtggtc agtcaagt                            38
<210>126
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸A
<400>126
ccagtagata tcccgccaac ccggagctgc ac                                  32
<210>127
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸B
<400>127
gaaaagatcc gtcatggggt cgtgcgctcc tt                                  32
<210>128
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸C
<400>128
cacgacccca tgacggatct tttccgctgc at                                  32
<210>129
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸D
<400>129
gagccggata tcatcggtct tgccttgctc gt                                  32
<210>130
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸ORF23c
<400>130
acgtgcgcgg tgagttcgcc gttgc                                          25
<210>131
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸ORF25c
<400>131
ctgaacgacg ccatcgcggt ggtgc                                          25
<210>132
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸ORF1*c
<400>132
gaccacctcg aaccgtccgg cgtca                                       25
<210>133
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸ORF2*c
<400>133
ggcccggtcc agcgtgccga agc                                         23
<210>134
<211>6174
<212>DNA
<213>生二素链霉菌
<400>134
ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60
ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc 120
aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180
gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240
ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 300
gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360
cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 420
gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480
gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540
gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600
ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc 660
cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 720
cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780
tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg 840
gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 900
cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960
gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 1020
tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 1080
gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140
gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200
tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 1260
gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320
gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380
tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440
tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500
gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560
tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620
ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680
ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740
tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800
tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860
acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920
tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980
acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2040
tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100
cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160
tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220
cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280
accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340
acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400
acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460
tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520
acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580
tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2640
cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700
actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 2760
cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2820
cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2880
acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2940
gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000
gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3060
tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120
caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180
gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240
gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300
atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360
gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420
gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480
tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540
ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600
ccgtggacgg agcgcgtccn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc cgccacaccc 4080
cccagcagcg tcagcgtccg cctcgggacc acacccggca ggacgacggg gtgcggggcg 4140
acgaggctga gggagccccg caactccacg gggcggctca accgcttgag ctgctccatc 4200
aactgctggg ccgaggtggt ccccgtgtgg tggtccaccg ggccgcggcc gctcgccgag 4260
gccagccgga ggttcccgcc cacccgcacc atgaagggca ggcccgcgag accgagccct 4320
cgcaccagtc gtggcagcac ggccgcgcgt gcgtccatca ccacggggcg ggccaaggag 4380
cggttggcct gagcggcttc ggccaccagg cggacgatgt tctcctcctc accgggtgcg 4440
ccggggtgcc ggggtgtgcc ctccccgctc cggccgccgc ccagcgtcag gcgccagctg 4500
accggggcgg ccgtcgtgcc cgaggccagc cacagcccgt gactctgctg gcagctcacc 4560
acccggccca ggtcggagac gaagcgccgg ctcaccccga cggagcgcac ccccgccttg 4620
gagaccacca tcggccagat cacccaggcg tcgggggtca gcctgtcgtc cacgtagcgg 4680
gccagcgcgg cccgcacctc gccccagtcc caggtcgacc cggcgacgaa gtggtgcagg 4740
ctctgttccg ccgcgccctc tccgacgaag gcggcgaggt tccgggcggt cttgcgtccc 4800
tgtgccgtga gcagcccgcg tatgtactgc tcacctcttc tgcgctggtc cgcccggcgg 4860
agcgaaccga gtaactccgc acatgcgtcg gagacgagcg agtcgaagtc gtgccgcgcg 4920
gcgggaccca cggggggcgc cgcgccggcg ggtcgaagcg tgcgtaaggt cataggagtc 4980
ctcgtggggg cctcgtcatc actgcgagtg gactgcgacc agcatcgcca attcacccgt 5040
tgctccccag gtacaccggg cacactcgtt ccgcttcgct cccccggcgg cacggcccgc 5100
gtgtggagca ctccccgctc tccggacggt gggggggaag cccaccgcac gcgcgccggt 5160
agcggtgccg gggccccaca acccctcacc gacggggtcc gttcgaccac atgccgtgat 5220
gatgccttcg ccgcacggcc tccttgaatg acggaccgtc agaaagacgt cactccgcgc 5280
gcgcccgctc ccgccccgac cccgcccggc cgccgtcccg cccccgcgac cctgtgggcc 5340
gacgccctct tgacggaccc ggaatcccgg gccgcgggac gggacggcga ggaactcgat 5400
gccgcaaagg ttccgcgtcc tcaccggcac ctccgagatc cagcgcaacg gcatcgccaa 5460
gctcctggct ttccaccact gagccgcacc ccctggcgag cagatccggg acaagacgcc 5520
accttcgcga cagtgtttag gaaaagttaa gtaaagaatt ccgcgagcgg attgccaggg 5580
agaacaaccc attgacgcgc accggtgcag cggccacatt gacggcacct gtcaagttca 5640
cccccaggag cttggaatcc catgcaggca attcggcatc acgtcatgct cgtcatggcc 5700
ttcgtgaccg tcgccacgac tttccttctc tggccgtcga cgcaatccgc gcaagcgttt 5760
cccccgaccc cgaagcagac ggtactgaac cacctccgcg ccatttccgg gaatcacatc 5820
gtctccggac agcacaacaa ggagcccgcc tccgccccgg gccagtacac ccagcaggtc 5880
aaggacgtca ccgggcagta ccccggcctg tggggcggtg acctgatgtt cgccgcggcg 5940
gacgtggccg gccgccagcg cgtcgtcgac caggccagga ccgagtgggc gaacggatcg 6000
ctggtctcgc tcacctggca cgtctgcccg ccgaccggcg gcagcacctg tgcgttcgag 6060
ggcggcgtca agtccacgct gacgaacgcg cagttctcgc aggtcctcac ggagggcagt 6120
gccctgaaca gcgcatggaa gcggcgcctg gacgaggtcg tcccgtacct gcag       6174
<210>135
<211>4770
<212>DNA
<213>生二素链霉菌
<400>135
gaattccgcg agcggattgc cagggagaac aacccattga cgcgcaccgg tgcagcggcc 60
acattgacgg cacctgtcaa gttcaccccc aggagcttgg aatcccatgc aggcaattcg 120
gcatcacgtc atgctcgtca tggccttcgt gaccgtcgcc acgactttcc ttctctggcc 180
gtcgacgcaa tccgcgcaag cgtttccccc gaccccgaag cagacggtac tgaaccacct 240
ccgcgccatt tccgggaatc acatcgtctc cggacagcac aacaaggagc ccgcctccgc 300
cccgggccag tacacccagc aggtcaagga cgtcaccggg cagtaccccg gcctgtgggg 360
cggtgacctg atgttcgccg cggcggacgt ggccggccgc cagcgcgtcg tcgaccaggc 420
caggaccgag tgggcgaacg gatcgctggt ctcgctcacc tggcacgtct gcccgccgac 480
cggcggcagc acctgtgcgt tcgagggcgg cgtcaagtcc acgctgacga acgcgcagtt 540
ctcgcaggtc ctcacggagg gcagtgccct gaacagcgca tggaagcggc gcctggacga 600
ggtcgtcccg tacctgcagc agctggagaa cgcgggcgtc cccgtcctct tccggccgct 660
gcacgagatg aacgaatcct ggaactggtg gggaaaccgg cccggagcga acggcagcgc 720
acgcctctac cagatcaccc gcgatcacct cgccgggacg aaagggctgg acaatctgat 780
ctgggtctgg aacgtccagg acaatccggc gggaaactgg aacagctact atccgggaga 840
tcagtacgtg gacgtcgttt cgctggacgt ctggtacaag agccacccga gttccgccga 900
ctaccagcag atgcggagca tcgcgggaac aaaacccatg gccctcgcgg agctgggcaa 960
aatgccgacc gccgcgctgc tggacagcca gacgcggtgg acatggttca tgatgtggtc 1020
cgagcatctg cgcgggaaca attccaacgc cgaaatacag acggcgtatt tccacccccg 1080
tgtactgaac cagggggagg tcgcactgcc ctgacgctcg gcgctgcccg gctctctcac 1140
gcgcgttctg acaggacgtc gcggagagtg cggggcaagc ggccggtgag ctgggcgcag 1200
tcgtcgcgga cccgatccca gcgctgttcg cgtaccgagg cgaacaggga ggagaaggcg 1260
tagagccacc agggatccag gccggtcgcc gctgtttcgg cagagtacgt gtcggccggg 1320
atgtccacgt aggcgaccgg tgtccgccac acctccgccg ccgtggaggc gatgcctgcc 1380
aggtccgtcg actcgggtcc cgtgatgtcg tggtgacggc cggtcggccc gcccaccgcg 1440
agggcggcga gggcgcgggc cacgtcgtcg cgcgccacca gggacacccg gccatcggct 1500
gccggcagcc tcagcagccc ggtcgagcgc gcctgggtga gccagcctag gaagaactcg 1560
atgtacagcg aggccctggc gaacgagcac ggcacgccgg aggcgagcag cagatcctcg 1620
gtgagccggt tgacgacggc gtagcagaac ggggaggccg agtcggcgtc gacgctgctc 1680
agtgccgcga catggccgac gcgctcggcc accacggcgg cgacgacgtt gcggtggtgc 1740
agcagcaccc gtgcgtcggg cccgtcgctg gagacgagga ccagagtgtc cacgcccttc 1800
agcgccgcac gcagagcggg cgggtcggcg tagtcggcga cggcgcactc cacccccggc 1860
ggtagtgcct cggcaggcag cttccgcctg gtcatcgcca cgacgtccac gtcggcccgg 1920
tccgcgagca gctgcaccac ccgcctgccc agactgcccg ccgcccctgt caccgcgata 1980
cgcatcgtcg cccccgtcgc cttgtcgtcg gtcgtaccac cgtagggggc caaccgcgac 2040
cagggcttgg aacgagccgg cccgccaggg cacagacgcg cgatcggtcc ggttttcccg 2100
tgctcttttg gaccgggacg ccggaccgct tcctttctac ggtggagccg ttcccgcccg 2160
agcccgcacg tcatcgacgt gcggggaaga cagaggtgat accgatgctc cgacgccgtc 2220
tcggagggcc gtcaggcccc ctcgtcagtg ccctgtgcct gggcgcgatg cccttcggca 2280
ccaccgtcga cgagaagacg tccttcgcca tcctcgaccg gttcgtcgag gccggcggca 2340
gtctcgtcga caccgccgac aactacgcgt tctgggctcc cggcgggacc ggggacgaga 2400
gcgagaacac cgtcgggcgc tggctggcga gccgccgccg ccgcgacgag gtggtgatct 2460
ccaccaaggt gggtgcccgc cccaccgtcc ccggcagcgg cctggagacc gccgaagggc 2520
tgtcggctcc cgtcatacgg aaggccgcgg aggacagcct gcgacgcctg ggcaccgatc 2580
gcatcgatct gtactggacc cacatcgagg accggaccgt ccctctggag gagacgctcg 2640
gagctctcga cgagctggtc ggcggcggca aggtggcggt gctgggctgc tccaaccacg 2700
cgggctggcg catcgaacgg gcccgcgcgc tcgcccggac caacggctgg acggcgtaca 2760
cctgcgtcca gcagcgctac tcctaccttc agccgcgctt cgacgtcgga ctgccggaga 2820
gcggacacgt ccacgcgacc tccgaactcc tcgaccacgt acgcagcgag cccgacctga 2880
cgctgctggc ctactcgtcc ctgctctcgg gcgcgtacac ccggccggac aagaccctgt 2940
ccgccgccta cgaccacccg ggcaccgggc agcggctgac cgtgctgcgg gaggtggccg 3000
ccgagctcgg tgccaccgcc aaccaggtgg tgctgtcctg gttgctcgga ggtgatccgc 3060
cggtgatccc gatcgtgggg gtgagttccg tcgagcagct ggacgaggtg ctggccgccg 3120
tcgagctgga gctgccccgg gagacgaggg cacggctgga cctcgccggg cggggctgac 3180
gggccacaca ccgcccctcg cccgggacgg gctgaccggc cgcacaccgt ccctcagccg 3240
ggacgggctg acggccacac acccgcccct cagcccggct gggctgggct gacggccaca 3300
cacccgctcc tcagcccggc tgggctgggc tgacggccac acacccgccc ctcagcccgg 3360
ctgggctggg ctgacggcca cacgccgtcc ctcgcccggg tcgggctgac cagccacacg 3420
ccgtccctca gtcggcccgc tccccggccc gcccggcgtc gacgtgccgc cggtcgtggc 3480
gccgggccgc gtcgatggcc tgtgccaggc gccgcacggc tccgggcacg gcgtggtccg 3540
ccagattgcc gtagccgagg accagcgcgg ggccggcggc ggccacggcc cgcgccccgc 3600
cggagtcgcc ggcccgggcc gtcgggtggt gctcggcccg cgccatccgg taggcgtcga 3660
gatccgccag cctcacgtca cgccgcgccg cctccctgac gacggtgggc gccgagcagt 3720
ccgtcaggga cagcagcagg tggaagccgg ccgccgcacc ggacacctgg aaccccggca 3780
gcgacgccgc gagttctccc atgaggtgat cgcggcgccg tttgtagcgc agccgtgccg 3840
cccgcaggta ccggtcgtag gacccgcggg ccaggaaccg ggcgaacgcc tcctggtcga 3900
tgacgggcgg tggtacgccc ccgacgtgct ccgcgcccag ggcctcggtc cagcgcggcg 3960
gggtcaccgc ccagccgatc cgcagggccg gcgagagcgt cttgctgacc gaccccagca 4020
gcgcgacgtg ctccggtgcc atgccctgca gggcgcccac ggggtggcgg tcgtatcgga 4080
actcggcgtc gtagtcgtcc tccagcacca ggccgtcgac ctcgcgggcc caggcgacca 4140
gctcgccgcg acgggccggg gcgaggacca caccggtcgg gaactggtgg gcgggagcga 4200
cgatcaccga ccggacctga ggcgcgcgcc gcagcaggtc gacccgcagg ccgtcgccgt 4260
ccacgggaac cgggacgggc accagcccct ccgccccgac cgtggcgctc agccgcgacc 4320
agccagggtc ctccagggcc atgtgggtgt ggccctcggt ccgcaggacc cggcacagcc 4380
tgcgcaccgc gtccagcgtg cccgcgcaga cgacgagctg ccgggcttcc agcgacgcgc 4440
cgcgtccccg cacgaggtag gccgcgagcc gctgccggag ccgggcgaga ccggccggat 4500
cggggtagcc gagctcgccc caggtcagtg cgccggtggc ctcccgcacc gcgtccgccc 4560
accgtccgcg gggaaaggcc cgcaggtcgg gtatgccggg cagcatgtcg aactccggct 4620
cccaccgcgt accgacgtcc gcctcgggcg tcaccggagc ggggacggcc tgcgccctga 4680
cccgggtggc cgagccgctg cgcgcctcca ggtacccctc cgcgacgagc tgcgcgtagg 4740
ggggatcctc tagagtcgac ctgcaggcct                                  4770
<210>136
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR31
<400>136
cccaagcttc tgcgcccgcg ggcgtgaa                                       28
<210>137
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR37
<400>137
gctctagaac cgtgtagccg cgccccgg                                       28
<210>138
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸KF30
<400>138
aagcttgtgt gcccggtgta cctggggagc                                     30
<210>139
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸KF31
<400>139
ggatcccgcg acggacacga ccgccgcgca                                   30
<210>140
<211>12134
<212>DNA
<213>生二素链霉菌
<400>140
ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg  60
ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc  120
aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg  180
gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc  240
ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg  300
gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg  360
cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc  420
gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc  480
gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg  540
gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc  600
ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc  660
cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg  720
cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg  780
tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg  840
gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc  900
cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac  960
gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc  1020
tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac  1080
gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg  1140
gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg  1200
tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg  1260
gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg  1320
gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt  1380
tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg  1440
tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg  1500
gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag  1560
tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa  1620
ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg  1680
ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg  1740
tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg  1800
tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg  1860
acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg  1920
tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca  1980
acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca  2040
tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact  2100
cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc  2160
tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc  2220
cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc  2280
accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg  2340
acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg  2400
acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc  2460
tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg  2520
acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga  2580
tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc  2640
cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga  2700
actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg  2760
cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg  2820
cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac  2880
acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc  2940
gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg  3000
gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac  3060
tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc  3120
caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg  3180
gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc  3240
gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc  3300
atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg  3360
gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac  3420
gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac  3480
tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac  3540
ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa   3600
ccgtggacgg agcgcgccga ggagcggaaa ggtctgccgc agaaacaggc tgcggccctt   3660
tctttccgct ttttccggta ccgggacggc cgttccgatg aaagcgaacg tccgcatgcg   3720
acggccgtcc ctcccgtacg ctcctccccc gtcgcggccg gccgggcggg cgggccggcc   3780
gaccgcgacg gggcggggcg gggtcacacc gccgtcgccc caccgaggtc gccgcgcgcg   3840
gagggctgcg ccagccgcag cgtgtgggcg atggacgcca gggtcacgtg ccggtgccag   3900
ccctggaacg accgtccttc gaagtcgcgc atgcccacgc ccacgctcac ccggtcgaag   3960
tcggcgtcga cctgttcggt gagcatcgcc agccgcagca gggcgccgcg gtcccaggac   4020
gtgaggtcgg tcagccacag gtcggcgggg cgccggcggt tgccccgcca cacccccagc   4080
agcgtcagcg tccgcctcgg gaccacaccc ggcaggacga cggggtgcgg ggcgacgagg   4140
ctgagggagc cccgcaactc cacggggcgg ctcaaccgct tgagctgctc catcaactgc   4200
tgggccgagg tggtccccgt gtggtggtcc accgggccgc ggccgctcgc cgaggccagc   4260
cggaggttcc cgcccacccg caccatgaag ggcaggcccg cgagaccgag ccctcgcacc   4320
agtcgtggca gcacggccgc gcgtgcgtcc atcaccacgg ggcgggccaa ggagcggttg   4380
gcctgagcgg cttcggccac caggcggacg atgttctcct cctcaccggg tgcgccgggg   4440
tgccggggtg tgccctcccc gctccggccg ccgcccagcg tcaggcgcca gctgaccggg   4500
gcggccgtcg tgcccgaggc cagccacagc ccgtgactct gctggcagct caccacccgg   4560
cccaggtcgg agacgaagcg ccggctcacc ccgacggagc gcacccccgc cttggagacc   4620
accatcggcc agatcaccca ggcgtcgggg gtcagcctgt cgtccacgta gcgggccagc   4680
gcggcccgca cctcgcccca gtcccaggtc gacccggcga cgaagtggtg caggctctgt   4740
tccgccgcgc cctctccgac gaaggcggcg aggttccggg cggtcttgcg tccctgtgcc   4800
gtgagcagcc cgcgtatgta ctgctcacct cttctgcgct ggtccgcccg gcggagcgaa   4860
ccgagtaact ccgcacatgc gtcggagacg agcgagtcga agtcgtgccg cgcggcggga   4920
cccacggggg gcgccgcgcc ggcgggtcga agcgtgcgta aggtcatagg agtcctcgtg   4980
ggggcctcgt catcactgcg agtggactgc gaccagcatc gccaattcac ccgttgctcc   5040
ccaggtacac cgggcacact cgttccgctt cgctcccccg gcggcacggc ccgcgtgtgg   5100
agcactcccc gctctccgga cggtgggggg gaagcccacc gcacgcgcgc cggtagcggt   5160
gccggggccc cacaacccct caccgacggg gtccgttcga ccacatgccg tgatgatgcc   5220
ttcgccgcac ggcctccttg aatgacggac cgtcagaaag acgtcactcc gcgcgcgccc   5280
gctcccgccc cgaccccgcc cggccgccgt cccgcccccg cgaccctgtg ggccgacgcc   5340
ctcttgacgg acccggaatc ccgggccgcg ggacgggacg gcgaggaact cgatgccgca   5400
aaggttccgc gtcctcaccg gcacctccga gatccagcgc aacggcatcg ccaagctcct   5460
ggctttccac cactgagccg caccccctgg cgagcagatc cgggacaaga cgccaccttc   5520
gcgacagtgt ttaggaaaag ttaagtaaag aattccgcga gcggattgcc agggagaaca   5580
acccattgac gcgcaccggt gcagcggcca cattgacggc acctgtcaag ttcaccccca   5640
ggagcttgga atcccatgca ggcaattcgg catcacgtca tgctcgtcat ggccttcgtg   5700
accgtcgcca cgactttcct tctctggccg tcgacgcaat ccgcgcaagc gtttcccccg   5760
accccgaagc agacggtact gaaccacctc cgcgccattt ccgggaatca catcgtctcc   5820
ggacagcaca acaaggagcc cgcctccgcc ccgggccagt acacccagca ggtcaaggac   5880
gtcaccgggc agtaccccgg cctgtggggc ggtgacctga tgttcgccgc ggcggacgtg   5940
gccggccgcc agcgcgtcgt cgaccaggcc aggaccgagt gggcgaacgg atcgctggtc   6000
tcgctcacct ggcacgtctg cccgccgacc ggcggcagca cctgtgcgtt cgagggcggc   6060
gtcaagtcca cgctgacgaa cgcgcagttc tcgcaggtcc tcacggaggg cagtgccctg   6120
aacagcgcat ggaagcggcg cctggacgag gtcgtcccgt acctgcagca gctggagaac   6180
gcgggcgtcc ccgtcctctt ccggccgctg cacgagatga acgaatcctg gaactggtgg   6240
ggaaaccggc ccggagcgaa cggcagcgca cgcctctacc agatcacccg cgatcacctc   6300
gccgggacga aagggctgga caatctgatc tgggtctgga acgtccagga caatccggcg   6360
ggaaactgga acagctacta tccgggagat cagtacgtgg acgtcgtttc gctggacgtc   6420
tggtacaaga gccacccgag ttccgccgac taccagcaga tgcggagcat cgcgggaaca   6480
aaacccatgg ccctcgcgga gctgggcaaa atgccgaccg ccgcgctgct ggacagccag   6540
acgcggtgga catggttcat gatgtggtcc gagcatctgc gcgggaacaa ttccaacgcc   6600
gaaatacaga cggcgtattt ccacccccgt gtactgaacc agggggaggt cgcactgccc   6660
tgacgctcgg cgctgcccgg ctctctcacg cgcgttctga caggacgtcg cggagagtgc   6720
ggggcaagcg gccggtgagc tgggcgcagt cgtcgcggac ccgatcccag cgctgttcgc   6780
gtaccgaggc gaacagggag gagaaggcgt agagccacca gggatccagg ccggtcgccg   6840
ctgtttcggc agagtacgtg tcggccggga tgtccacgta ggcgaccggt gtccgccaca   6900
cctccgccgc cgtggaggcg atgcctgcca ggtccgtcga ctcgggtccc gtgatgtcgt   6960
ggtgacggcc ggtcggcccg cccaccgcga gggcggcgag ggcgcgggcc acgtcgtcgc   7020
gcgccaccag ggacacccgg ccatcggctg ccggcagcct cagcagcccg gtcgagcgcg   7080
cctgggtgag ccagcctagg aagaactcga tgtacagcga ggccctggcg aacgagcacg   7140
gcacgccgga ggcgagcagc agatcctcgg tgagccggtt gacgacggcg tagcagaacg   7200
gggaggccga gtcggcgtcg acgctgctca gtgccgcgac atggccgacg cgctcggcca   7260
ccacggcggc gacgacgttg cggtggtgca gcagcacccg tgcgtcgggc ccgtcgctgg   7320
agacgaggac cagagtgtcc acgcccttca gcgccgcacg cagagcgggc gggtcggcgt   7380
agtcggcgac ggcgcactcc acccccggcg gtagtgcctc ggcaggcagc ttccgcctgg   7440
tcatcgccac gacgtccacg tcggcccggt ccgcgagcag ctgcaccacc cgcctgccca   7500
gactgcccgc cgcccctgtc accgcgatac gcatcgtcgc ccccgtcgcc ttgtcgtcgg   7560
tcgtaccacc gtagggggcc aaccgcgacc agggcttgga acgagccggc ccgccagggc   7620
acagacgcgc gatcggtccg gttttcccgt gctcttttgg accgggacgc cggaccgctt   7680
cctttctacg gtggagccgt tcccgcccga gcccgcacgt catcgacgtg cggggaagac   7740
agaggtgata ccgatgctcc gacgccgtct cggagggccg tcaggccccc tcgtcagtgc   7800
cctgtgcctg ggcgcgatgc ccttcggcac caccgtcgac gagaagacgt ccttcgccat   7860
cctcgaccgg ttcgtcgagg ccggcggcag tctcgtcgac accgccgaca actacgcgtt   7920
ctgggctccc ggcgggaccg gggacgagag cgagaacacc gtcgggcgct ggctggcgag   7980
ccgccgccgc cgcgacgagg tggtgatctc caccaaggtg ggtgcccgcc ccaccgtccc   8040
cggcagcggc ctggagaccg ccgaagggct gtcggctccc gtcatacgga aggccgcgga   8100
ggacagcctg cgacgcctgg gcaccgatcg catcgatctg tactggaccc acatcgagga   8160
ccggaccgtc cctctggagg agacgctcgg agctctcgac gagctggtcg gcggcggcaa   8220
ggtggcggtg ctgggctgct ccaaccacgc gggctggcgc atcgaacggg cccgcgcgct   8280
cgcccggacc aacggctgga cggcgtacac ctgcgtccag cagcgctact cctaccttca   8340
gccgcgcttc gacgtcggac tgccggagag cggacacgtc cacgcgacct ccgaactcct   8400
cgaccacgta cgcagcgagc ccgacctgac gctgctggcc tactcgtccc tgctctcggg   8460
cgcgtacacc cggccggaca agaccctgtc cgccgcctac gaccacccgg gcaccgggca   8520
gcggctgacc gtgctgcggg aggtggccgc cgagctcggt gccaccgcca accaggtggt   8580
gctgtcctgg ttgctcggag gtgatccgcc ggtgatcccg atcgtggggg tgagttccgt   8640
cgagcagctg gacgaggtgc tggccgccgt cgagctggag ctgccccggg agacgagggc   8700
acggctggac ctcgccgggc ggggctgacg ggccacacac cgcccctcgc ccgggacggg   8760
ctgaccggcc gcacaccgtc cctcagccgg gacgggctga cggccacaca cccgcccctc   8820
agcccggctg ggctgggctg acggccacac acccgctcct cagcccggct gggctgggct  8880
gacggccaca cacccgcccc tcagcccggc tgggctgggc tgacggccac acgccgtccc  8940
tcgcccgggt cgggctgacc agccacacgc cgtccctcag tcggcccgct ccccggcccg  9000
cccggcgtcg acgtgccgcc ggtcgtggcg ccgggccgcg tcgatggcct gtgccaggcg  9060
ccgcacggct ccgggcacgg cgtggtccgc cagattgccg tagccgagga ccagcgcggg  9120
gccggcggcg gccacggccc gcgccccgcc ggagtcgccg gcccgggccg tcgggtggtg  9180
ctcggcccgc gccatccggt aggcgtcgag atccgccagc ctcacgtcac gccgcgccgc  9240
ctccctgacg acggtgggcg ccgagcagtc cgtcagggac agcagcaggt ggaagccggc  9300
cgccgcaccg gacacctgga accccggcag cgacgccgcg agttctccca tgaggtgatc  9360
gcggcgccgt ttgtagcgca gccgtgccgc ccgcaggtac cggtcgtagg acccgcgggc  9420
caggaaccgg gcgaacgcct cctggtcgat gacgggcggt ggtacgcccc cgacgtgctc  9480
cgcgcccagg gcctcggtcc agcgcggcgg ggtcaccgcc cagccgatcc gcagggccgg  9540
cgagagcgtc ttgctgaccg accccagcag cgcgacgtgc tccggtgcca tgccctgcag  9600
ggcgcccacg gggtggcggt cgtatcggaa ctcggcgtcg tagtcgtcct ccagcaccag  9660
gccgtcgacc tcgcgggccc aggcgaccag ctcgccgcga cgggccgggg cgaggaccac  9720
accggtcggg aactggtggg cgggagcgac gatcaccgac cggacctgag gcgcgcgccg  9780
cagcaggtcg acccgcaggc cgtcgccgtc cacgggaacc gggacgggca ccagcccctc  9840
cgccccgacc gtggcgctca gccgcgacca gccagggtcc tccagggcca tgtgggtgtg  9900
gccctcggtc cgcaggaccc ggcacagcct gcgcaccgcg tccagcgtgc ccgcgcagac  9960
gacgagctgc cgggcttcca gcgacgcgcc gcgtccccgc acgaggtagg ccgcgagccg  10020
ctgccggagc cgggcgagac cggccggatc ggggtagccg agctcgcccc aggtcagtgc  10080
gccggtggcc tcccgcaccg cgtccgccca ccgtccgcgg ggaaaggccc gcaggtcggg  10140
tatgccgggc agcatgtcga actccggctc ccaccgcgta ccgacgtccg cctcgggcgt  10200
caccggagcg gggacggcct gcgccctgac ccgggtggcc gagccgctgc gcgcctccag  10260
gtacccctcc gcgacgagct gcgcgtaggc ctccgtcacc acccaccgcg agcagcccag  10320
gtccgccgcc agcgccctgc tcggcggcag cgcgctgccg gaggcgatcc gcccaccggt  10380
caccgccgcc cgcagggcac ggctcagccg gacgtgcagc gggccgtccg ccggcccgcc  10440
cagttcgaga aaggttcccc atgccgggtc ggtccggtcg tcgcccacgg cagccgatgc  10500
tacccaccgc cccgcgacgg ccgggcggcg gcgtccacgg gcccggtgca cactggatgg  10560
cgtggcggag acggaccggc atctcgacca gcggctggag caggccatca tggacctgct  10620
ggagcgacgg gcggccactg cctcgatctg tccgtccgac gccgcgcgtc gggtccacga  10680
gggtgacgac gagggctggc gagccctgct ggaacccgcg cgccgagcgg cctggcgtct  10740
ggtggggtcc ggcgaggtcg aggtgaccca ggccggccgg cccgtcacgc aggccgaggc  10800
ccgcgggccc gtccgcattc gtcgggcggg ttcctgacgg ctcgatccga aggcggaact  10860
cccgtgcccc ggcggcacgg gagctcgacg ccgggaggtc agcgccgcag ggtgagcaca  10920
cccggccgcc acggcagctg gtcgtagggg ccgcccgcgg tgggtgactt gccctggtag  10980
aggaaccgca ggttgcaggg gtcgacggtc atggtctggt cggggttgtc gcggaccagg  11040
tcaccgtggc tgatgtcgtt ggtccaggtg gccccgctgt tggccttgcc cgcgaagggg  11100
ttgctctcgc tcgcggcctg cggggtccac gagccgctca ggctggaggc cgtgaaggaa  11160
cggaagtagc gtccgttcgc gcccatcgcc tcgacgatca tcaggtactg gttctggccc  11220
tgaaccttgt agacctgcac gccctcgaac aggttggcct tcgtgtcgct catgatcgtc  11280
gtgtacgacg agccgaagct gcccgggaag ttcccgatcg gcatgctcgc ccggtagatc  11340
ttgccgttgt caccggcgaa gaacaggtac atgttctgtc cgtcggcgat cagggtctgg  11400
tcgatcgggc cggtgtcgga tcctgagatg ctcccggtga acaacggctg cggagccgac  11460
cagccgttgg ggttggccgg gtcgctggac gtgcggtaga cgaagggcca cgcgccccac 11520
tggtacgcca gcacccagac gttcttgggc gcgaagtaga acagggtggg cgccaccgcc 11580
gcctgactca tcccggtctg gccggccgac gccatgtccg accagttcgt gaaggggctg 11640
aacatcatcg agccgtagga cgaccccgac acgttcgacg cgtagaccag gtgcttgccg 11700
ttgtgggtca cggtggtgaa gtccttgacc gccgcccacc cgttcgccgg ctgcgccagc 11760
acacccgtcg acgaccaccg gtacgccgac ggaagggcac acgccccgtc cgtcgggggc 11820
gtcccggtca ggccggacca cttctgcccg ctgccaccga cgcacgtccc gatctgcacc 11880
gccgtgccgt tggccgtacc ggcgcccgcg gcctccaggc acagcccgga ctccacgccg 11940
acgaccgtgc cgtcggagtt cacccgccac tgctggttcg caccgccgga acagctccag 12000
atctgcaccc gcgtcccggg tgtggtggcg tgacccggaa cgtccaggca cttgttgccg 12060
tacacggtca gccgacggtc gtccgtcaac gtccactgct gattgctccc gccccagcag 12120
tcgtatatct gcag                                                   12134
<210>141
<211>1164
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1164)
<400>141
atg acc tta cgc acg ctt cga ccc gcc ggc gcg gcg ccc ccc gtg ggt    48
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly
1               5                   10                  15
ccc gcc gcg cgg cac gac ttc gac tcg ctc gtc tcc gac gca tgt gcg    96
Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala
            20                  25                  30
gag tta ctc ggt tcg ctc cgc cgg gcg gac cag cgc aga aga ggt gag    144
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu
       35                  40                  45
cag tac ata cgc ggg ctg ctc acg gca cag gga cgc aag acc gcc cgg    192
Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg
   50                  55                  60
aac ctc gcc gcc ttc gtc gga gag ggc gcg gcg gaa cag agc ctg cac    240
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His
65                  70                  75                  80
cac ttc gtc gcc ggg tcg acc tgg gac tgg ggc gag gtg cgg gcc gcg    288
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala
               85                  90                  95
ctg gcc cgc tac gtg gac gac agg ctg acc ccc gac gcc tgg gtg atc    336
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile
           100                 105                 110
tgg ccg atg gtg gtc tcc aag gcg ggg gtg cgc tcc gtc ggg gtg agc    384
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser
       115                 120                 125
cgg cgc ttc gtc tcc gac ctg ggc cgg gtg gtg agc tgc cag cag agt    432
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser
   130                 135                 140
cac ggg ctg tgg ctg gcc tcg ggc acg acg gcc gcc ccg gtc agc tgg    480
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp
145                 150                 155                 160
cgc ctg acg ctg ggc ggc ggc cgg agc ggg gag ggc aca ccc cgg cac    528
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His
               165                 170                 175
ccc ggc gca ccc ggt gag gag gag aac atc gtc cgc ctg gtg gcc gaa    576
Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu
           180                 185                 190
gcc gct cag gcc aac cgc tcc ttg gcc cgc ccc gtg gtg atg gac gca    624
Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala
       195                 200                 205
cgc gcg gcc gtg ctg cca cga ctg gtg cga ggg ctc ggt ctc gcg ggc    672
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly
    210                 215                 220
ctg ccc ttc atg gtg cgg gtg ggc ggg aac ctc cgg ctg gcc tcg gcg    720
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala
225                 230                 235                 240
agc ggc cgc ggc ccg gtg gac cac cac acg ggg acc acc tcg gcc cag    768
Ser Gly Arg GLy Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln
                245                 250                 255
cag ttg atg gag cag ctc aag cgg ttg agc cgc ccc gtg gag ttg cgg    816
Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg
            260                 265                 270
ggc tcc ctc agc ctc gtc gcc ccg cac ccc gtc gtc ctg ccg ggt gtg    864
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val
        275                 280                 285
gtc ccg agg cgg acg ctg acg ctg ctg ggg gtg tgg cgg ggc aac cgc    912
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Val Trp Arg Gly Asn Arg
    290                 295                 300
cgg cgc ccc gcc gac ctg tgg ctg acc gac ctc acg tcc tgg gac cgc    960
Arg Arg Pro Ala Asp Leu Trp Leu Thr Asp Leu Thr Ser Trp Asp Arg
305                 310                 315                 320
ggc gcc ctg ctg cgg ctg gcg atg ctc acc gaa cag gtc gac gcc gac    1008
Gly Ala Leu Leu Arg Leu Ala Met Leu Thr Glu Gln Val Asp Ala Asp
                325                 330                 335
ttc gac cgg gtg agc gtg ggc gtg ggc atg cgc gac ttc gaa gga cgg    1056
Phe Asp Arg Val Ser Val Gly Val Gly Met Arg Asp Phe Glu Gly Arg
            340                 345                 350
tcg ttc cag ggc tgg cac cgg cac gtg acc ctg gcg tcc atc gcc cac    1104
Ser Phe Gln Gly Trp His Arg His Val Thr Leu Ala Ser Ile Ala His
        355                 360                 365
acg ctg cgg ctg gcg cag ccc tcc gcg cgc ggc gac ctc ggt ggg gcg    1152
Thr Leu Arg Leu Ala Gln Pro Ser Ala Arg Gly Asp Leu Gly Gly Ala
    370                 375                 380
acg gcg gtg tga                                                     1164
Thr Ala Val
385
<210>142
<211>387
<212>PRT
<213>生二素链霉菌
<400>142
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly
1               5                   10                  15
Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala
            20                  25                  30
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu
        35                  40                  45
Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg
    50                  55                  60
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His
65                  70                  75                  80
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala
                85                  90                  95
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile
            100                 105                 110
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser
        115                 120                 125
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser
    130                 135                 140
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp
145                 150                 155                 160
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His
                165                 170                 175
Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu
            180                 185                 190
Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala
        195                 200                 205
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly
    210                 215                 220
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala
225                 230                 235                 240
Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln
                245                 250                 255
Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg
            260                 265                 270
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val
        275                 280                 285
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Val Trp Arg Gly Asn Arg
    290                 295                 300
Arg Arg Pro Ala Asp Leu Trp Leu Thr Asp Leu Thr Ser Trp Asp Arg
305                 310                 315                 320
Gly Ala Leu Leu Arg Leu Ala Met Leu Thr Glu Gln Val Asp Ala Asp
                325                 330                 335
Phe Asp Arg Val Ser Val Gly Val Gly Met Arg Asp Phe Glu Gly Arg
            340                 345                 350
Ser Phe Gln Gly Trp His Arg His Val Thr Leu Ala Ser Ile Ala His
        355                 360                 365
Thr Leu Arg Leu Ala Gln Pro Ser Ala Arg Gly Asp Leu Gly Gly Ala
    370                 375                 380
Thr Ala Val
385
<210>143
<211>849
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(849)
<400>143
atg cgt atc gcg gtg aca ggg gcg gcg ggc agt ctg ggc agg cgg gtg    48
Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val
1               5                   10                  15
gtg cag ctg ctc gcg gac cgg gcc gac gtg gac gtc gtg gcg atg acc    96
Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr
            20                  25                  30
agg cgg aag ctg cct gcc gag gca cta ccg ccg ggg gtg gag tgc gcc    144
Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala
        35                  40                  45
gtc gcc gac tac gcc gac ccg ccc gct ctg cgt gcg gcg ctg aag ggc    192
Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly
    50                  55                  60
gtg gac act ctg gtc ctc gtc tcc agc gac ggg ccc gac gca cgg gtg    240
Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val
65                  70                  75                  80
ctg ctg cac cac cgc aac gtc gtc gcc gcc gtg gtg gcc gag cgc gtc    288
Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val
                85                  90                  95
ggc cat gtc gcg gca ctg agc agc gtc gac gcc gac tcg gcc tcc ccg    336
Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro
            100                 105                 110
ttc tgc tac gcc gtc gtc aac cgg ctc acc gag gat ctg ctg ctc gcc    384
Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala
        115                 120                 125
tcc ggc gtg ccg tgc tcg ttc gcc agg gcc tcg ctg tac atc gag ttc    432
Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe
    130                 135                 140
ttc cta ggc tgg ctc acc cag gcg cgc tcg acc ggg ctg ctg agg ctg    480
Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu
145                 150                 155                 160
ccg gca gcc gat ggc cgg gtg tcc ctg gtg gcg cgc gac gac gtg gcc    528
Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala
                165                 170                 175
cgc gcc ctc gcc gcc ctc gcg gtg ggc ggg ccg acc ggc cgt cac cac    576
Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His
            180                 185                 190
gac atc acg gga ccc gag tcg acg gac ctg gca ggc atc gcc tcc acg    624
Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr
        195                 200                 205
gcg gcg gag gtg tgg cgg aca ccg gtc gcc tac gtg gac atc ccg gcc    672
Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala
    210                 215                 220
gac acg tac tct gcc gaa aca gcg gcg acc ggc ctg gat ccc tgg tgg    720
Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp
225                 230                 235                 240
ctc tac gcc ttc tcc tcc ctg ttc gcc tcg gta cgc gaa cag cgc tgg    768
Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp
                245                 250                 255
gat cgg gtc cgc gac gac tgc gcc cag ctc acc ggc cgc ttg ccc cgc    816
Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg
            260                 265                 270
act ctc cgc gac gtc ctg tca gaa cgc gcg tga                        849
Thr Leu Arg Asp Val Leu Ser Glu Arg Ala
        275                 280
<210>144
<211>282
<212>PRT
<213>生二素链霉菌
<400>144
Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val
1               5                   10                  15
Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr
            20                  25                  30
Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala
        35                  40                  45
Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly
    50                  55                  60
Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val
65                  70                  75                  80
Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val
                85                  90                  95
Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro
            100                 105                 110
Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala
        115                 120                 125
Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe
    130                 135                 140
Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu
145                 150                 155                 160
Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala
                165                 170                 175
Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His
            180                 185                 190
Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr
        195                 200                 205
Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala
    210                 215                 220
Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp
225                 230                 235                 240
Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp
                245                 250                 255
Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg
            260                 265                 270
Thr Leu Arg Asp Val Leu Ser Glu Arg Ala
        275                 280
<210>145
<211>1512
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1512)
<400>145
gtg ggc gac gac cgg acc gac ccg gca tgg gga acc ttt ctc gaa ctg    48
Val Gly Asp Asp Arg Thr Asp Pro Ala Trp Gly Thr Phe Leu Glu Leu
1               5                   10                  15
ggc ggg ccg gcg gac ggc ccg ctg cac gtc cgg ctg agc cgt gcc ctg    96
Gly Gly Pro Ala Asp Gly Pro Leu His Val Arg Leu Ser Arg Ala Leu
            20                  25                  30
cgg gcg gcg gtg acc ggt ggg cgg atc gcc tcc ggc agc gcg ctg ccg    144
Arg Ala Ala Val Thr Gly Gly Arg Ile Ala Ser Gly Ser Ala Leu Pro
        35                  40                  45
ccg agc agg gcg ctg gcg gcg gac ctg ggc tgc tcg cgg tgg gtg gtg    192
Pro Ser Arg Ala Leu Ala Ala Asp Leu Gly Cys Ser Arg Trp Val Val
    50                  55                  60
acg gag gcc tac gcg cag ctc gtc gcg gag ggg tac ctg gag gcg cgc    240
Thr Glu Ala Tyr Ala Gln Leu Val Ala Glu Gly Tyr Leu Glu Ala Arg
65                  70                  75                  80
agc ggc tcg gcc acc cgg gtc agg gcg cag gcc gtc ccc gct ccg gtg    288
Ser Gly Ser Ala Thr Arg Val Arg Ala Gln Ala Val Pro Ala Pro Val
                85                  90                  95
acg ccc gag gcg gac gtc ggt acg cgg tgg gag ccg gag ttc gac atg    336
Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp Met
            100                 105                 110
ctg ccc ggc ata ccc gac ctg cgg gcc ttt ccc cgc gga cgg tgg gcg    384
Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp Ala
        115                 120                 125
gac gcg gtg cgg gag gcc acc ggc gca ctg acc tgg ggc gag ctc ggc    432
Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu Gly
    130                 135                 140
tac ccc gat ccg gcc ggt ctc gcc cgg ctc cgg cag cgg ctc gcg gcc    480
Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala Ala
145                 150                 155                 160
tac ctc gtg cgg gga cgc ggc gcg tcg ctg gaa gcc cgg cag ctc gtc    528
Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu Val
                165                 170                 175
gtc tgc gcg ggc acg ctg gac gcg gtg cgc agg ctg tgc cgg gtc ctg    576
Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val Leu
            180                 185                 190
cgg acc gag ggc cac acc cac atg gcc ctg gag gac cct ggc tgg tcg    624
Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp Ser
        195                 200                 205
cgg ctg agc gcc acg gtc ggg gcg gag ggg ctg gtg ccc gtc ccg gtt    672
Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro Val
    210                 215                 220
ccc gtg gac ggc gac ggc ctg cgg gtc gac ctg ctg cgg cgc gcg cct    720
Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala Pro
225                 230                 235                 240
cag gtc cgg tcg gtg atc gtc gct ccc gcc cac cag ttc ccg acc ggt    768
Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr Gly
                245                 250                 255
gtg gtc ctc gcc ccg gcc cgt cgc ggc gag ctg gtc gcc tgg gcc cgc    816
Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala Arg
            260                 265                 270
gag gtc gac ggc ctg gtg ctg gag gac gac tac gac gcc gag ttc cga    864
Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe Arg
        275                 280                 285
tac gac cgc cac ccc gtg ggc gcc ctg cag ggc atg gca ccg gag cac    912
Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu His
    290                 295                 300
gtc gcg ctg ctg ggg tcg gtc agc aag acg ctc tcg ccg gcc ctg cgg    960
Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu Arg
305                 310                 315                 320
atc ggc tgg gcg gtg acc ccg ccg cgc tgg acc gag gcc ctg ggc gcg    1008
Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly Ala
                325                 330                 335
gag cac gtc ggg ggc gta cca ccg ccc gtc atc gac cag gag gcg ttc    1056
Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala Phe
            340                 345                 350
gcc cgg ttc ctg gcc cgc ggg tcc tac gac cgg tac ctg cgg gcg gca    1104
Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala Ala
        355                 360                 365
cgg ctg cgc tac aaa cgg cgc cgc gat cac ctc atg gga gaa ctc gcg    1152
Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu Ala
    370                 375                 380
gcg tcg ctg ccg ggg ttc cag gtg tcc ggt gcg gcg gcc ggc ttc cac    1200
Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe His
385                 390                 395                 400
ctg ctg ctg tcc ctg acg gac tgc tcg gcg ccc acc gtc gtc agg gag    1248
Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg Glu
                405                 410                 415
gcg gcg cgg cgt gac gtg agg ctg gcg gat ctc gac gcc tac cgg atg    1296
Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg Met
            420                 425                 430
gcg cgg gcc gag cac cac ccg acg gcc cgg gcc ggc gac tcc ggc ggg    1344
Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly Gly
        435                 440                 445
gcg cgg gcc gtg gcc gcc gcc ggc ccc gcg ctg gtc ctc ggc tac ggc    1392
Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr Gly
    450                 455                 460
aat ctg gcg gac cac gcc gtg ccc gga gcc gtg cgg cgc ctg gca cag    1440
Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala Gln
465                 470                  475                480
gcc atc gac gcg gcc cgg cgc cac gac cgg cgg cac gtc gac gcc ggg    1488
Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala Gly
                485                 490                 495
cgg gcc ggg gag cgg gcc gac tga                                    1512
Arg Ala Gly Glu Arg Ala Asp
            500
<210>146
<211>503
<212>PRT
<213>生二素链霉菌
<400>146
Val Gly Asp Asp Arg Thr Asp Pro Ala Trp Gly Thr Phe Leu Glu Leu
1               5                   10                  15
Gly Gly Pro Ala Asp Gly Pro Leu His Val Arg Leu Ser Arg Ala Leu
            20                  25                  30
Arg Ala Ala Val Thr Gly Gly Arg Ile Ala Ser Gly Ser Ala Leu Pro
        35                  40                  45
Pro Ser Arg Ala Leu Ala Ala Asp Leu Gly Cys Ser Arg Trp Val Val
    50                  55                  60
Thr Glu Ala Tyr Ala Gln Leu Val Ala Glu Gly Tyr Leu Glu Ala Arg
65                  70                  75                  80
Ser Gly Ser Ala Thr Arg Val Arg Ala Gln Ala Val Pro Ala Pro Val
                85                  90                  95
Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp Met
            100                 105                 110
Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp Ala
        115                 120                 125
Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu Gly
    130                 135                 140
Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala Ala
145                 150                 155                 160
Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu Val
                165                 170                 175
Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val Leu
            180                 185                 190
Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp Ser
        195                 200                 205
Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro Val
    210                 215                 220
Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala Pro
225                 230                 235                 240
Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr Gly
                245                 250                 255
Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala Arg
            260                 265                 270
Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe Arg
        275                 280                 285
Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu His
    290                 295                 300
Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu Arg
305                 310                 315                 320
Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly Ala
                325                 330                 335
Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala Phe
            340                 345                 350
Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala Ala
        355                 360                 365
Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu Ala
    370                 375                 380
Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe His
385                 390                 395                 400
Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg Glu
                405                 410                 415
Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg Met
            420                 425                 430
Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly Gly
        435                 440                 445
Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr Gly
    450                 455                 460
Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala Gln
465                 470                 475                 480
Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala Gly
                485                 490                 495
Arg Ala Gly Glu Arg Ala Asp
            500
<210>147
<211>276
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(276)
<400>147
gtg gcg gag acg gac cgg cat ctc gac cag cgg ctg gag cag gcc atc    48
Val Ala Glu Thr Asp Arg His Leu Asp Gln Arg Leu Glu Gln Ala Ile
1               5                   10                  15
atg gac ctg ctg gag cga cgg gcg gcc act gcc tcg atc tgt ccg tcc    96
Met Asp Leu Leu Glu Arg Arg Ala Ala Thr Ala Ser Ile Cys Pro Ser
            20                  25                  30
gac gcc gcg cgt cgg gtc cac gag ggt gac gac gag ggc tgg cga gcc    144
Asp Ala Ala Arg Arg Val His Glu Gly Asp Asp Glu Gly Trp Arg Ala
        35                  40                  45
ctg ctg gaa ccc gcg cgc cga gcg gcc tgg cgt ctg gtg ggg tcc ggc    192
Leu Leu Glu Pro Ala Arg Arg Ala Ala Trp Arg Leu Val Gly Ser Gly
    50                  55                  60
gag gtc gag gtg acc cag gcc ggc cgg ccc gtc acg cag gcc gag gcc    240
Glu Val Glu Val Thr Gln Ala Gly Arg Pro Val Thr Gln Ala Glu Ala
65                  70                  75                  80
cgc ggg ccc gtc cgc att cgt cgg gcg ggt tcc tga                    276
Arg Gly Pro Val Arg Ile Arg Arg Ala Gly Ser
                85                  90
<210>148
<211>91
<212>PRT
<213>生二素链霉菌
<400>148
Val Ala Glu Thr Asp Arg His Leu Asp Gln Arg Leu Glu Gln Ala Ile
1               5                   10                  15
Met Asp Leu Leu Glu Arg Arg Ala Ala Thr Ala Ser Ile Cys Pro Ser
            20                  25                  30
Asp Ala Ala Arg Arg Val His Glu Gly Asp Asp Glu Gly Trp Arg Ala
        35                  40                  45
Leu Leu Glu Pro Ala Arg Arg Ala Ala Trp Arg Leu Val Gly Ser Gly
    50                  55                  60
Glu Val Glu Val Thr Gln Ala Gly Arg Pro Val Thr Gln Ala Glu Ala
65                  70                  75                  80
Arg Gly Pro Val Arg Ile Arg Arg Ala Gly Ser
                85                  90
<210>149
<211>1236
<212>DNA
<213>生二素链霉菌
<220>
<221>CDS
<222>(1)..(1236)
<400>149
ctg cag ata tac gac tgc tgg ggc ggg agc aat cag cag tgg acg ttg    48
Leu Gln Ile Tyr Asp Cys Trp Gly Gly Ser Asn Gln Gln Trp Thr Leu
1               5                   10                  15
acg gac gac cgt cgg ctg acc gtg tac ggc aac aag tgc ctg gac gtt    96
Thr Asp Asp Arg Arg Leu Thr Val Tyr Gly Asn Lys Cys Leu Asp Val
            20                  25                  30
ccg ggt cac gcc acc aca ccc ggg acg cgg gtg cag atc tgg agc tgt    144
Pro Gly His Ala Thr Thr Pro Gly Thr Arg Val Gln Ile Trp Ser Cys
        35                  40                  45
tcc ggc ggt gcg aac cag cag tgg cgg gtg aac tcc gac ggc acg gtc    192
Ser Gly Gly Ala Asn Gln Gln Trp Arg Val Asn Ser Asp Gly Thr Val
    50                  55                  60
gtc ggc gtg gag tcc ggg ctg tgc ctg gag gcc gcg ggc gcc ggt acg    240
Val Gly Val Glu Ser Gly Leu Cys Leu Glu Ala Ala Gly Ala Gly Thr
65                  70                  75                  80
gcc aac ggc acg gcg gtg cag atc ggg acg tgc gtc ggt ggc agc ggg    288
Ala Asn Gly Thr Ala Val Gln Ile Gly Thr Cys Val Gly Gly Ser Gly
                85                  90                  95
cag aag tgg tcc ggc ctg acc ggg acg ccc ccg acg gac ggg gcg tgt    336
Gln Lys Trp Ser Gly Leu Thr Gly Thr Pro Pro Thr Asp Gly Ala Cys
            100                 105                 110
gcc ctt ccg tcg gcg tac cgg tgg tcg tcg acg ggt gtg ctg gcg cag    384
Ala Leu Pro Ser Ala Tyr Arg Trp Ser Ser Thr Gly Val Leu Ala Gln
        115                 120                 125
ccg gcg aac ggg tgg gcg gcg gtc aag gac ttc acc acc gtg acc cac    432
Pro Ala Asn Gly Trp Ala Ala Val Lys Asp Phe Thr Thr Val Thr His
    130                 135                 140
aac ggc aag cac ctg gtc tac gcg tcg aac gtg tcg ggg tcg tcc tac    480
Asn Gly Lys His Leu Val Tyr Ala Ser Asn Val Ser Gly Ser Ser Tyr
145                 150                 155                 160
ggc tcg atg atg ttc agc ccc ttc acg aac tgg tcg gac atg gcg tcg    528
Gly Ser Met Met Phe Ser Pro Phe Thr Asn Trp Ser Asp Met Ala Ser
                165                 170                 175
gcc ggc cag acc ggg atg agt cag gcg gcg gtg gcg ccc acc ctg ttc    576
Ala Gly Gln Thr Gly Met Ser Gln Ala Ala Val Ala Pro Thr Leu Phe
            180                 185                 190
tac ttc gcg ccc aag aac gtc tgg gtg ctg gcg tac cag tgg ggc gcg    624
Tyr Phe Ala Pro Lys Asn Val Trp Val Leu Ala Tyr Gln Trp Gly Ala
        195                 200                 205
tgg ccc ttc gtc tac cgc acg tcc agc gac ccg gcc aac ccc aac ggc    672
Trp Pro Phe Val Tyr Arg Thr Ser Ser Asp Pro Ala Asn Pro Asn Gly
    210                 215                 220
tgg tcg gct ccg cag ccg ttg ttc acc ggg agc atc tca gga tcc gac    720
Trp Ser Ala Pro Gln Pro Leu Phe Thr Gly Ser Ile Ser Gly Ser Asp
225                 230                 235                 240
acc ggc ccg atc gac cag acc ctg atc gcc gac gga cag aac atg tac    768
Thr Gly Pro Ile Asp Gln Thr Leu Ile Ala Asp Gly Gln Asn Met Tyr
                245                 250                 255
ctg ttc ttc gcc ggt gac aac ggc aag atc tac cgg gcg agc atg ccg    816
Leu Phe Phe Ala Gly Asp Asn Gly Lys Ile Tyr Arg Ala Ser Met Pro
            260                 265                 270
atc ggg aac ttc ccg ggc agc ttc ggc tcg tcg tac acg acg atc atg    864
Ile Gly Asn Phe Pro Gly Ser Phe Gly Ser Ser Tyr Thr Thr Ile Met
        275                 280                 285
agc gac acg aag gcc aac ctg ttc gag ggc gtg cag gtc tac aag gtt    912
Ser Asp Thr Lys Ala Asn Leu Phe Glu Gly Val Gln Val Tyr Lys Val
    290                 295                 300
cag ggc cag aac cag tac ctg atg atc gtc gag gcg atg ggc gcg aac    960
Gln Gly Gln Asn Gln Tyr Leu Met Ile Val Glu Ala Met Gly Ala Asn
305                 310                 315                 320
gga cgc tac ttc cgt tcc ttc acg gcc tcc agc ctg agc ggc tcg tgg    1008
Gly Arg Tyr Phe Arg Ser Phe Thr Ala Ser Ser Leu Ser Gly Ser Trp
                325                 330                 335
acc ccg cag gcc gcg agc gag agc aac ccc ttc gcg ggc aag gcc aac    1056
Thr Pro Gln Ala Ala Ser Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn
            340                 345                 350
agc ggg gcc acc tgg acc aac gac atc agc cac ggt gac ctg gtc cgc    1104
Ser Gly Ala Thr Trp Thr Asn Asp Ile Ser His Gly Asp Leu Val Arg
        355                 360                 365
gac aac ccc gac cag acc atg acc gtc gac ccc tgc aac ctg cgg ttc    1152
Asp Asn Pro Asp Gln Thr Met Thr Val Asp Pro Cys Asn Leu Arg Phe
    370                 375                 380
ctc tac cag ggc aag tca ccc acc gcg ggc ggc ccc tac gac cag ctg    1200
Leu Tyr Gln Gly Lys Ser Pro Thr Ala Gly Gly Pro Tyr Asp Gln Leu
385                 390                 395                 400
ccg tgg cgg ccg ggt gtg ctc acc ctg cgg cgc tga                    1236
Pro Trp Arg Pro Gly Val Leu Thr Leu Arg Arg
                405                 410
<210>150
<211>411
<212>PRT
<213>生二素链霉菌
<400>150
Leu Gln Ile Tyr Asp Cys Trp Gly Gly Ser Asn Gln Gln Trp Thr Leu
1               5                   10                  15
Thr Asp Asp Arg Arg Leu Thr Val Tyr Gly Asn Lys Cys Leu Asp Val
            20                  25                  30
Pro Gly His Ala Thr Thr Pro Gly Thr Arg Val Gln Ile Trp Ser Cys
        35                  40                  45
Ser Gly Gly Ala Asn Gln Gln Trp Arg Val Asn Ser Asp Gly Thr Val
    50                  55                  60
Val Gly Val Glu Ser Gly Leu Cys Leu Glu Ala Ala Gly Ala Gly Thr
65                  70                  75                  80
Ala Asn Gly Thr Ala Val Gln Ile Gly Thr Cys Val Gly Gly Ser Gly
                85                  90                  95
Gln Lys Trp Ser Gly Leu Thr Gly Thr Pro Pro Thr Asp Gly Ala Cys
            100                 105                 110
Ala Leu Pro Ser Ala Tyr Arg Trp Ser Ser Thr Gly Val Leu Ala Gln
        115                 120                 125
Pro Ala Asn Gly Trp Ala Ala Val Lys Asp Phe Thr Thr Val Thr His
    130                 135                 140
Asn Gly Lys His Leu Val Tyr Ala Ser Asn Val Ser Gly Ser Ser Tyr
145                 150                 155                 160
Gly Ser Met Met Phe Ser Pro Phe Thr Asn Trp Ser Asp Met Ala Ser
                165                 170                 175
Ala Gly Gln Thr Gly Met Ser Gln Ala Ala Val Ala Pro Thr Leu Phe
            180                 185                 190
Tyr Phe Ala Pro Lys Asn Val Trp Val Leu Ala Tyr Gln Trp Gly Ala
        195                 200                 205
Trp Pro Phe Val Tyr Arg Thr Ser Ser Asp Pro Ala Asn Pro Asn Gly
    210                 215                 220
Trp Ser Ala Pro Gln Pro Leu Phe Thr Gly Ser Ile Ser Gly Ser Asp
225                 230                 235                 240
Thr Gly Pro Ile Asp Gln Thr Leu Ile Ala Asp Gly Gln Asn Met Tyr
                245                 250                 255
Leu Phe Phe Ala Gly Asp Asn Gly Lys Ile Tyr Arg Ala Ser Met Pro
            260                 265                 270
Ile Gly Asn Phe Pro Gly Ser Phe Gly Ser Ser Tyr Thr Thr Ile Met
        275                 280                 285
Ser Asp Thr Lys Ala Asn Leu Phe Glu Gly Val Gln Val Tyr Lys Val
    290                 295                 300
Gln Gly Gln Asn Gln Tyr Leu Met Ile Val Glu Ala Met Gly Ala Asn
305                 310                  315                320
Gly Arg Tyr Phe Arg Ser Phe Thr Ala Ser Ser Leu Ser Gly Ser Trp
                325                 330                 335
Thr Pro Gln Ala Ala Ser Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn
            340                 345                 350
Ser Gly Ala Thr Trp Thr Asn Asp Ile Ser His Gly Asp Leu Val Arg
        355                 360                 365
Asp Asn Pro Asp Gln Thr Met Thr Val Asp Pro Cys Asn Leu Arg Phe
    370                 375                 380
Leu Tyr Gln Gly Lys Ser Pro Thr Ala Gly Gly Pro Tyr Asp Gln Leu
385                 390                 395                 400
Pro Trp Arg Pro Gly Val Leu Thr Leu Arg Arg
                405                 410
<210>151
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸KF36
<400>151
ttgccgtagc cgaggaccag cg                                             22
<210>152
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸KF37
<400>152
cacatggccc tggaggaccctg                                              22
<210>153
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸KF42
<400>153
aagcttgtac ggcccacaga atgatgtcac                                     30
<210>154
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸KF43
<400>154
aagcttcgac taccttggtg atctcgcctt                                     30
<210>155
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸KF32
<400>155
caaccgcttg agctgctcca tcaactgctg ggccgaggta tcgcgcgcgc ttcgttcggg    60
acgaa                                                                65
<210>156
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸KF33
<400>156
tgggtcccgc cgcgcggcac gacttcgact cgctcgtcta tctgcctctt cgtcccgaag    60
caact                                                                65
<210>157
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR71
<400>157
cgtcatcgac gtgcggggaa gacagaggtg ataccgatga tcgcgcgcgc ttcgttcggg    60
acgaa                                                                65
<210>158
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     寡核苷酸EDR72
<400>158
gccagcacct cgtccagctg ctcgacggaa ctcaccccca tctgcctctt cgtcccgaag    60
caact                                                                65
<210>159
<211>66
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
    寡核苷酸KF52
<400>159
gatccgccag cctcacgtca cgccgcgccg cctccctgac atcgcgcgcg cttcgttcgg    60
gacgaa                                                             66
<210>160
<211>66
<212>DNA
<213>Artificial sequnce
<220>
<223>人工序列描述:
     寡核苷酸KF53
<400>160
gaggcggacg tcggtacgcg gtgggagccg gagttcgaca atctgcctct tcgtcccgaa  60
gcaact                                                             66
<210>161
<211>2540
<212>DNA
<213>生二素链霉菌
<400>161
ctgcagggcg cccacggggt ggcggtcgta tcggaactcg gcgtcgtagt cgtcctccag  60
caccaggccg tcgacctcgc gggcccaggc gaccagctcg ccgcgacggg ccggggcgag  120
gaccacaccg gtcgggaact ggtgggcggg agcgacgatc accgaccgga cctgaggcgc  180
gcgccgcagc aggtcgaccc gcaggccgtc gccgtccacg ggaaccggga cgggcaccag  240
cccctccgcc ccgaccgtgg cgctcagccg cgaccagcca gggtcctcca gggccatgtg  300
ggtgtggccc tcggtccgca ggacccggca cagcctgcgc accgcgtcca gcgtgcccgc  360
gcagacgacg agctgccggg cttccagcga cgcgccgcgt ccccgcacga ggtaggccgc  420
gagccgctgc cggagccggg cgagaccggc cggatcgggg tagccgagct cgccccaggt  480
cagtgcgccg gtggcctccc gcaccgcgtc cgcccaccgt ccgcggggaa aggcccgcag  540
gtcgggtatg ccgggcagca tgtcgaactc cggctcccac cgcgtaccga cgtccgcctc  600
gggcgtcacc ggagcgggga cggcctgcgc cctgacccgg gtggccgagc cgctgcgcgc    660
ctccaggtac ccctccgcga cgagctgcgc gtaggcctcc gtcaccaccc accgcgagca    720
gcccaggtcc gccgccagcg ccctgctcgg cggcagcgcg ctgccggagg cgatccgccc    780
accggtcacc gccgcccgca gggcacggct cagccggacg tgcagcgggc cgtccgccgg    840
cccgcccagt tcgagaaagg ttccccatgc cgggtcggtc cggtcgtcgc ccacggcagc    900
cgatgctacc caccgccccg cgacggccgg gcggcggcgt ccacgggccc ggtgcacact    960
ggatggcgtg gcggagacgg accggcatct cgaccagcgg ctggagcagg ccatcatgga    1020
cctgctggag cgacgggcgg ccactgcctc gatctgtccg tccgacgccg cgcgtcgggt    1080
ccacgagggt gacgacgagg gctggcgagc cctgctggaa cccgcgcgcc gagcggcctg    1140
gcgtctggtg gggtccggcg aggtcgaggt gacccaggcc ggccggcccg tcacgcaggc    1200
cgaggcccgc gggcccgtcc gcattcgtcg ggcgggttcc tgacggctcg atccgaaggc    1260
ggaactcccg tgccccggcg gcacgggagc tcgacgccgg gaggtcagcg ccgcagggtg    1320
agcacacccg gccgccacgg cagctggtcg taggggccgc ccgcggtggg tgacttgccc    1380
tggtagagga accgcaggtt gcaggggtcg acggtcatgg tctggtcggg gttgtcgcgg    1440
accaggtcac cgtggctgat gtcgttggtc caggtggccc cgctgttggc cttgcccgcg    1500
aaggggttgc tctcgctcgc ggcctgcggg gtccacgagc cgctcaggct ggaggccgtg    1560
aaggaacgga agtagcgtcc gttcgcgccc atcgcctcga cgatcatcag gtactggttc    1620
tggccctgaa ccttgtagac ctgcacgccc tcgaacaggt tggccttcgt gtcgctcatg    1680
atcgtcgtgt acgacgagcc gaagctgccc gggaagttcc cgatcggcat gctcgcccgg    1740
tagatcttgc cgttgtcacc ggcgaagaac aggtacatgt tctgtccgtc ggcgatcagg    1800
gtctggtcga tcgggccggt gtcggatcct gagatgctcc cggtgaacaa cggctgcgga    1860
gccgaccagc cgttggggtt ggccgggtcg ctggacgtgc ggtagacgaa gggccacgcg    1920
ccccactggt acgccagcac ccagacgttc ttgggcgcga agtagaacag ggtgggcgcc    1980
accgccgcct gactcatccc ggtctggccg gccgacgcca tgtccgacca gttcgtgaag    2040
gggctgaaca tcatcgagcc gtaggacgac cccgacacgt tcgacgcgta gaccaggtgc    2100
ttgccgttgt gggtcacggt ggtgaagtcc ttgaccgccg cccacccgtt cgccggctgc    2160
gccagcacac ccgtcgacga ccaccggtac gccgacggaa gggcacacgc cccgtccgtc    2220
gggggcgtcc cggtcaggcc ggaccacttc tgcccgctgc caccgacgca cgtcccgatc    2280
tgcaccgccg tgccgttggc cgtaccggcg cccgcggcct ccaggcacag cccggactcc    2340
acgccgacga ccgtgccgtc ggagttcacc cgccactgct ggttcgcacc gccggaacag    2400
ctccagatct gcacccgcgt cccgggtgtg gtggcgtgac ccggaacgtc caggcacttg    2460
ttgccgtaca cggtcagccg acggtcgtcc gtcaacgtcc actgctgatt gctcccgccc    2520
cagcagtcgt atatctgcag                                                2540

Claims (93)

1.编码参与螺旋霉素生物合成的多肽的多核苷酸,其中所述多核苷酸的序列为:
(a)序列SEQ ID No.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149之一,
(b)由序列(a)的变体组成的序列之一,
(c)由于遗传密码的简并性而衍生自序列(a)和(b)的序列之一。
2.在高严格条件下与至少一条权利要求1所述的多核苷酸杂交的多核苷酸。
3.多核苷酸,其与包含权利要求1所述的多核苷酸中的至少10,12,15,18,20至25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850或1900个连续核苷酸的多核苷酸呈现至少70%,80%,85%,90%,95%或98%的核苷酸同一性。
4.如权利要求2或3所述的多核苷酸,其分离自链霉菌属的细菌。
5.如权利要求2、3或4所述的多核苷酸,其编码参与大环内酯生物合成的蛋白质。
6.如权利要求2、3、4或5所述的多核苷酸,其编码的蛋白质所具有的活性与可与该多核苷酸杂交或与该多核苷酸呈现同一性的多核苷酸所编码的蛋白质的活性相似。
7.由权利要求1、2、3、4、5或6所述多核苷酸的表达而产生的多肽。
8.参与螺旋霉素生物合成的多肽,其中所述多肽的序列是:
(a)序列SEQ ID No.4,6,8,10,12,14,16,18,20,22,24,26,27,29,31,32,33,35,37,38,39,41,42,44,46,48,50,51,52,54,55,56,57,58,59,61,63,65,67,69,71,73,75,77,79,81,83,85,108,110,112,114,116,117,119,121,142,144,146,148和150之一,
(b)如(a)所定义的序列之一,其中在整个所述序列中已经进行了一个或多个氨基酸的替换、插入或删除而未影响其功能特性,
(c)由序列(a)和(b)的变体组成的序列之一。
9.多肽,其与包含权利要求8所述多肽中的至少10,15,20,30至40,50,60,70,80,90,100,120,140,160,180,200,220,240,260,280,300,320,340,360,380,400,420,440,460,480,500,520,540,560,580,600,620或640个连续氨基酸的多肽呈现至少70%,80%,85%,90%,95%或98%的氨基酸同一性。
10.如权利要求9所述的多肽,其分离自链霉菌属的细菌。
11.如权利要求9或10所述的多肽,其编码参与大环内酯生物合成的蛋白质。
12.如权利要求9、10或11所述的多肽,其具有的活性与与其具有同一性的多肽具有的活性相似。
13.重组DNA,其包含至少一条如权利要求1,2,3,4,5和6中任一项所述的多核苷酸。
14.如权利要求13所述的重组DNA,其中所述重组DNA包括于载体内。
15.如权利要求14所述的重组DNA,其中所述载体选自噬菌体、质粒、噬菌粒、整合型载体、fosmids、粘粒、穿梭载体、BAC和PAC。
16.如权利要求15所述的重组DNA,其选自pOS49.1,pOS49.11,pOSC49.12,pOS49.14,pOS49.16,pOS49.28,pOS44.1,pOS44.2,pOS44.4,pSPM5,pSPM7,pOS49.67,pOS49.88,pOS49.106,pOS49.120,pOS49.107,pOS49.32,pOS49.43,pOS49.44,pOS49.50,pOS49.99,pSPM17,pSPM21,pSPM502,pSPM504,pSPM507,pSPM508,pSPM509,pSPM1,pBXL1111,pBXL1112,pBXL1113,pSPM520,pSPM521,pSPM522,pSPM523,pSPM524,pSPM525,pSPM527,pSPM528,pSPM34,pSPM35,pSPM36,pSPM37,pSPM38,pSPM39,pSPM40,pSPM41,pSPM42,pSPM43,pSPM44,pSPM45,pSPM47,pSPM48,pSPM50,pSPM51,pSPM52,pSPM53,pSPM55,pSPM56,pSPM58,pSPM72,pSPM73,pSPM515,pSPM519,pSPM74,pSPM75,pSPM79,pSPM83,pSPM107,pSPM543和pSPM106。
17.表达载体,其包含至少一段编码如权利要求7,8,9,10,11或12中所述多肽的核酸序列。
18.表达系统,其包含适当的表达载体和允许一条或多条如权利要求7,8,9,10,11或12中所述多肽表达的宿主细胞。
19.如权利要求18中所述的表达系统,其选自原核表达系统和真核表达系统。
20.如权利要求19所述的表达系统,其选自在细菌大肠杆菌中表达的系统、允许在昆虫细胞中表达的杆状病毒表达系统、允许在酵母细胞中表达的表达系统和允许在哺乳动物细胞中表达的表达系统。
21.宿主细胞,其中已经导入了如权利要求1,2,3,4,5,6,13,14,15,16和17中任意一项所述的至少一条多核苷酸和/或至少一个重组DNA和/或至少一个表达载体。
22.产生如权利要求7,8,9,10,11或12所述多肽的方法,其中所述方法包括以下步骤:
a)将至少一种编码所述多肽的核酸插入适当的载体;
b)在适当的培养基中,培养预先用步骤a)的载体转化或转染的宿主细胞;
c)回收条件培养基或细胞提取物;
d)从步骤c)获得的所述培养基或细胞提取物分离并纯化所述多肽;
e)根据需要,表征所产生的重组多肽。
23.在至少一种大环内酯的生物合成途径步骤中受阻断的微生物。
24.如权利要求23所述的微生物,该微生物是通过在产生这种(这些)大环内酯的微生物中失活至少一种参与这种(这些)大环内酯生物合成的蛋白质的功能而获得的。
25.如权利要求24所述的微生物,其中这种(这些)蛋白质的失活是通过在编码所述蛋白质的基因中诱变或者通过表达一条或多条与编码所述蛋白质的信使RNA互补的反义RNA而实施的。
26.如权利要求25所述的微生物,其中这种(这些)蛋白质的失活是通过辐射诱变、通过诱变化学剂的作用、通过定点诱变或通过基因替换而实施的。
27.如权利要求25或26所述的微生物,其中一个或多个基因诱变是在体外或原位通过在所考虑的基因中进行一个或多个碱基的抑制、替换、删除和/或添加或者通过基因失活而实施的。
28.如权利要求23,24,25,26或27所述的微生物,其中所述微生物是链霉菌属细菌。
29.如权利要求23,24,25,26,27或28所述的微生物,其中大环内酯是螺旋霉素。
30.如权利要求23,24,25,26,27,28或29所述的微生物,其中所述微生物是生二素链霉菌菌株。
31.如权利要求23,24,25,26,27,28,29或30所述的微生物,其中诱变是在至少一个包含如权利要求1,2,3,4,5和6中任意一项所述的序列的基因中进行的。
32.如权利要求25,26,27,28,29,30或31所述的微生物,其中诱变是在一个或多个这样的基因中进行的,所述一个或多个基因包含对应于一个或多个序列SEQ ID No.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149的序列之一。
33.如权利要求25,26,27,28,29,30,31或32所述的微生物,其中诱变为对包含对应于序列SEQ ID No.13的序列的基因进行基因失活。
34.生二素链霉菌菌株,其选自:
-于2002年7月10日保藏在国立微生物保藏中心(CNCM)[NationalCollection of Cultures and Microorganisms]的保藏号为I-2909,I-2911,I-2912,I-2913,I-2914,I-2915,I-2916或I-2917的菌株之一;
-菌株SPM510。
35.制备大环内酯生物合成中间体的方法,其包括以下步骤:
a)在适当的培养基中,培养如权利要求23,24,25,26,27,28,29,30,31,32,33或34中任意一项所述的微生物,
b)回收条件培养基或细胞提取物,
c)从步骤b)中获得的所述培养基或细胞提取物中分离并纯化所述生物合成中间体。
36.制备衍生自大环内酯的分子的方法,其中根据权利要求35中所述的方法制备生物合成中间体,并修饰如此产生的中间体。
37.如权利要求36所述的制备方法,其中所述中间体经化学、生物化学、酶学和/或微生物学修饰。
38.如权利要求36或37所述的制备方法,其中将一个或多个这样的基因导入所述微生物,所述一个或多个基因编码能够通过利用中间体作为底物而修饰所述中间体的蛋白质。
39.如权利要求36,37或38所述的制备方法,其中大环内酯是螺旋霉素。
40.如权利要求36,37,38或39所述的制备方法,其中所用微生物是生二素链霉菌菌株。
41.微生物,其产生螺旋霉素I而不产生螺旋霉素II和III。
42.如权利要求41所述的微生物,其包含螺旋霉素I生物合成所需的全部基因,但是其中包含序列SEQ ID No.13或其变体之一、或由于遗传密码简并性而由其衍生的序列之一并编码序列SEQ ID No.14的多肽或其变体之一的基因是不表达的或者已经使其失活了。
43.如权利要求42所述的微生物,其中所述失活是通过在编码所述蛋白质的基因中诱变或者通过表达与编码所述蛋白质的信使RNA互补的反义RNA而实施的。
44.如权利要求43所述的微生物,其中所述诱变是在该基因的启动子中、编码序列中或非编码序列中进行的,从而使所编码的蛋白质失活或者阻止其表达或阻止由其翻译。
45.如权利要求43或44所述的微生物,其中诱变是通过辐射、通过化学诱变剂的作用、通过定点诱变或通过基因替换而进行的。
46.如权利要求43,44或45所述的微生物,其中诱变是在体外或原位通过在所考虑的基因中进行一个或多个碱基的抑制、替换、删除和/或添加或者通过基因失活而进行的。
47.如权利要求41或42所述的微生物,其中所述微生物是通过表达螺旋霉素生物合成途径的基因而获得的,其中所述基因不包括包含对应于SEQ ID No.13或其变体之一的序列、或由于遗传密码的简并性而由其衍生的序列之一并且编码序列SEQ ID No.14的多肽或其变体之一的基因。
48.如权利要求41,42,43,44,45,46或47所述的微生物,其中所述微生物是链霉菌属的细菌。
49.如权利要求41,42,43,44,45,46,47或48所述的微生物,其中所述微生物是从产生螺旋霉素I、II和III的起始菌株获得的。
50.如权利要求41,42,43,44,45,46,47,48或49所述的微生物,其是通过在包含对应于SEQ ID No.13或其变体之一的序列、或由于遗传密码简并性而由其衍生的序列之一,并且编码序列SEQ ID No.14的多肽或其具有相同功能的变体之一的基因中进行诱变获得的。
51.如权利要求41,42,43,44,45,46,47,48,49或50所述的微生物,其中所述微生物是从产生螺旋霉素I、II和III的生二素链霉菌菌株获得的,其中对含有对应于SEQ ID No.13的序列或由于遗传密码简并性而由其衍生的序列之一的基因进行了基因失活。
52.生二素链霉菌菌株,其为2002年7月10日保藏于国立微生物保藏中心(CNCM)的保藏号为I-2910的菌株。
53.产生螺旋霉素I的方法,其包括以下步骤:
(a)在适当的培养基中,培养如权利要求41,42,43,44,45,46,47,48,49,50,51和52中任意一项所述的微生物,
(b)回收条件培养基或细胞提取物,
(c)从步骤b)获得的所述培养基或细胞提取物中分离并纯化螺旋霉素I。
54.如权利要求1,2,3,4,5和6中任意一项所述的多核苷酸的用途,用于提高微生物的大环内酯产量。
55.产大环内酯的突变微生物,其在至少一个包含如权利要求1,2,3,4,5或6中任意一项所述序列的基因中具有遗传修饰和/或其过量表达至少一个包含如权利要求1,2,3,4,5或6中任意一项所述序列的基因。
56.如权利要求55中所述的突变微生物,其中遗传修饰由在所考虑的基因中的一个或多个碱基的抑制、替换、删除和/或添加组成,目的在于表达一个或多个具有更高活性的蛋白质或者表达更高水平的这种(这些)蛋白质。
57.如权利要求55中所述的突变微生物,其中所考虑基因的过量表达是通过增加该基因的拷贝数和/或通过导入比野生型启动子活性更高的启动子而获得的。
58.如权利要求55或57中所述的突变微生物,其中所考虑基因的过量表达是通过用如权利要求13、14或17中所述的允许该基因过量表达的重组DNA构建体转化产大环内酯微生物而获得的。
59.如权利要求55,56,57或58中所述的突变微生物,其中遗传修饰是在一个或多个这样的基因中进行的,所述一个或多个基因包含对应于一个或多个序列SEQ ID No.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118,120,141,143,145,147和149的序列之一、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一。
60.如权利要求55,56,57,58或59中所述的突变微生物,其中微生物过量表达一个或多个这样的基因,所述一个或多个基因包含对应于一个或多个序列SEQ ID No.3,5,7,9,11,13,15,17,19,21,23,25,28,30,34,36,40,43,45,47,49,53,60,62,64,66,68,70,72,74,76,78,80,82,84,107,109,111,113,115,118和120的序列之一、或其变体之一、或由于遗传密码简并性而由其衍生的序列之一。
61.如权利要求55,56,57,58,59或60中所述的突变微生物,其中所述微生物是链霉菌属的细菌。
62.如权利要求55,56,57,58,59,60或61中所述的突变微生物,其中大环内酯是螺旋霉素。
63.如权利要求55,56,57,58,59,60,61或62中所述的突变微生物,其中所述微生物是生二素链霉菌菌株。
64.产生大环内酯的方法,其包括以下步骤:
(a)在适当的培养基中,培养如权利要求55,56,57,58,59,60,61,62,63和64中任意一项所述的微生物,
(b)回收条件培养基或细胞提取物,
(c)从步骤b)获得的所述培养基或细胞提取物中分离并纯化产生的所述大环内酯。
65.如权利要求1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16和17中任意一项所述的序列和/或重组DNA和/或载体的用途,用于制备杂化抗生素。
66.如权利要求1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17和21中任意一项所述的至少一种多核苷酸和/或至少一种重组DNA和/或至少一种表达载体和/或至少一种多肽和/或至少一种宿主细胞的用途,用于进行一种或多种生物转化。
67.多核苷酸,其为与如权利要求1,2,3,4,5或6中所述的多核苷酸之一互补的多核苷酸。
68.产生至少一种螺旋霉素的微生物,其过量表达:
-可使用以下序列引物对且以粘粒pSPM36或生二素链霉菌的总DNA为模板通过聚合酶链式反应(PCR)而获得的基因:
5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3’(SEQ ID No.138)和
5’GGATCCCGCGACGGACACGACCGCCGCGCA 3’(SEQ ID No.139),
-或者由于遗传密码的简并性而由其衍生的基因。
69.如权利要求68或90中所述的微生物,其是链霉菌属的细菌。
70.如权利要求68,69或90中所述的微生物,其是生二素链霉菌种的细菌。
71.如权利要求68,69,70或90中所述的微生物,其中所述基因的过量表达是通过用表达载体转化所述微生物获得的。
72.生二素链霉菌菌株,其为菌株OSC2/pSPM75(1)或菌株OSC2/pSPM75(2),于2003年10月6日保藏于国立微生物保藏中心(CNCM)[National Collection of Cultures and Microorganisms]巴斯德研究所,25,rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏号为I-3101。
73.重组DNA,其包含:
-使用以下序列引物对并且以粘粒pSPM36或生二素链霉菌总DNA为模板通过聚合酶链式反应能够获得的多核苷酸:
5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3’(SEQ ID No.138)和
5’GGATCCCGCGACGGACACGACCGCCGCGCA 3’(SEQ ID No.139),
-或者该多核苷酸中的至少10,12,15,18,20至25,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1460,1470,1480,1490或1500个连续核苷酸的片段。
74.如权利要求73或91中所述的重组DNA,其为载体。
75.如权利要求73,74或91中所述的重组DNA,其为表达载体。
76.宿主细胞,其中已经导入了至少一个如权利要求73,74,75或91中任意一项所述的重组DNA。
77.产生多肽的方法,其中所述方法包括以下步骤:
a)用至少一个如权利要求75中所述的表达载体转化宿主细胞;
b)在适当的培养基中培养所述宿主细胞;
c)回收条件培养基或细胞提取物;
d)从步骤c)获得的所述培养基或细胞提取物中分离并纯化所述多肽;
e)根据需要,表征所产生的重组多肽。
78.如权利要求51中所述的微生物,其中基因失活是通过同相删除包含对应于SEQ ID No.13的序列或由于遗传密码简并性而由其衍生的序列之一的基因或基因的一部分而进行的。
79.如权利要求41,42,43,44,45,46,47,48,49,50,51或78中任意一项所述的微生物,其也过量表达:
-使用以下序列引物对并且以粘粒pSPM36或生二素链霉菌总DNA为模板通过聚合酶链式反应能够获得的基因:
5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3’(SEQ ID No.138)和
5’GGATCCCGCGACGGACACGACCGCCGCGCA 3’(SEQ ID No.139),
-或由于遗传密码简并性而由其衍生的基因。
80.表达载体,其中序列SEQ ID No.47的多核苷酸或由于遗传密码简并性而由其衍生的多核苷酸置于生二素链霉菌中允许所述多核苷酸编码的蛋白质表达的启动子的控制之下。
81.如权利要求80中所述的表达载体,其为质粒pSPM524或pSPM525。
82.用如权利要求80或81中所述的载体转化的生二素链霉菌菌株。
83.如权利要求41,42,43,44,45,46,47,48,49,50,51,78,79和92中任意一项所述的微生物,其也过量表达具有编码序列SEQ ID No.47或具有由于遗传密码简并性而由其衍生的编码序列的基因。
84.如权利要求83中所述的微生物,其为菌株SPM502pSPM525,于2003年2月26日保藏在国立微生物保藏中心(CNCM)巴斯德研究所,25rue du Docteur Roux 75724 Paris Cedex 15,法国,保藏号为I-2977。
85.产生螺旋霉素的方法,其包括以下步骤:
(a)在适当的培养基中,培养如权利要求68,69,70,71,72,78,79,82,83,84,90和92中任意一项所述的微生物,
(b)回收条件培养基或细胞提取物,
(c)从步骤b)获得的所述培养基或细胞提取物中分离并纯化螺旋霉素。
86.多肽,其序列包含序列SEQ ID No.112或序列SEQ ID No.142。
87.多肽,其序列对应于由以下基因的编码序列翻译的序列:
-使用以下序列引物对并且以粘粒pSPM36或生二素链霉菌总DNA为模板通过聚合酶链式反应能够获得的基因:
5’AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3’(SEQ ID No.138)和
5’GGATCCCGCGACGGACACGACCGCCGCGCA 3’(SEQ ID No.139),
-或由于遗传密码简并性而由其衍生的基因。
88.表达载体,它允许在生二素链霉菌中表达如权利要求86,87或93中所述的多肽。
89.如权利要求88中所述的表达载体,其为质粒pSPM75。
90.如权利要求68中所述的微生物,其中通过聚合酶链式反应能够获得的基因是编码序列SEQ ID No.141的基因或是由于遗传密码简并性而由其衍生的基因。
91.如权利要求73中所述的重组DNA,其中通过聚合酶链式反应能够获得的多核苷酸是序列SEQ ID No.141的多核苷酸。
92.如权利要求79中所述的微生物,其中通过聚合酶链式反应能够获得的基因是编码序列SEQ ID No.141的基因或是由于遗传密码简并性而由其衍生的基因。
93.多肽,其序列是SEQ ID No.142。
CNA2003801029666A 2002-10-08 2003-10-08 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用 Pending CN1711355A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0212489A FR2845394A1 (fr) 2002-10-08 2002-10-08 Polypeptides impliques dans la biosynthese des spiramycines, sequences nucleotidiques codant ces polypeptides et leurs applications
FR0212489 2002-10-08
FR0302439 2003-02-27

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2008100823963A Division CN101302528B (zh) 2002-10-08 2003-10-08 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用

Publications (1)

Publication Number Publication Date
CN1711355A true CN1711355A (zh) 2005-12-21

Family

ID=32011514

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2008100823963A Expired - Lifetime CN101302528B (zh) 2002-10-08 2003-10-08 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用
CNA2003801029666A Pending CN1711355A (zh) 2002-10-08 2003-10-08 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2008100823963A Expired - Lifetime CN101302528B (zh) 2002-10-08 2003-10-08 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用

Country Status (3)

Country Link
CN (2) CN101302528B (zh)
FR (1) FR2845394A1 (zh)
ZA (1) ZA200502139B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2197524A1 (en) * 1996-02-22 1997-08-22 Bradley Stuart Dehoff Polyketide synthase genes
CA2197160C (en) * 1996-02-22 2007-05-01 Stanley Gene Burgett Platenolide synthase gene
JP2001511349A (ja) * 1997-07-25 2001-08-14 ヘキスト・マリオン・ルセル Saccharopolysporaerythraea及びStreptomycesantibioticusにおける6−デオキシヘキソースの生合成及び移送のための遺伝子

Also Published As

Publication number Publication date
ZA200502139B (en) 2006-05-31
CN101302528A (zh) 2008-11-12
FR2845394A1 (fr) 2004-04-09
CN101302528B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
CN1227362C (zh) 生产刺糖噻杀虫剂所用的生物合成基因
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
CN1977046A (zh) 编码参与普拉地内酯生物合成的多肽的dna
Galm et al. The biosynthetic gene cluster of zorbamycin, a member of the bleomycin family of antitumor antibiotics, from Streptomyces flavoviridis ATCC 21892
CN1732264A (zh) 产生疏螺旋体素的聚酮化合物合酶及其用途
CN101809030A (zh) 硫肽前体蛋白质、编码该蛋白质的基因及其用途
CN1676607A (zh) 为抗生素的生物合成从蓝灰链霉菌非产蓝亚种中克隆基因及其使用方法
US5786181A (en) Process for producing high purity 6, 12-dideoxyerythromycin A by fermentation
CN1186447C (zh) 介导除虫菌素b2:b1比例的除虫链霉菌基因
CN1711355A (zh) 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用
CN1732263A (zh) 生物合成糖肽类抗生素a40926的基因及蛋白
CN1507493A (zh) 用于生产丁烯基-多杀菌素杀虫剂的生物合成基因
JP2020500561A (ja) Streptomyces fungicidicusの遺伝子組換え株におけるエンデュラシジンの産生を増強するための組成物及び方法
KR101110175B1 (ko) 스피라마이신의 생합성에 관여하는 폴리펩티드, 이들폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도
CA2391131C (en) Genes and proteins for rosaramicin biosynthesis
CN1186446C (zh) 介导除虫菌素b2:b1比例的除虫链霉茵基因
CN1521180A (zh) 介导除虫菌素b2:b1比例的除虫链霉菌基因
DK1905833T3 (en) Polypeptides involved in the biosynthesis of spiramyciner, nucleotide sequences encoding these polypeptides, and uses thereof
CN1137806A (zh) 编码阿凡曼链霉菌支链α-酮酸脱氢酶复合物的基因
CN1190444C (zh) 南昌霉素生物合成基因簇
CN1257282C (zh) 南寡霉素生物合成基因簇
CN1667123A (zh) 负责fr-008聚酮抗生素生物合成的基因簇
EP1925668A2 (en) Genes involved in the biosynthesis of thiocoraline and heterologous production of same
US8044186B2 (en) Heterologous production of capreomycin and generation of new capreomycin derivatives through metabolic engineering
Park et al. Cloning of relA from Actinoplanes teichomyceticus ATCC31121 and its application for increases in antibiotic production

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1082957

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1082957

Country of ref document: HK