스피라마이신의 생합성에 관여하는 폴리펩티드, 이들 폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도{Polypeptides involved in spiramycin biosynthesis, nucleotide sequences encoding said polypeptides and uses thereof}
본 발명은 스피라마이신(spiramycin)에 대한 생합성 경로의 신규한 유전자의 분리와 동정, 및 이러한 생합성에 관여하는 신규한 폴리펩티드에 관한 것이다. 본 발명은 또한, 스피라마이신의 생성 수준을 증가시키고, 생성된 스피라마이신의 순도를 증가시킬 목적으로 상기 유전자를 사용하는 것에 관한 것이다.
본 발명은 또한, 신규한 항생제를 합성할 수 있게 하거나 유도된 형태의 스피라마이신을 생성시킬 수 있는 돌연변이체를 작제하기 위한 상기 유전자의 용도에 관한 것이다. 본 발명은 또한, 이들 유전자의 발현을 통하여 생성된 분자에 관한 것이고, 최종적으로는 이러한 유전자의 발현을 통하여 생성된 분자의 약리학적 활성 조성물에 관한 것이다.
스트렙토마이세스(Streptomyces)는 그람-양성 사상 토양 세균(gram-positive filamentous soil baterium)이다. 이들 세균은 이들이 분비하는 상당히 광범위한 분해성 효소로 인해 유기 물질의 분해와 광화 작용(mineralization)에 있어 중요한 역할을 한다. 이들은 특별히 다양한 화학 구조와 생물학적 활성을 지닌 2차 대사물 생성을 특징으로 하는 대사적 분화를 수반하는, 원핵생물에서 독특한 형태학적 분화 현상을 나타낸다. 이들 대사물로는 특히, 세균 스트렙토마이세스 암보파시엔스(Streptomyces ambofaciens)에 의해 천연적으로 생산되는 스피라마이신이 있다.
스피라마이신은 수의학 분야와 인체 의학 분야 모두에 사용되는 매크롤리드(macrolide) 계열의 항생제이다. 매크롤리드는 1개 이상의 당이 접목된 락톤 환의 존재를 특징으로 한다. 스트렙토마이세스 암보파시엔스는 본래, 스피라마이신 I, II 및 III(도 1 참조)을 생산하지만; 스피라마이신 I의 항생제 활성이 스피라마이신 II 및 III 보다 훨신 더 크다[참조: Liu et al., 1990]. 스피라마이신 I 분자는 플라테놀리드(platenolide)로 불리우는 락톤계 매크로사이클과, 3개의 당, 즉 포로사민, 미카미노스 및 미카로스 로 이루어진다(도 1 참조). 스피라마이신의 항생제 활성은, 이러한 항생제가 세균성 리보솜에 결합하는 것에 관여하는 기전을 통하여 원핵생물에서 단백질 합성을 억제하는 것에 기인한다.
매크롤리드 계열의 구성원이고 락톤 환을 보유하기도 하는 특정 화합물은 항생제 분야 이외에서도 사용된다. 따라서, 생성물 FK506은 면역억제 효과를 지니고 있으며, 기관 이식 분야와 류마티스성 관절염 분야에 치료학적으로 적용될 전망이며, 보다 일반적으로는, 자가면역 반응과 관련된 병리학적 질환에 치료학적으로 적 용될 전망이다. 기타 매크롤리드, 예를 들면, 아베르멕틴(avermectin)은 살곤충 활성과 구충 활성을 지닌다.
현재까지, 각종 부류에 속하는 항생제와 기타 2차 대사물에 관한 많은 생합성 경로(참조: K, Chater, 1990)가 스트렙토마이세스에서 이미 연구되었다. 그러나, 스피라마이신에 대한 생합성 경로에 관해서는 극히 부분적인 지식만이 지금까지 알려져 있다.
스피라마이신 생합성은 많은 단계를 포함하고 많은 효소들이 관여하는 복잡한 과정이다[참조: Omura et al., 1979a, Omura et al., 1979b]. 스피라마이신은 토양에서 발견되는 미생물들 중에 특히 풍부한 복합 분자를 포함하는 큰 부류의 폴리케티드(polyketide)에 속한다. 이들 분자는 이들의 구조적 유사상에 근거하여 분류되는 것이 아니라, 이들의 생합성 경로 단계 상의 특정의 유사성에 근거하여 분류된다. 구체적으로 언급하면, 폴리케티드는 복합적인 연속 반응에 의해 생성되는데, 이러한 반응은 "폴리케티드 신타제"(PKS)로 불리우는 한 가지 이상의 효소에 의해 촉매된 일련의 반응들이 이의 생합성 경로에 존재한다는 공통점을 가진다. 스트렙토마이세스 암보파시엔스에서는, 스피라마이신의 락톤계 매크로사이클(플라테놀리드)의 생합성이 5개의 PKS 유전자에 의해 암호화된 일련의 8개 모듈(module)에 의해 수행된다[참조: S. Kuhstoss, 1996, 미국 특허 제5,945,320호]. 스피라마이신은 이러한 락톤 환으로부터 수득된다. 그러나, 당 합성에 관여하고, 이를 락톤 환에 부착시키고 이러한 환을 변형시켜 스피라마이신을 수득하도록 하는데 관여하는 각종 효소와 단계는 오늘날까지 여전히 공지되어 있지 않다.
미국 특허 제5,514,544호에는 스트렙토마이세스 암보파시엔스에서 srmR로 지칭된 서열을 클로닝하는 것에 관해 기재되어 있다. 상기 특허에서는, srmR 유전자가 매크롤리드 생합성에 관여하는 유전자의 전사를 조절하는 단백질을 암호화한다는 가설이 제안되었다.
1987년에, 리차드슨(Richardson) 등은 에스. 암보파시엔스(S. ambofaciens)의 스피라마이신 내성이 적어도 3가지 유전자, 즉 srmA, srmB 및 srmC로 지칭된 유전자에 의해 부여된다는 사실을 밝혀내었다[참조: Richardson et al., 1987]. 미국 특허 제4,886,757호에는 srmC 유전자를 함유하는 에스. 암보파시엔스의 DNA 단편의 성상 확인이 보다 특별히 기재되어 있다. 그러나, 이러한 유전자의 서열은 기재되지 않았다. 1990년에, 리차드슨 등은 srmB 에 근접한 스피라마이신 생합성을 위한 유전자가 3가지 존재한다는 가설을 제시하였다[참조: Richardson et al., 1990]. 미국 특허 제5,098,837호에는 스피라마이신 생합성에 잠재적으로 관여하는 5가지 유전자의 클로닝에 관해 보고되었다. 이들 유전자는 srmD, srmE, srmF, srmG 및 srmH으로 지칭되었다.
스피라마이신과 같은 화합물을 제조하는데 있어서 가장 곤란한 점 중의 하나는 비교적 소량의 생성물을 제조하기 위해서도 매우 큰 발효 용적이 필요하다는 사실이다. 따라서, 이러한 분자의 생산 비용을 줄이기 위해서는 이의 생산 효율을 증대시킬 수 있도록 하는 것이 요망된다.
스피라마이신에 대한 생합성 경로는 복잡한 과정이고, 이러한 과정 중에 존재할 수도 있는 기생(parasitic) 반응을 동정 및 제거하는 것이 바람직할 것이다. 이러한 조작의 목적은 보다 순수한 항생제를 수득하고/하거나 생산성을 향상시키는 것이다. 이러한 측면에서, 스트렙토마이세스 암보파시엔스는 본래, 스피라마이신 I, II 및 III(도 1 참조)을 생산하지만; 스피라마이신 I의 항생제 활성이 스피라마이신 II 및 III 보다 훨신 더 크다[참조: Liu et al., 1990]. 따라서, 스피라마이신 I 만을 생산하는 균주를 갖는 것이 바람직할 것이다.
매크롤리드 항생제의 상업적 가치 때문에, 신규한 유도체, 특히 유리한 특성을 지닌 스피라마이신의 동족체를 생성시키고자 하는 연구가 집중적으로 수행되고 있다. 특히 스피라마이신-유도된 하이브리드 항생제를 제조할 목적으로, 스피라마이신 또는 스피라마이신 유도체에 대한 생합성 경로의 생합성 중간체를 충분한 양으로 생성시킬 수 있는 것이 바람직할 것이다.
발명의 일반적인 설명
본 발명은 스피라마이신 생합성에 관여하는 생성물을 생성시키는 유전자를 클로닝함으로써 비롯된 것이다. 본 발명은 무엇 보다도, 스피라마이신에 대한 생합성 경로의 신규한 유전자, 및 이러한 생합성에 관여하는 신규한 폴리펩티드에 관한 것이다.
상기 생합성 경로의 유전자와 이와 연관된 암호화 서열을 클로닝하고, 각 클론의 DNA 서열을 결정하였다. 이와 같이 클로닝된 암호화 서열은 orf1*c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8*, orf9*, orf10*, orf1, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10, orf11c, orf12, orf13c, orf14, orf15c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, orf23c, orf24c, orf25c, orf26, orf27, orf28c, orf29, orf30c, orf31, orf32c, orf33 및 orf34c로 명명될 것이다. 스피라마이신에 대한 생합성 경로에 있어서 이들 서열에 의해 암호화된 단백질의 기능은 다음 토의에서 전개되며, 이는 도 4, 5, 6 및 8로써 예시된다.
1) 본 발명의 제1 주제는 스피라마이신 생합성에 관여하는 폴리펩티드를 암호화하는 폴리뉴클레오티드에 관한 것이며, 이러한 폴리뉴클레오티드의 서열은 다음과 같다:
(a) 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 서열들 중의 하나,
(b) 서열 (a)의 변이체로 이루어진 서열들 중의 하나,
(c) 유전 암호 축퇴성(degeneracy)으로 인해 서열 (a) 및 (b)로부터 유도된 서열 중의 하나.
2) 본 발명의 주제는 또한, 고도로 엄격한 하이브리드화 조건 하에서, 상기 1)에 따르는 폴리뉴클레오티드 중의 하나 이상과 하이브리드화되는 폴리뉴클레오티드이다.
3) 본 발명은 또한, 상기 단락 1)에 따르는 폴리뉴클레오티드의 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 또는 1900개 이상의 연속되는 뉴클레오티드를 포함하는 폴리뉴클레오티드와 70%, 80%, 85%, 90%, 95% 또는 98% 이상의 뉴클레오티드 동일성을 나타내는 폴리뉴클레오티드에 관한 것이다.
4) 본 발명은 또한, 스트렙토마이세스 속(genus) 세균으로부터 분리되는, 상기 단락 2) 또는 3)에 따르는 폴리뉴클레오티드에 관한 것이다.
5) 본 발명은 또한, 매크롤리드의 생합성에 관여하는 단백질을 암호화하는, 상기 단락 2), 3) 또는 4)에 따르는 폴리뉴클레오티드에 관한 것이다.
6) 본 발명은 또한, 당해 폴리뉴클레오티드와 하이브리드화되거나 또는 당해 폴리뉴클레오티와 동일성을 나타내는 폴리뉴클레오티드에 의해 암호화된 단백질과 유사한 활성을 지닌 단백질을 암호화하는, 상기 단락 2), 3) 또는 4)에 따르는 폴리뉴클레오티드에 관한 것이다.
7) 본 발명은 또한, 상기 단락 1), 2), 3), 4), 5) 또는 6)에 따르는 폴리뉴클레오티드의 발현으로부터 생성된 폴리펩티드에 관한 것이다.
8) 본 발명의 또 다른 국면은 스피라마이신 생합성에 관여하는 폴리펩티드에 관한 것이며, 이러한 폴리펩티드의 서열은 다음과 같다:
(a) 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 및 150의 서열들 중의 하나,
(b) 상기 서열 (a) 전반에 걸쳐, 이러한 서열의 기능적 특성에는 전혀 영향을 미치지 않으면서 1개 이상의 아미노산이 치환, 삽입 또는 결실된 것을 제외하고는, 상기 (a)에 규정된 바와 같은 서열들 중의 하나,
(c) 서열 (a) 및 (b)의 변이체로 이루어진 서열들 중의 하나.
9) 본 발명의 또 다른 주제는 상기 단락 8)에 따르는 폴리펩티드의 10, 15, 20, 30 내지 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 또는 640개 이상의 연속되는 아미노산을 포함하는 폴리펩티드와 70%, 80%, 85%, 90%, 95% 또는 98% 이상의 아미노산 동일성을 나타내는 폴리펩티드에 관한 것이다.
10) 본 발명의 또 다른 국면은 스트렙토마이세스 속 세균으로부터 분리되는, 상기 단락 9)에 따르는 폴리펩티드에 관한 것이다.
11) 본 발명의 또 다른 국면은 매크롤리드의 생합성에 관여하는 단백질을 암호화하는, 상기 단락 9) 또는 10)에 따르는 폴리펩티드에 관한 것이다.
12) 본 발명의 또 다른 국면은 동일성을 공유하고 있는 폴리펩티드와 유사한 활성을 지니고 있는, 상기 단락 9), 10) 또는 11)에 따르는 폴리펩티드에 관한 것이다.
13) 본 발명의 또 다른 국면은 상기 단락 1), 2), 3), 4), 5) 및 6) 중의 하나에 따르는 하나 이상의 폴리뉴클레오티드를 포함하는 재조합 DNA에 관한 것이다.
14) 본 발명의 또 다른 국면은 상기 재조합 DNA가 벡터 내에 포함되어 있는, 상기 단락 13)에 따르는 재조합 DNA에 관한 것이다.
15) 본 발명의 또 다른 국면은 상기 벡터가 박테리오파아지, 플라스미드, 파아지미드, 통합(integrative) 벡터, 포스미드, 코스미드, 셔틀 벡터, BAC 및 PAC 중에서 선택되는, 상기 단락 14)에 따르는 재조합 DNA에 관한 것이다.
16) 본 발명의 또 다른 국면은 pOS49.1, pOS49.11, pOSC49.12, pOS49.14, pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5, pSPM7, pOS49.67, pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504, pSPM507, pSPM508, pSPM509, pSPM1, pBXL1111, pBXL1112, pBXL1113, pSPM520, pSPM521, pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, pSPM47, pSPM48, pSPM50, pSPM51,pSPM52, pSPM53, pSPM55, pSPM56, pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74, pSPM75, pSPM79, pSPM83, pSPM107, pSPM543 및 pSPM106 중에서 선택되는, 상기 단락 15)에 따르는 재조합 DNA에 관한 것이다.
17) 본 발명의 또 다른 국면은 상기 단락 7), 8), 9), 10), 11) 또는 12)에 따르는 폴리펩티드를 암호화하는 하나 이상의 핵산 서열을 포함하는 발현 벡터에 관한 것이다.
18) 본 발명은 또한, 적합한 발현 벡터와, 상기 단락 7), 8), 9), 10), 11) 또는 12)에 따르는 하나 이상의 폴리펩티드의 발현을 허용해 주는 숙주 세포를 포 함하는 발현 시스템에 관한 것이다.
19) 본 발명은 또한, 원핵성 발현 시스템과 진핵성 발현 시스템 중에서 선택되는, 상기 단락 18)에 따르는 발현 시스템에 관한 것이다.
20) 본 발명은 또한, 이. 콜라이(E. coli) 세균에서의 발현 시스템, 곤충 세포에서의 발현을 허용해주는 바쿨로바이러스(baculovirus) 발현 시스템, 효모 세포에서의 발현을 허용해주는 발현 시스템, 및 포유류 세포에서의 발현을 허용해주는 발현 시스템 중에서 선택되는, 상기 단락 19)에 따르는 발현 시스템에 관한 것이다.
21) 본 발명은 또한, 상기 단락 1), 2), 3), 4), 5), 6), 13), 14), 15), 16) 및 17) 중의 하나에 따르는 하나 이상의 폴리뉴클레오티드 및/또는 하나 이상의 재조합 DNA 및/또는 하나 이상의 발현 벡터가 도입된 숙주 세포에 관한 것이다.
22) a) 폴리펩티드를 암호화하는 하나 이상의 핵산을 적합한 벡터 내로 삽입하는 단계;
b) 단계 a)의 벡터로 미리 형질전환 또는 형질감염시킨 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계;
e) 경우에 따라, 이로써 생성된 재조합 폴리펩티드를 성상 확인하는 단계
를 포함하는, 상기 단락 7), 8), 9), 10), 11) 또는 12)에 따르는 폴리펩티 드의 생성 방법에 관한 것이다.
23) 본 발명의 또 다른 국면은 하나 이상의 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물에 관한 것이다.
24) 본 발명의 또 다른 국면은 이들 매크롤리드를 생산하는 미생물에서 상기 매크롤리드의 생합성에 관여하는 하나 이상의 단백질의 기능을 불활성화시킴으로써 수득되는, 상기 단락 23)에 따르는 미생물에 관한 것이다.
25) 본 발명의 또 다른 국면은 이들 단백질을 불활성화시키는 것이, 상기 단백질을 암호화하는 유전자에서 돌연변이 유발시키거나 또는 상기 단백질을 암호화하는 메신저 RNA에 상보적인 하나 이상의 안티센스 RNA를 발현시킴으로써 수행되는, 상기 단락 24)에 따르는 미생물에 관한 것이다.
26) 본 발명의 또 다른 국면은 이들 단백질을 불활성화시키는 것이, 방사선조사를 통하여 돌연변이 유발시키거나, 돌연변이 유발성 화학 제제를 작용시키거나, 부위-지시된 돌연변이 유발시키거나, 또는 유전자 대체시킴으로써 수행되는, 상기 단락 25)에 따르는 미생물에 관한 것이다.
27) 본 발명의 또 다른 국면은 돌연변이 유발시키는 것이, 시험관내 또는 원위치에서, 고려 중인 유전자 내의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키거나 또는 유전자 불활성화시킴으로써 수행되는, 상기 25) 또는 26)에 따르는 미생물에 관한 것이다.
28) 본 발명의 또 다른 국면은 상기 미생물이 스트렙토마이세스 속 세균인, 상기 단락 23), 24), 25), 26) 또는 27)에 따르는 미생물에 관한 것이다.
29) 본 발명의 또 다른 국면은 매크롤리드가 스피라마이신인, 상기 단락 23), 24), 25), 26), 27) 또는 28)에 따르는 미생물에 관한 것이다.
30) 본 발명의 또 다른 국면은 상기 미생물이 에스. 암보파시엔스 균주인, 상기 단락 23), 24), 25), 26), 27), 28) 또는 29)에 따르는 미생물에 관한 것이다.
31) 본 발명의 또 다른 국면은 돌연변이 유발이 상기 단락 1), 2), 3), 4), 5) 및 6) 중의 하나에 따르는 서열을 포함하는 하나 이상의 유전자에서 수행되는, 상기 단락 23), 24), 25), 26), 27), 28), 29) 또는 30)에 따르는 미생물에 관한 것이다.
32) 본 발명의 또 다른 국면은 돌연변이 유발이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 서열들 중의 하나 이상에 상응하는 서열들 중의 하나를 포함하는 하나 이상의 유전자에서 수행되는, 상기 단락 25), 26), 27), 28), 29), 30) 또는 31)에 따르는 미생물에 관한 것이다.
33) 본 발명의 또 다른 국면은 돌연변이 유발이 서열 번호 13에 상응하는 서열을 포함하는 유전자를 유전자 불활성화시키는 것으로 이루어지는, 상기 단락 25), 26), 27), 28), 29), 30), 31) 또는 32)에 따르는 미생물에 관한 것이다.
34) 본 발명의 또 다른 국면은 2002년 7월 10일자로 기탁 기관(Collection Nationale de Cultures de Microorganismes [National Collection of Cultures and Microorganisms]) (CNCM)에 등록 번호 I-2909, I-2911, I-2912, I-2913, I-2914, I-2915, I-2916 또는 I-2917로 기탁된 균주들 중의 하나로부터 선택된 균주인 스트렙토마이세스 암보파시엔스 균주에 관한 것이다.
35) 본 발명의 또 다른 국면은
a) 상기 단락 23), 24), 25), 26), 27), 28), 29), 30), 31), 32), 33) 또는 34) 중의 하나에 따르는 미생물을 적합한 배양 배지에서 배양하는 단계;
b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
c) 단계 b)에서 수득된 추출물로부터 또는 상기 배양 배지로부터 매크롤리드 생합성 중간체를 분리 및 정제하는 단계
를 포함하는, 상기 매크롤리드 생합성 중간체의 제조 방법에 관한 것이다.
36) 본 발명의 또 다른 국면은 생합성 중간체를 상기 단락 35)의 방법에 따라서 제조하고, 이로써 제조된 중간체를 변형시키는, 매크롤리드로부터 유도된 분자의 제조 방법에 관한 것이다.
37) 본 발명의 또 다른 국면은 상기 중간체가 화학적, 생화학적, 효소적 및/또는 미생물적으로 변형되는, 상기 단락 36)에 따르는 제조 방법에 관한 것이다.
38) 본 발명의 또 다른 국면은 상기 중간체를 기질로서 사용함으로써 이러한 중간체를 변형시킬 수 있는 단백질을 암호화하는 하나 이상의 유전자를 상기 미생물 내로 도입하는, 상기 단락 36) 또는 37)에 따르는 제조 방법에 관한 것이다.
39) 본 발명의 또 다른 국면은 매크롤리드가 스피라마이신인, 상기 단락 36), 37) 또는 38)에 따르는 제조 방법에 관한 것이다.
40) 본 발명의 또 다른 국면은 사용된 미생물이 에스. 암보파시엔스의 균주인, 상기 단락 36), 37), 38) 또는 39)에 따르는 제조 방법에 관한 것이다.
41) 본 발명의 또 다른 국면은 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 않는 미생물에 관한 것이다.
42) 본 발명의 또 다른 국면은 스피라마이신 I의 생합성에 요구되는 유전자 모두를 포함하긴 하지만, 서열 번호 13의 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 이의 변이체들 중의 하나를 암호화하는 유전자는 발현되지 않거나 또는 이를 불활성으로 만든, 상기 단락 41)에 따르는 미생물에 관한 것이다.
43) 본 발명의 또 다른 국면은 상기 불활성화가, 상기 단백질을 암호화하는 유전자에서 돌연변이 유발시키거나 또는 상기 단백질을 암호화하는 메신저 RNA에 상보적인 안티센스 RNA를 발현시킴으로써 수행되는, 상기 단락 42)에 따르는 미생물에 관한 것이다.
44) 본 발명의 또 다른 국면은 상기 돌연변이 유발이, 상기 유전자의 프로모터, 암호화 서열 또는 비-암호화 서열에서 수행되어, 암호화된 단백질을 불활성으로 만들거나, 또는 이의 발현이나 이로부터의 해독을 방지시키도록 하는, 상기 단락 43)에 따르는 미생물에 관한 것이다.
45) 본 발명의 또 다른 국면은 돌연변이 유발이, 방사선조사, 돌연변이 유발성 화학 제제의 작용, 부위-지시된 돌연변이 유발 또는 유전자 대체에 의해 수행되는, 상기 단락 43) 또는 44)에 따르는 미생물에 관한 것이다.
46) 본 발명의 또 다른 국면은 돌연변이 유발이, 시험관내 또는 원위치에서, 고려 중인 유전자 내의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키거나 또는 유전자 불활성화시킴으로써 수행되는, 상기 단락 43), 44) 또는 45)에 따르는 미생물에 관한 것이다.
47) 본 발명의 또 다른 국면은 상기 미생물이, 스피라마이신에 대한 생합성 경로의 유전자를 발현시킴으로써 수득되는데, 이들 유전자가 서열 번호 13에 상응하는 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 이의 변이체들 중의 하나를 암호화하는 유전자는 포함하지 않는, 상기 단락 41) 또는 42)에 따르는 미생물에 관한 것이다.
48) 본 발명의 또 다른 국면은 상기 미생물이 스트렙토마이세스 속 세균인, 상기 단락 41), 42), 43), 44), 45), 46) 또는 47)에 따르는 미생물에 관한 것이다.
49) 본 발명의 또 다른 국면은 상기 미생물이 스피라마이신 I, II 및 III을 생산하는 출발 균주로부터 수득되는, 상기 단락 41), 42), 43), 44), 45), 46), 47) 또는 48)에 따르는 미생물에 관한 것이다.
50) 본 발명의 또 다른 국면은 서열 번호 13에 상응하는 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 동일한 기능을 갖는 이의 변이체 들 중의 하나를 암호화하는 유전자 내에서 돌연변이 유발시킴으로써 수득되는, 상기 단락 41), 42), 43), 44), 45), 46), 47), 48) 또는 49)에 따르는 미생물 에 관한 것이다.
51) 본 발명의 또 다른 국면은 상기 미생물이 서열 번호 13에 상응하는 서열 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자의 유전자 불활성화가 수행되는, 스피라마이신 I, II 및 III을 생산하는 에스. 암보파시엔스 균주로부터 수득되는, 상기 단락 41), 42), 43), 44), 45), 46), 47), 48), 49) 또는 50)에 따르는 미생물에 관한 것이다.
52) 본 발명의 또 다른 국면은 2002년 7월 10일자로 기탁 기관(Collection Nationale de Cultures de Microorganismes)(CNCM)에 등록 번호 I-2910으로 기탁된 균주인 에스. 암보파시엔스 균주에 관한 것이다.
53) 본 발명의 또 다른 국면은
a) 상기 단락 41), 42), 43), 44), 45), 46), 47), 48), 49), 50), 51) 및 52) 중의 하나에 따르는 미생물을 적합한 배양 배지에서 배양하는 단계;
b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
c) 단계 b)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 스피라마이신 I을 분리 및 정제하는 단계
를 포함하는, 스피라마이신 I의 생성 방법에 관한 것이다.
54) 본 발명의 또 다른 국면은 미생물의 매크롤리드 생산을 향상시키기 위한, 상기 단락 1), 2), 3), 4), 5) 및 6) 중의 하나에 따르는 폴리뉴클레오티드의 용도에 관한 것이다.
55) 본 발명의 또 다른 국면은 상기 단락 1), 2), 3), 4), 5) 또는 6) 중의 하나에 따르는 서열을 포함하는 하나 이상의 유전자에서 유전자 변형을 지니고 있고, 상기 단락 1), 2), 3), 4), 5) 및 6) 중의 하나에 따르는 서열을 포함하는 하나 이상의 유전자를 과발현하는, 매크롤리드-생산 돌연변이체 미생물에 관한 것이다.
56) 본 발명의 또 다른 국면은 상기 유전자 변형이, 보다 큰 활성을 지닌 하나 이상의 단백질을 발현시키거나 또는 이들 단백질을 보다 높은 수준으로 발현시킬 목적으로, 고려 중인 유전자 내의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키는 것으로 이루어지는, 상기 단락 55)에 따르는 돌연변이체 미생물에 관한 것이다.
57) 본 발명의 또 다른 국면은 고려 중인 유전자의 과발현이, 이러한 유전자에 대한 복사물 수를 증가시키고/시키거나 야생형 프로모터 보다 더 활성인 프로모터를 도입함으로써 획득되는, 상기 단락 55)에 따르는 돌연변이체 미생물에 관한 것이다.
58) 본 발명의 또 다른 국면은 고려 중인 유전자의 과발현이, 매크롤리드-생산 미생물을 상기 단락 13), 14) 또는 17)에 따르는 재조합 DNA 작제물로 형질전환시켜 상기 유전자의 과발현을 허용함으로써 획득되는, 상기 단락 55) 또는 57)에 따르는 돌연변이체 미생물에 관한 것이다.
59) 본 발명의 또 다른 국면은 상기 유전자 변형이, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149 중의 하나 이상의 서열에 상응하는 서열들 중의 하나, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 하나 이상의 유전자에서 수행되는, 상기 단락 55), 56), 57) 또는 58)에 따르는 돌연변이체 미생물에 관한 것이다.
60) 본 발명의 또 다른 국면은 상기 미생물이, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149 중의 하나 이상의 서열에 상응하는 서열들 중의 하나, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 하나 이상의 유전자를 과발현하는, 상기 단락 55), 56), 57), 58) 또는 59)에 따르는 돌연변이체 미생물에 관한 것이다.
61) 본 발명의 또 다른 국면은 상기 미생물이 스트렙토마이세스 속 세균인, 상기 단락 55), 56), 57), 58), 59) 또는 60)에 따르는 돌연변이체 미생물에 관한 것이다.
62) 본 발명의 또 다른 국면은 매크롤리드가 스피라마이신인, 상기 단락 55), 56), 57), 58), 59), 60) 또는 61)에 따르는 돌연변이체 미생물에 관한 것이다.
63) 본 발명의 또 다른 국면은 상기 미생물이 에스. 암보파시엔스 균주인, 상기 단락 55), 56), 57), 58), 59), 60), 61) 또는 62)에 따르는 돌연변이체 미생물에 관한 것이다.
64) 본 발명의 또 다른 국면은
a) 상기 단락 55), 56), 57), 58), 59), 60), 61), 62), 63) 및 64) 중의 하나에 따르는 미생물을 적합한 배양 배지에서 배양하는 단계;
b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
c) 단계 b)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 생성된 매크롤리드(들)를 분리 및 정제하는 단계
를 포함하는, 상기 매크롤리드의 생성 방법에 관한 것이다.
65) 본 발명의 또 다른 국면은 하이브리드 항생제를 제조하기 위한, 상기 단락 1), 2), 3), 4), 5), 6), 7), 8), 9), 10), 11), 12), 13), 14), 15), 16) 및 17) 중의 하나에 따르는 서열 및/또는 재조합 DNA 및/또는 벡터의 용도에 관한 것이다.
66) 본 발명의 또 다른 국면은 한 가지 이상의 생체전환(bioconversion)을 수행하기 위한, 상기 단락 1), 2), 3), 4), 5), 6), 7), 8), 9), 10), 11), 12), 13), 14), 15), 16), 17) 및 21) 중의 하나에 따르는 하나 이상의 폴리뉴클레오티드 및/또는 하나 이상의 재조합 DNA 및/또는 하나 이상의 발현 벡터 및/또는 하나 이상의 폴리펩티드 및/또는 하나 이상의 숙주 세포의 용도에 관한 것이다.
67) 본 발명의 또 다른 국면은 상기 단락 1), 2), 3), 4), 5) 또는 6)에 따르는 폴리뉴클레오티드 중의 하나에 상보적인 폴리뉴클레오티드에 관한 것이다.
68) 본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하는, 하나 이상의 스피라마이신을 생산하는 미생물에 관한 것이다.
69) 본 발명의 또 다른 국면은 스트렙토마이세스 속 세균인, 단락 68 또는 90에 따르는 미생물에 관한 것이다.
70) 본 발명의 또 다른 국면은 스트렙토마이세스 암보파시엔스 종 세균인, 단락 68, 69 또는 90에 따르는 미생물에 관한 것이다.
71) 본 발명의 또 다른 국면은 상기 유전자의 과발현이, 해당 미생물을 발현 벡터로 형질전환시킴으로써 수득되는, 단락 68, 69, 70 또는 90에 따르는 미생물에 관한 것이다.
72) 본 발명의 또 다른 국면은 2003년 10월 6일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes(CNCM)[National Collection of Cultures and Microorganisms] Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-3101로 기탁된 균주 OSC2/pSPM75(1) 또는 균주 OSC2/pSPM75(2)인, 스트렙토마이세스 암보파시엔스 균주에 관한 것이다.
73) 본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응에 의해 수득될 수 있는 폴리뉴클레오티드; 또는
- 이러한 폴리뉴클레오티드의 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, 1480, 1490 또는 1500개 이상의 연속되는 뉴클레오티드의 단편
을 포함하는 재조합 DNA에 관한 것이다.
74) 본 발명의 또 다른 국면은 벡터인, 단락 73 또는 91에 따르는 재조합 DNA에 관한 것이다.
75) 본 발명의 또 다른 국면은 발현 벡터인, 단락 73, 74 또는 91에 따르는 재조합 DNA에 관한 것이다.
76) 본 발명의 또 다른 국면은 단락 73, 74, 75 및 91 중의 하나에 따르는 하나 이상의 재조합 DNA를 도입시킨 숙주 세포에 관한 것이다.
77) 본 발명의 또 다른 국면은
a) 단락 75에 따르는 하나 이상의 발현 벡터로 숙주 세포를 형질전환시키는 단계;
b) 상기 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계;
e) 경우에 따라, 이로써 생성된 재조합 폴리펩티드를 성상 확인하는 단계
를 포함하는, 폴리펩티드의 생성 방법에 관한 것이다.
78) 본 발명의 또 다른 국면은 유전자 불활성화가, 서열 번호 13에 상응하는 서열 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자 또는 이의 일부를 동위상(in-phase) 결실시킴으로써 수행되는, 단락 51에 따르는 미생물에 관한 것이다.
79) 본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응에 의해 수득될 수 있는 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하기도 하는, 단락 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 및 78 중의 하나에 따르는 미생물에 관한 것이다.
80) 본 발명의 또 다른 국면은 서열 번호 47의 폴리뉴클레오티드 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 폴리뉴클레오티드가, 스트렙토마이세스 암보파시엔스에서 상기 폴리뉴클레오티드에 의해 암호화된 단백질의 발현을 허용해 주는 프로모터의 제어 하에 위치되어 있는 발현 벡터에 관한 것이다.
81) 본 발명의 또 다른 국면은 플라스미드 pSPM524 또는 pSPM525인, 단락 80에 따르는 발현 벡터에 관한 것이다.
82) 본 발명의 또 다른 국면은 단락 80 또는 81에 따르는 벡터로 형질전환시킨 스트렙토마이세스 암보파시엔스 균주에 관한 것이다.
83) 본 발명의 또 다른 국면은 서열 번호 47의 암호화 서열 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 암호화 서열을 갖는 유전자를 과발현하기도 하는, 단락 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 78, 79 및 92 중의 하나에 따르는 미생물에 관한 것이다.
84) 본 발명의 또 다른 국면은 2003년 2월 26일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25 rue duDocteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-2977로 기탁된 균주 SPM502 pSPM525인, 단락 83에 따르는 미생물에 관한 것이다.
85) 본 발명의 또 다른 국면은
a) 단락 68, 69, 70, 71, 72, 78, 79, 82, 83, 84, 90 및 92 중의 하나에 따르는 미생물을 적합한 배양 배지에서 배양하는 단계;
b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
c) 단계 b)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 스피라마이신을 분리 및 정제하는 단계
를 포함하는, 상기 스피라마이신(들)의 생성 방법에 관한 것이다.
86) 본 발명의 또 다른 국면은 서열 번호 112 또는 서열 번호 142의 서열을 포함하는 폴리펩티드에 관한 것이다.
87) 본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자의 암호화 서열, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자의 암호화 서열
로부터 해독된 서열에 상응하는 서열을 갖는 폴리펩티드에 관한 것이다.
88) 본 발명의 또 다른 국면은 스트렙토마이세스 암보파시엔스에서 단락 86, 87 또는 93에 따르는 폴리펩티드의 발현을 허용해 주는 발현 벡터에 관한 것이다.
89) 본 발명의 또 다른 국면은 플라스미드 pSPM75인, 단락 88에 따르는 발현 벡터에 관한 것이다.
90) 본 발명의 또 다른 국면은 폴리머라제 연쇄 증폭에 의해 수득될 수 있는 유전자가 서열 번호 141의 암호화 서열의 유전자, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자인, 단락 68에 따르는 미생물에 관한 것이다.
91) 본 발명의 또 다른 국면은 폴리머라제 연쇄 증폭에 의해 수득될 수 있는 폴리뉴클레오티드가 서열 번호 141의 폴리뉴클레오티드인, 단락 73에 따르는 재조합 DNA에 관한 것이다.
92) 본 발명의 또 다른 국면은 폴리머라제 연쇄 증폭에 의해 수득될 수 있는 유전자가 서열 번호 141의 암호화 서열의 유전자, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자인, 단락 79에 따르는 미생물에 관한 것이다.
93) 본 발명의 또 다른 국면은 서열 번호 142의 서열로 이루어진 폴리펩티드에 관한 것이다.
일반적인 정의
본 발명의 목적상, 용어 "분리된"이란 본래의 환경(본래 위치하는 환경)으로부터 제거된 생물학적 물질(핵산 또는 단백질)을 의미한다.
예를 들어, 식물 또는 동물에 천연 상태로 존재하는 폴리뉴클레오티드는 분리되지 않은 것이다. 식물 또는 동물의 게놈 내에 천연적으로 삽입되는 인접한 핵산으로부터 격리된 동일한 폴리뉴클레오티드는 "분리된" 것으로 간주된다.
이러한 폴리뉴클레오티드는 벡터 내에 포함될 수 있고/있거나 상기 폴리뉴클레오티드는 조성물 내에 포함될 수 있는데, 그럼에도 불구하고 분리된 상태로 유지될 수 있는 것은, 이러한 벡터 또는 조성물이 이의 본래 환경을 구성하고 있지 않다는 사실 때문이다.
용어 "정제된"이란 해당 물질이 기타 화합물의 존재를 배제한, 절대적으로 순수한 형태로만 존재해야 한다는 것을 의미하지는 않는다. 이는 오히려 상대적인 의미이다.
출발 물질 또는 천연 물질을 1 차수 (order-of-magnitude ) 이상, 바람직하게는 2 또는 3, 우선적으로는 4 또는 5 차수로 정제시킨 후 "정제된" 상태의 폴리뉴클레오티드이다.
본 발명의 목적상, 용어 ORF("개방 판독 프레임")는 특히 유전자의 암호화 서열을 의미하기 위해 사용되었다.
본 발명의 목적상, 표현 "뉴클레오티드 서열"은 폴리뉴클레오티드 또는 핵산에 동등하게 지칭되도록 사용될 수 있다. 표현 "뉴클레오티드 서열"은 유전 물질 그 자체를 포괄하므로, 이의 서열에 관한 정보로 제한되지 않는다.
용어 "핵산", "폴리뉴클레오티드", "올리고뉴클레오티드" 또는 "뉴클레오티드 서열"은 일본쇄 형태 또는 이중체 형태의, 1개 이상 뉴클레오티드의 RNA, DNA 또는 cDNA 서열, 또는 RNA/DAN 하이브리드 서열을 포괄한다.
용어 "뉴클레오티드"는 천연 뉴클레오티드(A, T, G, C)와, 하나 이상의 변형을 포함하는 변형된 뉴클레오티드, 예를 들면, (1) 푸린 동족체, (2) 피리미딘 동 족체 또는 (3) 당 동족체 둘 다를 의미하며, 이러한 변형된 뉴클레오티드의 예는 예를 들어, PCT 국제공개공보 WO 95/04064에 기재되어 있다.
본 발명의 목적상, 제1 폴리뉴클레오티드의 각 염기가, 이와 역배향인 제2 폴리뉴클레오티드의 상보적 염기와 쌍을 형성하는 경우에, 이러한 제1 폴리뉴클레오티드는 제2 폴리뉴클레오티드에 "상보적"인 것으로 간주된다. 상보적 염기는 A와 T(또는 A와 U), 또는 C와 G이다.
용어 "스피라마이신에 대한 생합성 경로의 유전자"에는 또한, 조절성 유전자와, 생산자 미생물에 내성을 부여해 주는 유전자가 포함된다.
본 발명에 따르면, 기준 핵산의 "단편"이란 용어는 기준 핵산과 비교해서 보다 짧고, 기준 핵산과 동일한 뉴클레오티드 서열을 공통 부분 위에 포함하는 뉴클레오티드 서열을 의미할 것이다.
본 발명에 따르면, 이러한 핵산 "단편"은 경우에 따라, 보다 큰 폴리뉴클레오티드 내에 구성분으로 포함될 수도 있다.
상기 단편은 본 발명에 따르는 핵산의 8, 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 또는 1900개의 연속되는 뉴클레오티드 길이의 폴리뉴클레오티드를 포함하거나 또는 이들로 이루어진다.
본 발명에 따르면, 폴리펩티드의 "단편"이란 용어는 이의 아미노산 서열이 기준 폴리펩티드의 아미노산 서열 보다 짧고, 이들 기준 폴리펩티드와 공통인 전체 부분 전반에 걸쳐 동일한 아미노산 서열을 포함하는 폴리펩티드를 의미할 것이다.
이러한 단편은 경우에 따라, 이를 일부로 하는 보다 큰 폴리펩티드 내에 포함될 수도 있다.
본 발명에 따르는 폴리펩티드의 상기 단편은 10, 15, 20, 30 내지 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 또는 640개 아미노산 길이일 수 있다.
본 발명의 목적상, "고도로 엄격한 하이브리드화 조건"이란 표현은 비-상동성 핵산 쇄의 하이브리드화에는 바람직하지 못한 하이브리드화 조건을 의미할 것이다. 고도로 엄격한 하이브리드화 조건은, 예를 들어, 하이브리드화 온도 55 내지 65℃, 바람직하게는 하이브리드화 온도 55℃, 보다 더 바람직하게는 하이브리드화 온도 60℃, 가장 바람직하게는 하이브리드화 온도 65℃에서 문헌[참조: Church & Gilbert, 1984]에 기재된 완충액 중에서 하이브리드화시킨 다음, 55 내지 65℃, 바람직하게는 55℃, 보다 더 바람직하게는 60℃, 가장 바람직하게는 65℃에서 2X SSC 완충액(1X SSC 완충액은 0.15M NaCl, 15mM 나트륨 시트레이트의 수용액에 상응한다)에서 1회 이상의 세척을 수행한 다음, 55 내지 65℃, 바람직하게는 55℃, 보다 더 바람직하게는 60℃, 가장 바람직하게는 65℃에서 0.5X SSC 완충액에서 1회 이상 세척하는 조건으로서 서술될 수 있다.
상기 언급된 하이브리드화 조건은 당업자에게 공지된 기술에 따라서, 하이브 리드화하고자 하는 핵산의 길이 또는 선택된 표지화 유형의 함수로서 조정할 수 있다. 적합한 하이브리드화 조건은, 예를 들어, 문헌[참조: F. Ausubel et al (2002)]에 따라서 조정할 수 있다.
본 발명에 따르는 핵산의 "변이체"란 용어는 기준 폴리뉴클레오티드와 비교해서 1개 이상의 염기가 상이한 핵산을 의미할 것이다. 변이체 핵산은 천연 기원, 예를 들면, 천연상 발견되는 대립유전자성 변이체일 수 있거나, 또는 예를 들어, 돌연변이 유발 기술에 의해 수득된 비-천연 변이체일 수도 있다.
일반적으로, 기준 핵산과 변이체 핵산 간의 차이는 작기 때문에, 기준 핵산의 뉴클레오티드 서열과 변이체 핵산의 뉴클레오티드 서열은 매우 유사하고, 많은 영역에 있어 동일하다. 변이체 핵산에 존재하는 뉴클레오티드 변형은 침묵(silent) 변형일 수 있는데, 이는 이러한 변형으로는, 상기 변이체 핵산에 의해 암호화된 아미노산 서열을 변형시키지 못한다는 것을 의미한다.
그러나, 변이체 핵산 상의 뉴클레오티드 변화로 인해, 기준 핵산에 의해 암호화된 펩티드와 비교해서 변이체 핵산에 의해 암호화된 폴리펩티드 내에서 치환, 부가 및/또는 결실이 유발될 수도 있다. 또한, 암호화 영역 상의 뉴클레오티드 변형으로 인해, 아미노산 서열 내에 보존적 또는 비-보존적 치환이 야기될 수 있다.
바람직하게는, 본 발명에 따르는 변이체 핵산이, 기준 핵산의 폴리펩티드와 실질적으로 동일한 기능 또는 생물학적 활성을 보존하고 있거나 또는 초기 핵산에 의해 암호화된 폴리펩티드에 대한 항체에 의해 인식될 수 있는 능력을 보존하고 있는 폴리펩티드를 암호화한다.
따라서, 몇몇 변이체 핵산은 폴리펩티드의 돌연변이된 형태를 암호화할 것인데, 이에 관한 체계적인 연구는 문제의 단백질의 구조-활성 관계를 추론할 수 있게 해줄 것이다.
본 발명에 따르는 폴리펩티드의 "변이체"란 용어는 기준 폴리펩티드의 아미노산 서열과 비교해서, 1개 이상의 아미노산 잔기의 한 가지 이상의 치환, 부가 또는 결실을 함유하는 아미노산 서열을 갖는 폴리펩티드를 주로 의미할 것인데, 이러한 아미노산 치환은 차별 없이 보존적 또는 비-보존적일 수 있다.
바람직하게는, 본 발명에 따르는 변이체 폴리펩티드가, 기준 폴리펩티드와 실질적으로 동일한 기능 또는 생물학적 활성을 보존하고 있거나 또는 초기 폴리펩티드에 대한 항체에 의해 인식될 수 있는 능력을 보존하고 있다.
본 발명의 목적상, 기준 폴리펩티드와 "유사한 활성"을 지닌 폴리펩티드는 기준 폴리펩티드의 생물학적 활성을 측정하는데 적합한 생물학적 검정으로 측정된 바와 같이, 기준 폴리펩티드의 생물학적 활성과 유사하긴 하지만, 반드시 동일할 필요는 없는 생물학적 활성을 지닌 폴리펩티드를 의미한다.
본 발명의 목적상, 용어 "하이브리드 항생제"는 재조합 DNA 기술을 사용하여 인공 생합성 경로를 작제함으로써 생성된 화합물을 의미한다.
본 발명의 주제는 보다 특히, 다음의 상세한 설명에 제시된 바와 같은, 스피라마이신에 대한 생합성 경로의 신규한 유전자 및 이러한 생합성에 관여하는 신규한 폴리펩티드이다.
상기 생합성 경로의 유전자를 클로닝하고, 이들 유전자의 DNA 서열을 결정한다. 수득된 서열은 프레임플롯(FramePlot) 프로그램[참조: J. Ishikawa & K. Hotta, 1999]을 사용하여 분석하였다. 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정한다. 이러한 분석 결과, 상기 영역이 효소 "폴리케티드 신타제"(PKS)를 암호화하는 5개 유전자의 어느 한쪽에 위치되고, 스트렙토마이세스 특유의 코돈 활용을 나타내는 44개 ORF를 포함한다는 사실이 밝혀졌다. PKS를 암호화하는 이들 5개 유전자의 어느 한쪽에, 10개 및 34개 ORF가 각각 하류 및 상류에서 동정되었다(하류 및 상류는 동일한 방향으로 모두 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 3 및 37 참조). 따라서, 대략 41.7 kb의 영역을 점유하고 있는 상기 유형의 34개 개방 판독 프레임[참조: 25개 ORF를 함유하는 31 kb의 제1 영역을 나타내는 서열 번호 1, 및 대략 12.1 kb의 영역(이의 1.4 kb는 선행 서열(서열 번호 1)과 중복되고, 이의 대략 10.7 kb는 후속 서열에 상응한데, 대략 10.7 kb의 후자 부분은 9개의 부가 ORF(부분 서열의 1개 ORF 포함)를 함유한다)을 나타내는 서열 번호 14(또한, 하기 도 3 및 37 참조)]을, 상기 PKS를 암호화하는 5개 유전자의 상류에서 동정하고, 대략 11.1 kb 영역을 점유하고 있는 10개(서열 번호 2 및 도 3)는 PKS 유전자의 하류에서 동정하였다. 따라서, 5개 PKS 유전자의 하류에 위치된 10개 유전자는 orf1*c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8*, orf9* 및 orf10* (서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21)으로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(따라서, 암호화 쇄는 이들 유전자에 대해 서열 번호 2에 제시된 서열에 상보적인 쇄이다). 동일한 명명법을 사용하여, PKS 유전자의 상류의 34개 ORF는 orf1, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10, orf11c, orf12, orf13c, orf14, orf15c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, orf23c, orf24c, orf25c, orf26, orf27, orf28c, orf29, orf30c, orf31, orf32c, orf33 및 orf34c (서열 번호 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149)로 명명되었다(참조: 도 3 및 37).
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치, COGs(Cluster of Orthologous Groups)(이들 3가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990], BEAUTY[참조: K.C. Worley et al., 1995](이들 2가지 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
PKS를 암호화하는 유전자의 하류에 위치한 유전자
해당 영역의 조직을 다이아그램으로 표시한 것이 도 3에 도시되어 있다. 다음에서 입증되는 바와 같이, PKS를 암호화하는 유전자의 하류에서 동정된 10개의 유전자 중에 9개가 스피라마이신의 생합성에 관여하거나 스피라마이신에 대한 내성을 나타내는 것으로 여겨진다. 이들 9개 유전자는 다음과 같다: orf1*c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8* 및 orf9*.
다음 표 1에는, 5개의 PKS 유전자의 하류에서 동정된 10개 유전자의 DNA 서열과 아미노산 서열을 기준(참조)으로 하여 제시되어 있다.
유전자 명칭에 부가된 "c"는 암호화 서열이 역배향으로 존재한다는 것을 지시한다(따라서, 암호화 쇄는 이들 유전자에 대해 서열 번호 2에 제시된 서열에 상보적인 쇄이다).
동정된 폴리펩티드의 기능을 결정할 목적으로, 3가지 유형의 실험을 수행하였다: 동정된 서열을 공지된 기능의 서열과 비교하는 실험; 돌연변이체 균주를 작제시켜 주는 유전자 불활성화 실험; 및 이들 돌연변이체 균주에 의한 스피라마이신 생합성 중간체의 생산과 스피라마이신의 생산에 대한 분석 실험.
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 우선적으로, 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치, COGs(Cluster of Orthologous Groups), FASTA[참조: W.R. Pearson & D.J. Lipman, 1988 and W.R. Pearson, 1990], BEAUTY[참조: K.C. Worley et al., 1995]. 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다. 표 2에는 5개의 PKS 유전자의 하류에 위치한 10개 유전자 생성물과 강력한 유사성을 나타내는 단백질이 제시되어 있다.
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
이들 결과를 확인하기 위해, 유전자 불활성화 실험을 수행하였다. 사용된 방법은 유전자 대체를 수행하는 것으로 이루어진다. 개입중단된(interrupted) 표적 유전자를, 항생제[예를 들면, 아프라마이신(apramycin), 제네티신(geneticin) 또는 히그로마이신(hygromycin)]에 대한 내성을 부여해 주는 카세트에 의해 개입중단된 상기 유전자의 복사물로 대체시킨다. 사용된 카세트는 어느 한 쪽이, 모든 판독 프레임 내의 해독 종결 코돈과 접해있고, 스트렙토마이세스에서 활성인 전사 종결인자와 접해있다. 상기 카세트를 표적 유전자 내로 삽입하는 것은 이러한 표적 유전자에서의 결실을 수반하거나 수반하지 않을 수 있다. 상기 카세트를 플랭킹하는 영역의 크기는 수 백개 염기쌍에서 부터 수 천개 염기쌍 범위일 수 있다. "절제 가능한 카세트"로 지칭되는 제2 유형의 카세트를 유전자 불활성화에 사용할 수 있다. 이들 카세트는 에스. 암보파시엔스의 게놈 내로 도입된 후 부위-특이적 재조합 사건에 의해 스트렙토마이세스에서 절단될 수 있다는 이점을 지니고 있다. 이러한 목적은 최종 균주 내에, 이러한 균주에 속하지 않는 큰 DNA 서열이나 선별 마커를 잔존시키지 않으면서, 스트렙토마이세스 균주 내의 특정의 유전자를 불활성화시키는 것이다. 절제 후, 약 30개 염기쌍의 짧은 서열("반흔성(cicatricial)" 부위로 지칭됨) 만이 상기 균주의 게놈 내에 잔존한다(도 10 참조). 이러한 시스템의 사용은 초기에는, 표적 유전자의 야생형 복사물을 (2회 상동 재조합 사건을 통하여: 도 9 참조), 절제 가능한 카세트를 상기 표적 유전자 내로 삽입시킨 작제물로 대체시키는 것으로 이루어진다. 이러한 카세트의 삽입은 표적 유전자의 결실을 수반하게 된다(도 9 참조). 그 다음, 상기 균주의 게놈으로부터 절제 가능한 카세트를 절제시킨다. 절제 가능한 카세트는 부위-특이적 재조합 시스템을 통하여 기능하고, 결국에는 내성 유전자를 수반하지 않는 스트렙토마이세스 돌연변이체를 획득할 수 있게 해주는 이점을 지니고 있다. 불활성화된 유전자(들)의 하류에 위치한 유전자의 발현에 대한 가능한 극성 효과를 또한 피할 수 있다(도 10 참조). 이와 같이 하여 작제된 균주를 대상으로 하여, 이들의 스피라마이신 생산을 알아보기 위해 시험하였다.
orf1*c, orf2*c, orf3*c 및 orf4*c 유전자는 불활성화시키지 않았는데, 이는 서열 비교 실험 결과, 이들 유전자가 비교적 밀접한 항생제의 생합성에 관여하는 유전자와 비교적 높은 유사성을 지니고 있다는 사실을 결정할 수 있었기 때문이다. 따라서, orf1*c 유전자는 틸로신(tylosine)의 생합성에 관여하고 스트렙토마이세스 프라디애(Streptomyces fradiae)에서 미카미노스의 생성 동안 3-N-메틸화를 촉매하는 N-메틸트랜스퍼라제를 암호화하는 tylMI 유전자에 의해 암호화된 단백질과 66%의 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[참조: A.R. Gandecha et al., 1997; 젠뱅크(GenBank) 수탁 번호: CAA57473; BLAST 스코어: 287]. 이와 같이, 비교적 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질, 보다 특히 미카미노스의 생합성에 관여하는 단백질과의 유사성은 orf1*c 유전자가 포로사민 또는 미카미노스의 생합성 동안 N-메틸화에 책임이 있는 N-메틸트랜스퍼라제를 암호화한다는 사실을 제시해준다(도 5 및 6 참조). 이러한 가설은 orf1*c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 3 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf2*c 유전자는 스트렙토마이세스 프라디애에서 틸로신의 생합성에 관여하는 NDP 헥소스 3,4-이소머라제를 암호화하는 tylMIII 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성(35% 동일성)을 나타내는 단백질을 암호화한다[참조: A.R. Gandecha et al., 1997; 젠뱅크 수탁 번호: CAA57471; BLAST 스코어: 130]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질, 보다 특히 미카미노스의 생합성에 관여하는 단백질과의 유사성은 orf2*c 유전자가 스피라마이신의 당 중의 하나, 가능하게는 미카미노스의 생합성 동안 이성체화에 책임이 있는 NDP 헥소스 3,4-이소머라제를 암호화한다는 사실을 강력히 제시해준다(도 5 및 6 참조).
orf3*c 유전자는 스트렙토마이세스 프라디애에서 틸로신 생합성에 관여하는 글리코실트랜스퍼라제를 암호화하는 tylMII 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성(59% 동일성)을 나타내는 단백질을 암호화한다[참조: A.R. Gandecha et al., 1997; 젠뱅크 수탁 번호: CAA57472; BLAST 스코어: 448]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf3*c 유전자가 글리코실트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf3*c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 4 참조)
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf4*c 유전자는 몇 가지 크로토닐-CoA 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf4*c에 의해 암호화된 단백질은 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor)로부터의 크로토닐-CoA 리덕타제와 상당히 유사하다[참조: M. Redenbach et al., 1996; 젠뱅크 수탁 번호: NP_630556; BLAST 스코어: 772]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf4*c 유전자가 크로토닐-CoA 리덕타제를 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf4*c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 5 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf6* 유전자는 매크롤리드 항생제를 생산하는 스트렙토마이세스 미카로파시엔스(Streptomyces mycarofaciens)에 존재하는 mdmB 유전자와 특정의 유사성을 나타낸다[참조: Hara and Hutchinson, 1992; 젠뱅크 수탁 번호: A42719; BLAST 스코어: 489]. 이러한 생산자에서, 상기 유전자는 락톤 환의 아실화 반응에 관여한다. 따라서, orf6* 유전자는 아실트랜스퍼라제를 암호화하는 것으로 여겨진다. 이러한 가설은 orf6* 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 6 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf6* 유전자의 불활성화는 동위상 결실/역위에 의해 유발되었는데, 이는 생성된 균주가 스피라마이신 II와 III을 더 이상 생산하지 않고, 스피라마이신 I 만을 생산한다는 사실을 제시하였다(도 1 참조). 이는 orf6* 유전자가 실제로 스피라마이신 II와 III의 합성에 관여한다는 것을 확인시켜 준다. 상기 유전자에 의해 암호화된 효소는, 아세틸 또는 부티릴 그룹을 3-위치 내의 탄소에 부착시킴으로써 스피라마이신 II와 III의 형성에 책임이 있다. orf6* 유전자에 의해 암호화된 단백질을 더 이상 발현하지 않는 균주가 특히 유리한데, 이는 이들이 스피라마이신 II와 III은 더 이상 생산하지 않고, 스피라마이신 I 만을 생산하기 때문이다. 상기에 구체화된 바와 같이, 스피라마이신 I의 항생제 활성은 스피라마이신 II와 III의 항생제 활성 보다 훨씬 더 크다[참조: Liu et al., 1990].
orf5* 유전자는 몇 가지 O-메틸트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf5*에 의해 암호화된 단백질은 스트렙토마이세스 미카로파시엔스로부터의 O-메틸트랜스퍼라제(EC 2.1.1.-) MdmC와 상당한 유사성을 지닌다[참조: Hara & Hutchinson, 1992; 젠뱅크 수탁 번호: A42719; BLAST 스코어: 355]. 이와 같이, 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf5* 유전자가 O-메틸트랜스퍼라제를 또한 암호화한다는 사실을 강력히 제시해준다. orf5* 유전자는 락톤 환 내로 혼입된 전구체의 형성에 관여하는 것으로 여겨진다. 사실상, 서열 비교에 따르면, orf5* 유전자 생성물은 다음에 따르는 하이드록시말로닐-ACP의 메틸화에 책임이 있는 FkbG와 비교적 밀접하다[참조: Wu et al., 2000; Hoffmeister et al., 2000; 젠뱅크 수탁 번호: AAF86386; BLAST 스코어: 247](도 8 참조). 이러한 가설은 orf5* 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 7 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf6* 유전자 내로의 비-절제된 카세트의 삽입에 관한 극성 효과 때문에, orf5* 유전자가 스피라마이신에 대한 생합성 경로에 필수적이라는 사실을 결정할 수 있었다. 구체적으로 언급하면, 절제 가능한 카세트를 orf6* 유전자의 암호화 부위 내로 삽입하면, 스피라마이신 생산이 완전히 억제된다. 그러나, 삽입된 카세트가 일단 절제되면(그리고, 이에 따라 orf6* 유전자 만이 불활성화되는 경우; 실시예 14 및 15 참조), 스피라마이신 I의 생산이 다시 관찰된다. 이는 orf5* 유전자가 스피라마이신에 대한 생합성 경로에 필수적이란 사실을 보여주는데, 이는 이를 불활성화시키면 스피라마이신 생산이 완전히 억제되기 때문이다.
orf5* 유전자는 몇 가지 O-메틸트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. orf5* 유전자는 플라테놀리드의 합성에 직접적으로 관여하거나, 또는 PKS에 의해 플라테놀리드 내로 혼입된 메틸화 전구체(메톡시말로닐, 도 8 참조)의 합성에 관여하는 O-메틸트랜스퍼라제인 것으로 여겨진다. 이러한 가설을 입증하기 위해, LC/SM 및 NMR 분석 실험을 유전자형: orf6*::att1Ωhyg+의 에스. 암보파시엔스 균주 상에서 수행하였다. 이러한 균주에서는, orf5* 유전자가 발현되지 않았는데, 이는 전사 종결인자를 함유하는 카세트가 orf6* 유전자 내로 삽입됨에 따른 극성 효과 때문이다(실시예 27 참조). 상기 균주는 UV 스펙트럼이 스피라마이신 I과 유사한 외형을 지니지만, 질량 스펙트럼은 829에서 분자상 이온을 나타내는 분자를 생산한다는 사실이 밝혀졌다. 스피라마이신의 질량과 비교한 14 질량 상의 차이점은 락톤 환(이러한 화합물의 구조는 도 39에 도시되어 있다)의 탄소 번호 4에 의해 생성된 산소 상의 메틸 부재로써 설명할 수 있다. NMR에 의해 수득된 결과는 이러한 가설에 부합된다. 829 하의 특정 화합물이 존재하면, orf5*이 스피라마이신 생합성에 있어 일정 역할을 한다는 가설을 실증할 수 있다. 또한, 메틸 그룹을 갖지 않는 스피라마이신에 상응하는 생성물은 변형되지 않은 스피라마이신과 비교해서 극히 약한 미생물 활성(10배 정도 더 약함)을 나타내는데, 이는 미생물 미크로코쿠스 루테우스(Micrococcus luteus) 상에서 시험하였다.
orf7*c 유전자는 스트렙토마이세스 미카로파시엔스의 mdmA에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화하는데, 전자 단백질은 생산자 효소에서 미데카마이신 내성에 관여하는 단백질을 암호화한다[참조: Hara et al., 1990; 젠뱅크 수탁 번호: A60725; BLAST 스코어: 380]. 이와 같이, 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf7*c 유전자가 스피로마이신 내성에 관여한 단백질을 또한 암호화한다는 사실을 강력히 제시해준다. 보다 특히, orf7*c 유전자에 의해 암호화된 효소는 메틸트랜스퍼라제 활성을 지니고 있고, 스트렙토마이세스 암보파시엔스에서 스피라마이신 내성에 관여한다. 상기 유전자가 MLS I 유형의 내성(이러한 내성은 23S 리보솜성 RNA의 위치 A2058에서의 모노메틸화에 기인한 것으로 공지되어 있다)을 부여해 주는 것으로 입증되었다[참조: Pernodet et al., 1996]. 이러한 가설은 orf7*c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 8 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf8* 유전자는 스트렙토마이세스 그리세우스(Streptomyces griseus)에서 ABC 수송인자 유형의 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: Campelo, 2002; 젠뱅크 수탁 번호: CAC22119; BLAST 스코어: 191]. 이와 같이, ABC 수송인자 유형의 단백질과의 유사성은 orf8* 유전자가 스피라마이신 내성에 관여할 수 있는 ABC 수송인자 유형의 단백질을 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf8* 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 9 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf9* 유전자는 스트렙토마이세스 그리세우스에서 ABC 수송인자 유형의 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: Campelo, 2002; 젠뱅크 수탁 번호: CAC22118; BLAST 스코어: 269]. 이와 같이, ABC 수송인자 유형의 단백질과의 유사성은 orf9* 유전자가 스피라마이신 내성에 관여할 수 있는 ABC 수송인자 유형의 단백질을 또한 암호화한다는 사실을 제시해준다. 이러한 가설은 orf9* 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 10 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf10* 유전자는 공지되지 않은 기능의 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 그러나, orf10*과 유사한 유전자는 항생제 생합성에 관여하는 유전자의 몇몇 그룹 중에서 발견된다. 따라서, orf10*와 밀접한 유전자는 에스. 코엘리콜로르(S. coelicolor)에서 발견된다[참조: Redenbach et al., 1996, 젠뱅크 수탁 번호: NP_627432, BLAST 스코어: 109]. 밀접한 유전자(CouY)가 또한, 에스. 리쉬리엔시스(S. rishiriensis)에서 발견된다[참조: Wang et al., 2000, 젠뱅크 수탁 번호: AAG29779, BLAST 스코어 97].
PKS를 암호화하는 유전자의 상류에 위치한 유전자
PKS를 암호화하는 유전자의 상류에 위치한 DNA 서열에서는(하류 및 상류는 동일한 방향으로 모두 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 3 참조), 34개 ORF가 동정되었다(상기 참조). 따라서, 이러한 유형의 34개 개방 판독 프레임은 대략 41.7 kb의 영역[참조: 25개 ORF를 함유하는 31 kb의 제1 영역을 나타내는 서열 번호 1, 및 대략 12.1 kb의 영역(이의 1.4 kb는 선행 서열(서열 번호 1)과 중복되고, 이의 대략 10.7 kb는 후속 서열에 상응한데, 대략 10.7 kb의 후자 부분은 9개의 부가 ORF(ORF 부분 서열 포함)를 함유한다)을 나타내는 서열 번호 140(또한, 하기 도 3 및 37 참조)]을 차지한다. 해당 영역의 조직을 다이아그램으로 표시한 것이 도 5 및 37에 도시되어 있다. 동정된 34개 유전자는 다음과 같이 명명되었다: orf1, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10, orf11c, orf12, orf13c, orf14, orf15c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, orf23c, orf24c, orf25c, orf26, orf27, orf28c, orf29, orf30c, orf31, orf32c, orf33 및 orf34c.
다음 표 11에는, 5개의 PKS 유전자의 상류에서 동정된 34개 유전자의 DNA 서열과 아미노산 서열을 기준(참조)으로 하여 제시되어 있다.
1유전자 명칭에 부가된 "c"는 암호화 서열이 역배향으로 존재한다는 것을 지시한다(따라서, 암호화 쇄는 이들 유전자에 대해 서열 번호 1 또는 서열 번호 140에 제시된 서열에 상보적인 쇄이다).
2몇 가지 단백질 서열이 단일 orf로 지시된 경우에는, 상응하는 단백질이 여러 개의 가능한 해독 개시 부위로부터 유도된 것이다.
상기 표 11에 동정된 폴리펩티드의 기능을 결정할 목적으로, 3가지 유형의 실험을 수행하였다: 동정된 서열을 공지된 기능의 서열과 비교하는 실험; 유전자 불활성화 실험; 및 이들 돌연변이체 균주에 의한 스피라마이신 생산에 대한 분석 실험.
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 우선적으로, 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치, COGs(Cluster of Orthologous Groups), FASTA[참조: W.R. Pearson & D.J. Lipman, 1988 and W.R. Pearson, 1990], BEAUTY[참조: K.C. Worley et al., 1995](상기 참조). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다. 표 12에는 5개의 PKS 유전자의 상류에 위치한 34개 유전자와 강력한 유사성을 나타내는 단백질이 제시되어 있다.
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
이들 결과를 확인하기 위해, 유전자 불활성화 실험을 수행하였다. 사용된 방법은 유전자 대체를 수행하는 것으로 이루어진다. 개입중단시키고자 하는 표적 유전자를, 항생제(예를 들면, 아프라마이신 또는 히그로마이신)에 대한 내성을 부여해 주는 카세트에 의해 개입중단된 상기 유전자의 복사물로 대체시킨다. 사용된 카세트는 어느 한쪽이, 모든 판독 프레임 내의 해독 종결 코돈과 접해있고, 스트렙토마이세스에서 활성인 전사 종결인자와 접해있다. 상기 카세트를 표적 유전자 내로 삽입하는 것은 이러한 표적 유전자에서의 결실을 수반하거나 수반하지 않을 수 있다. 상기 카세트를 플랭킹하는 영역의 크기는 수 백개 염기쌍에서 부터 수 천개 염기쌍 범위일 수 있다. "절제 가능한 카세트"(상기 참조)로 지칭되는 제2 유형의 카세트를 유전자 불활성화에 사용할 수 있다. 이와 같이 하여 작제된 균주를 대상으로 하여, 이들의 스피라마이신 생산을 알아보기 위해 시험하였다.
orf1 유전자는 몇 가지 시토크롬 P450와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf1에 의해 암호화된 단백질은 스트렙토마이세스 프라디애에서 틸로신의 생합성에 관여하는 tylI 유전자에 의해 암호화된 단백질과 상당히 유사하다[참조: L.A. Merson-Davies et al., 1994; 젠뱅크 수탁 번호: S49051; BLAST 스코어: 530]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf1 유전자가 시토크롬 P450을 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf1 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 13 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf2 유전자는 아네우리니바실루스 더모애로필루스(Aneurinibacillus thermoaerophilus)의 dTDP-6-데옥시-3,4-케토헥술로스 이소머라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: Pfoestl, A. et al., 2003, 젠뱅크 수탁 번호: AAO06351; BLAST 스코어: 118]. 이와 같은 유사성은 orf2 유전자가 스피라마이신 분자에 존재하는 당 중의 하나, 가능하게는 미카로스의 생합성에 요구되는 이성체화 반응에 책임이 있는 이소머라제를 암호화한다는 사실을 강력히 제시해준다(도 5 참조). orf2 유전자의 불활성화를 수행하였다. 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 못한다는 사실이 밝혀졌다. 이는 orf2 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다.
orf3 유전자는 몇 가지 아미노트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf3에 의해 암호화된 단백질은 올레안도마이신 생합성에 관여하는 스트렙토마이세스 안티비오티쿠스(Streptomyces antibioticus)의 아미노트랜스퍼라제와 상당히 유사하다[참조: G. Draeger et al., 1999; 젠뱅크 수탁 번호: AAF59939; BLAST 스코어: 431]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf3 유전자가 스피라마이신의 아미노 당 중의 하나의 생합성에 필요한 아민기 전이 반응에 책임이 있는 3-아미노트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 5 참조). 이러한 가설은 orf3 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 15 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf3 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf3 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다. 스피라마이신 생성은 에스. 프라디애(S. fradiae)의 TylB 단백질의 발현에 의해 보충될 수 있다(실시예 23 참조). 이는 orf3 유전자가 미카미노스 생합성에 필요한 아민기 전이 반응에 책임이 있는 3-아미노트랜스퍼라제를 암호화한다는 사실을 입증해준다(도 5 참조). 미카미노스는 플라테놀리드에 부착될 제1 당이기 때문에, orf3 녹아웃(knockout)을 나타내는 균주(OS49.67)는 플라테놀리드를 축적할 것으로 예상된다.
orf3 유전자 녹아웃을 나타내는 균주의 생합성 중간체를 대상으로 연구하였다(실시예 20 참조). 이들 실험 결과, 상기 균주가 2가지 형태의 플라테놀리드, 즉 플라테놀리드 A와 플라테놀리드 B를 생산한다는 사실을 입증할 수 있었으며, 상기 2가지 분자의 추론되는 구조가 도 36에 도시되어 있다. 이러한 균주는 또한, 플라테놀리드 A + 미카로스와 플라테놀리드 B + 미카로스를 생산한다(실시예 20 및 도 40 참조). 이들 화합물은 당을 포함하지만, 어떠한 미카미노스도 포함하지 않는다. 또한, 이들을 스피라마이신과 비교할 경우(도 1 참조), 이들 화합물은 미카미노스 대신 미카로스를 포함한다. 이러한 결과는 orf3 유전자 생성물이 미카미노스 생합성에 관여하고 미카미노스 생합성에 요구되는 아민기 전이 반응에 책임이 있는 3-아미노트랜스퍼라제로서 역할을 한다는 사실과 일치한다(도 5 참조). 당화 특이성이 절대적인 것으로 여겨지지는 않는데, 이는 미카미노스에 의해 통상 점유된 위치에 부착된 미카로스를 갖는 분자가 발견되기 때문이라는 것을 인지할 수 있다(도 40 참조).
orf4 유전자는 몇 가지 NDP-글루코스 신테타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf4에 의해 암호화된 단백질은 스트렙토마이세스 베네주엘래(Streptomyces venezuelae)의 알파-D-글루코스-1-포스페이트 티미딜릴트랜스퍼라제와 상당히 유사하다[참조: Y. Xue et al., 1998; 젠뱅크 수탁 번호: AAC68682; BLAST 스코어: 404]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf4 유전자가 스피라마이신 분자 내로 혼입된 3가지 불규칙한 당의 생합성에 필요한 NDP-글루코스의 합성에 책임이 있는 NDP-글루코스 신테타제를 암호화한다는 사실을 강력히 제시해준다(도 4, 5 및 6 참조). 이러한 가설은 orf4 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 16 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf5 유전자는 몇 가지 글루코스 데하이드라타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf5에 의해 암호화된 단백질은 스트렙토마이세스 테네브라리우스(Streptomyces tenebrarius)의 dTDP-글루코스-4,6-데하이드라타제와 상당히 유사하다[참조: T.B.Li et al., 2001; 젠뱅크 수탁 번호: AAG18457; BLAST 스코어: 476]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf5 유전자가 스피라마이신 분자 내로 혼입된 3가지 불규칙한 당의 생합성에 필요한 NDP-글루코스 데하이드라타제를 암호화한다는 사실을 강력히 제시해준다(도 4, 5 및 6 참조). 이러한 가설은 orf5 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 17 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf6 유전자는 몇 가지 티오에스테라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf6에 의해 암호화된 단백질은 스트렙토마이세스 아베르미틸리스(Streptomyces avermitilis)의 티오에스테라제와 상당히 유사하다[참조: S. Omura et al., 2001; 젠뱅크 수탁 번호: BAB69315; BLAST 스코어: 234]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf6 유전자가 티오에스테라제를 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf6 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 18 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf7 유전자는 몇 가지 헥소스 데하이드라타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf7에 의해 암호화된 단백질은 틸로신 생합성에 관여하는 스트렙토마이세스 프라디애의 dNTP-헥소스 2,3-데하이드라타제(TylCVI 유전자에 의해 암호화됨)와 상당히 유사하다[참조: L.A. Merson-Davies et al., 1994; 젠뱅크 수탁 번호: AAF29379; BLAST 스코어: 461]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf7 유전자가 스피라마이신 분자 내로 혼입된 2가지 불규칙한 당의 생합성에 필요한 헥소스 2,3-데하이드라타제를 또한 암호화한다는 사실을 강력히 제시해준다(도 4 및 6 참조). 이러한 가설은 orf7 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 19 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf8 유전자는 몇 가지 아미노트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf8에 의해 암호화된 단백질은 삭카로폴리스포라 스피노사(Saccharopolyspora spinosa)에서 포로사민 생합성에 관여하는 것으로 추정되는 아미노트랜스퍼라제와 상당히 유사하다[참조: C. Waldron et al., 2001; 젠뱅크 수탁 번호: AAG23279; BLAST 스코어: 465]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf8 유전자가 포로사민 생합성에 필요한 아민기 전이 반응에 책임이 있는 4-아미노트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 6 참조). 이러한 가설은 orf8 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 20 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf8 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf8 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다. orf8 유전자 생성물이 포로사민 생합성에 있어 일정한 역할을 한다는 가설의 실증은, orf8 유전자에 대한 불활성화된 돌연변이체가 포로시딘을 생산하므로, 이러한 돌연변이체가 포로시딘 기(stage)에서 차단되고 어떠한 네오-스피라마이신도 생산하지 못한다는 사실에 의해 제공된다(도 7 및 실시예 25 참조). 이들 결과는 orf8 유전자 생성물이 포로사민 생합성에 관여한다는 사실에 부합된다(도 6 참조).
orf9c 유전자는 스트렙토마이세스 암보파시엔스에서 이미 동정되었으며, srmX로 명명되었다[참조: M. Geistlich et al., 1992]. 이러한 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 메틸트랜스퍼라제와 유사하다는 것은, orf9c 유전자가 미카미노스 또는 포로사민 생합성에 필요한 메틸화 반응에 책임이 있는 메틸트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 5 및 6 참조). 이러한 가설은 orf9c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 21 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf10 유전자는 스트렙토마이세스 암보파시엔스에서 이미 동정되었으며, srmR로 명명되었다[참조: M. Geistlich et al., 1992]. 이러한 유전자에 의해 암호화된 단백질은 스트렙토마이세스 암보파시엔스에서 스피라마이신에 대한 생합성 경로의 조절에 관여한다. orf10 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf10 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 단백질은 스피라마이신 생합성에 명백하게 필수적이다.
또한, orf10의 해독 개시 지점을 결정하였으며, 이러한 유전자를 과발현시키면, 스피라마이신 생산이 향상된다는 사실을 밝혀낼 수 있었다. 상기 해독 개시 부위는 문헌[참조: M. Geistlich et al., 1992]에 제안된 ATG의 상류에 위치한 ATG에 상응한다. 또한, 이러한 5' 말단이 Orf10의 기능에 필수적이란 사실이 입증되었는데, 이는 5'-절단된 메신저가 불활성이기 때문이다(실시예 17 참조). 스피라마이신 생산에 대한 목적하는 효과를 획득하기 위해서는, orf10의 5'-절단된 메신저는 발현되지 않도록 주의하면서 orf10의 과발현을 수행하는 것이 필수적이다.
orf11c 유전자는 스트렙토마이세스 암보파시엔스에서 이미 동정되었으며, srmB로 명명되었다[참조: M. Geistlich et al., 1992; and B. Schoner et al., 1992]. 이러한 유전자에 의해 암호화된 단백질은 스트렙토마이세스 암보파시엔스에서 스피라마이신 내성에 관여하고, 이는 ABC-유형 수송인자이다.
orf12 유전자는 몇 가지 헥소스 데하이드라타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf12에 의해 암호화된 단백질은 스트렙토마이세스 프라디애의 UrdQ 유전자에 의해 암호화되고 우르다마이신(urdamycin) 생합성에 관여하는 NDP-헥소스 3,4-데하이드라타제와 상당히 유사하다[참조: D. Hoffmeister et al., 1994; 젠뱅크 수탁 번호: AAF72550; BLAST 스코어: 634]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf12 유전자가 포로사민 생합성에 필요한 탈수 반응에 책임이 있는 3,4-데하이드라타제를 암호화한다는 사실을 강력히 제시해준다(도 6 참조). 이러한 가설은 orf12 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 22 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf12 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf12 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다. orf12가 포로사민 생합성에 있어 일정한 역할을 한다는 가설의 실증은, orf12 유전자에 대한 불활성화된 돌연변이체가 더 이상 포로사민을 생산하지 못한다는 사실에 의해 제공된다. 그러나, 이는 소량의 포로시딘을 생산한다. 따라서, 이러한 변이체는 포로시딘 기에서 차단되고 어떠한 네오-스피라마이신도 생산하지 못한다(도 7 및 실시예 26 참조). 상기 돌연변이체는 또한, 도 38에 제시된 구조를 갖는 화합물을 생산한다. 후자 화합물은 2개의 당, 즉 미카미노스와 미카로스를 함유하지만, 포로사민은 전혀 함유하지 않는다. 또한, 이를 스피라마이신의 구조와 비교할 경우(도 1 참조), 상기 화합물은 포로사민의 예상된 위치에 당 미카로스를 함유한다. 이들 결과는 orf12 유전자 생성물이 포로사민 생합성에 관여한다는 사실에 부합된다(도 6 참조). 당화 특이성이 절대적인 것으로 여겨지지는 않는데, 이는 미카로스가 포로사민에 의해 통상 점유된 위치에 부착된 분자가 발견되기 때문이라는 것을 인지할 수 있다(도 38 참조).
orf13c 유전자는 스트렙토마이세스 코엘리콜로르에서 공지되지 않은 기능의 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 이러한 단백질은 SC4H2.17(젠뱅크 수탁 번호: T35116; BLAST 스코어: 619)로 명명된다. orf13c 유전자에 의해 암호화된 단백질은 기타 유기체의 기타 단백질과 강력한 유사성을 또한 나타낸다(표 23 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf13c에 의해 암호화된 것과 밀접한 단백질에 기인하는 정확한 어떠한 기능도 없었다. 스트렙토마이세스 암보파시엔스에서 스피라마이신에 대한 생합성 경로에 있어서 상기 유전자의 기능을 연구할 목적으로 orf13c 유전자를 불활성화시켰다. 이로써 생성된 균주가 스피라마이신을 생산한다는 사실을 밝혀낼 수 있었다. 이는 orf13c 유전자가 스피라마이신 생합성에 필수적이지 않고 상기 세균의 생존에 필수적이지 않다는 것을 지시한다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 책임이 없다.
orf14 유전자는 추정상의 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: M. Redenbach et al., 1996; Bentley et al., 2002; 젠뱅크 수탁 번호: CAB90862; BLAST 스코어: 147].
orf14 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf14 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다. orf14 유전자 녹아웃을 나타내는 균주의 생합성 중간체를 대상으로 연구하였다(실시예 20 참조). 이들 실험 결과, 상기 균주가 플라테놀리드 A는 생산하지만, 플라테놀리드 B는 생산하지 못한다는 사실을 입증할 수 있었다(도 36 참조).
orf15c 유전자는 몇 가지 케토 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf15c에 의해 암호화된 단백질은 스트렙토마이세스 안티비오티쿠스에서 3-케토 리덕타제와 상당히 유사하다[젠뱅크 수탁 번호: T51102; BLAST 스코어: 285]. 이러한 유사성은 orf15c 유전자가 포로사민 생합성에 필요한 환원 반응에 책임이 있는 3-케토 리덕타제를 암호화한다는 사실을 강력히 제시해준다(도 6 참조). 이러한 가설은 orf15c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 24 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf16 유전자는 몇 가지 이소머라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf16에 의해 암호화된 단백질은 스트렙토마이세스 프라디애에서 NDP-헥소스 3,4-이소머라제와 상당히 유사하다[참조: Gandecha et al., 1997; 젠뱅크 수탁 번호: CAA57471; BLAST 스코어: 209]. 이러한 유사성은 orf16 유전자가 스피라마이신의 당 중의 하나의 생합성에 관여하는 단백질을 암호화한다는 사실을 강력히 제시해준다(도 5 및 6 참조). 이러한 가설은 orf16 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 25 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf17 유전자는 몇 가지 글리코실트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf17에 의해 암호화된 단백질은 스트렙토마이세스 베네주엘래의 글리코실트랜스퍼라제와 상당히 유사하다[참조: Y. Xue et al., 1998; 젠뱅크 수탁 번호: AAC68677; BLAST 스코어: 400]. orf17 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 글리코실 트랜스퍼라제 유사하다는 것은, 상기 유전자가 글리코실트랜스퍼라제를 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf17 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 26 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf18 유전자는 몇 가지 글리코실트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf18에 의해 암호화된 단백질은 스트렙토마이세스 리쉬리엔시스의 글리코실트랜스퍼라제와 상당히 유사하다[참조: Wang et al., 2000; 젠뱅크 수탁 번호: AAG29785; BLAST 스코어: 185]. orf18 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 글리코실 트랜스퍼라제와 유사하다는 것은, 상기 유전자가 글리코실트랜스퍼라제를 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf18 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 27 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf19 유전자는 몇 가지 케토 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf19에 의해 암호화된 단백질은 스트렙토마이세스 프라디애의 NDP-헥소스 4-케토 리덕타제(TylCIV)와 상당히 유사하다[참조: Bate et al., 2000; 젠뱅크 수탁 번호: AAD41822; BLAST 스코어: 266]. orf19 유전자에 의해 암호화된 단백질이, 밀접한 특정 항생제에 대한 생합성 경로에 관여하는 상기 케토 리덕타제와 유사하다는 것은, 상기 유전자가 미카로스 생합성에 필요한 환원 반응에 책임이 있는 4-케토 리덕타제를 또한 암호화한다는 사실을 강력히 제시해준다(도 4 참조). 이러한 가설은 orf19 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 28 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf20 유전자는 몇 가지 헥소스 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf20에 의해 암호화된 단백질은 dTDP-4-케토-L-6-데옥시헥소스 2,3-리덕타제를 암호화하는 삭카로폴리스포라 에리트래아(Saccharopolyspora erythraea)의 EryBII와 상당히 유사하다[참조: R.G. Summers et al., 1997; 젠뱅크 수탁 번호: AAB84068; BLAST 스코어: 491]. orf20c 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 헥소스 리덕타제와 유사하다는 것은, 상기 유전자가 미카로스 생합성에 필요한 환원 반응에 책임이 있는 2,3-리덕타제를 암호화한다는 사실을 강력히 제시해준다(도 4 참조). 이러한 가설은 orf20c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 29 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf21c 유전자는 몇 가지 헥소스 메틸트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf21c에 의해 암호화된 단백질은 NDP-헥소스 3-C-메틸트랜스퍼라제를 암호화하는 스트렙토마이세스 프라디애의 TylCIII 유전자와 상당히 유사하다[참조: N. Bate et al., 2000; 젠뱅크 수탁 번호: AAD41823; BLAST 스코어: 669]. orf21c 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 헥소스 메틸트랜스퍼라제와 유사하다는 것은, 상기 유전자가 미카로스 생합성에 필요한 메틸화 반응에 책임이 있는 헥소스 메틸트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 4 참조). 이러한 가설은 orf21c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 30 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf22c 유전자는 메톡시말로닐 생합성에 관여하는 효소를 암호화하는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스(Streptomyces hygroscopicus var. ascomyceticus)의 fkbH 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: K. Wu et al., 2000; 젠뱅크 수탁 번호: AAF86387; BLAST 스코어: 463]. orf22c 유전자에 의해 암호화된 단백질이, 밀접한 또 다른 매크롤리드에 대한 생합성 경로에 관여하는 상기 단백질과 유사하다는 것은, 이러한 유전자가 스트렙토마이세스 암보파시엔스에서 메톡시말로닐 생합성에 관여하는 효소를 또한 암호화한다는 사실을 강력히 제시해준다(도 8 참조).
orf23c 유전자는 메톡시말로닐에 관여하는 아실-CoA 데하이드로게나제를 암호화하는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스의 fkbI 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: K. Wu et al., 2000; 젠뱅크 수탁 번호: AAF86388; BLAST 스코어: 387]. orf23c 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 아실-CoA 데하이드로게나제와 유사하다는 것은, 이러한 유전자가 메톡시말로닐 생합성에 관여하는 아실-CoA 데하이드로게나제를 암호화한다는 사실을 강력히 제시해준다(도 8 참조). 이러한 가설은 orf23c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 31 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf24c 유전자는 메톡시말로닐 생합성에 관여하는 아실 운반체 단백질(ACP)를 암호화하는 것으로 여겨지는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스의 fkbJ 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: K. Wu et al., 2000; 젠뱅크 수탁 번호: AAF86389; BLAST 스코어: 87]. orf24c 유전자에 의해 암호화된 단백질이, 밀접한 또 다른 매크롤리드에 대한 생합성 경로에 관여하는 상기 단백질과 유사하다는 것은, 이러한 유전자가 스트렙토마이세스 암보파시엔스에서 메톡시말로닐 생합성에 관여하는 단백질을 암호화한다는 사실을 강력히 제시해준다(도 8 참조).
orf25c 유전자는 메톡시말로닐 생합성에 관여하는 아실-CoA 데하이드로게나제를 암호화하는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스의 fkbK 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: K. Wu et al., 2000; 젠뱅크 수탁 번호: AAF86390; BLAST 스코어: 268]. orf25c 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 아실-CoA 데하이드로게나제와 유사하다는 것은, 이러한 유전자가 메톡시말로닐 생합성에 관여하는 아실-CoA 데하이드로게나제를 암호화한다는 사실을 강력히 제시해준다(도 8 참조). 이러한 가설은 orf25c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 32 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf26 유전자는 스트렙토마이세스 프라디애에서 틸로신 생합성에 관여하는 미카로실트랜스퍼라제를 암호화하는 tylCV 유전자에 의해 암호화된 단백질과 65% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[참조: N. Bate et al., 2000; 젠뱅크 수탁 번호: AAD41824; BLAST 스코어: 471]. 보다 특히, TylCV는 틸로신 합성 동안 미카로스 분자와 결합하는 글리코실트랜스퍼라제이다. 이와 같이, 비교적 밀접한 또 다른 항생제에 대한 생합성 경로, 보다 특히 미카로스 전이에 관여하는 단백질과의 유사성은 orf26 유전자가 글리코실트랜스퍼라제라는 사실을 제시해준다. 이러한 가설은 orf26 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 33 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf27 유전자는 스트렙토마이세스 프라디애에서 틸로신 생합성에 관여하는 NDP-헥소스 3,5-(또는 5-) 에피머라제를 암호화하는 tylCVII 유전자에 의해 암호화된 단백질과 70% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[참조: N. Bate et al., 2000; 젠뱅크 수탁 번호: AAD41825; BLAST 스코어: 243]. 보다 특히, TylCVII는 미카로스 생합성에 관여하는 헥소스 3,5-(또는 5-) 에피머라제이다. 이와 같이, 비교적 밀접한 또 다른 항생제에 대한 생합성 경로, 보다 특히 미카로스 생합성에 관여하는 단백질과의 유사성은 orf27 유전자가 에피머라제를 암호화한다는 사실을 제시해준다. 이러한 가설은 orf27 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 34 참조). BLAST 프로그램을 사용하여 수득된 밀접한 서열 분석 결과는, orf27 유전자가 미카로스 생합성에 필요한 에피머화 반응에 책임이 있는 5-에피머라제를 암호화한다는 사실을 강력히 제시해준다(도 4 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf28c의 서열을 초기에 부분적으로 결정하였는데, 이는 대략 450개 염기쌍 영역의 서열 만이 서열 분석 후에 결정되었기 때문이다(이러한 영역은 서열 번호 106의 불완전 서열에서 "N"으로 상징된다). 그럼에도 불구하고, 이러한 ORF의 부분 서열(서열 번호 111)은 상기 설명된 바와 같은 각종 컴퓨터 프로그램을 이용한 분석에 사용되었다. 따라서, orf28c 유전자가, 스트렙토마이세스 더모톨레란스(Streptomyces thermotolerans)에서 카보마이신 생합성에 관여하는 조절성 단백질을 암호화하는 acyB2 유전자에 의해 암호화된 단백질과, 결정된 서열(Orf28c 단백질의 부분 서열인 서열 번호 112) 상에서 64% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다는 것을 결정할 수 있었다[참조: A. Arisawa et al., 1993; 젠뱅크 수탁 번호: JC2032; BLAST 스코어: 329]. 이와 같은, 비교적 밀접한 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은, orf28c 유전자가 스피라마이신 생합성에 관여하는 조절성 단백질을 암호화한다는 사실을 제시해준다. 이러한 가설은 orf28c 유전자에 의해 암호화된 단백질이 스트렙토마이세스 프라디애에서 틸로신 생합성에 관여하는 조절성 단백질인 TylR 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다[참조: N. Bate et al., 1999; 젠뱅크 수탁 번호: AAF29380; BLAST 스코어: 167].
결정되지 않은 서열의 어느 한쪽에 위치한 올리고뉴클레오티드를 사용하여 orf28c 유전자를 증폭시키고, 이를 발현 벡터 내로 아클로닝시키는 것이 가능하였다. 따라서, orf28c 유전자의 과발현이 OSC2 균주에서 스피라마이신 생산을 상당히 증가시킨다는 사실을 결정할 수 있었다(실시예 24 참조). 이는, orf28c 유전자를 과발현시키면, 스피라마이신 생산이 증가된다는 것을 입증해주며, 스피라마이신에 대한 생합성 경로의 조절인자로서의 이의 역할을 확인시켜 준다.
orf28c의 부분 서열을 후속 완성시키고, 대략 450개 염기쌍의 결손 영역을 결정하였다(서열 번호 140 및 서열 번호 141 참조). 이러한 ORF의 완전한 서열(서열 번호 141)은 상기 설명된 바와 같은 각종 컴퓨터 프로그램을 이용한 분석에 사용되었다. 따라서, orf28c 유전자가, 스트렙토마이세스 더모톨레란스에서 카보마이신 생합성에 관여하는 조절성 단백질을 암호화하는 acyB2 유전자에 의해 암호화된 단백질과, 결정된 서열(Orf28c 단백질의 완전한 서열인 서열 번호 142) 상에서 69% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다는 것을 결정할 수 있었다[참조: A. Arisawa et al., 1993; 젠뱅크 수탁 번호: JC2032; BLAST 스코어: 451]. 이와 같은, 비교적 밀접한 항생제의 생합성을 조절하는데 관여하는 단백질과의 유사성은, orf28c 유전자가 스피라마이신 생합성에 관여하는 조절성 단백질을 암호화한다는 사실을 제시해준다. 이러한 가설은 orf28c 유전자에 의해 암호화된 단백질이 스트렙토마이세스 프라디애에서 틸로신 생합성을 조절하는데 관여하는 조절성 단백질인 TylR 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다[참조: N. Bate et al., 1999; 젠뱅크 수탁 번호: AAF29380; BLAST 스코어: 224]. 상기 유전자를 과발현시킨 결과(실시예 24 참조), 이것이 스피라마이신 생합성 경로의 조절인자로 역할을 한다는 사실을 확인하였다.
orf28c 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf28c 유전자가 명백하게도 스피라마이신 생합성에 관여하고 있고, 스피라마이신 생합성에 필수적이란 사실을 확인시켜 준다. 이들 결과를, 상기 유전자의 과발현 결과와 조합해 보면(실시예 24 참조), Orf28c가 스피라마이신 생합성에 필수적인 활성인자로서의 역할을 한다는 사실과 일치한다.
orf29 유전자는 소란기움 셀룰로숨(Sorangium cellulosum)에서 소라펜(soraphen) A(폴리케티드 부류의 항진균제)의 생합성에 관여하는 유전자 그룹 내에 위치한 것으로 예상되는 글리코실 하이드롤라제와 31% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[참조: J. Ligon et al., 2002; 젠뱅크 수탁 번호: AAK19890; BLAST 스코어: 139]. 이와 같이, 비교적 밀접한 분자에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf29 유전자가 글리코실 하이드롤라제 활성을 지닌 단백질을 암호화한다는 사실을 제시해준다. 이러한 가설은 orf29 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 35 참조). CD-서치 프로그램(상기 참조)을 사용하여, orf29에 의해 암호화된 단백질의 서열을 분석한 결과는 orf29 유전자가 글리코실 하이드롤라제를 암호화한다는 사실을 또한 제시해준다.
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
SignalP 프로그램(http://www.cbs.dtu.dk/services/SignalP/)[참조: Nielsen, H., et al., 1997]을 사용하여, orf29로부터 추론된 단백질 서열을 분석한 결과, 상기 단백질이 위치 30과 31 사이에 예정된 절단 부위를 갖는 C-말단 시그널 서열(QSA/QA)를 갖는 것으로 밝혀졌다. 이러한 단백질은 세포외 단백질인 것으로 예상할 수 있다. 이는 글리코실하이드롤라제로서, 글리코실트랜스퍼라제 GimA 및/또는 GimB에 의한 당화에 의해 불활성화된 스피라마이신의 재활성화에 일정 역할을 할 수도 있다[참조: Gourmelen et al, 1998].
orf30c 유전자는 코리네박테륨 글루타미쿰(Corynebacterium glutamicum)에서 뉴클레오시드-디포스페이트 당 에피머라제와 31% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[젠뱅크 수탁 번호: NP_600590; BLAST 스코어: 89]. 이러한 유사성은 orf30c 유전자가 에피머라제를 암호화한다는 사실을 제시해준다. 이러한 가설은 CD-서치 프로그램(상기 참조)을 사용하여 상기 서열을 분석한 결과, orf30c 유전자가 에피머라제를 암호화한다는 사실을 또한 제시해준다는 사실에 의해 뒷받침된다.
orf30c은 각각 345개 및 282개 아미노산의 2가지 가능한 단백질(서열 번호 116 및 117)을 제공해주는 2가지 가능한 개시 코돈(서열 번호 115 참조)을 나타낸다. 그러나, 코돈 활용은 단지 제2 ATG로부터 유래된 스트렙토마이세스에 전형적인 것이며; 또한, 제1 ATG와 제2 ATG 간의 서열의 추론된 단백질 서열은 동정된 밀접한 서열과 정렬되지 않는 반면, 보다 짧은 단백질 서열(제2 ATG로부터 유래됨: 서열 번호 144)은 이들 단백질의 개시부와 정확하게 정렬된다. 따라서, 이로부터, 제2 ATG가 정확한 개시 코돈이므로, 이러한 orf의 서열이 서열 번호 143에 제시된 것인데, 이는 일단 해독되면, 서열 번호 144의 단백질에 상응한다는 사실을 추론할 수 있다.
orf31 유전자는 스트렙토마이세스 코엘리콜로르에서 옥시도리턱타제와 52% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[젠뱅크 수탁 번호: NP_631148; BLAST 스코어: 261]. 이러한 유사성은 orf31 유전자가 리덕타제를 암호화한다는 사실을 제시해준다. 이러한 가설은 CD-서치 프로그램(상기 참조)을 사용하여 상기 서열을 분석한 결과, orf31 유전자가 리덕타제를 암호화한다는 사실을 또한 제시해준다는 사실에 의해 뒷받침된다. 이러한 가설은 또한, orf31 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 36 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf31 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf31 유전자가 실제로 스피라마이신 생합성에 관여한다는 사실을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 단백질은 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다.
orf32c의 서열을 우선적으로, 부분적으로 결정하였는데(실시예 19 참조), 이는 5' 위치에서의 암호화 서열이 제2 단계에서만 결정되었기 때문이다. 그러나, 이러한 orf의 부분 서열(서열 번호 120)은 상기 설명된 바와 같은 각종 컴퓨터 프로그램을 이용한 분석에 사용되었다. 따라서, orf32c 유전자가, 스트렙토마이세스 코엘리콜로르에서 GntR 계열의 조절성 단백질과, 결정된 서열(Orf32c 단백질의 부분 서열인 서열 번호 121) 상에서 47% 동일성(BLAST를 사용하여 결정함)을 나타내는 단백질을 암호화한다는 것을 결정할 수 있었다[젠뱅크 수탁 번호: NP_625576; BLAST 스코어: 229]. 이러한 유사성은, orf32c 유전자가 GntR 계열의 전사 조절인자를 암호화한다는 사실을 제시해준다. 이러한 가설은 orf32c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다.
orf32c의 부분 서열을 후속 완성시키고, 결손 영역을 결정하였다(서열 번호 140 및 서열 번호 145 참조). 이러한 orf의 완전한 서열은 스트렙토마이세스 아베르미틸리스에서 GntR 계열의 조절성 단백질과 44% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[젠뱅크 수탁 번호: NP_824604; BLAST 스코어: 282]. 이러한 유사성은, orf32c 유전자가 GntR 계열의 전사 조절인자를 암호화한다는 사실을 제시해준다. 이러한 가설은 orf32c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 37 참조).
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
스트렙토마이세스 암보파시엔스에서 스피라마이신 생합성 경로에 있어서의 상기 유전자의 기능을 연구할 목적으로 orf32c 유전자를 불활성화시켰다. 이로써 생성된 균주가 스피라마이신을 생산한다는 사실을 밝혀낼 수 있었다. 이는 orf32c 유전자가 스피라마이신 생합성에 필수적이지 않고 상기 세균의 생존에 필수적이지 않다는 것을 지시한다.
orf33 유전자는 크산토모나스 캄페스트리스(Xanthomonas campestris)의 가상의 단백질과 49% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[젠뱅크 수탁 번호: NP_635564; BLAST 스코어: 54].
orf34c의 서열은 부분적이다. 사실상, 이러한 orf의 생성물과 데이터베이스 간에 수행된 비교 결과는, 상기 단백질의 C-말단 부분이 해당 뉴클레오티드 서열로부터 추론된 생성물 내에 존재하지 않으므로, 상기 orf가 서열 분석된 영역 보다 더 길고 이러한 영역을 벗어나서 연장된다는 사실을 제시해준다. 그러나, 상기 ORF의 부분 서열은 상기 설명된 바와 같은 각종 컴퓨터 프로그램을 이용한 분석에 사용되었다. 따라서, orf34c 유전자가, 스트렙토마이세스 코엘리콜로르로부터의 아라비노푸라노시다제와, 결정된 서열(Orf34c 단백질의 부분 서열인 서열 번호 150) 상에서 91% 동일성(BLAST를 사용하여 결정함)을 나타내는 단백질을 암호화한다는 것을 결정할 수 있었다[참조: Bentley et al., 2002; 젠뱅크 수탁 번호: NP_630049; BLAST 스코어: 654]. 에스. 코엘리콜로르(S. coelicolor)에서는, 이러한 아라비노푸라노시다제를 암호화하는 유전자가 2차 대사물 생합성에 관여하는 것으로 여겨지지 않는다. 따라서, 에스. 암보파시엔스에서는 상기 유전자가 스피라마이신 생합성에 관여하지 않는 것으로 예상된다.
본 발명의 주제는 또한, 고도로 엄격한 하이브리드화 조건 하에서, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 하나 이상의 폴리뉴클레오티드, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나와 하이브리드화되는 폴리뉴클레오티드이다. 우선적으로는, 이들 폴리뉴클레오티드를 스트렙토마이세스 속 세균으로부터 분리시키고, 보다 우선적으로는 이들 폴리뉴클레오티드가 매크롤리드의 생합성에 관여하는 단백질을 암호화하며, 보다 더 우선적으로는 이들 폴리뉴클레오티드가, 이들과 하이브리드화되는 폴리뉴클레오티드에 의해 암호화된 단백질과 유사한 활성을 지닌 단백질을 암호화한다. 고도로 엄격한 하이브리드화 조건은 비-상동성 핵산 쇄의 하이브리드화에는 바람직하지 못한 하이브리드화 조건으로서 규정될 수 있다. 고도로 엄격한 하이브리드화 조건은, 예를 들어, 하이브리드화 온도 55 내지 65℃, 바람직하게는 하이브리드화 온도 55℃, 보다 더 바람직하게는 하이브리드화 온도 60℃, 가장 바람직하게는 하이브리드화 온도 65℃ 하에 문헌[참조: Church & Gilbert, 1984]에 기재된 완충액 중에서 하이브리드화시킨 다음, 55 내지 65℃, 바람직하게는 55℃, 보다 더 바람직하게는 60℃, 가장 바람직하게는 65℃ 하에 2X SSC 완충액에서 1회 이상의 세척을 수행한 다음, 55 내지 65℃, 바람직하게는 55℃, 보다 더 바람직하게는 60℃, 가장 바람직하게는 65℃ 하에 0.5X SSC 완충액에서 1회 이상 세척하는 조건으로서 서술될 수 있다. 상기 언급된 하이브리드화 조건은 당업자에게 공지된 기술에 따라서, 하이브리드화하고자 하는 핵산의 길이 또는 선택된 표지화 유형의 함수로서 조정할 수 있다. 적합한 하이브리드화 조건은, 예를 들어, 문헌[참조: F. Ausubel et al (2002)]에 따라서 조정할 수 있다.
본 발명은 또한, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 뉴클레오티드 서열, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나로 이루어진 그룹 중에서 선택된 폴리뉴클레오티드, 또는 상보적 서열의 폴리뉴클레오티드의 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 또는 1900개 이상의 연속되는 뉴클레오티드를 포함하는 폴리뉴클레오티드와 70% 이상, 보다 바람직하게는 80%, 보다 바람직하게는 85%, 보다 더 바람직하게는 90%, 보다 더 바람직하게는 95%, 가장 바람직하게는 98% 뉴클레오티드 동일성을 나타내는 폴리뉴클레오티드에 관한 것이다. 우선적으로는, 이들 폴리뉴클레오티드를 스트렙토마이세스 속 세균으로부터 분리시키고, 보다 우선적으로는 이들 폴리뉴클레오티드가 매크롤리드의 생합성에 관여하는 단백질을 암호화하며, 보다 더 우선적으로는 이들 폴리뉴클레오티드가, 이들과 동일성을 나타내는 폴리뉴클레오티드에 의해 암호화된 단백질과 유사한 활성을 지닌 단백질을 암호화한다. 가장 바람직하게는, 본 발명에 따르는 폴리뉴클레오티드가 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 뉴클레오티드 서열로 이루어진 그룹 중에서 선택되거나 또는 상보 서열의 폴리뉴클레오티드이다.
비교를 위해 서열을 최적으로 정렬시키는 것은 공지된 연산방식, 예를 들면, 특히 공급원[INFOBIOGEN resource center, Evry, France]로부터 입수 가능한 FASTA 패키지[참조: W.R. Pearson & D.J. Lipman, 1988 and W.R. Pearson, 1990]의 연산방식을 이용하여 컴퓨터 상에서 수행할 수 있다. 예시하자면, 서열 동일성(%)은 LFASTA[참조: K.-M. Chao et al., 1992] 또는 LALIGN[참조: X. Huang and W. Miller, 1991] 소프트웨어를 사용하여 결정할 수 있다. LFASTA 및 LALIGN 프로그램은 FASTA 패키지의 일부이다. LALIGN은 최적의 국소 정렬을 제공해주는데, 이러한 프로그램은 보다 정밀하지만, LFASTA 보다 느리다.
본 발명의 또 다른 국면은 상기 규정된 바와 같은 핵산 서열의 발현으로부터 비롯되는 폴리펩티드에 관한 것이다. 우선적으로, 본 발명에 따르는 폴리펩티드는 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 및 150; 또는 기능적 특성에는 전혀 영향을 미치지 않으면서, 모든 서열을 따라 1개 이상의 아미노산이 치환, 삽입 또는 결실된 것을 제외한 상기 서열들 중의 하나; 또는 이들 서열의 변이체들 중의 하나 중에서 선택된 폴리펩티드의 10, 15, 20, 30 내지 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 또는 640개 이상의 연속되는 아미노산을 포함하는 폴리펩티드와 70% 이상, 보다 바람직하게는 80%, 보다 바람직하게는 85%, 보다 더 바람직하게는 90%, 보다 더 바람직하게는 95%, 가장 바람직하게는 98% 이상의 아미노산 동일성을 나타낸다. 우선적으로는, 본 발명에 따르는 폴리펩티드가 스트렙토마이세스 속 세균에 의해 천연 상태로 발현되고, 보다 우선적으로는 이들 폴리펩티드가 매크롤리드의 생합성에 관여하며, 보다 더 우선적으로는 이들 폴리펩티드가, 이들과 동일성을 공유하는 폴리펩티드와 유사한 활성을 지닌다. 바람직하게는, 본 발명에 따르는 폴리펩티드가 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 및 150의 폴리펩티드 서열; 또는 기능적 특성에는 전혀 영향을 미치지 않으면서, 모든 서열을 따라 1개 이상의 아미노산이 치환, 삽입 또는 결실된 것을 제외한 상기 서열들 중의 하나; 또는 이들 서열의 변이체들 중의 하나로 이루어진 그룹 중에서 선택된다. 가장 바람직하게는, 본 발명에 따르는 폴리펩티드가 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 및 150의 폴리펩티드 서열로 이루어진 그룹 중에서 선택된다.
비교를 위해 서열을 최적으로 정렬시키는 것은 공지된 연산방식, 예를 들면, 특히 공급원[INFOBIOGEN resource center, Evry, France]로부터 입수 가능한 FASTA 패키지[참조: W.R. Pearson & D.J. Lipman, 1988 and W.R. Pearson, 1990]의 연산방식을 이용하여 컴퓨터 상에서 수행할 수 있다. 예시하자면, 서열 동일성(%)은 공급원[INFOBIOGEN resource center, Evry, France]에 의해 규정된 바와 같은 디폴트(default) 파라미터를 이용하는 LFASTA[참조: K.-M. Chao et al., 1992] 또는 LALIGN[참조: X. Huang and W. Miller, 1991] 소프트웨어를 사용하여 결정할 수 있다. LFASTA 및 LALIGN 프로그램은 FASTA 패키지의 일부이다. LALIGN은 최적의 국소 정렬을 제공해주는데, 이러한 프로그램은 보다 정밀하지만, LFASTA 보다 느리다.
본 발명의 또 다른 국면은 상기 규정된 바와 같은 하나 이상의 폴리뉴클레오티드를 포함하는 재조합 DNA에 관한 것이다. 우선적으로는, 이러한 재조합 DNA가 벡터이다. 보다 더 우선적으로는, 상기 벡터가 박테리오파아지, 플라스미드, 파아지미드, 통합 벡터, 포스미드, 코스미드, 셔틀 벡터, BAC(세균성 인공 염색체) 및 PAC(P1-유도된 인공 염색체) 중에서 선택된다. 예시하자면, 람다 파아지와 M13 파아지가 박테리오파아지로서 언급될 수 있다. 플라스미드로서, 이. 콜라이에서 복제되는 플라스미드, 예를 들면, pBR322 및 이의 유도체, pUC18 및 이의 유도체, pUC19 및 이의 유도체, pGB2 및 이의 유도체[참조: G. Churchward et al., 1984], pACYC177(젠뱅크 수탁 번호: X06402) 및 이의 유도체, 및 pACYC184(젠뱅크 수탁 번호: X06403) 및 이의 유도체가 언급될 수 있다. 또한, 스트렙토마이세스에서 복제되는 플라스미드, 예를 들면, pIJ101 및 이의 유도체, pSG5 및 이의 유도체, SLP1 및 이의 유도체, 및 SCP2* 및 이의 유도체[참조: Kieser et al. 2000]를 언급할 수 있다. 파아지미드로서, 예를 들면, pBluescript II 및 이의 유도체[특히, Stratagene(LaJolla, California, USA) 회사로부터 시판됨], pGEM-T 및 이의 유도체[Promega(Madison, Wisconsin, USA) 회사로부터 시판됨], [lacuna] IS117 통합 시스템[참조: Kieser et al., 2000]을 언급할 수 있다. 포스미드로서, 예를 들면, 포스미드 pFOS1[New England Bioloabs Inc., Beverly, Massachussetts, USA 회사로부터 시판됨] 및 이의 유도체를 언급할 수 있다. 코스미드로서, 예를 들면, 코스미드 SuperCos 및 이의 유도체[특히, Stratagene(LaJolla, California, USA) 회사로부터 시판됨] 및 코스미드 pWED15[참조: Wahl et al., 1987] 및 이의 유도체가 언급될 수 있다. 셔틀 벡터로서, 이. 콜라이/스트렙토마이세스 셔틀 플라스미드, 예를 들면, pIJ903 및 이의 유도체, 플라스미드 pUWL, pCAO106, pWHM3 및 pOJ446 시리즈 및 이의 유도체[참조: Kieser et al. 2000], 및 이. 콜라이/스트렙토마이세스 셔틀 BAC, 예를 들면, WO 01/40497에 기재된 것을 언급할 수 있다. BAC (세균성 인공 염색체)로서, 예를 들면, BAC pBeloBAC11(젠뱅크 수탁 번호: U51113)를 언급할 수 있다. PAC(P1-유도된 인공 염색체)로서, 예를 들면, 벡터 pCYPAC6(젠뱅크 수탁 번호: AF133437)를 언급할 수 있다. 가장 바람직하게는, 본 발명에 따르는 벡터가 pOS49.1, pOS49.11, pOSC49.12, pOS49.14, pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5, pSPM7, pOS49.67, pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504, pSPM507, pSPM508, pSPM509, pSPM1, pBXL1111, pBXL1112, pBXL1113, pSPM520, pSPM521, pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, pSPM47, pSPM48, pSPM50, pSPM51, pSPM52, pSPM53, pSPM55, pSPM56, pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74, pSPM75, pSPM79, pSPM83, pSPM107, pSPM543 및 pSPM106 중에서 선택된다.
본 발명의 또 다른 국면은 생물학적 시스템에서 상기 언급된 바와 같은 하나 이상의 폴리펩티드의 발현을 허용해 주는 숙주 세포와 적합한 발현 벡터를 포함하는 발현 시스템에 관한 것이다. 본 발명에 따르는 발현 벡터는 상기 언급된 바와 같은 하나 이상의 폴리펩티드를 암호화하는 핵산 서열을 포함하고, 당업자에게 널리 공지된 각종 숙주 세포에서 본 발명에 따르는 각종 폴리펩티드의 발현을 위해 의도될 수 있다. 예를 들면, 원핵성 발현 시스템, 예를 들어, 세균 이. 콜라이에서의 발현 시스템, 및 진핵성 발현 시스템, 예를 들어, 곤충 세포에서의 발현을 허용해 주는 바쿨로바이러스 발현 시스템, 및 효모 세포에서의 발현을 허용해 주는 발현 시스템, 또는 포유류 세포, 특히 사람 세포에서의 발현을 허용해 주는 발현 시스템을 언급할 수 있다. 이러한 시스템에 사용될 수 있는 발현 벡터는 당업자에게 널리 공지되어 있는데, 원핵성 세포에 관해서는, 예를 들어, 이. 콜라이에서의 발현 벡터, 예를 들면, pET[Stratagene (LaJolla, California, USA) 회사에 의해 시판됨], GATEWAY 계열의 벡터[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨], pBAD 계열의 벡터[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨], pMAL 계열의 벡터[New England Bioloabs Inc. (Beverly, Massachussetts, USA) 회사에 의해 시판됨], 및 공개문헌[참조: B. Wilms et al., 2001]에 언급된 람노스-유도성 발현 벡터 및 이의 유도체를 언급할 수 있고; 또한, 스트렙토마이세스에서의 발현 벡터, 예를 들면, 벡터 pIJ4123, pIJ6021, pPM927, pANT849, pANT 850, pANT 851, pANT1200, pANT1201 및 pANT1202, 및 이의 유도체[참조: Kieser et al., 2000]를 언급할 수 있다. 효모 세포에 관해서는, 예를 들어, 벡터 pESC[Stratagene (LaJolla, California, USA) 회사에 의해 시판됨]를 언급할 수 있다. 곤충 세포에서의 발현을 허용해 주는 바쿨로바이러스 발현 시스템에 관해서는, 예를 들어, 벡터 BacPAK6[BD Biosciences Clontech, (Palo Alto, California, USA) 회사에 의해 시판됨]를 언급할 수 있다. 포유류 세포에 관해서는, 예를 들어, CMV(시토메갈로바이러스) 즉발 초기(immediate early) 유전자 프로모터를 포함하는 벡터[예를 들면, Stratagene (LaJolla, California, USA) 회사에 의해 시판된 벡터 pCMV 및 이의 유도체], 또는 공포형성(vacuolating) 원숭이 바이러스의 SV40 초기 프로모터를 포함하는 벡터[예를 들면, Stratagene (LaJolla, California, USA) 회사에 의해 시판된 벡터 pSG5]를 언급할 수 있다.
본 발명은 또한,
a) 폴리펩티드를 암호화하는 핵산을 적합한 벡터 내로 삽입하는 단계;
b) 단계 a)의 벡터로 미리 형질전환 또는 형질감염시킨 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을, 예를 들어, 초음파 처리하거나 삼투압 쇽에 의해 회수하는 단계;
d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계;
e) 경우에 따라, 이로써 생성된 재조합 폴리펩티드를 성상 확인하는 단계
를 포함하는, 상기 언급된 바와 같은 폴리펩티드의 생성 방법에 관한 것이다.
본 발명에 따르는 재조합 폴리펩티드는 당업자에게 공지되어 있고, 예를 들어, 문헌[참조: F. Ausubel et al., (2002)]에 언급된 방법에 따라서, 적당한 일련의 크로마토그래피 칼럼 상으로 통과시킴으로써 정제할 수 있다. 예시하자면, 생성하고자 하는 폴리펩티드에 짧은 폴리히스티딘 서열을 부가하는 것으로 이루어진 "히스티딘-태그" 기술을 언급할 수 있는데, 이는 상기 폴리펩티드가 닉켈 칼럼 상에서 정제될 수 있게 해준다. 본 발명에 따르는 폴리펩티드는 시험관내 합성 기술에 의해 제조할 수도 있다. 이러한 기술의 예를 들면, 본 발명에 따르는 폴리펩티드를 "신속한 해독 시스템(RTS)"[Roche Diagnostics France S.A., Meylan, France 회사에 의해 시판됨]을 사용하여 제조할 수 있다.
본 발명의 또 다른 국면은 본 발명에 따르는 하나 이상의 폴리뉴클레오티드 및/또는 하나 이상의 재조합 DNA 및/또는 하나 이상의 발현 벡터를 도입시킨 숙주 세포에 관한 것이다.
본 발명의 또 다른 국면은 하나 이상의 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물에 관한 것이다. 이점은 첫째, 돌연변이된 단백질의 기능을 연구하는데 있고, 둘째 생합성 중간체를 생산하는 미생물을 생성시키는데 있다. 이들 중간체는 임의로 분리 후, 특정 성분을 생산 배지에 부가함으로써 변형시키거나, 또는 이로써 돌연변이된 미생물에, 상기 중간체를 기질로서 사용함으로써 이를 변형시킬 수 있는 단백질을 암호화하는 기타 유전자를 도입함으로써 변형시킬 수 있다. 따라서, 이들 중간체는 화학적, 생화학적, 효소적 및/또는 미생물적으로 변형시킬 수 있다. 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물은, 이러한 매크롤리드(들)를 생산하는 미생물에서 이러한 매크롤리드(들)의 생합성에 관여하는 하나 이상의 단백질의 기능을 불활성화시킴으로써 수득할 수 있다. 불활성화된 단백질(들)에 따라서, 상기 매크롤리드(들)에 대한 생합성 경로의 각종 단계에서 차단된 미생물을 수득할 수 있다. 이러한 단백질(들)의 불활성화는 당업자에게 공지된 모든 방법에 의해 수행할 수 있는데, 예를 들어, 상기 단백질(들)을 암호화하는 유전자에서 돌연변이 유발시키거나 또는 상기 단백질(들)을 암호화하는 메신저 RNA(s)에 상보적인 하나 이상의 안티센스 RNA(s)를 발현시킴으로써 수행할 수 있다. 상기 돌연변이 유발은, 예를 들여, 방사선조사, 돌연변이 유발성 화학 제제의 작용, 부위-지시된 돌연변이 유발, 유전자 대체, 또는 당업자에게 공지된 기타 방법에 의해 수행될 수 있다. 이러한 돌연변이 유발에 적합한 조건은, 예를 들어, 문헌[참조: T. Kieser et al., (2000) and Ausubel et al., (2002)]에 기재된 교시에 따라서 조정할 수 있다. 돌연변이 유발은 시험관내 또는 원위치에서, 고려 중인 유전자 중의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키거나, 또는 유전자 불활성화시킴으로써 수행할 수 있다. 이러한 돌연변이 유발은 상기 언급된 바와 같은 서열을 포함하는 유전자에서 수행할 수 있다. 우선적으로는, 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 문제의 매크롤리드(들)의 생합성에 관여한 하나 이상의 단백질의 기능을 불활성화시키는 것은 돌연변이 유발에 의해 수행한다. 보다 더 우선적으로는, 문제의 매크롤리드가 스피라마이신이고 돌연변이 유발(들)이 수행되는 미생물이 에스. 암보파시엔스 균주이다. 보다 우선적으로는, 돌연변이 유발이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 서열 하나 이상에 상응하는 서열들 중의 하나를 포함하는 하나 이상의 유전자에서 수행된다. 바람직하게는, 돌연변이 유발(들)이 유전자 불활성화에 의해 수행된다. 가장 바람직하게는, 돌연변이 유발이 서열 번호 13에 상응하는 서열을 포함하는 유전자의 유전자 불활성화로 이루어진다.
예시하자면, 이러한 미생물의 예로서 다음 미생물을 언급할 수 있다: OS49.16(orf3:: Ωhyg, 실시예 2 참조), OS49.67(orf3 동위상 결실, 실시예 6 참조), OS49.107(orf8:: Ωhyg, 실시예 7 참조), OS49.50(orf10:: Ωhyg, 실시예 8 참조), SPM21(orf2::att3Ωaac-, 실시예 10 참조), SPM22(orf2::att3 동위상 결실, 실시예 10 참조), SPM501(orf6*::att1Ωhyg+, 실시예 14 참조), SPM502(orf6*::att1 동위상 결실, 실시예 14 참조), SPM507(orf12::att3Ωaac-, 실시예 11 참조), SPM508(orf13c::att3Ωaac-, 실시예 12 참조), 및 SPM509(orf14::att3Ωaac-, 실시예 13 참조), SPM107(orf28c::att3aac+, 실시예 29 참조), SPM543(orf31::att3aac+, 실시예 30 참조), SPM106(orf32c::att3aac+, 실시예 31 참조).
본 발명의 또 다른 국면은 상기 언급된 바와 같은, 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물을 사용하여, 매크롤리드 생합성 중간체를 제조하는 방법에 관한 것이다. 이러한 방법은 상기 언급된 바와 같은, 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물을 적합한 배양 배지에서 배양하는 단계; 이와 같이 조건화된 배양 배지 또는 세포 추출물을, 예를 들어, 초음파 처리하거나 삼투압 쇽에 의해 회수하는 단계; 및 전 단계에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 상기 생합성 중간체를 분리 및 정제하는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[참조: Kieser et al., (2000)]의 교시를 참조할 수 있다. 생성된 중간체는 당업자에게 공지된 모든 기술에 의해 회수할 수 있다. 당업자는, 예를 들어, 미국 특허 제3,000,785호에 교시된 기술, 보다 특히 상기 특허에 기재된 스피라마이신 추출 방법을 참조할 수 있다.
본 발명의 또 다른 국면은 상기 언급된 바와 같은, 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물을 사용하여, 매크롤리드로부터 유도된 분자를 제조하는 방법에 관한 것이다. 이러한 방법은 상기 방법에 따라서 생합성 중간체를 수득하는 단계; 및 이로써 생성된 중간체를 임의로 해당 배지로부터 분리시킨 후에, 이러한 중간체를 변형시키는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[참조: Kieser et al., (2000)]의 교시를 참조할 수 있다. 생성된 중간체는 임의 분리 후, 적합한 성분을 생산 배지에 부가함으로써 변형시키거나, 또는 해당 미생물에, 상기 중간체를 기질로서 사용함으로써 이를 변형시킬 수 있는 단백질을 암호화하는 기타 유전자를 도입함으로써 변형시킬 수 있다. 따라서, 이들 중간체는 화학적, 생화학적, 효소적 및/또는 미생물적으로 변형시킬 수 있다. 보다 우선적으로는, 문제의 매크롤리드가 스피라마이신이고 돌연변이 유발(들)이 수행되는 미생물이 에스. 암보파시엔스 균주이다.
본 발명은 또한, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물에 관한 것이다. 이러한 미생물은 스피라마이신 I의 생합성에 필요한 유전자 모두를 포함하지만, 스피라마이신 II와 III은 생산하지 못하는데, 이는 서열 번호 13에 상응하는 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 이의 변이체들 중의 하나를 암호화하는 유전자가 발현되지 않거나 또는 불활성화되었기 때문이다. 상기 단백질의 불활성화는 당업자에게 공지된 모든 방법, 예를 들면, 상기 단백질을 암호화하는 유전자에서 돌연변이 유발시키거나 또는 상기 단백질을 암호화하는 메신저 RNA에 상보적인 안티센스 RNA를 발현시킴으로써 수행할 수 있는데, orf5*의 발현이 이러한 조작에 의해 영향을 받을 경우에는, orf5* 유전자가 정확하게 발현되도록 또 다른 변형을 수행하는 것이 필요할 것이란 사실을 인지해야 한다. 돌연변이 유발은 암호화된 단백질을 불활성으로 만들거나 또는 이로부터 이의 발현 또는 해독을 방지하기 위해 비-암호화 서열 또는 암호화 서열에서 수행할 수 있다. 돌연변이 유발은 부위-지시된 돌연변이 유발, 유전자 대체, 또는 당업자에게 공지된 기타 모든 방법에 의해 수행할 수 있다. 이러한 돌연변이 유발에 적합한 조건은, 예를 들어, 문헌[참조: T. Kieser et al., (2000) and Ausubel et al., (2002)]에 기재된 교시에 따라서 조정할 수 있다. 돌연변이 유발은 시험관내 또는 원위치에서, 고려 중인 유전자 중의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키거나, 또는 유전자 불활성화시킴으로써 수행할 수 있다. 미생물은 또한, 서열 번호 13의 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 이의 변이체들 중의 하나를 암호화하는 유전자를 포함하지 않으면서, 스피라마이신에 대한 생합성 경로의 유전자를 발현시킴으로써 수득할 수 있다. 우선적으로는, 상기 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물이, 스피라마이신 I, II 및 III을 생산하는 출발 미생물로부터 수득된다. 보다 더 우선적으로는, 상기 미생물이 서열 번호 13의 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 동일한 기능을 갖는 이의 변이체들 중의 하나를 암호화하는 유전자에서 돌연변이 유발시킴으로써 수득된다. 보다 더 우선적으로는, 이러한 돌연변이 유발이 유전자 불활성화에 의해 수행된다. 바람직하게는, 상기 미생물이 스피라마이신 I, II 및 III을 생산하는 에스. 암보파시엔스의 균주로부터 수득되는데, 서열 번호 13의 서열, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자의 불활성화가 수행된다. 가장 바람직하게는, 유전자 불활성화가 서열 번호 13의 서열, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자 또는 이의 일부를 동위상 결실시킴으로써 수행된다. 예시하자면, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물로서, 균주 SPM502(orf6*::att1, 실시예 14 참조)를 언급할 수 있다.
본 발명은 또한,
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응에 의해 수득될 수 있는 유전자, 보다 바람직하게는 서열 번호 141의 암호화 서열의 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하는, 상기 언급된 바와 같이, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물에 관한 것이다.
이러한 유전자의 서열의 한 예가 서열 번호 111(DNA)에 제시되어 있지만, 이러한 서열은 부분적인데, 이는 상응하는 암호화 서열의 3' 부분을 포함하지 않기 때문이다. 이러한 암호화 서열 부분을 단백질로 해독시킨 것이 서열 번호 112에 제시되어 있다. 당업자는 특히 실시예 24에 제시된 교시를 이용하여 이를 용이하게 완성할 수 있을 것이다. 서열 번호 111에서 결정되지 않은 서열을 제2 단계에서 결정하였는데, 이러한 orf(orf28c)의 완전한 서열이 서열 번호 141에 제시되어 있다. 이러한 암호화 서열을 단백질로 해독시킨 것이 서열 번호 142에 제시되어 있다. 실시예 24에는 orf28c 유전자의 클로닝 방법과, orf28c의 발현을 허용해 주는 발현 벡터의 생성 방법이 제시되어 있다. 상기 실시예는 또한, 균주 OSC2에서 orf28c 유전자를 과발현시키면, 이러한 균주에서의 스피라마이신 생산이 향상된다는 사실을 나타낸다. orf28c 유전자의 과발현은 이러한 유전자의 복사물 수를 증가시키고/시키거나 야생형 프로모터 보다 더 활성인 프로모터를 도입함으로써 획득될 수 있다. 바람직하게는, 상기 유전자의 과발현이, 이러한 유전자의 과발현을 허용해 주는 재조합 DNA 작제물을 해당 미생물 내로 도입함으로써 획득된다. 바람직하게는, 이러한 재조합 DNA 작제물이 상기 유전자의 복사물 수를 증가시키고 상기 유전자의 과발현 획득을 가능하게 만든다. 이러한 재조합 DNA 작제물에서는, 유전자의 암호화 서열을, 야생형 프로모터 보다 더 활성인 프로모터의 제어 하에 위치시킬 수 있다. 예시하자면, 스트렙토마이세스 암보파시엔스에서 활성인 ptrc 프로모터[참조: E. Amann et al., 1988], 및 ermE* 프로모터를 언급할 수 있다. 따라서, 바람직하게는, 작제물 pSPM75의 경우와 같이(실시예 24 참조), 도입된 orf28c 유전자의 복사물(들)을 ermE* 프로모터의 제어 하에 위치시킨다.
본 발명은 또한, 서열 번호 47의 암호화 서열을 갖거나 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 암호화 서열을 갖는 유전자를 과발현하기도 하는, 상기 언급된 바와 같이, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물에 관한 것이다. 우선적으로는, 이러한 미생물이 2003년 2월 26일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes [National Collection of Cultures and Microorganisms] (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-2977로 기탁된 균주 SPM502 pSPM525이다.
본 발명은 또한, 스피라마이신 I의 생성 방법에 관한 것이다. 이러한 방법은 상기 언급된 바와 같이, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물을 적합한 배양 배지에서 배양하는 단계; 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및 전 단계에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 스피라마이신 I을 분리 및 정제하는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[참조: Kieser et al., (2000)]의 교시를 참조할 수 있다. 생성된 스피라마이신 I은 당업자에게 공지된 모든 기술에 의해 회수할 수 있다. 당업자는, 예를 들어, 미국 특허 제3,000,785호에 교시된 기술, 보다 특히 상기 특허에 기재된 스피라마이신 추출 방법을 참조할 수 있다.
본 발명의 또 다른 국면은 미생물의 매크롤리드 생산을 향상시키기 위한, 본 발명에 따르는 뉴클레오티드 서열의 용도에 관한 것이다. 따라서, 본 발명은 상기 규정된 바와 같은 서열을 포함하는 하나 이상의 유전자에서 유전자 변형을 나타내고/내거나 상기 규정된 바와 같은 서열을 포함하는 하나 이상의 유전자를 과발현하는 매크롤리드-생산 돌연변이체 미생물에 관한 것이다. 상기 유전자 변형은 보다 큰 활성을 지닌 하나 이상의 단백질을 발현할 목적으로 또는 이러한 단백질(들)을 보다 높은 수준으로 발현할 목적으로, 고려 중인 유전자(들) 내의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가하는 것으로 이루어질 수 있다. 고려 중인 유전자의 과발현은 이러한 유전자의 복사물 수를 증가시키고/시키거나 야생형 프로모터 보다 더 활성인 프로모터를 도입함으로써 획득될 수 있다. 예시하자면, 스트렙토마이세스 암보파시엔스에서 활성인 ptrc 프로모터[참조: E. Amann et al., 1988], 및 ermE* 프로모터[참조: Bibb et al., 1985 and Bibb et al., 1994]를 언급할 수 있다. 따라서, 고려 중인 유전자의 과발현은, 이러한 유전자의 과발현을 허용해 주는 본 발명에 따르는 재조합 DNA 작제물을, 고려 중인 매크롤리드-생산 미생물 내로 도입함으로써 획득할 수 있다. 구체적으로 언급하면, 매크롤리드 생합성의 특정 단계들이 제한성이고, 이들 제한성 단계에 관여한 야생형 단백질(들) 보다 활성이거나 이들 단백질 보다 높은 수준으로 발현되는 하나 이상의 단백질이 발현되는 경우에는, 관련 매크롤리드(들)의 생산을 향상시키는 것이 가능하다. 틸로신의 생산율을 증가시키는 것은, 예를 들어, 매크로신을 틸로신으로 전환시키는 제한성 메틸트랜스퍼라제를 암호화하는 유전자를 복제시킴으로써 스트렙토마이세스 프라디애에서 획득할 수 있다[참조: R. Baltz, 1997]. 보다 활성인 단백질의 발현 생성은 특히 돌연변이 유발에 의해 획득할 수 있는데; 당업자는 예를 들어, 이와 관련하여 문헌[F. Ausubel et al., (2002)]의 연구 내용을 참조할 수 있다. 우선적으로는, 이들의 매크롤리드 생산 측면에서 향상된 돌연변이체 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 문제의 매크롤리드가 스피라마이신이고, 돌연변이 유발(들)이 수행되는 미생물은 에스. 암보파시엔스 균주이다. 보다 우선적으로는, 유전자 변형이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 하나 이상에 상응하는 서열들 중의 하나, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 하나 이상의 유전자에서 수행된다. 바람직하게는, 상기 미생물이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 하나 이상에 상응하는 서열들 중의 하나, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 하나 이상의 유전자를 과발현한다. 바람직하게는, 상기 미생물이 서얼 번호 111 또는 141에 상응하는 서열, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자를 과발현한다. 서열 번호 111에 제시된 서열은 부분적이지만; 당업자는 특히 실시예 24에 제시된 교시를 이용하여 이를 용이하게 완성할 수 있을 것이다. 서열 번호 111에 결정되지 않은 서열을 제2 단계에서 결정하고, 이러한 orf(orf28c)의 완전한 서열이 서열 번호 141에 제시되어 있다. 이러한 암호화 서열을 단백질로 해독한 것이 서열 번호 142에 제시되어 있다. 실시예 24에는 orf28c 유전자의 클로닝 방법과, orf28c의 발현을 허용해 주는 발현 벡터의 생성 방법이 제시되어 있다. 상기 실시예는 또한, 균주 OSC2에서 orf28c 유전자를 과발현시키면, 이러한 균주에서의 스피라마이신 생산이 향상된다는 사실을 나타낸다. orf28c 유전자의 과발현은 이러한 유전자의 복사물 수를 증가시키고/시키거나 야생형 프로모터 보다 더 활성인 프로모터를 도입함으로써 획득될 수 있다. 바람직하게는, 상기 유전자의 과발현이, 이러한 유전자의 과발현을 허용해 주는 재조합 DNA 작제물을 해당 미생물 내로 도입함으로써 획득된다. 바람직하게는, 이러한 재조합 DNA 작제물이 상기 유전자의 복사물 수를 증가시키고 상기 유전자의 과발현 획득을 가능하게 만든다. 이러한 재조합 DNA 작제물에서는, 유전자의 암호화 서열을, 야생형 프로모터 보다 더 활성인 프로모터의 제어 하에 위치시킬 수 있다. 예시하자면, 스트렙토마이세스 암보파시엔스에서 활성인 ptrc 프로모터[참조: E. Amann et al., 1988], 및 ermE* 프로모터를 언급할 수 있다. 따라서, 바람직하게는, 작제물 pSPM75의 경우와 같이(실시예 24 참조), 도입된 orf28c 유전자의 복사물(들)을 ermE* 프로모터의 제어 하에 위치시킨다.
본 발명의 또 다른 국면은 전 단락에서 언급된 미생물을 사용하여, 매크롤리드를 생산하는 방법에 관한 것이다. 이러한 방법은 전 단락에서 규정된 미생물을 적합한 배양 배지에서 배양하는 단계; 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및 전 단계에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 생성된 매크롤리드(들)를 분리 및 정제하는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[Kieser et al., (2000)]의 교시를 참조할 수 있다. 이로써 생성된 매크롤리드는 당업자에게 공지된 모든 기술에 의해 회수할 수 있다. 당업자는, 예를 들어, 미국 특허 제3,000,785호에 교시된 기술, 보다 특히 상기 특허에 기재된 스피라마이신 추출 방법을 참조할 수 있다. 우선적으로는, 이러한 방법에 사용된 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 문제의 매크롤리드가 스피라마이신이고, 이들의 스피라마이신 생산 측면에서 향상된 돌연변이체 미생물이 에스. 암보파시엔스이다.
본 발명의 또 다른 국면은 하이브리드 항생제를 제조하기 위한, 본 발명에 따르는 서열 및/또는 벡터의 용도에 관한 것이다. 구체적으로 언급하면, 본 발명에 따르는 폴리뉴클레오티드는, 기질 특이성 측면에서 변형을 유발시키는 하나 이상의 돌연변이체 단백질을 발현하는 미생물을 수득하는데 사용될 수 있거나, 또는 하이브리드 항생제 제조 목적으로 수 많은 항생제-생산 미생물에서 발현될 수 있다. 따라서, 본 발명에 따르는 폴리뉴클레오티드는 생산자 미생물들 간의 유전자 전이에 의해, 유리한 약리학적 특성을 지닌 하이브리드 항생제를 생성시킬 수 있다[참조: Hopwood et al., 1985a, Hopwood et al., 1985b, Hutchinson et al., 1989]. 하이브리드 항생제 생성을 가져다 줄 수 있는 유전 공학 원리는 호프우드(Hopwood) 등에 의해(1981년) 가장 먼저 제안되었다. 항생제의 생합성에 관여하는 효소가, 구조적으로는 관련되긴 하지만 이의 천연 기질과는 상이한 기질을 종종 수용한다는 사실이 제안되었다. 항생제에 대한 생합성 경로의 유전자에 의해 암호화된 효소가 1차 대사 효소 보다 덜 엄격한 기질 특이성을 나타낸다는 사실이 일반적으로 받아들여지고 있다[참조: Hopwood 1981, Hutchinson 1988, Robinson 1988]. 따라서, 다수의 비-천연 기질이 항생제-생산 미생물에 의해, 이들 항생제에 대한 생합성 경로의 돌연변이체 또는 정제된 효소로 전환된다는 것을 밝혀내는 것이 가능하였다[참조: Hutchinson 1988]. 이러한 교시를 이용하여, 당업자는 하이브리드 항생제를 생성시킬 목적으로, 기질 특이성 측면에서 변형을 유발시키는 하나 이상의 돌연변이체 단백질을 발현하는 미생물을 작제할 수 있다.
본 발명은 또한, 한 가지 이상의 생체전환을 수행하기 위한, 하나 이상의 폴리뉴클레오티드 및/또는 하나 이상의 재조합 DNA 및/또는 하나 이상의 발현 벡터 및/또는 하나 이상의 폴리펩티드 및/또는 하나 이상의 숙주 세포의 용도에 관한 것이다. 따라서, 본 발명은 본 발명에 따르는 하나 이상의 단백질을 적합한 발현 시그널의 제어 하에 발현시키는 세균성 또는 진균성 균주를 작제하는 것을 가능케 한다. 이어서, 이러한 균주를 사용하여 한 가지 이상의 생체전환을 수행할 수 있다. 이러한 생체전환은 완전 세포를 사용하거나, 또는 이러한 세포의 비세포성 추출물을 사용하여 수행할 수 있다. 이러한 생체전환은 생합성 경로 효소를 사용하여, 특정 분자를 유도된 형태로 전환시킬 수 있다. 예를 들어, 문헌[참조: Carreras et al., 2002]에는 신규한 에리트로마이신 유도체를 생성시키기 위한, 삭카로폴리스포라 에리트래아 및 스트렙토마이세스 코엘리콜로르 균주의 용도가 기재되어 있다. 문헌[참조: Walczak et al., 2001]에는 데스아세틸아드리아미신(안트라사이클린 동족체)를 신규한 안트라사이클린으로 생체전환시키기 위한, 스트렙토마이세스 P450 모노옥시게나제의 용도가 기재되어 있다. 문헌[참조: Olonao et al., 1999]에는 엡실론-로도마이시논을 로도마이신 D로 생체전환시키기 위한, 스트렙토마이세스 리비단스(Streptomyces lividans)의 변형된 균주의 용도가 기재되어 있다. 당업자는 이러한 원리를 모든 생합성 중간체에 적용할 수 있다.
본 발명은 또한,
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
을 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응에 의해 수득될 수 있는 폴리뉴클레오티드, 보다 바람직하게는 서열 번호 141의 폴리뉴클레오티드; 또는
- 이러한 폴리뉴클레오티드의 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, 1480, 1490 또는 1500개 이상의 연속되는 뉴클레오티드의 단편
을 포함하는 재조합 DNA에 관한 것이다.
우선적으로는, 이러한 재조합 DNA가 벡터이다. 보다 더 우선적으로는, 상기 벡터가 박테리오파아지, 플라스미드, 파아지미드, 통합 벡터, 포스미드, 코스미드, 셔틀 벡터, BAC(세균성 인공 염색체) 및 PAC(P1-유도된 인공 염색체) 중에서 선택된다. 예시하자면, 람다 파아지와 M13 파아지가 박테리오파아지로서 언급될 수 있다. 플라스미드로서, 이. 콜라이에서 복제되는 플라스미드, 예를 들면, pBR322 및 이의 유도체, pUC18 및 이의 유도체, pUC19 및 이의 유도체, pGB2 및 이의 유도체[참조: G. Churchward et al., 1984], pACYC177(젠뱅크 수탁 번호: X06402) 및 이의 유도체, 및 pACYC184(젠뱅크 수탁 번호: X06403) 및 이의 유도체가 언급될 수 있다. 또한, 스트렙토마이세스에서 복제되는 플라스미드, 예를 들면, pIJ101 및 이의 유도체, pSG5 및 이의 유도체, SLP1 및 이의 유도체, 및 SCP2* 및 이의 유도체[참조: Kieser et al. 2000]를 언급할 수 있다. 파아지미드로서, 예를 들면, pBluescript II 및 이의 유도체[특히, Stratagene(LaJolla, California, USA) 회사로부터 시판됨], pGEM-T 및 이의 유도체[Promega(Madison, Wisconsin, USA) 회사로부터 시판됨], λZAPII 및 이의 유도체[Stratagene(LaJolla, California, USA) 회사로부터 시판됨]를 언급할 수 있다. 통합 벡터로서, 예를 들어, 스트렙토마이세스에서 통합되는 벡터, 예를 들면, SLP1로부터 유도된 벡터[참조: Kieser et al, 2000], pSAM2로부터 유도된 벡터[참조: Kieser et al, 2000], PhiC31 파아지 통합 시스템을 이용하는 벡터[참조:Kieser et al, 2000][예를 들면, pSET152(참조: Bierman et al., 1992)] 또는 VWB 통합 시스템을 이용하는 벡터[참조: L. van Mellaert et al. 1998], 및 IS117 통합 시스템을 이용하는 벡터[참조: Kieser et al., 2000]을 언급할 수 있다. 포스미드로서, 예를 들면, 포스미드 pFOS1[New England Bioloabs Inc., Beverly, Massachussetts, USA 회사로부터 시판됨] 및 이의 유도체를 언급할 수 있다. 코스미드로서, 예를 들면, 코스미드 SuperCos 및 이의 유도체[특히, Stratagene(LaJolla, California, USA) 회사로부터 시판됨] 및 코스미드 pWED15[참조: Wahl et al., 1987] 및 이의 유도체가 언급될 수 있다. 셔틀 벡터로서, 이. 콜라이/스트렙토마이세스 셔틀 플라스미드, 예를 들면, pIJ903 및 이의 유도체, 플라스미드 pUWL, pCAO106, pWHM3 및 pOJ446 시리즈 및 이의 유도체[참조: Kieser et al. 2000], 및 이. 콜라이/스트렙토마이세스 셔틀 BAC, 예를 들면, WO 01/40497에 기재된 것을 언급할 수 있다. BAC(세균성 인공 염색체)로서, 예를 들면, BAC pBeloBAC11(젠뱅크 수탁 번호: U51113)를 언급할 수 있다. PAC(P1-유도된 인공 염색체)로서, 예를 들면, 벡터 pCYPAC6(젠뱅크 수탁 번호: AF133437)를 언급할 수 있다. 보다 우선적으로는, 상기 재조합 DNA가 발현 벡터이다. 이러한 시스템에 사용될 수 있는 발현 벡터는 당업자에게 널리 공지되어 있는데, 원핵성 세포에 관해서는, 예를 들어, 이. 콜라이에서의 발현 벡터, 예를 들면, pET[Stratagene (LaJolla, California, USA) 회사에 의해 시판됨], GATEWAY 계열의 벡터[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨], pBAD 계열의 벡터[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨], pMAL 계열의 벡터[New England Bioloabs Inc. (Beverly, Massachussetts, USA) 회사에 의해 시판됨], 및 공개문헌[참조: B. Wilms et al., 2001]에 언급된 람노스-유도성 발현 벡터 및 이의 유도체를 언급할 수 있고; 또한, 스트렙토마이세스에서의 발현 벡터, 예를 들면, 벡터 pIJ4123, pIJ6021, pPM927, pANT849, pANT 850, pANT 851, pANT1200, pANT1201 및 pANT1202, 및 이의 유도체[참조: Kieser et al., 2000]를 언급할 수 있다. 효모 세포에 관해서는, 예를 들어, 벡터 pESC[Stratagene (LaJolla, California, USA) 회사에 의해 시판됨]를 언급할 수 있다. 곤충 세포에서의 발현을 허용해 주는 바쿨로바이러스 발현 시스템에 관해서는, 예를 들어, 벡터 BacPAK6[BD Biosciences Clontech, (Palo Alto, California, USA) 회사에 의해 시판됨]를 언급할 수 있다. 포유류 세포에 관해서는, 예를 들어, CMV(시토메갈로바이러스) 즉발 초기 유전자 프로모터를 포함하는 벡터[예를 들면, Stratagene (LaJolla, California, USA) 회사에 의해 시판된 벡터 pCMV 및 이의 유도체], 또는 공포형성 원숭이 바이러스의 SV40 초기 프로모터를 포함하는 벡터[예를 들면, Stratagene (LaJolla, California, USA) 회사에 의해 시판된 벡터 pSG5]를 언급할 수 있다. 본 발명의 또 다른 국면은 본 단락에서 언급된 하나 이상의 재조합 DNA를 도입시킨 숙주 세포에 관한 것이다.
본 발명의 또 다른 국면은
a) 상기 단락에 기재된 바와 같은 하나 이상의 발현 벡터로 숙주 세포를 형질전환시키는 단계;
b) 상기 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계;
e) 경우에 따라, 이로써 생성된 재조합 폴리펩티드를 성상 확인하는 단계
를 포함하는, 폴리펩티드의 생성 방법에 관한 것이다.
이로써 생성된 재조합 폴리펩티드는 당업자에게 공지되어 있고, 예를 들어, 문헌[참조: F. Ausubel et al., (2002)]에 언급된 방법에 따라서, 적당한 일련의 크로마토그래피 칼럼 상으로 통과시킴으로써 정제할 수 있다. 예시하자면, 생성하고자 하는 폴리펩티드에 짧은 폴리히스티딘 서열을 부가하는 것으로 이루어진 "히스티딘-태그" 기술을 언급할 수 있는데, 이는 상기 폴리펩티드가 닉켈 칼럼 상에서 정제될 수 있게 해준다. 이러한 폴리펩티드는 시험관내 합성 기술에 의해 제조할 수도 있다. 이러한 기술의 예를 들면, 상기 폴리펩티드를 "신속한 해독 시스템(RTS)"[Roche Diagnostics France S.A., Meylan, France 회사에 의해 시판됨]을 사용하여 제조할 수 있다.
본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
을 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자, 보다 바람직하게는 서열 번호 141의 암호화 서열의 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하는, 하나 이상의 스피라마이신을 생산하는 미생물에 관한 것이다.
이러한 유전자의 서열의 한 예가 서열 번호 111(DNA)에 제시되어 있지만, 이러한 서열은 부분적인데, 이는 상응하는 암호화 서열의 3' 부분을 포함하지 않기 때문이다. 이러한 암호화 서열 부분을 단백질로 해독시킨 것이 서열 번호 112에 제시되어 있다. 당업자는 특히 실시예 24에 제시된 교시를 이용하여 이를 용이하게 완성할 수 있을 것이다. 상기 실시예에는 orf28c 유전자의 클로닝 방법과, orf28c의 발현을 허용해 주는 발현 벡터의 생성 방법이 제시되어 있다. 상기 실시예는 또한, 균주 OSC2에서 orf28c 유전자를 과발현시키면, 이러한 균주에서의 스피라마이신 생산이 향상된다는 사실을 나타낸다. 바람직하게는,
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
을 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자, 보다 바람직하게는 서열 번호 141의 암호화 서열의 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하는 미생물이, 스트렙토마이세스 속 세균이고, 보다 더 바람직하게는 스트렙토마이세스 암보시엔스 종 세균이다. 바람직하게는, 상기 유전자의 과발현이, 상기 미생물을 발현 벡터로 형질전환시킴으로써 획득되고, 보다 바람직하게는 이러한 미생물 균주가 2003년 10월 6일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes(CNCM)[National Collection of Cultures and Microorganisms] Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-3101로 기탁된 균주 OSC2/pSPM75(1) 또는 균주 OSC2/pSPM75(2)이다.
본 발명의 또 다른 국면은 전 단락에서 언급된 미생물을 사용하여, 스피라마이신(들)을 생산하는 방법에 관한 것이다. 이러한 방법은 전 단락에서 규정된 미생물을 적합한 배양 배지에서 배양하는 단계; 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및 전 단계에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 생성된 스피라마이신(들)을 분리 및 정제하는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[Kieser et al., (2000)]의 교시를 참조할 수 있다. 이로써 생성된 스피라마이신(들)은 당업자에게 공지된 모든 기술에 의해 회수할 수 있다. 당업자는, 예를 들어, 미국 특허 제3,000,785호에 교시된 기술, 보다 특히 상기 특허에 기재된 스피라마이신 추출 방법을 참조할 수 있다. 우선적으로는, 이러한 방법에 사용된 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 상기 미생물이 에스. 암보파시엔스 균주이다.
본 발명의 또 다른 국면은 서열 번호 47의 폴리뉴클레오티드, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 폴리뉴클레오티드를, 스트렙토마이세스 암보파시엔스에서 상기 폴리뉴클레오티드에 의해 암호화된 단백질의 발현을 허용해주는 프로모터의 제어 하에 위치시킨 발현 벡터에 관한 것이다. 스트렙토마이세스에서 사용될 수 있는 발현 벡터의 예는 상기 제시되어 있다. 우선적으로는, 이러한 발현 벡터가 플라스미드 pSPM524 또는 pSPM525이다.
본 발명의 또 다른 국면은 전 단락에서 규정된 벡터로 형질전환시킨 스트렙토마이세스 암보파시엔스 균주에 관한 것이다.
본 발명의 또 다른 국면은 서열 번호 112의 서열을 포함하는 폴리펩티드에 관한 것이다. 본 발명은 또한,
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
을 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자의 암호화 서열, 보다 바람직하게는 서열 번호 141의 암호화 서열의 유전자의 암호화 서열, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자의 암호화 서열
로부터 해독된 서열에 상응하는 서열을 포함하는 폴리펩티드에 관한 것이다. 우선적으로는, 이들 폴리펩티드가 스트렙토마이세스 속 세균에 의해 천연 상태로 발현되고, 보다 우선적으로는 이들 폴리펩티드가 스피라마이신 생합성에 관여한다.
본 발명의 또 다른 국면은 스트렙토마이세스 암보파시엔스에서 전 단락에서 규정된 바와 같은 폴리펩티드의 발현을 허용해 주는 발현 벡터에 관한 것이다. 스트렙토마이세스에서 사용될 수 있는 발현 벡터의 예는 상기 제시되어 있다. 우선적으로는, 문제의 발현 벡터가 플라스미드 pSPM75이다.
도 1: 스피라마이신 I, II 및 III의 화학적 구조.
도 2: 해당 영역을 서열 분석하는데 사용된 코스미드.
도 3: 스피라마이신에 대한 생합성 경로에 관여한 유전자 그룹의 조직도.
도 4: 미카로스에 대해 제안된 생합성 경로.
도 5: 미카미노스에 대해 제안된 생합성 경로.
도 6: 포로사민에 대해 제안된 생합성 경로.
도 7: 스피라마이신 분자 및 중간체에 당을 부가하는 우선 순위.
도 8: 에스. 암보파시엔스에서 메톡시말로닐에 대해 제안된 생합성 경로. 이 경로는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스에서 메톡시말로닐의 생합성과 유사하게 제안되었다[참조: K. Wu et al., 2000].
도 9: 특정 유전자를 불활성화시키기 위한 단계:
A) 이. 콜라이에서는 복제되지만 스트렙토마이세스에서는 복제되지 않는 벡터 내로 표적 유전자를 클로닝하는 단계;
B) 내성 카세트를 (동일한 짧은 서열들 간의 재조합 또는 클로닝에 의해) 상기 표적 유전자 내로 삽입하는 단계;
C) 상기 플라스미드를 스트렙토마이세스 암보파시엔스 내로 도입하고(이. 콜라이와의 접합 또는 형질전환에 의함), 통합된 카세트를 갖는 클론을 선별한 다음, 유전자 대체물을 가지도록 벡터 부분을 상실한 클론을 스크리닝하는 단계;
D) 유전자 대체시킴으로써 표적 유전자를 불활성화시킨 돌연변이체 균주의 염색체 영역을 수득하는 단계.
도 10: 절제 가능한 카세트를 이용하여 표적 유전자를 개입중단시킨 경우에 수행할 수도 있는, 도 9에 기재된 방법에 따라서 유전자를 불활성화시킨 이후의 임의 단계:
E) 상기 돌연변이체 균주 내로, pSAM2의 xis 및 int 유전자를 수반하는 플라스미드 pOSV508를 도입하는 단계(이의 생성물은 상기 카세트를 둘러싸고 있는 attL 서열과 attR 서열 간의 부위-특이적 재조합에 의해 효과적으로 절제될 것이다);
F) 절제 가능한 카세트를 상실하고, 카세트가 내성을 제공하는 항생제에 민감한 클론을 생성하는 단계;
G) 항생제를 함유하지 않는 고형 배지 상에서 성장시키고 포자 형성시킨 후, 플라스미드 pOSV508이 높은 빈도로 상실된다. 따라서, 표적 유전자가 동위상 결실을 함유하는 티오스트렙톤에 대해 민감한 클론을 수득하는 것이 가능하다. 이와 같이 결실된 표적 유전자 서열은 PCR 증폭시키고 PCR 생성물을 서열 분석함으로써 제어할 수 있다.
도 11: 절제 가능한 카세트를 상동 재조합 실험에 사용할 목적으로, 이러한 카세트를 증폭시킴. 짧은 상동 서열을 통하여 상동 재조합시키는 기술이 문헌[참조: Chaveroche et al., 2000]에 기재되어 있다. 올리고뉴클레오티드의 5' 말단에 위치한 39개 또는 40개 데옥시뉴클레오티드는, 불활성화시키고자 하는 유전자의 서열에 상응하는 서열을 포함하고, 가장 3' 부위에 위치한 20개 데옥시뉴클레오티드는 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다.
도 12: 문헌[참조: Chaveroche et al., 2000]에 기재된 기술을 사용하여 표적 유전자를 불활성화시키기 위한 작제물의 생성.
도 13: 플라스미드 pWHM3의 지도. 스트렙토 ori: 스트렙토마이세스 복제 기점.
도 14: 플라스미드 pOSV508의 지도.
도 15: 절제 가능한 카세트 구조의 예. 이는 attR 및 attL 부위[참조: Raynal et al., 1998]에 의해 둘러싸인[이들 간의 재조합 사건은 xis 및 int 유전자의 발현을 통하여 상기 카세트를 절제시킬 수 있을 것이다] Ωhyg 카세트[참조: Blondelet-Rouault et al., 1997]로 이루어진다.
도 16: 플라스미드 pBXL1111의 지도.
도 17: 플라스미드 pBXL1112의 지도.
도 18: 스피라마이신에 대한 미크로코쿠스 루테우스 균주의 민감성에 근거한, 스피라마이신 생성에 대한 미생물학적 시험. 사용된 미크로코쿠스 루테우스 균주는 스피라마이신에 대해서는 천연적으로 민감하지만 콘고시딘(congocidine)에 대해서는 내성인 균주이다. 시험하고자 하는 각종 스트렙토마이세스 균주를, 70ml 의 MP5 배지를 함유하는 500ml용 에를렌마이어 플라스크에서 배양하고, 2.5 x 106개 포자/ml의 초기 농도로 접종하며, 250rpm으로 궤도 진탕시키면서 27℃ 하에 성장시킨다. 배양한지 48, 72 및 96시간 후에, 발효 과실즙(musts) 샘플을 취하고, 원심분리시킨다. 이들 상청액을 멸균용 배양 배지에서 10배 희석시킨 것을 본 시험에 사용한다. 콘고시딘에 대해서는 내성이지만 스피라마이신에는 민감한 미크로코쿠스 루테우스 지시 균주[참조: Gourmelen et al., 1998]를 12 x 12cm 사각형 디쉬에서 배양한다. 왓트만(Whatman) AA 종이 디스크를 각 상청액의 10배 희석물 70ℓ에 침지시키고, 디쉬 표면 상에 놓아둔다. 각종 농도(MP5 중의 2-4-8㎍/ml)의 스피라마이신 용액에 침지시킨 디스크를 표준 범위로서 희석시킨다. 이러한 디쉬를 37℃에서 24 내지 48시간 동안 항온 배양한다. 디쉬가 스피라마이신을 함유하는 경우, 이를 한천 내로 확산시키고 미크로코쿠스 루테우스 지시 균주의 성장을 억제시킨다. 이와 같이 억제시키면, 디스크 주변에 "할로"가 창출되는데, 이러한 할로는 미크로코쿠스 루테우스 균주가 성장하지 않은 영역을 반영한 것이다. 따라서, 상기 할로가 존재하는 것은 스피라마이신의 존재를 지시해주며, 이로써 문제의 에스. 암보파시엔스가 스피라마이신 생산자인지 아닌지를 결정할 수 있다. 표준 범위에 대해 수득된 억제 직경과 비교한 결과, 상기 균주에 의해 생산된 스피라마이신의 양에 관한 지표를 획득할 수 있다.
도 19: 균주 OSC2의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 20: 균주 SPM501의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 21: 균주 SPM502의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 22: 균주 SPM507의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 23: 균주 SPM508의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 24: 균주 SPM509의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 25: FASTA 프로그램을 사용하여 생성된 에스. 프라디애의 TylB 단백질(서열 번호 87)과, Orf3 단백질(서열 번호 29)의 정렬.
도 26: FASTA 프로그램을 사용하여 생성된 SrmD 단백질(서열 번호 16)과, 에스. 미카로파시엔스(S. mycarofaciens)의 MdmA 단백질(서열 번호 88)의 정렬.
도 27: 절제 가능한 카세트의 절제 후 잔여 부위 서열의 예. 진하게 표시된 것은 문헌[참조: Raynal et al., 1998]에 규정된 바와 같은 최소 att26 부위이다. 33개 뉴클레오티드의 상 1 서열(att1)은 서열 번호 104에 제시되어 있고, 34개 뉴클레오티드의 상 2 서열(att2)은 서열 번호 105에 제시되어 있으며, 35개 뉴클레오티드의 상 3 서열(att3)은 서열 번호 95에 제시되어 있다.
도 28: orf10 유전자의 다이아그램 표시, 사용된 PCR 프라이머의 위치 및 각 쌍의 프라이머를 사용하여 수득된 작제물.
도 29: 카세트 pac-oritT의 작제.
도 30: 코스미드 pWED2의 지도.
도 31: 스피라마이신에 대한 생합성 경로에 관여하는 유전자 그룹의 다이아그램 표시, 및 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA 라이브러리의 코스미드를 분리시키기 위해 사용된 3가지 프로브의 위치(실시예 19 참조).
도 32: 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA 라이브러리로부터 분리된 코스미드의 삽입물의 위치(실시예 19 참조). 신규한 코스미드 DNA 라이브러리.
도 33: 코스미드 pSPM36의 PstI-PstI 단편(플라스미드 pSPM58의 삽입물)의 아클로닝, 코스미드 pSPM36의 StuI-StuI 단편(플라스미드 pSPM72의 삽입물)의 아클로닝, 및 EcoRI-StuI(플라스미드 pSPM73의 삽입물)의 아클로닝.
도 34: 플라스미드 pSPM58의 PstI-PstI 삽입물 및 플라스미드 pSPM73의 EcoRI-StuI 삽입물에서 동정된 개방 판독 프레임의 위치.
도 35: 238nm 및 280nm 하에 생성된 균주 OS49.67의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램(상류)과, 33.4분 및 44.8분에 용출된 분자의 UV 스펙트럼(하류)의 중첩.
도 36: 플라테놀리드 A 분자와 플라테놀리드 B 분자의 분자 구조.
도 37: 스피라마이신에 대한 생합성 경로에 관여하는 유전자 그룹의 조직도.
도 38: 균주 SPM507에 의해 생성된 생합성 중간체의 분자 구조.
도 39: 스피라마이신을 과생산하는 균주로부터 수득된 유전자형 orf6*::att1Ωhyg+의 에스. 암보파시엔스 균주에 의해 생성된 생합성 중간체의 구조. 카세트 att1Ωhyg+를 orf6* 내로 삽입하면, orf5*의 발현을 방지시키는 극성 효과가 발휘된다.
도 40: 균주 OS49.67에 의해 생산된, 플라테놀리드 A + 미카로스 및 플라테 놀리드 B + 미카로스 분자의 분자 구조.
도 41: 코스미드 pSPM36의 PstI-PstI 단편(플라스미드 pSPM79의 삽입물)의 아클로닝, 플라스미드 pSPM79의 PstI-PstI 삽입물에서 동정된 개방 판독 프레임의 위치결정, 및 서열 번호 140의 위치결정.
본 발명은 다음 실시예를 사용하여 예시되지만, 이로써 제한되지 않는다.
요약하면, 스피로마이신에 대한 생합성 경로의 유전자를 스트렙토마이세스 암보파시엔스의 게놈 DNA 라이브러리로부터 분리시킨다. 이 라이브러리는 스트렙토마이세스 암보파시엔스의 게놈 DNA를 BamHI 제한 효소로 부분 분해시킴으로써 수득한다. 평균 35 내지 45kb의 큰 DNA 단편을 코스미드 pWED15[참조: Wahl et al., 1987]로부터 유도된 코스미드 pWED1[참조: Gourmelen et al., 1998] 내로 클로닝시킨다. 이들 코스미드를, 파아지 입자를 사용하여 이. 콜라이 내로 도입한다. 이로써 수득된 라이브러리를 에스. 프라디애의 tylB 유전자의 일정 부분에 상응하는 프로브(서열 번호 86)와 하이브리드화시킨다[참조: Merson-Davies & Cundliffe, 1994, 젠뱅크 수탁 번호: U08223]. 하이브리드화한 후, 상기 프로브와 하이브리드화한 4개의 코스미드 중에서 1개의 코스미드를 보다 특별히 선별한다. 이어서, pOS49.1로 명명된 코스미드를 SacI로 분해시키고, 상기 프로브와 하이브리드화된 영역을 함유하는 3.3kb 단편을 벡터 pUC19 내로 아클로닝시키고 서열 분석하였다. 4개의 개방 판독 프레임을 동정하면, 이들 중의 하나는 에스. 프라디애의 TylB 단백질(서열 번호 87)과 강력한 서열 유사성을 나타내는 단백질(서열 번호 29)을 암호화한다(도 25 참조). 이러한 유전자는 orf3(서열 번호 28)로 명명되고, 이를 에 스. 암보파시엔스에서 불활성시킨다. orf3 유전자를 불활성화시킨 클론은 더 이상 스피로마이신을 생성하지 않는다는 사실을 입증할 수 있었다. 이는 orf3 유전자, 또는 하류에 위치한 유전자가 스피라마이신 생합성에 관여한다는 것을 보여준다.
이러한 사항을 일단 확인하면, 보다 큰 영역의 코스미드 pOS49.1을 대상으로 하여, 앞서 연구된 SacI 단편의 어느 한쪽을 서열 분석하였다. 이로써, 코스미드 pOS49.1로부터, 7개의 완전한 개방 판독 프레임과 이러한 7개의 완전한 개방 판독 프레임의 어느 한쪽에 위치한 2개의 기타 불완전한 판독 프레임을 포함하는 영역의 서열을 수득할 수 있었다. 데이터베이스에서의 조사를 통하여, 불완전한 개방 판독 프레임 중의 하나가 srmG 유전자 자리("폴리케티드 신타제"(PKS)로 지칭되는 효소를 암호화하는 영역)에 상응한다는 사실을 밝혀낼 수 있었다. 상응하는 유전자를 문헌[참조: S. Burgett et al. in 1996 (US patent 5,945,320)]에 의해 아클로닝시킨다. 더우기, 기타 개방 판독 프레임, 7개의 완전한 ORF[orf1, orf2, orf3, orf4, orf5, orf6 및 orf7(서열 번호 23, 25, 28, 30, 34, 36 및 40)로 명명됨] 및 orf8로 명명된 8번째 ORF의 출발부는 데이터베이스에서 발견되지 않았다.
연속해서, 스피라마이신 생합성에 관여하는 기타 유전자를 클로닝할 목적으로, 이와 동일한 영역 중의 에스. 암보파시엔스 게놈의 단편을 포함하는 기타 코스미드를 분리하였다. 이를 위해, 3가지 프로브를 사용하여, 콜로니 상에서 일련의 추가 하이브리드화를 수행하였다. 제1 프로브는 pOS49.1로부터 아클로닝된, orf1, orf2 및 orf3의 출발부를 함유하는 3.7kb DNA 단편에 상응한다. 제2 프로브는 pOS49.1로부터 아클로닝된, orf7의 일정 부분과 orf8의 일정 부분을 함유하는 2kb DNA 단편에 상응한다. 제3 프로브를 또한 사용하였다. 이러한 후자 프로브는 srmD 유전자를 함유하는 1.8kb DNA 단편에 상응한다. srmD 유전자는 스피라마이신 내성을 부여할 수 있는 에스. 암보파시엔스로부터 분리된 유전자이다. 구체적으로 언급하면, 기존의 연구는 에스. 그리세오푸스쿠스(S. griseofuscus) 균주(스피라마이신-민감성 균주)에 스피라마이신 내성을 부여해주는, 에스. 암보파시엔스의 몇 가지 내성 결정기를 클로닝할 수 있게 해주었다[참조: Pernodet et al., 1993 and Pernodet et al., 1999]. 내성 유전자를 분리하기 위해, 에스. 암보파시엔스 균주의 게놈 DNA의 코스미드 라이브러리를 코스미드 pKC505[참조: Richardson MA et al., 1987]에서 생성시켰다. 이러한 코스미드 풀을, 스피라마이신에 본래 민감한 에스. 그리세오푸스쿠스 내로 도입하였다. 이로써, 에스. 그리세오푸스쿠스에 아프라마이신 내성과 스피라마이신 내성을 부여할 수 있는 5개 코스미드를 수득하였다. 이들 5개 코스미드 중에서, pOS44.1로 명명된 코스미드는 이의 삽입물 내에, 스트렙토마이세스 미카로파시엔스의 mdmA 유전자에 의해 암호화되고 상기 생산자 유기체 내의 미데카마이신 내성과 관련된 단백질과 특정의 유사성을 나타내는 단백질을 암호화하는 srmD 유전자를 함유한다[참조: Hara et al., 1990, 젠뱅크 수탁 번호: A60725)(도 26). 스피라마이신 생합성 유전자를 위치시키기 위해 사용된 제3 프로브는 srmD 유전자를 포함하는 대략 1.8kb의 삽입물이다.
이들 3가지 프로브를 사용하여 상기 언급된 게놈 DNA 라이브러리를 하이브리드화하고, 가장 긴 삽입물을 함유하기 쉽고 공통의 밴드는 전혀 갖지 않는 2개의 코스미드(pSPM7 및 pSPM5)를 선택하는 것이 가능하였다. 코스미드 pSPM5는 제1 및 제2 프로브와 하이브리드화하였지만, 제3 프로브와는 하이브리드화하지 않은 반면, 코스미드 pSPM7은 제3 프로브와만 하이브리드화하였다. 이들 2개의 코스미드는 "숏건(shotgun) 서열 분석" 기술을 사용하여 완전히 서열 분석하였다. 이들 2개의 코스미드 pSPM5 및 pSPM7의 삽입물 서열을 어셈블리할 수 있었는데, 이는 이들이 중복되지는 않았지만, 각각의 삽입물이 이의 한쪽 말단에 공지된 서열을 포함하였기 때문이다. 구체적으로 언급하면, 이들 삽입물 각각이 "폴리케티드 신타제"(PKS)로 지칭된 효소를 암호화하는 유전자들 중의 하나의 서열 단편을 포함하였다. 이들 5개 유전자를 문헌[참조: S. Burgett et al. in 1996 (US patent 5,945,320)]에 의해 클로닝하였다(도 2 참조). 이로써, 단일 에스. 암보파시엔스 게놈 DNA 서열을 결정하는 것이 가능하였다. 5' 위치에서, 제1 PKS 유전자 내에 위치한 EcoRI 부위로부터 출발하고 3' 위치에 BamHI 부위 까지 범위의 30 943 뉴클레오티드 서열이 서열 번호 1에 제시되어 있다. 이러한 서열은 PKS 유전자의 상류 영역에 상응한다(도 2 및 3 참조). 제5 PKS 유전자 내에 위치한, 5' 위치에서 PstI로부터 출발하여 3' 위치에서 BstEII 부위 까지 범위의 11 171 뉴클레오티드의 제2 영역이 서열 번호 2에 제시되어 있다. 이러한 영역은 PKS 유전자의 하류 영역이다(하류 및 상류는 모두 동일한 방향으로 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 2 및 3 참조).
다음에는, 스피라마이신 생합성에 관여하는 기타 유전자를 클로닝할 목적으로, 이와 동일한 영역 중의 에스. 암보파시엔스 게놈의 단편을 포함하는 기타 코스미드를 분리하였다(실시예 18 및 19 참조).
실시예 1: 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 ATCC23877의 게놈 DNA 라이브러리의 작제
1.1 스트렙토마이세스 암보파시엔스 균주 ATCC23877의 게놈 DNA 추출
스트렙토마이세스 암보파시엔스 균주 ATCC23877[특히, 기탁 기관(American Type Culture Collection(ATCC)(Manassas, Virginia, USA))으로부터 번호 23877로 입수 가능함]을 YEME(효모 추출물-맥아 추출물)[참조: Kieser, T, et al., 2000]에서 배양하고 이러한 균주의 게놈 DNA를 용해 및 침전 표준 기술에 따라서 추출 및 정제하였다[참조: Kieser T. et al., 2000].
1.2 게놈 DNA 라이브러리의 작제
상기 분리된 바와 같은 스트렙토마이세스 암보파시엔스 균주 ATCC23877의 게놈 DNA를 BamHI 제한 효소로 부분적으로 분해시켜, 크기가 대략 35 내지 45 kb인 DNA 단편을 수득한다. 이들 단편을, BamHI으로 미리 분해시킨 코스미드 pWED1[참조: Gourmelen et al., 1998] 내로 클로닝시켰다. 코스미드 pWED1은 포유류에서 활성인 발현 모듈(module)을 함유하는 4.1 kb HpaI-HpaI 단편을 결실시킴으로써[참조: Gourmelen et al., 1998] 코스미드 pWE15[참조: Wahl, et al., 1987]로부터 유도된 것이다. 이어서, 이러한 연결 혼합물을 시험관내에서, 프로메가(Promega) 회사에 의해 시판되고 있는 "Packagene®람다 DNA 패키징 시스템"을 제조업자의 권고 사항에 따라서 사용하여 람다 파아지 입자 내에서 단백질 막으로 싼다. 수득된 파아지 입자를 사용하여, 공급원[Stratagene(LaJolla, California, USA)]에 의해 시판되고 있는 이. 콜라이의 SURE® 균주를 감염시킨다. 코스미드 pWED1은 앰피실린 내성을 제공해주기 때문에, 상기 클론을 LB 배지 + 앰피실린(50㎍/ml) 상에서 선별하였다.
실시예 2: 스트렙토마이세스 암보파시엔스에서 스피라마이신 생합성에 관여하는 유전자의 분리 및 성상 확인
2.1 스트렙토마이세스 암보파시엔스 ATCC23877의 게놈 라이브러리의 이. 콜라이 클론의 콜로니 하이브리드화
상기 수득된 라이브러리의 대략 2,000개 이. 콜라이 클론을, 콜로니 하이브리드화를 위해 필터 상으로 옮긴다. 이러한 하이브리드화에 사용된 프로브는 스트렙토마이세스 프라디애의 tylB 유전자의 일정 부분을 포함하는 NaeI-NaeI DNA 단편(서열 번호 86)이다. 이러한 단편은 tylB 유전자의 암호화 서열이 2677번에서 부터 3843번 까지의 뉴클레오티드에 상응하는, 다음 문헌에 의해 기재된 DNA 단편의 2663번에서 부터 3702번 까지의 뉴클레오티드에 상응한다[참조: L.A. Merson-Davies & E. Cundliffe (L.A. Merson-Davies & E. Cundliffe, 1994, 젠뱅크 수탁 번호: U08223].
스트렙토마이세스 프라디애의 tylB 유전자의 일정 부분을 수반하는 NaeI-NaeI DNA 단편(서열 번호 86)을, 무작위 프라이밍 기술 (Roche 회사에 의해 시판되 고 있는 키트)을 이용하여 32P로 표지시키고, 이를 프로브로서 사용하여, 필터 상에 옮긴 상기 라이브러리의 2,000개 클론을 하이브리드화하였다. 사용된 막은 공급원[Amersham (Amersham Biosciences, Orsay, France) 회사]에 의해 시판되고 있는 Hybond N 나일론 막이고, 하이브리드화는 문헌[참조: Church & Gilbert (Church & Gilbert, 1984)]에 기재된 완충액 중에서 55℃ 하에 수행한다. 세척을 15분 동안 55℃ 하에 2X SSC에서 수행한 다음, 55℃ 하에 각각 15분 동안 0.5X SSC에서 2회 연속해서 세척한다. 이러한 하이브리드화 및 세척 조건 하에서, 하이브리드화된 2,000개 중에서 4개 클론이 강력한 하이브리드화 시그널을 나타내었다. 이들 4개 클론을 LB 배지 + 앰피실린(50㎍/ml)에서 배양하고 상응하는 4개 코스미드를 표준 알칼리성 용해에 의해 추출시킨다[참조: Sambrook et al., 1989]. 이어서, 이러한 하이브리드화는 실제로, 이들 4개 코스미드의 삽입물 내에 존재하는 DNA 단편에 기인한다는 사실을 확인하였다. 이를 위해, 코스미드를 여러 개의 효소(BamHI, PstI 및 SacI)로 독립적으로 분해시킨다. 분해 생성물을 아가로스 겔 상에서 분리시키고, 나일론 막 상으로 옮긴 다음, 상기와 동일한 조건 하에서 스트렙토마이세스 프라디애의 tylB 유전자의 일정 부분을 포함하는 NaeI-NaeI DNA 단편(상기 참조)와 하이브리드화시킨다. 4개 코스미드를 실증하는 것이 가능하였고, 이들 코스미드 중의 1개가 보다 특별힌 선별되어 pOS49.1로 명명되었다.
2.2 코스미드 pOS49.1의 삽입물의 서열 분석 및 동정된 영역의 관련 여부 확인
코스미드 pOS49.1의 삽입물의 몇 가지 단편을 아클로닝시키고 이들의 서열을 결정하였다. 코스미드 pOS49.1을 SacI 효소로 분해시키고, 이를 상기 언급된 조건 하에 서던 블롯팅한 결과, 3.3 kb 단편이 tylB 프로브와 하이브리드화되는 영역을 함유하고 있는 것으로 나타났다. 이러한 3.3 kb 단편을 0.8% 아가로스 겔로부터 전기용출시킴으로써 분리시킨 다음, 벡터 pUC19(젠뱅크 수탁 번호: M77789) 내로 클로닝시키고 서열 분석하였다. 이로써 수득된 플라스미드는 pOS49.11로 명명되었다. 프레임플롯(FramePlot) 프로그램(참조: J. Ishikawa & K. Hotta, 1999)을 사용하여, 스트렙토마이세스 특유의 코돈 활용을 나타내는 4개의 개방 판독 프레임을 상기 단편에서 동정할 수 있었다(2개는 완전한 개방 판독 프레임이고 2개는 절단된 개방 판독 프레임이다). FASTA 프로그램[참조: W.R. Pearson & D.J Lipman, 1988 and W.R. Pearson, 1990, 특히 INFOBIOGEN resource center, Evry, France로부터 입수 가능함]을 이용한 서열 비교 결과, 이들 4개의 개방 판독 프레임 중의 1개로부터 추론된 단백질이 에스. 프라디애의 TylB 단백질(서열 번호 87; 젠뱅크 수탁 번호: U08223)과 강력한 서열 유사성을 나타낸다는 사실을 밝혀낼 수 있었다(도 25 참조). 이러한 단백질은 Orf3로 명명되었다(서열 번호 29).
상응하는 유전자(orf3 유전자(서열 번호 28))가 에스. 암보파시엔스에서 스피라마이신 생합성에 관여하는지를 시험할 목적으로, Ωhyg 카세트(참조: M-H. Blondelet-Rouault et al., 1997, 젠뱅크 수탁 번호: X99315)를 이용하여 상기 유전자를 개입중단시켰다. 이를 위해, 플라스미드 pOS49.11을 XhoI 효소로 분해시키고, 4개의 개방 판독 프레임(2개는 완전한 개방 판독 프레임이고 2개는 절단된 프 레임이며, 이에는 원형 상태의 orf3가 포함된다)를 공급원[Stratagene (LaJolla, California, USA)]에 의해 시판되고 있는 벡터 pBC SK+의 XhoI 부위 내로 아클로닝시킨다. 이로써 수득된 플라스미드는 pOS49.12로 명명되었다. orf3을 불활성화시킬 목적으로, orf3 내부의 PmlI-BstEII 단편을 후자 플라스미드 내로의 평활-말단 클로닝에 의해 Ωhyg 카세트로 대체시킨다. 이를 위해, 플라스미드 pOS49.12를 PmlI 및 BstEII 효소로 분해시키는데, 이에 대한 독특한 부위는 orf3 유전자의 암호화 서열이다. 상기 벡터에 상응하는 단편의 말단을 클레노우(Klenow) 효소(DNA 폴리머라제 I 큰 단편)로 처리함으로써 이를 평활 말단화한다. Ωhyg 카세트는 플라스미드 pHP45 Ωhyg[참조: Blondelet-Rouault et al., 1997, 젠뱅크 수탁 번호: X99315]를 BamHI 효소로 분해시킴으로써 수득된다. Ωhyg 카세트에 상응하는 단편을 아가로스 겔 상에서 회수하고, 이의 말단을 클레노우 효소로 처리함으로써 이를 평활 말단화한다. 이로써 수득된 2개의 평활 말단 단편(Ωhyg 카세트 및 플라스미드 pOS49.12)을 연결하고, 이러한 연결 생성물을 사용하여 이. 콜라이 세균을 형질전환시킨다. 이로써 수득된 플라스미드는 pOS49.14로 명명되었으며, 이는 Ωhyg 카세트를 이용하여 개입중단시킨 orf3 유전자를 함유하고 있다.
XhoI-XhoI 단편 형태(이의 말단은 클레노우 효소로 처리함으로써 비-점착성으로 만들었다)의, 플라스미드 pOS49.14의 삽입물을 플라스미드 pOJ260[이러한 플라스미드 pOJ260는 이. 콜라이에서는 복제할 수 있지만, 에스. 암보파시엔스에서는 복제할 수 없는 접합 플라스미드(참조: M. Bierman et al., 1992)이고, 상기 플라스미드는 이. 콜라이와 스트렙토마이세스에 아프라마이신 내성을 부여해준다]의 EcoRV 부위 내로 클로닝시킨다. 이로써 수득된 플라스미드(플라스미드 pOJ260 내로 클로닝된 플라스미드 pOS49.14의 삽입물)는 pOS49.16로 명명되었다. 후자를 문헌[참조: Mazodier et al., 1989]에 기재된 바와 같이, 접합된 이. 콜라이 균주 S17-1을 사용하여 접합시킴으로써 에스. 암보파시엔스 균주 ATCC23877 내로 전이시킨다. 이. 콜라이 균주 S17-1은 이. 콜라이 균주 294로부터 유도된 것이다[참조: Simon et al., 1983 and Simon, et al., 1986]. Ωhyg 카세트에 의해 수반된 히그로마이신 내성 마커를 보유하고 있고 벡터 pOJ260에 의해 수반된 아프라마이신 내성 마커를 상실한 피전달접합균주(transconjugant) 클론을 수득하는 것이 가능하였다. 이를 위해, 접합 후, 상기 클론을 대상으로 하여, 이들의 히그로마이신 내성에 대해 선별하였다. 이어서, 히그로마이신-내성 클론을 각각, 히그로마이신(항생제 B) 함유 배지와 아프라마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 히그로마이신에 내성인 유전자(HygR)와 아프라마이신에 민감한 유전자(ApraS)는 원칙적으로, 이중 재조합 사건이 발생하였으므로 Ωhyg 카세트를 이용하여 개입중단시킨 orf3 유전자를 보유하고 있는 것이다. orf3의 야생형 복사물을 상기 개입중단된 복사물로 대체시키는 것은 2회 연속되는 하이브리드화에 의해 확인되었다. 따라서, 수득된 클론의 총 DNA를 각종 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, Ωhyg 카세트에 상응하는 프로브(상기 참조)와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, 4개의 개방 판독 프레임(2개는 완전한 개방 판독 프레임이고 2개는 절단된 프레임이며, 이에는 원형 상태의 orf3가 포함된다)을 함유 하는 플라스미드 pOS49.11의 XhoI-XhoI을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전형을 확인할 수 있다. 이로써 수득된 orf3::Ωhyg 클론들 중의 하나(이의 유전자형은 확인하였다)를 선택하고, 이를 OS49.16으로 명명하였다.
이와 같이 하여 수득된 OS49.16 클론의 스피라마이신 생성 여부는 다음에 기재되는 생성 시험을 이용하여 시험하였다(실시예 15 참조). 따라서, 상기 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 입증할 수 있었는데, 이는 orf3 및/또는 하류에 위치한 유전자, 예를 들면, orf4가 스피라마이신 생합성에 관여한다는 사실을 확인시켜 준다.
이러한 사실이 일단 확인되면, 코스미드 pOS49.1의 보다 큰 영역을 기존에 연구된 SacI 단편의 어느 한쪽 위에서 서열 분석하였다. 따라서, 코스미드 pOS49.1로부터, 7개의 완전한 개방 판독 프레임과 이러한 7개의 개방 판독 프레임의 한쪽에 위치한 2개의 기타 불완전한 개방 판독 프레임을 포함하는 영역의 서열을 수득하는 것이 가능하였다. 데이터베이스 내에서의 조사를 통하여, 불완전한 개방 판독 프레임 중의 하나가 srmG 유전자 자리("폴리케티드 신타제"(PKS)로 지칭되는 효소를 암호화하는 영역)에 상응한다는 사실을 밝혀낼 수 있었다. 상응하는 유전자를 문헌[참조: S. Burgett et al. in 1996 (US patent 5,945,320)]에 의해 아클로닝시킨다. 더우기, 기타 개방 판독 프레임: 7개의 완전한 ORF[orf1, orf2, orf3, orf4, orf5, orf6 및 orf7(서열 번호 23, 25, 28, 30, 34, 36 및 40)로 명명 됨] 및 orf8로 명명된 8번째 ORF의 출발부(이러한 orf의 완전한 서열은 서열 번호 43에 제시되어 있다)는 데이터베이스에서 발견되지 않았다.
실시예 3: 스트렙토마이세스 암보파시엔스에서 스피라마이신 생합성에 관여하는 기타 유전자의 분리 및 성상 확인
두 번째로, 스피라마이신 생합성에 관여하는 기타 유전자를 클로닝할 목적으로, 이와 동일한 영역 중의 에스. 암보파시엔스 게놈의 단편을 포함하는 기타 코스미드를 분리하였다. 이를 위해, 3가지 프로브를 사용하여, 일련의 추가 콜로니 하이브리드화를 수행하였다:
- 사용된 제1 프로브는 pOS49.1로부터 아클로닝된, orf1, orf2 및 orf3의 출발부와 PKS 유전자의 단편[PKS에 상응하는 유전자는 문헌(참조: S. Burgett et al. in 1996 (US patent 5,945,320)에 의해 클로닝하였다]를 함유하고, 서열 번호 1의 EcoRI 부위를 한정하는 위치 1의 1,300개 염기쌍 상류에 위치한 BamHI 부위에서 부터 2472번에 위치한(서열 번호 1) PstI 부위까지 범위의 3.7kb BamHI-PstI DNA 단편에 상응한다. 이러한 BamHI-PstI 단편을 pOS49.1로부터 플라스미드 pBC SK+ 내로 아클로닝시켜, 플라스미드 pOS49.28을 수득하였다.
- 사용된 제2 프로브는 pOS49.1로부터 아클로닝된 orf7과 orf8의 단편을 함유하고, 서열 번호 1의 6693번에 위치한 PstI 부위에서 부터 서열 번호 1의 8714번에 위치한 BamHI 부위까지 범위의 대락 2 kb의 PstI-BamHI DNA 단편에 상응한다. 이러한 PstI-BamHI 단편을 pOS49.1로부터 플라스미드 pBC SK+ 내로 아클로닝시켜, 플라스미드 pOS49.76을 수득하였다.
- 제3 프로브를 또한 사용하였다. 이는 srmD 유전자를 함유하는 1.8kb EcoRI-HindIII DNA 단편에 상응한다. srmD 유전자는 스피라마이신 내성을 부여할 수 있는 에스. 암보파시엔스로부터 분리된 유전자이다. 구체적으로 언급하면, 기존의 연구는 에스. 그리세오푸스쿠스 균주(스피라마이신-민감성 균주)에 스피라마이신 내성을 부여해주는, 에스. 암보파시엔스의 몇 가지 내성 결정기를 클로닝할 수 있게 해주었다[참조: Pernodet et al., 1993 and Pernodet et al., 1999]. 내성 유전자를 분리하기 위해, 에스. 암보파시엔스 균주 ATCC23877의 게놈 DNA의 코스미드 라이브러리를 코스미드 pKC505[참조: M.A. Richardson MA et al., 1987]에서 생성시켰다. 이를 위해, 에스. 암보파시엔스 균주 ATCC23877의 게놈 DNA를 Sau3AI로 부분적으로 분해시켜, 크기가 대략 30 내지 40kb인 단편을 수득한다. 이로써 분해된 게놈 DNA(3㎍)을, BamHI 효소로 미리 분해시킨 1㎍의 pKC505와 연결시켰다[참조: Permodet et al., 1999]. 이어서, 이러한 연결 혼합물을 시험관 내에서 파아지 입자 내에 단백질 막으로 싼다. 수득된 파아지 입자를 사용하여, 이. 콜라이 균주 HB101(특히, American Type Culture Collection(ATCC)(Manassas, Virginia, USA)로부터 번호 33694로 입수 가능함)를 감염시켰다. 대략 20,000개의 아프라마이신-내성 이. 콜라이 클론을 모으고, 이들 클론의 코스미드를 추출하였다. 이러한 코스미드 풀을, 스피라마이신에 본래 민감한 에스. 그리세오푸스쿠스 균주 DSM 10191[참조: K.L. Cox & R.H. Baltz, 1984] 내로 원형질체 형질전환에 의해 도입하였다[참조: R.N. Rao et al., 1987; 상기 균주는 특히, German Collection of Microorganisms and Cell Cultures(Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, DSMZ), (Braunschweig, Germany)로부터 번호 DSM 10191로 입수 가능하다]. 아프라마이신을 함유하는 배지 상에서 상기 형질전환체를 선별하였다. 아프라마이신을 함유하는 배지 상에서 성장하는 클론들 중의 1,300개를 5㎍/ml의 스피라마이신을 함유하는 배지 상으로 옮겼다. 여러 개의 아프라마이신-내성 클론을 또한, 스피라마이신 함유 배지 상에서 성장시키고, 이들 클로니의 코스미드를 추출하여, 이. 콜라이와 에스. 그리세오푸스쿠스를 형질전환시키는데 사용하였다[참조: Pernodet et al., 1999]. 이로써, 에스. 그리세오푸스쿠스에 아프라마이신 내성과 스피라마이신 내성을 동시에 부여할 수 있고 이. 콜라이에 아프라마이신 내성을 부여할 수 있는 5개 코스미드를 수득하였다. 이들 5개 코스미드 중에서, pOS44.1로 명명된 코스미드는 이의 삽입물 내에, 스트렙토마이세스 미카로파시엔스의 mdmA 유전자에 의해 암호화된 단백질(서열 번호 88)과 특정의 유사성을 나타내는 단백질(서열 번호 16)을 암호화하는 유전자(서열 번호 15)를 함유하는 것으로 결정되었으며; 이러한 유전자는 srmD로 명명되었다{FASTA 프로그램[참조: W.R. Pearson & D.J Lipman, 1988 and W.R. Pearson, 1990, 특히 INFOBIOGEN resource center, Evry, France로부터 입수 가능함]을 사용하여 수행된, 도 26에 제시된 정렬 참조}.
플라스미드 pOS44.1 내에 함유된 내성 결정기를 분리하기 위해, 후자를 Sau3AI 제한 효소로 부분적으로 분해시켜 크기가 대략 1.5 내지 3kb인 단편을 수득하고, 이들 단편을 BamHI 효소로 선형화시킨 벡터 pIJ486에 연결하였다[참조: Ward et al., 1986]. 스피라마이신에 본래 내성인, 에스. 그리세오푸스쿠스 균주 DSM 10191[참조: R.N. Rao et al., 1987]에 스피라마이신 내성을 부여할 수 있는 능력을 알아보기 위해 플라스미드를 선별하였다(상기 참조). 이를 위해, 벡터 pIJ486에 연결된 pOS44.1의 Sau3AI 단편에 상응하는 플라스미드 풀(상기 참조)을 균주 DSM 10191 내로 원형질체 형질전환시킴으로써 도입하고, 이러한 형질전환체를 대상으로 하여, 이들의 티오스트렙톤 내성(pIJ486에 의해 수반된 tsr 유전자에 기인함)에 대해 선별하였다. 티오스트렙톤을 함유하는 배지 상에서 성장하는 클론을 스피라마이신 함유 배지 상으로 옮긴다. 몇 가지 티오스트렙톤-내성 클론이 또한, 스피라마이신 함유 배지 상에서 성장하였으며, 이들 콜로니의 플라스미드를 추출하였다. 내성이 부여되고 대략 1.8kb 삽입물을 함유하는 플라스미드를 선별하고, 이를 pOS44.2로 명명하였다. 이러한 1.8kb 삽입물은, 삽입물 한쪽 상의 벡터 내에 존재하는 HindIII 부위와 EcoRI 부위를 통하여 용이하게 절제될 수 있다. 이러한 1.8kb HindIII-EcoRI 삽입물을 서열 분석하고, 이를 함유하는 내성 유전자를 srmD로 명명하였다. 이로써, srmD 유전자를 함유하는 상기 단편을, EcoRI-HindIII로 개방시킨 벡터 pUC19(젠뱅크 수탁 번호: M77789) 내로 용이하게 아클로닝시킬 수 있었으며, 이와 같이 하여 수득된 플라스미드는 pOS44.4로 명명되었다. srmD 유전자를 함유하는, 상기 플라스미드의 1.8kb HindIII-EcoRI 삽입물을 프로브로서 사용하여 스피라마이신 생합성 유전자를 위치시켰다(하기 참조).
플라스미드 pOS44.4를 함유하는 에스케리챠 콜라이(Escherichia Coli) DH5α 균주를 2002년 7월 10일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes [National Collection of Cultures and Microorganisms] (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-2918로 기탁하였다.
상기 수득된(실시예 1 참조) 라이브러리의 대략 2,000개 클론을 통상적인 기술에 따라서[참조: Sambrook et al., 1989] 콜로니 하이브리드화하기 위해 필터 상으로 옮겼다.
상기 언급된 3가지 프로브를 무작위 프라이밍 기술 (Roche에 의해 시판되고 있는 키트)을 이용하여 32P로 표지시키고, 이를 사용하여, 필터 상에 옮긴 상기 라이브러리의 2,000개 클론을 하이브리드화하였다. 하이브리드화는 문헌[참조: Church & Gilbert (Church & Gilbert, 1984)]에 기재된 완충액 중에서 65℃ 하에 수행한다. 세척을 15분 동안 65℃ 하에 2X SSC에서 수행한 다음, 65℃ 하에 각각 15분 동안 0.5X SSC에서 2회 연속해서 세척한다. 이러한 하이브리드화 및 세척 조건 하에서, 하이브리드화된 2,000개 중에서 16개 클론이 적어도 1개의 프로브와 강력한 하이브리드화 시그널을 나타내었다. 그러나, 어떠한 코스미드도 상기 3가지 프로브와 하이브리드화하지 않았다. 상기 16개 코스미드를 추출하고, BamHI 제한 효소로 분해시킨다. 이들 각종 코스미드의 제한 프로필을 서로 비교한 결과, 가장 긴 삽입물 영역을 함유하기 쉽고 공통의 밴드는 전혀 갖지 않는 2개의 코스미드를 선택하게 되었다. 이로써, pSPM5로 명명된 것과 pSPM7로 명명된 2개의 코스미드를 선택하였다. 코스미드 pSPM5는 프로브 orf1 내지 orf4 및 프로브 orf8와 하이브리 드화하였지만, 프로브 srmD와는 하이브리드화하지 않았다. pSPM7은 프로브 srmD와만 하이브리드화하였고, 다른 2가지 프로브와는 하이브리드화하지 않았다.
이들 2개의 코스미드는 "숏건 서열 분석" 기술을 사용하여 완전히 서열 분석하였다. 이들 2개의 코스미드 pSPM7 및 pSPM5의 삽입 서열을 어셈블리할 수 있었는데, 이는 이들이 중복되지는 않았지만, 각각의 삽입물이 이의 한쪽 말단에 공지된 서열을 포함하였기 때문이다. 구체적으로 언급하면, 이들 삽입물 각각이 "폴리케티드 신타제"(PKS)로 지칭된 효소를 암호화하는 유전자들 중의 하나의 서열 단편을 포함하였다. 이들 5개 유전자를 문헌[참조: S. Burgett et al. in 1996 (US patent 5,945,320)]에 의해 클로닝하였다(도 2 참조). 이로써, 단일 에스. 암보파시엔스 게놈 DNA 서열을 결정하는 것이 가능하였다. 5' 위치에서, 제1 PKS 유전자 내에 위치한 EcoRI 부위로부터 출발하고 3' 위치에 BamHI 부위 까지 범위의 30,943개 뉴클레오티드 서열이 서열 번호 1에 제시되어 있다. 이러한 서열은 PKS 유전자의 상류 영역에 상응한다(도 2 및 3 참조). 제5 PKS 유전자 내에 위치한, 5' 위치에서 PstI로부터 출발하여 3' 위치에서 NcoI 부위 까지 범위의 11,171개 뉴클레오티드의 제2 영역이 서열 번호 2에 제시되어 있다. 이러한 제2 영역은 PKS 유전자의 하류 영역이다(하류 및 상류는 모두 동일한 방향으로 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 2 및 3 참조).
실시예 4: 뉴클레오티드 서열 분석, 개방 판독 프레임의 결정, 및 스피라마이신 생합성에 관여하는 유전자의 성상 확인
수득된 서열은 프레임플롯 프로그램[참조: J. Ishikawa & K. Hotta, 1999]을 사용하여 분석하였다. 이로써, 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정하는 것이 가능하였다. 이러한 분석 결과, 상기 영역이 효소 "폴리케티드 신타제"(PKS)를 암호화하는 5개 유전자의 어느 한 쪽에 위치한 35개 ORF를 포함한다는 사실이 결정되었다. 10개 및 25개 ORF가 각각 이들 유전자의 하류 및 상류에서 동정되었다(하류 및 상류는 모두 동일한 방향으로 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 3 참조). 따라서, 대략 31 kb의 영역을 점유하고 있는 상기 유형의 25개 개방 판독 프레임(서열 번호 1 및 도 37)을 상기 5개 PKS 유전자의 상류에서 동정하였고, 대략 11.1 kb 영역을 점유하고 있는 10개(서열 번호 2 및 도 3)는 PKS 유전자의 하류에서 동정하였다. 상류 영역 유전자는 orf1, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10, orf11c, orf12, orf13c, orf14, orf15c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, orf23c, orf24c 및 orf25c(서열 번호 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 및 84)로 명명되었다. 하류 영역 유전자는 orf1*c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8*, orf9* 및 orf10*(서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21)로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(따라서, 암호화 쇄는 이들 유전자에 대해 서열 번호 1 또는 서열 번호 2에 제시된 서열에 상보적인 쇄이다)(도 3 참조).
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치, COGs(Cluster of Orthologous Groups)(이들 3가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990], BEAUTY[참조: K.C. Worley et al., 1995](이들 2가지 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
실시예 5: 유전자 불활성화: 스트렙토마이세스 암보파시엔스의 녹-아웃 균주의 작제 원리
사용된 방법은 유전자 대체를 수행하는 것으로 이루어진다. 개입중단시키고자 하는 표적 유전자를 도 9에 예시된 바와 같이, 항생제(예를 들면, 아프라마이신 또는 히그로마이신)에 대한 내성을 부여해 주는 카세트를 이용하여 개입중단시킨 상기 유전자의 복사물로 대체시킨다. 사용된 카세트는 어느 한 쪽이, 모든 판독 프레임 내의 해독 종결 코돈과 접해있고, 스트렙토마이세스에서 활동성인 전사 종결인자와 접해있다.
상기 카세트를 표적 유전자 내로 삽입하는 것은 이러한 표적 유전자에서의 결실을 수반하거나 수반하지 않을 수 있다. 상기 카세트를 플랭킹하는 영역의 크기는 수 백개 염기쌍에서 부터 수 천개 염기쌍 범위일 수 있다.
상기 카세트를 사용하여 유전자를 불활성화시키는데 요구되는 작제물은 재조합 DNA 작제물을 수득하기 위한 기준 유기체인 이. 콜라이에서 수득하였다. 개입중단된 유전자는 이. 콜라이에서는 복제될 수 있지만, 스트렙토마이세스에서는 복제될 수 없는 플라스미드에서 수득하였다.
이어서, 상기 작제물을 벡터 내로 아클로닝시켜 에스. 암보파시엔스에서 목적하는 유전자를 불활성화 및 형질전환시킬 수 있다. 이를 위해, 다음 2가지 플라스미드를 사용하였다:
- pOJ260[참조: M. Bierman et al., 1992](실시예 2 참조). 이는 이. 콜라이와 스트렙토마이세스에 아프라마이신 내성을 부여해 주고, 히그로마이신 내성을 부여해 주는 카세트를 이용하여 표적 유전자를 개입중단시킨 경우에 사용된다.
- pOSK1205(4726 bp). 이러한 플라스미드는 네오마이신/카나마이신 내성을 암호화하는 서열을 함유하는 AvrII 단편을 히그로마이신 내성을 암호화하는 서열로 대체시켰지만, P SV40 프로모터는 보존하고 있는 플라스미드 pBK-CMV(Stratagene (LaJolla, California, USA)에 의해 시판됨)로부터 유도된 것이다. 이를 위해, 플라스미드 pHP45-Ωhyg[참조: Blondelet-Rouault et al., 1997]를 NotI 및 PflmI 효소로 분해시키고; 말단 모두를 클레노우 효소로 처리함으로써 평활 말단화시킨 후에, 히그로마이신 내성 부여 단편을 벡터 pBK-CMV의 AvrII 부위 내로 아클로닝시킨다. pOSK1205에서는, 히그로마이신 내성을 부여해 주는 카세트가 pSV40 프로모터 보다 앞에 있다. 이러한 플라스미드는 이. 콜라이와 스트렙토마이세스에 히그로마이신 내성을 부여해 주고, 아프라마이신 내성을 부여해 주는 카세트를 이용하여 표적 유전자를 개입중단시킨 경우에 사용된다.
상기 카세트는 표적 유전자 내에 존재하는 제한 부위를 사용하여 클로닝시키거나, 또는 예를 들어, 문헌[참조: M.K. Chaveroche et al., 2000]에 기재된 바와 같은 동일한 짧은 서열들 간을 재조합시킴으로써 표적 유전자 내로 도입하였다.
이어서, 카세트에 의해 개입중단된 유전자를 수반하는 플라스미드를, 예를 들어, 이. 콜라이와 스트렙토마이세스 간을 접합시킴으로써 스트렙토마이세스 암보파시엔스 내로 도입할 수 있다[참조: P. Mazodier et al., 1989]. 이러한 기술은 기본 벡터가 벡터 pOJ260인 경우에 사용된다. 예를 들어, 문헌[참조: Oh & Chater, 1997]에 의해 기재된 바와 같이 재조합 횟수를 증가시키기 위해, DNA을 알칼리 처리함으로써 변성시킨 후[참조: T. Kieser et al., 2000] 원형질체 형질전환시키는 기술인 제2 기술을 사용할 수 있다. 이러한 기술은 기본 벡터가 pOJ260 또는 pOSK1205(하기 참조)인 경우에 사용된다. 이어서, 표적 유전자 내에 존재하는 카세트에 상응하는 항생제로 형질전환체를 선별한다(도 9, 항생제 B 참조). 이로써, 1회 또는 2회 재조합 사건에 의해 통합이 이루어진 클론의 혼합물을 선별한다. 이어서, 이에 대한 내성 유전자가 벡터 내에 존재하는(재조합 카세트 외부) 항생제(참조: 도 9, 항생제 A)에 민감한 클론을 찾아낸다. 이로써, 원칙적으로 2회 재조합 사건으로 인해 야생형 유전자가 카세트에 의해 개입중단된 복사물로 대체된 클론을 선별하는 것이 가능하다. 이들 단계는 도 9에 도식적으로 제시되어 있다.
몇 가지 카세트를 사용하여 표적 유전자를 개입중단시킬 수 있다. 히그로마이신 내성을 부여해 주는 Ωhyg 카세트[참조: Blondelet-Rouault et al., 1997, 젠뱅크 수탁 번호: X99315]를 사용할 수 있다.
실시예 6:
orf3
유전자에서 동위상 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf3 유전자를 Ωhyg 카세트(실시예 2.2 참조)로 개입중단시키면, orf3::Ωhyg 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 입증하는 것이 가능한데, 이는 클로닝된 영역의 하나 이상의 유전자가 스피라마이신 생합성에 관여한다는 사실을 확인시켜 준다(실시예 2.2 참조). 이들의 배향 측면에서는, ORF 1 내지 7이 동시 전사되는 것으로 예상되고(도 3 참조) 관찰된 표현형(스피라마이신의 비-생산자)는 orf3과 동시 전사되는 유전자 하나 이상을 불활성화시킴으로써 기인된 것일 수 있다. orf3가 스피라마이신 생합성에 관여한다는 사실을 확인하기 위해, orf3 유전자를 추가로 불활성화시키는데, 후반 불활성화는 동위상으로 수행된다. 이를 위해, orf3 내부의 504개 염기쌍의 DraIII 단편을 결실시킨다. 1번(서열 번호 1)에 위치한 EcoRI 부위에서 부터 5274번(서열 번호 1)에 위치한 SacI 부위 까지의 범위이고 2563번과 3067번에 위치한 2개의 DraIII 부위 사이를 결실시킨(504개 뉴클레오티드가 제거됨), pOS49.1로부터 수득된 DNA 단편을 플라스미드 pOJ260 내로 클로닝시킨다[참조: M. Bierman et al., 1992]. 이로써 수득된 플라스미드는 pOS49.67로 명명되었다.
따라서, pOS49.67의 삽입물은 orf1 유전자, orf2 유전자, 동위상 결실시킨 orf3 유전자, orf4 유전자 및 orf5의 일정 부분을 함유하는 에스. 암보파시엔스의 DNA 단편으로 구성된다. 이러한 삽입물이 아클로닝된 벡터가 pOJ260이므로, 플라스미드 pOS49.67은 아프라마이신 내성을 제공해주고, 이를 원형질체 형질전환에 의해 균주 OS49.16 내로 도입시킨다(실시예 2 참조). 균주 OS49.16은 히그로마이신에 내성이기 때문에, hygR 및 apraR 형질전환체가 수득되었다. 이러한 클론을 비-선별성 배지 상에서 2회 계대접종한 후, 아프라마이신에 민감한 클론과 히그로마이신에 민감한 클론(apraS 및 hygS)를 찾아내었다. 이들 클론 중 몇몇에서는, 상동 서열 간의 재조합 사건으로 인해 실제로, (균주 OS49.16의 게놈 내에 함유된) Ωhyg 카세트로 개입중단된 orf3 복사물이, 해당 벡터 상에 존재하는 동위상 결실이 수반된 orf3 복사물로 대체될 것으로 예상된다. 이러한 재조합으로부터 생성된 클론은 벡터 서열의 제거 후 apraS 및 hygS일 것으로 예상된다. 이로써 수득된 균주의 유전자형은 하이브리드화 또는 PCR에 의해 확인할 수 있으며, (orf3의 단지 1개의 동위상 결실된 복사물이 상기 수득된 클론의 게놈 내에 존재한다는 것을 확인하기 위해) PCR 생성물을 서열 분석하였다. 이로써, 동위상 결실된 orf3 복사물을 1개만 갖는 클론을 수득하였으며, 이들의 유전자형을 확인하였다. 목적하는 특징을 나타내는 클론을 보다 특별히 선별하였으며, 이는 OS49.67로 명명되었다.
균주 OS49.67 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2916로 기탁되었다.
실시예 7:
orf8
유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf8 유전자의 불활성화를 수행하기 위해, Ωhyg 카세트를 orf8의 암호화 서열 내로 도입한 작제물을 수득하였다. 이를 위해, 플라스미드 pOS49.88를 우선적으로 작제하였다. 플라스미드 pOS49.88은 pUC19의 PstI-EcoRI 부위 내로 클로닝된, orf7의 말단부, orf8 및 orf9의 출발부를 함유하는 3.7kb 단편(코스미드 pSPM5로부터 수득된 PstI-EcoRI 단편)을 삽입함으로써 플라스미드 pUC19(젠뱅크 수탁 번호: M77789)로부터 유도된 것이다. (클레노우 효소로 처리시킴으로써 평활 말단화된 BamHI 단편 형태의) Ωhyg 카세트를, 클레노우 효소로 처리함으로써 말단 모두를 평활 말단화시킨 후에 orf8에 위치한 pOS49.88의 독특한 SalI 부위 내로 클로닝시킨다.
상기 클로닝이 평활 말단화되었기 때문에, 해당 카세트의 삽입 방향에 따라서 2가지 유형의 플라스미드가 수득되었다: hyg 유전자와 orf8 유전자가 동일한 배향으로 존재하는 pOS49.106; 및 hyg 유전자와 orf8 유전자가 반대 배향으로 존재하는 pOS49.120. 이어서, 플라스미드 pOS49.106의 삽입물을 플라스미드 pOJ260 내로 아클로닝시켜 pOS49.107을 수득한다. 이를 위해, 플라스미드 pOS49.106을 Asp718I 효소로 분해시키고, 클레노우 효소로 처리함으로써 말단을 평활 말단화시키며; 이러한 분해 생성물을 PstI 효소로 재분해시키고, Ωhyg 카세트가 삽입된 orf8 유전자를 함유하는 단편을 벡터 pOJ260(상기 참조) 내로 클로닝시킨다. 이를 위해, 벡 터 pOJ260을 EcoRV 및 PstI 효소로 분해시키고, 연결을 위해 사용한다. 따라서, 이러한 조작으로 특정 배향의 연결을 획득할 수 있는데, 이는 상기 2개 단편 중의 하나를 한쪽에서 평활 말단시키고, 다른 쪽에는 PstI를 평활 말단시키기 때문이다. 이로써 수득된 플라스미드는 pOS49.107로 명명되었다.
플라스미드 pOS49.107을 원형질체 형질전환에 의해 에스. 암보파시엔스 균주 ATCC23877 내로 도입하였다[참조: T. Kieser et al., 2000]. 원형질체 형질전환 후, 상기 클론을 대상으로 하여, 이들의 히그로마이신 내성에 대해 선별하였다. 이어서, 히그로마이신-내성 클론을 각각, 히그로마이신(항생제 B) 함유 배지와 아프라마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 히그로마이신에 내성인 유전자(HygR)와 아프라마이신에 민감한 유전자(ApraS)는 원칙적으로, 이중 유전자교환 사건이 발생하였으므로 Ωhyg 카세트에 의해 개입중단된 orf8 유전자를 함유하고 있는 것이다. orf8의 야생형 복사물을 Ωhyg 카세트에 의해 개입중단된 복사물로 대체시키는 것은 서던 블롯팅에 의해 확인되었다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, Ωhyg 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, 크기가 대략 3.7kb인, orf7의 말단부, orf8 및 orf9의 출발부를 함유하는 플라스미드 pOS49.88의 PstI-EcoRI 삽입물을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
orf8::Ωhyg 클론을 선택하고, 이를 OS49.107로 명명하였다. 균주 OS49.107 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2917 기탁되었다.
실시예 8:
orf10
유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
매트릭스로서 에스. 암보파시엔스의 게놈 DNA를 사용하고 다음 프라이머를 이용함으로써 PCR하여, orf10 유전자 내부의 1.5kb DNA 단편을 수득하였다:
이러한 PCR-유도된 DNA 단편을 벡터 pCR2.1[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨] 내로 클로닝하였다. 이로써 수득된 플라스미드는 pOS49.32로 명명되었다. (BamHI 단편 형태의) Ωhyg 카세트(상기 참조)를, 클레노우 효소로 처리함으로써 말단 모두를 평활 말단화시킨 후에 orf10 유전자 단편 내부의 독특한 BstEII 부위 내로 클로닝시킨다. 상기 클로닝이 평활 말단화되었기 때문에, 해당 카세트의 삽입 방향에 따라서 2가지 유형의 플라스미드가 수득되었다: hyg 유전자와 orf10 유전자가 동일한 배향으로 존재하는 pOS49.43; 및 hyg 유전자와 orf10 유전자가 반대 배향으로 존재하는 pOS49.44. 플라스미드 pOS49.43 의 삽입물(이의 말단을 클레노우 효소로 처리함으로써 평활 말단화시킨 Asp718I-XbaI 단편 형태)을 플라스미드 pOJ260의 EcoRV 부위 내로 전이시켜, 플라스미드 pOS49.50을 수득할 수 있다. Ωhyg 카세트에 의해 개입중단된 orf10 유전자를 함유하는 플라스미드 pOS49.50을 스트렙토마이세스 암보파시엔스 균주 ATCC23877 내로 도입하였다. 형질전환 후, 상기 클론을 대상으로 하여, 이들의 히그로마이신 내성에 대해 선별하였다. 이어서, 히그로마이신-내성 클론을 각각, 히그로마이신(항생제 B) 함유 배지와 아프라마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 히그로마이신에 내성인 유전자(HygR)와 아프라마이신에 민감한 유전자(ApraS)는 원칙적으로, 이중 유전자교환 사건이 발생하였으며 Ωhyg 카세트에 의해 개입중단된 orf10 유전자를 함유하고 있는 것이다. 이로써, 상기 카세트에 의해 수반된 히그로마이신 내성 마커를 함유하고 있고 벡터 pOJ260에 의해 수반된 아프라마이신 내성 마커를 상실한 클론을 수득하였다. orf10의 야생형 복사물을 orf10::Ωhyg 개입중단된 복사물로 대체시키는 것으로 이루어진 사건은 서던 블롯팅에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, Ωhyg 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, orf10 유전자 내의 1.5kb PCR 생성물을 사용하여 제2 하이브리드화를 수행하였다(상기 참조).
예상된 특징을 나타내는 클론(orf10::Ωhyg )을 보다 특별히 선택하고, 이를 OS49.50으로 명명하였다. 사실상, 2회 하이브리드화를 통하여, Ωhyg 카세트가 상 기 클론의 게놈 내에 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 복사물을 Ωhyg 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에, 예상된 분해 프로필을 사실상 수득할 수 있다는 사실을 확인할 수 있었다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
실시예 9: 유전자 불활성화: "절제 가능한 카세트" 기술에 따라서 녹아웃된 스트렙토마이세스 암보파시엔스 균주의 작제 원리(도 9 및 10 참조)
"절제 가능한 카세트"로 지칭되는 제2 유형의 카세트를 유전자 불활성화에 사용할 수 있다. 이들 카세트는 에스. 암보파시엔스의 게놈 내로 도입된 후 부위-특이적 재조합 사건에 의해 스트렙토마이세스에서 절단될 수 있다는 이점을 지니고 있다. 이러한 목적은 최종 균주 내에, 이러한 균주에 속하지 않는 큰 DNA 서열이나 선별 마커를 잔존시키지 않으면서, 스트렙토마이세스 균주 내의 특정의 유전자를 불활성화시키는 것이다. 절제 후, 대략 30개 정도 염기쌍의 짧은 서열("반흔성(scar)" 부위로 지칭됨) 만이 상기 균주의 게놈 내에 잔존한다(도 10 참조).
이러한 시스템의 사용은 초기에는, 표적 유전자의 야생형 복사물을 (2회 상동 재조합 사건을 통하여: 도 9 참조), 절제 가능한 카세트를 상기 표적 유전자 내로 삽입시킨 작제물로 대체시키는 것으로 이루어진다. 이러한 카세트의 삽입은 표적 유전자의 결실을 수반하게 된다(도 9 참조). 그 다음, 상기 균주의 게놈으로부 터 절제 가능한 카세트를 절제시킨다. 절제 가능한 카세트는 부위-특이적 재조합 시스템을 통하여 기능하고, 결국에는 내성 유전자를 수반하지 않는 스트렙토마이세스 돌연변이체를 획득할 수 있게 해주는 이점을 지니고 있다. 불활성화된 유전자(들)의 하류에 위치한 유전자의 발현에 대한 가능한 극성 효과를 또한 피할 수 있다(도 10 참조).
절제 가능한 카세트의 이용에 관해 당해 분야에 보고되었으며, 이는 포유류 세포, 효소 세포 및 이. 콜라이를 포함한 많은 유기체에서 사용되었다[참조: Bayley et al., 1992; Brunelli and Pall, 1993; Camilli et al., 1994; Dale and Ow, 1991; Russell et al., 1992; Lakso et al., 1992]. 이들 절제 가능한 카세트는 모두, lox 부위 상에서 작용하는 Cre 부위-특이적 레컴비나제(recombinase)를 이용한다. 이러한 재조합 시스템은 P1 박테리오파아지로부터 유래한다.
"절제 가능한 카세트" 유형 시스템을 스트렙토마이세스에서 작제하기 위해, 스트렙토마이세스 암보파시엔스의 이동 유전 요소 pSAM2에 대한 부위-특이적 재조합 시스템을 이용한다[참조: Boccard et al., 1989a and b]. 이러한 시스템 설정은 초기에는, 절제 가능한 카세트가 삽입되는, 개입중단될 유전자를 포함하는 재조합 벡터를 작제하는 것으로 구성된다. 절제 가능한 카세트를 표적 유전자 내로 삽입하는 것은 표적 유전자의 결실을 수반하게 된다. 이는 표적 유전자 내에 존재하는 제한 부위를 사용하여 클로닝시키거나, 또는 예를 들어, 문헌[참조: M.K. Chaveroche et al., 2000]에 기재된 바와 같은 동일한 짧은 서열들 간을 재조합시킴으로써 수행할 수 있다. 절제 가능한 카세트는 예를 들어, Ωhyg 카세트를 사용 하여 작제할 수 있다[참조: Blondelet Rouault et al.,1997]. 이러한 카세트는 pSAM2의 통합된 복사물을 정상적으로 플랭킹하는 attR 및 attL 서열과 접해있다(도 15 참조). attL 및 attR 서열은 pSAM2의 절제를 허용하거나 또는 이들 두 영역 사이에 위치한 모든 DNA 단편의 절제를 허용해 주는 부위-특이적 재조합에 필요한 부위 모두를 함유한다[참조: Sezonov et al., 1997, Raynal et al.,1998]. 이러한 카세트의 작제가 Ωhyg 카세트의 사용으로만 제한되지 않는 것은 명백하며, 기타 내성 카세트를 이러한 카세트 작제에 대한 기본으로서 사용할 수 있다[예를 들면, Ωaac 또는 Ωvph 카세트(참조: Blondelet Rouault et al.,1997)].
상기 작제물을 수득한 후, 재조합 플라스미드를 사용하여 스트렙토마이세스 균주를 형질전환시킨다. 이어서, 표적 유전자 내에 존재하는 카세트에 상응하는 항생제로 형질전환체를 선별한다(참조: 도 9, 항생제 B, 이는, 예를 들어, 절제 가능한 카세트가 Ωhyg 카세트로부터 유도되는 경우에는 히그로마이신으로의 선별을 포함한다). 이로써, 1회 또는 2회 재조합 사건에 의해 통합이 이루어진 클론의 혼합물을 선별한다. 이어서, 이에 대한 내성 유전자가 벡터 내에 존재하는(재조합 카세트 외부) 항생제(참조: 도 9, 항생제 A)에 민감한 클론을 찾아낸다. 이로써, 원칙적으로 2회 재조합 사건으로 인해 야생형 유전자가 카세트에 의해 개입중단된 복사물로 대체된 클론을 선별하는 것이 가능하다. 이들 단계는 도 9에 도식적으로 제시되어 있으며; 이로써 수득된 클론의 유전자형은 서던 블롯팅에 의해 확인하고 목적하는 특징(야생형 유전자를 절제 가능한 카세트에 의해 개입중단된 복사물로 대체시킴)을 나타내는 클론을 선별한다.
그 다음, 상기 선별된 균주를, attR 부위와 attL 부위 간의 부위-특이적 재조합에 필요한 xis 및 int 유전자의 발현을 허용해 주는 플라스미드로 형질전환시킨다. 이러한 재조합으로 인해, 재조합 사건을 통하여 상기 균주의 게놈 내에 절제 가능한 카세트가 잔존하게 된다(도 10 참조)[참조: Raynal et al., 1998]. 스트렙토마이세스에서 비교적 안정한 벡터로부터의 xis 및 int 유전자를 수반하는 벡터[스트렙토마이세스 벡터 pWHM3로부터 유도됨(참조: Vara et al., 1989)]를 선택하는 것이 유리한데, 이로써 선별 압력의 부재 하에 포자형성 몇 주기 후에 후자 벡터를 상실한 균주를 수득하는 것이 가능해진다.
상기 카세트를 절제하기 위해, 예를 들어, 절제 가능한 카세트에 의해 개입중단된 유전자를 함유하는 에스. 암보파시엔스 균주 내로 원형질체 형질전환시킴으로써 도입되는 플라스미드 pOSV508(도 14 참조)를 사용하는 것이 가능하다. 플라스미드 pOSV508는 ptrc 프로모터(참조: E. Amann et al., 1988)의 제어 하에 위치된, pSAM2의 xis 및 int 유전자(참조: F. Boccard et al., 1989b)가 부가된 플라스미드 pWHM3(참조: J. Vara et al.,1989)(도 13 참조)으로부터 유도된 것이다. ptrc 프로모터의 제어 하에 위치된 xis 및 int 유전자를 플라스미드 pOSint3으로부터의 플라스미드 pWHM3 내로 아클로닝시킨다(참조: Raynal et al., 1998)(도 14 참조). pSAM2의 xis 및 int 유전자를 수반하는 플라스미드 pOSV508을 돌연변이체 균주 내로 도입하면, 절제 가능한 카세트를 플랭킹하는 attL 부위와 attR 부위 간의 부위-특이적 재조합에 의해 이러한 절제 가능한 카세트를 효과적으로 절제시켜 줄 것이다(참조: A. Raynal et al., 1998)(도 10). pOSV508에 의해 수반된 tsr 유전 자에 기인하여 이들의 티오스트렙톤 내성에 대해 선별된 형질전환체 중에서, 해당 카세트의 존재가 내성을 부여해 주는 항생제에 대해 민감한 형질전환체를 선택한다(도 10 참조). 이러한 절제는 효과적이고, 형질전환체의 90% 이상이 이러한 유형인 것으로 관찰되었다. 티오스트렙톤이 결여된 고체 배지 상에서의 성장과 포자형성을 1회 이상 수행한 후, 플라스미드 pOSV508을 상실한 클론을 수득한다. 이들 클론은 티오스트렙톤에 대한 이들의 민감성 측면에서 탐지될 수 있다. 결실된 표적 유전자의 서열은 PCR에 의해 확인할 수 있고 이러한 PCR 생성물을 서열 분석함으로써 확인할 수 있다.
최종적으로, 이로써 생성된 균주는 불활성화 유전자(예를 들어, 내부 결실물) 내에, attR 부위와 attL 부위 간의 재조합으로부터 유도된, 최소 attB 부위(참조: Raynal et al., 1998)에 상응하는 "반흔성" att 부위를 수반한다. 잔존하는 최소 attB 부위는 스트렙토마이세스 암보파시엔스, 스트렙토마이세스 프리스티내스피랄리스(Streptomyces pristinaespiralis) 및 스트렙토마이세스 리비단스 균주에 천연적으로 존재하는 것과 유사하다(참조: Sezonov et al., 1997).
불활성화시키고자 하는 유전자를 하류에 위치한 기타 유전자와 동시 전사시킬 수 있다. 오페론에서 하류 유전자의 발현에 대한 극성 효과를 지니고 있는 유전자들 중의 하나가 불활성화되는 것을 피하기 위해서는, 카세트를 절제한 후 동위상 결실을 획득하는 것이 중요하다. 상기 언급된 바와 같은 절제 가능한 카세트 시스템은 이러한 요구 사항을 충족시켜 줄 수 있다. 당업자는 사실상, 3가지 상이한 절제 가능한 카세트를 용이하게 작제할 수 있는데, 이러한 카세트는 절제 후, 판독 프레임이 무엇이든지 간에 중지 코돈을 수반하지 않는 33, 34 또는 35개 뉴클레오티드 서열을 각각 잔존시킨다. 상기 카세트의 삽입과 연관된 결실 크기와 표적 유전자의 서열이 공지된 경우에는, 이들 3가지 절제 가능한 카세트 중에서, 절제시키면 동위상 결실되는 것을 선택하는 것이 가능하다. 부가된 33, 34 또는 35개 뉴클레오티드 중에서, 26개가 최소 attB 부위에 상응한다(도 27 참조).
본 출원의 경우에는, 2가지 절제 가능한 카세트를 사용하였다. 이들 2가지 카세트는 다음과 같다: att1Ωhyg+(서열 번호 91) 및 att3Ωaac-(서열 번호 92); 이들 카세트는 절제 후 각각 33 및 35개 뉴클레오티드를 잔존시킨다. 이들은 각각, Ωhyg 카세트 또는 Ωaac 카세트를 포함하며, + 및 - 부호는 내성 카세트의 배향에 상응한다. 이들 두 카세트를 작제하고 벡터 pBC SK+의 EcoRV 부위 내로 클로닝하였는데, 이의 HindIII 부위는 미리 결실시켰다. 이로써 수득된 플라스미드는 patt1Ωhyg+ 및 patt3Ωaac-로 각각 명명되었다. 절제 가능한 카세트는 플라스미드를 EcoRV로 분해시킴으로써 용이하게 꺼낼 수 있다.
실시예 10:
orf2
유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf2 유전자의 불활성화는 절제 가능한 카세트를 사용하여 수행하였다(상기 참조). 사용된 출발 균주는 균주 ATCC23877로부터 유도되는 스트렙토마이세스 암보파시엔스 균주 OSC2이다. 그러나, 균주 OSC2는 이동 유전 요소 pSAM2를 상실하였다는 점에서 균주 ATCC23877와 상이하다(참조: Boccard et al., 1989a and b). 이러한 이동 요소는 균주 ATCC23877의 원형질체 형성(세포벽을 분해시키고 균사체를 단편으로 만드는 리소자임의 작용(참조: Kieser et al., 2000)) 및 상기 균주의원형질체 재생 동안 자발적으로 상실될 수 있다. pSAM2 요소를 상실한 클론을 선별하기 위해, KorSA 전사 억제인자에 의한 pra 유전자의 억제에 근거하여 스크린을 설정하였다(참조: Sezonov et al., 1995 and G. Sezonov et al., 2000). 이를 위해, aph 유전자(카나마이신 내성을 부여해 주고 자신의 프로모터가 결여되어 있음)의 상류에 위치한 pra 유전자의 프로모터를 함유하는 DNA 단편을 불안정한 벡터 pWHM3Hyg 내로 클로닝하는데, 후자는 tsr 유전자를 hyg 유전자(히그로마이신 내성을 부여함)로 대체시킨 플라스미드 pWHM3(참조: Vara et al., 1989)로부터 유도된다. 이로써 수득된 플라스미드는 pOSV510로 명명되었다. 균주 ATCC23877는 원형질체 형성 후에 플라스미드 pOSV510로 형질전환시켰다. Pra 프로모터는 KorSA 억제인자에 의해 억제되는 프로모터이고, 후자를 암호화하는 유전자는 pSAM2 이동 요소 내에 위치해 있다(참조: Sezonov G. et al., 2000). 플라스미드 pOSV510로 형질전환시킨 후, 형질전환된 세균을 대상으로 하여, 이의 카나마이신 내성에 대해 선별하였다(pOSV510에 의해 수반된 aph 유전자에 기인함). pSAM2 통합 요소를 상실한 클론은 KorSA 억제인자를 상실하였으며, Pra 프로모터는 더 이상 억제되지 않으며 aph 카나마이신 내성 유전자의 발현을 허용해 준다. 따라서, 플라스미드 pOSV510로의 형질전환 후 카나마이신으로 선별하게 되면, pSAM2 통합 요소를 상실하고(이에 따라 KorSA를 상실함) 플라스미드 pOSV510을 함유하는 클론을 선별하는 것이 가능해진다. 플라스미드 pOSV510은 불안정하기 때문에, 항생제 없이 포자 형 성을 수회 수행한 후에 분리된 클론을 카나마이신 함유 배지, 히그로마이신 함유 배지 및 항생제 무함유 배지 상에서 계대배양하였다. 카나마이신과 히그로마이신에 민감한 클론은 pOSV510을 상실하였다. pSAM2 요소의 상실은 하이브리드화 및 PCR에 의해 확인하였다. 목적하는 특징을 나타내는 클론을 선별하고 이를 OSC2로 명명하였다.
균주 OSC2 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2908로 기탁되었다.
orf2 유전자의 불활성화는 절제 가능한 카세트 기술을 사용하여 수행하였다(상기 및 도 10 참조). 이를 위해, 1번에 위치한 EcoRI 부위에서 부터 출발하여 4521번(서열 번호 1)에 위치한 BamHI 부위 까지 서열의 4.5kb 삽입물을 코스미드 pSPM5로부터의 플라스미드 pUC19(젠뱅크 수탁 번호: M77789)의 EcoRI 및 BamHI 부위 내로 아클로닝시켰다. 이로써 수득된 플라스미드는 pOS49.99로 명명되었다.
이러한 플라스미드를, 플라스미드 pKOBEG를 이미 함유하고 있는 이. 콜라이 균주 KS272 내로 도입하였다(참조: Chaveroche et al., 2000)(도 12 참조).
이와 병행해서, att3Ωaac- 절제 가능한 카세트(서열 번호 92, 상기 참조)를, 매트릭스로서 플라스미드 pOSK1102[플라스미드 pOSK1102는 att3Ωaac- 카세트를 EcoRV 단편으로서, pGP704Not의 독특한 EcoRV 부위 내로 클로닝시킨 벡터 pGP704Not로부터 유도된 플라스미드이다(참조: Chaveroche et al., 2000 and V.L. Miller & J.J. Mekalanos, 1988)]를 사용하고, 다음 프라이머를 사용하여 PCR함으 로써 증폭시켰다:
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개 데옥시뉴클레오티드는 표적 유전자(본 경우에는 orf2) 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 20개 데옥시뉴클레오티드(진하게 표시됨)는 att3Ωaac- 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다(도 11 참조).
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 pOS49.99를 함유하는 이. 콜라이 균주를 형질전환시킨다(도 12 참조). 이로써, 상기 세균을 전기천공시킴으로써 형질전환시키고, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3Ωaac- 카세트가 표적 유전자(orf2) 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 플라스미드를 추출하고 여러 제한 효소로 분해하였다(참조: Chaveroche et al., 2000). 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 플라스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 플라스미드는 pSPM17로 명명하였다. 이러한 플라스미드는 orf2가 아프라마이신 카세트에 의해 개입중단된 pOS49.99로부 터 유도된 것이다(도 12 참조).
상기 카세트의 삽입은 orf2의 암호화 부분의 211번 뉴클레오티드와 492번 뉴클레오티드 사이의 orf2 결실을 수반한다.
플라스미드 pSPM17을 EcoRI 효소로 분해시킨 다음, 클레노우 효소로 처리함으로써 평활 말단화하고, 이러한 분해 생성물을 XbaI 효소로 분해시키고, 결실된 orf2 유전자를 함유하는 삽입물을 벡터 pOSK1205(상기 참조) 내로 클로닝시켰다. 이를 위해, 벡터 pOSK1205를 BamHI 효소로 분해시키고, 이의 말단을 클레노우 효소로 처리함으로써 평활 말단화한 다음, 이 생성물을 XbaI 효소로 분해시키고, 상기와 같이 pSPM17로부터 수득된 삽입물과의 연결에 사용하였다. 따라서, 이러한 조작으로 특정 배향의 연결을 획득할 수 있는데, 이는 상기 2개 단편 중의 하나를 한쪽에서 평활 말단시키고, 다른 쪽에는 XbaI를 평활 말단시키기 때문이다. 이로써 수득된 플라스미드는 pSPM21로 명명되었는데; 이는 히그로마이신 내성 유전자(벡터 부분)와, 결실된 orf2 유전자를 att3Ωaac- 카세트로 대체시킨 삽입물을 수반한다.
벡터 pSPM21을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 히그로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 유전자(HygS)는 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3Ωaac- 카세트에 의해 개입중단된 orf2 유 전자를 함유하고 있는 것이다. 이들 클론을 선별하고, orf2의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 확인하였다. att3Ωaac- 카세트의 존재는 콜로니 PCR에 의해 확인하였다. 하이브리드화를 또한 수행하였다. 이를 위해, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, 플라스미드 pOS49.99(상기 참조) 삽입물의 EcoRI-BamHI 단편에 상응하는 3kb 프로브와 하이브리드화하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론을 선별하고, 이를 SPM21로 명명하였다. PCR 및 하이브리드화를 이용하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 복사물을 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에, 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf2::att3Ωaac-을 갖는다.
균주 SPM21 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2914로 기탁되었다.
상기 카세트를 절제하기 위해, 균주 SPM21을 원형질체 형질전환에 의해 벡터 pOSV508로 형질전환시켰다(도 14 참조). 플라스미드 pOSV508는 ptrc 프로모터(참조: E. Amann et al., 1988)의 제어 하에 위치된, pSAM2의 xis 및 int 유전자(참 조: F. Boccard et al., 1989b)가 부가된 플라스미드 pWHM3(참조: J. Vara et al.,1989)(도 13 참조)으로부터 유도된 것이다. pSAM2의 xis 및 int 유전자를 수반하는 플라스미드 pOSV508을 상기 균주 SPM21 내로 도입하면, 절제 가능한 카세트를 플랭킹하는 attL 부위와 attR 부위 간의 부위-특이적 재조합에 의해 이러한 절제 가능한 카세트를 효과적으로 절제시켜 줄 것이다(참조: A. Raynal et al., 1998)(도 10). pOSV508에 의해 수반된 tsr 유전자에 기인하여 이들의 티오스트렙톤 내성에 대해 선별된 형질전환체 중에서, 아프라마이신에 대해 민감해진 형질전환체(이에 대한 내성 유전자는 att3Ωaac- 카세트에 의해 수반된다)를 선택하는데; 이러한 절제로 인해, 사실상 상기 내성 유전자가 상실된다(도 10 참조). 플라스미드 pOSV508은 불안정하기 때문에, 항생제 무함유 배지 상에서 2회 연속해서 계대접종한 후, 분리된 클론을 티오스트렙톤 함유 배지 및 티오스트렙톤 무함유 배지 상에서 계대배양하였다. 티오스트렙톤-민감성 클론은 pOSV508을 상실하였다. PCR하고 PCR 생성물을 서열 분석함으로써, 상기 카세트의 절제로 인해 orf2 유전자 내에서 동위상 결실이 실제로 일어났다는 사실을 확인하였고; 이러한 카세트의 절제는 사실상, 특징적인 "반흔성" att3 서열을 잔존시킨다(이는 attL 부위와 attR 부위 간의 재조합 후 기원의 attB 부위와 유사하다):
5'ATCGCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3'(서열 번호 95).
이로써 수득된, 목적하는 유전자형(orf2::att3)을 갖는 균주는 SPM22로 명명되었다.
균주 SPM22 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2915로 기탁되었다.
실시예 11:
orf12
유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf12, orf13c 및 orf14를 불활성화시키기 위해, 동일한 출발 플라스미드(pSPM504)를 사용하여, 각종 위치에 "절제 가능한 카세트"의 카세트를 도입하였다. 이러한 플라스미드는 orf7에서 부터 orf17까지의 영역에 상응하는 15.1kb 삽입물을 함유한다. 상기 플라스미드를 작제하기 위해, 코스미드 pSPM7(상기 참조)의 분해로부터 유래하는 15.1kb BglII 단편을, BamHI로 분해시킨 플라스미드 pMBL18(참조: Nakano et al., 1995) 내로 클로닝하였다. BamHI 말단과 BglII 말단은 호환성이기 때문에, 연결 후에 플라스미드 pSPM502를 수득한다. 이어서, pSPM502 완전한 삽입물을 (HindIII/NheI 단편 형태로) 플라스미드 pOSK1205(HindIII/NheI로 분해시킴) 내로 아클로닝시켜, 플라스미드 pSPM504를 수득할 수 있다.
이러한 플라스미드를, 플라스미드 pKOBEG를 이미 함유하고 있는 이. 콜라이 균주 KS272 내로 도입하였다(참조: Chaveroche et al., 2000)(도 12 참조).
이와 병행해서, att3Ωaac- 절제 가능한 카세트를, 매트릭스로서 플라스미드 pOSK1102[플라스미드 pOSK1102는 att3Ωaac- 카세트를 EcoRV 단편으로서, pGP704Not의 독특한 EcoRV 부위 내로 클로닝시킨 벡터 pGP704Not로부터 유도된 플라스미드이다(참조: Chaveroche et al., 2000 and V.L. Miller & J.J. Mekalanos, 1988)]를 사용하여 PCR함으로써 증폭시켰으며, 사용된 프라이머는 다음과 같다:
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개(EDR8의 경우에는 39개) 데옥시뉴클레오티드는 표적 유전자(본 경우에는 orf12) 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 20개 데옥시뉴클레오티드(진하게 표시됨)는 att3Ωaac- 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다(도 11 참조).
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 pSPM504(상기 참조)를 함유하는 이. 콜라이 균주 KS272를 형질전환시킨다(도 12 참조; 원칙적으로 플라스미드 pOS49.99는 플라스미드 pSPM504로 대체되어야 하고, 수득된 플라스미드는 더 이상 pSPM17이 아니지만, pSPM507이다). 이로써, 상기 세균을 이러한 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3Ωaac- 카세트가 표적 유전자(orf12) 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 플라스미드를 추출하고 여러 제한 효소로 분해하였다(참조: Chaveroche et al., 2000). 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사 용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 플라스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 플라스미드는 pSPM507로 명명되었다. 이러한 플라스미드는 orf12가 att3Ωaac- 카세트에 의해 개입중단된 pSPM504로부터 유도된 것이다(도 12 참조). 상기 카세트의 삽입은 orf12 유전자에서의 결실을 수반하는데, 개입중단은 orf12의 30번째 코돈에서 시작한다. orf12의 마지막 46개 코돈은 카세트 다음에 존재한다.
벡터 pSPM507을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 히그로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 유전자(HygS)는 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3Ωaac- 카세트에 의해 개입중단된 orf12 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf12의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3Ωaac- 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, PCR에 의해 수득되고 orf12 유전자의 암호화 서열의 매우 큰 부분에 상응하는 DNA 단편을 사용하여 제2 하이브리드화를 수행 하였다.
당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf12::att3Ωaac-)을 보다 특별히 선별하고, 이를 SPM507로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf12::att3Ωaac-을 갖고 SPM507로 명명되었다. 유전자의 배향이 주어지면(도 3 참조), orf12의 불활성화 효과를 연구하기 위해 카세트를 절제할 필요가 없다. 구체적으로 언급하면, orf13c가 orf12와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도, 특히 플라스미드 pOSV508로의 형질전환에 의해 제거할 수 있는 가능성이 생긴다. 균주 SPM507 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2911로 기탁되었다.
실시예 12:
orf13c
유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
att3Ωaac- 절제 가능한 카세트를, 매트릭스로서 플라스미드 pOSK1102(상기 참조)를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시켰다:
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개 데옥시뉴클레오티드는 표적 유전자(본 경우에는 orf13c) 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 20개 데옥시뉴클레오티드(진하게 표시됨)는 att3Ωaac- 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다(도 11 참조).
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 pSPM504(상기 참조)를 함유하는 이. 콜라이 균주 KS272를 형질전환시킨다(도 12 참조; 원칙적으로 플라스미드 pOS49.99는 플라스미드 pSPM504로 대체되어야 하고, 수득된 플라스미드는 더 이상 pSPM17이 아니지만, pSPM508이다). 이로써, 상기 세균을 이러한 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3Ωaac- 카세트가 표적 유전자(orf13c) 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 플라스미드를 추출하고 여러 제한 효소로 분해하였다(참조: Chaveroche et al., 2000). 당업자에게 공지된 모든 방법, 특히 적당한 올리 고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 플라스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 플라스미드를 pSPM508로 명명하였다. 이러한 플라스미드는 orf13c가 아프라마이신 카세트에 의해 개입중단된 pSPM504로부터 유도된 것이다(도 12 참조). 상기 카세트의 삽입은 orf13c 유전자에서의 결실을 수반하는데, 개입중단은 orf13c의 6번째 코돈에서 시작한다. orf13c의 마지막 3개 코돈은 카세트 다음에 존재한다.
벡터 pSPM508을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 히그로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 클론(HygS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3Ωaac- 카세트에 의해 개입중단된 orf13c 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf13c의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3Ωaac- 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, orf13c의 암호화 서열의 상류 및 하류에 대략 100개 염기쌍 정도로 연장된 서열에 상응하는 PCR 생성물을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf13c::att3Ωaac-)을 보다 특별히 선별하고, 이를 SPM508로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf13c::att3Ωaac-을 갖고 SPM508로 명명되었다. 유전자의 배향이 주어지면(도 3 참조), orf13c의 불활성화 효과를 연구하기 위해 카세트를 절제할 필요가 없다. orf14가 orf13c와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM508 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2912로 기탁되었다.
실시예 13:
orf14
유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
att3Ωaac- 절제 가능한 카세트를, 매트릭스로서 플라스미드 pOSK1102(상기 참조)를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시켰다:
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개 데옥시뉴클레오티드는 표적 유전자(본 경우에는 orf14) 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 20개 데옥시뉴클레오티드(진하게 표시됨)는 att3Ωaac- 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다(도 11 참조).
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 pSPM504(상기 참조)를 함유하는 이. 콜라이 균주 KS272를 형질전환시킨다(도 12 참조; 원칙적으로 플라스미드 pOS49.99는 플라스미드 pSPM504로 대체되어야 하고, 수득된 플라스미드는 더 이상 pSPM17이 아니지만, pSPM509이다). 이로써, 상기 세균을 이러한 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3Ωaac- 카세트가 표적 유전자(orf14) 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 플라스미드를 추출하고 여러 제한 효소로 분해하였다(참조: Chaveroche et al., 2000). 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 플라스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 플라스미드를 pSPM509로 명명하였다. 이러한 플라스미드는 orf14가 아프라마이신 카세트에 의해 개입중단된 pSPM504로부터 유도된 것이다(도 12 참조). 상기 카세트의 삽입은 orf14 유전자에서의 결실을 수반하는데, 개입중단은 orf14의 4번째 코돈에서 시작한다. orf14의 마지막 코돈은 카세트 다음에 존재한다.
벡터 pSPM509를 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 히그로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 클론(HygS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3Ωaac- 카세트에 의해 개입중단된 orf14 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf14의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3Ωaac- 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, orf14의 암호화 서열의 상류 및 하류에 대략 100개 염기쌍 정도로 연장된 서열에 상응하는 PCR 생성물을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf14::att3Ωaac-)을 보다 특별히 선별하고, 이를 SPM509로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf14::att3Ωaac-을 갖고 SPM509로 명명되었다. 유전자의 배향이 주어지면(도 3 참조), orf14의 불활성화 효과를 연구하기 위해 카세트를 절제할 필요가 없다. orf15c가 orf14와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM509 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2913으로 기탁되었다.
실시예 14:
orf6*
유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf6* 유전자의 불활성화는 절제 가능한 카세트 기술을 사용하여 수행하였다(상기 및 도 10 참조). 이를 위해, 코스미드 pSPM7을 매트릭스로서 사용하고 다음 올리고뉴클레오티드를 사용하여, orf6* 유전자의 일정 단편을 증폭시켰다:
이들 올리고뉴클레오티드의 3' 말단에 위치한 20개 데옥시뉴클레오티드는 orf6* 유전자(서열 번호 13)의 암호화 부분에 위치한 서열에 상응하고, 5' 위치에 가장 근접하게 위치한 6개 데옥시뉴클레오티드는 후속 클로닝을 촉진시켜 주는 PstI 부위의 서열에 상응한다. 증폭된 DNA 단편은 크기가 대략 1.11kb이다. 이러한 PCR 생성물을 벡터 pGEM-T Easy(Promega (Madison, Wisconsin, USA) 회사에 의해 시판됨) 내로 클로닝시켜, pBXL1111로 명명된 플라스믿를 수득할 수 있다(도 16 참조).
이어서, att1Ωhyg+ 절제 가능한 카세트를 orf6* 유전자의 암호화 서열 내로 도입하였다. 이를 위해, 플라스미드 pBXL1111을 SmaI 및 Asp718I 제한 효소로 분해시키고, 분해 생성물을 클레노우 효소로 처리하였다. 이러한 조작으로 인해, orf6* 유전자의 암호화 서열 내에 120bp의 내부 결실을 유발시킬 수 있다(도 15 참조). 또한, 상기 제한 부위 중의 어느 한쪽에 orf6* 서열의 511bp와 485bp가 각각 잔존하는데, 이는 orf6* 유전자의 불활성화를 위한 상동 재조합을 허용해줄 것이 다. att1Ωhyg+ 절제 가능한 카세트는 플라스미드 patt1Ωhyg+(상기 참조)를 EcoRV로 분해시킴으로써 이러한 플라스미드로부터 제조하였다. 이어서, 후자를, 앞서 기재된 바와 같이 하여(SmaI 및 Asp718I 분해에 이어, 클레노우 효소로 처리함) 미리 제조한 벡터 pBXL1111 내로 아클로닝시킨다. 수득된 플라스미드는 pBXL1112로 명명하였다(도 17 참조). 이러한 작제물에서는 orf6* 유전자가 120bp 결실을 포함하고 att1Ωhyg+ 카세트에 의해 개입중단된다.
이어서, 플라스미드 pBXL1112를 PstI 효소(PCR 올리고뉴클레오티드 내에 존재하기 때문에 카세트를 둘러싸고 있는 부위)로 분해시키고, att1Ωhyg+ 카세트에 의해 개입중단된 orf6*의 일정 부분을 포함하는 3.7kb PstI 삽입물을 플라스미드pOJ260(상기 참조)의 PstI 부위 내로 클로닝시켰다. 이로써 수득된 플라스미드는 pBXL1113로 명명되었다.
벡터 pBXL1113을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 히그로마이신 내성에 대해 선별하였다. 이어서, 히그로마이신-내성 클론을 각각, 히그로마이신(항생제 B) 함유 배지와 아프라마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 히그로마이신에 내성인 클론(HygR)과 아프라마이신에 민감한 클론(ApraS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att1Ωhyg+ 카세트에 의해 개입중단된 orf6* 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf6*의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 서던 블롯팅 기술에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, hyg 유전자(PCR에 의해 수득됨)에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, orf6* 유전자를 함유하는, 크기가 대략 1.1kb이고 플라스미드 pBXL1111(상기 및 도 16 참조)로부터 수득된 PstI-PstI 삽입물을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf6*::att1Ωhyg+)을 보다 특별히 선별하고, 이를 SPM501로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att1Ωhyg+ 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att1Ωhyg+ 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf6*::att1Ωhyg+을 갖고 SPM501로 명명되었다. 균주 SPM501 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2909로 기탁되었다.
상기 카세트를 절제하기 위해, 균주 SPM501을 원형질체 형질전환에 의해 벡터 pOSV508로 형질전환시켰다(도 14 참조). 플라스미드 pOSV508는 ptrc 프로모터( 참조: E. Amann et al., 1988)의 제어 하에 위치된, pSAM2의 xis 및 int 유전자(참조: F. Boccard et al., 1989b)가 부가된 플라스미드 pWHM3(참조: J. Vara et al.,1989)(도 13 참조)으로부터 유도된 것이다. pSAM2의 xis 및 int 유전자를 수반하는 플라스미드 pOSV508을 상기 균주 SPM501 내로 도입하면, 절제 가능한 카세트를 플랭킹하는 attL 부위와 attR 부위 간의 부위-특이적 재조합에 의해 이러한 절제 가능한 카세트를 효과적으로 절제시켜 줄 것이다(참조: A. Raynal et al., 1998)(도 10). pOSV508에 의해 수반된 tsr 유전자에 기인하여 이들의 티오스트렙톤 내성에 대해 선별된 형질전환체 중에서, 히그로마이신에 대해 민감해진 형질전환체(이에 대한 내성 유전자는 att1Ωhyg+ 카세트에 의해 수반된다)를 선택하는데; 이러한 절제로 인해, 사실상 상기 내성 유전자가 상실된다(도 10 참조). 플라스미드 pOSV508은 불안정하기 때문에, 항생제 무함유 배지 상에서 2회 연속해서 계대접종한 후, 분리된 클론을 티오스트렙톤 함유 배지 및 티오스트렙톤 무함유 배지 상에서 계대배양하였다. 티오스트렙톤-민감성 클론은 pOSV508을 상실하였다. PCR하고 PCR 생성물을 서열 분석함으로써, 상기 카세트의 절제로 인해 orf6* 유전자 내에서 동위상 결실이 실제로 일어났다는 사실을 확인하였다. 개입중단은 158번째 코돈에서 시작하고, 40개 코돈이 결실되며(120bp), 이러한 카세트의 절제는 33bp의 특징적인 "반흔성" att1 서열을 잔존시킨다:
5'ATCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3'(서열 번호 104).
이로써 수득된, 목적하는 유전자형(orf6*::att1)을 갖는 균주는 SPM502로 명명되었다.
균주 SPM502 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2910으로 기탁되었다.
실시예 15:
orf2, orf3, orf8, orf10, orf12, orf13c, orf14
또는
orf6*
유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 분석
수득된 각종 균주의 스피라마이신 생산을 시험하기 위해, 미크로코쿠스 루테우스 균주의 민감성에 근거한 미생물학적 시험을 개발하였다(참조: A. Gourmelen et al., 1998). 사용된 미크로코쿠스 루테우스 균주는 스피라마이신에 대해서는 천연적으로 민감한 균주 DSM1790[이러한 균주는 특히, German Collection of Microorganisms and Cell Cultures(Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, DSMZ), (Braunschweig, Germany)로부터 번호 DSM 1790으로 입수 가능하다]로부터 유래된 균주이며; 본 시험에 사용된 균주는 이것이 콘고시딘(congocidine)에 대해서 내성이라는 점에서 균주 DSM 1790과 상이하다. 이러한 균주는 증가 량의 콘고시딘을 함유하는 배지 상에서 선별함으로써 수득된 자연 돌연변이체이다. 상기 균주는 스트렙토마이세스 암보파시엔스가 스피라마이신과 콘고시딘을 둘 다 생산한다는 사실에 기인하여 선별하였다. 미크로코쿠스 루테우스 균주의 민감성에 근거한 미생물학적 시험을 이용하여 수득된 각종 균주의 스피라마이신 생산을 검정하고자 하는 것이 목적이기 때문에, 콘고시딘-내성 균주를 갖는 것이 필요하다.
시험하고자 하는 각종 스트렙토마이세스 균주를, 70ml의 MP5 배지를 함유하는 500ml용 에를렌마이어 플라스크에서 배양한다(참조: Pernodet et al., 1993). 차폐된(baffled) 에를렌마이어를 각종 에스. 암보파시엔스 균주의 2.5 x 106개 포자/ml의 초기 농도로 접종하며, 250rpm으로 궤도 진탕시키면서 27℃ 하에 성장시킨다. 배양한지 48, 72 및 96시간 후에, 상청액 2ml 샘플을 취하고 이를 원심분리시킨다. 이어서, 각종 상청액을 -20℃에서 동결시킨다. 이들 상청액을 멸균용 배양 배지에서 10배 희석시킨 것을 본 시험에 사용한다(도 18 참조).
콘고시딘에 대해서는 내성이지만 스피라마이신에는 민감한 미크로코쿠스 루테우스 지시 균주를 37℃에서 48시간 동안 콘고시딘을 5㎍/ml로 함유하는 2TY 배지(참조: Sambrook et la., 1989)에서 배양하였다. 이러한 배양물의 광밀도(OD)를 측정하고, 이를 희석시켜 광밀도를 4로 조정한다. 상기 예비배양물 0.4ml를, 온도를 미리 약 45℃로 조정한 40ml의 DAM5 배지(Difco Antibiotic Medium 5, Difco 회사에 의해 시판됨)에서 희석시킨다. 이어서, 상기 배지를 12 x 12cm 사각형 디쉬에 따라 붓고, 주위 온도 하에 방치시켜 둔다.
상기 배지가 냉각되어 고형화되면, 직경이 12mm인 왓트만 AA 종이 디스크(참조: A. Gourmelen et al., 1998)를 각 상청액의 10배 희석물 70㎕에 침지시키고, 디쉬 표면 상에 놓아둔다. 각종 농도(MP5 배양 배지 중의 2-4-8㎍/ml)의 스피라마이신 용액에 침지시킨 디스크를 표준 범위로서 사용한다. 이러한 디쉬를 4℃에서 2시간 동안 정치시켜 상기 항생제가 한천 내로 확산되도록 한 다음, 37℃에서 24 내지 48시간 동안 항온 배양한다.
상기 디쉬가 스피라마이신을 함유하는 경우, 이는 한천 내로 확산되어, 미크로코쿠스 루테우스 지시 균주의 성장을 억제시킨다. 이와 같이 억제시키면, 디스크 주변에 "할로"가 창출되는데, 이러한 할로는 미크로코쿠스 루테우스 균주가 성장하지 않은 영역을 반영한 것이다. 따라서, 상기 할로가 존재하는 것은 스피라마이신의 존재를 지시해주며, 이로써 문제의 디스크에 상응하는 에스. 암보파시엔스 균주가 스피라마이신 생산자인지 아닌지를 결정할 수 있다. 표준 범위에 대해 수득된 억제 직경과 비교한 결과, 상기 균주에 의해 생산된 스피라마이신의 양에 관한 지표를 획득할 수 있다.
스피라마이신 생산을 탐지하기 위해, 앞서 실시예에 기재된 각종 균주를 본 시험에 사용하였다. 수득된 결과가 표 38에 함께 분류되었다:
이들 결과는 스피라마이신 생합성에 관여하는 각종 유전자의 기능에 관한 특정 수의 결론을 이끌어낼 수 있게 해준다. 따라서, orf3 유전자는 스피라마이신 생합성에 필수적이다. 구체적으로 언급하면, 상기 유전자를 동위상 불활성화시키면, 더 이상 스피라마이신을 생산하지 않는 균주(OS49.67(실시예 6 참조))가 야기된다. 이러한 동위상 불활성화는, 도입된 카세트가 orf3의 하류에 위치한 유전자의 발현에 영향을 미칠 것이라는 가설을 일축할 수 있게 해준다.
유사하게, orf8 및 orf10 유전자는 스피라마이신 생합성에 필수적인 단백질을 암호화하는데, 이는 균주 OS49.107과 OS49.50는 비-생산자 표현형을 지니기 때문이다. 또한, 이들 후자의 2개 균주에서는, 이러한 비-생산자 표현형에 대해 책임이 있는 상응하는 유전자의 불활성화가 명백한데, 이는 각종 orfs의 배양 측면에서(도 3 참조) 상기 도입된 작제물이 극성 효과를 지닐 수 없기 때문이다.
절제 가능한 카세트를 갖는 균주에 관한 연구는 개입중단된 유전자의 기능에 관한 특정 수의 결론을 이끌어낼 수 있게 해준다. 균주 SPM507은 유전자형: orf12::att3Ωaac-을 갖는다. 유전자의 배향 측면에서(도 3 참조), orf12의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf13c가 orf12와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM507의 표현형은 비-생산자이므로; 이로부터, orf12 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다.
균주 SPM508은 유전자형: orf13c::att3Ωaac-을 갖는다. 유전자의 배향 측면에서(도 3 참조), orf13c의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf14가 orf13c와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM508의 표현형은 비-생산자이므로; 이로부터, orf13c 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자가 아니라고 결론지을 수 있다.
균주 SPM509는 유전자형: orf14::att3Ωaac-을 갖는다. 유전자의 배향 측면에서(도 3 참조), orf14의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf15c가 orf14와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM509의 표현형은 비-생산자이므로; 이로부터, orf14 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다.
균주 SPM21은 유전자형: orf2::att3Ωaac-을 갖는다. 이러한 균주는 스피라마이신 비-생산자 표현형을 갖는다. 그러나, 유전자 orf1 내지 orf8의 배향(도 3 참조)은 이들 유전자가 동시 전사된다는 사실을 암시한다. 관찰된 표현형은 도입된 카세트가 오페론의 하류에 위치한 유전자의 발현에 대해 극성 효과를 발휘하기 때문일 수 있다. 균주 SPM22는 유전자형 orf2::att3을 가지며, 이는 도입된 카세트의 동위상 절제 후에 수득하였다. 이러한 카세트를 절제하면, 특징적인 "반흔성" 서열(실시예 10 참조) 만이 잔존한다. 균주 SPM22는 비-생산자 표현형을 가지므로; 이로부터, orf2 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다. orf2의 불활성에 기인한 효과 만이 관찰된다.
균주 SPM501은 유전자형: orf6*::att1Ωhyg+을 갖는다. 이러한 균주는 스피라마이신 비-생산자 표현형을 갖는다. 그러나, orf5* 및 orf6* 유전자는 동일한 배향을 갖기 때문에(도 3 참조), 관찰된 표현형은 orf6* 내로 도입된 카세트가 orf5*의 발현에 대해 극성 효과를 발휘하기 때문일 수 있다. 이들 유전자의 배열은 이들이 동시 전사될 수 있다는 것을 암시한다. 이러한 문제에 답하기 위해, 도입된 카세트를 동위상 절제한 후에 균주 SPM502를 수득하였다. 이러한 균주에서는 orf6*의 불활성화 효과 만이 관찰된다. 이 균주는 유전자형 orf6*::att1(실시예 14 참조)을 갖는다. 이러한 카세트를 절제하면, 동위상 "반흔" 서열(실시예 14 참조) 만이 잔존한다. 균주 SPM502는 생산자 표현형을 갖는다(그러나, 이 균주는 스피라마이신 I 만을 생산한다(실시예 16 참조)). 따라서, orf5* 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있는데, 이는 균주 SPM501에서의 이의 간접적인 불활성화로 인해 비-생산자 표현형이 유도되기 때문이다. 다른 한편으론, orf6* 유전자가 에스. 암보파시엔스에서 스피라마이신 I의 생합성에 필수적인 유전자가 아니다(한편으론, 스피라마이신 II 및 III의 생산에 필수적이다)(실시예 16 참조).
실시예 16: 수득된 돌연변이체 균주에서 스피라마이신 I, II 및 III의 생산 검정
시험하고자 하는 각종 균주를 각각, 70ml의 MP5 배지를 함유하는 500ml용 차폐된 에를렌마이어에서 배양한다(참조: Pernodet et al., 1993). 이러한 에를렌마이어를 각종 에스. 암보파시엔스 균주의 2.5 x 106개 포자/ml의 초기 농도로 접종하며, 72시간 동안 250rpm으로 궤도 진탕시키면서 27℃ 하에 성장시킨다. 동일한 클론에 상응하는 배양물을 모으고, 주름진 필터 내로 임의 여과시킨 다음, 7000rpm으로 15분 동안 원심분리시킨다. 이어서, 각종 상청액을 -30℃ 하에 저장하였다.
이온-쌍 형성 고 성능 액체 크로마토그래피(HPLC)함으로써 본 검정을 수행하였다. 배양 배지를 HPLC 분석하여, 3가지 형태의 스피라마이신 농도를 정확하게 결정할 수 있다. 사용된 칼럼(Macherey-Nagel)은 뉴클레오실(Nucleosil) 옥틸 그래프트된 실리카 상으로 채운다. 입자 크기는 5㎛이고 공극 크기는 100Å이다. 칼럼의 내부 직경은 4.6mm이고 길이는 25cm이다. 이동 상은 6.25g/L의 NaClO4 퍼클로레이트를 함유하는 H3PO4 완충액(pH 2.2)과 아세토니트릴의 70/30(v/v) 혼합물이다. 1ml/min으로 고정된 유속을 이용하여 등용매 시스템에서 본 분석을 수행하였다. 칼럼은 23℃에서 열제어한다. 238nm에서 UV 분광측광함으로써 탐지하였다. 샘플을 +10℃ 하에 냉장시키고, 피크 면적으로부터 정량화를 결정한다(외부 교정에 의함). 이들 조건 하에, 스피라마이신 I, II 및 III에 대한 잔류 시간은 각각 17, 21 및 30분인데, 이는 3가지 형태의 스피라마이신을 포함하는 시판용 샘플을 사용하여 확인할 수 있었다.
균주 OSC2는 스피라마이신 생산자 표현형을 갖는다. 이는 절제 가능한 카세트를 갖는 균주를 수득하기 위해 사용된 모 균주이다(실시예 15 참조). 따라서, 이 균주는 3가지 형태의 스피라마이신을 생산하기 위한 양성 대조군으로서 사용되었다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 3가지 형태의 스피라마이신을 생산하는 것은 명백하다(도 19 참조).
절제 가능한 카세트를 갖는 균주에 관한 연구는 개입중단된 유전자의 기능에 관한 특정 수의 결론을 이끌어낼 수 있게 해준다. 균주 SPM507은 유전자형: orf12::att3Ωaac-을 갖는다. 균주 SPM507의 표현형은 비-생산자이므로(실시예 15 참조); 이로부터, orf12 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 더 이상 스피라마이신을 생산하지 않는다(도 22 참조). 이러한 결과는 orf12 유전자가 스피라마이신 생합성에 필수적인 특성을 확인시켜 준다.
균주 SPM508은 유전자형: orf13c::att3Ωaac-을 갖는다. 균주 SPM508은 스피라마이신 생산자 표현형을 가지므로(실시예 15 참조); 이로부터, orf13c 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자가 아니라고 결론지을 수 있다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 스피라마이신 I, II 및 III을 생산한다(도 23 참조). 이러한 결과는 orf13c 유전자가 에스. 암보파시엔스에서 스피라마이신 I, II 및 III의 생합성에 필수적인 유전자가 아니라는 것을 확인시켜 준다.
균주 SPM509는 유전자형: orf14::att3Ωaac-을 갖는다. 균주 SPM509의 표현형은 비-생산자이므로; 이로부터, orf14 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 더 이상 스피라마이신을 생산하지 않는다(도 24 참조). 이러한 결과는 orf14 유전자가 스피라마이신 생합성에 필수적인 특성을 확인시켜 준다.
균주 SPM501은 유전자형: orf6*::att1Ωhyg+을 갖는다. 이러한 균주는 스피라마이신 비-생산자 표현형을 갖는다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 더 이상 스피라마이신을 생산하지 않는다(도 20 참조). 그러나, orf5* 및 orf6* 유전자는 동일한 배향을 갖기 때문에(도 3 참조), 관찰된 표현형은 orf6* 내로 도입된 카세트가 오페론에서 orf5*의 발현에 대해 극성 효과를 발휘하기 때문일 수 있다. 이는 이들 유전자가 동시 전사된는 것을 암시한다. 이러한 문제에 답하기 위해, 도입된 카세트를 절제한 후에 균주 SPM502를 수득하였는데, 이로써 orf6* 유전자의 동위상 결실이 생겼고 orf5*의 발현이 복원되었다. 이 균주는 유전자형 orf6*::att1(실시예 14 및 15 참조)을 갖는다. 이러한 카세트를 절제하면, 동위상 "반흔" att 서열(실시예 14 참조) 만이 잔존한다. 균주 SPM502는 스피라마이신 생산자 표현형을 갖는다. 그러나, HPLC에 의해 입증된 바와 같이, 상기 균주는 스피라마이신 I 만을 생산하고, 스피라마이신 II와 III은 생산하지 못한다(도 21 참조)). 따라서, 이들 결과로부터, orf5* 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있는데, 이는 균주 SPM501에서의 이의 간접적인 불활성화로 인해 스피라마이신 비-생산자 표현형이 유도되기 때문이다(도 20 참조). 다른 한편으론, orf6* 유전자가 에스. 암보파시엔스에서 스피라마이신 I의 생합성에 필수적인 유전자가 아닌데, 이는 이러한 유전자의 불활성화로 인해 스피로마이신 I 생산자 표현형이 유도되었기 때문이다(도 21 참조). 그러나, orf6*은 스피라마이신 II와 III의 생산에는 필수적이다(실시예 16 참조). 따라서, orf6* 유전자는 위치 3에서 플라테놀리드의 변형에 책임이 있는 아실트랜스퍼라제를 암호화하는 것이 명백하다(도 1 참조).
실시예 17:
orf10
의 해독 개시점 결정 및 스피라마이신 생산 향상
17.1 플라스미드 pSPM523, pSPM524 및 pSPM525의 작제:
orf10 유전자를 스트렙토마이세스 암보파시엔스에서 동정하고, 이를 srmR으로 명명하였다(참조: M. Geistlich et al., 1992). orf10 유전자의 불활성화를 수행하였다(실시예 8 참조). 이로써, 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 나타낼 수 있었다(실시예 15 참조). 이는 orf10 유전자가 스피라마이신 생합성에 명백히 관여한다는 것을 확인시켜 준다. 따라서, 이러한 유전자에 의해 암호화된 단백질이 스피라마이신 생합성에 필수적이란 것은 명백하다. 그러나, 서열 분석 결과, 동일한 판독 프레임에 위치한 2개의 ATG 코돈이 orf10의 해독을 위해 사용될 수 있는 것으로 나타났다(도 28 참조). 2개의 가능한 코돈 중의 하나(가장 상류 코돈)이 서열 번호 1에 제시된 서열의 10656번에서 시작하는 반면, 보다 하류에 위치한 기타 가능한 코돈은 10809번(서열 번호 1)에서 시작한다. 스피라마이신 생산에 대한 srmR 의 가능한 발현 효과를 시험하기 전에, 해독 개시점을 먼저 결정하는 것이 중요하다.
해독 개시 부위를 결정할 목적으로, 3가지 형태의 orf10을 포함하는 3가지 작제물을 생성하였다. 이들 형태는 HindIII 제한 부위 또는 BamHI 제한 부위를 포함하는 올리고뉴클레오티드를 사용하여 PCR함으로써 수득하였다.
증폭에 사용된 제1 쌍은 다음 올리고뉴클레오티드에 상응한다:
EDR39:
5'CCCAAGCTTGAGAAGGGAGCGGACATTCATGGCCCGCGCCGAACGC3'(서열 번호 122) (HindIII 부위가 진하게 표시되어 있다)
EDR42:
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'(서열 번호 123) (BamHI 부위가 진하게 표시되어 있다)
프라이머 쌍 EDR39-EDR42는 3' 위치에 가장 근접하게 위치한(서열 번호 1에 제시된 서열에서 10809번 위치) ATG를 포함하는 orf10의 단편을 증폭시켜 준다(도 28 참조). 수득된 단편은 크기가 대략 2kb이고, "짧은 orf10"로 후술될 것이며; 이는 orf10 프로모터를 함유하지 않는다. 이러한 2kb 단편을 벡터 pGEM-T easy 내로 클로닝하여 플라스미드 pSPM520을 수득하였다.
증폭에 사용된 제2 쌍은 다음 올리고뉴클레오티드에 상응한다:
EDR40:
5'CCCAAGCTTGAGAAGGGAGCGGACATTCAATGCTTTGGTAAAGCAC3'(서열 번호 124) (HindIII 부위가 진하게 표시되어 있다)
EDR42:
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'(서열 번호 123) (BamHI 부위가 진하게 표시되어 있다)
프라이머 쌍 EDR40-EDR42는 5' 위치에 가장 근접하게 위치한(서열 번호 1에 제시된 서열에서 10656번 위치) ATG를 포함하는 orf10의 단편을 증폭시켜 준다(도 28 참조). 이러한 2kb 단편("짧은 orf10"로 후술됨)을 벡터 pGEM-T easy 내로 클로닝하여 플라스미드 pSPM521을 수득하였는데; 상기 플라스미드는 orf10 프로모터를 함유하지 않는다.
증폭에 사용된 제3 쌍은 다음 올리고뉴클레오티드에 상응한다:
EDR41:
5'-CCCAAGCTTTCAAGGAACGACGGGGTGGTCAGTCAAGT-3'
(서열 번호 125) (HindIII 부위가 진하게 표시되어 있다)
EDR42:
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'
(서열 번호 123) (BamHI 부위가 진하게 표시되어 있다)
프라이머 쌍 EDR41-EDR42는 2개의 ATG와 자신의 프로모터를 포함하는 orf10 유전자를 증폭시켜 준다(도 28 참조). 이러한 2.8kb 단편("프로(pro) orf10"로 후술됨)을 벡터 pGEM-T easy 내로 클로닝하여 플라스미드 pSPM52를 수득하였다.
"프로 orf10" 단편은 매트릭스로서, 균주 OSC2의 염색체 DNA를 사용하여 수득하였다. "짧은 orf10" 및 "긴 orf10" 단편은 매트릭스로서, 앞서 정제된 "프로 orf10" 단편의 DNA를 사용하여 온전히 수득하였다.
이어서, 플라스미드 pSPM520, pSPM521 및 pSPM522의 HindIII-BamHI 삽입물을, HindIII-BamHI 효소로 예비분해시킨 벡터 pUWL201[프로모터(ermE* promoter)(참조: Bibb et al., 1994)의 세기를 증가시키는 돌연변이를 수반하는 ermE 프로모터(참조: Bibb et al., 1985, 특히 도 2) 영역의 KpnI-BamHI 단편을 도입한(참조: Doumith et al., 2000) 플라스미드 pUWL199(참조: U.F. Wehmeier, 1995)로부터 유도된 플라스미드] 내로 아클로닝시켰다. 이로써, 3가지 플라스미드를 수득하였다: pSPM523(삽입물로서 "짧은 orf10" 형태를 갖는 pUWL201로부터 유도됨), pSPM524(삽입물로서 "긴 orf10" 형태를 갖는 pUWL201로부터 유도됨) 및 pSPM525("프로 orf10" 형태를 갖는 pUWL201로부터 유도됨)(도 28).
17.2 균주 OS49.50을 작제물 pSPM523, pSPM524 및 pSPM525로 형질전환시킴:
균주 OS49.50(orf10 유전자에서 녹아웃을 나타내는 균주, 실시예 8 참조)를, 각각의 플라스미드 pSPM523, pSPM524 및 pSPM525로 원형질체 형질전환(참조: T. Kieser et al., 2000)시킴으로써 독립적으로 형질전환시켰다. 균주 OS49.50를, 삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 음성 대조군을 또한 제조하였다. 원형질체 형질전환 후, 이들 클론을 대상으로 하여, 이들의 티오스트렙톤 내성에 대해 선별하였다. 이들 클론을 각 플라스미드로 형질전환시키는 것은 이들 플라스미드를 추출함으로써 확인하였다. 이로써 4개의 신규한 균주가 수득되었다: 균주 OSC49.50 pUWL201(삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 유도됨); 균주 OSC49.50 pSPM523(플라스미드 pSPM523으로 형질전환시킴으로써 유도됨); 균주 OSC49.50 pSPM524(플라스미드 pSPM524로 형질전환시킴으로써 유도됨); 및 최종적으로 균주 OS49.50 pSPM525(플라스미드 pSPM525로 형질전환시킴으로써 유도됨).
이들 4가지 균주 각각의 스피라마이신 생산을 HPLC로써 시험하였다. 이를 위해, 시험하고자 하는 각종 스트렙토마이세스 균주를, 70ml의 MP5 배지를 함유하는, 차폐기가 장착된 500ml용 에를렌마이어(차폐된 에를렌마이어)에서 배양한다(참조: Pernodet et al., 1993). 상기 균주가 플라스미드 pUWL201 또는 이의 유도체 중의 하나를 함유하는 경우, 5㎍/ml의 티오스트렙톤을 가한다. 차폐된 에를렌마이어를 각종 에스. 암보파시엔스 균주의 2.5 x 106개 포자/ml의 초기 농도로 접종하며, 배양물을 96시간 동안 250rpm으로 궤도 진탕시키면서 27℃ 하에 항온 배양하였다. 이어서, 세포를 원심분리시킴으로써 상기 배지로부터 분리시키고, 상청액을 HPLC함으로써 분석하여(실시예 16 참조), 생산된 스피라마이신의 양을 결정하였다. 표준 샘플과 피크 면적 측정을 통하여, 이들 균주에 의해 생산된 스피라마이신 각각의 양을 결정할 수 있었다. 이러한 분석 결과가 표 39에 제시되어 있으며, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 총 생산량에 상응한다(스피라마이신 I, II 및 III 생산량을 부가함으로써 수득됨).
표 39에 제시된 결과에 의해 밝혀진 바와 같이, 음성 대조군(플라스미드 pUWL201로 형질전환시킨 균주 OS49.50)은 스피라마이신을 생산하지 않는다. 플라스미드 pSPM523("짧은 orf10" 형태 함유)를 균주 OS49.50 내로 도입한 경우에는, 스피라마이신 생산이 전혀 관찰되지 않는다. 한편, 플라스미드 pSPM524("긴 orf10" 형태 함유)와 플라스미드 pSPM525("프로 orf10" 형태 함유)의 존재로 인해, 숙주 균주 OS49.50에서의 스피라마이신 생산이 복원된다. 이로써, 가장 상류의 ATG를 함유하는 orf10 단편 만이 스피라마이신 합성을 복원시킬 수 있다.
이러한 결과를 확인할 목적으로, 플라스미드 pSPM521("긴 orf10" 형태를 함유하는 플라스미드 pGEM-T easy)를 XhoI 제한 효소(이 효소는 2개의 ATG 사이에 위치한, 상기 플라스미드 내의 독특한 부위를 갖는다(도 28 참조))로 분해시킨다. 이어서, 클레노우 효소로 처리함으로써 XhoI 말단을 평활 말단화시킨다. 이어서, 상기 플라스미드를 T4 DNA 리가제 작용에 의해 스스로에 대해 폐쇄 보완하여 플라스미드 pSPM527을 제공한다. 가장 상류의 ATG(서열 번호 1에 제시된 서열에서 10656번 위치)가 실제로 해독 개시 부위로서 사용된 경우에는, 이러한 처리로 인해, XhoI 부위에서 판독 프레임의 이동이 유발되어 활성화 활성을 전혀 나타내지 않는 단백질을 생산하는 효과가 나타날 것이다. 한편, 해독 개시가 가장 하류의 ATG(서열 번호 1에 제시된 서열에서 10809번 위치)에서 일어나는 경우에는, 이러한 처리가 Orf10(전사 개시점의 위치가 제공된 경우)의 발현에 거의 또는 전혀 영향을 미치지 않아야 하고 생성되는 단백질에 대해 전혀 영향을 미치지 말아야 한다.
이어서, pSPM527의 BamHI-HindIII 삽입물을 벡터 pUWL201 내로 아클로닝시켜, 플라스미드 pSPM528을 수득하였다. 이러한 플라스미드를 균주 OS49.50 내로 도입하고, 목적하는 플라스미드를 갖는 클론을 보다 특별히 선별하였다. 이어서, 이로써 생성된 균주의 스피라마이신 생산을 HPLC에 의해 시험하였다(실시예 16 및 상기 참조). 플라스미드 pSPM524(표 39 참조)의 경우에 관찰된 것과는 다르게, 균주 OS49.50 내에 플라스미드 pSPM528이 존재하는 것이 스피라마이신 생산을 재정립하지는 못하였다. 이는 orf10 유전자의 해독 개시 부위가 가장 하류 위치에 위치한 ATG(ATG 1, 도 28 참조)라는 것을 확인시켜 준다.
17.3 에스. 암보파시엔스 균주 OSC2의 스피라마이신 생산 향상
스피라마이신 생산에 대한 orf10 유전자의 과발현 효과를 시험하기 위해, 플라스미드 pSPM523, pSPM524, pSPM525 및 pSPM528을 균주 OSC2 내로 도입하였다. 이를 위해, 균주 OSC2의 원형질체를, 각각의 플라스미드 pSPM523, pSPM524, pSPM525 및 pSPM528로 독립적으로 형질전환시켰다(참조: T. Kieser et al., 2000). 균주 OSC2를, 삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 음성 대조군을 또한 제조하였다. 원형질체 형질전환 후, 이들 클론을 대상으로 하여, 이들의 티오스트렙톤 내성에 대해 선별하였다. 이로써 5개의 신규한 균주가 수득되었다: 균주 OSC2 pUWL201(삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 유도됨); 균주 OSC2 pSPM523(플라스미드 pSPM523으로 형질전환시킴으로써 유도됨); 균주 OSC2 pSPM524(플라스미드 pSPM524로 형질전환시킴으로써 유도됨); 균주 OSC2 pSPM525(플라스미드 pSPM525로 형질전환시킴으로써 유도됨); 및 최종적으로, 균주 OSC2 pSPM528(플라스미드 pSPM525로 형질전환시킴으로써 유도됨). 이어서, 이들 균주의 스피라마이신 생산을 HPLC에 의해 분석하였다(실시예 17.2에서와 동일한 방식으로 수행함). 균주 OSC2의 스피라마이신 생산에 관해 분석은 비교를 위해 동시에 수행하였다. 이러한 분석 결과가 표 40에 제시되어 있으며, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 총 생산량에 상응한다(스피라마이신 I, II 및 III 생산량을 부가함으로써 수득됨).
따라서, 플라스미드 pSPM524가 존재하거나 또는 플라스미드 pSPM525이 존재하는 것이 균주 OSC2의 스피라마이신 생산량을 상당히 증가시키는 것으로 관찰된다. 이는 Orf10의 과발현이 스피라마이신 생산에 긍정적인 효과를 나타낸다는 것을 명백히 입증해준다. 한편, 플라스미드 pSPM528은 스피라마이신 생산에 전혀 영향을 미치지 않는다.
동일한 방식으로, 플라스미드 pSPM525 및 pUWL201을 균주 SPM502 내로 도입하였다(실시예 14 참조). 이로써 2가지 신규한 균주를 수득하였다: 균주 SPM502 pUWL201(삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 유도됨); 및 균주 SPM502 pSPM525(플라스미드 pSPM525로 형질전환시킴으로써 유도됨).
균주 SPM502 pSPM525(이러한 균주는 플라스미드 pSPM525을 함유한다, 상기 참조) 샘플은 2003년 2월 26일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2977로 기탁되었다.
균주 SPM502 pUWL201 및 SPM502 pSPM525의 스피라마이신 생산을 HPLC에 의해 분석하였다(실시예 17.2에서와 동일한 방식으로 수행함). 균주 SPM502의 스피라마이신 생산에 관해 분석은 비교를 위해 동시에 수행하였다. 이러한 분석 결과가 표 41에 제시되어 있으며, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 I 생산량에 상응한다. 사실상, 이들 균주는 스피라마이신 II와 III을 전혀 생산하지 않는다.
따라서, 균주 SPM502에서의 orf10 유전자의 과발현이 스피라마이신 I의 생산을 상당히 증가시키는 것으로 관찰되었다.
실시예 18: 코스미드 pWED2에서 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA 라이브러리의 작제
18.1 코스미드 pWED2의 작제
스트렙토마이세스에서 유전자의 불활성화를 촉진시킬 목적으로, (적합한 이. 콜라이 균주로부터 스트렙토마이세스 내로 접합시킴으로써 이의 도입을 허용해 주는) 플라스미드 RK2의 oriT 서열을 수반하고 스트렙토마이세스에서 탐지 가능한 표현형을 부여해 주는 항생제에 대해 내성인 유전자를 또한 수반하는 코스미드를 작제하였다. 스트렙토마이세스 암보파시엔스의 게놈 DNA의 큰 삽입물을 함유하는 상기 코스미드를 유전자 불활성화 실험에 사용할 수 있다.
상기 벡터를 작제하기 위해, pac-oriT 카세트(EcoRV 단편)을, 독특한 HpaI 부위에서 코스미드 pWED15(참조: Wahl et al., 1987)로부터 유도된 코스미드 pWED1(참조: Gourmelen et al., 1998) 내로 도입하였다. pac-oriT 카세트는 PCR함으로써 수득하였다. 이를 위해, 제1 프라이머로서, 프라이머 A[이의 서열은 5'-CCAGTAGATATC CCGCCAACCCGGAGCTGCAC-3'(서열 번호 126)이고, EcoRV 제한 부위가 밑줄쳐져 있으며, 진하게 표시된 20개 뉴클레오티드 서열은 pac 유전자의 프로모터의 상류 영역에 상응한다]를 사용하고, 제2 프라이머로서, 프라이머 B[이의 서열은 5'-GAAAAGATCCGT CATGGGGTCGTGCGCTCCTT-3'(서열 번호 127)인데, 이는 이의 5' 말단에, oriT 서열 출발부에 상응하는 12개 뉴클레오티드 서열(이탤릭체로 표시되어 있음)을 포함하고 pac 유전자의 말단에 상응하는 20개 뉴클레오티드 서열(진하게 표시됨)을 포함한다]를 사용하여 플라스미드 pVF 10.4(참조: Vara et al., 1985; Lacalle et al., 1989)로부터 PCR함으로써, 상기 pac 유전자를 증폭시켰다(참조: 도 29, 1st PCR).
oriT 유전자에 관해서는, 제1 프라이머로서, 프라이머 C[이의 서열은 5'-CACGACCCCATG ACGGATCTTTTCCGCTGCAT-3'(서열 번호 128)인데, 이는 이의 5' 말단에, pac 유전자의 암호화 서열의 하류 서열에 상응하는 12개의 뉴클레오티드 서열(진하게 표시됨)과, oriT 서열 출발부에 상응하는 20개 뉴클레오티드 서열을 포함한다]를 사용하고, 제2 프라이머로서, 프라이머 D[이의 서열은 5'-GAGCCGGATATC ATCGGTCTTGCCTTGCTCGT-3'(서열 번호 129)인데, 이는 EcoRV 제한 부위(한줄로 밑줄쳐져 있음)와 oriT 서열의 말단에 상응하는 20개 뉴클레오티드 서열(이탤릭체로 표시되어 있음)을 포함한다]를 사용하여, 플라스미드 pPM803(참조: P. Mazodier et al., 1989)로부터 PCR함으로써 증폭시켰다(참조: 도 29, 2nd PCR).
프라이머 A와 B를 사용하여 수득된 증폭 생성물과, 프라이머 C와 D를 사용하여 수득된 증폭 생성물은 이들의 말단 중 하나에, 24개 뉴클레오티드 공통 서열을 갖는다. 앞서 수득된 2가지 증폭 생성물을 혼합하고, 프라이머로서 프라이머 A와 D를 사용함으로써 제3의 PCR을 수행하였다(참조: 도 29, 3rd PCR). 이로써, 조합물 pac+oriT에 상응하는 증폭 생성물을 수득할 수 있다. 이어서, 이러한 pac-oriT 단편을 벡터 pGEM-T Easy(Promega (Madison, Wisconsin, USA) 회사에 의해 시판됨) 내로 클로닝시켜, 플라스미드 pGEM-T-pac-oriT를 수득할 수 있다. 이어서, 이러한 플라스미드의 삽입물을 코스미드 pWED1 내로 아클로닝시켰다. 이를 위해, 플라스미드 pGEM-pac-oriT를 EcoRV 효소로 분해시키고, 조합물 pac+oriT을 함유하는 EcoRV 삽입물을, HpaI 효소로 미리 개방시킨 코스미드 pWED1 내로 삽입하였다. 이로써 수득된 코스미드를 pWED2로 명명하였다(도 30 참조).
상기 코스미드는 스트렙토마이세스에서 유전자의 불활성화를 촉진시킬 수 있다. 구체적으로 언급하면, 이는 적합한 이. 콜라이 균주로부터 스트렙토마이세스 내로 접합시킴으로써 이의 도입을 허용해 주는 oriT 서열을 수반할 뿐만 아니라, 스트렙토마이세스에서 탐지 가능한 표현형을 부여해 주는 항생제에 대해 내성인 유전자를 수반한다. 스트렙토마이세스 암보파시엔스의 게놈 DNA의 큰 삽입물을 함유하는 상기 코스미드를 유전자 불활성화 실험에 사용할 수 있다.
이로써, 표적 유전자를 함유하는 pWED2로부터 유도된 코스미드를, 플라스미드 pKOBEG(참조: Chaveroche et al. 2000)를 함유하는 이. 콜라이 균주 KS272 내로 도입할 수 있고, 특정 카세트를 문헌(참조: Chaveroche et al. 2000)에 기재된 기술에 따라서 표적 유전자 내로 도입할 것이다. 이어서, 이러한 기술에 의해 수득된 코스미드(표적 유전자를 불활성화시킨 코스미드)를 이. 콜라이 균주, 예를 들면, S17.1 균주, 또는 oriT 서열을 함유하는 플라스미드를 접합에 의해 스트렙토마이세스로 전이시켜 줄 수 있는 기타 모든 균주 내로 도입할 수 있다.
이. 콜라이와 스트렙토마이세스 간의 접합 후, 표적 유전자의 야생형 복사물을 개입중단된 복사물로 대체시킬 스트렙토마이세스의 클론을 실시예 2에 기재된 바와 같이 수득할 수 있다.
상기 신규한 코스미드 상에 존재하는, 스트렙토마이세스에서 발현된 내성 유전자는 스트렙토마이세스 알보니거(Streptomyces alboniger)(참조: J. Vara et al., 1985; Lacalle et al., 1989)의 pac 유전자인데, 이는 푸로마이신(puromycin) N-아세틸트랜스퍼라제를 암호화하고 푸로마이신 내성을 제공해준다. 유전자 불활성화 실험에서는, 이중 재조합 사건이 발생한 클론을 찾아낼 것이다. 이들 클론으로부터 플라스미드 pWED2를 제거할 것이므로, 이는 푸로마이신에 대해 다시 민감해질 것이다.
18.2 코스미드 pWED2에서 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA 라이브러리의 작제
스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA를 BamHI 제한 효소로 부분적으로 분해시켜, 크기가 대략 35 내지 45 kb인 DNA 단편을 수득한다. 이어서, 이들 단편을, BamHI으로 미리 분해시킨 코스미드 pWED2 내로 클로닝시킨 다음, 알칼리성 포스파타제로 처리하였다. 이어서, 이러한 연결 혼합물을 시험관내에서, 프로메가(Promega; Madison, Wisconsin, USA) 회사에 의해 시판되고 있는 "Packagene®람다 DNA 패키징 시스템"을 제조업자의 권고 사항에 따라서 사용하여 람다 파아지 입자 내에서 단백질 막으로 싼다. 수득된 파아지 입자를 사용하여, 공급원[Stratagene(LaJolla, California, USA)]에 의해 시판되고 있는 이. 콜라이 SURE® 균주를 감염시킨다. 코스미드 pWED2는 앰피실린 내성을 제공해주기 때문에, 상기 클론을 LB 배지 + 앰피실린(50㎍/ml) 상에서 선별하였다.
실시예 19: 스피라마이신에 대한 생합성 경로 영역을 포괄하는 신규한 라이브러리의 코스미드 분리. 이들 코스미드의 단편의 아클로닝 및 서열 분석
19.1 스트렙토마이세스 암보파시엔스 OSC2의 게놈 라이브러리의 콜로니 상에서의 하이브리드화
orf1* 내지 orf10*, 또는 orf1 내지 orf25c의 일부 또는 전부, 또는 orf25c의 보다 상류 영역을 포괄하는 스트렙토마이세스 암보파시엔스 OSC2(실시예 18 참조)의 신규한 라이브러리의 코스미드를 분리하였다. 이를 위해, 다음 3가지 프로브를 사용하여, 실시예 18에 따라서 수득된 이. 콜라이 콜로니 상에서 연속적인 하이브리드화를 수행하였다(도 31 참조):
- 사용된 제1 프로브는 매트릭스로서, pSPM5를 사용하고 다음 프라이머를 사용하여 PCR함으로써 증폭시킨 대략 0.8kb의 DNA 단편에 상응한다:
ORF23c: 5'-ACGTGCGCGGTGAGTTCGCCGTTGC-3'(서열 번호 130) 및
ORF25c: 5'-CTGAACGACGCCATCGCGGTGGTGC-3'(서열 번호 131).
이로써 수득된 PCR 생성물은 orf23c의 출발부, 이의 원형 상태의 orf24c 및 orf25c의 말단의 단편을 함유한다(참조: 도 31, 프로브 I).
- 사용된 제2 프로브는 매트릭스로서, 에스. 암보파시엔스 균주 ATCC23877의 총 DNA를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시킨 대략 0.7kb의 DNA 단편에 상응한다:
ORF1*c: 5'-GACCACCTCGAACCGTCCGGCGTCA-3'(서열 번호 132) 및
ORF2*c: 5'-GGCCCGGTCCAGCGTGCCGAAGC-3'(서열 번호 133).
이로써 수득된 PCR 생성물은 orf1*c의 말단과 orf2*c의 출발부의 단편을 함유한다(참조: 도 31, 프로브 II).
- 사용된 제3 프로브는 orf1, orf2 및 orf3을 함유하고 플라스미드 pOS49.99를 분해시킴으로써 수득된, 대략 3kb의 EcoRI-BamHI 단편에 상응한다(참조: 도 31, 프로브 III).
실시예 18.2에서 수득된 라이브러리의 대략 2,000개 클론을 통상적인 기술에 따라서[참조: Sambrook et al., 1989] 콜로니 하이브리드화하기 위해 필터 상으로 옮겼다.
제1 프로브(참조: 도 31, 프로브 I)를 무작위 프라이밍 기술 (Roche에 의해 시판되고 있는 키트)을 이용하여 32P로 표지시키고, 이를 사용하여, 필터 상으로 옮긴 상기 라이브러리의 2,000개 클론 상에서 하이브리드화를 수행하였다. 하이브리드화는 문헌[참조: Church & Gilbert (Church & Gilbert, 1984)]에 기재된 완충액 중에서 65℃ 하에 수행한다. 65℃ 하에 2X SSC, 0.1% SDS에서 처음에는 10분 동안 수행한 다음, 두 번째는 20분 동안 2회 세척을 수행하고, 30분 동안 지속되는 제3 세척은 65℃ 하에 0.2X SSC, 0.1% SDS에서 수행하였다. 이러한 하이브리드화 및 세척 조건 하에서, 하이브리드화된 2,000개 중에서 20개 클론이 제1 프로브와 강력한 하이브리드화 시그널을 나타내었다. 이들 20개 클론을 LB 배지 + 앰피실린(50㎍/ml)에서 배양하고, 상응하는 20개 코스미드를 알칼리성 분해(참조: Sambrook et al., 1989)함으로써 추출한 다음, BamHI 제한 효소로 분해시켰다. 이어서, 이러한 분해 생성물을 아가로스 겔 상에서 분리시키고, 나일론 막 상으로 옮긴 다음, 상기와 동일한 조건 하에 제1 프로브(상기 참조: PCR 생성물 ORF23c-ORF25c, 프로브 I)와 하이브리드화하였다. 12개 코스미드가, 사용된 프로브와 강력하게 하이브리드화된 BamHI 단편을 함유하였다. 이들 12개 코스미드는 pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44 및 pSPM45로 명명되었다. BamHI로 분해시킨 후의 이들 12개 코스미드의 프로필을 서로 비교하고 또한 코스미드 pSPM5의 프로필과 비교하였다. 또한, orf1-orf25c 영역에서 이미 동정된 각종 유전자에 상응하는 각종 프라이머를 사용하여 PCR 증폭 실험함으로써, 이들 코스미드 몇몇의 삽입물을 서로에 대해 위치 설정할 수 있었으며 또한, 이미 공지된 orf1-orf25c 영역에서의 이들 삽입물의 위치를 결정할 수 있었다(도 32 참조). 코스미드 pSPM36을 보다 특별히 선택하였는데, 이는 이것이 orf25c의 상류에 큰 영역을 함유하기 쉽기 때문이다(도 31 및 32 참조).
이어서, 상기 언급된 바와 동일한 조건을 이용하여, 스트렙토마이세스 암보파시엔스 OSC2의 라이브러리의 2000개 클론을 PCR 생성물: ORF1*c-ORF2*c(참조: 도 31, 프로브 II)에 상응하는 제2 프로브와 하이브리드화하였다. 이러한 하이브리드화로 인해, 이의 삽입물이 orf1*c에서 부터 orf10*c까지의 영역에 위치한 코스미드를 분리하는 것이 가능해졌다. 사용된 하이브리드화 조건 하에서, 하이브리드화된 2,000개 중에서 16개 클론이 상기 제2 프로브와 강력한 하이브리드화 시그널을 나타내었다. 이들 16개 클론을 LB 배지 + 앰피실린(50㎍/ml)에서 배양하고, 상응하는 16개 코스미드를 알칼리성 분해(참조: Sambrook et al., 1989)함으로써 추출한 다음, BamHI 제한 효소로 분해시켰다. BamHI로 분해시킨 후 이들 16개 코스미드의 분해 프로필을 서로 비교하고 또한 코스미드 pSPM7의 분해 프로필과 비교하였다. 프라이머 ORF1*c 및 ORF2*c을 사용한 PCR 증폭 실험으로, orf1*c 및 orf2*c 유전자를 명백히 함유하고 있고 이의 프로필이 공통의 밴드 뿐만 아니라 상이한 밴드를 갖고 있는 2개의 코스미드를 선백하는 것이 가능해졌다. 또한, orf1*c 내지 orf10*c 영역에서 이미 동정된 각종 유전자에 상응하는 각종 프라이머를 사용하여 기타 PCR 증폭 실험함으로써, 이들 코스미드의 삽입물을 서로에 대해 위치 설정할 수 있었으며 또한, 이미 공지된 orf1*c 내지 orf10*c 영역에서의 이들 삽입물의 위치를 결정할 수 있었다(도 32 참조). 2개의 코스미드를 보다 특별히 선별하고 이를 pSPM47 및 pSPM48로 명명하였다(도 32 참조).
상기 언급된 바와 동일한 조건을 이용하여, 스트렙토마이세스 암보파시엔스 OSC2의 라이브러리의 2000개 클론을 플라스미드 pOS49.99의 EcoRI-BamHI 단편(참조: 도 31, 프로브 III)에 상응하는 제3 프로브와 또한 하이브리드화하였다. 이러한 하이브리드화로 인해, orf1에서 부터 orf3까지의 영역을 함유하고, PKS 유전자의 큰 부분을 함유하거나 또는 스피라마이신에 대한 생합성 경로의 유전자 orf1 내지 orf25c의 큰 부분을 함유하기 쉬운 코스미드를 분리하는 것이 가능해졌다. 이들 하이브리드화 조건 하에서, 하이브리드화된 2,000개 중에서 35개 클론이 상기 제3 프로브와 강력한 하이브리드화 시그널을 나타내었다. 이들 35개 클론을 LB 배지 + 앰피실린(50㎍/ml)에서 배양하고, 상응하는 35개 코스미드를 알칼리성 분해(참조: Sambrook et al., 1989)함으로써 추출한 다음, BamHI 제한 효소로 분해시켰다. BamHI로 분해시킨 후 이들 35개 코스미드의 프로필을 서로 비교하고 또한 코스미드 pSPM5의 프로필과 비교하였다. 또한, orf1 내지 orf25c 영역에서 이미 동정된 각종 유전자에 상응하는 각종 프라이머를 사용하여 PCR 증폭 실험함으로써, 이들 코스미드가 orf1 내지 orf25c 영역으로부터 유래하는 삽입물을 명백히 함유하고 있다는 것을 확인할 수 있었고, 이들 코스미드의 삽입물을 서로에 대해 위치 설정할 수 있었으며 또한, 이미 공지된 orf1 내지 orf25c 영역에 대해 위치 설정할 수 있었다(도 32 참조). 5개 코스미드를 보다 특별히 선별하고 이들을 pSPM50, pSPM51, pSPM53, pSPM55 및 pSPM56로 명명하였다(도 32 참조).
19.2 코스미드 pSPM36의 삽입물 일부의 아클로닝 및 서열 분석
프라이머 ORF23c 및 ORF25c를 사용하여 PCR함으로써 수득된 대략 0.8kb의 프로브(참조: 상기 및 도 31, 프로브 I)를, PstI 효소로 분해시킨 에스. 암보파시엔스 OSC2의 총 DNA 상에서 서던 블롯팅 실험하는데 또한 사용하였다. 상기 언급된 하이브리드화 조건 하에서, 상기 프로브는 PstI 효소로 분해시킨 에스. 암보파시엔스 OSC2의 총 DNA 상에서 하이브리드화된 경우에 대략 6kb의 단일 PstI 단편을 나타낸다. PstI 부위는 orf23c 영역 내에 존재하지만(참조: 서열 번호 80), 공지된 서열(서열 번호 1 참조)의 말단(BamHI 부위) 까지 존재하는 PstI 부위는 전혀 없다. 이러한 PstI-BamHI 단편은 크기가 대략 1.4kb이다. 따라서, PstI 효소로 분해시킨 에스. 암보파시엔스의 총 DNA 상에서 하이브리드화된 6kb PstI 단편은 orf25c의 상류에 위치한 대략 4.6kb의 영역을 함유한다. 이러한 영역은 기타 유전자(이의 생성물은 스피라마이신 I에 대한 생합성 과정에 관여한다)를 함유하기 쉽다. 분해시킴으로써, 코스미드 pSPM36이 이러한 6kb PstI 단편을 실제로 함유하고 있다는 것을 확인하였다. orf25c의 추가 상류 서열을 결정할 목적으로, 상기 단편을 pSPM36으로부터 분리하였다. 이를 위해, 코스미드 pSPM36을 PstI 제한 효소로 분해시켰다. 크기가 대략 6kb인 PstI-PstI 단편을 0.8% 아가로스 겔로부터 전기용출시킴으로써 분리한 다음, 이를 벡터 pBK-CMV(4512bp)(Stratagene (La Jolla, California, USA)에 의해 시판됨) 내로 클로닝하였다. 이로써 수득된 플라스미드를 pSPM58로 명명하고(도 33 참조), 이의 삽입물 서열을 결정하였다. 이러한 삽입물 서열이 서열 번호 134에 제시되어 있다. 그러나, 모든 서열이 결정된 것은 아니며, 대략 450개 뉴클레오티드 갭이 존재하며, 결정되지 않은 서열의 일부는 상응하는 서열 내에 일련의 "N"로써 표시된다.
19.3 신규한 뉴클레오티드 서열의 분석, 개방 판독 프레임의 결정, 및 스피라마이신 생합성에 관여하는 유전자의 성상 확인
수득된 코스미드 pSPM58의 삽입물 서열은 프레임플롯 프로그램[참조: J. Ishikawa & K. Hotta, 1999]을 사용하여 분석하였다. 이로써, 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정하는 것이 가능하였다. 이러한 분석 결과, 상기 삽입물이 orf25c의 상류에 4개의 신규한 ORF를 포함하고 있다는 것을 결정할 수 있었다(도 34 참조). 이들 유전자는 orf26(서열 번호 107), orf27(서열 번호 109), orf28c(서열 번호 111, 이러한 orf의 서열은 완전히 결정되지 않았는데, 이는 pSPM58의 삽입물 서열 분석시 대략 450개의 뉴클레오티드 갭이 존재하기 때문이며, 이들 450개 뉴클레오티드는 서열 번호 111에서 일련의 "N" 형태로 나타내었다) 및 orf29(후자 orf의 서열은 본 삽입물에서 불완전하다)로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(도 34 참조).
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치(이들 2가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990](이러한 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
19.4 코스미드 pSPM36의 삽입물의 또 다른 일부의 아클로닝 및 서열 분석
프라이머 ORF23c 및 ORF25c를 사용하여 PCR함으로써 수득된 대략 0.8kb의 프로브(참조: 상기 및 도 31, 프로브 I)를, StuI 효소로 분해시킨 균주 OSC2의 총 DNA 상에서 서던 블롯팅 실험하는데 또한 사용하였다. 이러한 프로브에 대해 상기 언급된 하이브리드화 조건 하에서, 상기 프로브는 StuI 효소로 분해시킨 균주 OSC2의 총 DNA 상에서 하이브리드화된 경우에 대략 10kb의 단일 StuI 단편을 나타낸다. orf23c에 StuI 부위가 존재하고(서열 번호 80 참조), 이러한 부위가 PstI 부위에 대해 상대적으로 위치하는 경우에는, 상기 10kb 단편이 앞서 연구된 PstI 단편(pSPM58의 삽입물) 모두를 포함하고, 아직까지 연구되지 않은 대략 4kb 영역을 획득할 수 있게 해준다(도 33 참조). 분해시킴으로써, 코스미드 pSPM36이 이러한 10kb StuI 단편을 실제로 함유하고 있다는 것을 확인하였다. orf29의 말단 서열과 orf29의 추가 상류의 기타 유전자 서열을 결정할 목적으로, 상기 단편을 pSPM36으로부터 분리하였다. 이를 위해, 코스미드 pSPM36을 StuI 제한 효소로 분해시켰다. 크기가 대략 10kb인 StuI-StuI 단편을 0.8% 아가로스 겔로부터 전기용출시킴으로써 분리한 다음, 이를 벡터 pBK-CMV(4512bp)(Stratagene (La Jolla, California, USA)에 의해 시판됨) 내로 클로닝하였다. 이로써 수득된 플라스미드를 pSPM72로 명명하였다(도 33 참조). 후자를 EcoRI(pSPM58의 삽입물 내의 EcoRI 부위) 및 HindIII(상기 삽입물 말단의 StuI 부위 바로 다음에 위치한, 상기 벡터의 다중 클로닝 부위 중의 HindIII 부위)로 분해시켰다(도 33 참조). 이로써 수득된 EcoRI-HindIII DNA 단편은 플라스미드 pSPM72의 삽입물의 단편에 상응하고(도 33 참조), 이를 EcoRI 및 HindIII로 미리 분해시킨 벡터 pBC-SK+(Stratagene (La Jolla, California, USA)에 의해 시판됨) 내로 아클로닝시켰다. 이로써 수득된 플라스미드를 pSPM73으로 명명하였으며, 이의 삽입물 서열을 결정하였다. 이러한 삽입물 서열이 서열 번호 135에 제시되어 있다.
pSPM58 및 pSPM73의 삽입물 서열의 어셈블리가 서열 번호 106에 제시되어 있다. 이러한 서열은 orf23c(서열 번호 80 참조) 내의 PstI 부위로부터 출발하여 orf32c(도 34 참조) 내의 StuI 부위까지 지속된다. orf28c(서열 번호 111)의 서열은 완성되지 않았기 때문에(실시예 19.3 참조), 대략 450개 뉴클레오티드 영역이 서열 분석되지 않았고, 이들 450개 뉴클레오티드는 서열 번호 106의 서열 내에 일련의 "N" 형태로 표시된다.
19.5 신규한 뉴클레오티드 서열 분석, 개방 판독 프레임의 결정, 및 스피라마이신 생합성에 관여하는 유전자의 성상 확인
수득된 코스미드 pSPM73의 삽입물의 부분 서열은 프레임플롯 프로그램[참조: J. Ishikawa & K. Hotta, 1999]을 사용하여 분석하였다. 이로써, 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정하는 것이 가능하였다. 이러한 분석 결과, 상기 삽입물이 4개 ORF, 즉 1개는 불완전하고 3개는 완전한 ORF를 포함하고 있다는 것을 결정할 수 있었다(도 34 참조). 불완전한 ORF는 orf29의 암호화 서열의 3' 위치에 상응한데, 이로써 플라스미드 pSPM58의 삽입물을 서열 분석하는 동안 수득된 상기 동일한 orf의 부분 서열을 통하여 상기 유전자의 서열을 완성시킬 수 있었다(실시예 19.2 및 19.3 참조). 이와 같이 2개 서열을 조합함으로써, orf29의 완전한 서열을 수득할 수 있었다. 이로써 수득된 4개 유전자는 orf29(서열 번호 113), orf30c(서열 번호 115), orf31(서열 번호 118) 및 orf32c(서열 번호 120)로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(도 34 참조).
이들 개방 판독 프레임으로부터 추론된 단백질 서열(orf29에 대해서는 서열 번호 114, orf30c에 대해서는 서열 번호 116 및 117, orf31에 대해서는 서열 번호 119 및 orf32c에 대해서는 서열 번호 121)을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치(이들 2가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990](이러한 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
19.6 코스미드 pSPM36의 삽입물의 제3 부분의 아클로닝 및 서열 분석
orf32c에 대한 내부 서열에 상응하는 프로브(0.8kb DNA 단편)를, 매트릭스로서 스트렙토마이세스 암보파시엔스 균주의 총 DNA를 사용하고 다음 프라이머를 사용하여 PCR함으로써 수득하였다:
KF36: 5'- TTGCCGTAGCCGAGGACCAGCG-3' (서열 번호 151) 및
KF37: 5'- CACATGGCCCTGGAGGACCCTG-3' (서열 번호 152).
이로써 수득된 PCR 생성물은 orf32c의 내부 서열을 나타낸다. 이러한 프로브는 PstI 효소로 분해시킨, 균주 OSC2의 염색체 DNA와 코스미드 pSPM36의 DNA 상에서 서던 블롯팅 실험하는데 사용하였다. 상기 언급된 바와 동일한 하이브리드화 조건 하에서(실시예 19.1 참조), 이러한 프로브는 PstI 효소로 분해시킨, 균주 OSC2의 총 DNA와 코스미드 pSPM36의 DNA 상에서 하이브리드화되는 경우에 대략 3.4kb 및 2.5kb의 2개의 PstI 단편을 나타낸다. 사용된 프로브 내에 PstI 부위가 존재한다면, 이러한 결과를 설명할 수 있다. 크기가 대략 3.4kb인 제1 DNA 단편은 이의 서열이 이미 전적으로 공지되어 있는 단편이다. 2.5kb 단편의 서열은 700bp 영역에 걸쳐 단지 부분적으로만 공지되어 있다. orf32c의 말단 서열과 이의 상류의 기타 유전자 서열을 결정할 목적으로, 상기 단편을 pSPM36으로부터 분리하였다. 이를 위해, 코스미드 pSPM36을 PstI 제한 효소로 분해시켰다. 크기가 대략 2.5kb인 PstI-PstI 단편을 0.8% 아가로스 겔로부터 정제시킴으로써 분리한 다음, 이를 벡터 pBK-CMV(4518bp)(Stratagene (La Jolla, California, USA)에 의해 시판됨) 내로 클로닝하였다. 이로써 수득된 플라스미드를 pSPM79로 명명하고(도 41 참조), 이의 삽입물 서열을 결정하였다.
orf28c의 서열(서열 번호 111)은 완성되지 않았다(실시예 19.3 참조). 구체적으로 언급하면, 대략 450개 뉴클레오티드 영역을 결정하는 것이 가능하지 않았기 때문에, 이들 450개 뉴클레오티드는 서열 번호 106의 서열 내에 일련의 "N" 형태로 표시된다. 생략된 영역 전체 서열은 이 영역을 재서열 분석함으로써 결정하였다. 따라서, pSPM58 및 pSPM73의 삽입물 서열을 완전히 결정하였다. orf28c의 암호화 부분의 완전한 서열이 서열 번호 141에 제시되어 있고, 이러한 서열로부터 추론되는 단백질이 서열 번호 142에 제시되어 있다. 플라스미드 pSPM79의 삽입물 서열이 서열 번호 161에 제시되어 있다.
pSPM58, pSPM73 및 pSPM79의 삽입물 서열의 어셈블리가 서열 번호 140에 제시되어 있다(도 41 참조). 이러한 서열은 orf23c(서열 번호 80 참조)에서 PstI 부위로부터 출발하여 orf34c(도 41 참조)에서 PstI 부위까지 지속된다.
19.7 신규한 뉴클레오티드 서열 분석, 개방 판독 프레임의 결정, 및 스피라마이신 생합성에 관여하는 유전자의 성상 확인
수득된 코스미드 pSPM79의 삽입물 서열은 프레임플롯 프로그램[참조: Ishikawa J & Hotta K. 1999]을 사용하여 분석하였다. 이로써, 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정하는 것이 가능하였다. 이러한 분석 결과, 상기 삽입물이 3개의 ORF, 즉 2개는 불완전한 ORF(orf32c 및 orf34c)이고 1개는 완전한 ORF(orf33)를 포함하고 있다는 것을 결정할 수 있었다(도 41 참조).
불완전한 제1 ORF는 orf32c의 암호화 서열의 5' 위치에 상응한다. 이로써 플라스미드 pSPM73의 삽입물을 서열 분석하는 동안 수득된 상기 동일한 orf의 부분 서열을 통하여 상기 유전자의 서열을 완성시킬 수 있었다(실시예 19.2 및 19.3 참조). 이와 같이 2개 서열을 조합함으로써, orf32c(서열 번호 145)의 완전한 서열을 수득할 수 있었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(도 41 참조). 완전한 orf는 orf33(서열 번호 147)로 명명되었다. 제3의 ORF는 orf34c(서열 번호 149)로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(도 37 참조). 이러한 orf 생성물과 데이터뱅크 간에 수행된 비교 결과는, 상기 단백질의 C-말단부가 뉴클레오티드 서열로부터 추론된 생성물 내에 존재하지 않으므로, 이러한 orf가 서열 분석된 영역 보다 더 길고 이러한 영역을 벗어나서 지속된다는 사실을 제안하고 있다.
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치(이들 2가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990](이러한 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
실시예 20: 스피라마이신 생합성 중간체 생성에 관한 분석
20.1 샘플 제조:
시험하고자 하는 각종 균주를 각각, 70ml의 MP5 배지를 함유하는 7개의 500ml용 차폐된 에를렌마이어에서 배양한다(참조: Pernodet et al., 1993). 이러한 에를렌마이어를 각종 에스. 암보파시엔스 균주의 2.5 x 106개 포자/ml의 농도로 접종하며, 96시간 동안 250rpm으로 궤도 진탕시키면서 27℃ 하에 성장시킨다. 동일한 클론에 상응하는 배양물을 모으고, 주름진 필터 내로 임의 여과시킨 다음, 7000rpm으로 15분 동안 원심분리시킨다.
이어서, 수산화나트륨을 이용하여 과실즙의 pH를 9로 조정하고, 메틸 이소부티릴 케톤(MIBK)을 사용하여 상청액을 추출한다. 이어서, 유기 상(MIBK)을 회수하고 증발시킨다. 이어서, 건조 추출물을 1ml의 아세토니트릴에 흡수시킨 다음, 1/10로 희석(물을 이용하여 100㎕ 대 1ml)시킨 후에, 이를 액체 크로마토그래피/질량 분광법(LC/MS) 분석에 사용하였다.
20.2 LC/MS에 의한 샘플 분석:
시험하고자 하는 균주에 의해 합성된 각종 생성물의 질량을 측정할 목적으로, 상기 샘플을 LC/MS함으로써 분석하였다.
사용된 고 성능 액체 크로마토그래피 칼럼은 크로마실(Kromasil) C8 150* 4.6mmm, 5mmm, 100Å 칼럼이다.
이동 상은 아세토니트릴과 수성 0.05% 트리플루오로아세트산 용액의 혼합물로 이루어진 구배이고, 유속은 1ml/min으로 설정된다. 칼럼 오븐의 온도는 30℃로 유지시킨다.
칼럼 배출구에서의 UV 탐지는 2가지 상이한 파장, 즉 238nm 및 280nm에서 수행하였다.
크로마토그래피 칼럼과 커플링된 질량 분광계는 30 및 70V 하의 원추 전압을 갖는, 단일 사극(Quadripole) 장치[Agilent에 의해 시판됨]이다.
20.3 균주 OS49.67에 의해 생산된 생합성 중간체의 분석
orf3 유전자를 동위상 결실시킴으로써 불활성화시킨 균주 OS49.67은 스피라마이신을 생산하지 않는다(실시예 6 및 15 참조).
샘플을 상기 언급된 방법(단락 20.1 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 참조) LC/MS에 의해 분석하였다. 보다 특히, 크로마토그래피에 의한 분석은 이동 상으로서 20%의 아세토니트릴을 T=O에서 부터 T=5분까지 사용한 다음, T=35분에서 30%로 선형 증가시킨 후, T=50분까지 안정 수준에 달하는 용매 구배로 수행하였다.
이들 조건 하에서, 2가지 생성물이 보다 특별히 관찰되었다: 238nm에서 흡수되는 생성물(잔류 시간 33.4분) 및 280nm에서 흡수되는 생성물(잔류 시간 44.8분)(도 35 참조). 도 35에는 238nm 및 280nm 하에 생성된 HPLC 크로마토그램(상류)과, 33.4분 및 44.8분에 용출된 분자의 UV 스펙트럼(하류)의 중첩이 도시되어 있다.
커플된 질량 분광 분석 조건은 다음과 같다: 스캐닝은 100 내지 1000 Da 범위의 질량을 포괄하는 스캔 모드로 수행한다. 전기증배기 획득량은 1V이다. 전기분무 공급원에 관해서 언급하면, 분무화 기체 압력은 35psig이고, 건조화 기체의 유속은 12.0 ℓ/min이며, 건조화 기체의 온도는 350℃이고 모세관 전압은 +/- 3000V이다. 이들 실험으로, 분리된 두 생성물의 질량을 측정할 수 있었다. 이들 질량은 각각, 먼저 용출된 생성물([M-H2O]+=353 주 생성물)에 대해서는 370g/mol이고 제2 생성물([M-H2O]+=351 주 생성물)에 대해서는 368g/mol이다.
구조를 획득하기 위해, 상기 언급된 생성물을 다음 조건 하에 분리 및 정제하였다: 이동 상은 수성 0.5% 트리플루오로아세트산 용액과 아세토니트릴의 70/30(v/v) 혼합물이다. 크로마토그래피는 고정된 유속 1ml/min을 이용하는 등용매 시스템으로 수행한다. 이들 조건 하에, 상기 2가지 생성물의 잔류 시간은 각각 8분 및 13.3분이다. 또한, 이러한 경우, 제조된 샘플(단락 20.1 참조)은 10㎕을 주입하기 전에는 물에서 희석시키지 않는다.
상기 2가지 생성물을 크로마토그래피 칼럼 배출구에서 회수하고 다음 조건 하에 분리하였다: Oasis HLB 1cc 30mg 카트릿지(Waters)를 1ml의 아세토니트릴에 이어, 1ml의 물/아세토니트릴(20v/80v) 및 1ml의 80/20 물/아세토니트릴로 순차적으로 조건화시킨다. 이어서, 상기 샘플을 도입하고, 카트릿지를 1ml의 물/아세토니트릴(95/5) 및 1ml의 물/중수소화 아세토니트릴(95/5)로 연속해서 세척한 다음, 600㎕의 40/60 물/중수소화 아세토니트릴로 용출시킨다. 이어서, 회수한 용액을 NMR에 의해 직접 분석한다.
이들 두 화합물에 대해 수득된 NMR 스펙트럼은 다음과 같다:
- 용출된 제1 생성물: 플라테놀리드 A: (스펙트럼 9646V)
CD3CN 중의 1H 스펙트럼(화학적 이동, ppm): 0.90 (3H, t, J=6Hz), 0.93 (3H, d, J=5Hz), 1.27 (3H, d, J=5Hz), 1.27 내지 1.40 (3H, m), 1.51 (1H, m), 1.95 (1H, m), 2.12 (1H, m), 2.30 (1H, d, J=12Hz), 2.50 (1H, d, J=11Hz), 2.58 (1H, dd, J=9 및 12 Hz), 2.96 (1H, d, J=7Hz), 3.43 (3H, s), 3.70 (1H, d, J=9Hz), 3.86 (1H, d, J=7Hz), 4.10 (1H, m), 5.08 (1H, m), 5.58 (1H, dt, J=3 및 12Hz), 5.70 (1H, dd, J=8 및 12 Hz), 6.05 (1H, dd, J=9 및 12 Hz), 6.24 (1H, dd, J=9 및 12Hz).
- 용출된 제2 생성물: 플라테놀리드 B: (스펙트럼 9647V)
CD3CN 중의 1H 스펙트럼(화학적 이동, ppm): 0.81 (3H, t, J=6Hz), 0.89 (1H, m), 1.17 (3H, d, J=5Hz), 1.30 (4H, m), 1.47 (2H, m), 1.61 (1H, t, J=10Hz), 2.20 (1H, m), 2.38 (1H, d, J=13Hz), 2.52 (1H, m), 2.58 (1H, m), 2.68 (1H, dd, J=8 및 13Hz), 3.10 (1H, d, J=7Hz), 3.50 (3H, s), 3.61 (1H, d, J=8Hz), 3.82 (1H, d, J=7Hz), 5.09 (1H, m), 6,20 (1H, m), 6.25 (1H, dd, J=9 및 12 Hz), 6.58 (1H, d, J=12 Hz), 7.19 (1H, dd, J=9 및 12Hz).
이들 실험으로써, 이들 2가지 화합물의 구조를 결정할 수 있었다. 용출된 제1 생성물은 플라테놀리드 A이고, 제2 생성물은 플라테놀리드 B이며; 이들 2가지 분자의 추론된 구조가 도 36에 제시되어 있다.
상기 언급된 바와 약간은 상이하지만, 이의 설정 조건은 당업자에게 널리 공지되어 있는 조건 하에서 LC/MS 기술을 NMR과 조합하여 사용하여, 균주 OS49.67이 플라테놀리드 A 및 B 이외에도 이들 2가지 화합물의 유도체를 생산한다는 사실을 결정할 수 있었다. 이들은 플라테놀리드 A + 미카로스와 플라테놀리드 B + 미카로스이다(이들 2가지 화합물의 구조가 도 40에 제시되어 있다). 균주 OS49.67의 과실즙의 분석 결과가 표 42에 제시되어 있다.
20.4 균주 SPM509에 의해 생산된 생합성 중간체의 분석
orf14 유전자를 불활성화시킨 균주 SPM509(arf14::att3Ωaac-)은 스피라마이신을 생산하지 않는다(실시예 13, 15 및 16 참조). 샘플을 상기 언급된 방법(단락 20.1 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 및 20.3 참조) LC/MS에 의해 분석하였다. MP5 배지에서 배양된 균주 SPM509의 배양 상청액에 존재하는 생합성 중간체의 분석 결과, 이러한 균주가 단지 형태 B의 플라테놀리드("플라테놀리드 B", 도 36 참조) 만을 생산하고 형태 A("플라테놀리드 A, 도 36 참조)는 생산하지 않은 것으로 나타났다.
실시예 21:
orf3
유전자에서 녹아웃을 나타내는 균주(OS49.67)에서
orf14
유전자의 개입중단
orf14 유전자는 스피라마이신 생합성에 필수적이다(실시예 13, 15 및 16 참조: 상기 유전자가 개입중단된 균주 SPM509는 더 이상 스피라마이신을 생산하지 않는다). MP5 배지에서 배양된 균주 SPM509의 배양 상청액에 존재하는 생합성 중간체의 분석 결과, 이러한 균주가 단지 형태 B의 플라테놀리드 만을 생산하고 형태 A는 생산하지 않은 것으로 나타났다(실시예 20 참조). 이러한 관찰 결과를 설명할 수 있는 가설들 중의 하나는 orf14의 생성물이 효소적 환원 단계를 통하여 형태 B의 플라테놀리드를 형태 A로 전환시키는데 관여한다는 것이다. 이러한 가설을 시험하기 위해, 스피라마이신은 더 이상 생산하지 않지만 형태 A와 B의 플라테놀리드를 생산하는 돌연변이체에서 orf14 유전자를 불활성화시킨다. 이는 orf3 유전자를 동위상 결실에 의해 불활성화시킨(△orf3) 균주 OS49.67(실시예 6 및 20 참조)의 경우에 해당된다. 이러한 균주에서 orf14 유전자를 불활성화시키기 위해, 균주 OS49.67을 원형질체 형질전환시킴으로서 플라스미드 pSPM509를 도입하였다(참조: T. Kieser et al., 2000). orf14 유전자의 불활성화는 균주 OSC2의 경우에 이미 언급되었고(실시예 13 참조), 이와 동일한 과정을 균주 OS49.67에서 orf14 유전자의 불활성화를 위해 사용하였다. 플라스미드 pSPM509로 형질전환시킨 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신 함유 배지와 히그로마이신 함유 배지 상에서 계대배양하였다. 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 클론(HygS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 상기 orf14 유전자가 att3Ωaac- 카세트에 의해 개입중단된 orf14의 복사물로 대체된 것이다. 이들 클론을 보다 특별히 선별하고, orf14의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3Ωaac- 카세트에 상응하는 프로브와 하이브리드화시켜, 유전자 대체가 실제로 수행되었는지를 확인하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(△orf3, orf14::att3Ωaac-)을 보다 특별히 선별하고, 이를 SPM510으로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 orf14 유전자를 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다.
실시예 22:
orf14
유전자의 개입중단의 기능적 상보성
22.1 플라스미드 pSPM519의 작제:
orf14 유전자를 다음 쌍의 올리고뉴클레오티드를 사용하고, 매트릭스로서 균주 OSC2의 염색체 DNA를 사용하여 PCR함으로써 증폭시켰다: EDR31: 5'CCCAAGCTCTGCGCCCGCGGGCGTGAA 3'(서열 번호 136) 및 EDR37: 5'GCTCTAGAACCGTGTAGCCGCGCCCCGG 3'(서열 번호 137). 올리고뉴클레오티드 EDR31 및 EDR37은 각각 HindIII 및 XbaI 제한 부위(진하게 표시된 서열)를 수반한다. 이로써 수득된 1.2kb 단편을 벡터 pGEM-T easy(Promega (Madison, Wisconsin, USA))에 의해 시판됨) 내로 클로닝시켜, 플라스미드 pSPM515를 수득하였다. 이어서, 이러한 플라스미드를 HindIII 및 XbaI 제한 효소로 분해시켰다. 수득된 1.2kb HindIII/XbaI 삽입물을, 상기와 동일한 효소로 미리 분해시킨 벡터 pUWL201(실시예 17.1 참조)내로 클로닝하였다. 이로써 수득된 플라스미드는 pSPM519로 명명되었다.
22.1 균주 SPM509 및 SPM510을 플라스미드 pSPM519로 형질전환시킴:
플라스미드 pSPM519를 원형질체 형질전환에 의해 균주 SPM509(실시예 13 참조) 및 SPM510(실시예 17 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 티오스트렙톤 내성에 대해 선별하였다. 이어서, 상기 클론을 티오스트렙톤 함유 배지 상에서 계대배양하였다.
균주 SPM509는 스피라마이신 비-생산자 균주이다(실시예 13, 15 및 16, 및 도 24 참조). 벡터 pSPM519로 형질전환시킨 균주 SPM509(SPM509 pSPM519로 명명된 균주)의 스피라마이신 생산은, 상기 균주를 티오스트렙톤의 존재 하에 MP5 배지에서 배양함으로써 분석하였다. 이어서, 배양 상청액을 HPLC에 의해 분석하였다(실시예 16 및 17 참조). 이러한 분석 결과가 표 43에 제시되어 있고, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 총 생산량에 상응한다(스피라마이신 I, II 및 III 생산량을 부가함으로써 수득됨). 균주 SPM509 내에 벡터 pSPM519가 존재하는 것이 스피라마이신 생산을 복원시키는 것으로 관찰되었다(표 43 참조).
플라스미드 pSPM519로 형질전환시킨 균주 SPM510은 SPM510 pSPM519로 명명되었다.
실시예 23: 에스. 프라디애의
tylB
유전자에 의한
orf3
유전자의 개입중단의 기능적 상보성
23.1 플라스미드 pOS49.52의 작제:
플라스미드 pOS49.52는 에스. 암보파시엔스의 TylB 단백질의 발현을 허용해 주는 플라스미드에 상응한다. 이를 작제하기 위해, 에스. 프라디애의 tylB 유전자의 암호화 서열[참조: Merson-Davies & Cundliffe, 1994, 젠뱅크 수탁 번호: U08223(상기 영역 서열), SFU08223(DNA 서열) 및 AAA21342(단백질 서열)]을 플라스미드 pKC1218(참조: Bierman et al., 1992, Kieser et al., 2000; 상기 플라스미드를 함유하는 이. 콜라이 균주는 특히 ARS (NRRL) Agricultural Research Service Culture Collection) (Peoria, Illinois, USA)로부터 번호 B-14790로 입수 가능하다) 내로 도입하였다. 또한, 상기 암호화 서열을 ermE* 프로모터의 제어 하에 위치시켰다(참조: 상기, 특히 실시예 17.1, Bibb et al., 1985, Bibb et al., 1994).
23.1 균주 OS49.67을 플라스미드 pOS49.52로 형질전환시킴:
orf3 유전자를 동위상 결실에 의해 불활성화시킨 균주 OS49.67은 스피라마이신을 생산하지 않는다(실시예 6 및 15 참조). 플라스미드 pOS49.52를 원형질체 형질전환에 의해 균주 OS49.67 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 상기 클론을 아프라마이신 함유 배지 상에서 계대배양하였다. 이 클론을 보다 특별히 선별하고 OS49.67 pOS49.52로 명명하였다.
상기 입증된 바와 같이, 균주 OS49.67은 스피라마이신을 생산하지 않는다(실시예 6 및 15 참조). 벡터 pOS49.52로 형질전환시킨 균주 OS49.67의 스피라마이신 생산은 실시예 15에 기재된 기술에 의해 분석하였다. 이로써, 상기 균주가 스피라마이신 생산자 표현형을 지니고 있다는 것을 입증할 수 있었다. 따라서, TylB 단백질은 orf3 유전자의 개입중단의 기능적 상보성을 허용해 준다.
실시예 24:
orf28c
유전자의 과발현에 의한 스피라마이신 생산 향상
24.1 플라스미드 pSPM75의 작제:
orf28c 유전자는 HindIII 제한 부위 또는 BamHI 제한 부위를 포함하는 한 쌍의 올리고뉴클레오티드를 사용하여 PCR함으로써 증폭시켰다. 이들 프라이머는 다음 서열을 갖는다:
KF30: 5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138)
[HindIII 제한 부위(진하게 표시됨)를 갖는다]
KF31: 5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
[BamHI 제한 부위(진하게 표시됨)를 갖는다].
프라이머 KF30 및 KF31은 각각 HindIII 및 BamHI 제한 부위(진하게 표시된 서열)을 수반한다. 프라이머 KF30와 KF31 쌍은 매트릭스로서 플라스미드 pSPM36(상기 참조)을 사용하여, orf28c 유전자를 함유하는 크기가 대략 1.5kb인 DNA 단편을 증폭시킬 수 있게 해준다. 이로써 수득된 1.5kb 단편을 벡터 pGEM-T easy(Promega (Madison, Wisconsin, USA)에 의해 시판됨) 내로 클로닝시켜, 플라스미드 pSPM74를 수득하였다. 이어서, 플라스미드 pSPM74를 HindIII 및 BamHI 제한 효소로 분해시키고, 수득된 대략 1.5kb HindIII/BamHI 삽입물을, 상기와 동일한 효소로 미리 분해시킨 벡터 pUWL201(실시예 17.1 참조) 내로 아클로닝시켰다. 이로써 수득된 플라스미드를 pSPM75로 명명하였는데, 이는 ermE* 프로모터의 제어 하에 위치된 orf28c의 암호화 서열을 모두 함유한다.
24.2 균주 OSC2를 플라스미드 pSPM75로 형질전환시킴:
플라스미드 pSPM75를 원형질체 형질전환에 의해 균주 OSC2 내로 도입하였다(참조: T. Kieser et al., 2000). 원형질체 형질전환 후, 상기 클론을 대상으로 하여, 이들의 티오스트렙톤 내성에 대해 선별하였다. 이어서, 상기 클론을 티오스트렙톤 함유 배지 상에서 계대배양하고, 상기 플라스미드로의 형질전환을 플라스미드 추출에 의해 확인하였다. 2개 클론을 보다 특별히 선별하고, 이를 OSC2/pSPM75(1) 및 OSC2/pSPM75(2)로 명명하였다.
균주 OSC2/pSPM75(2) 샘플은 2003년 10월 6일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-3101로 기탁되었다.
스피라마이신 생산에 대한 orf28c 유전자의 과발현 효과를 시험하기 위해, OSC2/pSPM75(1) 및 OSC2/pSPM75(2) 클론의 스피라마이신 생산을 실시예 15에 기재된 기술에 의해 시험하였다. 이와 병행해서, 비교를 위해, 균주 OSC2의 스피라마이신 생산에 관한 분석을 또한 수행하였다. 이로써, 플라스미드 pSPM75의 존재가 균주 OSC2의 스피라마이신 생산을 상당히 증가시킨다는 사실을 관찰할 수 있었다. 이로써, orf28c의 과발현이 스피라마이신 생산 증가를 가져다 주는 것으로 입증되었으며, 이것이 조절인자로서 역할을 한다는 사실을 확인시켜 준다.
OSC2/pSPM75(1) 및 OSC2/pSPM75(2) 클론의 스피라마이신 생산을 또한, HPLC에 의해 분석하였다(실시예 17.2에서와 동일한 방식으로 수행됨). 이와 병행해서, 비교를 위해, 균주 OSC2의 스피라마이신 생산에 관한 분석을 또한 수행하였다. 이러한 분석 결과가 표 44에 제시되어 있고, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 총 생산량에 상응한다(스피라마이신 I, II 및 III 생산량을 부가함으로써 수득됨).
따라서, 플라스미드 pSPM75가 존재하는 것이 균주 OSC2의 스피라마이신 생산량을 상당히 증가시키는 것으로 관찰된다. 이는 orf28c의 과발현이 스피라마이신 생산에 긍정적인 효과를 나타낸다는 것을 명백히 입증해준다.
실시예 25:
orf8
유전자에서 불활성화시킨 균주에 의한 스피라마이신 생합성 중간체의 생산 분석
orf8 유전자를 Ωhyg 카세트의 삽입에 의해 불활성화시킨 균주 OS49.107은 스피라마이신을 생산하지 않는다(실시예 7 및 15 참조). orf8 유전자는 몇 가지 아미노트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화하고, orf8 유전자가 포로사민 생합성에 필요한 아민기 전이 반응에 대해 책임이 있는 4-아미노트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 6 참조). 따라서, 스피라마이신 생합성은 포로시딘 단계에서 차단될 것으로 예상된다(도 7 참조). 따라서, 스피라마이신 비-생산자인 균주 OS49.107은 포로시딘을 생산해야 한다.
균주 OS49.107의 상청액 샘플을 상기 언급된 방법(MIBK 추출을 수반하지 않는 실시예 16 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 및 20.3 참조) LC/MS에 의해 분석하였다. SIM 모드에서는, 포로시딘의 분자 이온에 관한 질량 558을 선별하고 몇 가지 피크를 탐지하였다. 질량 558의 화합물이 존재하는 것은 orf8이 포로사민 합성에 일정 역할을 한다는 가설에 부합된다.
실시예 26:
orf12
유전자에서 불활성화시킨 균주에 의한 스피라마이신 생합성 중간체의 생산 분석
orf12 유전자를 불활성화시킨 균주 SPM507은 스피라마이신을 생산하지 않는다(실시예 11 및 15 참조). orf12 유전자는 포로사민 생합성에 필요한 탈수 반응에 대해 책임이 있는 3,4-데하이드라타제를 암호화하는 것으로 여겨진다(도 6 참조). 따라서, 스피라마이신 생합성은 포로시딘 단계에서 차단될 것으로 예상된다(도 7 참조). 따라서, 스피라마이신 비-생산성 균주인 균주 SPM507은 포로시딘을 생산해야 한다.
균주 SPM507의 상청액 샘플을 상기 언급된 방법(MIBK 추출을 수반하지 않는 실시예 16 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 및 20.3 참조) LC/MS에 의해 분석하였다. 이들 조건 하에서, 포로시딘 잔류 시간은 대략 12.9분이다. SIM 모드에서는, 포로시딘의 분자 이온 [M+H]+에 관한 질량 558을 선별하고 특정 피크를 탐지하였다. 질량 558의 화합물이 존재하는 것은 orf12의 생성물이 스피라마이신 생합성에 일정 역할을 한다는 가설을 실증시켜 준다.
그러나, 포로시딘은 비교적 적은 양으로 존재하고, 이들 조건 하에서는 238nm에서 흡수되는 생성물이 보다 특별히 관찰되었다(잔류 시간 17.1분). LC/MS 분석 결과, 상기 화합물의 질량이 744.3g/mol인 것으로 결정되었다([M+H]+=744.3 주 생성물).
구조를 획득하기 위해, 상기 언급된 생성물을 상기 언급된 조건 하에 분리 및 정제하였다(단락 20.1 참조). 이어서, 유기 상(MIBK)을 회수하고 증발시킨다. 건조 추출물을 물에 흡수시키고 헵탄으로 추출한다. 이어서, 수용액을 Oasis HLB 1g 카트릿지(Waters SAS, St-Quentin en-Yvelines, France)에 결합시킴으로써 이를 추출한다. 이 화합물을 30/70 물/아세토니트릴 혼합물로 용출시킴으로써 회수한다. 이어서, 이 용액을 분석용 칼럼 상으로 주사하고(100㎕), 분획을 Oasis HLB 1cc 30mg 카트릿지(Waters) 상에서 회수한다. 사용하기 전에, 이러한 Oasis HLB 1cc 30mg 카트릿지(Waters)를 아세토니트릴에 이어, 물/아세토니트릴 혼합물(20v/80v) 및 80/20 물/아세토니트릴 혼합물로 순차적으로 조건화시킨다.
이어서, Oasis HLB 1cc 30mg 카트릿지(Waters)를 1ml의 물/아세토니트릴(95/5) 및 1ml의 물/중수소화 아세토니트릴(95/5)로 연속해서 세척한 다음, 600㎕의 40/60 물/중수소화 아세토니트릴로 용출시킨다. 이어서, 회수한 용액을 NMR에 의해 직접 분석한다.
상기 화합물에 대해 수득된 NMR 스펙트럼은 다음과 같다(19312V NMR 스펙트럼):
CD3CN/D2O 중의 1H 스펙트럼(화학적 이동, ppm): 0.92 (3H, d, J=6Hz), 1.10 (1H, 분해되지 않은 피크), 1.14 (3H, s), 1.17 (3H, d, J=6Hz), 1.22 (3H, d, J=6Hz), 1.25 (3H, d, J=6Hz), 1.40 (1H, 분해되지 않은 피크), 1.75 (1H, dd, J=12 및 2Hz), 1.81 (1H, 분해되지 않은 피크), 1.90 (1H, d, J=12Hz), 2.05 (1H, 분해되지 않은 피크), 2.12 (3H, s), 2.15 (1H, 분해되지 않은 피크), 2.35 (2H, 분해되지 않은 피크), 2.45 (6H, 넓은 s), 2.53 (1H, 분해되지 않은 피크), 2.64 (1H, dd, J=12 및 9Hz), 2.80 (1H, dd, J=9 및 16Hz), 2.95 (1H, d, J=8Hz), 3.23 (2H, 분해되지 않은 피크), 3.34 (1H, d, J=7Hz), 3.45 (3H, s), 3.49 (1H, 분해되지 않은 피크), 3.93 (1H, dd, J=7 및 3Hz), 4.08 (1H, 분해되지 않은 피크), 4.37 (1H, d, J=6Hz), 4.88 (1H, 분해되지 않은 피크), 5.05 (2H, 분해되지 않은 피크), 5.65 (2H, 분해되지 않은 피크), 6.08 (1H, dd, J=8 및 12Hz), 6.40 (1H, dd, J=12 및 9Hz), 9.60 (1H, s).
이들 실험으로써, 상기 화합물의 구조를 결정할 수 있었으며, 이러한 구조가 도 38에 제시되어 있다.
실시예 27:
orf5*
유전자에서 불활성화시킨 균주에 의한 스피라마이신 생합성 중간체의 생산 분석
균주 SPM501은 유전자형 orf6*::att1Ωhyg+을 갖는다. att1Ωhyg+ 카세트를 orf6* 유전자 내로 삽입시킨 극성 효과를 통하여, orf5* 유전자가 스피라마이신 생합성 경로에 필수적이란 사실을 결정할 수 있었다. 구체적으로 언급하면, 상기 절제 가능한 카세트를 orf6* 유전자 내로 삽입시키면, orf5* 유전자의 발현에 대한 극성 효과를 통하여 스피라마이신 생산을 완전히 억제시킨다. 그러나, 상기와 같이 삽입된 카세트를 일단 절단시키면(그리고, 이에 따라 orf6* 유전자 만이 불활성화되는 경우; 실시예 14 및 15 참조), 스피라마이신 I의 생산이 복원된다. 이는 orf5* 유전자가 스피라마이신 생합성에 필수적이란 사실을 입증해주는데, 이는 이를 불활성화시키면, 스피라마이신 생산이 완전히 억제되기 때문이다.
orf5* 유전자는 몇 가지 O-메틸트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. orf5* 유전자는 플라테놀리드의 생합성에 관여하는 O-메틸트랜스퍼라제인 것으로 여겨진다. 이러한 가설을 입증하기 위해, LC/MS 및 NMR 분석 실험을, 스피라마이신을 과생산하는 균주로부터 수득된 유전자형: orf6*::att1Ωhyg+의 에스. 암보파시엔스 균주 상에서 수행하였다.
상기 균주의 상청액 샘플을 상기 언급된 방법(MIBK 추출을 수반하지 않는 실시예 16 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 및 20.3 참조) LC/MS에 의해 분석하였다. 그러나 사용된 칼럼은 X-Terra 칼럼(Waters SAS, St-Quentin en-Yvelines, France)이고, 분광계의 원추 전압은 380V로 설정되어, 분석된 화합물의 발효를 획득한다. 이들 조건 하에서, 잔류 시간이 대략 13.1분인 생성물이 관찰된다. 상기 화합물의 질량 스펙트럼은 스피라마이신 I과 유사한 외관을 나타내지만, 분자 이온은 829이다. 스피라마이신의 질량과 비교한 14 질량 상의 차이점은 락톤 환(이러한 화합물의 구조는 도 39에 제시되어 있다)의 탄소 번호 4에 의해 생성된 산소 상의 메틸 그룹 부재로써 설명할 수 있다. 829 하의 특정 화합물이 존재하면, orf5*이 스피라마이신 생합성에 있어 일정 역할을 한다는 가설을 실증할 수 있다. 민감한 엠. 루테우스(M. luteus) 균주 상에서 수행된 미생물학적 시험을 이용하여(실시예 15 및 도 18 참조), 균주 orf6*::Ωatthyg+에 의해 생산된 중간체 분자(메틸 그룹이 부재하는 스피라마이신, 이의 구조는 도 39에 제시되어 있다)가 위치 4에 메틸 그룹을 갖는 기원 스피라마이신 보다 훨씬 활성이 덜하다(10 인자 정도)란 사실을 입증해주었다.
실시예 28: 신규한 "절제 가능한 카세트"의 작제:
신규한 절제 가능한 카세트를 작제하였다. 이들 카세트는 실시예 9에서 이미 기재된 바와 같은 절제 가능한 카세트와 매우 유사하다. 전자 카세트와 본 실시예의 신규한 카세트 간의 주요 차이점은 후자 카세트에서는, Ω 인터포손(interposon)의 말단에 상응하는 서열(이러한 서열은 T4 파아지로부터 유래하는 전사 종결인자를 함유한다)이 부재한다는 것이다.
종결인자를 갖지 않는 카세트에서는, 특정 항생제에 대한 내성을 부여해 주는 유전자를, 절제를 허용해 주는 attR 및 attL 서열에 의해 플랭킹시킨다. 이러한 내성 유전자는 아프라마이신 내성을 부여해 주는 아세틸트랜스퍼라제를 암호화하는 aac(3)IV 유전자이다. 이러한 유전자는 Ωaac 카세트(젠뱅크 수탁 번호: X99313, Blondelet-Rouault, M.H. et al., 1997)에 존재하고, 이는 매트릭스로서, 플라스미드 pOSK1102(상기 참조)를 사용하고, 프라이머로서, 5' 위치에 HindIII 제한 부위(진하게 표시됨)(AAGCTT)를 각각 함유하는 올리고뉴클레오티드 KF42 및 KF43를 사용하여 PCR함으로써 증폭시켰다:
KF42: 5'-AAGCTTGTACGGCCCACAGAATGATGTCAC-3'
(서열 번호 153) 및
KF43: 5'-AAGCTTCGACTACCTTGGTGATCTCGCCTT-3'
(서열 번호 154).
이와 같이 하여 수득된 대략 1kb의 PCR 생성물을 이. 콜라이 벡터 pGEMT Easy 내로 클로닝하여, 플라스미드 pSPM83을 생성시킨다.
벡터 pSPM83을 HindIII 제한 효소로 분해시켰다. 이러한 삽입물의 HindIII-HindIII 단편을 0.8% 아가로스 겔로부터 정제함으로써 분리시킨 다음, 가능한 각종 절제 가능한 캇세트를 수반하는 각종 플라스미드의 attL 서열과 attR 서열 사이에 위치한 HindIII 부위 내로 클로닝하여(실시예 9 및 27 참조), Ωacc에 상응하는 HindIII 단편을 aac 유전자 단독에 상응하는 HindIII 단편으로 대체시킨다. 이로써, att1aac, att2aac 및 att3aac 카세트를 수득할 수 있었다(목적하는 상에 따름; 실시예 9 참조). attL 서열과 attR 서열에 대한 aac 유전자의 배향에 따라서, att1aac+, att1aac-, att2aac+, att2aac-, att3aac+ 및 att3aac-를 구별한다(실시예 9에서 적응된 것과 동일한 규정에 따름).
실시예 29:
orf28c
유전자에서 녹아웃을 나타내는 에스. 암보파시엔스 균주의 작제
orf28c 유전자는 절제 가능한 카세트 기술을 사용하여 불활성화시켰다. 절제 가능한 카세트 att3aac+(실시예 28 참조)를, 매트릭스로서 플라스미드 pSPM101[플라스미드 pSPM101은 att3aac+ 카세트를 EcoRV 단편으로서, pGP704Not의 독특한 EcoRV 부위 내로 클로닝시킨 벡터 pGP704Not로부터 유도된 플라스미드이다(참조: Chaveroche et al., 2000 and V.L. Miller & J.J. Mekalanos, 1988)]를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시켰다:
KF32:
5' CAACCGCTTGAGCTGCTCCATCAACTGCTGGGCCGAGGT ATCGCGCGCGCTTCGTTCGGGACGAA 3' (서열 번호 155) 및
KF33:
5' TGGGTCCCGCCGCGCGGCACGACTTCGACTCGCTCGTCT ATCTGCCTCTTCGTCCCGAAGCAACT 3' (서열 번호 156).
이들 올리고뉴클레오티드의 5' 말단에 위치한 39개 뉴클레오티드는 orf28c 유전자 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 26개 뉴클레오티드(진하게 표시되고 밑줄쳐져 있음)는 절제 가능한 카세트 att3aac+의 말단 중의 하나의 서열에 상응한다.
이로써 수득된 PCR 생성물을 사용하여, 코스미드 pSPM36을 함유하는 하이퍼-재조합 이. 콜라이 균주 DY330[이러한 균주는 이의 염색체 내로 통합된 람다 파아지의 exo, bet 및 gam 유전자를 함유하고, 이들 유전자를 42℃에서 발현시키며, 이를 이. 콜라이 균주 KS272 대신 사용하였다(참조: Chaveroche et al., 2000)]를 형질전환시킨다. 이로써, 상기 세균을 상기 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 이들 클론을 대상으로 하여 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3aac+ 카세트가 orf28c 유전자 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 코스미드를 추출하고 BamHI 제한 효소로 분해하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 코스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 코스미드는 pSPM107로 명명하였다. 이러한 코스미드는 orf28c가 att3aac+ 카세트에 의해 개입중단된 pSPM36의 유도체이다. 상기 카세트의 삽입은 orf28c에서의 결실을 수반하는데, 개입중단은 orf28c의 28번 코돈에서 시작한다. 카세트 다음에, orf28c의 마지막 137 코돈이 존재한다.
코스미드 pSPM107을 제1 단계에서 이. 콜라이 균주 DH5α 내로 도입한 다음, 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2 내로 도입하였다. 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 푸로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 푸로마이신에 민감한 클론(PuroS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3aac+ 카세트에 의해 개입중단된 orf28c 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf28c의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3aac+ 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내의 예상된 유전자 자리에 상기 카세트가 존재하는지를 확인하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf28c::att3aac+)을 보다 특별히 선별하고, 이를 SPM107로 명명하였다. 따라서, 이 클론은 유전자형: orf28c::att3aac+을 가지며 SPM107로 명명되었다. 유전자의 배향 측면에서(도 3 참조), orf28c의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf29가 orf28c와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도, 특히 플라스미드 pOSV508로의 형질전환에 의해 제거할 수 있는 가능성이 생긴다.
스피라마이신 생산에 대한 orf28c 유전자의 활동 중지 효과를 시험하기 위해, 균주 SPM107의 스피라마이신 생산을 실시예 15에 기재된 기술에 의해 시험하였다. 이로써, 상기 균주는 스피라마이신 비-생산자 표현형을 가진다는 사실을 입증할 수 있었다. 이는 orf28c 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라는 것을 입증해 준다.
실시예 30:
orf31
유전자에서 녹아웃을 나타내는 에스. 암보파시엔스 균주의 작제
orf31 유전자는 절제 가능한 카세트 기술을 사용하여 불활성화시켰다. 절제 가능한 카세트 att3aac+는, 매트릭스로서 플라스미드 pSPM101을 사용하고, 올리고뉴클레오티드 EDR71 및 EDR72를 사용하여 PCR함으로써 증폭시켰다:
EDR71:
5'CGTCATCGACGTGCGGGGAAGACAGAGGTGATACCGATG ATCGCGCGCGCTTCGTTCGGGACGAA 3'(서열 번호 157)
EDR72:
5'GCCAGCACCTCGTCCAGCTGCTCGACGGAACTCACCCCC ATCTGCCTCTTCGTCCCGAAGCAACT 3'(서열 번호 158).
이들 올리고뉴클레오티드의 5' 말단에 위치한 39개 뉴클레오티드는 orf31 유전자 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 26개 뉴클레오티드(진하게 표시되고 밑줄쳐져 있음)는 절제 가능한 카세트 att3aac+의 말단 중의 하나의 서열에 상응한다.
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 코스미드 pSPM36을 함유하는 이. 콜라이 균주 KS272를 형질전환시킨다(도 12 참조; 원칙적으로 플라스미드 pOS49.99는 코스미드 pSPM36으로 대체되어야 하고, 수득된 플라스미드는 더 이상 pSPM17이 아니지만, pSPM543이다). 이로써, 상기 세균을 이러한 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3aac+ 카세트가 orf31 유전자 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 코스미드를 추출하고 여러 제한 효소로 분해하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 코스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 코스미드는 pSPM543으로 명명하였다. 이러한 코스미드는 orf31가 att3aac+ 카세트에 의해 개입중단된 pSPM36의 유도체이다(도 12 참조). 상기 카세트의 삽입은 orf31에서의 결실을 수반하는데, 개입중단은 orf31의 36번 코돈에서 시작한다. 카세트 다음에, orf31의 마지막 33 코돈이 존재한다.
코스미드 pSPM543을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: Kieser, T et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 푸로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 푸로마이신에 민감한 클론(PuroS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3aac+ 카세트에 의해 개입중단된 orf31 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf31의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3aac+ 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내의 예상된 유전자 자리에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, PCR에 의해 수득되고 orf31 유전자의 암호화 서열의 매우 큰 부분에 상응하는 DNA 단편을 사용하여 제2 하이브리드화를 수행하였다.
당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf31::att3aac+)을 보다 특별히 선별하고, 이를 SPM543으로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3aac+ 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att3aac+ 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf31::att3aac+을 갖고 SPM543으로 명명되었다. 유전자의 배향이 주어지면(도 3 참조), orf31의 불활성화 효과를 연구하기 위해 카세트를 절제할 필요가 없다. orf32c가 orf31와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도, 특히 플라스미드 pOSV508으로의 형질전환에 의해 제거할 수 있는 가능성이 생긴다.
스피라마이신 생산에 대한 orf31 유전자의 활동 중지 효과를 시험하기 위해, 균주 SPM543의 스피라마이신 생산을 실시예 15에 기재된 기술에 의해 시험하였다. 이로써, 상기 균주는 스피라마이신 비-생산성 표현형을 가진다는 사실을 입증할 수 있었다. 이는 orf31 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라는 것을 입증해 준다.
실시예 31:
orf32c
유전자에서 녹아웃을 나타내는 에스. 암보파시엔스 균주의 작제
orf32c 유전자는 절제 가능한 카세트 기술을 사용하여 불활성화시켰다. 절제 가능한 카세트 att3aac+를, 매트릭스로서 플라스미드 pSPM101를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시켰다:
KF52:
5' GATCCGCCAGCCTCACGTCACGCCGCGCCGCCTCCCTGAC ATCGCGCGCGCTTCGTTCGGGACGAA 3' (서열 번호 159) 및
KF53:
5' GAGGCGGACGTCGGTACGCGGTGGGAGCCGGAGTTCGACA ATCTGCCTCTTCGTCCCGAAGCAACT 3' (서열 번호 160).
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개 뉴클레오티드는 orf32c 유전자 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 26개 뉴클레오티드(진하게 표시되고 밑줄쳐져 있음)는 절제 가능한 카세트 att3aac+의 말단 중의 하나의 서열에 상응한다.
이로써 수득된 PCR 생성물을 사용하여, 코스미드 pSPM36을 함유하는 하이퍼-재조합 이. 콜라이 균주 DY330(참조: Yu et al., 2000)를 형질전환시킨다. 이로써, 상기 세균을 전기천공시킴으로써 상기 PCR 생성물로 형질전환시키고, 이들 클론을 대상으로 하여 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3aac+ 카세트가 orf32c 유전자 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 코스미드를 추출하고 BamHI 제한 효소로 분해하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 코스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 코스미드는 pSPM106으로 명명하였다. 이러한 코스미드는 orf32c가 att3aac+ 카세트에 의해 개입중단된 pSPM36의 유도체이다. 상기 카세트의 삽입은 orf32c에서의 결실을 수반하는데, 개입중단은 orf32c의 112번 코돈에서 시작한다. 카세트 다음에, orf32c의 마지막 91 코돈이 존재한다.
코스미드 pSPM106을 제1 단계에서 이. 콜라이 균주 DH5α 내로 도입한 다음, 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2 내로 도입하였다. 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 푸로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 푸로마이신에 민감한 클론(PuroS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3aac+ 카세트에 의해 개입중단된 orf32c 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf32c의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3aac+ 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf32c::att3aac+)을 보다 특별히 선별하였다. 따라서, 이 클론은 유전자형: orf32c::att3aac+을 가지며 SPM106으로 명명되었다. 유전자의 배향 측면에서(도 3 참조), orf32c의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf33이 orf32c와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도, 특히 플라스미드 pOSV508로의 형질전환에 의해 제거할 수 있는 가능성이 생긴다.
스피라마이신 생산에 대한 orf32c 유전자의 활동 중지 효과를 시험하기 위해, 균주 SPM106의 스피라마이신 생산을 실시예 15에 기재된 기술에 의해 시험하였다. 이로써, 상기 균주는 스피라마이신-생산성 표현형을 가진다는 사실을 입증할 수 있었다. 이는 orf32c 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자가 아니라는 것을 입증해 준다.
본원에 기재된 작제물 목록
약어 목록: Am: 앰피실린; Hyg: 히그로마이신; Sp: 스피라마이신; Ts: 티오스트렙톤; Cm: 클로람페니콜; Kn: 카나마이신; Apra: 아프라마이신.
생물학적 물질 기탁
다음 유기체들은 부다페스트 조약의 규정에 따라서, 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes(National Collection of Cultures and Microorganisms) (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 기탁되었다.
- 균주 OSC2는 등록 번호 I-2908로 기탁되었다.
- 균주 SPM501은 등록 번호 I-2909로 기탁되었다.
- 균주 SPM502는 등록 번호 I-2910으로 기탁되었다.
- 균주 SPM507은 등록 번호 I-2911로 기탁되었다.
- 균주 SPM508은 등록 번호 I-2912로 기탁되었다.
- 균주 SPM509는 등록 번호 I-2913으로 기탁되었다.
- 균주 SPM21은 등록 번호 I-2914로 기탁되었다.
- 균주 SPM22는 등록 번호 I-2915로 기탁되었다.
- 균주 OS49.67은 등록 번호 I-2916으로 기탁되었다.
- 균주 OS49.107은 등록 번호 I-2917로 기탁되었다.
- 플라스미드 pOS44.4를 함유하는 에스케리챠 콜라이 균주 DH5α는 등록 번호 I-2918로 기탁되었다.
다음 유기체는 부다페스트 조약의 규정에 따라서, 2003년 2월 26일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes(CNCM), 25 rue du Docteur Roux, 75724 Paris Cedex 15, France]에 기탁되었다.
- 균주 SPM502 pSPM525는 등록 번호 I-2977로 기탁되었다.
다음 유기체는 부다페스트 조약의 규정에 따라서, 2003년 10월 6일자로 기탁기관[Collection Nationale de Cultures de Microorganismes(CNCM), Pasteur Institute, 25 rue du Docteur Roux, 75724 Paris Cedex 15, France]에 기탁되었다.
- 균주 OSC2/pSPM75(2)는 등록 번호 I-3101로 기탁되었다.
인용된 모든 공개 공보 및 특허는 본원에 참조문헌으로써 삽입되어 있다.
관계 서적 목록:
<110> Aventis Pharma SA;
CNRS
<120> Polypeptides involved in spiramycin biosynthesis,
nucleotide sequences encoding said polypeptides and
uses thereof
<130> Spiramycin biosynthesis (2)
<150> FR 0212489
<151> 2002-10-08
<150> FR 0302439
<151> 2003-02-27
<150> US 60/493,490
<151> 2003-08-07
<160> 161
<170> KopatentIn 1.71
<210> 1
<211> 30943
<212> DNA
<213> Streptomyces ambofaciens
<400> 1
gaattcggca attcccgggg cgccgggaaa ccggcacgcc attccgacca cggcaacggc 60
gtcggaccgg tcgtcactgc gggaaatcgc gagttctcca gacacctgca tccctcatat 120
gttcgccgta ccacgccgtg gcttttctgc cttttcttga tcttcccgag cgtacagcgg 180
gcgaactgcc gggcgacagg aacggccggt gaacgacaat caattgtgtc aagttcggag 240
attgtccacc gattctcgtc accggagacg gcgcgggatc atgcgggacc acacggcatc 300
gcaccaggtc cgcagggtcg gcgctccgac gtcccggccg gtcgcgcact ccggtgacct 360
gcacgcggag tcctgggcga gcggagaaga tttcagtacc tcgcggcgcg ggacaaccac 420
ttcgcgacga atatgtcagg tctccccgag cggtccgtgc cgccccgccc tgacccgtcc 480
gcgcccgtcc cgctccgccc cggtcgtcat ctcggccgga atttcagtcg gcagctcatt 540
gtgtcaggtt cgccttgccg acattctccg gagattccta agctctgccg gtaaccggga 600
ccggaaccac cgtgccgcgc gttcggtcca cacaccgctt ttcgaggagt ccgactgatg 660
ggtgaggccg tgacgggacc gatggagctg agcaaggacg cggacgcccg ggggctgctt 720
gagtggttcg cgtacaacag gacgcgtcat ccggtgttct gggacgagac ccgacaggcg 780
tggcaggtct tcggctacga cgactacgtg acggtgtcga acaacccgca gttcttctcc 840
tcggacttca acatggtgat gccgacgccg cccgaactgg agatgatcat cggtccgggc 900
acgatcggcg cgctggaccc gcccgcgcac ggaccgatgc gcaagctggt gagccaggcg 960
ttcacccccc gacggatcgc ccggctggag cccagggtgc gcgcgatcac cgaggagctc 1020
ctggacaagg tggggcagca ggacgtcgtc gacgccgtgg gtgacctgtc ctacgcgctg 1080
ccggtcatcg tgatcgccga actgctgggc atacccgccg gcgaccgtga cctgttccgg 1140
gagtgggtcg acaccctgct gacgaacgag ggcctggagt acccgaacct cccggacaac 1200
ttcaccgaga cgatcgcgcc cgcgctcaag gagatgaccg actacctcct gaagcagatc 1260
cacgccaagc gggacgcgcc cgccgacgac ctggtcagcg ggctggtcca ggcggagcag 1320
gacggccgcc ggctgaccga cgtcgagatc gtcaacatcg tcgcgctgct cctgacggcg 1380
gggcacgtct cctccagcac cctgctcagc aacctgttcc tggtcctgga ggagaacccg 1440
caggcgctgg aggacctgcg ggccgatcgc tccctggtgc ccggcgcgat cgaggagacg 1500
ctgcgctacc gcagcccctt caacaacatc ttccggttcg tcaaggagga caccaccgtc 1560
ctcggtccgc tcatggagaa gggccagatg gtgatcgcct ggagccagtc cgccaaccgg 1620
gacccccggc acttcccgga cccggacacc ttcgacatcc gccgctcgga cggcacccgg 1680
cacatggcct tcgggcacgg catccaccac tgcctgggtg ccgccctcgc ccgcctggag 1740
ggcaaggtca tgctcgaact cctcctggac cgggtccaag gcttccgcat cgaccacgag 1800
cacaccgtgt tctacgaggc cgaccagctc actccgaagt acctgcccgt ccgggtcgac 1860
tggaactgaa cccgagggtc tcgtcccgga gtccagggcc gtcccgagcc ggccctggac 1920
ctcacgaccg cccgataagg agcgccgcca tcgccgagaa cacagccgag ctccctgccc 1980
ggcgggtcgg caggatcaag ccgtgccggc tgatcaggct cgagcagcac atcgacccgc 2040
gcggcagcct ctccgtgatc gagtccggcg tgaccgtgga cttccccgtc cgacgcgtct 2100
actacatgca tggccagacc cagtcctctc ccccgcgcgg cctgcacgcg caccgcaccc 2160
tggaacaact cgtcatcgcc gtccacggcg ccttctccat caccctcgac gacggcttcc 2220
agcacgccac ctaccgtctg gacgaacccg gagccggact ctgcatcggc cccatggtct 2280
ggcgcgtcct gaaggacttc gaccccgaca ccgtggccct ggtcctcgcc tcgcagcact 2340
acgaggagtc cgactactac cgcgactacg acaccttcct gcatgacgca cggagcctca 2400
catgaccatc cccttcctcg acgcgggcgc cggctaccgg gagttgcgag ccgagatcga 2460
cgcggccctg cagcgggtgt ccgcctccgg ccgctatctg ctcgacgcgg aactcgcggc 2520
cttcgaggag gagttcgccg cgtactgcga caacgaccac tgtgtggcgg tgggcagtgg 2580
ctgcgacgcg ctggagctgt ccctgcgggc gctggacatc ggtcccgggg acgaggtggt 2640
ggtgcccgcg cacaccttca tcgggacctg gctggccgtg tccgctaccg gggcacggcc 2700
ggtggccgtc gacccgacgc cggacgggct ctccctcgac ccggcgctgg tggaggcggc 2760
gctcacccct cggaccagag ccctgatgcc ggtgcacctg cacgggcacc cggccgacct 2820
cgacccgcta ctggcgatcg ccggacggca cggcctggcc gtggtcgagg acgccgcgca 2880
ggcccacggc gcccgttacc ggggccgcag gatcggctcg ggccacgtgg tcgcgttcag 2940
cttctacccc ggcaagaacc tcggcgccat gggggacggc ggcgcggtgg tcacgggtga 3000
ctccggtgtg gccgagcgga tccggttgct gcgcaactgc ggctcgcggg agaagtaccg 3060
gcacgaggtg cgctcgaccc actcccggct cgacgagttc caggcggccg tgctgcgggc 3120
caaactgccg cggctcgacg cgtggaacgc ccgccgggcc ggcacggccg aacggtacgg 3180
gcgggccctg ggtccggtac cgcagatcgc cgtcccggtc accgctccct gggccgaccc 3240
ggtgtggcac ctgtacgtga tccgctgcgc ggagcgcgac gagctgcgcc gccggctgga 3300
acgagccggg gtccagaccc tgatccacta ccccgtgccc ccgcaccggt ccccggccta 3360
cgccgacgac ccggccggcg caccggcggg gacccacccg ctcagtgagc gcctggcggc 3420
gcagagcctc agccttcccc tgggaccgca cctcggggag gacgaggccc gcgccgtcgt 3480
ggcggcggtc cgggcggcgt ccgcagggct ggcggcgtac ccgacgccgg acggccagcg 3540
ttttcctcta gtgacggaga aacgatgacc gaggtcatgt cagggcgtcc cggaatgaaa 3600
gggatcatcc tcgcaggcgg cggagggacc cgcctacgcc ccttgaccgg cacgctgtcc 3660
aagcaactgc tgcccgtcta cgacaagccg atgatctact acccgctgtc cgtcctgatg 3720
ctgggcggca tccgcgagat cctcgtcgtc tcctccaccc agcacatcga gctgttccag 3780
cggctgctgg gcgacggctc ccgcctcggc ctcgacatca cctacgccga acaggccgag 3840
cccgagggca tagcgcaggc catcaccatc ggcaccgacc acatcggcga ctcaccggtc 3900
gcgctcatcc tgggcgacaa catcttccac ggccccggct tctcggccgt gctccagggc 3960
agcatccgcc acctcgacgg ctgtgtgctg ttcggctacc cggtcagcga cccgaagcgc 4020
tacggcgtcg gcgagatcga cgaccagggc gtactgctgt ccctggagga gaaaccggcc 4080
cggccccgct ccaacctcgc cgtcaccggc ctctacctct acgacaacga cgtggtcgac 4140
atcgccaaga acatccggcc ctcggcgcgc ggcgaactcg agatcacgga cgtcaacagg 4200
acctacctgg agcagaaacg cgcccggctc atcgaactgg gccacggctt cgcctggctc 4260
gacatgggca cccacgactc cctcctccag ggcggccagt acgtccagct catcgagcag 4320
cgccagggag tgcggatcgc ctgcatcgag gagatcgccc tgcgcatggg cttcatcgac 4380
gccgacaccc tccaccggct cggccgcgaa ctgggcacct ccggatacgg cgcgtacctg 4440
atggaggtgg ccacccgtgc aggcaccgaa tgagacgccg cgccggcccg cccgctccgc 4500
cggccgacgg ccgccggccc ggatcctcgt caccgggggc gccggcttca tcggctcgcg 4560
cttcgtgaac gcgctgctgg acggctccct gccggagttc ggcaaacccg aggtgagggt 4620
gctcgacgcg ctcacctacg cgggcaacct ggccaatctg gccccggtgg gcgactgtcc 4680
ccggctgcgg atcttcccgg gggacatccg cgaccgcggc gcggtcaccc aggcgatggc 4740
gggggtcgac ctggtggtgc acttcgcggc cgagtcgcac gtggaccgct cgatcgacga 4800
cgccgacgcc ttcgtgcgca ccaacgtgct gggcacccag gtcctcctcc aggaggcact 4860
ggccgtacgc cccgggctgt tcgtgcacgt ctcgacggac gaggtgtacg gctccatcga 4920
ggaggggtcc tggcccgagg agcacccgct gaaccccaac tcgccctacg ccgcctcgaa 4980
ggcgtcctcc gacctgctgg cgctggccca ccaccgcacg cacggactgc cggtgtgcgt 5040
cacccgctgc tccaacaact acgggcccta ccagtacccg gagaagatca tcccgctgtt 5100
caccagcagc ctcctcgacg gcgggaccgt cccgctctac ggggacggcg gcaaccggcg 5160
cgactggctg cacgtggacg accactgccg gggcatcgcc ctggtggccc ggggcggccg 5220
gcccggcgag gtctacaaca tcggcggcgg caccgagctg agcaacgtcg agctcacgga 5280
gcgtctgctg aaactgtgcg gagccgactg gtcggcggtg cggcgggtgc ccgaccgcaa 5340
gggccacgac cggcgctact ccgtcgacta caccaagatc gcggacgagc tgggttacgc 5400
gccgcggatc accatcgacg aagggctgga gcggaccgtg cactggtacc gggagaaccg 5460
cgcgtggtgg gcgcccgcga agagggggcg atgacggtga cgaccgcatc cgtggacccg 5520
ctcgacctgt ggctccgccg gtaccagccg tccgcgtcac ccgccgtccg gctggtgtgc 5580
ttcccgcacg cgggcggctc ggcgagttcg ttcctgccgt tcacccggca gctgccggac 5640
cggatcgagg tcgtggccgt ccagtacccc gggcgccagg accgcaggag cgaaccgctg 5700
gtcgacacca tcgagggact ggccgagccc ctggccggcc tgctggaggc gcaggccggc 5760
cccccggtgg tgctgttcgg gcacagcatg ggcgcgctgg tggcctacga ggtcgcccgc 5820
gcgctccagc ggcggggagc ggctccggtg cgcctggtgg tctccgggcg ccgggccccc 5880
gccgtcgacc ggccgatgac cgtgcacctc tacgacgacg accggctggt cgaggaactc 5940
cgcaagctcg acggcaccga cagccaggtg ttcgccgatc cggagctgct ccggctggtg 6000
ctgcccgtga tccgcaacga ctaccgggcc gtggcggcct acgcccaccg cccgggggcg 6060
ccgctggact gccccctcac cgtgttcacc ggcgccgacg accccaccgt gaccgcggcc 6120
gaggcggcgg cctggcacga ggcggcggcg tccgacgtcg agacgcgcac cttccccggt 6180
ggccacttct tcccgtacca gcggaccgcg gaggtgtgcg gggccctggt cgacacgctc 6240
gagccgctgc tgtcggccgg gacgcgcggt gtccggcggg tccgcccggg gtgacgtggg 6300
cacggtcgag tacgccgtcc accggcgtac cgcggaacgg gtgagggtct ccgccgacac 6360
cctggacagc ccggtcaccg cgctggcgga ggtgccccgc tggctggagg aataccaccg 6420
ggcgcaccgc ttccacgtcg agccgatccc cttcgaccgg ctccggcggt ggtccttcga 6480
gccgggcacc ggcgacctgc ggcacgagac gggccgcttc ttctccgtgg aggggctgcg 6540
caccagctcg gacgccgatc cggtcgcccg tgtccagccg atcatcgtgc agcccgaggt 6600
ggggctgctc ggcatcctgg cccgggagtt cgacggggtg ctgcacttcc tgatgcaggc 6660
caaacccgag cccggcaacg tcaacgggct gcagatctcc cccacggtgc aggccacgcg 6720
cagcaacttc gacgaggtgc accacggccg gtccaccccg ttcctcgacc acttcatcca 6780
ccgccccggc cgccgggtcc tgatcgacag catccagtcc gaacagggcg actggttcct 6840
gcacaagcgc aaccgcaaca tggtcgtcga gatcgacacc gacatcgagg ccgacgccgc 6900
gttccgctgg ctgaccctcg ggcagatccg ccggctgatg ctccaggacg acctcgtcaa 6960
catggacacc cgcagtgtgc tggcctgtct gcccaccgcg cacggcacgc ccgacgacgg 7020
tgacgactcc ttcccggcgg cgctgcgccg ctccctctac ggggagaccg cgccgttgca 7080
cgatctgcac gccatcacca gctgcctcac cgacgtccgg gcgctgcggg tgctgcgcca 7140
gcagagcgtg ccgctcgacg acgcccggcg ggacggctgg gagcggaccg ggagcgcgat 7200
ccggcatcgc agcggcaggc atttcgagat catggcggtg gaggtgaccg cggagcgccg 7260
tgaagtggcc tcgtggaccc agccgttgct gcgcccgtgc tcgcagggac tggcggccct 7320
gatcacccgg cggatcaacg gggtgctgca cgccctggtg gcggcgcggt cggaggtcgg 7380
cacgctcaac gtcgccgagt tcggaccgac cgtccagtgc cggcccgacg aggcggacgg 7440
ccagtcgccc ccgtacctgg accgggtgct gacggccgga gccgaccgcg tccgctacga 7500
cgtggtgcag tcggaggagg gcgggcgctt ctaccacgcg cgcaaccgct atctggtggt 7560
cgaggcgggg ccggagctcg acacgggctg cccgcccggc ttctgctggg ctaccttcgg 7620
ccagctcacc gaactgctcg cgcacggcaa ctatctcaac gtcgaactcc gcaccctcat 7680
ggcgtgcgca cacgcctcct actgaatggt cacgaaagct gcaccgcgcg ggagaatcgg 7740
cagcgcgcca ccggccggcc ggcacccgga aggtaaagcg ccgttctccc gcatcggcgc 7800
cctgcgggaa acggcggaac ggccggcccg gaccgcgcgc aattcccggc gggacacggt 7860
gggagcccgc acgaggaacc gctttccccg ccttcggtgc gcccggccgc gggaccaccc 7920
ccgcctcccg gccgggccgc ggaatacgac gggggcggcc gaggacattc ctttcccgcc 7980
tccggaaaag cgcgccccga gggcccccga atgccgggcg ggacggacgg cgactgcgcg 8040
cggacggcgg cccggcgtcg aacgcacctg cccgagtccg gacgagacag cgcgacgcga 8100
gaggcgaaaa tgatcaatct cttccagccc cagatggggg ccgaggaact ggcggcggtg 8160
tccgaggtct tcgacgacca atggctcggt cacggacccc ggaccgcggc gttcgagtcc 8220
gcgttcgccg agcacctcgg ggtcggcccc gagcacgtcg tcttcctcaa ctcgggcacc 8280
gccggcctct tcctggccct ggagtcgctc ggcctgcggc ccggcgacga ggtcgtgctc 8340
ccctcgccca gcttcctcgc cgcggcgaac gccgtacagc tctcgggagc gcgcccggtg 8400
ttctgcgaca ccgacccgcg gacgctgaac cccgccctgg agcacatcga ggcggccgtc 8460
accccgcgca ccagggccgt catcgcgctc cactacggcg gccaccccgg cgacatcgtg 8520
cgcatcgccg agcgctgccg ggagcggggc atcaccctga tcgaggacgc cgcgtgctcc 8580
gtggcctccc gcgtcgacgg ccgaccggtc ggcaccttcg gcgacctcgc catgtggagc 8640
ttcgacgcca tgaaggtcct ggtcaccggc gacggaggga tgatctacgt caaggacccc 8700
ggggcggccg cccggatccg gcgcctcgcc taccacggcc tcacgcggtc cagcggcctg 8760
ggatacgcca gggtctcggc gcgctggtgg gagatggacg tccccgaacc gggccgccgc 8820
gtcatcggga acgacctcac cgcggccatc ggcgcggtcc agttgcgccg gcttcccggc 8880
ttcgtggccc gccgcaggga gatcgtcgcc ctgtacgaca gcgaactgag ctcgctggag 8940
ggcgtgctga caccgcccgc gccacccgcg gggcacgagt ccacgcacta cttctactgg 9000
atccagctgg cccccggcgt ccgggaccgg gtggcacgcg acctgctcac cgacggcatc 9060
tacaccacct tccgctacgc acctctgcac aaggtgcccg cctacggcca caccggaggc 9120
gaactgcccg gcgtggagcg ggcgtccgaa cggaccctgt gcctgcccct gcaccccggc 9180
ctgtcggacg ccgacgtccg caccgtcgtg tcctccctgc gcagagccct gagcgccgcg 9240
gatccggccc ccgcctgacg cgcgcacgcg ccacggcccc tgtcccggcg gtgaccgccg 9300
ggacaggggc cgtggcgcgt cctgcggacg gtccgggcca ccccgccgtc ccgtcggtgc 9360
gtcagcgacg cgtgccgagg aagaagcccg gtgagccctc gcccgtcacg acgtactcga 9420
cgtccaggcc ggccttgcgg tacgcggcct cgtactccgc acgcgagaac agcgtgaggt 9480
agtccacctc gctgcggtgc cggatgccct ccgcggtgtg cgcgatcagg tagtggatct 9540
ccatccgggt ccgcccgccc tcccgggtcg agtgggagac acgggcgacg ccctggtcgc 9600
ccggtgccgt ccgcagggcg tgggtggaga cgtggccgtc caggaaggtg tcggggaagt 9660
accacggttc gacggccagg acaccgtccg cggtcaggtg ccgcgccatg gcggcgacgg 9720
cgtcctccag gtcggccgtg gtctccaggt acccgatcga gctgaacatg cagaccacgg 9780
cgtcgaacgt ctcgccgagg tcgaacgccc gcatgtcacc gcggtggagg gtgacgccgg 9840
ggagccgctc ctcggcgcgg gccgccatcc actcggacag ctccaggccg ctcacgcggt 9900
cgtagagctt ggcgaaggcc tccaggtggg taccggtgcc gcacgcgatg tcgagcaggc 9960
tggccgcgtc cggcgtacgt tcccggatca ggtcggtgac ccgggcggcc tcacccgcgt 10020
agtccttgcg gtcctggtag agcaggtcgt agacctcggc ggcactgtcg ttctcgtaca 10080
tgggaatcct ccgggccgtg aagggggaac cgtgggtctg tcgaagagga gtgcgccgtg 10140
cgctcggggc gggggcggcc tgccgccggc ccctcgcgat gatctccgta cggacaccca 10200
acagttcacg ccgagccggg gtcaaggaac gacggggtgg tcagtcaagt cgggcgctcc 10260
gcccccgggg cggggcgcgc cggcgacgcg cacggattcg gccaaccggt tgctcgttcc 10320
gccggaaatc acggtgtggc ccccgggcca ccgggtagct tatgcctcgt tcaccgcagc 10380
ggttgaagag gcagccttca accccggccc ggcctttatg gaattcattt ccaccgtgcc 10440
gcaacaccca ctgaaggacg gccggatatc ggccatgaag ccccggcctt tcagccaggc 10500
accctctctt gtcgaataga gtatgtcctc cgctgaagcc gccgaagacg gacgaagggg 10560
acgaacggtc acctcggtcg atctagacgg aatccttgaa agcgtaatag cctgtcaatg 10620
ctttggtaaa gcacagggat gggggtgcct gcgggatgag tgacctgggt tctggtgaag 10680
aagggtccga agaagacgag tcggacgacg cactcgcctt cctcgagttc atcgcccggt 10740
cggcaccacg gagcgaatac gaccggctca tggcccgcgc cgaacgctcg ggcgccgacg 10800
aggaccggat gcgccgactg gagcgcttca accggctcgc cctcaccgcg cagtcgatga 10860
tcgagtaccg ccgcgaccgg gaggcggagc tcgcggccct ggtcgacgcc gcgcacgagt 10920
tcgtcgccgc ccggcggggc aaggacctgc tggagtccat cgcccgcaga gcacggctgc 10980
tgctgaagct ggacgtctcc tacgtcggcc tgcacgagga ggaccggccc ggcacggtgg 11040
tgctgagcgc cgacggcaac gcggtcaagg tcgccgagag ctaccggctg ccggccgacg 11100
gcggactggg cgccatggtg cgcacctgcc gcgctccctt ctggaccccg gactacctcg 11160
gggacaacag cttcacgcac gtcgaggccg tcgacgacat cgtccgcgcc gaaggcctgc 11220
gcgcggtcct ggccgtcccg ctgtgcgccg ggggcgaacc gatgggggtc ctctacgtcg 11280
ccgaccgtca ggtgcggcat ctgaccccca acgaggtcac cctgctgtgc tcgctcgccg 11340
atctggccgc ggtggcgatc gagcgcaacc ggctggtcga ggagctccac gacaccatcg 11400
ggcaactgcg ccaggacatc ggcgaggccc gcaccgccct cgcgcgcacc cgcaggtccg 11460
ccgacctcca gtcgcacctg gtcacgcagg tgatggacag gcgcggcgcc gactcgttac 11520
tcgcgacggc cgccgaggcg ctcggcggcg gagccggcct gtgcagcccg ctcgggcgcc 11580
cgctcgccga gtacgggacc ctgcgccccg tcgcccccac ggaactgcgc gcggcgtgcc 11640
gccgggccgc cgagaccggc cggcccacct ccgtggcccc gggggtctgg acggtgcccc 11700
tgcttcccgg gggcaacgcc ggcttcctgc tgaccgacct cggtccggac gcggaccaca 11760
ccgccgtccc cctgctcccg atggtcgccc gcaccctcgc gctgcacctg cgcgtccagc 11820
acgacgactc ccccaaggcg cagagccacc aggagttctt cgacgacctg atcggggcgc 11880
cccgctcacc cacgctcctc agggaacgcg ccctgatgtt ctccctcagc ttccgccgcc 11940
cgcacgtggt gctggtggcg gacggacccc gcgggacctc gccgcggctg gaggcctccg 12000
gcgccgacta cgcgaaggag ctcggcgggc tgtgcagcgt gcgggacggc gccgtcgtcc 12060
tgctgctgcc cggcgacgac cccgtcgccg tggcgcagac cgccgccccg gagctgaccg 12120
accgcgccgg gcaccccgtc accgtggggg tcgcgggccc cgcctcgacc gtcgacggca 12180
tcgccgacgc gcaccgtgag gccgcgaagt gtctggagac cctccgcgcg ctcggcggcg 12240
acggcggcac cgcgtgcgcc tccgacctgg gtttcctcgg catgctcctc gccgaggaga 12300
acgacgtccc cggttacatc aggacgacga tcggccccgt ggtcgactac gacacccacc 12360
gcttcacgga tctggttccc actctgaggg tgtacctgga gtcgggcagg agccccacgc 12420
gtgccgcaga gacactgcgc gtgcacccga acaccgtctc acggcggctg gagcgcatcg 12480
gcgtactgct gggagaggac tggcagtcac cggagcgggt gctggacata caactggccc 12540
tgcggctcta tcaggtgcgc tcggcgctct cctcgcaacc ggcgtccgag acccgggccg 12600
tgctcggatc gctgcgcgag tgacctctcc ggcacgggcg gcgccccgcc cgtcggcgcg 12660
gatcgcgccg acaggcgggc gttgaccacc ggccaccggt cccccgtacg acgaggtccc 12720
gggcccgcgt ggttcagccg gcgctgaact cggcgatgcg cccgtctccc atggtcagcc 12780
gggcgccggt gaaccgggac cgcatccgac ggtcgtgggt gacgaccacg acggcgccgc 12840
ggtagtccgc gagtgcctgc tccaactcct ccaccagcac cggggtgagg tggttggtgg 12900
gctcgtccag cagcagcagg tccatcgggt cgctcaccag ccgggcgatc tcgatccggc 12960
ggcgctgccc gtaggacaga tccttcacgc gtcgccgcag gtcggacggg ctgaacaggc 13020
cgagcgacag cagtttctcc gcgtggtcct ccaggtagcc ctcccggccc tgggcgaagg 13080
cccgcagcac ggtcagtccg ggcgcccagg gcgtctcgtc ctgccgcaga tgaccgaccc 13140
ggcagccgac gcgcaccgag ccgccgtccg gctccagttc cccggacagc acccgcaaca 13200
aggtggactt gcccgcaccg ttgggacctg tgacgagcag ccgttcgccg ggccggatcg 13260
tcagggagtc cacggcgagc cgacccgcga cgcgcacgtc ggtgagttcg gccaccgcct 13320
cctccgcctc cgggcccgcg gtgtcgatgc gggcggcgaa ggacaacggg tcggcgggag 13380
cgtggaccgg gttctcggtc agctgcgcca cgcgttgctt cgcgttgcgg atccgcacca 13440
tcgcgccgtg gtcgcgccct cgcctgcggt aggcgccgtg gccgaacacg gagagggaca 13500
tcttgcgcgg gatgccgtcc atccgcgcca cgttggaggt gatcagcccg cggttgcggt 13560
cgagttcggc acgccactcc tcgtactccc gcagccgccg ctcgcgttcc acggccttgg 13620
ccgtcaggta gccctcgtag ccgttgccgt agcgggtgac gctgccggag tcgacctcca 13680
ggatcgtggt ggtgagccgg tcgaggaaga cccggtcgtg ggtgaccgcg atcaccgtgc 13740
cgcggtggcc ggccaggtgg tcctccagcc attccatcgc ccggtcgtcg aggtcgttgg 13800
tcggttcgtc caggagcagc agctccggcg acgaggcgag ggtcgcggcg agcgcgaggc 13860
gggagcgttc gccaccggag agggttccga gcttgcggtc gcggtccagg ctcggcagtc 13920
cgaggccgtg cagcgcgacc tccacgcgca cgtcggcctc gtagccgcca cgcgcctggt 13980
actgctcgac cagagcggcg tagcgctgga ggccggcgga cagctcgcgc tcggagccgt 14040
tctcgtcgct ctcgcccagc tccgcctcgg cctcgcgcat cgccgcttcg agctcgcgca 14100
ggtcggacag ggccaggtcg acggcgtcct ggacggtggc gtcgaggggc agttccagtg 14160
tctgcgccag gtagccgacg ccgccgggag cgaccacggt gagcgcgccg ttgtcgggct 14220
ccacgcggcc ggcgaggatc ttgagcagcg tggacttgcc ggaaccgttg tcgccgatca 14280
cgccgacctt ctcgcccggc ttgatgctga aaccgacccg gtcgagcacg acacagtcgt 14340
ggtagcgctt cgtgatgtcg tgtagggcgt attgcgcaat cgacacgcgt aagtctcctg 14400
tttccacgat gaggatgagt ggatgcgtga gcgcgctcgc agaaagaacg gaaagcagaa 14460
gggacgccac cactgcggac atggccggtc agggggtgtc acgagcacgc tgctggatgc 14520
ggcaggcgga gtcagctcaa cgccgggcat cctcatctat cacagagatc ccatgcgaag 14580
aactatagcc gtgctacccg gtgccgcgca acggtatgcg tgtcgcaccg gccgacgtga 14640
tgcagtcgga ccgggatgat cgcttgtccg gcggccggat gcctagcctc gggagcaacc 14700
acagcggtct ttcacgagag gggtcgacca tgggcgatct caggaaccgc atcaccgagc 14760
tggtccgcgc gtaccaccgg gaacaggcgc ccgggggctt cgttcccggg acgacgcacg 14820
taccggtctc cggcgcggtg ctgagcgagg aggaccggct ggcgctggtg gagacggcgc 14880
tggagatgcg gatcgcggcc ggcccggcct cccggggctt cgagcggcag ttcgcccggt 14940
acctcgggct ccggaaggcg cacctgacca actccggttc ctccgccaac ctcctcgccc 15000
tcggcgcgct cacctcgccg cagctggagg agagacggct gcgtccgggg gacgaggtcg 15060
tcacggtcgc cgccgggttc cccacgacgg tcaacccgat cttccacaac gggctggtgc 15120
ccgtcttcgt ggacgtcgag ctcggcacgt acaacacgac gcccgagcgc atcgagcggg 15180
ccatcggccc ccggaccagg gcgatcatga tcgcgcacgc cctgggcaac cccttcgagg 15240
ccgaagaggt ggcccgcctc gcggacgagc gggagctgtt cctcatcgag gacaactgcg 15300
acgcggtggg gtcccgctac cggggcaggc tcaccggctc cttcggcgac ctgtcgaccg 15360
tcagcttcta tcccgcgcac cacatcgcga tgggtgaggg gggctgcgtg ctcaccgaca 15420
acctggccct ggcgcggatc gtggaatcac tgcgcgactg ggggcgcgac tgctggtgcg 15480
agccgggtga ggacaaccgc tgcctcaagc ggttcgacca gaagatgggt gacctgccgc 15540
ccgggtacga ccacaagtac atcttctcgc acgtcggtta caacctgaag tcgaccgacc 15600
tgcaggcggc cctcgggctg tcccagctga cccggatcga ggagttcacc gaggccaggc 15660
gcgccaactg gcggcatctg cgcgccgcgt tggacgggct gcccggtctg ctgctgcctc 15720
atgccacacc gggcagcgat ccgagctggt tcgggttcct catcaccgtg gacccggacg 15780
ccgcgtacag cagggcggcc ctggtcgacc acctggaatc gcgccggatc agcacccgcc 15840
gcctgttcgg gggcaacctc gtgcggcacc ccgcctacac cgaccgtcgg taccgggtgt 15900
ccggctccct ggagaacagc gacctgatca ccgaccagac gttctggatc ggggtcttcc 15960
ccggcatcac cccggagatg atcgcctacg tcggcgacac gatccgggag tgcgtgctca 16020
agcactcctg aggggcggcg gtacgggggt gcgcgtggag gggaggaccg gggcggtcct 16080
cctccggggc gtcacggccg cggaagcgtc cgaagctccg aggcgaggtc ggggtggacc 16140
cgcgcggtga gcagggtgcc ctccggcgtg tgctcggtgc tgagcacctc gccctcgtcg 16200
tgcacccgcg ccaccaggct cccctcgtcg taggggatca cgacctccac ctccacctcg 16260
gggtgcggca gcaggcggtc gatcagttcc cgcagctcgt cgatgccccg acccgaacgg 16320
gcggacacga cgatcgcgtc cggctcctgc tccagcagac gggcgaggac gtccgggtcc 16380
gcgacatcgg ccttgttgac gaccacgacc tcggtggact cgccggcgcc cacgtcccgc 16440
agcacctcgc gcaccgaggc cagctgcgcg ccggggtccg ggtgcgaacc gtcgaccacg 16500
tgcagcacca gatgcgcgtc cgcgacctct tcgatcgtgg aacggaacgc ctccaccagg 16560
tggtgcggga ggtggcgtac gaagcccacg gtgtcggcga tggtgtaggg gcgcccgctc 16620
ggcgtcgtcg cccgccgcac ggtcgtgtcc agggtggcga acagggcgtt ctccaccagc 16680
acgccggctc cggtgaggcg gttgagcagc gatgacttgc cggcgttggt gtagccggcg 16740
agggcgaccg acagcacctt gttgcgccgt cgctcctccc ggttcacgtc ccggccggtc 16800
ttcagctgct ccagctcccg gcggagcctg gccatcttgt cgttgatccg ccgccggtcc 16860
gtctcgatct tcgtctcacc gggaccgcgc gtggccatgc caccgccgcc accgccgccc 16920
atctgccggg acagcgactg gccccagccg cgcagccgcg gcagcatgta ctgcatctgc 16980
gccagcgcca cctgcgcctt gccctcccgg gactgggcgt gctgcgcgaa gatgtccagg 17040
atcagggccg tgcggtccac gaccttgacc ccgacgacct cctccaggtg catcagctga 17100
ctggggctca gttccccgtc gcacaccacg gtgtcggcgc cggtctcctc gacgatgtcg 17160
cgcagctgcg acgccttgcc cgagccgatg tacgtcgccg ggtccggctt ctgccggcgc 17220
tgcacgacgc cgtccagcac gagggcgccc gcggtctcgg cgagcgccgc cagctcggcg 17280
agcgaactgt cggcctccgc ggccgttccc gaggtccaga tgccgacgag caccacccgc 17340
tcgagtcgca gctggcggta ctcgacctcg gagacgtcgg tcagttcggt ggagagcccc 17400
gcgacgcggc ggagggaggc ccggtcctcg cggtctaact gatcgccgtc ccattcctcg 17460
gcgtcggcgc cggccatcgt gtcgtccatc agtgcgtcgg ctcgctgcgt gccggcgaag 17520
tcctcgggat gcgtcaaagt acttccaatc tggggggttc gagagcgttc cggggcgggg 17580
cgcgtccggc ctgcggggcc gggcgcgggg ccggggggtc ggggccgacg tgtccgcacc 17640
tcgccgtcgg gggccggtgc cgtggaggtc gctgccggaa ctcacatgcc gtccacccta 17700
gccatgtcgc cggggtgtgc aaggacgtat cggcgatcac ctccccagct gacagagtgt 17760
gcaccgggta ctgcgcccgc gggcgtgaag cgggcgagtg tggatgtcat gcgagtactc 17820
attatcgggg gttcacagtt cgtgggccgg gccttcgccg ccgaggcact ggccgcgggg 17880
caccgggtca ccacgttcaa ccggggtgtc agcggcaccg acctgcccgg cgtcgaggcg 17940
gtcaggggcg accgcgaggt ggccggcgac ctggagcggc tggtgtccgg aaggcactgg 18000
gacgcggtcg tggacacctg cggttacgtg ccccgcacgg tgggggcctc ggccgcggcg 18060
ctgtccgggc acgcggacac ctacctctac gtctccagca tcgcctgcct gcccgactgg 18120
gcgcaggcgg tccgtccggt ggacgacgac tcacctgccc acgactgccc gccggacgcc 18180
ggaccggacc acgccgacgg tgactacggc gtcctgaagg ccggctgcga gcgcgccgtg 18240
gaccggcact tcgcgggccg gaccctgcac ctgcgggccg gtgtcatcct cgggccgcac 18300
gacaccatgc gcatgctcga cgcctggctg tggcgcatgc gcgtcgccga gggggagcac 18360
cgccgggtgc tcgccccggg caaccccgag gtgggcatgc gcctgatcga cgtacgcgat 18420
gtcgccgtct tcggcctcga ctgcctcgcg gacggccgta ccggcgcctt catcgtcaac 18480
ccgccggaga agaacaccac cttcggggag ttgctcacgg agtgcgtcaa ggccaccggt 18540
tcggccgcgg agccggtgtg ggtcgacgag gggttcctcg ccgagcacgg cgtgagtccg 18600
tggacggacc tgccgatgtg ggtgcccgac accgcgcggg acaccctcgt gtgggcggcc 18660
ggagcaccgc gcgcccgggc cgcgggtctg gcctgccggc ccttctccga caccgtgcgg 18720
gacgcctggg aggtcgtccg ggaccggccc gtcccggaac tgccgctcgc ggccggctgc 18780
ggcctgtccc tgagccggga gaaggagctg ctcgccgcct gggacgctcg cggcggtgcg 18840
gcggcgggct gacgcggccc ccgaggagtg cgacgccgtt tcccgctcgc ggggagcggc 18900
gctcgcgtgt ccgccccgcg gcccggcggc gcgtcctgtg tcccggcgcc cggggcgcgg 18960
ctacacggtg aaggtctcgg cgcgggccac gatctcgtcg accagccccg cctggcgcag 19020
cgcggcgtac gactcggcgg agacgtcctc ggcccggatc accgcacggc ggaagaccga 19080
caggatgttc acgaagtgcc ggtccacggg caggacgcgc tcctcccggt ggtcctggcg 19140
ggacagccgc agtacggggt ggtggctgtc cggggtcgtg aagacgtggc tcagggcgag 19200
cgagccggtg ctgccgtgca gctcgtacgc cgagcggtag ccgtgttcca tgccgaaggc 19260
gaggtgggcg gccacgccct ggggggcggc gagcaggacg ctgccggaga ccacgacgcc 19320
ccggcggcgg tcacggcgca gcacggcgcc ggtcaggcgc agttcgggtc cgaggaagtg 19380
cagcgcggcc cgcagcgggt agacgccgtt gtcgagcagt gcgccgccgc cgatgtcggg 19440
tcggtagcgc atgtcgtcgt cggcgcgcgg cgggatggtg aaggcggcgg agaaggtgcg 19500
cagctctccg atggcaccgg cctccaacag ggctttgacg gtggcgtgtt gagagtggtg 19560
gaggaacatg aagttctcca tcagtaccag tccgcgctcc cgggccatgg cgaacaggcg 19620
ggccgcgtcg gcgtggttgg cggcggcggg cttctccacg aggacgtgtt tgcccgcccg 19680
cagcgccgcc gcggcccatt cggcgtgcag catgctgggc accgcgatgt agacggcgtc 19740
cacgtcgggg cgttccagca gggcctcgta gggcgcgacc gcctcgcagt cgaagtgcct 19800
gcccagggcc ttggcccggt ccgcgtcgcg gctgccgacg caggtcagca cggtgccggg 19860
ggtggagagc agggcgggca gggtgcgacg gcccgcgatg tcgccgcagc cgatcgctcc 19920
gaagcgcagc accggggacg cttccggccg cggcgggccg ggtgcggcga acggttcagc 19980
agaagtaccc agggcggtca tggatggttc cgtcaatcgg tccggatggt cacggcacag 20040
cgtggtgaac ggccggcgca cacccacgag tcgcttccgg caatgggcgg ccctgaagct 20100
acccggcggc ccgacgcgac ggcaaggccg atctgacaca gtgccgcgcc gagggaccgt 20160
cggtgccccg cgtacccgct gacctgacac tacgccgacc aatctgtgga cggggcggtg 20220
gccgcccggg ttaggtgagc gcggcgcccg cggtgaccgc gacgccggtc cgaagcggcc 20280
ctcggggcac gccgttggag agaggagacg cgggtgacgg acgcgatcac gaccgagctg 20340
gccgaccgcg aactggggcg cagactgcac cggatacgcg gcgtccactg gtatttcggc 20400
aaccacggtg acccgtacgc cctcatcctg cgcggtcaga ccgacgaccc gtcggtgtac 20460
gaggagcggg tccgcgaggg cgggccgctg ttccgcagcc gtaccgggac ctgggtgacc 20520
gcggacccgg aggtggccgc ggccgtgctg ggcgactcgc gcttcggtgc gctggaccgc 20580
gccggacggc gcccggagga gtacctccag ccgtcgcccg ccacgtacct ggggctggac 20640
cgcgccgcgt acgcgcgtct gcggcgggtg gccgagcccg tgctgggcgc ggacgccgcc 20700
gccgcgtggc gccggctcgg cgaggacgtc gggcgccggc tgctcgccgg ccgcggttcc 20760
ggcctcgacc tgacggcgga cttcgcccgc cggctgccgg cattggtcct ggccgcgtgg 20820
ctcggggtgc cgggcgaacg gtgcgacgag tgggaggagt cgctgcgggc ggcggggccg 20880
ctgctggacg gtctgctgtg tccgcagacg ctggcggcca cccgtgcggc ggactcggcc 20940
gccgaggggc tgcgcgcgct gttggacgag gtggtcgccg cgcgtcccgg cgggtccggc 21000
gagggtgcgg tggcccgcat ggtcggcgcc ggagccgccc ccgacgacgc ggtggccgcc 21060
gccgtgtgcc tggcgctctc ggccgtcgaa ccgacgacga ccctggtgtg cgaagcggtc 21120
cggctgctgc tcgaccgacc cgagtggtgg cggcggttgt gcgactcccc cgctctggcg 21180
ccggccgcgg tccggcacac cctgcggcac gcgcccccgg tgcggctgga gagccgggtg 21240
gcccacgagg acgtgacggt ggcggatcgt ccgctgcccg ccgggagcca cgtggtggtg 21300
ctcgtgggcg cggcacggcg cgcgggcgcc ccggccgcgg agccggcgga cctggcgggc 21360
gcaccggcgg cggagctgcc ggacgacctg tggttcgcgc tgtccgggga gttcgtcggc 21420
cgtgccgccg agaccgcgct gggcgtgctg gccgaggccg ccccgggact gcggcgggac 21480
ggcgacatcg tccggcggcg ccgttccccg gtcctcggca ggtacgcgcg gttccccgtc 21540
gcgtactcct gacgggcccg cggccggcgt cccctcagtc ccccacgacg tttcatgaaa 21600
ggagtgccgt gcgcgtcctg gtgacctcca tcccgcacca cacgcactac taccacctgg 21660
taccgctgat ctgggctctg cgtgcctcgg ggcacgaggt ggtggcggcc ggccagccgt 21720
cgctggtcga cgccatcacc gccagcggca tcccggcgtt cgccctggcc gaggaggagt 21780
cgctggcgca gatcttcgag gaggtcgagg gcgatctcca gccgtatcag cacggcatcg 21840
acgagttcga cttcttcggc accctgaagg acgagctgga ctgggagaag ctgctcgccc 21900
agcaggtgat cctgtccggc ctgtggctgg aaccgctcaa cggcgccacg accctcgaca 21960
gcatcgtcga cttcgcccgg gcctggaagc ccgacctggt gctgtgggag ccgttcacct 22020
atgcggggcc ggtggcggcc cgggcgtgcg gggccgcgca cgcccgcgtc ctgtgggggc 22080
cggacacgat cgggctgctg cggacgaagt tccttcaggc ccaggcgcgt cagcccgagg 22140
agcaccggga cgacccggtc gcggagtgga tgacctgggc cctggcgcgc tacgggtgcg 22200
acttccggga ggaggacgtg ctcggtcagt ggagcgtgga cccgatggcg gagggcgtca 22260
gtctgggcct cgacctgccg accgtcccga tgcgctacac cccgtacaac gggtcggcgg 22320
tgatccccga ctggctgacc gaggaaccga aacggcctcg ggtctgcctg accctggggg 22380
tgtcctcgcg ggagcacagt gaggacgagg tcccggtgca gaggtttatc gaggcgctgg 22440
ccgatctcga catcgagctg gtggcgaccc tggacgacgc ccagcgggac ctgctgccga 22500
ggatcccgga caacacgcgc atcgtcgact tcgtgcccat ggacgcgttg ctgccgacgt 22560
gctcggcgat catcaaccac agcggttcgg gcacgtgcaa caccgccgcg ctgcacgggg 22620
tgccgcagat catcctcggc ggcatcctgg acgccgccgt acggcagcac atgttcgcgc 22680
agaactccgc cgccctcacc ttcgctccgg aggaggtgac cggcgcgtcg ctgaggagcg 22740
cgctggtgcg cctgctcgag gagccgcggt tccgcgacgg cgcgcggcgg ctgaaggagc 22800
ggatgcgggc catgcccagc ccggccggga tcgtgccgac cctggagcgc ctcacggccc 22860
agcaccgccg ggcgtgttga accggcgcgc gggcccgtgc cggcggtgac cgcccgaccc 22920
gactctcgcg tgtgatcgat ctcgtcgact cagccgtgga ccggttcgcc tgtccgcgcc 22980
cgacactgga gtgctgatgc gggccctctt cacgaccgcg ccgctcgcgg gccacctgct 23040
tccgctggtg cccatcgcgt gggccctgcg ggcggccggc cacgaggtac tggtggcgac 23100
ccgggaggac ttcgtgccgg tcgccctgcg gtcggggctg ccgtccgcct cgtgcgggcc 23160
gcccgccgcg gacctggcgg gcgcggccga ggcgggggcg ctcgcgcggc cccgcggagc 23220
ggcggaggct cggggggtcc tgagcggggc gctggcgcgc gtcgcccggg gcagtctggc 23280
gggggtgcgg cggctggcgg acgcctggcg gccggatctg atcgtcagcg aacgggccga 23340
gttcgccggg ccgctggtcg cggcggccct cggggtcccg tgggtccgct accactggtc 23400
ggtctcgtcc ctggaggagt accggcgagc ggccgaggcc gagttcgcgc ccgagctggc 23460
ggcgctcggc ctcgaccggt tcccggaggc ggcgcgcgtg ctcgatccgt ggccggtgtc 23520
gctgcgccgg ccggacgcgg tcgcccacga cggggtccgg cacgtaccgg cccacgggga 23580
cgcccccgtc cccgactggg cgttcacgcg cggtcgcggg ccgcggatct gcgtgacgct 23640
cggcaccatg ctgccccggt acggcgccgc cgggatggcc gacttcctga cggagctggt 23700
ggcggagacc cgcggagggg actgcgaact gctcgtggcg gtcgacgacg acgtcgtcgc 23760
gcggtggccg tcgctgccct ccgcggtgcg gtacgccggc cggctgccgc tggcggaggt 23820
gctgcccgcg tgcgacgcgg tggtgcacca cggcgggcag ggcacgtccc tgaccgcgct 23880
ggccgcgggt cggccgcagg tcgtcatggc gcggctcgac gaccagttcg acaacgcgcg 23940
ggcactggcg gcggcggggg cggccctgct cgtaccgccg tcccgggcca ctcccgcggc 24000
cgtggccgcg gggtgcgccg aagtgctgga gaacgccctg tatgccaagg cggcagccgg 24060
gctcgccgag gagatggcgc tgctgccgtc gccgtcggcg gcggtcggac tcctggaaca 24120
cccggggccc gggccggaca tgccgcggag ttacccgaac gaggatgcgg tgtgacgtga 24180
atctggaagt actcaaccgt tcgaacgatc cgcgcgggcc ggtgatcacg gtggtcggcg 24240
cgtccggctt catcgggtcc gccctggtcg ccgagctggc gcgcatgccg gtgcggctgc 24300
gggcggtggc ccggcgcgag acccccgttc ccgcgggggc acgggccgcc gtcgaggtcc 24360
gccgggcgga cctcgcccgg ccggacgagg tcggggccgc cgtcgagggg gcggacgccg 24420
tcgtgcacct cgccgcccac atcggcggcg cgcggtcgtg gcgcgcggcc gacgagcggt 24480
cgctgcgggt gaacgtcggt ctgctgcgcg acgtggccga cgcgttccgg gaccgctcgg 24540
ggcccgcccc ggccgtggtc ctggccagta ccctccaggc cggcgtcgag ctgtcccggc 24600
agggcccgta cgcccggcag aagtcggcgg ccgaggaggt cctgctgcgg gccgcctccg 24660
aggaggtggt ccgcggcgtc gtgctgcggc tgccgaccgt ctacgggcgc agcccgctga 24720
ccgggtggac gggccgcggg gtggtcgcgt cggtggcacg gcaggccgtc tcgggcgagc 24780
cggtcacgat gtggcacgac ggcacggtcg ggcgcgatct gctccacgtg gaggacgcgg 24840
cccgcgcctt cgcggcggcg ctcggtcacg tggagcggct ggacggcggc acgtggtccg 24900
tcggtacggg ccggctggag cccttgggag aggtgttctc ggccctcgcc gggctggtgg 24960
ccgagcggac ggggaggccc cccgtaccgg tggtctccac ggagccgccc gaccatgccg 25020
aggcgggcga cttcgagagc gcggtctgtg acccctccgc gttccgcgcg gtgaccgggt 25080
ggtctcccct cgttccgttg cgggcggggc tcggcgccgt ggtggagacg atggtggccg 25140
acggagcgag gggtgggatc cgaacgtgag cacggaccgg gagcaggccg cgcacacgcg 25200
gctcggtcgc agcgcgaccc tggtgagccg gctctggctg ggcaccgtga acttcagcgg 25260
ccgggtcgag gacggtgacg cgatgcagct gatggaggcg gcggtcgacc gcggcatcaa 25320
ctgcatcgac accgcggaca tctacggctg gcggatccac aagggccaca ccgaggaact 25380
ggtgggccgg tggctggcca agagcgccgc gcggcgggag gacgtcctgc tggccaccaa 25440
ggtcggcggg gacatgagcg aacggctcaa cgacggcggc ctgtcggcgc ggcacatcgt 25500
cacggcctgc gagcagtcgc tgcggcgcct gggcgtggac cacatcgacc tgtaccagat 25560
gcaccgcgtc gaccacgccg cgccgtggga cgagatctgg caggcgatgg accgtctggt 25620
ggcgagcggc aaggtgacct acgtggggtc gtcgaacttc gccggctgga acgtcgccgc 25680
cgcgcaggac gcggcccggc ggcgccagtc cctcggtctg gtgtccgagc agtgcctgta 25740
caacctggcg gtgcgccacg ccgagctgga actgctgccg gccgcccagg cgtacggact 25800
gggcgtgttc gcctggtcgc cgctgcacgg cgggctgctc agcggggtgc tgcgcaagct 25860
cgcggcgggc gtcgcggtga agtcggcaca ggggcgggcc cagctgctgc tgcccgagct 25920
gcgcgcgacg atcgaggcgt acgaggggtt ctgcggccgg atcggcgcgg atccggccga 25980
ggtcggtctg gcctgggtgc tgtcccggcc ggggatcagc ggcgcggtga tcggtccgcg 26040
cacggtggac cagctggact cggcgctgcg gtccctggac ctggtcctcg gggaggccga 26100
actggccgag ctggacgcca tcttcccgcc cctgggcaag ggcggccggg cgccggacgc 26160
gtggatcagc tgaagggggt gcatcggccg acgtcacgcc ggccgatgcc gccggtcaca 26220
cgacgtcgag cgcgggcagc gggaagacca gtcggccgcc gccgtcgagg aactcccgct 26280
cccgttcgac gaacccgtcc cggtagatcc agggcaggac cagcaactgg tccggcttct 26340
gcgccttcgc gtcctcctcg gacacgatgg ggatgcccgt cccgggggtg aaacgccccg 26400
ccttctcctc gctcacctcg ccgatgcacg gcaggtcccg ttcggtgatc ccgcagtact 26460
ggaggatgac gttgcccttg gtggaggcgc cgtacccgag ggtcagcagg ccctcttggc 26520
gggagcggtc caggaagccg cgcagggcgt cccgctggtc ggcgacgcgg cgggcgaagg 26580
cctcgaacgg tgccatgccg tccagtcccg cggcggcctc ggcggcccgg atgcgggcca 26640
ggcccgcctc gtccctcggg tgccgggaac cggtcctggc gagcgtgacg cacaggctgc 26700
cgccgtacac ctcggtgagc tcggcccgga tgacggtgag gccgacgcgt tccgccatcc 26760
actcgatctg gcgcagcgcg tagtactcca ggtgctcgtg gcagacgatg tcgtacgcgt 26820
cggcttcgag catggcgggc aggtagctct gctccatcat ccagacgccg tcctcggcga 26880
ggacgtcgcg gacgtcgctc atgaagcgca gcgggtccgg caggtcgtag aacatcgcga 26940
tggaggtgac ggccttcgcc cgccgcgccc cgaagcggtt ctcgaaggtc gcgcgggtga 27000
agtagtccac gaccaactcg gcgttcggcg ggtacaggtc gcggaacttg ccgccggtcg 27060
ggtcgatgcc gaccagtcgc gggccgtcgg cggggtagcc cttgaggagc gtggcgtcgt 27120
tgctgccgat gtcgaggacc aggtcgtccg ggccgaggtc caccagccgg cggacggcgg 27180
cgaccttgcc atgcaggtgg tcgaccatga agggccggat gcccgagcgg tagccgtagc 27240
cctcgccgta catgaggtcc gggtcggggg tgtggcgcag ttgcacgagg ccgcatccgg 27300
ccggggaaca cgcgacgagt tccagcggga ccgacggcac gacctcgtcg cggtcggccg 27360
ggaacacccc ggtgagcgcc tgttcgccca ggtcgagtac ggagagcagc tccttgttgc 27420
cgcagacgcg gcacgcggtg gcaatcatgg ggtcctttcg ggatcctggc cggggcgccg 27480
ccggcccgtg gccaggtcgg gagcttccag acggagggtg tcgggggcgg gccgggggga 27540
cggcaccagg tgcaggcggc cgatcgcgcc ggtggcggcg gaggcgtcct ggcacgggca 27600
gggatcgtcg gtgaatccgg cgaagcggta ggccacttcc atcatccggt tgcgttcggt 27660
ggcccggaag tcggctccga ggtgcacccc ggcccggtgc gcctggtccg tcagccagcg 27720
caggatcacc gtgccggccc ccagcgacac cacccggcac gaggtggcca gcagcttgat 27780
ccgccaggcc tcggggccgc gccgcagcag cacgacgccg accgcgccgt agggaccgaa 27840
gcgatcggtg acggtggtga ccagcacctc gtggtcgggg tcgtcgatga gggcgcgcag 27900
ctcgtcctcg gagtagtgca ctccggtggc gttcatctgg ctggtgcgca gggtcagttc 27960
ctcgacccgc gacagctcca ggggcgtggc gcggctgatc cgcatccgga tgtccagcga 28020
gcgcaggaag tccgcgtcgg gtccggtgaa gtcggaccgc tcggcgtccc ggcggaagga 28080
cgcctggtac atggagcggc ggcgggtcga gtcgacggtg acggtgcccg ggctgaactc 28140
cgggaggccg gtcagccggg tcgcctgctc ggcggcgtag gtgcggacct ccggcagttc 28200
gtgggtgacc tcggcccgtt cgaagggctg gtcgtcgatg aaggcgaggg tgctcggcgc 28260
gaagttcagc cggtcggcga tctcgcggac cgacttcgac ttcgggcccc agccgatcct 28320
cgggagcacg aagtactcgg cgacgccgag ctgttcgagc ttcgcccagg cgtgatcgtg 28380
gtcgttcttg ctggccaccg cctgcaggat gccgcgcgcg tccagctcgg tgatggtccg 28440
caggacgtcc ggggcgagcc ggacctcgtc ctcctcgagg agggtgccct gccagagggt 28500
gttgtccagg tcccagacca ggcatttgac caacggctcg gcggcgttgt cccggtgcac 28560
gtcgttccct tctctcgata cggcggttgc gaccgcgact cctcgacagg gcgtacgcgg 28620
cccgcggccg gcggggacac gggccggttc acccggccgc ggacatcacg tgccgggcca 28680
ggaccagttc gcagatctcg ttgctgccct cgatgatctc catgagcttg gcgtcgcggt 28740
gcgcccgtgc gacgacgtgt ccctcccgcg ccccggccga cgccagcacc tgcacggccc 28800
gttcggcccc gcgtgcggcg ccggtggccg cgacgtgctt ggccaggacg gcggcgacca 28860
ccatgtcggg gctgccctcg tcccactggg cgctggcgtg ctcgcacgcc cgggcggcgt 28920
gctgttcggc gacgaacagt tcggcgaggt gccgggcgac gagctggtgg tccgagagcc 28980
gcgtgccgaa ctgctcccgt ccgccggcgt gacgtgcggc ggcggccagg caggcgcgca 29040
ggatgcccag ggagccccag gccaccgaca tccggccgta gctcagcgcg gtggtgacca 29100
gcagggcggg ggtgcggtcg tggccctgga gcagggcgtc tgccggcagc cggaccccgt 29160
ccaggtggat gtcggcgtgt ccggccgcgc ggcagccgtg cgcgtcggtg atgcgctcga 29220
cgcgtacgcc gggggccgag gcgggcacca cgacggcgcc cgcgccctgc tccgtgcggc 29280
cgaagaccac cagcaggtcc gcgtacgcgg cgttggtcgc ccacaccttg acgccgtcga 29340
cgacgacttc gtcgccgtcg gaggtgatgc gggtgcgcag ggcggacagg tcgctgccgg 29400
cgccggcctc ggtgaacgcc acggcggcca gttcgccgcc ggtcaaccgg ggcaccaggg 29460
aggcctgctg gtccgctccg gcgagccggc gcagcgtcca ggcggccatg ccctgcgagg 29520
tcatgacgct ccgcaacgag ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc 29580
gccggctggt ccagccgagg ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc 29640
gggagccgag gtcgtgcagc aggccgaggg gcagctcgcc cgtccggtcc cactcggccg 29700
cccggtcgcc gaccagcgcg gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg 29760
tgtcagccac ctgcgtgccc ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg 29820
accatcgcgt cgacggtgcg gaagttgtcg agcatcaggt cggcgccgct gatgacgatg 29880
ccgtaggtct tctccaggtg cacgacgagc tgcatggcga acagcgagga catcccgccg 29940
acggcgaaca ggtcctggtc gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg 30000
agcagttccc cggcgacctc gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg 30060
gacgtcgtgg tcatcgcgtg gcctcctggt agtcgtagaa tccccggccg ctcttgcggc 30120
cgagcaggcc ctggcggacc ttgtccagca gcagctcgct cgggcggagc gccggatcgc 30180
cggtccgttc gtgcatcacc cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg 30240
ccgtggccag gggtccggtg cggtggccga tgcagtcgcg catcagcgcg tccacggtct 30300
ccggggtggc ccggccctcg tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca 30360
ggcggctggt cacgaagccg gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg 30420
acagcaggtc ccgggtggcc cgggcggccg cctctccgct gcgcggtccg aggaccacct 30480
cgaccgtggg gatcacgtac gcggggttca tgaagtgcac gccgacgagg tcctcggggc 30540
gggggacggc gtcggccagc tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg 30600
tccccgggcg cgccacggac gccaggtccg ccagcacctc ggccttccgc tcggggtcct 30660
cggtgacggc ctcgatcacg gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg 30720
tcagctcccc gggcgggcgg tcgtggggca gcgcgcccat cagccgggcc gtccgcagat 30780
gcagcgcgac cgcgtcgggg gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga 30840
ccgggtgccc gtgtccgacg gcgagtgccg cgatggccgt gcccatgacg cccgcgccga 30900
gcacgacgag cggagaattt tccttggaat cgggcacgga tcc 30943
<210> 2
<211> 11171
<212> DNA
<213> Streptomyces ambofaciens
<400> 2
ctgcaggcgc gcgggctgct cgggcaggag gcgcccgccg agagcctcga cgcgatgatc 60
gacgactact gcgcgcagat ccgcgaggtc cagcccgagg gcccgtaccg gctgctcggc 120
tggtccatgg gcgggctgct cgcgcaccgg gtcgccaccc gcctccagcg ggcggggcag 180
cgcgtcgacc tgctcgcgat cgtcgacgcc tatccgcccg cctcggtgcg ggccgactgg 240
gacgcggcgg agatggtggc gcggatcggt gaggaactgg gcttcgacgt ggaccgggtc 300
ggccccggcc aggaggaggc gctgctcgcg gatctgcggg cgaaggggca tcccctgggg 360
catctgccgg gcggtgacat cggcgcggcg gtccgcgtgt acgtcaacag ctcgcgcctg 420
acgaggaacc tgcggcccga ggcgttcgac ggggacgtcc tcttcttcgc ctccgggacc 480
tcgttcgccg aggacgacca ggttcacgac gtcgccgcct ggcggccgta cgtcaccggg 540
cagatcaccg agcacgtgat cgaccacctc cacgaggacc tcttgatcga accggccgcg 600
gtcacggcca tctccgacgt gctcgtcggg catctgcccg cggacgacac accccgcgcg 660
tccggcgcac cccgcgcacc tcgcgcatcc cgatgaggaa ggaaacatca tgagcaaccc 720
gttcgaggac acggaagcca cctacgtcgt gctggtcaac gacgaggggc agcactcgct 780
gtggccgtcg ttcgcggagg tcccggcggg ctggtccgtc gtggtgccgg agacggaccg 840
gcagtcgtgc ctggactaca tcaacgagaa ctggaccgac atgcgcccca agagcctcgt 900
cgaggcgatg gcgacggccg ggcaggacgc cccttgagcc aggacgccat gatccgggcg 960
gtcggcgtcc gcaagagctt gcggcgacgt ccacgccctc gacggcgtgg acatcgaggt 1020
cgaacggggc cgggtgctcg ggctgctggg tcacaacggg gccggcaaga cgaccttggt 1080
gaacatcctt gccacggtct ccccggcgtc cgcgggcacg gtgaccgtcg ccggtttcga 1140
cgtcgcgacg cagggcgccg agatccgcgc gcgcatcggg gtgaccggcc agttcgcgtc 1200
ggtggacgag tacctgagcg gattccgcaa cctcgtcctg atcggccgcc tcctcggggc 1260
gggacggcgt gaggcggcgg cccgggccac cgagctcctg gagctgttcg agctgaccgg 1320
ggcggcccac cagccctccc gcacctactc gggcgggatg cgccgacggc tcgacctcgc 1380
cgccagcctg gtcggccggc cggacgtgct gttcctcgac gagccgacga ccgggctgga 1440
cccggcgacc cggatcgccc tgtgggagac ggtggagaag ctggtggcgg gcggcacgac 1500
cgtcctgctg accacccagt acctggacga ggcggaccgg ctggccgact ggatcaccgt 1560
cctgtcgaag ggccgggtgg tggcctcgga caccaccgac cggctcaagg ccgacctggg 1620
ccaccggtcg gtgcgggtgg tccttccgcc cgccgccgac ctgacggccg ccgccgccgc 1680
gctcaccgcc ggcgggttcc gtccgcggtc cgacgccggg gagcacgcgc tgaccacgcc 1740
cgtggacacc tcggccggta tcgcgggcgt catccgcgcg ctggacaccg tcggaacgca 1800
ggccgtcgag ctgaccgtca aggagccgtc cctggacgac gtctacctgg cgctcaccca 1860
tccctcaccc gccgccgacg cggcctgatc cccaggagtt ccgttggcca tccaggagcg 1920
cgccgtgaag gaggtggcgg tcgacaccgg taccccggcc ggccccgtgt ggcgtggtgc 1980
cggcctcggc acccagctgt gggtactgac cgcgcggcag atccgttcca tgtacggcga 2040
ccgccgcctg gcgctgttca gcctgatgca accggtgatc atgctgttgc tgctgagcga 2100
gatcttcggc agcatggccg acccggacga cttcccgcag ggcgtgcgct acatcgacta 2160
cgtggtgccc gcgctgctgg tcaccaccgg catcggctcg gcccagggcg cgggggtggg 2220
cctggtcagg gacatggaca acgggatggt ggcgcgcttc cgcgtcctgc cggcccggct 2280
gttcctggtg ctggtcgccc ggtcgctggc cgatctggtc cgtgtgttca ccgagttggt 2340
cgtcctcgtg gccgtcggtg tgatcctgct gggcttccgt ccggccgggg gtttgtgggg 2400
cacgtccgcc gccctgttgc tcaccctgtt cgtcatctgg tcgctgatct gggggttcat 2460
cgccctcgcg gcgtggctgc gcagcgtgga ggtgatgtcc agcctcgcgg ttctggtgat 2520
gttcccgctc atgttcgcct ccagtgcgtt cgtcccgctg gacgccctcc cggagtggct 2580
gcgctcggtg gcgcacctca accccgtgac gtacgcggtc gacagcgccc gccgcctggc 2640
gctggactgg gacccggggt ggagcgtgcc cggcgcgctg ctgaccagca ccgcgctcat 2700
ggcggtgggg atgtacgtcg ccgggcgttc cttcaagagg cccccgaacg aatgattccg 2760
gcgaacgggt ccgtcgcctg cccctccggg ctcgcccggg ggaggcgggc gcggtctcag 2820
cggtcggccg tccgcccgta ggcgcggaag agtgcggtcc actccgggac cgtgaggtcc 2880
ttgacccggt cggccggcct cacgcccgcc ccgcgcacga actgggcgtg tccgcggcgc 2940
agcaccttcc gcgcggcgtc gcccaccgtc atctggccgg tgtcgaagac ccgttggacg 3000
aaccgctggt aggcggcctt ctcacgccag ggcacggacg gcctgcggtg cggggcgacc 3060
atcagggtct gggtgtccgc gcgcggtacg ggggtgaagt cctggcgtga gaaggccagg 3120
ccccggtcga acgagtacca cggctcccac tgggcgttga agaggtttcc gccccaggct 3180
ccggtccgct ttcccacgta ctcccgctgc aacaggaaca cgccctgccg catgcgcgcc 3240
ggacccatgt cgaggcagcg cctcagcatt ctggtgccgg tgacgaaggg aagattcccg 3300
atgagtctga ccggctgccc gggcagttgc agggtcagga aatcctcgtt caccaccgtg 3360
acgtccggca gcgattcggc ggccagccgc cgagcccagc ggggatctat ttccaccgcg 3420
agtaaaggcg tcccgggtga ggcgagcact ttggtcaccc gccctgatcc cgcgcctatt 3480
tcgacggtca tcaggtcatt cggagaatcg ggcggaatgg tgtccgaacc gtccagctga 3540
gcggagaaac gacaggccgc ggcggctgta cgaaagaagt tctgacccca ttctctccgc 3600
gcggtgctgc gtgaatcagc gggtgcggag acggattgcg gtggcagtgg ggatttcaat 3660
gtcacctcgg cgacattacc aagtcttgac ccaacggtcc atcaaccacc ggtatacccc 3720
atgcaattca gccaccgtcc ggcccgatcc cgacgttcgg ccgcgggcct ttcgggcccg 3780
accggtgacc agcgcgcgaa ccggagttcc cggcgatatt tccggctcct ggcgactcgc 3840
cacagtctcg tcgggggcgg ccggcgccat gactccgacg ggggcgattc ccggccgact 3900
tcgtcaggtc cggagggtcc cccgggcggc gcgggccgat ggccgctgac tgtgtcatct 3960
gcgggttgtc ggccgaacac accgcgcccc aggatgactc agccgttcct gcggtcgtcc 4020
cgaccccggt cccacccccg aaaagaggag cgagaatcca gtgctccagc gcgtcgatct 4080
gtcgtcactc accggcctcc gctggtatgc ggcgctgacg gtattcgcct gtcacatcgc 4140
ccagcagggc ttcttcgccg accagcaggt gggcagcgca ctgctgcaca tcaccccgct 4200
cggttccatg gcggtctcga tcttcttcat actgagtgga ttcgtcctcg cctggtcggc 4260
ccgcgacgag gactccgtgc cgactttctg gcggcgccgc atcgcgaaga tctatccgct 4320
gcatctcgcg acgttcggca tcgcggctct catcattttc tccctgtcgg agccggtact 4380
tcccggcggt tccgtatggg acgggctggt gcccaatgtt ctgctcgtgc agtcctggct 4440
tcccgacgcg accctcacgg ccagtttcaa cacgcccagc tggtcgctct cctgtgagat 4500
cgccttctat ctgtcgttcc cgctgtggta ccggctggtg cgcaggattc ccgcacggcg 4560
gctgtggtgg tgcgccgcgg ggatcgccgt ggccgtgacg tgtgtgcccc tgctggcggg 4620
cctgctcccg gcgagcgagg aggtggcccc cgggatgtcg ctcaacgagg tctggttcgc 4680
gtactggctt ccgccggtgc gcatgctgga gttcgtcctc ggcatcgtga tggcgctgat 4740
cctgcgcgcg gggatctgga agggccccgg tccggcggtc tgcacggcgc tcctcgccgc 4800
gagttacggc ctcacccaga tggtgccccc gatcttcacc ctcgtcgcct gctccgtcgt 4860
accggccgcg ctgctgatca cggcgctggc cgacgccgac gtgcacggcc ggcgcacggg 4920
gctgcgttcg gcgacgctgg tgcggctggg ccagtggtcc ttcgccttct acctggtcca 4980
cttcctgatc atccgctacg gacaccggct gatgggcggc gatctgggct acgagcggca 5040
gtggagcacc ccggccgcga tcgcgctgtc cctggggatg ctgggggtgg cggtcctggc 5100
cggcggtctg ctgcacaccg tcgtcgaaca gccctgcatg cgcctgttcg gcagccgcag 5160
gtccgcctcc cgtccgaagc ccggcgccac cgcggctccc cggaactcac ccgcggccga 5220
cgcggccggc gtgcccctgc tcccgggcgt acccgggccc gcgcacaccc ccgcagcgac 5280
gaacgaaccc accccgagag gatgatgagc gtggcagacc agacggctct cagccccgcg 5340
ctgctggagt acgcccggag cgtcgcgctg cgggacgacg gcctgctgcg cgaactgcac 5400
gaggtgaccg ccgggctccc cggcggccgg gccatgcaga tcatgcccga ggaggcgcag 5460
ttcctcgccc tgctgatccg gctcgtcggt gcccggcggg tgctggagat cggcaccttc 5520
acggggtaca gcacgctgtg catggcgcgg gcactgcccg ccgacggcac cgtcgtcacc 5580
tgcgacatca gcgacaggtg gcccggcgtc ggcgcaccgt actggcgccg ggccggggtg 5640
gagtcccgga tcgacctgcg cgtcggcgac gccgtccgga ccctcgccga gctccgcgag 5700
cacgaggggg acggctcgtt cgacctggtc ttcgtcgacg ccgacaagac cgggtacccg 5760
cactactacg agcaggcgct ggccctggta cgccccggcg gactggtggc ggtcgacaac 5820
accctgttct tcggccgggt ggccgacccg gccgtcgagg acgccgacac cgtcgccgtg 5880
cgcgcgctca acgagctgct gcgcgacgac gaacgcgtgg acatcgccct gctgacggtc 5940
gccgacggga tcactctggc ccgccggcgg gagtgagtcc gcacggggtg cggagcacct 6000
ggtgccgtca ccggcccgca cacgtccgcc gccgacctgc ccgggcaggt cgccgagctg 6060
ctgccctggc gtggccggcc ctcgtcgagg gccgcgcggt cagcggaacc ggttgatcgc 6120
gtcgatgtgc cgcgcccgct tctcctcgtc gcgcacgccc agcccctccg tgggcgccag 6180
gcagagcacg ccgaccttgc cctggtgctg gttgccgtgc acgtcgtgca cggcaaccgc 6240
cgtgtcggcc agcgggtagg tgcgcgagag ggtggggtgg atcctcccct tggcgacgag 6300
ccggttcgcc tcccacgcct cgcggtagtt ggcgaagtgg gtgccgacga tacgcttgag 6360
gtgcatccag aggtagcggt tgtcgaactc gtggcggaag cccgaggtgg aggcgcaggt 6420
gacgatcgtg ccgcccctgc gggtgacgta gacggacgcc ccgaaggtct cccggccggg 6480
gtgctcgaag acgatgtcga cgtcctcgcc cccggtgacc tcgcggatgc gcttgccgaa 6540
gcgcttccac tcccgcgggt cctgggtgtc ctcgtcgctc cagaagcggt agtcctcggc 6600
ggagcggtcg atgatggcct ccgcgcccat ggcccggcac acctcggcct tgcgcgcgct 6660
ggagaccacg cagacggggt gggccccgcc ggcgagggcc agctgggtgg cgtacgagcc 6720
caggccgccg ctggcgcccc agatcagcac gttgtcgccc tgcttcatgc cggcgccgtt 6780
gcgggagacc agctggcggt aggcggtgga gttgaccaga ccgggcgcgg cggcctcctc 6840
ccaggtcaga tgggccgcct tgggcatcag ctggttggac ttgacgaggg ccacctcggc 6900
caggcccccg aagttggtct cgaagcccca gatgcgctgg gccgggtcga gcatggtgtc 6960
gtcgtgcccg tcggggctct ccagctccac cgacagacag tgcgcgacga cctcgtcacc 7020
gggtttccag acgttcacgc cgggtcccgt gcgcagcacc acgccggaca ggtcggaacc 7080
gaggatgtgg tacggcaggt cgtggcgcgc ggccagcggc gaggtgcgcc cgtagcgctc 7140
caggaagccg aacgtcggga ggggctcgaa gatggaggac cagaccgtgt tgtagttgac 7200
ggagctggcc atcaccgcga ccagcgcctc cccgggcccc acttcgggca gcggcacctc 7260
gtcgacgtgc agggacttgc gcgggtcctt gtccgcgctc ggcatcccgc ggaacatgtc 7320
ggtgtcctct ttgcggacgg tcacggcgcg gaaggactcg ggcaggggca gcgccgcgat 7380
gtcctcgggg gtgcggtccg cggcggtgat cgcggcgagc agcgcgctct gcgcatggct 7440
ttcgggcatg gaacggtctc cgatcgctcg tgtcgtcagg tggcccggtg cagggcggtg 7500
aggcgctcca gggtggggat gatcccggcg ggcgtggggt cggcgagcat ctcctcgctc 7560
agccgccgcg cgcccgccct gatcgcgggg tcgtgcacgg ccgtgtgcac cgcgtcggcc 7620
agaccgcgcg ccgtgagcgt cgccgcgggc aggtcgaacc cggcggacag gcgctggagt 7680
tgctgcgcct tgagcggcgc gtcccacagg gagggcagca ggatctgcgg cactccgtgg 7740
cgcagggcgg tggaccaggt gcccgctccg ccgtggtgga tgatcgcggc gcagctcggc 7800
agcagcgcgt cgagcggtac gaagtccacg ggcacgacgt tgtcggggag ggtgcccagg 7860
cggtcgagct gggaggtgtc cagggtggcc accacctcga tgtccagccg gccgagcgcc 7920
tccagcagtt cggagtagga gaccgcgtcg cggccgtagg tctcgcgggc ggacacgccg 7980
agggtgaggc agacgcgggg gcggtcgggc ttcttgccga gccagggttc gatcacggag 8040
cgcccgttgt agggcacgta gcacatgggc accgtggtct ggcccaggtc gaggcgggtg 8100
ctgcgcgggc ccgggtcgat cacccagtgg ccgagcacgt cgcgttcgtc gaaggcgagc 8160
ccgtaccggt ccagcgtcca gccgagccat tcggcgatgg ggtcctcgcg cagttcctcc 8220
ggcatcccgt cgagggcggc gaggaagcgc aggcgggagc gtccgatggc gtcggggccc 8280
cacaggatgc gcgcgtgggc ggcaccgcag gcgcgggccg cgaccggccc cgcgtaggtc 8340
cagggttccc acacgaccag gtcgggccgc cagccacggg cgaagtcgac gatctcgtcc 8400
atcgtggcgg cgccgttgaa cggggcgaag cacagggcgg ccatcatgct ctgctggccg 8460
agcaggtact cccaggtggt ctcctcctcg ctctccacct caccgaactc gaagccccgc 8520
tggtagggga cgaggtcgct gcccatctcg gcgagcagct ccgcggccgg tcggtcgtcg 8580
cccaccggta cggcggtcag gccggtggag gtgatgacgt cggtgaggga gggcgggctc 8640
gccacccgta cctcgtgccc ggcggcgcgc agcgcccagg cgaggggcac cagactgtag 8700
tagtgggtgt tgtgggcgag ggatgtcagc aggacgcgca cagcggctcc ggtctgggag 8760
ggggcgtacg gacggcgggg tcatcccggg tggacccgga ggcgggcgca ggcgcccagg 8820
accggtgacc gcggccgggt caggggcggt ccctcggccc gcaggccggg caggcggccg 8880
gccgtgacct ggaccgcggt ggtggcggcc aggcggatca gcgggagggc gagcgccagg 8940
tgcggtccgt cggcgccccc gagcggctcc ggcccgggga tctcccgtcc ggcggcggcc 9000
agcaccacga cgtgctcgtc ggcggtgatc cggcggccgc cgagttcgag gccggtgtgc 9060
gcgacccggt tctccagccg ggccgggggg cgctcgcgca gcacctggtc gacggcgttc 9120
gccgcggccg gcgtccggcg ggccctctcc cactcccccg gccggccgag cagccggtgg 9180
accgtgtgcg cgacggcggt gacgacgggt tcgggtgcgc cgaccgcgag gagcagcgcg 9240
atgcgctcga cgtcgccggg ggcgacgccg tcgtgcagga ggagggcgag cacgtcgtcg 9300
ggccggggct cggcgttccc gaggccccgg gacttctccg cgacgagctc ggggaccagg 9360
tcggccagtg tgcggacggc gtcggcggac tcccgggcca cggtcagcag ttgcggggcc 9420
atccgggcgt cgagctgggg gccgcaggcg gcgagtgccc gcgcggcggt ggcgcggtcg 9480
cggcccggca ctccgaggag cctgagcatc agctcgacgg cgtagggccg ggcgacctcg 9540
ccgacaaggt cgaacccggc gtcaccggtg ggcagcaggc ggccgagcac tctgcgggcg 9600
gtggtgcgcg ccgcgcaggg cgcctgggcc ggggcgtacc ggctgagcac cggggcggcc 9660
agcgcccgca ggcgtacgag ctccgcgcgt tcgtggtggg ggaacgcctc ggcgaggggc 9720
agcagttcct cgtccgggcg gcgtccggcc cggtccagcg tgccgaagcg cgggtcggcc 9780
aggacggccg ccgccacctc ggggtccgcg gtcacccagg cgtccagctg ttcgctgcgg 9840
aaccacggtc cgcgggcccg gatctcccgt tcgaacggct cggggtcggc gacggcgcgc 9900
aggatcagcg cgtacgggtc gccctggttg ccggcgcacc agtgtgcggc ccgggtcagc 9960
tggagccgac ggccgagcgc acggacgccc gtgctcgtgt ccgcgctcgt gctcgtgctc 10020
gcgggggccg tttccgtggc aagggtgggc atggctgccc tgcctttctt ctcgggtcga 10080
tgggggcgct cgcacgatcg ggggacccgg gtgtgccggg tgggtcgggg caacccgcct 10140
ccgggccgcg gcggtccgcg tcggcaccgg gtcagcggcg ggtgccgatg aacagcccgc 10200
gaccggacgg gccgccttcc tggtagacca cgtcgcagcc ggcgcgctcg aaggccgcct 10260
cgtagtcggc gcgcgggaac agggtgatgg tgtggtcctc ggtcaggtga cggacgccgc 10320
cgggtccggc gaggaggtag tgcacctcga tgcgggtggc gttcccctcc cgtacggagt 10380
gcgagacccg gcagacggtg cgctcgcccg cctccgtgat gctggcgccg acgtaaccgg 10440
gggtgaagga ctcggggaac caccagggtt cgacgacgat gacgccggac ggttcgaggt 10500
ggtcggtgaa ggcccgcagc gtgctgtcga gttcgtcggt ggtccgcagg tggcctatgg 10560
agctgaacat gcaggtcacc gcgtcgaacc ggcgtcccag ggagaacgag cgcatgtccc 10620
cttggtggaa ggtgacaccg gggttccggc cggtcgcgag ggccagcatg tcggcggaga 10680
gttccaggcc ctcgacgtgg tcgaagaggc cgtccaggtg gtgcaggtgc tggccggtgc 10740
cgcaggccac gtcgagcagg gtccgggcgc ccggccggtg gacgcgcacg agtgcggcga 10800
tctcctcggc ctcctgccgg tagtccttcc ccttcccctc gtggaccagg tcgtagacgg 10860
ccgcgatgtc gtcggcgtac atcagtgttt ccctccggtg agcggggcgg gaccgggctg 10920
gtgcgggagg ctgtccagcc attcgtgcac cagggacgcg gtgtgccggg cgtgttcggt 10980
gagcatggtg aagtggttgc cgggcacgtc ggcgacggtc cgtgcgaacg ggacctggga 11040
ccgccagtcg ccccgcgccc cgcccgcggg cggccacgcg cacaggggtt cggacgcccg 11100
ggccagcagg acgggggctt cgagggcggt gagccgggtt ccgagcacca gccgctgata 11160
gccggccatg g 11171
<210> 3
<211> 711
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(711)
<400> 3
atg tac gcc gac gac atc gcg gcc gtc tac gac ctg gtc cac gag ggg 48
Met Tyr Ala Asp Asp Ile Ala Ala Val Tyr Asp Leu Val His Glu Gly
1 5 10 15
aag ggg aag gac tac cgg cag gag gcc gag gag atc gcc gca ctc gtg 96
Lys Gly Lys Asp Tyr Arg Gln Glu Ala Glu Glu Ile Ala Ala Leu Val
20 25 30
cgc gtc cac cgg ccg ggc gcc cgg acc ctg ctc gac gtg gcc tgc ggc 144
Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cys Gly
35 40 45
acc ggc cag cac ctg cac cac ctg gac ggc ctc ttc gac cac gtc gag 192
Thr Gly Gln His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu
50 55 60
ggc ctg gaa ctc tcc gcc gac atg ctg gcc ctc gcg acc ggc cgg aac 240
Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn
65 70 75 80
ccc ggt gtc acc ttc cac caa ggg gac atg cgc tcg ttc tcc ctg gga 288
Pro Gly Val Thr Phe His Gln Gly Asp Met Arg Ser Phe Ser Leu Gly
85 90 95
cgc cgg ttc gac gcg gtg acc tgc atg ttc agc tcc ata ggc cac ctg 336
Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser Ile Gly His Leu
100 105 110
cgg acc acc gac gaa ctc gac agc acg ctg cgg gcc ttc acc gac cac 384
Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His
115 120 125
ctc gaa ccg tcc ggc gtc atc gtc gtc gaa ccc tgg tgg ttc ccc gag 432
Leu Glu Pro Ser Gly Val Ile Val Val Glu Pro Trp Trp Phe Pro Glu
130 135 140
tcc ttc acc ccc ggt tac gtc ggc gcc agc atc acg gag gcg ggc gag 480
Ser Phe Thr Pro Gly Tyr Val Gly Ala Ser Ile Thr Glu Ala Gly Glu
145 150 155 160
cgc acc gtc tgc cgg gtc tcg cac tcc gta cgg gag ggg aac gcc acc 528
Arg Thr Val Cys Arg Val Ser His Ser Val Arg Glu Gly Asn Ala Thr
165 170 175
cgc atc gag gtg cac tac ctc ctc gcc gga ccc ggc ggc gtc cgt cac 576
Arg Ile Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His
180 185 190
ctg acc gag gac cac acc atc acc ctg ttc ccg cgc gcc gac tac gag 624
Leu Thr Glu Asp His Thr Ile Thr Leu Phe Pro Arg Ala Asp Tyr Glu
195 200 205
gcg gcc ttc gag cgc gcc ggc tgc gac gtg gtc tac cag gaa ggc ggc 672
Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gln Glu Gly Gly
210 215 220
ccg tcc ggt cgc ggg ctg ttc atc ggc acc cgc cgc tga 711
Pro Ser Gly Arg Gly Leu Phe Ile Gly Thr Arg Arg
225 230 235
<210> 4
<211> 236
<212> PRT
<213> Streptomyces ambofaciens
<400> 4
Met Tyr Ala Asp Asp Ile Ala Ala Val Tyr Asp Leu Val His Glu Gly
1 5 10 15
Lys Gly Lys Asp Tyr Arg Gln Glu Ala Glu Glu Ile Ala Ala Leu Val
20 25 30
Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cys Gly
35 40 45
Thr Gly Gln His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu
50 55 60
Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn
65 70 75 80
Pro Gly Val Thr Phe His Gln Gly Asp Met Arg Ser Phe Ser Leu Gly
85 90 95
Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser Ile Gly His Leu
100 105 110
Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His
115 120 125
Leu Glu Pro Ser Gly Val Ile Val Val Glu Pro Trp Trp Phe Pro Glu
130 135 140
Ser Phe Thr Pro Gly Tyr Val Gly Ala Ser Ile Thr Glu Ala Gly Glu
145 150 155 160
Arg Thr Val Cys Arg Val Ser His Ser Val Arg Glu Gly Asn Ala Thr
165 170 175
Arg Ile Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His
180 185 190
Leu Thr Glu Asp His Thr Ile Thr Leu Phe Pro Arg Ala Asp Tyr Glu
195 200 205
Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gln Glu Gly Gly
210 215 220
Pro Ser Gly Arg Gly Leu Phe Ile Gly Thr Arg Arg
225 230 235
<210> 5
<211> 1272
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1272)
<400> 5
atg ccc acc ctt gcc acg gaa acg gcc ccc gcg agc acg agc acg agc 48
Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser
1 5 10 15
gcg gac acg agc acg ggc gtc cgt gcg ctc ggc cgt cgg ctc cag ctg 96
Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gln Leu
20 25 30
acc cgg gcc gca cac tgg tgc gcc ggc aac cag ggc gac ccg tac gcg 144
Thr Arg Ala Ala His Trp Cys Ala Gly Asn Gln Gly Asp Pro Tyr Ala
35 40 45
ctg atc ctg cgc gcc gtc gcc gac ccc gag ccg ttc gaa cgg gag atc 192
Leu Ile Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu Ile
50 55 60
cgg gcc cgc gga ccg tgg ttc cgc agc gaa cag ctg gac gcc tgg gtg 240
Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gln Leu Asp Ala Trp Val
65 70 75 80
acc gcg gac ccc gag gtg gcg gcg gcc gtc ctg gcc gac ccg cgc ttc 288
Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe
85 90 95
ggc acg ctg gac cgg gcc gga cgc cgc ccg gac gag gaa ctg ctg ccc 336
Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro
100 105 110
ctc gcc gag gcg ttc ccc cac cac gaa cgc gcg gag ctc gta cgc ctg 384
Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu
115 120 125
cgg gcg ctg gcc gcc ccg gtg ctc agc cgg tac gcc ccg gcc cag gcg 432
Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gln Ala
130 135 140
ccc tgc gcg gcg cgc acc acc gcc cgc aga gtg ctc ggc cgc ctg ctg 480
Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu
145 150 155 160
ccc acc ggt gac gcc ggg ttc gac ctt gtc ggc gag gtc gcc cgg ccc 528
Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro
165 170 175
tac gcc gtc gag ctg atg ctc agg ctc ctc gga gtg ccg ggc cgc gac 576
Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp
180 185 190
cgc gcc acc gcc gcg cgg gca ctc gcc gcc tgc ggc ccc cag ctc gac 624
Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gln Leu Asp
195 200 205
gcc cgg atg gcc ccg caa ctg ctg acc gtg gcc cgg gag tcc gcc gac 672
Ala Arg Met Ala Pro Gln Leu Leu Thr Val Ala Arg Glu Ser Ala Asp
210 215 220
gcc gtc cgc aca ctg gcc gac ctg gtc ccc gag ctc gtc gcg gag aag 720
Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys
225 230 235 240
tcc cgg ggc ctc ggg aac gcc gag ccc cgg ccc gac gac gtg ctc gcc 768
Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala
245 250 255
ctc ctc ctg cac gac ggc gtc gcc ccc ggc gac gtc gag cgc atc gcg 816
Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg Ile Ala
260 265 270
ctg ctc ctc gcg gtc ggc gca ccc gaa ccc gtc gtc acc gcc gtc gcg 864
Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala
275 280 285
cac acg gtc cac cgg ctg ctc ggc cgg ccg ggg gag tgg gag agg gcc 912
His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala
290 295 300
cgc cgg acg ccg gcc gcg gcg aac gcc gtc gac cag gtg ctg cgc gag 960
Arg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gln Val Leu Arg Glu
305 310 315 320
cgc ccc ccg gcc cgg ctg gag aac cgg gtc gcg cac acc ggc ctc gaa 1008
Arg Pro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu
325 330 335
ctc ggc ggc cgc cgg atc acc gcc gac gag cac gtc gtg gtg ctg gcc 1056
Leu Gly Gly Arg Arg Ile Thr Ala Asp Glu His Val Val Val Leu Ala
340 345 350
gcc gcc gga cgg gag atc ccc ggg ccg gag ccg ctc ggg ggc gcc gac 1104
Ala Ala Gly Arg Glu Ile Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp
355 360 365
gga ccg cac ctg gcg ctc gcc ctc ccg ctg atc cgc ctg gcc gcc acc 1152
Gly Pro His Leu Ala Leu Ala Leu Pro Leu Ile Arg Leu Ala Ala Thr
370 375 380
acc gcg gtc cag gtc acg gcc ggc cgc ctg ccc ggc ctg cgg gcc gag 1200
Thr Ala Val Gln Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu
385 390 395 400
gga ccg ccc ctg acc cgg ccg cgg tca ccg gtc ctg ggc gcc tgc gcc 1248
Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala
405 410 415
cgc ctc cgg gtc cac ccg gga tga 1272
Arg Leu Arg Val His Pro Gly
420
<210> 6
<211> 423
<212> PRT
<213> Streptomyces ambofaciens
<400> 6
Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser
1 5 10 15
Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gln Leu
20 25 30
Thr Arg Ala Ala His Trp Cys Ala Gly Asn Gln Gly Asp Pro Tyr Ala
35 40 45
Leu Ile Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu Ile
50 55 60
Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gln Leu Asp Ala Trp Val
65 70 75 80
Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe
85 90 95
Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro
100 105 110
Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu
115 120 125
Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gln Ala
130 135 140
Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu
145 150 155 160
Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro
165 170 175
Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp
180 185 190
Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gln Leu Asp
195 200 205
Ala Arg Met Ala Pro Gln Leu Leu Thr Val Ala Arg Glu Ser Ala Asp
210 215 220
Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys
225 230 235 240
Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala
245 250 255
Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg Ile Ala
260 265 270
Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala
275 280 285
His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala
290 295 300
Arg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gln Val Leu Arg Glu
305 310 315 320
Arg Pro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu
325 330 335
Leu Gly Gly Arg Arg Ile Thr Ala Asp Glu His Val Val Val Leu Ala
340 345 350
Ala Ala Gly Arg Glu Ile Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp
355 360 365
Gly Pro His Leu Ala Leu Ala Leu Pro Leu Ile Arg Leu Ala Ala Thr
370 375 380
Thr Ala Val Gln Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu
385 390 395 400
Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala
405 410 415
Arg Leu Arg Val His Pro Gly
420
<210> 7
<211> 1266
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1266)
<400> 7
gtg cgc gtc ctg ctg aca tcc ctc gcc cac aac acc cac tac tac agt 48
Val Arg Val Leu Leu Thr Ser Leu Ala His Asn Thr His Tyr Tyr Ser
1 5 10 15
ctg gtg ccc ctc gcc tgg gcg ctg cgc gcc gcc ggg cac gag gta cgg 96
Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg
20 25 30
gtg gcg agc ccg ccc tcc ctc acc gac gtc atc acc tcc acc ggc ctg 144
Val Ala Ser Pro Pro Ser Leu Thr Asp Val Ile Thr Ser Thr Gly Leu
35 40 45
acc gcc gta ccg gtg ggc gac gac cga ccg gcc gcg gag ctg ctc gcc 192
Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala
50 55 60
gag atg ggc agc gac ctc gtc ccc tac cag cgg ggc ttc gag ttc ggt 240
Glu Met Gly Ser Asp Leu Val Pro Tyr Gln Arg Gly Phe Glu Phe Gly
65 70 75 80
gag gtg gag agc gag gag gag acc acc tgg gag tac ctg ctc ggc cag 288
Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gln
85 90 95
cag agc atg atg gcc gcc ctg tgc ttc gcc ccg ttc aac ggc gcc gcc 336
Gln Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala
100 105 110
acg atg gac gag atc gtc gac ttc gcc cgt ggc tgg cgg ccc gac ctg 384
Thr Met Asp Glu Ile Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu
115 120 125
gtc gtg tgg gaa ccc tgg acc tac gcg ggg ccg gtc gcg gcc cgc gcc 432
Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala
130 135 140
tgc ggt gcc gcc cac gcg cgc atc ctg tgg ggc ccc gac gcc atc gga 480
Cys Gly Ala Ala His Ala Arg Ile Leu Trp Gly Pro Asp Ala Ile Gly
145 150 155 160
cgc tcc cgc ctg cgc ttc ctc gcc gcc ctc gac ggg atg ccg gag gaa 528
Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu
165 170 175
ctg cgc gag gac ccc atc gcc gaa tgg ctc ggc tgg acg ctg gac cgg 576
Leu Arg Glu Asp Pro Ile Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg
180 185 190
tac ggg ctc gcc ttc gac gaa cgc gac gtg ctc ggc cac tgg gtg atc 624
Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val Ile
195 200 205
gac ccg ggc ccg cgc agc acc cgc ctc gac ctg ggc cag acc acg gtg 672
Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gln Thr Thr Val
210 215 220
ccc atg tgc tac gtg ccc tac aac ggg cgc tcc gtg atc gaa ccc tgg 720
Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val Ile Glu Pro Trp
225 230 235 240
ctc ggc aag aag ccc gac cgc ccc cgc gtc tgc ctc acc ctc ggc gtg 768
Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val
245 250 255
tcc gcc cgc gag acc tac ggc cgc gac gcg gtc tcc tac tcc gaa ctg 816
Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu
260 265 270
ctg gag gcg ctc ggc cgg ctg gac atc gag gtg gtg gcc acc ctg gac 864
Leu Glu Ala Leu Gly Arg Leu Asp Ile Glu Val Val Ala Thr Leu Asp
275 280 285
acc tcc cag ctc gac cgc ctg ggc acc ctc ccc gac aac gtc gtg ccc 912
Thr Ser Gln Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro
290 295 300
gtg gac ttc gta ccg ctc gac gcg ctg ctg ccg agc tgc gcc gcg atc 960
Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala Ile
305 310 315 320
atc cac cac ggc gga gcg ggc acc tgg tcc acc gcc ctg cgc cac gga 1008
Ile His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly
325 330 335
gtg ccg cag atc ctg ctg ccc tcc ctg tgg gac gcg ccg ctc aag gcg 1056
Val Pro Gln Ile Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala
340 345 350
cag caa ctc cag cgc ctg tcc gcc ggg ttc gac ctg ccc gcg gcg acg 1104
Gln Gln Leu Gln Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr
355 360 365
ctc acg gcg cgc ggt ctg gcc gac gcg gtg cac acg gcc gtg cac gac 1152
Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp
370 375 380
ccc gcg atc agg gcg ggc gcg cgg cgg ctg agc gag gag atg ctc gcc 1200
Pro Ala Ile Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala
385 390 395 400
gac ccc acg ccc gcc ggg atc atc ccc acc ctg gag cgc ctc acc gcc 1248
Asp Pro Thr Pro Ala Gly Ile Ile Pro Thr Leu Glu Arg Leu Thr Ala
405 410 415
ctg cac cgg gcc acc tga 1266
Leu His Arg Ala Thr
420
<210> 8
<211> 421
<212> PRT
<213> Streptomyces ambofaciens
<400> 8
Val Arg Val Leu Leu Thr Ser Leu Ala His Asn Thr His Tyr Tyr Ser
1 5 10 15
Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg
20 25 30
Val Ala Ser Pro Pro Ser Leu Thr Asp Val Ile Thr Ser Thr Gly Leu
35 40 45
Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala
50 55 60
Glu Met Gly Ser Asp Leu Val Pro Tyr Gln Arg Gly Phe Glu Phe Gly
65 70 75 80
Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gln
85 90 95
Gln Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala
100 105 110
Thr Met Asp Glu Ile Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu
115 120 125
Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala
130 135 140
Cys Gly Ala Ala His Ala Arg Ile Leu Trp Gly Pro Asp Ala Ile Gly
145 150 155 160
Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu
165 170 175
Leu Arg Glu Asp Pro Ile Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg
180 185 190
Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val Ile
195 200 205
Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gln Thr Thr Val
210 215 220
Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val Ile Glu Pro Trp
225 230 235 240
Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val
245 250 255
Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu
260 265 270
Leu Glu Ala Leu Gly Arg Leu Asp Ile Glu Val Val Ala Thr Leu Asp
275 280 285
Thr Ser Gln Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro
290 295 300
Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala Ile
305 310 315 320
Ile His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly
325 330 335
Val Pro Gln Ile Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala
340 345 350
Gln Gln Leu Gln Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr
355 360 365
Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp
370 375 380
Pro Ala Ile Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala
385 390 395 400
Asp Pro Thr Pro Ala Gly Ile Ile Pro Thr Leu Glu Arg Leu Thr Ala
405 410 415
Leu His Arg Ala Thr
420
<210> 9
<211> 1350
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1350)
<400> 9
atg ccc gaa agc cat gcg cag agc gcg ctg ctc gcc gcg atc acc gcc 48
Met Pro Glu Ser His Ala Gln Ser Ala Leu Leu Ala Ala Ile Thr Ala
1 5 10 15
gcg gac cgc acc ccc gag gac atc gcg gcg ctg ccc ctg ccc gag tcc 96
Ala Asp Arg Thr Pro Glu Asp Ile Ala Ala Leu Pro Leu Pro Glu Ser
20 25 30
ttc cgc gcc gtg acc gtc cgc aaa gag gac acc gac atg ttc cgc ggg 144
Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly
35 40 45
atg ccg agc gcg gac aag gac ccg cgc aag tcc ctg cac gtc gac gag 192
Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu
50 55 60
gtg ccg ctg ccc gaa gtg ggg ccc ggg gag gcg ctg gtc gcg gtg atg 240
Val Pro Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met
65 70 75 80
gcc agc tcc gtc aac tac aac acg gtc tgg tcc tcc atc ttc gag ccc 288
Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser Ile Phe Glu Pro
85 90 95
ctc ccg acg ttc ggc ttc ctg gag cgc tac ggg cgc acc tcg ccg ctg 336
Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu
100 105 110
gcc gcg cgc cac gac ctg ccg tac cac atc ctc ggt tcc gac ctg tcc 384
Ala Ala Arg His Asp Leu Pro Tyr His Ile Leu Gly Ser Asp Leu Ser
115 120 125
ggc gtg gtg ctg cgc acg gga ccc ggc gtg aac gtc tgg aaa ccc ggt 432
Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly
130 135 140
gac gag gtc gtc gcg cac tgt ctg tcg gtg gag ctg gag agc ccc gac 480
Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp
145 150 155 160
ggg cac gac gac acc atg ctc gac ccg gcc cag cgc atc tgg ggc ttc 528
Gly His Asp Asp Thr Met Leu Asp Pro Ala Gln Arg Ile Trp Gly Phe
165 170 175
gag acc aac ttc ggg ggc ctg gcc gag gtg gcc ctc gtc aag tcc aac 576
Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn
180 185 190
cag ctg atg ccc aag gcg gcc cat ctg acc tgg gag gag gcc gcc gcg 624
Gln Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala
195 200 205
ccc ggt ctg gtc aac tcc acc gcc tac cgc cag ctg gtc tcc cgc aac 672
Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gln Leu Val Ser Arg Asn
210 215 220
ggc gcc ggc atg aag cag ggc gac aac gtg ctg atc tgg ggc gcc agc 720
Gly Ala Gly Met Lys Gln Gly Asp Asn Val Leu Ile Trp Gly Ala Ser
225 230 235 240
ggc ggc ctg ggc tcg tac gcc acc cag ctg gcc ctc gcc ggc ggg gcc 768
Gly Gly Leu Gly Ser Tyr Ala Thr Gln Leu Ala Leu Ala Gly Gly Ala
245 250 255
cac ccc gtc tgc gtg gtc tcc agc gcg cgc aag gcc gag gtg tgc cgg 816
His Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg
260 265 270
gcc atg ggc gcg gag gcc atc atc gac cgc tcc gcc gag gac tac cgc 864
Ala Met Gly Ala Glu Ala Ile Ile Asp Arg Ser Ala Glu Asp Tyr Arg
275 280 285
ttc tgg agc gac gag gac acc cag gac ccg cgg gag tgg aag cgc ttc 912
Phe Trp Ser Asp Glu Asp Thr Gln Asp Pro Arg Glu Trp Lys Arg Phe
290 295 300
ggc aag cgc atc cgc gag gtc acc ggg ggc gag gac gtc gac atc gtc 960
Gly Lys Arg Ile Arg Glu Val Thr Gly Gly Glu Asp Val Asp Ile Val
305 310 315 320
ttc gag cac ccc ggc cgg gag acc ttc ggg gcg tcc gtc tac gtc acc 1008
Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr
325 330 335
cgc agg ggc ggc acg atc gtc acc tgc gcc tcc acc tcg ggc ttc cgc 1056
Arg Arg Gly Gly Thr Ile Val Thr Cys Ala Ser Thr Ser Gly Phe Arg
340 345 350
cac gag ttc gac aac cgc tac ctc tgg atg cac ctc aag cgt atc gtc 1104
His Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg Ile Val
355 360 365
ggc acc cac ttc gcc aac tac cgc gag gcg tgg gag gcg aac cgg ctc 1152
Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu
370 375 380
gtc gcc aag ggg agg atc cac ccc acc ctc tcg cgc acc tac ccg ctg 1200
Val Ala Lys Gly Arg Ile His Pro Thr Leu Ser Arg Thr Tyr Pro Leu
385 390 395 400
gcc gac acg gcg gtt gcc gtg cac gac gtg cac ggc aac cag cac cag 1248
Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gln His Gln
405 410 415
ggc aag gtc ggc gtg ctc tgc ctg gcg ccc acg gag ggg ctg ggc gtg 1296
Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val
420 425 430
cgc gac gag gag aag cgg gcg cgg cac atc gac gcg atc aac cgg ttc 1344
Arg Asp Glu Glu Lys Arg Ala Arg His Ile Asp Ala Ile Asn Arg Phe
435 440 445
cgc tga 1350
Arg
450
<210> 10
<211> 449
<212> PRT
<213> Streptomyces ambofaciens
<400> 10
Met Pro Glu Ser His Ala Gln Ser Ala Leu Leu Ala Ala Ile Thr Ala
1 5 10 15
Ala Asp Arg Thr Pro Glu Asp Ile Ala Ala Leu Pro Leu Pro Glu Ser
20 25 30
Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly
35 40 45
Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu
50 55 60
Val Pro Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met
65 70 75 80
Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser Ile Phe Glu Pro
85 90 95
Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu
100 105 110
Ala Ala Arg His Asp Leu Pro Tyr His Ile Leu Gly Ser Asp Leu Ser
115 120 125
Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly
130 135 140
Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp
145 150 155 160
Gly His Asp Asp Thr Met Leu Asp Pro Ala Gln Arg Ile Trp Gly Phe
165 170 175
Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn
180 185 190
Gln Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala
195 200 205
Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gln Leu Val Ser Arg Asn
210 215 220
Gly Ala Gly Met Lys Gln Gly Asp Asn Val Leu Ile Trp Gly Ala Ser
225 230 235 240
Gly Gly Leu Gly Ser Tyr Ala Thr Gln Leu Ala Leu Ala Gly Gly Ala
245 250 255
His Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg
260 265 270
Ala Met Gly Ala Glu Ala Ile Ile Asp Arg Ser Ala Glu Asp Tyr Arg
275 280 285
Phe Trp Ser Asp Glu Asp Thr Gln Asp Pro Arg Glu Trp Lys Arg Phe
290 295 300
Gly Lys Arg Ile Arg Glu Val Thr Gly Gly Glu Asp Val Asp Ile Val
305 310 315 320
Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr
325 330 335
Arg Arg Gly Gly Thr Ile Val Thr Cys Ala Ser Thr Ser Gly Phe Arg
340 345 350
His Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg Ile Val
355 360 365
Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu
370 375 380
Val Ala Lys Gly Arg Ile His Pro Thr Leu Ser Arg Thr Tyr Pro Leu
385 390 395 400
Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gln His Gln
405 410 415
Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val
420 425 430
Arg Asp Glu Glu Lys Arg Ala Arg His Ile Asp Ala Ile Asn Arg Phe
435 440 445
Arg
<210> 11
<211> 675
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(675)
<400> 11
atg atg agc gtg gca gac cag acg gct ctc agc ccc gcg ctg ctg gag 48
Met Met Ser Val Ala Asp Gln Thr Ala Leu Ser Pro Ala Leu Leu Glu
1 5 10 15
tac gcc cgg agc gtc gcg ctg cgg gac gac ggc ctg ctg cgc gaa ctg 96
Tyr Ala Arg Ser Val Ala Leu Arg Asp Asp Gly Leu Leu Arg Glu Leu
20 25 30
cac gag gtg acc gcc ggg ctc ccc ggc ggc cgg gcc atg cag atc atg 144
His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gln Ile Met
35 40 45
ccc gag gag gcg cag ttc ctc gcc ctg ctg atc cgg ctc gtc ggt gcc 192
Pro Glu Glu Ala Gln Phe Leu Ala Leu Leu Ile Arg Leu Val Gly Ala
50 55 60
cgg cgg gtg ctg gag atc ggc acc ttc acg ggg tac agc acg ctg tgc 240
Arg Arg Val Leu Glu Ile Gly Thr Phe Thr Gly Tyr Ser Thr Leu Cys
65 70 75 80
atg gcg cgg gca ctg ccc gcc gac ggc acc gtc gtc acc tgc gac atc 288
Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp Ile
85 90 95
agc gac agg tgg ccc ggc gtc ggc gca ccg tac tgg cgc cgg gcc ggg 336
Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly
100 105 110
gtg gag tcc cgg atc gac ctg cgc gtc ggc gac gcc gtc cgg acc ctc 384
Val Glu Ser Arg Ile Asp Leu Arg Val Gly Asp Ala Val Arg Thr Leu
115 120 125
gcc gag ctc cgc gag cac gag ggg gac ggc tcg ttc gac ctg gtc ttc 432
Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe
130 135 140
gtc gac gcc gac aag acc ggg tac ccg cac tac tac gag cag gcg ctg 480
Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gln Ala Leu
145 150 155 160
gcc ctg gta cgc ccc ggc gga ctg gtg gcg gtc gac aac acc ctg ttc 528
Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe
165 170 175
ttc ggc cgg gtg gcc gac ccg gcc gtc gag gac gcc gac acc gtc gcc 576
Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala
180 185 190
gtg cgc gcg ctc aac gag ctg ctg cgc gac gac gaa cgc gtg gac atc 624
Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp Ile
195 200 205
gcc ctg ctg acg gtc gcc gac ggg atc act ctg gcc cgc cgg cgg gag 672
Ala Leu Leu Thr Val Ala Asp Gly Ile Thr Leu Ala Arg Arg Arg Glu
210 215 220
tga 675
225
<210> 12
<211> 224
<212> PRT
<213> Streptomyces ambofaciens
<400> 12
Met Met Ser Val Ala Asp Gln Thr Ala Leu Ser Pro Ala Leu Leu Glu
1 5 10 15
Tyr Ala Arg Ser Val Ala Leu Arg Asp Asp Gly Leu Leu Arg Glu Leu
20 25 30
His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gln Ile Met
35 40 45
Pro Glu Glu Ala Gln Phe Leu Ala Leu Leu Ile Arg Leu Val Gly Ala
50 55 60
Arg Arg Val Leu Glu Ile Gly Thr Phe Thr Gly Tyr Ser Thr Leu Cys
65 70 75 80
Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp Ile
85 90 95
Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly
100 105 110
Val Glu Ser Arg Ile Asp Leu Arg Val Gly Asp Ala Val Arg Thr Leu
115 120 125
Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe
130 135 140
Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gln Ala Leu
145 150 155 160
Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe
165 170 175
Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala
180 185 190
Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp Ile
195 200 205
Ala Leu Leu Thr Val Ala Asp Gly Ile Thr Leu Ala Arg Arg Arg Glu
210 215 220
<210> 13
<211> 1245
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1245)
<400> 13
gtg ctc cag cgc gtc gat ctg tcg tca ctc acc ggc ctc cgc tgg tat 48
Val Leu Gln Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr
1 5 10 15
gcg gcg ctg acg gta ttc gcc tgt cac atc gcc cag cag ggc ttc ttc 96
Ala Ala Leu Thr Val Phe Ala Cys His Ile Ala Gln Gln Gly Phe Phe
20 25 30
gcc gac cag cag gtg ggc agc gca ctg ctg cac atc acc ccg ctc ggt 144
Ala Asp Gln Gln Val Gly Ser Ala Leu Leu His Ile Thr Pro Leu Gly
35 40 45
tcc atg gcg gtc tcg atc ttc ttc ata ctg agt gga ttc gtc ctc gcc 192
Ser Met Ala Val Ser Ile Phe Phe Ile Leu Ser Gly Phe Val Leu Ala
50 55 60
tgg tcg gcc cgc gac gag gac tcc gtg ccg act ttc tgg cgg cgc cgc 240
Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg
65 70 75 80
atc gcg aag atc tat ccg ctg cat ctc gcg acg ttc ggc atc gcg gct 288
Ile Ala Lys Ile Tyr Pro Leu His Leu Ala Thr Phe Gly Ile Ala Ala
85 90 95
ctc atc att ttc tcc ctg tcg gag ccg gta ctt ccc ggc ggt tcc gta 336
Leu Ile Ile Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val
100 105 110
tgg gac ggg ctg gtg ccc aat gtt ctg ctc gtg cag tcc tgg ctt ccc 384
Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gln Ser Trp Leu Pro
115 120 125
gac gcg acc ctc acg gcc agt ttc aac acg ccc agc tgg tcg ctc tcc 432
Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser
130 135 140
tgt gag atc gcc ttc tat ctg tcg ttc ccg ctg tgg tac cgg ctg gtg 480
Cys Glu Ile Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val
145 150 155 160
cgc agg att ccc gca cgg cgg ctg tgg tgg tgc gcc gcg ggg atc gcc 528
Arg Arg Ile Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly Ile Ala
165 170 175
gtg gcc gtg acg tgt gtg ccc ctg ctg gcg ggc ctg ctc ccg gcg agc 576
Val Ala Val Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser
180 185 190
gag gag gtg gcc ccc ggg atg tcg ctc aac gag gtc tgg ttc gcg tac 624
Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr
195 200 205
tgg ctt ccg ccg gtg cgc atg ctg gag ttc gtc ctc ggc atc gtg atg 672
Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly Ile Val Met
210 215 220
gcg ctg atc ctg cgc gcg ggg atc tgg aag ggc ccc ggt ccg gcg gtc 720
Ala Leu Ile Leu Arg Ala Gly Ile Trp Lys Gly Pro Gly Pro Ala Val
225 230 235 240
tgc acg gcg ctc ctc gcc gcg agt tac ggc ctc acc cag atg gtg ccc 768
Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gln Met Val Pro
245 250 255
ccg atc ttc acc ctc gtc gcc tgc tcc gtc gta ccg gcc gcg ctg ctg 816
Pro Ile Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu
260 265 270
atc acg gcg ctg gcc gac gcc gac gtg cac ggc cgg cgc acg ggg ctg 864
Ile Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu
275 280 285
cgt tcg gcg acg ctg gtg cgg ctg ggc cag tgg tcc ttc gcc ttc tac 912
Arg Ser Ala Thr Leu Val Arg Leu Gly Gln Trp Ser Phe Ala Phe Tyr
290 295 300
ctg gtc cac ttc ctg atc atc cgc tac gga cac cgg ctg atg ggc ggc 960
Leu Val His Phe Leu Ile Ile Arg Tyr Gly His Arg Leu Met Gly Gly
305 310 315 320
gat ctg ggc tac gag cgg cag tgg agc acc ccg gcc gcg atc gcg ctg 1008
Asp Leu Gly Tyr Glu Arg Gln Trp Ser Thr Pro Ala Ala Ile Ala Leu
325 330 335
tcc ctg ggg atg ctg ggg gtg gcg gtc ctg gcc ggc ggt ctg ctg cac 1056
Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His
340 345 350
acc gtc gtc gaa cag ccc tgc atg cgc ctg ttc ggc agc cgc agg tcc 1104
Thr Val Val Glu Gln Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser
355 360 365
gcc tcc cgt ccg aag ccc ggc gcc acc gcg gct ccc cgg aac tca ccc 1152
Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro
370 375 380
gcg gcc gac gcg gcc ggc gtg ccc ctg ctc ccg ggc gta ccc ggg ccc 1200
Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro
385 390 395 400
gcg cac acc ccc gca gcg acg aac gaa ccc acc ccg aga gga tga 1245
Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly
405 410 415
<210> 14
<211> 414
<212> PRT
<213> Streptomyces ambofaciens
<400> 14
Val Leu Gln Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr
1 5 10 15
Ala Ala Leu Thr Val Phe Ala Cys His Ile Ala Gln Gln Gly Phe Phe
20 25 30
Ala Asp Gln Gln Val Gly Ser Ala Leu Leu His Ile Thr Pro Leu Gly
35 40 45
Ser Met Ala Val Ser Ile Phe Phe Ile Leu Ser Gly Phe Val Leu Ala
50 55 60
Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg
65 70 75 80
Ile Ala Lys Ile Tyr Pro Leu His Leu Ala Thr Phe Gly Ile Ala Ala
85 90 95
Leu Ile Ile Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val
100 105 110
Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gln Ser Trp Leu Pro
115 120 125
Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser
130 135 140
Cys Glu Ile Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val
145 150 155 160
Arg Arg Ile Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly Ile Ala
165 170 175
Val Ala Val Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser
180 185 190
Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr
195 200 205
Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly Ile Val Met
210 215 220
Ala Leu Ile Leu Arg Ala Gly Ile Trp Lys Gly Pro Gly Pro Ala Val
225 230 235 240
Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gln Met Val Pro
245 250 255
Pro Ile Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu
260 265 270
Ile Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu
275 280 285
Arg Ser Ala Thr Leu Val Arg Leu Gly Gln Trp Ser Phe Ala Phe Tyr
290 295 300
Leu Val His Phe Leu Ile Ile Arg Tyr Gly His Arg Leu Met Gly Gly
305 310 315 320
Asp Leu Gly Tyr Glu Arg Gln Trp Ser Thr Pro Ala Ala Ile Ala Leu
325 330 335
Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His
340 345 350
Thr Val Val Glu Gln Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser
355 360 365
Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro
370 375 380
Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro
385 390 395 400
Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly
405 410
<210> 15
<211> 849
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(849)
<400> 15
gtg aca ttg aaa tcc cca ctg cca ccg caa tcc gtc tcc gca ccc gct 48
Val Thr Leu Lys Ser Pro Leu Pro Pro Gln Ser Val Ser Ala Pro Ala
1 5 10 15
gat tca cgc agc acc gcg cgg aga gaa tgg ggt cag aac ttc ttt cgt 96
Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gln Asn Phe Phe Arg
20 25 30
aca gcc gcc gcg gcc tgt cgt ttc tcc gct cag ctg gac ggt tcg gac 144
Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gln Leu Asp Gly Ser Asp
35 40 45
acc att ccg ccc gat tct ccg aat gac ctg atg acc gtc gaa ata ggc 192
Thr Ile Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu Ile Gly
50 55 60
gcg gga tca ggg cgg gtg acc aaa gtg ctc gcc tca ccc ggg acg cct 240
Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro
65 70 75 80
tta ctc gcg gtg gaa ata gat ccc cgc tgg gct cgg cgg ctg gcc gcc 288
Leu Leu Ala Val Glu Ile Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala
85 90 95
gaa tcg ctg ccg gac gtc acg gtg gtg aac gag gat ttc ctg acc ctg 336
Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu
100 105 110
caa ctg ccc ggg cag ccg gtc aga ctc atc ggg aat ctt ccc ttc gtc 384
Gln Leu Pro Gly Gln Pro Val Arg Leu Ile Gly Asn Leu Pro Phe Val
115 120 125
acc ggc acc aga atg ctg agg cgc tgc ctc gac atg ggt ccg gcg cgc 432
Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg
130 135 140
atg cgg cag ggc gtg ttc ctg ttg cag cgg gag tac gtg gga aag cgg 480
Met Arg Gln Gly Val Phe Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg
145 150 155 160
acc gga gcc tgg ggc gga aac ctc ttc aac gcc cag tgg gag ccg tgg 528
Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp
165 170 175
tac tcg ttc gac cgg ggc ctg gcc ttc tca cgc cag gac ttc acc ccc 576
Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gln Asp Phe Thr Pro
180 185 190
gta ccg cgc gcg gac acc cag acc ctg atg gtc gcc ccg cac cgc agg 624
Val Pro Arg Ala Asp Thr Gln Thr Leu Met Val Ala Pro His Arg Arg
195 200 205
ccg tcc gtg ccc tgg cgt gag aag gcc gcc tac cag cgg ttc gtc caa 672
Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gln Arg Phe Val Gln
210 215 220
cgg gtc ttc gac acc ggc cag atg acg gtg ggc gac gcc gcg cgg aag 720
Arg Val Phe Asp Thr Gly Gln Met Thr Val Gly Asp Ala Ala Arg Lys
225 230 235 240
gtg ctg cgc cgc gga cac gcc cag ttc gtg cgc ggg gcg ggc gtg agg 768
Val Leu Arg Arg Gly His Ala Gln Phe Val Arg Gly Ala Gly Val Arg
245 250 255
ccg gcc gac cgg gtc aag gac ctc acg gtc ccg gag tgg acc gca ctc 816
Pro Ala Asp Arg Val Lys Asp Leu Thr Val Pro Glu Trp Thr Ala Leu
260 265 270
ttc cgc gcc tac ggg cgg acg gcc gac cgc tga 849
Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg
275 280
<210> 16
<211> 282
<212> PRT
<213> Streptomyces ambofaciens
<400> 16
Val Thr Leu Lys Ser Pro Leu Pro Pro Gln Ser Val Ser Ala Pro Ala
1 5 10 15
Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gln Asn Phe Phe Arg
20 25 30
Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gln Leu Asp Gly Ser Asp
35 40 45
Thr Ile Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu Ile Gly
50 55 60
Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro
65 70 75 80
Leu Leu Ala Val Glu Ile Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala
85 90 95
Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu
100 105 110
Gln Leu Pro Gly Gln Pro Val Arg Leu Ile Gly Asn Leu Pro Phe Val
115 120 125
Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg
130 135 140
Met Arg Gln Gly Val Phe Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg
145 150 155 160
Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp
165 170 175
Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gln Asp Phe Thr Pro
180 185 190
Val Pro Arg Ala Asp Thr Gln Thr Leu Met Val Ala Pro His Arg Arg
195 200 205
Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gln Arg Phe Val Gln
210 215 220
Arg Val Phe Asp Thr Gly Gln Met Thr Val Gly Asp Ala Ala Arg Lys
225 230 235 240
Val Leu Arg Arg Gly His Ala Gln Phe Val Arg Gly Ala Gly Val Arg
245 250 255
Pro Ala Asp Arg Val Lys Asp Leu Thr Val Pro Glu Trp Thr Ala Leu
260 265 270
Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg
275 280
<210> 17
<211> 831
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(831)
<400> 17
gtg aag gag gtg gcg gtc gac acc ggt acc ccg gcc ggc ccc gtg tgg 48
Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp
1 5 10 15
cgt ggt gcc ggc ctc ggc acc cag ctg tgg gta ctg acc gcg cgg cag 96
Arg Gly Ala Gly Leu Gly Thr Gln Leu Trp Val Leu Thr Ala Arg Gln
20 25 30
atc cgt tcc atg tac ggc gac cgc cgc ctg gcg ctg ttc agc ctg atg 144
Ile Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met
35 40 45
caa ccg gtg atc atg ctg ttg ctg ctg agc gag atc ttc ggc agc atg 192
Gln Pro Val Ile Met Leu Leu Leu Leu Ser Glu Ile Phe Gly Ser Met
50 55 60
gcc gac ccg gac gac ttc ccg cag ggc gtg cgc tac atc gac tac gtg 240
Ala Asp Pro Asp Asp Phe Pro Gln Gly Val Arg Tyr Ile Asp Tyr Val
65 70 75 80
gtg ccc gcg ctg ctg gtc acc acc ggc atc ggc tcg gcc cag ggc gcg 288
Val Pro Ala Leu Leu Val Thr Thr Gly Ile Gly Ser Ala Gln Gly Ala
85 90 95
ggg gtg ggc ctg gtc agg gac atg gac aac ggg atg gtg gcg cgc ttc 336
Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe
100 105 110
cgc gtc ctg ccg gcc cgg ctg ttc ctg gtg ctg gtc gcc cgg tcg ctg 384
Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu
115 120 125
gcc gat ctg gtc cgt gtg ttc acc gag ttg gtc gtc ctc gtg gcc gtc 432
Ala Asp Leu Val Arg Val Phe Thr Glu Leu Val Val Leu Val Ala Val
130 135 140
ggt gtg atc ctg ctg ggc ttc cgt ccg gcc ggg ggt ttg tgg ggc acg 480
Gly Val Ile Leu Leu Gly Phe Arg Pro Ala Gly Gly Leu Trp Gly Thr
145 150 155 160
tcc gcc gcc ctg ttg ctc acc ctg ttc gtc atc tgg tcg ctg atc tgg 528
Ser Ala Ala Leu Leu Leu Thr Leu Phe Val Ile Trp Ser Leu Ile Trp
165 170 175
ggg ttc atc gcc ctc gcg gcg tgg ctg cgc agc gtg gag gtg atg tcc 576
Gly Phe Ile Ala Leu Ala Ala Trp Leu Arg Ser Val Glu Val Met Ser
180 185 190
agc ctc gcg gtt ctg gtg atg ttc ccg ctc atg ttc gcc tcc agt gcg 624
Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala
195 200 205
ttc gtc ccg ctg gac gcc ctc ccg gag tgg ctg cgc tcg gtg gcg cac 672
Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala His
210 215 220
ctc aac ccc gtg acg tac gcg gtc gac agc gcc cgc cgc ctg gcg ctg 720
Leu Asn Pro Val Thr Tyr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu
225 230 235 240
gac tgg gac ccg ggg tgg agc gtg ccc ggc gcg ctg ctg acc agc acc 768
Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr
245 250 255
gcg ctc atg gcg gtg ggg atg tac gtc gcc ggg cgt tcc ttc aag agg 816
Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg
260 265 270
ccc ccg aac gaa tga 831
Pro Pro Asn Glu
275
<210> 18
<211> 276
<212> PRT
<213> Streptomyces ambofaciens
<400> 18
Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp
1 5 10 15
Arg Gly Ala Gly Leu Gly Thr Gln Leu Trp Val Leu Thr Ala Arg Gln
20 25 30
Ile Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met
35 40 45
Gln Pro Val Ile Met Leu Leu Leu Leu Ser Glu Ile Phe Gly Ser Met
50 55 60
Ala Asp Pro Asp Asp Phe Pro Gln Gly Val Arg Tyr Ile Asp Tyr Val
65 70 75 80
Val Pro Ala Leu Leu Val Thr Thr Gly Ile Gly Ser Ala Gln Gly Ala
85 90 95
Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe
100 105 110
Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu
115 120 125
Ala Asp Leu Val Arg Val Phe Thr Glu Leu Val Val Leu Val Ala Val
130 135 140
Gly Val Ile Leu Leu Gly Phe Arg Pro Ala Gly Gly Leu Trp Gly Thr
145 150 155 160
Ser Ala Ala Leu Leu Leu Thr Leu Phe Val Ile Trp Ser Leu Ile Trp
165 170 175
Gly Phe Ile Ala Leu Ala Ala Trp Leu Arg Ser Val Glu Val Met Ser
180 185 190
Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala
195 200 205
Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala His
210 215 220
Leu Asn Pro Val Thr Tyr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu
225 230 235 240
Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr
245 250 255
Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg
260 265 270
Pro Pro Asn Glu
275
<210> 19
<211> 882
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(882)
<400> 19
gtg gac atc gag gtc gaa cgg ggc cgg gtg ctc ggg ctg ctg ggt cac 48
Val Asp Ile Glu Val Glu Arg Gly Arg Val Leu Gly Leu Leu Gly His
1 5 10 15
aac ggg gcc ggc aag acg acc ttg gtg aac atc ctt gcc acg gtc tcc 96
Asn Gly Ala Gly Lys Thr Thr Leu Val Asn Ile Leu Ala Thr Val Ser
20 25 30
ccg gcg tcc gcg ggc acg gtg acc gtc gcc ggt ttc gac gtc gcg acg 144
Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr
35 40 45
cag ggc gcc gag atc cgc gcg cgc atc ggg gtg acc ggc cag ttc gcg 192
Gln Gly Ala Glu Ile Arg Ala Arg Ile Gly Val Thr Gly Gln Phe Ala
50 55 60
tcg gtg gac gag tac ctg agc gga ttc cgc aac ctc gtc ctg atc ggc 240
Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu Ile Gly
65 70 75 80
cgc ctc ctc ggg gcg gga cgg cgt gag gcg gcg gcc cgg gcc acc gag 288
Arg Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu
85 90 95
ctc ctg gag ctg ttc gag ctg acc ggg gcg gcc cac cag ccc tcc cgc 336
Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gln Pro Ser Arg
100 105 110
acc tac tcg ggc ggg atg cgc cga cgg ctc gac ctc gcc gcc agc ctg 384
Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu
115 120 125
gtc ggc cgg ccg gac gtg ctg ttc ctc gac gag ccg acg acc ggg ctg 432
Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu
130 135 140
gac ccg gcg acc cgg atc gcc ctg tgg gag acg gtg gag aag ctg gtg 480
Asp Pro Ala Thr Arg Ile Ala Leu Trp Glu Thr Val Glu Lys Leu Val
145 150 155 160
gcg ggc ggc acg acc gtc ctg ctg acc acc cag tac ctg gac gag gcg 528
Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gln Tyr Leu Asp Glu Ala
165 170 175
gac cgg ctg gcc gac tgg atc acc gtc ctg tcg aag ggc cgg gtg gtg 576
Asp Arg Leu Ala Asp Trp Ile Thr Val Leu Ser Lys Gly Arg Val Val
180 185 190
gcc tcg gac acc acc gac cgg ctc aag gcc gac ctg ggc cac cgg tcg 624
Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser
195 200 205
gtg cgg gtg gtc ctt ccg ccc gcc gcc gac ctg acg gcc gcc gcc gcc 672
Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala
210 215 220
gcg ctc acc gcc ggc ggg ttc cgt ccg cgg tcc gac gcc ggg gag cac 720
Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His
225 230 235 240
gcg ctg acc acg ccc gtg gac acc tcg gcc ggt atc gcg ggc gtc atc 768
Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly Ile Ala Gly Val Ile
245 250 255
cgc gcg ctg gac acc gtc gga acg cag gcc gtc gag ctg acc gtc aag 816
Arg Ala Leu Asp Thr Val Gly Thr Gln Ala Val Glu Leu Thr Val Lys
260 265 270
gag ccg tcc ctg gac gac gtc tac ctg gcg ctc acc cat ccc tca ccc 864
Glu Pro Ser Leu Asp Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro
275 280 285
gcc gcc gac gcg gcc tga 882
Ala Ala Asp Ala Ala
290
<210> 20
<211> 293
<212> PRT
<213> Streptomyces ambofaciens
<400> 20
Val Asp Ile Glu Val Glu Arg Gly Arg Val Leu Gly Leu Leu Gly His
1 5 10 15
Asn Gly Ala Gly Lys Thr Thr Leu Val Asn Ile Leu Ala Thr Val Ser
20 25 30
Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr
35 40 45
Gln Gly Ala Glu Ile Arg Ala Arg Ile Gly Val Thr Gly Gln Phe Ala
50 55 60
Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu Ile Gly
65 70 75 80
Arg Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu
85 90 95
Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gln Pro Ser Arg
100 105 110
Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu
115 120 125
Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu
130 135 140
Asp Pro Ala Thr Arg Ile Ala Leu Trp Glu Thr Val Glu Lys Leu Val
145 150 155 160
Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gln Tyr Leu Asp Glu Ala
165 170 175
Asp Arg Leu Ala Asp Trp Ile Thr Val Leu Ser Lys Gly Arg Val Val
180 185 190
Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser
195 200 205
Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala
210 215 220
Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His
225 230 235 240
Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly Ile Ala Gly Val Ile
245 250 255
Arg Ala Leu Asp Thr Val Gly Thr Gln Ala Val Glu Leu Thr Val Lys
260 265 270
Glu Pro Ser Leu Asp Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro
275 280 285
Ala Ala Asp Ala Ala
290
<210> 21
<211> 228
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(228)
<400> 21
atg agc aac ccg ttc gag gac acg gaa gcc acc tac gtc gtg ctg gtc 48
Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val
1 5 10 15
aac gac gag ggg cag cac tcg ctg tgg ccg tcg ttc gcg gag gtc ccg 96
Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro
20 25 30
gcg ggc tgg tcc gtc gtg gtg ccg gag acg gac cgg cag tcg tgc ctg 144
Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gln Ser Cys Leu
35 40 45
gac tac atc aac gag aac tgg acc gac atg cgc ccc aag agc ctc gtc 192
Asp Tyr Ile Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val
50 55 60
gag gcg atg gcg acg gcc ggg cag gac gcc cct tga 228
Glu Ala Met Ala Thr Ala Gly Gln Asp Ala Pro
65 70 75
<210> 22
<211> 75
<212> PRT
<213> Streptomyces ambofaciens
<400> 22
Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val
1 5 10 15
Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro
20 25 30
Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gln Ser Cys Leu
35 40 45
Asp Tyr Ile Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val
50 55 60
Glu Ala Met Ala Thr Ala Gly Gln Asp Ala Pro
65 70 75
<210> 23
<211> 1212
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1212)
<400> 23
atg ggt gag gcc gtg acg gga ccg atg gag ctg agc aag gac gcg gac 48
Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp
1 5 10 15
gcc cgg ggg ctg ctt gag tgg ttc gcg tac aac agg acg cgt cat ccg 96
Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro
20 25 30
gtg ttc tgg gac gag acc cga cag gcg tgg cag gtc ttc ggc tac gac 144
Val Phe Trp Asp Glu Thr Arg Gln Ala Trp Gln Val Phe Gly Tyr Asp
35 40 45
gac tac gtg acg gtg tcg aac aac ccg cag ttc ttc tcc tcg gac ttc 192
Asp Tyr Val Thr Val Ser Asn Asn Pro Gln Phe Phe Ser Ser Asp Phe
50 55 60
aac atg gtg atg ccg acg ccg ccc gaa ctg gag atg atc atc ggt ccg 240
Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met Ile Ile Gly Pro
65 70 75 80
ggc acg atc ggc gcg ctg gac ccg ccc gcg cac gga ccg atg cgc aag 288
Gly Thr Ile Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arg Lys
85 90 95
ctg gtg agc cag gcg ttc acc ccc cga cgg atc gcc cgg ctg gag ccc 336
Leu Val Ser Gln Ala Phe Thr Pro Arg Arg Ile Ala Arg Leu Glu Pro
100 105 110
agg gtg cgc gcg atc acc gag gag ctc ctg gac aag gtg ggg cag cag 384
Arg Val Arg Ala Ile Thr Glu Glu Leu Leu Asp Lys Val Gly Gln Gln
115 120 125
gac gtc gtc gac gcc gtg ggt gac ctg tcc tac gcg ctg ccg gtc atc 432
Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val Ile
130 135 140
gtg atc gcc gaa ctg ctg ggc ata ccc gcc ggc gac cgt gac ctg ttc 480
Val Ile Ala Glu Leu Leu Gly Ile Pro Ala Gly Asp Arg Asp Leu Phe
145 150 155 160
cgg gag tgg gtc gac acc ctg ctg acg aac gag ggc ctg gag tac ccg 528
Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro
165 170 175
aac ctc ccg gac aac ttc acc gag acg atc gcg ccc gcg ctc aag gag 576
Asn Leu Pro Asp Asn Phe Thr Glu Thr Ile Ala Pro Ala Leu Lys Glu
180 185 190
atg acc gac tac ctc ctg aag cag atc cac gcc aag cgg gac gcg ccc 624
Met Thr Asp Tyr Leu Leu Lys Gln Ile His Ala Lys Arg Asp Ala Pro
195 200 205
gcc gac gac ctg gtc agc ggg ctg gtc cag gcg gag cag gac ggc cgc 672
Ala Asp Asp Leu Val Ser Gly Leu Val Gln Ala Glu Gln Asp Gly Arg
210 215 220
cgg ctg acc gac gtc gag atc gtc aac atc gtc gcg ctg ctc ctg acg 720
Arg Leu Thr Asp Val Glu Ile Val Asn Ile Val Ala Leu Leu Leu Thr
225 230 235 240
gcg ggg cac gtc tcc tcc agc acc ctg ctc agc aac ctg ttc ctg gtc 768
Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val
245 250 255
ctg gag gag aac ccg cag gcg ctg gag gac ctg cgg gcc gat cgc tcc 816
Leu Glu Glu Asn Pro Gln Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser
260 265 270
ctg gtg ccc ggc gcg atc gag gag acg ctg cgc tac cgc agc ccc ttc 864
Leu Val Pro Gly Ala Ile Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe
275 280 285
aac aac atc ttc cgg ttc gtc aag gag gac acc acc gtc ctc ggt ccg 912
Asn Asn Ile Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro
290 295 300
ctc atg gag aag ggc cag atg gtg atc gcc tgg agc cag tcc gcc aac 960
Leu Met Glu Lys Gly Gln Met Val Ile Ala Trp Ser Gln Ser Ala Asn
305 310 315 320
cgg gac ccc cgg cac ttc ccg gac ccg gac acc ttc gac atc cgc cgc 1008
Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp Ile Arg Arg
325 330 335
tcg gac ggc acc cgg cac atg gcc ttc ggg cac ggc atc cac cac tgc 1056
Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly Ile His His Cys
340 345 350
ctg ggt gcc gcc ctc gcc cgc ctg gag ggc aag gtc atg ctc gaa ctc 1104
Leu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu Leu
355 360 365
ctc ctg gac cgg gtc caa ggc ttc cgc atc gac cac gag cac acc gtg 1152
Leu Leu Asp Arg Val Gln Gly Phe Arg Ile Asp His Glu His Thr Val
370 375 380
ttc tac gag gcc gac cag ctc act ccg aag tac ctg ccc gtc cgg gtc 1200
Phe Tyr Glu Ala Asp Gln Leu Thr Pro Lys Tyr Leu Pro Val Arg Val
385 390 395 400
gac tgg aac tga 1212
Asp Trp Asn
<210> 24
<211> 403
<212> PRT
<213> Streptomyces ambofaciens
<400> 24
Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp
1 5 10 15
Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro
20 25 30
Val Phe Trp Asp Glu Thr Arg Gln Ala Trp Gln Val Phe Gly Tyr Asp
35 40 45
Asp Tyr Val Thr Val Ser Asn Asn Pro Gln Phe Phe Ser Ser Asp Phe
50 55 60
Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met Ile Ile Gly Pro
65 70 75 80
Gly Thr Ile Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arg Lys
85 90 95
Leu Val Ser Gln Ala Phe Thr Pro Arg Arg Ile Ala Arg Leu Glu Pro
100 105 110
Arg Val Arg Ala Ile Thr Glu Glu Leu Leu Asp Lys Val Gly Gln Gln
115 120 125
Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val Ile
130 135 140
Val Ile Ala Glu Leu Leu Gly Ile Pro Ala Gly Asp Arg Asp Leu Phe
145 150 155 160
Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro
165 170 175
Asn Leu Pro Asp Asn Phe Thr Glu Thr Ile Ala Pro Ala Leu Lys Glu
180 185 190
Met Thr Asp Tyr Leu Leu Lys Gln Ile His Ala Lys Arg Asp Ala Pro
195 200 205
Ala Asp Asp Leu Val Ser Gly Leu Val Gln Ala Glu Gln Asp Gly Arg
210 215 220
Arg Leu Thr Asp Val Glu Ile Val Asn Ile Val Ala Leu Leu Leu Thr
225 230 235 240
Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val
245 250 255
Leu Glu Glu Asn Pro Gln Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser
260 265 270
Leu Val Pro Gly Ala Ile Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe
275 280 285
Asn Asn Ile Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro
290 295 300
Leu Met Glu Lys Gly Gln Met Val Ile Ala Trp Ser Gln Ser Ala Asn
305 310 315 320
Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp Ile Arg Arg
325 330 335
Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly Ile His His Cys
340 345 350
Leu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu Leu
355 360 365
Leu Leu Asp Arg Val Gln Gly Phe Arg Ile Asp His Glu His Thr Val
370 375 380
Phe Tyr Glu Ala Asp Gln Leu Thr Pro Lys Tyr Leu Pro Val Arg Val
385 390 395 400
Asp Trp Asn
<210> 25
<211> 540
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(540)
<220>
<221> CDS
<222> (190)..(540)
<400> 25
ctg aac ccg agg gtc tcg tcc cgg agt cca ggg ccg tcc cga gcc ggc 48
Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly
1 5 10 15
cct gga cct cac gac cgc ccg ata agg agc gcc gcc atc gcc gag aac 96
Pro Gly Pro His Asp Arg Pro Ile Arg Ser Ala Ala Ile Ala Glu Asn
20 25 30
aca gcc gag ctc cct gcc cgg cgg gtc ggc agg atc aag ccg tgc cgg 144
Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg Ile Lys Pro Cys Arg
35 40 45
ctg atc agg ctc gag cag cac atc gac ccg cgc ggc agc ctc tcc gtg 192
Leu Ile Arg Leu Glu Gln His Ile Asp Pro Arg Gly Ser Leu Ser Val
50 55 60
atc gag tcc ggc gtg acc gtg gac ttc ccc gtc cga cgc gtc tac tac 240
Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr
65 70 75 80
atg cat ggc cag acc cag tcc tct ccc ccg cgc ggc ctg cac gcg cac 288
Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala His
85 90 95
cgc acc ctg gaa caa ctc gtc atc gcc gtc cac ggc gcc ttc tcc atc 336
Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser Ile
100 105 110
acc ctc gac gac ggc ttc cag cac gcc acc tac cgt ctg gac gaa ccc 384
Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu Pro
115 120 125
gga gcc gga ctc tgc atc ggc ccc atg gtc tgg cgc gtc ctg aag gac 432
Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys Asp
130 135 140
ttc gac ccc gac acc gtg gcc ctg gtc ctc gcc tcg cag cac tac gag 480
Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr Glu
145 150 155 160
gag tcc gac tac tac cgc gac tac gac acc ttc ctg cat gac gca cgg 528
Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala Arg
165 170 175
agc ctc aca tga 540
Ser Leu Thr
180
<210> 26
<211> 179
<212> PRT
<213> Streptomyces ambofaciens
<400> 26
Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly
1 5 10 15
Pro Gly Pro His Asp Arg Pro Ile Arg Ser Ala Ala Ile Ala Glu Asn
20 25 30
Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg Ile Lys Pro Cys Arg
35 40 45
Leu Ile Arg Leu Glu Gln His Ile Asp Pro Arg Gly Ser Leu Ser Val
50 55 60
Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr
65 70 75 80
Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala His
85 90 95
Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser Ile
100 105 110
Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu Pro
115 120 125
Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys Asp
130 135 140
Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr Glu
145 150 155 160
Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala Arg
165 170 175
Ser Leu Thr
<210> 27
<211> 116
<212> PRT
<213> Streptomyces ambofaciens
<400> 27
Val Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr
1 5 10 15
Tyr Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala
20 25 30
His Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser
35 40 45
Ile Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu
50 55 60
Pro Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys
65 70 75 80
Asp Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr
85 90 95
Glu Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala
100 105 110
Arg Ser Leu Thr
115
<210> 28
<211> 1167
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1167)
<400> 28
atg acc atc ccc ttc ctc gac gcg ggc gcc ggc tac cgg gag ttg cga 48
Met Thr Ile Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg
1 5 10 15
gcc gag atc gac gcg gcc ctg cag cgg gtg tcc gcc tcc ggc cgc tat 96
Ala Glu Ile Asp Ala Ala Leu Gln Arg Val Ser Ala Ser Gly Arg Tyr
20 25 30
ctg ctc gac gcg gaa ctc gcg gcc ttc gag gag gag ttc gcc gcg tac 144
Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr
35 40 45
tgc gac aac gac cac tgt gtg gcg gtg ggc agt ggc tgc gac gcg ctg 192
Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu
50 55 60
gag ctg tcc ctg cgg gcg ctg gac atc ggt ccc ggg gac gag gtg gtg 240
Glu Leu Ser Leu Arg Ala Leu Asp Ile Gly Pro Gly Asp Glu Val Val
65 70 75 80
gtg ccc gcg cac acc ttc atc ggg acc tgg ctg gcc gtg tcc gct acc 288
Val Pro Ala His Thr Phe Ile Gly Thr Trp Leu Ala Val Ser Ala Thr
85 90 95
ggg gca cgg ccg gtg gcc gtc gac ccg acg ccg gac ggg ctc tcc ctc 336
Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu
100 105 110
gac ccg gcg ctg gtg gag gcg gcg ctc acc cct cgg acc aga gcc ctg 384
Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu
115 120 125
atg ccg gtg cac ctg cac ggg cac ccg gcc gac ctc gac ccg cta ctg 432
Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu
130 135 140
gcg atc gcc gga cgg cac ggc ctg gcc gtg gtc gag gac gcc gcg cag 480
Ala Ile Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gln
145 150 155 160
gcc cac ggc gcc cgt tac cgg ggc cgc agg atc ggc tcg ggc cac gtg 528
Ala His Gly Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Val
165 170 175
gtc gcg ttc agc ttc tac ccc ggc aag aac ctc ggc gcc atg ggg gac 576
Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp
180 185 190
ggc ggc gcg gtg gtc acg ggt gac tcc ggt gtg gcc gag cgg atc cgg 624
Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg Ile Arg
195 200 205
ttg ctg cgc aac tgc ggc tcg cgg gag aag tac cgg cac gag gtg cgc 672
Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Val Arg
210 215 220
tcg acc cac tcc cgg ctc gac gag ttc cag gcg gcc gtg ctg cgg gcc 720
Ser Thr His Ser Arg Leu Asp Glu Phe Gln Ala Ala Val Leu Arg Ala
225 230 235 240
aaa ctg ccg cgg ctc gac gcg tgg aac gcc cgc cgg gcc ggc acg gcc 768
Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala
245 250 255
gaa cgg tac ggg cgg gcc ctg ggt ccg gta ccg cag atc gcc gtc ccg 816
Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gln Ile Ala Val Pro
260 265 270
gtc acc gct ccc tgg gcc gac ccg gtg tgg cac ctg tac gtg atc cgc 864
Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val Ile Arg
275 280 285
tgc gcg gag cgc gac gag ctg cgc cgc cgg ctg gaa cga gcc ggg gtc 912
Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val
290 295 300
cag acc ctg atc cac tac ccc gtg ccc ccg cac cgg tcc ccg gcc tac 960
Gln Thr Leu Ile His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr
305 310 315 320
gcc gac gac ccg gcc ggc gca ccg gcg ggg acc cac ccg ctc agt gag 1008
Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu
325 330 335
cgc ctg gcg gcg cag agc ctc agc ctt ccc ctg gga ccg cac ctc ggg 1056
Arg Leu Ala Ala Gln Ser Leu Ser Leu Pro Leu Gly Pro His Leu Gly
340 345 350
gag gac gag gcc cgc gcc gtc gtg gcg gcg gtc cgg gcg gcg tcc gca 1104
Glu Asp Glu Ala Arg Ala Val Val Ala Ala Val Arg Ala Ala Ser Ala
355 360 365
ggg ctg gcg gcg tac ccg acg ccg gac ggc cag cgt ttt cct cta gtg 1152
Gly Leu Ala Ala Tyr Pro Thr Pro Asp Gly Gln Arg Phe Pro Leu Val
370 375 380
acg gag aaa cga tga 1167
Thr Glu Lys Arg
385
<210> 29
<211> 388
<212> PRT
<213> Streptomyces ambofaciens
<400> 29
Met Thr Ile Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg
1 5 10 15
Ala Glu Ile Asp Ala Ala Leu Gln Arg Val Ser Ala Ser Gly Arg Tyr
20 25 30
Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr
35 40 45
Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu
50 55 60
Glu Leu Ser Leu Arg Ala Leu Asp Ile Gly Pro Gly Asp Glu Val Val
65 70 75 80
Val Pro Ala His Thr Phe Ile Gly Thr Trp Leu Ala Val Ser Ala Thr
85 90 95
Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu
100 105 110
Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu
115 120 125
Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu
130 135 140
Ala Ile Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gln
145 150 155 160
Ala His Gly Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Val
165 170 175
Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp
180 185 190
Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg Ile Arg
195 200 205
Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Val Arg
210 215 220
Ser Thr His Ser Arg Leu Asp Glu Phe Gln Ala Ala Val Leu Arg Ala
225 230 235 240
Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala
245 250 255
Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gln Ile Ala Val Pro
260 265 270
Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val Ile Arg
275 280 285
Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val
290 295 300
Gln Thr Leu Ile His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr
305 310 315 320
Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu
325 330 335
Arg Leu Ala Ala Gln Ser Leu Ser Leu Pro Leu Gly Pro His Leu Gly
340 345 350
Glu Asp Glu Ala Arg Ala Val Val Ala Ala Val Arg Ala Ala Ser Ala
355 360 365
Gly Leu Ala Ala Tyr Pro Thr Pro Asp Gly Gln Arg Phe Pro Leu Val
370 375 380
Thr Glu Lys Arg
385
<210> 30
<211> 909
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(909)
<220>
<221> CDS
<222> (10)..(909)
<220>
<221> CDS
<222> (28)..(909)
<400> 30
atg acc gag gtc atg tca ggg cgt ccc gga atg aaa ggg atc atc ctc 48
Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu
1 5 10 15
gca ggc ggc gga ggg acc cgc cta cgc ccc ttg acc ggc acg ctg tcc 96
Ala Gly Gly Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser
20 25 30
aag caa ctg ctg ccc gtc tac gac aag ccg atg atc tac tac ccg ctg 144
Lys Gln Leu Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu
35 40 45
tcc gtc ctg atg ctg ggc ggc atc cgc gag atc ctc gtc gtc tcc tcc 192
Ser Val Leu Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser
50 55 60
acc cag cac atc gag ctg ttc cag cgg ctg ctg ggc gac ggc tcc cgc 240
Thr Gln His Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp Gly Ser Arg
65 70 75 80
ctc ggc ctc gac atc acc tac gcc gaa cag gcc gag ccc gag ggc ata 288
Leu Gly Leu Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile
85 90 95
gcg cag gcc atc acc atc ggc acc gac cac atc ggc gac tca ccg gtc 336
Ala Gln Ala Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val
100 105 110
gcg ctc atc ctg ggc gac aac atc ttc cac ggc ccc ggc ttc tcg gcc 384
Ala Leu Ile Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala
115 120 125
gtg ctc cag ggc agc atc cgc cac ctc gac ggc tgt gtg ctg ttc ggc 432
Val Leu Gln Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly
130 135 140
tac ccg gtc agc gac ccg aag cgc tac ggc gtc ggc gag atc gac gac 480
Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp
145 150 155 160
cag ggc gta ctg ctg tcc ctg gag gag aaa ccg gcc cgg ccc cgc tcc 528
Gln Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser
165 170 175
aac ctc gcc gtc acc ggc ctc tac ctc tac gac aac gac gtg gtc gac 576
Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp
180 185 190
atc gcc aag aac atc cgg ccc tcg gcg cgc ggc gaa ctc gag atc acg 624
Ile Ala Lys Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr
195 200 205
gac gtc aac agg acc tac ctg gag cag aaa cgc gcc cgg ctc atc gaa 672
Asp Val Asn Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu
210 215 220
ctg ggc cac ggc ttc gcc tgg ctc gac atg ggc acc cac gac tcc ctc 720
Leu Gly His Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu
225 230 235 240
ctc cag ggc ggc cag tac gtc cag ctc atc gag cag cgc cag gga gtg 768
Leu Gln Gly Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val
245 250 255
cgg atc gcc tgc atc gag gag atc gcc ctg cgc atg ggc ttc atc gac 816
Arg Ile Ala Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp
260 265 270
gcc gac acc ctc cac cgg ctc ggc cgc gaa ctg ggc acc tcc gga tac 864
Ala Asp Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr
275 280 285
ggc gcg tac ctg atg gag gtg gcc acc cgt gca ggc acc gaa tga 909
Gly Ala Tyr Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu
290 295 300
<210> 31
<211> 302
<212> PRT
<213> Streptomyces ambofaciens
<400> 31
Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu
1 5 10 15
Ala Gly Gly Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser
20 25 30
Lys Gln Leu Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu
35 40 45
Ser Val Leu Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser
50 55 60
Thr Gln His Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp Gly Ser Arg
65 70 75 80
Leu Gly Leu Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile
85 90 95
Ala Gln Ala Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val
100 105 110
Ala Leu Ile Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala
115 120 125
Val Leu Gln Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly
130 135 140
Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp
145 150 155 160
Gln Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser
165 170 175
Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp
180 185 190
Ile Ala Lys Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr
195 200 205
Asp Val Asn Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu
210 215 220
Leu Gly His Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu
225 230 235 240
Leu Gln Gly Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val
245 250 255
Arg Ile Ala Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp
260 265 270
Ala Asp Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr
275 280 285
Gly Ala Tyr Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu
290 295 300
<210> 32
<211> 299
<212> PRT
<213> Streptomyces ambofaciens
<400> 32
Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu Ala Gly Gly
1 5 10 15
Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser Lys Gln Leu
20 25 30
Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu Ser Val Leu
35 40 45
Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser Thr Gln His
50 55 60
Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu
65 70 75 80
Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile Ala Gln Ala
85 90 95
Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val Ala Leu Ile
100 105 110
Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala Val Leu Gln
115 120 125
Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly Tyr Pro Val
130 135 140
Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp Gln Gly Val
145 150 155 160
Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala
165 170 175
Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp Ile Ala Lys
180 185 190
Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr Asp Val Asn
195 200 205
Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu Leu Gly His
210 215 220
Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu Leu Gln Gly
225 230 235 240
Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val Arg Ile Ala
245 250 255
Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp Ala Asp Thr
260 265 270
Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr Gly Ala Tyr
275 280 285
Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu
290 295
<210> 33
<211> 293
<212> PRT
<213> Streptomyces ambofaciens
<400> 33
Gly Met Lys Gly Ile Ile Leu Ala Gly Gly Gly Gly Thr Arg Leu Arg
1 5 10 15
Pro Leu Thr Gly Thr Leu Ser Lys Gln Leu Leu Pro Val Tyr Asp Lys
20 25 30
Pro Met Ile Tyr Tyr Pro Leu Ser Val Leu Met Leu Gly Gly Ile Arg
35 40 45
Glu Ile Leu Val Val Ser Ser Thr Gln His Ile Glu Leu Phe Gln Arg
50 55 60
Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu Asp Ile Thr Tyr Ala Glu
65 70 75 80
Gln Ala Glu Pro Glu Gly Ile Ala Gln Ala Ile Thr Ile Gly Thr Asp
85 90 95
His Ile Gly Asp Ser Pro Val Ala Leu Ile Leu Gly Asp Asn Ile Phe
100 105 110
His Gly Pro Gly Phe Ser Ala Val Leu Gln Gly Ser Ile Arg His Leu
115 120 125
Asp Gly Cys Val Leu Phe Gly Tyr Pro Val Ser Asp Pro Lys Arg Tyr
130 135 140
Gly Val Gly Glu Ile Asp Asp Gln Gly Val Leu Leu Ser Leu Glu Glu
145 150 155 160
Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala Val Thr Gly Leu Tyr Leu
165 170 175
Tyr Asp Asn Asp Val Val Asp Ile Ala Lys Asn Ile Arg Pro Ser Ala
180 185 190
Arg Gly Glu Leu Glu Ile Thr Asp Val Asn Arg Thr Tyr Leu Glu Gln
195 200 205
Lys Arg Ala Arg Leu Ile Glu Leu Gly His Gly Phe Ala Trp Leu Asp
210 215 220
Met Gly Thr His Asp Ser Leu Leu Gln Gly Gly Gln Tyr Val Gln Leu
225 230 235 240
Ile Glu Gln Arg Gln Gly Val Arg Ile Ala Cys Ile Glu Glu Ile Ala
245 250 255
Leu Arg Met Gly Phe Ile Asp Ala Asp Thr Leu His Arg Leu Gly Arg
260 265 270
Glu Leu Gly Thr Ser Gly Tyr Gly Ala Tyr Leu Met Glu Val Ala Thr
275 280 285
Arg Ala Gly Thr Glu
290
<210> 34
<211> 1038
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1038)
<400> 34
gtg cag gca ccg aat gag acg ccg cgc cgg ccc gcc cgc tcc gcc ggc 48
Val Gln Ala Pro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly
1 5 10 15
cga cgg ccg ccg gcc cgg atc ctc gtc acc ggg ggc gcc ggc ttc atc 96
Arg Arg Pro Pro Ala Arg Ile Leu Val Thr Gly Gly Ala Gly Phe Ile
20 25 30
ggc tcg cgc ttc gtg aac gcg ctg ctg gac ggc tcc ctg ccg gag ttc 144
Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe
35 40 45
ggc aaa ccc gag gtg agg gtg ctc gac gcg ctc acc tac gcg ggc aac 192
Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn
50 55 60
ctg gcc aat ctg gcc ccg gtg ggc gac tgt ccc cgg ctg cgg atc ttc 240
Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg Ile Phe
65 70 75 80
ccg ggg gac atc cgc gac cgc ggc gcg gtc acc cag gcg atg gcg ggg 288
Pro Gly Asp Ile Arg Asp Arg Gly Ala Val Thr Gln Ala Met Ala Gly
85 90 95
gtc gac ctg gtg gtg cac ttc gcg gcc gag tcg cac gtg gac cgc tcg 336
Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser
100 105 110
atc gac gac gcc gac gcc ttc gtg cgc acc aac gtg ctg ggc acc cag 384
Ile Asp Asp Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gln
115 120 125
gtc ctc ctc cag gag gca ctg gcc gta cgc ccc ggg ctg ttc gtg cac 432
Val Leu Leu Gln Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val His
130 135 140
gtc tcg acg gac gag gtg tac ggc tcc atc gag gag ggg tcc tgg ccc 480
Val Ser Thr Asp Glu Val Tyr Gly Ser Ile Glu Glu Gly Ser Trp Pro
145 150 155 160
gag gag cac ccg ctg aac ccc aac tcg ccc tac gcc gcc tcg aag gcg 528
Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala
165 170 175
tcc tcc gac ctg ctg gcg ctg gcc cac cac cgc acg cac gga ctg ccg 576
Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro
180 185 190
gtg tgc gtc acc cgc tgc tcc aac aac tac ggg ccc tac cag tac ccg 624
Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gln Tyr Pro
195 200 205
gag aag atc atc ccg ctg ttc acc agc agc ctc ctc gac ggc ggg acc 672
Glu Lys Ile Ile Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr
210 215 220
gtc ccg ctc tac ggg gac ggc ggc aac cgg cgc gac tgg ctg cac gtg 720
Val Pro Leu Tyr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val
225 230 235 240
gac gac cac tgc cgg ggc atc gcc ctg gtg gcc cgg ggc ggc cgg ccc 768
Asp Asp His Cys Arg Gly Ile Ala Leu Val Ala Arg Gly Gly Arg Pro
245 250 255
ggc gag gtc tac aac atc ggc ggc ggc acc gag ctg agc aac gtc gag 816
Gly Glu Val Tyr Asn Ile Gly Gly Gly Thr Glu Leu Ser Asn Val Glu
260 265 270
ctc acg gag cgt ctg ctg aaa ctg tgc gga gcc gac tgg tcg gcg gtg 864
Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val
275 280 285
cgg cgg gtg ccc gac cgc aag ggc cac gac cgg cgc tac tcc gtc gac 912
Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp
290 295 300
tac acc aag atc gcg gac gag ctg ggt tac gcg ccg cgg atc acc atc 960
Tyr Thr Lys Ile Ala Asp Glu Leu Gly Tyr Ala Pro Arg Ile Thr Ile
305 310 315 320
gac gaa ggg ctg gag cgg acc gtg cac tgg tac cgg gag aac cgc gcg 1008
Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala
325 330 335
tgg tgg gcg ccc gcg aag agg ggg cga tga 1038
Trp Trp Ala Pro Ala Lys Arg Gly Arg
340 345
<210> 35
<211> 345
<212> PRT
<213> Streptomyces ambofaciens
<400> 35
Val Gln Ala Pro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly
1 5 10 15
Arg Arg Pro Pro Ala Arg Ile Leu Val Thr Gly Gly Ala Gly Phe Ile
20 25 30
Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe
35 40 45
Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn
50 55 60
Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg Ile Phe
65 70 75 80
Pro Gly Asp Ile Arg Asp Arg Gly Ala Val Thr Gln Ala Met Ala Gly
85 90 95
Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser
100 105 110
Ile Asp Asp Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gln
115 120 125
Val Leu Leu Gln Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val His
130 135 140
Val Ser Thr Asp Glu Val Tyr Gly Ser Ile Glu Glu Gly Ser Trp Pro
145 150 155 160
Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala
165 170 175
Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro
180 185 190
Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gln Tyr Pro
195 200 205
Glu Lys Ile Ile Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr
210 215 220
Val Pro Leu Tyr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val
225 230 235 240
Asp Asp His Cys Arg Gly Ile Ala Leu Val Ala Arg Gly Gly Arg Pro
245 250 255
Gly Glu Val Tyr Asn Ile Gly Gly Gly Thr Glu Leu Ser Asn Val Glu
260 265 270
Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val
275 280 285
Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp
290 295 300
Tyr Thr Lys Ile Ala Asp Glu Leu Gly Tyr Ala Pro Arg Ile Thr Ile
305 310 315 320
Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala
325 330 335
Trp Trp Ala Pro Ala Lys Arg Gly Arg
340 345
<210> 36
<211> 804
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(804)
<220>
<221> CDS
<222> (7)..(804)
<220>
<221> CDS
<222> (22)..(804)
<400> 36
atg acg gtg acg acc gca tcc gtg gac ccg ctc gac ctg tgg ctc cgc 48
Met Thr Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg
1 5 10 15
cgg tac cag ccg tcc gcg tca ccc gcc gtc cgg ctg gtg tgc ttc ccg 96
Arg Tyr Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro
20 25 30
cac gcg ggc ggc tcg gcg agt tcg ttc ctg ccg ttc acc cgg cag ctg 144
His Ala Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu
35 40 45
ccg gac cgg atc gag gtc gtg gcc gtc cag tac ccc ggg cgc cag gac 192
Pro Asp Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp
50 55 60
cgc agg agc gaa ccg ctg gtc gac acc atc gag gga ctg gcc gag ccc 240
Arg Arg Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro
65 70 75 80
ctg gcc ggc ctg ctg gag gcg cag gcc ggc ccc ccg gtg gtg ctg ttc 288
Leu Ala Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe
85 90 95
ggg cac agc atg ggc gcg ctg gtg gcc tac gag gtc gcc cgc gcg ctc 336
Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu
100 105 110
cag cgg cgg gga gcg gct ccg gtg cgc ctg gtg gtc tcc ggg cgc cgg 384
Gln Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg
115 120 125
gcc ccc gcc gtc gac cgg ccg atg acc gtg cac ctc tac gac gac gac 432
Ala Pro Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp
130 135 140
cgg ctg gtc gag gaa ctc cgc aag ctc gac ggc acc gac agc cag gtg 480
Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val
145 150 155 160
ttc gcc gat ccg gag ctg ctc cgg ctg gtg ctg ccc gtg atc cgc aac 528
Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn
165 170 175
gac tac cgg gcc gtg gcg gcc tac gcc cac cgc ccg ggg gcg ccg ctg 576
Asp Tyr Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu
180 185 190
gac tgc ccc ctc acc gtg ttc acc ggc gcc gac gac ccc acc gtg acc 624
Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr
195 200 205
gcg gcc gag gcg gcg gcc tgg cac gag gcg gcg gcg tcc gac gtc gag 672
Ala Ala Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu
210 215 220
acg cgc acc ttc ccc ggt ggc cac ttc ttc ccg tac cag cgg acc gcg 720
Thr Arg Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala
225 230 235 240
gag gtg tgc ggg gcc ctg gtc gac acg ctc gag ccg ctg ctg tcg gcc 768
Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala
245 250 255
ggg acg cgc ggt gtc cgg cgg gtc cgc ccg ggg tga 804
Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly
260 265
<210> 37
<211> 267
<212> PRT
<213> Streptomyces ambofaciens
<400> 37
Met Thr Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg
1 5 10 15
Arg Tyr Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro
20 25 30
His Ala Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu
35 40 45
Pro Asp Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp
50 55 60
Arg Arg Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro
65 70 75 80
Leu Ala Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe
85 90 95
Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu
100 105 110
Gln Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg
115 120 125
Ala Pro Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp
130 135 140
Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val
145 150 155 160
Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn
165 170 175
Asp Tyr Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu
180 185 190
Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr
195 200 205
Ala Ala Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu
210 215 220
Thr Arg Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala
225 230 235 240
Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala
245 250 255
Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly
260 265
<210> 38
<211> 265
<212> PRT
<213> Streptomyces ambofaciens
<400> 38
Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr
1 5 10 15
Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro His Ala
20 25 30
Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu Pro Asp
35 40 45
Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp Arg Arg
50 55 60
Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro Leu Ala
65 70 75 80
Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe Gly His
85 90 95
Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu Gln Arg
100 105 110
Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro
115 120 125
Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp Arg Leu
130 135 140
Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val Phe Ala
145 150 155 160
Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn Asp Tyr
165 170 175
Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu Asp Cys
180 185 190
Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala
195 200 205
Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg
210 215 220
Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala Glu Val
225 230 235 240
Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr
245 250 255
Arg Gly Val Arg Arg Val Arg Pro Gly
260 265
<210> 39
<211> 260
<212> PRT
<213> Streptomyces ambofaciens
<400> 39
Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr Gln Pro Ser Ala Ser
1 5 10 15
Pro Ala Val Arg Leu Val Cys Phe Pro His Ala Gly Gly Ser Ala Ser
20 25 30
Ser Phe Leu Pro Phe Thr Arg Gln Leu Pro Asp Arg Ile Glu Val Val
35 40 45
Ala Val Gln Tyr Pro Gly Arg Gln Asp Arg Arg Ser Glu Pro Leu Val
50 55 60
Asp Thr Ile Glu Gly Leu Ala Glu Pro Leu Ala Gly Leu Leu Glu Ala
65 70 75 80
Gln Ala Gly Pro Pro Val Val Leu Phe Gly His Ser Met Gly Ala Leu
85 90 95
Val Ala Tyr Glu Val Ala Arg Ala Leu Gln Arg Arg Gly Ala Ala Pro
100 105 110
Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro Ala Val Asp Arg Pro
115 120 125
Met Thr Val His Leu Tyr Asp Asp Asp Arg Leu Val Glu Glu Leu Arg
130 135 140
Lys Leu Asp Gly Thr Asp Ser Gln Val Phe Ala Asp Pro Glu Leu Leu
145 150 155 160
Arg Leu Val Leu Pro Val Ile Arg Asn Asp Tyr Arg Ala Val Ala Ala
165 170 175
Tyr Ala His Arg Pro Gly Ala Pro Leu Asp Cys Pro Leu Thr Val Phe
180 185 190
Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala Glu Ala Ala Ala Trp
195 200 205
His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg Thr Phe Pro Gly Gly
210 215 220
His Phe Phe Pro Tyr Gln Arg Thr Ala Glu Val Cys Gly Ala Leu Val
225 230 235 240
Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr Arg Gly Val Arg Arg
245 250 255
Val Arg Pro Gly
260
<210> 40
<211> 1410
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1410)
<220>
<221> CDS
<222> (46)..(1410)
<400> 40
gtg ggc acg gtc gag tac gcc gtc cac cgg cgt acc gcg gaa cgg gtg 48
Val Gly Thr Val Glu Tyr Ala Val His Arg Arg Thr Ala Glu Arg Val
1 5 10 15
agg gtc tcc gcc gac acc ctg gac agc ccg gtc acc gcg ctg gcg gag 96
Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala Glu
20 25 30
gtg ccc cgc tgg ctg gag gaa tac cac cgg gcg cac cgc ttc cac gtc 144
Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His Val
35 40 45
gag ccg atc ccc ttc gac cgg ctc cgg cgg tgg tcc ttc gag ccg ggc 192
Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly
50 55 60
acc ggc gac ctg cgg cac gag acg ggc cgc ttc ttc tcc gtg gag ggg 240
Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly
65 70 75 80
ctg cgc acc agc tcg gac gcc gat ccg gtc gcc cgt gtc cag ccg atc 288
Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro Ile
85 90 95
atc gtg cag ccc gag gtg ggg ctg ctc ggc atc ctg gcc cgg gag ttc 336
Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu Phe
100 105 110
gac ggg gtg ctg cac ttc ctg atg cag gcc aaa ccc gag ccc ggc aac 384
Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly Asn
115 120 125
gtc aac ggg ctg cag atc tcc ccc acg gtg cag gcc acg cgc agc aac 432
Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser Asn
130 135 140
ttc gac gag gtg cac cac ggc cgg tcc acc ccg ttc ctc gac cac ttc 480
Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe
145 150 155 160
atc cac cgc ccc ggc cgc cgg gtc ctg atc gac agc atc cag tcc gaa 528
Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser Glu
165 170 175
cag ggc gac tgg ttc ctg cac aag cgc aac cgc aac atg gtc gtc gag 576
Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu
180 185 190
atc gac acc gac atc gag gcc gac gcc gcg ttc cgc tgg ctg acc ctc 624
Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu
195 200 205
ggg cag atc cgc cgg ctg atg ctc cag gac gac ctc gtc aac atg gac 672
Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met Asp
210 215 220
acc cgc agt gtg ctg gcc tgt ctg ccc acc gcg cac ggc acg ccc gac 720
Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp
225 230 235 240
gac ggt gac gac tcc ttc ccg gcg gcg ctg cgc cgc tcc ctc tac ggg 768
Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly
245 250 255
gag acc gcg ccg ttg cac gat ctg cac gcc atc acc agc tgc ctc acc 816
Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu Thr
260 265 270
gac gtc cgg gcg ctg cgg gtg ctg cgc cag cag agc gtg ccg ctc gac 864
Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu Asp
275 280 285
gac gcc cgg cgg gac ggc tgg gag cgg acc ggg agc gcg atc cgg cat 912
Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg His
290 295 300
cgc agc ggc agg cat ttc gag atc atg gcg gtg gag gtg acc gcg gag 960
Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala Glu
305 310 315 320
cgc cgt gaa gtg gcc tcg tgg acc cag ccg ttg ctg cgc ccg tgc tcg 1008
Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys Ser
325 330 335
cag gga ctg gcg gcc ctg atc acc cgg cgg atc aac ggg gtg ctg cac 1056
Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu His
340 345 350
gcc ctg gtg gcg gcg cgg tcg gag gtc ggc acg ctc aac gtc gcc gag 1104
Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu
355 360 365
ttc gga ccg acc gtc cag tgc cgg ccc gac gag gcg gac ggc cag tcg 1152
Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln Ser
370 375 380
ccc ccg tac ctg gac cgg gtg ctg acg gcc gga gcc gac cgc gtc cgc 1200
Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg
385 390 395 400
tac gac gtg gtg cag tcg gag gag ggc ggg cgc ttc tac cac gcg cgc 1248
Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg
405 410 415
aac cgc tat ctg gtg gtc gag gcg ggg ccg gag ctc gac acg ggc tgc 1296
Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys
420 425 430
ccg ccc ggc ttc tgc tgg gct acc ttc ggc cag ctc acc gaa ctg ctc 1344
Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu Leu
435 440 445
gcg cac ggc aac tat ctc aac gtc gaa ctc cgc acc ctc atg gcg tgc 1392
Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys
450 455 460
gca cac gcc tcc tac tga 1410
Ala His Ala Ser Tyr
465 470
<210> 41
<211> 469
<212> PRT
<213> Streptomyces ambofaciens
<400> 41
Val Gly Thr Val Glu Tyr Ala Val His Arg Arg Thr Ala Glu Arg Val
1 5 10 15
Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala Glu
20 25 30
Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His Val
35 40 45
Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly
50 55 60
Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly
65 70 75 80
Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro Ile
85 90 95
Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu Phe
100 105 110
Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly Asn
115 120 125
Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser Asn
130 135 140
Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe
145 150 155 160
Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser Glu
165 170 175
Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu
180 185 190
Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu
195 200 205
Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met Asp
210 215 220
Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp
225 230 235 240
Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly
245 250 255
Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu Thr
260 265 270
Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu Asp
275 280 285
Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg His
290 295 300
Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala Glu
305 310 315 320
Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys Ser
325 330 335
Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu His
340 345 350
Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu
355 360 365
Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln Ser
370 375 380
Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg
385 390 395 400
Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg
405 410 415
Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys
420 425 430
Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu Leu
435 440 445
Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys
450 455 460
Ala His Ala Ser Tyr
465
<210> 42
<211> 454
<212> PRT
<213> Streptomyces ambofaciens
<400> 42
Val Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala
1 5 10 15
Glu Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His
20 25 30
Val Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro
35 40 45
Gly Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu
50 55 60
Gly Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro
65 70 75 80
Ile Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu
85 90 95
Phe Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly
100 105 110
Asn Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser
115 120 125
Asn Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His
130 135 140
Phe Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser
145 150 155 160
Glu Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val
165 170 175
Glu Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr
180 185 190
Leu Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met
195 200 205
Asp Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro
210 215 220
Asp Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr
225 230 235 240
Gly Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu
245 250 255
Thr Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu
260 265 270
Asp Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg
275 280 285
His Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala
290 295 300
Glu Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys
305 310 315 320
Ser Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu
325 330 335
His Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala
340 345 350
Glu Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln
355 360 365
Ser Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val
370 375 380
Arg Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala
385 390 395 400
Arg Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly
405 410 415
Cys Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu
420 425 430
Leu Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala
435 440 445
Cys Ala His Ala Ser Tyr
450
<210> 43
<211> 1248
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1248)
<400> 43
atg ccg ggc ggg acg gac ggc gac tgc gcg cgg acg gcg gcc cgg cgt 48
Met Pro Gly Gly Thr Asp Gly Asp Cys Ala Arg Thr Ala Ala Arg Arg
1 5 10 15
cga acg cac ctg ccc gag tcc gga cga gac agc gcg acg cga gag gcg 96
Arg Thr His Leu Pro Glu Ser Gly Arg Asp Ser Ala Thr Arg Glu Ala
20 25 30
aaa atg atc aat ctc ttc cag ccc cag atg ggg gcc gag gaa ctg gcg 144
Lys Met Ile Asn Leu Phe Gln Pro Gln Met Gly Ala Glu Glu Leu Ala
35 40 45
gcg gtg tcc gag gtc ttc gac gac caa tgg ctc ggt cac gga ccc cgg 192
Ala Val Ser Glu Val Phe Asp Asp Gln Trp Leu Gly His Gly Pro Arg
50 55 60
acc gcg gcg ttc gag tcc gcg ttc gcc gag cac ctc ggg gtc ggc ccc 240
Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro
65 70 75 80
gag cac gtc gtc ttc ctc aac tcg ggc acc gcc ggc ctc ttc ctg gcc 288
Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala
85 90 95
ctg gag tcg ctc ggc ctg cgg ccc ggc gac gag gtc gtg ctc ccc tcg 336
Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser
100 105 110
ccc agc ttc ctc gcc gcg gcg aac gcc gta cag ctc tcg gga gcg cgc 384
Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gln Leu Ser Gly Ala Arg
115 120 125
ccg gtg ttc tgc gac acc gac ccg cgg acg ctg aac ccc gcc ctg gag 432
Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu
130 135 140
cac atc gag gcg gcc gtc acc ccg cgc acc agg gcc gtc atc gcg ctc 480
His Ile Glu Ala Ala Val Thr Pro Arg Thr Arg Ala Val Ile Ala Leu
145 150 155 160
cac tac ggc ggc cac ccc ggc gac atc gtg cgc atc gcc gag cgc tgc 528
His Tyr Gly Gly His Pro Gly Asp Ile Val Arg Ile Ala Glu Arg Cys
165 170 175
cgg gag cgg ggc atc acc ctg atc gag gac gcc gcg tgc tcc gtg gcc 576
Arg Glu Arg Gly Ile Thr Leu Ile Glu Asp Ala Ala Cys Ser Val Ala
180 185 190
tcc cgc gtc gac ggc cga ccg gtc ggc acc ttc ggc gac ctc gcc atg 624
Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met
195 200 205
tgg agc ttc gac gcc atg aag gtc ctg gtc acc ggc gac gga ggg atg 672
Trp Ser Phe Asp Ala Met Lys Val Leu Val Thr Gly Asp Gly Gly Met
210 215 220
atc tac gtc aag gac ccc ggg gcg gcc gcc cgg atc cgg cgc ctc gcc 720
Ile Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg Ile Arg Arg Leu Ala
225 230 235 240
tac cac ggc ctc acg cgg tcc agc ggc ctg gga tac gcc agg gtc tcg 768
Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser
245 250 255
gcg cgc tgg tgg gag atg gac gtc ccc gaa ccg ggc cgc cgc gtc atc 816
Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val Ile
260 265 270
ggg aac gac ctc acc gcg gcc atc ggc gcg gtc cag ttg cgc cgg ctt 864
Gly Asn Asp Leu Thr Ala Ala Ile Gly Ala Val Gln Leu Arg Arg Leu
275 280 285
ccc ggc ttc gtg gcc cgc cgc agg gag atc gtc gcc ctg tac gac agc 912
Pro Gly Phe Val Ala Arg Arg Arg Glu Ile Val Ala Leu Tyr Asp Ser
290 295 300
gaa ctg agc tcg ctg gag ggc gtg ctg aca ccg ccc gcg cca ccc gcg 960
Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala
305 310 315 320
ggg cac gag tcc acg cac tac ttc tac tgg atc cag ctg gcc ccc ggc 1008
Gly His Glu Ser Thr His Tyr Phe Tyr Trp Ile Gln Leu Ala Pro Gly
325 330 335
gtc cgg gac cgg gtg gca cgc gac ctg ctc acc gac ggc atc tac acc 1056
Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly Ile Tyr Thr
340 345 350
acc ttc cgc tac gca cct ctg cac aag gtg ccc gcc tac ggc cac acc 1104
Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr
355 360 365
gga ggc gaa ctg ccc ggc gtg gag cgg gcg tcc gaa cgg acc ctg tgc 1152
Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys
370 375 380
ctg ccc ctg cac ccc ggc ctg tcg gac gcc gac gtc cgc acc gtc gtg 1200
Leu Pro Leu His Pro Gly Leu Ser Asp Ala Asp Val Arg Thr Val Val
385 390 395 400
tcc tcc ctg cgc aga gcc ctg agc gcc gcg gat ccg gcc ccc gcc tga 1248
Ser Ser Leu Arg Arg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala
405 410 415
<210> 44
<211> 415
<212> PRT
<213> Streptomyces ambofaciens
<400> 44
Met Pro Gly Gly Thr Asp Gly Asp Cys Ala Arg Thr Ala Ala Arg Arg
1 5 10 15
Arg Thr His Leu Pro Glu Ser Gly Arg Asp Ser Ala Thr Arg Glu Ala
20 25 30
Lys Met Ile Asn Leu Phe Gln Pro Gln Met Gly Ala Glu Glu Leu Ala
35 40 45
Ala Val Ser Glu Val Phe Asp Asp Gln Trp Leu Gly His Gly Pro Arg
50 55 60
Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro
65 70 75 80
Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala
85 90 95
Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser
100 105 110
Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gln Leu Ser Gly Ala Arg
115 120 125
Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu
130 135 140
His Ile Glu Ala Ala Val Thr Pro Arg Thr Arg Ala Val Ile Ala Leu
145 150 155 160
His Tyr Gly Gly His Pro Gly Asp Ile Val Arg Ile Ala Glu Arg Cys
165 170 175
Arg Glu Arg Gly Ile Thr Leu Ile Glu Asp Ala Ala Cys Ser Val Ala
180 185 190
Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met
195 200 205
Trp Ser Phe Asp Ala Met Lys Val Leu Val Thr Gly Asp Gly Gly Met
210 215 220
Ile Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg Ile Arg Arg Leu Ala
225 230 235 240
Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser
245 250 255
Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val Ile
260 265 270
Gly Asn Asp Leu Thr Ala Ala Ile Gly Ala Val Gln Leu Arg Arg Leu
275 280 285
Pro Gly Phe Val Ala Arg Arg Arg Glu Ile Val Ala Leu Tyr Asp Ser
290 295 300
Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala
305 310 315 320
Gly His Glu Ser Thr His Tyr Phe Tyr Trp Ile Gln Leu Ala Pro Gly
325 330 335
Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly Ile Tyr Thr
340 345 350
Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr
355 360 365
Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys
370 375 380
Leu Pro Leu His Pro Gly Leu Ser Asp Ala Asp Val Arg Thr Val Val
385 390 395 400
Ser Ser Leu Arg Arg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala
405 410 415
<210> 45
<211> 720
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(720)
<400> 45
atg tac gag aac gac agt gcc gcc gag gtc tac gac ctg ctc tac cag 48
Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gln
1 5 10 15
gac cgc aag gac tac gcg ggt gag gcc gcc cgg gtc acc gac ctg atc 96
Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu Ile
20 25 30
cgg gaa cgt acg ccg gac gcg gcc agc ctg ctc gac atc gcg tgc ggc 144
Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp Ile Ala Cys Gly
35 40 45
acc ggt acc cac ctg gag gcc ttc gcc aag ctc tac gac cgc gtg agc 192
Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser
50 55 60
ggc ctg gag ctg tcc gag tgg atg gcg gcc cgc gcc gag gag cgg ctc 240
Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu
65 70 75 80
ccc ggc gtc acc ctc cac cgc ggt gac atg cgg gcg ttc gac ctc ggc 288
Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly
85 90 95
gag acg ttc gac gcc gtg gtc tgc atg ttc agc tcg atc ggg tac ctg 336
Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser Ile Gly Tyr Leu
100 105 110
gag acc acg gcc gac ctg gag gac gcc gtc gcc gcc atg gcg cgg cac 384
Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His
115 120 125
ctg acc gcg gac ggt gtc ctg gcc gtc gaa ccg tgg tac ttc ccc gac 432
Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp
130 135 140
acc ttc ctg gac ggc cac gtc tcc acc cac gcc ctg cgg acg gca ccg 480
Thr Phe Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro
145 150 155 160
ggc gac cag ggc gtc gcc cgt gtc tcc cac tcg acc cgg gag ggc ggg 528
Gly Asp Gln Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Gly Gly
165 170 175
cgg acc cgg atg gag atc cac tac ctg atc gcg cac acc gcg gag ggc 576
Arg Thr Arg Met Glu Ile His Tyr Leu Ile Ala His Thr Ala Glu Gly
180 185 190
atc cgg cac cgc agc gag gtg gac tac ctc acg ctg ttc tcg cgt gcg 624
Ile Arg His Arg Ser Glu Val Asp Tyr Leu Thr Leu Phe Ser Arg Ala
195 200 205
gag tac gag gcc gcg tac cgc aag gcc ggc ctg gac gtc gag tac gtc 672
Glu Tyr Glu Ala Ala Tyr Arg Lys Ala Gly Leu Asp Val Glu Tyr Val
210 215 220
gtg acg ggc gag ggc tca ccg ggc ttc ttc ctc ggc acg cgt cgc tga 720
Val Thr Gly Glu Gly Ser Pro Gly Phe Phe Leu Gly Thr Arg Arg
225 230 235 240
<210> 46
<211> 239
<212> PRT
<213> Streptomyces ambofaciens
<400> 46
Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gln
1 5 10 15
Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu Ile
20 25 30
Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp Ile Ala Cys Gly
35 40 45
Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser
50 55 60
Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu
65 70 75 80
Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly
85 90 95
Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser Ile Gly Tyr Leu
100 105 110
Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His
115 120 125
Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp
130 135 140
Thr Phe Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro
145 150 155 160
Gly Asp Gln Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Gly Gly
165 170 175
Arg Thr Arg Met Glu Ile His Tyr Leu Ile Ala His Thr Ala Glu Gly
180 185 190
Ile Arg His Arg Ser Glu Val Asp Tyr Leu Thr Leu Phe Ser Arg Ala
195 200 205
Glu Tyr Glu Ala Ala Tyr Arg Lys Ala Gly Leu Asp Val Glu Tyr Val
210 215 220
Val Thr Gly Glu Gly Ser Pro Gly Phe Phe Leu Gly Thr Arg Arg
225 230 235
<210> 47
<211> 1968
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1968)
<400> 47
atg agt gac ctg ggt tct ggt gaa gaa ggg tcc gaa gaa gac gag tcg 48
Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser
1 5 10 15
gac gac gca ctc gcc ttc ctc gag ttc atc gcc cgg tcg gca cca cgg 96
Asp Asp Ala Leu Ala Phe Leu Glu Phe Ile Ala Arg Ser Ala Pro Arg
20 25 30
agc gaa tac gac cgg ctc atg gcc cgc gcc gaa cgc tcg ggc gcc gac 144
Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp
35 40 45
gag gac cgg atg cgc cga ctg gag cgc ttc aac cgg ctc gcc ctc acc 192
Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr
50 55 60
gcg cag tcg atg atc gag tac cgc cgc gac cgg gag gcg gag ctc gcg 240
Ala Gln Ser Met Ile Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala
65 70 75 80
gcc ctg gtc gac gcc gcg cac gag ttc gtc gcc gcc cgg cgg ggc aag 288
Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys
85 90 95
gac ctg ctg gag tcc atc gcc cgc aga gca cgg ctg ctg ctg aag ctg 336
Asp Leu Leu Glu Ser Ile Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu
100 105 110
gac gtc tcc tac gtc ggc ctg cac gag gag gac cgg ccc ggc acg gtg 384
Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val
115 120 125
gtg ctg agc gcc gac ggc aac gcg gtc aag gtc gcc gag agc tac cgg 432
Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg
130 135 140
ctg ccg gcc gac ggc gga ctg ggc gcc atg gtg cgc acc tgc cgc gct 480
Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala
145 150 155 160
ccc ttc tgg acc ccg gac tac ctc ggg gac aac agc ttc acg cac gtc 528
Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr His Val
165 170 175
gag gcc gtc gac gac atc gtc cgc gcc gaa ggc ctg cgc gcg gtc ctg 576
Glu Ala Val Asp Asp Ile Val Arg Ala Glu Gly Leu Arg Ala Val Leu
180 185 190
gcc gtc ccg ctg tgc gcc ggg ggc gaa ccg atg ggg gtc ctc tac gtc 624
Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val
195 200 205
gcc gac cgt cag gtg cgg cat ctg acc ccc aac gag gtc acc ctg ctg 672
Ala Asp Arg Gln Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu
210 215 220
tgc tcg ctc gcc gat ctg gcc gcg gtg gcg atc gag cgc aac cgg ctg 720
Cys Ser Leu Ala Asp Leu Ala Ala Val Ala Ile Glu Arg Asn Arg Leu
225 230 235 240
gtc gag gag ctc cac gac acc atc ggg caa ctg cgc cag gac atc ggc 768
Val Glu Glu Leu His Asp Thr Ile Gly Gln Leu Arg Gln Asp Ile Gly
245 250 255
gag gcc cgc acc gcc ctc gcg cgc acc cgc agg tcc gcc gac ctc cag 816
Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gln
260 265 270
tcg cac ctg gtc acg cag gtg atg gac agg cgc ggc gcc gac tcg tta 864
Ser His Leu Val Thr Gln Val Met Asp Arg Arg Gly Ala Asp Ser Leu
275 280 285
ctc gcg acg gcc gcc gag gcg ctc ggc ggc gga gcc ggc ctg tgc agc 912
Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser
290 295 300
ccg ctc ggg cgc ccg ctc gcc gag tac ggg acc ctg cgc ccc gtc gcc 960
Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala
305 310 315 320
ccc acg gaa ctg cgc gcg gcg tgc cgc cgg gcc gcc gag acc ggc cgg 1008
Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg
325 330 335
ccc acc tcc gtg gcc ccg ggg gtc tgg acg gtg ccc ctg ctt ccc ggg 1056
Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly
340 345 350
ggc aac gcc ggc ttc ctg ctg acc gac ctc ggt ccg gac gcg gac cac 1104
Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His
355 360 365
acc gcc gtc ccc ctg ctc ccg atg gtc gcc cgc acc ctc gcg ctg cac 1152
Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His
370 375 380
ctg cgc gtc cag cac gac gac tcc ccc aag gcg cag agc cac cag gag 1200
Leu Arg Val Gln His Asp Asp Ser Pro Lys Ala Gln Ser His Gln Glu
385 390 395 400
ttc ttc gac gac ctg atc ggg gcg ccc cgc tca ccc acg ctc ctc agg 1248
Phe Phe Asp Asp Leu Ile Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg
405 410 415
gaa cgc gcc ctg atg ttc tcc ctc agc ttc cgc cgc ccg cac gtg gtg 1296
Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val
420 425 430
ctg gtg gcg gac gga ccc cgc ggg acc tcg ccg cgg ctg gag gcc tcc 1344
Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser
435 440 445
ggc gcc gac tac gcg aag gag ctc ggc ggg ctg tgc agc gtg cgg gac 1392
Gly Ala Asp Tyr Ala Lys Glu Leu Gly Gly Leu Cys Ser Val Arg Asp
450 455 460
ggc gcc gtc gtc ctg ctg ctg ccc ggc gac gac ccc gtc gcc gtg gcg 1440
Gly Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala
465 470 475 480
cag acc gcc gcc ccg gag ctg acc gac cgc gcc ggg cac ccc gtc acc 1488
Gln Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr
485 490 495
gtg ggg gtc gcg ggc ccc gcc tcg acc gtc gac ggc atc gcc gac gcg 1536
Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly Ile Ala Asp Ala
500 505 510
cac cgt gag gcc gcg aag tgt ctg gag acc ctc cgc gcg ctc ggc ggc 1584
His Arg Glu Ala Ala Lys Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly
515 520 525
gac ggc ggc acc gcg tgc gcc tcc gac ctg ggt ttc ctc ggc atg ctc 1632
Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu
530 535 540
ctc gcc gag gag aac gac gtc ccc ggt tac atc agg acg acg atc ggc 1680
Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr Ile Arg Thr Thr Ile Gly
545 550 555 560
ccc gtg gtc gac tac gac acc cac cgc ttc acg gat ctg gtt ccc act 1728
Pro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr
565 570 575
ctg agg gtg tac ctg gag tcg ggc agg agc ccc acg cgt gcc gca gag 1776
Leu Arg Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu
580 585 590
aca ctg cgc gtg cac ccg aac acc gtc tca cgg cgg ctg gag cgc atc 1824
Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg Ile
595 600 605
ggc gta ctg ctg gga gag gac tgg cag tca ccg gag cgg gtg ctg gac 1872
Gly Val Leu Leu Gly Glu Asp Trp Gln Ser Pro Glu Arg Val Leu Asp
610 615 620
ata caa ctg gcc ctg cgg ctc tat cag gtg cgc tcg gcg ctc tcc tcg 1920
Ile Gln Leu Ala Leu Arg Leu Tyr Gln Val Arg Ser Ala Leu Ser Ser
625 630 635 640
caa ccg gcg tcc gag acc cgg gcc gtg ctc gga tcg ctg cgc gag tga 1968
Gln Pro Ala Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu
645 650 655
<210> 48
<211> 655
<212> PRT
<213> Streptomyces ambofaciens
<400> 48
Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser
1 5 10 15
Asp Asp Ala Leu Ala Phe Leu Glu Phe Ile Ala Arg Ser Ala Pro Arg
20 25 30
Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp
35 40 45
Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr
50 55 60
Ala Gln Ser Met Ile Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala
65 70 75 80
Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys
85 90 95
Asp Leu Leu Glu Ser Ile Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu
100 105 110
Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val
115 120 125
Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg
130 135 140
Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala
145 150 155 160
Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr His Val
165 170 175
Glu Ala Val Asp Asp Ile Val Arg Ala Glu Gly Leu Arg Ala Val Leu
180 185 190
Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val
195 200 205
Ala Asp Arg Gln Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu
210 215 220
Cys Ser Leu Ala Asp Leu Ala Ala Val Ala Ile Glu Arg Asn Arg Leu
225 230 235 240
Val Glu Glu Leu His Asp Thr Ile Gly Gln Leu Arg Gln Asp Ile Gly
245 250 255
Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gln
260 265 270
Ser His Leu Val Thr Gln Val Met Asp Arg Arg Gly Ala Asp Ser Leu
275 280 285
Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser
290 295 300
Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala
305 310 315 320
Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg
325 330 335
Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly
340 345 350
Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His
355 360 365
Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His
370 375 380
Leu Arg Val Gln His Asp Asp Ser Pro Lys Ala Gln Ser His Gln Glu
385 390 395 400
Phe Phe Asp Asp Leu Ile Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg
405 410 415
Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val
420 425 430
Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser
435 440 445
Gly Ala Asp Tyr Ala Lys Glu Leu Gly Gly Leu Cys Ser Val Arg Asp
450 455 460
Gly Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala
465 470 475 480
Gln Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr
485 490 495
Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly Ile Ala Asp Ala
500 505 510
His Arg Glu Ala Ala Lys Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly
515 520 525
Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu
530 535 540
Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr Ile Arg Thr Thr Ile Gly
545 550 555 560
Pro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr
565 570 575
Leu Arg Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu
580 585 590
Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg Ile
595 600 605
Gly Val Leu Leu Gly Glu Asp Trp Gln Ser Pro Glu Arg Val Leu Asp
610 615 620
Ile Gln Leu Ala Leu Arg Leu Tyr Gln Val Arg Ser Ala Leu Ser Ser
625 630 635 640
Gln Pro Ala Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu
645 650 655
<210> 49
<211> 1749
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1749)
<220>
<221> CDS
<222> (76)..(1749)
<220>
<221> CDS
<222> (97)..(1749)
<400> 49
atg tcc gca gtg gtg gcg tcc ctt ctg ctt tcc gtt ctt tct gcg agc 48
Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser
1 5 10 15
gcg ctc acg cat cca ctc atc ctc atc gtg gaa aca gga gac tta cgc 96
Ala Leu Thr His Pro Leu Ile Leu Ile Val Glu Thr Gly Asp Leu Arg
20 25 30
gtg tcg att gcg caa tac gcc cta cac gac atc acg aag cgc tac cac 144
Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His
35 40 45
gac tgt gtc gtg ctc gac cgg gtc ggt ttc agc atc aag ccg ggc gag 192
Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu
50 55 60
aag gtc ggc gtg atc ggc gac aac ggt tcc ggc aag tcc acg ctg ctc 240
Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu
65 70 75 80
aag atc ctc gcc ggc cgc gtg gag ccc gac aac ggc gcg ctc acc gtg 288
Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val
85 90 95
gtc gct ccc ggc ggc gtc ggc tac ctg gcg cag aca ctg gaa ctg ccc 336
Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro
100 105 110
ctc gac gcc acc gtc cag gac gcc gtc gac ctg gcc ctg tcc gac ctg 384
Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu
115 120 125
cgc gag ctc gaa gcg gcg atg cgc gag gcc gag gcg gag ctg ggc gag 432
Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu
130 135 140
agc gac gag aac ggc tcc gag cgc gag ctg tcc gcc ggc ctc cag cgc 480
Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg
145 150 155 160
tac gcc gct ctg gtc gag cag tac cag gcg cgt ggc ggc tac gag gcc 528
Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala
165 170 175
gac gtg cgc gtg gag gtc gcg ctg cac ggc ctc gga ctg ccg agc ctg 576
Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu
180 185 190
gac cgc gac cgc aag ctc gga acc ctc tcc ggt ggc gaa cgc tcc cgc 624
Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg
195 200 205
ctc gcg ctc gcc gcg acc ctc gcc tcg tcg ccg gag ctg ctg ctc ctg 672
Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu
210 215 220
gac gaa ccg acc aac gac ctc gac gac cgg gcg atg gaa tgg ctg gag 720
Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu
225 230 235 240
gac cac ctg gcc ggc cac cgc ggc acg gtg atc gcg gtc acc cac gac 768
Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp
245 250 255
cgg gtc ttc ctc gac cgg ctc acc acc acg atc ctg gag gtc gac tcc 816
Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser
260 265 270
ggc agc gtc acc cgc tac ggc aac ggc tac gag ggc tac ctg acg gcc 864
Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala
275 280 285
aag gcc gtg gaa cgc gag cgg cgg ctg cgg gag tac gag gag tgg cgt 912
Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg
290 295 300
gcc gaa ctc gac cgc aac cgc ggg ctg atc acc tcc aac gtg gcg cgg 960
Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg
305 310 315 320
atg gac ggc atc ccg cgc aag atg tcc ctc tcc gtg ttc ggc cac ggc 1008
Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly
325 330 335
gcc tac cgc agg cga ggg cgc gac cac ggc gcg atg gtg cgg atc cgc 1056
Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg
340 345 350
aac gcg aag caa cgc gtg gcg cag ctg acc gag aac ccg gtc cac gct 1104
Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala
355 360 365
ccc gcc gac ccg ttg tcc ttc gcc gcc cgc atc gac acc gcg ggc ccg 1152
Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro
370 375 380
gag gcg gag gag gcg gtg gcc gaa ctc acc gac gtg cgc gtc gcg ggt 1200
Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly
385 390 395 400
cgg ctc gcc gtg gac tcc ctg acg atc cgg ccc ggc gaa cgg ctg ctc 1248
Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu
405 410 415
gtc aca ggt ccc aac ggt gcg ggc aag tcc acc ttg ttg cgg gtg ctg 1296
Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu
420 425 430
tcc ggg gaa ctg gag ccg gac ggc ggc tcg gtg cgc gtc ggc tgc cgg 1344
Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg
435 440 445
gtc ggt cat ctg cgg cag gac gag acg ccc tgg gcg ccc gga ctg acc 1392
Val Gly His Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr
450 455 460
gtg ctg cgg gcc ttc gcc cag ggc cgg gag ggc tac ctg gag gac cac 1440
Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His
465 470 475 480
gcg gag aaa ctg ctg tcg ctc ggc ctg ttc agc ccg tcc gac ctg cgg 1488
Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg
485 490 495
cga cgc gtg aag gat ctg tcc tac ggg cag cgc cgc cgg atc gag atc 1536
Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile
500 505 510
gcc cgg ctg gtg agc gac ccg atg gac ctg ctg ctg ctg gac gag ccc 1584
Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro
515 520 525
acc aac cac ctc acc ccg gtg ctg gtg gag gag ttg gag cag gca ctc 1632
Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu
530 535 540
gcg gac tac cgc ggc gcc gtc gtg gtc gtc acc cac gac cgt cgg atg 1680
Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met
545 550 555 560
cgg tcc cgg ttc acc ggc gcc cgg ctg acc atg gga gac ggg cgc atc 1728
Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile
565 570 575
gcc gag ttc agc gcc ggc tga 1749
Ala Glu Phe Ser Ala Gly
580
<210> 50
<211> 582
<212> PRT
<213> Streptomyces ambofaciens
<400> 50
Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser
1 5 10 15
Ala Leu Thr His Pro Leu Ile Leu Ile Val Glu Thr Gly Asp Leu Arg
20 25 30
Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His
35 40 45
Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu
50 55 60
Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu
65 70 75 80
Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val
85 90 95
Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro
100 105 110
Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu
115 120 125
Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu
130 135 140
Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg
145 150 155 160
Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala
165 170 175
Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu
180 185 190
Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg
195 200 205
Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu
210 215 220
Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu
225 230 235 240
Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp
245 250 255
Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser
260 265 270
Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala
275 280 285
Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg
290 295 300
Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg
305 310 315 320
Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly
325 330 335
Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg
340 345 350
Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala
355 360 365
Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro
370 375 380
Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly
385 390 395 400
Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu
405 410 415
Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu
420 425 430
Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg
435 440 445
Val Gly His Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr
450 455 460
Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His
465 470 475 480
Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg
485 490 495
Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile
500 505 510
Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro
515 520 525
Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu
530 535 540
Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met
545 550 555 560
Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile
565 570 575
Ala Glu Phe Ser Ala Gly
580
<210> 51
<211> 557
<212> PRT
<213> Streptomyces ambofaciens
<400> 51
Val Glu Thr Gly Asp Leu Arg Val Ser Ile Ala Gln Tyr Ala Leu His
1 5 10 15
Asp Ile Thr Lys Arg Tyr His Asp Cys Val Val Leu Asp Arg Val Gly
20 25 30
Phe Ser Ile Lys Pro Gly Glu Lys Val Gly Val Ile Gly Asp Asn Gly
35 40 45
Ser Gly Lys Ser Thr Leu Leu Lys Ile Leu Ala Gly Arg Val Glu Pro
50 55 60
Asp Asn Gly Ala Leu Thr Val Val Ala Pro Gly Gly Val Gly Tyr Leu
65 70 75 80
Ala Gln Thr Leu Glu Leu Pro Leu Asp Ala Thr Val Gln Asp Ala Val
85 90 95
Asp Leu Ala Leu Ser Asp Leu Arg Glu Leu Glu Ala Ala Met Arg Glu
100 105 110
Ala Glu Ala Glu Leu Gly Glu Ser Asp Glu Asn Gly Ser Glu Arg Glu
115 120 125
Leu Ser Ala Gly Leu Gln Arg Tyr Ala Ala Leu Val Glu Gln Tyr Gln
130 135 140
Ala Arg Gly Gly Tyr Glu Ala Asp Val Arg Val Glu Val Ala Leu His
145 150 155 160
Gly Leu Gly Leu Pro Ser Leu Asp Arg Asp Arg Lys Leu Gly Thr Leu
165 170 175
Ser Gly Gly Glu Arg Ser Arg Leu Ala Leu Ala Ala Thr Leu Ala Ser
180 185 190
Ser Pro Glu Leu Leu Leu Leu Asp Glu Pro Thr Asn Asp Leu Asp Asp
195 200 205
Arg Ala Met Glu Trp Leu Glu Asp His Leu Ala Gly His Arg Gly Thr
210 215 220
Val Ile Ala Val Thr His Asp Arg Val Phe Leu Asp Arg Leu Thr Thr
225 230 235 240
Thr Ile Leu Glu Val Asp Ser Gly Ser Val Thr Arg Tyr Gly Asn Gly
245 250 255
Tyr Glu Gly Tyr Leu Thr Ala Lys Ala Val Glu Arg Glu Arg Arg Leu
260 265 270
Arg Glu Tyr Glu Glu Trp Arg Ala Glu Leu Asp Arg Asn Arg Gly Leu
275 280 285
Ile Thr Ser Asn Val Ala Arg Met Asp Gly Ile Pro Arg Lys Met Ser
290 295 300
Leu Ser Val Phe Gly His Gly Ala Tyr Arg Arg Arg Gly Arg Asp His
305 310 315 320
Gly Ala Met Val Arg Ile Arg Asn Ala Lys Gln Arg Val Ala Gln Leu
325 330 335
Thr Glu Asn Pro Val His Ala Pro Ala Asp Pro Leu Ser Phe Ala Ala
340 345 350
Arg Ile Asp Thr Ala Gly Pro Glu Ala Glu Glu Ala Val Ala Glu Leu
355 360 365
Thr Asp Val Arg Val Ala Gly Arg Leu Ala Val Asp Ser Leu Thr Ile
370 375 380
Arg Pro Gly Glu Arg Leu Leu Val Thr Gly Pro Asn Gly Ala Gly Lys
385 390 395 400
Ser Thr Leu Leu Arg Val Leu Ser Gly Glu Leu Glu Pro Asp Gly Gly
405 410 415
Ser Val Arg Val Gly Cys Arg Val Gly His Leu Arg Gln Asp Glu Thr
420 425 430
Pro Trp Ala Pro Gly Leu Thr Val Leu Arg Ala Phe Ala Gln Gly Arg
435 440 445
Glu Gly Tyr Leu Glu Asp His Ala Glu Lys Leu Leu Ser Leu Gly Leu
450 455 460
Phe Ser Pro Ser Asp Leu Arg Arg Arg Val Lys Asp Leu Ser Tyr Gly
465 470 475 480
Gln Arg Arg Arg Ile Glu Ile Ala Arg Leu Val Ser Asp Pro Met Asp
485 490 495
Leu Leu Leu Leu Asp Glu Pro Thr Asn His Leu Thr Pro Val Leu Val
500 505 510
Glu Glu Leu Glu Gln Ala Leu Ala Asp Tyr Arg Gly Ala Val Val Val
515 520 525
Val Thr His Asp Arg Arg Met Arg Ser Arg Phe Thr Gly Ala Arg Leu
530 535 540
Thr Met Gly Asp Gly Arg Ile Ala Glu Phe Ser Ala Gly
545 550 555
<210> 52
<211> 550
<212> PRT
<213> Streptomyces ambofaciens
<400> 52
Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His
1 5 10 15
Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu
20 25 30
Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu
35 40 45
Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val
50 55 60
Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro
65 70 75 80
Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu
85 90 95
Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu
100 105 110
Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg
115 120 125
Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala
130 135 140
Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu
145 150 155 160
Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg
165 170 175
Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu
180 185 190
Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu
195 200 205
Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp
210 215 220
Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser
225 230 235 240
Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala
245 250 255
Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg
260 265 270
Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg
275 280 285
Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly
290 295 300
Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg
305 310 315 320
Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala
325 330 335
Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro
340 345 350
Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly
355 360 365
Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu
370 375 380
Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu
385 390 395 400
Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg
405 410 415
Val Gly His Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr
420 425 430
Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His
435 440 445
Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg
450 455 460
Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile
465 470 475 480
Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro
485 490 495
Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu
500 505 510
Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met
515 520 525
Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile
530 535 540
Ala Glu Phe Ser Ala Gly
545 550
<210> 53
<211> 1431
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1431)
<220>
<221> CDS
<222> (16)..(1431)
<220>
<221> CDS
<222> (37)..(1431)
<220>
<221> CDS
<222> (40)..(1431)
<220>
<221> CDS
<222> (79)..(1431)
<220>
<221> CDS
<222> (130)..(1431)
<400> 53
gtg ccg cgc aac ggt atg cgt gtc gca ccg gcc gac gtg atg cag tcg 48
Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gln Ser
1 5 10 15
gac cgg gat gat cgc ttg tcc ggc ggc cgg atg cct agc ctc ggg agc 96
Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser
20 25 30
aac cac agc ggt ctt tca cga gag ggg tcg acc atg ggc gat ctc agg 144
Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg
35 40 45
aac cgc atc acc gag ctg gtc cgc gcg tac cac cgg gaa cag gcg ccc 192
Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro
50 55 60
ggg ggc ttc gtt ccc ggg acg acg cac gta ccg gtc tcc ggc gcg gtg 240
Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val
65 70 75 80
ctg agc gag gag gac cgg ctg gcg ctg gtg gag acg gcg ctg gag atg 288
Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met
85 90 95
cgg atc gcg gcc ggc ccg gcc tcc cgg ggc ttc gag cgg cag ttc gcc 336
Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala
100 105 110
cgg tac ctc ggg ctc cgg aag gcg cac ctg acc aac tcc ggt tcc tcc 384
Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser
115 120 125
gcc aac ctc ctc gcc ctc ggc gcg ctc acc tcg ccg cag ctg gag gag 432
Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu
130 135 140
aga cgg ctg cgt ccg ggg gac gag gtc gtc acg gtc gcc gcc ggg ttc 480
Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe
145 150 155 160
ccc acg acg gtc aac ccg atc ttc cac aac ggg ctg gtg ccc gtc ttc 528
Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val Pro Val Phe
165 170 175
gtg gac gtc gag ctc ggc acg tac aac acg acg ccc gag cgc atc gag 576
Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu
180 185 190
cgg gcc atc ggc ccc cgg acc agg gcg atc atg atc gcg cac gcc ctg 624
Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu
195 200 205
ggc aac ccc ttc gag gcc gaa gag gtg gcc cgc ctc gcg gac gag cgg 672
Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg
210 215 220
gag ctg ttc ctc atc gag gac aac tgc gac gcg gtg ggg tcc cgc tac 720
Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr
225 230 235 240
cgg ggc agg ctc acc ggc tcc ttc ggc gac ctg tcg acc gtc agc ttc 768
Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe
245 250 255
tat ccc gcg cac cac atc gcg atg ggt gag ggg ggc tgc gtg ctc acc 816
Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr
260 265 270
gac aac ctg gcc ctg gcg cgg atc gtg gaa tca ctg cgc gac tgg ggg 864
Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly
275 280 285
cgc gac tgc tgg tgc gag ccg ggt gag gac aac cgc tgc ctc aag cgg 912
Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg
290 295 300
ttc gac cag aag atg ggt gac ctg ccg ccc ggg tac gac cac aag tac 960
Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr
305 310 315 320
atc ttc tcg cac gtc ggt tac aac ctg aag tcg acc gac ctg cag gcg 1008
Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala
325 330 335
gcc ctc ggg ctg tcc cag ctg acc cgg atc gag gag ttc acc gag gcc 1056
Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala
340 345 350
agg cgc gcc aac tgg cgg cat ctg cgc gcc gcg ttg gac ggg ctg ccc 1104
Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro
355 360 365
ggt ctg ctg ctg cct cat gcc aca ccg ggc agc gat ccg agc tgg ttc 1152
Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe
370 375 380
ggg ttc ctc atc acc gtg gac ccg gac gcc gcg tac agc agg gcg gcc 1200
Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala
385 390 395 400
ctg gtc gac cac ctg gaa tcg cgc cgg atc agc acc cgc cgc ctg ttc 1248
Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe
405 410 415
ggg ggc aac ctc gtg cgg cac ccc gcc tac acc gac cgt cgg tac cgg 1296
Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg
420 425 430
gtg tcc ggc tcc ctg gag aac agc gac ctg atc acc gac cag acg ttc 1344
Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe
435 440 445
tgg atc ggg gtc ttc ccc ggc atc acc ccg gag atg atc gcc tac gtc 1392
Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val
450 455 460
ggc gac acg atc cgg gag ttc gtg ctc aag cac tcc tga 1431
Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser
465 470 475
<210> 54
<211> 476
<212> PRT
<213> Streptomyces ambofaciens
<400> 54
Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gln Ser
1 5 10 15
Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser
20 25 30
Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg
35 40 45
Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro
50 55 60
Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val
65 70 75 80
Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met
85 90 95
Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala
100 105 110
Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser
115 120 125
Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu
130 135 140
Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe
145 150 155 160
Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val Pro Val Phe
165 170 175
Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu
180 185 190
Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu
195 200 205
Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg
210 215 220
Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr
225 230 235 240
Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe
245 250 255
Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr
260 265 270
Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly
275 280 285
Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg
290 295 300
Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr
305 310 315 320
Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala
325 330 335
Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala
340 345 350
Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro
355 360 365
Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe
370 375 380
Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala
385 390 395 400
Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe
405 410 415
Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg
420 425 430
Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe
435 440 445
Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val
450 455 460
Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser
465 470 475
<210> 55
<211> 471
<212> PRT
<213> Streptomyces ambofaciens
<400> 55
Met Arg Val Ala Pro Ala Asp Val Met Gln Ser Asp Arg Asp Asp Arg
1 5 10 15
Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser Asn His Ser Gly Leu
20 25 30
Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg Asn Arg Ile Thr Glu
35 40 45
Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro Gly Gly Phe Val Pro
50 55 60
Gly Thr Thr His Val Pro Val Ser Gly Ala Val Leu Ser Glu Glu Asp
65 70 75 80
Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met Arg Ile Ala Ala Gly
85 90 95
Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu
100 105 110
Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala
115 120 125
Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro
130 135 140
Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn
145 150 155 160
Pro Ile Phe His Asn Gly Leu Val Pro Val Phe Val Asp Val Glu Leu
165 170 175
Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro
180 185 190
Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu Gly Asn Pro Phe Glu
195 200 205
Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile
210 215 220
Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr
225 230 235 240
Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe Tyr Pro Ala His His
245 250 255
Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu
260 265 270
Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys
275 280 285
Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg Phe Asp Gln Lys Met
290 295 300
Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr Ile Phe Ser His Val
305 310 315 320
Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser
325 330 335
Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp
340 345 350
Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro
355 360 365
His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr
370 375 380
Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu
385 390 395 400
Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val
405 410 415
Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu
420 425 430
Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe Trp Ile Gly Val Phe
435 440 445
Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val Gly Asp Thr Ile Arg
450 455 460
Glu Phe Val Leu Lys His Ser
465 470
<210> 56
<211> 464
<212> PRT
<213> Streptomyces ambofaciens
<400> 56
Val Met Gln Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro
1 5 10 15
Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met
20 25 30
Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg
35 40 45
Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val
50 55 60
Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr
65 70 75 80
Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu
85 90 95
Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn
100 105 110
Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro
115 120 125
Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val
130 135 140
Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu
145 150 155 160
Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro
165 170 175
Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile
180 185 190
Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu
195 200 205
Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val
210 215 220
Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser
225 230 235 240
Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly
245 250 255
Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu
260 265 270
Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg
275 280 285
Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr
290 295 300
Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr
305 310 315 320
Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu
325 330 335
Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu
340 345 350
Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp
355 360 365
Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr
370 375 380
Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr
385 390 395 400
Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp
405 410 415
Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr
420 425 430
Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met
435 440 445
Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser
450 455 460
<210> 57
<211> 463
<212> PRT
<213> Streptomyces ambofaciens
<400> 57
Met Gln Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser
1 5 10 15
Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly
20 25 30
Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu
35 40 45
Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser
50 55 60
Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala
65 70 75 80
Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg
85 90 95
Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser
100 105 110
Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln
115 120 125
Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala
130 135 140
Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val
145 150 155 160
Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu
165 170 175
Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala
180 185 190
His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala
195 200 205
Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val Gly
210 215 220
Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr
225 230 235 240
Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys
245 250 255
Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg
260 265 270
Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys
275 280 285
Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp
290 295 300
His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp
305 310 315 320
Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe
325 330 335
Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp
340 345 350
Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro
355 360 365
Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser
370 375 380
Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg
385 390 395 400
Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg
405 410 415
Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp
420 425 430
Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile
435 440 445
Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser
450 455 460
<210> 58
<211> 450
<212> PRT
<213> Streptomyces ambofaciens
<400> 58
Met Pro Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser
1 5 10 15
Thr Met Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr
20 25 30
His Arg Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val
35 40 45
Pro Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val
50 55 60
Glu Thr Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly
65 70 75 80
Phe Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu
85 90 95
Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr
100 105 110
Ser Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val
115 120 125
Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn
130 135 140
Gly Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr
145 150 155 160
Thr Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile
165 170 175
Met Ile Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala
180 185 190
Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp
195 200 205
Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp
210 215 220
Leu Ser Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu
225 230 235 240
Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu
245 250 255
Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp
260 265 270
Asn Arg Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro
275 280 285
Gly Tyr Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys
290 295 300
Ser Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile
305 310 315 320
Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala
325 330 335
Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly
340 345 350
Ser Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala
355 360 365
Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile
370 375 380
Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr
385 390 395 400
Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu
405 410 415
Ile Thr Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro
420 425 430
Glu Met Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys
435 440 445
His Ser
450
<210> 59
<211> 433
<212> PRT
<213> Streptomyces ambofaciens
<400> 59
Met Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His
1 5 10 15
Arg Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro
20 25 30
Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu
35 40 45
Thr Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe
50 55 60
Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr
65 70 75 80
Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser
85 90 95
Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr
100 105 110
Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly
115 120 125
Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr
130 135 140
Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met
145 150 155 160
Ile Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg
165 170 175
Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala
180 185 190
Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu
195 200 205
Ser Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly
210 215 220
Gly Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser
225 230 235 240
Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn
245 250 255
Arg Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly
260 265 270
Tyr Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser
275 280 285
Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu
290 295 300
Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala
305 310 315 320
Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser
325 330 335
Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala
340 345 350
Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser
355 360 365
Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr
370 375 380
Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile
385 390 395 400
Thr Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu
405 410 415
Met Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His
420 425 430
Ser
<210> 60
<211> 1398
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1398)
<400> 60
atg gac gac acg atg gcc ggc gcc gac gcc gag gaa tgg gac ggc gat 48
Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp
1 5 10 15
cag tta gac cgc gag gac cgg gcc tcc ctc cgc cgc gtc gcg ggg ctc 96
Gln Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu
20 25 30
tcc acc gaa ctg acc gac gtc tcc gag gtc gag tac cgc cag ctg cga 144
Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gln Leu Arg
35 40 45
ctc gag cgg gtg gtg ctc gtc ggc atc tgg acc tcg gga acg gcc gcg 192
Leu Glu Arg Val Val Leu Val Gly Ile Trp Thr Ser Gly Thr Ala Ala
50 55 60
gag gcc gac agt tcg ctc gcc gag ctg gcg gcg ctc gcc gag acc gcg 240
Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala
65 70 75 80
ggc gcc ctc gtg ctg gac ggc gtc gtg cag cgc cgg cag aag ccg gac 288
Gly Ala Leu Val Leu Asp Gly Val Val Gln Arg Arg Gln Lys Pro Asp
85 90 95
ccg gcg acg tac atc ggc tcg ggc aag gcg tcg cag ctg cgc gac atc 336
Pro Ala Thr Tyr Ile Gly Ser Gly Lys Ala Ser Gln Leu Arg Asp Ile
100 105 110
gtc gag gag acc ggc gcc gac acc gtg gtg tgc gac ggg gaa ctg agc 384
Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser
115 120 125
ccc agt cag ctg atg cac ctg gag gag gtc gtc ggg gtc aag gtc gtg 432
Pro Ser Gln Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val
130 135 140
gac cgc acg gcc ctg atc ctg gac atc ttc gcg cag cac gcc cag tcc 480
Asp Arg Thr Ala Leu Ile Leu Asp Ile Phe Ala Gln His Ala Gln Ser
145 150 155 160
cgg gag ggc aag gcg cag gtg gcg ctg gcg cag atg cag tac atg ctg 528
Arg Glu Gly Lys Ala Gln Val Ala Leu Ala Gln Met Gln Tyr Met Leu
165 170 175
ccg cgg ctg cgc ggc tgg ggc cag tcg ctg tcc cgg cag atg ggc ggc 576
Pro Arg Leu Arg Gly Trp Gly Gln Ser Leu Ser Arg Gln Met Gly Gly
180 185 190
ggt ggc ggc ggt ggc atg gcc acg cgc ggt ccc ggt gag acg aag atc 624
Gly Gly Gly Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys Ile
195 200 205
gag acg gac cgg cgg cgg atc aac gac aag atg gcc agg ctc cgc cgg 672
Glu Thr Asp Arg Arg Arg Ile Asn Asp Lys Met Ala Arg Leu Arg Arg
210 215 220
gag ctg gag cag ctg aag acc ggc cgg gac gtg aac cgg gag gag cga 720
Glu Leu Glu Gln Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg
225 230 235 240
cgg cgc aac aag gtg ctg tcg gtc gcc ctc gcc ggc tac acc aac gcc 768
Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala
245 250 255
ggc aag tca tcg ctg ctc aac cgc ctc acc gga gcc ggc gtg ctg gtg 816
Gly Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val
260 265 270
gag aac gcc ctg ttc gcc acc ctg gac acg acc gtg cgg cgg gcg acg 864
Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr
275 280 285
acg ccg agc ggg cgc ccc tac acc atc gcc gac acc gtg ggc ttc gta 912
Thr Pro Ser Gly Arg Pro Tyr Thr Ile Ala Asp Thr Val Gly Phe Val
290 295 300
cgc cac ctc ccg cac cac ctg gtg gag gcg ttc cgt tcc acg atc gaa 960
Arg His Leu Pro His His Leu Val Glu Ala Phe Arg Ser Thr Ile Glu
305 310 315 320
gag gtc gcg gac gcg cat ctg gtg ctg cac gtg gtc gac ggt tcg cac 1008
Glu Val Ala Asp Ala His Leu Val Leu His Val Val Asp Gly Ser His
325 330 335
ccg gac ccc ggc gcg cag ctg gcc tcg gtg cgc gag gtg ctg cgg gac 1056
Pro Asp Pro Gly Ala Gln Leu Ala Ser Val Arg Glu Val Leu Arg Asp
340 345 350
gtg ggc gcc ggc gag tcc acc gag gtc gtg gtc gtc aac aag gcc gat 1104
Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp
355 360 365
gtc gcg gac ccg gac gtc ctc gcc cgt ctg ctg gag cag gag ccg gac 1152
Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gln Glu Pro Asp
370 375 380
gcg atc gtc gtg tcc gcc cgt tcg ggt cgg ggc atc gac gag ctg cgg 1200
Ala Ile Val Val Ser Ala Arg Ser Gly Arg Gly Ile Asp Glu Leu Arg
385 390 395 400
gaa ctg atc gac cgc ctg ctg ccg cac ccc gag gtg gag gtg gag gtc 1248
Glu Leu Ile Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val
405 410 415
gtg atc ccc tac gac gag ggg agc ctg gtg gcg cgg gtg cac gac gag 1296
Val Ile Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu
420 425 430
ggc gag gtg ctc agc acc gag cac acg ccg gag ggc acc ctg ctc acc 1344
Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr
435 440 445
gcg cgg gtc cac ccc gac ctc gcc tcg gag ctt cgg acg ctt ccg cgg 1392
Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg
450 455 460
ccg tga 1398
Pro
465
<210> 61
<211> 465
<212> PRT
<213> Streptomyces ambofaciens
<400> 61
Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp
1 5 10 15
Gln Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu
20 25 30
Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gln Leu Arg
35 40 45
Leu Glu Arg Val Val Leu Val Gly Ile Trp Thr Ser Gly Thr Ala Ala
50 55 60
Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala
65 70 75 80
Gly Ala Leu Val Leu Asp Gly Val Val Gln Arg Arg Gln Lys Pro Asp
85 90 95
Pro Ala Thr Tyr Ile Gly Ser Gly Lys Ala Ser Gln Leu Arg Asp Ile
100 105 110
Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser
115 120 125
Pro Ser Gln Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val
130 135 140
Asp Arg Thr Ala Leu Ile Leu Asp Ile Phe Ala Gln His Ala Gln Ser
145 150 155 160
Arg Glu Gly Lys Ala Gln Val Ala Leu Ala Gln Met Gln Tyr Met Leu
165 170 175
Pro Arg Leu Arg Gly Trp Gly Gln Ser Leu Ser Arg Gln Met Gly Gly
180 185 190
Gly Gly Gly Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys Ile
195 200 205
Glu Thr Asp Arg Arg Arg Ile Asn Asp Lys Met Ala Arg Leu Arg Arg
210 215 220
Glu Leu Glu Gln Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg
225 230 235 240
Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala
245 250 255
Gly Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val
260 265 270
Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr
275 280 285
Thr Pro Ser Gly Arg Pro Tyr Thr Ile Ala Asp Thr Val Gly Phe Val
290 295 300
Arg His Leu Pro His His Leu Val Glu Ala Phe Arg Ser Thr Ile Glu
305 310 315 320
Glu Val Ala Asp Ala His Leu Val Leu His Val Val Asp Gly Ser His
325 330 335
Pro Asp Pro Gly Ala Gln Leu Ala Ser Val Arg Glu Val Leu Arg Asp
340 345 350
Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp
355 360 365
Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gln Glu Pro Asp
370 375 380
Ala Ile Val Val Ser Ala Arg Ser Gly Arg Gly Ile Asp Glu Leu Arg
385 390 395 400
Glu Leu Ile Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val
405 410 415
Val Ile Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu
420 425 430
Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr
435 440 445
Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg
450 455 460
Pro
465
<210> 62
<211> 1044
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1044)
<400> 62
atg cga gta ctc att atc ggg ggt tca cag ttc gtg ggc cgg gcc ttc 48
Met Arg Val Leu Ile Ile Gly Gly Ser Gln Phe Val Gly Arg Ala Phe
1 5 10 15
gcc gcc gag gca ctg gcc gcg ggg cac cgg gtc acc acg ttc aac cgg 96
Ala Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg
20 25 30
ggt gtc agc ggc acc gac ctg ccc ggc gtc gag gcg gtc agg ggc gac 144
Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp
35 40 45
cgc gag gtg gcc ggc gac ctg gag cgg ctg gtg tcc gga agg cac tgg 192
Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp
50 55 60
gac gcg gtc gtg gac acc tgc ggt tac gtg ccc cgc acg gtg ggg gcc 240
Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala
65 70 75 80
tcg gcc gcg gcg ctg tcc ggg cac gcg gac acc tac ctc tac gtc tcc 288
Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser
85 90 95
agc atc gcc tgc ctg ccc gac tgg gcg cag gcg gtc cgt ccg gtg gac 336
Ser Ile Ala Cys Leu Pro Asp Trp Ala Gln Ala Val Arg Pro Val Asp
100 105 110
gac gac tca cct gcc cac gac tgc ccg ccg gac gcc gga ccg gac cac 384
Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His
115 120 125
gcc gac ggt gac tac ggc gtc ctg aag gcc ggc tgc gag cgc gcc gtg 432
Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val
130 135 140
gac cgg cac ttc gcg ggc cgg acc ctg cac ctg cgg gcc ggt gtc atc 480
Asp Arg His Phe Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val Ile
145 150 155 160
ctc ggg ccg cac gac acc atg cgc atg ctc gac gcc tgg ctg tgg cgc 528
Leu Gly Pro His Asp Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg
165 170 175
atg cgc gtc gcc gag ggg gag cac cgc cgg gtg ctc gcc ccg ggc aac 576
Met Arg Val Ala Glu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn
180 185 190
ccc gag gtg ggc atg cgc ctg atc gac gta cgc gat gtc gcc gtc ttc 624
Pro Glu Val Gly Met Arg Leu Ile Asp Val Arg Asp Val Ala Val Phe
195 200 205
ggc ctc gac tgc ctc gcg gac ggc cgt acc ggc gcc ttc atc gtc aac 672
Gly Leu Asp Cys Leu Ala Asp Gly Arg Thr Gly Ala Phe Ile Val Asn
210 215 220
ccg ccg gag aag aac acc acc ttc ggg gag ttg ctc acg gag tgc gtc 720
Pro Pro Glu Lys Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val
225 230 235 240
aag gcc acc ggt tcg gcc gcg gag ccg gtg tgg gtc gac gag ggg ttc 768
Lys Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe
245 250 255
ctc gcc gag cac ggc gtg agt ccg tgg acg gac ctg ccg atg tgg gtg 816
Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val
260 265 270
ccc gac acc gcg cgg gac acc ctc gtg tgg gcg gcc gga gca ccg cgc 864
Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg
275 280 285
gcc cgg gcc gcg ggt ctg gcc tgc cgg ccc ttc tcc gac acc gtg cgg 912
Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg
290 295 300
gac gcc tgg gag gtc gtc cgg gac cgg ccc gtc ccg gaa ctg ccg ctc 960
Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu
305 310 315 320
gcg gcc ggc tgc ggc ctg tcc ctg agc cgg gag aag gag ctg ctc gcc 1008
Ala Ala Gly Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala
325 330 335
gcc tgg gac gct cgc ggc ggt gcg gcg gcg ggc tga 1044
Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly
340 345
<210> 63
<211> 347
<212> PRT
<213> Streptomyces ambofaciens
<400> 63
Met Arg Val Leu Ile Ile Gly Gly Ser Gln Phe Val Gly Arg Ala Phe
1 5 10 15
Ala Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg
20 25 30
Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp
35 40 45
Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp
50 55 60
Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala
65 70 75 80
Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser
85 90 95
Ser Ile Ala Cys Leu Pro Asp Trp Ala Gln Ala Val Arg Pro Val Asp
100 105 110
Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His
115 120 125
Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val
130 135 140
Asp Arg His Phe Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val Ile
145 150 155 160
Leu Gly Pro His Asp Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg
165 170 175
Met Arg Val Ala Glu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn
180 185 190
Pro Glu Val Gly Met Arg Leu Ile Asp Val Arg Asp Val Ala Val Phe
195 200 205
Gly Leu Asp Cys Leu Ala Asp Gly Arg Thr Gly Ala Phe Ile Val Asn
210 215 220
Pro Pro Glu Lys Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val
225 230 235 240
Lys Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe
245 250 255
Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val
260 265 270
Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg
275 280 285
Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg
290 295 300
Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu
305 310 315 320
Ala Ala Gly Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala
325 330 335
Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly
340 345
<210> 64
<211> 1041
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1041)
<400> 64
atg acc gcc ctg ggt act tct gct gaa ccg ttc gcc gca ccc ggc ccg 48
Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro
1 5 10 15
ccg cgg ccg gaa gcg tcc ccg gtg ctg cgc ttc gga gcg atc ggc tgc 96
Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala Ile Gly Cys
20 25 30
ggc gac atc gcg ggc cgt cgc acc ctg ccc gcc ctg ctc tcc acc ccc 144
Gly Asp Ile Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro
35 40 45
ggc acc gtg ctg acc tgc gtc ggc agc cgc gac gcg gac cgg gcc aag 192
Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys
50 55 60
gcc ctg ggc agg cac ttc gac tgc gag gcg gtc gcg ccc tac gag gcc 240
Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala
65 70 75 80
ctg ctg gaa cgc ccc gac gtg gac gcc gtc tac atc gcg gtg ccc agc 288
Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr Ile Ala Val Pro Ser
85 90 95
atg ctg cac gcc gaa tgg gcc gcg gcg gcg ctg cgg gcg ggc aaa cac 336
Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His
100 105 110
gtc ctc gtg gag aag ccc gcc gcc gcc aac cac gcc gac gcg gcc cgc 384
Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg
115 120 125
ctg ttc gcc atg gcc cgg gag cgc gga ctg gta ctg atg gag aac ttc 432
Leu Phe Ala Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe
130 135 140
atg ttc ctc cac cac tct caa cac gcc acc gtc aaa gcc ctg ttg gag 480
Met Phe Leu His His Ser Gln His Ala Thr Val Lys Ala Leu Leu Glu
145 150 155 160
gcc ggt gcc atc gga gag ctg cgc acc ttc tcc gcc gcc ttc acc atc 528
Ala Gly Ala Ile Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr Ile
165 170 175
ccg ccg cgc gcc gac gac gac atg cgc tac cga ccc gac atc ggc ggc 576
Pro Pro Arg Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp Ile Gly Gly
180 185 190
ggc gca ctg ctc gac aac ggc gtc tac ccg ctg cgg gcc gcg ctg cac 624
Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His
195 200 205
ttc ctc gga ccc gaa ctg cgc ctg acc ggc gcc gtg ctg cgc cgt gac 672
Phe Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp
210 215 220
cgc cgc cgg ggc gtc gtg gtc tcc ggc agc gtc ctg ctc gcc gcc ccc 720
Arg Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro
225 230 235 240
cag ggc gtg gcc gcc cac ctc gcc ttc ggc atg gaa cac ggc tac cgc 768
Gln Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg
245 250 255
tcg gcg tac gag ctg cac ggc agc acc ggc tcg ctc gcc ctg agc cac 816
Ser Ala Tyr Glu Leu His Gly Ser Thr Gly Ser Leu Ala Leu Ser His
260 265 270
gtc ttc acg acc ccg gac agc cac cac ccc gta ctg cgg ctg tcc cgc 864
Val Phe Thr Thr Pro Asp Ser His His Pro Val Leu Arg Leu Ser Arg
275 280 285
cag gac cac cgg gag gag cgc gtc ctg ccc gtg gac cgg cac ttc gtg 912
Gln Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val
290 295 300
aac atc ctg tcg gtc ttc cgc cgt gcg gtg atc cgg gcc gag gac gtc 960
Asn Ile Leu Ser Val Phe Arg Arg Ala Val Ile Arg Ala Glu Asp Val
305 310 315 320
tcc gcc gag tcg tac gcc gcg ctg cgc cag gcg ggg ctg gtc gac gag 1008
Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gln Ala Gly Leu Val Asp Glu
325 330 335
atc gtg gcc cgc gcc gag acc ttc acc gtg tag 1041
Ile Val Ala Arg Ala Glu Thr Phe Thr Val
340 345
<210> 65
<211> 346
<212> PRT
<213> Streptomyces ambofaciens
<400> 65
Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro
1 5 10 15
Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala Ile Gly Cys
20 25 30
Gly Asp Ile Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro
35 40 45
Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys
50 55 60
Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala
65 70 75 80
Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr Ile Ala Val Pro Ser
85 90 95
Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His
100 105 110
Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg
115 120 125
Leu Phe Ala Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe
130 135 140
Met Phe Leu His His Ser Gln His Ala Thr Val Lys Ala Leu Leu Glu
145 150 155 160
Ala Gly Ala Ile Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr Ile
165 170 175
Pro Pro Arg Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp Ile Gly Gly
180 185 190
Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His
195 200 205
Phe Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp
210 215 220
Arg Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro
225 230 235 240
Gln Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg
245 250 255
Ser Ala Tyr Glu Leu His Gly Ser Thr Gly Ser Leu Ala Leu Ser His
260 265 270
Val Phe Thr Thr Pro Asp Ser His His Pro Val Leu Arg Leu Ser Arg
275 280 285
Gln Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val
290 295 300
Asn Ile Leu Ser Val Phe Arg Arg Ala Val Ile Arg Ala Glu Asp Val
305 310 315 320
Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gln Ala Gly Leu Val Asp Glu
325 330 335
Ile Val Ala Arg Ala Glu Thr Phe Thr Val
340 345
<210> 66
<211> 1239
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1239)
<400> 66
gtg acg gac gcg atc acg acc gag ctg gcc gac cgc gaa ctg ggg cgc 48
Val Thr Asp Ala Ile Thr Thr Glu Leu Ala Asp Arg Glu Leu Gly Arg
1 5 10 15
aga ctg cac cgg ata cgc ggc gtc cac tgg tat ttc ggc aac cac ggt 96
Arg Leu His Arg Ile Arg Gly Val His Trp Tyr Phe Gly Asn His Gly
20 25 30
gac ccg tac gcc ctc atc ctg cgc ggt cag acc gac gac ccg tcg gtg 144
Asp Pro Tyr Ala Leu Ile Leu Arg Gly Gln Thr Asp Asp Pro Ser Val
35 40 45
tac gag gag cgg gtc cgc gag ggc ggg ccg ctg ttc cgc agc cgt acc 192
Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr
50 55 60
ggg acc tgg gtg acc gcg gac ccg gag gtg gcc gcg gcc gtg ctg ggc 240
Gly Thr Trp Val Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Gly
65 70 75 80
gac tcg cgc ttc ggt gcg ctg gac cgc gcc gga cgg cgc ccg gag gag 288
Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu
85 90 95
tac ctc cag ccg tcg ccc gcc acg tac ctg ggg ctg gac cgc gcc gcg 336
Tyr Leu Gln Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala
100 105 110
tac gcg cgt ctg cgg cgg gtg gcc gag ccc gtg ctg ggc gcg gac gcc 384
Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala
115 120 125
gcc gcc gcg tgg cgc cgg ctc ggc gag gac gtc ggg cgc cgg ctg ctc 432
Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu
130 135 140
gcc ggc cgc ggt tcc ggc ctc gac ctg acg gcg gac ttc gcc cgc cgg 480
Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg
145 150 155 160
ctg ccg gca ttg gtc ctg gcc gcg tgg ctc ggg gtg ccg ggc gaa cgg 528
Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg
165 170 175
tgc gac gag tgg gag gag tcg ctg cgg gcg gcg ggg ccg ctg ctg gac 576
Cys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp
180 185 190
ggt ctg ctg tgt ccg cag acg ctg gcg gcc acc cgt gcg gcg gac tcg 624
Gly Leu Leu Cys Pro Gln Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser
195 200 205
gcc gcc gag ggg ctg cgc gcg ctg ttg gac gag gtg gtc gcc gcg cgt 672
Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg
210 215 220
ccc ggc ggg tcc ggc gag ggt gcg gtg gcc cgc atg gtc ggc gcc gga 720
Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly
225 230 235 240
gcc gcc ccc gac gac gcg gtg gcc gcc gcc gtg tgc ctg gcg ctc tcg 768
Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser
245 250 255
gcc gtc gaa ccg acg acg acc ctg gtg tgc gaa gcg gtc cgg ctg ctg 816
Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu
260 265 270
ctc gac cga ccc gag tgg tgg cgg cgg ttg tgc gac tcc ccc gct ctg 864
Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu
275 280 285
gcg ccg gcc gcg gtc cgg cac acc ctg cgg cac gcg ccc ccg gtg cgg 912
Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro Val Arg
290 295 300
ctg gag agc cgg gtg gcc cac gag gac gtg acg gtg gcg gat cgt ccg 960
Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro
305 310 315 320
ctg ccc gcc ggg agc cac gtg gtg gtg ctc gtg ggc gcg gca cgg cgc 1008
Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg
325 330 335
gcg ggc gcc ccg gcc gcg gag ccg gcg gac ctg gcg ggc gca ccg gcg 1056
Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala
340 345 350
gcg gag ctg ccg gac gac ctg tgg ttc gcg ctg tcc ggg gag ttc gtc 1104
Ala Glu Leu Pro Asp Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val
355 360 365
ggc cgt gcc gcc gag acc gcg ctg ggc gtg ctg gcc gag gcc gcc ccg 1152
Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro
370 375 380
gga ctg cgg cgg gac ggc gac atc gtc cgg cgg cgc cgt tcc ccg gtc 1200
Gly Leu Arg Arg Asp Gly Asp Ile Val Arg Arg Arg Arg Ser Pro Val
385 390 395 400
ctc ggc agg tac gcg cgg ttc ccc gtc gcg tac tcc tga 1239
Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser
405 410
<210> 67
<211> 412
<212> PRT
<213> Streptomyces ambofaciens
<400> 67
Val Thr Asp Ala Ile Thr Thr Glu Leu Ala Asp Arg Glu Leu Gly Arg
1 5 10 15
Arg Leu His Arg Ile Arg Gly Val His Trp Tyr Phe Gly Asn His Gly
20 25 30
Asp Pro Tyr Ala Leu Ile Leu Arg Gly Gln Thr Asp Asp Pro Ser Val
35 40 45
Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr
50 55 60
Gly Thr Trp Val Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Gly
65 70 75 80
Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu
85 90 95
Tyr Leu Gln Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala
100 105 110
Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala
115 120 125
Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu
130 135 140
Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg
145 150 155 160
Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg
165 170 175
Cys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp
180 185 190
Gly Leu Leu Cys Pro Gln Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser
195 200 205
Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg
210 215 220
Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly
225 230 235 240
Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser
245 250 255
Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu
260 265 270
Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu
275 280 285
Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro Val Arg
290 295 300
Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro
305 310 315 320
Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg
325 330 335
Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala
340 345 350
Ala Glu Leu Pro Asp Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val
355 360 365
Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro
370 375 380
Gly Leu Arg Arg Asp Gly Asp Ile Val Arg Arg Arg Arg Ser Pro Val
385 390 395 400
Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser
405 410
<210> 68
<211> 1272
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1272)
<400> 68
gtg cgc gtc ctg gtg acc tcc atc ccg cac cac acg cac tac tac cac 48
Val Arg Val Leu Val Thr Ser Ile Pro His His Thr His Tyr Tyr His
1 5 10 15
ctg gta ccg ctg atc tgg gct ctg cgt gcc tcg ggg cac gag gtg gtg 96
Leu Val Pro Leu Ile Trp Ala Leu Arg Ala Ser Gly His Glu Val Val
20 25 30
gcg gcc ggc cag ccg tcg ctg gtc gac gcc atc acc gcc agc ggc atc 144
Ala Ala Gly Gln Pro Ser Leu Val Asp Ala Ile Thr Ala Ser Gly Ile
35 40 45
ccg gcg ttc gcc ctg gcc gag gag gag tcg ctg gcg cag atc ttc gag 192
Pro Ala Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gln Ile Phe Glu
50 55 60
gag gtc gag ggc gat ctc cag ccg tat cag cac ggc atc gac gag ttc 240
Glu Val Glu Gly Asp Leu Gln Pro Tyr Gln His Gly Ile Asp Glu Phe
65 70 75 80
gac ttc ttc ggc acc ctg aag gac gag ctg gac tgg gag aag ctg ctc 288
Asp Phe Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu
85 90 95
gcc cag cag gtg atc ctg tcc ggc ctg tgg ctg gaa ccg ctc aac ggc 336
Ala Gln Gln Val Ile Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly
100 105 110
gcc acg acc ctc gac agc atc gtc gac ttc gcc cgg gcc tgg aag ccc 384
Ala Thr Thr Leu Asp Ser Ile Val Asp Phe Ala Arg Ala Trp Lys Pro
115 120 125
gac ctg gtg ctg tgg gag ccg ttc acc tat gcg ggg ccg gtg gcg gcc 432
Asp Leu Val Leu Trp Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala
130 135 140
cgg gcg tgc ggg gcc gcg cac gcc cgc gtc ctg tgg ggg ccg gac acg 480
Arg Ala Cys Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr
145 150 155 160
atc ggg ctg ctg cgg acg aag ttc ctt cag gcc cag gcg cgt cag ccc 528
Ile Gly Leu Leu Arg Thr Lys Phe Leu Gln Ala Gln Ala Arg Gln Pro
165 170 175
gag gag cac cgg gac gac ccg gtc gcg gag tgg atg acc tgg gcc ctg 576
Glu Glu His Arg Asp Asp Pro Val Ala Glu Trp Met Thr Trp Ala Leu
180 185 190
gcg cgc tac ggg tgc gac ttc cgg gag gag gac gtg ctc ggt cag tgg 624
Ala Arg Tyr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu Gly Gln Trp
195 200 205
agc gtg gac ccg atg gcg gag ggc gtc agt ctg ggc ctc gac ctg ccg 672
Ser Val Asp Pro Met Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro
210 215 220
acc gtc ccg atg cgc tac acc ccg tac aac ggg tcg gcg gtg atc ccc 720
Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val Ile Pro
225 230 235 240
gac tgg ctg acc gag gaa ccg aaa cgg cct cgg gtc tgc ctg acc ctg 768
Asp Trp Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu
245 250 255
ggg gtg tcc tcg cgg gag cac agt gag gac gag gtc ccg gtg cag agg 816
Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gln Arg
260 265 270
ttt atc gag gcg ctg gcc gat ctc gac atc gag ctg gtg gcg acc ctg 864
Phe Ile Glu Ala Leu Ala Asp Leu Asp Ile Glu Leu Val Ala Thr Leu
275 280 285
gac gac gcc cag cgg gac ctg ctg ccg agg atc ccg gac aac acg cgc 912
Asp Asp Ala Gln Arg Asp Leu Leu Pro Arg Ile Pro Asp Asn Thr Arg
290 295 300
atc gtc gac ttc gtg ccc atg gac gcg ttg ctg ccg acg tgc tcg gcg 960
Ile Val Asp Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala
305 310 315 320
atc atc aac cac agc ggt tcg ggc acg tgc aac acc gcc gcg ctg cac 1008
Ile Ile Asn His Ser Gly Ser Gly Thr Cys Asn Thr Ala Ala Leu His
325 330 335
ggg gtg ccg cag atc atc ctc ggc ggc atc ctg gac gcc gcc gta cgg 1056
Gly Val Pro Gln Ile Ile Leu Gly Gly Ile Leu Asp Ala Ala Val Arg
340 345 350
cag cac atg ttc gcg cag aac tcc gcc gcc ctc acc ttc gct ccg gag 1104
Gln His Met Phe Ala Gln Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu
355 360 365
gag gtg acc ggc gcg tcg ctg agg agc gcg ctg gtg cgc ctg ctc gag 1152
Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu
370 375 380
gag ccg cgg ttc cgc gac ggc gcg cgg cgg ctg aag gag cgg atg cgg 1200
Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg
385 390 395 400
gcc atg ccc agc ccg gcc ggg atc gtg ccg acc ctg gag cgc ctc acg 1248
Ala Met Pro Ser Pro Ala Gly Ile Val Pro Thr Leu Glu Arg Leu Thr
405 410 415
gcc cag cac cgc cgg gcg tgt tga 1272
Ala Gln His Arg Arg Ala Cys
420
<210> 69
<211> 423
<212> PRT
<213> Streptomyces ambofaciens
<400> 69
Val Arg Val Leu Val Thr Ser Ile Pro His His Thr His Tyr Tyr His
1 5 10 15
Leu Val Pro Leu Ile Trp Ala Leu Arg Ala Ser Gly His Glu Val Val
20 25 30
Ala Ala Gly Gln Pro Ser Leu Val Asp Ala Ile Thr Ala Ser Gly Ile
35 40 45
Pro Ala Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gln Ile Phe Glu
50 55 60
Glu Val Glu Gly Asp Leu Gln Pro Tyr Gln His Gly Ile Asp Glu Phe
65 70 75 80
Asp Phe Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu
85 90 95
Ala Gln Gln Val Ile Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly
100 105 110
Ala Thr Thr Leu Asp Ser Ile Val Asp Phe Ala Arg Ala Trp Lys Pro
115 120 125
Asp Leu Val Leu Trp Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala
130 135 140
Arg Ala Cys Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr
145 150 155 160
Ile Gly Leu Leu Arg Thr Lys Phe Leu Gln Ala Gln Ala Arg Gln Pro
165 170 175
Glu Glu His Arg Asp Asp Pro Val Ala Glu Trp Met Thr Trp Ala Leu
180 185 190
Ala Arg Tyr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu Gly Gln Trp
195 200 205
Ser Val Asp Pro Met Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro
210 215 220
Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val Ile Pro
225 230 235 240
Asp Trp Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu
245 250 255
Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gln Arg
260 265 270
Phe Ile Glu Ala Leu Ala Asp Leu Asp Ile Glu Leu Val Ala Thr Leu
275 280 285
Asp Asp Ala Gln Arg Asp Leu Leu Pro Arg Ile Pro Asp Asn Thr Arg
290 295 300
Ile Val Asp Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala
305 310 315 320
Ile Ile Asn His Ser Gly Ser Gly Thr Cys Asn Thr Ala Ala Leu His
325 330 335
Gly Val Pro Gln Ile Ile Leu Gly Gly Ile Leu Asp Ala Ala Val Arg
340 345 350
Gln His Met Phe Ala Gln Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu
355 360 365
Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu
370 375 380
Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg
385 390 395 400
Ala Met Pro Ser Pro Ala Gly Ile Val Pro Thr Leu Glu Arg Leu Thr
405 410 415
Ala Gln His Arg Arg Ala Cys
420
<210> 70
<211> 1179
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1179)
<400> 70
atg cgg gcc ctc ttc acg acc gcg ccg ctc gcg ggc cac ctg ctt ccg 48
Met Arg Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro
1 5 10 15
ctg gtg ccc atc gcg tgg gcc ctg cgg gcg gcc ggc cac gag gta ctg 96
Leu Val Pro Ile Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu
20 25 30
gtg gcg acc cgg gag gac ttc gtg ccg gtc gcc ctg cgg tcg ggg ctg 144
Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu
35 40 45
ccg tcc gcc tcg tgc ggg ccg ccc gcc gcg gac ctg gcg ggc gcg gcc 192
Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala
50 55 60
gag gcg ggg gcg ctc gcg cgg ccc cgc gga gcg gcg gag gct cgg ggg 240
Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly
65 70 75 80
gtc ctg agc ggg gcg ctg gcg cgc gtc gcc cgg ggc agt ctg gcg ggg 288
Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly
85 90 95
gtg cgg cgg ctg gcg gac gcc tgg cgg ccg gat ctg atc gtc agc gaa 336
Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu Ile Val Ser Glu
100 105 110
cgg gcc gag ttc gcc ggg ccg ctg gtc gcg gcg gcc ctc ggg gtc ccg 384
Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro
115 120 125
tgg gtc cgc tac cac tgg tcg gtc tcg tcc ctg gag gag tac cgg cga 432
Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg
130 135 140
gcg gcc gag gcc gag ttc gcg ccc gag ctg gcg gcg ctc ggc ctc gac 480
Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp
145 150 155 160
cgg ttc ccg gag gcg gcg cgc gtg ctc gat ccg tgg ccg gtg tcg ctg 528
Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu
165 170 175
cgc cgg ccg gac gcg gtc gcc cac gac ggg gtc cgg cac gta ccg gcc 576
Arg Arg Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala
180 185 190
cac ggg gac gcc ccc gtc ccc gac tgg gcg ttc acg cgc ggt cgc ggg 624
His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly
195 200 205
ccg cgg atc tgc gtg acg ctc ggc acc atg ctg ccc cgg tac ggc gcc 672
Pro Arg Ile Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala
210 215 220
gcc ggg atg gcc gac ttc ctg acg gag ctg gtg gcg gag acc cgc gga 720
Ala Gly Met Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly
225 230 235 240
ggg gac tgc gaa ctg ctc gtg gcg gtc gac gac gac gtc gtc gcg cgg 768
Gly Asp Cys Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg
245 250 255
tgg ccg tcg ctg ccc tcc gcg gtg cgg tac gcc ggc cgg ctg ccg ctg 816
Trp Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu
260 265 270
gcg gag gtg ctg ccc gcg tgc gac gcg gtg gtg cac cac ggc ggg cag 864
Ala Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gln
275 280 285
ggc acg tcc ctg acc gcg ctg gcc gcg ggt cgg ccg cag gtc gtc atg 912
Gly Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gln Val Val Met
290 295 300
gcg cgg ctc gac gac cag ttc gac aac gcg cgg gca ctg gcg gcg gcg 960
Ala Arg Leu Asp Asp Gln Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala
305 310 315 320
ggg gcg gcc ctg ctc gta ccg ccg tcc cgg gcc act ccc gcg gcc gtg 1008
Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val
325 330 335
gcc gcg ggg tgc gcc gaa gtg ctg gag aac gcc ctg tat gcc aag gcg 1056
Ala Ala Gly Cys Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala
340 345 350
gca gcc ggg ctc gcc gag gag atg gcg ctg ctg ccg tcg ccg tcg gcg 1104
Ala Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala
355 360 365
gcg gtc gga ctc ctg gaa cac ccg ggg ccc ggg ccg gac atg ccg cgg 1152
Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg
370 375 380
agt tac ccg aac gag gat gcg gtg tga 1179
Ser Tyr Pro Asn Glu Asp Ala Val
385 390
<210> 71
<211> 392
<212> PRT
<213> Streptomyces ambofaciens
<400> 71
Met Arg Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro
1 5 10 15
Leu Val Pro Ile Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu
20 25 30
Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu
35 40 45
Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala
50 55 60
Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly
65 70 75 80
Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly
85 90 95
Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu Ile Val Ser Glu
100 105 110
Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro
115 120 125
Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg
130 135 140
Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp
145 150 155 160
Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu
165 170 175
Arg Arg Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala
180 185 190
His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly
195 200 205
Pro Arg Ile Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala
210 215 220
Ala Gly Met Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly
225 230 235 240
Gly Asp Cys Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg
245 250 255
Trp Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu
260 265 270
Ala Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gln
275 280 285
Gly Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gln Val Val Met
290 295 300
Ala Arg Leu Asp Asp Gln Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala
305 310 315 320
Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val
325 330 335
Ala Ala Gly Cys Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala
340 345 350
Ala Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala
355 360 365
Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg
370 375 380
Ser Tyr Pro Asn Glu Asp Ala Val
385 390
<210> 72
<211> 993
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(993)
<400> 72
gtg aat ctg gaa gta ctc aac cgt tcg aac gat ccg cgc ggg ccg gtg 48
Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val
1 5 10 15
atc acg gtg gtc ggc gcg tcc ggc ttc atc ggg tcc gcc ctg gtc gcc 96
Ile Thr Val Val Gly Ala Ser Gly Phe Ile Gly Ser Ala Leu Val Ala
20 25 30
gag ctg gcg cgc atg ccg gtg cgg ctg cgg gcg gtg gcc cgg cgc gag 144
Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu
35 40 45
acc ccc gtt ccc gcg ggg gca cgg gcc gcc gtc gag gtc cgc cgg gcg 192
Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg Ala
50 55 60
gac ctc gcc cgg ccg gac gag gtc ggg gcc gcc gtc gag ggg gcg gac 240
Asp Leu Ala Arg Pro Asp Glu Val Gly Ala Ala Val Glu Gly Ala Asp
65 70 75 80
gcc gtc gtg cac ctc gcc gcc cac atc ggc ggc gcg cgg tcg tgg cgc 288
Ala Val Val His Leu Ala Ala His Ile Gly Gly Ala Arg Ser Trp Arg
85 90 95
gcg gcc gac gag cgg tcg ctg cgg gtg aac gtc ggt ctg ctg cgc gac 336
Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp
100 105 110
gtg gcc gac gcg ttc cgg gac cgc tcg ggg ccc gcc ccg gcc gtg gtc 384
Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val
115 120 125
ctg gcc agt acc ctc cag gcc ggc gtc gag ctg tcc cgg cag ggc ccg 432
Leu Ala Ser Thr Leu Gln Ala Gly Val Glu Leu Ser Arg Gln Gly Pro
130 135 140
tac gcc cgg cag aag tcg gcg gcc gag gag gtc ctg ctg cgg gcc gcc 480
Tyr Ala Arg Gln Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala
145 150 155 160
tcc gag gag gtg gtc cgc ggc gtc gtg ctg cgg ctg ccg acc gtc tac 528
Ser Glu Glu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr
165 170 175
ggg cgc agc ccg ctg acc ggg tgg acg ggc cgc ggg gtg gtc gcg tcg 576
Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser
180 185 190
gtg gca cgg cag gcc gtc tcg ggc gag ccg gtc acg atg tgg cac gac 624
Val Ala Arg Gln Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp
195 200 205
ggc acg gtc ggg cgc gat ctg ctc cac gtg gag gac gcg gcc cgc gcc 672
Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala
210 215 220
ttc gcg gcg gcg ctc ggt cac gtg gag cgg ctg gac ggc ggc acg tgg 720
Phe Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp
225 230 235 240
tcc gtc ggt acg ggc cgg ctg gag ccc ttg gga gag gtg ttc tcg gcc 768
Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala
245 250 255
ctc gcc ggg ctg gtg gcc gag cgg acg ggg agg ccc ccc gta ccg gtg 816
Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val
260 265 270
gtc tcc acg gag ccg ccc gac cat gcc gag gcg ggc gac ttc gag agc 864
Val Ser Thr Glu Pro Pro Asp His Ala Glu Ala Gly Asp Phe Glu Ser
275 280 285
gcg gtc tgt gac ccc tcc gcg ttc cgc gcg gtg acc ggg tgg tct ccc 912
Ala Val Cys Asp Pro Ser Ala Phe Arg Ala Val Thr Gly Trp Ser Pro
290 295 300
ctc gtt ccg ttg cgg gcg ggg ctc ggc gcc gtg gtg gag acg atg gtg 960
Leu Val Pro Leu Arg Ala Gly Leu Gly Ala Val Val Glu Thr Met Val
305 310 315 320
gcc gac gga gcg agg ggt ggg atc cga acg tga 993
Ala Asp Gly Ala Arg Gly Gly Ile Arg Thr
325 330
<210> 73
<211> 330
<212> PRT
<213> Streptomyces ambofaciens
<400> 73
Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val
1 5 10 15
Ile Thr Val Val Gly Ala Ser Gly Phe Ile Gly Ser Ala Leu Val Ala
20 25 30
Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu
35 40 45
Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg Ala
50 55 60
Asp Leu Ala Arg Pro Asp Glu Val Gly Ala Ala Val Glu Gly Ala Asp
65 70 75 80
Ala Val Val His Leu Ala Ala His Ile Gly Gly Ala Arg Ser Trp Arg
85 90 95
Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp
100 105 110
Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val
115 120 125
Leu Ala Ser Thr Leu Gln Ala Gly Val Glu Leu Ser Arg Gln Gly Pro
130 135 140
Tyr Ala Arg Gln Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala
145 150 155 160
Ser Glu Glu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr
165 170 175
Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser
180 185 190
Val Ala Arg Gln Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp
195 200 205
Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala
210 215 220
Phe Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp
225 230 235 240
Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala
245 250 255
Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val
260 265 270
Val Ser Thr Glu Pro Pro Asp His Ala Glu Ala Gly Asp Phe Glu Ser
275 280 285
Ala Val Cys Asp Pro Ser Ala Phe Arg Ala Val Thr Gly Trp Ser Pro
290 295 300
Leu Val Pro Leu Arg Ala Gly Leu Gly Ala Val Val Glu Thr Met Val
305 310 315 320
Ala Asp Gly Ala Arg Gly Gly Ile Arg Thr
325 330
<210> 74
<211> 1008
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1008)
<400> 74
gtg agc acg gac cgg gag cag gcc gcg cac acg cgg ctc ggt cgc agc 48
Val Ser Thr Asp Arg Glu Gln Ala Ala His Thr Arg Leu Gly Arg Ser
1 5 10 15
gcg acc ctg gtg agc cgg ctc tgg ctg ggc acc gtg aac ttc agc ggc 96
Ala Thr Leu Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly
20 25 30
cgg gtc gag gac ggt gac gcg atg cag ctg atg gag gcg gcg gtc gac 144
Arg Val Glu Asp Gly Asp Ala Met Gln Leu Met Glu Ala Ala Val Asp
35 40 45
cgc ggc atc aac tgc atc gac acc gcg gac atc tac ggc tgg cgg atc 192
Arg Gly Ile Asn Cys Ile Asp Thr Ala Asp Ile Tyr Gly Trp Arg Ile
50 55 60
cac aag ggc cac acc gag gaa ctg gtg ggc cgg tgg ctg gcc aag agc 240
His Lys Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser
65 70 75 80
gcc gcg cgg cgg gag gac gtc ctg ctg gcc acc aag gtc ggc ggg gac 288
Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp
85 90 95
atg agc gaa cgg ctc aac gac ggc ggc ctg tcg gcg cgg cac atc gtc 336
Met Ser Glu Arg Leu Asn Asp Gly Gly Leu Ser Ala Arg His Ile Val
100 105 110
acg gcc tgc gag cag tcg ctg cgg cgc ctg ggc gtg gac cac atc gac 384
Thr Ala Cys Glu Gln Ser Leu Arg Arg Leu Gly Val Asp His Ile Asp
115 120 125
ctg tac cag atg cac cgc gtc gac cac gcc gcg ccg tgg gac gag atc 432
Leu Tyr Gln Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu Ile
130 135 140
tgg cag gcg atg gac cgt ctg gtg gcg agc ggc aag gtg acc tac gtg 480
Trp Gln Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Thr Tyr Val
145 150 155 160
ggg tcg tcg aac ttc gcc ggc tgg aac gtc gcc gcc gcg cag gac gcg 528
Gly Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Ala Ala Gln Asp Ala
165 170 175
gcc cgg cgg cgc cag tcc ctc ggt ctg gtg tcc gag cag tgc ctg tac 576
Ala Arg Arg Arg Gln Ser Leu Gly Leu Val Ser Glu Gln Cys Leu Tyr
180 185 190
aac ctg gcg gtg cgc cac gcc gag ctg gaa ctg ctg ccg gcc gcc cag 624
Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gln
195 200 205
gcg tac gga ctg ggc gtg ttc gcc tgg tcg ccg ctg cac ggc ggg ctg 672
Ala Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu
210 215 220
ctc agc ggg gtg ctg cgc aag ctc gcg gcg ggc gtc gcg gtg aag tcg 720
Leu Ser Gly Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser
225 230 235 240
gca cag ggg cgg gcc cag ctg ctg ctg ccc gag ctg cgc gcg acg atc 768
Ala Gln Gly Arg Ala Gln Leu Leu Leu Pro Glu Leu Arg Ala Thr Ile
245 250 255
gag gcg tac gag ggg ttc tgc ggc cgg atc ggc gcg gat ccg gcc gag 816
Glu Ala Tyr Glu Gly Phe Cys Gly Arg Ile Gly Ala Asp Pro Ala Glu
260 265 270
gtc ggt ctg gcc tgg gtg ctg tcc cgg ccg ggg atc agc ggc gcg gtg 864
Val Gly Leu Ala Trp Val Leu Ser Arg Pro Gly Ile Ser Gly Ala Val
275 280 285
atc ggt ccg cgc acg gtg gac cag ctg gac tcg gcg ctg cgg tcc ctg 912
Ile Gly Pro Arg Thr Val Asp Gln Leu Asp Ser Ala Leu Arg Ser Leu
290 295 300
gac ctg gtc ctc ggg gag gcc gaa ctg gcc gag ctg gac gcc atc ttc 960
Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala Ile Phe
305 310 315 320
ccg ccc ctg ggc aag ggc ggc cgg gcg ccg gac gcg tgg atc agc tga 1008
Pro Pro Leu Gly Lys Gly Gly Arg Ala Pro Asp Ala Trp Ile Ser
325 330 335
<210> 75
<211> 335
<212> PRT
<213> Streptomyces ambofaciens
<400> 75
Val Ser Thr Asp Arg Glu Gln Ala Ala His Thr Arg Leu Gly Arg Ser
1 5 10 15
Ala Thr Leu Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly
20 25 30
Arg Val Glu Asp Gly Asp Ala Met Gln Leu Met Glu Ala Ala Val Asp
35 40 45
Arg Gly Ile Asn Cys Ile Asp Thr Ala Asp Ile Tyr Gly Trp Arg Ile
50 55 60
His Lys Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser
65 70 75 80
Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp
85 90 95
Met Ser Glu Arg Leu Asn Asp Gly Gly Leu Ser Ala Arg His Ile Val
100 105 110
Thr Ala Cys Glu Gln Ser Leu Arg Arg Leu Gly Val Asp His Ile Asp
115 120 125
Leu Tyr Gln Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu Ile
130 135 140
Trp Gln Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Thr Tyr Val
145 150 155 160
Gly Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Ala Ala Gln Asp Ala
165 170 175
Ala Arg Arg Arg Gln Ser Leu Gly Leu Val Ser Glu Gln Cys Leu Tyr
180 185 190
Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gln
195 200 205
Ala Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu
210 215 220
Leu Ser Gly Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser
225 230 235 240
Ala Gln Gly Arg Ala Gln Leu Leu Leu Pro Glu Leu Arg Ala Thr Ile
245 250 255
Glu Ala Tyr Glu Gly Phe Cys Gly Arg Ile Gly Ala Asp Pro Ala Glu
260 265 270
Val Gly Leu Ala Trp Val Leu Ser Arg Pro Gly Ile Ser Gly Ala Val
275 280 285
Ile Gly Pro Arg Thr Val Asp Gln Leu Asp Ser Ala Leu Arg Ser Leu
290 295 300
Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala Ile Phe
305 310 315 320
Pro Pro Leu Gly Lys Gly Gly Arg Ala Pro Asp Ala Trp Ile Ser
325 330 335
<210> 76
<211> 1233
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1233)
<400> 76
atg att gcc acc gcg tgc cgc gtc tgc ggc aac aag gag ctg ctc tcc 48
Met Ile Ala Thr Ala Cys Arg Val Cys Gly Asn Lys Glu Leu Leu Ser
1 5 10 15
gta ctc gac ctg ggc gaa cag gcg ctc acc ggg gtg ttc ccg gcc gac 96
Val Leu Asp Leu Gly Glu Gln Ala Leu Thr Gly Val Phe Pro Ala Asp
20 25 30
cgc gac gag gtc gtg ccg tcg gtc ccg ctg gaa ctc gtc gcg tgt tcc 144
Arg Asp Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser
35 40 45
ccg gcc gga tgc ggc ctc gtg caa ctg cgc cac acc ccc gac ccg gac 192
Pro Ala Gly Cys Gly Leu Val Gln Leu Arg His Thr Pro Asp Pro Asp
50 55 60
ctc atg tac ggc gag ggc tac ggc tac cgc tcg ggc atc cgg ccc ttc 240
Leu Met Tyr Gly Glu Gly Tyr Gly Tyr Arg Ser Gly Ile Arg Pro Phe
65 70 75 80
atg gtc gac cac ctg cat ggc aag gtc gcc gcc gtc cgc cgg ctg gtg 288
Met Val Asp His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val
85 90 95
gac ctc ggc ccg gac gac ctg gtc ctc gac atc ggc agc aac gac gcc 336
Asp Leu Gly Pro Asp Asp Leu Val Leu Asp Ile Gly Ser Asn Asp Ala
100 105 110
acg ctc ctc aag ggc tac ccc gcc gac ggc ccg cga ctg gtc ggc atc 384
Thr Leu Leu Lys Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly Ile
115 120 125
gac ccg acc ggc ggc aag ttc cgc gac ctg tac ccg ccg aac gcc gag 432
Asp Pro Thr Gly Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu
130 135 140
ttg gtc gtg gac tac ttc acc cgc gcg acc ttc gag aac cgc ttc ggg 480
Leu Val Val Asp Tyr Phe Thr Arg Ala Thr Phe Glu Asn Arg Phe Gly
145 150 155 160
gcg cgg cgg gcg aag gcc gtc acc tcc atc gcg atg ttc tac gac ctg 528
Ala Arg Arg Ala Lys Ala Val Thr Ser Ile Ala Met Phe Tyr Asp Leu
165 170 175
ccg gac ccg ctg cgc ttc atg agc gac gtc cgc gac gtc ctc gcc gag 576
Pro Asp Pro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu
180 185 190
gac ggc gtc tgg atg atg gag cag agc tac ctg ccc gcc atg ctc gaa 624
Asp Gly Val Trp Met Met Glu Gln Ser Tyr Leu Pro Ala Met Leu Glu
195 200 205
gcc gac gcg tac gac atc gtc tgc cac gag cac ctg gag tac tac gcg 672
Ala Asp Ala Tyr Asp Ile Val Cys His Glu His Leu Glu Tyr Tyr Ala
210 215 220
ctg cgc cag atc gag tgg atg gcg gaa cgc gtc ggc ctc acc gtc atc 720
Leu Arg Gln Ile Glu Trp Met Ala Glu Arg Val Gly Leu Thr Val Ile
225 230 235 240
cgg gcc gag ctc acc gag gtg tac ggc ggc agc ctg tgc gtc acg ctc 768
Arg Ala Glu Leu Thr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr Leu
245 250 255
gcc agg acc ggt tcc cgg cac ccg agg gac gag gcg ggc ctg gcc cgc 816
Ala Arg Thr Gly Ser Arg His Pro Arg Asp Glu Ala Gly Leu Ala Arg
260 265 270
atc cgg gcc gcc gag gcc gcc gcg gga ctg gac ggc atg gca ccg ttc 864
Ile Arg Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro Phe
275 280 285
gag gcc ttc gcc cgc cgc gtc gcc gac cag cgg gac gcc ctg cgc ggc 912
Glu Ala Phe Ala Arg Arg Val Ala Asp Gln Arg Asp Ala Leu Arg Gly
290 295 300
ttc ctg gac cgc tcc cgc caa gag ggc ctg ctg acc ctc ggg tac ggc 960
Phe Leu Asp Arg Ser Arg Gln Glu Gly Leu Leu Thr Leu Gly Tyr Gly
305 310 315 320
gcc tcc acc aag ggc aac gtc atc ctc cag tac tgc ggg atc acc gaa 1008
Ala Ser Thr Lys Gly Asn Val Ile Leu Gln Tyr Cys Gly Ile Thr Glu
325 330 335
cgg gac ctg ccg tgc atc ggc gag gtg agc gag gag aag gcg ggg cgt 1056
Arg Asp Leu Pro Cys Ile Gly Glu Val Ser Glu Glu Lys Ala Gly Arg
340 345 350
ttc acc ccc ggg acg ggc atc ccc atc gtg tcc gag gag gac gcg aag 1104
Phe Thr Pro Gly Thr Gly Ile Pro Ile Val Ser Glu Glu Asp Ala Lys
355 360 365
gcg cag aag ccg gac cag ttg ctg gtc ctg ccc tgg atc tac cgg gac 1152
Ala Gln Lys Pro Asp Gln Leu Leu Val Leu Pro Trp Ile Tyr Arg Asp
370 375 380
ggg ttc gtc gaa cgg gag cgg gag ttc ctc gac ggc ggc ggc cga ctg 1200
Gly Phe Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu
385 390 395 400
gtc ttc ccg ctg ccc gcg ctc gac gtc gtg tga 1233
Val Phe Pro Leu Pro Ala Leu Asp Val Val
405 410
<210> 77
<211> 410
<212> PRT
<213> Streptomyces ambofaciens
<400> 77
Met Ile Ala Thr Ala Cys Arg Val Cys Gly Asn Lys Glu Leu Leu Ser
1 5 10 15
Val Leu Asp Leu Gly Glu Gln Ala Leu Thr Gly Val Phe Pro Ala Asp
20 25 30
Arg Asp Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser
35 40 45
Pro Ala Gly Cys Gly Leu Val Gln Leu Arg His Thr Pro Asp Pro Asp
50 55 60
Leu Met Tyr Gly Glu Gly Tyr Gly Tyr Arg Ser Gly Ile Arg Pro Phe
65 70 75 80
Met Val Asp His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val
85 90 95
Asp Leu Gly Pro Asp Asp Leu Val Leu Asp Ile Gly Ser Asn Asp Ala
100 105 110
Thr Leu Leu Lys Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly Ile
115 120 125
Asp Pro Thr Gly Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu
130 135 140
Leu Val Val Asp Tyr Phe Thr Arg Ala Thr Phe Glu Asn Arg Phe Gly
145 150 155 160
Ala Arg Arg Ala Lys Ala Val Thr Ser Ile Ala Met Phe Tyr Asp Leu
165 170 175
Pro Asp Pro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu
180 185 190
Asp Gly Val Trp Met Met Glu Gln Ser Tyr Leu Pro Ala Met Leu Glu
195 200 205
Ala Asp Ala Tyr Asp Ile Val Cys His Glu His Leu Glu Tyr Tyr Ala
210 215 220
Leu Arg Gln Ile Glu Trp Met Ala Glu Arg Val Gly Leu Thr Val Ile
225 230 235 240
Arg Ala Glu Leu Thr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr Leu
245 250 255
Ala Arg Thr Gly Ser Arg His Pro Arg Asp Glu Ala Gly Leu Ala Arg
260 265 270
Ile Arg Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro Phe
275 280 285
Glu Ala Phe Ala Arg Arg Val Ala Asp Gln Arg Asp Ala Leu Arg Gly
290 295 300
Phe Leu Asp Arg Ser Arg Gln Glu Gly Leu Leu Thr Leu Gly Tyr Gly
305 310 315 320
Ala Ser Thr Lys Gly Asn Val Ile Leu Gln Tyr Cys Gly Ile Thr Glu
325 330 335
Arg Asp Leu Pro Cys Ile Gly Glu Val Ser Glu Glu Lys Ala Gly Arg
340 345 350
Phe Thr Pro Gly Thr Gly Ile Pro Ile Val Ser Glu Glu Asp Ala Lys
355 360 365
Ala Gln Lys Pro Asp Gln Leu Leu Val Leu Pro Trp Ile Tyr Arg Asp
370 375 380
Gly Phe Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu
385 390 395 400
Val Phe Pro Leu Pro Ala Leu Asp Val Val
405 410
<210> 78
<211> 1116
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1116)
<400> 78
gtg cac cgg gac aac gcc gcc gag ccg ttg gtc aaa tgc ctg gtc tgg 48
Val His Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp
1 5 10 15
gac ctg gac aac acc ctc tgg cag ggc acc ctc ctc gag gag gac gag 96
Asp Leu Asp Asn Thr Leu Trp Gln Gly Thr Leu Leu Glu Glu Asp Glu
20 25 30
gtc cgg ctc gcc ccg gac gtc ctg cgg acc atc acc gag ctg gac gcg 144
Val Arg Leu Ala Pro Asp Val Leu Arg Thr Ile Thr Glu Leu Asp Ala
35 40 45
cgc ggc atc ctg cag gcg gtg gcc agc aag aac gac cac gat cac gcc 192
Arg Gly Ile Leu Gln Ala Val Ala Ser Lys Asn Asp His Asp His Ala
50 55 60
tgg gcg aag ctc gaa cag ctc ggc gtc gcc gag tac ttc gtg ctc ccg 240
Trp Ala Lys Leu Glu Gln Leu Gly Val Ala Glu Tyr Phe Val Leu Pro
65 70 75 80
agg atc ggc tgg ggc ccg aag tcg aag tcg gtc cgc gag atc gcc gac 288
Arg Ile Gly Trp Gly Pro Lys Ser Lys Ser Val Arg Glu Ile Ala Asp
85 90 95
cgg ctg aac ttc gcg ccg agc acc ctc gcc ttc atc gac gac cag ccc 336
Arg Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe Ile Asp Asp Gln Pro
100 105 110
ttc gaa cgg gcc gag gtc acc cac gaa ctg ccg gag gtc cgc acc tac 384
Phe Glu Arg Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr
115 120 125
gcc gcc gag cag gcg acc cgg ctg acc ggc ctc ccg gag ttc agc ccg 432
Ala Ala Glu Gln Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro
130 135 140
ggc acc gtc acc gtc gac tcg acc cgc cgc cgc tcc atg tac cag gcg 480
Gly Thr Val Thr Val Asp Ser Thr Arg Arg Arg Ser Met Tyr Gln Ala
145 150 155 160
tcc ttc cgc cgg gac gcc gag cgg tcc gac ttc acc gga ccc gac gcg 528
Ser Phe Arg Arg Asp Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala
165 170 175
gac ttc ctg cgc tcg ctg gac atc cgg atg cgg atc agc cgc gcc acg 576
Asp Phe Leu Arg Ser Leu Asp Ile Arg Met Arg Ile Ser Arg Ala Thr
180 185 190
ccc ctg gag ctg tcg cgg gtc gag gaa ctg acc ctg cgc acc agc cag 624
Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gln
195 200 205
atg aac gcc acc gga gtg cac tac tcc gag gac gag ctg cgc gcc ctc 672
Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu
210 215 220
atc gac gac ccc gac cac gag gtg ctg gtc acc acc gtc acc gat cgc 720
Ile Asp Asp Pro Asp His Glu Val Leu Val Thr Thr Val Thr Asp Arg
225 230 235 240
ttc ggt ccc tac ggc gcg gtc ggc gtc gtg ctg ctg cgg cgc ggc ccc 768
Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro
245 250 255
gag gcc tgg cgg atc aag ctg ctg gcc acc tcg tgc cgg gtg gtg tcg 816
Glu Ala Trp Arg Ile Lys Leu Leu Ala Thr Ser Cys Arg Val Val Ser
260 265 270
ctg ggg gcc ggc acg gtg atc ctg cgc tgg ctg acg gac cag gcg cac 864
Leu Gly Ala Gly Thr Val Ile Leu Arg Trp Leu Thr Asp Gln Ala His
275 280 285
cgg gcc ggg gtg cac ctc gga gcc gac ttc cgg gcc acc gaa cgc aac 912
Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn
290 295 300
cgg atg atg gaa gtg gcc tac cgc ttc gcc gga ttc acc gac gat ccc 960
Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro
305 310 315 320
tgc ccg tgc cag gac gcc tcc gcc gcc acc ggc gcg atc ggc cgc ctg 1008
Cys Pro Cys Gln Asp Ala Ser Ala Ala Thr Gly Ala Ile Gly Arg Leu
325 330 335
cac ctg gtg ccg tcc ccc cgg ccc gcc ccc gac acc ctc cgt ctg gaa 1056
His Leu Val Pro Ser Pro Arg Pro Ala Pro Asp Thr Leu Arg Leu Glu
340 345 350
gct ccc gac ctg gcc acg ggc cgg cgg cgc ccc ggc cag gat ccc gaa 1104
Ala Pro Asp Leu Ala Thr Gly Arg Arg Arg Pro Gly Gln Asp Pro Glu
355 360 365
agg acc cca tga 1116
Arg Thr Pro
370
<210> 79
<211> 371
<212> PRT
<213> Streptomyces ambofaciens
<400> 79
Val His Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp
1 5 10 15
Asp Leu Asp Asn Thr Leu Trp Gln Gly Thr Leu Leu Glu Glu Asp Glu
20 25 30
Val Arg Leu Ala Pro Asp Val Leu Arg Thr Ile Thr Glu Leu Asp Ala
35 40 45
Arg Gly Ile Leu Gln Ala Val Ala Ser Lys Asn Asp His Asp His Ala
50 55 60
Trp Ala Lys Leu Glu Gln Leu Gly Val Ala Glu Tyr Phe Val Leu Pro
65 70 75 80
Arg Ile Gly Trp Gly Pro Lys Ser Lys Ser Val Arg Glu Ile Ala Asp
85 90 95
Arg Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe Ile Asp Asp Gln Pro
100 105 110
Phe Glu Arg Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr
115 120 125
Ala Ala Glu Gln Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro
130 135 140
Gly Thr Val Thr Val Asp Ser Thr Arg Arg Arg Ser Met Tyr Gln Ala
145 150 155 160
Ser Phe Arg Arg Asp Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala
165 170 175
Asp Phe Leu Arg Ser Leu Asp Ile Arg Met Arg Ile Ser Arg Ala Thr
180 185 190
Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gln
195 200 205
Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu
210 215 220
Ile Asp Asp Pro Asp His Glu Val Leu Val Thr Thr Val Thr Asp Arg
225 230 235 240
Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro
245 250 255
Glu Ala Trp Arg Ile Lys Leu Leu Ala Thr Ser Cys Arg Val Val Ser
260 265 270
Leu Gly Ala Gly Thr Val Ile Leu Arg Trp Leu Thr Asp Gln Ala His
275 280 285
Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn
290 295 300
Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro
305 310 315 320
Cys Pro Cys Gln Asp Ala Ser Ala Ala Thr Gly Ala Ile Gly Arg Leu
325 330 335
His Leu Val Pro Ser Pro Arg Pro Ala Pro Asp Thr Leu Arg Leu Glu
340 345 350
Ala Pro Asp Leu Ala Thr Gly Arg Arg Arg Pro Gly Gln Asp Pro Glu
355 360 365
Arg Thr Pro
370
<210> 80
<211> 1122
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1122)
<400> 80
gtg gct gac acc tcc cac gcc gac ggc acc gag gcc gag gag ctg ttc 48
Val Ala Asp Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe
1 5 10 15
acc gcg ctg gtc ggc gac cgg gcg gcc gag tgg gac cgg acg ggc gag 96
Thr Ala Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu
20 25 30
ctg ccc ctc ggc ctg ctg cac gac ctc ggc tcc cgg ggc ctg ctg tgc 144
Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys
35 40 45
gca cag gcg ccc gcg gtc cac ggc ggc ctc ggc tgg acc agc cgg cgc 192
Ala Gln Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg
50 55 60
aac ggc gaa ctc acc gcg cac gtc ggc gcc ctc tgc agc tcg ttg cgg 240
Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg
65 70 75 80
agc gtc atg acc tcg cag ggc atg gcc gcc tgg acg ctg cgc cgg ctc 288
Ser Val Met Thr Ser Gln Gly Met Ala Ala Trp Thr Leu Arg Arg Leu
85 90 95
gcc gga gcg gac cag cag gcc tcc ctg gtg ccc cgg ttg acc ggc ggc 336
Ala Gly Ala Asp Gln Gln Ala Ser Leu Val Pro Arg Leu Thr Gly Gly
100 105 110
gaa ctg gcc gcc gtg gcg ttc acc gag gcc ggc gcc ggc agc gac ctg 384
Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu
115 120 125
tcc gcc ctg cgc acc cgc atc acc tcc gac ggc gac gaa gtc gtc gtc 432
Ser Ala Leu Arg Thr Arg Ile Thr Ser Asp Gly Asp Glu Val Val Val
130 135 140
gac ggc gtc aag gtg tgg gcg acc aac gcc gcg tac gcg gac ctg ctg 480
Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu
145 150 155 160
gtg gtc ttc ggc cgc acg gag cag ggc gcg ggc gcc gtc gtg gtg ccc 528
Val Val Phe Gly Arg Thr Glu Gln Gly Ala Gly Ala Val Val Val Pro
165 170 175
gcc tcg gcc ccc ggc gta cgc gtc gag cgc atc acc gac gcg cac ggc 576
Ala Ser Ala Pro Gly Val Arg Val Glu Arg Ile Thr Asp Ala His Gly
180 185 190
tgc cgc gcg gcc gga cac gcc gac atc cac ctg gac ggg gtc cgg ctg 624
Cys Arg Ala Ala Gly His Ala Asp Ile His Leu Asp Gly Val Arg Leu
195 200 205
ccg gca gac gcc ctg ctc cag ggc cac gac cgc acc ccc gcc ctg ctg 672
Pro Ala Asp Ala Leu Leu Gln Gly His Asp Arg Thr Pro Ala Leu Leu
210 215 220
gtc acc acc gcg ctg agc tac ggc cgg atg tcg gtg gcc tgg ggc tcc 720
Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser
225 230 235 240
ctg ggc atc ctg cgc gcc tgc ctg gcc gcc gcc gca cgt cac gcc ggc 768
Leu Gly Ile Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly
245 250 255
gga cgg gag cag ttc ggc acg cgg ctc tcg gac cac cag ctc gtc gcc 816
Gly Arg Glu Gln Phe Gly Thr Arg Leu Ser Asp His Gln Leu Val Ala
260 265 270
cgg cac ctc gcc gaa ctg ttc gtc gcc gaa cag cac gcc gcc cgg gcg 864
Arg His Leu Ala Glu Leu Phe Val Ala Glu Gln His Ala Ala Arg Ala
275 280 285
tgc gag cac gcc agc gcc cag tgg gac gag ggc agc ccc gac atg gtg 912
Cys Glu His Ala Ser Ala Gln Trp Asp Glu Gly Ser Pro Asp Met Val
290 295 300
gtc gcc gcc gtc ctg gcc aag cac gtc gcg gcc acc ggc gcc gca cgc 960
Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg
305 310 315 320
ggg gcc gaa cgg gcc gtg cag gtg ctg gcg tcg gcc ggg gcg cgg gag 1008
Gly Ala Glu Arg Ala Val Gln Val Leu Ala Ser Ala Gly Ala Arg Glu
325 330 335
gga cac gtc gtc gca cgg gcg cac cgc gac gcc aag ctc atg gag atc 1056
Gly His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu Ile
340 345 350
atc gag ggc agc aac gag atc tgc gaa ctg gtc ctg gcc cgg cac gtg 1104
Ile Glu Gly Ser Asn Glu Ile Cys Glu Leu Val Leu Ala Arg His Val
355 360 365
atg tcc gcg gcc ggg tga 1122
Met Ser Ala Ala Gly
370
<210> 81
<211> 373
<212> PRT
<213> Streptomyces ambofaciens
<400> 81
Val Ala Asp Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe
1 5 10 15
Thr Ala Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu
20 25 30
Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys
35 40 45
Ala Gln Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg
50 55 60
Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg
65 70 75 80
Ser Val Met Thr Ser Gln Gly Met Ala Ala Trp Thr Leu Arg Arg Leu
85 90 95
Ala Gly Ala Asp Gln Gln Ala Ser Leu Val Pro Arg Leu Thr Gly Gly
100 105 110
Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu
115 120 125
Ser Ala Leu Arg Thr Arg Ile Thr Ser Asp Gly Asp Glu Val Val Val
130 135 140
Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu
145 150 155 160
Val Val Phe Gly Arg Thr Glu Gln Gly Ala Gly Ala Val Val Val Pro
165 170 175
Ala Ser Ala Pro Gly Val Arg Val Glu Arg Ile Thr Asp Ala His Gly
180 185 190
Cys Arg Ala Ala Gly His Ala Asp Ile His Leu Asp Gly Val Arg Leu
195 200 205
Pro Ala Asp Ala Leu Leu Gln Gly His Asp Arg Thr Pro Ala Leu Leu
210 215 220
Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser
225 230 235 240
Leu Gly Ile Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly
245 250 255
Gly Arg Glu Gln Phe Gly Thr Arg Leu Ser Asp His Gln Leu Val Ala
260 265 270
Arg His Leu Ala Glu Leu Phe Val Ala Glu Gln His Ala Ala Arg Ala
275 280 285
Cys Glu His Ala Ser Ala Gln Trp Asp Glu Gly Ser Pro Asp Met Val
290 295 300
Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg
305 310 315 320
Gly Ala Glu Arg Ala Val Gln Val Leu Ala Ser Ala Gly Ala Arg Glu
325 330 335
Gly His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu Ile
340 345 350
Ile Glu Gly Ser Asn Glu Ile Cys Glu Leu Val Leu Ala Arg His Val
355 360 365
Met Ser Ala Ala Gly
370
<210> 82
<211> 312
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(312)
<400> 82
atg acc acg acg tcc ggt cgg ccc gac ccc acc ggc acg acc ccc acc 48
Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr
1 5 10 15
gcc gac gag gtc gcc ggg gaa ctg ctc ggg ttc ctc gag gac cgc acc 96
Ala Asp Glu Val Ala Gly Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr
20 25 30
aag acc acc tgg gag cgc gac cag gac ctg ttc gcc gtc ggc ggg atg 144
Lys Thr Thr Trp Glu Arg Asp Gln Asp Leu Phe Ala Val Gly Gly Met
35 40 45
tcc tcg ctg ttc gcc atg cag ctc gtc gtg cac ctg gag aag acc tac 192
Ser Ser Leu Phe Ala Met Gln Leu Val Val His Leu Glu Lys Thr Tyr
50 55 60
ggc atc gtc atc agc ggc gcc gac ctg atg ctc gac aac ttc cgc acc 240
Gly Ile Val Ile Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr
65 70 75 80
gtc gac gcg atg gtc cgg ctg gtc gga cgg ctg gcc gcg ccc ggc gag 288
Val Asp Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu
85 90 95
gcg acc ggg cac gca ggt ggc tga 312
Ala Thr Gly His Ala Gly Gly
100
<210> 83
<211> 103
<212> PRT
<213> Streptomyces ambofaciens
<400> 83
Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr
1 5 10 15
Ala Asp Glu Val Ala Gly Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr
20 25 30
Lys Thr Thr Trp Glu Arg Asp Gln Asp Leu Phe Ala Val Gly Gly Met
35 40 45
Ser Ser Leu Phe Ala Met Gln Leu Val Val His Leu Glu Lys Thr Tyr
50 55 60
Gly Ile Val Ile Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr
65 70 75 80
Val Asp Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu
85 90 95
Ala Thr Gly His Ala Gly Gly
100
<210> 84
<211> 867
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(867)
<400> 84
gtg ccc gat tcc aag gaa aat tct ccg ctc gtc gtg ctc ggc gcg ggc 48
Val Pro Asp Ser Lys Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly
1 5 10 15
gtc atg ggc acg gcc atc gcg gca ctc gcc gtc gga cac ggg cac ccg 96
Val Met Gly Thr Ala Ile Ala Ala Leu Ala Val Gly His Gly His Pro
20 25 30
gtc aca ctg gtc gac acc tcc gcc ggg gcg cgc gcg gcc gcc ccc gac 144
Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp
35 40 45
gcg gtc gcg ctg cat ctg cgg acg gcc cgg ctg atg ggc gcg ctg ccc 192
Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro
50 55 60
cac gac cgc ccg ccc ggg gag ctg acc gtc gag gag gcg ccg gcc gcc 240
His Asp Arg Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala
65 70 75 80
gtc gcc acc gcg acc gcc gtg atc gag gcc gtc acc gag gac ccc gag 288
Val Ala Thr Ala Thr Ala Val Ile Glu Ala Val Thr Glu Asp Pro Glu
85 90 95
cgg aag gcc gag gtg ctg gcg gac ctg gcg tcc gtg gcg cgc ccg ggg 336
Arg Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val Ala Arg Pro Gly
100 105 110
acg ctg ctc gtc agc aac acc tcg ggc gtc ccc atc gac gag ctg gcc 384
Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro Ile Asp Glu Leu Ala
115 120 125
gac gcc gtc ccc cgc ccc gag gac ctc gtc ggc gtg cac ttc atg aac 432
Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn
130 135 140
ccc gcg tac gtg atc ccc acg gtc gag gtg gtc ctc gga ccg cgc agc 480
Pro Ala Tyr Val Ile Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser
145 150 155 160
gga gag gcg gcc gcc cgg gcc acc cgg gac ctg ctg tcc ggc ctg ggc 528
Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly
165 170 175
cgc cgg ggc atc gtc gtc ggc gac ggc gcc ggc ttc gtg acc agc cgc 576
Arg Arg Gly Ile Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg
180 185 190
ctg ctg cac cgg atg ctg aac gac gcc atc gcg gtg gtg cac gag ggc 624
Leu Leu His Arg Met Leu Asn Asp Ala Ile Ala Val Val His Glu Gly
195 200 205
cgg gcc acc ccg gag acc gtg gac gcg ctg atg cgc gac tgc atc ggc 672
Arg Ala Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys Ile Gly
210 215 220
cac cgc acc gga ccc ctg gcc acg gcc gac ctg atc gga ctg gac aac 720
His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu Ile Gly Leu Asp Asn
225 230 235 240
ctg gcc gac tcg ctg cgg gtg atg cac gaa cgg acc ggc gat ccg gcg 768
Leu Ala Asp Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala
245 250 255
ctc cgc ccg agc gag ctg ctg ctg gac aag gtc cgc cag ggc ctg ctc 816
Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gln Gly Leu Leu
260 265 270
ggc cgc aag agc ggc cgg gga ttc tac gac tac cag gag gcc acg cga 864
Gly Arg Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Gln Glu Ala Thr Arg
275 280 285
tga 867
<210> 85
<211> 288
<212> PRT
<213> Streptomyces ambofaciens
<400> 85
Val Pro Asp Ser Lys Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly
1 5 10 15
Val Met Gly Thr Ala Ile Ala Ala Leu Ala Val Gly His Gly His Pro
20 25 30
Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp
35 40 45
Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro
50 55 60
His Asp Arg Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala
65 70 75 80
Val Ala Thr Ala Thr Ala Val Ile Glu Ala Val Thr Glu Asp Pro Glu
85 90 95
Arg Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val Ala Arg Pro Gly
100 105 110
Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro Ile Asp Glu Leu Ala
115 120 125
Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn
130 135 140
Pro Ala Tyr Val Ile Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser
145 150 155 160
Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly
165 170 175
Arg Arg Gly Ile Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg
180 185 190
Leu Leu His Arg Met Leu Asn Asp Ala Ile Ala Val Val His Glu Gly
195 200 205
Arg Ala Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys Ile Gly
210 215 220
His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu Ile Gly Leu Asp Asn
225 230 235 240
Leu Ala Asp Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala
245 250 255
Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gln Gly Leu Leu
260 265 270
Gly Arg Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Gln Glu Ala Thr Arg
275 280 285
<210> 86
<211> 1040
<212> DNA
<213> Streptomyces fradiae
<400> 86
ggcaggagcc acccgtgaca gggctgccgc ggcccgccgt ccgggtgccg ttccacgatc 60
tgcgggacgt gcacgcggcc acgggggtgg agtcggagat cggcggcgcg ctgctgcgcg 120
tcgccgcgcg cgggcgctat ctgctgggtg ccgaactcgc cgcgttcgag gagcggttcg 180
ccgagtactg cggcaacgcc cactgtgtcg ccgtgggcag cgggctcgac gacgctcgtc 240
tggcgctgtg ggcgctcggg gtgggcgagg gcgacgaggt gatcgtgccc tcgcacacgt 300
tcatcgcgtc ctggctcgcg gtgtcggcga cgggtgccac cccggtgccg gtcgagcccg 360
gtgatcccgg cgagccgggg cccggggcgt tcctgctcga cccggaccgg ctggaggccg 420
cgctgacccc gcggaccagg gccgtgatgc ccgtgcatct ctacgggcac ccggtggatc 480
tggacccggt cggggcgttc gcggagccgc acgggctggc cgtcgtggag gacgcggcgc 540
aggccacggc ccgttaccgc gggaggcgga tcggcagcgg ccaccgcacg gcgttcagct 600
tctacccggg gaagaacctg ggcgcgctcg gcgacggcgg tgccgtggtc acctcggacc 660
cggaactcgc ggaccggctg cggctgttgc gcaactacgg cgcccgggag aagtaccggc 720
acgaggagcg gggcaccaac tcccgcctgg acgagctgca ggcggccgtg ctgtcggtca 780
agctgccgta cctggacgcc tggaacaccc gccgccggga gatcgccgcc cgctacggcg 840
aggcgctggc cggtctgccg ggcgtcaccg tgccggaggg ccgcgtggcg gagccggtct 900
ggcatcagta cgtgctgcgc agcccgtacc gcgaccggtt gcggcggcgg ctggccgagg 960
cgggggtgga gaccctggtc cactatccgg tggccgtgca cgcgtcgggc gcgtacgcgg 1020
gcgcggggcc gtgtcccgcc 1040
<210> 87
<211> 388
<212> PRT
<213> Streptomyces fradiae
<400> 87
Met Thr Gly Leu Pro Arg Pro Ala Val Arg Val Pro Phe His Asp Leu
1 5 10 15
Arg Asp Val His Ala Ala Thr Gly Val Glu Ser Glu Ile Gly Gly Ala
20 25 30
Leu Leu Arg Val Ala Ala Arg Gly Arg Tyr Leu Leu Gly Ala Glu Leu
35 40 45
Ala Ala Phe Glu Glu Arg Phe Ala Glu Tyr Cys Gly Asn Ala His Cys
50 55 60
Val Ala Val Gly Ser Gly Leu Asp Asp Ala Arg Leu Ala Leu Trp Ala
65 70 75 80
Leu Gly Val Gly Glu Gly Asp Glu Val Ile Val Pro Ser His Thr Phe
85 90 95
Ile Ala Ser Trp Leu Ala Val Ser Ala Thr Gly Ala Thr Pro Val Pro
100 105 110
Val Glu Pro Gly Asp Pro Gly Glu Pro Gly Pro Gly Ala Phe Leu Leu
115 120 125
Asp Pro Asp Arg Leu Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Val
130 135 140
Met Pro Val His Leu Tyr Gly His Pro Val Asp Leu Asp Pro Val Gly
145 150 155 160
Ala Phe Ala Glu Pro His Gly Leu Ala Val Val Glu Asp Ala Ala Gln
165 170 175
Ala Thr Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Arg Thr
180 185 190
Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Leu Gly Asp Gly
195 200 205
Gly Ala Val Val Thr Ser Asp Pro Glu Leu Ala Asp Arg Leu Arg Leu
210 215 220
Leu Arg Asn Tyr Gly Ala Arg Glu Lys Tyr Arg His Glu Glu Arg Gly
225 230 235 240
Thr Asn Ser Arg Leu Asp Glu Leu Gln Ala Ala Val Leu Ser Val Lys
245 250 255
Leu Pro Tyr Leu Asp Ala Trp Asn Thr Arg Arg Arg Glu Ile Ala Ala
260 265 270
Arg Tyr Gly Glu Ala Leu Ala Gly Leu Pro Gly Val Thr Val Pro Glu
275 280 285
Gly Arg Val Ala Glu Pro Val Trp His Gln Tyr Val Leu Arg Ser Pro
290 295 300
Tyr Arg Asp Arg Leu Arg Arg Arg Leu Ala Glu Ala Gly Val Glu Thr
305 310 315 320
Leu Val His Tyr Pro Val Ala Val His Ala Ser Gly Ala Tyr Ala Gly
325 330 335
Ala Gly Pro Cys Pro Ala Gly Gly Leu Pro Arg Ala Glu Arg Leu Ala
340 345 350
Gly Glu Val Leu Ser Leu Pro Ile Gly Pro His Leu Pro Asp Glu Ala
355 360 365
Val Glu Val Val Ile Ala Ala Val Gln Ser Ala Ala Leu Asp Ser Trp
370 375 380
Glu Glu Gly Pro
385
<210> 88
<211> 271
<212> PRT
<213> Streptomyces mycarofaciens
<400> 88
Met Ser Pro Ile Ser Ala Ser Ala Pro Ala Ala Ser Arg Ser Thr Ala
1 5 10 15
Arg Arg Glu Leu Gly Gln Asn Phe Phe Arg Ser Ala Ala Ala Ala Cys
20 25 30
Arg Phe Ser Asp Gln Leu Asp Ala Phe Cys Ala Asp Leu Pro Gly Ser
35 40 45
Leu Ala Asp Val Leu Thr Val Glu Ile Gly Ala Gly Ser Gly Arg Val
50 55 60
Thr Lys Ala Leu Ala Ser Ala Gly Arg Ser Leu Leu Ala Val Glu Ile
65 70 75 80
Asp Ala Tyr Trp Ala Arg Arg Leu Thr Ala Glu Ser Leu Pro Asp Val
85 90 95
Thr Val Val Asn Glu Asp Phe Leu Asn Leu Gln Leu Pro Arg Gln Pro
100 105 110
Ile Arg Leu Ile Gly Asn Leu Pro Phe Val Ser Gly Thr Lys Ile Leu
115 120 125
Arg Arg Cys Leu Glu Leu Gly Pro Asn Arg Met Cys Gln Ala Val Phe
130 135 140
Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg Thr Gly Ala Trp Gly Gly
145 150 155 160
Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp Tyr Thr Phe Glu Gly Gly
165 170 175
Leu Ala Phe Ser Arg Asn Glu Phe Ser Pro Val Pro Arg Ala Asp Thr
180 185 190
Gln Thr Leu Val Val Met Pro Arg Arg Arg Pro Ser Val Pro Trp Arg
195 200 205
Glu Arg Thr Asp Tyr Gln Arg Phe Thr Gln Gln Ile Phe Asp Thr Gly
210 215 220
Gln Met Thr Ile Gly Glu Ala Ala Arg Lys Val Leu Arg Arg Gly His
225 230 235 240
Ala Gln Phe Val Arg Ser Ala Gly Val Arg Pro Ala Asp Arg Val Lys
245 250 255
Asp Leu Thr Val Arg Asp Trp Ala Ala Leu Phe Arg Ala Asn Pro
260 265 270
<210> 89
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide SRMR1
<400> 89
ctgccagtcc tctcccagca gtacg 25
<210> 90
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide SRMR2
<400> 90
tgaagctgga cgtctcctac gtcgg 25
<210> 91
<211> 2755
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description: Cassette
excisable
<400> 91
gatatctacc tcttcgtccc gaagcaactt gggtgggcgc tcgaccttgg gccagtgtgc 60
ttctcacctg cggcgccagt ccatgggtgc tcgcggttgt ccgccgctgt gcgctggcgt 120
tgtcacgcag ttagacactc accttcccac gggcggtgtc gtagggctcg gctaagttgc 180
ccgcatgact gacagggatc cctcgagaag ctttatgctt gtaaaccgtt ttgtgaaaaa 240
atttttaaaa taaaaaaggg gacctctagg gtccccaatt aattagtaat ataatctatt 300
aaaggtcatt caaaaggtca tccaccggat caattcccct gctcgcgcag gctgggtgcc 360
aagctctcgg gtaacatcaa ggcccgatcc ttggagccct tgccctcccg cacgatgatc 420
gtgccgtgat cgaaatccag atccttgacc cgcagttgca aaccctcact gatccgtaat 480
gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 540
ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 600
gccaagctgc ggtggcgtac accgtcgcct cggtcggccc gtagagattg gcgatcccga 660
ccgcagcacc accgagaacg tccccgacgt ggccgaccag cccgtcatcg tcaacgcctg 720
accgcggtgc ggacaggccg tgtcgcgacc ggccgtgcgg aattaagccg gcccgtaccc 780
tgtgaataga ggtccgctgt gacacaagaa tccctgttac ttctcgaccg tattgattcg 840
gatgattcct acgcgagcct gcggaacgac caggaattct gggagccgct ggcccgccga 900
gccctggagg agctcgggct gccggtgccg ccggtgctgc gggtgcccgg cgagagcacc 960
aaccccgtac tggtcggcga gcccgacccg gtgatcaagc tgttcggcga gcactggtgc 1020
ggtccggaga gcctcgcgtc ggagtcggag gcgtacgcgg tcctggcgga cgccccggtg 1080
ccggtgcccc gcctcctcgg ccgcggcgag ctgcggcccg gcaccggagc ctggccgtgg 1140
ccctacctgg tgatgagccg gatgaccggc accacctggc ggtccgcgat ggacggcacg 1200
accgaccgga acgcgctgct cgccctggcc cgcgaactcg gccgggtgct cggccggctg 1260
cacagggtgc cgctgaccgg gaacaccgtg ctcacccccc attccgaggt cttcccggaa 1320
ctgctgcggg aacgccgcgc ggcgaccgtc gaggaccacc gcgggtgggg ctacctctcg 1380
ccccggctgc tggaccgcct ggaggactgg ctgccggacg tggacacgct gctggccggc 1440
cgcgaacccc ggttcgtcca cggcgacctg cacgggacca acatcttcgt ggacctggcc 1500
gcgaccgagg tcaccgggat cgtcgacttc accgacgtct atgcgggaga ctcccgctac 1560
agcctggtgc aactgcatct caacgccttc cggggcgacc gcgagatcct ggccgcgctg 1620
ctcgacgggg cgcagtggaa gcggaccgag gacttcgccc gcgaactgct cgccttcacc 1680
ttcctgcacg acttcgaggt gttcgaggag accccgctgg atctctccgg cttcaccgat 1740
ccggaggaac tggcgcagtt cctctggggg ccgccggaca ccgcccccgg cgcctgacgc 1800
cccgggccgc ccggcgccgc ccccggcccc cggcggccgc ccggagcccc gcccgcgctc 1860
gggagccccg ggcccgcgcc gaagcccgct gctgcgagcc cggagcgggc cggccgacgg 1920
cggtgcgggc ccggcggcgg acgctcagca gcggcgggcg tgaaaggccc tggcatcctc 1980
gatcatctcc tccagggtgg tcggccgagc ttccatccca gctcggcaag gatcgatccg 2040
cgcagatcag ttggaagaat ttgtccacta cgtgaaaggc gagatcacca aggtagtcgg 2100
caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc ttaactcaag 2160
cgttagatgc actaagcaca taattgctca cagccaaact atcaggtcaa gtctgctttt 2220
attattttta agcgtgcata ataagcccta cacaaattgg gagatatatc atgaaaggct 2280
ggctttttct tgttatcgca atagttggcg aagtaatcgc aacatccgca ttaaaatcta 2340
gcgagggctt tactaagctg atccggtgga tgaccttttg aatgaccttt aatagattat 2400
attactaatt aattggggac cctagaggtc ccctttttta ttttaaaaat tttttcacaa 2460
aacggtttac aagcataaag cttgttaaca gatctcccgg ctcgtcggac actccggtac 2520
ggccgtgact gaggaggtct accggaagca gatccggccc gtcatccaga ccggcgctgt 2580
ggtcatggac ggcatcttca agcggggtcc ggcgcgatag tcacgcagat agacacgcac 2640
agaaaacagg tgaggcagac cgtaacgtta cggtctgcct cacctggtgt ttctctgtcg 2700
gggtggcggg atttgaaccc acgacctctt cgtcccgaac gaagcgcgcg atatc 2755
<210> 92
<211> 2208
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description: Cassette
excisable
<400> 92
gatatcgcgc gcgcttcgtt cgggacgaag aggtcgtggg ttcaaatccc gccaccccga 60
cagagaaaca ccaggtgagg cagaccgtaa cgttacggtc tgcctcacct gttttctgtg 120
cgtgtctatc tgcgtgacta tcgcgccgga ccccgcttga agatgccgtc catgaccaca 180
gcgccggtct ggatgacggg ccggatctgc ttccggtaga cctcctcagt cacggccgta 240
ccggagtgtc cgacgagccg ggagatctgt taacaagctt tatgcttgta aaccgttttg 300
tgaaaaaatt tttaaaataa aaaaggggac ctctagggtc cccaattaat tagtaatata 360
atctattaaa ggtcattcaa aaggtcatcc accggatcaa ttcccctgct cgcgcaggct 420
gggtgccaag ctctcgggta acatcaaggc ccgatccttg gagcccttgc cctcccgcac 480
gatgatcgtg ccgtgatcga aatccagatc cttgacccgc agttgcaaac cctcactgat 540
ccggctcacg gtaactgatg ccgtatttgc agtaccagcg tacggcccac agaatgatgt 600
cacgctgaaa atgccggcct ttgaatgggt tcatgtgcag ctccatcagc aaaaggggat 660
gataagttta tcaccaccga ctatttgcaa cagtgccgtt gatcgtgcta tgatcgactg 720
atgtcatcag cggtggagtg caatgtcgtg caatacgaat ggcgaaaagc cgagctcatc 780
ggtcagcttc tcaaccttgg ggttaccccc ggcggtgtgc tgctggtcca cagctccttc 840
cgtagcgtcc ggcccctcga agatgggcca cttggactga tcgaggccct gcgtgctgcg 900
ctgggtccgg gagggacgct cgtcatgccc tcgtggtcag gtctggacga cgagccgttc 960
gatcctgcca cgtcgcccgt tacaccggac cttggagttg tctctgacac attctggcgc 1020
ctgccaaatg taaagcgcag cgcccatcca tttgcctttg cggcagcggg gccacaggca 1080
gagcagatca tctctgatcc attgcccctg ccacctcact cgcctgcaag cccggtcgcc 1140
cgtgtccatg aactcgatgg gcaggtactt ctcctcggcg tgggacacga tgccaacacg 1200
acgctgcatc ttgccgagtt gatggcaaag gttccctatg gggtgccgag acactgcacc 1260
attcttcagg atggcaagtt ggtacgcgtc gattatctcg agaatgacca ctgctgtgag 1320
cgctttgcct tggcggacag gtggctcaag gagaagagcc ttcagaagga aggtccagtc 1380
ggtcatgcct ttgctcggtt gatccgctcc cgcgacattg tggcgacagc cctgggtcaa 1440
ctgggccgag atccgttgat cttcctgcat ccgccagagg gcgggatgcg aagaatgcga 1500
tgccgctcgc cagtcgattg gctgagctca tgagcggaga acgagatgac gttggagggg 1560
caaggtcgcg ctgattgctg gggcaacacg tgaaaggcga gatcaccaag gtagtcggca 1620
aataatgtct aacaattcgt tcaagccgac gccgcttcgc ggcgcggctt aactcaagcg 1680
ttagatgcac taagcacata attgctcaca gccaaactat caggtcaagt ctgcttttat 1740
tatttttaag cgtgcataat aagccctaca caaattggga gatatatcat gaaaggctgg 1800
ctttttcttg ttatcgcaat agttggcgaa gtaatcgcaa catccgcatt aaaatctagc 1860
gagggcttta ctaagctgat ccggtggatg accttttgaa tgacctttaa tagattatat 1920
tactaattaa ttggggaccc tagaggtccc cttttttatt ttaaaaattt tttcacaaaa 1980
cggtttacaa gcataaagct tctcgaggga tccctgtcag tcatgcgggc aacttagccg 2040
agccctacga caccgcccgt gggaaggtga gtgtctaact gcgtgacaac gccagcgcac 2100
agcggcggac aaccgcgagc acccatggac tggcgccgca ggtgagaagc acactggccc 2160
aaggtcgagc gcccacccaa gttgcttcgg gacgaagagg cagatatc 2208
<210> 93
<211> 60
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide ORF2A
<400> 93
cccgcgcggc agcctctccg tgatcgagtc cggcgtgacc atcgcgcgcg cttcgttcgg 60
<210> 94
<211> 60
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide ORF2B
<400> 94
gctccgtgcg tcatgcagga aggtgtcgta gtcgcggtag atctgcctct tcgtcccgaa 60
<210> 95
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description: Cicatrice
att3
<400> 95
atcgcgcgcg cttcgttcgg gacgaagagg tagat 35
<210> 96
<211> 59
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR8
<400> 96
cgggatgatc gcttgtccgg cggccggatg cctagcctca tcgcgcgcgc ttcgttcgg 59
<210> 97
<211> 60
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR9
<400> 97
cccgatccag aacgtctggt cggtgatcag gtcgctgttc atctgcctct tcgtcccgaa 60
<210> 98
<211> 60
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR3
<400> 98
accggggcgg tcctcccctc cggggcgtca cggccgcgga atctgcctct tcgtcccgaa 60
<210> 99
<211> 60
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR4
<400> 99
cacgcagcga gccgacgcac tgatggacga cacgatggcc atcgcgcgcg cttcgttcgg 60
<210> 100
<211> 60
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR5
<400> 100
gggcgtgaag cgggcgagtg tggatgtcat gcgagtactc atcgcgcgcg cttcgttcgg 60
<210> 101
<211> 60
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR6
<400> 101
cgggaaacgg cgtcgcactc ctcgggggcc gcgtcagccc atctgcctct tcgtcccgaa 60
<210> 102
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide C9583
<400> 102
ctgcaggtgc tccagcgcgt cgatct 26
<210> 103
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide C9584
<400> 103
ctgcagacgg aggcggacct gcggct 26
<210> 104
<211> 33
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description: Cicatrice
att1
<400> 104
atcgcgcgct tcgttcggga cgaagaggta gat 33
<210> 105
<211> 34
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description: Cicatrice
att2
<400> 105
atcggcgcgc ttcgttcggg acgaagaggt agat 34
<210> 106
<211> 10325
<212> DNA
<213> Streptomyces ambofaciens
<400> 106
ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60
ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc 120
aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180
gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240
ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 300
gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360
cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 420
gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480
gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540
gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600
ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc 660
cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 720
cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780
tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg 840
gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 900
cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960
gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 1020
tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 1080
gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140
gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200
tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 1260
gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320
gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380
tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440
tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500
gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560
tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620
ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680
ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740
tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800
tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860
acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920
tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980
acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2040
tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100
cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160
tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220
cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280
accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340
acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400
acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460
tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520
acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580
tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2640
cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700
actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 2760
cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2820
cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2880
acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2940
gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000
gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3060
tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120
caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180
gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240
gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300
atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360
gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420
gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480
tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540
ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600
ccgtggacgg agcgcgtccn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc cgccacaccc 4080
cccagcagcg tcagcgtccg cctcgggacc acacccggca ggacgacggg gtgcggggcg 4140
acgaggctga gggagccccg caactccacg gggcggctca accgcttgag ctgctccatc 4200
aactgctggg ccgaggtggt ccccgtgtgg tggtccaccg ggccgcggcc gctcgccgag 4260
gccagccgga ggttcccgcc cacccgcacc atgaagggca ggcccgcgag accgagccct 4320
cgcaccagtc gtggcagcac ggccgcgcgt gcgtccatca ccacggggcg ggccaaggag 4380
cggttggcct gagcggcttc ggccaccagg cggacgatgt tctcctcctc accgggtgcg 4440
ccggggtgcc ggggtgtgcc ctccccgctc cggccgccgc ccagcgtcag gcgccagctg 4500
accggggcgg ccgtcgtgcc cgaggccagc cacagcccgt gactctgctg gcagctcacc 4560
acccggccca ggtcggagac gaagcgccgg ctcaccccga cggagcgcac ccccgccttg 4620
gagaccacca tcggccagat cacccaggcg tcgggggtca gcctgtcgtc cacgtagcgg 4680
gccagcgcgg cccgcacctc gccccagtcc caggtcgacc cggcgacgaa gtggtgcagg 4740
ctctgttccg ccgcgccctc tccgacgaag gcggcgaggt tccgggcggt cttgcgtccc 4800
tgtgccgtga gcagcccgcg tatgtactgc tcacctcttc tgcgctggtc cgcccggcgg 4860
agcgaaccga gtaactccgc acatgcgtcg gagacgagcg agtcgaagtc gtgccgcgcg 4920
gcgggaccca cggggggcgc cgcgccggcg ggtcgaagcg tgcgtaaggt cataggagtc 4980
ctcgtggggg cctcgtcatc actgcgagtg gactgcgacc agcatcgcca attcacccgt 5040
tgctccccag gtacaccggg cacactcgtt ccgcttcgct cccccggcgg cacggcccgc 5100
gtgtggagca ctccccgctc tccggacggt gggggggaag cccaccgcac gcgcgccggt 5160
agcggtgccg gggccccaca acccctcacc gacggggtcc gttcgaccac atgccgtgat 5220
gatgccttcg ccgcacggcc tccttgaatg acggaccgtc agaaagacgt cactccgcgc 5280
gcgcccgctc ccgccccgac cccgcccggc cgccgtcccg cccccgcgac cctgtgggcc 5340
gacgccctct tgacggaccc ggaatcccgg gccgcgggac gggacggcga ggaactcgat 5400
gccgcaaagg ttccgcgtcc tcaccggcac ctccgagatc cagcgcaacg gcatcgccaa 5460
gctcctggct ttccaccact gagccgcacc ccctggcgag cagatccggg acaagacgcc 5520
accttcgcga cagtgtttag gaaaagttaa gtaaagaatt ccgcgagcgg attgccaggg 5580
agaacaaccc attgacgcgc accggtgcag cggccacatt gacggcacct gtcaagttca 5640
cccccaggag cttggaatcc catgcaggca attcggcatc acgtcatgct cgtcatggcc 5700
ttcgtgaccg tcgccacgac tttccttctc tggccgtcga cgcaatccgc gcaagcgttt 5760
cccccgaccc cgaagcagac ggtactgaac cacctccgcg ccatttccgg gaatcacatc 5820
gtctccggac agcacaacaa ggagcccgcc tccgccccgg gccagtacac ccagcaggtc 5880
aaggacgtca ccgggcagta ccccggcctg tggggcggtg acctgatgtt cgccgcggcg 5940
gacgtggccg gccgccagcg cgtcgtcgac caggccagga ccgagtgggc gaacggatcg 6000
ctggtctcgc tcacctggca cgtctgcccg ccgaccggcg gcagcacctg tgcgttcgag 6060
ggcggcgtca agtccacgct gacgaacgcg cagttctcgc aggtcctcac ggagggcagt 6120
gccctgaaca gcgcatggaa gcggcgcctg gacgaggtcg tcccgtacct gcagcagctg 6180
gagaacgcgg gcgtccccgt cctcttccgg ccgctgcacg agatgaacga atcctggaac 6240
tggtggggaa accggcccgg agcgaacggc agcgcacgcc tctaccagat cacccgcgat 6300
cacctcgccg ggacgaaagg gctggacaat ctgatctggg tctggaacgt ccaggacaat 6360
ccggcgggaa actggaacag ctactatccg ggagatcagt acgtggacgt cgtttcgctg 6420
gacgtctggt acaagagcca cccgagttcc gccgactacc agcagatgcg gagcatcgcg 6480
ggaacaaaac ccatggccct cgcggagctg ggcaaaatgc cgaccgccgc gctgctggac 6540
agccagacgc ggtggacatg gttcatgatg tggtccgagc atctgcgcgg gaacaattcc 6600
aacgccgaaa tacagacggc gtatttccac ccccgtgtac tgaaccaggg ggaggtcgca 6660
ctgccctgac gctcggcgct gcccggctct ctcacgcgcg ttctgacagg acgtcgcgga 6720
gagtgcgggg caagcggccg gtgagctggg cgcagtcgtc gcggacccga tcccagcgct 6780
gttcgcgtac cgaggcgaac agggaggaga aggcgtagag ccaccaggga tccaggccgg 6840
tcgccgctgt ttcggcagag tacgtgtcgg ccgggatgtc cacgtaggcg accggtgtcc 6900
gccacacctc cgccgccgtg gaggcgatgc ctgccaggtc cgtcgactcg ggtcccgtga 6960
tgtcgtggtg acggccggtc ggcccgccca ccgcgagggc ggcgagggcg cgggccacgt 7020
cgtcgcgcgc caccagggac acccggccat cggctgccgg cagcctcagc agcccggtcg 7080
agcgcgcctg ggtgagccag cctaggaaga actcgatgta cagcgaggcc ctggcgaacg 7140
agcacggcac gccggaggcg agcagcagat cctcggtgag ccggttgacg acggcgtagc 7200
agaacgggga ggccgagtcg gcgtcgacgc tgctcagtgc cgcgacatgg ccgacgcgct 7260
cggccaccac ggcggcgacg acgttgcggt ggtgcagcag cacccgtgcg tcgggcccgt 7320
cgctggagac gaggaccaga gtgtccacgc ccttcagcgc cgcacgcaga gcgggcgggt 7380
cggcgtagtc ggcgacggcg cactccaccc ccggcggtag tgcctcggca ggcagcttcc 7440
gcctggtcat cgccacgacg tccacgtcgg cccggtccgc gagcagctgc accacccgcc 7500
tgcccagact gcccgccgcc cctgtcaccg cgatacgcat cgtcgccccc gtcgccttgt 7560
cgtcggtcgt accaccgtag ggggccaacc gcgaccaggg cttggaacga gccggcccgc 7620
cagggcacag acgcgcgatc ggtccggttt tcccgtgctc ttttggaccg ggacgccgga 7680
ccgcttcctt tctacggtgg agccgttccc gcccgagccc gcacgtcatc gacgtgcggg 7740
gaagacagag gtgataccga tgctccgacg ccgtctcgga gggccgtcag gccccctcgt 7800
cagtgccctg tgcctgggcg cgatgccctt cggcaccacc gtcgacgaga agacgtcctt 7860
cgccatcctc gaccggttcg tcgaggccgg cggcagtctc gtcgacaccg ccgacaacta 7920
cgcgttctgg gctcccggcg ggaccgggga cgagagcgag aacaccgtcg ggcgctggct 7980
ggcgagccgc cgccgccgcg acgaggtggt gatctccacc aaggtgggtg cccgccccac 8040
cgtccccggc agcggcctgg agaccgccga agggctgtcg gctcccgtca tacggaaggc 8100
cgcggaggac agcctgcgac gcctgggcac cgatcgcatc gatctgtact ggacccacat 8160
cgaggaccgg accgtccctc tggaggagac gctcggagct ctcgacgagc tggtcggcgg 8220
cggcaaggtg gcggtgctgg gctgctccaa ccacgcgggc tggcgcatcg aacgggcccg 8280
cgcgctcgcc cggaccaacg gctggacggc gtacacctgc gtccagcagc gctactccta 8340
ccttcagccg cgcttcgacg tcggactgcc ggagagcgga cacgtccacg cgacctccga 8400
actcctcgac cacgtacgca gcgagcccga cctgacgctg ctggcctact cgtccctgct 8460
ctcgggcgcg tacacccggc cggacaagac cctgtccgcc gcctacgacc acccgggcac 8520
cgggcagcgg ctgaccgtgc tgcgggaggt ggccgccgag ctcggtgcca ccgccaacca 8580
ggtggtgctg tcctggttgc tcggaggtga tccgccggtg atcccgatcg tgggggtgag 8640
ttccgtcgag cagctggacg aggtgctggc cgccgtcgag ctggagctgc cccgggagac 8700
gagggcacgg ctggacctcg ccgggcgggg ctgacgggcc acacaccgcc cctcgcccgg 8760
gacgggctga ccggccgcac accgtccctc agccgggacg ggctgacggc cacacacccg 8820
cccctcagcc cggctgggct gggctgacgg ccacacaccc gctcctcagc ccggctgggc 8880
tgggctgacg gccacacacc cgcccctcag cccggctggg ctgggctgac ggccacacgc 8940
cgtccctcgc ccgggtcggg ctgaccagcc acacgccgtc cctcagtcgg cccgctcccc 9000
ggcccgcccg gcgtcgacgt gccgccggtc gtggcgccgg gccgcgtcga tggcctgtgc 9060
caggcgccgc acggctccgg gcacggcgtg gtccgccaga ttgccgtagc cgaggaccag 9120
cgcggggccg gcggcggcca cggcccgcgc cccgccggag tcgccggccc gggccgtcgg 9180
gtggtgctcg gcccgcgcca tccggtaggc gtcgagatcc gccagcctca cgtcacgccg 9240
cgccgcctcc ctgacgacgg tgggcgccga gcagtccgtc agggacagca gcaggtggaa 9300
gccggccgcc gcaccggaca cctggaaccc cggcagcgac gccgcgagtt ctcccatgag 9360
gtgatcgcgg cgccgtttgt agcgcagccg tgccgcccgc aggtaccggt cgtaggaccc 9420
gcgggccagg aaccgggcga acgcctcctg gtcgatgacg ggcggtggta cgcccccgac 9480
gtgctccgcg cccagggcct cggtccagcg cggcggggtc accgcccagc cgatccgcag 9540
ggccggcgag agcgtcttgc tgaccgaccc cagcagcgcg acgtgctccg gtgccatgcc 9600
ctgcagggcg cccacggggt ggcggtcgta tcggaactcg gcgtcgtagt cgtcctccag 9660
caccaggccg tcgacctcgc gggcccaggc gaccagctcg ccgcgacggg ccggggcgag 9720
gaccacaccg gtcgggaact ggtgggcggg agcgacgatc accgaccgga cctgaggcgc 9780
gcgccgcagc aggtcgaccc gcaggccgtc gccgtccacg ggaaccggga cgggcaccag 9840
cccctccgcc ccgaccgtgg cgctcagccg cgaccagcca gggtcctcca gggccatgtg 9900
ggtgtggccc tcggtccgca ggacccggca cagcctgcgc accgcgtcca gcgtgcccgc 9960
gcagacgacg agctgccggg cttccagcga cgcgccgcgt ccccgcacga ggtaggccgc 10020
gagccgctgc cggagccggg cgagaccggc cggatcgggg tagccgagct cgccccaggt 10080
cagtgcgccg gtggcctccc gcaccgcgtc cgcccaccgt ccgcggggaa aggcccgcag 10140
gtcgggtatg ccgggcagca tgtcgaactc cggctcccac cgcgtaccga cgtccgcctc 10200
gggcgtcacc ggagcgggga cggcctgcgc cctgacccgg gtggccgagc cgctgcgcgc 10260
ctccaggtac ccctccgcga cgagctgcgc gtagggggga tcctctagag tcgacctgca 10320
ggcct 10325
<210> 107
<211> 1218
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1218)
<400> 107
atg gct cat atc gca ttc ttc atc ctt ccg gtt gcc ggg cat gtg aat 48
Met Ala His Ile Ala Phe Phe Ile Leu Pro Val Ala Gly His Val Asn
1 5 10 15
ccg acc ctg gga gtc gcc gag gaa ctg gtc gcg cgc ggc cac cgg gtg 96
Pro Thr Leu Gly Val Ala Glu Glu Leu Val Ala Arg Gly His Arg Val
20 25 30
acg ttc gcg ctg tcc gag gac ctc gcc gag cgg gcc cgg ctg atc ggc 144
Thr Phe Ala Leu Ser Glu Asp Leu Ala Glu Arg Ala Arg Leu Ile Gly
35 40 45
gcc gag gtg gtc acc tat ccg gtg gac agg caa cgg ttc ctg gac cag 192
Ala Glu Val Val Thr Tyr Pro Val Asp Arg Gln Arg Phe Leu Asp Gln
50 55 60
atg gtg ccg cgg cag gac gcg gac gag tac acg gac gag gac gag ttc 240
Met Val Pro Arg Gln Asp Ala Asp Glu Tyr Thr Asp Glu Asp Glu Phe
65 70 75 80
gtc cgg gtc ctg gag tgg ctg ctg gac atg acg gtg cag acc atg gaa 288
Val Arg Val Leu Glu Trp Leu Leu Asp Met Thr Val Gln Thr Met Glu
85 90 95
ccg ctg gag agg cac ttc gcc ggg gac cgg ccc gac gtc gtc gtc aac 336
Pro Leu Glu Arg His Phe Ala Gly Asp Arg Pro Asp Val Val Val Asn
100 105 110
gat ccg tcg tcg ctg tgg acg gga cgg ctg ctg gcg gac cgg tgg ggc 384
Asp Pro Ser Ser Leu Trp Thr Gly Arg Leu Leu Ala Asp Arg Trp Gly
115 120 125
atc ccg gtc atc cgc agc act ccg acc tat gcc gcc aac gaa cac tgg 432
Ile Pro Val Ile Arg Ser Thr Pro Thr Tyr Ala Ala Asn Glu His Trp
130 135 140
tcg ctg cat ccg ccg gtc gac tcg gcc gag ccg ccg gac gac ccc gag 480
Ser Leu His Pro Pro Val Asp Ser Ala Glu Pro Pro Asp Asp Pro Glu
145 150 155 160
ctg cac aag ctg ctc gcg cgg atc gag cgg ctg ctg gag gag cag ggc 528
Leu His Lys Leu Leu Ala Arg Ile Glu Arg Leu Leu Glu Glu Gln Gly
165 170 175
gtc gag cac gac ctg gcc ggc ttc acc ggg gtc ctg cac ggc ggt ccg 576
Val Glu His Asp Leu Ala Gly Phe Thr Gly Val Leu His Gly Gly Pro
180 185 190
gcc ctg ctg tac atg ccc cgc tcg ttc cag tac gcg ggc gag acc ttc 624
Ala Leu Leu Tyr Met Pro Arg Ser Phe Gln Tyr Ala Gly Glu Thr Phe
195 200 205
gac gca cag cac cac ttc gtc ggc ccc tgc ccg ccc cgc acc gcg ttc 672
Asp Ala Gln His His Phe Val Gly Pro Cys Pro Pro Arg Thr Ala Phe
210 215 220
cac ggc gag tgg agg ccg ggg gac gac gac ggc cgg ccc ctg gtg ctg 720
His Gly Glu Trp Arg Pro Gly Asp Asp Asp Gly Arg Pro Leu Val Leu
225 230 235 240
gtg agt ctc gga acc ctg tac aac gac cgg ccg gac ttc ttc cgc acc 768
Val Ser Leu Gly Thr Leu Tyr Asn Asp Arg Pro Asp Phe Phe Arg Thr
245 250 255
tgc ctg gag gcg ttc ggc gac gag ccc tgg aac gtg ctt ctg gtg ctg 816
Cys Leu Glu Ala Phe Gly Asp Glu Pro Trp Asn Val Leu Leu Val Leu
260 265 270
ggc ggc ggg gtg ccc gcg gcc gac ctg ggc ccg ctt ccc ggc aat gtc 864
Gly Gly Gly Val Pro Ala Ala Asp Leu Gly Pro Leu Pro Gly Asn Val
275 280 285
cgg gtg acc gac ttc gtg tcg ctg cgc gac gtc ctg ccg cac acg gcg 912
Arg Val Thr Asp Phe Val Ser Leu Arg Asp Val Leu Pro His Thr Ala
290 295 300
gtg gtg gtg aac cac ggt ggg atg agc acc gcc atg gag gtg ttc tcg 960
Val Val Val Asn His Gly Gly Met Ser Thr Ala Met Glu Val Phe Ser
305 310 315 320
cac ggt gtg ccg gtg gtg gcg atc ccg gtg atg ccg gag ccc cgg gcc 1008
His Gly Val Pro Val Val Ala Ile Pro Val Met Pro Glu Pro Arg Ala
325 330 335
acc gcg cgg cgg atc gtc gaa ctg ggc ctg ggc gac cag ctg ctg aac 1056
Thr Ala Arg Arg Ile Val Glu Leu Gly Leu Gly Asp Gln Leu Leu Asn
340 345 350
tcg gag ctg acg gcc gag tcc ctg cgt gcc acg gta cgg cgg gtg ctg 1104
Ser Glu Leu Thr Ala Glu Ser Leu Arg Ala Thr Val Arg Arg Val Leu
355 360 365
gcg gac tcc gcg atc ccg ggg aac atg cgc ggg ttc cgg gag cag atc 1152
Ala Asp Ser Ala Ile Pro Gly Asn Met Arg Gly Phe Arg Glu Gln Ile
370 375 380
agg gcg gcc ggc ggg gcg ccc gcg gcg gcc gac gcg atc gag gga ctg 1200
Arg Ala Ala Gly Gly Ala Pro Ala Ala Ala Asp Ala Ile Glu Gly Leu
385 390 395 400
ctg ccc cgg gtg ggc tga 1218
Leu Pro Arg Val Gly
405
<210> 108
<211> 405
<212> PRT
<213> Streptomyces ambofaciens
<400> 108
Met Ala His Ile Ala Phe Phe Ile Leu Pro Val Ala Gly His Val Asn
1 5 10 15
Pro Thr Leu Gly Val Ala Glu Glu Leu Val Ala Arg Gly His Arg Val
20 25 30
Thr Phe Ala Leu Ser Glu Asp Leu Ala Glu Arg Ala Arg Leu Ile Gly
35 40 45
Ala Glu Val Val Thr Tyr Pro Val Asp Arg Gln Arg Phe Leu Asp Gln
50 55 60
Met Val Pro Arg Gln Asp Ala Asp Glu Tyr Thr Asp Glu Asp Glu Phe
65 70 75 80
Val Arg Val Leu Glu Trp Leu Leu Asp Met Thr Val Gln Thr Met Glu
85 90 95
Pro Leu Glu Arg His Phe Ala Gly Asp Arg Pro Asp Val Val Val Asn
100 105 110
Asp Pro Ser Ser Leu Trp Thr Gly Arg Leu Leu Ala Asp Arg Trp Gly
115 120 125
Ile Pro Val Ile Arg Ser Thr Pro Thr Tyr Ala Ala Asn Glu His Trp
130 135 140
Ser Leu His Pro Pro Val Asp Ser Ala Glu Pro Pro Asp Asp Pro Glu
145 150 155 160
Leu His Lys Leu Leu Ala Arg Ile Glu Arg Leu Leu Glu Glu Gln Gly
165 170 175
Val Glu His Asp Leu Ala Gly Phe Thr Gly Val Leu His Gly Gly Pro
180 185 190
Ala Leu Leu Tyr Met Pro Arg Ser Phe Gln Tyr Ala Gly Glu Thr Phe
195 200 205
Asp Ala Gln His His Phe Val Gly Pro Cys Pro Pro Arg Thr Ala Phe
210 215 220
His Gly Glu Trp Arg Pro Gly Asp Asp Asp Gly Arg Pro Leu Val Leu
225 230 235 240
Val Ser Leu Gly Thr Leu Tyr Asn Asp Arg Pro Asp Phe Phe Arg Thr
245 250 255
Cys Leu Glu Ala Phe Gly Asp Glu Pro Trp Asn Val Leu Leu Val Leu
260 265 270
Gly Gly Gly Val Pro Ala Ala Asp Leu Gly Pro Leu Pro Gly Asn Val
275 280 285
Arg Val Thr Asp Phe Val Ser Leu Arg Asp Val Leu Pro His Thr Ala
290 295 300
Val Val Val Asn His Gly Gly Met Ser Thr Ala Met Glu Val Phe Ser
305 310 315 320
His Gly Val Pro Val Val Ala Ile Pro Val Met Pro Glu Pro Arg Ala
325 330 335
Thr Ala Arg Arg Ile Val Glu Leu Gly Leu Gly Asp Gln Leu Leu Asn
340 345 350
Ser Glu Leu Thr Ala Glu Ser Leu Arg Ala Thr Val Arg Arg Val Leu
355 360 365
Ala Asp Ser Ala Ile Pro Gly Asn Met Arg Gly Phe Arg Glu Gln Ile
370 375 380
Arg Ala Ala Gly Gly Ala Pro Ala Ala Ala Asp Ala Ile Glu Gly Leu
385 390 395 400
Leu Pro Arg Val Gly
405
<210> 109
<211> 621
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(621)
<400> 109
atg ctc atc acc gaa aca gca gtg ccc gac gtg ttc cgc atc gat ccg 48
Met Leu Ile Thr Glu Thr Ala Val Pro Asp Val Phe Arg Ile Asp Pro
1 5 10 15
gaa ccg ctg ccg gac cac cgg ggc cgg ttc tac gaa gcg gtg cgc cgc 96
Glu Pro Leu Pro Asp His Arg Gly Arg Phe Tyr Glu Ala Val Arg Arg
20 25 30
ggg ccg ctg gag gcc gcc gtc ggg cac tcg gtc gag gtc cgg cag gtc 144
Gly Pro Leu Glu Ala Ala Val Gly His Ser Val Glu Val Arg Gln Val
35 40 45
cac tgc acc gtc tcc ggg cgc aac gta ctg cgc ggc ctg cac gcc acc 192
His Cys Thr Val Ser Gly Arg Asn Val Leu Arg Gly Leu His Ala Thr
50 55 60
acc ctg ccg ccg ggc cag gcc aag atc ctc acc tgt gtg cgg ggt gcg 240
Thr Leu Pro Pro Gly Gln Ala Lys Ile Leu Thr Cys Val Arg Gly Ala
65 70 75 80
gcg ctg act atg gtg gtc gac atg agg gtc ggg tca ccg ggc ttc gga 288
Ala Leu Thr Met Val Val Asp Met Arg Val Gly Ser Pro Gly Phe Gly
85 90 95
cgg tac gag gcg gtg cgg cag gat gcc ccg tcg ggc acc gcg ctc tac 336
Arg Tyr Glu Ala Val Arg Gln Asp Ala Pro Ser Gly Thr Ala Leu Tyr
100 105 110
ctg ccg gac ggc atc ggc ctg ggc tac gtg gcc ctc gcg gac gac aca 384
Leu Pro Asp Gly Ile Gly Leu Gly Tyr Val Ala Leu Ala Asp Asp Thr
115 120 125
tgc atg aac tac ctg tgc acc gag gag tac gtc ccg ggc atg gtc atc 432
Cys Met Asn Tyr Leu Cys Thr Glu Glu Tyr Val Pro Gly Met Val Ile
130 135 140
gac gtg gac gcc ctg gac ccc gaa ctc ggc ctg ccg tgg gga ctg acc 480
Asp Val Asp Ala Leu Asp Pro Glu Leu Gly Leu Pro Trp Gly Leu Thr
145 150 155 160
ggg gat ccc gtc cgc tcc gcc cgg gac gcg gcg gcg ccg tcc ctg cgg 528
Gly Asp Pro Val Arg Ser Ala Arg Asp Ala Ala Ala Pro Ser Leu Arg
165 170 175
gcg gcc gcg gcg gcg gga att ctg ccc acg tac gag gac tgc tta cgg 576
Ala Ala Ala Ala Ala Gly Ile Leu Pro Thr Tyr Glu Asp Cys Leu Arg
180 185 190
gtg cgc acg tcc gtg ccc gcc cct ccc gac cgg act cgg ctc tga 621
Val Arg Thr Ser Val Pro Ala Pro Pro Asp Arg Thr Arg Leu
195 200 205
<210> 110
<211> 206
<212> PRT
<213> Streptomyces ambofaciens
<400> 110
Met Leu Ile Thr Glu Thr Ala Val Pro Asp Val Phe Arg Ile Asp Pro
1 5 10 15
Glu Pro Leu Pro Asp His Arg Gly Arg Phe Tyr Glu Ala Val Arg Arg
20 25 30
Gly Pro Leu Glu Ala Ala Val Gly His Ser Val Glu Val Arg Gln Val
35 40 45
His Cys Thr Val Ser Gly Arg Asn Val Leu Arg Gly Leu His Ala Thr
50 55 60
Thr Leu Pro Pro Gly Gln Ala Lys Ile Leu Thr Cys Val Arg Gly Ala
65 70 75 80
Ala Leu Thr Met Val Val Asp Met Arg Val Gly Ser Pro Gly Phe Gly
85 90 95
Arg Tyr Glu Ala Val Arg Gln Asp Ala Pro Ser Gly Thr Ala Leu Tyr
100 105 110
Leu Pro Asp Gly Ile Gly Leu Gly Tyr Val Ala Leu Ala Asp Asp Thr
115 120 125
Cys Met Asn Tyr Leu Cys Thr Glu Glu Tyr Val Pro Gly Met Val Ile
130 135 140
Asp Val Asp Ala Leu Asp Pro Glu Leu Gly Leu Pro Trp Gly Leu Thr
145 150 155 160
Gly Asp Pro Val Arg Ser Ala Arg Asp Ala Ala Ala Pro Ser Leu Arg
165 170 175
Ala Ala Ala Ala Ala Gly Ile Leu Pro Thr Tyr Glu Asp Cys Leu Arg
180 185 190
Val Arg Thr Ser Val Pro Ala Pro Pro Asp Arg Thr Arg Leu
195 200 205
<210> 111
<211> 960
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(903)
<400> 111
atg acc tta cgc acg ctt cga ccc gcc ggc gcg gcg ccc ccc gtg ggt 48
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly
1 5 10 15
ccc gcc gcg cgg cac gac ttc gac tcg ctc gtc tcc gac gca tgt gcg 96
Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala
20 25 30
gag tta ctc ggt tcg ctc cgc cgg gcg gac cag cgc aga aga ggt gag 144
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu
35 40 45
cag tac ata cgc ggg ctg ctc acg gca cag gga cgc aag acc gcc cgg 192
Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg
50 55 60
aac ctc gcc gcc ttc gtc gga gag ggc gcg gcg gaa cag agc ctg cac 240
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His
65 70 75 80
cac ttc gtc gcc ggg tcg acc tgg gac tgg ggc gag gtg cgg gcc gcg 288
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala
85 90 95
ctg gcc cgc tac gtg gac gac agg ctg acc ccc gac gcc tgg gtg atc 336
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile
100 105 110
tgg ccg atg gtg gtc tcc aag gcg ggg gtg cgc tcc gtc ggg gtg agc 384
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser
115 120 125
cgg cgc ttc gtc tcc gac ctg ggc cgg gtg gtg agc tgc cag cag agt 432
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser
130 135 140
cac ggg ctg tgg ctg gcc tcg ggc acg acg gcc gcc ccg gtc agc tgg 480
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp
145 150 155 160
cgc ctg acg ctg ggc ggc ggc cgg agc ggg gag ggc aca ccc cgg cac 528
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His
165 170 175
ccc ggc gca ccc ggt gag gag gag aac atc gtc cgc ctg gtg gcc gaa 576
Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu
180 185 190
gcc gct cag gcc aac cgc tcc ttg gcc cgc ccc gtg gtg atg gac gca 624
Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala
195 200 205
cgc gcg gcc gtg ctg cca cga ctg gtg cga ggg ctc ggt ctc gcg ggc 672
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly
210 215 220
ctg ccc ttc atg gtg cgg gtg ggc ggg aac ctc cgg ctg gcc tcg gcg 720
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala
225 230 235 240
agc ggc cgc ggc ccg gtg gac cac cac acg ggg acc acc tcg gcc cag 768
Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln
245 250 255
cag ttg atg gag cag ctc aag cgg ttg agc cgc ccc gtg gag ttg cgg 816
Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg
260 265 270
ggc tcc ctc agc ctc gtc gcc ccg cac ccc gtc gtc ctg ccg ggt gtg 864
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val
275 280 285
gtc ccg agg cgg acg ctg acg ctg ctg ggg ggt gtg gcg gnnnnnnnnn 913
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Gly Val Ala
290 295 300
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnn 960
<210> 112
<211> 301
<212> PRT
<213> Streptomyces ambofaciens
<400> 112
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly
1 5 10 15
Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala
20 25 30
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu
35 40 45
Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg
50 55 60
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His
65 70 75 80
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala
85 90 95
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile
100 105 110
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser
115 120 125
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser
130 135 140
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp
145 150 155 160
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His
165 170 175
Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu
180 185 190
Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala
195 200 205
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly
210 215 220
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala
225 230 235 240
Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln
245 250 255
Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg
260 265 270
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val
275 280 285
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Gly Val Ala
290 295 300
<210> 113
<211> 1008
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1008)
<400> 113
atg cag gca att cgg cat cac gtc atg ctc gtc atg gcc ttc gtg acc 48
Met Gln Ala Ile Arg His His Val Met Leu Val Met Ala Phe Val Thr
1 5 10 15
gtc gcc acg act ttc ctt ctc tgg ccg tcg acg caa tcc gcg caa gcg 96
Val Ala Thr Thr Phe Leu Leu Trp Pro Ser Thr Gln Ser Ala Gln Ala
20 25 30
ttt ccc ccg acc ccg aag cag acg gta ctg aac cac ctc cgc gcc att 144
Phe Pro Pro Thr Pro Lys Gln Thr Val Leu Asn His Leu Arg Ala Ile
35 40 45
tcc ggg aat cac atc gtc tcc gga cag cac aac aag gag ccc gcc tcc 192
Ser Gly Asn His Ile Val Ser Gly Gln His Asn Lys Glu Pro Ala Ser
50 55 60
gcc ccg ggc cag tac acc cag cag gtc aag gac gtc acc ggg cag tac 240
Ala Pro Gly Gln Tyr Thr Gln Gln Val Lys Asp Val Thr Gly Gln Tyr
65 70 75 80
ccc ggc ctg tgg ggc ggt gac ctg atg ttc gcc gcg gcg gac gtg gcc 288
Pro Gly Leu Trp Gly Gly Asp Leu Met Phe Ala Ala Ala Asp Val Ala
85 90 95
ggc cgc cag cgc gtc gtc gac cag gcc agg acc gag tgg gcg aac gga 336
Gly Arg Gln Arg Val Val Asp Gln Ala Arg Thr Glu Trp Ala Asn Gly
100 105 110
tcg ctg gtc tcg ctc acc tgg cac gtc tgc ccg ccg acc ggc ggc agc 384
Ser Leu Val Ser Leu Thr Trp His Val Cys Pro Pro Thr Gly Gly Ser
115 120 125
acc tgt gcg ttc gag ggc ggc gtc aag tcc acg ctg acg aac gcg cag 432
Thr Cys Ala Phe Glu Gly Gly Val Lys Ser Thr Leu Thr Asn Ala Gln
130 135 140
ttc tcg cag gtc ctc acg gag ggc agt gcc ctg aac agc gca tgg aag 480
Phe Ser Gln Val Leu Thr Glu Gly Ser Ala Leu Asn Ser Ala Trp Lys
145 150 155 160
cgg cgc ctg gac gag gtc gtc ccg tac ctg cag cag ctg gag aac gcg 528
Arg Arg Leu Asp Glu Val Val Pro Tyr Leu Gln Gln Leu Glu Asn Ala
165 170 175
ggc gtc ccc gtc ctc ttc cgg ccg ctg cac gag atg aac gaa tcc tgg 576
Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met Asn Glu Ser Trp
180 185 190
aac tgg tgg gga aac cgg ccc gga gcg aac ggc agc gca cgc ctc tac 624
Asn Trp Trp Gly Asn Arg Pro Gly Ala Asn Gly Ser Ala Arg Leu Tyr
195 200 205
cag atc acc cgc gat cac ctc gcc ggg acg aaa ggg ctg gac aat ctg 672
Gln Ile Thr Arg Asp His Leu Ala Gly Thr Lys Gly Leu Asp Asn Leu
210 215 220
atc tgg gtc tgg aac gtc cag gac aat ccg gcg gga aac tgg aac agc 720
Ile Trp Val Trp Asn Val Gln Asp Asn Pro Ala Gly Asn Trp Asn Ser
225 230 235 240
tac tat ccg gga gat cag tac gtg gac gtc gtt tcg ctg gac gtc tgg 768
Tyr Tyr Pro Gly Asp Gln Tyr Val Asp Val Val Ser Leu Asp Val Trp
245 250 255
tac aag agc cac ccg agt tcc gcc gac tac cag cag atg cgg agc atc 816
Tyr Lys Ser His Pro Ser Ser Ala Asp Tyr Gln Gln Met Arg Ser Ile
260 265 270
gcg gga aca aaa ccc atg gcc ctc gcg gag ctg ggc aaa atg ccg acc 864
Ala Gly Thr Lys Pro Met Ala Leu Ala Glu Leu Gly Lys Met Pro Thr
275 280 285
gcc gcg ctg ctg gac agc cag acg cgg tgg aca tgg ttc atg atg tgg 912
Ala Ala Leu Leu Asp Ser Gln Thr Arg Trp Thr Trp Phe Met Met Trp
290 295 300
tcc gag cat ctg cgc ggg aac aat tcc aac gcc gaa ata cag acg gcg 960
Ser Glu His Leu Arg Gly Asn Asn Ser Asn Ala Glu Ile Gln Thr Ala
305 310 315 320
tat ttc cac ccc cgt gta ctg aac cag ggg gag gtc gca ctg ccc tga 1008
Tyr Phe His Pro Arg Val Leu Asn Gln Gly Glu Val Ala Leu Pro
325 330 335
<210> 114
<211> 335
<212> PRT
<213> Streptomyces ambofaciens
<400> 114
Met Gln Ala Ile Arg His His Val Met Leu Val Met Ala Phe Val Thr
1 5 10 15
Val Ala Thr Thr Phe Leu Leu Trp Pro Ser Thr Gln Ser Ala Gln Ala
20 25 30
Phe Pro Pro Thr Pro Lys Gln Thr Val Leu Asn His Leu Arg Ala Ile
35 40 45
Ser Gly Asn His Ile Val Ser Gly Gln His Asn Lys Glu Pro Ala Ser
50 55 60
Ala Pro Gly Gln Tyr Thr Gln Gln Val Lys Asp Val Thr Gly Gln Tyr
65 70 75 80
Pro Gly Leu Trp Gly Gly Asp Leu Met Phe Ala Ala Ala Asp Val Ala
85 90 95
Gly Arg Gln Arg Val Val Asp Gln Ala Arg Thr Glu Trp Ala Asn Gly
100 105 110
Ser Leu Val Ser Leu Thr Trp His Val Cys Pro Pro Thr Gly Gly Ser
115 120 125
Thr Cys Ala Phe Glu Gly Gly Val Lys Ser Thr Leu Thr Asn Ala Gln
130 135 140
Phe Ser Gln Val Leu Thr Glu Gly Ser Ala Leu Asn Ser Ala Trp Lys
145 150 155 160
Arg Arg Leu Asp Glu Val Val Pro Tyr Leu Gln Gln Leu Glu Asn Ala
165 170 175
Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met Asn Glu Ser Trp
180 185 190
Asn Trp Trp Gly Asn Arg Pro Gly Ala Asn Gly Ser Ala Arg Leu Tyr
195 200 205
Gln Ile Thr Arg Asp His Leu Ala Gly Thr Lys Gly Leu Asp Asn Leu
210 215 220
Ile Trp Val Trp Asn Val Gln Asp Asn Pro Ala Gly Asn Trp Asn Ser
225 230 235 240
Tyr Tyr Pro Gly Asp Gln Tyr Val Asp Val Val Ser Leu Asp Val Trp
245 250 255
Tyr Lys Ser His Pro Ser Ser Ala Asp Tyr Gln Gln Met Arg Ser Ile
260 265 270
Ala Gly Thr Lys Pro Met Ala Leu Ala Glu Leu Gly Lys Met Pro Thr
275 280 285
Ala Ala Leu Leu Asp Ser Gln Thr Arg Trp Thr Trp Phe Met Met Trp
290 295 300
Ser Glu His Leu Arg Gly Asn Asn Ser Asn Ala Glu Ile Gln Thr Ala
305 310 315 320
Tyr Phe His Pro Arg Val Leu Asn Gln Gly Glu Val Ala Leu Pro
325 330 335
<210> 115
<211> 1038
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1038)
<220>
<221> CDS
<222> (190)..(1038)
<400> 115
atg acg tgc ggg ctc ggg cgg gaa cgg ctc cac cgt aga aag gaa gcg 48
Met Thr Cys Gly Leu Gly Arg Glu Arg Leu His Arg Arg Lys Glu Ala
1 5 10 15
gtc cgg cgt ccc ggt cca aaa gag cac ggg aaa acc gga ccg atc gcg 96
Val Arg Arg Pro Gly Pro Lys Glu His Gly Lys Thr Gly Pro Ile Ala
20 25 30
cgt ctg tgc cct ggc ggg ccg gct cgt tcc aag ccc tgg tcg cgg ttg 144
Arg Leu Cys Pro Gly Gly Pro Ala Arg Ser Lys Pro Trp Ser Arg Leu
35 40 45
gcc ccc tac ggt ggt acg acc gac gac aag gcg acg ggg gcg acg atg 192
Ala Pro Tyr Gly Gly Thr Thr Asp Asp Lys Ala Thr Gly Ala Thr Met
50 55 60
cgt atc gcg gtg aca ggg gcg gcg ggc agt ctg ggc agg cgg gtg gtg 240
Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val Val
65 70 75 80
cag ctg ctc gcg gac cgg gcc gac gtg gac gtc gtg gcg atg acc agg 288
Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr Arg
85 90 95
cgg aag ctg cct gcc gag gca cta ccg ccg ggg gtg gag tgc gcc gtc 336
Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala Val
100 105 110
gcc gac tac gcc gac ccg ccc gct ctg cgt gcg gcg ctg aag ggc gtg 384
Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly Val
115 120 125
gac act ctg gtc ctc gtc tcc agc gac ggg ccc gac gca cgg gtg ctg 432
Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val Leu
130 135 140
ctg cac cac cgc aac gtc gtc gcc gcc gtg gtg gcc gag cgc gtc ggc 480
Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val Gly
145 150 155 160
cat gtc gcg gca ctg agc agc gtc gac gcc gac tcg gcc tcc ccg ttc 528
His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro Phe
165 170 175
tgc tac gcc gtc gtc aac cgg ctc acc gag gat ctg ctg ctc gcc tcc 576
Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala Ser
180 185 190
ggc gtg ccg tgc tcg ttc gcc agg gcc tcg ctg tac atc gag ttc ttc 624
Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe Phe
195 200 205
cta ggc tgg ctc acc cag gcg cgc tcg acc ggg ctg ctg agg ctg ccg 672
Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu Pro
210 215 220
gca gcc gat ggc cgg gtg tcc ctg gtg gcg cgc gac gac gtg gcc cgc 720
Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala Arg
225 230 235 240
gcc ctc gcc gcc ctc gcg gtg ggc ggg ccg acc ggc cgt cac cac gac 768
Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His Asp
245 250 255
atc acg gga ccc gag tcg acg gac ctg gca ggc atc gcc tcc acg gcg 816
Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr Ala
260 265 270
gcg gag gtg tgg cgg aca ccg gtc gcc tac gtg gac atc ccg gcc gac 864
Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala Asp
275 280 285
acg tac tct gcc gaa aca gcg gcg acc ggc ctg gat ccc tgg tgg ctc 912
Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp Leu
290 295 300
tac gcc ttc tcc tcc ctg ttc gcc tcg gta cgc gaa cag cgc tgg gat 960
Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp Asp
305 310 315 320
cgg gtc cgc gac gac tgc gcc cag ctc acc ggc cgc ttg ccc cgc act 1008
Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg Thr
325 330 335
ctc cgc gac gtc ctg tca gaa cgc gcg tga 1038
Leu Arg Asp Val Leu Ser Glu Arg Ala
340 345
<210> 116
<211> 345
<212> PRT
<213> Streptomyces ambofaciens
<400> 116
Met Thr Cys Gly Leu Gly Arg Glu Arg Leu His Arg Arg Lys Glu Ala
1 5 10 15
Val Arg Arg Pro Gly Pro Lys Glu His Gly Lys Thr Gly Pro Ile Ala
20 25 30
Arg Leu Cys Pro Gly Gly Pro Ala Arg Ser Lys Pro Trp Ser Arg Leu
35 40 45
Ala Pro Tyr Gly Gly Thr Thr Asp Asp Lys Ala Thr Gly Ala Thr Met
50 55 60
Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val Val
65 70 75 80
Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr Arg
85 90 95
Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala Val
100 105 110
Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly Val
115 120 125
Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val Leu
130 135 140
Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val Gly
145 150 155 160
His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro Phe
165 170 175
Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala Ser
180 185 190
Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe Phe
195 200 205
Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu Pro
210 215 220
Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala Arg
225 230 235 240
Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His Asp
245 250 255
Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr Ala
260 265 270
Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala Asp
275 280 285
Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp Leu
290 295 300
Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp Asp
305 310 315 320
Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg Thr
325 330 335
Leu Arg Asp Val Leu Ser Glu Arg Ala
340 345
<210> 117
<211> 282
<212> PRT
<213> Streptomyces ambofaciens
<400> 117
Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val
1 5 10 15
Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr
20 25 30
Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala
35 40 45
Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly
50 55 60
Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val
65 70 75 80
Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val
85 90 95
Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro
100 105 110
Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala
115 120 125
Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe
130 135 140
Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu
145 150 155 160
Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala
165 170 175
Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His
180 185 190
Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr
195 200 205
Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala
210 215 220
Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp
225 230 235 240
Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp
245 250 255
Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg
260 265 270
Thr Leu Arg Asp Val Leu Ser Glu Arg Ala
275 280
<210> 118
<211> 975
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(975)
<400> 118
atg ctc cga cgc cgt ctc gga ggg ccg tca ggc ccc ctc gtc agt gcc 48
Met Leu Arg Arg Arg Leu Gly Gly Pro Ser Gly Pro Leu Val Ser Ala
1 5 10 15
ctg tgc ctg ggc gcg atg ccc ttc ggc acc acc gtc gac gag aag acg 96
Leu Cys Leu Gly Ala Met Pro Phe Gly Thr Thr Val Asp Glu Lys Thr
20 25 30
tcc ttc gcc atc ctc gac cgg ttc gtc gag gcc ggc ggc agt ctc gtc 144
Ser Phe Ala Ile Leu Asp Arg Phe Val Glu Ala Gly Gly Ser Leu Val
35 40 45
gac acc gcc gac aac tac gcg ttc tgg gct ccc ggc ggg acc ggg gac 192
Asp Thr Ala Asp Asn Tyr Ala Phe Trp Ala Pro Gly Gly Thr Gly Asp
50 55 60
gag agc gag aac acc gtc ggg cgc tgg ctg gcg agc cgc cgc cgc cgc 240
Glu Ser Glu Asn Thr Val Gly Arg Trp Leu Ala Ser Arg Arg Arg Arg
65 70 75 80
gac gag gtg gtg atc tcc acc aag gtg ggt gcc cgc ccc acc gtc ccc 288
Asp Glu Val Val Ile Ser Thr Lys Val Gly Ala Arg Pro Thr Val Pro
85 90 95
ggc agc ggc ctg gag acc gcc gaa ggg ctg tcg gct ccc gtc ata cgg 336
Gly Ser Gly Leu Glu Thr Ala Glu Gly Leu Ser Ala Pro Val Ile Arg
100 105 110
aag gcc gcg gag gac agc ctg cga cgc ctg ggc acc gat cgc atc gat 384
Lys Ala Ala Glu Asp Ser Leu Arg Arg Leu Gly Thr Asp Arg Ile Asp
115 120 125
ctg tac tgg acc cac atc gag gac cgg acc gtc cct ctg gag gag acg 432
Leu Tyr Trp Thr His Ile Glu Asp Arg Thr Val Pro Leu Glu Glu Thr
130 135 140
ctc gga gct ctc gac gag ctg gtc ggc ggc ggc aag gtg gcg gtg ctg 480
Leu Gly Ala Leu Asp Glu Leu Val Gly Gly Gly Lys Val Ala Val Leu
145 150 155 160
ggc tgc tcc aac cac gcg ggc tgg cgc atc gaa cgg gcc cgc gcg ctc 528
Gly Cys Ser Asn His Ala Gly Trp Arg Ile Glu Arg Ala Arg Ala Leu
165 170 175
gcc cgg acc aac ggc tgg acg gcg tac acc tgc gtc cag cag cgc tac 576
Ala Arg Thr Asn Gly Trp Thr Ala Tyr Thr Cys Val Gln Gln Arg Tyr
180 185 190
tcc tac ctt cag ccg cgc ttc gac gtc gga ctg ccg gag agc gga cac 624
Ser Tyr Leu Gln Pro Arg Phe Asp Val Gly Leu Pro Glu Ser Gly His
195 200 205
gtc cac gcg acc tcc gaa ctc ctc gac cac gta cgc agc gag ccc gac 672
Val His Ala Thr Ser Glu Leu Leu Asp His Val Arg Ser Glu Pro Asp
210 215 220
ctg acg ctg ctg gcc tac tcg tcc ctg ctc tcg ggc gcg tac acc cgg 720
Leu Thr Leu Leu Ala Tyr Ser Ser Leu Leu Ser Gly Ala Tyr Thr Arg
225 230 235 240
ccg gac aag acc ctg tcc gcc gcc tac gac cac ccg ggc acc ggg cag 768
Pro Asp Lys Thr Leu Ser Ala Ala Tyr Asp His Pro Gly Thr Gly Gln
245 250 255
cgg ctg acc gtg ctg cgg gag gtg gcc gcc gag ctc ggt gcc acc gcc 816
Arg Leu Thr Val Leu Arg Glu Val Ala Ala Glu Leu Gly Ala Thr Ala
260 265 270
aac cag gtg gtg ctg tcc tgg ttg ctc gga ggt gat ccg ccg gtg atc 864
Asn Gln Val Val Leu Ser Trp Leu Leu Gly Gly Asp Pro Pro Val Ile
275 280 285
ccg atc gtg ggg gtg agt tcc gtc gag cag ctg gac gag gtg ctg gcc 912
Pro Ile Val Gly Val Ser Ser Val Glu Gln Leu Asp Glu Val Leu Ala
290 295 300
gcc gtc gag ctg gag ctg ccc cgg gag acg agg gca cgg ctg gac ctc 960
Ala Val Glu Leu Glu Leu Pro Arg Glu Thr Arg Ala Arg Leu Asp Leu
305 310 315 320
gcc ggg cgg ggc tga 975
Ala Gly Arg Gly
325
<210> 119
<211> 324
<212> PRT
<213> Streptomyces ambofaciens
<400> 119
Met Leu Arg Arg Arg Leu Gly Gly Pro Ser Gly Pro Leu Val Ser Ala
1 5 10 15
Leu Cys Leu Gly Ala Met Pro Phe Gly Thr Thr Val Asp Glu Lys Thr
20 25 30
Ser Phe Ala Ile Leu Asp Arg Phe Val Glu Ala Gly Gly Ser Leu Val
35 40 45
Asp Thr Ala Asp Asn Tyr Ala Phe Trp Ala Pro Gly Gly Thr Gly Asp
50 55 60
Glu Ser Glu Asn Thr Val Gly Arg Trp Leu Ala Ser Arg Arg Arg Arg
65 70 75 80
Asp Glu Val Val Ile Ser Thr Lys Val Gly Ala Arg Pro Thr Val Pro
85 90 95
Gly Ser Gly Leu Glu Thr Ala Glu Gly Leu Ser Ala Pro Val Ile Arg
100 105 110
Lys Ala Ala Glu Asp Ser Leu Arg Arg Leu Gly Thr Asp Arg Ile Asp
115 120 125
Leu Tyr Trp Thr His Ile Glu Asp Arg Thr Val Pro Leu Glu Glu Thr
130 135 140
Leu Gly Ala Leu Asp Glu Leu Val Gly Gly Gly Lys Val Ala Val Leu
145 150 155 160
Gly Cys Ser Asn His Ala Gly Trp Arg Ile Glu Arg Ala Arg Ala Leu
165 170 175
Ala Arg Thr Asn Gly Trp Thr Ala Tyr Thr Cys Val Gln Gln Arg Tyr
180 185 190
Ser Tyr Leu Gln Pro Arg Phe Asp Val Gly Leu Pro Glu Ser Gly His
195 200 205
Val His Ala Thr Ser Glu Leu Leu Asp His Val Arg Ser Glu Pro Asp
210 215 220
Leu Thr Leu Leu Ala Tyr Ser Ser Leu Leu Ser Gly Ala Tyr Thr Arg
225 230 235 240
Pro Asp Lys Thr Leu Ser Ala Ala Tyr Asp His Pro Gly Thr Gly Gln
245 250 255
Arg Leu Thr Val Leu Arg Glu Val Ala Ala Glu Leu Gly Ala Thr Ala
260 265 270
Asn Gln Val Val Leu Ser Trp Leu Leu Gly Gly Asp Pro Pro Val Ile
275 280 285
Pro Ile Val Gly Val Ser Ser Val Glu Gln Leu Asp Glu Val Leu Ala
290 295 300
Ala Val Glu Leu Glu Leu Pro Arg Glu Thr Arg Ala Arg Leu Asp Leu
305 310 315 320
Ala Gly Arg Gly
<210> 120
<211> 1227
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1227)
<400> 120
gtg acg ccc gag gcg gac gtc ggt acg cgg tgg gag ccg gag ttc gac 48
Val Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp
1 5 10 15
atg ctg ccc ggc ata ccc gac ctg cgg gcc ttt ccc cgc gga cgg tgg 96
Met Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp
20 25 30
gcg gac gcg gtg cgg gag gcc acc ggc gca ctg acc tgg ggc gag ctc 144
Ala Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu
35 40 45
ggc tac ccc gat ccg gcc ggt ctc gcc cgg ctc cgg cag cgg ctc gcg 192
Gly Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala
50 55 60
gcc tac ctc gtg cgg gga cgc ggc gcg tcg ctg gaa gcc cgg cag ctc 240
Ala Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu
65 70 75 80
gtc gtc tgc gcg ggc acg ctg gac gcg gtg cgc agg ctg tgc cgg gtc 288
Val Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val
85 90 95
ctg cgg acc gag ggc cac acc cac atg gcc ctg gag gac cct ggc tgg 336
Leu Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp
100 105 110
tcg cgg ctg agc gcc acg gtc ggg gcg gag ggg ctg gtg ccc gtc ccg 384
Ser Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro
115 120 125
gtt ccc gtg gac ggc gac ggc ctg cgg gtc gac ctg ctg cgg cgc gcg 432
Val Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala
130 135 140
cct cag gtc cgg tcg gtg atc gtc gct ccc gcc cac cag ttc ccg acc 480
Pro Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr
145 150 155 160
ggt gtg gtc ctc gcc ccg gcc cgt cgc ggc gag ctg gtc gcc tgg gcc 528
Gly Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala
165 170 175
cgc gag gtc gac ggc ctg gtg ctg gag gac gac tac gac gcc gag ttc 576
Arg Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe
180 185 190
cga tac gac cgc cac ccc gtg ggc gcc ctg cag ggc atg gca ccg gag 624
Arg Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu
195 200 205
cac gtc gcg ctg ctg ggg tcg gtc agc aag acg ctc tcg ccg gcc ctg 672
His Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu
210 215 220
cgg atc ggc tgg gcg gtg acc ccg ccg cgc tgg acc gag gcc ctg ggc 720
Arg Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly
225 230 235 240
gcg gag cac gtc ggg ggc gta cca ccg ccc gtc atc gac cag gag gcg 768
Ala Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala
245 250 255
ttc gcc cgg ttc ctg gcc cgc ggg tcc tac gac cgg tac ctg cgg gcg 816
Phe Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala
260 265 270
gca cgg ctg cgc tac aaa cgg cgc cgc gat cac ctc atg gga gaa ctc 864
Ala Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu
275 280 285
gcg gcg tcg ctg ccg ggg ttc cag gtg tcc ggt gcg gcg gcc ggc ttc 912
Ala Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe
290 295 300
cac ctg ctg ctg tcc ctg acg gac tgc tcg gcg ccc acc gtc gtc agg 960
His Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg
305 310 315 320
gag gcg gcg cgg cgt gac gtg agg ctg gcg gat ctc gac gcc tac cgg 1008
Glu Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg
325 330 335
atg gcg cgg gcc gag cac cac ccg acg gcc cgg gcc ggc gac tcc ggc 1056
Met Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly
340 345 350
ggg gcg cgg gcc gtg gcc gcc gcc ggc ccc gcg ctg gtc ctc ggc tac 1104
Gly Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr
355 360 365
ggc aat ctg gcg gac cac gcc gtg ccc gga gcc gtg cgg cgc ctg gca 1152
Gly Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala
370 375 380
cag gcc atc gac gcg gcc cgg cgc cac gac cgg cgg cac gtc gac gcc 1200
Gln Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala
385 390 395 400
ggg cgg gcc ggg gag cgg gcc gac tga 1227
Gly Arg Ala Gly Glu Arg Ala Asp
405
<210> 121
<211> 408
<212> PRT
<213> Streptomyces ambofaciens
<400> 121
Val Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp
1 5 10 15
Met Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp
20 25 30
Ala Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu
35 40 45
Gly Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala
50 55 60
Ala Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu
65 70 75 80
Val Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val
85 90 95
Leu Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp
100 105 110
Ser Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro
115 120 125
Val Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala
130 135 140
Pro Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr
145 150 155 160
Gly Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala
165 170 175
Arg Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe
180 185 190
Arg Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu
195 200 205
His Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu
210 215 220
Arg Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly
225 230 235 240
Ala Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala
245 250 255
Phe Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala
260 265 270
Ala Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu
275 280 285
Ala Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe
290 295 300
His Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg
305 310 315 320
Glu Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg
325 330 335
Met Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly
340 345 350
Gly Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr
355 360 365
Gly Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala
370 375 380
Gln Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala
385 390 395 400
Gly Arg Ala Gly Glu Arg Ala Asp
405
<210> 122
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR39
<400> 122
cccaagcttg agaagggagc ggacattcat ggcccgcgcc gaacgc 46
<210> 123
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR42
<400> 123
cgggatccgg ctgaccatgg gagacgggcg catcgccgag ttcagc 46
<210> 124
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR40
<400> 124
cccaagcttg agaagggagc ggacattcaa tgctttggta aagcac 46
<210> 125
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR41
<400> 125
cccaagcttt caaggaacga cggggtggtc agtcaagt 38
<210> 126
<211> 32
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide A
<400> 126
ccagtagata tcccgccaac ccggagctgc ac 32
<210> 127
<211> 32
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide B
<400> 127
gaaaagatcc gtcatggggt cgtgcgctcc tt 32
<210> 128
<211> 32
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide C
<400> 128
cacgacccca tgacggatct tttccgctgc at 32
<210> 129
<211> 32
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide D
<400> 129
gagccggata tcatcggtct tgccttgctc gt 32
<210> 130
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide ORF23c
<400> 130
acgtgcgcgg tgagttcgcc gttgc 25
<210> 131
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide ORF25c
<400> 131
ctgaacgacg ccatcgcggt ggtgc 25
<210> 132
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide ORF1*c
<400> 132
gaccacctcg aaccgtccgg cgtca 25
<210> 133
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide ORF2*c
<400> 133
ggcccggtcc agcgtgccga agc 23
<210> 134
<211> 6174
<212> DNA
<213> Streptomyces ambofaciens
<400> 134
ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60
ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc 120
aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180
gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240
ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 300
gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360
cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 420
gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480
gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540
gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600
ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc 660
cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 720
cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780
tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg 840
gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 900
cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960
gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 1020
tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 1080
gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140
gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200
tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 1260
gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320
gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380
tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440
tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500
gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560
tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620
ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680
ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740
tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800
tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860
acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920
tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980
acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2040
tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100
cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160
tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220
cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280
accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340
acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400
acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460
tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520
acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580
tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2640
cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700
actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 2760
cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2820
cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2880
acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2940
gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000
gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3060
tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120
caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180
gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240
gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300
atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360
gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420
gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480
tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540
ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600
ccgtggacgg agcgcgtccn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc cgccacaccc 4080
cccagcagcg tcagcgtccg cctcgggacc acacccggca ggacgacggg gtgcggggcg 4140
acgaggctga gggagccccg caactccacg gggcggctca accgcttgag ctgctccatc 4200
aactgctggg ccgaggtggt ccccgtgtgg tggtccaccg ggccgcggcc gctcgccgag 4260
gccagccgga ggttcccgcc cacccgcacc atgaagggca ggcccgcgag accgagccct 4320
cgcaccagtc gtggcagcac ggccgcgcgt gcgtccatca ccacggggcg ggccaaggag 4380
cggttggcct gagcggcttc ggccaccagg cggacgatgt tctcctcctc accgggtgcg 4440
ccggggtgcc ggggtgtgcc ctccccgctc cggccgccgc ccagcgtcag gcgccagctg 4500
accggggcgg ccgtcgtgcc cgaggccagc cacagcccgt gactctgctg gcagctcacc 4560
acccggccca ggtcggagac gaagcgccgg ctcaccccga cggagcgcac ccccgccttg 4620
gagaccacca tcggccagat cacccaggcg tcgggggtca gcctgtcgtc cacgtagcgg 4680
gccagcgcgg cccgcacctc gccccagtcc caggtcgacc cggcgacgaa gtggtgcagg 4740
ctctgttccg ccgcgccctc tccgacgaag gcggcgaggt tccgggcggt cttgcgtccc 4800
tgtgccgtga gcagcccgcg tatgtactgc tcacctcttc tgcgctggtc cgcccggcgg 4860
agcgaaccga gtaactccgc acatgcgtcg gagacgagcg agtcgaagtc gtgccgcgcg 4920
gcgggaccca cggggggcgc cgcgccggcg ggtcgaagcg tgcgtaaggt cataggagtc 4980
ctcgtggggg cctcgtcatc actgcgagtg gactgcgacc agcatcgcca attcacccgt 5040
tgctccccag gtacaccggg cacactcgtt ccgcttcgct cccccggcgg cacggcccgc 5100
gtgtggagca ctccccgctc tccggacggt gggggggaag cccaccgcac gcgcgccggt 5160
agcggtgccg gggccccaca acccctcacc gacggggtcc gttcgaccac atgccgtgat 5220
gatgccttcg ccgcacggcc tccttgaatg acggaccgtc agaaagacgt cactccgcgc 5280
gcgcccgctc ccgccccgac cccgcccggc cgccgtcccg cccccgcgac cctgtgggcc 5340
gacgccctct tgacggaccc ggaatcccgg gccgcgggac gggacggcga ggaactcgat 5400
gccgcaaagg ttccgcgtcc tcaccggcac ctccgagatc cagcgcaacg gcatcgccaa 5460
gctcctggct ttccaccact gagccgcacc ccctggcgag cagatccggg acaagacgcc 5520
accttcgcga cagtgtttag gaaaagttaa gtaaagaatt ccgcgagcgg attgccaggg 5580
agaacaaccc attgacgcgc accggtgcag cggccacatt gacggcacct gtcaagttca 5640
cccccaggag cttggaatcc catgcaggca attcggcatc acgtcatgct cgtcatggcc 5700
ttcgtgaccg tcgccacgac tttccttctc tggccgtcga cgcaatccgc gcaagcgttt 5760
cccccgaccc cgaagcagac ggtactgaac cacctccgcg ccatttccgg gaatcacatc 5820
gtctccggac agcacaacaa ggagcccgcc tccgccccgg gccagtacac ccagcaggtc 5880
aaggacgtca ccgggcagta ccccggcctg tggggcggtg acctgatgtt cgccgcggcg 5940
gacgtggccg gccgccagcg cgtcgtcgac caggccagga ccgagtgggc gaacggatcg 6000
ctggtctcgc tcacctggca cgtctgcccg ccgaccggcg gcagcacctg tgcgttcgag 6060
ggcggcgtca agtccacgct gacgaacgcg cagttctcgc aggtcctcac ggagggcagt 6120
gccctgaaca gcgcatggaa gcggcgcctg gacgaggtcg tcccgtacct gcag 6174
<210> 135
<211> 4770
<212> DNA
<213> Streptomyces ambofaciens
<400> 135
gaattccgcg agcggattgc cagggagaac aacccattga cgcgcaccgg tgcagcggcc 60
acattgacgg cacctgtcaa gttcaccccc aggagcttgg aatcccatgc aggcaattcg 120
gcatcacgtc atgctcgtca tggccttcgt gaccgtcgcc acgactttcc ttctctggcc 180
gtcgacgcaa tccgcgcaag cgtttccccc gaccccgaag cagacggtac tgaaccacct 240
ccgcgccatt tccgggaatc acatcgtctc cggacagcac aacaaggagc ccgcctccgc 300
cccgggccag tacacccagc aggtcaagga cgtcaccggg cagtaccccg gcctgtgggg 360
cggtgacctg atgttcgccg cggcggacgt ggccggccgc cagcgcgtcg tcgaccaggc 420
caggaccgag tgggcgaacg gatcgctggt ctcgctcacc tggcacgtct gcccgccgac 480
cggcggcagc acctgtgcgt tcgagggcgg cgtcaagtcc acgctgacga acgcgcagtt 540
ctcgcaggtc ctcacggagg gcagtgccct gaacagcgca tggaagcggc gcctggacga 600
ggtcgtcccg tacctgcagc agctggagaa cgcgggcgtc cccgtcctct tccggccgct 660
gcacgagatg aacgaatcct ggaactggtg gggaaaccgg cccggagcga acggcagcgc 720
acgcctctac cagatcaccc gcgatcacct cgccgggacg aaagggctgg acaatctgat 780
ctgggtctgg aacgtccagg acaatccggc gggaaactgg aacagctact atccgggaga 840
tcagtacgtg gacgtcgttt cgctggacgt ctggtacaag agccacccga gttccgccga 900
ctaccagcag atgcggagca tcgcgggaac aaaacccatg gccctcgcgg agctgggcaa 960
aatgccgacc gccgcgctgc tggacagcca gacgcggtgg acatggttca tgatgtggtc 1020
cgagcatctg cgcgggaaca attccaacgc cgaaatacag acggcgtatt tccacccccg 1080
tgtactgaac cagggggagg tcgcactgcc ctgacgctcg gcgctgcccg gctctctcac 1140
gcgcgttctg acaggacgtc gcggagagtg cggggcaagc ggccggtgag ctgggcgcag 1200
tcgtcgcgga cccgatccca gcgctgttcg cgtaccgagg cgaacaggga ggagaaggcg 1260
tagagccacc agggatccag gccggtcgcc gctgtttcgg cagagtacgt gtcggccggg 1320
atgtccacgt aggcgaccgg tgtccgccac acctccgccg ccgtggaggc gatgcctgcc 1380
aggtccgtcg actcgggtcc cgtgatgtcg tggtgacggc cggtcggccc gcccaccgcg 1440
agggcggcga gggcgcgggc cacgtcgtcg cgcgccacca gggacacccg gccatcggct 1500
gccggcagcc tcagcagccc ggtcgagcgc gcctgggtga gccagcctag gaagaactcg 1560
atgtacagcg aggccctggc gaacgagcac ggcacgccgg aggcgagcag cagatcctcg 1620
gtgagccggt tgacgacggc gtagcagaac ggggaggccg agtcggcgtc gacgctgctc 1680
agtgccgcga catggccgac gcgctcggcc accacggcgg cgacgacgtt gcggtggtgc 1740
agcagcaccc gtgcgtcggg cccgtcgctg gagacgagga ccagagtgtc cacgcccttc 1800
agcgccgcac gcagagcggg cgggtcggcg tagtcggcga cggcgcactc cacccccggc 1860
ggtagtgcct cggcaggcag cttccgcctg gtcatcgcca cgacgtccac gtcggcccgg 1920
tccgcgagca gctgcaccac ccgcctgccc agactgcccg ccgcccctgt caccgcgata 1980
cgcatcgtcg cccccgtcgc cttgtcgtcg gtcgtaccac cgtagggggc caaccgcgac 2040
cagggcttgg aacgagccgg cccgccaggg cacagacgcg cgatcggtcc ggttttcccg 2100
tgctcttttg gaccgggacg ccggaccgct tcctttctac ggtggagccg ttcccgcccg 2160
agcccgcacg tcatcgacgt gcggggaaga cagaggtgat accgatgctc cgacgccgtc 2220
tcggagggcc gtcaggcccc ctcgtcagtg ccctgtgcct gggcgcgatg cccttcggca 2280
ccaccgtcga cgagaagacg tccttcgcca tcctcgaccg gttcgtcgag gccggcggca 2340
gtctcgtcga caccgccgac aactacgcgt tctgggctcc cggcgggacc ggggacgaga 2400
gcgagaacac cgtcgggcgc tggctggcga gccgccgccg ccgcgacgag gtggtgatct 2460
ccaccaaggt gggtgcccgc cccaccgtcc ccggcagcgg cctggagacc gccgaagggc 2520
tgtcggctcc cgtcatacgg aaggccgcgg aggacagcct gcgacgcctg ggcaccgatc 2580
gcatcgatct gtactggacc cacatcgagg accggaccgt ccctctggag gagacgctcg 2640
gagctctcga cgagctggtc ggcggcggca aggtggcggt gctgggctgc tccaaccacg 2700
cgggctggcg catcgaacgg gcccgcgcgc tcgcccggac caacggctgg acggcgtaca 2760
cctgcgtcca gcagcgctac tcctaccttc agccgcgctt cgacgtcgga ctgccggaga 2820
gcggacacgt ccacgcgacc tccgaactcc tcgaccacgt acgcagcgag cccgacctga 2880
cgctgctggc ctactcgtcc ctgctctcgg gcgcgtacac ccggccggac aagaccctgt 2940
ccgccgccta cgaccacccg ggcaccgggc agcggctgac cgtgctgcgg gaggtggccg 3000
ccgagctcgg tgccaccgcc aaccaggtgg tgctgtcctg gttgctcgga ggtgatccgc 3060
cggtgatccc gatcgtgggg gtgagttccg tcgagcagct ggacgaggtg ctggccgccg 3120
tcgagctgga gctgccccgg gagacgaggg cacggctgga cctcgccggg cggggctgac 3180
gggccacaca ccgcccctcg cccgggacgg gctgaccggc cgcacaccgt ccctcagccg 3240
ggacgggctg acggccacac acccgcccct cagcccggct gggctgggct gacggccaca 3300
cacccgctcc tcagcccggc tgggctgggc tgacggccac acacccgccc ctcagcccgg 3360
ctgggctggg ctgacggcca cacgccgtcc ctcgcccggg tcgggctgac cagccacacg 3420
ccgtccctca gtcggcccgc tccccggccc gcccggcgtc gacgtgccgc cggtcgtggc 3480
gccgggccgc gtcgatggcc tgtgccaggc gccgcacggc tccgggcacg gcgtggtccg 3540
ccagattgcc gtagccgagg accagcgcgg ggccggcggc ggccacggcc cgcgccccgc 3600
cggagtcgcc ggcccgggcc gtcgggtggt gctcggcccg cgccatccgg taggcgtcga 3660
gatccgccag cctcacgtca cgccgcgccg cctccctgac gacggtgggc gccgagcagt 3720
ccgtcaggga cagcagcagg tggaagccgg ccgccgcacc ggacacctgg aaccccggca 3780
gcgacgccgc gagttctccc atgaggtgat cgcggcgccg tttgtagcgc agccgtgccg 3840
cccgcaggta ccggtcgtag gacccgcggg ccaggaaccg ggcgaacgcc tcctggtcga 3900
tgacgggcgg tggtacgccc ccgacgtgct ccgcgcccag ggcctcggtc cagcgcggcg 3960
gggtcaccgc ccagccgatc cgcagggccg gcgagagcgt cttgctgacc gaccccagca 4020
gcgcgacgtg ctccggtgcc atgccctgca gggcgcccac ggggtggcgg tcgtatcgga 4080
actcggcgtc gtagtcgtcc tccagcacca ggccgtcgac ctcgcgggcc caggcgacca 4140
gctcgccgcg acgggccggg gcgaggacca caccggtcgg gaactggtgg gcgggagcga 4200
cgatcaccga ccggacctga ggcgcgcgcc gcagcaggtc gacccgcagg ccgtcgccgt 4260
ccacgggaac cgggacgggc accagcccct ccgccccgac cgtggcgctc agccgcgacc 4320
agccagggtc ctccagggcc atgtgggtgt ggccctcggt ccgcaggacc cggcacagcc 4380
tgcgcaccgc gtccagcgtg cccgcgcaga cgacgagctg ccgggcttcc agcgacgcgc 4440
cgcgtccccg cacgaggtag gccgcgagcc gctgccggag ccgggcgaga ccggccggat 4500
cggggtagcc gagctcgccc caggtcagtg cgccggtggc ctcccgcacc gcgtccgccc 4560
accgtccgcg gggaaaggcc cgcaggtcgg gtatgccggg cagcatgtcg aactccggct 4620
cccaccgcgt accgacgtcc gcctcgggcg tcaccggagc ggggacggcc tgcgccctga 4680
cccgggtggc cgagccgctg cgcgcctcca ggtacccctc cgcgacgagc tgcgcgtagg 4740
ggggatcctc tagagtcgac ctgcaggcct 4770
<210> 136
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR31
<400> 136
cccaagcttc tgcgcccgcg ggcgtgaa 28
<210> 137
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR37
<400> 137
gctctagaac cgtgtagccg cgccccgg 28
<210> 138
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF30
<400> 138
aagcttgtgt gcccggtgta cctggggagc 30
<210> 139
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF31
<400> 139
ggatcccgcg acggacacga ccgccgcgca 30
<210> 140
<211> 12134
<212> DNA
<213> Streptomyces ambofaciens
<400> 140
ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60
ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc 120
aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180
gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240
ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 300
gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360
cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 420
gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480
gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540
gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600
ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc 660
cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 720
cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780
tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg 840
gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 900
cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960
gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 1020
tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 1080
gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140
gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200
tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 1260
gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320
gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380
tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440
tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500
gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560
tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620
ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680
ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740
tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800
tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860
acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920
tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980
acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2040
tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100
cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160
tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220
cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280
accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340
acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400
acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460
tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520
acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580
tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2640
cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700
actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 2760
cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2820
cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2880
acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2940
gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000
gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3060
tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120
caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180
gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240
gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300
atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360
gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420
gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480
tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540
ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600
ccgtggacgg agcgcgccga ggagcggaaa ggtctgccgc agaaacaggc tgcggccctt 3660
tctttccgct ttttccggta ccgggacggc cgttccgatg aaagcgaacg tccgcatgcg 3720
acggccgtcc ctcccgtacg ctcctccccc gtcgcggccg gccgggcggg cgggccggcc 3780
gaccgcgacg gggcggggcg gggtcacacc gccgtcgccc caccgaggtc gccgcgcgcg 3840
gagggctgcg ccagccgcag cgtgtgggcg atggacgcca gggtcacgtg ccggtgccag 3900
ccctggaacg accgtccttc gaagtcgcgc atgcccacgc ccacgctcac ccggtcgaag 3960
tcggcgtcga cctgttcggt gagcatcgcc agccgcagca gggcgccgcg gtcccaggac 4020
gtgaggtcgg tcagccacag gtcggcgggg cgccggcggt tgccccgcca cacccccagc 4080
agcgtcagcg tccgcctcgg gaccacaccc ggcaggacga cggggtgcgg ggcgacgagg 4140
ctgagggagc cccgcaactc cacggggcgg ctcaaccgct tgagctgctc catcaactgc 4200
tgggccgagg tggtccccgt gtggtggtcc accgggccgc ggccgctcgc cgaggccagc 4260
cggaggttcc cgcccacccg caccatgaag ggcaggcccg cgagaccgag ccctcgcacc 4320
agtcgtggca gcacggccgc gcgtgcgtcc atcaccacgg ggcgggccaa ggagcggttg 4380
gcctgagcgg cttcggccac caggcggacg atgttctcct cctcaccggg tgcgccgggg 4440
tgccggggtg tgccctcccc gctccggccg ccgcccagcg tcaggcgcca gctgaccggg 4500
gcggccgtcg tgcccgaggc cagccacagc ccgtgactct gctggcagct caccacccgg 4560
cccaggtcgg agacgaagcg ccggctcacc ccgacggagc gcacccccgc cttggagacc 4620
accatcggcc agatcaccca ggcgtcgggg gtcagcctgt cgtccacgta gcgggccagc 4680
gcggcccgca cctcgcccca gtcccaggtc gacccggcga cgaagtggtg caggctctgt 4740
tccgccgcgc cctctccgac gaaggcggcg aggttccggg cggtcttgcg tccctgtgcc 4800
gtgagcagcc cgcgtatgta ctgctcacct cttctgcgct ggtccgcccg gcggagcgaa 4860
ccgagtaact ccgcacatgc gtcggagacg agcgagtcga agtcgtgccg cgcggcggga 4920
cccacggggg gcgccgcgcc ggcgggtcga agcgtgcgta aggtcatagg agtcctcgtg 4980
ggggcctcgt catcactgcg agtggactgc gaccagcatc gccaattcac ccgttgctcc 5040
ccaggtacac cgggcacact cgttccgctt cgctcccccg gcggcacggc ccgcgtgtgg 5100
agcactcccc gctctccgga cggtgggggg gaagcccacc gcacgcgcgc cggtagcggt 5160
gccggggccc cacaacccct caccgacggg gtccgttcga ccacatgccg tgatgatgcc 5220
ttcgccgcac ggcctccttg aatgacggac cgtcagaaag acgtcactcc gcgcgcgccc 5280
gctcccgccc cgaccccgcc cggccgccgt cccgcccccg cgaccctgtg ggccgacgcc 5340
ctcttgacgg acccggaatc ccgggccgcg ggacgggacg gcgaggaact cgatgccgca 5400
aaggttccgc gtcctcaccg gcacctccga gatccagcgc aacggcatcg ccaagctcct 5460
ggctttccac cactgagccg caccccctgg cgagcagatc cgggacaaga cgccaccttc 5520
gcgacagtgt ttaggaaaag ttaagtaaag aattccgcga gcggattgcc agggagaaca 5580
acccattgac gcgcaccggt gcagcggcca cattgacggc acctgtcaag ttcaccccca 5640
ggagcttgga atcccatgca ggcaattcgg catcacgtca tgctcgtcat ggccttcgtg 5700
accgtcgcca cgactttcct tctctggccg tcgacgcaat ccgcgcaagc gtttcccccg 5760
accccgaagc agacggtact gaaccacctc cgcgccattt ccgggaatca catcgtctcc 5820
ggacagcaca acaaggagcc cgcctccgcc ccgggccagt acacccagca ggtcaaggac 5880
gtcaccgggc agtaccccgg cctgtggggc ggtgacctga tgttcgccgc ggcggacgtg 5940
gccggccgcc agcgcgtcgt cgaccaggcc aggaccgagt gggcgaacgg atcgctggtc 6000
tcgctcacct ggcacgtctg cccgccgacc ggcggcagca cctgtgcgtt cgagggcggc 6060
gtcaagtcca cgctgacgaa cgcgcagttc tcgcaggtcc tcacggaggg cagtgccctg 6120
aacagcgcat ggaagcggcg cctggacgag gtcgtcccgt acctgcagca gctggagaac 6180
gcgggcgtcc ccgtcctctt ccggccgctg cacgagatga acgaatcctg gaactggtgg 6240
ggaaaccggc ccggagcgaa cggcagcgca cgcctctacc agatcacccg cgatcacctc 6300
gccgggacga aagggctgga caatctgatc tgggtctgga acgtccagga caatccggcg 6360
ggaaactgga acagctacta tccgggagat cagtacgtgg acgtcgtttc gctggacgtc 6420
tggtacaaga gccacccgag ttccgccgac taccagcaga tgcggagcat cgcgggaaca 6480
aaacccatgg ccctcgcgga gctgggcaaa atgccgaccg ccgcgctgct ggacagccag 6540
acgcggtgga catggttcat gatgtggtcc gagcatctgc gcgggaacaa ttccaacgcc 6600
gaaatacaga cggcgtattt ccacccccgt gtactgaacc agggggaggt cgcactgccc 6660
tgacgctcgg cgctgcccgg ctctctcacg cgcgttctga caggacgtcg cggagagtgc 6720
ggggcaagcg gccggtgagc tgggcgcagt cgtcgcggac ccgatcccag cgctgttcgc 6780
gtaccgaggc gaacagggag gagaaggcgt agagccacca gggatccagg ccggtcgccg 6840
ctgtttcggc agagtacgtg tcggccggga tgtccacgta ggcgaccggt gtccgccaca 6900
cctccgccgc cgtggaggcg atgcctgcca ggtccgtcga ctcgggtccc gtgatgtcgt 6960
ggtgacggcc ggtcggcccg cccaccgcga gggcggcgag ggcgcgggcc acgtcgtcgc 7020
gcgccaccag ggacacccgg ccatcggctg ccggcagcct cagcagcccg gtcgagcgcg 7080
cctgggtgag ccagcctagg aagaactcga tgtacagcga ggccctggcg aacgagcacg 7140
gcacgccgga ggcgagcagc agatcctcgg tgagccggtt gacgacggcg tagcagaacg 7200
gggaggccga gtcggcgtcg acgctgctca gtgccgcgac atggccgacg cgctcggcca 7260
ccacggcggc gacgacgttg cggtggtgca gcagcacccg tgcgtcgggc ccgtcgctgg 7320
agacgaggac cagagtgtcc acgcccttca gcgccgcacg cagagcgggc gggtcggcgt 7380
agtcggcgac ggcgcactcc acccccggcg gtagtgcctc ggcaggcagc ttccgcctgg 7440
tcatcgccac gacgtccacg tcggcccggt ccgcgagcag ctgcaccacc cgcctgccca 7500
gactgcccgc cgcccctgtc accgcgatac gcatcgtcgc ccccgtcgcc ttgtcgtcgg 7560
tcgtaccacc gtagggggcc aaccgcgacc agggcttgga acgagccggc ccgccagggc 7620
acagacgcgc gatcggtccg gttttcccgt gctcttttgg accgggacgc cggaccgctt 7680
cctttctacg gtggagccgt tcccgcccga gcccgcacgt catcgacgtg cggggaagac 7740
agaggtgata ccgatgctcc gacgccgtct cggagggccg tcaggccccc tcgtcagtgc 7800
cctgtgcctg ggcgcgatgc ccttcggcac caccgtcgac gagaagacgt ccttcgccat 7860
cctcgaccgg ttcgtcgagg ccggcggcag tctcgtcgac accgccgaca actacgcgtt 7920
ctgggctccc ggcgggaccg gggacgagag cgagaacacc gtcgggcgct ggctggcgag 7980
ccgccgccgc cgcgacgagg tggtgatctc caccaaggtg ggtgcccgcc ccaccgtccc 8040
cggcagcggc ctggagaccg ccgaagggct gtcggctccc gtcatacgga aggccgcgga 8100
ggacagcctg cgacgcctgg gcaccgatcg catcgatctg tactggaccc acatcgagga 8160
ccggaccgtc cctctggagg agacgctcgg agctctcgac gagctggtcg gcggcggcaa 8220
ggtggcggtg ctgggctgct ccaaccacgc gggctggcgc atcgaacggg cccgcgcgct 8280
cgcccggacc aacggctgga cggcgtacac ctgcgtccag cagcgctact cctaccttca 8340
gccgcgcttc gacgtcggac tgccggagag cggacacgtc cacgcgacct ccgaactcct 8400
cgaccacgta cgcagcgagc ccgacctgac gctgctggcc tactcgtccc tgctctcggg 8460
cgcgtacacc cggccggaca agaccctgtc cgccgcctac gaccacccgg gcaccgggca 8520
gcggctgacc gtgctgcggg aggtggccgc cgagctcggt gccaccgcca accaggtggt 8580
gctgtcctgg ttgctcggag gtgatccgcc ggtgatcccg atcgtggggg tgagttccgt 8640
cgagcagctg gacgaggtgc tggccgccgt cgagctggag ctgccccggg agacgagggc 8700
acggctggac ctcgccgggc ggggctgacg ggccacacac cgcccctcgc ccgggacggg 8760
ctgaccggcc gcacaccgtc cctcagccgg gacgggctga cggccacaca cccgcccctc 8820
agcccggctg ggctgggctg acggccacac acccgctcct cagcccggct gggctgggct 8880
gacggccaca cacccgcccc tcagcccggc tgggctgggc tgacggccac acgccgtccc 8940
tcgcccgggt cgggctgacc agccacacgc cgtccctcag tcggcccgct ccccggcccg 9000
cccggcgtcg acgtgccgcc ggtcgtggcg ccgggccgcg tcgatggcct gtgccaggcg 9060
ccgcacggct ccgggcacgg cgtggtccgc cagattgccg tagccgagga ccagcgcggg 9120
gccggcggcg gccacggccc gcgccccgcc ggagtcgccg gcccgggccg tcgggtggtg 9180
ctcggcccgc gccatccggt aggcgtcgag atccgccagc ctcacgtcac gccgcgccgc 9240
ctccctgacg acggtgggcg ccgagcagtc cgtcagggac agcagcaggt ggaagccggc 9300
cgccgcaccg gacacctgga accccggcag cgacgccgcg agttctccca tgaggtgatc 9360
gcggcgccgt ttgtagcgca gccgtgccgc ccgcaggtac cggtcgtagg acccgcgggc 9420
caggaaccgg gcgaacgcct cctggtcgat gacgggcggt ggtacgcccc cgacgtgctc 9480
cgcgcccagg gcctcggtcc agcgcggcgg ggtcaccgcc cagccgatcc gcagggccgg 9540
cgagagcgtc ttgctgaccg accccagcag cgcgacgtgc tccggtgcca tgccctgcag 9600
ggcgcccacg gggtggcggt cgtatcggaa ctcggcgtcg tagtcgtcct ccagcaccag 9660
gccgtcgacc tcgcgggccc aggcgaccag ctcgccgcga cgggccgggg cgaggaccac 9720
accggtcggg aactggtggg cgggagcgac gatcaccgac cggacctgag gcgcgcgccg 9780
cagcaggtcg acccgcaggc cgtcgccgtc cacgggaacc gggacgggca ccagcccctc 9840
cgccccgacc gtggcgctca gccgcgacca gccagggtcc tccagggcca tgtgggtgtg 9900
gccctcggtc cgcaggaccc ggcacagcct gcgcaccgcg tccagcgtgc ccgcgcagac 9960
gacgagctgc cgggcttcca gcgacgcgcc gcgtccccgc acgaggtagg ccgcgagccg 10020
ctgccggagc cgggcgagac cggccggatc ggggtagccg agctcgcccc aggtcagtgc 10080
gccggtggcc tcccgcaccg cgtccgccca ccgtccgcgg ggaaaggccc gcaggtcggg 10140
tatgccgggc agcatgtcga actccggctc ccaccgcgta ccgacgtccg cctcgggcgt 10200
caccggagcg gggacggcct gcgccctgac ccgggtggcc gagccgctgc gcgcctccag 10260
gtacccctcc gcgacgagct gcgcgtaggc ctccgtcacc acccaccgcg agcagcccag 10320
gtccgccgcc agcgccctgc tcggcggcag cgcgctgccg gaggcgatcc gcccaccggt 10380
caccgccgcc cgcagggcac ggctcagccg gacgtgcagc gggccgtccg ccggcccgcc 10440
cagttcgaga aaggttcccc atgccgggtc ggtccggtcg tcgcccacgg cagccgatgc 10500
tacccaccgc cccgcgacgg ccgggcggcg gcgtccacgg gcccggtgca cactggatgg 10560
cgtggcggag acggaccggc atctcgacca gcggctggag caggccatca tggacctgct 10620
ggagcgacgg gcggccactg cctcgatctg tccgtccgac gccgcgcgtc gggtccacga 10680
gggtgacgac gagggctggc gagccctgct ggaacccgcg cgccgagcgg cctggcgtct 10740
ggtggggtcc ggcgaggtcg aggtgaccca ggccggccgg cccgtcacgc aggccgaggc 10800
ccgcgggccc gtccgcattc gtcgggcggg ttcctgacgg ctcgatccga aggcggaact 10860
cccgtgcccc ggcggcacgg gagctcgacg ccgggaggtc agcgccgcag ggtgagcaca 10920
cccggccgcc acggcagctg gtcgtagggg ccgcccgcgg tgggtgactt gccctggtag 10980
aggaaccgca ggttgcaggg gtcgacggtc atggtctggt cggggttgtc gcggaccagg 11040
tcaccgtggc tgatgtcgtt ggtccaggtg gccccgctgt tggccttgcc cgcgaagggg 11100
ttgctctcgc tcgcggcctg cggggtccac gagccgctca ggctggaggc cgtgaaggaa 11160
cggaagtagc gtccgttcgc gcccatcgcc tcgacgatca tcaggtactg gttctggccc 11220
tgaaccttgt agacctgcac gccctcgaac aggttggcct tcgtgtcgct catgatcgtc 11280
gtgtacgacg agccgaagct gcccgggaag ttcccgatcg gcatgctcgc ccggtagatc 11340
ttgccgttgt caccggcgaa gaacaggtac atgttctgtc cgtcggcgat cagggtctgg 11400
tcgatcgggc cggtgtcgga tcctgagatg ctcccggtga acaacggctg cggagccgac 11460
cagccgttgg ggttggccgg gtcgctggac gtgcggtaga cgaagggcca cgcgccccac 11520
tggtacgcca gcacccagac gttcttgggc gcgaagtaga acagggtggg cgccaccgcc 11580
gcctgactca tcccggtctg gccggccgac gccatgtccg accagttcgt gaaggggctg 11640
aacatcatcg agccgtagga cgaccccgac acgttcgacg cgtagaccag gtgcttgccg 11700
ttgtgggtca cggtggtgaa gtccttgacc gccgcccacc cgttcgccgg ctgcgccagc 11760
acacccgtcg acgaccaccg gtacgccgac ggaagggcac acgccccgtc cgtcgggggc 11820
gtcccggtca ggccggacca cttctgcccg ctgccaccga cgcacgtccc gatctgcacc 11880
gccgtgccgt tggccgtacc ggcgcccgcg gcctccaggc acagcccgga ctccacgccg 11940
acgaccgtgc cgtcggagtt cacccgccac tgctggttcg caccgccgga acagctccag 12000
atctgcaccc gcgtcccggg tgtggtggcg tgacccggaa cgtccaggca cttgttgccg 12060
tacacggtca gccgacggtc gtccgtcaac gtccactgct gattgctccc gccccagcag 12120
tcgtatatct gcag 12134
<210> 141
<211> 1164
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1164)
<400> 141
atg acc tta cgc acg ctt cga ccc gcc ggc gcg gcg ccc ccc gtg ggt 48
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly
1 5 10 15
ccc gcc gcg cgg cac gac ttc gac tcg ctc gtc tcc gac gca tgt gcg 96
Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala
20 25 30
gag tta ctc ggt tcg ctc cgc cgg gcg gac cag cgc aga aga ggt gag 144
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu
35 40 45
cag tac ata cgc ggg ctg ctc acg gca cag gga cgc aag acc gcc cgg 192
Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg
50 55 60
aac ctc gcc gcc ttc gtc gga gag ggc gcg gcg gaa cag agc ctg cac 240
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His
65 70 75 80
cac ttc gtc gcc ggg tcg acc tgg gac tgg ggc gag gtg cgg gcc gcg 288
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala
85 90 95
ctg gcc cgc tac gtg gac gac agg ctg acc ccc gac gcc tgg gtg atc 336
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile
100 105 110
tgg ccg atg gtg gtc tcc aag gcg ggg gtg cgc tcc gtc ggg gtg agc 384
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser
115 120 125
cgg cgc ttc gtc tcc gac ctg ggc cgg gtg gtg agc tgc cag cag agt 432
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser
130 135 140
cac ggg ctg tgg ctg gcc tcg ggc acg acg gcc gcc ccg gtc agc tgg 480
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp
145 150 155 160
cgc ctg acg ctg ggc ggc ggc cgg agc ggg gag ggc aca ccc cgg cac 528
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His
165 170 175
ccc ggc gca ccc ggt gag gag gag aac atc gtc cgc ctg gtg gcc gaa 576
Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu
180 185 190
gcc gct cag gcc aac cgc tcc ttg gcc cgc ccc gtg gtg atg gac gca 624
Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala
195 200 205
cgc gcg gcc gtg ctg cca cga ctg gtg cga ggg ctc ggt ctc gcg ggc 672
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly
210 215 220
ctg ccc ttc atg gtg cgg gtg ggc ggg aac ctc cgg ctg gcc tcg gcg 720
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala
225 230 235 240
agc ggc cgc ggc ccg gtg gac cac cac acg ggg acc acc tcg gcc cag 768
Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln
245 250 255
cag ttg atg gag cag ctc aag cgg ttg agc cgc ccc gtg gag ttg cgg 816
Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg
260 265 270
ggc tcc ctc agc ctc gtc gcc ccg cac ccc gtc gtc ctg ccg ggt gtg 864
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val
275 280 285
gtc ccg agg cgg acg ctg acg ctg ctg ggg gtg tgg cgg ggc aac cgc 912
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Val Trp Arg Gly Asn Arg
290 295 300
cgg cgc ccc gcc gac ctg tgg ctg acc gac ctc acg tcc tgg gac cgc 960
Arg Arg Pro Ala Asp Leu Trp Leu Thr Asp Leu Thr Ser Trp Asp Arg
305 310 315 320
ggc gcc ctg ctg cgg ctg gcg atg ctc acc gaa cag gtc gac gcc gac 1008
Gly Ala Leu Leu Arg Leu Ala Met Leu Thr Glu Gln Val Asp Ala Asp
325 330 335
ttc gac cgg gtg agc gtg ggc gtg ggc atg cgc gac ttc gaa gga cgg 1056
Phe Asp Arg Val Ser Val Gly Val Gly Met Arg Asp Phe Glu Gly Arg
340 345 350
tcg ttc cag ggc tgg cac cgg cac gtg acc ctg gcg tcc atc gcc cac 1104
Ser Phe Gln Gly Trp His Arg His Val Thr Leu Ala Ser Ile Ala His
355 360 365
acg ctg cgg ctg gcg cag ccc tcc gcg cgc ggc gac ctc ggt ggg gcg 1152
Thr Leu Arg Leu Ala Gln Pro Ser Ala Arg Gly Asp Leu Gly Gly Ala
370 375 380
acg gcg gtg tga 1164
Thr Ala Val
385
<210> 142
<211> 387
<212> PRT
<213> Streptomyces ambofaciens
<400> 142
Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly
1 5 10 15
Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala
20 25 30
Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu
35 40 45
Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg
50 55 60
Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His
65 70 75 80
His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala
85 90 95
Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile
100 105 110
Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser
115 120 125
Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser
130 135 140
His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp
145 150 155 160
Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His
165 170 175
Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu
180 185 190
Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala
195 200 205
Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly
210 215 220
Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala
225 230 235 240
Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln
245 250 255
Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg
260 265 270
Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val
275 280 285
Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Val Trp Arg Gly Asn Arg
290 295 300
Arg Arg Pro Ala Asp Leu Trp Leu Thr Asp Leu Thr Ser Trp Asp Arg
305 310 315 320
Gly Ala Leu Leu Arg Leu Ala Met Leu Thr Glu Gln Val Asp Ala Asp
325 330 335
Phe Asp Arg Val Ser Val Gly Val Gly Met Arg Asp Phe Glu Gly Arg
340 345 350
Ser Phe Gln Gly Trp His Arg His Val Thr Leu Ala Ser Ile Ala His
355 360 365
Thr Leu Arg Leu Ala Gln Pro Ser Ala Arg Gly Asp Leu Gly Gly Ala
370 375 380
Thr Ala Val
385
<210> 143
<211> 849
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(849)
<400> 143
atg cgt atc gcg gtg aca ggg gcg gcg ggc agt ctg ggc agg cgg gtg 48
Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val
1 5 10 15
gtg cag ctg ctc gcg gac cgg gcc gac gtg gac gtc gtg gcg atg acc 96
Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr
20 25 30
agg cgg aag ctg cct gcc gag gca cta ccg ccg ggg gtg gag tgc gcc 144
Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala
35 40 45
gtc gcc gac tac gcc gac ccg ccc gct ctg cgt gcg gcg ctg aag ggc 192
Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly
50 55 60
gtg gac act ctg gtc ctc gtc tcc agc gac ggg ccc gac gca cgg gtg 240
Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val
65 70 75 80
ctg ctg cac cac cgc aac gtc gtc gcc gcc gtg gtg gcc gag cgc gtc 288
Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val
85 90 95
ggc cat gtc gcg gca ctg agc agc gtc gac gcc gac tcg gcc tcc ccg 336
Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro
100 105 110
ttc tgc tac gcc gtc gtc aac cgg ctc acc gag gat ctg ctg ctc gcc 384
Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala
115 120 125
tcc ggc gtg ccg tgc tcg ttc gcc agg gcc tcg ctg tac atc gag ttc 432
Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe
130 135 140
ttc cta ggc tgg ctc acc cag gcg cgc tcg acc ggg ctg ctg agg ctg 480
Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu
145 150 155 160
ccg gca gcc gat ggc cgg gtg tcc ctg gtg gcg cgc gac gac gtg gcc 528
Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala
165 170 175
cgc gcc ctc gcc gcc ctc gcg gtg ggc ggg ccg acc ggc cgt cac cac 576
Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His
180 185 190
gac atc acg gga ccc gag tcg acg gac ctg gca ggc atc gcc tcc acg 624
Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr
195 200 205
gcg gcg gag gtg tgg cgg aca ccg gtc gcc tac gtg gac atc ccg gcc 672
Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala
210 215 220
gac acg tac tct gcc gaa aca gcg gcg acc ggc ctg gat ccc tgg tgg 720
Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp
225 230 235 240
ctc tac gcc ttc tcc tcc ctg ttc gcc tcg gta cgc gaa cag cgc tgg 768
Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp
245 250 255
gat cgg gtc cgc gac gac tgc gcc cag ctc acc ggc cgc ttg ccc cgc 816
Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg
260 265 270
act ctc cgc gac gtc ctg tca gaa cgc gcg tga 849
Thr Leu Arg Asp Val Leu Ser Glu Arg Ala
275 280
<210> 144
<211> 282
<212> PRT
<213> Streptomyces ambofaciens
<400> 144
Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val
1 5 10 15
Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr
20 25 30
Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala
35 40 45
Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly
50 55 60
Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val
65 70 75 80
Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val
85 90 95
Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro
100 105 110
Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala
115 120 125
Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe
130 135 140
Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu
145 150 155 160
Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala
165 170 175
Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His
180 185 190
Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr
195 200 205
Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala
210 215 220
Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp
225 230 235 240
Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp
245 250 255
Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg
260 265 270
Thr Leu Arg Asp Val Leu Ser Glu Arg Ala
275 280
<210> 145
<211> 1512
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1512)
<400> 145
gtg ggc gac gac cgg acc gac ccg gca tgg gga acc ttt ctc gaa ctg 48
Val Gly Asp Asp Arg Thr Asp Pro Ala Trp Gly Thr Phe Leu Glu Leu
1 5 10 15
ggc ggg ccg gcg gac ggc ccg ctg cac gtc cgg ctg agc cgt gcc ctg 96
Gly Gly Pro Ala Asp Gly Pro Leu His Val Arg Leu Ser Arg Ala Leu
20 25 30
cgg gcg gcg gtg acc ggt ggg cgg atc gcc tcc ggc agc gcg ctg ccg 144
Arg Ala Ala Val Thr Gly Gly Arg Ile Ala Ser Gly Ser Ala Leu Pro
35 40 45
ccg agc agg gcg ctg gcg gcg gac ctg ggc tgc tcg cgg tgg gtg gtg 192
Pro Ser Arg Ala Leu Ala Ala Asp Leu Gly Cys Ser Arg Trp Val Val
50 55 60
acg gag gcc tac gcg cag ctc gtc gcg gag ggg tac ctg gag gcg cgc 240
Thr Glu Ala Tyr Ala Gln Leu Val Ala Glu Gly Tyr Leu Glu Ala Arg
65 70 75 80
agc ggc tcg gcc acc cgg gtc agg gcg cag gcc gtc ccc gct ccg gtg 288
Ser Gly Ser Ala Thr Arg Val Arg Ala Gln Ala Val Pro Ala Pro Val
85 90 95
acg ccc gag gcg gac gtc ggt acg cgg tgg gag ccg gag ttc gac atg 336
Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp Met
100 105 110
ctg ccc ggc ata ccc gac ctg cgg gcc ttt ccc cgc gga cgg tgg gcg 384
Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp Ala
115 120 125
gac gcg gtg cgg gag gcc acc ggc gca ctg acc tgg ggc gag ctc ggc 432
Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu Gly
130 135 140
tac ccc gat ccg gcc ggt ctc gcc cgg ctc cgg cag cgg ctc gcg gcc 480
Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala Ala
145 150 155 160
tac ctc gtg cgg gga cgc ggc gcg tcg ctg gaa gcc cgg cag ctc gtc 528
Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu Val
165 170 175
gtc tgc gcg ggc acg ctg gac gcg gtg cgc agg ctg tgc cgg gtc ctg 576
Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val Leu
180 185 190
cgg acc gag ggc cac acc cac atg gcc ctg gag gac cct ggc tgg tcg 624
Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp Ser
195 200 205
cgg ctg agc gcc acg gtc ggg gcg gag ggg ctg gtg ccc gtc ccg gtt 672
Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro Val
210 215 220
ccc gtg gac ggc gac ggc ctg cgg gtc gac ctg ctg cgg cgc gcg cct 720
Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala Pro
225 230 235 240
cag gtc cgg tcg gtg atc gtc gct ccc gcc cac cag ttc ccg acc ggt 768
Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr Gly
245 250 255
gtg gtc ctc gcc ccg gcc cgt cgc ggc gag ctg gtc gcc tgg gcc cgc 816
Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala Arg
260 265 270
gag gtc gac ggc ctg gtg ctg gag gac gac tac gac gcc gag ttc cga 864
Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe Arg
275 280 285
tac gac cgc cac ccc gtg ggc gcc ctg cag ggc atg gca ccg gag cac 912
Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu His
290 295 300
gtc gcg ctg ctg ggg tcg gtc agc aag acg ctc tcg ccg gcc ctg cgg 960
Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu Arg
305 310 315 320
atc ggc tgg gcg gtg acc ccg ccg cgc tgg acc gag gcc ctg ggc gcg 1008
Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly Ala
325 330 335
gag cac gtc ggg ggc gta cca ccg ccc gtc atc gac cag gag gcg ttc 1056
Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala Phe
340 345 350
gcc cgg ttc ctg gcc cgc ggg tcc tac gac cgg tac ctg cgg gcg gca 1104
Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala Ala
355 360 365
cgg ctg cgc tac aaa cgg cgc cgc gat cac ctc atg gga gaa ctc gcg 1152
Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu Ala
370 375 380
gcg tcg ctg ccg ggg ttc cag gtg tcc ggt gcg gcg gcc ggc ttc cac 1200
Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe His
385 390 395 400
ctg ctg ctg tcc ctg acg gac tgc tcg gcg ccc acc gtc gtc agg gag 1248
Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg Glu
405 410 415
gcg gcg cgg cgt gac gtg agg ctg gcg gat ctc gac gcc tac cgg atg 1296
Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg Met
420 425 430
gcg cgg gcc gag cac cac ccg acg gcc cgg gcc ggc gac tcc ggc ggg 1344
Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly Gly
435 440 445
gcg cgg gcc gtg gcc gcc gcc ggc ccc gcg ctg gtc ctc ggc tac ggc 1392
Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr Gly
450 455 460
aat ctg gcg gac cac gcc gtg ccc gga gcc gtg cgg cgc ctg gca cag 1440
Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala Gln
465 470 475 480
gcc atc gac gcg gcc cgg cgc cac gac cgg cgg cac gtc gac gcc ggg 1488
Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala Gly
485 490 495
cgg gcc ggg gag cgg gcc gac tga 1512
Arg Ala Gly Glu Arg Ala Asp
500
<210> 146
<211> 503
<212> PRT
<213> Streptomyces ambofaciens
<400> 146
Val Gly Asp Asp Arg Thr Asp Pro Ala Trp Gly Thr Phe Leu Glu Leu
1 5 10 15
Gly Gly Pro Ala Asp Gly Pro Leu His Val Arg Leu Ser Arg Ala Leu
20 25 30
Arg Ala Ala Val Thr Gly Gly Arg Ile Ala Ser Gly Ser Ala Leu Pro
35 40 45
Pro Ser Arg Ala Leu Ala Ala Asp Leu Gly Cys Ser Arg Trp Val Val
50 55 60
Thr Glu Ala Tyr Ala Gln Leu Val Ala Glu Gly Tyr Leu Glu Ala Arg
65 70 75 80
Ser Gly Ser Ala Thr Arg Val Arg Ala Gln Ala Val Pro Ala Pro Val
85 90 95
Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp Met
100 105 110
Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp Ala
115 120 125
Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu Gly
130 135 140
Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala Ala
145 150 155 160
Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu Val
165 170 175
Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val Leu
180 185 190
Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp Ser
195 200 205
Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro Val
210 215 220
Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala Pro
225 230 235 240
Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr Gly
245 250 255
Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala Arg
260 265 270
Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe Arg
275 280 285
Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu His
290 295 300
Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu Arg
305 310 315 320
Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly Ala
325 330 335
Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala Phe
340 345 350
Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala Ala
355 360 365
Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu Ala
370 375 380
Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe His
385 390 395 400
Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg Glu
405 410 415
Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg Met
420 425 430
Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly Gly
435 440 445
Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr Gly
450 455 460
Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala Gln
465 470 475 480
Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala Gly
485 490 495
Arg Ala Gly Glu Arg Ala Asp
500
<210> 147
<211> 276
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(276)
<400> 147
gtg gcg gag acg gac cgg cat ctc gac cag cgg ctg gag cag gcc atc 48
Val Ala Glu Thr Asp Arg His Leu Asp Gln Arg Leu Glu Gln Ala Ile
1 5 10 15
atg gac ctg ctg gag cga cgg gcg gcc act gcc tcg atc tgt ccg tcc 96
Met Asp Leu Leu Glu Arg Arg Ala Ala Thr Ala Ser Ile Cys Pro Ser
20 25 30
gac gcc gcg cgt cgg gtc cac gag ggt gac gac gag ggc tgg cga gcc 144
Asp Ala Ala Arg Arg Val His Glu Gly Asp Asp Glu Gly Trp Arg Ala
35 40 45
ctg ctg gaa ccc gcg cgc cga gcg gcc tgg cgt ctg gtg ggg tcc ggc 192
Leu Leu Glu Pro Ala Arg Arg Ala Ala Trp Arg Leu Val Gly Ser Gly
50 55 60
gag gtc gag gtg acc cag gcc ggc cgg ccc gtc acg cag gcc gag gcc 240
Glu Val Glu Val Thr Gln Ala Gly Arg Pro Val Thr Gln Ala Glu Ala
65 70 75 80
cgc ggg ccc gtc cgc att cgt cgg gcg ggt tcc tga 276
Arg Gly Pro Val Arg Ile Arg Arg Ala Gly Ser
85 90
<210> 148
<211> 91
<212> PRT
<213> Streptomyces ambofaciens
<400> 148
Val Ala Glu Thr Asp Arg His Leu Asp Gln Arg Leu Glu Gln Ala Ile
1 5 10 15
Met Asp Leu Leu Glu Arg Arg Ala Ala Thr Ala Ser Ile Cys Pro Ser
20 25 30
Asp Ala Ala Arg Arg Val His Glu Gly Asp Asp Glu Gly Trp Arg Ala
35 40 45
Leu Leu Glu Pro Ala Arg Arg Ala Ala Trp Arg Leu Val Gly Ser Gly
50 55 60
Glu Val Glu Val Thr Gln Ala Gly Arg Pro Val Thr Gln Ala Glu Ala
65 70 75 80
Arg Gly Pro Val Arg Ile Arg Arg Ala Gly Ser
85 90
<210> 149
<211> 1236
<212> DNA
<213> Streptomyces ambofaciens
<220>
<221> CDS
<222> (1)..(1236)
<400> 149
ctg cag ata tac gac tgc tgg ggc ggg agc aat cag cag tgg acg ttg 48
Leu Gln Ile Tyr Asp Cys Trp Gly Gly Ser Asn Gln Gln Trp Thr Leu
1 5 10 15
acg gac gac cgt cgg ctg acc gtg tac ggc aac aag tgc ctg gac gtt 96
Thr Asp Asp Arg Arg Leu Thr Val Tyr Gly Asn Lys Cys Leu Asp Val
20 25 30
ccg ggt cac gcc acc aca ccc ggg acg cgg gtg cag atc tgg agc tgt 144
Pro Gly His Ala Thr Thr Pro Gly Thr Arg Val Gln Ile Trp Ser Cys
35 40 45
tcc ggc ggt gcg aac cag cag tgg cgg gtg aac tcc gac ggc acg gtc 192
Ser Gly Gly Ala Asn Gln Gln Trp Arg Val Asn Ser Asp Gly Thr Val
50 55 60
gtc ggc gtg gag tcc ggg ctg tgc ctg gag gcc gcg ggc gcc ggt acg 240
Val Gly Val Glu Ser Gly Leu Cys Leu Glu Ala Ala Gly Ala Gly Thr
65 70 75 80
gcc aac ggc acg gcg gtg cag atc ggg acg tgc gtc ggt ggc agc ggg 288
Ala Asn Gly Thr Ala Val Gln Ile Gly Thr Cys Val Gly Gly Ser Gly
85 90 95
cag aag tgg tcc ggc ctg acc ggg acg ccc ccg acg gac ggg gcg tgt 336
Gln Lys Trp Ser Gly Leu Thr Gly Thr Pro Pro Thr Asp Gly Ala Cys
100 105 110
gcc ctt ccg tcg gcg tac cgg tgg tcg tcg acg ggt gtg ctg gcg cag 384
Ala Leu Pro Ser Ala Tyr Arg Trp Ser Ser Thr Gly Val Leu Ala Gln
115 120 125
ccg gcg aac ggg tgg gcg gcg gtc aag gac ttc acc acc gtg acc cac 432
Pro Ala Asn Gly Trp Ala Ala Val Lys Asp Phe Thr Thr Val Thr His
130 135 140
aac ggc aag cac ctg gtc tac gcg tcg aac gtg tcg ggg tcg tcc tac 480
Asn Gly Lys His Leu Val Tyr Ala Ser Asn Val Ser Gly Ser Ser Tyr
145 150 155 160
ggc tcg atg atg ttc agc ccc ttc acg aac tgg tcg gac atg gcg tcg 528
Gly Ser Met Met Phe Ser Pro Phe Thr Asn Trp Ser Asp Met Ala Ser
165 170 175
gcc ggc cag acc ggg atg agt cag gcg gcg gtg gcg ccc acc ctg ttc 576
Ala Gly Gln Thr Gly Met Ser Gln Ala Ala Val Ala Pro Thr Leu Phe
180 185 190
tac ttc gcg ccc aag aac gtc tgg gtg ctg gcg tac cag tgg ggc gcg 624
Tyr Phe Ala Pro Lys Asn Val Trp Val Leu Ala Tyr Gln Trp Gly Ala
195 200 205
tgg ccc ttc gtc tac cgc acg tcc agc gac ccg gcc aac ccc aac ggc 672
Trp Pro Phe Val Tyr Arg Thr Ser Ser Asp Pro Ala Asn Pro Asn Gly
210 215 220
tgg tcg gct ccg cag ccg ttg ttc acc ggg agc atc tca gga tcc gac 720
Trp Ser Ala Pro Gln Pro Leu Phe Thr Gly Ser Ile Ser Gly Ser Asp
225 230 235 240
acc ggc ccg atc gac cag acc ctg atc gcc gac gga cag aac atg tac 768
Thr Gly Pro Ile Asp Gln Thr Leu Ile Ala Asp Gly Gln Asn Met Tyr
245 250 255
ctg ttc ttc gcc ggt gac aac ggc aag atc tac cgg gcg agc atg ccg 816
Leu Phe Phe Ala Gly Asp Asn Gly Lys Ile Tyr Arg Ala Ser Met Pro
260 265 270
atc ggg aac ttc ccg ggc agc ttc ggc tcg tcg tac acg acg atc atg 864
Ile Gly Asn Phe Pro Gly Ser Phe Gly Ser Ser Tyr Thr Thr Ile Met
275 280 285
agc gac acg aag gcc aac ctg ttc gag ggc gtg cag gtc tac aag gtt 912
Ser Asp Thr Lys Ala Asn Leu Phe Glu Gly Val Gln Val Tyr Lys Val
290 295 300
cag ggc cag aac cag tac ctg atg atc gtc gag gcg atg ggc gcg aac 960
Gln Gly Gln Asn Gln Tyr Leu Met Ile Val Glu Ala Met Gly Ala Asn
305 310 315 320
gga cgc tac ttc cgt tcc ttc acg gcc tcc agc ctg agc ggc tcg tgg 1008
Gly Arg Tyr Phe Arg Ser Phe Thr Ala Ser Ser Leu Ser Gly Ser Trp
325 330 335
acc ccg cag gcc gcg agc gag agc aac ccc ttc gcg ggc aag gcc aac 1056
Thr Pro Gln Ala Ala Ser Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn
340 345 350
agc ggg gcc acc tgg acc aac gac atc agc cac ggt gac ctg gtc cgc 1104
Ser Gly Ala Thr Trp Thr Asn Asp Ile Ser His Gly Asp Leu Val Arg
355 360 365
gac aac ccc gac cag acc atg acc gtc gac ccc tgc aac ctg cgg ttc 1152
Asp Asn Pro Asp Gln Thr Met Thr Val Asp Pro Cys Asn Leu Arg Phe
370 375 380
ctc tac cag ggc aag tca ccc acc gcg ggc ggc ccc tac gac cag ctg 1200
Leu Tyr Gln Gly Lys Ser Pro Thr Ala Gly Gly Pro Tyr Asp Gln Leu
385 390 395 400
ccg tgg cgg ccg ggt gtg ctc acc ctg cgg cgc tga 1236
Pro Trp Arg Pro Gly Val Leu Thr Leu Arg Arg
405 410
<210> 150
<211> 411
<212> PRT
<213> Streptomyces ambofaciens
<400> 150
Leu Gln Ile Tyr Asp Cys Trp Gly Gly Ser Asn Gln Gln Trp Thr Leu
1 5 10 15
Thr Asp Asp Arg Arg Leu Thr Val Tyr Gly Asn Lys Cys Leu Asp Val
20 25 30
Pro Gly His Ala Thr Thr Pro Gly Thr Arg Val Gln Ile Trp Ser Cys
35 40 45
Ser Gly Gly Ala Asn Gln Gln Trp Arg Val Asn Ser Asp Gly Thr Val
50 55 60
Val Gly Val Glu Ser Gly Leu Cys Leu Glu Ala Ala Gly Ala Gly Thr
65 70 75 80
Ala Asn Gly Thr Ala Val Gln Ile Gly Thr Cys Val Gly Gly Ser Gly
85 90 95
Gln Lys Trp Ser Gly Leu Thr Gly Thr Pro Pro Thr Asp Gly Ala Cys
100 105 110
Ala Leu Pro Ser Ala Tyr Arg Trp Ser Ser Thr Gly Val Leu Ala Gln
115 120 125
Pro Ala Asn Gly Trp Ala Ala Val Lys Asp Phe Thr Thr Val Thr His
130 135 140
Asn Gly Lys His Leu Val Tyr Ala Ser Asn Val Ser Gly Ser Ser Tyr
145 150 155 160
Gly Ser Met Met Phe Ser Pro Phe Thr Asn Trp Ser Asp Met Ala Ser
165 170 175
Ala Gly Gln Thr Gly Met Ser Gln Ala Ala Val Ala Pro Thr Leu Phe
180 185 190
Tyr Phe Ala Pro Lys Asn Val Trp Val Leu Ala Tyr Gln Trp Gly Ala
195 200 205
Trp Pro Phe Val Tyr Arg Thr Ser Ser Asp Pro Ala Asn Pro Asn Gly
210 215 220
Trp Ser Ala Pro Gln Pro Leu Phe Thr Gly Ser Ile Ser Gly Ser Asp
225 230 235 240
Thr Gly Pro Ile Asp Gln Thr Leu Ile Ala Asp Gly Gln Asn Met Tyr
245 250 255
Leu Phe Phe Ala Gly Asp Asn Gly Lys Ile Tyr Arg Ala Ser Met Pro
260 265 270
Ile Gly Asn Phe Pro Gly Ser Phe Gly Ser Ser Tyr Thr Thr Ile Met
275 280 285
Ser Asp Thr Lys Ala Asn Leu Phe Glu Gly Val Gln Val Tyr Lys Val
290 295 300
Gln Gly Gln Asn Gln Tyr Leu Met Ile Val Glu Ala Met Gly Ala Asn
305 310 315 320
Gly Arg Tyr Phe Arg Ser Phe Thr Ala Ser Ser Leu Ser Gly Ser Trp
325 330 335
Thr Pro Gln Ala Ala Ser Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn
340 345 350
Ser Gly Ala Thr Trp Thr Asn Asp Ile Ser His Gly Asp Leu Val Arg
355 360 365
Asp Asn Pro Asp Gln Thr Met Thr Val Asp Pro Cys Asn Leu Arg Phe
370 375 380
Leu Tyr Gln Gly Lys Ser Pro Thr Ala Gly Gly Pro Tyr Asp Gln Leu
385 390 395 400
Pro Trp Arg Pro Gly Val Leu Thr Leu Arg Arg
405 410
<210> 151
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF36
<400> 151
ttgccgtagc cgaggaccag cg 22
<210> 152
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF37
<400> 152
cacatggccc tggaggaccc tg 22
<210> 153
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF42
<400> 153
aagcttgtac ggcccacaga atgatgtcac 30
<210> 154
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF43
<400> 154
aagcttcgac taccttggtg atctcgcctt 30
<210> 155
<211> 65
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF32
<400> 155
caaccgcttg agctgctcca tcaactgctg ggccgaggta tcgcgcgcgc ttcgttcggg 60
acgaa 65
<210> 156
<211> 65
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF33
<400> 156
tgggtcccgc cgcgcggcac gacttcgact cgctcgtcta tctgcctctt cgtcccgaag 60
caact 65
<210> 157
<211> 65
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR71
<400> 157
cgtcatcgac gtgcggggaa gacagaggtg ataccgatga tcgcgcgcgc ttcgttcggg 60
acgaa 65
<210> 158
<211> 65
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide EDR72
<400> 158
gccagcacct cgtccagctg ctcgacggaa ctcaccccca tctgcctctt cgtcccgaag 60
caact 65
<210> 159
<211> 66
<212> DNA
<213> Artificial sequence
<220>
<223> Artificial sequence description:
Oligonucleotide KF52
<400> 159
gatccgccag cctcacgtca cgccgcgccg cctccctgac atcgcgcgcg cttcgttcgg 60
gacgaa 66
<210> 160
<211> 66
<212> DNA
<213> Artificial sequnce
<220>
<223> Artificial sequence description:
Oligonucleotide KF53
<400> 160
gaggcggacg tcggtacgcg gtgggagccg gagttcgaca atctgcctct tcgtcccgaa 60
gcaact 66
<210> 161
<211> 2540
<212> DNA
<213> Streptomyces ambofaciens
<400> 161
ctgcagggcg cccacggggt ggcggtcgta tcggaactcg gcgtcgtagt cgtcctccag 60
caccaggccg tcgacctcgc gggcccaggc gaccagctcg ccgcgacggg ccggggcgag 120
gaccacaccg gtcgggaact ggtgggcggg agcgacgatc accgaccgga cctgaggcgc 180
gcgccgcagc aggtcgaccc gcaggccgtc gccgtccacg ggaaccggga cgggcaccag 240
cccctccgcc ccgaccgtgg cgctcagccg cgaccagcca gggtcctcca gggccatgtg 300
ggtgtggccc tcggtccgca ggacccggca cagcctgcgc accgcgtcca gcgtgcccgc 360
gcagacgacg agctgccggg cttccagcga cgcgccgcgt ccccgcacga ggtaggccgc 420
gagccgctgc cggagccggg cgagaccggc cggatcgggg tagccgagct cgccccaggt 480
cagtgcgccg gtggcctccc gcaccgcgtc cgcccaccgt ccgcggggaa aggcccgcag 540
gtcgggtatg ccgggcagca tgtcgaactc cggctcccac cgcgtaccga cgtccgcctc 600
gggcgtcacc ggagcgggga cggcctgcgc cctgacccgg gtggccgagc cgctgcgcgc 660
ctccaggtac ccctccgcga cgagctgcgc gtaggcctcc gtcaccaccc accgcgagca 720
gcccaggtcc gccgccagcg ccctgctcgg cggcagcgcg ctgccggagg cgatccgccc 780
accggtcacc gccgcccgca gggcacggct cagccggacg tgcagcgggc cgtccgccgg 840
cccgcccagt tcgagaaagg ttccccatgc cgggtcggtc cggtcgtcgc ccacggcagc 900
cgatgctacc caccgccccg cgacggccgg gcggcggcgt ccacgggccc ggtgcacact 960
ggatggcgtg gcggagacgg accggcatct cgaccagcgg ctggagcagg ccatcatgga 1020
cctgctggag cgacgggcgg ccactgcctc gatctgtccg tccgacgccg cgcgtcgggt 1080
ccacgagggt gacgacgagg gctggcgagc cctgctggaa cccgcgcgcc gagcggcctg 1140
gcgtctggtg gggtccggcg aggtcgaggt gacccaggcc ggccggcccg tcacgcaggc 1200
cgaggcccgc gggcccgtcc gcattcgtcg ggcgggttcc tgacggctcg atccgaaggc 1260
ggaactcccg tgccccggcg gcacgggagc tcgacgccgg gaggtcagcg ccgcagggtg 1320
agcacacccg gccgccacgg cagctggtcg taggggccgc ccgcggtggg tgacttgccc 1380
tggtagagga accgcaggtt gcaggggtcg acggtcatgg tctggtcggg gttgtcgcgg 1440
accaggtcac cgtggctgat gtcgttggtc caggtggccc cgctgttggc cttgcccgcg 1500
aaggggttgc tctcgctcgc ggcctgcggg gtccacgagc cgctcaggct ggaggccgtg 1560
aaggaacgga agtagcgtcc gttcgcgccc atcgcctcga cgatcatcag gtactggttc 1620
tggccctgaa ccttgtagac ctgcacgccc tcgaacaggt tggccttcgt gtcgctcatg 1680
atcgtcgtgt acgacgagcc gaagctgccc gggaagttcc cgatcggcat gctcgcccgg 1740
tagatcttgc cgttgtcacc ggcgaagaac aggtacatgt tctgtccgtc ggcgatcagg 1800
gtctggtcga tcgggccggt gtcggatcct gagatgctcc cggtgaacaa cggctgcgga 1860
gccgaccagc cgttggggtt ggccgggtcg ctggacgtgc ggtagacgaa gggccacgcg 1920
ccccactggt acgccagcac ccagacgttc ttgggcgcga agtagaacag ggtgggcgcc 1980
accgccgcct gactcatccc ggtctggccg gccgacgcca tgtccgacca gttcgtgaag 2040
gggctgaaca tcatcgagcc gtaggacgac cccgacacgt tcgacgcgta gaccaggtgc 2100
ttgccgttgt gggtcacggt ggtgaagtcc ttgaccgccg cccacccgtt cgccggctgc 2160
gccagcacac ccgtcgacga ccaccggtac gccgacggaa gggcacacgc cccgtccgtc 2220
gggggcgtcc cggtcaggcc ggaccacttc tgcccgctgc caccgacgca cgtcccgatc 2280
tgcaccgccg tgccgttggc cgtaccggcg cccgcggcct ccaggcacag cccggactcc 2340
acgccgacga ccgtgccgtc ggagttcacc cgccactgct ggttcgcacc gccggaacag 2400
ctccagatct gcacccgcgt cccgggtgtg gtggcgtgac ccggaacgtc caggcacttg 2460
ttgccgtaca cggtcagccg acggtcgtcc gtcaacgtcc actgctgatt gctcccgccc 2520
cagcagtcgt atatctgcag 2540