KR20100039443A - 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 - Google Patents

답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 Download PDF

Info

Publication number
KR20100039443A
KR20100039443A KR1020107004815A KR20107004815A KR20100039443A KR 20100039443 A KR20100039443 A KR 20100039443A KR 1020107004815 A KR1020107004815 A KR 1020107004815A KR 20107004815 A KR20107004815 A KR 20107004815A KR 20100039443 A KR20100039443 A KR 20100039443A
Authority
KR
South Korea
Prior art keywords
nucleic acid
daptomycin
polypeptide
thioesterase
sequence
Prior art date
Application number
KR1020107004815A
Other languages
English (en)
Inventor
비비안 팩 운 미아오
폴 브라이언
리처드 에이취 볼츠
마리 프랑스와 꼬페-레갈
Original Assignee
큐비스트 파마슈티컬즈 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US2001/032354 external-priority patent/WO2002059322A2/en
Application filed by 큐비스트 파마슈티컬즈 인코포레이티드 filed Critical 큐비스트 파마슈티컬즈 인코포레이티드
Publication of KR20100039443A publication Critical patent/KR20100039443A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes

Abstract

본 발명은 답토마이신 생합성 유전자의 전부 또는 일부를 포함하는 핵산 분자를 제공한다. 답토마이신 생합성 유전자 클러스터는 스트렙토마이세스, 바람직하게는 에스. 로제오스포루스로부터 유래될 수 있다. 본 발명은 또한 에스. 로제오스포루스로부터의 다른 핵산 분자를 제공한다. 본 발명은 추가로 상기 핵산 분자들에 의해 코딩되는 폴리펩티드, 이 폴리펩티드에 특이적으로 결합하는 항체, 및 상기 핵산 분자, 폴리펩티드 및 항체를 이용하여 답토마이신 및 다른 화합물을 제조하는 방법을 제공한다.

Description

답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법{COMPOSITIONS AND METHODS RELATING TO THE DAPTOMYCIN BIOSYNTHETIC GENE CLUSTER}
본 발명은 답토마이신 생합성 유전자 클러스터, 바람직하게는 에스. 로제오스포루스로부터의 답토마이신 생합성 유전자 클러스터의 전부 또는 일부를 포함하는 핵산 분자와 관련된 것이다.
방선균을 포함한 박테리아 및 진균류는 다양한 저분자량 펩티드와 폴리케티드 화합물(대략 2-48 잔기의 길이)을 합성한다. 이들 화합물의 생합성은 비리보솜 펩티드 신세타제(synthetase)(NRPSs)에 의해, 그리고 폴리케티드 신타제(synthase)(PKs)에 의해 촉매된다. 유전자 코드에 따른 리보솜-매개 RNA 번역에 관련되지 않는 NRPS 과정은, 리보솜에 의해 RNA 주형으로부터 번역되는 펩티드에 비해 방대한 구조적 다양성을 나타내는 펩티드를 생산할 수 있다. 이들은 D- 및 L- 아미노산과 하이드록시산의 통합, 선형, 고리형 또는 분지쇄 고리 구조를 형성하는 펩티드 주쇄내의 변이, 및 산화, 아실화, 글리코실화, N-메틸화 및 헤테로사이클형 고리 형성을 포함한 부가의 구조적 변형을 포함한다. 많은 비리보솜 합성 펩티드는 유용한 약리학적(예, 항생제, 항바이러스, 항진균, 항기생충, 사이드로포어(siderophore), 세포증식억제, 면역억제, 항콜레스테롤 및 항암), 농화학적 또는 물리화학적(예, 생계면활성제) 특성을 갖는 것으로 확인되었다.
비리보솜 합성 펩티드는 하나 이상의 서브유닛을 포함하는 커다란(예, 약 200-2000 kDa) 다기능성 NRPS 효소 복합체에 의해 조립된다. 그 예는 답토마이신, 반코마이신, 에치노칸딘 및 사이클로스포린을 포함한다. 유사하게, 폴리케티드는 하나 이상의 서브유닛을 포함하는 커다란 다기능성 PKS 효소 복합체에 의해 조립된다. 그 예는 에리스로마이신, 티로신, 모넨신 및 아베르멕틴을 포함한다. 일부 경우에는, 혼합된 PKS/NRPS 시스템에 의해 복합체 분자들이 합성될 수 있다. 그 예는 라파마이신, 블레오마이신 및 에포티론을 포함한다.
NRPS는 일반적으로 NRPS 복합체를 구성하는 하나 이상의 오픈 리딩 프레임으로 이루어진다. NRPS 복합체는, 특정 빌딩 블록 기질에 결합하여 이를 활성화시키고 펩티드 쇄 형성과 연장을 촉매하도록 배열된 단백질 생합성 단위 시리즈를 포함하며 단백질 주형으로 작용한다.(참고: Konz and Marahiel, Chem.Biol.,6,pp.39-48(1999) 및 이 문헌에 인용된 문헌; vonDohern et al., Chem. Biol., 6, pp. 273-279(1999) 및 이 문헌에 인용된 문헌; 및 Cane and Walsh, Chem.Biol., 6, pp.319-325,(1999) 및 이 문헌에 인용된 문헌 - 이들 각각은 그 모두가 본원에 참고로 통합됨). 각 NRPS 또는 NRPS 서브유닛은 하나 이상의 모듈을 포함한다. "모듈"은 하나의 빌딩 블록(예, 하나의 아미노산)을 성장하는 펩티드 쇄에 통합시키는 촉매 단위로 정의된다. NRPS 단백질 주형을 형성하는 생합성 모듈의 순서 및 특이성은 최종적인 펩티드 생성물의 서열과 구조를 지배한다.
NRPS의 각 모듈은 펩티드 쇄 연장에 필요한 특이적 반응을 촉매하는 분별된, 접힌 단백질 도메인을 함유하는 반자치성 활성 부위로 작용한다. (단일 모듈 복합체내의) 최소 모듈은 적어도 두 개의 핵심 도메인인 1) 아미노산(또는 때로는 하이드록시산)을 활성화시키는 아데닐화 도메인, 및 2) 활성화된 중간체를 효소-결합된 판테테인 보조인자로 전달하는 티올화 또는 아실 운반체 도메인으로 이루어진다. 대부분의 모듈은 또한 3) 활성화된 중간체간의 펩티드 결합 형성을 촉매하는 축합 도메인을 함유한다. 도 9 참고. 이들 세 개의 핵심 도메인을 보충하는 것은 예를 들어, 결합된 아미노산 중간체의 N-메틸화(M 또는 메틸화 도메인)와 L-에서 D-로의 전환(E 또는 에피머화 도메인), 및 헤테로사이클 고리 형성(Cy 또는 고리화 도메인)을 매개할 수 있는 다양한 수의 부가 도메인이다. 이 도메인들은 일반적으로 특이적인 아미노산 모티프 또는 특징에 의해 특징지어진다. NRPS와 혼합 NRPS/PKS 효소 복합체에 의해 조립된 성숙한 펩티드 생성물의 방대한 구조적 및 기능적 다양성에 기여하는 것은 근처 모듈들내에 묶여진(tethered) 중간체에 국소적으로 작용하는 그러한 부가 도메인들의 조합이다.
각 최소 모듈의 아데닐화 도메인은 동족 아미노산의 특이적 인식과 활성화를 촉매한다. 비리보솜 펩티드 생합성의 이 초기 단계에서, 각 NRPS 모듈의 동족 아미노산은 아데닐화 도메인에 결합되고 불안정한 아실 아데닐레이트로서 활성화된다(수반되는 ATP 가수분해와 함께). (참고: 예, Stachelhaus et al.,Chem., Biol. 6:493-505(1999)와 Challis et al., Chem.Biol. 7:211-224(2000), 각각 본원에 참고로 통합됨). 대부분의 NRPS 모듈에서, 아실 아데닐레이트 중간체는 이어서 모듈의 T(티올화) 도메인(또한 펩티딜 운반체 단백질 또는 PCP 도메인으로 칭함)으로 옮겨지며, 여기서 티오에스테르 중간체로 전환되고 트랜스티올화 반응을 통해 공유적으로 결합된 효소 보조인자에 묶인다(4‘-포스포판테테이닐(4’-PP) 중간체). D-배열된 또는 N-메틸화된 아미노산을 통합시키는 모듈은 여분의 변형 도메인을 보유할 수 있으며, 이들은 몇몇 연구된 NRPS에서는 A 도메인과 T 도메인 사이에 위치한다.
각 모듈의 효소-결합된 중간체는 이어서 단계적인 축합 반응에 의해 펩티드 생성물로 조립되는데, 이들 축합 반응은 한 모듈의 한 잔기의 티오에스테르-활성화된 카르복실기를 예를 들어 다음 모듈내의 다음 아미노산의 이웃 아미노기로 이전시키는 것에 관련되며, 이때 중간체는 NRPS에 공유적으로 연결된 채로 유지된다. 각 축합 반응은 일반적으로 두 개의 최소 모듈 사이에 위치한 축합 (C) 도메인에 의해 촉매된다. NRPS내의 축합 도메인의 수는 일반적으로 최종 (선형) 펩티드 내에 존재하는 펩티드 결합의 수에 상응한다. 여분의 C 도메인은 몇몇 NRPS에서(예를 들어, 사이클로스포린 합성 효소의 아미노 말단과 라파마이신의 카르복실 말단에서; 참고: 예를 들어 Konz and Marahiel, 상기 문헌) 발견되어 펩티드 쇄 종결과 고리화 반응에 관련되는 것으로 제안되었다. 하지만, 많은 기타 NRPS 복합체는 C-말단 티오에스테라제(Te) 도메인(약 28-35K 상대 분자량)에 의해 촉매되는 반응에서 전길이 쇄를 방출한다.
대부분의 NRPS 복합체의 티오에스테라제 도메인은 촉매적 트리아드(잘 알려진 키모트립신 기작과 유사함)를 이용하며, 이는 히스티딘과 산성 잔기에 대해 보존된 삼차원 배열의 보존된 세린(가끔씩은 시스테인 또는 아스파테이트) 잔기를 포함한다. 예를 들어, 각각 참고로 본원에 통합되는 V.De Crecy Lagard in Comprehensive Natural Products Chemistry, Volume 4, ed. J.W.Kelly(New York:Elsevier), 1999, pp. 221-238 참고. 티오에스테르 절단은 2 단계 과정이다. 첫 번째(아실화) 단계에서는, 전길이 펩티드 쇄가 티올화 도메인내의 티올 결합된 효소 중간체로부터(상기 참고) Te 도메인내의 보존된 세린 잔기로 옮겨져, 아실-O-Te 에스테르 중간체를 형성한다. 두 번째(탈아실화) 단계에서는, 에스테르 중간체가 물에 의해(가수분해) 공격되는지 또는 활성화된 분자내 친핵체에 의해(고리화) 공격되는 지에 따라, Te 도메인 세린 에스테르 중간체가 가수분해되거나(그래서 선형의 전길이 생성물을 방출함), 또는 고리화를 일으킨다.
NRPS 수퍼패밀리의 다양한 일원으로부터의 C-말단 티오에스테라제 도메인의 서열 비교에 의해, 세린 촉매 잔기를 포함하는 보존된 모티프(GXSXG 모티프)가 밝혀졌으며, 이는 종종 보존된 세린 잔기로부터 약 25 아미노산 하부의 아스파르트산 잔기가 뒤따른다. 두 번째 유형의 티오에스테라제, 유리(free) 티오에스테라제 효소는 일부 펩티드와 폴리케티드 이차 대사물의 생합성에 참여하는 것으로 알려져 있다. 예를 들어 각각 참고로 본원에 통합되는 Schneider and Marahiel, Arch.Microbiol. 169,pp.404-410(1998), 및 Butler et al., Chem.Biol.,6,pp.87-292(1999) 참고. 이들 티오에스테라제는 종종 효율적인 천연 생성물 합성에 필요하다. Butler et al.은 효율적인 티로신 생성에 요구되는 폴리케티드 티로신 유전자 클러스터에서 발견된 유리 티오에스테라제가 편집과 교정 기능에 관여할 수도 있다는 가설을 세웠다.
NRPS 다효소 복합체의 모듈 조직화는 이 모듈들을 코딩하는 게놈 DNA의 수준에서 보여진다. 몇몇 다른 NRPS들을 코딩하는 유전자의 조직과 DNA 서열이 연구되어 왔다(예를 들어, 본원에 참고로 통합되는 Marahiel, Chem.Biol., 4, pp.561-567(1997) 참고). 많은 다양한 유기체에서 유래한 NRPS 서열을 비교함으로써 특정 NRPS 기능성 도메인을 특징짓는 보존된 서열이 동정되었으며, 이들 보존된 서열 모티프는 새로운 NRPS 유전자와 모듈을 동정하고 분리하는 데 유용한 프로브를 고안하는 데 이용되어 왔다.
유전 공학과 생체내 재조합에 의해 DNA 수준에서 모듈의 수와 위치를 변화시킴으로써 새로운 특이성을 갖는 새로운 효소를 설계하기 위해 PKS와 NRPS 효소 복합체의 모듈 구조를 이용할 수 있다. 기능성 하이브리드 NRPS는 예를 들어 전체 모듈 융합에 기초하여 구성될 수 있다. 예를 들어 본원에 참고로 통합되는 Gokhale et al., Science, 284, pp. 482-485(1999); Mootz et al., Proc.Natl.Acad.Sci.USA 97,pp.5848-5853(2000) 참고. 재조합 기술을 이용하여 이종성 PKS 또는 NRPS 복합체에서 유래한 도메인을 성공적으로 교환할 수도 있다. 예를 들어, 본원에 참고로 통합되는 Schneider et al., Mol.Gen.Genet., 257, pp.308-318(1998); McDaniel et al., Proc.Natl.Acad.Sci. USA., 96, pp. 1846-1851(1999); 미국 특허 제 5,652,116호와 5,795,738호; 및 국제 공개 번호 WO 00/56896호 참고.
아데닐화 도메인의 기질 결합 포켓을 형성하는 잔기를 변화시켜 모듈내에 새로운 기질 특이성을 설계하는 것 또한 개시되어 있다. 예를 들어 참고로 본원에 통합되는 Cane and Walsh, Chem.Biol.,6, 319-325(1999); Stachelihaus et al., Chem.Biol.,6,493-505(1999); 및 WO 00/52152호를 참고. 바실러스 서브틸리스 펩티드 합성 효소 GrsA 아데닐화 도메인(PheA)(그 구조는 공지임)의 서열을 원핵 및 진핵 NRPS로부터의 160개의 다른 아데닐화 도메인의 서열과 비교함으로써, 예를 들어 Stachelhaus et al.,(상기)과 Challis et al., Chem.Biol., 7, pp.211-224(2000)은 다양한 아미노산 기질에 대한 아데닐화 (A) 도메인 싸인 서열(유전자 코드의 코돈에 유사함)을 정의하였다. 이들 싸인 서열의 수집으로부터, 추정적인 NRPS 선택성 부여 코드(유전자 코드처럼 축퇴성을 가짐)를 설립하였다.
모듈을 첨가하거나, 결실시키거나 교환하여 새로운 모듈 주형 구조와 새로운 기질 특이성을 갖는 NRPS를 설계하는 능력은 변화되고 잠재적으로 유익한 특성을 갖는 새로운 펩티드를 생성할 수 있게 한다. 예를 들어 라파마이신 PKS(다른 기질 특이성을 코딩함)로부터의 카운터파트 서열을 치환시킴으로써 에리스로마이신 전구체(DEBS)를 합성하는 PKS를 체계적으로 변형시켜 50개 이상의 새로운 폴리케티드를 포함하는 조합 라이브러리를 제조하였다. 예를 들어 참고로 본원에 통합되는 WO00/63361과 McDaniel et al.,(1999), 상기 참고.
항생제와 기타 잠재적 독성 화합물들을 생산하는 많은 박테리아는 ATP 결합 카세트(ABC) 운반자(transporter)를 합성한다. ABC 운반자는 양자-의존성 경막 전기화학 포텐셜을 이용하여 항생제와 같은 독성 세포 대사물을 내보내고 예를 들어 철 또는 기타 금속과 같은 환경으로부터의 물질을 들여보낸다. 세 가지 유형의 ABC 운반자와 항생제 내성을 나타내는 펌프를 코딩하는 유전자가 있으며, 이들은 종종 항생제 생산자 유기체내의 생합성 집단에 연결되어 있다(예를 들어, 스트렙토마이세스 코엘리컬러에서의 액티노로딘 내성). 예를 들어, 본원에 참고로 통합되는 Mendez et al., FEMS Microbiol. Lett. 158:1-8(1998) 참고. 모두 워커(Walker) A와 B 모티프를 포함하는 ATP-결합 영역을 갖는다. Id. 유형 I 시스템은 친수성 ATP-결합 도메인과 소수성 막통합(intergral membrane) 도메인을 위한 별도의 유전자들에 관련된다. 유형 III 시스템은 소수성 N-말단과 친수성의 ATP-결합 C-말단을 가진 단백질을 코딩하는 단일 유전자에 관련된다. 유형 II 수송자는 소수성 도메인을 갖지 않으며, 두 세트의 워커 모티프를 A:B:A:B의 순서로 갖는다.
스트렙토마이세스 글라우스센스 유전자, StrV(PIR 기탁 번호 S57561)와 StrW(PIR 기탁 번호 S57562)는 스트렙토마이신-관련 화합물들에 대한 내성에 연관된 유형 III 수송자를 코딩한다. 두 유전자들은 5'-하이드록시스트렙토마이신 항생제 생합성 유전자 클러스터내에 있다. 예를 들어, 본원에 참고로 통합되는 Beyer et al., Mol. Gen. Genet. 250:775-84(1996)를 참고. 독소루비신 및 관련 항생제에 대한 내성은 스트렙토마이세스 퓨세티우스내의 두 개의 유형 I 수송자에 의해 부여되며, 이들은 drrA 와 drrB에 의해 코딩된다. 예를 들어, 참고로 본원에 통합되는 Guifoile et al., Proc.Natl.Acad.Sci. USA 88: 8553-57 (1991)을 참고. 또한, 스트렙토마이세스 로체이로부터 분리된 drrAB의 상동체는 에스. 리비단스에서 액티노로딘 PKS 프로모터의 조절하에 발현될 때 다약제 내성을 부여한다. 예를 들어, 본원에 참고로 통합되는 Fernandez-Moreno et al., J.Bacteriol. 179:6929-36(1998) 참고.
답토마이신(Biotechnology of Antibiotics, 2nd Ed., ed. W.R.Strohl(New York: Marcel Dekker, Inc.), 1997, pp.415-435에서 R.H.Baltz에 의해 개시됨)은 NRPS에 의해 만들어진, 비리보솜 합성 펩티드의 예이다. LY146032로도 알려진 답토마이신은 스트렙토마이세스 로제오스포루스(Streptomyces roseosporus)의 발효에 의해 생산되는 고리형 리포펩티드 항생제이다. 답토마이신은 에스. 로제오스포루스의 인자 A-21978C 유형 항생제의 일원이며 3-아미노산 쇄를 통해 고리형 10-아미노산 펩티드의 N-말단 트립토판에 연결된 n-데카노일 측쇄를 포함한다. 이 화합물은 메티실린 내성 스타필로코커스 아우레우스, 반코마이신 내성 장내구균, 글리코펩티드 중간 민감성 스타필로코커스 아우레우스, 코아귤라제-음성 포도알균, 및 페니실린 내성 스트렙토코커스 뉴모니아를 포함하며 이에 한정되지 않는 박테리아에 의해 야기되는 감염과 같이, 치료 조건이 한정되는 심각한 감염을 치료하기 위한 다양한 제제로 개발되고 있다. 예를 들어, Tally et al., Exp. Opin. Invest. Drugs 8:1223-1238, 1999 참고. 그람 양성 박테리아에 대한 답토마이신의 항생제 작용은 이것이 막 전위를 간섭하고 리포테이코산 합성을 억제하는 능력에 기여했다.
답토마이신 NRPS를 포함한, 답토마이신 생합성 경로에 관여하는 단백질을 코딩하는 유전자의 동정은, 개선된 항생제(예를 들어 더 큰 성능을 가짐)를 생산할 수 있거나, 천연의 또는 새로운 항생제를 증가된 양으로 생산할 수 있거나, 또는 유용한 생물학적 특성을 갖는 다른 펩티드 생성물을 생산할 수 있는 다른 숙주 균주 뿐만 아니라 변형된 스트렙토마이세스 로제오스포루스를 생성하는 데 있어서 첫 번째 단계를 제공할 것이다. 분리된 핵산과 분리된 단백질을 포함하여, 스트렙토마이세스 로제오스포루스 답토마이신 생합성 유전자 클러스터에 관련된 조성물과 방법은 2000년 10월 17일에 출원된 미국 가출원 60/240,879호; 2001년 2월 28일에 출원된 60/272,207호; 및 2001년 8월 8일에 출원된 60/310,385호에 개시되어 있으며 이들은 모두 본원에 참고로 통합된다.
더욱이, 스트렙토마이세스 로제오스포루스와 이종성 숙주에서의 발현을 위한 전길이 답토마이신 NRPS 주형을 구성하기 위하여, 스트렙토마이세스 로제오스포루스 답토마이신 생합성 유전자 클러스터의 유전자 및 모듈 조직을 동정하는 것은 유익할 것이다. 특히, 답토마이신 유전자 클러스터가 티오에스테라제(Te) 도메인을 포함하는지 여부를 아는 것은 유익할 것이다. 만일 포함한다면, Te 도메인은 분리되어 융합 펩티드로서 또는 유리 펩티드로서 발현되어 새로운 NRPS 모듈과 주형에서 펩티드 쇄 종결을 촉매하기 위해 이용될 수 있을 것이다. 예를 들어, de Ferra et al., J.Biol.Chem., 272, pp.25304-25309(1997); Guenzi et al., J.Biol.Chem., 273, pp.14403-14410(1998); 및 Trauger et al., Nature, 407, pp. 215-218(2000)을 참고하며 이들은 모두 참고로 본원에 통합된다. 답토마이신 생합성에 관련된 폴리펩티드를 코딩하는 다른 핵산 분자들을 동정하는 것 또한 유익할 것이다. 이들은 제한없이, 답토마이신의 펩티드 도메인에 지질 꼬리를 부착시키는 데 관련된 효소, 항생제 내성을 조절하는 폴리펩티드 및 ABC 수송자를 포함한다. 항생제 내성을 조절하는 폴리펩티드와 ABC 수송자는 내성을 부여하거나, 또는 답토마이신 및 관련 항생제에 대한 박테리아의 내성을 증가, 변형 또는 감소시키는데 이용될 수 있다. 항생제 내성에 관련된 폴리펩티드는 또한 박테리아의 내성 기작을 결정하는 데 유용하여, 답토마이신과 관련 항생제를 변형시켜 이들을 내성 박테리아에 대해 더욱 강력하게 만들 수 있다.
본 발명은 답토마이신 생합성 유전자 클러스터, 바람직하게는 에스. 로제오스포루스로부터의 답토마이신 생합성 유전자 클러스터의 전부 또는 일부를 포함하는 핵산 분자를 제공하여 이들 문제점을 해결한다.
도 1은 답토마이신 NRPS 유전자를 조작하여 유전자 발현 또는 코딩된 단백질의 발현을 변화시키는 방법의 도식이다.
도 2A는 BAC 클론 B12:03A05의 도식이다. 이 도식은 90 kb 단편으로 불리는 90 kb 영역, SP6 단편으로 불리는 약 13 kb 영역, 및 본원에서 GTC2 단편으로 불리는 약 25-28 kb 영역을 보여준다. 서열 번호 1은 90 kb 단편의 핵산 서열을 보여준다. 서열 번호 103은 SP6 단편의 핵산 서열을 보여준다. SP6 단편은 왼쪽에서 90 kb 단편과 인접한다. GTC 단편은 오른쪽에서 90 kb 단편과 인접한다. 서열 번호 105는 GTC2 단편의 핵산 서열을 보여준다.
도 2B는 90 kb 단편의 도식을 보여준다. 답토마이신 생합성 유전자 클러스터의 영역에는 폴리펩티드를 코딩하는 핵산 서열인 38개의 오픈 리딩 프레임이 있다.
도 2C는 SP6 단편의 도식을 보여준다. SP6 단편에는 9개의 ORF가 있다. 90 kb와 SP6 단편의 ORF를 위한 아미노산 및 핵산 서열 동정자를 위해서는 표 5를 참고하라.
도 2D는 GTC2 단편의 도식을 보여준다.
도 3은 Clustal W 프로그램을 이용한, 스트렙토마이세스 코엘리컬러의 칼슘 의존성 항생제(CDA) III 단백질의 아미노산 서열(서열 번호 164)과 DptD의 아미노산 서열(서열 번호 7)의 비교를 보여준다. 실시예 3 참고.
도 4는 Clustal W 프로그램을 이용한, DptH의 아미노산 서열(서열 번호 8)과 스트렙토마이세스 코엘리컬러의 CDA NRPS와 연관된 가능한 하이드롤라제(티오에스테라제로 가정됨)의 아미노산 서열(서열 번호 165)의 비교를 보여준다. 실시예 3 참고.
도 5A-5C는 답토마이신 생합성 유전자 클러스터를 함유한 스트렙토마이세스 리비단스 TK64 클론 CBUK138742(ATCC 기탁번호 PTA3140, 2001년 3월 1일 기탁)에서 생산된 A21978C 리포펩티드 또는 답토마이신의 분석을 보여준다. 도 5A는 CBUK138742의 브로스의 HPLC 분석을 보여준다. 하부 패널은 HPLC 용출액에 대해 200-600 nm 범위에 걸쳐 관찰한 최대 흡광도를 시간에 대해 플롯팅한 것을 보여준다. 세 개의 천연 리포펩티드인, 리포펩티드 A21978C1(C1 리포펩티드), A21978C2(C2 리포펩티드) 및 A21978C3(C3 리포펩티드)의 존재는 각각 보유 시간 5.61, 5.77, 및 5.89분의 피크에 의해 나타내진다. 상부 패널은 이들 피크에 대해 관찰된 UV-가시광선 스펙트럼을 보여준다. 도 5B는 답토마이신 유전자 클러스터를 함유한 스트렙토마이세스 리비단스 TK64 클론의 데카노산 공급 발효로부터 정제된 답토마이신의 ESI 질량 스펙트럼을 보여준다. 도 5C는 CBUK138742의 데카노산 공급 발효로부터 정제된 답토마이신의 1H NMR 스펙트럼(400 MHz, d6-DMSO)를 보여준다.
도 6은 클로닝 벡터 pStreptoBAC V의 다이아그램이다.
도 7은 답토마이신 생합성 유전자 클러스터로부터의 BAC 클론의 HinDIII 분해를 보여준다. 레인 1은 B12:01G05(82 kb 삽입체)을 보여주고; 레인 2는 B12:03A05(120 kb 삽입체)을 보여주며; 레인 3은 B12:06A12(85 kb 삽입체)을 보여주며; 레인 4는 B12:12FG06(65 kb 삽입체)을 보여주며; 레인 5는 B12:18H04(46 kb 삽입체)을 보여주며, 레인 6은 B12:20C09(65 kb 삽입체)을 보여준다.
도 8은 스트렙토마이세스 로제오스포루스의 답토마이신 NPRS 영역의 약 180-200 kb를 커버하는 일부 BAC 클론들의 지도를 보여준다.
도 9는 NRPS의 유전자 구조의 도식이다.
도 10은 스트렙토마이세스 코엘리컬러로부터의 CDA NRPS와 답토마이신 NRPS의 Asn과 Asp를 특정하는 도메인에 대한 아데닐화(A) 도메인 유사성을 나타내는 덴드로그램이다. 실시예 5 참고.
도 11은 Asn의 입체화학을 결정하는 HPLC 분석의 결과를 보여준다. 실시예 6 참고.
도 12는 답토마이신 NRPS의 조직을 보여주는 도식이다.
도 13은 실시예 12C에 개시된 대로 생성된 신규의 리포펩티드의 1H NMR 스펙트럼을 보여준다.
발명의 요약
본 발명은 답토마이신 생합성 유전자 클러스터, 바람직하게는 에스. 로제오스포루스로부터의 답토마이신 생합성 유전자 클러스터의 전부 또는 일부를 포함하는 핵산 분자를 제공하여 이들 문제점을 해결한다. 이 핵산 분자는 DptA, DptBC 또는 DptD를 코딩할 수 있으며, 또는 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터로부터의 dptA, dptBC 또는 dptD 유전자 중 하나 이상을 포함할 수도 있다.
본 발명은 또한 답토마이신 생합성 유전자 클러스터로부터의 유리 티오에스테라제와 통합 티오에스테라제를 코딩하는 핵산 분자들을 제공한다. 이 핵산 분자는 DptH 또는 DptD로부터의 티오에스테라제 도메인을 코딩할 수도 있으며, 답토마이신 생합성 유전자 클러스터로부터의 dptH 또는 dptD 유전자를 포함할 수도 있다.
본 발명의 다른 목적은 에스. 로제오스포루스로부터의 핵산 서열을 포함하는 박테리아 인공 염색체로부터의 DNA 서열을 포함하는 핵산 분자를 제공하는 것이다. 바람직하게는 이 핵산 분자는 박테리아 인공 염색체(BAC) 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05중 임의의 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함한다.(상기 클론들 중, 단지 B12:03A05만이 기탁되었으며; ATCC 기탁번호 PTA-3141로서 2001년 3월 1일에 기탁되었음). 바람직한 구체예에서, 이 핵산 분자는 폴리펩티드를 코딩한다. 다른 바람직한 구체예에서, 이 핵산 분자는 본원에 개시된 바와 같은 dptA, dptBC, dptD, dptE, dptF, dptH와 같은 답토마이신 생합성에 관련된 폴리펩티드, ABC 수송자, 또는 항생제 내성을 조절하는 폴리펩티드를 코딩한다.
본 발명은 또한 전술한 핵산 분자의 선택적 하이브리드화 또는 상동성 핵산 분자를 제공한다. 본 발명은 추가로 대립유전자 변이체와 그 부분들을 제공한다. 본 발명은 추가로 전술한 핵산 분자의 전사를 조절하는 발현 조절 서열 하나 이상을 포함하는 핵산 분자를 제공한다. 발현 조절 서열은 답토마이신 생합성 유전자 클러스터의 발현 조절 서열로부터 유래되거나 또는 이종성 핵산 서열로부터 유래될 수도 있다.
다른 구체예에서, 본 발명은 답토마이신 생합성 유전자 클러스터로부터의 답토마이신 NRPS 및/또는 티오에스테라제를 코딩하는 핵산 서열을 포함하는 유전자로부터의 하나 이상의 발현 조절 서열을 포함하는 핵산 분자를 제공한다. 바람직하게는, 핵산 분자는 답토마이신 NRPS 또는 dptH의 발현 조절 서열의 일부 또는 전부를 포함한다.
본 발명의 다른 목적은 전술한 핵산 분자 중 하나 이상을 포함하는 벡터 및/또는 숙주 세포를 제공한다. 바람직한 구체예에서, 벡터 및/또는 숙주 세포는 DptA, DptBC, DptD, DptE, DptF, 및/또는 DptH의 전부 또는 일부를 코딩하는 핵산 분자, 또는 전술한 BAC 클론의 전부 또는 일부를 포함한다. 숙주 세포는 답토마이신 NRPS와 같은 NRPS 또는 PKS의 전부 또는 일부를 포함할 수도 있다. 숙주 세포는 추가로 하나 이상의 티오에스테라제를 포함할 수도 있다.
본 발명의 다른 목적은 답토마이신 생합성 유전자 클러스터에서 유래한 폴리펩티드, 바람직하게는 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터로부터 유래한 폴리펩티드를 제공하는 것이다. 이 폴리펩티드는 DptA, DptBC, 또는 DptD일 수 있다.
본 발명은 또한 통합 또는 유리 티오에스테라제에서 유래한, 바람직하게는 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터에서 유래한 폴리펩티드를 제공한다. 바람직한 구체예에서, 이 폴리펩티드는 티오에스테라제에서 유래한다. 폴리펩티드는 DptH 또는 DptD의 티오에스테라제 도메인으로부터 유래할 수도 있다.
본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 하나의 핵산 분자에 의해 코딩되는 폴리펩티드를 제공한다. 이들 폴리펩티드는 다른 것들 중에서 지질 꼬리를 답토마이신의 펩티드 도메인에 붙이는 데 관여하는 효소, 항생제 내성을 조절하는 폴리펩티드 및 ABC 수송자를 포함한다.
본 발명의 다른 목적은 전술한 폴리펩티드의 단편을 제공하는 것이다. 한 구체예에서, 그 단편은 본원에서 정의된 도메인 또는 모듈 적어도 하나를 포함한다. 다른 구체예에서, 이 단편은 폴리펩티드의 하나 이상의 에피토프를 포함한다.
본 발명의 다른 목적은 답토마이신 NRPS 폴리펩티드, 티오에스테라제, 및 본원에서 제공된 BAC 클론의 핵산 분자에 의해 코딩된 폴리펩티드의 돌연변이 단백질, 융합 단백질, 상동성 단백질 또는 대립유전자 변이체인 폴리펩티드를 제공하는 것이다.
본 발명은 또한 답토마이신 NRPS의 폴리펩티드, 답토마이신 생합성 유전자 클러스터의 티오에스테라제 폴리펩티드, 또는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 하나로부터의 핵산 분자에 의해 코딩되는 폴리펩티드에 특이적으로 결합하는 항체를 제공한다. 본 발명은 또한 전술한 폴리펩티드 또는 단백질중 어느 하나의 단편, 폴리펩티드 돌연변이, 융합 단백질, 대립유전자 변이체에 의해 코딩되는 폴리펩티드 또는 상동성 단백질에 결합할 수 있는 항체를 제공한다. 이 항체를 이용하여 본 발명의 폴리펩티드의 존재 또는 양을 검출하거나 폴리펩티드의 활성을 억제하거나 활성화시킬 수 있다.
본 발명의 다른 목적은 핵산 분자를 숙주 세포내로 도입하고 폴리펩티드를 발현시킴으로써 본원에서 개시된 핵산 분자를 이용하여 폴리펩티드를 재조합적으로 생산할 수 있는 방법을 제공하는 것이다.
본 발명은 또한 본 발명의 핵산 분자를 이용하여 본원에서 개시된 핵산 분자와 비교하여 유사하거나 동일한 핵산 서열을 갖는 핵산 분자를 검출하거나 증폭시키는 방법을 제공한다.
이 핵산 분자와 폴리펩티드는 예를 들어, 천연 생성물의 생합성과 생산 및 새로운 화합물의 설계된 생합성에 유용하다. 답토마이신 NRPS 및/또는 티오에스테라제를 이용하여 자연 발생 화합물 및 신규 화합물 둘 다를 포함한 기타 리포펩티드와 답토마이신을 생산할 수도 있다. 폴리펩티드를 이용하여 비리보솜 펩티드 합성에 의해 생산되는 다른 화합물뿐만 아니라 고리형 또는 비고리형 리포펩티드를 생체외에서 생산할 수도 있다. 다르게는, 본 발명의 핵산 분자를 숙주 세포내로 도입하여 발현시킬 수 있으며, 숙주 세포는 이어서 비리보솜 펩티드 합성에 의해 생산되는 다른 화합물과 리포펩티드를 생산하기 위해 이용될 수도 있다.
본 발명의 다른 목적은 비리보솜 펩티드 합성에 의해 신규 화합물을 생산할 수 있는 신규한 유전자 클러스터를 제공하는 것이다. 답토마이신 생합성 유전자 클러스터의 뉴클레오티드를 변화시킴으로써, 구체적으로는 답토마이신 NRPS의 뉴클레오티드, 도메인 또는 모듈을 변화시켜, 비리보솜 펩티드 합성에 관여하는 새로운 폴리펩티드를 만들기 위해 신규의 유전자 클러스터를 얻을 수도 있다. 이러한 방식으로, 자연 발생 폴리펩티드에 의해 생산되는 펩티드 외에 비리보솜 펩티드 합성에 의해 생성되는 펩티드 내로 다른 아미노산들을 통합시킬 수도 있다. 본 발명은 또한 본원에 개시된 방법에 의해 생성된 화합물을 포함한다.
본 발명의 다른 목적은 본 발명의 핵산과 아미노산 서열을 저장하는 컴퓨터 판독가능 수단을 제공하는 것이다. 컴퓨터 판독 가능 수단의 기록은 서열의 판독과 전시 및 본 발명의 서열을 다른 서열과 비교, 배열 및 순서지정하기 위해 이용할 수 있다.
발명의 상세한 설명
정의와 일반적 기술
본원에서 달리 정의되지 않으면, 본 발명과 관련하여 사용되는 과학적 및 기술적 용어는 당업자에 의해 상식적으로 이해되는 의미를 갖는다. 또한, 내용상 달리 요구되지 않으면, 단수 용어는 복수를 포함하며 복수 용어는 단수를 포함한다. 일반적으로, 본원에서 개시된 명명법, 세포와 조직 배양, 분자 생물학, 면역학, 미생물학, 유전학 및 단백질과 핵산 화학 및 하이브리드화의 기법 및 이와 관련된 명명법은 당업계에 잘 알려져 있으며 통상적으로 이용되는 것들이다. 본 발명의 방법과 기술은 일반적으로 당업계에 잘 알려지고 달리 나타내지 않으면 본 명세서의 전반에 걸쳐 인용되고 언급되는 다양한 일반적이고 보다 구체적인 참고 문헌들에 개시된 통상의 방법에 따라 수행된다. 예를 들어, Sambrook et al., Molecular Cloning; A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1989); Sambrook et al., Molecular Cloning:3d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2000); Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates(1992, and Supplements to 2000); Ausubel et al., Short Protocols in Molecular Biology; A Compendium of Methods from Current Protocols in Molecular Biology, 4th ed.,Wiley & Sons(1999); Harlow and Lane Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1990); Harlow and Lane Using Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1998); 및 T.Kieser et al., Practical Streptomyces Genetics, John Innes Foundation, Norwich(2000)를 참고하며, 각각 본원에 참고로 통합된다.
효소 반응과 정제 기법은 당업계에서 통상적으로 이루어지거나 본원에 개시된 대로, 제조자의 지침에 따라 수행된다. 본원에 개시된 분석 화학, 합성 유기 화학 및 의학적 및 약학적 화학의 실험 과정과 기술 및 관련하여 이용되는 명명법은 당업계에 잘 알려져 있으며 흔히 사용되고 있다. 화학 합성, 화학 분석, 약학 제제, 제제, 및 전달 그리고 환자의 치료에 표준 기법이 이용된다.
달리 나타내지 않으면, 하기 용어는 다음 의미를 갖는 것으로 이해된다.
용어 "티오에스테라제"는 티오에스테르 결합의 절단을 촉매하여 고리형 또는 선형 분자를 생성할 수 있는 효소를 의미한다.
용어 "티오에스테라제 활성"은 티오에스테라제, 또는 뮤테인, 상동성 단백질, 유사체, 유도체, 융합 단백질 또는 이들의 단편이 티오에스테르 결합의 절단을 촉매하는 효소 활성을 의미한다. 티오에스테라제 활성은 예를 들어 결합 및/또는 해리 상수, 촉매 속도 및 기질 전환 속도를 포함한다. 폴리펩티드의 티오에스테라제 활성은 DptH, DptD의 티오에스테라제 도메인, dptH에 의해 코딩되는 폴리펩티드, dptD의 티오에스테라제 도메인에 의해 코딩되는 폴리펩티드, 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖는 폴리펩티드 또는 서열 번호 8의 아미노산 서열을 갖는 폴리펩티드의 티오에스테라제 활성과 동일할 수도 있다. 티오에스테라제 활성은 또한 전술한 티오에스테라제들의 활성과 다를 수도 있다; 예를 들어, 그것은 증가되거나 감소된 촉매 활성, 다른 결합 및/또는 해리 상수 또는 촉매를 위한 다른 기질을 가질 수도 있다. "감소된" 또는 "증가된" 티오에스테라제 활성은 각각 티오에스테라제의 감소되거나 증가된 촉매 활성을 의미한다.
"답토마이신 생합성 유전자 클러스터로부터 유래된 티오에스테라제"는 답토마이신 합성에 관련된 폴리펩티드를 코딩하는 유전자 클러스터의 유전자중 하나에 의해 코딩되는 티오에스테라제 또는 티오에스테라제 도메인이다. 바람직하게는, 이 티오에스테라제는 스트렙토마이세스로부터의 답토마이신 생합성 유전자 클러스터로부터 유래하며, 바람직하게는 에스. 로제오스포루스로부터의 답토마이신 생합성 유전자 클러스터로부터 유래한다.
"답토마이신 생합성 유전자 클러스터"는 본원에서 유기체, 바람직하게는 박테리아 세포에서 답토마이신의 합성을 위해 필요한 많은 폴리펩티드를 코딩하는 핵산 분자로 정의된다. 답토마이신 생합성 유전자 클러스터는 적어도 DptA, DptBC, DptD 및 DptH를 코딩하거나 또는 그 뮤테인, 상동성 단백질, 대립유전자 변이체 또는 그 단편을 코딩하는 핵산 분자와 답토마이신 합성에 필요한 다른 폴리펩티드를 코딩하는 다른 핵산 서열을 포함한다. 바람직하게는, 답토마이신 생합성 유전자 클러스터는 박테리아 세포내로 도입되고 발현될 때 답토마이신의 합성을 허용하는 BAC B12:03A05의 일부를 포함한다.
"답토마이신 NRPS"는 적절한 박테리아 세포에서 답토마이신을 합성할 수 있는 NRPS로 정의된다. 답토마이신 NRPS는 폴리펩티드 서브유닛 DptA, DptBC 및 DptD, 또는 적절한 세포에서 발현될 때 답토마이신의 합성을 지시할 수 있는 그것의 뮤테인, 상동성 단백질, 대립유전자 변이체 또는 단편을 포함한다. 답토마이신 NRPS는 추가로 DptH 및/또는 DptE 또는 DptF와 같은 기타 폴리펩티드를 포함할 수도 있다. 바람직하게는, 답토마이신 NRPS는 스트렙토마이세스로부터의 답토마이신 생합성 유전자 클러스터로부터 유래되며, 보다 바람직하게는 답토마이신 NRPS는 에스. 로제오스포루스로부터 유래된다. 용어 "답토마이신 NRPS"는 답토마이신 NRPS가 단지 답토마이신만을 합성하기 위해 이용될 수 있다는 것을 의미하지 않는다. 그렇다기보다는, 본원에서 이용될 때, 이 용어는 NRPS가 답토마이신 생합성 유전자 클러스터로부터 원래 유래한다는 것을 개시하기 위한 목적으로만 이용된다. 답토마이신 NRPS는 본원에서 개시된 대로, 답토마이신 외의 다른 분자를 합성하기 위해 이용될 수 있다.
"유전자"는 폴리펩티드를 코딩하는 핵산 서열과 그 폴리펩티드를 코딩하는 핵산 서열에 작동가능하게 연결된 발현 조절 서열을 포함하는 핵산 분자로 정의된다. 예를 들어, 유전자는 프로모터, 하나 이상의 인핸서, 폴리펩티드를 코딩하는 핵산 서열, 하부 조절 서열 및, 가능하게는 RNA의 발현의 조절에 관련된 다른 핵산 서열을 포함할 수도 있다.
만일 핵산 분자 또는 폴리펩티드가 특정 종으로부터 분리되거나 또는 핵산 분자 또는 폴리펩티드가 특정 종으로부터 분리된 핵산 분자 또는 폴리펩티드와 상동이면, 핵산 분자 또는 폴리펩티드는 이 특정 종으로부터 "유래된" 것이다.
용어 "dptA", "dptBC", 및 "dptD"는 답토마이신 NRPS의 서브유닛을 코딩하는 핵산 분자를 의미한다. 바람직한 구체예에서, 핵산 분자는 스트렙토마이세스로부터 유래되고, 보다 바람직하게는 핵산 분자는 에스. 로제오스포루스로부터 유래된다. 바람직한 구체예에서, dptA, dptBC, 및 dptD는 각각 서열 번호 9, 11, 및 7의 아미노산 서열을 갖는 폴리펩티드를 코딩한다. 용어 "dptA", "dptBC", 및 "dptD"는 또한 이들 유전자의 대립유전자 변이체를 의미하며, 이들은 스트렙토마이세스의 다른 종으로부터 또는 다른 에스. 로제오스포루스 균주로부터 얻을 수 있다.
용어 "dptH"는 그 코딩 도메인이 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 유전자를 의미하며, 이때 자연 발생 티오에스테라제는 "유리" 티오에스테라제이다. 유리 티오에스테라제는 그것이 자연 발생일 때 더 큰 폴리펩티드의 기능성 도메인이 아닌 티오에스테라제이다. dptH 유전자는 또한 하기에 개시된 바처럼, 그 유전자의 코딩 영역의 상부에 위치한 발현 조절 서열을 포함한다. 한 구체예에서, dptH의 발현 조절 서열은 서열 번호 5의 핵산 서열을 갖는다. 용어 "dptH"는 또한 서열 번호 8에 의해 정의된 폴리펩티드를 코딩하는 핵산을 의미한다. 용어 "dptH"는 또한 이 유전자의 대립유전자 변이체를 의미하며, 이는 스트렙토마이세스의 다른 종 또는 다른 에스. 로제오스포루스 균주로부터 얻을 수 있다.
용어 "대립유전자 변이체"는 한 유전자의 둘 이상의 자연 발생 대체형중 하나를 의미하며, 이때 각 대립유전자는 다른 뉴클레오티드 서열을 갖는다. 대립유전자 변이체는 동일한 폴리펩티드 또는 다른 폴리펩티드를 코딩할 수도 있다. 본원에서 사용될 때, 대립유전자는 기준 핵산 서열에 대하여 90% 이상의 서열 동일성, 바람직하게는 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 서열 동일성을 가지며 기준 핵산 분자에 의해 코딩되는 폴리펩티드와 유사하거나 동일한 생물학적 특성을 갖는 폴리펩티드를 코딩하는 것이다.
용어 "폴리뉴클레오티드" 또는 "핵산 분자"는 적어도 10 염기 길이의, 리보뉴클레오티드 또는 데옥시뉴클레오티드 또는 이들 유형 중 어느 유형의 변형된 형태의 뉴클레오티드의 중합체 형태를 의미한다. 이 용어는 단일쇄 및 이중쇄 형태의 DNA를 포함한다. 또한, 폴리뉴클레오티드는 자연 발생 및/또는 비-자연 발생 뉴클레오티드 연결에 의해 함께 연결된 자연 발생 뉴클레오티드 및 변형된 뉴클레오티드 중 하나 또는 둘다를 포함할 수 있다.
"분리된" 또는 "실질적으로 순수한" 핵산 또는 폴리뉴클레오티드(예, RNA, DNA, 또는 혼합된 중합체)는 자연 숙주 세포내에서 천연 폴리뉴클레오티드에 자연적으로 수반되는 다른 세포 성분들(예, 리보솜, 폴리머라제, 또는 그 폴리뉴클레오티드가 천연적으로 연합되어 있는 게놈 서열)로부터 실질적으로 분리된 것이다. 이 용어는 (1) 그것의 자연 발생 환경으로부터 제거되거나 (2) "분리된 폴리뉴클레오티드”가 자연에서 발견되는 폴리뉴클레오티드의 전부 또는 일부와 연합되어 있지 않거나, (3) 자연에서는 연결되어 있지 않는 폴리뉴클레오티드에 작동적으로 연결되거나, 또는 (4) 더 큰 서열의 일부로서 자연에서는 발생하지 않는 핵산 또는 폴리뉴클레오티드를 포함한다. 용어 "분리된" 또는 "실질적으로 순수한"은 또한 재조합 또는 클론된 DNA 분리물, 화학적으로 합성된 폴리뉴클레오티드 유사체, 또는 이종성 시스템에 의해 생물학적으로 합성된 폴리뉴클레오티드 유사체에 대하여 사용될 수 있다.
핵산 분자 또는 폴리뉴클레오티드의 "일부"는 기준 핵산 분자의 적어도 14 뉴클레오티드의 부분적인 인접 서열을 포함하는 핵산 분자를 의미한다. 바람직하게는, 일부는 기준 핵산 분자의 적어도 17 또는 20 뉴클레오티드를 포함한다. 보다 바람직하게는, 일부는 적어도 25, 30, 35, 40, 50, 60, 70, 80,90, 100, 200, 300, 400, 500, 또는 1000 뉴클레오티드를 포함하며, 최대로는 기준 핵산 분자보다 1 뉴클레오티드 짧은 뉴클레오티드를 포함한다. 핵산 분자의 일부는 다른 핵산 서열을 전혀 포함하지 않을 수도 있다. 다르게는, 핵산 분자의 일부는 다른 핵산 분자로부터의 다른 핵산 분자를 포함할 수도 있다.
용어 "올리고뉴클레오티드"는 일반적으로 200 뉴클레오티드 또는 그 이하의 길이를 포함하는 폴리뉴클레오티드를 말한다. 바람직하게는, 올리고뉴클레오티드는 10 내지 60 뉴클레오티드 길이이며, 가장 바람직하게는 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 또는 60 뉴클레오티드 길이이다. 올리고뉴클레오티드는 단일쇄일 수 있어 예를 들어 프로브 또는 프라이머로 이용될 수 있으며, 또는 돌연변이 유전자의 작제에 사용하기 위한 이중쇄일 수도 있다. 본 발명의 올리고뉴클레오티드는 센스 또는 안티센스 올리고뉴클레오티드일 수 있다. 올리고뉴클레오티드는 필요하면 검출을 위한 표지를 포함할 수 있다.
본원에서 언급되는 용어 "자연 발생 뉴클레오티드"는 자연 발생 데옥시리보뉴클레오티드와 리보뉴클레오티드를 포함한다. 본원에서 언급되는 용어 "변형된 뉴클레오티드"는 변형되거나 치환된 당 기 등을 가진 뉴클레오티드를 포함한다. 본원에서 언급된 용어 "뉴클레오티드 결합"은 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포르아니라데이트, 포스포로아미데이트 등과 같은 뉴클레오티드 결합을 포함한다. 예를 들어 본원에 참고로 통합되는 LaPlanche et al., Nucl.Acids.Res. 14:9081(1986); Stec et al.,J.Am.Chem.Soc.106:6077(1984); Stein et al.Nucl.Acids.Res.16:3209(1988); Zon et al.,Anti-Cancer Drug Design 6:539(1991); Zon et al. Oligonucleotides and Analogues:A Practical Approach, pp.87-108(F.Eckstein, Ed., Oxford University Press, Oxford England(1991)); Stec et al. U.S. Patent No.5,151,510; Uhlmann and Peyman Chemical Reviews 90:543(1990) 참고.
달리 기재되지 않으면, 센스 배향의 폴리뉴클레오티드 서열의 왼쪽 말단은 5' 말단이고 오른쪽 말단은 3' 말단이다. 또한, 센스 배향의 폴리뉴클레오티드의 왼쪽 방향은 5' 방향으로 칭해지며, 오른쪽 방향은 3' 방향으로 칭해진다.
핵산 서열의 문맥에서 용어 "퍼센트 서열 동일성" 또는 "동일한"은 최대로 일치되도록 배열될 때 두 서열내의 동일한 잔기를 말한다. 서열 동일성 비교의 길이는 약 9 뉴클레오티드 이상의 길이이며, 일반적으로 약 20 뉴클레오티드 이상, 보다 일반적으로 약 24 뉴클레오티드 이상, 일반적으로 약 28 뉴클레오티드 이상, 보다 일반적으로 약 32 뉴클레오티드 이상, 및 바람직하게는 약 36 이상 또는 그 이상의 뉴클레오티드 길이이다. 뉴클레오티드 서열 동일성을 측정하기 위해 이용될 수 있는 많은 상이한 알고리즘이 당업계에 공지되어 있다. 한 구체예에서, 폴리뉴클레오티드 서열은 Blast(Altschl et al., J.Mol.Biol. 215:403-410, 1990)를 이용하여 비교할 수 있다. 예를 들어, 폴리뉴클레오티드 서열은 FASTA, Gap 또는 Bestfit를 이용하여 비교할 수 있으며, 이들은 위스콘신 매디슨의 Genetics Computer Group(GCG)의 Wisconsin Package Version 10.0에 들어 있다. FASTA는 문제 서열과 조사 서열간의 배열과 최대 겹침 영역의 퍼센트 서열 동일성을 제공한다(Pearson, 1990, 본원에 참고로 통합됨). 예를 들어, 핵산 서열간의 퍼센트 서열 동일성은 디폴트 파라미터(글자 크기 6과 점수 매기기 매트릭스를 위한 NOPAM 인자)를 가진 FASTA를 이용하거나 또는 본원에 참고로 통합되는 GCG Version 6.1에 제공된 디폴트 파라미터를 가진 Gap을 이용하여 결정할 수 있다.
핵산 또는 그 단편을 언급할 때, 용어 "실질적 상동성” 또는 "실질적 유사성"은, 전술한 대로 FASTA, BLAST 또는 Gap과 같은 서열 동일성의 공지된 알고리즘에 의해 측정할 때, 적절한 뉴클레오티드 삽입 또는 결실을 가지면서 다른 핵산(또는 그 상보성 쇄)과 적절히 배열될 때 적어도 약 50%, 보다 바람직하게는 60%, 대개 적어도 약 70%, 보다 일반적으로 적어도 약 80%, 바람직하게는 적어도 약 90%, 그리고 보다 바람직하게는 적어도 약 95%, 96%, 97%, 98%, 또는 99%의 뉴클레오티드 염기에서 뉴클레오티드 서열 동일성이 있음을 나타낸다.
다르게는, 핵산 또는 그 단편이 선택적인 하이브리드화 조건하에서 다른 핵산, 다른 핵산의 쇄, 또는 그 상보성 쇄에 하이브리드화할 때 실질적인 상동성 또는 유사성이 존재한다. 일반적으로, 선택적 하이브리드화는 적어도 약 14 뉴클레오티드 길이에 걸쳐 적어도 약 55% 서열 동일성- 바람직하게는 적어도 약 65%, 보다 바람직하게는 적어도 약 75%, 그리고 가장 바람직하게는 적어도 약 90%의 서열 동일성이 있을 때 일어난다. 예를 들어 본원에 참고로 통합되는 Kanehisa, 1984를 참고.
핵산 하이브리드화는 염 농도, 온도, 용매, 하이브리드화하는 종의 염기 조성, 상보성 영역의 길이, 및 하이브리드화하는 핵산간의 뉴클레오티드 염기 미스매치의 수과 같은 조건에 의해 영향을 받을 것이며, 이는 당업자에 의해 쉽게 인식될 것이다. 핵산 하이브리드화 실험의 내용에서 "엄격한 하이브리드화 조건"과 "엄격한 세척 조건"은 여러 가지의 다른 물리적 파라미터에 의존한다. 가장 중요한 파라미터는 하이브리드화 온도, 핵산의 염기 조성, 염농도 및 핵산의 길이를 포함한다. 당업자는 특정 하이브리드화 엄격도를 얻기 위해 이들 파라미터를 어떻게 변화시키는지 안다.
일반적으로, "엄격한 하이브리드화"는 구체적 조건하에서 특정 DNA 하이브리드의 열 융점(Tm)보다 약 25℃ 이하에서 수행된다. "엄격한 세척"은 특정 조건하에서 특정 DNA 하이브리드의 Tm보다 약 5℃ 낮은 온도에서 수행된다. Tm은 표적 서열의 50%가 완전히 매치되는 프로브에 하이브리드화하는 온도이다. 예를 들어 참고로 본원에 통합되는 상기 Sambrook et al., page 9.51을 참고.
특정 DNA-DNA 하이브리드의 Tm은 식 Tm=81.5℃ + 16.6(log10 [Na+]) + 0.41(분획 G+C)-0.63(% 포름아미드)-(600/l)에 의해 평가될 수 있으며, 이때 l은 염기 쌍인 하이브리드의 길이이다.
특정 RNA-RNA 하이브리드의 Tm은 식 Tm=79.8℃ + 18.5(log10 [Na+]) + 0.58(분획 G+C)+11.8(분획 G+C)2-0.35(% 포름아미드)-(820/l)에 의해 평가될 수 있다.
특정 RNA-DNA 하이브리드의 Tm은 식 Tm=79.8℃ + 18.5(logic [Na+]) + 0.58(분획 G+C)+11.8(분획 G+C)2-0.50(% 포름아미드)-(820/l)에 의해 평가될 수 있다.
일반적으로, Tm은 두 핵산간의 각 1%의 미스매치에 대해 1-1.5℃씩 감소한다. 따라서, 당업자는 표적 핵산에 대해 더 높거나 더 낮은 정도의 서열 동일성을 갖는 서열을 얻기 위해 하이브리드화 및/또는 세척 조건을 변화시킬 수 있다. 예를 들어, 표적 핵산 서열로부터 최대 10% 미스매치를 함유하는 하이브리드화 핵산을 얻기 위해서는, 완전히 매치되는 하이브리드의 계산된 Tm으로부터 10-15℃를 빼고, 이어서 이에 따라 하이브리드화 및 세척 온도를 조정하면 될 것이다. 프로브 서열은 또한 어떤 조건하에서는 이중 DNA에 특이적으로 하이브리드화하여 삼중 또는 그 이상의 DNA 복합체를 형성할 수도 있다. 그러한 프로브와 적절한 하이브리드화 조건의 준비는 당업계에 공지되어 있다.
서던 또는 노던 블롯의 필터상에서의 100 이상의 상보성 잔기를 가진 상보성 핵산 서열의 하이브리드화 또는 라이브러리 스크리닝을 위한 엄격한 하이브리드화 조건의 예는 42℃에서 50% 포름아미드/6X SSC에서 10 시간 이상, 바람직하게는 12-16 시간이다. 엄격한 하이브리드화 조건의 다른 예는 포름 아미드없이 68℃의 6X SSC에서 적어도 10 시간, 바람직하게는 12-16 시간이다. 서던 또는 노던 블롯의 필터상에서의 100 이상의 상보성 잔기를 가진 상보성 핵산 서열의 하이브리드화 또는 라이브러리 스크리닝을 위한 낮은 엄격도 하이브리드화 조건의 예는 42℃에서 6X SSC에서 10 시간 이상, 바람직하게는 12-16 시간이다. 유사하지만 동일하지 않은 핵산 서열을 동정하기 위한 하이브리드화 조건은 염농도를 일정하게 유지하면서(6X SSC) 하이브리드화 온도를 68℃에서 42℃로 변화시키거나, 또는 하이브리드화 온도와 염농도를 일정하게 유지하고(예, 42℃와 6X SSC) 포름아미드 농도를 50%에서 0%로 변화시킴으로써 찾을 수 있다. 하이브리드화 완충액은 또한 백그라운드를 낮추기 위해 블로킹 제제를 포함할 수 있다. 이들 제제는 당업계에 잘 공지되어 있다. 예를 들어 본원에 참고로 통합되는 Sambrook et al., 상기, pages 8.46과 9.46-9.58 참고.
세척 조건 또한 엄격도 조건을 바꾸기 위해 변화될 수 있다. 엄격한 세척 조건의 예는 65℃에서 15분간 0.2X SSC로 세척하는 것이다(SSC 완충액을 위해서는 Sambrook et al., 상기 참고). 종종 높은 엄격도 세척은 과다한 프로브를 제거하기 위한 낮은 엄격도 세척에 의해 선행된다. 100 염기쌍 이상의 이중쇄 DNA를 위한 중간 엄격도 세척의 예는 1X SSC로 45℃에서 15분간이다. 그러한 이중쇄를 위한 낮은 엄격도 세척의 예는 4X SSC로 40℃에서 15분간이다. 일반적으로, 특정 하이브리드화 분석에서 무관한 프로브에 대해 관찰된 것보다 2배 이상 높은 시그날-대-노이즈 비는 특이적 하이브리드화의 검출을 나타낸다.
본원에서 정의된 대로, 엄격한 조건하에서 서로 하이브리드화하지 않는 핵산은, 만일 그들이 실질적으로 서로 동일한 폴리펩티드를 코딩한다면 그들은 실질적으로 서로 상동성이다. 예를 들어, 핵산이 유전자 코드의 풍부함(redundancy)에 의해 허용되는 높은 코돈 축퇴성을 이용하여 합성적으로 또는 재조합적으로 생성될 경우에 이러한 일이 발생한다.
본 발명의 폴리뉴클레오티드는 RNA, cDNA, 게놈 DNA 및 이들의 합성 형태와 혼합된 중합체의 센스 및 안티센스 쇄 모두를 포함할 수 있다. 이들은 화학적으로 또는 생화학적으로 변형될 수 있으며 또는 비-천연 또는 유도체화된 뉴클레오티드 염기를 함유할 수도 있으며, 이는 당업자에게 쉽게 이해될 것이다. 그러한 변형은 예를 들어, 표지, 메틸화, 하나 이상의 자연 발생 뉴클레오티드의 유사체에 의한 치환, 비하전 결합(예, 메틸 포스포네이트, 포스포트리에스테르, 포스포르아미데이트, 카바메이트 등), 하전 결합(예, 포스포로티오에이트, 포스포로디티오에이트 등), 펜던트 부(예, 폴리펩티드), 삽입되는 물질(intercalators)(예, 아크리딘, 프소라렌 등), 킬레이터, 알킬레이터, 및 변형된 결합(예, 알파 아노머 핵산 등)과 같은 뉴클레오티드간 변형을 포함한다. 또한 수소 결합 및 기타 화학적 상호작용을 통해 지정된 서열에 결합하는 능력에서 폴리뉴클레오티드를 모방하는 합성 분자도 포함된다. 그러한 분자는 당업계에 공지되어 있으며, 예를 들어 분자의 주쇄내의 포스페이트 결합을 펩티드 결합이 대신하는 것을 포함한다.
핵산 서열에 적용될 때, 용어 "돌연변이된"은 기준 핵산 서열에 비교할 때 핵산 서열내의 뉴클레오티드가 삽입, 결실, 또는 변화될 수 있음을 의미한다. 단일 변화가 한 위치에서 만들어질 수 있으며(점 돌연변이), 또는 여러 개의 뉴클레오티드가 단일 위치에서 삽입, 결실 또는 변화될 수 있다. 또한 하나 이상의 변화가 핵산 서열내의 임의의 수의 위치에서 이루어질 수 있다. 바람직한 구체예에서, 핵산 서열은 티오에스테라제의 야생형 핵산 서열이다. 핵산 서열은 하기에서 개시되는 돌연변이 기법을 포함한 당업계에 공지된 임의의 방법에 의해 돌연변이될 수 있다.
용어 "에러-프론(error-prone) PCR"은 DNA 폴리머라제의 복사 신뢰성이 낮아서 PCR 생성물의 전체 길이를 따라 높은 비율의 점 돌연변이가 얻어지는 조건하에서 PCR을 수행하는 방법을 의미한다. 예를 들어, Leung et al., Technique, 1.pp.11-15(1989)와 Caldwell and Joyce PCR Methods Applic., 2.pp.28-33(1992) 참고.
용어 "올리고뉴클레오티드-지시된 돌연변이 유발"은 임의의 클론된 DNA 절편에서 부위 특이적인 돌연변이를 생성시킬 수 있게 하는 방법을 의미한다. 예를 들어, Reidhaar-Olson et al., Science, 241, pp.53-57(1988) 참고.
용어 "어셈블리 PCR"은 작은 DNA 단편들의 혼합물로부터 PCR 생성물을 조립하는 것에 관련되는 방법을 의미한다. 많은 상이한 PCR 반응이 동일한 바이알내에서 평행하게 일어나며 한 반응의 생성물이 다른 반응의 생성물을 프라임한다.
용어 "성적 PCR 돌연변이 유발" 또는 "DNA 셔플링(shuffling)"은 생체외에서 상이하지만 관련성이 높은 DNA 서열의 DNA 분자간의 강요된 상동성 재조합과 결합된 에러-프론 PCR 방법을 의미하며, 이는 서열 상동성에 기초한 DNA 분자의 임의 단편화에 의해 야기되고, 이어서 에러-프론 PCR 반응에서의 프라이머 연장에 의한 크로스오버의 고정이 일어난다. 예를 들어, Stemmer, Proc.Natl.Acad.Sci. USA 91, pp.10747-10751(1994) 참고. DNA 셔플링은 몇몇 관련 유전자들사이에서 수행될 수 있다("패밀리 셔플링")
용어 "생체내 돌연변이 유발"은 임의의 클론된 DNA에서 임의 돌연변이를 생성시키는 방법을 의미하며, 이는 DNA 수선 경로의 하나 이상에서 돌연변이를 보유한 이. 콜라이같은 박테리아 균주에서의 DNA의 증식에 관련된다. 이들 "돌연변이체" 균주는 야생형 부모보다 더 높은 비율의 임의 돌연변이를 갖는다. 돌연변이체 균주에서 DNA를 증식시키는 것은 궁극적으로 DNA 내의 임의 돌연변이를 생성시킬 것이다.
용어 "카세트 돌연변이 유발"은 이중쇄 DNA 분자의 작은 영역을 원래 서열과는 다른 합성 올리고뉴클레오티드 "카세트"로 대체하는 임의의 방법을 의미한다. 이 올리고뉴클레오티드는 종종 완전히 및/또는 부분적으로 임의화된 천연 서열을 함유한다.
용어 "순환 앙상블 돌연변이 유발(recursive ensemble mutagenesis)"은 그 일원들이 아미노산 서열이 상이한, 표현형적으로 관련된 돌연변이체들의 다양한 집단을 생성시키기 위해 개발된 단백질 공학(단백질 돌연변이 유발)을 위한 알고리즘을 의미한다. 이 방법은 조합 카세트 돌연변이 유발의 연속적인 순환을 조절하는 피드백 기작을 이용한다. 예를 들어, Arkin and Youvan, Proc.Natl.Acad.Sci.USA 89, pp.7811-7815(1992) 참고.
용어 "지수적 앙상블 돌연변이 유발(exponential ensemble mutagenesis)"은 높은 비율의 독특하고 기능적인 돌연변이를 가진 조합 라이브러리를 생성시키기 위한 방법을 의미하며, 여기서 잔기들의 작은 그룹들이 평행하게 임의화되어 기능적 단백질로 이끄는 아미노산을 각각의 변화된 위치에서 동정한다. 예를 들어, Delegrave and Youvan, Biotechnol.Res., 11, pp.1548-1552(1993); 및 random and site-directed mutagenesis, Arnold, Curr.Opin.Biotechnol., 4, pp.450-455(1993) 참고. 전술한 참고문헌 각각은 참고로 본원에 통합된다.
"작동적으로 연결된" 발현 조절 서열은 발현 조절 서열이 관심 유전자와 인접하여 이 관심 유전자를 조절하는 연결 뿐만 아니라, 발현 조절 서열이 관심 유전자를 조절하기 위해 트랜스로 또는 먼거리에서도 작용하는 연결을 의미한다.
본원에서 사용되는 용어 "발현 조절 서열"은 그들이 작동적으로 연결된 코딩 서열의 발현에 영향을 주기 위해 필요한 폴리뉴클레오티드 서열을 의미한다. 발현 조절 서열은 전사, 전사 후 사건들 및 핵산 서열의 번역을 조절하는 서열이다. 발현 조절 서열은 적절한 전사 개시, 종결, 프로모터 및 인핸서 서열; 스플라이싱 및 폴리아데닐화 시그날과 같은 효율적인 RNA 프로세싱 시그날; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 증가시키는 서열(예, 리보솜 결합 부위); 단백질 안정성을 증가시키는 서열; 및 필요할 경우, 단백질 분비를 증가시키는 서열을 포함한다. 이러한 조절 서열의 특성은 숙주 유기체에 따라 다르다: 원핵 세포에서는, 그러한 조절 서열은 일반적으로 프로모터, 리보솜 결합 부위 및 전사 종결 서열을 포함한다. 용어 "조절 서열"은 최소한 그 존재가 발현에 필수적인 모든 성분들을 포함할 것을 의도하며, 또한 그 존재가 유익한 부가 성분들, 예를 들어 리더 서열 과 융합 파트너 서열을 포함할 수 있다.
본원에서 사용되는 용어 "벡터"는 그것이 연결되어 있는 다른 핵산 분자를 수송할 수 있는 핵산 분자를 의미한다. 벡터의 한 유형은 "플라스미드"이며, 이는 원형의 이중쇄 DNA 루프로서 그 내부로 부가의 DNA 단편들이 연결될 수 있다. 다른 벡터들은 코스미드, 박테리아 인공 염색체(BAC) 및 효모 인공 염색체(YAC)를 포함한다. 다른 유형의 벡터는 바이러스 벡터이며, 이때 부가의 DNA 단편들이 바이러스 게놈내로 연결될 수 있다. 박테리아 세포를 감염시키는 바이러스 벡터는 박테리오파아지라 불린다. 일부 벡터들은 그들이 도입되는 숙주 세포에서 자가 복제를 할 수 있다(예, 박테리아의 복제 오리진을 보유한 박테리아 벡터). 다른 벡터들은 숙주 세포내로 도입시 숙주 세포의 게놈내로 통합되어 숙주 게놈과 함께 복제될 수 있다. 더욱이, 일부 벡터들은 그들이 작동적으로 연결된 유전자의 발현을 지시할 수 있다. 그러한 벡터들은 본원에서 "재조합 발현 벡터"(또는 간단하게, "발현 벡터")라고 불린다. 일반적으로, 재조합 DNA 기법에서 이용되는 발현 벡터는 종종 플라스미드 형태이다. 본 명세서에서, 플라스미드가 가장 흔히 이용되는 벡터의 형태이므로 "플라스미드"와 "벡터"는 호환적으로 사용될 수 있다. 하지만, 본 발명은 동등한 기능을 하는 다른 형태의 발현 벡터들을 포함할 것을 의도한다.
본원에서 사용되는 용어 "재조합 숙주 세포"(또는 간단하게 "숙주 세포")는 재조합 발현 벡터가 도입되는 세포를 의미한다. 그러한 용어들은 특정 대상 세포뿐만 아니라 그러한 세포의 후손도 의미하는 것으로 의도됨을 이해해야 한다. 일부 변형들이 돌연변이 또는 환경적 영향으로 인해 후손에서 일어날 수도 있으므로, 그러한 후손은 사실상 부모 세포와 동일하지 않을 수 있으나 여전히 본원에서 사용된 용어 "숙주 세포"의 범위내에 포함된다.
용어 "폴리펩티드"는 자연 발생 및 비-자연 발생 단백질과 폴리펩티드, 폴리펩티드 단편 및 폴리펩티드 돌연변이, 유도체 및 유사체를 포함한다. 본원에서 사용될 때, 폴리펩티드는 적어도 여섯 개의 아미노산, 바람직하게는 적어도 8, 10, 12, 15, 20, 25, 또는 30개의 아미노산을 포함하며, 더욱 바람직하게는 폴리펩티드는 자연 발생 폴리펩티드의 전 길이이다. 폴리펩티드는 단량체일 수도 있고 중합체일 수도 있다. 또한, 폴리펩티드는 단일 폴리펩티드내에 많은 상이한 모듈을 포함할 수 있으며 이 모듈 각각은 하나 이상의 다른 활성을 가질 수 있다. 본 발명에 따른 바람직한 폴리펩티드는 답토마이신 생합성 유전자 클러스터에서 유래한 티오에스테라제와 그 단편, 돌연변이, 유사체 및 유도체를 포함한다.
용어 "분리된 단백질" 또는 "분리된 폴리펩티드"는 그 유래의 기원 또는 공급원에 의해 (1) 그 천연 상태에서 수반되는 자연적으로 연합된 성분들과 연합되어 있지 않거나, (2) 동종으로부터의 다른 단백질이 없거나, (3) 이종으로부터의 세포에 의해 발현되거나, 또는 (4) 자연에서 발생하지 않는 단백질 또는 폴리펩티드이다. 따라서, 화학적으로 합성되거나 또는 자연적으로 기원한 세포와 다른 세포 시스템에서 합성된 폴리펩티드는 그것의 자연적으로 연합된 성분과는 분리된 것일 것이다. 폴리펩티드 또는 단백질은 또한 당업계에 공지된 단백질 정제 기법을 이용하여 분리함으로써 자연에서 연합되는 성분들이 없도록 할 수 있다.
단백질 또는 폴리펩티드는 샘플의 적어도 약 60% 내지 75%가 단일 종의 폴리펩티드를 나타낼 때 "실질적으로 순수"하거나 "실질적으로 균질"하거나 또는 "실질적으로 정제"된 것이다. 폴리펩티드 또는 단백질은 단량체 또는 다량체일 수 있다. 실질적으로 순수한 폴리펩티드 또는 단백질은 일반적으로 약 50%, 60%, 70%, 80%, 또는 90% W/W, 보다 일반적으로는 약 95% 의 단백질 샘플을 포함할 것이며, 바람직하게는 99% 이상 순수할 것이다. 단백질 순도 또는 균질성은 당업계에 공지된 많은 방법에 의해 나타낼 수 있으며, 그 예로는 단백질 샘플을 폴리아크릴아미드 젤 전기영동하고 이어서 공지된 염료로 젤을 염색하여 단일 폴리펩티드 밴드를 가시화하는 것이 있다. 일부 목적을 위해, HPLC 또는 당업계에 공지된 정제 방법을 이용하여 더 높은 해상도를 제공할 수 있다.
본원에서 사용되는 용어 "폴리펩티드 단편"은 전길이 폴리펩티드와 비교하여 아미노-말단 및/또는 카르복시-말단 결실을 갖는 폴리펩티드를 의미한다. 바람직한 구체예에서, 폴리펩티드 단편은 이 단편의 아미노산 서열이 자연 발생 서열의 상응하는 위치와 동일한 연속 서열이다. 단편은 일반적으로 적어도 6, 7, 8, 9, 또는 10 아미노산 길이이고, 바람직하게는 적어도 12, 14, 16 또는 18 아미노산 길이이며, 보다 바람직하게는 적어도 20 아미노산 길이이며, 보다 바람직하게는 적어도 25, 30, 35, 40 또는 45 아미노산, 보다 더 바람직하게는 적어도 50 또는 60 아미노산 길이이며, 더욱 더 바람직하게는 적어도 70 아미노산 길이이다.
"유도체"는 일차 구조 서열은 실질적으로 상동성이나, 예를 들어 생체내 또는 생체외 화학적 및 생화학적 변형을 포함하거나 천연 폴리펩티드에서 발견되지 않는 아미노산을 통합시킨 폴리펩티드 또는 그 단편을 의미한다. 그러한 변형은 예를 들어, 아세틸화, 카르복실화, 인산화, 글리코실화, 유비퀴틴화, 표지화(예, 라디오뉴클라이드 이용), 및 다양한 효소적 변형을 포함하며, 이는 당업자에게 쉽게 이해될 것이다. 다양한 폴리펩티드 표지화 방법 및 그러한 목적을 위해 유용한 다양한 치환체 또는 표지가 당업계에 공지되어 있으며, 125I, 32P, 35S, 및 3H와 같은 방사성 동위원소, 표지된 안티리간드에 결합하는 리간드(예, 항체), 플루오로포어, 형광발광제, 효소 및 표지된 리간드를 위한 특이적 결합쌍 일원으로 작용할 수 있는 안티리간드를 포함한다. 표지의 선택은 원하는 민감도, 프라이머와의 결합의 용이성, 안정성 필요성, 및 이용가능한 기구에 의존한다. 폴리펩티드를 표지화하는 방법은 당업계에 공지되어 있다. 예를 들어, Ausubel et al., 1992를 참고하며 본원에 참고로 통합된다.
용어 "융합 단백질"은 이종성 아미노산 서열에 결합된 폴리펩티드 또는 단편을 포함하는 폴리펩티드를 의미한다. 융합 단백질은 둘 이상의 상이한 단백질로부터의 둘 이상의 원하는 기능성 요소를 함유하도록 만들어질 수 있기 때문에 유용하다. 융합 단백질은 관심 폴리펩티드로부터의 적어도 10개의 연속적인 아미노산을 포함하며, 보다 바람직하게는 적어도 20 또는 30 아미노산, 보다 더 바람직하게는 적어도 40, 50, 또는 60 아미노산, 더욱 바람직하게는 적어도 75, 100 또는 125 아미노산을 포함한다. 융합 단백질은 폴리펩티드 또는 그 단편을 코딩하는 핵산 서열을 다른 단백질 또는 펩티드를 코딩하는 핵산 서열과 인 프레임(in frame)으로 만들어 융합 단백질을 발현시킴으로써 재조합적으로 생성될 수 있다. 다르게는, 폴리펩티드 또는 그 단편을 다른 단백질과 가교시켜 화학적으로 융합 단백질을 생성시킬 수 있다.
용어 "비-펩티드 유사체"는 기준 폴리펩티드의 특성과 유사한 특성을 가진 화합물을 의미한다. 비-펩티드 화합물은 또한 "펩티드 모방체" 또는 "펩티도모방체"라고도 부른다. 예를 들어, Fauchere, J.Adv.Drug Res. 15:29(1986); Veber and Freidinger Trends Neurosci.p.392(1985); 및 Evans et al. J.Med.Chem. 30:1229(1987)을 참고하며 이들은 참고로 본원에 통합된다. 이러한 화합물은 종종 컴퓨터화된 분자 모델링의 도움으로 개발된다. 유용한 펩티드와 구조적으로 유사한 펩티드 모방체를 이용하여 동등한 효과를 생성할 수 있다. 일반적으로, 펩티도모방체는 티오에스테라제와 같은 패러다임 폴리펩티드(즉, 원하는 생화학적 특성 또는 약리학적 활성을 갖는 폴리펩티드)와 구조적으로 유사하나, -CH2NH-, CH2S-, -CH2CH2-, -CH=CH-(시스와 트랜스), -COCH2-, -CH(OH)CH2-, 및 -CH2SO-로 이루어진 군 중에서 선택되는 결합에 의해 공지의 방법에 의해 임의로 대체된 하나 이상의 펩티드 결합을 가진다. 컨센서스(consensus) 서열의 하나 이상의 아미노산을 동일한 유형의 D-아미노산(예, L-리신 대신 D-리신)으로 체계적으로 치환시키는 것은 또한 보다 안정한 펩티드를 생성하기 위해 이용될 수 있다. 또한, 컨센서스 서열 또는 실질적으로 동일한 컨센서스 서열 변이를 포함하는 억제된 펩티드를 당업계에 공지된 방법(Rizo and Gierasch, Annu. Rev. Biochem. 61:387(1992), 참고로 본원에 통합됨)을 이용하여, 예를 들어 펩티드를 고리화화는 분자내 디설파이드 가교를 형성시킬 수 있는 내부 시스테인 잔기를 부가함으로써 생성시킬 수 있다.
"폴리펩티드 돌연변이" 또는 "뮤테인"은 그 서열이 천연 또는 야생형 단백질의 아미노산 서열과 비교하여 하나 이상의 아미노산의 치환, 삽입 또는 결실을 함유하는 폴리펩티드를 의미한다. 뮤테인은 한 위치에서의 단일 아미노산이 다른 아미노산으로 바뀐 하나 이상의 아미노산 점 치환, 자연 발생 단백질의 서열에서 하나 이상의 아미노산이 삽입 또는 결실된 하나 이상의 삽입 및/또는 결실, 및/또는 아미노 또는 카르복시 말단의 어느 하나 또는 둘다에서 아미노산 서열의 절단을 가질 수 있다. 또한, 뮤테인은 자연 발생 단백질과 동일하거나 상이한 생물학적 활성을 가질 수도 있다. 예를 들어, 뮤테인은 증가되거나 감소된 생물학적 활성을 가질 수도 있다. 본 발명의 바람직한 구체예에서, 뮤테인은 자연 발생 티오에스테라제와 동일하거나 증가된 티오에스테라제 활성을 갖는다. 뮤테인은 야생형 단백질과 적어도 50%, 60%, 또는 70% 서열 상동성을 가지며, 보다 바람직하게는 뮤테인이 야생형 단백질과 적어도 80%, 85%, 또는 90% 서열 상동성을 가지며, 보다 더 바람직하게는 뮤테인이 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는다. 서열 상동성은 디폴트 파라미터를 이용하여 Gap 또는 Bestfit과 같은 일반적인 서열 분석 알고리즘을 이용함으로써 측정될 수 있다.
바람직한 아미노산 치환은 (1) 단백질 분해에 대한 민감성을 감소시키고, (2) 산화에 대한 민감성을 감소시키고, (3) 단백질 복합체를 형성하기 위한 결합 친화도를 변화시키고, (4) 결합 친화도 또는 효소 활성을 변화시키고, (5) 그러한 유도체, 유사체, 융합 단백질과 뮤테인의 기능적 특성 또는 다른 물리화학적 특성을 부여하거나 변화시키는 것들이다. 단일 또는 다중 아미노산 치환(바람직하게는 보존적 아미노산 치환)을 자연 발생 서열에 만들 수도 있다(바람직하게는 분자간 접촉을 형성하는 도메인(s)외의 폴리펩티드의 부분에서). 보존적 아미노산 치환은 모 서열의 구조적 특성을 실질적으로 변화시키지 않는다(예를 들어, 대체 아미노산은 모 서열에서 발생하는 헬릭스를 파괴하거나 모 서열을 특징짓는 다른 유형의 이차 구조를 파괴해서는 안된다). 당업계에서 인식된 폴리펩티드 이차 및 삼차 구조의 예는 Proteins, Structures and Molecular Principles(Creighton, Ed., W.H.Freeman and Company, New York(1984)); Introduction to Protein Structure(C.Branden and J.Tooze, eds., Garland Publishing, New York, N.Y.(1991)); 및 Thornton et al., Nature 354:105(1991)에 개시되어 있으며, 이들은 모두 본원에 참고로 통합된다.
본원에서 이용될 때, 20개의 통상의 아미노산과 그들의 약자는 통상의 용법을 따른다. Immunology-A Synthesis (2nd Edition, E.S.Golub and D.R.Gren, Eds., Sinauer Associates, Sunderland, Mass.(1991), 본원에 참고로 통합됨)을 참고. 20개의 통상의 아미노산의 입체이성질체(예, D-아미노산), α-, α-이치환된 아미노산과 같은 비천연 아미노산, N-알킬 아미노산 및 기타 비통상적인 아미노산 또한 본 발명의 폴리펩티드의 적절한 성분이 될 수 있다. 비통상적인 아미노산의 예는 γ-카르복시글루타메이트, ε-N,N,N-트리메틸리신, ε-N-아세틸리신, O-포스포세린, N-아세틸세린, N-포르밀메티오닌, 3-메틸히스티딘, 5-히드록시리신, s-N-메틸아르기닌, 및 기타 유사한 아미노산과 이미노산(예, 4-하이드록시프롤린)을 포함한다. 본원에서 이용되는 폴리펩티드 표시법에서는, 표준 용법과 규약에 따라 왼쪽 방향은 아미노 말단 방향이고 오른쪽 방향은 카르복시-말단 방향이다.
단백질은, 만일 그 단백질의 코딩된 아미노산 서열이 다른 유기체의 단백질의 코딩된 아미노산 서열과 유사한 서열을 가지면 다른 유기체로부터의 단백질과 "상동성"을 갖거나 "상동성"이다. 다르게는, 단백질은, 만일 두 단백질이 유사한 아미노산 서열을 가지면 다른 단백질에 상동성을 갖거나 상동성이다. 두 단백질이 상동성이라고 말해지더라도, 이것이 이들 단백질간에 진화적 관련성이 반드시 존재함을 의미하는 것은 아니다. 대신, 용어 "상동성인"은 두 단백질이 유사한 아미노산 서열을 갖는 것을 의미하는 것으로 정의된다. 바람직한 구체에에서, 상동성 단백질은 야생형 단백질에 대해 적어도 50%, 60%, 또는 70% 서열 동일성을 나타내는 것이며, 보다 바람직하게는 상동성 단백질은 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 나타낸다. 또한, 많은 경우에 유사한 아미노산 서열을 가진 단백질이 유사한 기능을 가짐에도 불구하고, 용어 "상동성인"은 그 단백질들이 서로 기능적으로 유사해야함을 의미하는 것은 아니다.
"상동성인"이 단백질 또는 펩티드에 대해 사용될 경우, 동일하지 않은 잔기 부분은 종종 보존적 아미노산 치환에 의해 상이함이 인식된다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 화학적 특성(예, 전하 또는 소수성)을 가진 측쇄(R 기)를 갖는 다른 아미노산 잔기에 의해 치환된 것이다. 일반적으로, 보존적 아미노산 치환은 단백질의 기능적 특성을 실질적으로 변화시키지는 않을 것이다. 둘 이상의 아미노산 서열이 서로 보존적 치환에 의해 상이한 경우, 퍼센트 서열 동일성 또는 상동성 정도는 치환의 보존적 특성에 대해 교정하기 위해 상향 조정될 수 있다. 이러한 조절을 위한 수단은 당업계에 공지되어 있다.(예를 들어 본원에 참고로 통합되는 Pearson et al., 1994 참고)
다음 여섯 개의 그룹은 각각 서로를 위한 보존적 치환인 아미노산을 함유한다:
1. 세린(S), 트레오닌(T);
2. 아스파르트산(D), 글루탐산(E);
3. 아스파라긴(N), 글루타민(Q);
4. 아르기닌(R), 리신(K);
5. 이소루이신(I), 루이신(L), 메티오닌(M), 알라닌(A), 발린(V), 및
6. 페닐알라닌(F), 티로신(Y), 트립토판(W).
서열 동일성이라고도 하는, 폴리펩티드의 서열 상동성은 일반적으로 서열 분석 소프트웨어를 이용하여 측정된다. 예를 들어, 위스콘신 53705 메디슨 910 유니버시티 애브뉴에 소재하는 Genetics Computer Group(GCG)의 Sequence Analysis Software Package가 있다. 단백질 분석 소프트웨어는 지정된 상동성 측정을 이용하여 유사한 서열을 보존적 아미노산 치환을 포함한 다양한 치환, 결실 및 기타 변형에 매치시킨다. 예를 들어, GCG는 "Gap"과 "Bestfit"과 같은 프로그램을 함유하며, 이들은 디폴트 파라미터를 이용하여 유기체의 다른 종들로부터의 상동성 폴리펩티드와 같은 밀접하게 관련된 폴리펩티드간의 또는 야생형 단백질과 그것의 뮤테인간의 서열 상동성 또는 서열 동일성을 결정할 수 있다. 예를 들어 GCG Version 6.1 참고.
폴리펩티드 서열을 다른 유기체로부터의 많은 수의 서열을 함유하는 데이타베이스와 비교할 때 바람직한 알고리즘은 컴퓨터 프로그램 BLAST, 특히 blastp, tblastn 또는 BlastX이다. 본원에 참고로 통합되는 Altschul et al., Nucleic Acids Res.25:33893402(1997) 참고. 번역된 뉴클레오티드 서열을 단백질 데이타베이스와 비교하는 BlastX는 국립 생물공학 정보 센터에 위치한 서브를 통해 온라인으로 수행될 수도 있다. 단백질 서열을 단백질 데이타베이스와 비교하는 blastp를 위해 바람직한 파라미터는 다음과 같다:
기대 값: 10 (디폴트)
필터: seg (디폴트)
갭을 열기 위한 비용: 11(디폴트)
갭을 확장하기 위한 비용: 1(디폴트)
최대 배열: 100(디폴트)
단어 크기: 11(디폴트)
기재의 수: 100(디폴트)
페널티 매트릭스: BLOSUM62.
상동성을 위해 비교되는 폴리펩티드 서열의 길이는 일반적으로 적어도 약 16 아미노산 잔기, 대개 적어도 약 20 잔기, 보다 일반적으로 적어도 약 24 잔기, 통상적으로 적어도 약 28 잔기, 및 바람직하게는 약 35 잔기 이상일 것이다. 많은 수의 다른 유기체로부터의 서열을 함유하는 데이타베이스를 조사할 경우에는 아미노산 서열을 비교하는 것이 바람직하다.
아미노산 서열을 이용하는 데이타베이스 조사는 공지된 blastp외의 알고리즘에 의해 측정될 수 있다. 예를 들어, 폴리펩티드 서열은 GCG Version 6.1내의 프로그램인 FASTA를 이용하여 비교될 수 있다. FASTA는 문제 서열과 조사 서열간의 최상의 겹침의 영역의 배열 및 퍼센트 서열 동일성을 제공한다(Pearson, 1990, 본원에 참고로 통합됨). 예를 들어, 아미노산 서열간의 퍼센트 서열 동일성은 본원에 참고로 통합되는 GCG Version 6.1에 제공되는 대로, 디폴트 파라미터(단어 크기 2와 PAM250 점수매기기 매트릭스)를 가지고 FASTA를 이용하여 결정될 수 있다.
"항체"는 완전한(intact) 면역글로불린, 또는 항원 특이적 결합을 위해 완전한 항체와 경쟁하는 항원 결합 부분을 의미한다. 항원 결합 부분은 재조합 DNA 기법 또는 원래 항체의 효소적 또는 화학적 절단에 의해 생성될 수도 있다. 항원 결합 부분은 특히 Fab, Fab', F(ab')2, Fv, dAb, 및 상보성 결정 영역(CDR) 단편, 단일쇄 항체 (scFv), 키메라 항체, 디이아바디(diabodies), 및 폴리펩티드에의 특이적 항원 결합을 부여하기에 충분한 면역글로불린의 적어도 일부를 함유하는 폴리펩티드를 포함한다. Fab 단편은 VL, VH, CL 및 CH1 도메인으로 이루어진 일가 단편이며; F(ab')2 단편은 힌지 영역에서 디설파이드 가교에 의해 연결된 두 개의 Fab 단편을 포함하는 이가 단편이며; Fd 단편은 VH와 CH1 도메인으로 이루어지며; Fv 단편은 항체의 단일 암(arm)의 VL과 VH 도메인으로 이루어지며; dAb 단편(Ward et al., Nature 341:544-546, 1989)은 VH 도메인으로 이루어진다.
단일쇄 항체(scFv)는 VL과 VH 영역이 짝을 이루어 그들이 단일 단백질 쇄로 만들어지도록 하는 합성 링커를 통해 일가 분자를 형성하는 항체이다(Bird et al., Science 242:423-426, 1988 and Huston et al., Proc.Natl.Acad.Sci.USA 85:5879-5883, 1988). 다이아바디는 이가의 이특이적 항체로서, VH와 VL 도메인이 단일 폴리펩티드 쇄상에 발현되지만, 동일 쇄 상의 두 도메인간의 짝이루기를 허용하기에는 짧은 링커를 이용하여, 상기 도메인들이 다른 쇄의 상보성 도메인과 짝을 이루어 두 개의 항원 결합 부위를 형성하도록 한다.(예를 들어, Hollinger et al., Proc.Natl.Acad.Sci.USA 90:6444-6448, 1993, 및 Poljak et al., Structure 2:1121-1123, 1994 참고) 하나 이상의 CDR들을 공유적 또는 비공유적으로 분자내에 통합시켜 그 분자를 면역부착소(immunoadhesin)로 만든다. 면역부착소는 더 큰 폴리펩티드쇄의 일부로서 CDR을 통합할 수도 있으며, CDR을 다른 폴리펩티드 쇄에 공유적으로 연결시킬 수도 있으며, 또는 CDR을 비공유적으로 통합시킬 수도 있다. CDR은 면역부착소가 특정 관심 항원에 특이적으로 결합하도록 한다. 키메라 항체는 한 항체로부터의 하나 이상의 영역과 하나 이상의 다른 항체로부터의 하나 이상의 영역을 함유하는 항체이다.
항체는 하나 이상의 결합 부위를 가질 수도 있다. 하나보다 많은 결합 부위가 있으면, 이 결합 부위는 서로 동일할 수도 상이할 수도 있다. 예를 들어, 자연 발생 면역글로불린은 두 개의 동일한 결합 부위를 가지며, 단일쇄 항체 또는 Fab 단편은 하나의 결합 부위를 가지며, 반면 "이특이적" 또는 "이기능적" 항체는 두 개의 다른 결합 부위를 가진다.
"분리된 항체"는 (1) 그것이 천연 상태에서 수반하는, 자연에서 연합되어 있는 기타 항체를 포함한, 자연에서 연합되어 있는 성분과 연합되어 있지 않거나, (2) 동종으로부터의 다른 단백질이 없거나, (3) 이종으로부터의 세포에 의해 발현되거나, 또는 (4) 자연에서 발생하지 않는 항체이다.
"중화 항체" 또는 "억제성 항체"는 폴리펩티드의 활성을 억제하거나, 폴리펩티드가 그것에 정상적으로 결합하는 리간드에 결합하는 것을 차단하는 항체이다. 예를 들어, 중화 항-티오에스테라제 항체는 티오에스테라제의 활성을 차단하는 것일 수도 있다. "활성화 항체"는 폴리펩티드의 활성을 증가시키는 항체이다. 예를 들어, 활성화 항티오에스테라제 항체는 티오에스테라제의 활성을 증가시키는 것이다.
용어 "에피토프"는 면역글로불린 또는 T-세포 수용체에 대한 특이적 결합을 할 수 있는 임의의 단백질 결정 인자를 포함한다. 에피토프성 결정인자는 대개 아미노산 또는 당 측쇄와 같은, 분자의 화학적 활성 표면 그룹핑으로 이루어지고 대개 특이적 전하 특성뿐만 아니라 특이적 삼차원적 구조 특성을 갖는다. 항체는 해리 상수가 1 μM 이하, 바람직하게는 100 nM 이하, 가장 바람직하게는 10 nM 이하일 때 항원과 특이적으로 결합하는 것으로 말한다.
용어 "환자"는 사람과 가축을 포함한다.
본 명세서와 청구범위에 걸쳐, 단어 "포함하다", 또는 "포함하는"과 같은 변형은 기재된 정수 또는 정수의 그룹을 포함함을 의미하며, 임의의 다른 정수 또는 정수의 그룹을 배제하지는 않는다.
핵산 분자, 조절 서열, 벡터, 숙주 세포 및 폴리펩티드를 만드는 재조합 방
핵산 분자
한 태양에서, 본 발명은 티오에스테라제 또는 답토마이신 NRPS 또는 그 서브유닛을 코딩하는 핵산 분자를 제공한다. 한 구체예에서, 이 핵산 분자는 DptA, DptBC 또는 DptD 중 하나 이상을 코딩한다. 바람직한 구체예에서, 이 핵산 분자는 서열 번호 9, 11 또는 7의 아미노산 서열중 임의의 하나를 포함하는 폴리펩티드를 코딩한다. 다른 바람직한 구체예에서, 핵산 분자는 dptA, dptBC 및/또는 dptD를 포함한다. 추가의 바람직한 구체예에서, 핵산 분자는 서열 번호 10, 12 또는 3중의 어느 하나를 포함하는 핵산 서열을 포함한다.
다른 구체예에서, 이 핵산 분자는 답토마이신 생합성 유전자 클러스터로부터 유래된 티오에스테라제를 코딩한다. 바람직한 구체예에서, 이 핵산 분자는 유리 티오에스테라제이거나 통합 티오에스테라제인, 답토마이신 생합성 유전자 클러스터로부터 유래된 티오에스테라제를 코딩한다. 다른 바람직한 구체예에서, 이 핵산 분자는 DptH 또는 DptD의 티오에스테라제 도메인을 코딩한다. 보다 바람직한 구체예에서, 핵산 분자는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 포함하거나 서열 번호 8의 아미노산 서열을 갖는 폴리펩티드를 코딩한다. 다른 구체예에서, 핵산 분자는 답토마이신 생합성 유전자 클러스터로부터의 dptD의 티오에스테라제-코딩 도메인 또는 dptH를 포함한다. 다른 바람직한 구체예에서, 핵산 분자는 서열 번호 6 또는 서열 번호 3의 핵산 서열 또는 그것의 티오에스테라제-코딩 부분을 포함하는 영역을 포함한다. 다른 구체예에서, 핵산 분자는 또한 답토마이신 NRPS 또는 그 서브유닛을 코딩한다. dptA, dptBC, dptD 및 dptH와 답토마이신 생합성 유전자 클러스터의 다른 유전자들의 분리와 동정에 관한 실시예 1-6을 참고.
다른 구체예에서, 핵산 분자는 아실 CoA 리가제를 코딩한다. 바람직한 구체예에서, 핵산 분자는 DptE를 코딩하며, 바람직하게는 핵산 분자는 서열 번호 15를 코딩한다. 보다 바람직한 구체예에서, 핵산 분자는 dptE를 포함한다. 더욱 바람직한 구체예에서, 핵산 분자는 서열 번호 16을 포함한다. 다른 구체예에서, 핵산 분자는 아실 트랜스퍼라제를 코딩한다. 바람직한 구체예에서, 핵산 분자는 DptF를 코딩하며, 바람직하게는 핵산 분자는 서열 번호 17을 코딩한다. 보다 바람직한 구체예에서, 핵산 분자는 dptF를 포함한다. 더욱 바람직한 구체예에서, 핵산 분자는 서열 번호 18을 포함한다.
본 발명의 다른 구체예는 에스. 로제오스포루스로부터의 핵산 서열을 포함하는 박테리아 인공 염색체(BAC)로부터의 DNA 서열을 포함하는 핵산 분자를 제공한다. 바람직한 구체예에서, 핵산 분자는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05중 임의의 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함한다. 바람직한 구체예에서, 이 핵산 분자는 B12:03A05(ATCC 기탁번호 PTA-3140으로서 2001년 3월 1일에 기탁되었음)로부터의 에스. 로제오스포루스 핵산 서열을 포함한다. 핵산 분자는 BAC 클론 내의 전체 에스. 로제오스포루스 핵산 서열을 포함할 수도 있고 또는 그 일부를 포함할 수도 있다. 바람직한 구체예에서, 그 일부는 폴리펩티드, 바람직하게는 전길이 폴리펩티드를 코딩할 수 있는 핵산 서열 하나 이상을 포함하는 핵산 분자, 즉 그 개시 코돈부터 종결 코돈까지 폴리펩티드를 코딩하는 핵산 분자이다. 한 바람직한 구체예에서, 그 일부는 제한없이 dptA, dptBC, dptD, dptE, dptF, 또는 dptH와 같은 답토마이신 생합성에 관련된 폴리펩티드를 코딩하는 핵산 분자를 포함한다.
다른 구체예에서, BAC 클론으로부터의 일부는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136으로부터 선택된 폴리펩티드를 코딩하는 핵산 서열을 포함하는 핵산 분자이다. 다른 구체예에서, BAC 클론으로부터의 일부는 서열 번호 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135로부터 선택된 핵산 서열을 포함하는 핵산 분자이다.
서열 번호 110과 112의 아미노산 서열을 갖는 폴리펩티드는 답토마이신 생합성의 조절자이다. 스트렙토마이세스에서 생합성 경로의 기능을 위해서는 다수의 조절자가 필요하다(Bate et al., Chem.Biol., 6, 617-624, 1999; Baltz, Bioprocess Technol.22, 308-381, 1995). 예를 들어, 에스.하이그로스코피쿠스에서 바이아라포스를 위한 생합성 경로는 항생제 생산에 있어 긍정적 조절 역할을 가진 유전자 bprA를 함유한다(Raibaud et al., J.Bacteriol. 173, 4454-4463, 1991). 또한, 다양한 생산 균주에서 긍정적 조절인자 유전자의 카피 수를 증가시킴으로써 항생제 생산의 증가가 얻어질 수 있음이 보여졌다(예, S.lividans, Vogtli et al., Mol.Microbiol. 14, 643-653, 1994; in S.argillaceus, Lombo et al., J.Bacteriol. 181, 642-647, 1999 및 in S.peucetius, Otten et al., Microbiology 146, 1457-1468, 2000). 서열 번호 109의 뉴클레오티드 서열을 갖는 핵산 분자에 의해 코딩되는, 서열 번호 110의 조절성 활성 인자 폴리펩티드는 brpA 및 스트렙토마이세스에서 발견되는 다른 조절 단백질뿐만 아니라 정족수 감지(quorum sensing) 에 관련된 luxR-패밀리 단백질과도 동일성과 유사성을 공유한다. 이들 모두는 2-성분 전사 활성인자의 패밀리내의 DNA-결합 단백질이다(Kenney, Curr.Opin.Microbiol.5, 135-141, 2002). 따라서, 서열 번호 110의 조절 활성 인자 폴리펩티드는 에스. 로제오스포루스에서 답토마이신의 수율을 증대시키기 위해 이용될 수 있다. 조절 활성 인자 유전자 또는 그들의 생물학적 활성 부분은 통합성 또는 자가 복제 발현 벡터내로 클론되어, 하나 이상의 카피로 에스. 로제오스포루스내의 하나 이상의 중성 부위에 재도입될 수 있다. 트랜스제닉 균주는 실시예 9에 개시된 대로 발효되고 답토마이신 생산에 대해 분석될 수 있으며 야생형 균주보다 더 많은 양의 답토마이신을 생산하기 위해 이용될 수 있다.
서열 번호 111의 뉴클레오티드 서열에 의해 코딩되는 서열 번호 112의 아미노산 서열을 갖는 폴리펩티드는 다양한 대사물 억제제(LacI, rbsR, malR, REG1)뿐만 아니라 스트렙토마이세스 코엘리컬러로부터의 추정적 DeoR-패밀리 전사 조절인자와 상당한 양의 동일성 및 유사성을 공유한다. 이들 단백질은 프로모터 영역에 결합하여 전사를 막는다(Zeng and Saxlid, J.Bacteriol. 181, 1719-1729, 1999; Oskouian and Stewart, J.Bacteriol. 172, 3804-3812, 1990). 따라서, 이 유전자는 답토마이신 생합성의 부정적 조절인자이다. 따라서, 이 부정적 조절 인자 유전자의 파괴 또는 결실, 또는 그 단백질 생성물의 억제는 답토마이신의 구성적 발현 및/또는 증가된 수율을 야기할 것이다. 다른 구체예에서는, 부정적 조절 유전자를 결실시키고 여러 카피의 긍정적 조절 유전자를 삽입하여 답토마이신 생성을 더욱 증가시킬 수 있다.
서열 번호 19, 21, 29, 45, 47, 49, 63, 67, 75, 및 77의 아미노산 서열(서열 번호 20, 22, 30, 46, 48, 50, 64, 68, 76, 또는 78의 핵산 서열)을 갖는 폴리펩티드는 ABC 수송자이다. 이 폴리펩티드들 중 일부는 워커 모티프를 가진 펌프형 폴리펩티드인 반면, 다른 것들은 금속 제거(예, 철 또는 망간 수송(표 6과 7 참고))에서 역할을 하는 폴리펩티드이다. 서열 번호 76을 포함하는 핵산 분자는, 에스. 로체이의 (AAD44229.1)의 ORF 1과 에스.퓨세티스 DrrA(P32010) 유전자에 대한 서열 유사성에 의해 결정된 대로, ABC 수송자 시스템의 ATP-결합 성분을 코딩한다. 코딩된 폴리펩티드는 워커 A와 워커 B 모티프 둘다 갖는다. 또한, 그것의 합성은, 통합된 막 성분을 코딩하면서, 에스. 퓨티세우스 DrrB 생성물(AAA74718.1)에 대한 그 서열 유사성에 의해 결정된 대로, Drr-B-유사 폴리펩티드를 코딩하는 서열 번호 78을 포함하는 핵산 분자의 합성에 번역이 연결된 것으로 보인다. 서열 번호 21의 아미노산 서열을 갖는 폴리펩티드는 StrV 상동체인 한편, 서열 번호 19의 아미노산 서열을 갖는 폴리펩티드는 StrW 상동체이다. 예를 들어 상기의 Beyer et al., 1996 참고. StrV 상동체는 두 워커 모티프 모두를 갖는 반면, StrW 상동체는 단지 워커 B 모티프만을 갖는다. 이 폴리펩티드를 코딩하는 두 핵산 서열 모두 상보성 쇄에 있으며 번역에서 조절되는 것으로 보인다. 그들은 에스. 코엘리컬러 상동체, G8A.01과 G8A.02(emb│ CAB88931, CAB88932)를 갖는다. 표 6과 7 참고.
다른 태양에서, BAC 클론의 일부는 옥시도리덕타제(oxydoreductase); 디하이드로게나제(dehydrogenase); 항생제 내성에 관련된 전사 조절 인자; 항미생물제인 노보비오신의 생합성에 관련된, NovABC-관련 폴리펩티드; 모노옥시게나제(monooxygenase); 아실 CoA 티오에스테라제; DNA 헬리카제(helicase); DNA 리가제(ligase); 하이드롤라제(hydrolase); 열안정성 중성 프로테아제(protease); 답토마이신의 수송에서 유용한 ABC 수송자; 내생 포자 형성에 관련된 spoVK 유사 단백질; 세린 프로테아제; 및 중격화 및 포자 형성동안 DNA 분리에 관련되는 FtsK/SpoIIIE 유사 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자이다. 이들 핵산 분자와 코딩된 폴리펩티드는 답토마이신 생합성에 유용할 수도 있다; 예를 들어 아실 CoA 티오에스테라제는 티오에스테라제에 대해 전술한 이유때문에 유용할 수도 있고 또한 답토마이신의 펩티드 도메인에 지질 꼬리를 첨가하는 데 중요할 수도 있다. 효소를 코딩하는 이들 핵산 분자는 또한 다른 옥시도리덕타제, 디하이드로게나제, 모노옥시게나제, 하이드롤라제, 세린 또는 중성 프로테아제, DNA 헬리카제 또는 DNA 리가제가 당업계에서 사용되는 것과 동일한 방식으로 사용될 수 있기 때문에 유용하다. 주목할만하게, 전사 조절 인자는 공지 방법을 이용하여 돌연변이되어 답토마이신 또는 다른 항생제 내성을 증가 또는 감소시킬 수 있다. NovABC-관련 폴리펩티드를 코딩하는 핵산 분자는 NovABC가 당업계에서 이용되는 것과 동일한 방법으로, 예를 들어 노보비오신 또는 관련 항미생물 제제를 생산하기 위해 이용될 수도 있다. 전술한 활성을 갖는 폴리펩티드는 서열 번호 23, 25, 27, 29, 33, 35, 37, 91, 93, 97, 99, 104, 108, 114, 116, 118, 120, 130, 132, 134, 및 136의 아미노산 서열을 포함하며 서열 번호 24, 26, 28, 30, 34, 36, 38, 92, 94, 98, 100, 105, 107, 113, 115, 117, 119, 129, 131, 133 및 135의 핵산 서열에 의해 코딩된다.
다른 태양에서, BAC 클론의 일부는 일정한 기능을 갖지 않지만 다른 스트렙토마이세스로부터의 핵산 분자와 폴리펩티드에 매우 상동성인 폴리펩티드를 코딩하는 핵산 분자이다. 이들 핵산 분자(서열 번호 62, 66, 70, 80, 82, 84, 86, 88, 96, 102, 121, 123, 125 및 127), 그들이 코딩하는 폴리펩티드(서열 번호 61, 65, 69,79, 81, 83, 85, 87, 95, 101, 122, 124, 126 및 128) 및 이 폴리펩티드에 대한 항체를 이용하여, 예를 들어 미생물학적 시험 또는 법의학에 유용한 표준 분자 생물학 및 단백질 화학 기법을(예, PCR, RT-PCR, 서던 블롯팅, 노던 블롯팅, ELISA, 방사능면역분석 또는 웨스턴 블롯팅)을 이용하여 다른 스트렙토마이세스 종을 동정할 수 있다. 다른 구체예에서, BAC 클론의 일부는 일정한 기능을 갖지 않으며 다른 종으로부터의 핵산 분자와 폴리펩티드에 매우 상동성이 아닌 폴리펩티드를 코딩하는 핵산 분자이다. 그럼에도 불구하고, 이들 핵산 분자(서열 번호 32, 40, 42, 44, 52, 54, 56, 58, 60, 72 및 74)는 답토마이신 생합성 유전자 클러스터에 밀접하기 때문에 유용하며, 따라서 이들은 답토마이신 생합성 유전자 클러스터의 전부 또는 일부를 코딩하는 핵산 분자를 동정하기 위해 이용될 수 있다. 폴리펩티드를 코딩하지 않는 BAC 클론의 일부들은 동일한 이유로 유용하다. 또한, 서열 번호 31, 39, 41, 43, 51, 53, 55, 57, 59, 71 및 73의 아미노산 서열을 갖는 폴리펩티드는 에스. 로제오스포루스를 동정하기 위해 이용될 수 있는 항체를 만들기 위해 이용될 수 있다. 이 폴리펩티드는 임의의 다른 종에 매우 상동성이 아니므로, 이 항체는 에스. 로제오스포루스에 대해 매우 특이적일 것이다.
다른 태양에서, 본 발명은 전술한 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 바람직한 구체예에서, 본 발명은 DptA, DptBC, DptD 또는 DptH를 코딩하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 9, 11, 7 또는 8을 코딩하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 보다 바람직한 구체예에서, 본 발명은 dptA, dptBC, dptD 또는 dptH의 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 10, 12, 3 또는 6의 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05중 임의의 하나, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136을 코딩하는 핵산 분자 또는 서열 번호 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 전술한 핵산 서열의 임의의 것의 선택적 하이브리드화는 낮은 엄격도 하이브리드화 조건하에서 수행될 수도 있다. 바람직한 구체예에서, 선택적 하이브리드화는 높은 엄격도 하이브리드화 조건에서 수행된다. 본 발명의 바람직한 구체예에서, 하이브리드화하는 핵산 분자는 본 발명의 폴리펩티드를 재조합적으로 발현하기 위해 이용될 수도 있다.
다른 태양에서, 본 발명은 답토마이신 NRPS 또는 그 서브유닛, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 핵산 분자, 또는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05중 임의의 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함하는 핵산 분자에 상동성인 핵산 분자를 제공한다. 본 발명은 DptA, DptBC, DptD 또는 DptH를 코딩하는 핵산 분자에 상동성인 핵산 분자를 제공한다. 한 구체예에서, 이 핵산 분자는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산 분자에 상동성이다. 바람직한 구체예에서, 이 핵산 분자는 dptA, dptBC, 또는 dptD 중 어느 하나 이상에 상동성이다. 다른 구체예에서, 이 핵산 분자는 dptD의 티오에스테라제 도메인에 의해 또는 dptH에 의해 코딩되는 티오에스테라제에 상동성이다. 보다 바람직한 구체예에서, 이 핵산 분자는 서열 번호 10, 12, 3 또는 6의 핵산 서열을 갖는 핵산 분자에 상동성이다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136을 코딩하는 핵산 분자 또는 서열 번호 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자에 상동성인 핵산 분자를 제공한다. 바람직한 구체예에서, 상동성 핵산 분자는 본원에서 개시된 핵산 분자와 적어도 60%, 70%, 80%, 또는 85% 서열 동일성을 갖는 것이다. 보다 바람직한 구체예에서, 상동성 핵산 분자는 본원에서 개시된 핵산 분자와 적어도 90%, 95%, 97%, 98% 또는 99% 서열 동일성을 갖는 것이다. 또한, 한 구체예에서, 상동성 핵산 분자는 답토마이신 NRPS 또는 그 서브유닛, 티오에스테라제를 코딩하는 핵산 분자, 또는 본원에 개시된 폴리펩티드를 코딩하는 핵산 분자에 대해 전 길이에 걸쳐 상동성이다. 다른 구체예에서, 상동성 핵산 분자는 본원에서 개시된 핵산 분자에 대해 그 길이의 일부만에 걸쳐 상동성이며, 이때 그 일부는 핵산 분자의 적어도 50 뉴클레오티드, 바람직하게는 적어도 100 뉴클레오티드, 보다 바람직하게는 적어도 200 뉴클레오티드, 보다 더 바람직하게는 적어도 300 뉴클레오티드이다.
다른 구체예에서, 본 발명은 답토마이신 NRPS 또는 그 서브유닛, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 유전자의 대립유전자 변이체인 핵산, 또는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함하는 핵산 분자를 제공한다. 바람직한 구체예에서, 본 발명은 dptA, dptBC, dptD 또는 dptH의 대립유전자 변이체인 핵산을 제공한다. 보다 더 바람직한 구체예에서, 대립유전자 변이체는 유전자의 변이체이며, 이때 이 유전자는 DptA, DptBC, DptD 또는 DptH를 코딩한다. 다른 바람직한 구체예에서, 대립유전자 변이체는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자의 변이체이다. 또 다른 보다 바람직한 구체예에서, 대립유전자 변이체는 유전자의 변이체로서, 이때 그 유전자는 서열 번호 10, 12, 3 또는 6의 핵산 서열을 갖는다. dptH ,또는 dptD의 티오에스테라제의 대립유전자 변이체는 바람직하게는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖는 폴리펩티드의 활성과 비교하여 동일하거나 유사한 효소 활성을 가진 티오에스테라제를 코딩하거나 또는 서열 번호 8의 아미노산 서열을 갖는다. dptA, dptBC, 또는 dptD의 대립유전자 변이체는 바람직하게는 각각 서열 번호 9, 11 또는 7의 아미노산 서열을 갖는 답토마이신 NRPS와 동일한 활성을 갖는 폴리펩티드를 코딩한다. 다른 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136을 코딩하는 핵산 분자 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자의 대립유전자 변이체를 제공한다. 바람직한 구체예에서, 대립유전자 변이체는 폴리펩티드의 동일한 생물학적 활성을 갖는 폴리펩티드를 코딩한다; 예를 들어, 이 대립유전자는 ABC-수송자 활성을 갖는 폴리펩티드를 코딩한다.
본 발명의 다른 목적은 본 발명의 핵산 서열의 일부를 포함하는 핵산 분자를 제공하는 것이다. 본 발명은 답토마이신 NRPS, 그 서브유닛, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 핵산 분자의 일부, 또는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05 중 어느 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함하는 핵산 분자의 일부를 제공한다. 본 발명은 또한 전술한 선택적으로 하이브리드화하거나 또는 상동성인 핵산 분자의 일부를 제공한다. 본 발명은 전술한 핵산 분자의 대립유전자 변이체의 일부를 제공한다. 일부는 적어도 10 뉴클레오티드, 보다 바람직하게는 적어도 15, 20, 25, 30, 35, 40, 50, 100, 150, 200, 250, 또는 300 뉴클레오티드를 포함한다. 핵산 일부의 최대 크기는, 만일 그 핵산 분자가 하나보다 많은 유전자를 코딩한다면 전체 핵산 분자보다 1 뉴클레오티드 짧으며, 만일 그 핵산 분자가 단일 폴리펩티드를 코딩한다면 전길이 단백질을 코딩하는 핵산 분자보다 1 뉴클레오티드 짧다.
다른 태양에서, 하이브리드화하거나 상동성인 핵산 분자, 대립유전자 변이체, 또는 핵산 분자의 일부는 천연(야생형) 폴리펩티드와 동일한 생물학적 활성을 갖는 폴리펩티드를 코딩한다.
다른 태양에서, 본 발명은 하기하는 바와 같은 융합 단백질, 상동성 단백질, 폴리펩티드 단편, 뮤테인 또는 폴리펩티드 유사체를 코딩하는 핵산 분자를 제공한다.
본 발명의 핵산 분자는 단일 폴리펩티드 또는 다중 폴리펩티드를 코딩할 수 있다. 한 구체예에서, 본 발명은 다수의, 번역에서 연결된 폴리펩티드들을 코딩하는 핵산 분자, 예를 들어 DptA, DptBC, 및 DptD를 코딩하는 핵산 분자를 제공한다. 본 발명은 또한 에스. 로제오스포루스로부터 유래된 단일 폴리펩티드, 예를 들어, DptA, DptBC, 또는 DptD, 또는 그것의 폴리펩티드 단편, 뮤테인, 융합 단백질, 폴리펩티드 유사체 또는 상동성 단백질을 코딩하는 핵산 분자를 제공한다. 본 발명은 또한 발현 조절 서열과 같은, 다른 에스. 로제오스포루스 서열과 연합되어 있지 않은 핵산 서열을 제공한다.
일부 구체예에서, 본 발명의 핵산 분자는 플라스미드, 지정된 코스미드, pRHB153, pRHB157, pRHB159, pRHB160, pRHB161, pRHB162, pRHB166, pRHB168, pRHB169, pRHB170, pRHB172, pRHB173, pRHB174, pRHB599, pRHB602, pRHB603, pRHB613, pRHB614, pRHB680, pRHB678 또는 pRHB588(McHenney et al., J.Bacteriol.180:143-151(1998), 본원에 참고로 통합되며 이들 플라스미드 또는 코스미드중 임의의 것은 공지 기술의 일부이며 본 출원의 범위내에 속함)중 임의의 하나 이상을 포함하지 않을 수도 있다. 수행된 추가의 분석은 상기 McHenney et al.에서 언급된 플라스미드 또는 코스미드내의 답토마이신 삽입체의 일부의 위치와 배향이 정확하지 않음을 나타내었다.
발현 조절 서열
다른 구체예에서, 본 발명은 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 또는 답토마이신 NRPS를 코딩하는 핵산 서열을 포함하는 유전자로부터의 발현 조절 서열 하나 이상을 포함하는 핵산 분자를 제공한다. 바람직한 구체예에서, 이 핵산 분자는 답토마이신 NRPS 또는 dptH의 발현 조절 서열의 일부 또는 전부를 포함한다. 또 다른 보다 바람직한 구체예에서, 이 핵산 분자는 서열 번호 2 또는 5의 전부 또는 일부를 포함한다. 다른 바람직한 구체예에서, 이 핵산 분자는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05 중 어느 하나로부터의 에스. 로제오스포루스 핵산 서열로부터의 발현 조절 서열을 포함한다. 이론에 얽매임없이, 답토마이신 생합성 유전자 클러스터내의 dptA의 상부의 핵산 서열(서열 번호 2)은 dptA, dptBC, 및 dptD를 위한 천연 발현 조절 서열을 포함하는 것으로 생각된다. 또한, dptA, dptBC, 및 dptD를 위한 단일 전사물이 생성되고 DptA, DptBC, 및 DptD의 발현이 번역에서 연결되어 있는 것으로 생각된다.
바람직한 구체예에서, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 및/또는 답토마이신 NRPS를 코딩하는 핵산 서열을 포함하는 유전자의 전체 발현 조절 서열은 전사를 조절하기 위해 이용된다. 다른 구체예에서, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 및/또는 답토마이신 NRPS를 코딩하는 핵산 서열을 포함하는 유전자의 전체 발현 조절 서열의 일부만이 전사를 조절하기 위해 이용된다. 당업자는 공지 방법을 이용하여 전사를 조절하기 위해 유전자의 어느 부분을 사용할 것인지를 결정할 수 있다. 예를 들어, 답토마이신 NRPS 및/또는 티오에스테라제 유전자의 발현 조절 서열의 전부 또는 일부를 포함하는 핵산 서열을 리포터 유전자를 포함하는 벡터내로 연결시킬 수 있다. 그러한 리포터 유전자의 예는 제한없이 클로람페니콜 아세틸트랜스퍼라제(CAT), 루시퍼라제, 녹색 형광 단백질, β-갈락토시다제 등을 포함한다. 발현 조절 서열을 포함하는 핵산 분자는 그것이 리포터 유전자의 프로모터 또는 인핸서로 작용할 수 있도록 벡터내로 연결된다. 이 벡터는 숙주 세포내로 도입되고 발현이 유도된다. 이어서, 이 발현 조절 서열의 일부가 전사를 활성화시키거나 조절하기에 충분한지를 결정하기 위하여 리포터 유전자 생성물의 생산을 분석할 수 있다. 핵산 서열이 전사를 조절하기에 충분한지를 결정하는 방법은 일상적이며 당업계에 공지되어 있다. 예를 들어, 상기한 Ausubel et al.,을 참고.
본원에서 개시된 발현 조절 서열의 전부 또는 일부, 또는 이들 발현 조절 서열 또는 그 일부 다수 카피를 포함하는 핵산 분자는 두번째 핵산 분자에 작동적으로 연결되어 두번째 핵산 분자의 전사를 조절할 수도 있다. 한 구체예에서, 본 발명은 일반적으로 에스. 로제오스포루스에 의해 발현되지 않는 폴리펩티드를 코딩하는 핵산 분자와 같은 이종성 핵산 분자에 작동적으로 연결된 발현 조절 서열을 포함하는 핵산 분자를 제공한다. 다른 바람직한 구체예에서, 발현 조절 서열을 포함하는 핵산 분자는 벡터, 바람직하게는 박테리아 벡터내로 삽입된다. 보다 바람직한 구체예에서, 이 벡터는 박테리아 숙주 세포, 보다 바람직하게는 스트렙토마이세스 또는 이. 콜라이내로, 보다 더 바람직하게는 에스. 로제오스포루스, 에스. 리비단스 또는 에스. 프라디에 숙주 세포내로 도입된다.
본 발명은 또한 답토마이신 NRPS에 관련된 폴리펩티드와 답토마이신 생합성 유전자 클러스터로부터 유래된 티오에스테라제를 코딩하는 핵산 서열 또는 본원에 개시된 BAC 클론 또는 그 일부로부터의 핵산 분자와 작동적으로 연결된 본원에 개시된 에스. 로제오스포루스로부터의 발현 조절 서열을 포함하는 핵산 서열을 제공한다. 이 발현 조절 서열은 DptA, DptBC, DptD 또는 DptH를 코딩하는 핵산 분자, 또는 본 발명의 BAC 클론, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 서열에서 유래한 폴리펩티드를 코딩하는 핵산 분자, 또는 그 단편, 상동성 단백질, 뮤테인, 유사체, 유도체 또는 융합 단백질을 코딩하는 핵산 분자에 작동적으로 연결될 수 있다. 발현 조절 서열은 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 핵산 서열 또는 그 단편에 작동적으로 연결될 수도 있다. 바람직하게는, 발현 조절 서열은 dptA, dptBC, dptD 또는 dptH 중 하나 이상의 코딩 영역에 작동적으로 연결된다. 보다 바람직한 구체예에서, 발현 조절 서열은 서열 번호 10, 12, 3 또는 6에서 선택된 핵산 서열 또는 그 일부에 작동적으로 연결된다. 본 발명은 또한 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산을 포함하는 폴리펩티드의 코딩 영역 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자에 작동적으로 연결된 발현 조절 서열을 제공한다.
다른 구체예에서, 본 발명은 답토마이신 NRPS, 그 서브유닛, 모듈 또는 도메인, 티오에스테라제를 코딩하는 핵산 분자, 또는 본 발명의 BAC 클론으로부터의 에스. 로제오스포루스 서열에서 유래한 폴리펩티드를 코딩하는 핵산 분자의 전사를 지시하는 발현 조절 서열 하나 이상을 포함하는 핵산 분자를 제공하며, 이때 이 발현 조절 서열은 답토마이신 생합성 유전자 클러스터에서 유래한 것이 아니다. 적합한 발현 조절 서열의 예는 하기에서 개시된다.
발현 벡터, 숙주 세포 및 폴리펩티드를 생성하는 재조합 방법
핵산 서열은 그들을 적절한 발현 벡터내의 발현 조절 서열에 작동적으로 연결시키고 이 발현 벡터를 이용하여 적절한 단세포 숙주를 형질전환시킴으로써 발현될 수도 있다. 발현 조절 서열은 핵산 서열의 전사, 전사후 사건들 및 번역을 조절하는 서열이다. 본 발명의 핵산 서열을 발현 조절 서열에 작동적으로 연결시키는 것은 물론 이미 그 핵산 서열의 일부가 아니라면, 번역 개시 코돈, ATG 또는 GTG를 그 핵산 서열의 상부에 정확한 리딩 프레임으로 제공하는 것을 포함한다.
광범위한 숙주/발현 벡터 조합을 이용하여 본 발명의 핵산 서열을 발현시킬 수 있다. 예를 들어, 유용한 발현 벡터는 염색체, 비염색체 및 합성 핵산 서열의 단편으로 구성될 수도 있다.
바람직한 구체예에서, 본 발명의 핵산 분자를 발현시키기 위하여 박테리아 숙주 세포가 이용된다. 박테리아 숙주를 위한 유용한 발현 벡터는 pBluescript, pGEX-2T, pUC 벡터, col E1, pCR1, pBR322, pMB9 및 그 유도체를 포함한, 이. 콜라이 또는 스트렙토마이세스로부터의 플라스미드와 같은 박테리아 플라스미드, 예를 들어 파아지 람다의 많은 유도체(예, NM989, λGT10 및 λGT11)와 같은 파아지 DNA와 RP4와 같은 더 광범위한 숙주 범위 플라스미드, 및 기타 파아지(예, M13과 방사상 단일 쇄 파아지 DNA)를 포함한다. 바람직한 벡터는 박테리아 인공 염색체(BAC)이다. 보다 바람직한 벡터는 실시예 2에 개시된 pStreptoBAC이다.
다른 구체예에서, 효모, 곤충 또는 포유류 세포와 같은 진핵 숙주 세포가 이용될 수도 있다. 효모 벡터는 효모 통합 플라스미드(예, YIp5) 및 효모 복제 플라스미드(YRp와 YEp 시리즈 플라스미드), 효모 센트로미어 플라스미드(YCp 시리즈 플라스미드), pGPD-2, 2μ 플라스미드와 그 유도체, 및 Gietz and Sugino, Gene, 74, pp.527-34(1988)에 개시된 것들과 같은 개량된 셔틀 벡터(YIplac, YEplac 및 YCplac)를 포함한다. 포유류 세포에서의 발현은 pSV2, pBC12BI, 및 p91023를 포함한 다양한 벡터와 용균성 바이러스 벡터(예, 백시니아 바이러스, 아데노 바이러스, 및 배큘로바이러스), 에피좀 바이러스 벡터(예, 보바인 파필로마바이러스), 및 레트로바이러스 벡터(예, 쥐과 레트로바이러스)를 이용하여 이룰 수 있다. 곤충 세포를 위한 유용한 벡터는 배큘로바이러스 벡터와 pVL 941을 포함한다.
또한, 광범위한 발현 조절 서열의 어느 하나를 이들 벡터에서 이용하여 본 발명의 DNA 서열을 발현시킬 수 있다. 그러한 유용한 발현 조절 서열은 전술한 발현 벡터들의 구조 유전자와 연합된 발현 조절 서열을 포함한다. 전사를 조절하는 발현 조절 서열은 예를 들어 프로모터, 인핸서, 및 전사 종결 부위를 포함한다. 전사후 사건들을 조절하는 진핵 세포내의 발현 조절 서열은 스플라이스 공여자 부위와 수용자 부위 및 전사된 RNA의 반감기를 변형시키는 서열(예, 폴리(A) 첨가를 지시하는 서열 또는 RNA-결합 단백질을 위한 결합 부위)을 포함한다. 번역을 조절하는 발현 조절 서열은 리보솜 결합 부위, 폴리펩티드의 표적화된 발현을 특정 세포 부위로 지시하는 서열, 및 번역의 속도 또는 효율을 변형시키는 5' 및 3' 비번역 영역내의 서열을 포함한다.
유용한 발현 조절 서열의 예는 예를 들어, SV40 또는 아데노바이러스의 초기 및 후기 프로모터, lac 시스템, trp 시스템, TAC 또는 TRC 시스템, T3 및 T7 프로모터, 파아지 람다의 주요 오퍼레이터 및 프로모터 영역, fd 피막 단백질의 조절 영역, 3-포스포글리서레이트 키나제 또는 다른 당분해 효소를 위한 프로모터, 산 포스파타제의 프로모터(예, Pho5), 효모 α-접합 시스템의 프로모터들, GAL1 또는 GAL10 프로모터, 및 원핵 또는 진핵 세포 또는 그들의 바이러스의 유전자의 발현을 조절하는 것으로 알려진 다른 구성적 및 유도성 프로모터 서열, 및 그들의 다양한 조합을 포함한다. 다른 발현 조절 서열은 상기에서 개시된 것과 같은, 답토마이신 생합성 유전자 클러스터로부터의 것들을 포함한다.
바람직한 핵산 벡터는 또한 선별가능한 또는 증폭가능한 마커 유전자 및 관심 유전자의 카피수를 증폭시키기 위한 수단을 포함한다. 그러한 마커 유전자는 공지되어 있다. 핵산 벡터는 또한 안정화 서열(예, ori- 또는 ARS-유사 서열 및 텔로미어-유사 서열)을 포함할 수도 있으며, 또는 다르게는 숙주 세포 게놈내로의 지시되거나 지시되지 않은 통합을 선호하도록 고안될 수도 있다. 바람직한 마커 유전자와 안정화 서열은 pStreptoBAC에 개시되며, 이는 실시예 2에 개시된다. 바람직한 구체예에서, 본 발명의 핵산 서열은 원하는 코딩된 핵산 서열을 포함하는 단백질을 코딩하는 RNA의 고농도 발현을 허용하는 발현 벡터내로 인프레임으로 삽입된다. 핵산 클로닝과 서열화 방법은 공지되어 있으며 Sambrook et al., supra 1989; 및 Ausubel et al.을 포함한 실험 매뉴얼에 개시되어 있다. 생물학적, 화학적 및 면역학적 시약의 제조자로부터의 제품 정보 또한 유용한 정보를 제공한다. 실시예 2는 바람직한 핵산 클로닝과 서열 결정 방법을 제공한다.
물론, 모든 벡터와 발현 조절 서열이 본 발명의 핵산 서열을 발현하기 위해 똑같이 잘 작용하지는 않을 것이다. 모든 숙주 또한 동일한 발현 시스템으로 똑같이 잘 작용하지는 않을 것이다. 하지만, 당업자는 과도한 실험없이 그리고 본 발명의 범위를 벗어남 없이, 이들 벡터, 발현 조절 서열 및 숙주중에서 선택할 수 있을 것이다. 예를 들어, 벡터를 선택함에 있어, 벡터는 숙주 세포내에서 복제되어야 하므로 숙주가 고려되어야 한다. 벡터의 카피수, 그 카피수를 조절하는 능력, 통합을 조절하는 능력, 및 항생제 또는 기타 선별 마커와 같은, 그 벡터에 의해 코딩되는 임의의 다른 단백질의 발현 또한 고려되어야 한다.
발현 조절 서열을 선택함에 있어서, 다양한 인자가 또한 고려되어야 한다. 이들은 예를 들어, 서열의 상대적 강도, 그것의 조절성, 및 본 발명의 핵산 서열과의 양립성, 특히 가능한 2차 구조에 관한 양립성을 포함한다. 단세포 숙주는 선택된 벡터와의 그들의 양립성, 본 발명의 핵산 서열에 의해 코딩되는 생성물의 독성, 그들의 분비 특성, 그들이 폴리펩티드를 정확하게 접는 능력, 그들의 발효 또는 배양 요건, 및 그들로부터 본 발명의 핵산 서열에 의해 코딩되는 생성물의 정제의 용이성을 고려하여 선택되어야 한다.
재조합 핵산 분자 및 특히, 본 발명의 발현 벡터는 본 발명의 폴리펩티드를 이종성 숙주 세포에서 재조합 폴리펩티드로 발현시키기 위해 이용될 수도 있다. 본 발명의 폴리펩티드는 전길이 일수도 있고, 또는 본 발명에 따른 핵산 서열로부터 재조합적으로 발현된 전길이 폴리펩티드 단편보다 짧을 수도 있다. 그러한 폴리펩티드는 생물학적 활성을 가질 수도 갖지 않을 수도 있는, 유사체, 유도체 및 뮤테인을 포함한다. 바람직한 구체예에서, 이 폴리펩티드는 이종성 박테리아 숙주 세포에서 발현된다. 보다 바람직한 구체예에서, 폴리펩티드는 이종성 스트렙토마이세스 숙주 세포에서 발현되며, 보다 더 바람직하게는 에스. 리비단스 또는 에스. 프라디에 숙주 세포에서 발현된다. 예를 들어 하기의 실시예 7을 참고하라.
형질전환 및 핵산을 숙주 세포내로 도입하는 다른 방법들(예, 접합, 원형질 형질전환 또는 융합, 형질감염, 전기천공, 리포좀 전달, 막융합 기법, 고속 DNA-피복 펠릿, 바이러스 감염 및 원형질체 융합)은 공지된 다양한 방법들에 의해 이루어질 수 있다(예를 들어, Ausubel, supra and Sambrook et al., supra 참고). 박테리아, 효모, 식물, 또는 포유류 세포는 플라스미드, 코스미드, 등과 같은 발현 벡터로 형질전환 또는 형질감염되며, 이때 발현 벡터는 관심 핵산을 포함한다. 다르게는, 이들 세포는 관심 핵산을 포함하는 바이러스 발현 벡터에 의해 감염될 수도 있다. 숙주 세포, 벡터, 및 이용되는 형질전환 방법에 의존하면서, 일시적 또는 안정한 폴리펩티드 발현은 구성적이거나 유도성일 것이다. 당업자는 폴리펩티드를 일시적으로 발현시킬 것인지 또는 안정한 방식으로 발현시킬 것인지, 그리고 단백질을 구성적으로 또는 유도성으로 발현시킬 것인지를 결정할 수 있을 것이다.
광범위한 단세포 숙주 세포가 본 발명의 DNA 서열을 발현시키는 데 유용하다. 이들 숙주는 이. 콜라이, 슈도모나스, 바실러스, 스트렙토마이세스, 진균류, 효모, 곤충 세포(예, 스포돕테라 프루지페르다(SF9)), 동물 세포(예, CHO, BHK, MDCK) 및 다양한 쥐과 세포(예, 3T3과 WEHI 세포), 아프리카 녹색 원숭이 세포(예, COS1, COS7, BSC1, BSC 40, 및 BMT10), 및 인간 세포(VERO, WI38 및 HeLa 세포) 및 조직 배양한 식물 세포와 같은 공지된 진핵 및 원핵 숙주를 포함할 수 있다. 바람직한 구체예에서, 숙주 세포는 스트렙토마이세스이다. 보다 바람직한 구체예에서, 숙주 세포는 에스. 로제오스포루스, 에스. 리비단스 또는 에스. 프라디에이다.
형질감염, 재조합 단백질의 발현과 정제의 세부적 사항은 문헌에 잘 기재되어 있으며 당업자가 이해한다. 박테리아 세포 발현 시스템에서 외래 유전자를 재조합 생산하는 데 이용되는 각 단계의 다양한 기술적 태양의 상세 사항은 당업계의 많은 교과서와 실험 매뉴얼에서 발견될 수 있다. 예를 들어, Ausubel et al., supra, and Sambrook et al., supra, and Kieser et al., supra를 참고하며 이들은 참고로 본원에 통합된다.
폴리펩티드
티오에스테라제와 그 단편
본 발명의 다른 목적은 답토마이신 합성에 관련된 티오에스테라제로부터 유래된 폴리펩티드를 제공하는 것이다. 한 구체예에서, 이 폴리펩티드는 답토마이신 생합성 유전자 클러스터로부터 유래된다. 바람직한 구체예에서, 이 폴리펩티드는 통합 또는 유리 티오에스테라제로부터 유래된다. 보다 바람직한 구체예에서, 이 폴리펩티드는 DptD의 티오에스테라제 도메인 또는 DptH의 아미노산 서열을 포함한다. 보다 더 바람직한 구체예에서, 이 폴리펩티드는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열 또는 서열 번호 8의 아미노산 서열을 포함한다. 티오에스테라제로부터 유래된 폴리펩티드는 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 클론, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩될 수도 있다. 본원에서 개시된 폴리펩티드는 전술한 바대로 재조합적으로 생성될 수도 있고, 자연적으로 그 단백질을 발현하는 세포로부터 분리될 수도 있고, 또는 명세서의 기재에 따라 공지된 방법을 이용하여 화학적으로 합성될 수도 있다. 예를 들어 실시예 3-6을 참고.
이 폴리펩티드는 본원에서 정의된 티오에스테라제의 단편을 포함할 수도 있다. 전체 티오에스테라제의 단편 또는 일부만을 포함하는 폴리펩티드는 티오에스테라제 활성을 갖는 폴리펩티드를 코딩할 수도 코딩하지 않을 수도 있다. 티오에스테라제 활성을 갖지 않는 폴리펩티드는, 그것이 단편, 유사체, 뮤테인, 상동성 단백질 또는 유도체인지 여부에 관계없이 유용하며, 특히 항-티오에스테라제 항체를 제조하기 위해 동물을 면역시킬때 유용하다. 하지만, 바람직한 구체예에서, 일부 또는 단편은 티오에스테라제 활성을 갖는 폴리펩티드를 코딩한다. 폴리펩티드가 티오에스테라제 활성을 갖는 지 여부를 결정하는 방법은 하기에 개시된다. 또한, 바람직한 구체예에서, 이 단편은 GXSXG 티오에스테라제 모티프를 포함하는 아미노산 서열을 포함한다(실시예 3 참고). 보다 바람직한 구체예에서, 단편은 티오에스테라제 모티프 GWSFG 또는 GTSLG를 포함하는 아미노산 서열을 포함하며, 이들 모티프는 각각 서열 번호 7의 티오에스테라제 도메인 또는 서열 번호 8의 아미노산 서열로부터 유래한다.
티오에스테라제를 코딩하는 DNA를 절단시키고 이어서 그것을 재조합적으로 발현시킴으로써 티오에스테라제를 코딩하는 폴리펩티드의 단편을 생산할 수 있다. 다르게는, 전길이 폴리펩티드의 일부를 화학적으로 합성함으로써 단편을 생산할 수 있다. 또한 재조합 폴리펩티드 또는 분리된 자연 발생 폴리펩티드를 효소로 절단함으로써 단편을 생산할 수 있다. 폴리펩티드 단편을 생산하는 방법은 공지되어 있다(예를 들어 Ausubel et al., supra, and Sambrook et al., supra, 참고). 한 구체예에서, 티오에스테라제의 단지 일부 또는 단편만을 포함하는 폴리펩티드는 티오에스테라제를 화학적으로 또는 효소를 이용하여 절단하여 생성할 수도 있다. 바람직한 구체예에서, 폴리펩티드 단편은 티오에스테라제의 단편을 코딩하는 핵산 분자를 숙주 세포에서 발현시켜 생산할 수 있다.
답토마이신 NRPS 폴리펩티드, 및 그 서브유닛과 단편
본 발명의 다른 목적은 답토마이신 NRPS 또는 그 서브유닛에서 유래된 폴리펩티드를 제공하는 것이다. 답토마이신 NRPS는 서브유닛 DptA, DptBC, 및 DptD를 포함한다. 하기의 실시예 3-6에서 보다 상세하게 개시되는 바와 같이, 각 서브유닛은 특이적 빌딩 블록 기질에 결합하여 활성화시키고 펩티드 쇄 형성과 연장을 촉매하는 많은 모듈을 포함한다. 또한, 각 모듈은 축합, 아데닐화 및 티올화에 참여하는 많은 도메인을 포함한다. 또한, 실시예 6에서 보다 상세하게 개시되는 바와 같이, 일부 모듈은 에피머화 도메인을 포함한다. DptD는 또한 실시예 5와 상기에서 개시되는 바처럼 티오에스테라제 도메인을 포함한다.
한 구체예에서, 이 폴리펩티드는 DptA, DptBC, 및/또는 DptD로부터의 아미노산 서열을 포함한다. 보다 더 바람직한 구체예에서, 폴리펩티드는 서열 번호 9, 11 또는 7의 아미노산 서열을 포함한다. 답토마이신 NRPS 폴리펩티드는 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 클론, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩될 수도 있다. 본원에 개시된 폴리펩티드는 전술한 대로 재조합적으로 생산될 수도 있고, 자연적으로 그 단백질을 발현하는 세포로부터 분리될 수도 있고, 또는 명세서의 기재에 따라 공지된 방법을 이용하여 화학적으로 합성될 수도 있다. 예를 들어, DptA, DptBC, 및 DptD의 모듈과 도메인뿐만 아니라 아미노산 서열에 관해서는 실시예 3-6을 참고.
폴리펩티드는 본원에서 정의한 답토마이신 NRPS의 단편을 포함할 수도 있다. 한 구체예에서, 이 단편은 답토마이신 NRPS 서브유닛의 하나 이상의 완전한 모듈을 포함한다. 다른 구체예에서, 단편은 답토마이신 NRPS 서브유닛의 도메인 하나 이상을 포함한다. 또 다른 구체예에서, 단편은 완전한 도메인 또는 모듈을 포함하지 않을 수도 있으나, 하나 이상의 도메인 또는 모듈의 일부만을 포함할 수도 있다. 답토마이신 NRPS의 전체 도메인 또는 모듈을 포함하지 않는 폴리펩티드는 그것이 단편, 유사체, 뮤테인, 상동성 단백질 또는 유도체인지 여부에 관계없이 유용하며, 특히 항-티오에스테라제 항체를 제조하기 위해 동물을 면역시킬 때 유용하다. 보다 바람직한 구체예에서, 이 단편은 아미노산에 결합하는 데 필요한 아데닐화 도메인의 적어도 일부를 포함하는 아미노산 서열을 포함한다. 도메인의 이 일부는 하기 실시예 5에서 개시되는 바와 같이, 특정 아데닐화 도메인의 아미노산 포켓 코드에 의해 범위가 정해진다.
전술한 대로, 본 발명의 폴리펩티드의 단편을 재조합적으로, 화학적 합성에 의해, 또는 효소 절단에 의해 생산할 수 있다.
에스. 로제오스포루스 BAC 클론으로부터의 폴리펩티드
본 발명의 다른 목적은 본 발명의 에스. 로제오스포루스 BAC 클론으로부터의 핵산 또는 그 일부에 의해 코딩되는 폴리펩티드를 제공하는 것이다. 한 구체예에서, 본 발명은 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05로부터의 핵산 분자 또는 그 일부에 의해 코딩되는 폴리펩티드를 제공한다. 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 포함하는 폴리펩티드 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자에 의해 코딩되는 폴리펩티드를 제공한다. 다른 바람직한 구체예에서, 본 발명은 DptE 또는 DptF인 폴리펩티드, 서열 번호 15 또는 17의 아미노산 서열을 갖는 폴리펩티드, 또는 dptE 또는 dptF에 의해 코딩되거나 서열 번호 16 또는 18의 핵산 서열에 의해 코딩되는 폴리펩티드를 제공한다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 29, 45, 47, 49, 63, 67, 75, 및 77의 아미노산 서열을 포함하거나 서열 번호 20, 22, 30, 46, 48, 50, 64, 68, 76, 또는 78의 핵산 서열에 의해 코딩되는 ABC 수송자를 제공한다. 다른 바람직한 구체예에서, 본 발명은 디하이드로게나제와 같은 옥시도리덕타제; 항생제 내성에 관련된 전사 조절 인자; 항미생물제인 노보비오신의 생합성에 관련된, NovABC-관련 폴리펩티드; 모노옥시게나제; 아실 CoA 티오에스테라제; DNA 헬리카제; 또는 DNA 리가제인 폴리펩티드를 제공하며, 그 예로는 서열 번호 23, 25, 27, 29, 33, 35, 37, 91, 93, 97 및 99로부터 선택된 아미노산 서열을 갖는 폴리펩티드에 의해 제공되는 것들이 있다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 61, 65, 69, 79, 81, 83, 85, 87, 95, 및 101로부터 선택된 아미노산 서열을 갖는 폴리펩티드에 의해 제공되는 것과 같은, 스트렙토마이세스 폴리펩티드에 매우 상동성인 폴리펩티드를 제공한다. 본원에서 정의된 폴리펩티드는 전술한 대로 재조합적으로 생산될 수도 있고, 자연적으로 그 단백질을 발현하는 세포로부터 분리될 수도 있고, 또는 명세서의 기재에 따라 공지된 방법을 이용하여 화학적으로 합성될 수도 있다. 본 발명은 또한 본원에서 정의된 BAC 클론으로부터의 폴리펩티드를 코딩하는 핵산 분자의 단편을 포함하는 폴리펩티드를 제공한다. 전술한 대로, 본 발명의 폴리펩티드의 단편을 재조합적으로, 화학적 합성에 의해 또는 효소 절단에 의해 생성할 수 있다.
뮤테인, 상동성 단백질, 대립유전자 변이체, 유사체 및 유도체
본 발명의 다른 목적은 답토마이신 NRPS, 그 서브유닛, 또는 티오에스테라제또는 에스. 로제오스포루스 BAC 핵산 분자 또는 그 일부에 의해 코딩되는 폴리펩티드 또는 그 일부의 돌연변이 단백질(뮤테인), 융합 단백질, 상동성 단백질 또는 대립유전자 변이체인 폴리펩티드를 제공하는 것이다. 돌연변이 티오에스테라제는 자연발생 티오에스테라제와 비교하여 동일하거나 상이한 효소 활성을 가질 수도 있고 천연 단백질의 아미노산 서열과 비교하여 적어도 하나의 아미노산 삽입, 중복, 결실, 재배열 또는 치환을 포함한다. 한 구체예에서, 뮤테인은 자연 발생 티오에스테라제와 비교하여 동일하거나 감소된 티오에스테라제 활성을 갖는다. 다른 구체예에서, 돌연변이 티오에스테라제는 자연 발생 티오에스테라제와 비교하여 증가된 티오에스테라제 활성을 갖는다. 바람직한 구체예에서, 답토마이신 생합성 유전자 클러스터의 티오에스테라제의 뮤테인은 티오에스테라제 활성을 변화시키기 위해 이용될 수 있다. 예를 들어 실시예 12와 13을 참고. 다른 구체예에서, 돌연변이 답토마이신 NRPS 또는 그 서브유닛은 자연 발생 답토마이신 NRPS와 동일하거나 상이한 아미노산 특이성, 티올화 활성, 축합 활성, 또는 존재한다면 에피머화 활성을 가질 수도 있다. 답토마이신 NRPS 뮤테인은 NRPS의 아미노산 인식, 결합, 에피머화 또는 다른 촉매적 특성을 바꾸기 위해 이용될 수도 있다. 예를 들어 실시예 12와 16 참고. 유사하게, 본 발명의 에스. 로제오스포루스 BAC 핵산 분자에 의해 코딩되는 폴리펩티드의 뮤테인은 유사한 생물학적 활성 또는 상이한 활성을 가질 수도 있으나, 바람직하게는 유사한 생물학적 활성을 갖는다.
본 발명의 뮤테인은 자연 발생 돌연변이 미생물로부터 또는 실험적으로 돌연변이 유발된 미생물로부터 분리하여 얻을 수도 있으며, 폴리펩티드를 화학적으로 조작하여 생산할 수도 있고, 또는 변화된 핵산 분자를 포함하는 숙주 세포로부터 생산될 수도 있다. 바람직한 구체예에서, 뮤테인은 바뀐 핵산 분자를 포함하는 숙주 세포로부터 생산된다. 뮤테인은 또한 합성 또는 반-합성 화학 기법을 이용하여 아미노산 잔기를 다른 아미노산 잔기로 바꿈으로써 화학적으로 생산될 수도 있다. 답토마이신 NRPS, 그 서브유닛 또는 티오에스테라제를 코딩하는 핵산 서열내로 또는 에스. 로제오스포루스 BAC 핵산 분자내로 돌연변이를 도입하고 이어서 그것을 재조합적으로 발현하여 폴리펩티드의 뮤테인을 생산할 수도 있다. 이들 돌연변이는 특정 코딩된 아미노산이 바뀌도록 표적화될 수도 있고, 또는 폴리펩티드내의 임의의 코딩된 아미노산이 바뀌도록 비표적화될 수도 있다. 임의의 아미노산 변화를 가진 뮤테인은 하기하는 바처럼, 티오에스테라제 활성, 아미노산 특이성, 티올화 활성, 에피머화 활성, 또는 축합 활성과 같은 특정 생물학적 활성에 대해 검사될 수 있다. 뮤테인은 또한 공지의 방법을 이용하여, 예를 들어 옥시도리덕타제 활성, ABC 수송자 활성, 모노옥시게나제 활성, 또는 DNA 리가제 또는 헬리카제 활성에 대해 검사될 수 있다. 다수의 임의 돌연변이는 예를 들어 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지시된 돌연변이 유발, 어셈블리 PCR, 성적 PCR 돌연변이 유발, 생체내 돌연변이 유발, 카세트 돌연변이 유발, 순환적 앙상블 돌연변이 유발, 지수적 앙상블 돌연변이 유발 및 부위-특이적 돌연변이 유발에 의해 유전자내로 도입될 수 있다. 표적화된 또는 임의 아미노산 변화를 가진 뮤테인을 생성하는 방법은 공지되어 있다. 예를 들어 Sambrook et al., supra, Ausubel et al., supra, 미국 특허 제5,223,408호 및 전술한 참고문헌들을 참고할 수 있으며 이들은 모두 참고로 본원에 통합된다.
본 발명은 또한 답토마이신 NRPS, 그 서브유닛, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제, 또는 본원에 개시된 에스. 로제오스포루스 BAC 핵산 분자에 의해 코딩되는 폴리펩티드에 상동성인 폴리펩티드를 제공한다. 한 구체예에서, 이 폴리펩티드는 DptD의 티오에스테라제 도메인에 또는 DptH에, 또는 dptD의 티오에스테라제 도메인 또는 dptH에 의해 코딩된 폴리펩티드에 상동성이다. 바람직한 구체예에서, 폴리펩티드는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖거나 서열 번호 8의 아미노산 서열을 갖는 티오에스테라제에 상동성이다. 다른 구체예에서, 이 폴리펩티드는 DptA, DptBC, 또는 DptD에 상동성이거나 dptA, dptBC, 또는 dptD에 의해 코딩되는 폴리펩티드에 상동성이다. 바람직한 구체예에서, 이 폴리펩티드는 서열 번호 9, 11 또는 3의 아미노산 서열을 갖는 폴리펩티드에 상동성이다. 본 발명은 또한 본원에 개시된 에스. 로제오스포루스 BAC 클론, 예를 들어 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05로부터의 핵산 분자에 의해 코딩되는 폴리펩티드에 상동성인 폴리펩티드를 제공한다. 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 포함하는 폴리펩티드 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135에서 선택된 핵산 서열을 포함하는 핵산 분자에 의해 코딩되는 폴리펩티드에 상동성인 폴리펩티드를 제공한다.
바람직한 구체예에서, 상동성 폴리펩티드는 본 발명의 폴리펩티드에 상당한 서열 동일성을 나타내는 것이다. 보다 바람직한 구체예에서, 상동성 폴리펩티드는 서열 번호 9, 11, 7 또는 8 또는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 포함하는 폴리펩티드와 적어도 50%, 60%, 70% 또는 80% 서열 동일성을 나타내는 것이다. 보다 더 바람직한 구체예에서, 상동성 폴리펩티드는 서열 번호 9, 11, 7, 또는 8의 아미노산 서열 또는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81,83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 포함하는 폴리펩티드에 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 나타내는 것이다.
상동성 단백질은 다른 종으로부터 유래된 자연 발생 단백질, 특히 다른 스트렙토마이세스 종에서 유래된 단백질, 또는 다른 스트렙토마이세스 로제오스포루스 균주에서 유래된 단백질일 수 있으며, 이때 상동성 단백질은 서열 번호 9, 11, 7 또는 8의 아미노산 서열 또는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열에 상당한 서열 동일성을 나타내는 아미노산 서열을 포함한다. 자연 발생 상동성 단백질은 다른 종 또는 균주로부터 직접 분리될 수도 있다. 다르게는, 자연 발생 상동성 단백질을 코딩하는 핵산 분자는 분리되어 상동성 단백질을 재조합적으로 발현하기 위해 이용될 수도 있다. 다른 구체예에서, 상동성 단백질은 핵산 분자를 임의로 돌연변이시키고 이어서 그 핵산 분자를 발현시켜 실험적으로 생성된 것일 수도 있다. 다른 구체예에서, 상동성 단백질은 코딩된 폴리펩티드의 아미노산을 바꾸기 위해 하나 이상의 코돈을 지시 돌연변이시켜 실험적으로 생성된 것일 수도 있다.
다른 구체예에서, 본 발명은 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 또는 답토마이신 NRPS 또는 그 서브유닛을 코딩하는 유전자의 대립유전자 변이체에 의해 코딩되는 폴리펩티드를 제공한다. 바람직한 구체예에서, 본 발명은 dptA, dptBC, dptD 또는 dtpH의 대립유전자 변이체에 의해 코딩되는 폴리펩티드를 제공한다. 보다 더 바람직한 구체예에서, 폴리펩티드는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 유전자의 대립유전자 변이체에 의해 코딩된다. 다른 보다 바람직한 구체예에서, 폴리펩티드는 서열 번호 10, 12, 3 또는 6의 핵산 서열을 갖는 유전자의 대립유전자 변이체에 의해 코딩된다. 대립유전자 변이체는 본원에서 개시된 티오에스테라제, 답토마이신 NRPS 또는 그 서브유닛과 동일하거나 상이한 생물학적 활성을 가질 수 있다. 바람직한 구체예에서, 대립유전자 변이체는 다른 종의 스트렙토마이세스에서 유래되며, 보다 바람직하게는 스트렙토마이세스 로제오스포루스의 균주로부터 유래된다. 다른 구체예에서, 본 발명은 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는B12:03A05 중 어느 하나, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열의 대립유전자 변이체에 의해 코딩되는 폴리펩티드를 제공한다. 바람직한 구체예에서, 폴리펩티드는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 유전자의 대립유전자 변이체, 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 갖는 유전자의 대립유전자 변이체에 의해 코딩된다.
다른 구체예에서, 본 발명은 본 발명의 폴리펩티드의 유도체를 제공한다. 바람직한 구체예에서, 유도체는 아세틸화되거나, 카르복실화되거나, 인산화되거나, 글리코실화되거나 또는 유비퀴틴화되었다. 다른 바람직한 구체예에서, 유도체는 125I, 32P, 35S, 및 3H와 같은 방사성 동위원소로 표지되었다. 다른 바람직한 구체예에서, 유도체는 플루오로포어, 화학발광 제제, 효소 및 표지된 리간드를 위한 특이적 결합쌍 일원으로 작용할 수 있는 항리간드로 표지되었다. 바람직한 구체예에서, 폴리펩티드는 답토마이신의 생합성에 관련된 티오에스테라제이다. 보다 더 바람직한 구체예에서, 이 폴리펩티드는 DptD의 티오에스테라제 도메인을 포함하거나 또는 DptH의 아미노산 서열을 포함하거나, 또는 dptD의 티오에스테라제 코딩 도메인 또는 dptH에 의해 코딩되는 티오에스테라제이다. 다른 바람직한 구체예에서, 이 폴리펩티드는 답토마이신 NRPS 또는 그 서브유닛이며, 보다 바람직하게는 DptA, DptBC, 또는 DptD이거나, 보다 더 바람직하게는 dptA, dptBC, 또는 dptD에 의해 코딩되는 폴리펩티드이다. 다른 보다 바람직한 구체예에서, 폴리펩티드는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖거나, 또는 그것의 뮤테인, 대립유전자 변이체, 상동성 단백질 또는 단편이다. 바람직하게는, 티오에스테라제 유도체는 답토마이신 생합성에 관련된 티오에스테라제와 동일하거나 유사한 티오에스테라제 활성을 가지며, 보다 바람직하게는, 그 유도체는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖거나 서열 번호 8의 아미노산 서열을 갖는 티오에스테라제와 동일하거나 유사한 티오에스테라제 활성을 갖는다. 다른 바람직한 구체예에서, 답토마이신 NRPS 또는 NRPS 서브유닛 유도체는 자연 발생 답토마이신 NRPS 또는 그 서브유닛과 동일하거나 유사한 활성을 가진다. 다른 구체예에서, 유도체는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는, 바람직하게는 B12:03A05 중 하나로부터의 에스. 로제오스포루스 핵산 서열로부터의 핵산 분자에 의해 코딩되는 폴리펩티드로부터 유도된다. 바람직한 구체예에서, 유도체는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 갖는 폴리펩티드 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 갖는 유전자에 의해 코딩되는 폴리펩티드로부터 유래된다.
본 발명은 또한 비-펩티드 유사체를 제공한다. 바람직한 구체예에서, 비-펩티드 유사체는 답토마이신 합성에 관련된 티오에스테라제, 답토마이신 NRPS 또는 그 서브유닛 또는 에스. 로제오스포루스 BAC 클론으로부터의 핵산 분자에 의해 코딩되는 폴리펩티드와 구조적으로 유사하나, 하나 이상의 펩티드 결합이 --CH2NH--, --CH2S--, --CH2-CH2--, --CH=CH--(시스와 트랜스), --COCH2--, --CH(OH)CH2--, 및 --CH2SO--로 이루어진 군 중에서 선택되는 결합에 의해 치환된다. 다른 구체예에서, 비-펩티드 유사체는 티오에스테라제, 답토마이신 NRPS 또는 그 서브유닛의 아미노산 하나 이상이 동일한 유형의 D-아미노산으로 치환되어 보다 안정한 펩티드를 형성하는 것을 포함한다. 바람직하게는, 비-펩티드 유사체와 펩티드 유사체 둘다 답토마이신의 생합성에 관련된 자연 발생 폴리펩티드와 동일하거나 유사한 생물학적 활성을 가지며, 보다 바람직하게는 이 유사체는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드와 동일하거나 유사한 생물학적 활성을 갖는다. 본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 어느 하나, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩되는 폴리펩티드의 유사체를 제공한다. 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 갖거나 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 갖는 유전자에 의해 코딩되는 폴리펩티드의 유사체를 제공한다.
융합 단백질
본 발명의 폴리펩티드는 유전적, 효소적 또는 화학적 또는 면역학적 마커(예, 에피토프 태그)와 같은 다른 분자들에 융합될 수도 있다. 융합 파트너는 특히, myc, 헤마글루티닌(HA), GST, 면역글로불린, β-갈락토시다제, 비오틴 trpE, 단백질 A, β-락타마제, α-아밀라제, 말토즈 결합 단백질, 알콜 디하이드로게나제, 폴리히스티딘(예를 들어, 폴리펩티드의 아미노 및/또는 카르복실 말단에서의 6 히스티딘), lacZ, 녹색 형광 단백질(GFP), 효모 α접합 인자, GAL4 전사 활성화 또는 DNA 결합 도메인, 루시퍼라제, 및 혈청 단백질(예, 오브알부민, 알부민 및 IgG의 불변 도메인)을 포함한다. 예를 들어, Godowski et al., 1988, 및 Ausubel et al., supra 참고. 융합 단백질은 또한 인자 XIII, 트립신, 펩신 또는 공지된 임의의 효소와 같은 효소에 의해 인지되는 부위와 같은 특이적 효소 절단 부위를 함유할 수도 있다. 융합 단백질은 일반적으로 전술한 대로 재조합 핵산 기법에 의해, 또는 본원에 참고로 통합되는 Merrifield, 1963에 개시된 것과 같은 기법을 이용하여 화학적으로 합성되거나, 또는 화학적 가교에 의해 생성될 수도 있다.
태그가 붙여진 융합 단백질은 용이한 국소화, 스크리닝 및 에피토프 또는 효소 태그를 통한 특이적 결합을 가능하게 한다. Ausubel, 1991, 16장 참고. 일부 태그는 대상 단백질이 M13과 같은 파아지미드의 표면에 나타나게 하며, 이는 원하는 단백질 표적에 결합할 수도 있는 패닝 제제(panning agent)로 유용하다. 융합 단백질의 다른 잇점은 에피토프 또는 효소 태그가 정제를 단순화시킬 수 있다는 것이다. 이들 융합 단백질은 종종 친화도 크로마토그래피에 의해 한 단계로 정제될 수도 있다. 예를 들어, His6 태그된 단백질은 Ni 친화성 컬럼상에서 정제될 수 있고 GST 융합 단백질은 글루타치온 친화성 컬럼상에서 정제될 수 있다. 유사하게, IgG의 Fc 도메인을 포함하는 융합 단백질은 단백질 A 또는 단백질 G 컬럼상에서 정제될 수 있고, myc와 같은 에피토프 태그를 포함하는 융합 단백질은 항-c-myc 항체를 함유한 면역친화성 컬럼을 이용하여 정제될 수 있다. 정제 후 절단될 수 있는 효소 절단 부위에 의해, 본 발명의 핵산 분자에 의해 코딩된 단백질로부터 에피토프 태그를 분리시키는 것이 바람직하다.
융합 단백질의 두번째 잇점은 스크리닝 표적에 대한 친화성 결합을 통해 융합 단백질을 플레이트 또는 컬럼에 결합시키기 위해 에피토프 태그를 이용할 수 있다는 것이다.
따라서, 다른 태양에서, 본 발명은 답토마이신 생합성 유전자 클러스터로부터 유래한 티오에스테라제의 전부 또는 일부를 포함하는 융합 단백질을 제공하며, 그러한 융합 단백질을 코딩하는 핵산 분자를 제공한다. 다른 태양은 답토마이신 NRPS 또는 그 서브유닛의 전부 또는 일부를 포함하는 융합 단백질을 제공하며, 그러한 단백질을 코딩하는 핵산 분자를 제공한다. 에를 들어 실시예 11-16을 참고. 본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는B12:03A05, 바람직하게는 B12:03A05로부터의 핵산 분자에 의해 코딩되는 폴리펩티드의 전부 또는 일부를 포함하는 융합 단백질을 제공한다. 바람직한 구체예에서, 융합 단백질은 dptA, dptBC, dptD, 또는 dptH 중 하나 이상에 의해 코딩되는 폴리펩티드의 전부 또는 일부를 포함한다. 다른 바람직한 구체예에서, 융합 단백질은 dptA, dptBC, dptD, 또는 dptH 에 선택적으로 하이브리드화하는 핵산 분자에 의해 코딩되는 폴리펩티드를 포함한다. 보다 바람직한 구체예에서, 융합 단백질은 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드를 포함하거나, 또는 그 단편, 뮤테인, 상동성 단백질, 유도체 또는 유사체인 폴리펩티드를 포함한다. 보다 더 바람직한 구체예에서, 융합 단백질을 코딩하는 핵산 분자는 서열 번호 10, 12, 3 또는 6의 핵산 서열의 전부 또는 일부를 포함하거나, 또는 상기 핵산 서열을 포함하는 핵산 서열에 상동성이거나 선택적으로 하이브리드화하는 핵산 서열의 전부 또는 일부를 포함한다. 본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는B12:03A05, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩되는 폴리펩티드 서열을 포함하는 융합 단백질을 제공한다. 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 갖는 폴리펩티드를 포함하거나, 또는 그 단편, 뮤테인, 상동성 단백질, 유도체 또는 유사체인 폴리펩티드를 포함하는 융합 단백질을 제공한다. 본 발명은 또한 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135에 의해 코딩되는 폴리펩티드를 포함하거나, 또는 상기 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하거나 상동성인 핵산 서열의 전부 또는 일부를 포함하는 융합 단백질을 제공한다.
본 발명의 한 태양에서, 답토마이신 생합성 유전자 클러스터로부터 유래한 티오에스테라제의 전부 또는 일부를 포함하는 융합 단백질은 비리보솜 단백질 합성에 관련된 폴리펩티드로부터의 다른 모듈(이종성 또는 하이브리드 모듈 포함)을 포함한다. 예를 들어, 실시예 12E, G 및 H와 실시예 13 참고. 다른 바람직한 구체예에서, 융합 단백질은 티오에스테라제를 코딩하는 아미노산 서열 하나 이상을 포함하며, 이때 티오에스테라제는 서로 동일하거나 상이할 수도 있다. 예를 들어, 실시예 11E-G(답토마이신 티오에스테라제 유전자의 중복), 실시예 12(변형된 NRPS 티오에스테라제 융합 단백질 생성), 및 실시예 13(유리 티오에스테라제 융합 단백질 생성)을 참고.
다른 구체예에서, 본 발명은 둘 이상의 다른 티오에스테라제로부터의 아미노산 서열의 하이브리드인 융합 단백질과 그러한 융합 단백질을 코딩하는 핵산 분자를 제공한다. 하이브리드 융합 단백질은 상이한 티오에스테라제들의 둘, 셋, 또는 그 이상의 부분으로 구성될 수 있다. 하이브리드 티오에스테라제는 상이하거나 동일한 특이성을 가질 수 있다.
티오에스테라제와 답토마이신 NRPS 활성을 분석하는 방법
티오에스테라제의 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질이 야생형 티오에스테라제 폴리펩티드와 동일하거나, 증가되거나 감소된 생물학적 활성을 갖는지를 결정하는 많은 방법이 당업계에 공지되어 있다. 한 구체예에서, 적절한 티오에스테르 결합의 절단 및/또는 상응하는 생성물의 방출을 모니터하는 티오에스테라제 분석이 생체외에서 수행된다. 광- 또는 방사성-표지된 기질을 이용하는 방법을 포함한 공지된 많은 티오에스테라제 분석이 이용될 수 있다.
바람직한 구체예에서, NRPS에 의한 펩티드 합성과 관련된 티오에스테라제 활성은 세포 분석을 이용하여 결정된다. 예를 들어, 단편, 뮤테인, 상동성 단백질 또는 융합 단백질을 코딩하는 핵산 분자를, dptD의 티오에스테라제 도메인중 하나 또는 둘다 또는 dptH가 없는 답토마이신 생합성 유전자 클러스터를 포함하는 박테리아 세포내로 도입할 수 있다. 다르게는, 핵산 분자를 다른 화합물(예, 다른 리포펩티드)을 생산하는 다른 생합성 유전자 클러스터를 포함하는 박테리아 세포내로 도입할 수 있다. 바람직한 구체예에서, 박테리아 세포는 에스. 리비단스일 수 있다. 핵산 분자는 접합, 형질전환, 전기천공, 원형질체 융합 등을 포함하는 공지 방법에 의해 박테리아 세포내로 도입될 수 있다. 이 핵산 분자를 포함하는 박테리아 세포는 그 핵산 분자에 의해 코딩되는 폴리펩티드가 발현되는 조건하에서 배양된다. 배양 후, HPLC 및/또는 LC/MS에 의해 박테리아 세포를 분석하여 박테리아 세포가 원하는 리포펩티드를 생산하는 지를 결정할 수 있다. 예를 들어 하기의 실시예 7-9에 개시된 답토마이신 발현 방법 참고. 티오에스테라제 활성이 항-세포 성장 특성을 갖는 펩티드(예, 항생제, 항진균제, 항바이러스제 또는 항유사분열 제제)의 합성과 관련될 때, 공지된 원하는 분석법을 이용할 수 있다.
다르게는, 티오에스테라제의 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질을 dptD의 티오에스테라제 도메인중 하나 또는 둘다 또는 dptH가 없는 답토마이신 생합성 유전자 클러스터를 포함하는 세포, 특히 박테리아 세포내로 도입할 수 있다. 배양 후, 실시예 7에 개시된 대로, HPLC 및/또는 LC/MS에 의해 박테리아 세포를 분석하여 박테리아 세포가 원하는 리포펩티드를 생산하는 지를 결정할 수 있다. 다른 화합물(예, 다른 리포펩티드)을 생산하는 다른 생합성 유전자 클러스터를 포함하는 세포로 동일한 방법을 이용할 수 있다.
바람직한 구체예에서, 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질은 GXSXG 티오에스테라제 모티프를 포함하는 아미노산 서열을 포함한다(실시예 3 참고). 보다 바람직한 구체예에서, 단편, 뮤테인, 상동성 단백질, 유사체, 또는 유도체는 각각 서열 번호 7과 8에서 유래하는 티오에스테라제 모티프 GWSFG(서열 번호 166) 또는 GTSLG(서열 번호 167)를 포함하는 아미노산 서열을 포함한다.
유사한 공지의 방법을 이용하여, 답토마이신 NRPS 또는 그 서브유닛의 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질이 야생형 NRPS 또는 그 서브유닛과 동일하거나 상이한 생물학적 활성을 갖는 지를 결정할 수 있다.
항체
본 발명의 유전자에 의해 코딩되는 폴리펩티드는 다양한 공지 기법을 이용하여 본 발명의 폴리펩티드와 그 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질에 결합하는 폴리클로날 또는 모노클로날 항체를 유도하는 데 이용될 수 있다. 본 발명의 폴리펩티드에 대해 형성된 항체는 본 발명의 폴리펩티드와 면역학적으로 반응하는 면역글로불린 분자 또는 그 일부이다.
본 발명의 폴리펩티드에 대해 형성된 항체는 포유류 숙주의 면역화에 의해 생성될 수 있다. 그러한 항체는 폴리클로날 또는 모노클로날일 수 있다. 바람직하게는 그들은 모노클로날이다. 폴리클로날 및 모노클로날 항체를 생성하는 방법은 공지이다. 그러한 방법을 살펴보기 위해서는 본원에 참고로 통합되는 Harlow and Lane, Antibodies:A Laboratory Manual (1988) and Ausubel et al., supra를 참고. 본 발명의 폴리펩티드와의 면역반응성의 결정은 면역블롯 분석과 ELISA를 포함한 공지 방법에 의해 가능하다.
10-8 M-1 또는 바람직하게는 10-9 내지 10-10 M-1 또는 그 이상의 친화성을 갖는 모노클로날 항체는 일반적으로 예를 들어 Harlow and Lane, 1988에 개시된 표준 과정에 의해 만들어진다. 요약하면, 적절한 동물을 선발하여 원하는 면역화 프로토콜을 따른다. 적당한 시간 후, 그러한 동물의 비장을 잘라내어 개별 비장 세포를 적절한 선별 조건하에서 대개 불멸화된 골수종 세포에 융합시킨다. 그후, 세포를 클론들을 분리시키고, 원하는 항원 영역에 대해 특이적인 적절한 항체를 생성하는 지 여부에 대해 각 클론의 상등액을 시험한다.
다른 적합한 기법은 림프구를 항원성 폴리펩티드에 생체외 노출시키는 것에 관련되거나, 또는 다르게는 파아지 또는 유사한 벡터내의 항체의 라이브러리를 선별하는 것에 관련된다. Huse et al., 1989 참고. 본 발명의 폴리펩티드와 항체는 변형되거나 변형되지 않고 이용될 수 있다. 빈번하게, 폴리펩티드와 항체는 검출가능한 시그날을 제공하는 물질을 공유적으로 또는 비공유적으로 연결시킴으로써 표지될 것이다. 광범위한 표지와 접합 기법이 공지되어 있으며 과학 문헌 및 특허 문헌에 보고되어 있다. 적절한 표지는 라디오뉴클라이드, 효소, 기질, 보조인자, 억제제, 형광제제, 화학발광 제제, 자기 입자 등을 포함한다. 그러한 표지의 이용을 개시하는 특허는 미국 특허 제3,817,837호, 3,850,752호, 3,939,350호, 3,996,345호, 4,277,437호, 4,275,149호 및 4,366,241호를 포함하며 이들은 참고로 본원에 통합된다. 또한, 재조합 면역글로불린이 생성될 수도 있다(참고로 본원에 통합되는 미국 특허 제4,816,567호 참고).
본 발명의 항체는 또한 다른 종들(예, 마우스와 사람)로부터의 면역글로불린 서열로부터 또는 동종으로부터의 면역글로불린 경쇄와 중쇄 서열의 부분으로부터 형성되는 하이브리드 분자일 수 있다. 항체는 단일쇄 항체 또는 인간화 항체일 수 있다. 하이브리드 하이브리도마의 생산, 디설파이드 교환, 화학적 가교, 두 개의 모노클로날 항체간의 펩티드 링커 부가, 특정 세포주내로 두 세트의 면역글로불린 중쇄와 경쇄의 도입 등을 포함하는 공지의 많은 기법 중 임의의 것에 의해 제조된 2 기능성 항체와 같은, 다중 결합 특이성을 갖는 분자일 수 있다.
본 발명의 항체는 또한 인간 모노클로날 항체일 수 있으며, 예를 들어 불멸화된 인간 세포에 의해 생산되거나, SCID-hu 마우스 또는 "인간" 항체를 생산할 수 있는 다른 인간을 제외한 동물에 의해 생산되거나, 클론된 인간 면역글로불린 유전자의 발현에 의해 생산된 항체들일 수 있다. 인간화된 항체의 제조는 참고로 본원에 통합되는 미국 특허 제5,777,085호와 5,789,554호에 개시된다.
요약하면, 본 발명의 개시를 보는 당업자는 주어진 항체 분자의 안정성 또는 반감기, 면역원성, 독성, 친화성 또는 수율을 증가시키거나 감소시키는 방법을 포함한, 본 발명의 항체의 생물학적 특성을 변화시키기 위해, 또는 특정 분야에 보다 적합하도록 임의의 다른 방법으로 변화시키기 위해 이용될 수 있는 많은 다양한 방법을 갖는다.
바람직한 구체예에서, 본 발명의 항체는 답토마이신 합성에 관련된 티오에스테라제 또는 답토마이신 NRPS 또는 그 서브유닛에 결합한다. 보다 바람직한 구체예에서, 이 항체는 dptA, dptBC, dptD, 또는 dptH에 의해 코딩되는 폴리펩티드 또는 그 단편에 결합한다. 다른 바람직한 구체예에서, 항체는 dptA, dptBC, dptD, 또는 dptH 에 선택적으로 하이브리드화하는 핵산 분자에 의해 코딩되는 폴리펩티드에 결합한다. 보다 바람직한 구체예에서, 항체는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드에 결합하거나, 또는 그 단편, 뮤테인, 상동성 단백질, 유도체, 유사체 또는 융합 단백질인 폴리펩티드에 결합한다. 보다 더 바람직한 구체예에서, 항체는 서열 번호 10, 12, 3, 또는 6의 핵산 서열의 전부 또는 일부를 포함하는 핵산 분자에 의해 코딩되는 폴리펩티드에 결합한다. 다른 구체예에서, 항체는 서열 번호 10, 12, 3, 또는 6의 핵산 서열을 포함하는 핵산 분자에 상동성이거나 선택적으로 하이브리드화하는 핵산 서열의 전부 또는 일부를 포함하는 핵산 분자에 의해 코딩되는 폴리펩티드에 결합한다.
본 발명은 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 어느 하나, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩되는 폴리펩티드에 선택적으로 결합하는 항체를 제공한다. 폴리펩티드는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136에서 선택되는 아미노산 서열을 포함하거나 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열에 의해 코딩된다. 바람직하게는, 항체는 서열 번호 23, 25, 27, 29, 33, 35, 37, 91, 93, 97, 99, 110 또는 112로부터 선택되거나 서열 번호 61, 65, 69, 79, 81, 83, 85, 87, 95 및 101로부터 선택되는 아미노산 서열을 포함하는 폴리펩티드에 선택적으로 결합한다. 본 발명은 또한 그 단편, 뮤테인, 상동성 단백질, 유도체, 유사체 또는 융합 단백질에 선택적으로 결합하는 항체를 제공한다.
컴퓨터 판독 수단
본 발명의 추가 태양은 본 발명의 핵산과 아미노산 서열을 저장하기 위한 컴퓨터 판독 수단이다. 바람직한 구체예에서, 본 발명은 본원에서 개시된 핵산과 아미노산 서열 모두를 완전한 서열 세트로서 또는 임의의 조합으로 저장하기 위한 컴퓨터 판독 수단을 제공한다. 컴퓨터 판독 수단의 기록은 판독과 전시, 및 어떤 기준을 만족하는 데이터에 대한 질의시 데이터의 국소화, 서열의 비교, 기준을 만족하는 서열의 배열 또는 순서화 등을 허용하는 프로그램의 적용을 위한 컴퓨터 시스템과의 인터페이스를 위해 접근될 수 있다.
본 발명의 핵산과 아미노산 서열은 특히 서열 분석 알고리즘에서뿐만 아니라 서치 분석에 유용한 데이터베이스의 성분으로 유용하다. 본원에서 사용될 때, 용어 "본 발명의 핵산 서열"과 "본 발명의 아미노산 서열"은 컴퓨터 판독 형태로 환원되거나 저장될 수 있는 본 발명의 폴리뉴클레오티드 또는 폴리펩티드의 임의의 검출가능한 화학적 또는 물리적 특성을 의미한다. 이들은 제한없이 크로마토그래피 스캔 데이터 또는 피크 데이터, 사진 데이터 또는 그로부터의 스캔 데이터, 및 질량 스펙트럼 데이터를 포함한다.
본 발명은 본 발명의 서열을 저장하고 있는 컴퓨터 판독 매체를 제공한다. 컴퓨터 판독 매체는 하기 중 하나 이상을 포함할 수도 있다: 본 발명의 핵산 서열의 서열을 포함하는 핵산 서열; 본 발명의 아미노산 서열을 포함하는 아미노산 서열; 적어도 하나의 서열이 본 발명의 핵산 서열의 서열을 포함하는 핵산 서열 세트; 적어도 하나의 서열이 본 발명의 아미노산 서열의 서열을 포함하는 아미노산 서열 세트; 본 발명의 핵산 서열 하나 이상의 서열을 포함하는 핵산 서열을 나타내는 데이터 세트; 본 발명의 아미노산 서열의 서열을 포함하는 아미노산 서열을 코딩하는 핵산 서열을 나타내는 데이터 세트; 적어도 하나의 서열이 본 발명의 핵산 서열의 서열을 포함하는 핵산 서열 세트; 적어도 하나의 서열이 본 발명의 아미노산 서열의 서열을 포함하는 아미노산 서열 세트; 본 발명의 핵산 서열의 서열을 포함하는 핵산 서열을 나타내는 데이터 세트; 본 발명의 아미노산 서열의 서열을 포함하는 아미노산 서열을 코딩하는 핵산 서열을 나타내는 데이터 세트. 컴퓨터 판독 매체는 예를 들어, 시판되는 플로피 디스크, 테잎, 하드 드라이버, 컴팩트 디스크 및 비디오 디스크를 포함한, 정보, 또는 데이터를 저장하기 위해 이용되는 물질의 임의의 조성일 수 있다.
또한 본 발명은 특성 서열의 분석, 특히 유전자 서열의 분석을 위한 방법을 제공한다. 바람직한 서열 분석 방법은 예를 들어, 서열 상동성 분석(예, 동일성 및 유사성 분석), RNA 구조 분석, 서열 조립, 분기학적 분석, 서열 모티프 분석, 오픈 리딩 프레임 결정, 핵산 염기 콜링(calling), 및 서열결정 크로마토그램 피크 분석의 방법들을 포함한다.
컴퓨터에 기초한 방법이 핵산 상동성 확인을 수행하기 위해 제공된다. 이 방법은 컴퓨터 판독 매체중의 본 발명의 핵산 서열을 포함하는 핵산 서열을 제공하는 단계; 및 상기 핵산 서열을 적어도 하나의 핵산 또는 아미노산 서열과 비교하여 상동성을 확인하는 단계를 포함한다.
컴퓨터에 기초한 방법은 또한 아미노산 상동성 확인을 수행하기 위해 제공되며, 상기 방법은 컴퓨터 판독 매체중의 본 발명의 아미노산 서열을 포함하는 아미노산 서열을 제공하는 단계; 및 상기 아미노산 서열을 적어도 하나의 핵산 또는 아미노산 서열과 비교하여 상동성을 확인하는 단계를 포함한다.
컴퓨터에 기초한 방법은 추가로 겹치는 핵산 서열을 하나의 핵산 서열로 조립하기 위해 제공되며, 이 방법은 컴퓨터 판독 매체중의 본 발명의 핵산 서열을 포함하는 제1 핵산 서열을 제공하는 단계; 및 제1 핵산 서열과 제2 핵산 서열간의 적어도 하나의 겹치는 영역에 대해 스크리닝하는 단계를 포함한다.
핵산 분자를 프로브와 프라이머로서 이용하는 방법
한 구체예에서, 본 발명의 핵산 분자는 이 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 동정하거나 증폭시키기 위한 프로브 또는 프라이머로 이용될 수 있다. 바람직한 구체예에서, 프로브 또는 프라이머는 답토마이신 NRPS, 그 서브유닛 또는 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 핵산 분자로부터 유래된다. 이 프로브 또는 프라이머는 또한 답토마이신 NRPS, 또는 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 유전자로부터 유래된 발현 조절 서열로부터 유래될 수도 있다. 바람직한 구체예에서, 프로브 또는 프라이머는 dptA, dptBC, dptD, 또는 dptH로부터 유래된다. 보다 바람직한 구체예에서, 프로브 또는 프라이머는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산 분자로부터 유래된다. 다른 바람직한 구체예에서, 프로브 또는 프라이머는 서열 번호 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 갖는 핵산 분자로부터 유래된다. 다른 구체예에서, 프로브 또는 프라이머는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136을 코딩하는 핵산 서열로부터 유래된다.
일반적으로, 프로브 또는 프라이머는 적어도 10 뉴클레오티드 길이이며, 보다 바람직하게는 적어도 12, 보다 바람직하게는 적어도 14 그리고 보다 더 바람직하게는 적어도 16 뉴클레오티드 길이이다. 보다 더 바람직한 구체예에서, 프로브 또는 프라이머는 적어도 18 뉴클레오티드 길이이고, 보다 바람직하게는 적어도 20, 보다 바람직하게는 적어도 22 뉴클레오티드 길이이다. 프라이머와 프로브는 또한 더 긴 길이로 이용될 수도 있다. 예를 들어, 프로브 또는 프라이머는 25 뉴클레오티드 길이이거나, 또는 30, 40, 또는 50 뉴클레오티드 길이일 수 있다. 올리고뉴클레오티드 프로브를 이용하여 핵산 하이브리드화를 수행하는 방법은 공지되어 있다. 예를 들어, Sambrook et al., supra 참고. 예를 들어, 짧은 프로브의 방사성표지화를 개시하는 11장과 페이지 11.31-11.32와 11.40-11.44, 및 프로브 하이브리드화를 위한 특이적 조건(페이지 11.50-11.51)을 포함한 올리고뉴클레오티드 프로브를 위한 하이브리드화 조건을 개시한 페이지 11.45-11.53을 참고. 프라이머를 이용하여 PCR을 수행하는 방법은 공지되어 있다. 예를 들어, Sambrook et al., supra 및 Ausubel et al., supra 참고. PCR 방법은 본 발명의 핵산 분자의 대립유전자 변이체와 단편을 동정하고/하거나 분리하기 위해 이용될 수 있으며; PCR은 또한 프라이머에 하이브리드하고 증폭될 수 있는 핵산 분자를 동정하고/하거나 분리하기 위해 이용될 수 있으며, 그리고 본 발명의 상동성 단백질, 유사체, 융합 단백질 또는 뮤테인을 코딩하는 핵산 분자를 분리하기 위해 이용될 수 있다.
화합물의 생합성을 위해 티오에스테라제를 이용하는 방법- Dpt 유전자들의 조작
본 발명의 답토마이신 생합성 유전자 클러스터의 유전자들은 다양한 방식으로 조작되어 새로운 생합성 펩티드 생성물을 생산하거나 이 유전자 클러스터로부터 발현된 하나 이상의 유전자의 조절을 변화시킬 수 있다. 예를 들어 도 1 참고.
티오에스테라제를 코딩하는 유전자의 파괴
한 태양에서, 본 발명은 박테리아 세포에서 NRPS 또는 PKS 경로에 관련되는 티오에스테라제를 코딩하는 유전자를 파괴하거나 결실시키는 방법을 제공한다. 바람직하게는, 이 방법은 답토마이신 생합성 유전자 클러스터의 티오에스테라제를 코딩하는 유전자 또는 그 일부를 파괴하거나 결실시키는 단계를 포함한다. 통합 티오에스테라제를 코딩하는 유전자의 파괴 또는 결실은 최종 생성물로 가는 중간체인 화합물의 생성을 야기할 것이다. 한 태양에서, 통합 티오에스테라제를 코딩하는 유전자 또는 그 일부가 파괴되거나 결실될 수 있다. 바람직한 구체예에서, 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터의 통합 티오에스테라제를 코딩하는 유전자의 파괴 또는 결실은 선형의 리포펩티드 화합물을 생성할 것이다. 만일 NRPS로부터 그것의 방출이 숙주 세포내의 다른 내인성 또는 외인성 티오에스테라제 활성에 의해 촉매된다면, 이 선형 리포펩티드 화합물은 직접 이용될 것이다. 만일 내인성 티오에스테라제 활성에 의해 NRPS로부터 방출되지 않는다면, 그러한 선형 리포펩티드 화합물은 가능하지만 아직 확인되지 않은 티오에스테라제 폴리펩티드를 시험하기 위해 또는 티오에스테라제 융합, 단편, 뮤테인, 유도체, 유사체 또는 상동체 폴리펩티드를 활성에 대해 시험하기 위해 유용한 중간체일 것이다. 선형 리포펩티드 화합물은 다르게는 신규의 리포펩티드의 생산을 위한 중간체로 이용될 수도 있다.
다른 태양에서, 유리 티오에스테라제를 코딩하는 유전자는 NRPS를 포함하는 박테리아 세포에서 파괴되거나 결실될 수 있다. 유리 티오에스테라제는 NRPS에서 생산된 펩티드 화합물의 교정에 관련되는 것으로 생각되므로, 유리 티오에스테라제를 코딩하는 유전자의 파괴 또는 결실은 유리 티오에스테라제의 존재하에서 생산된 화합물과 비교하여 돌연변이를 갖는 화합물의 생산을 야기할 것이다. 이들 돌연변이된 화합물들은 신규의 리포펩티드를 생성하기 위해 이용될 수 있다. 예를 들어 실시예 13 참고.
바람직한 구체예에서, 이 방법은 dptD의 티오에스테라제 코딩 부분을 파괴하거나 결실시키거나 답토마이신 생합성 유전자 클러스터의 dptH를 결실시키거나 파괴하는 단계를 포함한다. 보다 더 바람직한 구체예에서, 이 방법은 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖거나 서열 번호 8의 아미노산 서열을 갖는 티오에스테라제를 코딩하는 유전자를 파괴하거나 결실시키는 단계를 포함한다. 본 발명은 또한 티오에스테라제를 코딩하는 유전자를 파괴하거나 결실시키는 방법을 포함하며, 이때 이 유전자는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열 또는 서열 번호 8의 아미노산 서열을 갖는 티오에스테라제를 코딩하는 유전자와 상동성이거나 선택적으로 하이브리드화한다. 다른 바람직한 구체예에서, 티오에스테라제의 파괴 또는 결실은 하기하는 바와 같은 비리보솜 펩티드 합성에 관련된 유전자 클러스터를 변화시키는 방법과 결합될 수도 있다.
티오에스테라제를 코딩하는 유전자의 파괴는 본 명세서의 개시를 따라 당업자에게 알려진 임의의 방법에 의해 이루어질 수 있다. 바람직한 구체예에서, 티오에스테라제를 코딩하는 유전자의 파괴는 예를 들어 각각 본원에 참고로 통합되는 Hosted and Baltz, J.Bacteriol., 179, pp.180-186(1997); Butler et al., Chem.Biol.,6, pp.287-292(1999); 및 Xue et al., Proc.Natl.Acad.Sci. USA, 95, pp.12111-12116(1998)에 개시된 방법을 이용하여 표적화된 유전자 파괴에 의해 이루어질 수 있다. 예를 들어 실시예 11 참고.
고리화 부위의 변화 및 티오에스테라제를 이용하여 생산된 고리형 펩티드
NRPS에 관련된 자연 발생 폴리펩티드에서, 통합 티오에스테라제는 폴리펩티드의 카르복시 말단에 위치하여, 여기서 생성물 고리화에 관여한다. 한 태양에서, 본 발명은 티오에스테라제를 코딩하는 모듈의 위치를 바꿈으로써 고리형 펩티드의 고리화 부위(또는 선형 펩티드의 방출)를 바꾸는 방법을 제공한다. 한 구체예에서, 고리화 부위는 티오에스테라제를 코딩하는 모듈을, NRPS에 관련된 폴리펩티드를 코딩하는 유전자내로, 티오에스테라제 모듈이 자연적으로 발생하는 영역의 상부인 영역에 삽입함으로써 변화될 수 있다. 이 구체예에서, 생산되는 고리형 펩티드는 자연 발생 고리형 펩티드보다 작을 것이다. 예를 들어 실시예 12 참고.
바람직한 구체예에서, 모듈은 답토마이신 생합성 유전자 클러스터로부터의 통합 티오에스테라제를 코딩한다. 보다 바람직한 구체예에서, 모듈은 DptD의 티오에스테라제 도메인을 포함한다. 보다 더 바람직한 구체예에서, 모듈은 서열 번호 7의 아미노산 서열의 전부 또는 일부, 바람직하게는 티오에스테라제 도메인을 포함하는 서열 번호 7의 부분을 갖는 폴리펩티드를 코딩한다. 다른 바람직한 구체예에서, 모듈은 서열 번호 7의 티오에스테라제 도메인의 전부 또는 일부를 코딩하는 핵산 분자 또는 서열 번호 3의 핵산 서열 전부 또는 일부를 포함하는 티오에스테라제 도메인을 코딩하는 핵산 분자에 선택적으로 하이브리드화하거나 상동성인 핵산 모듈을 포함한다.
다르게는, 펩티드에 아미노산을 첨가하는 데(또는 그렇지 않으면 펩티드 내의 아미노산을 변형시키는 데) 관여하는 다른 모듈들이 티오에스테라제를 코딩하는 모듈의 상부에 도입될 수 있다. 예를 들어, 실시예 12 참고. 그러한 모듈은 적어도 아데닐화 도메인과 티올화 또는 아실 운반자 도메인을 포함하는 최소 모듈을 포함한다. 바람직한 구체예에서, 삽입된 모듈은 또한 축합 도메인을 포함할 것이다. M 도메인, E 도메인 및/또는 Cy 도메인을 포함한 부가의 도메인이 또한 티오에스테라제 모듈의 상부에 삽입될 수도 있다. 티오에스테라제 도메인의 상부에 삽입될 모듈의 유형은 원하는 아미노산 잔기의 유형에 의존할 것이다. 특정 아미노산을 첨가하고/하거나 변형시킬 모듈을 삽입하는 방법은 공지되어 있다. 예를 들어, 본원에 참고로 통합되는 Mootz et al., Curr.Opin.Biotechnol., 10, pp.341-348(1999) 참고. 티오에스테라제의 상부에 하나 이상의 모듈을 참가하면 더 크고 자연 발생 고리형 펩티드와 다른 아미노산 잔기를 함유할 수 있는 고리형 펩티드를 합성할 수 있는, NRPS에 관련된 폴리펩티드를 생산할 것이다.
티오에스테라제의 생체내 용도
본 발명의 유전자의 다른 용도는 NRPS를 발현하는 세포에서 생성물의 수율을 개선하는 것이다. 예를 들어, 실시예 11 참고. 수율 증가를 위해 이용될 수 있는 핵산 분자는 긍정적 조절 인자, 아실 CoA 티오에스테라제, ABC 수송자, NovABC-관련 폴리펩티드, DptA, DptBC, DptD, DptD와 DptH를 포함한 답토마이신 내성 및 답토마이신 티오에스테라제를 코딩하는 폴리펩티드를 코딩하는 핵산 분자를 포함한다. 완전한 답토마이신 생합성 유전자 클러스터, 답토마이신 NRPS 또는 그것의 임의 도메인 또는 서브유닛은 또한 복사될 수도 있다. 바람직한 구체예에서, 유리 및/또는 답토마이신 생합성 유전자 클러스터로부터의 통합 티오에스테라제는 세포내로 도입되어 답토마이신의 생산을 개선한다. 다른 바람직한 구체예에서, 티오에스테라제의 부가의 카피들이 전술한 대로 변화된 NRPS 폴리펩티드를 포함하는 세포내로 도입될 수도 있다. 이론에 얽매임없이, 유리 및/또는 통합 티오에스테라제의 부가의 카피들은, 박테리아 세포의 교정 능력(예, 유리 티오에스테라제) 또는 고리화 및/또는 펩티드 방출 능력(예, 통합 티오에스테라제)을 증가시켜 펩티드의 NRPS 프로세싱을 개선시킬 수도 있다.
바람직한 구체예에서, 티오에스테라제를 코딩하는 핵산 분자의 부가 카피가 세포내로 도입될 수도 있다. 예를 들어, 실시예 11 참고. 티오에스테라제의 도입은 임의의 공지 방법에 의해 이루어질 수 있다. 보다 바람직한 구체예에서, 이 유전자의 부가의 카피는 강한 발현 조절 서열의 조절성 조절하에 있다. 이들 서열은 상기한 대로 다른 티오에스테라제 유전자로부터 유래될 수도 있고 또는 이종성 서열로부터 유래할 수도 있다. 또한, 티오에스테라제를 코딩하는 핵산 분자는 세포내로 도입되어 별도의 폴리펩티드로 발현될 수도 있다. 이것은 유리 티오에스테라제에게 특히 유용하다. 다르게는, 티오에스테라제를 코딩하는 핵산 분자는 세포내로 도입되어 다수-도메인 단백질의 일부를 형성할 수도 있다. 이는 NRPS를 형성하거나 NRPS와 상호작용하는 폴리펩티드내로의 상동성 재조합에 의해 이루어질 수 있다. 이는 필요한 것은 아니지만, 통합 티오에스테라제에 특히 유용하다.
다른 구체예에서, 유리 및/또는 통합 티오에스테라제의 카피들은 답토마이신 생합성 유전자 클러스터 외의 NRPS 복합체를 발현하는 세포내로 도입될 수도 있다. 예를 들어 실시예 13 참고. 한 바람직한 구체예에서, 이 복합체는 NRPS 복합체이다. 다른 바람직한 구체예에서, 이 복합체는 PKS 복합체 또는 혼합된 PKS/NRPS 복합체이다. 많은 PKS 및 NPRS 복합체가 공지되어 있다. 예를 들어, 반코마이신, 블레오마이신, A54145, CDA, 암포마이신, 에치노칸딘, 사이클로스포린, 에리스로마이신, 티로신, 모넨신, 아베르멕틴, 페니실린, 세팔로스포린, 프리스티나마이신, 에리스로마이신, 라파마이신, 스피노신, 디뎀닌, 디스코바하미안, 및 에포티론을 생성하는 복합체가 있다. 전술한 대로, 유리 및/또는 통합 티오에스테라제의 부가는 박테리아 세포의 교정 능력(예, 유리 티오에스테라제) 또는 고리화 및/또는 펩티드 방출 능력(예, 통합 티오에스테라제)을 증가시켜 펩티드의 NRPS 또는 PKS 프로세싱을 개선시킬 수도 있다. 유리 및/또는 통합 티오에스테라제의 부가는 전술한 방법에 의해 이루어질 수 있다.
바람직한 구체예에서, 세포 내로 도입되는 티오에스테라제를 코딩하는 핵산 분자는 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제이다. 바람직한 구체예에서, 이 유전자는 dptD의 티오에스테라제-코딩 도메인이거나 또는 dptH이다. 보다 바람직하게는, 이 핵산 분자는 서열 번호 7 또는 8의 티오에스테라제 도메인의 아미노산 서열을 갖는 티오에스테라제 또는 티오에스테라제 활성을 갖는 그들의 상동성 단백질, 융합 단백질, 뮤테인, 유도체, 유사체 또는 단편을 코딩한다.
NPRS에 의해 신규의 화합물을 생산하기 위해 유전자 클러스터를 바꾸는 방법
NRPS 폴리펩티드 모듈과 도메인의 변화
다른 태양에서, 본 발명은 NRPS 내의 모듈의 수 또는 위치를 바꾸는 방법을 제공한다. 한 구체예에서, 하나 이상의 모듈을 NRPS로부터 제거할 수 있다. 이들 결실은 NRPS에 의해 자연 발생 펩티드보다 짧은 펩티드 생성물이 합성되도록 할 것이다. 다른 구체예에서, 하나 이상의 도메인을 NRPS로부터 제거할 수 있다. 이 경우, NRPS에 의해 생성되는 생성물은 예를 들어 에피머화 및/또는 메틸화 도메인이 결실되면 결실없이 생성된 펩티드와 비교하여 화학적 변화를 가질 것이다.
다른 구체예에서, 하나 이상의 모듈 또는 도메인이 NRPS에 첨가될 수 있다. 이 경우, NRPS에 의해 합성되는 펩티드는 자연 발생 펩티드보다 길거나 또는 부가의 화학적 변화를 가질 것이다. 예를 들어, 만일 에피머화 도메인 또는 메틸화 도메인이 부가되면, 생성되는 펩티드는 여분의 D-아미노산을 함유하거나 또는 메틸화된 아미노산을 함유할 것이다. 또 다른 구체예에서, 하나 이상의 모듈이 돌연변이 될 수 있으며, 예를 들어 아데닐화 도메인이 돌연변이되어 자연 발생 아데닐화 도메인과는 다른 아미노산 특이성을 가질 수 있다. 어느 아미노산이 모듈 1-13의 각각의 아데닐화 도메인내에 결합할 것인지를 결정하는, 답토마이신 NRPS를 위한 아미노산 포켓 코드는 실시예 5에 개시된다. 표 2 참고. 아미노산 코드를 가지고, 당업자는 다양한 공지 기법에 의해 돌연변이를 수행하여 한 모듈의 코드를 다른 코드로 바꾸어 바뀐 NRPS에 의해 합성된 생성 펩티드의 최종 아미노산 조성 및/또는 서열을 바꿀 것이다. 예를 들어, 실시예 12A 참고. 다른 구체예에서, 하나 이상의 서브유닛을 NRPS에 첨가하거나 결실시킬 수 있다.
또 다른 구체예에서, 하나 이상의 도메인, 모듈, 또는 서브유닛을 다른 도메인, 모듈, 또는 서브유닛으로 치환하여 보충성에 의한 신규 펩티드를 생산할 수도 있다. 이 경우, 바뀐 NRPS에 의해 생산되는 펩티드는 예를 들어 자연 발생 펩티드와 비교하여 하나 이상의 다른 아미노산을 가질 것이다. 또한, 도메인, 모듈 또는 서브유닛의 삽입, 결실, 치환 및 돌연변이의 다른 조합들을 이용하여 관심 펩티드를 생성할 수도 있다. 예를 들어, 자연 발생의 것을 변형된 모듈, 도메인 또는 서브유닛으로 대체할 수도 있으며, 또는 한 유기체로부터의 NRPS로부터의 자연 발생 모듈, 도메인 또는 서브유닛을 다른 유기체로부터의 NRPS의 모듈, 도메인 또는 서브유닛으로 대체할 수도 있다. 예를 들어, 실시예 12C 참고. 모듈, 도메인 및 서브유닛의 변화는 부위-지시된 돌연변이, 도메인 교환(모듈 또는 서브유닛 변형을 위해), 모듈 또는 서브유닛내의 도메인의 결실, 삽입 또는 치환, 또는 서브유닛내의 모듈의 결실, 삽입 또는 치환에 의해 수행될 수 있다. 추가로, 임의의 공지 방법을 이용하여 도메인, 모듈 또는 서브유닛을 파괴하여 그것이 작용하지 않도록 할 수 있다. 이러한 파괴는 예를 들어 다른 유전자(예, 선별 또는 스크리닝을 허용하는 유전자)에 의한 상동성 재조합을 통한 단일 크로스오버 파괴자 또는 치환과 같은 기법을 포함한다.
변형된 NRPS 복합체에 의해 생산되는 생성물은 상이한 통합된 아미노산, 아미노산의 상이한 화학적 변화(예, 메틸화와 에피머화)를 가질 것이며, 천연 리포펩티드보다 짧거나 길 수 있다. 도메인, 모듈 또는 서브유닛은 2, 3, 또는 4 NRPS를 포함한, 원하는 수의 NRPS로부터 유래될 수 있다. 또한, 본 발명은 통합 티오에스테라제를 갖거나 통합 티오에스테라제가 없는 변화된 NRPS 복합체를 포함한다. 예를 들어, 실시예 12B-J 참고.
모듈, 도메인 및/또는 서브유닛의 공급원은 답토마이신 생합성 유전자 클러스터로부터 유래될 수도 있고 또는 다른 리포펩티드를 코딩하는 NRPS 또는 다른 펩티드 공급원으로부터 유래할 수도 있다. 이들 펩티드 공급원은 글리코펩티드 유전자 클러스터, 혼합된 경로 유전자 클러스터 및 사이드로포어 유전자 클러스터를 포함한다. 추가로, 모듈, 도메인, 및/또는 서브유닛의 공급원은 스트렙토마이세스 및 비-스트렙토마이세스 공급원을 포함한 임의의 적절한 공급원으로부터 얻어질 수 있다. 비-스트렙토마이세스 공급원은 방선균(예, 아미코라톱시스), 원핵 비-방선균(예, 바실러스와 시아노박테리아), 및 비-박테리아 공급원(예, 진균류)를 포함한다.
NRPS 또는 그 일부는 관심의 숙주 세포에 대해 이종성일 수도 있으며 또는 숙주 세포에 내인성일 수도 있다. 한 구체예에서, 답토마이신 NRPS 또는 그 일부(예, 도메인, 모듈 또는 그 서브유닛)은 당업자에게 알려진 임의의 벡터(예, 플라스미드, 코스미드, 박테리오파아지 또는 BAC)상에서 숙주 세포내로 도입된다. 답토마이신 NRPS 또는 그 일부가 도입되는 숙주 세포는 내인성 NRPS 또는 그 일부(예, 도메인, 모듈, 또는 그 서브유닛)를 함유할 수도 있다. 다르게는, 이종성 NRPS 또는 그 일부는 이종성 답토마이신 NRPS 또는 그 일부를 함유하는 숙주 세포내로 도입될 수도 있다. 답토마이신 NRPS, 기타 NRPS, 또는 NRPS의 도메인, 모듈 또는 서브유닛은 자연 발생 서열 또는 변형된 서열을 가질 수도 있다. 다른 구체예에서, 답토마이신 NRPS 또는 그 일부는 숙주 세포에 내인성이며, 예를 들어 숙주 세포는 에스. 로제오스포루스이다. 자연 발생 또는 변형된 NRPS, 또는 그 도메인, 모듈 또는 서브유닛은 답토마이신 NRPS 또는 그 일부를 포함하는 숙주 세포내로 도입될 수도 있다. 이종성 도메인, 모듈, 서브유닛 또는 NRPS는 구성적 또는 조절성 프로모터를 포함할 수 있으며, 이들은 당업계에 공지되어 있다. 프로모터는 세포내로 도입되는 핵산 분자에 대하여 상동성 또는 이종성일 수 있다. 한 구체예에서, 프로모터는 전술한 대로, 답토마이신 생합성 유전자 클러스터로부터 올 수도 있다.
NRPS 또는 그 일부(예, 도메인, 모듈, 서브유닛)를 포함하는 핵산 분자는 에피좀으로 유지될 수도 있고 또는 게놈내로 통합될 수도 있다. 핵산 분자는 예를 들어 파아지 통합 부위에서 게놈내로 도입될 수 있다. 또한, 핵산 분자는 내인성 또는 이종성 NRPS 또는 그 일부의 부위 또는 게놈내의 그 밖의 위치에서 게놈내로 도입될 수 있다. 핵산 분자는 게놈 내에 이미 존재하는 NRPS의 도메인, 모듈 또는 서브유닛의 기능의 전부 또는 일부를 파괴하는 방식으로 도입될 수도 있고 또는 NRPS 또는 그 일부의 기능을 방해하지 않는 방식으로 도입될 수도 있다.
이들 NRPS에 의해 생산되는 펩티드는 새로운 화합물로서 유용할 수 있으며, 또는 새로운 화합물을 생산하는 데 유용할 수 있다. 바람직한 구체예에서, 새로운 화합물은 항생제 화합물로서 유용하며 또는 항생제 화합물을 생산하기 위해 이용될 수 있다. 다른 바람직한 구체예에서, 새로운 화합물은 항생제, 항진균, 항바이러스, 항기생충, 항유사분열, 세포증식 억제, 항종양, 면역조절, 항-콜레스테롤, 사이드로포어, 농화학(예, 살곤충제) 또는 물리화학적(예, 계면활성제) 특성을 포함하며 이에 제한되지 않는 유용한 활성을 갖는 다른 펩티드로서 유용하거나 이를 생산하기 위해 이용될 수 있다. 보다 바람직한 구체예에서, 바뀐 NRPS 폴리펩티드를 이용하여 생산된 화합물은 2000년 12월 15일에 출원된 미국 출원 제 09/738,742호, 09/737,908호 및 09/739,535호에 개시된 것을 포함하는 답토마이신 관련 화합물의 합성에 이용될 수 있다.
또한, 숙주 세포 배양동안 이용가능한 기질의 풀을 변화시킴으로써 비리보솜 합성된 펩티드와 폴리케티드의 다양한 변이체를 얻을 수 있다. 예를 들어, 답토마이신의 시판 제품은 최종 생산물의 리포펩티드 프로파일을 바꾸는 데카노산의 존재하에 답토마이신 생산자 스트렙토마이세스 로제오스포루스를 배양한 결과이다. 예를 들어 미국 특허 4,885,243호를 참고. 폴리케티드 중간체의 N-아세틸 시스테아민(SNAC) 유사체를 공급한 결과, 유리 카르복실산 또는 에스테르 유사체와 비교할 때 중간체의 폴리케티드내로의 통합이 상당히 증가하였다. 예를 들어, Yue et al., J.Am.Chem.Soc., 109, pp.1253-1255(1987); Cane and Yang, J.Am.Chem.Soc., 109, pp.1255-1257(1987); Cane et al., J.Am.Chem.Soc., 115, pp.522-526 및 527-535(1993); Cane et al., J.Am.Chem.Soc., 117, pp.633-634(1995); Pieder et al.,J.Am.Chem.Soc., 117, pp.11373-11374(1995)를 참고하며 이들 각각은 참고로 본원에 통합된다. 아미노산의 SNAC 유사체가 생체외에서 NRPS내로 통합되었다. Ehmann et al., Chem.Biol.,7, pp.765-772(2000). 따라서, SNAC 또는 다른 판테테인 모방체를 공급하여 비천연 기질을 NRPS-생산된 펩티드내로 통합시키는 것은 가능하다.
비리보솜 합성된 펩티드와 폴리케티드의 추가의 다양성은 또한 하나 이상의 NRPS 및 PKS 유전자(천연, 하이브리드 또는 달리 변형된 모듈 또는 도메인을 코딩함)를 이종성 숙주 세포, 즉, 상기 NRPS와 PKS 유전자 또는 모듈이 기원한 숙주 세포외의 숙주 세포에서 발현시켜 이루어질 수 있다.
또한, 답토마이신 또는 관련 화합물에 대한 박테리아 세포의 내성을 증가시키기 위해 항생제 내성에 관련된 ABC 수송자 또는 다른 폴리펩티드를 발현시킬 수도 있다. ABC 수송자는 자가 조직 세포에서(즉, 그 유전자를 포함하는 세포) 과다발현될 수도 있고, 또는 이종성 세포(즉, 정상적으로는 그 유전자를 갖지 않는 세포)에서 발현될 수도 있다. 추가로, 본 발명의 ABC 수송자 유전자 또는 본원에서 개시된 항생제 내성에 관련된 다른 폴리펩티드를 발현시켜 답토마이신에 내성인 세포를 선별할 수 있다. 이러한 선별은 답토마이신 내성의 기작을 결정하는 데 유용할 수 있으며, 또는 항체 내성이 선별되는 표준 분자 생물학적 기법에 이용될 수도 있다.
본 발명의 화합물, 그것의 약학 조성물, 및 화합물과 조성물을 이용하여 치료하는 방법
본 발명의 다른 목적은 본 발명의 티오에스테라제, NRPS 또는 그 서브유닛을 이용하여 생산될 수 있는 펩티드 또는 리포펩티드 및 그들의 염, 에스테르, 아미드, 에테르 및 보호된 형태, 그리고 이들 펩티드, 리포펩티드 또는 그 염을 포함하는 약학 제제를 제공하는 것이다. 바람직한 구체예에서, 리포펩티드는 전술한 답토마이신 또는 답토마이신-관련 리포펩티드이다.
다양한 일상적이고 잘 알려진 프로토콜을 이용하여 본 발명의 펩티드, 리포펩티드 또는 다른 화합물이 항생제 활성을 갖는지를 결정할 수 있다. 분리되거나 정제된 화합물을 이용할 수도 있고 또는 발효 배양액 또는 세포 용균액에 존재하는 미정제 화합물을 이용할 수도 있다. 효능을 결정하기 위해, 그람 양성 또는 그람 음성 박테리아 시험 균주중 하나 또는 둘다를 이용할 수도 있고, 다양한 시험 균주를 이용할 수도 있다. 바람직한 구체예에서, 박테리아 시험 균주는 그람 양성 시험 균주일 것이다. 보다 바람직한 구체예에서, 박테리아 시험 균주는 스타필로코커스, 보다 바람직하게는 에스.아우레우스일 것이다. 항생제 활성을 결정하기 위해 이용될 수 있는 방법의 예는 미국 특허 제4,208,408호와 4,537,717호에 제공된다. 당업자는 다른 가능한 항생제와 다른 시험 균주가 이용될 수 있음을 인지할 것이다.
펩티드, 리포펩티드 또는 그 약학적 허용염은 질병, 특히 박테리아 감염의 치료적 또는 예방적 치료를 위해 경구, 정맥내, 근육내, 피하, 에어로졸, 국소 또는 비경구 투여를 위해 제제화될 수 있다. 바람직한 구체예에서, 리포펩티드는 답토마이신 또는 답토마이신-관련 리포펩티드이다. 본원에서 "답토마이신", "답토마이신-관련 리포펩티드" 또는 "리포펩티드"는 그들의 약학적 허용염을 포함한다. 답토마이신 또는 답토마이신-관련 리포펩티드를 포함한 펩티드는 펩티드 또는 관심 리포펩티드와 양립할 수 있는 임의의 약학적 허용 담체 또는 부형제를 이용하여 제제화될 수 있다. 예를 들어 사람의 치료를 위한 다양한 항미생물 제제의 투여를 위한 방법의 일반적인 기재를 위해서는 Handbook of Pharmaceutical Additives:An Internation Guide to More than 6000 Products by Trade Name, Chemical, Function, and Manufacturer, Ashgate Publishing Co., eds., M.Ash and I.Ash, 1996; Merck Index:An Encyclopedia of Chemicals, Drugs and Biologicals, ed.S.Budavari, annual; Remington's Pharmaceutical Sciences Mack Publishing Company, Easton, PA; Martindale:The Complete Drug Reference, ed.K.Parfitt, 1999: and Goodman & Gilman's The Pharmaceutical Basis of Therapeutics, Pergamon Press, New York, NY, ed. L.S.Goodman et al.,를 참고하며 이들은 참고로 본원에 통합된다. 본 발명의 펩티드 또는 리포펩티드는 통상의 약학적 담체 및 부형제와 혼합될 수 있으며 정제, 캡슐, 엘릭시르, 현탁액, 시럽, 웨이퍼, 크림 등의 형태로 이용될 수 있다. 펩티드 또는 리포펩티드는 본원에 개시된 바대로 다른 치료제 및 항생제와 혼합될 수 있다. 본 발명의 화합물을 포함하는 조성물은 약 0.1 내지 약 90중량%의 활성 화합물을 함유할 것이며, 보다 일반적으로는 약 10 내지 약 30 중량%를 함유할 것이다.
본 발명의 조성물은 조절되거나(예, 캡슐) 또는 서방성 전달 시스템(예, 생분해성 매트릭스)를 이용하여 전달될 수 있다. 본 발명의 조성물의 투여에 적합한 약물 전달을 위한 예시적인 서방성 전달 시스템은 미국 특허 제4,452,775호(Kent에게 허여됨), 제5,239,660호(Leonard에게 허여됨), 제3,854,480호(Zaffaroni에게 허여됨)에 개시된다.
이 조성물은 통상의 담체와 부형제를 함유할 수 있으며, 그 예로는 옥수수 전분 또는 젤라틴, 락토스, 슈크로스, 미세결정질 셀룰로스, 카올린, 만니톨, 디칼슘 포스페이트, 소듐 클로라이드 및 알긴산이 있다. 이 조성물은 크로스카멜로스 소듐, 미세결정질 셀룰로스, 옥수수 전분, 소듐 전분 글리콜레이트 및 알긴산을 함유할 수 있다.
포함될 수 있는 정제 결합제는 아카시아, 메틸셀룰로스, 소듐 카르복시메틸셀룰로스, 폴리비닐피롤리돈(포비돈), 하이드록시프로필 메틸셀룰로스, 슈크로스, 전분 및 에틸셀룰로스이다.
사용될 수 있는 윤활제는 마그네슘 스테아레이트 또는 기타 금속 스테아레이트, 스테아르산, 실리콘 플루이드, 탈크, 왁스, 오일 및 콜로이드 실리카를 포함한다.
페퍼민트, 노루발풀의 오일, 체리 향미료 등과 같은 향미료 또한 이용될 수 있다. 또한, 투여 형태를 그 외관을 보다 보기 좋게 하거나 제품의 식별을 돕기 위해 착색제를 첨가하는 것이 바람직할 수도 있다.
경구용으로는, 정제와 캡슐같은 고형 제제가 특히 유용하다. 서방성 제제 또는 장 피복 제제 또한 고안될 수도 있다. 소아용 또는 노인용의 경우, 좌약, 시럽 및 씹을 수 있는 정제가 특히 적합하다. 경구 투여의 경우, 약학 조성물은 예를 들어, 정제, 캡슐, 현탁액 또는 액체 형태일 수 있다. 약학 조성물은 치료적 유효량의 활성 성분을 함유하는 투여 단위의 형태로 만들어지는 것이 바람직하다. 그러한 투여 단위의 예는 정제와 캡슐이다. 치료의 목적의 경우, 정제 및 캡슐은 활성 성분에 더하여, 예를 들어 아카시아 검, 젤라틴, 폴리비닐피롤리돈, 소르비톨, 또는 트라가칸트와 같은 결합제; 예를 들어 칼슘 포스페이트, 글리신, 락토스, 옥수수전분, 소르비톨, 또는 수크로스와 같은 충진제; 예를 들어 마그네슘 스테라레이트, 폴리에틸렌 글리콜, 실리카, 또는 탈크와 같은 활택제; 예를 들어, 감자 전분과 같은 붕해제, 향미제 또는 착색제 또는 허용가능한 습윤제와 같은 통상의 담체를 함유할 수 있다. 경구용 액체 제제는 일반적으로 수성 또는 유성 용액, 현탁액, 에멀젼, 시럽 또는 엘릭시르의 형태이며, 이들은 현탁제, 유화제, 비수성 제제, 방부제, 착색제 및 향미제와 같은 통상의 첨가제를 함유할 수 있다. 경구용 액체 제제는 리포펩티드 미셀 또는 리포펩티드의 단량체 형태를 포함할 수도 있다. 액체 제제를 위한 첨가제의 예는 아카시아, 아몬드 오일, 에틸 알콜, 분획화된 코코넛 오일, 젤라틴, 글루코스 시럽, 글리세린, 수소화된 식용 지방, 레시틴, 메틸 셀룰로스, 메틸 또는 프로필 파라-하이드록시벤조에이트, 프로필렌 글리콜, 소르비톨, 또는 소르브산을 포함한다.
정맥내(IV) 사용을 위해서는, 펩티드 또는 리포펩티드의 수용성 형태를 통상적으로 사용되는 정맥내 유체 중 하나에 용해시켜 주사로 투여할 수 있다. 정맥내 제제는 담체, 부형제 또는 안정화제를 포함할 수 있으며, 이들로는 제한없이 칼슘, 인체 혈청 알부민, 시트레이트, 아세테이트, 칼슘 클로라이드, 카보네이트, 및 기타 염을 포함한다. 정맥내 유체는 제한없이 생리 식염수 또는 링거 용액을 포함한다. 펩티드 또는 리포펩티드는 또한 주사기, 캐뉼라, 카테터 및 선에 놓여질 수도 있다.
비경구 투여를 위한 제제는 수성 또는 비수성 등장성 멸균 주사 용액 또는 현탁액 형태일 수 있다. 이들 용액 또는 현탁액은 경구 투여용 제제에 사용되는 것으로 언급된 담체 중 하나 이상을 갖는 멸균 파우더 또는 과립으로부터 제조될 수 있다. 리포펩티드 미셀은 특히 비경구 투여에 적합하다. 화합물은 폴리에틸렌 글리콜, 프로필렌 글리콜, 에탄올, 옥수수 오일, 벤질 알콜, 소듐 클로라이드, 및/또는 다양한 완충액에 용해될 수 있다. 근육내 제제의 경우, 리포펩티드 화합물 또는 이 화합물의 적절한 가용성 염 형태(예, 염산염)의 멸균 제제를 주사용 물(WFI), 생리식염수 또는 5% 글루코스와 같은 약학적 희석제에 용해시켜 투여할 수 있다.
주사가능한 디포우(depot) 형태는 폴리락티드-폴리글리콜리드와 같은 생분해성 중합체에 상기 화합물의 미세캡슐화된 매트릭스를 형성시켜 만들 수 있다. 약물 대 중합체의 비율과 이용되는 구체적 중합체의 특성에 의존하면서, 약물 방출의 속도가 조절될 수 있다. 다른 생분해성 중합체의 예는 폴리(오르토에스테르)와 폴리(안하이드라이드)를 포함한다. 주사가능한 디포우 제제는 또한 약물을 신체 조직과 양립할 수 있는 마이크로에멀젼에 포획시켜 제조될 수 있다.
국소적 용도의 경우, 본 발명의 화합물은 또한 피부, 또는 코와 목의 점막에 적용하기에 적합한 형태로 제조될 수 있고, 크림, 연고, 액체 스프레이 또는 흡입제, 로젠지, 또는 목 페인트 형태를 가질 수 있다. 그러한 국소 제제는 추가로 디메틸설폭사이드(DMSO)와 같은 화학적 화합물을 포함하여 활성 성분의 표면 투과를 촉진할 수 있다. 국소 제제의 경우, 답토마이신, 답토마이신-관련 리포펩티드 또는 적절한 그들의 염형태의 멸균 제제를 크림, 연고, 스프레이 또는 기타 국소 드레싱으로 투여할 수도 있다. 국소 제제는 또한 답토마이신 또는 답토마이신-관련 리포펩티드 조성물로 함침된 밴드 형태일 수도 있다.
눈 또는 귀에 적용하기 위해서는, 본 발명의 화합물을 연고, 크림, 로션, 페인트 또는 분말로서 소수성 또는 친수성 기제에 조제된 액체 또는 반-액체 형태로 제공할 수 있다.
직장 투여를 위해, 본 발명의 화합물을 코코아 버터, 왁스 또는 기타 글리세라이드와 같은 통상의 담체와 혼합된 좌약의 형태로 투여할 수 있다.
에어로졸 제제의 경우, 펩티드 또는 리포펩티드 또는 화합물의 염 형태의 멸균 제제를 계량된 투여량 흡입기와 같은 흡입기 및 분사기로 이용할 수 있다. 리포펩티드 미셀의 멸균 형태는 또한 에어로졸 제제를 위해 이용될 수 있다. 에어로졸화된 형태는 특히 폐렴 및 굴(sinus)계 감염과 같은 호흡기 감염을 치료하는 데 유용하다.
다르게는, 본 발명의 화합물은 전달시에 적절한 약학적 허용 담체에서 재구성되는 분말 형태일 수 있다. 한 구체예에서, 본 화합물의 단위 투여 형태는 멸균된 밀봉 앰퓰내의 적절한 희석제중의 화합물 또는 그 염의 용액일 수 있다. 단위 투여 형태중의 화합물의 농도는 다양할 수 있으며, 예를 들어, 약 1% 내지 약 50%이며, 이용되는 화합물과 그것의 용해도 및 의사가 원하는 투여량에 의존한다. 만일 조성물이 투여 단위를 함유하면, 각 투여 단위는 활성 물질 50-500 mg을 함유하는 것이 바람직할 것이다. 성인 인간 치료의 경우, 이용되는 투여량은 투여 경로와 빈도에 의존하면서, 100 mg 내지 3 g/1일의 범위가 바람직하다.
추가의 태양에서, 본 발명은 사람 및 기타 동물에서의 감염, 특히 그람 양성 박테리아에 의해 야기된 감염을 치료하는 방법을 제공한다. 용어 "치료하다"는 감염의 예방과 숙주 동물이 감염된 후 확립된 감염의 조절 둘다를 의미하기 위해 이용된다. 이미 확립된 감염은 급성 또는 만성일 수 있다. 본 방법은 사람 또는 기타 동물에게 유효 투여량의 본 발명 화합물을 투여하는 것을 포함한다. 답토마이신의 유효 투여량은 예를 들어 일반적으로 약 0.1 내지 약 25 mg/kg 답토마이신, 답토마이신-관련 리포펩티드 또는 약학적 허용염이다. 답토마이신 또는 답토마이신-관련 리포펩티드는 단량체일 수도 있고 또는 리포펩티드 미셀의 일부일 수도 있다. 바람직한 투여량은 약 1 내지 약 25 mg/kg의 답토마이신 또는 답토마이신-관련 리포펩티드 또는 그 약학적 허용염이다. 보다 바람직한 투여량은 약 1 내지 12 mg/kg 답토마이신 또는 그 약학적 허용염이다. 답토마이신을 위한 이들 투여량은 본 발명의 변형된 NRPS 복합체에 의해 생산된 기타 선형 및 고리형 펩티드의 유효 투여량을 결정하고 최적화하기 위해 당업자에 의해 출발점으로 이용될 수 있다.
한 구체예에서, 본 발명은 환자에서 감염, 특히 그람 양성 박테리아에 의해 야기된 감염을 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신 또는 다른 항박테리아성 펩티드 또는 리포펩티드의 치료적 유효량으로 치료하는 방법을 제공한다. 답토마이신 또는 항박테리아성 펩티드 또는 리포펩티드는 단량체일 수도 있고 리포펩티드 미셀내에 있을 수도 있다. 항박테리아 제제를 전달하는 예시적 과정은 Rogers에게 허여된 미국 특허 제5,041,567호와 PCR 특허 출원 제 EP94/02552호(공개 번호 WO95/05384호)에 개시되어 있으며, 이들의 전체 내용은 참고로 본원에 통합된다. 본원에서 사용될 때, 용어 "치료적 유효량"은, 박테리아 감염의 개시를 막거나, 증상을 완화시키거나 또는 진전을 중단시키는, 본 발명에 따른 변형된 NRPS에 의해 생산된 변형된 답토마이신 또는 다른 항박테리아성 펩티드 또는 리포펩티드의 양을 의미한다. 용어 "치료하다"는 감염의 발생을 방지하고 감염을 조절 또는 제거하기 위한 본 발명의 화합물의 치료 유효량을 환자에게 투여하는 것으로 정의된다. 용어 "대상"은 본원에서 개시된 대로, 포유류, 식물 또는 세포 배양물로 정의된다. 바람직한 구체예에서, 대상은 펩티드 또는 리포펩티드 치료를 필요로 하는 사람 또는 기타 동물 환자이다.
펩티드 또는 리포펩티드 항생제 화합물은 하루 한번 투여될 수도 있고 또는 하루에 여러번 투여될 수도 있다. 치료 체제는 예를 들어 몇일 또는 2-4주와 같이 장기간에 걸친 투여를 요구할 수도 있다. 투여되는 투여단위당 양 또는 투여되는 총량은 감염의 특성과 심각성, 환자의 나이 및 일반적인 건강, 항생제에 대한 환자의 내성 및 감염에 관련된 미생물(들)과 같은 인자들에 의존할 것이다. 투여 방법은 본원에 참고로 통합되며 1999년 9월 24일에 출원된 미국 출원 제09/406,568호에 개시되어 있으며, 이 출원은 1999년 3월 24일에 출원된 미국 가출원 제60/125,750호와 1998년 9월 25일에 출원된 미국 가출원 제60/101,828호의 이익을 향유한다.
본 발명의 방법은 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제, 또는 그 약학 조성물을, 그람 양성 박테리아 감염을 감소시키거나 제거하는 데 효과적인 양으로 이들을 필요로 하는 환자에게 투여하는 것을 포함한다. 항생제는 경구, 비경구, 흡입, 국소, 직장, 비강, 볼, 질, 또는 이식 저장소, 외부 펌프 또는 카테터로 투여될 수 있다. 항생제는 눈 또는 에어로졸화된 사용을 위해 제조될 수도 있다. 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 펩티드 또는 리포펩티드 항생제, 또는 그 약학적 조성물은 또한 농양, 심실 또는 관절내로 직접 주사되거나 투여될 수 있다. 비경구 투여는 피하, 정맥내, 근육내, 관절내, 윤활내, 수조내, 경막내, 간내, 병변내 및 두개내 주사 또는 주입을 포함한다. 바람직한 구체예에서, 답토마이신 또는 다른 펩티드 또는 리포펩티드는 정맥내로, 피하로 또는 경구로 투여된다.
본 발명의 방법은 임의 유형의 그람 양성 박테리아에 의해 야기되거나 또는 악화된 박테리아 감염을 갖는 환자를 치료하기 위해 이용될 수 있다. 바람직한 구체예에서, 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 답토마이신-관련 리포펩티드, 또는 다른 펩티드 또는 리포펩티드 항생제, 또는 그 약학 조성물은 본 발명의 방법에 따라 환자에게 투여된다. 다른 바람직한 구체예에서, 박테리아 감염은 메티실린-민감성 및 메티실린-내성 스타필로코커스(스타필로코커스 아우레우스, 스타필로코커스 에피덜미디스, 스타필로코커스 헤모리티쿠스, 스타필로코커스 호미니스, 스타필로코커스 사프로피티쿠스, 및 코아귤라제-음성 스타필로코커스를 포함), 글리코펩티드 중간체-민감성 스타필로코커스 아우레우스(GISA), 페니실린-민감성 및 페니실린-내성 스트렙토코커스(스트렙토코커스 뉴모니에, 스트렙토코커스 피오게네스, 스트렙토코커스 아가락티에, 스트렙토코커스 아비움, 스트렙토코커스 보비스, 스트렙토코커스 락티스, 스트렙토코커스 산지우스 및 스트렙토코커스 그룹 C, 스트렙토코커스 그룹 G 및 비리단스 스트렙토코커스 포함), 엔테로코커스(엔테로코커스 페칼리스와 엔테로코커스 패시움과 같은 반코마이신-민감성 및 반코마이신-내성 균주 포함), 클로스트리듐 디피시레, 클로스트리듐 클로스트리디포르메, 클로스트리듐 이노쿰, 클로스트리듐 퍼프린젠스, 클로스트리듐 라모숨, 헤모필러스 인플루엔자, 리스테리아 모노사이토젠스, 코리네박테리움 제이케움, 비피도박테리움 종, 유박테리움 아에로파시엔스, 유박테리움 렌튬, 락토바실러스 애시도필러스, 락토바실러스 카제이, 락토바실러스 플란타룸, 락토코커스 종, 류코노스톡 종, 페디오코커스, 펩토스트렙토코커스 언애어로비우스, 펩토스트렙토코커스 아사카로리티쿠스, 펩토스트렙토코커스 매그너스, 펩토스트렙토코커스 미크로스, 펩토스트렙토코커스 프레보티, 펩토스트렙토코커스 프로덕투스, 프로피오니박테리움 애크네스, 및 액티노마이세스 종을 포함하며 이에 제한되지 않는 박테리아에 의해 야기되거나 심해질 수 있다.
고전적으로 "내성"인 균주에 대한 답토마이신의 항박테리아 활성은 생체외 실험에서 고전적으로 "민감성"인 균주에 대한 활성과 비교할 만하다. 또한, 민감성 균주에 대한 답토마이신의 최소 억제 농도(MIC)는 대개 반코마이신의 값보다 4배 낮다. 따라서, 바람직한 구체예에서, 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 답토마이신-관련 리포펩티드, 또는 다른 펩티드 또는 리포펩티드 항생제 또는 약학 조성물은 본 발명의 방법에 따라 반코마이신을 포함한 다른 항생제에 내성인 박테리아 감염을 나타내는 환자에게 투여된다. 또한, 글리코펩티드 항생제와는 달리, 답토마이신은 그람 양성 유기체에 대하여 신속하고 농도의존성인 박테리아살균 활성을 나타낸다. 따라서, 바람직한 구체예에서, 답토마이신, 리포펩티드 항생제 또는 그 약학 조성물은 신속하게 작용하는 항생제 치료를 필요로 하는 환자에게 본 발명의 방법에 따라 투여된다.
본 발명의 방법은 신체의 임의 기관 또는 조직의 그람 양성 박테리아 감염에 사용될 수 있다. 이들 기관 또는 조직은 제한없이 골격 근육, 피부, 혈류, 신장, 심장, 폐 및 뼈를 포함한다. 본 발명 방법은 제한없이 피부와 연조직 감염, 균혈증 및 요로감염을 치료하기 위해 이용될 수 있다. 본 발명 방법은 중이염, 굴염, 만성 기관지염 및 약물내성 스트렙토코커스 뉴모니에 또는 헤모필루스 인플루엔자에 의해 야기된 폐렴을 포함한 폐렴을 제한없이 포함하는 지역사회 획득 호흡기 감염을 치료하기 위해 이용될 수 있다. 본 발명의 방법은 또한 다른 유형의 그람 양성 박테리아를 포함하거나, 또는 호기성, 카프로필릭(caprophilic), 또는 혐기성 박테리아를 포함한 그람 양성과 그람 음성 박테리아 둘다를 포함하는 혼합 감염을 치료하기 위해 이용될 수 있다. 이러한 유형의 감염은 배안 감염증 및 산과/부인과 감염을 포함한다. 본 발명 방법은 제한없이 폐렴, 복강내 패혈증, 피부 및 연조직 감염 및 뼈와 관절 감염을 포함하는 병원 감염을 위한 스텝 다운 치료에 이용될 수 있다. 본 발명 방법은 또한 제한없이 심장내막염, 신장염, 패혈관절염 및 골수염을 포함하는 감염을 치료하기 위해 이용될 수 있다. 바람직한 구체예에서, 전술한 질병의 임의의 것은 답토마이신, 리포펩티드 항생제 또는 그 약학 조성물을 이용하여 치료할 수 있다. 또한, 이 질병들은 단량체 또는 미셀 형태의 답토마이신 또는 리포펩티드 항생제를 이용하여 치료할 수 있다.
본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 답토마이신-관련 리포펩티드, 또는 다른 펩티드 또는 리포펩티드는 또한 환자 또는 동물의 음식 또는 사료로 투여될 수 있다. 만일 전체 음식 섭취의 일부로 투여되면, 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드의 양은 음식의 1 중량% 미만일 수 있으며 바람직하게는 0.5 중량% 이하이다. 동물을 위한 음식은 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드가 첨가되거나 또는 프리믹스에 첨가될 수 있는 일반 음식물일 수 있다.
본 발명의 방법은 또한 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제외의 항생제 하나 이상 및/또는 항진균제 하나 이상을 동시에 투여하면서 실시될 수 있다. 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제외의 항생제와 항진균제의 동시투여는 다른 유형의 그람 양성 박테리아에 의해 야기되는 감염, 그람 양성과 그람 음성 박테리아 둘다에 의해 야기되는 감염, 또는 박테리아와 진균류 둘다에 의해 야기되는 감염을 포함한 혼합 감염에 유용할 수 있다. 더욱이, 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제는 동시 투여된 하나 이상의 항생제의 독성 프로파일을 개선할 수 있다. 답토마이신과 아미노글리코시드의 투여는 아미노글리코시드에 의해 야기된 신장 독성을 완화시킬 수 있음이 알려졌다. 바람직한 구체예에서, 항생제 및/또는 항진균제는 변형된 답토마이신, 다른 펩티드 또는 리포펩티드 항생제와 동시에, 또는 변형된 답토마이신, 다른 펩티드 또는 리포펩티드 항생제를 포함하는 약학 조성물로 투여될 수 있다.
변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드 항생제와 함께 투여될 수 있는 항박테리아 제제와 그 분류는, 제한없이 페니실린과 관련 약물, 카르바페넴(carbapenems), 세팔로스포린(cephalosporins)과 관련 약물, 아미노글리코시드(aminoglycoside), 바시트라신(bacitracin), 그라미시딘(gramicidin), 뮤피로신(mupirocin), 클로람페니콜(chloramphenicol), 티암페니콜(thiamphenicol), 후시데이트 소듐(fusidate sodium), 린코마이신(lincomycin), 크린다마이신(clindamycin), 마크로라이드(macrolide), 노보비오신(novobiocin), 폴리믹신(polymyxins), 리파마이신(rifamycins), 스펙티노마이신(spectinomycin), 테트라사이클린(tetracyclines), 반코마이신(vancomycin), 테이코프라닌(teicoplanin), 항엽산 제제(스트렙토그라민(streptogramins), 설폰아미드(sulfonamide), 트리메토프림(trimethoprim) 및 그 조합을 포함), 및 피리메타민(pyrimethamine), 합성 항박테리아제(니트로푸란(nitrofurans), 메텐아민 만델레이트(methenamine mandelate) 및 메텐아민 히푸레이트(methenamine hippurate)를 포함), 니트로이미다졸(nitroimidazole), 퀴놀론(quinolones), 플루오로퀴놀론(fluoroquinolones), 이소니아지드(isoniazid), 에탐부톨(ethambutol), 피라진아미드(pyrazinamide), 파라-아미노살리실산(para-aminosalicylic acid)(PAS), 사이클로세린(cycloserine), 카프레오마이신(capreomycin), 에티온아미드(ethionamide), 프로티온아미드(prothionamide), 티아세타존(thiacetazone), 비오마이신(viomycin), 에베미노마이신(eveminomycin), 글리코펩티드, 글리실사이클린(glycylcycline), 케토라이드(ketolides), 옥사졸리디논(oxazolidinone); 이미페넨(imipenen), 아미카신(amikacin), 네틸미신(netilmicin), 포스포마이신(fosfomycin), 젠타마이신(gentamycin), 세프트리악손(ceftriaxone), 지르아신(Ziracin), LY 333328, CL 331002, HMR 3647, 리네조리드(Linezolid), 시네르시드(Synercid), 아즈트레오남(Aztreonam), 및 메트로니다졸(Metronidazole), 에피로프림(Epiroprim), OCA-983, GV-143253, 산페트리넴 소듐(Sanfetrinem sodium), CS-834, 비아페넴(Biaphenem), A-99058.1, A-165600, A-179796, KA 159, 디네미신(Dynemicin) A, DX8739, DU 6681; 세프루프레남(Cefluprenam), ER 35786, 세포세리스(Cefoselis), 산페트리넴 세렉세틸(Sanfetrinem celexetil), HGP-31, 세프피롬(Cefpirome), HMR-3647, RU-59863, 메르사시딘(Mersacidin), KP 736, 리파라질(Rifalazil); 코산(Kosan), AM 1732, MEN 10700, 레나페넴(Lenapenem), BO 2502A, NE-1530, PR 39, K130, OPC 20000, OPC 2045, 베네프림(Veneprim), PD 138312, PD 140248, CP 111905, 수로페넴(Sulopenem), 리티페남 아콕실(ritipenam acoxyl), RO-65-5788, 사이클로티아리딘(Cyclothialidine), Sch-40832, SEP-132613, 미카코시딘(micacocodin) A, SB-275833, SR-15402, SUN A0026, TOC 39, 카루모남(carumonam), 세포조프란(Cefozopran), 세페타메트 피복실(Cefetamet pivoxil), 및 T 3811을 포함한다.
바람직한 구체예에서, 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 또는 펩티드 또는 리포펩티드 항생제와 함께 투여될 수 있는 항박테리아 제제는 제한없이 이미페넨, 아미카신, 네틸미신, 포스포마이신, 젠타마이신, 세프트리악손, 테이코프라닌, 지라신, LY 333328, CL 331002, HMR 3647, 리네조리드, 시네르시드, 아즈트레오남, 및 메트로니다졸을 포함한다.
변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드 항생제와 함께 투여될 수 있는 항진균 제제는 제한없이 카스포푼젠, 보리코나졸, 세르타코나졸, IB-367, FK-463, LY-303366, Sch-56592, 시타프록사신, DB-289 폴리엔, 예를 들어 암포네리신, 니스타틴, 프리마리신; 아졸, 예를 들어 플루코나졸, 이트라코나졸, 및 케토코나졸; 알릴아민, 예를 들어 나프티핀 및 테르비나핀; 및 플루사이토신과 같은 항-대사물을 포함한다. 다른 항진균제제는 제한없이, 본원에 참고로 통합되는 Fostel et al., Drug Discovery Today 5:25-32(2000)에 개시된 것들을 포함한다. Fostel et al.은 코리네칸딘, Mer-WF3010, 푸사칸딘스, 알트리키틴/LL 15G256Y, 소르다린스, 시스펜타신, 아족시바실린, 아우레오바시딘 및 카프레푼진을 포함하는 항진균 화합물을 개시한다.
답토마이신-관련 리포펩티드를 포함한, 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제는 박테리아 감염이 제거되거나 감소될 때까지 이 방법에 따라 투여될 수 있다. 한 구체예에서, 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드는 3일 내지 6개월의 기간 동안 투여된다. 바람직한 구체예에서, 본 발명의 변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드는 7일 내지 56일 동안 투여된다. 보다 바람직한 구체예에서, 변형된 답토마이신, 또는 펩티드 또는 리포펩티드는 7일 내지 28일 동안 투여된다. 보다 더 바람직한 구체예에서, 변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드는 7일 내지 14일 동안 투여된다. 다른 구체예에서, 항생제는 3 내지 7일 동안 투여된다. 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드는 본 발명에 따라 필요한 경우 더 길거나 더 짧은 기간 동안 투여될 수 있다.
본 발명이 보다 완전하게 이해되도록 하기 위해 하기 실시예가 개시된다. 이들 실시예는 단지 예시의 목적이며 본 발명의 범위를 제한하기 위한 것이 아니다.
[실시예]
실시예 1: 스트렙토마이세스 로제오스포루스 답토마이신 생합성 유전자 클러스터의 초기 서열결정
스트렙토마이세스 로제오스포루스 균주 A21978.6(ATCC 기탁 번호 31568)을 이용하여 코스미드 라이브러리를 구성하였다. 게놈 DNA를 Sau3A1와 알카라인 포스파타제(Boehringer Mannheim Biochemicals)로 부분적으로 분해하였다. 대략 40kb 길이의 DNA를 분리하여 BamHI-분해된 코스미드 pKC1471에 연결시키고 Gigapack 패키징 추출물(Stratagene, Inc.)을 이용하여 Hosted and Baltz, J.Bacteriol., 179, pp.180-186(1997)에 개시된 대로 패키징하였다. 패키징된 DNA를 이. 콜라이 XL1-Blue-MFR'(Stratagene, Inc.)내로 도입하고 코스미드를 함유한 각각의 클론을 96-웰 도트 블롯 장치내에 순서를 갖춘 배열로 저장하였다. 미세적정 웰의 한 열로부터의 12개의 배양물을 모아서 플라스미드 pRHB153으로부터의 DNA의 2.1 kB SphI 단편 및 pRHB157로부터의 5.2 kb DraI-KpnI 단편에 하이브리드화시켜 스크리닝하였으며, 상기 두 단편 모두 에스. 로제오스포루스로부터 클론된 NRPS 서열을 함유하였다.(McHenney et al., supra 참고). 하이브리드화 풀로부터의 각각의 코스미드를 동일한 프로브에의 하이브리드화에 의해 동정하였다.
코스미드와 플라스미드 DNA를 유체역학적으로 전단하고 이어서 표준 1% 아가로즈젤상에서 전기영동하여 분리하였다. 분리된 2500-3000 bp 길이의 DNA 단편을 젤로부터 잘라내고 GeneClean(등록상표명) 과정(BIO 101, Inc.)에 의해 정제하였다. 젤-정제된 DNA 단편의 말단을 T4 DNA 폴리머라제를 이용하여 충전시키거나 평말단으로 만들었다. 이 DNA 단편을 독특한 BstXI-링커 어댑터(5'-GTCTTCACCACGGGG-3' - 서열 번호 13 및 5' GTGGTGAAGAC-3' - 서열 번호 14, 100-1000배 과량)에 연결시켰다. 이들 링커는 BstXI-절단 pGTC 벡터(Genome Therapeutics Corp., Waltham, MA)에 상보적인 반면, 오버행은 자가 상보성이 아니다. 따라서, 상기 링커는 연쇄물이 되거나 개방된 벡터가 쉽게 자가 연결되지 않을 것이다. 링커-적용된 삽입체를 1% 아가로즈젤상에서 전기영동하여 통합되지 않은 링커로부터 분리하고 GeneClean(등록상표명)을 이용하여 정제하였다. 정제된 링커-적용된 삽입체를 BstXI-절단 pGTC 벡터에 연결시켜 "샷건" 서브클론 라이브러리를 구성하였다.
이어서 pGTC 라이브러리를 DH5α 수행능력이 있는 세포(Gibco/BRL, DH5α형질전환 프로토콜)내로 형질전환시켰다. 암피실린과 IPTG/Xgal(IPTG=이소프로필-b-D-티오갈락토피라노시드; Xgal=5-브로모-4-클로로-3-인도일-b-D-티오발락토피라노시드)를 함유한 항생제 플레이트상에 도말하여 형질전환을 평가하였다. 플레이트를 37℃에서 밤새 배양하였다. 형질전환체를 플레이트 정제하고 하기 플라스미드를 함유하는 정제된 클론을 추가 분석을 위하여 선택하였다.
에스. 로제오스포루스 DNA의 대략 50 kb의 삽입체를 함유하는 플라스미드 pRHB160, 대략 15 kb의 삽입체를 함유하는 플라스미드 pRHB613, 대략 13 kb의 삽입체를 함유하는 플라스미드 pRHB614, 대략 51 kb의 삽입체를 함유하는 플라스미드 pRHB159를 DNA 서열결정을 위해 선택하였다. (McHenney et al., supra 참고).
상기 플라스미드들로 형질전환된 균주의 각각의 배양물을 37℃에서 밤새 성장시켰다. DNA를 실리카 비드 DNA 제조법을 이용하여 정제하였다(Engelstein et al., Microb.Comp.Genomics 394):237-241, 1998). 이 방식으로, 25 mg의 DNA를 클론당 얻었다. 이들 정제된 DNA 샘플을 일차적으로 ABI 염료-종결인자 화학을 이용하여 서열 결정하였다. 모든 후속 단계는 ABI377 또는 제조자의 지시에 따른 Amersham 자동화 DNA 서열 결정 법에 의한 서열 결정에 기초하였다. ABI 염료 종결인자 서열 판독은 ABI377 또는 Amersham MegaBaceTM 모세관 기계상에서 수행되었다. 데이터를 젤의 레인 트랙킹을 따르는 UNIX 기계로 옮겼다. 프로그램 PHRED를 이용하여 기본 콜과 품질 점수를 결정하였다(Ewing et al., Genome Res.8:175-185, 1998). 디폴트 프로그램 파라미터와 품질 점수를 가진 PHRAP를 이용하여 판독물을 조합하였다(P.Green, Abstracts of DOE Human Genome Program Contractor-Grantee Workshop V, Jan.1996, p.157). 초기 조립은 6x 커버리지에서 행해졌다.
실시예 2: 스트렙토마이세스 로제오스포루스 생합성 유전자 클러스터의 부가의 DNA 분자의 분리와 분석
30℃에서 F10A 브로스(2% 아가, 25% 가용성 전분, 0.2% 덱스트로스, 0.5% 효모 추출물, 0.5% 펩톤 및 0.3% 칼슘 카보네이트)에서 교반된 스트렙토마이세스 로제오스포루스(NRRL11379)(ATCC No.31568)의 밤새 배양물로부터 메가베이스 DNA의 제조를 위한 균사체를 얻었다. 세척된 세포를 SeakemTM GTG 아가로즈(FMC Bioproducts, 1% 최종 농도)에 심고, 37℃에서 3 시간 동안 리소자임(2 mg/ml TE)에서 항온처리하고, 이어서 0.1 x NLS + 0.2 mg/ml 프로테이나제 K에서 50℃에서 밤새 용해시켜 DNA를 젤 매트릭스내로 방출시켰다. DNA를 함유한 아가로즈를 1 mM EDTA(pH8)로 세척하고 이어서 37℃에서 BamHI으로 처리하였다. 부분적으로 분해된 DNA를 6V/cm, 120°각도, 12℃로 맞춰진 CHEF Mapper DRIII(Biorad)를 이용하여 펄스장 전기영동에 의해 0.6% 아가로즈 젤(0.5x TBE)에서 2 단계 크기 선별 과정을 수행하였다. 첫번째 선별은 22-44 sec 선형 경사진 스위치 시간으로 14 시간 수행하는 것으로 이루어졌다. 100-200 kb 람다 연쇄물 크기 마커와 함께 이동하는 DNA를 함유한 젤을 잘라내어 3-5 sec 선형 경사를 가지고 18 시간 두번째 젤에 놓았다. 크기 마커와 비교하여 75-145 kb 로 추정되는 DNA를 TAE에서 전기용출하였다(MiniProtein II Cell model, Biorad).
단일-카피 BAC 라이브러리 클로닝 벡터 pStreptoBAC V는 pBACe3.6에서 유래한다(Frengen et al., A modular, positive selection bacterial artificial chromosome vector with multiple cloning sites, Genomics, 58:250-253(1999)). 스트렙토마이세스에서의 부위 특이적 통합과 접합을 위한 파아지 jC31로부터의 oriT와 attP 서열뿐만 아니라 두 개의 마커, 이. 콜라이에서의 선별을 위한 AmpR 과 스트렙토마이세스에서의 선별을 위한 ApraR 를 함유하도록 pBACe3.6를 변형시켰다. 도 6 참고. 에스. 로제오스포루스 DNA와의 연결을 위한 pStrestpBAC V 벡터를 제조하기 위해, 벡터를 먼저 BamHI으로 분해하고 그 반응을 열(65℃에서 1 시간)에 의해 불활성화시켰다. 이어서 DNA를 새우 알칼라인 포스파타제로 30분간 탈인산화시켰다. 두 개의 밴드(pUC 단편에 해당하는 13 kb와 3 kb)를 0.6% 아가로즈 젤에서 분리하였으며 13 kb 밴드를 GeneClean 스핀 컬럼을 이용하여 정제하였다.
150 ㎕ 반응물에서 9U의 T4 DNA 리가제(Promega)를 이용하여 에스. 로제오스포루스 DNA 200 ng을 BamHI으로 절단되고 포스파타제로 처리된 pStrestpBAC V 벡터 DNA 75 ng에 연결시켰다. 16℃에서 16 시간 후, 연결 반응물을 65℃에서 30분간 가열하고, 10% 폴리에틸렌 글리콜 8000에 대해 투석하고, 300V와 4kΩ에서 전압 승압기를 가진 세포 천공기(Gibco/BRL)를 이용하여 DH10B 전기수행능력이 있는 세포(Gibco/BRL) 10 ㎕내로 형질전환시켰다. 세포를 100 mg/ml 아프라마이신과 5% 수크로스를 함유한 배지(LB 아가)상에 도말하였다. 샘플 클론의 분석은 39 kb 내지 105 kb 범위의 삽입체를 나타내었다. 평균 삽입체 크기는 71.4 kb였고, 표준 편차는 14.7 kb이다. 대략 2,000 클론을 96-웰 미세적정 플레이트에서 -80℃에서 저장하였다.
하기에서 나타내진 프라이머 쌍 P61/P62, P72/P73 및 P74/P75를 이용하여 폴리머라제 쇄 반응(PCR)을 이용하여 이 BAC 라이브러리를 스크리닝하였다. 뉴클레오티드 위치는 서열 번호 1의 번호매김에 따르며, "C"는 프라이머 서열이 서열 번호 1의 상보성 쇄에 해당함을 나타낸다:
Figure pat00001
PCR을 32 사이클 동안 하기 조건하에서 수행하였다; 94℃, 45초, 54℃, 30초, 72℃, 1분. 부가 시약뿐만 아니라 Taq 폴리머라제는 Gibco BRL(Bethesda)에 의해 공급되었으며, 모든 반응은 5% DMSO를 포함하였다.
클론 B12:03A05를 처음에 프라이머쌍 P61/P62로 검출하고(상기 참고), 이어서 다른 두 개의 프라이머 쌍으로 양성임을 확인하였다. 클론 B12:03A05의 DNA를 표준 알카리 분해 과정에 의해 얻어서 DNA 서열결정에 이용하였다(하기 참고).
답토마이신 유전자 클러스터의 부분들을 포함하는 많은 다른 클론들(dpt-관련 클론들)을 BAC 라이브러리로부터 분리하였다. 이들 클론은 B12:01G05(삽입체 크기 82 kb), B12:06A12(삽입체 크기 85 kb), B12:12F06(삽입체 크기 65 kb), B12:18H04(삽입체 크기 46 kb) 및 B12:20C09(삽입체 크기 65 kb)를 포함한다. 이들 BAC 클론의 HinDIII 분해를 보여주는 도 7 참고. 답토마이신 유전자 클러스터 영역에서 분리된 다른 BAC 들은 B12:09D02, B12:17F08, B12:05D08, B12:15H07, B12:21F10, 및 B12:16D12를 포함한다. 이들 BAC들은 180 내지 200 kb를 커버한다. 도 8은 답토마이신 유전자 클러스터에 대한 BAC 클론의 대략적인 위치를 보여준다.
ABI 프리즘 염료 종결인자 사이클 서열결정 준비 반응 키트(Perkin Elmer), 제조자의 추천 반응 혼합물 및 조건, 그리고 하기 프라이머(C는 프라이머 서열이 서열 번호 1의 상보성 쇄에 해당함을 나타냄)를 이용하여 클론 B12:03A05로부터의 BAC DNA 1 ㎍ 분액을 서열결정하여, 실시예 2에서 결정된 답토마이신 생합성 유전자 클러스터 서열을 연장하였다.
Figure pat00002
일렉트로파네로그램(electrophanerogram)을 검사하여 필요한 대로 교정하고, AssemblyLign Module of MacVectorTM을 이용하여 서열을 배열하였다. 배열된 서열(contig)을 분석과 주석을 위하여 MacVectorTM 파일로 저장하였다. MacVectorTM의 오픈 리딩 프레임 옵션을 이용하여 가능한 ORF와 가능한 중지/개시를 동정하였다.
90 kb 서열의 분석은 답토마이신 생합성 유전자 클러스터 영역내에 총 38개의 오픈 리딩 프레임을 보여주었다. 도 2 참고. ORF는 228 염기쌍 내지 22 kb 범위의 크기이다. 세 개의 가장 큰 ORF는 하기하는 바대로 NRPS 유전자들이다. NRPS 유전자들 중 하나는 보존된 모티프, GXSXG의 존재에 기초하여 티오에스테라제 활성을 갖는 것으로 예측되었다(실시예 3 참고). 또다른 예측된 오픈 리딩 프레임은 또한 티오에스테라제 활성을 갖는 단백질을 코딩한다(실시예 3 참고). 많은 가능한 ABC 수송자가 또한 동정되었다.
답토마이신 생합성 유전자 클러스터의 서열이 서열 번호 1에 나타난다. 또한 도 2 참고. 답토마이신 비리보솜 펩티드 신세타제(NRPS)를 코딩하는 유전자를 dptA, dptBC, 및 dptD로 표시한다. 상부 ORF의 일부가 아니며 관심 ORF의 시작점으로부터 상부에 있는 모든 서열을 프로모터 영역으로 지정한다. dptA, dptBC, 및 dptD가 겹치는 개시 및 종결 코돈을 가지며 명백히 번역이 연결되어 있으므로(예를 들어, dptBC의 TGA 종결 코돈은 dptD의 ATG 개시 코돈과 겹치며, 이는 아마도 그 자신의 리보솜 결합 부위와 연합되어 있다), 전체 집단(dptE, dptF, dptA, dptBC, 및 dptD를 포함)의 프로모터를 답토마이신 NRPS 프로모터로 나타낸다.
답토마이신 NRPS dptA 유전자의 ORF의 DNA 서열(서열 번호 1의 뉴클레오티드 38555-56047)이 서열 번호 10에 나타난다. 이 ORF는 17493 뉴클레오티드 길이이다. 코딩된 DptA 단백질의 아미노산 서열은 서열 번호 9에 나타난다. 이 단백질은 5830 아미노산 잔기 길이이다.
답토마이신 NRPS dptBC 유전자의 ORF의 DNA 서열(서열 번호 1의 뉴클레오티드 56044-78060)이 서열 번호 12에 나타난다. 이 ORF는 22017뉴클레오티드 길이이다. 코딩된 DptBC 단백질의 아미노산 서열은 서열 번호 11에 나타난다. 이 단백질은 7338 아미노산 잔기 길이이다.
답토마이신 NRPS dptD 유전자의 ORF의 DNA 서열(서열 번호 1의 뉴클레오티드 78057-85196)이 서열 번호 3에 나타난다. 이 ORF는 7140 뉴클레오티드 길이이다. dptD 유전자 ORF는 C-말단의 타입 I 티오에스테라제(TE I) 도메인을 코딩한다. 예측된 DptD 단백질의 아미노산 서열은 서열 번호 7에 나타난다. 이 단백질은 2379 아미노산 잔기 길이이다.
dptE와 dptF 유전자는 dptA와 답토마이신 NRPS 프로모터 사이에 위치한다.
dptH 티오에스테라제-코딩 유전자의 DNA 서열은 서열 번호 4에 나타나며(서열 번호 1의 뉴클레오티드 85498-86350); dptH의 프로모터 영역은 서열 번호 5에 나타나며(서열 번호 1의 뉴클레오티드 85498-85534); dptH의 오픈 리딩 프레임은 서열 번호 6에 나타난다(서열 번호 1의 뉴클레오티드 85535-86350). 예측된 DptH 단백질의 아미노산 서열은 서열 번호 8에 나타난다(도 4 참고).
답토마이신 NRPS의 프로모터 영역(서열 번호 1의 뉴클레오티드 36018-36407)은 서열 번호 2에 나타난다.
90kb contig의 하부 DNA의 서열은 GPS-1 게놈 프라이밍 시스템(New England Biolabs)와 같은 시스템을 이용하는 트랜스포존 프라임된 서열결정에 의해 플라스미드 pV107로부터 Genome Therapeutics Corps.에 의해 생성되었다. 플라스미드 pV107은 표준 기법을 이용하여 B12:03A05 게놈으로부터 벡터 pNEB193(EcoRI(New England Biolabs)로 절단됨)내로 서브클론된 대략 28 kb EcoRI 단편을 포함한다. 이 단편은 GTC2라 불린다. 적절한 수의 트랜스포존이 꼬리에 붙은 라이브러리 클론을 서열 결정하여 6-배 여분을 갖는 contig를 생성하였으며, PCR 생성물의 부가적인 국소적 서열 결정을 이용하여 필요한 위치의 서열을 마무리했다. contig의 5' 말단과 기존의 90 kb 사이의 겹치는 부분을 contig로부터 제거하여, pV107 유래 서열(GTC2로 칭함)의 시작점은 1로 시작한다. GTC2 단편의 서열은 서열 번호 106에 제공된다.
실시예 3: dptD와 dptH 유전자의 티오에스테라제로서의 동정
dptD와 dptH 유전자와 예측된 그들의 번역 생성물을 검사하여 비리보솜 펩티드 신세타제와 티오에스테라제에 전형적인 아미노산 모티프를 동정하였다. X가 번역단계에서 리보솜에 의해 생성된 단백질에 삽입되는 20개의 L-아미노산 중 임의의 하나인 아미노산 서열 모티프 GXSXG가 티오에스테라제를 나타낸다(Mootz et al., J.Bacteriol. 179:6843-6850, 1997, 본원에 참고로 통합됨). 서열 번호 7-8을 GXSXG 티오에스테라제 모티프에 대해 검사하였다. 서열 번호 7에서, 티오에스테라제 모티프 GWSFG(서열 번호 166)에의 아미노산 서열 매치가, 서열 번호 1의 뉴클레오티드 84654-84668에 의해 코딩되는 좌표(coordinates) 2200-2204에서 발견되었다. 서열 번호 8에서, 티오에스테라제 모티프 GTSLG(서열 번호 167)에의 아미노산 서열 매치가, 서열 번호 1의 뉴클레오티드 85823-85838에 의해 코딩되는 좌표 97-101에서 발견되었다.
서열 번호 7의 DptD 단백질을 스트렙토마이세스 코엘리컬러의 CDA III 단백질에 배열시켰다. 이 배열은 느린 페어방식 배열 모드로 Clustal w(V 1.4) 프로그램을 이용하여 수행되었다. 10.0의 오픈 갭 패널티, 0.1의 연장된 갭 패널티, 및 CDA III 단백질에의 블로섬(blosum) 유사성 매트릭스가 이용되었다. CDA III 단백질은 카르복시-말단 티오에스테라제 도메인을 가진 비리보솜 펩티드 신세타제이다(GENBANK 기탁 번호 AL035707, 버젼 AL035707.1 GI:4490978, 본원에 참고로 통합됨). 배열에 이용된 CDA III 아미노산 서열은, 두 개의 GENBANK 코스미드 서열, AL035707과 AL035640으로부터 콘티그(contig)를 생성시키고 이어서 오픈 리딩 프레임을 GENBANK에서 주석된 콘티그에서 번역시켜 MacVector 프로그램을 이용하여 생성되었다. 서열 비교 결과(도 3) 7705와 1223의 보존된 동일성의 배열 점수를 나타냈으며, 이는 두 비교 서열간의 상당한 유사성을 나타낸다. DptD 단백질과 CDA III 단백질의 GXSXG 티오에스테라제 모티프를 이 분석에서 배열하였다.
서열 번호 8의 DptH 단백질의 GXSXG 티오에스테라제 모티프를 스트렙토마이세스 코엘리컬러(CAA71338 단백질, 상기 참고)의 CDA III 단백질의 GXSXG 티오에스테라제 모티프에 배열시켰다. 이 배열은 느린 페어방식 배열 모드로 Clustal W(V 1.4) 프로그램을 이용하여 수행되었다. 10.0의 오픈 갭 페널티, 0.1의 연장된 갭 페널티, 및 GENPEPT 레코드 CAA71338(버젼 CAA71338.1 GI:2647975, 본원에 참고로 통합됨)의 스트렙토마이세스 티오에스테라제 단백질에의 블로섬 유사성 매트릭스가 이용되었다. 이 배열 결과(도 4) 955와 145의 보존된 동일성의 배열 점수를 나타냈으며, 이는 두 비교 서열간의 상당한 유사성을 나타낸다.
이들 분석은 dptD와 dptH가 티오에스테라제 단백질, 구체적으로 서열 번호 7-8의 단백질을 코딩함을 나타낸다.
실시예 4: 답토마이신 NRPS의 동정
답토마이신 NRPS 서브유닛으로서 dptD의 동정
전술한 dptD DNA 서열의 예측된 번역 생성물(실시예 2와 3)을 NRPS 문헌에 개시된 다양한 단백질 모티프가 존재하는 지를 시각적으로 검사하였다. 축합 도메인을 나타내는 dptD 축합("M") 모티프가 서열 번호 1의 뉴클레오티드 78486-78509에서 동정되었다(실시예 4-6에 개시된 모든 뉴클레오티드 위치는 서열 번호 1에 대한 것임). 예를 들어 NRPS내의 다양한 모티프를 위해서는 Kleinkauf et al., Eur.J.Biochem., 236, pp.335-351(1996) 및 Pospiech et al., Microbiology, 142, pp.741-746(1996) 참고. ATP-결합("C") 모티프가 뉴클레오티드 79896-79928에서 동정되었으며, ATP-결합("E") 모티프가 뉴클레오티드 80451-80486에서 동정되었으며, ATPase("F") 모티프가 뉴클레오티드 80556-80579에서 동정되었으며, ATP-결합("G") 모티프가 뉴클레오티드 80652-80675에서 동정되었다. 이들 모티프는 총체적으로 아데닐화 도메인을 나타낸다. 티올화(PCP) 도메인을 나타내는 티올화("J") 모티프는 뉴클레오티드 81048-81062에서 동정되었다. 상기 모티프들, 및 그들이 상징하는 도메인들은 dptD의 모듈 1에 속하며, 답토마이신 신세타제의 관점에서 이는 모듈 12이다.
축합 도메인을 나타내는 다른 dptD 축합("M") 모티프는 뉴클레오티드 81621-81644에서 동정되었다. 다른 ATP-결합 ("C") 모티프는 뉴클레오티드 83114-83147에서 동정되었으며, ATP-결합("E") 모티프가 뉴클레오티드 83667-83702에서 동정되었으며, ATPase("F") 모티프가 뉴클레오티드 83772-83795에서 동정되었으며, ATP-결합("G") 모티프가 뉴클레오티드 83868-83891에서 동정되었다. 이들 모티프는 총체적으로 또 다른 아데닐화 도메인을 나타낸다. 티올화(PCP) 도메인을 나타내는 티올화("J") 모티프는 뉴클레오티드 84255-84269에서 동정되었다. 상기 모티프들, 및 그들이 상징하는 도메인들은 dptD의 모듈 2에 속하며, 답토마이신 신세타제의 관점에서 이는 모듈 13이다.
전술한 예측된 모티프와 도메인에 상응하는 DptD 아미노산 서열이 동정되었다(DptD를 위한 아미노산 위치는 모두 서열 번호 7의 아미노산 위치를 말함). DptD의 모듈 1(답토마이신 신세타제의 모듈 12에 해당)에 속하는 모티프들, 및 그들이 상징하는 도메인은 하기와 같다: DptD 축합("M") 모티프는 좌표 144-151에서 동정되었으며; ATP-결합 ("C") 모티프는 좌표 614-624에서 동정되었으며, ATP-결합("E") 모티프가 좌표 799-810에서 동정되었으며, ATPase("F") 모티프가 좌표 834-841에서 동정되었으며, ATP-결합("G") 모티프가 좌표 866-873에서 동정되었으며, 티올화("J") 모티프는 좌표 998-1002에서 동정되었다.
DptD의 모듈 2(답토마이신 신세타제의 모듈 13에 해당)에 속하는 DptD 모티프들, 및 그들이 상징하는 도메인은 하기와 같다: DptD 축합("M") 모티프는 좌표 1189-1196에서 동정되었으며, ATP-결합 ("C") 모티프는 좌표 1687-1697에서 동정되었으며, ATP-결합("E") 모티프가 좌표 1871-1882에서 동정되었으며, ATPase("F") 모티프가 좌표 1906-1913에서 동정되었으며, ATP-결합("G") 모티프가 좌표 1938-1945에서 동정되었으며, 티올화("J") 모티프는 좌표 2067-2071에서 동정되었다. ATP-결합 모티프는 아데닐화 도메인을 나타낸다.
답토마이신 NRPS 서브유닛으로서 dptA와 dptBC의 동정
일부 M,C,E,F,G 및 J 모티프가 유사한 방식으로 dptA와 dptBC에서 동정되었다. 각 모티프의 서열과 유형, 각 모티프가 발견되는 유전자와 모듈, 및 각 모티프의 아미노산과 뉴클레오티드 좌표가 표 1에서 나타난다:
Figure pat00003
Figure pat00004
표 1의 아미노산 좌표는 각 단백질의 아미노산 서열(DptA: 서열 번호 9; DptBC: 서열 번호 11)을 나타낸다. 뉴클레오티드 위치는 서열 번호 1의 뉴클레오티드 위치를 나타낸다.
실시예 5: 아미노산 포켓 코드 주석
아미노산 포켓 코드는 동족 아미노산의 인식 및/또는 결합에 관여하는 것으로 생각되는 아데닐화(A) 도메인의 아미노산 잔기 세트를 말한다. 13개의 답토마이신 신세타제 모듈을 위한 아미노산 포켓 코드가 하기에 나타난다(표 2).
답토마이신 신세타제 모듈을 위한 아미노산 포켓 코드는 Blast 분석 또는 NRPS A 도메인(아미노산 결합 포켓)과 배열된 추정적 Dpt 번역 생성물의 MacVector 7.0을 이용하여 생성된 배열을 가시적으로 검사하여 동정되었다(Stachelhaus et al.(1999), The specificity-conferring code of adenylatin domains in nonribosomal peptide synthetases, Chem.Biol.,6:493-505에 개시됨). 또한 Challis et al., (2000), Predictive, structure-based model of amino acid recognition by nonribosomal peptide synthetase adenylation domains, Chem.Biol.7:211-224 참고.
Figure pat00005
표 2의 아미노산 좌표는 각 단백질의 아미노산 서열을 나타낸다(DptA:서열 번호 9; DptBC: 서열 번호 11; DptD: 서열 번호 7). 뉴클레오티드 위치는 서열 번호 1의 뉴클레오티드 위치를 나타낸다.
답토마이신 유전자 클러스터의 아스파테이트와 아스파라긴을 위한 전체 아데닐화 도메인과 스트렙토마이세스 코엘리컬러의 CDA III NRPS의 아스파테이트, 아스파라긴 및 트레오닌을 위한 아데닐화 도메인간의 유사성은 도 10에 나타난다. 아미노산을 배열하고 Macvector를 이용하여 계통수를 구성하였다. 명명법은 다음과 같다: 유전자의 이름 -- 그 유전자내의 모듈의 수 -- 활성화된 아미노산(단문자 코드). 이 배열은 답토마이신 유전자 클러스터내의 아스파테이트와 아스파라긴을 위한 아데닐화 도메인이 트레오닌과 같은 무관한 아미노산으로부터의 도메인에 대해서보다 서로간에 더 유사함을 보여준다. 또한, 이 배열은 답토마이신 유전자 클러스터내의 아스파테이트와 아스파라긴을 위한 아데닐화 도메인이 CDA의 아스파테이트와 아스파라긴을 위한 모듈에 대해서보다 서로간에 더 유사함을 보여준다.
실시예 6: 답토마이신 NRPS의 에피머라제 도메인의 동정
DptA, DptBC, 및 DptD의 아미노산 서열을 에피머라제 도메인의 특징부인 서열에 대해 검사하였다. 에피머라제 도메인은 L-아미노산을 D-아미노산으로 전환시키는 역할을 하며 일반적으로 대략 1.4-1.6 kb DNA에 의해 코딩된다.
답토마이신 유전자 클러스터내에 총 2개의 에피머라제 도메인이 있을 것으로 예상되었는데, 이는 답토마이신이 2개의 D-아미노산, D-Ala와 D-Ser을 함유하는 것으로 알려져 있었기 때문이다. 하나의 에피머라제 도메인은 모듈 8(D-Ala)과 모듈 11(D-Ser)의 각각에서 동정되었다. 모듈 8과 11은 에피머라제 도메인을 함유하지 않는 모듈보다 대략 1.4 kb 더 크다(에피머라제 도메인을 함유하지 않는 모듈이 각각 3.2 kb인데 비하여 모듈 8과 11은 각각 대략 4.6 kb임). 또한, 모듈 8과 11은 모티프 K,L,M,N,O,P 및 Q를 포함한, 에피머라제 도메인을 나타내는 모티프들을 함유한다(Kleinkauf and Von Dohren, 236:355-351(1996)). 표 3 참고.
놀랍게도, 에피머라제 도메인은 또한 모듈 2에서 동정되었다. 모듈 2는 예상보다 1.6 kb 더 크다. 또한, 모듈 2는 모티프 K,L,M,N,O,P 및 Q를 포함한, 에피머라제 도메인의 특징인 많은 모티프를 함유한다. 표 3 참고. 이러한 예상치 못한 발견은 답토마이신의 아스파라긴이 D 형태임을 나타낸다.
Figure pat00006
표 3의 아미노산 좌표는 각 단백질의 아미노산 서열을 나타낸다(DptA:서열 번호 9; DptBC: 서열 번호 11; DptD: 서열 번호 7). 뉴클레오티드 위치는 서열 번호 1에서의 뉴클레오티드 위치를 나타낸다.
답토마이신의 아스파라긴이 D 형태임을 확인하기 위하여, 고압액체크로마토그래피(HPLC)를 수행하였다. 아미노산 오르니틴, 글리신, 트레오닌, 아스파르트산, 아스파라긴, 및 탈아실화된 트립토판을 함유하는 헥사-펩티드(Trp-Asn-Asp-Orn-Gly-Thr)(서열 번호 168)을 분해하여 답토마이신으로부터 분리하였다. 상기 펩티드를 D-Asn 또는 L-Asn을 함유하는 펩티드를 분리시키는 조건하에서 HPLC에 의해 분석하였다. HPLC는 분리된 상기 펩티드에 대하여 단지 하나의 큰 피크만을 나타냈다. 도 11의 왼쪽 패널을 참고. 답토마이신으로부터 분리된 펩티드를 실험실에서 합성되고 D-Asn을 함유한 동일 서열의 펩티드와 혼합하였다. 이 펩티드 혼합물을 전술한 동일 조건하에서 HPLC에 의해 분석하였으며 단일 피크만을 함유하는 것으로 나타났다. 도 11, 중간 패널 참고. 또한, 답토마이신으로부터 분리된 펩티드를 L-Asn을 함유하는 동일 서열의 합성 펩티드와 혼합하였다. HPLC 분석은 두 개의 피크를 나타냈다. 도 11, 오른쪽 패널 참고. 이들 실험은 자연 발생 답토마이신이 L-Asn이 아니라 D-Asn을 함유함을 확인한다.
실시예 2-7에 개시된 실험들로부터, 답토마이신 NRPS의 조직이 결정되었다. 도12는 dptA, dptBC, 및 dptD의 조직을 나타낸다. dptA는 다섯 개의 모듈(모듈 1-5)을 함유하고, dptB는 여섯 개의 모듈(모듈 6-11)을 함유하고, dptD는 두 개의 모듈(모듈 12-13)과 티오에스테라제 도메인을 함유한다. 표 4는 13개 모듈, 그들의 도메인, dpt 유전자, 및 그들의 동족 아미노산간의 상응성을 요약한다. "C"는 촉매 도메인을 나타내고, "A"는 아데닐화 도메인을 나타낸고, "T"는 티올화 도메인을 나타내고, "E"는 에피머라제 도메인을 나타내며, "Te"는 티오에스테라제 도메인을 나타낸다.
Figure pat00007
실시예 7: 스트렙토마이세스 로제오스포루스로부터의 답토마이신 유전자 클러스터를 이용한 스트렙토마이세스 리비단스의 형질전환
클론 B12:03A05로부터의 BAC DNA를 함유하는 이. 콜라이 세포(실시예 2 참고)를 교반(250 rpm)하면서 37℃에서 밤새 루리아(Luria) 브로스(LB; Difco) 5 ml에서 성장시켰다. BAC DNA를 표준 알카리 용해 기법으로 분리하였다(Sambrook et al., supra, "Small scale preparation of plasmid DNA" 참고).
에스. 리비단스 TK64 포자를 이용하여 25 mL의 YEME + 수크로스 배지를 접종하고 배양물을 30℃에서 40 시간 동안 배양하였다. 이어서 배양물을 수집하고 균사체를 상등액으로부터 침전시키고 P-완충액으로 몇번 세척하였다(Practical Streptomyces Genetics; Tobias Kieser, Mervyn J.Bibb, Mark J.Buttner, Keith F.Chater and David Hopwood(John Innes Foundation, Norwich, 2000)("Practical Streptomyces Genetics"). 새로운 원형질체를 상기의 Practical Streptomyces Genetics(p.56)에 개시된 방법에 따라 제조하고 0.5 ml 분액(대략 108-109 원형질체)으로 나누고 3000 rpm에서 7분간 원심분리하여 침전시켰다. 대부분의 상등액을 제거하여 펠렛과 약 50 ㎕의 상등액만 남겼다. 펠렛을 남은 상등액에 재현탁하고, 여기에 클론 B12:03A05로부터의 BAC DNA 5 ㎕(TE중의 50 ng/㎕)를 첨가하였다. 이 현탁액을 P-완충액중의 25% PEG-1000 350 ㎕를 첨가하기 전과 후에 부드럽게 혼합하였다(Practical Streptomyces Genetics).
원형질체 현탁액 혼합물을 동등한 양으로 세 개의 건조된 R5T 플레이트(원래 중량의 약 15%를 손실하도록 건조됨: Practical Streptomyces Genetics 참고)에 도말하였다. 접종된 플레이트를 30℃에서 밤새 배양하였다. 16-18 시간 성장시킨 후, 플레이트에 20% 글리세롤중의 아프라마이신 용액(1 mg/ml) 3 ml를 도말하여 각 플레이트에 약 100 ㎍/ml의 최종 농도를 제공하고 플레이트를 30℃에서 배양하였다. 3일 후, 플레이트를 검사하여 아프라마이신 선별하에서 성장하는 콜로니를 함유하는지를 결정하였다. 2개의 콜로니를 뽑아서, 100 ㎕/ml의 아프라마이신을 함유하는 2개의 F10A 아가 플레이트(2.5% 아가, 0.3% 칼슘 카보네이트, 0.5% 증류기 가용성 물질, 2.5% 가용성 전분, 0.5% 효모 추출물, 0.2% 덱스트로스 및 0.5% 박토펩톤; 1L의 탈이온화되고 오토클레이브된 물에 현탁됨)에 스트리킹하고, 콜로니가 생겨날 때까지 30℃에서 배양하였다. 포자를 Practical Streptomyces Genetics에 개시된 방법에 따라 수집하고 -20℃에서 20% 글리세롤 현탁액으로 저장하였다.
에스. 리비단스를 답토마이신 유전자 클러스터를 함유하는 BAC DNA(B12:03A05, CBUK136742에서 유래)로 형질전환시켜 얻어진 포자를 적절한 배지에서 성장시키고 고압 액체 크로마토그래피(HPLC)와 LC-MS로 분석하여 그들이 야생형 리포펩티드 프로파일을 생산하는 지를 결정하였다(실시예 9 참고).
실시예 8: 답토마이신 유전자 클러스터를 함유하는 스트렙토마이세스 리비단스 TK64 클론의 발효
답토마이신 유전자 클러스터를 함유하는 스트렙토마이세스 리비단스 TK64 클론의 포자를 5 ml의 10% 수성 글리세롤(BDH)중의 배지 A(2% 조사된 귀리(Quaker), 0.7% 트립톤(Difco), 0.2% 소야 펩톤(Sigma), 0.5% 염화나트륨(BDH), 0.1% 미량 염 용액, 1.8% 아가 no.2(Lab M), 0.01% 아프라마이신(Sigma))의 10일된 슬랜트 배양물에 현탁시켜 수집하였다. 1.5 ml 동결 바이알내의 이 현탁액 1 ml은 -135℃에 저장되었다 나온 출발 물질을 포함한다. 예비 배양물은 상기 출발 물질 0.3 ml를 배지 A1의 경사면에 무균적으로 놓고 28℃에서 9일간 배양함으로써 생산되었다.
종자 배양물은 예비-배양물을 0.1% Tween 80(Sigma) 용액 4 ml로 무균 처리하고 경사면 표면을 부드럽게 하여 성장력있는 균사체와 포자의 현탁액을 형성함으로써 생성되었다. 이 현탁액의 2 ml 분액을 40 ml의 영양 용액 S(1% D-글루코스(BDH), 1.5% 글리세롤(BDH), 1.5% 소야 펩톤(Sigma), 0.3% 염화나트륨(BDH), 0.5% 맥아 추출물(Oxoid), 0.5% 효모 추출물(Lab M), 0.1% Junlon PW100(Honeywell and Stein Ltd), 0.1% Tween 80(Sigma), 4.6% MOPS(Sigma), pH 7.0으로 조정되며 오토클레이브됨)를 함유하는, 격벽을 갖춘 250 ml 플라스크내로 옮겨서 30℃에서 44 시간 동안 240 rpm에서 교반하였다.
종자 배양물 5%를 50 ml의 배지 P(1% 글루코스(BDH), 2% 가용성 전분(Sigma), 0.5% 효모 추출물(Difco), 0.5% 카제인(Sigma), 4.6% MOPS(Sigma0, pH 7로 조정되고 오토클레이브됨)를 함유하는 격벽을 갖춘 250 ml 플라스크로 옮기고 30℃에서 7일 동안 240 rpm에서 교반하여 생성물 배양물을 생성시켰다.
실시예 9: 답토마이신 유전자 클러스터를 함유하는 스트렙토마이세스 리비단스 TK64 클론의 발효로부터 얻은 A21978C 리포펩티드의 정제 및 분석
실시예 8에 개시된 생성물 배양물의 전체 배양물 2 ml를 무균적으로 제거하여 10분간 원심분리한 후 분석함으로써, 상기 생성물 배양물을 분석 샘플로 하였다. 최대 부피 50 ㎕의 상등액을 분석하여 스트렙토마이세스 로제오스포루스에 의해 생산된 천연 리포펩티드(A21978C)의 생산을 모니터하였다. 이 분석은 4.6 X 50 mm Symmetry C8 3.5 ㎛ 컬럼과 Phenomenex Security Guard C8 카트리지를 갖춘 996 PDA 검출기와 Waters Alliance 2690 HPLC 시스템을 이용하여 주위 온도에서 수행되었다. 구배는 처음에는 90% 물과 10% 아세토니트릴에서 2.5분간 유지되며, 이어서 6분에 걸쳐 100% 아세토니트릴까지 선형 구배가 뒤따른다. 유속은 분당 1.5 ml이며 구배는 0.01% 트리플루오로아세트산으로 완충된다. 발효 2일째에 천연 리포펩티드 중 세 개, C1, C2, 및 C3의 생산(답토마이신과 동일한 UV/가시광선 스펙트럼을 가짐)이 명백했으며, 도 5A에 나타난 바처럼, 개시된 분석 조건하에서 보유 시간 5.62, 5.77 및 5.90분을 갖는 HPLC 피크(λmax 223.8, 261.5 및 364.5 nm)로 나타났다. 이어서 리포펩티드는 7일 기간 동안 각 샘플 지점에서의 발효에서 명백하게 유지되었다. 리포펩티드 C1, C2, 및 C3의 총 수율은 발효 물질 리터당 10-20 mg 범위였다.
액체 크로마토그래피-질량 스펙트로미트리(LC-MS) 분석은 양성 이온 모드의 일렉트로스프레이 이온화를 이용하여 Finnigan SSQ710c LC-MS 시스템상에서 200-2000 달톤의 스캔 범위와 2초 스캔으로 수행되었다. 크로마토그래피에 의한 분리는 0.01% 포름산을 함유하는 선형 물-아세토니트릴 구배로 용출되는 Waters Symmetry C8 컬럼(2.1 x 50mm, 3.5 ㎛ 입자 크기)상에서 이루어지며, 상기 구배는 0.5분의 초기 지연 후 6분의 기간에 걸쳐 10% 아세토니트릴로부터 100% 아세토니트릴로 증가되며 이어서 재평형화 전에 추가 3.5분간 100% 아세토니트릴에서 유지되었다. 유속은 0.35 ml/분이며 이 방법은 주위 온도에서 수행되었다.
스트렙토마이세스 로제오스포루스에 의해 생산된 주요 A21978C 리포펩티드 대사물 C1, C2, 및 C3에 대해 보고된 질량과 일치하는 1634.7, 1648.7 및 1662.7의 m/z에서의 분자 이온([M+H]+)에 의해 나타내지는 바와 같이, 세 개의 천연 리포펩티드의 동정이 확인되었다.(Debono et al., J.Antibiotics, 40, pp.761-777(1987)).
BAC 클론 01G06, B12:06A12, B12:12F06 및 B12:18H04를 이용하여 유사한 실험을 수행하였다. 이들 BAC 클론중 어느 하나를 함유하는 에스. 리비단스 세포의 어느 것도 답토마이신을 생산할 수 없었다.
실시예 10: 답토마이신의 생산을 위한 답토마이신 유전자 클러스터를 함유하는 스트렙토마이세스 리비단스 TK64 클론의 공급-배치 발효
답토마이신 유전자 클러스터(클론 B12:03A05에서 유래)를 함유한 스트렙토마이세스 리비단스 TK64 클론의 세포를 5 ml의 10% 수성 글리세롤(BDH)중의 배지 A(Practical Streptomyces Genetics 참고: 2% 조사된 귀리(Quaker), 0.7% 트립톤(Difco), 0.2% 소야 펩톤(Sigma), 0.5% 염화나트륨(BDH), 0.1% 미량 염 용액, 1.8% 아가 no.2(Lab M), 0.01% 아프라마이신(Sigma))의 10일된 경사 배양물에 현탁시켜 재생시켰다. -135℃에 저장되었던, 출발 물질 1 ml를 함유하는 1.5 ml 동결 바이알을 꺼내어 신속하게 녹였다. 예비 배양물은 상기 출발 물질 0.3ml를 배지 A의 경사면에 무균적으로 놓고 28℃에서 9일간 배양함으로써 생산되었다. 종자 배양물의 접종을 위한 재료는 예비-배양물을 0.1% Tween 80(Sigma) 용액 4 ml로 무균 처리하고 경사면 표면을 부드럽게 하여 성장력있는 균사체와 포자의 현탁액을 형성함으로써 생성되었다.
종자 배양물은 250 ml의 영양 용액 S(Practical Streptomyces Genetics 참고)를 함유하는 격벽을 갖춘 2 L짜리 Erlenmeyer 플라스크내로 접종 물질 1 ml를 무균적으로 놓음으로써 생산되었으며 30℃에서 2일간 240 rpm에서 교반되었다.
생성물 배양물은 종자 배양물을 영양 용액 P(Practical Streptomyces Genetics 참고) 14 L를 함유하는 20 L 발효기내로 무균적으로 옮김으로써 생성되었다. 생성물 발효기를 350 rpm에서 교반하고, 0.5 vvm에서 통기시키고, 온도를 30℃로 조절하였다. 20 시간 배양한 후, 발효동안 50%(w/v) 글루코스 용액을 상기 배양물에 5 g/hr로 공급하였다.
40 시간 배양 후, 데카노산:메틸 올레이트(각각 Sigma and Acros Organics)의 50:50 혼합물을 발효 나머지 기간 동안 0.5 g/hr로 발효기에 공급하였다. 배양물을 112 시간 후에 수집하고, 볼(bowl) 원심분리기를 통해 배치 가공하여 생물질을 배양물 상등액으로부터 제거하였다.
생물질을 버리고 깨끗해진 발효 브로스를 추출을 위해 보관하였다. 브로스(약 10 L)를, 물로 예비평형화된 HP20 레진의 60 mm(직경) x 300 mm (길이) 컬럼 상에 100 ml/min의 속도로 로딩하였다. 컬럼을 2L의 물 및 이어서 1.5 L의 80% 메탄올(물중의)로 비슷한 유속으로 세척하였다. 마지막으로, 결합된 물질을 2 L 메탄올로 용출하고 이어서 진공하에서 수성 농축물로 만들었다. 이 농축물을 정제수로 1 L로 희석하고 에틸 아세테이트(700 ml)로 세 번 분배시켰다. 에틸 아세테이트 분획을 분석하고 버리고, 수성 층을 분말로 동결건조하였다.
동일한 패킹을 갖춘 2개의 40x100mm Waters NovaPak C18 6㎛ 유닛과 40x10mm Guard-Pak으로 구성된 방사상으로 압축된 카트리지 컬럼을 이용하여 고 성능 액체 크로마토그래피(HPLC)에 의해 답토마이신을 분리하였다. 동결건조된 물질(150 내지 200 mg)을 물에 용해시키고, 초기 조건이 90% 물과 10% 아세토니트릴이고, 이어서 10분에 걸쳐 20% 물과 80% 아세토니트릴로 선형으로 증가되고, 이어서 즉시 추가 1분 동안 100% 아세토니트릴로 증가되는 구배를 이용하여 컬럼상에서 크로마토그래피하였다. 223 nm에서의 UV 흡광도를 답토마이신의 용출에 대해 모니터하였다. 답토마이신 피크는 약 9분에서 용출되어 수집되고 수회 반복된 용출에 걸쳐 합쳐졌다. 이어서 샘플을 진공하에서 증발시키고 진공에서 건조시켜 30 mg의 정제된 화합물을 얻었다. 전체 물질의 단지 일부만을 처리하였다.
정제된 화합물을 먼저 996 PDA 검출기와 Waters Alliance 2690 HPLC 시스템을 이용하여 Phenomenex Security Guard C8 카트리지를 갖춘 4.6 X 50 mm Symmetry C8 3.5 ㎛ 입자 크기 컬럼상에서 주위 온도에서 역상 HPLC에 의해 분석하였다. 컬럼을 물-아세토니트릴 구배로 용출하였으며, 구배는 처음에는 90% 물에서 2.5분간이며, 이어서 6분에 걸쳐 100% 아세토니트릴까지 선형으로 증가되었으며, 유속은 분당 1.5 ml였다. 구배는 0.01% 트리플루오로아세트산으로 완충되었다. 이 크로마토그래피 분석은 보유 시간(5.52분)과 정제된 화합물의 UV 흡수 스펙트럼(λmax 223.8, 261.5, 366.9nm)이 답토마이신의 것들과 일치함을 확인했다. LC-MS(ESI)는 1620.6의 분자 이온 MH+를 확인하였으며, 1H NMR(D6-DMSO)는 답토마이신에 대해 기록된 것과의 우수한 가시적 매치를 보여주었다(도 5C).
이 물질이 답토마이신임은 13CNMR 실험에 의해 추가로 확인되었다.
공급물-배치 발효는 또한 더 큰 규모, 예를 들어 60,000 리터로 이루어질 수 있다.
실시예 11: 수율 증가를 위한 답토마이신 유전자의 용도
제1장 긍정적 조절 유전자의 복사
스트렙토마이세스 로제오스포루스의 염색체중의 중성 게놈 부위를 TN5097 또는 관련 트랜스포존을 이용한 트랜스포존 돌연변이유발, 및 이어지는 발효 분석에 의해 동정한다. 중성 부위와 트랜스포존의 바깥쪽을 절단하는 제한 엔도뉴클레아제를 이용하여 염색체로부터 이 중성 부위를 잘라내고, 트랜스포존의 항생제 내성 마커(TN5097의 경우에는 하이그로마이신 내성)의 발현에 대해 선별하면서 이. 콜라이에 클로닝하였다. 이러한 접근법의 예는 티로신 생산자인 스트렙토마이세스 프라디에의 중성 부위를 동정하는 데 이용되었다. 본원에 참고로 통합되는 Baltz et al., Antonie van Leeuwenhoek, 71, pp.179-187(1997) 참고. 에스. 로제오스포루스에서 중성 부위를 동정하는 예는 본원에 참고로 통합되는 McHenney et al., J.Bacteriol., 180, pp.143-151(1998)에 개시된다.
답토마이신 유전자 클러스터로부터의 조절 유전자(서열 번호 109)를 중성 부위내에서 플라스미드로 클로닝한다. 적절한 플라스미드는 단일 크로스오버를 함유하는 일차 재조합체의 선별을 위한 항생제 내성 유전자, 야생형 rpsL 유전자와 같은 반대 선별이 가능한 마커, 클론된 조절 유전자와 상부 및 하부 서열을 염색체 중성 부위내로 삽입하고 플라스미드 서열을 제거하는 이중 크로스오버를 함유하는 재조합체의 선별을 위한 스트렙토마이신에 대한 민감성을 부여하는 리보좀 단백질 유전자(Hosted and Baltz, J.Bacteriol., 179, pp.180-186(1997)) 및 플라스미드의 큐어링을 촉진하는 열민감성 레플리콘을 함유하는 것이다. 이중 크로스오버는 rpsL 유전자에 돌연변이를 함유하고 있기 때문에 스트렙토마이신에 대해 정상적으로는 내성인 숙주 균주에서 이루어진다. rpsL의 야생형(스트렙토마이신-민감성) 대립유전자는 스트렙토마이신 내성에 대해 우성이므로, 스트렙토마이신 내성을 발현하는 재조합체는 중성 부위의 두개의 아암(arm)에서의 이중 크로스오버에 의해 플라스미드상의 rpsL 유전자를 제거하고 따라서 클론된 답토마이신 조절 유전자를 염색체내로 삽입했음에 틀림없다. 재조합체는 그들이 클론된 답토마이신 조절 유전자가 없는 모 균주에 비하여 증가된 수율을 가짐을 입증하기 위해 발효된다.
ABC 수송자 유전자의 복제
상부 및 하부 서열을 포함한, 답토마이신 유전자 클러스터로부터의 ABC 수송자 유전자 하나 이상을 전술한 벡터의 중성 부위내로 클로닝하고 이중 크로스오버에 의해 실시예 11A에 개시된 대로 에스. 로제오스포루스 염색체내로 삽입한다. 재조합체를 발효시켜 그들이 클론된 ACB 수송자 유전자가 없는 모 균주에 비하여 증가된 답토마이신 수율을 가짐을 확인한다.
novA, B, C 상동체의 복제
상부 및 하부 서열을 포함한, 답토마이신 유전자 클러스터로부터의 novA, B, C 상동체를 함유하는 DNA 단편을 벡터의 중성 부위내로 클로닝하고 이중 크로스오버에 의해 실시예 11A에 개시된 대로 에스. 로제오스포루스 염색체내로 삽입한다. 재조합체를 발효시켜 그들이 클론된 novA, B, C 유전자가 없는 모 균주에 비하여 증가된 답토마이신 수율을 가짐을 확인한다.
답토마이신 생합성 유전자의 복제
지방 아실-CoA 리가제, NRPS의 세개의 서브유닛, dptD의 통합 티오에스테라제 및 dptH의 유리 티오에스테라제를 포함한, 답토마이신 생합성 유전자, dptA, dptBC, dptD, dptE, dptF, dptG, 및 dptH를 phiC31 부착 및 통합 기능(att/int) 및 플라스미드 RK2로부터의 oriT(Baltz, Trends in Microbiol.,6:76-83(1998), 참고로 본원에 통합)를 함유하는 BAC 벡터내로, 이. 콜라이로부터 에스. 로제오스포루스로의 접합을 위해 클로닝시켰다. 답토마이신 유전자를 함유하는 상기 BAC를 이. 콜라이 S17.1, 즉 자가 복제 플라스미드 RK2를 함유하는 균주로부터의 접합에 의해 에스. 로제오스포루스내로 도입하였다. 다르게는, BAC 벡터는 답토마이신 유전자 클러스터내로의 상동성 재조합에 의해 염색체내로 도입된다. 재조합체를 발효시켜 그들이 클론된 답토마이신 유전자가 없는 모 균주에 비하여 증가된 답토마이신 수율을 가짐을 확인한다.
답토마이신 티오에스테라제 유전자의 복제
답토마이신 유전자 클러스터(서열 번호 1)는 티오에스테라제 활성을 갖는 단백질의 특징적인 보존된 서열 모티프를 포함하는 아미노산 서열을 코딩하는 오픈 리딩 프레임을 갖는 적어도 두 개의 유전자(dptD와 dptH) (각각 서열 번호 3과 6) 또는 그 도메인을 함유한다. DptD와 DptH 아미노산 서열 각각을 위해 서열 번호 7과 서열 번호 8 참고. 이들 티오에스테라제 유전자 또는 이들의 티오에스테라제 도메인의 어느 하나(또는 둘다)는 상기 실시예 11A의 과정을 따라 복사될 수 있다.
선택적으로 발현 조절 서열(예를 들어 서열 번호 1 또는 2의 천연 조절 서열)에 작동적으로 연결되고, 선택적으로 상부 및 하부 서열을 포함하는 dptD ORF 서열(예, 서열 번호 1; 서열 번호 3)을 함유하는 DNA의 단편을 중성 부위 벡터내로 클로닝하고 이중 크로스오버에 의해 실시예 11A에 개시된 대로 에스. 로제오스포루스 염색체내로 삽입한다. 재조합체를 발효시켜 그들이 클론된 dptD 유전자가 없는 모 균주에 비하여 증가된 농도의 답토마이신을 생산함을 확인한다.
유사하게, 선택적으로 발현 조절 서열(예를 들어 서열 번호 1, 4 또는 5의 천연 조절 서열)에 작동적으로 연결되고, 선택적으로 상부 및 하부 서열을 포함하는 dptH ORF 서열(예, 서열 번호 4; 서열 번호 6)을 함유하는 DNA의 단편을 중성 부위 벡터내로 클로닝하고 이중 크로스오버에 의해 실시예 11A에 개시된 대로 에스. 로제오스포루스 염색체내로 삽입한다. 재조합체를 발효시켜 그들이 클론된 dptH 유전자가 없는 모 균주에 비하여 증가된 농도의 답토마이신을 생산함을 확인한다.
다른 적절한 숙주(즉, NRPS 또는 PKS 다효소 복합체를 갖는 것들)를 티오에스테라제 활성을 갖는 답토마이신 유전자 클러스터로부터의 단백질 코딩 DNA의 단편으로 형질전환시켜 펩티드 생산을 개선할 수 있다. 다르게는, 그러한 DNA 단편에 의해 코딩되는 폴리펩티드는 당업계에 공지된 단백질 전이 기법에 의해 에스. 로제오스포루스 또는 상기 다른 적절한 숙주내로 도입될 수도 있다.
답토마이신 내성 유전자의 복제
자연 상태에서 답토마이신에 민감한 적절한 스트렙토마이세트 숙주에서 답토마이신 내성 유전자를 클로닝하고 발현시켜 동정할 수 있다. 클론된 답토마이신 내성 유전자를 중성 부위내에서 중성 부위 백터내로 도입하고, 실시예 11A에 개시된 대로 이중 크로스오버에 의해 에스. 로제오스포루스 염색체내로 도입한다. 재조합체를 발효시켜 그들이 클론된 답토마이신 내성 유전자가 없는 모 균주에 비하여 증가된 농도의 답토마이신을 생산함을 확인한다.
답토마이신 생합성 유전자와 부가 유전자의 복제
Practical Streptomyces Genetics, supra에 개시된 대로 접합에 의하여 BAC 클론 B12:03A05를 야생형 스트렙토마이세스 로제오스포루스 A21978.6(ATCC 기탁 번호 31568, CBUK136737)와 스트렙토마이세스 로제오스포루스 A21978.65(NRRL 기탁 번호 15998, CBUK136879)내로 도입하여 엑스접합체(exconjugants), CBUK 136927과 CBUK 138016을 각각 생성하였다. 각각 필터 멸균된 글루탐산, Na 염(BDH) 오르니틴(Sigma)와 아스파르트산(Sigma) 각각 0.1%가 첨가된 배지 P에서 모 균주와 엑스접합체 균주를 세 벌로 실시예 8에 개시된 대로 발효시켰다.
배양물 샘플을 취하여 10일 실험동안 HPLC로 분석하였다. 5 ㎕의 상등액을 주사한 것을 제외하고는 실시예 9에서 개시된 대로 HPLC를 수행하였다. 발효를 행한 후 40-56 시간째에, 에스. 로제오스포루스 천연 리포펩티드 중 세 개(A21978C1, A21978C2 및 A21978C3)의 생산이 명확히 나타났다. 이들 리포펩티드는 모든 후속 샘플 지점에서의 발효에서 존재하였으며, 실험 시간 과정 끝에서 다른 A21978C 인자들이 나타났다. 세 개의 발효 복제물에 대해 평균된, 엑스접합체 CBUK 136927 및 CBUK138016에 의해 생산된 A21978C 리포펩티드의 최대 수율(각각, 284 mg/L와 1488 mg/L)은 각각 모 균주 CBUK 136737(143 mg/L)와 CBUK 136879(726 mg/L)에 의해 생산된 것의 약 2배였다.
실시예 12: 신규한 생성물을 생산하기 위한 답토마이신 생합성 유전자의 용
A. 아미노산 특이성 코드의 부위-지시된 돌연변이에 의한 펩티드 구조의 변화: 위치 2 D-Asn의 D-Asp로의 전환
답토마이신내의 13 아미노산을 위한 아미노산 특이성 코드가 표 1에 나타난다(실시예 6 참고). 또한 NRPS의 아데닐화 도메인 아미노산 특이성 코드를 동정하고 변화시키는 것에 대해서는 Stachelhaus et al., Chem.Biol.,6,pp.493-505(1999)를 참고. 답토마이신의 위치 3, 7, 및 9의 모든 세개의 L-asp 잔기를 위한 코드는 동일하다; DLTKLGAV(서열 번호 169)(이때 문자들은 표준 아미노산 약자를 나타냄). 위치 2의 D-Asn을 위한 코드는 DLTKLGDV(서열 번호 170)이며, 이는 하나의 아미노산이 차이가 난다(위치 7에서 A 대신 D임). D-Asn 특이성 코드는 PS I의 모듈 2의 아데닐화 도메인에서 부위 특이적을 변화를 만들어 D-Asp를 특정하는 것으로 변화된다.
모듈 2의 돌연변이 버젼은 유전자 치환에 의해 에스. 로제오스포루스내로 삽입된다. 반대 선별가능한 마커(예, 야생형 rpsL 유전자)가 유전자 치환에 의해 모듈 2의 아데닐화 도메인내로 삽입된다. 적절한 열민감성 플라스미드 상의, D-Asp를 위한 코딩 서열을 함유하며 인접 DNA(특이성 코드의 각 측면상에 약 1 내지 5 kb)를 함유하는 돌연변이 모듈 2 아데닐화 도메인이 답토마이신 생합성이 파괴된 에스. 로제오스포루스 균주내로 도입된다. 플라스미드상의 항생제 내성 마커(예, 하이그로마이신, 아프라마이신, 또는 티오스트렙톤 내성)에 대한 선별에 의해 단일 크로스오버를 함유한 재조합체가 비허용성 온도에서 선별된다. 만일 숙주 균주가 염색체 rpsL 유전자에서의 돌연변이에 의해 스트렙토마이신 내성이면, 유전자 치환을 완결하는 두번째 크로스오버가 스트렙토마이신 내성에 대해 선별될 수 있다. 재조합체는 항생제 생산에 대해 스크리닝된다. 답토마이신의 신규 유도체를 예를 들어 미국 특허 RE 32,333, RE32,455, 4,874,843호, 4,482,487호, 4,537,717호, 및 5,912,226호에 개시된 방법들에 따라 분리하고 분석하여 구조를 확인한다.
B. 상이한 아미노산 특이성중 하나를 위한 아미노산 코딩 모듈의 분자적 교
답토마이신은 네 개의 아미노산을 갖는다: 위치 3,7,9의 세 개의 L-asp 잔기, 및 위치 12의 3-메틸-Glu(3-MG)(표 1, 실시예 6 참고). 답토마이신의 신규 유도체는 3-MG를 특정하는 아데닐화 도메인을 L-asp를 특정하는 것으로 교환함으로써 생성된다. 3-MG 모듈의 아데닐화 도메인은 분자 유전학적 과정에 의해 제거된 L-asp 아데닐화 도메인에 인접하는 L-asp 모듈의 단편내로 삽입된다. L-asp 모듈로부터의 인접 DNA를 함유하는 하이브리드 3-MG 모듈은 적절하게 구성된 유전자 치환 벡터내로 삽입되며, 이 하이브리드 모듈은 실시예 11A에서처럼 상동성 이중 크로스오버에 의해 L-asp 모듈을 대신한다. 이러한 동일한 과정을 다른 두 L-asp 모듈을 위해서 반복한다. 재조합체는 위치 3, 7, 또는 9의 L-asp를 위해 치환된 3-MG를 함유하는 답토마이신의 세 개의 신규 유도체를 생산하며 분자내에 전체적으로 네 개의 음전하를 유지한다.
C. 다른 아미노산의 통합을 촉매하는 것을 위한 비리보솜 펩티드 신세타제(NRPS)의 교환
답토마이신 NRPS의 세 번째 서브유닛을 코딩하는 유전자는(표 1, 실시예 6 참고) 아미노산 12(3-MG)와 13(L-kyn)의 통합을 위한 특이성을 코딩하는 2개의 모듈을 함유한다. 고리형 리포펩티드 CDA의 생합성을 위한 세 번째 서브유닛을 코딩하는 유전자는(Kempter et al., Angew.Chem.Int.Ed.Engl.,36, pp.498-501(1997); Chong et al., Microbiology, 144, pp.193-199(1998), 각각 참고로 본원에 통합됨) 또한 마지막 두 아미노산(이 경우 아미노산 10(3-MG)와 11(L-trp))을 코딩한다. 위치 13에 L-kyn 대신에 L-trp을 함유하는 답토마이신의 유도체는 유전자 dptD를 파괴하고, 그것을 CDA를 위한 PSIII를 코딩하는 유전자로 치환함으로써 생성된다. 보다 강한 프로모터로부터의 PSIII 유전자의 발현(예, ermEp* 프로모터; Baltz, Trends Microbiolo, 6, pp.76-83(1998), 참고로 본원에 통합됨) 및 실시예 11A에 개시된 대로 에스. 로제오스포루스 게놈의 중성 부위로의 삽입은 CDA PSIII가 dptD 돌연변이를 보충하도록 하여 L-kyn을 대신하는 L-trp을 가진 변형된 답토마이신이 생성되도록 한다. 재조합체를 발효하여 재조합체의 생성물을 실시예 9에 개시된 대로 LC-MS에 의해 분석한다.
다른 서브 유닛을 위한 트랜스-보완을 위해, 즉, 답토마이신 생합성 유전자 클러스터의 서브유닛의 파괴 또는 결실을 생성시키고 이어서 NRPS로부터의 하나 이상의 천연 또는 변형된 서브유닛에 의해 트랜스로 보충시키기 위해 유사한 조작을 수행할 수 있다(후자는 실시예 12, 특히 실시예 12A, 12B 또는 12H, 12J를 통해 개시된 방법을 이용하여 생성될 수 있는 것과 같은, 답토마이신 생합성 유전자 클러스터의 변형된 버젼에 의한 트랜스-보완을 포함할 수 있다). NRPS 서브유닛간의 트랜스-보완은 이어서 이전 실시예들에 개시된 대로 분석될 수 있는 신규의 비리보솜 펩티드가 생성되도록 한다.
답토마이신 생합성 유전자 클러스터와 칼슘 의존성 항생제(CDA) 생합성 유전자 클러스터의 일부를 이용하여 트랜스-보완 실험을 하기 위해, 답토마이신 생합성 유전자 세트 또는 답토마이신 생합성 유전자와 부가 유전자 세트(예, BAC 클론 B12:03A05에 함유된 것)를, 방선균의 다른 천연 또는 조작된 균주 또는 종으로 형질전환 또는 접합에 의해 도입한다. 수용체는 이차 대사물을 생산하는 공지의 균주일 수도 있고 또는 특성이 규명되지 않은 균주일 수도 있으며, 또는 답토마이신의 생합성을 위한 것 외의 생합성 경로를 보유하도록 하는 재조합 기법에 의해 생성될 수도 있다. 형질전환체 또는 엑스접합체는 다양한 배지에서 발효되며 전체 브로스 또는 그 추출물은 신규의 답토마이신-유사 화합물 또는 답토마이신-내성 시험 유기체에 대한 생물학적 활성에 대해 스크리닝된다.
일부 예에서, 보충은 답토마이신 생합성 경로내의 유전자들 중 일부의 불활성화에 의해 촉진된다. BAC B12:03A05의 NRPS의 서브유닛을 코딩하는 서열은 결실되거나 마커 유전자에 의해 대체되어, 이미 하나 이상의 천연 또는 도입된 NRPS 유전자 클러스터를 발현하는 이종성 숙주 내로 도입되기 전에 변형된 B12:03A05를 형성할 수 있다. 변형된 B12:03A05 클론에 의해 그리고 내인성 숙주 NRPS 유전자에 의해 코딩되는 효소 서브유닛은 이어서 세포질에서 연합되어 신규의 펩티드를 생성하는 이종다량체 다효소 복합체를 형성할 수도 있다. 다른 경우에, 답토마이신 NRPS를 포함하는 B12:03A05 또는 그 일부가 이미 하나 이상의 천연 또는 도입된 NRPS 유전자 클러스터를 발현하는 이종성 숙주내로 도입된 후에 결실이 생성될 수도 있다. 예를 들어, dptD-파괴되거나 결실된 B12:03A05 버젼은 B12:03A05가 도입된 에스. 리비단스 균주에서 생성될 수 있다. 에스. 리비단스는 CDA를 위한 유전자 클러스터의 천연 카피를 보유한다. 생성되는 균주를 발효시켜 분석하여 CDA PS III과 변형된 B12:03A05 사이의 보충이 위치 13에서 L-kyn 대신 L-trp을 함유하는 답토마이신 유도체를 생성함을 보여준다. 이 실시예의 한 구체예에서, 실시예 7에 개시된 에스. 리비단스 TK64/B12:03A05 균주를 이용하여 트랜스-보완에 의해 신규 리포펩티드가 생성될 수 있음이 확인되었다.
신규 리포펩티드를 생산하기 위해, 인접 DNA 서열을 가로지르는 상동성 재조합을 이용하여 에스. 리비단스 TK64/B12:03A05의 dptD의 코딩 영역의 한 부분을 이종성 마커 유전자로 교환하였다. 상동성 재조합을 수행하기 위하여, dptD의 바로 상부 영역("5' 단편")과 바로 하부 영역("3' 단편")을 포함하는 두 단편을, 독특한 제한 부위가 도입된(밑줄쳐짐) 5'-말단 연장을 가진 하기의 프라이머 세트를 이용하여 염색체 에스. 로제오스포루스 DNA로부터 증폭시켰다:
5' 단편(1122 bp):
5' GCG AAG CTT CTG GTG GCG CAT CAC CTG G 3' (서열 번호 156)
5' GCT CTA GAT GGA AGT ATG TCC TCC ATC GC 3' (서열 번호 157)
3' 단편(1535 bp):
5' CGG ATC CCG CCG GCA CCT GAC CC 3' (서열 번호 158)
5' CCG AAT TCC GCC TCC GAG TAC ATC GAG G 3' (서열 번호 159)
증폭된 단편을 연속하여 pNEB193(New England Biolabs)의 다중 클로닝 부위내의 상응하는 독특한 부위내로 클로닝시켰다. 생성된 구조체, pSD002를 제한 분해 분석하여 배향에 대해 확인하고, PCR에 의해 생성된 부분에 에러가 없는 지에 대해 서열 결정에 의해 확인하였다. 마커 유전자, ermE(에리스로마이신 내성 유전자, Hopwood, supra)을 함유하는 SpeI 단편을 XbaI 부위에서 pSD002내로 삽입하고, 제한 효소 분해 분석에 의해 확인하였다. 생성된 플라스미드, pSD005는 따라서 dptD의 상부와 하부 DNA 서열에 상동성인 DNA 스트레치에 의해 인접한 ermE로 구성된 카세트를 포함한다. 일단 상동성 재조합에 의해 답토마이신 생합성 유전자 클러스터 경로내로 도입되면, 이 카세트는 처음 31 bp와 마지막 12 bp를 제외하고 모든 dptD를 ermE로 대체할 것이다. 이 치환 카세트를 포함하는 영역은 이어서 온도-민감성 복제 오리진과 rpsL(TK64 배경에서 이용될 수 있는 스트렙토마이신에 대한 민감성을 부여하는 유전자)을 보유하는 벡터(pRHB538의 클로닝 부위-변형된 버젼, Hosted et al., J.Bacteriol.179:180-186, 1997)내로 서브클로닝되어 에스. 리비단스내로 도입하기 위한 시리즈의 최종 플라스미드인 pSD030을 생성하였다.
플라스미드 pSD030를 실시예 7에 개시된 대로 원형질체 형질전환에 의해 에스. 리비단스내로 도입하였다. 원형질체와 세포의 형질전환 혼합물을 R2Ye 플레이트에 부드럽게 도포하고 약 16 시간 동안 30℃에서 배양하였다. 이어서 각 플레이트를 1.25 mg의 에리스로마이신을 함유하는 물 1 ml를 부어 그 액체가 배지내로 흡수되면 최종 농도가 50 ㎍/ml가 되었다. 7일 후 형질전환 플레이트상에서 생겨나는 에리스로마이신-내성 콜로니를 TSB (Hopwood, supra) + 에리스로마이신 25 ml내로 접종하여 48 시간 동안 30℃에서 배양하였다. 균사체를 수집하고, 균사 질량의 10분의 1을 불려서 TSB (Hopwood, supra) + 에리스로마이신의 새로운 25 ml 분액에 옮겼다. 이어서 생성된 용액을 40℃에서 배양하여 pSD030의 온도-민감성 레플리콘에 대해 선별하였다. 48 시간 후, 균사체를 원심분리에 의해 수집하고, 부드럽게 한 후 최종 부피 2 ml의 TSB에 재현탁하였다. 이 현탁액 100 ㎕를 50 ㎍/ml 에리스로마이신과 30 ㎍/ml 스트렙토마이신을 함유하는 SPMR 플레이트상에 도말하였다(Babcock et al., J.Bacterio.170:2802-2808, 1988). 생존한 콜로니를 스크리닝한 결과, ermE가 성공적으로 dptD를 대체한 CBUK 137860과 같은 균주를 동정하는 PCR에 의해 정확한 유전형을 갖는 것으로 나타났다.
CBUK 137860의 출발 물질은 실시예 10에 개시된 대로 제조하였으며 종자 배양물을 생산하기 위해 이용되었다. 생성물 배양물은 또한 실시예 10에 개시된 대로 생성되었으나, 통기는 0.7 vvm에서 수행되었다. 발효기의 pH는 14%(v/v) 수산화 암모늄 용액으로 6.50으로 컴퓨터로 조절되었다. 50%(w/v) 글루코스 용액을 발효동안 0.36 g/L/hr로 배양물에 공급하였다.
20 L 발효기로부터의 생물질을 버리고 깨끗해진 액체를 열린 유리 컬럼에 가하였으며, 이때 이 컬럼은 미쯔비시 HP20 수지(60 x 300mm)로 페킹되고 메탄올과 물로 조절된 것이다. 용출에 앞서, 컬럼을 2 L의 물과 2 L의 메탄올/물(1:4)로 세척하였다. 이어서 컬럼을 2 L의 메탄올/물(4:1) 및 이어서 1 L의 메탄올로 용출하고 두 개의 별도의 분획으로 수집하였다.
액체 크로마토그래피-질량 스펙트로스코피(LC-MS) 일렉트로스프레이 이온화(ESI) 분석은 양 분획이 A21978C/CDA 하이브리드 분자를 함유함을 나타냈으며, 덜 복잡한 메탄올/물(4:1) 분획을 추가로 처리하였다. 이것을 진공하에서 수성 잔기로 증발시키고 이어서 물로 500 ml를 만들었다. 이어서 2L 분리 깔때기에서 3 x 500 ml 에틸 아세테이트로 추출하여 수성 및 유기 분획을 얻었다. LC-MS(ESI)는 하이브리드 분자가 유기 상에 존재하지 않음을 나타냈으며 유기상을 버렸다. 수성 분획을 밤새 동결건조시켰다.
하이브리드 분자를 Waters Prep LC 시스템과 Waters 40 x 200 mm Nova-Pak C18 60Å 6 ㎛ 방사상 압축 이중 카트리지(40 x 10 mm 가드를 갖춤)를 이용하는 제조성 고성능 액체 크로마토그래피(HPLC)에 의해 정제하였다. 동결 건조된 물질을 물에 용해시키고 구배 방법을 이용하여 정제하였다. 이 방법은 2분 동안 90% 물과 10% 아세토니트릴에서 유지되고 이어서 13분에 걸쳐 25% 물과 75% 아세토니트릴까지 선형 구배가 뒤따른다. 유속은 분당 55 ml이며 전체 구배는 0.04% 트리플루오로아세트산으로 완충되었다. 분획들을 수집하여, 양성 이온 모드의 일렉트로스프레이 이온화를 이용하여 Finnigan SSQ710c LC-MS 시스템상에서 200-2000 달톤의 스캔 범위와 2초 스캔으로 LC-MS를 수행하여 분석하였다. 이 LC-MS 분석을 위한 크로마토그래피 분리는 0.01% 포름산을 함유하는 선형 물-아세토니트릴 구배로 용출되는 Waters Symmetry C8 컬럼(4.6 x 50 mm, 3.5 ㎛ 입자 크기)상에서 이루어졌으며, 상기 구배는 0.5분의 초기 지연 후 6분의 기간에 걸쳐 10% 아세토니트릴로부터 100% 아세토니트릴로 증가되며 이어서 재평형화 전에 추가 3.5분 동안 100% 아세토니트릴에서 유지되었다. 유속은 1.5 ml/분이며 이 방법은 주위 온도에서 수행되엇다.
상기 분석은 천연 A21978C 리포펩티드 A21978C1(가지친 천연 C11 아실쇄를 가짐)과 A21978C2(가지친 C12 아실쇄를 가짐)의 예상된 유사체로서 A21978C/CDA 하이브리드를 동정하였으며, 여기서 천연 키누레닌 잔기는 트립토판 잔기로 대체된다. 두 분획 모두 NMR 연구에 앞서 추가 정제를 필요로 하였다. C11 하이브리드(A)를, 0.04% 트리플루오로아세트산으로 완충된 60% 물과 40% 아세토니트릴을 이용하는 평등한(isocratic) 방법을 이용하여 정제하였다. 1.8 mg의 물질이 분리되었다. C12 하이브리드(B) 최종 정제 단계는 0.04% 트리플루오로아세트산으로 완충된 58% 물과 42% 아세토니트릴을 이용하는 평등한 방법을 이용하였다. 약 1.5 mg의 물질이 분리되었다. 1H NMR 스펙트럼이 도 13에 나타난다. A와 B에 대한 UV 맥시멈과 ESI-MS 분자 이온 정보(음성 이온 모드에서 관찰된 이중-하전된 이온)가 하기에 나타난다:
Figure pat00008

답토마이신 NRPS의 변형된 버젼(예, dptA 결실, dptA + dptD 결실 등)이 에스. 리비단스, 에스. 프라디에, 에스. 비리도크로모젠 및 기타 등과 같은 다른 2차 대사산물 생성 균주내로 도입되는 유사한 실험은 또한 답토마이신 백본에 기초한 유사체 화합물을 생성할 수도 있다. NRPS 서브유닛이 별도로 발현되고 교환될 수 있음을 생각할 때, 에스. 로제오스포루스 또는 다른 발현 숙주에서 모든 서브유닛을 단독으로 또는 조합으로, 천연 또는 변형된 NRPS 서브유닛(전술한 답토마이신 신세타제의 변형된 버젼을 포함) 하나 이상으로 교환하거나 트랜스-보완할 수 있다. 한 예로서, 하기의 변형된 에스. 로제오스포루스 균주가 생성될 수 있다: dptA, dptD가 천연 좌로부터 결실되고 dptBC 발현은 그대로임. 이어서, 이 균주를, 위치 2에서 asn 대신 asp를 통합시키도록 부위-지시된 돌연변이에 의해 변형된 외부 통합된 dptA(실시예 12) 및 kyn-수용 모듈이 CDA PSIII의 trp-수용 모듈로 교환되도록 변형된 외부 통합된 dptD에 의해, 또는 외부 통합된 CDAIII에 의해 보충시킬 수 있다. 동일한 균주를 생성하는 다른 방식은 아스파라긴 대신 아스파테이트를 통합하는 변형된 dptA 서브유닛을 이미 보유한 에스. 리비단스 TK64 유도체내로 dptA, dptD 결실된 BAC B12:03A05를 도입하는 것이다. 그러한 균주는 발효되어 위치 2에 asp와 위치 13에 trp을 갖는 답토마이신 유도체를 회수할 수 있다.
D. 답토마이신 고리의 연장 또는 꼬리의 연장을 야기하기 위한 하나 이상의 모듈의 삽입
간단한 NRPS 연장 모듈은 도메인 "C-A-T"(축합-, 아데닐화-, 및 티올화-도메인)을 포함하는 것으로 정의될 수 있다. 모듈을 연결하고, 부가의 내부 모듈을 삽입하기 위한 답토마이신 NRPS내의 허용 부위를 동정하기 위해, 도메인과 도메인간 영역을 가요성 "링커" 서열을 나타내는 서열에 대해 검사하였다. 예를 들어, 본원에 참고로 통합되는 Mootz et al., Proc.Natl.Acad.Sci.U.S.A., 97, pp.5848-5853(2000) 참고. 부가의 모듈을 코딩하는 서열은 공지의 유전자 재조합 기법(예, 실시예 11A)을 이용하여 상부 T-도메인과 하부 C-도메인간의 링커 서열내에 삽입된다.
모듈 DNA의 분리는 생산자 유기체로부터 추출된 염색체 DNA로부터 얻어진다. 제한 효소로 염색체 DNA를 자르고, 서던 블롯에 의해 동정한 후 관심 모듈을 코딩하는 단편을 분리하거나 또는 적절한 프라이머를 이용한 유전자 증폭(PCR)에 의해 관심 모듈을 분리하는 것과 같은 다양한 분리 기법을 이용할 수 있다. 증폭된 단편의 서열 결정과 특성 규명 및 클로닝은 통상의 방법으로 수행할 수 있다. 새로운 모듈은 dptA에서 L-Thr과 Gly을 특정하는 모듈간; dptBC에서 L-Orn과 L-Asp 또는 L-Asp와 D-Ala를 특정하는 모듈간; dptBC에서 L-Asp와 Gly 또는 Gly과 D-Ser 간; 및 dptD에서 3-MG와 L-kyn을 특정하는 모듈간에 삽입되어 답토마이신 고리를 연장시킬 수 있다. 새로운 모듈은 L-Trp과 D-Asn, D-Asn과 L-Asp, 또는 L-Asp와 L-Try을 특정하는 모듈간에 dptA 유전자에 삽입되어 답토마이신 꼬리를 연장시킬 수 있다. 모듈 삽입은 실시예 11A에 개시된 이중 크로스오버 방법을 이용하여 수행될 수 있다.
E. 티오에스테라제 모듈에 이웃하고 그 상부에 있는 부가의 카르복실 말단 모듈의 삽입
다양한 NRPS와 PKS의 카르복시말단 티오에스테라제 도메인("Te-도메인")은 비-천연 펩티드와 폴리케티드 기질을 절단할 수 있다(즉, 쇄 종결을 촉매). Mootz et al., supra; de Ferra et a., J.Biol.Chem., 272, 25304-25309(1997)을 참고하며, 각각은 본원에 참고로 통합된다. Te-도메인은 하이드롤라제로 작용하여 선형 생성물을 방출할 수 있고, 또는 사이클라제로 작용하여 고리형 펩티드를 방출할 수 있다. 증거는 NRPS 또는 PKS내에서 천연 형태에서 사이클라제로 작용하는 Te-도메인이 새로운 모듈의 형태로 조작될 때 하이드롤라제로 작용할 수도 있음을 제안한다. (분리된 C-말단 Te-도메인은 핵심 "인식 아미노산"이 기질의 C-말단과 N-말단에 있는 한 다양한 기질의 고리화를 촉매하는 것으로 나타났다: Trauger et al., Nature, 407, pp.215-218, 2000 참고.
또한, 일부 C-말단 Te 도메인은 이동될 때, 천연 NRPS 또는 PKS 모듈 형태에서 바로 상부에 존재하는 단백질 도메인의 일부와의 연합이 유지됨으로써 최상으로 작용하는 것으로 나타났다. 본원에 참고로 통합되는 Guenzi et al., J.Biol.Chem.,273, pp.14403-14410(1998) 참고. Te 도메인과 바로 상부의 도메인의 일부(N-말단) 사이의 경계를 유지하는 것이 또한 새로운 모듈 형태내에서 Te-도메인의 사이클라제 기능을 보유하는 데 기여할 수도 있다.
따라서, Te-도메인으로부터 상부에 부가 모듈을 삽입하고 그것을 작동적으로 연결시키기 위해, 표준 유전자 조작을 이용하여, 전술한 대로, C-A-T 모듈과 C-말단 Te-도메인간의 링커 서열을 동정하고, 부가 모듈을 코딩하는 서열을 그안에 삽입할 수 있다. 선택적으로, 끝에서 두번째의 티올화(T-) 도메인의 C-말단 부분이 Te-도메인에 연결된 채 있는(또는 그렇지 않으면 이식되어 있는) 새로운 하이브리드 C-말단 Te-도메인("T-/Te- 도메인)을 설계할 수 있다. Guenzi et al., 1998, supra 참고. 이어서 실시예 11A에 개시된 대로, 공지된 유전자 재조합 기법을 이용하여 하이브리드 T-/Te- 도메인으로부터 상부의 동정된 링커 영역내에 부가 모듈을 코딩하는 서열을 삽입한다.
F. 답토마이신 고리의 수축 또는 꼬리의 단축을 야기하기 위한 하나 이상의 모듈의 내부 결실
이중 크로스오버와 항생제 플레이트상에서의 선별에 의해 염색체상의 내부 모듈의 결실을 얻기 위해서는, 결실될 모듈의 하부 단편에 연결에 의해 융합된 결실될 모듈의 상부에 위치한 염색체 DNA 단편을 함유하는 플라스미드를 준비하는 것이 필요하다. 이 플라스미드는 또한 스트렙토마이신-내성 유전자 배경에서 재조합체에 스트렙토마이신 민감성을 부여하기 위한 야생형 rpsL 유전자(실시예 11A 참고), 단일 크로스오버의 선별을 위한 항생제 내성 유전자(예, 아프라마이신 내성, 티오스트렙톤 내성 또는 하이그로마이신 내성), 및 승온에서 큐어될 수 있는 온도 민감성 레플리콘을 보유한다. 교환될 모듈의 상부 DNA 영역내로 상동성 재조합에 의해 플라스미드를 삽입하는 단일 크로스오버는 승온에서 항생제 내성에 대해 선별될 수 있다. 모듈을 결실시키는 두번째 크로스오버는 스트렙토마이신을 함유하는 배지상에서 선별될 수 있다(따라서 모든 플라스미드 서열을 제거함). 적절한 모듈의 결실을 함유하는 재조합체는 적절한 제한 엔도뉴클레아제로 절단된 에스. 로제오스포루스 DNA의 서던 블롯 하이브리드화에 의해 입증될 수 있다. 이 방법은 예를 들어, dptBC로부터 L-Asp 모듈 또는 Gly 모듈을 결실시키기 위해 이용될 수 있다. 또한 L-Asn, L-Asp, 또는 L-Asn와 L-Asp 둘다를 특정하는 dptA 유전자내의 모듈을 결실시키기 위해 이용될 수 있다.
G. 답토마이신 고리의 수축을 야기하기 위한 말단 티오에스테라제의 이전
답토마이신 NRPS(DptD)의 마지막 모듈의 카르복실 말단에 위치하는 티오에스테라제(Te) 영역을 코딩하는 서열은 내부 모듈 코딩 영역의 말단의 상부로 이전될 수 있다. 이러한 이전은 절단된 선형 또는 고리형 펩티드를 생산할 한정된 짧아진 생성물을 방출되도록 할 것이다. Te의 이전은 실시예 12A와 12F에서 전술한 방식과 아주 동일한 이중 크로스오버에 의해 이루어질 수 있다.
답토마이신 NRPS와 다른 NRPS 또는 PKS 유전자간의 분자 교환
a. 다른 NRPS 또는 PKS상의 답토마이신 티오에스테라제
전술한 바와 같은 공지된 분자적 및 유전적 방법을 이용하여, 본 발명의 답토마이신 NRPS의 C-말단 Te-도메인을 코딩하는 서열(예, DptD)을 다양한 다른 숙주로부터의 다른 NRPS 또는 PKS 모듈 유전자를 코딩하는 서열과 연합되도록 이동시켜(단독으로 또는 그들의 하나 이상의 상부 모듈 또는 부분과 함께), 유용한 특성을 갖는 새로운 펩티드 및/또는 하이브리드 펩티드/폴리케티드 생성물을 생성할 수 있는 하이브리드 모듈 신세타제를 생성할 수 있다. 예를 들어, Stachelhaus et al., Science, 269, pp.69-72(1995) 및 Cane and Khosla, Chem.Biol.,6,pp.319-325(1999)를 참조하며, 이들은 각각 참고로 본원에 통합된다. 유사하게, 본 발명의 유리 티오에스테라제를 코딩하는 답토마이신 서열(예, DptH)은 다른 NRPS 또는 PKS 코딩 모듈 유전자와 연합하도록 이동되어 하이브리드 모듈 신세타제를 생성할 수 있다.
b. 답토마이신과 다른 NRPS 및/또는 PKS간의 모듈 및 도메인 교환
본 발명의 답토마이신 생합성 유전자 클러스터로부터 유래된 다양한 서열(도메인과 모듈 구조를 포함하며 이에 한정되지 않음)을 이용하여, 답토마이신 생합성 유전자 클러스터로부터의 서열을 포함하는 하이브리드 NRPS와 하이브리드 NRPS/PKS 모듈 신세타제를 생산하기 위해 상동성 및 이종성 숙주에서의 답토마이신 서열과 천연 또는 합성 NRPS와 PKS 서열간의 유전자 재조합 반응(유전자 중복, 전환, 치환, 등)에 이용하기 위한 플라스미드와 다른 벡터들을 구성할 수 있다. 그러한 하이브리드 신세타제는 새롭고 유용한 특성을 가질 것으로 예상되는 신규의 펩티드와 폴리케티드를 생산할 것이다.
정상적으로는 아실화되지 않는 비리보솜 합성된 펩티드의 리포펩티드 유도체의 생성
답토마이신의 지방산 꼬리는 dptA의 시작점에서 축합 도메인과 함께 작용하는 dptE와 dptF 유전자의 생성물에 의해 부착되는 것으로 생각된다. 이들 유전자와 유전자 단편들은 외래 비리보솜 펩티드 신타제 유전자의 개시 부분으로, 또는 유전자의 시작 부분에서(예, dptBC 또는 dptD의 5') 또는 모듈의 시작 부분의 유전자 내(예, 모듈 2의 5')에서 답토마이신 유전자 클러스터내의 내부 위치로 이전되어, 외래의 비리보솜 합성된 펩티드의 아실화된 버젼을 생성하거나 또는 답토마이신의 아실화되고 절단된 유도체를 생성할 수 있다. 외래 유전자는 다른 천연 유기체, 또는 전술한 대로 펩티드 서열에 치환된 아미노산을 갖도록 재조합 기법에 의해 생성된 유기체(예를 들어, 고리를 연장하거나 수축시키기 위한 변형을 일으킨 답토마이신의 다양한 버젼)로부터 유래될 수도 있다.
펩티드 구조에서 아미노산 입체이성질체의 변형
NRPS에 의해 생산된 아미노산 백본의 입체특이성은 공여 모듈의 에피머라제 도메인과 수용 모듈의 구별되는 축합 도메인의 존재에 의해 결정된다. 아미노산의 입체화학의 변화는 에피머라제 도메인을 공여 모듈에 첨가함으로써, 그리고 적절한 축합 도메인을 수용 모듈에 치환시킴으로써 이루어질 수 있다. 변화는 또한 공여 모듈로부터 에피머라제 도메인을 제거하고 적절한 축합 도메인을 수용 모듈에서 치환시킴으로써 이루어질 수 있으며, 예를 들어, 에피머라제 도메인을 dptA의 모듈 2로부터 잘라내고, dptA의 모듈 3의 축합 도메인을 정상적으로는 D-아미노산을 수용하지 않는 다른 모듈로부터의 축합 도메인으로 교환할 수 있다. 유용한 에피머라제와 축합 도메인은 다른 비리보솜 펩티드 신세타제 유전자에서뿐만 아니라 답토마이신 집단에서 발견될 수 있다.
실시예 13: 유리 티오에스테라제의 용도
A. 모듈 NRPS와 PKS에 의한 생성물 형성의 효율을 증가시키기 위한 상동성 또는 이종성 시스템에서의 dptD 또는 dptH 관련 서열의 발현
티로시딘 신세타제로부터 잘라낸 C-말단 Te-도메인은 핵심 "인지 아미노산"이 기질의 C-말단과 N-말단에 있는 한은 다양한 펩티드 기질상의 고리화를 촉매하는 것으로 나타났다. Trauger et al., Nature, 407, 215-218, 2000 참고. 답토마이신 NRPS의 C-말단 도메인으로부터 유래된 서열(예, dptD)은 유사하게 상동성 또는 이종성 숙주에서(또는 생체외 시스템에서) 분리되고 발현되어(단독으로 또는 적절한 융합 단백질 형태로), 천연적으로(또는 조작되어) 답토마이신 Te-도메인이 기질 말단에 결합하고 연결되는 데 필요한 핵심 기질 인지 아미노산을 보유하는 펩티드와 폴리케티드 생성물의 고리화를 촉매할 수 있다.
독립적인 발현을 위해 답토마이신 신세타제의 C-말단 Te-도메인에서 유래된 서열을 분리할 때, 끝에서 두번째의 아미노산 모듈로부터의 천연 C-말단 서열을 포함하는 것이 바람직할 수 있다. 에를 들어, Guenzi et al., 1998, supra 참고. 다양한 dptD와 상부-유래 서열 조합을 공지된 기법을 이용하여 시험하여, DptA 및/또는 DptBC와 같은 상부 폴리펩티드로부터 독립적으로 발현될 때 답토마이신 NRPS의 C-말단 Te 도메인의 티오에스테라제 활성을 최적화시킬 수 있다. 답토마이신의 C-말단 Te 도메인의 독립적인 발현은 표준 분자 생물학 기법을 이용하여 이루어질 수 있다. 답토마이신 NRPS의 C-말단 Te 도메인의 독립적인 발현은 천연 답토마이신 NRPS 프로모터 서열(서열 번호 2)로부터 하부의 dptD ORF의 티오에스테라제 도메인(서열 번호 3)으로부터 유래된 서열을 적절하게 구성된 발현 벡터내로 삽입함으로써 이루어진다.
다르게는, 답토마이신 NRPS의 C-말단 Te 도메인의 독립적인 발현은, 구성적으로 활성인 이종성 프로모터 또는 조절되는 방식으로 켜지고 꺼질 수 있는 이종성 프로모터로부터 하부에 dptD ORF의 티오에스테라제 도메인(서열 번호 3)을 삽입함으로써 이루어진다. 당업자는 적절한 프로모터와 숙주-의존 방식의 발현 또는 과발현을 위한 벡터를 선택하는 데 있어서 고려해야 할 사항을 인식할 것이다.
본 발명의 답토마이신 생합성 유전자 클러스터의 유리 티오에스테라제 도메인(dptH)로부터 유래된 서열은 유사하게 상동성 또는 이종성 숙주에서 발현되어 신규의 고리형 펩티드 등을 시험하고 개발할 수 있다.
답토마이신의 핵심 인지 아미노산은 답토마이신의 아미노산 잔기의 체계적 돌연변이유발, 및 이어지는 분리된 Te-도메인에 의해 촉매되는 반응에서 각 변형된 답토마이신 기질을 이용하는 고리화 분석에 의해 동정된다. 답토마이신 고리화에 필요한 C- 및 N- 말단 아미노산 잔기를 동정하여, 펩티드와 폴리케티드 빌딩 블록 단위가 삽입될 수 있는 새로운 기질 백본내로 설계한다. 기질 조작은 공지의 기법을 이용하여 핵산 서열 수준 또는 펩티드 수준에서 수행될 수 있다. 바람직한 기질의 길이와 조성은 기질 결합 효율, 촉매 속도, 생성되는 고리형 생성물의 생물학적 활성, 및 최종 생성물의 정제의 용이성을 포함(이에 제한되지 않음)하여 당업자에게 공지된 인자들을 고려하여 실험적으로 결정될 수 있다.
B. 교정 기능에 영향을 주기 위한 dptD 또는 dptH의 돌연변이 유발
답토마이신 유전자 클러스터로부터의 dptH 유전자는 일부 펩티드와 폴리케티드 이차 대사산물의 생합성에 참여하는 것으로 알려진 유리 티오에스테라제 효소에 관련된다. 예를 들어, 본원에 참고로 통합되는 Schneider and Marahiel, Arch.Microbiol.,169, pp.404-410(1998), 및 Butler et al., Chem.Biol.,6,pp.87-292(1999) 참고. 효율적인 천연 생성물 합성을 위해서는 종종 티오에스테라제의 편집이 필요한 것으로 제안되어 왔다. Butler et al.은 폴리케티드 티로신 유전자 클러스터에서 발견되는 유리 티오에스테라제가 편집과 교정 기능에 관여할 수 있음을 가정하였으며, 이는 효율적인 생성물 형성에서의 티오에스테라제의 제안된 역할과 일치한다.
답토마이신 dptH(유리 티오에스테라제를 코딩함) 또는 dptD(C-말단 Te를 코딩함)의 티오에스테라제-코딩 도메인의 상동성 또는 이종성 발현은 모듈 NRPS와 PKS에 의한 생성물 형성의 효율에 영향을 줄 수 있다. 답토마이신 티오에스테라제 유형 II 효소(DptH)(및 잠재적으로는 답토마이신 유전자 클러스터의 C-말단으로부터 분리되어 별도로 발현될 경우 유형 I 티오에스테라제 효소)의 제안된 편집 및 교정 기능은 통상의 돌연변이유발 및 다른 재조합 DNA 기법(예, DNA 복제의 신뢰성에 나쁜 영향을 주는 것으로 알려진 것들)을 이용하여 변경될 수 있다. 티오에스테라제 유전자의 변형되고 돌연변이된 형태는, 적절한 발현 시스템에서 발현되어 바뀐 생물학적 특성을 갖는 티오에스테라제 효소를 코딩하는 것들에 대해 스크리닝될 수 있다. 특히 바람직한 것은 아미노산이 잘못 통합되는 비율이 정상보다 높은 티오에스테라제 효소이다. 그러한 돌연변이는 새롭고 유용한 생물학적 특성을 갖는 펩티드 및 펩티드/폴리케티드 하이브리드 생성물의 보다 큰 다양성을 생성하는 데 유용할 것이다.
실시예 14: 답토마이신 생합성 유전자를 이용하여 관련 유전자를 동정하고 분리하기
본 발명의 핵산과 아미노산 서열은 다른 리포펩티드 경로로부터의 상응하는 서열과 비교되어 NRPS 또는 다른 리포펩티드를 코딩하는 NRPS의 성분으로부터의 서열을 동정하기 위해 이용될 수 있는 특성을 동정할 수 있다.
아미노산 3-메틸 글루탐산(3MG)는 흔치 않으나 답토마이신, 에스. 코엘리컬러로부터의 칼슘 의존성 항생제(CDA), 및 에스. 프라디에에 의해 만들어지는 A54145 화합물에서 발견된다. 3MG 아데닐화 도메인을 코딩하는 에스. 로제오스포루스와 에스. 코엘리컬러 핵산 서열 및 다른 아미노산을 아데닐화시키는 유전자로부터의 유사 서열의 비교를 이용하여 프라이머쌍 P140과 P141을 생성하였다:
P140 ACSSWSGGSGTSSCCTTCATGAA (서열 번호 160)
P141 ATGGTGTTCGAGAACTAYCC (서열 번호 161)
표준 기법을 이용하여 P140과 P141을 이용한 PCR에 의해 에스. 프라디에 코스미드 라이브러리 클론을 스크리닝하였다. PCR 반응은 약 700 bp의 핵산 분자 생성물을 생성하였으며, 이것의 서열은 에스. 로제오스포루스와 에스. 코엘리컬러의 3MG 아데닐화 도메인을 코딩하는 영역에 유사함이 입증되었다. 프라이머 워킹에 의한 서열의 연장은 동정된 영역이 A54145의 3MG 모듈임을 확인하였다.
이 방법은 또한 D-아미노산 활성화 모듈의 하부의 축합 도메인을 코딩하는 NRPS 경로의 부분을 동정하는 데 이용되었다. D-아미노산은 비리보솜 합성된 펩티드에서 발견되는 특이 아미노산이며, 그들과 연합된 축합 도메인을 위한 프라이머는 그러한 아미노산을 가진 경로를 동정하는 데 이용될 수 있다. 이들 D-아미노산 축합 도메인을 코딩하는 에스. 로제오스포루스 답토마이신과 에스. 코엘리컬러 CDA 서열의 핵산 서열은 서로 그리고 L-아미노산과 연합된 다른 축합 도메인으로부터의 유사 서열에 비교되어 프라이머쌍 P144와 P145를 생성하였다.
P144 SCSCTSCAGGAGGGSHTSSTSTTCC (서열 번호 162)
P145 CCGAASACSACGTCGTCSCGSCC (서열 번호 163)
표준 기법을 이용하여 P144와 P145를 이용한 PCR에 의해 에스. 프라디에 코스미드 라이브러리 클론을 스크리닝하였다. PCR 반응은 약 800 bp의 핵산 분자 생성물을 생성하였으며, 이것의 서열은 에스. 로제오스포루스와 에스. 코엘리컬러의 D-아미노산을 따르는 축합 도메인에 유사함이 입증되었다. 하나보다 많은 도메인에 상응하는 서열을 얻었으며, 이는 그 경로가 하나 보다 많은 D-아미노산을 가짐을 나타냈다.
답토마이신 경로의 서열을 이해하는 데 기초한 이러한 방법은, DptE와 F와 같은 아실화에 관련된 유전자뿐만 아니라 펩티드에 지방산을 축합시키는 데 관여하는 첫번째 아데닐화 모듈의 축합 도메인 또는 에피머라제 도메인을 코딩하는 영역과 같은, 리포펩티드 경로 유전자 클러스터의 다른 유전적 특성을 위한 특별한 프라이머 세트를 개발하기 위해 이용될 수 있다.
Figure pat00009
* 90kb 단편의 ORF-1는, 종결 코돈을 포함한 ORF의 3' 말단이 SP6 단편에서 종결되므로 ORF의 부분 서열이다. 종결 코돈을 포함한 ORF-1 서열의 3' 말단의 핵산 서열은 서열 번호 103의 뉴클레오티드 13020-12876에 해당한다. 따라서, 90kb 단편의 ORF-1의 전체 오픈 리딩 프레임은 서열 번호 19(서열 번호 1의 뉴클레오티드 1635-1의 상보성 쇄)와 이어지는 서열 번호 103의 뉴클레오티드 13020-12876의 상보성쇄로 이루어진다.
Figure pat00010
Figure pat00011
[표 6]
90kb 단편내의 ORF들의 BlastX 결과
Figure pat00012
Figure pat00013
Figure pat00014
Figure pat00015
Figure pat00016
Figure pat00017
Figure pat00018
Figure pat00019
Figure pat00020
Figure pat00021
Str은 유전자가 DNA 분자상에(서열 번호 1에 대하여) 왼쪽에서 오른쪽으로(+) 또는 그 상보성 쇄상에서 오른쪽에서 왼쪽으로 코딩되어 있는지를 의미한다.
BlastX 박스는 각 ORF에 대한 두개의 상위 BlastX 점수(상부 두 라인) 및 데이타베이스 단백질 입력과 데이타베이스 입력에 대한 ORF의 배열에 관한 상세 사항을 함유한다.
[표 7]
SP6 단편의 ORF에 대한 BlastX 결과
Figure pat00022
Figure pat00023
Figure pat00024
Str은 유전자가 DNA 분자상에(서열 번호 1에 대하여) 왼쪽에서 오른쪽으로(+) 또는 그 상보성 쇄상에서 오른쪽에서 왼쪽으로 코딩되어 있는지를 의미한다.
BlastX 박스는 각 ORF에 대한 두개의 상위 BlastX 점수(상부 두 라인) 및 데이타베이스 단백질 입력과 데이타베이스 입력에 대한 ORF의 배열에 관한 상세 사항을 함유한다.
[표 8]
GTC 단편의 ORF에 대한 BlastX 결과
Figure pat00025
Figure pat00026
실시예 15: 액티노로딘의 부재하에 스트렙토마이세스 리비단스에서 답토마이신의 이종성 생산
유전적 효과 및 배지 효과는 둘다 이종성 숙주에서 A21978C 리포펩티드의 발현을 개선시키도록 변형되었다. dpt 유전자 클러스터를 함유하는 다양한 균주 BAC를 상기 유전자 클러스터가 없는 대조군 균주와 함께 쉐이크-플라스크 발효로 성장시키고 깨끗해진 브로스를 HPLC에 의해 A21978C 리포펩티드 시리즈의 존재에 대해 분석하였다. BAC 클론 B1203A05상의 dpt 집단을 표준 기법을 이용한 원형질체 생산에 의해 에스. 리비단스내로 도입하였다(Keiser, T., et al., Practical Streptomycete genetics, John Innes Foundation, Norwich, 2000). 검사된 균주는 dpt 유전자 클러스터를 함유하는 에스. 리비단스 TK23과 TK64 균주와 부분적으로 결실된 액티노로딘 경로를 가진 에스. 리비단스 TK23의 유전적으로 변경된 버젼을 포함하였다. 다른 비교가능하고 적절한 act 넉아웃 균주들이 공지되어 있다. TK64는 스트렙토마이신에 대한 내성을 부여하며 또한 액티노로딘의 생산의 증가에도 관여하는(Shima et al., J.Bacteriol, 178(24), 7276-7284(1996)) rpsL(str-6) 돌연변이를 보유하는 점에서 TK23과 다르다. 액티노로딘 군은 많은 발효 조건하에서 에스. 리비단스에 의해 다량으로 생산되며 다른 이차 대사물을 발효로부터 검출하고 정제하는 것을 간섭하는 착색된 폴리케티드이다.
에스. 리비단스로부터 액티노로딘 생산을 제거하기 위해, 그 경로의 일부를 결실시킨 카세트를 구성하였다. 액티노로딘 폴리케티드 신타제 경로를 함유하는 8kb 단편(Malpartida and Hopwood, Mol.Gen.Genet., 205, 66-73(1986))을 pUC19내로 클로닝하고; 1.4kb의 DNA를 이 단편의 중앙으로부터 제거하여 actIorfI의 3' 말단과 actIorfII의 거의 전부를 결실시켰다. 이어서 이 단편을 내성 마커 ermE에 의해 대체시켰다(Bibb et al., Gene, 38(1-3), 15-26(1985)). 이어서 이 결실 카세트를 온도 민감성 플라스미드 pGM160에 옮기고 에스. 리비단스 TK23내로 도입하였다. 이들 재조합 균주를 이어서 40 시간 동안 발효시키고 선택성 배지상에 도말하여 이 선별로부터 몇개의 콜로니가 적절한 표현형을 갖는 것으로 분리되었다. 이들 균주의 유전형을 이어서 서던 블롯으로 확인하였다. BAC 벡터만을 함유하는 TK64와 TK23 둘다의 에스. 리비단스 균주를 또한 대조군 균주로서 검사하였다. 균주 표시법에 대해서는 표 9 참조.
[표 9]
Figure pat00027
rpsL 컬럼의 + 는 야생형 상태를 나타낸다.
많은 다른 배지가 초기에 개발되었음에도 불구하고, 두 개의 다른 배지를 그들이 에스. 리비단스에서 A21978C 리포펩티드의 생산을 지지하는 능력에 대해 보다 자세하게 검사되었다. 이들 배지 둘다 또한 에스. 로제오스포루스에서 A21978C 리포펩티드의 우수한 생산을 지지한다. 배지 A는 1% 글루코스(BDH), 2% 가용성 전분(Sigma), 0.5% 효모 추출물(Difco), 0.5% 카제인(Sigma), 4.6% MOPS(Sigma)로 이루어지는 복합 배지이며 pH 7로 조정되고 오토클레이브되었다. 배지 B는 미량 원소와 비타민과 함께 2% 글리세롤, 0.25% 수크로스, 1.2% 프롤린, 1.5% MOPS, 0.056% K2HPO4, 0.05% NaCl로 이루어지며 pH 7로 조정되고 필터 멸균되었다.
발효는 100 mg/L 아프라마이신을 함유한 풍부한 귀리 슬로프를 -135℃에 저장된 동결바이알로부터의 물질 약 0.25 ml로 접종하여 시작하였다. 28℃에서 7-10일간 배양한 후, 0.1% Tween 80 4 ml를 첨가하여 혼합된 균사체와 포자 현탁액을 생성시키고, 2 ml를 격벽을 갖춘 플라스크내의 25 mg/L 아프라마이신을 함유한 종자 배지 40 ml내로 접종하여 종자 단계를 시작하였다. 종자 플라스크를 30℃에서 24-28 시간 동안 240 rpm에서 교반하고 5%를 배지 A 또는 B 50 ml를 함유하는 생산 플라스크로 옮겼다. 약 1 ml 브로스를 무균적으로 제거하여 생산 발효 기간의 2일부터 6일까지 복제 플라스크를 샘플 채취하고 10,000 rpm에서 10분간 원심분리하고 HPLC에 의하여 상등액을 분석하였다. 분석은 4.6 X 50 mm Symmetry C8 3.5 ㎛ 컬럼과 Phenomenex Security Guard C8 카트리지를 갖춘 996 PDA 검출기와 Waters Alliance 2690 HPLC 시스템을 이용하여 주위 온도에서 수행되었다. 구배는 처음에는 90% 물과 10% 아세토니트릴에서 2.5분간 유지되고, 이어서 6분에 걸쳐 100% 아세토니트릴까지 선형 구배가 뒤따른다. 유속은 분당 1.5 ml이며 구배는 0.01% 트리플루오로아세트산으로 완충된다. 최대 50 ㎕의 상등액을 주입하여 천연 A21978C 리포펩티드의 생산을 모니터하였다.
예상된 분자량의 확인은 200-2000 달톤의 스캔 범위와 2초 스캔으로 양성 이온 모드의 일렉트로스프레이 이온화를 이용하는 Finnigan SSQ710c LC-MS 시스템을 이용하는 LC-MS 분석에 의해 얻어졌다. LC 방법은 Waters Symmetry C8 컬럼(2.1 x 50 mm 3.5 ㎛ 입자 크기)에서 수행되었다. 이 방법은 0.5분 동안 90% 물, 10% 아세토니트릴 및 0.01% 포름산의 초기 조건에서 유지되고 이어서 6분의 기간에 걸쳐 100% 아세토니트릴과 0.01% 포름산으로의 선형 구배가 뒤따른다. 이어서 재평형화 전에 추가 3.5분 동안 유지된다. 이 방법은 주위 온도에서 수행되었다.
배지 A중의 에스. 리비단스 TK64에서의 A21978C 리포펩티드 시리즈의 이종성 발현을 HPLC에 의해 분석하였다. 특징적인 UV/가시광 스펙트럼을 갖는 A21978C 리포펩티드 중 세 개의 생산이 명백하였으며, 전술한 분석 조건하에서 그 보유 시간은 5.61, 5.77 및 5.89분(λmax 223.8, 261.5 및 364.5 nm)이었다. LC-MS 분석에서, 이들 세 개의 A21978C 리포펩티드는 스트렙토마이세스 로제오스포루스에 의해 생산된 주요 A21978C 리포펩티드 대사물 C1, C2, 및 C3 각각에 대해 보고된 질량과 일치하는 1634.7, 1648.7 및 1662.7의 m/z에서의 분자 이온([M-H]+)을 나타냈다. (Debono et al., J.Antibiotics, XL(6), pp.761-777(1987)). 유사한 생성물 프로파일이 또한 동일한 조건하에서 에스. 리비단스 TK23(137027)에서 dpt 유전자 클러스터의 이종성 발현에 대해 얻어졌다. 액티노로딘 생산을 증가시키는 것으로 보고된 rpsL 돌연변이의 부재에도 불구하고 액티노로딘의 유사하게 높은 생산 수준이 이 균주에서 관찰되었다. A21978C 리포펩티드는 BAC 벡터만이 통합된 TK64 대조군 균주(136736) 또는 TK23 대조군 균주(137028)의 발효에서는 검출되지 않았다.
이들 균주에 의한 조 브로스에서 생산된 A21978C 리포펩티드의 양은 CDA 복합체의 성분들을 포함한 숙주 피크와의 동시-크로마토그래피로 인해 정확하게 정량될 수 없었다. 하지만, 세 개의 주요 리포펩티드의 총 최대 수율은 약 20 mg/L로 추정되었다. A21978C 리포펩티드는 많은 다른 숙주 대사물과 함께 발효에서 초기에 생산되었다.
A21978C 리포펩티드의 생산의 프로파일은 또한 배지 A에서의 에스. 리비단스 TK23(137024) act 넉아웃 균주의 발효로부터 관찰되었다. 이 균주에서 완전한 act 경로의 부재는 정상적으로는 고농도의 act가 지지되는 특정된 배지 B의 적용을 허용하였다. 특정된 배지의 변화를 평가하였으며, 2-4 g/L 정도의 K2HPO4가 A21978C 리포펩티드의 생산과 숙주 대사물 일부의 억제 둘다에 유익함을 발견하였다. HPLC 분석은 인산염 보충없이 배지 B에서의 A21978C 리포펩티드의 생산과 비교할 때, 50 시간째에 더 높은 인산염으로 보충된 배지에서 성장된 137024의 조 브로스로부터 더 깨끗한 HPLC 프로파일이 얻어짐을 밝혔다. 발효가 진전하고 인산염 탈억제가 발생함에 따라, 배지 A에서 이전에 관찰된 정도까지는 아니지만 숙주 대사물의 농도와 다양성이 증가하였다. 발효 초기에는 많은 숙주 대사물의 생산이 억제되었음에도 불구하고, 리포펩티드의 CDA 시리즈의 생산은 억제되지 않았다. CDA는 인산화되지 않거나 인산화된 형태 둘다로 존재할 수 있다. 이용되는 크로마토그래피 조건하에서, CDA의 인산화되지 않은 형태는 A21978C 리포펩티드와 동일한 영역에서 동시에 크로마토그래피되었고 검출과 정량을 복잡하게 만들었다. 인산염을 발효 배지내로 통합시킨 결과, 적어도 처음에는 생산을 CDA의 인산화된 형태로 치우치게 했으며, 이 형태는 HPLC에 의해 세 개의 A21978C로부터 잘 분리되었다. CDA 생산에 대한 이 효과는 또한 통합된 BAC 플라스미드를 가지지만 dpt 유전자 클러스터(137026)를 함유하지 않는 에스. 리비단스 TK23 act 넉아웃 균주의 대조군 균주의 고 인산염 보충된 배지 B에서의 발효로부터도 명확하게 나타났다.
미국모식균배양수집소(ATCC) PTA-3140 20010301 미국모식균배양수집소(ATCC) PTA-3141 20010301
SEQUENCE LISTING <110> CUBIST PHARMACEUTICALS, INC. <120> COMPOSITIONS AND METHODS RELATING TO THE DAPTOMYCIN BIOSYNTHETIC GENE CLUSTER <130> CUB-12 PCT CIP <140> PCT/US02/24310 <141> 2002-07-31 <150> PCT/US01/32354 <151> 2001-10-17 <150> 60/310,385 <151> 2001-08-06 <150> 60/379,866 <151> 2002-05-10 <160> 165 <170> PatentIn Ver. 2.1 <210> 1 <211> 90597 <212> DNA <213> Streptomyces roseosporus <400> 1 gccaccaccg tacggccctc cagcacccgg gccagggaac gctccagatg acgggcggcc 60 cgcgggtcca gcagcgacgt cgcctcgtcc agcaccagcg tgtgcggatc ggccagcacc 120 agccgggcca gcgcgatctg ctgcgcctgg gccggggtca gcgtgaaccc gcccgaaccg 180 acctcggtgt ccagcccctt ctccagcgcc ttcgcccagc cgtccgcgtc gaccgcggcc 240 agcgacgccc acagctcggc gtccttcgcc ccttccctgg ccaggcgcag attgtcccgg 300 agcgaaccga cgaagacatg gtgctcctgg ttgaccaggg ccacatgctc acggacccgc 360 tccgccgtca tccgcgacaa ctccgccccg ccgagcgtca cctcaccggt gcgcggtgcg 420 tagatccccg ccagcagccg gcccagcgtc gacttgcccg cgccggacgg gccgaccagg 480 gcgagccggg tgcccggagc cacgtcgagc gacaccttgt gcaggacgtc gacaccttcc 540 cggtacccga agcggacctc gtccgcccgt acgtcccggc cttccgggcc gacctcggcg 600 tcgcccgcgt ccggctcgat gtcccggacg ccgaccagcc gggccagcga cacctgggcc 660 acctggagct cgtcgtacca gcgcaggatc agaccgatcg ggtcgaccat catctgggcc 720 agcaacgccc ccgtcgtcag ctgcccgacc gtcagccacc cctccagcac gaaccagccg 780 ccgagcagca ggaccgcgcc gaggatcgtc acgtacgtgg cgttgatgac ggggaagagc 840 accgagcgga ggaagagtgt gtaccgttcc cacgctgtcc attgagaaat ccgccggtcc 900 gacagcgcca cccggcggcc gccgaggcgg tgcgcctcca cggtccgccc cgcgtccacg 960 gtctccgcga gcatcgcggc gacggcggcg taaccggcgg cctccgagcg gtacgcggag 1020 ggggcccggc ggaagtacca gcggcagccc acgatcagca ccggcagcgc gatcagcacg 1080 gccagcgcca gcgggggagc ggtcaccgtc agcgcgccga gcagcagccc ggcccacacg 1140 acgccgatcg ccagctgcgg cacggcctcg cgcatcgcgt tcgccagccg gtcgatgtcc 1200 gtggtgatcc gggacagcag atcgcccgtc ccggcccgct ccagcacacc gggcggcagc 1260 ccgacggacc ggacgaggaa gtcctcgcgc agatccgcga gcatctcctc gcccagcatc 1320 gcgccgcgca gccgcatgga gcgggtgaac aggacctgga cgaccagcgc caccgcgaag 1380 atcgcggccg tacgctccag atgcaggtcg gtgaccccgg ccgagaggtc ctcgaccaga 1440 ccgcccagca gatacggtcc ggtgatcgag gcgaccaccg ccaccgcgtt gaccgcgatc 1500 aggacggtga acgccctgcg gtgccgacgc agcagactcc gtacgtaact ccgcacggtc 1560 gtcggtgtgc ccacgggcag tgtcgtcgcc gactccgggg ccgcggggtc gtacgccggg 1620 ggtgcgacgc cgatcatgcc ctctcctcga tttcctcgat gctcttcatg gcggggacgt 1680 cgccgctctt catgacggag acgtcgtcac cgacgccgtt caccgcgtcc gccgcggccg 1740 cctcgtcgtc ggtctcgcgg gtgacgaccg cccggtagcg cggttcgttg cgcagcaggt 1800 cgtggtgggt tcccacggcg acgaccgtgc cctcgtggac gaggaccacc cggtcggcgg 1860 cgtcgagcag cagcggcgac gaggcgaacg ccaccgtcgt acgaccctgg cgcagcttcg 1920 cgatgccggc ggcgacccgt gcctcggtgt gcgagtcgac cgcggaggtc ggctcgtcca 1980 gcaccagcgc ctccgggtcg gtgaccaggg accgggccag cgccagacgc tggcgctggc 2040 cgccggacag ggaccggccg cgctcggtga tccgggtccg catcgggtcc ccgtcgttgt 2100 cgacggacgc ctgggccaga gcgctcagca catcggcgca ctgggccgcc tccagcgccg 2160 tgtccggggt gaccaggccc gaggacggga cgtccagcag ctcctggagc gtgccggaca 2220 gcagcaccgg gtccttgtcc tggaccagga ccgccgctcg tgcggcgtcc agcgggatct 2280 cgtccagggc gaccccgccg agcagcaccg acggggtcgc cgcggcggcc ttgtcgtcct 2340 cctcgccggt ctccgcgtgc ccgccgagcc gttcggccag ccggcccgcc tcgtccgggt 2400 caccgcagac gacggccgtg aactgcccgc gcggagccat cagcccggtc gccgggtcgt 2460 acagatcacc ggtgggcgtc acaccctcca ccgtggcctc ctgcgcactg cggtgcagcg 2520 acagcacccg caccgcacgc tgcgcggacg gccgggagaa ggagtacgcc atcgcgatct 2580 cctcgaagtg acgcaggggg aacagcatca gggtggccgc gctgtagacc gtgacgagct 2640 ggccgacgtc gatgcggccg tcccgggcga gcgtcgcccc gtaccagacc aggcagatca 2700 gcaggatccc cggcagcagc acctgcaccg ccgagatcag cgcccacatc ctggcgctgc 2760 gcacggccgc gcggcggacc tcctgggagg cgcggcggta gcggccgagg aacagctcct 2820 cgccgccgat accgcgcagc acccgcagac cggccacggt gtccgaggcc agctcggtgg 2880 ccttgcccgc cttctcgcgc tgctcgtcgg cgcggcgggt ggcgcgcggc agcaacggca 2940 gcacggccag ggccagcacc ggcatggcga gcgccaccac cagcccgagg gacggcagat 3000 agaccgccag gccgacgcag atcaccacga gggcggtggc cgcggccgcg aaccgggaga 3060 gcgcctcgac gaaccagccg atcttctcca cgtcaccggt cgacacggcc acgacctcac 3120 cggccgcgac ccgtcgggtc agcgcggagc ccagctcggc ggtcttgcgg gcgagtagtt 3180 gctggacccg cgcggcggcg gtgatccagt tggtcacggc ggtccggtgg agcatggtgt 3240 cgccgacggc gatcagtacg ccgagggcca cgatgaggcc gcccgccagg gcgagccgcc 3300 ctccggagcg gtcgatgacg gcctggacgg cgagccccac ggtgaccggc agaccggcga 3360 tgccgagctg gtgcagcagc ccccaggaga gggacttcag ctgcccgccg agctgattgc 3420 gcccgagcca gaacaggaag cgagggcccg aacgtacatc ggggtcgccg ggatccgaat 3480 acggaaggtc gcgaatctgc atgacgtccc agggctcgtg aaacggaggt ccggacagac 3540 ctcgaagacg gggtgacgtg caaggctccc tgttcgtccc gttccggggc aaccggtttt 3600 tttcggtcgc ccccgccctg cggggtcccg ggccgagcag gcccgggacc ccacagacgt 3660 cactccgcgg gcttctccga gtccatgccg gaccgggtct tcttccactc gccccgggtg 3720 aagtccggga tcggcagggg cacgcccttg gccttgatgg acagatggct cagcggcacg 3780 ggggccgtcc agaccgccgc gtcgtacacg tcgaagtcgg gcaccagacc gagccgcatg 3840 cactgcatca ggcggaacac catgatgtag tccatcccgc cgtggccgcc cggcggattg 3900 gcgtgctcct tccacagcca gtggtcccac tcggcgtact tcttgaagtc gtcccactgg 3960 tggttggtgt tcgtgggctc cagatagatc cgctccgggt agtcctcgaa cacgcccttg 4020 gtcccgccga ggctgttgat ccgcgagtac gggtggggcg acgacacgtc gtgctccagg 4080 cggatcaccc ggcccttggc ggtctgcacg aggctgatcg tccggtcggc cccgatgtac 4140 gactccttcc agctcgggtc gcccgcaggc atgtgctcct cgcggtaggc ggcgaggccc 4200 aggggggtgg tgccgacact gctgatgctg acgacccggt cgccccggtt gacgtccatg 4260 tagttggcga ccggaccgaa cccgtggttg gggtagaggt caccgcgcag ccgggtgtgc 4320 cacagccgcc gccacggacc ctcgtagtag tcggggtcga acatcagctc acgcagatcg 4380 tggttgtagg ccccggcgcc gtgctgcagc tcaccgaaga gacccgcgtg cgccatccgc 4440 agcacccgca tctcgttctt gccgtaacaa cagttctcca gctgcatgca gtgccgccgg 4500 gtgcgctcgg agagatccac gagctgccac agctcttcca ggcgcatcgc gatcgggcac 4560 tccaccccga cgtgcttgcc gttcagcatc gccgtcttcg ccatcgggaa gtgcagctcc 4620 cacggcgtca ccacgtagac gaagtcgatg tccccgcgct tgcagaggtt ctcgtagtcg 4680 tgctcgtcct tggcatagat cgccggggcg ggctgaccgg cggccgtcac cttcttggcg 4740 gccttctccg ccttgtcccg gaccgtgtcg cacaccgcct tgacctggac gcccgggagg 4800 gcgaggaaga ggtcgatcat gctgtcgccg cggttgccga ggccgatgat gccgacccgg 4860 accgtggagc gccgctcgaa gggcacgccc gccatggtgc ggccctgccg gggaggggcg 4920 gcggccacgg cttccgcggc ggcgacggcg tccggggcgc tccgcccggc cgccgaagcg 4980 gtgcctgcgc ccagtgcgcc gaggccgagt ccggccccgg ccacgcccgc cgtggtccac 5040 agcaccgaac ggcggctggg atcctgccgg ttcacctcgt cggccgcgcc gctgtgcggg 5100 ggtatgtcct gcggttccgg tgcgggccgg gcgtcgtcgt tcatcgagcc tccaggtggg 5160 gtttgggggt tcagacggtg cgcgagcgcg cccggtcccg ccgtacggat acgggcgggc 5220 gggaccgggg ctcggtaagg accctggagg gtgaggctga tggtgcgcaa gggaagtatt 5280 tggactcttg tcctcaaacc ttggactttt ctcacggcac gccgaagccc cgactggtgc 5340 aaccaatcgg ggccgtaaaa cgctcatctg tgcaggccgg cgggggtgcc cgcgcccgca 5400 gtcaccgact cacgggagag tcggccgggt ggcgtgttcc agttcgatca gcgccgagcg 5460 gtacgggtgc ccggtggcgc gttccatgcc gatctcgcac atccggttcg ccgacagata 5520 ggcgtcgtag gggcggcggt cgacctcggc ggcctccttg gccgtcgccg agtcggtcaa 5580 ctccttgtgg agcatgcccc ggtcgcccgc gaacgcacag caccccgcgt cgtccgggac 5640 cacgacctcc tgcgcgcagg cctcggccag cgcccgcaac tgccccacgt cacccagatg 5700 ttccatcgaa caggtcggat gcaggaccgc cgagccggcc gtccggaaca ccgtcagatg 5760 cggcagcagc tcctcggccg cccacaccag cgagtccacg acggtcagtt cgcggtggag 5820 cgcccggttg tcctcggtga ggtagggcac cacctcctcg gcgatgccga gcgtgcacga 5880 ggaggcgtcc acgaccagcg gcagcgtccc gcccgccgtc cagccccagg cggcctccac 5940 gatccggttc gccatgatcc tgttgcccgc gtcgtatccc ttggaatgcc agatcgtcgc 6000 gcagcacgtg cccgtgacgt cctcggggat ccacaccggc tttccggccc gcccggacac 6060 ggcgaccacc gcctcggcca gggagagagc gggccccgcg tcgccgtcgt cgggcccggc 6120 gaagatgcgg ttgacacagg ccgggtagta gacggcgctc gcccccacgc gtgcggtgtc 6180 cggcagccgc cgggccgcag caccggggat ctgcggcagc cactccggta cgagatcggg 6240 gcgcacggcc ttgcgggcga ggcgcgtcac ggcctgcagc ggtgcgtccc ccacccggtt 6300 cccgacggtg tcggccgccg ccacggccag ccgcgccgaa gcctccaccg cgcggaagtt 6360 cttcgcggtg agggccgcga tccgctcctc gcgcggggtg tgcctgcggt gccggaagcc 6420 cttcatcatc gccccggtgt cgatgccgac cgggcaggcg agtttgcagg tggaatcccc 6480 ggcgcaggtg tccacggcgt catagccgta cgcgtccaga aggccggact ccaccggtga 6540 gccgtcggtc tgccgcatca tctcccggcg cagcacgatc cgctggcgcg gagtggtggt 6600 cagatcctca ctggggcagg tcggctcgca gaagccgcac tcgatgcacg ggtcggcgac 6660 cgcctccacc ttcggaatgg tcttcaggcc ccgcagatgg gcccgcgggt cccggtccag 6720 cacgatgcgt ggagcgagca ccccggcggg gtcgatgacc tgcttggtcc gccacatcag 6780 ctcggtggcg cgcggccccc actcgcgctc caggaacggc gcgatattgc gtccggtggc 6840 gtgctccgcc ttgagcgatc cgtcgaaccg gtccaccacc agcgcgcaga actcctgcat 6900 gaacgcgtcg taccgggcca cgtcggccgg cttcgccgcg tcgaacgcga gcaggaagtg 6960 cagattgccg tgtgccgcgt gccccgccac ggcggcgtcg aagccgtggc gcgactggag 7020 ctccagcagc gccgcgcagg cgtccgccag ccgggcgggc ggcaccgcga agtcctccgt 7080 gatcagggtg gtgcccgagg gccgggagcc gccgacggcg gtcacgaacg ccttgcgggc 7140 cttccagtac ccggcgatcg tcccggcgtc ccgggtgaac gcgttggtca cggacgccgc 7200 cggacgcacg aggtccagac cggccacgac cgcgtccgcc gcccgctcga acgccgcccg 7260 gcccgcctcg tcggccgccc ggaactccac cagcagcgcg gtcgtctccc ggggcagcgc 7320 cgcccagtcc gccggaacgc ccggcacgct gacggaggcg cgcagggtgt tgccgtccat 7380 cagctccacg gcgatcgccc ccgcctcgtt gaaccggggc acggccgccg cggcggcggt 7440 gagggagggg aagaacagca ggccgctgga gacccgccgg tcgagcggga gggtgtcgaa 7500 gacgacctcg gagatgaagc cgaacgtgcc ctcggagccg accatcagcc cgcgcaggat 7560 ctgcaccggc gtcgccccgt cgaggaaggc gtccaggcga tagccattgg tgttcttgat 7620 cgtgtacttg gcgcggatcc gggcggtcag ctccgcgtcc gcctcgatct ccgccttcag 7680 ctccagcagc cccgcgcaca gctccggttc ggcgtgggcc agctcctcgt cggcggcggg 7740 gtgcgcggtg tcgacgacgg tgccgctcgg cagcacgaag gtgagcgagg cgagcgtgcg 7800 gtaggagttg cgggtggtgc ccgccgtcat gcccgaggcg ttgttggcga cgaccccgcc 7860 gagggtgcag gcgatggcgc tggccggatc ggggcccagc agcctgccgt accgggcgag 7920 ggcggcgttg gcccgcatga cggtggtgcc cggcaggatc cgggcccgcg ccccgtcgtc 7980 cagcacctcc acgccggtcc agtgacggcg tacgtcgacg aggatgtcct cgccctgggc 8040 ctggccgttg aggctggtgc ccgcggcccg gaagaccacg gatcggccct tgccatgggc 8100 gtacgacagg atcgcggaca cgtcgtcgag gtcctcgggg accagcacga cccgggggag 8160 gaagcggtag gggctggcgt cggaggcgta ccgcacgagg tcggagatct tccagagcac 8220 cttgtccgcg ccgagcagcg cggtcagctc gctccgcagc ggctccgggg tgccgcccgc 8280 gctgccgtcg gtgacccggt cgggggcggg ttcccgcgcc gttccggggc gcagcgcttc 8340 cgggtcgggc tccagcagcg gcatgtcggc cttcccctcg gctcggcgct cagcggtggc 8400 acgcggcagc ggcgctcagc agtggcgctc cggcattccg tcgaccagag cggacagcag 8460 ctcgccgaac acctcgcgct gatcggcggt caatggagcc aggatctcct ctgcggcggc 8520 ccggcgcgcg ctgcgcaggg accgcagcgt ggcgcgcccc tcgtcggtga tctcgatacg 8580 gaccacccgg cggctgtcgg gatccggggc gcggcgcacc cggccgctcg cctccagggc 8640 gtcgaccagc gtggtcacgg cgcgcgggac gacgtcgagc cgtcgggcca gatccgccat 8700 ccggggggcc gcgtcgtaac tcgcgaccgt ccgcaacagg cggaactggg ccggagtgat 8760 gtcgatcggc tccagctggc ggcgctggat gcggtgcagc cgccgggtga gccgcagcag 8820 ctgttcggcg agcaagccgt cacgggagtc ccgggaatcg cgagagtccc gggactcggg 8880 ggaatcaggg gagtcggggg aatccggggc gtccatacgg gaacaatatc aggaccttgt 8940 tcattgtgag cataggtaac aatgagctag gctctcactg tgcgggaccg ggactgcccg 9000 gccccgcctc acgcccgacg aaggagccca tgaaacccga cgaacccacg tggacgcccc 9060 cgcccgatgc ccgccccgcc gccgaccggc ggcccgccga ggtgcgccgc atcctccgcc 9120 tcttccgccc ctatcgcggc cgcctggccg tcgtcggcct gctggtcggc gcatcctccc 9180 tggtcggggt cgcctccccg ttcctgctgc gcgagatcct cgacaccgcc atcccgcagg 9240 gacgcacggg cctgctgacc ctgctggcgc tcggcatgat cctcaccgcc gtgatgacca 9300 gcgtcttcgg cgtgctccag accctcatct cgaccaccgt cggccagcgc gtcatgcacg 9360 acctgcgcac cgccgtctac acccagctcc agcggatgcc gctcgccttc ttcacccgga 9420 cccgcacggg cgaggtccag tcccgcatcg ccaacgacat cggcggcatg caggcgacgg 9480 tcacctccac cgcgacctcg ctggtctcca acctcacggc cgtcatcgcg accgtcgtcg 9540 ccatgctcgc cctcgactgg cggctcaccg tcgtctcgct gctcctgctg ccggtcttcg 9600 tcgcgatcag ccgccgcgtc ggccgggaac gcaagaagat caccacccag cgccagaaac 9660 agatggccgc gatggccgcc accgtcaccg agtccctctc ggtcagcggc atcctcctcg 9720 gccgcacgat gggccgctcc gactccctca cccagggctt cgccgaggag tccgagcgcc 9780 tggtcgacct cgaagtgcgc tccaacatgg ccggccgctg gcggatgtcc gtgatcggca 9840 ttgtgatggc cgccatgccc gccgtcatct actgggcggc cggactcacc ttcgcgtccg 9900 gagccgccgc cgtctccatc ggcacactcg tcgccttcgt cacgctccag caggggctgt 9960 tccgcccggc ggtcagcctg ctctccaccg gtgtgcagat gcagacctcc ctcgccctct 10020 tccagcgcat cttcgaatac ctcgacctca cggtggacat caccgaaccg gaacacccgg 10080 tccggctgga gaggatccgc ggcgagatcg ccttcgagga cgtcgacttc agctacgacg 10140 agaagaacgg cccgacgctg accggcatcg acgtgaccgt ccccgcgggc gacagcctcg 10200 cggtcgtcgg ctccaccggc tccggcaagt ccaccctcag ctacctggtg ccccggctgt 10260 acgacgtcac cggcggccgg gtcacgctcg acggcatcga cgtccgcgac ctggacttcg 10320 acaccctcgc ccgggccgtc ggcgtcgtct cccaggagac gtacctcttc cacgcctcgg 10380 tcgccgacaa cctccgcttc gccaagccgg aggccaccga cgaggagatc gaggccgcgg 10440 cccgcgccgc gcagatccac gaccacatcg cctccctgcc cgacggctac gacacgatgg 10500 tcggcgagcg cggctaccgc ttctcgggcg gcgagaagca gcgcctcgcc atcgcccgca 10560 ccatcctgcg cgaccctccg gtgctgatcc tcgacgaggc gaccagcgcg ctcgacaccc 10620 gtacggaaca ggccgtgcag gaggcgatcg acgccctgtc cgccggacgg accacgctca 10680 ccatcgcgca ccggctctcc accgtccgcg acgcggacca gatcgtcgtc ctggaggacg 10740 gccgggtcgc cgagcgcggt acgcacgagg aactgctcga ccgcgacggc cgctacgccg 10800 ccctgatccg ccgcgactcc cacccggtcc cggtcccggt cccggctccc tgaccaccct 10860 tgtcgggccg gccctcgatc agaccgcccc tgacgtcacc gccatggccc gcatacggca 10920 tgatcgccgc gcatgagagc tctcctcggg gtggaactcc ccggctaccg caccgtcgac 10980 accgacacct ggctgaacga ccacggcgat gtgctgtcct tgcacttctt cgacctgccg 11040 ccggacctgc cggccgcgct ggacgacggc ccggccctgc ggcacggtct gacccacttc 11100 accgccaggg cgggcggcgg cctcatcgag acatcggtga agcggctggg cgagctgccc 11160 gccctgcggc agatactcaa actgccgctg ccgaaccagc ccagcggcca ggcgttcatc 11220 ggcagcttca ccgtgccgcg cgccggatgc agcaccgtgg tgaagatcca ggcggcggag 11280 cgcggcatga cgggcatgcg ggaagccgtg gtgatggcca agctcggccc cgaccagtac 11340 ttccggccgc acccctacgc ccccgaggtc cagggcgggc tgccctttca cacggcggat 11400 cacgtccagt gggacgcgga gttcccggac catccgctca cccgggtccg ccggacgctc 11460 gacaccctcg cggcggcggt gacggtggca cccgagttcg ccgcgctgcc gcccttcacc 11520 ggaccggctc aggcgaacgg ctgagccgac cggctgcgta cacacagcac acagcacaca 11580 gggcacacgg cgcacacagc acacacggcg gcgccgccgc tcccgtggga cggggagcga 11640 cggcgccggg cggagcaatg gtcagacgag ccaacccacg aagtggacga cgccggcaag 11700 caggttggtc aggaagttca tctggtcttt ctccttgtac gtggtgcatc tgtgggactg 11760 cgcagtagcg gtctgcagcc cgttgactgc gctctgcaat catcacgccc cggacgagtg 11820 aagagcaacg aatcccctga cgatcacgcg ttccagcgaa cacccgatct cttgttcgtg 11880 tgttccggct acgggtgttc tgtccgcgtc gtacggcgtt cgtgtcgccg gggccgacgc 11940 cgtggtcggg ctaccggccc tggctcgcac cccgggttaa cgtgcccgca tggtgaacga 12000 gtccccggac gcccgacccc gtcgcagact ccgcccgacc cgccgcggaa agatcgtcct 12060 ggtcgtcggc gcactgctcg tcgtgacggc cgccgtcctg atccccctgt ccctgaccgg 12120 atcggacgag ccgccgaaga agcaggagac cccgcagagc acgctgatga tccccgaagg 12180 ccgccgagtg tcccaggtgt acgaagcggt cgacaaggcg ctcgacctga agcccggcag 12240 cacgctgaag gccgcgtcga cggtggacct gaagctgccc gcccaggccg agggcaaccc 12300 cgaggggtac ctcttcccgg ccacgtatcc gatcgacgac acgaccgagc ccgcgggcct 12360 gctgcgctac atggccgaca ccgcccgcaa acacttcgcc gcggaccatg tcacggccgg 12420 ggcccagcgg aacaacgtct ccgtctacga cacggtcacc atcgccagca tcgtccaggc 12480 cgaggccgac accccggccg acatgggcaa ggtggcccgc gtcgtctaca accggctgct 12540 caaggacatg ccgctccaga tggactccac catcaactac gccctcaagc gctccaccct 12600 ggacacgtcg accgccgaca cccagctgga cagcccgtac aacagctacc ggatcaaggg 12660 cctgccgccg acgcccatcg gcaatccggg agaggacgcg ctgcgcgccg ccgtcaggcc 12720 cacgcccggc ccctggctct acttcgtcac ggtcggcccc ggcgacaccc ggttcacgga 12780 cagctacgac gagcagcaga agaacgtcga ggagttcaac cgcggccgtg gctccgccac 12840 gacgggctga ccgaatcggc agacggggcg gggggattca cacccccggc acgggcgcgg 12900 gcacggagac gaccgccgag gcccctccgt cggcgcccgt ctccttcagc agccgcatga 12960 ccgaccggac cgccgcgcgg ccggcgcggt tcgcgccgat ggtgctggcg gaagggccgt 13020 acccgacgag atggacgcgc ccgtcccgta cggcacgggt gtcctcggcc cggatgccac 13080 cacccggctc gcgcagcttc agcggggcca gatggtccac ggcgggccgg aacccggtcg 13140 cccagaggat cacgtcggtc tcgacggtac ggccgtcgtc ccaggccaca ccggtcggcg 13200 tgatccggtc gaacatcggc agccggtcca gcactccccg ctcccgggcc cgccgcacgg 13260 catcgttcag cggcagcccg gtcacgctga ccacgctctt cggcggcagc ccgttgcgta 13320 cccgctcctc caccatcgcc acggccgccc gcccccactc ctcggtgaac ggaccttcgc 13380 ggaacaccgg ttcgctgcgg gtcacccaga aggtgtcggc cgcgtgctcg gcgatctcca 13440 tcagatgctg cgtaccggaa gcgccacccc cgaccacgag gacgcgctgc ccggcgaact 13500 cctcgggccc cggatagttc gccgtgtgca actgccgccc ccggaacgtc tcctggcccg 13560 gatagcgcgg ccagaacggc cggtcccagg tgccggtggc gttgatcaga gcccgcgcgg 13620 cgtacgtccc ctcggacgtc tccaccagca gccgaccgcc gcttccctcc cgtacggcgc 13680 tcacctccac gggccggtgg acccgcaggc cgaagcggtc ctcgtacgcg gcgaagtacg 13740 cgccgatcac ctccgacgag ggccggtcgg ggtcggcccc ggtcagctcc atgcccggaa 13800 gcgcgtgcat cccgtggacc ttgccgtacg tcagcgaggg ccagcggaac tgccacgcac 13860 cgcccggccg gggcgcgtgg tccagcacga cgaagtcgtt gtccggctcc agcccgacgc 13920 ggcgcagatg gtaggcggcg gacagtcccg cctgacccgc gccgatgacg accacgtcca 13980 gctcgcgcac cccagaaatg ttcacgcttc tactaactcg tcgggcgccc gggatcatcc 14040 cgggcgcccg acgagcgtca ccgcacggct cagcgacccc cggcgagcag caggggagcc 14100 ccgcccggcg ccgtggcggt ccggctctcg gcgccactca cacccagcag cggcgacgcg 14160 ggcacggtcg acagcagccc gcggcgggac agctcgggtg tgacgccctc gccgaaccag 14220 tacgcctcct ccagatgcgg atatccggag agcacgaagt gctccacgcc cagcgcgtgg 14280 tactcctcga tccggtccgc gacctccgca tggctgccca ccagcgcggt cccggccccg 14340 ccgcgcacca gaccgacccc tgtgtgcgcg agtggagatg atcctgcacg gcacgcccca 14400 catgcgatcg agcgtttctg aggtctgtgc cgtggcctct cggacatggc cacggcgagg 14460 gaatcggtgt tgcagagtga cgtgtgtcgt tgagtcggcg gctcgggcgg gggtggcgtg 14520 gtcaacggtt cggtgggcgg gcggctgagg cttggtgggt gtccgcgccg gagctgacgt 14580 ggcggtgtac ttcttgtggg ccgtgccagt ccaggcacac cacggtggcg tcgtcttcga 14640 ggcggccgcc tgcggcgtcg cgtacggcgg aggtcagcat cagggtggtc tcgcgtgggt 14700 gcaggctgcg ggtctgccgt agcagggcag ctacgtcgat cttctctccg tggcgttcga 14760 gcatgccgtc cgtcagcatg aggagccggt ctcccgggtg caggtccagg gtttggacgc 14820 ggtaggggcg gggcgagacg acggccagcc cgaaaggctg gtcgacctgg caggggatgg 14880 tttccaccat gcctgcacgc atgcgcatgg gccagggatg gccggcgttg acgagctcgg 14940 cctttccggt gtggaggttg atgcgcagca gttgtccggt ggcgtggccc tgtccgtggc 15000 tggtcagggc ctggtcgccc tggcgggcct gttcggcgag gggggctccg gcgcggcggg 15060 ctctgcgcag ggcgcccacc aggacggtgg ccgccagggc tgcgccgagg tcatggccca 15120 tggggtcggt caccgacagg tgcagggtgt cgcggtccag tgcgtagtcg aacgtgtcgc 15180 cgctgaggtc ctcggagggc tccaggctcc cgctcagggt gaactgcgcg gcctcgcagg 15240 acagggcctg tggaagcagc tgatactgga tctccgctgc cagggtcggg ggtctggagc 15300 gtttgcccca ggtgtagaag tcggtgaagc gcccgttggc gatcacgacg taggccagcg 15360 cgtgagcggc ttccccgaca gcgagcacaa cctcttcctc gtcgctcctg ccggccggca 15420 ggagcagttc gagcagaccg atcgcgtccc cccggttggt cacgggaact attacccgct 15480 gttcttgtcc ggcgggctcg tgatgcggcc gctgggtgcg gatcacctgc tcgtagacgc 15540 tccccccgaa cagagggatc cgctccgttt cgttttcact gcccgcggca gtcgtggtgg 15600 agagccgcgc gagcgctcta ccggtcagat ccacaatcag gaatgtgacc ttcgtagccg 15660 cgaaccgcct gcgcagatct tctgcgacca cggccacggc ctcaaccgga gccgccgtct 15720 ccgccgccgt cagcagtcgg gacaggtcgc tcgagccacg gctcatggca gcggttccct 15780 tctctggatg tttggggccc gttgcgcccc gccgcccagt cgcccctcct cgtacctgcc 15840 ttgcgctcca cggtggtcga cagcgagcag cccggcacgg gcccgcccgc tctcggccca 15900 ttgcgtgaca gtcctgcatc cacctgttcc agtctgaacc tcaatcggcc ctttgtccgg 15960 atgagggacc gggtcggccg gaggcgaggc gccaccgggt gaggaaggcg ccgaccgcca 16020 cctcgatggg gtcggggcgg acgatgtcac cgaactcggt ggcgcttctc ccgcaccacc 16080 ccgagcagag cgttgtccac gggcgatgtt cgtcgccgac accagcagga cacgccgccc 16140 ctgggcgatg cggtcgccga tggctcgccg gaggacggtg gtcttccctg taccaggcgg 16200 ccccacacca ggtggacgcc ctcgccgagg catgctcgat acgcgagcct gggcaggatg 16260 gaagcccggc ggatcgatgg cgtgggcaga gcgaccgccg atcatcgcgg tcgccagagc 16320 agtggcgaga ggatgctcac ccagccaggc gataccgtca cgcaaggcct cgatcaggaa 16380 ggtgggcggc tgcttgagca tccacaggtg agggtcgtcg atctgcgaaa tctgctaccc 16440 gcaatgtgag cagggagccg ttctgtacag cctcgaagac tgcgaaaccc tcgatctcga 16500 tgccgtcgtt gcccgtcccg ggcggcctca gggagtccag ctgcccaggt ccgatgtcgg 16560 agcccagcag atcgaccacg taccggcccg ggtcaccgct cctggccgcc cgcccgacga 16620 gctgccagcg tggctgcctg cccacgcctc cttcgacagc gatccactct ccgagtgccg 16680 aggcgatttt ctcacgccat cccacctacc gtccccccga tcagcctcgg tccgatcgcc 16740 tgcccgctgc tgcgctgtgc cctccggctg cgatccggtt cgctcgaagt gcctgcggcc 16800 tgttcacggg gccggtggat ccgctccgga tgcgctgtcc ttgcaggcac gttcgtccag 16860 gcagtcggct cccgaagccg tccagggcgc atcactccgc agggagctag agggctgtcc 16920 cgtaaaaaac ctccgtctca ggggcgttgg gggtagtcag ggtgatctgc gtagggtgac 16980 gcgagaccga gcaggtcatc gcatggccag gtcgcgccgt cgtaccgaca gtcatcgcgg 17040 ttgtcccacg gcagttcggg gtcacccgtg gcagggctga gcccatgtcg ggcgagcacg 17100 cgccgcttgg cctcggcttc ccgcaggacg cgagccgggt cgtgcagcgc gacgtgcagg 17160 gcgatcgtgg aatggaagcc ggagagttct ccctggcaga agtcgaccgt gtgtccgtga 17220 ggggcccact ccccgcagcc gtcaccgtcg caccggccgg ccaggttggc ctcctcgtcc 17280 agccgagcgt ggaggaacgt cacaaggtct tggctcatgg ggtcatcctg gccgacggct 17340 cggccggtgg ccggcccact gtttgcgaac ttgcgggcgg tctgtcgcag ggcaccgccc 17400 tgtccgtgtt cggcacggac gcgggagcgg gaggcccctt ggaacgcgaa tgctccagct 17460 tcgaaggcaa cggcgagcag caaggggtcc ggcaccatcc ccgcactccg tgcgccacac 17520 ctgcgcctct cgcgctcttg tgtcacgaga actcccagac cgcaaagcgc cacacccacc 17580 tgcagtcgga cgcgcatagt ccgccctgga tgctgcggaa tcgcatcctc agcccgcgtc 17640 gcagtataga tagtccgggt tgtcccaacg gttgttggtg gacaccaaca aggacaatgc 17700 caaccgtcag gttcggctga gcttcttcgg agggtgagcc gatctggttg cacgagaggc 17760 gggaagtccg gccgcaccaa ccggacgctc ggaccgtgtg tccgaacctg tcacgcaagc 17820 ctgcacaggc ccccgccgtg caatcgaagg gctgctcctg gtgcccgtga tgtcggtacg 17880 cgatctcgtc gggatgccgt gtcacccgtg cgaaccgcca cgccgcgccg aggggcgccg 17940 gcgcggcgtg gggaggatga ggtggtggaa gggggtgctg atgacggttc ggcatcaggg 18000 ggtgcggtgg tggttcgctc ttctcgctct cgtcgggtgc gtggtctgtg tcctctgcgt 18060 cgtcgcgctc agcggggcgg ggcactactt cgggctctcc ttgtgggcgg gcatcgcgct 18120 cgtggtggtg ggggcgctgt ttcccctcgg ggggctgggc ttcctgtact gggtggacga 18180 cggccggtcc gaggacagct tcctcgtgaa gttcctgtgc ttcgtcgccc actccgccgt 18240 cctcgggctg gcagccgtct cgtgcaccgg ggctgaggcg tgggcctttg agcagcgcgg 18300 gcggtggacg gaggcgacgg tcgtgggata cagcccgccc cgggtggtcc cgggtgatcc 18360 gccgacgaag gtgcgggcgt cctgcgcgct ggagaccgcc gagggcgaac gcgtccggcc 18420 ccggctgccg gagggccgcg gctgccgcga cggggtgcgg cacgggtccc gcctcgacgt 18480 gctgtacgac ccccggggtc tgctggcgcc ccgggccacc gagcccatgg accacggcgt 18540 caccgtcccg gtcctcgggg gcgtggcgac cctgtccggt ttcctcggct gtgtcgccct 18600 cgcctggcgg tgggaaaccc tccgggtacg cagcgcgcgc cgcacggcag cgcgccgagg 18660 gcgggaatcc gcagccggtt agggggtggg ggcgttcgcc ggctctcctt gccgccgtga 18720 cctggagcgc ggcgcggctg gagcccacct gccgggccga gtagttgcct gcactgcgcc 18780 cttctcgccg tgggagatcg tggctgaggc gatgggcgga agacacccgg ccttccccgg 18840 ttcagagggg aaggccgggt gtcaggcgca aggacctgcg agaacccgga aggatcctgc 18900 tgccgggccg gtcatcattt cttgaatgcg cgcatgtact ttccgaactt ctccaggccg 18960 tcgatattgc gcgggctgct gatgccctcg ttgtagtcga ggacgaagaa gttgttcttc 19020 ttcacggccg gcagttcctt ggtgtgcggc gacttcttca ggaactcgat cttcttctcg 19080 gcgggctggt cgccgtagtc gaagatcatg atgacctcgg gctcggcctg ggtgacggct 19140 tcccagttca cctgggtcca gcgctcctcc aggccgtcga agatgttctt cccgcccgcg 19200 gtcttgatga tgtcgttggg cggcacctgg ttgcccgccg tgaacggctg gtcggtcccg 19260 gagtcgtaga ggaacacggg cacgggcttg cccttcggag cctgctcggc gacggcggcc 19320 tcgcgcttct tcaagccggc gacgaccttc tccgcctcct cttcgacctg gaagatccgt 19380 ccgaggcgtt cgaggtcggt gtagaggccc ttgaaaggcg tcaacttctc cggatggccc 19440 gggtagttgt agcagctctc actgtgcatg aagctctgta cgccgagctt gtcgaggatc 19500 tccggggtga tgccccgctg gtcgctgaag cccgagttcc agccggcgac gacgaagtcc 19560 gacttggcgt ccacgacgat ctccttgttg aggaggtcgt cgctgagcat cttcaccttg 19620 gcgtagtcct tcgcccaggg agactcgctg accggcgggt tggccggcgg catgacgtag 19680 ccgtgcacgt ggtcggccag gcccagactg aacagcttgt cggcgctgcc gccctcgtag 19740 gcgacggccc gcttcggcac cgtgtactcg acggactcgc cgcagcgctt cacggtgctc 19800 ttcccggagc ccttgccctg ggattcgacc tcggcgccac accccgtgag caggagcgcg 19860 gacgcggcga cggggatggc gagtttggtg aacttcatgg tcttcctcag gaatcgagtg 19920 agtagagcaa ctgggggtcg cccgtcagcg gatgcgggac gacggaggcg cggaccccga 19980 atacctcgtc gacgagttcg ggcgtgagga cgtccttggg cgtgcccgag gtgatcaggc 20040 ggccttcgct gagtacgccg atccggtcgc acgcggcggc cgcgaggttc aggtcgtgga 20100 gtacgacgag gacggtcagg ccggcaccgc gcagcaggga caggagccgc acctgatggc 20160 gtacgtcgag atggttcgtc ggctcgtcga ggacgaggat cttcggctcc tgcacgaggg 20220 cgcgggcgag caggacgcgc tggcgctcgc cgccggagag ggtgaggatg ccgcgtcggg 20280 ccaggtgcag gatgtcgagc cgacgcatgg cgtgctcgca cagatcccgt tcgtgaccgt 20340 tcaacggggt gctgccgcgc tggtggggtg tgcggccgag ggcgatcacc tcctcgacgg 20400 tgaagtcgag gtcgacggcg ccgtcctggg tcatcgccgc gatgagctgg gcgctgcggc 20460 gcatggtcag cgacgagagc tcctggccgt ccaccttcac ggtgccggag ctgggtttca 20520 gggcccggta cacgcaccgc agggcggtgg acttgccgct gccgttgggg ccgacgaggc 20580 cgaccacctg accgctgccg acgtccaggg agaggtcccg taccaggctc ttgccgtcgg 20640 tcaccaccga gagcccgtcg agttcgaggt ccatctcaac ggcctccgaa catgtaggac 20700 ttgcggcgca tcagggtgat gaacaccggg acgccgacca gcgcggtgat gacgccgagc 20760 ggcagctcgc ggggggcgac cagggtccgc gacacgagat cgacccagac catgaagacc 20820 gccccggcga gtggtgcgac ggcgagcacc cgcgcgtgcg tcgcgcccac caccatgcgt 20880 acgaggtgcg gcatgacgag gccgacgaag gcgatggaac cgctgacggc gaccatcacg 20940 cccgtcacca gggagacgag cacgagcagg gacttgcggt gtcggtcggg gctgatgccc 21000 aggctggctg cggtctcgtc accgagagcc aggacgtcga gcgggcggcc gtgccggtgc 21060 aggacgagga caccgagcag cacggcggcg gtgaccaccg gcagcgaacc ccaggaagcg 21120 gcgccgaagc tgcccatggt ccagtacagg accatgctgg tcgcctcgga gctgggcgcg 21180 aagtagatga tgacactcat cacggcctgg aaacccagcg acatggcgac accggtcagt 21240 acgagccgca gcggcgagag cgcccccttg gtggacgagg cgccgtacac caggactgag 21300 gccacgagcg cgccgaggaa ggcgcccacg gacaccgcgt agatcccgaa cacggcgagc 21360 ccgcccatga ccgtcacacc gacggcgccc acggaggccc ccgaggagac gcccagaacg 21420 aacgggtcgg ccagcgcgtt gcgcaccagg gcctggatgg cgacaccgac cgcgctgagc 21480 ccggccccca cgagcgccgc gagcaggacg cgcggggtgc ggatctgcca gatgatctgg 21540 tacgtcgtca cctcgtccgc cgagatcggc ccgccactga gcgcggccca gaggaagcgc 21600 gcggtctcgg ccggggggac cacggcaggc ccgagaccga tggcgacgac gacggagacg 21660 acgagcgcgg cgaacaggct cacgcagatc gccaccaggc ccgtccggga gccggtccga 21720 accggctctt gcgcggtggg cgcgggacgt tgcagcgcct cgggtggcgc gggcggtgac 21780 atgtggatcg gccttccggt ttcggagcgt tgatgaacgg tggatgtgcg tccgtggggt 21840 gcccgcgacc ttgggcgggc gccccgtcgg cttcggctac gccgaaccgg ggatctcgtc 21900 ctcggagcgc agcaccagga gcccggccac cacggccacg gcgacgagca gcccgaacgc 21960 ggcggcgatc cccgggtacc ccgcgagccc gagtcccgct ccgccgaggg cggcgccggc 22020 gaagacgccg aggctctggc ccgccgcgtt gaggctcagc gcggaacccc gcatcgatcc 22080 gcagcgcctg accagcagac tgacggcgca ggcggcgacg gccgcgtggc tagcggcgtg 22140 cagcgaagta aaggccaggg cgagcggcag ccaggtcgtg aaccagaaac cggtagcggt 22200 gaccagggcc gccaacagtc cgacgagcaa gagctgttcg gtacccacgg tggatttctc 22260 ggcgttggtg atgcggcccg tgagcaggtt gctgacgaag aacgaggcgc cgctgagcgt 22320 ccacaccagc gagaacaggg cggggtcgag gtggaaccgg tcgtcgtagt agaccgcgag 22380 gtaggcgagg tagcccatga agaccgcggt gcgcaggaag gagatggcga gcagcggcac 22440 cgagccgcgg acctgggcca gggccttgaa cgaggcgaag tagcccgtgc gcgggccacc 22500 ctcgaccacc gggtcctcgc ccttcctgcc gcgtacgagg aagaccgcgg cgagcagcag 22560 cgagacgacg gtgacggcga gcaggtcgcc ctcccatccc cacagcaggg ccggcagggc 22620 gatcaggggc gcggcgagca tcgccgtcat cgaggtcgtc gacgtgacga gggtggccgc 22680 acgggcggcg gacttgccgt cgccgaaccg gtcggcggcg gcagcggtga gcgccgggtt 22740 gatcaccgcg gtgccggcgc cgaccagcag gcagaacacc gcggtcagga ggaagtctcc 22800 gctcgcgccg agggctgagg agacggcgag tacgacgaga ccgaccgcga ccgccttcga 22860 cttgggtacc cggtcgatca ggggggccag ggccgtgccc acggcgagcg ccgcgaggcc 22920 ccccaggccg cgcaggccgc ccaccgcggc gacaccgctc ccggtctcct cggcgatcgg 22980 caccagatac gtgctgaaga cggtgaacgg cagcaggccg acggcggagg ccaccaggac 23040 cggccacagg gctcgcgcca tcttcaggtc gccgggcatc tcgggggact tctccggtgc 23100 gacggccgaa cgggaggtgc cggcgctcac aggtcaccgc ctgcgcggta gcggtacatc 23160 gtcgtctcgt cggcgctgaa ctgtgagaac gggaagggct cggcgttcag ggcggtgacg 23220 cccgagccga ggaacgcgcg ggcgacggcg ctgcccgtct gggcgtacac gacgagcggc 23280 accttctgct cgcggcagtg ttccaggatc aggtcgaagg tgccgttgga gagtgtcatc 23340 cccgtggcga cgacggcgtg ggcctctgcg aggacctcgg tcatgtcgtc cgcgaccggc 23400 tctccccact gggtggttcg caggttgagg tcgcacggca ggcagacgcc gccccgctcg 23460 cggatcgcgg cgacgagcgg gttgacgacg ccgatgagcg cgaccttggc gccctcctcg 23520 atgtcgagca gcccggcgat ggacgcgtcc cgcgccttcg cccgcacctc gggggtcccc 23580 accggcagcg ggacggcctc ctgctccggg gcttcccgat gcggctgtat ctgtgcgagg 23640 taggcgtcga gcgccgctat gcgcaccggg gcggactcgt ggcgcagcaa cttctccagc 23700 gggtgcccgg aggcgttctc gcagaagtcc ggggtgagtt cgcctgcctc gaaggagcag 23760 ccgccgaagg accggccgac acgcagcacc aggtagtggt tgtggtacgt caccggtccg 23820 ccggcgagcc gtgtcgtgtg gtagagccag aacgcgctgg tgacggtcat gtccttcggg 23880 tcggggccgt agtccccggc gaggacggca tcggtgagct cggcgaccga ctgcggcgtg 23940 ggaaagggca tgtcagaggg ctttcttctg gtcggaggtg gagtcatcgg tccacgtcat 24000 ggcggaccag gggtggctga gctcgtcgag cgaggtgatc tcgcgcggtt cgaggtcctc 24060 gatgtcgggc gcctcggtgt gcttggcgta cgcgctgtcg acgtagcggt gacctgtgtc 24120 cgccgcgatg aagacgtacg tccgggaatc gtccttcgac cgctcccacc gggtggtcag 24180 gtaggcggcg cccgcggaca ggcctgcgaa gatgccgctg gagcggagca ggtggacggc 24240 gcctgcgagc gcggagtcga agctgaccca gtggatccgg tcgtacagat cgtgccggac 24300 gttctcgaac gggatggcgc tgccgatgcc ggcgatgatc atgtccgggt ccgagacgtg 24360 ctccgagccg aacgtgacgc tgccgaaggg ctggactccg acgagggaga cgtctcggcc 24420 cgcctcgcgc agatacgagg cgatggcgcc tgtcgacgcg ccggaaccca cgccgcccac 24480 caaggtcagg ggcccggcgg gcacctcgtc ggcgatcgtt tcggccactt cgcggtagcc 24540 gtagtagtgg atgctgtcgt ggtactgccg catccagtgg tacgaggggt tctcctccag 24600 gatctcggcg atgcgccgca cccggagctc ctggtcgagg cggagattcc tggacggccg 24660 cacctgctcg agcgtggcac cgagaatctc gagctgcgcc ttgagcgtgc ggtccaccgt 24720 ggtcgacccc acgatgtggc acttcatgcc gtagcggtgg caggcgaggg cgagggcctg 24780 cgcgtagatg ccgctcgaac tgtcgacgag ggtgtcaccg ggtttgacgg tgcccgactc 24840 aaggaggtgc cgcaccgccc ccagagccga gtagatcttc atggtctcga accgcagaca 24900 gaccaggtcc ggccgcagtg ctatgagatc gggtttcttg atcgcttcag ctatgtgctc 24960 gtacatctcc gtcttccggt cgagcgggac atgaaccgtc tgcctcgatc aggtccggct 25020 gggctgggcc gcggtgtggc cgtgagcccg gacgagagca ttatggaaat gaaaacgatt 25080 gtcaaaaccg agtaaggtgt gcgccagtca tcaccacggg agccgcacag gcagctctac 25140 gccccgtgac gggcagcaag gcttttggag gaactcatgc atctgccccg ggtcggtccg 25200 cgatcctgcc tgtcgggtcg ggcgggcatg gacactggag tgggcaccgc ctacggaacg 25260 ttcggggaac tgctccaggg tgaactgccg gaggaggcag gcgatttcct cgtcacgctg 25320 cctgtcgccc ggtgggcgag ggcgtccttc cggtgcgacc cggccatggg agatgtcatc 25380 gtcaggccgt cgcacaagga gaaggcgagg cggctggcct gcctgatcct ggaggaggca 25440 ccggggatga ccggtggggt gctgacggtc aacagcgtga tcccggaggg caaagggctg 25500 gccagttcat ccgccgacct ggtcgccacg gcgcgcgcgg tggggcgggc cctgcggctc 25560 gacatgccgc catcgcggat cgaggggctg ctgaggctga tcgaaccgac cgatggtgtc 25620 ctgtacccgg gaatagtcgc cttccatcat cgagcggtgc gactgcgcgc gatgctgggc 25680 tcgttgcccg ccatgtcggt cgtcggtgtc gacgagggcg gggccgtgga cacggtcgac 25740 ttcaaccgca tacccaagcc gttcacgccg gcggaccggc gtgagtacgc cgacctgctg 25800 aaccggctga gtggggccgt tcgctcacgc gacctcgcgg aggtgggcag ggtggcgacg 25860 cgcagcgcgc tcatgaacca gccgcttcgg tacaagcgac tgctggagcc catgcgggag 25920 atctgcaggg atgccggtgg tctgggcgtg gccgtgggcc acagtgggac ggcgctcggc 25980 gtgctcctgg acgccgcgga tcccgcgtac ccgcaccggg ccaccgcggt ggcccgggcg 26040 tgcggggatc tggccggggc cgtcgcggtc tatcggaccc tcagtttccc gaacgccgtc 26100 agccatggtg gtcggaccgt cggctgaggg cggttcccgg aggcatgccc cgacggggcc 26160 cgatggcgcg gcaagcaggg attcgcctga cgttgagggt ggcccggatc gctgtatggt 26220 caccgcggtg ccggtgcgtg gaccgtgtca ctcccggctc ccttgtgaag ccgatcgccg 26280 gtgctccgcg gacgctgtga aggtggacgg cctcgaccgg ttcgtccaag ggcccgaggt 26340 gccaaggcct ctgcgaccgg tatcgcggac gccctcgggc acgtggactt cctctcggcc 26400 gccgccgggc caaccgttcc ggacaatcga agggacccag gttcatgctc accgcacagc 26460 agcctgctcc cggcgtcgtg cccgcccgga tccacgtcac ggacaggttg gaggccgctc 26520 acccgctcgc cgctgacggg gctgtcgtcc tgacaggcgt cgagccctcc ggtgacggcc 26580 tggtcctcgc cgccgcagcc gtcctggggg agcggctgca gcaggtgttc cctcaccggc 26640 tgcgggcgtc cgacggctcg aacttcgtcc accttcatgc ggacagcttc gacttcgtcg 26700 tcaacgtagg gggcgtcgag catcgccgac gtgatccgga tgaggactat gtcctcatcc 26760 agtgcgtccg gcagtccgac tccggcggcg actccttcgt ggctgacgcc tatcgcttcg 26820 tggaccactg cgcgacggcc gatcctgaac tgtgggactt cctgacccga ggggacgtcg 26880 acctgtacgg cgcgtggtcc ggactgcgtg gtatgcccgc aacccccttt gtgggcaggc 26940 atgtcgagta cacccgcgcc ggtcggcgta tcgtccggcg cggcgacggg gtgacccctc 27000 tgcaccggga ccctggcgcg gaccacaccc ggcggatgct cgcccgtctg gaggaagccg 27060 tccatgcgct ggaggagacg ctcccgcgat tccggctcga caagggcgaa atcctcgtcc 27120 tggacaacta ccgctgctgg cacggccgcg aggctcacac gggagatcgc gcggtacgta 27180 tcctcacggt gcgcagcagc gacgcccgct gaggcgctgt tggttcgcct cactcgccgt 27240 gacacagggg caggcgtctg cggcggtgct gtttccgcgc gggacggacc gggggagatt 27300 ccccggtcgg taaagggggc gaccggcgat ccgctcaccc cgcctcgatc attgcgcagg 27360 ctcttcgagc gcttcgtgct tcacgccggc tgccagatcc gggccagtgc ctccggggtg 27420 agtacttcct ccggtgatcc ctgcccgatc agtcgtccgt cggccaggag caggcaggcg 27480 tcggccgagc gggcggcgtc caggtcgtgg gtggcctgga cgacggtggt gccgtcggcg 27540 accaggtccg tcagcagggc cgtgatccgc tcccgcgcct cggggtcgag tccggtggtc 27600 ggctcgtcca ggagaagcag gtcggactgt tgggcgaggc cctgcgcgat cagcacgcgc 27660 tgacgctggc cgcccgacag ctcgccgagc tggcgggcgc cgaggtcggc gacccccagc 27720 ctctccatgg cggagtcgac cgcggtccgg tccgtgcggg tcagccgccg ccacaggccc 27780 cgctgtcccc agcggcccat ctccaccgtc tgccgcgccg tgagggggag ggtgtcgccg 27840 acggcaccgc gctgcgggac gaaagccggc ggggagccct ctgcgtaccg gagttgtccg 27900 gatgtggcgg tgatcactcc ggccaggacg cccagcagcg tcgacttgcc gcttccgttg 27960 ggtccgacca gggcggtcat ggccaacggc ggtattgcgg cgctgagttg gtggagcacg 28020 gggcggccgg ggtagccggc gctcagccgc tggaaccgga cgcgttcatt ccgcagttcg 28080 gtggccggcg ggaacggagg gttgttattg aacatggttg tcattatatg gtcctcgtat 28140 ggagtggttg acggcccctt tcgaggtggc ctttgtgcag agggccctat gggccgggat 28200 cctggtgtcg gcgatatgcg ccctcgcggg aacgtgggtg gtgctgcgcg ggatggcctt 28260 cctcggtgac gcgatgtcgc acgggctgct gcccggcgtc gcggtcgcct ccctgctggg 28320 aggcaacctg ctggtggggg cggtggtgag cgcggccgtg atggcggcgg gcgtcacggc 28380 cctcgggcgg actccgcgac tgtcccagga caccggcatc ggcctgctgt tcgtgggcat 28440 gctgtcgctc ggcgtcatca tcgtgtcgcg gtcgcagtcc ttcgcggtgg acctcaccgg 28500 cttcctgttc ggagacgtcc tcgccgtgcg ggggagcgat ctgctgcttc ttggagtagc 28560 cctgctgctg gcgctggccg tctcggtgct cggctaccgg gctttcctgg ccctcgcgtt 28620 cgacgagcgc aaggcccgga cactcgggct gcgtccccgg ctcgcccatg ccgtgctgct 28680 cggcctgctg gcgctggcca tcgtggcctc cttccacatc gtgggcacgc tgctcgtcct 28740 cggtctgctc atcgccccgc ccgcggcggc catgccctgg gcgcgaagcg tccaggcggt 28800 catggtcctc gcggcgctcc tcggcgccgc cgccaccttc ggcggcctgc tcctgtcctg 28860 gcatctgcgc accgcggccg gagcgaccgt ctcggccctc gccgtcgctc tcttcttcct 28920 gtcccacctg gcatccggac ttcggcaccg ccgccgtgcg cgccggggcg gtcttgccga 28980 accggcggtc gccccgggcc gcgacctcct ccacgtcctg accgagagaa acctgaggcg 29040 atctccttgc tcgtccgaaa aaacgtcaca tcgctggctc cggcgcttgc ggccgtgatc 29100 ctcctgaccg ccggatgcgg gggcggggac gaggccaagt ccggttccgg gcccgcctct 29160 tcgtccccca ctccgcacgg ctatgtcgaa ggcgccaccg aggcggccga gcagcagtcc 29220 agacttctgc tcggcgaccc cgggagcggt gagacccgcg tgctggacct gatcaccggc 29280 aaggtgtacg acatcgcccg cagccccggt gccaccgcac tcaccacgga cggccgcttc 29340 ggctacttcc acggcccgga cggcatacgg gtgctcgaca gcggtgcgtg gatggtggac 29400 cacggcgacc acgtccacta ttaccgcgcg aagatcaagg aggtcggcga actcccgggc 29460 ggcaccggta cgagcatccg cggcgacgcg ggcgtgaccg tggcctcgtc ggcggacggg 29520 aaggcgagcg tgtatcgcag ggcggacctg gagaaaggcg ccctgggcac gccgtccccg 29580 ctgcccggca cgttcgccgg cgccgtcgtg ccgtacgcgg aacacctggt gacactcacc 29640 gctgagagcg gggctccggc gaaggtcgcc gtgctggacc gttccggcaa gcgcgtcgcc 29700 gctccggagg cggagtgcga ggagcctcag ggcgacgcgg tcacccggcg cggggttgtc 29760 ctcggctgcg ccgacggcgc tctgctcgtc catgaggacg acggcgcctt cacggcggag 29820 aagattccgt acggcgagga cgtgccgaag accgagcggg ccgtggagtt ccggcaccgc 29880 ccgggcagca gcaccctcac ggcacccgcc ggcaaggacg ctgtctgggt cctggatgcc 29940 ggcgagggcg cctggacccg ggtgaagacc ggccccgtgg tcgccgccaa cacggccggc 30000 gaaggctcgc cgctggtcgt cctggagacc gacggggccc tgcacggcta cgacataccc 30060 accggcaagg agaccggcgt gaccgatccc ctgctcaagg aactgcccgg aaccggtgcg 30120 ggcggcggcg cggctccggt gatcgaggtg gaccgcagcc gggcctacct caacgacccc 30180 gagggcaagc gcgtgtacga gatcgactac aacgacgatc tccgcgtggc ccgtacgttc 30240 gacgtcgacg tacggccgtc cctgatggtg gagacgggcc gatgagcgcg cgcgtgggcg 30300 ctccacggat gcgtgccctg ctggtgtccc tggccggatt cttcgtcgtc gccggtgcgg 30360 cgaccggctg cgcgggcggc ggagacgaac ggccccgggt cgtggtgacc accaacatcc 30420 tcggcgacat cacccgggag atcgtcgggg acgaggccgg cgtcagtgtc ctgatgaagc 30480 ccaacgccga cccgcactcc ttcggcctct cggccgtgca ggccgctgag ttggagaacg 30540 ccgacctggt cgtctacaac gggctcggcc tggaggagaa cgtgttgcgg cacgtggagg 30600 ctgcccgcga gtccggagtg gccgccttcg ccgcgggtga ggcggccgac ccgctcacct 30660 tccatgccgg acaggacggc ggccccgaag aggacgccgg caagcccgat ccgcacttct 30720 ggaccgaccc cgaccgcgta cgcgaggccg ccggcctgat cgccgaccag gtcgccgagc 30780 atgtggaggg cgtcgacgag aagaaggtcc gggagaacgc cgagcggtac gacggacaac 30840 tcgccgacct cacgggatgg atggagaagt ccttcgccgc catccccgag gaccggcgtg 30900 ccctggtgac caaccaccac gtcttcggct acctcgccga ccgcttcggc ctccgcgtca 30960 tcggcgcggt catccccagc ggaaccacgc tcgcctcgcc cagctcctcc gacctgcgct 31020 ctctcaccca ggccatggag aaggccaagg tgcgcaccgt cttcgccgac tcctcccagc 31080 ccacccggct cgccgaggtc ctgcgccagg agatgggcgg cgacgtggac gtcgtctcgc 31140 tctactccga gtcgctgacc gagaagggca agggcgccgg aacctacctg gagatgatgc 31200 gcgccaacac ctccgccatg gccgagggcc tcaccggcga ctgaacgagc ttccccgcgg 31260 cacggcactt cgagcgccgg ccgctccacc ccacaaaccc gcgcctgagg gccggagagg 31320 aaacaccgat catgaacaag cccacccgcg ccagagtctt cacgggcacg gcgctggtcg 31380 tggcggcgtc gatggcgctg accgcctgcg gcggcaacgg caacgacgac gccccttccg 31440 gcaaagagcc caaggagcag aagagcagcg aggccgcggc ggtcgggaac ccgatcgtcg 31500 cctcgtacga cgggggactg tacgtcctcg acggcgagac cctgaagctc gcgaagacga 31560 tcgcactgcc cggcttcaac cgggtcaacc cggcgggcga caacgagcac gtcgtcgtct 31620 ccacggactc cggcttccgc gtgttcgacg ccacccgaca ggagttcacc gacgccgagt 31680 tcaagggttc caagccgggg cacgtcgtcc ggcacggcgg caagacggtc ctgttcaccg 31740 acggcacggg agaggtgaac gtcttcgacc ccgccgacct gtccgacggg aagaagccgg 31800 acggccgcac ctacacgtcc gcgaagcccc accacggtgt cgccatcgaa ctggccggcg 31860 gagaactcgt caccaccctc ggcaccgagg agaagcgcac cggagccctc gtcctggaca 31920 aggacaacaa ggagatcgca cgcgccgaga actgccccgg agtgcacggc gaggccgccg 31980 cccagggcga ggtggccggc ttcggctgcg aggacggcgt cctgctctac aaggacggca 32040 agttcaccaa ggtcgacgcc cccggcgact acgcccgcac cggcaaccag gccggcagcg 32100 acgcctcccc gatcctcctc ggcgactaca agaccgaccc cgacgccgaa ctggaacgcc 32160 ccacccgcat atccctgatc gacacccgta cggcgaagat gaagctggtc gacctcggca 32220 ccagctactc cttccgctcc ctcgcccgcg gcccgcacgg cgaagccctc gtgctcggca 32280 ccaacggcac cctccacgtc atcgacccgg agaccggaaa ggtcgagaag aagatcgacg 32340 cggtcggcga ctggaccgag cccctggact ggcagcagcc caggcccacc ctgttcgtcc 32400 gggaccacac ggcgtacgtc tccgaaccgg gcaagcgcca actccactcc atcgacctgg 32460 aatcggggaa gaagctggca tccgtcaccc tgccgaaggg caccaacgaa ctgtccggca 32520 cggtcgccgg tcactgacct gtcccgttcc ctcttttcct cgggccccga ggagcgcaac 32580 gcctgccgga ttcgtgttcc ggcaggcgtt gctgtcgtcg gagcctgcaa ccttgacgac 32640 cctgccgagg agaaccgttt caccacggag gcctggggtg cgcagatgga actgtgcgcg 32700 ctccactcca gggaccgtga cgccaccgtc aagacctgtg ccgccggccg cccgaaacgc 32760 aagccgtcgt acggcttcct gggccgtccc acagccgccg aggagctcgc cgcggtcacg 32820 agctgcggcg gcggtgcctg cgccgccacc acacgatcgc gagcgtgaag gcggccgcaa 32880 cgcccagcag ggcccacagg atggtggaga gcacgctctc ggcctcgcgc agggaggtcg 32940 agaccagtgt tcccgcggac acgtagagcg cggaccacat cgcggctccg gcgagggagg 33000 cgggcaggaa gcggaggtag cgcacggagc cgacgccggc ggtcgcgggg gtgagggtgc 33060 gtaccacggg caaaaggcgg gtcaggaaga cggcgcgcgc cccgtaccgg tggcagagct 33120 cttgcgcgcg gtcccagtgg tgctgcccaa tccgccgtac caggcgcgtc tcccgcatcc 33180 gctgcccgta gcggatgccg aggaagtagc cgatgtggtc gccggccgag ctgctgagtg 33240 tgacgacgag gaagagggcc aacagcgggc gtgtcccctc cgttccggcg ctcagggcca 33300 gtaccgcgac ctcgccgggg acggccatgc cggccccaag gccggattcc gcgaacgcga 33360 atacggaggc cagcgcgaat ctggtgaccg ggttcatgtc cgacaccgct gtcagtacat 33420 cgttcatcca cgacacggca gccccgctct gtctctcctc gttcgtggag ccctcccgac 33480 ggcgccacgg ggattcccgc gcccttcttc cgagaacaca ccgaagagaa cagcggaacg 33540 acttcccggc gtcaccggac gcatacccgg gcggccggtg ggagcgcctg aaaaagaacg 33600 aagggacacc aacctaccag ggaaccgctg gacgactcct ccctcccggc cacgaccacc 33660 ccgcgacgga ccccgcagac cgcccccggc aaccattccc cttcacccac cccgtccgcc 33720 gacggagcac gggggctcgc cgtacagatc cgggcctcgt tgatccactg ggtgagaacg 33780 gcggggccgg ccccggccgc gagggcggcc cggtagtgag acagacgctt ctcgcccttt 33840 ctcaccgccc gccgggcctg ctcgacctcc ggggcgcggc catcggatgc ggcagccgcg 33900 tgcgtcaggg cggtgagggt ggcggtcaga cgttccggcg cgaaggcacg ggcgatccac 33960 tggtcgagtg ccgggcagat catgtcctcc cgcaggcaca tcatgtcctc ccgcgggcac 34020 acggtgcggg ggtgaccgag tccggggtgg agggccttgt tcctgggacc cgctcctgac 34080 cgtgtacggg cgtccgaggt cggctcaggc gatcgcggtc aactaccccg tgggctacag 34140 tgcgttgact gcgggcagtg cacacgccca ccggcaccga cgacgcggag aagcatgggc 34200 gggagcgcga tcaggacccg gcagctgacc aagcacttcg gtgcggtgca ggcgctggtc 34260 ggcgtggatc tggaggtgcc cgcggggagc gtgctggggc tcctgggaca caacggtgcc 34320 gggaagacca cgctgatcca gatcctctcg acggtgctcc ccccgtccgg tgggtccgcc 34380 gaggtcgccg gcttcgacat cgtgcgcgat gcccgacggg tacgcgcctg tatcggggtg 34440 acggggcagt tcgctgccct ggacgagcat ctgtccgggc tcgccaatct ggtgctgatc 34500 tcccggctgc tgggtgcccg gccgagggag gccagacgcc gggcggccga actggtcgaa 34560 caattcggtc tcaccgaggc agcggacaga ccgatgcgga cctactccgg cggaatgcgg 34620 cggcgcatcg acctggcggc gagtctggtg gccaggccct cggtgctgtt cctcgacgag 34680 cccaccaccg ggctggaccc ggtgagccgc accgcactct gggagacggt ggaagggctg 34740 gtcgccgagg gcacgacggt tctgctgacc acccagtacc tcgacgaggc cgaccggctg 34800 gcggaccgga tagcggtgct gtcgtccggc cacgtggtga cggtcggcac ggcggcggag 34860 ctcaaggcgg cgggcacccg gtccgtccgc ctgaccttcg ggtccgcggc ggatctggag 34920 agcgcggaag gagcgctgcg cctggagggc ctcggcctca caacggatcc ggtgtcccgg 34980 acggtgtcac tgccgctggc ggcaacggcc gagctggccg ggatcttccg gattctcggc 35040 gcggcgggcg tggagctcgc cgaactggcg ctcaaggagc ccacgctgga cgacgtgtat 35100 ctgagcctgg cggagagctg ggagaccacg agcgggggaa cggtccggtg ctgaccacac 35160 gacgtacggg tccggggacc tcgccggtgg cggacgggcc cgggtggcgc ggcgggggtg 35220 cggggatcgg cacccagttc cgggtgctga ccggccggca gttccggatc atctacgggg 35280 accggcggat cgcgctgttc agcctgctcc agccgatcat catgctcatg ctgttcagtc 35340 aggtgctggg ccgcatggcc aatccggaga tcttcccgcc gggtgtgcgc tacctcgact 35400 acctggtgcc ggctctgctg ctgacgaccg ggatcggttc cgcgcagggc ggcgggctgg 35460 gtctcgtcag ggacatggag tccgggatga tggtccggct gcgggtgatg ccggtacggc 35520 tgccgctggt cctggtggcc cggtcgctgg ccgatctggc gcgggtcgcc ctgcagctcg 35580 tggcgttgct cgcctgtgcg atggggccgc tgggctaccg gccggccggg ggcgtgtcgg 35640 ggatcgtcgg cgcgacgctg ctcgcgttgc tcgtcgcgtg gtcgctgatc tgggtgttcc 35700 tggccctcgc cgcgtggctg cggagcatcg aggtgctgtc cagcatcggg ttcctcgtca 35760 ccttccccct gatgttcgcg tcgagtgcct tcgtcccgct cgacattctg ccgggatggc 35820 tcagggtcat cgcgacggtc aatcccctca cgtacgcggt ggaggcgtcc cgcgatctgg 35880 cgctggacca cagcgcgctg ggcgcggcgc tcgcggccgt cggcaccagt cttgcgctct 35940 tggcggtgac cggtctgctg gcggtacgcg ggctgcggcg cccgccgggt gcgggcggcc 36000 cgcaccggac gccctgaccc ctccccacca cctgcccagt gtgacgtttg cgcagatgag 36060 aacgtgcgta aacgccgcat acgcaaagat cgtccctgcc gggacccatt gacgttcgca 36120 ggggcgtgga acatactggc gatcaagtcg cacaggaacc aacaggcaca ccaaccacag 36180 gcgttacagg gggggttggt gtttcgtcca tatcaagtgg tttggtccgc cgaagcggtt 36240 ggacctcaca tgacggcaac agggcattcg cacatgcctg atgacgggac ggcacacctc 36300 acgcagcggc gaccggtcgc aagccggacg cggaatgact ccctgcctta caggtatgcg 36360 agcgcggatg cgtcgttcga ccggagtcag gagggggagt gcctgccgtg agtgagagcc 36420 gctgtgccgg gcagggcctg gtgggggcac tgcggacctg ggcacggaca cgtgcccggg 36480 agactgccgt ggttctcgta cgggacaccg gaaccaccga cgacacggcg tcggtggact 36540 acggacagct ggacgagtgg gccagaagca tcgcggtgac cctccgacag caactcgcgc 36600 cggggggacg ggcacttctg ctgctgccgt ccggcccgga gttcacggcc gcgtacctcg 36660 gctgcctgta cgcgggtctg gccgccgtac cggcgccgct gcccgggggg cgccacttcg 36720 aacgccgccg tgtcgcggcc atcgccgccg acagcggagc cggcgtggtg ctgaccgtcg 36780 cgggtgagac cgcctccgtc cacgactggc tgaccgagac cacggccccg gctactcgcg 36840 tcgtggccgt ggacgaccgg gcggcgctcg gcgacccggc gcagtgggac gacccgggcg 36900 tcgcgcccga cgacgtggct ctcatccagt acacctcggg ctcgaccggc aaccccaagg 36960 gcgtggtcgt gacccacgcc aacctgctgg cgaacgcgcg gaatctcgcc gaggcctgcg 37020 agctgaccgc cgccactccc atgggcggct ggctgcccat gtaccacgac atggggctcc 37080 tgggcacgct gacaccggcc ctgtacctcg gcaccacgtg cgtgctgatg agctccacgg 37140 cattcatcaa acggccgcac ctgtggctac ggaccatcga ccggttcggc ctggtctggt 37200 cgtcggctcc cgacttcgcg tacgacatgt gtctgaagcg cgtcaccgac gagcagatcg 37260 ccgggctgga cctgtcccgc tggcggtggg ccggcaacgg cgcggagccc atccgggcag 37320 ccaccgtacg ggccttcggc gaacggttcg cccggtacgg cctgcgcccc gaggcgctca 37380 ccgccggcta cgggctggcc gaggccaccc tgttcgtgtc gaggtcgcag gggctgcaca 37440 cggcacgagt cgccaccgcc gccctcgaac gccacgaatt ccgcctcgcc gtacccggcg 37500 aggcagcccg ggagatcgtc agctgcggtc ccgtcggcca cttccgcgcc cgcatcgtcg 37560 aacccggcgg gcaccgtgtt ctgccgcccg gccaggtcgg cgagctggtc ctccagggag 37620 ccgccgtctg cgccggctac tggcaggcca aggaggagac cgagcagacc ttcggcctca 37680 ccctcgacgg cgaggacggt cactggctgc gcaccggcga tctcgccgcc ctgcacgaag 37740 ggaatctcca catcaccggc cgctgcaaag aggccctggt gatacgagga cgcaatctgt 37800 acccgcagga catcgagcac gaactccgcc tgcaacaccc ggaacttgag agcgtcggcg 37860 ccgcgttcac cgtcccggcg gcacctggca cgccgggctt gatggtggtc cacgaagtcc 37920 gcaccccggt ccccgccgac gaccacccgg ccctggtcag cgccctgcgg gggacgatca 37980 accgcgaatt cggactcgac gcccagggca tcgccctggt gagccgcggc accgtactgc 38040 gtaccaccag cggcaaggtc cgccggggcg ccatgcgtga cctctgcctc cgcggggagc 38100 tgaacatcgt ccacgcggac aagggctggc acgccatcgc cggcacggcc ggagaggaca 38160 tcgcccccac tgaccacgct ccacatccgc accccgcgta atcgccggag ggcggccctg 38220 ccctggaacg ggcaccgcgg tgcccgccga cagcgaggag tagctccaca tgaacccgcc 38280 cgaagcggtc agcacgccca gcgaggtcac cgcgtggatc accggacaga tcgccgagtt 38340 cgtgaacgag acacccgacc ggatcgccgg tgacgcaccc ctgaccgacc atggcctcga 38400 ctccgtctcc ggagttgccc tctgcgcgca ggtcgaggac cgctacggga tcgaggtcga 38460 cccggagctg ctgtggagcg tccccacact caacgagttc gtccaggcac tgatgcccca 38520 gttggccgac cgcacctgag gggatccgcg agagatggac atgcagtcgc agcgcctcgg 38580 cgtcaccgcc gcccaacaga gcgtctggct cgccggccag ctggcggacg accaccgcct 38640 gtaccactgt gcggcgtacc tgtcactcac cgggtccatc gacccgcgga cactcggcac 38700 ggcggtccgg cggaccctcg acgagaccga ggcgctgcgt acccggttcg taccgcagga 38760 cggggaactg ctgcagatcc tcgaacccgg tgccggacag ctcctgctgg aagccgactt 38820 ctccggcgac ccggaccccg agcgggcggc acacgactgg atgcacgcgg cgctcgccgc 38880 accggtccgc ctcgaccgcg ccgggaccgc cacccacgcc ctgctcaccc tcggcccgtc 38940 ccgccacctg ctgtacttcg gctaccacca catcgcgctc gacggctacg gtgccctgct 39000 ccacctgcgc cgcctcgccc acgtctacac cgccctcagc aacggggacg accccggccc 39060 ctgcccgttc ggccccctgg ccggtgtcct cacggaggag gcggcctacc gtgactccga 39120 caaccatcgg cgcgacgggg aattctggac ccggtccctc gccggtgcgg acgaggcccc 39180 cgggctgagc gagcgggagg ccggcgctct cgccgtcccg ctgcgccgca ccgtggagct 39240 gtccggcgaa cggacggaga agctggccgc ctcggccgcg gccactggag ctcgctggtc 39300 gtcactgctc gtcgccgcca ccgccgcgtt cgtacgccgc cacgctgccg ccgacgacac 39360 cgtcatcggc ctgcccgtca ccgcccggct caccgggccg gcgctgcgta ccccgtgcat 39420 gctcgccaac gacgtgccgc tgcgcctcga cgcccggctc gatgccccgt tcgccgcgct 39480 ccttgccgac accacccgcg ccgtcggcac gctggcgcgc caccagcggt tccgcgggga 39540 agaactccac cggaacctgg ggggcgtcgg ccgcaccgcg ggcctggcgc gggtcaccgt 39600 caacgtcctg gcgtatgtcg acaacatccg gttcggcgac tgccgggccg tggtccacga 39660 gttgtcctcg ggaccggtcc gcgacttcca catcaactcc tacggcaccc ccggcacccc 39720 cgacggcgtc cagctggtct tcagcggtaa ccccgccctg tacacggcca ccgatctggc 39780 cgaccaccag gagcggttcc tgcgcttcct cgacgctgtg accgccgacc cggacctgcc 39840 gaccggaaga caccgcctcc tgtcgccggg cacccgcgcc cggctgctcg acgactcccg 39900 cggcacggaa cgccccgtac cgcgtgccac cttgccggaa ctcttcgccg aacaggcccg 39960 gcgcaccccc gacgcgcccg ccgtccagca cgacggcacc gtcctcacct accgcgacct 40020 gcaccggagt gtcgaacggg cggccggacg gctggccggc ctcggcctgc gtaccgagga 40080 cgtcgtcgcc ctcgccctcc ccaagtccgc cgagagcgtc gcgatcctgc tcggcatcca 40140 gcgggccggc gccgcctacg tgccgctgga ccccacccat ccggccgagc ggctggcccg 40200 tgtactcgac gacacccgac cccggtacct cgtcaccacc ggacacatcg acggcctgtc 40260 ccaccccacg ccgcagttgg ccgccgccga cctcctccgt gagggcggcc cagagcccgc 40320 cccgggccgc ccggcacccg gcaacgcggc gtacatcatc cagacctccg gctccaccgg 40380 acggccgaag ggtgtcgtcg tcactcacga agggctggcc accctcgccg ccgaccagat 40440 ccggcgctac cgcacgggac cggacgcccg cgtactgcag ttcatctccc cggggttcga 40500 cgtcttcgtc tccgaactga gcatgaccct cctgtccggc ggctgcctgg tgataccgcc 40560 ggacggcctg accggccgtc acctcgccga cttccttgcc gcggaggccg tcaccaccac 40620 atccctcacc cccggcgcac tcgccaccat gcccgccaca gatctcccgc acctgcggac 40680 tctgatcgtc ggcggagagg tctgcccgcc ggagatcttc gaccagtggg gccggggccg 40740 ggacatcgtc aacgcgtacg ggcccaccga gacaaccgtc gaggcgaccg cctggcaccg 40800 tgacggtgcc acccacggcc ccgtcccgct cggccgcccc accctcaacc ggcgcggcta 40860 cgtcctcgac ccggcgctcg aacccgtccc cgacgggacg accggcgaac tgtacctggc 40920 cggcgagggc ctcgcccggg gctacgtcgc tgctcccggg cccaccgccg agcgtttcgt 40980 cgccgacccg ttcggcccgc ccggcagccg catgtaccgc accggtgacc tggtgcggcg 41040 gcgctccggc ggcatgctgg aattcgtcgg acgagccgac ggacaggtca aactccgcgg 41100 cttccgcatc gaactcggcg aggtccaggc cgcgctcacc gctctccccg gggtacgtca 41160 ggccggcgtc ctgatccgcg aggaccgccc cggggacccc cggctcgtcg ggtacatcgt 41220 gcccgcgccc ggcgccgaac cggacgccgg tgagctccgt gcggccctgg cccgtaccct 41280 cccgccccac atggtgccct gggcgctcgt ccccctcccc gcactgccgc tgacgtccaa 41340 cggcaaactg gacagggcgg cccttcccgt ccccgccgcc cgcgccggcg gatccgggca 41400 acgcccggtc accccacagg agaagacact ctgcgccctg ttcgccgacg tcctcggcgt 41460 aacggaggtc gccacggacg acgtgttctt cgagctcggc ggccactccc tcaacggcac 41520 ccggctgctc gcccggatca ggaccgagtt cggcaccgac ctcaccctcc gcgacctgtt 41580 cgccttcccc accgtcgccg gccttctccc gctcctggac gacaacggac ggcagcacac 41640 caccccgccg ctgcctccgc gcccggagcg cctccccctg tcgcacgcgc agcagcgact 41700 gtggttcctc gaccaggtcg aaggccccag ccccgcgtac aacatcccca ccgccgtccg 41760 gctcgaaggc ccgctcgaca tcccggccct cgctgtcgcc ctgcaggacg tcaccaaccg 41820 ccacgagccc ttgcgtactc tcctcgccga ggactccgaa ggcccccacc aggtcatcct 41880 gccccccgag gccgcccgcc ccgaactgac ccacagcacc gtcgcgcccg gcgatctcgc 41940 cgcagccctc gccgaagccg cacgccgccc cttcgacctc gccggtgaga tcccactcaa 42000 agcccacctg ttcggctgcg gcccggacga ccacaccctg ctgctcctcg tccaccacac 42060 cgccggcgac ggagcctccg tcgaggtcct cgtacgcgat ctcgcccacg cctacggcgc 42120 ccgccgcgcc ggcgacgccc cgcacttcga gccgctgccc ctgcagtacg ccgaccacac 42180 cctgcgccga cggcacctgc tggacgatcc gtcggacagc acacagctcg accactggcg 42240 cgacgccctg gccggcctgc ccgagcagct cgaactgccc accgaccaca cccggcccgc 42300 cgttcccacc cgccggggcg aggcgatcgc cttcaccgtg cccgagcaca cgcaccacac 42360 gctgcgggcc atggcccagg cccacggcgt caccgtgttc atggtcatgc aggccgcgct 42420 cgccgccctg ctgtcgcggc acggcgcggg ccacgacatc cccctcggaa cacccgtcgc 42480 gggccgctcc gacgacggca cggaagacct cgtcgggttc ttcgtcaaca cgctcgtact 42540 gcgcaacgac gtctccgggg acccgacgtt cgcggaactc gtgtcgcggg tgcgggccgc 42600 caacctggac gcgtacgcct accaggacgt tcccttcgag cgtctcgtcg acgtactcaa 42660 accggagcgg tccctgtcct ggcacccgct cttccagatc atgatcgcgt acaacggccc 42720 ggcgacgaac gacaccgccg acgggtcccg cttcgcgggc ctcaccagcc gcgtccatgc 42780 cgtccacacc ggcatgtcca agttcgacct gtcgttcttc ctcaccgagc acgcggacgg 42840 cctcggcatc gacggcgctc tcgagttcag caccgatctc ttcacgcgga tcaccgcgga 42900 gcgcctggtc cagcgctacc tcaccgtcct ggagcaagcc gccggagcac cggaccgccc 42960 catcagttcg tacgaactcc tcggcgacga cgaacgcgca ctcctcgccc aatggaacga 43020 caccgcccac cccacccccc caggcacggt gctcgatctc ctcgaaagcc gtgcggcgcg 43080 gacccccgac cggccggccg tcgtcgagaa cgaccacgtc ctcacctacg ccgacctgca 43140 cacccgggcc aaccggctcg cccgccacct gatcaccgcc cacggcgtcg gtcccgaacg 43200 tctcgtcgcc gtcgccctgc cccggtccgc cgagctgctg gtggcacttc tcgcggtcct 43260 caagaccgga gccgcctacg tccctctcga cctcacccac cccgccgagc gcaccgccgt 43320 cgtcctcgac gactgccggc cggccgtgat cctcaccgac gccggtgcgg cccgtgaact 43380 gccgcggcgc gacatcccac agctccgcct cgacgaaccc gaggtccacg cggcgatcgc 43440 ggaacaaccg gggggtccgg tcaccgaccg ggaccgcacg tgcgtcactc cggtcagcgg 43500 cgagcacgtg gcatacgtga tctacacatc cggctccacg ggccggccca agggtgtggc 43560 ggtggaacac cgttcactgg ccgacttcgt gcggtactcc gtgaccgcgt accccggagc 43620 cttcgacgtc accctgctgc acagccccgt gaccttcgac ctcaccgtga cctcgctgtt 43680 cccgccactg gtcgtcggtg gcgccatcca tgtcgcggac ctgaccgagg cgtgcccacc 43740 gagcctggcc gcggcgggcg ggccgacgtt cgtcaaggcc acaccgagcc atctgccact 43800 gctcacgcac gaggcgacat gggccgcgtc cgcgaaggtg ctgctcgtcg ggggcgagca 43860 gttgctggga agggagctgg acaagtggcg ggccgggtcg ccggaggccg tcgtcttcaa 43920 cgactacggc cccaccgagg ccacggtcaa ctgcgtggac ttccgtatcg atccgggaca 43980 accgatcggt gcggggccgg tggcgatcgg ccgcccgttg cggaacacgc gggtgttcgt 44040 gctcgacggt gggttgcggg cggtgccggt cggtgtggtc ggtgagctcc atgtggcggg 44100 cgaggggctg gcgcggggtt atctcgggca gccgggtctg acggcggagc ggttcgtggc 44160 gtgtccgttc ggtgatgccg gggagcggat gtaccgcacg ggtgacctgg tgcggtggcg 44220 tgcggatggg atgctggagt tcgtcggccg ggtcgacgat caggtcaagg tgcggggttt 44280 ccggatcgag ctgggcgagg tggaggccgc tgtcgcggcc tgcccgggtg tggaccgctc 44340 cgtggtggtg gtacgggagg accgaccggg agaccgccgg ctggtggcgt atgtgacggc 44400 cgccggtgac gaggcggagg ggctggcacc gctgatcgtg gagacggccg cgggccgtct 44460 gcccgggtac atggtgccgt cggccgtggt cgtactggac gagattcccc tgacgccgaa 44520 cggcaaggtg gaccgtgccg cgctgcccgc gccgcgcgtc gccccggccg cggagttccg 44580 cgtcaccgga tcaccccgtg aagaggctct gtgcgccctg ttcgcggaag tgctgggcgt 44640 ggaacgggtc ggcgtggacg acgggttctt cgacctcggc ggagacagca ttctgtccat 44700 tcaactggtg gcgcgggcgc gccgggcggg tctggaggtg tcggtgcggg acgttttcga 44760 gcaccgcacc gtacgggcgc tggccggtgt ggtgcgggag tccggaggcg tcgctgccgc 44820 cgtcgtggac tccggtgtgg gtgcggtgga gcggtggccg gtggtggagt ggctggcgga 44880 gcgtggtggc ggtgggctcg gcggtgcggt cagggccttc aaccagtccg tcgtggtcgc 44940 cacaccggcc ggtatcacct gggacgaact gcggacggtc ctggacgcgg tacgcgaacg 45000 ccacgacgcc tggcggctac gggtagtgga ttccggtgac ggcgcctggt ccctgcgcgt 45060 cgacgcgccc gcccccggcg gtgagcccga ctggatcacc cggcacggca tggccagcgc 45120 cgacctggag gagcaggtga acgccgtgcg ggccgccgcc gtggaggccc ggagccggct 45180 cgatccactg accggacgga tggtccgcgc ggtatggctg gaccgtggac ccgaccgccg 45240 gggagtcctg gtcctggtgg cgcaccacct ggtcgtcgac ggcgtctcct ggcgcatcgt 45300 cctcggcgac ctcggcgaag cctggacaca ggcacgcgct ggcgggcatg tgcggttgga 45360 cacggtcggc acatcgctgc gcggctgggc ggcggcgctg gcggaacagg gccgccacgg 45420 cgcccgcgcc accgaagcaa acctgtgggc acagatggtc cacggctcgg accctctggt 45480 cggcccacgc gcggtggacc cttcggtgga cgtcttcggc gtggtggagt cggtgggttc 45540 acgggcgtcg gtgggggtgt cgcgtgccct gctgacggag gtcccgtcgg tcctgggtgt 45600 gggcgtgcag gaagtgctgc tggcggcatt cggcctggca gtgacgcgct ggcgcggccg 45660 cggcggaagc gtcgtcgtgg acgtcgaggg tcacggccgc aacgaagacg ccgtacccgg 45720 cgcggacctc tcccgcaccg tggggtggtt caccagcatc taccccgtcc gcctccccct 45780 cgagccggcg gcctgggacg agatacgcgc cggcggtccc gccgtcggac gcaccgtccg 45840 cgagatcaag gaatgcctcc gcaccctgcc cgaccagggc ctgggctacg gcatcctgcg 45900 ctacctcgac cccgaaaacg gacccgccct cgcccagcac cccaccccgc acttcggctt 45960 caactacctc ggacgggtct cggtctcggc ggacgctgcc tcactggacg aaggcgacgc 46020 ccatgccgac gggctcggcg gcctcgtcgg cggcagggca gcggcggact ccgacgagga 46080 acagtgggcc gactgggttc cggtgtcggg tccgttcgcg gtgggcgcgg gtcaggaccc 46140 cgttctgccg gtggcccacg cggtggagtt caacgcgatc accctggaca cacccgacgg 46200 cccccgcctc agcgtgacat ggtcgtggcc gacgacactg ctgtccgaat cccggatacg 46260 agaactcgcc cgcttctggg acgaagccct cgaagggctg gtcgcacacg cccgccgtcc 46320 cgacgcgggc ggactgaccc cctcggacct gccgctggtc gccctcgacc acgcggaact 46380 ggaggccctg caggccgacg tcaccggtgg cgtgcacgac atcctgcccg tatcaccgct 46440 tcaggaagga ctgctcttcc acagctcctt cgccgccgac ggggtcgacg tctacgtggg 46500 acaactcacg ttcgacctga ccggaccagt cgacgccgac cacctgcacg ccgtggtcga 46560 aagcctggtg acacgccacg acgtcctgcg caccggctac cgccaggcac agtccggcga 46620 atggatcgcc gtcgtggcac gacaagtcca caccccctgg cagtacatcc acacactcga 46680 cacggacgcc gacaccctca caaacgacga gcgctggcgg ccgttcgaca tgacgcaggg 46740 cccactcgca cgattcaccc tcgcacgcat caacgacacc cacttccgct tcatcgtcac 46800 gtaccaccac gtcatcctcg acggctggtc cgtggcggtt ctcatacgcg aactcttcac 46860 cacctatcgc gacaccgccc tcggccgccg gccggaggtt ccgtactccc caccgcgccg 46920 tgacttcatg gcgtggctcg ccgaacgcga ccagaccgct gcgggacagg catggcgttc 46980 cgcgctggcc ggactcgcgg agcccacagt gctcgccctc ggaacggagg gcagtggggt 47040 gattcccgaa gtccttgagg aagagatcag cgaggaactg acctcggaac tggtggcgtg 47100 ggcgcgtggg cgtggtgtga cggtcgcgtc ggtggtgcag gcggcctggg cgttggtgct 47160 ggggcggctg gtgggccggg acgacgtggt gttcggcctg accgtgtcgg gccggcccgc 47220 cgaagtggcg ggtgtggagg acatggtcgg tctgttcgtg aacaccattc cgttgcgggc 47280 ccggatggac ccggcggagt cactgggcgc cttcgtggag cggctgcagc gggaacagac 47340 ggaactgctc gagcaccagc acgtccggct ggccgaggtc cagcgctggg ccggacacaa 47400 ggaactcttc gacgtcggaa tggtcttcga gaactacccg atggattccc tgctgcagga 47460 ttcactgttc cacggcagtg gcctgcagat cgacggaata cagggtgccg atgcgacgca 47520 tttcgctttg aacctggcag tggttcccct tcccgccatg cgattccggc tcggctatcg 47580 gccggacgtg tttgacgcgg gtcgggtgcg tgagctgtgg ggttggatcg tccgggcctt 47640 ggagtgcgtg gtctgcgagc gtgatgtgcc ggtgtccggt gtcgatgtgc tgggtgccgg 47700 tgagcgggag acgctgctgg gctggggtgc gggcgcggaa cccggcgtgc gtgcgctgcc 47760 gggtgcgggt gcgggtgcgg gtgcggggct ggtcgggttg ttcgaggagc gggtgcggac 47820 cgacccggac gcggtggccg tgcgcggcgc gggagtggaa tggagttacg cggagctgaa 47880 cgcgcgggcg aatgcggtgg cccggtggct gatcggccgg ggcgtgggac ccgagcgcgg 47940 tgtcggggtg gtgatggacc gcggcccgga cgtggtggcc atgctcctcg cggtcgccaa 48000 aagcggcggc ttctacctgc ccgtcgaccc gcaatggccc accgaacgca tcgactgggt 48060 actcgccgac gccggcatcg acctggccgt cgtgggcgag aacctggccg ctgcggtcga 48120 ggccgtccgc gactgcgagg tggtcgacta cgcgcagatc gcccgcgaaa cacggctgaa 48180 cgagcaggcg gccaccgacg ccggtgatgt gacggacggg gagcgcgtgt cggctctgct 48240 gtccgggcat ccgctgtatg tcatctacac ctccggctcg acgggcctgc ccaagggcgt 48300 ggtggtcacc cacgcctcgg tcggcgccta tctgcggcgc ggccgcaacg cctaccgcgg 48360 cgccgccgac ggcctgggcc acgtgcactc ctcactcgcg ttcgacctga ccgtgaccgt 48420 tctgttcacc cccctggtct ccggcggctg cgtcaccctc ggcgatctcg acgacaccgc 48480 caacggcctg ggcgccacct tcctcaaggc cactccttcc cacctgcccc tgctcggcca 48540 actcgaccgg gtactcgccc ccgacgccac cctcctcctc ggcggcgaag ccctcaccgc 48600 cggcgccctg caccactggc gcacccacca cccccacacc acggtcatca acgcctacgg 48660 cccgaccgaa ctcaccgtca actgcgccga ataccgcatc ccccccggcc actgcctccc 48720 cgacggcccc gtccccatcg gacgcccctt caccggccac cacctcttcg tcctcgaccc 48780 cgccctccgc ctcacacccc ccgacaccat cggcgaactg tatgtggccg gtgacggcct 48840 ggcgcggggc tatctcgggc gcccggacct gaccgccgaa cgcttcgtgg cctgcccctt 48900 ccgcagcccc ggcgaacgca tgtaccgcac cggcgacctc gcacgctggc gcagcgacgg 48960 aacactcgaa ttcatcggcc gtgccgacga ccaggtcaag atccgcggct tccgcatcga 49020 actcggcgaa gtcgaggcgg ctgtcgcggc gcatccgcac gtggcgcggg ccatcgccgt 49080 cgtacgcgag gaccggcccg gcgaccagcg cctggtcgcg tacgtgacag gcagcgaccc 49140 gagcggcctg tcctcggcgg tgacggacac cgtcgccggc cgcctgcccg cgtacatggt 49200 gccgtcggcc gtcgtcgtac tggaccagat ccccctcacc cccaacggca aggtcgaccg 49260 cgccgccctc cccgcgcccg ggaccgcctc cggaaccacc tcccgagcac ccggcacagc 49320 ccgtgaagag atcctgtgca ccctgttcgc cgacgtactc ggtctggatc aggtcggcgt 49380 ggacgaggac ttcttcgacc tcggcggcca ttccctgctc gccacccgcc tcacctcacg 49440 gatccggtcg gccctcggca tcgacctcgg tgtccgagcc ctcttcaaag ccccgaccgt 49500 cggccgcctg gaccagctgc tccagcaaca gaccaccagc ctccgggcac ccctggtcgc 49560 gcgggagcgc accggttgtg agccgctgtc gttcgcgcag cagcgcctgt ggttcctcca 49620 ccagctcgaa ggccccaacg ccgcgtacaa catccccatg gctctgcgac tcaccggccg 49680 cctggacctg accgcgctgg aagcggccct gacggatgtg atcgcccgcc acgaaagcct 49740 gcgaacggtc atcgcccagg acgattcggg cggcgtgtgg cagaacatcc tgcccaccga 49800 cgacacccgc acccacctca ccctcgacac catgccggtc gacgcgcaca ccctgcagaa 49860 tcgggtggac gaggccgccc gccatccgtt cgacctcacc accgagatcc ccctccgcgc 49920 caccgtcttc cgcgtcaccg acgacgagca cgtcctcctg ctcgtgctcc accacatcgc 49980 cggcgacggc tggtccatgg cccccctggc ccacgacctg tccgccgcct acaccgtcag 50040 actcgagcac cacgcaccgc aactgcccgc tctggccgtc caatacgccg actacgccgc 50100 ctggcaacgc gacgtcctgg gcaccgagaa caacacatcg agccaactct ccacccaact 50160 cgactactgg tacagcaaac tcgaaggcct ccccgccgaa ctgaccctcc ccaccagtcg 50220 cgtccggccc gccgtggcct cccacgcatg cgaccgcgtc gagttcaccg tgccccacga 50280 cgtgcaccaa ggcctgaccg cactcgcccg cacccagggc gccaccgtct tcatggtggt 50340 gcaggcggcc ctggcggccc tgctgtcccg actcggcgcc ggcaccgaca tccccatcgg 50400 cacccccatc gccggccgca ccgaccaggc gatggagaac ctgatcggac tcttcgtcaa 50460 caccctcgta ctgcgcaccg acgtctccgg ggacccgacc ttcgccgagc tcctggcccg 50520 tgtgcgcacc actgctctcg acgcatacgc acaccaggac atccccttcg aacgcctggt 50580 agaagccatc aaccccgaac gatccctcac ccggcacccc ctcttccagg tcatgctcgc 50640 cttcaacaac acggaccgcc gatccgcgct cgacgcgctc gacgccatgc ccggccttca 50700 cgcacgaccg gccgacgtcc tggctgtgac cagcccctac gatctcgcgt tctcgttcgt 50760 ggagacaccc ggcagcacgg agatgcccgg catcctggac tacgcaaccg acctgttcga 50820 ccgctccacg gccgaggcca tgaccgaacg tctggtgcgc ctcctcgcgg agatcgcccg 50880 ccggcccgag ctgtccgtgg gcgacatcgg catcctgtcg gccgacgagg tgaaggccct 50940 cagccccgag gctcccccgg cagccgagga acttcacacc tccacactgc ctgagctgtt 51000 cgaggagcag gtggcggctc ggggccatgc ggtcgcggtg gtgtgcgaag gagaggagct 51060 gtcgtacaag gagttgaacg cgcgggcgaa tcgcctggcc agggtgctga tggagcgcgg 51120 cgcaggcccc gaacggttcg tgggcgtggc actaccgcgt ggcctggacc tcatcgtggc 51180 actcctggcc gtgaccaaaa ccggcgccgc atacgttccg ctcgaccccg aataccccac 51240 cgaccgcctc gcgtacatgg tcaccgacgc caaccccacc gcggtcgtga cctcaacgga 51300 cgtacacatc cccctgatcg ccccccgcat cgagctcgac gacgaggcaa tccgcaccga 51360 actcgccgcc gctcccgaca cagccccctg tgtcgggagc ggccccgccc accccgccta 51420 cgtcatctac acctccggct ccaccggtcg ccccaagggc gtcgtcatca gccacgccaa 51480 tgtcgtacgc ctgttcaccg catgctccga cagtttcgac ttcggaccgg accacgtctg 51540 gacgctcttc cactcgtacg ccttcgactt ctcggtctgg gagatctggg gcgcgctgct 51600 tcacggcggg cggctcgtcg tcgtgccgtt cgaggtgact cgttctcccg ccgaattcct 51660 cgcgctgctc gccgagcagc aggtcacgct gctgagccag acaccgtccg cgttccatca 51720 gctgacggag gccgcccgcc aggagccggc gcgctgcgcc gggctggccc tgcgacatgt 51780 ggtcttcggc ggcgaggcgc tcgacccgtc gcgactgcgc gactggttcg acctgccgct 51840 cggctcacgg ccgacgctcg tgaacatgta cggcatcacc gagaccaccg tccacgtcac 51900 ggtgctcccg ctggaggatc gcgcgacgag tctttccggc agcccgatcg gtcggccctt 51960 ggccgatctg caggtgtacg tcctcgacga acggctccgc ccggtgcccc caggcaccgt 52020 cggcgagatg tacgtggcag gcgccggtct ggcccgcggc tatctgggac gccccgctct 52080 gaccgccgag cggttcgtgg ccgacccgaa ttcccgttcc ggcggccgtc tgtaccgcac 52140 aggcgacctg gccaaggtgc ggcccgacgg gggactggag tatgtgggcc gcggggaccg 52200 gcaggtgaag atccgcggct tccggatcga actcggcgag atcgaggccg cgctggtcac 52260 acacgcgggt gtcgtccagg cggtggtcct ggtgcgggac gagcagaccg acgaccaacg 52320 gcttgtcgcg cacgtggtgc ccgcgctgcc gcaccgggcg ccgaccctgg ccgaactcca 52380 cgagcacctc gcggcgaccc tgccggcgta catggtgccg tccgcgtacc ggaccctgga 52440 cgagctgccg ctgacggcca acggaaagct cgaccgcgcg gcgctggccg ggcagtggca 52500 gggcggaacc cgcacccgga gactgcctcg gacgccgcag gaagagatcc tgtgcgagtt 52560 gttcgccgac gtcctccggt tgcccgccgc cggggccgac gacgacttct tcgccctggg 52620 aggccattcc ctgctggcga cgcgcctcct gtcggctgtc aggggcaccc tgggtgtgga 52680 actcggcatc cgcgacctct tcgccgcgcc cacgcctgcc gggctcgcga ccgtactggc 52740 ggcctccggc accgccctgc cacctgtgac caggatcgac cggcgccctg aacggctccc 52800 gctgtccttc gcacagcggc gactgtggtt cctgagcaag ctggaagggc ccagcgccac 52860 ctacaacatc ccggtcgccg tccggctcac cggcgccctc gacgtcccgg ctctccgggc 52920 cgccctgggg gacgtcaccg cacggcacga atcactgcgt acggtcttcc ccgacgacgg 52980 gggcgaaccc cgccagctgg tgctcccaca cgccgaaccc cccttcctca cgcacgaggt 53040 gaccgtcgga gaggtggcgg aacaggcggc gtccgccacc gggtacgcct tcgacatcac 53100 cagcgatacg ccgctgcggg ccaccctgtt gcgcgtctca ccggaggaac acgtcctcgt 53160 ggtggtcatc caccacatcg ccggcgacgg ctggtccatg gggccgttgg tgcgtgacct 53220 ggtcaccgcc taccgggccc gaacgcgggg cgacgccccg gagtacaccc cgcttcccgt 53280 gcagtacgcc gactacgccc tgtggcaaca cgctgttgcg ggcgacgagg acgccccgga 53340 cggccggacg gcgcgtcggc tcgggtactg gcgcgagatg ctggccgggc tgcccgagga 53400 gcacacgctg cccgccgacc ggccccggcc cgttcggtcc tcgcaccggg gcggccgggt 53460 acggttcgaa ctgcccgccg gcgtgcaccg gagtctgctg gccgtggcgc gtgaccgtcg 53520 ggccacgctg ttcatggtgg tgcaggctgc gctcgccggt ctgttgtccc ggctcggcgc 53580 gggcgacgac atccccatcg gcaccccggt cgccgggcgg ggcgatgaag cgctggacga 53640 cgtcgtcggg tttttcgtca ataccctggt ccttcggacg aatctcgcgg gggatccgtc 53700 cttcgccgac ctggtggacc gggtcaggac cgccgacctc gacgcgttcg cgcaccagga 53760 cgtgcccttc gaacggctcg tggaggcgct tgcgccacgg cgttccctcg cccgccaccc 53820 gctgttccag atctggtaca ccctcaccaa cgccgaccag gacatcaccg gccaggcact 53880 caacgccctc ccgggcctga ccggggacga gtacccgctg ggggccagtg ccgccaagtt 53940 cgacctgtcg ttcaccttca ctgaacaccg cacccccgac ggagacgccg ccggcctgtc 54000 cgttctgctc gactacagca gcgacctgta cgaccacggc actgccgccg cactgggcca 54060 ccggctgacc ggattcttcg cagcactggc cgccgacccc accgcccccc tgggcaccgt 54120 cccgctcctc accgacgacg agcgggaccg catcctcggt gactggggca gcggtacgca 54180 caccccgctg cccccgcgca gcgtggccga gcagatcgtc cgccgggccg cgctggaccc 54240 ggacgccgtc gccgtcatca ccgcggaaga ggaactctcg taccgggaac tggaaaggct 54300 cagcggtgag acggcgcggc tgctggccga ccgggggatc ggccgcgaga gcctcgtcgc 54360 cgtcgccctg ccccgcacgg ccggcctggt caccaccctg ctcggcgtcc tgcgcaccgg 54420 cgccgcctac ctcccgctcg acaccgggta ccccgccgag cgactcgcgc acgtgctctc 54480 cgacgcccgt cccgacctcg tcctcaccca cgccggcctc gccggacggc tgccggccgg 54540 cctcgcgccg accgtcctcg tcgacgagcc gcagccgccc gccgcagccg cccccgcggt 54600 tcccacgtcc ccgtcgggcg accacctcgc gtacgtcatc cacacctccg gctccaccgg 54660 caggcccaag ggcgtcgcga tcgccgagtc ctccctgcgc gccttcctcg cggacgcggt 54720 ccggcgccac gacctgaccc cgcacgaccg gttgctcgcg gtgaccaccg tcggcttcga 54780 catcgccggc ctcgaactgt tcgccccgct cctcgccggt gccgcgatcg tgctggccga 54840 cgaggacgcc gtacgcgacc ccgcctcgat cacctccctg tgcgcacgcc accacgtcac 54900 cgtcgtccag gccacgccca gttggtggcg ggccatgctc gacggagcac cggccgacgc 54960 cgccgcccgg ctcgagcacg tacggatcct ggtcggcggc gaaccgctgc ccgccgacct 55020 ggcccgtgtc ctgaccgcaa ccggcgccgc cgtcaccaac gtgtacggac ccaccgaagc 55080 caccatctgg gccaccgccg ccccactcac cgccggcgac gaccgcacac ccggcatcgg 55140 cacccccctg gacaactggc gcgtccacat actcgacgcg gccctcggac ccgttccccc 55200 gggtgttccg ggcgagatcc acatcgccgg gtccgggctc gcccgcggct atctgcgccg 55260 cccggacctc accgccgaac gcttcgtcgc caacccgttc gcccccggcg agcggatgta 55320 ccgcaccggc gacctcggcc ggttccgccc ggacggcacg ctcgaacacc tcggccgcgt 55380 ggacgaccag gtcaaggtac ggggcttccg catcgaactc ggcgacgtcg aggccgccct 55440 cgcccggcat cccgacgtgg ggcgcgccgc cgccgccgtc cgccccgacc accgcggcca 55500 gggccgcctt gtcgcgtacg tcgtcccccg tcccggcacc cggggaccgg acgccggcga 55560 actgcgcgag acggtacgcg aacttctgcc tgactacatg gtcccctccg cccaggtgac 55620 tctcaccacc ctgcctcaca ccccgaacgg caaactcgac cgcgccgcgc tgcccgcccc 55680 cgtgttcggc acccctgccg gacgcgcccc cgccacccgc gaggaaaaga tcctcgccgg 55740 gctcttcgcg gacatcctgg gcctgcccga cgtgggagcc gacagcggct tcttcgacct 55800 cggcggcgac agcgtgctgt ccatccagct cgtgagccgc gcccggaggg aaggactgca 55860 catcaccgta cgagacgtgt tcgagcacgg gacggtcggc gcactcgccg ccgcggccct 55920 tccggcaccg gccgacgacg cggacgacac cgtccccggc acggacgtac tgccttcgat 55980 cagcgacgac gaattcgagg agttcgagct ggagctcgga ctcgaggggg aggaagagca 56040 gtggtgaacc gccggtcgaa ggtagtcgag gagatcctgc ctgtctcggc gctccaggaa 56100 ggactgctgt tccacagctc cttcgccgcc gccgacggag tcgacgtgta cgcgggacag 56160 ctcgcgttcg acctggtcgg cgcggtggac accggtcggc tgcgggccgc cgtcgaaagc 56220 ctcgtggcgc ggcacggcgt cctgcgctca agctaccgtc aggcgcgctc cggggagtgg 56280 gtcgcggtcg tggcgcggcg cgtcgcgacg ccatggcgcg ccgtcgacgc ccgcgacggt 56340 gccacggacg ctgccgccgt ggcccgggag gaacgctggc gcccgttcga cctgggccgg 56400 gccccgctgg ctcggttcgt gctcgtacgg accgacgacg accgtttccg gttcgtgatc 56460 acgtaccacc acgtcatcct cgacggctgg tcgctgccgg tactgctgcg cgaactcctt 56520 gccctgtacg gaagcggcgc cgacccgtcg gtgctgccgc ccgtccgccc ctacggcgac 56580 tttctccggt gggccgccgc gcgcgacgac gccgccgccg aaaccgcctg gcgcgacgcg 56640 ctcaccggcc tggacgagcc ctccctggtc gcacccggcg cttcccccga cggcgtcgtg 56700 ccggcctccg tccacgccga actcgacaag gccggcaccg agaacctcgc cgcctgggcc 56760 aggcaccgcg gcatcaccca ggccaccgcc gtccgcgccg cgtgggccct cgttctcggc 56820 cagcacaccg gccgcgacga cgtcgtgttc ggcgtcaccg tctccggacg gcccgccgaa 56880 ctcgccggcg ccgagcacat ggtcggactc ttcatcaaca ccgtccccct gcgcacggtc 56940 ctcgaccccg ccgacaccct cggcacgttc gccgctcgcc tccaggccga acagaccacc 57000 ctcctcgaac accagcacgt gcggctctcc gacatccagc gctgggccgg acacaaagaa 57060 ctcttcgaca ccattgtcgt cttcgagaac taccccatcg gccacagcgg ccccggctcc 57120 atccgcaccg acgacttcac cgtcaccgcc accgaaggct ccgacgccac ccactacccc 57180 ctcaccctca ccgccgtacc cggcgaaacc ctgcgcctca agctcgacca ccgccccgac 57240 ctcgtcgaca ccaccaccgc caccgccctg ctgcgccgcg tgacccgcgt cctggaaacc 57300 gccaccgacg acaccgggca caccctcgcc cgcctcgacc tcctcgacga cgacgaacgc 57360 caccgcctgc tgcgcggctg gaacgacacc acgcgcgagc agccgcccac ctactaccac 57420 caggaattcg aggaacaggc gcggaggcgg ccccacgaca cggcccttgt cttcaccagc 57480 acctcctgga cgtacgaaga actcaacgac cgcgccaacc ggctcgcccg cctgctcgtc 57540 gccgccggcg ccggctccga cgacttcgtc gcgctcgcct tcccccgttc cgcggaatcc 57600 gtcgtcgcca tcctcgccgt actcaaagcg ggcgccgcct acctgccgct cgacatggac 57660 cagcccgccg aacggctcac cggcatcctc gccgacgcac acccgaccgt cgtcctcacg 57720 accaccaccg ccaccccgct gccgcacccc ggccgcaccc tcgtcctcga cagccccacc 57780 accgcccgcg ccctcgctgc ggcacccgca cacaacctca ccgacgccga ccgccgtacc 57840 ccgctcaacg cccgcaacgc cgcctacatc atccacacct ccggctccac cggacgcccc 57900 aagggcgtcg tcatcgaaca ccgcagtctc gccaacctct tccacgacca tcggcgcgcc 57960 ctcatagaac cccatgccgc cggaggatca cggctcaagg ccggcctcac cgcctccctc 58020 tccttcgaca cctcctggga aggtctgatc tgcctggccg ccggccacga actgcacctt 58080 attgacgacg acacccgccg agacgccgaa cgcgtcgccg aactcatcga ccggcagcgc 58140 atcgacgtca tcgacgtcac cccctccttc gcccagcaac tcgtagagac cggaatcctc 58200 gacgagggcc gccaccaccc cgccgccttc atgctcggcg gtgaaggcgt cgacgcgaaa 58260 ctctggacca ggctctccga cgtccccggc gtcacctcgt acaactacta cggccccacc 58320 gaattcaccg tcgacgccct cgcctgcacg gtcggcatcg caccccgccc cgtcatcggc 58380 caccccctcg acaacacggc cgcctacatc ctcgacggct tcctgcgtcc cgtacccgaa 58440 ggcgtcgccg gcgagctcta cctcgccggc acccagctcg cccgcggcta cgccggccgg 58500 cccggcctga cggccgaacg cttcgtggcc tgccccttcg gcgcgccggg cgaacgcatg 58560 taccgcaccg gcgacctcgt ccggcgcagt cccggcggcg tggtcgaata cctcggacgc 58620 gtggacgatc agatcaaact ccgcggcttc cgcatcgaac ccgccgagat cgagctcgcc 58680 ctggccggcc accccgccgt cgcccagaac gtcgtcctcc tgcaccgctc cgccaccgga 58740 gaggctcgcc tcgtggcgta cgtcgtcccc ggcacacccg tcgacccgcg ggaactcacc 58800 gggcacctcg ccgcccggct gcccgcgtac atggtgccct cggctttcgt tctcctcgac 58860 accctcccgc tcacccccaa cggcaaactg gaccgcggcg ccctgccgga gcccgccttc 58920 ggtaccgcgc cccgccccga gcgcccccgc acacccgtcg aggagatcct ctgcggcctg 58980 tacgccgacg tgctcgggct tccctcgttc ggcgccgacg acgacttctt cgacgccggc 59040 gggcactcgc tgctggccag caaactcgtc agccgtatcc gtacgaacct gaaaaccgaa 59100 ctcaacgtcc gcgccctctt cgagcaccgc acggtctcct ccctggccac cgccctccac 59160 cgggccgcgc aggccggccc cgcgctcacc gccggaccgc gccccgcacg gatcccgctg 59220 tcgtacgccc agcgccgcct gtggttcctc aaccggctcg accgcgacag cgccgcgtac 59280 aacatgcccg tcgcactccg cctgcgtggc cccctggaca gcaccgccat gtgcgccgca 59340 ctcaccgacg tcgccgaacg ccacgaggcg ctgcgcaccg tgttcgagga ggaccgggac 59400 ggtgcccacc agatcgtgct gcccgcgacc ggcctcggcc ctctgctcac cgtgaccggg 59460 gccgacggga cgaccctgcg tgccctcatc accgagttcg tacgcaggcc cttcgacctg 59520 gcggcggaga tccccttccg cgccgcactg ttccgcgtcg gcgacgagga acatgtactg 59580 gtcgtcgtcc tgcaccacat cgccggggac ggctggtcca tgggaccgct cgcacgcgac 59640 gtggccgagg cctaccgggc gcgggcggcc gggagggcac ccgactggga accgctgccc 59700 gtgcagtacg ccgactacgc gctctggcag cgggaggtgc tgggcgcgga ggacgacgag 59760 accggcgaac tctccgccca actcgcccac tggcgcaccc gcctcgcagg ggcccccgca 59820 gaactcacgc tgcccaccga ccgcccacgc cccgctgtcg cctccaccgc cggagaccgc 59880 gtcgaattca ccgtgcccgc cggactccac caggccctcg ccgacctggc acgggcccac 59940 ggcgcgacgg tcttcatggt cgtccaggcc gccctcgccg tcctgctgtc acgtctcggc 60000 gccggcgacg acatccccat cggcaccccg gtcgccggcc gcaccgacga ggccacggag 60060 gaactgatcg ggttcttcgt caacacgctg gtgctgcgca ccgacgtgtc cggcgacccg 60120 acgttcgccg aactcctcgc gcgggtgcgg gccaccgacc tcgacgcgta cgcacaccag 60180 gacgtgccat tcgaacgtct ggtcgaggtg ttgaacccgg agcggtcact ggcacggcat 60240 ccactgttcc aggtcatgct gacgttcaac gtcccggaca tggacggggt cggaagcgcg 60300 ctggggaatc tgggggaact ggaggtctcc ggtgaggcca tccggacgga tcagaccaag 60360 gtggatctcg ctttcacgtg cacggagatg tacgccgcgg acggtgcggc ctcgggaatg 60420 cgcggggtgc tggaataccg gcttgatgtg ttcggtgcgg tacaggcccg ggaaacgacg 60480 gagcggttgg tgcgggtgtt ggagggtgtg gtttctggtg ggggtggggt gtctgtgtcg 60540 ggggttgatg tgttgggtgt gggtgagcgg gagaggttgt tggggtgggg tgtgggtggg 60600 ccggtgcctg tggtgccggg tggtgggttg gtggggttgt tcgaggagcg ggtgcgggcc 60660 gacgcggacg cggtggccgt gcgtggcgcg ggggtggtgt ggagttatgg ggagttgaat 60720 gcgcgggtga atgtggtggc gcggtggttg gtgggtcggg gtgtgggggc ggagtgtggt 60780 gtgggtgtgg tgatgggccg cggggtggat gtggtggtga tgttgctggc ggtggcgaag 60840 gcgggtgggt tttatgtgcc ggtggatccg gagtggccgg tggagcgggt ggggtgggtg 60900 ctggcggatg ccggggtggg gctggttgtg gtgggggagg ggttgtcgca tgtggtgggg 60960 gattttcctg ggggtgaggt tttcgagttt tcgcgggttg ttcgtgagtc gtgtcttgtg 61020 gagttggtgg ctgcggatgg ggttgaggtt cggaatgtga cggatggtga gcgggcgtcg 61080 cgtctgttgc cggggcatcc gttgtatgtg gtttatacgt cgggttcgac ggggcggccg 61140 aagggtgttg tggtgacgca tgcttcggtg ggtgggtatt tggcgcgtgg tcgggatgtg 61200 tatgcgggtg ccgttggtgg tgtggggttt gtgcattcgt cgcttgcgtt cgatctgacg 61260 gtgacggttc tgttcacgcc tttggtgtct ggcggttgtg ttgtgttggg tgagttggac 61320 gagtcggcgc agggggtggg tgcctcgttc gtgaaggtga ctccgtcgca tctgggtttg 61380 ctgggtgagc tggagggtgt ggtggcgggg aacggcatgc tgctggtggg gggtgaggcg 61440 ttgtcgggtg gtgcgctgcg tgagtggcgt gagcgtaatc cgggtgtggt ggtggtgaat 61500 gcttatggtc cgacggagct gacggtgaac tgtgccgagt tccttatcgc gcctggtgag 61560 gaggttccgg atgggcctgt gccgatcggg cgtcctttcg cgggtcagcg gatgtttgtt 61620 ctggatgcgg cgctgcgggt ggtgccggtc ggtgtggtgg gtgagttgta tgtggcgggt 61680 gtgggtctgg cgcggggcta tctcgggcgt gcgggtctga cggcggagcg gttcgtggcc 61740 tgccccttcg gtgcgccggg tgagcgtatg taccgtacgg gggatctggt gcggtggcgg 61800 gtggacggcg cgcttgagtt tgttggtcgt gcggatgatc aggtgaaggt ccgtggtttc 61860 cgtgtggagt tgggtgaggt ggagggtgct gttgcggcgc atcctgatgt ggtgcgtgcg 61920 gttgttgtgg tgcgtgagga ccggccgggt gatcaccggt tggttgcgta tgtcaccggt 61980 gttgacacgg gtggactgtc ctctgcggtg atgcgtgccg ttgctgagcg tctgcctgcg 62040 tacatggtgc cgtcggcggt ggtggttctg gatgagatcc cgttgacgcc gaatgggaag 62100 gtggaccggg cggcgcttcc ggtgccgggg gtggaggcgg gcgcgggcta ccgggcgcct 62160 gtttcgccgc gggaggaggt gttgtgtggt ctgttcgcgg aggtgctggg gctggagcgg 62220 gtgggggtgg acgatgattt cttcgggttg ggtggtcatt ctcttctggc gactcgtctg 62280 atttcgcgtg tccgtgcggt gttgggtgtt gaggcgggtg tgcgggcgtt gttcgaggcg 62340 ccgacggtga gccgtttgga gcggttgctg cgggagcggt cggctttggg ggtgcgggtg 62400 cctctggtgg cacgggagcg gacgggtcgg gagccgttgt cgttcgctca gcagcgtctg 62460 tggttccttg aggaactgga agggcccggt gctgcgtaca acattccgat ggcgctgcgt 62520 ctggccggtg ttctggacgt cgaagcgctg caccaggcgc tcattgatgt catcgcccgc 62580 cacgaaagcc tccgcaccct catcgcgcag gatgcgggta ctgcctggca gcacatcctg 62640 cccgttgacg accctcgcac ccgtcccggt ctccctcttg tggacatcgg tgccgacgcc 62700 cttcaggagc ggctcgacga agccgccggc cggcccttcg atctcgcggc cgatctcccg 62760 gtccgggcca cagtcttccg cctcaccgac aacgaccaca tcctcctggt cgtggcccat 62820 cacgtggcct tcgacgcgat gtcccgtgtg ccgttcatcc ggaacgtcaa gcgcgccttc 62880 gaggcccgta cgaacggcgc ggcccccgac tggaggccgc tgcccgtgca gtacgcggat 62940 tatgcggcct ggcagcgcga cgtactcggc acggaggacg acgagtcgag cgagctgtcg 63000 gcccagctcg cctactggcg cacccaacta gcctcactac cggccgagtt ggcgctcccg 63060 acggaccggg cccggcccgc cgtcgcctcg tacgaaggcg gcaaggtcga gttcaccgtc 63120 cccgccgggg tgtatgacgg cctggtggct ctcgcccgtg ccgagggtgt cacggtcttc 63180 atggtcgtgc aggcggcgct ggccgcgctc ctctcccggc tcggcgccgg cgacgacatc 63240 cccatcggca ccccgatcgc cggccgcacc gaccaggcca ccgaagatct catcggcttc 63300 ttcgtgaaca ccctcgtcct gcgcaccgac gtgtccggcg acccgacgtt cgccgaactc 63360 ctcgcgcgcg tccgggccac cgacctcgac gcctacgccc accaggacat ccccttcgaa 63420 cgactggtcg aagcggtcaa ccccgagcgc tccctcgccc gccaccccct cttccaggtc 63480 atgctgacct tcgacaacac gattgaccgt gaggtcacgg agggcttcgc gggcctcggg 63540 gtggaaggcc tgccgctggg tgcgggagcg gtcaaattcg atctgctctt cggtctctcc 63600 gaggtgggcg gcgagctgcg cggagccgtg gagtaccgct gcgatctctt cgaccacccg 63660 acggtggcgc agctcgcgga gcgcctggtg cgggtactgg agcgcgtggc ttccgacgct 63720 tcggtacgca cgggtgaact gccggtcgtc ggcgaggcgg agcgcgcccg tgtcctgacg 63780 gagtggaatg acacgggcgt ccccggtgtg ccggaaacat tcctggagtt gttcgaggcg 63840 caggtcgcgg cccggggtga cgcgccggcg gtcgtgtacg agggtgaggt tctgtcgtac 63900 cgggaactcg acgcgcgggc gaaccgcctg gccgggctgc tggtggggcg cggtgcgggc 63960 ccggagcatt tcgtgggggt ggcgctgccg cgtgggctgg atctgatcgt ggccctgctg 64020 gccgtgctca agtccggtgc cgcgtacgtt cccctggacc cggagtaccc ggccgagcgg 64080 ctggtccaca tggtcaccga cgccgccccc gtcgtggtcg tgacctccac cgacgtacgt 64140 actctgcgga ccgttccccg ggtcgagctg gacgacgagg cgacccgcgc caccctggtc 64200 gcagcccccg ccacagggcc cgacgtgaag atgtccgcct cccaccccgc gtacgtgatc 64260 tacacctccg ggtccacggg ccgccccaag ggcgtcgtca tcagccacgg cagcctggcc 64320 aacttcctcg cctgggcgcg ggaagacctg ggtgccgagc ggctccggca cgtcgtgttg 64380 tccacgtccc tcagcttcga cgtctccgtg gtcgaactct tcgccccgct gtcctgcggc 64440 ggcaccgtcg agatcgtccg gaatctgctg gccctcgtcg accgccccgg ccgatggtcc 64500 gcgagcctgg tcagcggcgt gccgtcggcc ttcgcgcagc tgctggaagc cggcctcgac 64560 cgggccgacg tgggcatgat cgccctggcc ggcgaggcgc tgtccgctcg cgacgtgcgc 64620 cgcgtccgcg ctgtgctgcc cggggcccgc gtggccaact tctacggccc gaccgaagcc 64680 accgtctacg ccacggcctg gtacggcgac acccccatgg acgccgcggc ccccatgggc 64740 cggcccctgc gcaacacgtg tgtgtatgtg ctggacgacg ggctgcgcgt ggtgccggtc 64800 ggtgtggtgg gtgagctgta tgtggcgggt gtgggtctgg cgcggggcta tctcgggcgt 64860 gtgggtctga cggcggagcg gtttgtggcg tgtccgttcg gtgcgcgggg tgagcgtatg 64920 tatcgcacgg gggatttggt gcggtggcgg gtggacggca cgcttgagtt tgttggtcgt 64980 gcggatgatc aggtgaaggt ccgtggtttc cgtgtggagt tgggtgaggt ggagggtgct 65040 gttgcggcgc atcctgatgt ggtgcgtgcg gttgttgtgg tgcgtgagga ccggccgggt 65100 gatcaccggt tggttgcgta tgtcaccggt gttgacacgg gtggactgtc ctctgcggtg 65160 atgcgtgccg ttgctgagcg tctgcctgcg tacatggtgc cgtcggcggt ggtggttctg 65220 gatgagatcc cgttgacgcc gaacgggaag gtggaccggg cgggtcttcc ggtgccggtg 65280 gtgtcggtgg cggggttctg tgcgccgtcg tcgccgcggg aggaggtgtt gtgtggtctg 65340 ttcgcggagg tgctgggtgt tgagcgggtg ggggtggacg atgggttctt cgatctgggc 65400 ggggacagca ttctgtcgat tcagttggtg gcgcgggctc gtcgggcggg tctggagttg 65460 tcggttcggg atgttttcga gggccgtacg gtacgtgctc tggcggctgt ggtgcgtggt 65520 tcggacgctg gggcggttgg tgtggtgggg ggtgctgaga ttgtgctgcc gggtgtgggt 65580 gaggtggagc ggtggccggt ggtggagtgg ctggcggagc gtggtggggg gtcgctgggt 65640 ggtgtggttc ggggtttcaa tcagtctgtt gtgcttgctg tgcctgctgg gttggtgtgg 65700 gaggagttgc gggtgttgtt gggtgcggtg cgggatcggc atgaggcgtg gcggttgcgg 65760 gtgctggatt ccggggcgtt gtgtgttgat ggtgttgttc cggatgacgg gtcgtggatt 65820 gtccggtgtg acctgagcgg tatgggtgtg gatggtcagg tggatgctgt gcgggctgcg 65880 gctgtggagg cgcgtgcgtg gctggatccg tcggtgggcc gggtggtgcg ggcggtgtgg 65940 ctggagcgtg gtggtgatcg ttcgggggtg ttggtgctgg tggcgcatca cctggtggtg 66000 gacggtgtgt cgtggcgggt ggtgctgggg gatctggcgg aggggtgggc gcaggtgcgt 66060 tcgggtggcc gtgtggagtt gggtgtggtg gggacgtcgt tgcggggttg ggcggcggcg 66120 ttggcggagc agggccggcg gggcgagcgt gcgggggagg tggagttgtg gtcgcggatg 66180 gttcggggtg cggatgttct ggtggggtcg cgtgctgtgg atggtgcggt ggatgttttc 66240 ggcggggtgg tgtcggttga ttcgcgggcg tcggtgtcgg tgtcgcgtgc gttgctgacg 66300 gaggtgccgt cggttctggg tgttggtgtg caggaggtgt tgctggcggc attcgggctg 66360 gcggtcgcgc ggtggcgcgg ccggggtggg ccggttgtgg tggatgttga ggggcacggg 66420 cgtaatgagg acgctgtgcg gggtgctgat ctgtctcgta ctgtcggttg gttcaccagt 66480 gtgtatccgg tccgtgtgcc ggtggagtcc gcttcgtggg acgaggtgcg tgcgggtggt 66540 ccggtggtgg gccgtgtggt gcgtgaggtg aaggagactc tgcgttcgct gcctgaccag 66600 ggtctgggtt atggcatcct gcgctatctc gatcccgagc acggtcctgc tctggcccgg 66660 catgccaccc cgcagttcgg tttcaactac ctcggccgct tcaccaccgg aaccgacgac 66720 accggtgacg aggggatgac ggactgggtc cccgtgtcag ggccgttcgc ggtgggagcc 66780 ggccaggacc ccgaactgcc cgtggcgcac gcggtcgagt tcaacgcgat cacgctggac 66840 accccggagg gcccgcgcct gggcgtgaca tggtcgtggc cgacgacgct gctgccggag 66900 tcccggatac gggagctggc ccgctactgg gacgaggccc tggaagggct ggtcgaacac 66960 gcccggcacc ccgaagccgg cggcctcacg ccgtccgacg tgacgctggt ggaagtgaac 67020 caggtggagc tcgaccgtct gcaggcgggg gtcgccggtg gtgcggagga gattctgccg 67080 gtgtcggccc tgcaagaggg gctgctgttc cacagcgcgt tggcctctgg tggggtggac 67140 gtgtatgtgg ggcagctggt gttcgatctg gtcggtccgg tggacgtcga ccggctgcgc 67200 gcggctgtcg aaggtctggt ggcgcggcac ggggtgctgc ggtcgggata ccgccaactg 67260 cggtcgggcg aatgggttgc ggtcgtcgca cgacaggtgg atctgccgtg gcagtccatc 67320 gacgtgcgcg acggcggtat cgacgggttg gtggaagagg agcgctggcg ccggttcgac 67380 atgggccggg gtccactggc gcgcttcgtg ctcatccgga cgcacgacga tcgtttccgg 67440 ttcgtcatca cgtaccacca cgtcgtcctc gacggctggt ccgtcccggt gctgctgcgt 67500 gagctgctgg ccctgtacgg cagctcgggg gacgtatcgg ttctgccggg ggtccgctcg 67560 tacggcgatt tcctgcgatg ggtcgccgcg cgagacgccg cagccgccga aggcgcatgg 67620 cggcgggcgc tgacgggcct ggaggagccg tcgctcgtcg cgccaggcgt ttcccgagac 67680 ggggtcgtcc cggcggcgtt ccacggtgcg gtcgacggcg acctctcgca gaagatcgtg 67740 gcgtgggcgc gcgggcgtgg tgtgacggtt gcgtcggtgg tacaggcggc gtgggccttg 67800 gtgctggggc ggttgatggg tcgggacgat gtggtgttcg gggtgacggt gtcgggtcgg 67860 cctgccgagg tggtgggtgt ggaggacatg gtcggtctgt tcgtgaacac cattccgttg 67920 cgggcgcggc tggatccggc ggagtcgctg ggtggtttcg tggagcggct gcagcgggag 67980 cagacggagc tgctggagca tcagcatgtc cggctggcgg aagtccagcg gtgggccggg 68040 cacaaggaac tcttcgatgt cggaatggtc ttcgacaact acccggtttc ttctgaatcc 68100 ccggaagcgg aattccagat ctcacgaaca ggcggataca acggaaccca ctacgcactg 68160 aacctcgttg cttccatgca cggcctggag ctggaactgg aaatcggtta tcggccggat 68220 gtgtttgatg cgggtcgggt gcgtgaggtg tggggatggt tggtgcgggt gttggagggt 68280 gtggtttctg gtgggggtgg ggtgtctgtg tcgggggttg atgtgttggg tgtgggtgag 68340 cgggagaggt tgttggggtg gggtgtgggt gggccggtgc ctgtggtgcc gggtggtggg 68400 ttggtggggt tgttcgagga gcgggtgcgg gccgacgcgg acgcggtggc cgtgcgtggc 68460 gcgggggtgg tgtggagtta tggggagttg aatgcgcggg tgaatgtggt ggcgcggtgg 68520 ttggtgggtc ggggtgtggg ggcggagtgt ggtgtgggtg tggtgatggg ccgcggggtg 68580 gatgtggtgg tgatgttgct ggcggtggcg aaggcgggtg ggttttatgt gccggtggat 68640 ccggagtggc cggtggagcg ggtggggtgg gtgctggcgg atgccggggt ggggctggtt 68700 gtggtggggg aggggttgtc gcatgtggtg ggggattttc ctgggggtga ggttttcgag 68760 ttttcgcggg ttgttcgtga gtcgtgtctt gtggagttgg tggctgcgga tggggttgag 68820 gttcggaatg tgacggatgg tgagcgggcg tcgcgtctgt tgccggggca tccgttgtat 68880 gtggtttata cgtcgggttc gacggggcgg ccgaagggtg ttgtggtgac gcatgcttcg 68940 gtgggtgggt atttggcgcg tggtcgggat gtgtatgcgg gtgccgttgg tggtgtgggg 69000 tttgtgcatt cgtcgcttgc gttcgatctg acggtgacgg ttctgttcac gcctttggtg 69060 tctggcggtt gtgttgtgtt gggtgagttg gacgagtcgg cgcagggggt gggtgcctcg 69120 ttcgtgaagg tgactccgtc gcatctgggt ttgctgggtg agctggaggg tgtggtggcg 69180 gggaacggca tgctgctggt ggggggtgag gcgttgtcgg gtggtgcgct gcgtgagtgg 69240 cgtgagcgta atccgggtgt ggtggtggtg aatgcttatg gtccgacgga gctgacggtg 69300 aactgtgccg agttccttat cgcgcctggt gaggaggttc cggatgggcc tgtgccgatc 69360 gggcgtcctt tcgcgggtca gcggatgttt gttctggatg cggcgctgcg ggtggtgccg 69420 gtcggtgtgg tgggtgagtt gtatgtggcg ggtgtgggtc tggcgcgggg ctatctcggg 69480 cgtgtgggtc tgacggcgga gcggtttgtg gcgtgtccgt tcggtgtgcc gggtgagcgt 69540 atgtatcgca cgggggattt ggtgcggtgg cgggtggacg gcgcgcttga gttcgttggc 69600 cgtgcggatg atcaggtgaa ggtccgtggt ttccgtgtgg agttgggtga ggtggagggt 69660 gctgttgcgg cgcatcctga tgtggtgcgt gcggttgttg tggtgcgtga ggaccggccg 69720 ggtgatcacc ggttggtggc ttacgtgact gcgggtggtg ttggtgggga tggtcttcgt 69780 tccgcgatct ctggtttggt ggctgagcgt ctgcctgcgt acatggtgcc gtcggcggtg 69840 gtggttctgg atgagatccc gttgacgccg aacgggaagg tggaccgggc ggcgcttccg 69900 gtgccggagg tggaggcggg cacgggctac cgggcgcctg tttcgccgcg ggaggaggtg 69960 ttgtgtggtc tgttcgcgga ggtgctgggt gttgagcggg tgggggtgga cgatgacttc 70020 ttcgagttgg gtggtcattc tcttctggcg actcgtctga tttcgcgtgt ccgtgcggtg 70080 ttgggtgttg aggcgggtgt gcgggcgttg ttcgaggcgc cgacggtgag ccgtctggag 70140 cggttgctcc gggagcggtc gggtttgggg gtgcgggtgc ctctggtggc acgggagcgg 70200 acgggtcggg agccgttgtc gttcgctcag cagcgtctgt ggttccttga ggaactcgaa 70260 gggcccggtg ctgcgtacaa cattccgatg gcgctgcgtc tggccggtgt tctggacgtc 70320 gaagcgctgc accaggcgct cattgatgtc atcgcccgcc atgaaagcct ccgcaccctc 70380 atcgcgcagg atgcgggtac tgcctggcag cacatcctgc ccgttgacga ccctcgcacc 70440 cgtcccggtc tccctcttgt ggacatcggt gccgacgccc ttcaggagcg gctcgacgaa 70500 gccgccggcc ggcccttcga cctcgcggcc gatctcccgg tccgggccac agtcttccgc 70560 ctcaccgaca acgaccacat cctcctgctg gtcctgcacc acatcgccgg cgacggctgg 70620 tcgatgggcc cgctcgcccg cgatctctcc acggcgtaca gcgcacgcgc cgcaggagcc 70680 gcctcggcct ggcggcccct ctccgtgcag tacgcggatt atgcggcctg gcagcgcgac 70740 gtactcggca cggaggacga cgagtcgagc gagctgtcgg cccagctcgc ctactggcgc 70800 acccaactag cgtcactccc agccgagttg gcgctcccga cggaccgggc ccggcccgcc 70860 gtcgccacct accggggcgg acgcatcgag ttcaccatcc ccgccgacgt ccaccgcagc 70920 ctcgccgacc tcgcccgtgc cgagggtgtc acggtcttca tggtcgtgca ggcggcgctg 70980 gccgcgctcc tctcccggct cggcgccggc gacgacatcc ccatcggcac cccgatcgcc 71040 ggccgcaccg accaggccac cgaagatctc atcggcttct tcgtgaacac cctcgtcctg 71100 cgcaccgacg tctccggcga cccgacgttc gccgaactcc tcgcgcgcgt ccgggccacc 71160 gacctcgacg cctacgccca ccaggacatc cccttcgaac gactggtcga agcggtcaac 71220 cccgagcgct ccctcgcccg ccaccccctc ttccaggtca tgctcgcctt caacaacgcc 71280 gagacgagca ccccgctgcc catggccgaa ggcctggctg cctcccggca ggacatcgaa 71340 ccgggcgtgg cgaaattcga tctggccctg tattgcaacg aatcccgcgg tgagacgggc 71400 gaccaccagg gcatcagaag tgtcttcgag taccgccgcg acctgtggga cgaggacacc 71460 gtgcggcagc tcgccgaccg gttcctgcat gttctcgctg cttttgcggc agccccggag 71520 caacgtgcga gcagcgtcga cgtgctccgg gcgggcgagc gcgaccaact gctgcacgag 71580 tggaacgaca cggctgccgc tctccccccg gcactgctgc cccagctgtt cgaggagcag 71640 gtgcggcgca ccccgcacga tgtcgctctc gtctcgggga acatccggct cacgtacgcg 71700 gagctggacg cgcgcgcgaa ccgcctggcc cacttgctgc tcgcccgggg cgcggccccc 71760 gagacgttcg tcgcggtggc cctgccccgg accgaagagc tcctggtggc cctgctggcc 71820 gtacagaaaa caggtgccgg acatctgccg ctggatcccg gcttcccggc cgagcggctc 71880 agctacatgc tggatgacgc ccgccctgcg gtggtcctca ccacggagga catcagcgcc 71940 cgcatacccg gcggaagcca tgtggtactc gactccgagc aggtgaccgg cgagctccac 72000 gaccacccgg ccacgtcccc cgccggccgg ggcaaccccg ccggcccggc gtacgtgatc 72060 tacacctccg gatccaccgg ccagcccaag ggcgtcgtcg taccgtcggc cgccctggtg 72120 aacttcctgg ccgacatggt gcccaggctc gggctccgcg gtggcgaccg cctgctgtcc 72180 gtgaccaccg tgggcttcga catcgcggcc ctcgagctct tcgtcccgct actgagcggc 72240 gccaccgtcg tcctcgcgga cggggagacg gtccgcgacc cggcgctggc ccgccagacg 72300 tgcgaggacc acggcgtcac catggtccag gcgacaccga gctggtggca cggcatgctc 72360 gccgacgcgg gcgacagcct gcgcggcgtg cacgccgtcg tgggcggtga ggccctgagc 72420 cccgggttgc gcgacgcgct gacacgaggc gcgcggtccg tcacgaacat gtacggcccg 72480 acggagacga ccatctggtc caccagcgcc gggcaggccg ccggggacag cgctccccct 72540 tcgatcggca cacccatcct caacactcgc gtgtatgtgc tcgacgctgc tttgtgtgtc 72600 gtgccaccgg gcgtcgcagg cgagctgtac atcgcgggcg acggcctcgc gcggggctat 72660 ctcgggcgtg cgggtctgac ggcggagcgg ttcgtggcct gccccttcgg tgcgccgggt 72720 gagcgtatgt accgtacggg ggatctggtg cggtggcggg tggacggcgc gcttgagttt 72780 gttggtcgtg cggatgatca ggtgaaggtc cgtggtttcc gtgtggagtt gggtgaggtg 72840 gagggtgctg ttgcggcgca tcctgatgtg gtgcgtgcgg ttgttgtggt gcgtgaggac 72900 cggccgggtg atcaccggtt ggttgcgtat gtcaccggtg ttgacacggg tggactgtcc 72960 tctgcggtga tgcgtgccgt tgctgagcgt ctgcctgcgt acatggtgcc gtcggcggtg 73020 gtggttctgg atgagatccc gttgacgccg aatgggaagg tggaccgggc ggcgcttccg 73080 gtgccggggg tggaggcggg cgcgggctac cgggcgcctg tttcgccgcg ggaggaggtg 73140 ttgtgtggtc tgttcgcgga ggtgctgggt gttgagcggg tgggggtgga cgatgatttc 73200 ttcgggttgg gtggtcattc tcttctggcg actcgtctga tttcgcgtgt ccgtgcggtg 73260 ttgggtgttg aggcgggtgt gcgggcgttg ttcgaggcgc cgacggtgag ccgtttggag 73320 cggttgctgc gggagcggtc gggtttgggg gtgcgggtgc ctctggtggc acgggagcgg 73380 acgggtcggg agccgttgtc gttcgctcag cagcgtctgt ggttccttga ggaactggaa 73440 gggcccggtg ctgcgtacaa cattccgatg gcgctgcgtc tggccggtgt tctggacgtc 73500 gaagcgctgc accaggcgct cattgatgtc atcgcccgcc acgaaagcct ccgcaccctc 73560 atcgcccgcg acagtgacgg cacggcccgg cagcaggtgc tgcccgtcgg tgaccccgcc 73620 gcgcgaccgg ctcttccggt cgtacagacc gacgccgaca ccctcgtcgc gaaactgaac 73680 gaggccgtcg gccgcccctt cgacctcacg gccgagatgc ccctgcgtgc caccgtcttc 73740 cgggtggccg acgaggacca cgcgctgctg ctggtgttcc accacatcgc cggcgacggc 73800 tggtcgacgg gcctgctcgc ccgcgacctg tccaccgcgt acgcagccag gctcgaaggc 73860 cgggaccccc aactgccacc cctccccgtg cagtacgcgg actacgcggc ctggcagcgc 73920 gacgtactcg gcacggagga cgacgagtcg agcgagctgt cggcccagct cgcctactgg 73980 cgcacccaac ttgccgacct cccagccgag ttggccctcc cggcggaccg ggtccggccc 74040 gccagggcct cgtacgaagg aggccgggtc ggcttcaccg tccccgccgg ggtcctccgc 74100 gacctcacgc gcctggcccg tgtcgagggt gtcacggtct tcatggtcgt gcaggcggcg 74160 ctggccgcgc tcctctcccg gctcggcgcc ggcgacgaca tccccatcgg caccccgatc 74220 gccggccgca ccgaccaggc caccgaagat ctcatcggct tcttcgtgaa caccctcgtc 74280 ctgcgcaccg acgtctccgg cgacccgacg ttcgccgaac tcctcgcgcg cgtccgggcc 74340 accgacctcg acgcctacgc ccaccaggac atccccttcg aacgactggt cgaagcggtc 74400 aaccccgagc gctccctcgc ccgccacccc ctcttccagg tcatgctcgc cttcgacaac 74460 acggccgacg gaggccccgt agaagacttc cccggactgt ccgcagccgg gctgccgttg 74520 ggtgcgggcg cggcgaagtt cgatctgctc ttcggtctct ccgaggtggg cggcgagctg 74580 cgcggagccg tggagtaccg ctgcgatctc ttcgaccacc cgacggccgc acggatcgcg 74640 gagcgcctgg tgcgggtgct ggagcgggtc gccgccgacg cgtcggtacg cctgggcgag 74700 ctgcccgtgg tgagcgacgc cgagcgggcc tgcgtcctga cggagtggaa cgacaccgcc 74760 gtccccggcg tgacgggaac gctgtcggcg ctgttcgagg cacgggccgc agcccggggc 74820 gacgcgccgg cggtcgtgta cgagggtgaa gaactgtcgt accgtgaact gaacacacgc 74880 gccaaccgcc tcgcccatgt cctggccgag cacggcgcag gccccgagcg gttcgtcggt 74940 gtggccctgc cccgcagtcc ggacctcgta gtggcactgc tggcggtcgt gaaatcgggc 75000 gcggcctacg taccgctcga ccccgagtac ccggccgacc ggctcgcgta catggccggc 75060 gacgctgccc ccgtggcggt cctgacccgc ggggacgtcg aactccccgg gtccgtcccg 75120 cggatcgggc tggacgacac agagatccgc gcgacactcg ccaccgcccc cggcacgaac 75180 cccggcacgc cggtgaccga ggcccacccc gcgtacatga tctacacctc cggatccacc 75240 ggccgcccca agggcgtcgt cgtctcccac ggcgccatcg tcaaccggct cgcctggatg 75300 caggcggagt accgtctcga cgcgaccgat cgtgtcttgc agaagactcc ggccggtttc 75360 gacgtgtcgg tctgggagtt cttctggccg ctgctcgagg gcgcggtcct cgtgttcgcc 75420 cggcccggcg gccaccggga cgcggcgtat ctggccggac tcatcgagcg cgagcgcatc 75480 accacggcac atttcgtgcc ctccatgctg cgcgtcttcc tcgaagagcc cggcgcggca 75540 ctctgcaccg gactgaggcg ggtgatatgc agcggcgagg ccctcggcac ggacctggcc 75600 gtggacttcc gcgcgaaact gcccgtcccc ctgcacaatc tgtacggccc gaccgaagcg 75660 gctgtcgatg tcacccacca cgcgtatgag cccgccaccg gcacggccac ggtccccatt 75720 ggccgcccca tctggaacat ccgcacctac gtcctcgacg ccgccctgcg tcctgtgcca 75780 ccgggcgtgc ccggcgagct gtatctggcc ggcgccggcc tggcccgcgg ctaccacggc 75840 cgcccggcac tgacggcgga gcggtttgtg gcgtgtccgt tcggtgtgcc gggtgagcgt 75900 atgtatcgca cgggggattt ggtgcggtgg cgggtggacg gcacgcttga gtttgttggt 75960 cgtgcggatg atcaggtgaa ggtccgtggt ttccgtgtgg agttgggtga ggtggagggt 76020 gctgttgcgg cgcatcctga tgtggtgcgt gcggttgttg tggtgcgtga ggaccggccg 76080 ggtgatcacc ggttggtggc ttacgtgact gtgggtggtg ttggtgggga tggccttcgt 76140 tccgcgatct ctggtctggt ggctgagcgt ctgcctgcgt acatggtgcc gtcggcggtg 76200 gtggttctgg atgagatccc gttgacgccg aacgggaagg tggaccgggc gggtcttccg 76260 gtgccggtgg tgtcggtggc ggggttctgt gcgccgtcgt cgccgcggga ggaggtgttg 76320 tgtggtctgt tcgcggaggt gctgggtgtt gagcgggtgg gggtggacga tgggttcttc 76380 gatctgggcg gggacagcat tctgtcgatt cagttggtgg cgcgggctcg tcgggcgggt 76440 ctggagttgt cggttcggga tgttttcgag ggccgtacgg tacgtgctct ggcggctgtg 76500 gtgcgtggtt cggacgctgg ggcggttggt gtggtggggg gtgctgagat tgtgctgccg 76560 ggtgtgggtg aggtggagcg gtggccggtg gtggagtggc tggcggagcg tggtgggggg 76620 tcgctgggtg gtgtggttcg gggtttcaat cagtctgttg tgcttgctgt gcctgctggg 76680 ttggtgtggg aggagttgcg ggtgttgttg ggtgcggtgc gggatcggca tgaggcgtgg 76740 cggttgcggg tgctggattc cggggcgttg tgtgttgatg gtgttgttcc ggatgacggg 76800 tcgtggattg tccggtgtga cctgagcggt atgggtgtgg atggtcaggt ggatgctgtg 76860 cgggctgcgg ctgtggaggc gcgtgcgtgg ctggatccgt cggtgggccg ggtggtgcgg 76920 gcggtgtggc tggagcgtgg tggtgatcgt tcgggggtgt tggtgctggt ggcgcatcac 76980 ctggtggtgg acggtgtgtc gtggcgggtg gtgctggggg atctggcgga ggggtgggcg 77040 caggtgcgtt cgggtggccg tgtggagttg ggtgtggtgg ggacgtcgtt gcggggttgg 77100 gcggcggcgt tggcggagca gggccggcgg ggcgagcgtg cgggggaggt ggagttgtgg 77160 tcgcggatgg ttcggggtgc ggatgttctg gtggggtcgc gtgctgtgga tggtgcggtg 77220 gatgttttcg gcggggtggt gtcggttgat tcgcgggcgt cggtgtcggt gtcgcgtgcg 77280 ttgctgacgg aggtgccgtc ggttctgggt gttggtgtgc aggaggtgtt gctggcggca 77340 ttcgggctgg cggtcgcgcg gtggcgcggc cggggtgggc cggttgtggt ggatgttgag 77400 gggcacgggc gtaatgagga cgctgtgcgg ggcgctgatc tgtctcgtac tgtcggttgg 77460 ttcaccagtg tgtatccggt ccgtgtgccg gtggagtccg cttcgtggga cgaggtgcgt 77520 gcgggcggtc cggtggtggg ccgtgtggtg cgtgaggtga aggagactct gcgttcgctg 77580 cctgaccagg gtctgggtta tggcatcctg cgctatctcg atcccgagca cggtcctgct 77640 ctggcccggc atgccacccc gcagttcggt ttcaactacc tcggccgctt caccaccgga 77700 accgacgaaa ccaccacggc cgacgccctc gaccgggccc ccgcgtggag ccttctcgcc 77760 cgcagcgccg ccggccagga ccccgaactg cccgtggcgc acgcggtcga gttcaacgcg 77820 atcacgctgg acaccccgga gggcccgcgc ctgggcgtga catggtcgtg gccgacgacg 77880 ctgctgccgg agtcccggat acgggagctg gcccgctact gggacgaagc cctggaaggg 77940 ctggtcgaac acgcccggca ccccgaagcc ggcggcctca cgccgtccga cgtgggcctc 78000 gcggaactct cctttgctga gatcgaactg ctcgaagacg actggaggac acagggatga 78060 cgcagcgcgc gatggaggac atacttcctc tcactccgct gcaggaggga ctgctgttcc 78120 acagtgttta cgacgagcag tccgtcgacg tgtacaccgt gcaggtggtc gtcgacctcg 78180 aggggcccgt cgaccccgaa gcactgcgcg ccgccgcggc cgccctgctg cgtcggcacg 78240 ccaacctgcg ggcggccttc cggtacgagc ggctgcagcg ccccgtgcag atcatcccgc 78300 gcgaggttgc ggtgccgtgg gagcacaccg acgtcgcgaa gctcgagggc gccgagcaga 78360 aggccgagat cgaacgcctg ctgcacgacc agcggtggcg ccgcttcgat ctgacggctc 78420 cgcccctgct gcggttcctg ctcgtgcgca caggccacga ccggcaccgt ttcgcgctga 78480 ctttccatca catcctcatg gacggctggt cgatgcccgt cctgctgcgg gaactcatca 78540 ccctctaccg caccggcgac gagaccgccc tgccctgggt ccggccgtac cgggactacc 78600 tggcctggat ctcccgccgc gaccgggacg aggccgggcg ggcctggtcc aaggcactgg 78660 ccggggttga cgaggccacc ctcgtcgccc cgggtgccga ccgggccgcc gagccgccgc 78720 tgtggaccga gtcccggctc gaaccggacc tggcggcgac gctcgccgcc cgcgcccgcg 78780 agttcggcgt caccctcaac accctcgtcc aggccgcctg ggcgctcgtc ctcggccgcc 78840 tcaccggccg cgacgacgtc gtgttcggcg tgaccgtgtc cggccggccg ccggagctcg 78900 caggtgtcga ggacatggtg ggcctcttca tcaacaccgt gccgctgcgt gccgagctgc 78960 tgccgcacga gagcctccgg gacttcaccg tccgcctcca gcgcgaacag atacagctcc 79020 tcgaccacca gtacgaacga ctggcggtca tccagcggct cgccggccgg acagaactct 79080 tcgacacggt gatggtcttc gagaactacc ccgtcgccgc cgcatcctcc gccggcgccg 79140 acggccccgc ggccgaaccc cgggtcgccg acgtccacgt acgcgacgcc atgcactacc 79200 ccctcggtct gctggtcctg cccggcccgc cgctgcgcct gcgctttggc caccggccga 79260 gcgccctgcc cgccgaacgc gtcacgacga tccgcgacag cctcgtgcga gccctggagc 79320 tcatggccga ccagccggac ctcgccgtcg gcagggccga catcctcggc gaggaggaga 79380 aacagcatct cctcaccggc ctcaacgaca cccaccgcga cgtgcccccg ctcaccgtgc 79440 ccggaatgat cgaggcccag gcggcccgca cccccggcag gccggcggtc catgcccgcg 79500 acggcgaact ctcctacgcc gaactcaacg cgcgcgccaa ccggctcgca cgccacctcg 79560 ccgcggccgg cgtgggcccc gagcagtacg tcaccctgct gctcccgctc tccgcccgca 79620 tggtcgtggc cgctctcgcc gtgatgaaga ccggcgccgc gtacgttccc gtggacccgg 79680 agtatccggc cgaccgcatc gcgtacatgc ttggcgacat cggccccgcg ctcgtcctca 79740 ccgactcccg ctcggccgcg gccatgcccg ccggcccggc ccgcgtcctc accctcgacg 79800 acgacgccct cgacacgggc gttcgcgccc tgcccgaaca cgacctcggc accgacggta 79860 tcgcgccgct tcccgaccag cccgcgtacg tcatctacac ctcgggctcc accggccgcc 79920 ccaagggcgt cgtgatcctg caccgttccg tcaccggcta cctcctgcgc acgatcgagg 79980 aataccccga agccgccggc aaggcattcg tgcactcgcc cgtgtccttc gacctcaccg 80040 tcggagcgct gtacgcaccc ctggtgagcg gtggctgcct gcgcctcgga tcgttcaccg 80100 acgacaagat cctcgacctg ggcgaggaca gccccacctt catgaaggcc acccccagcc 80160 atctcgccgt cctcgactcc ctccccgacg agatctcccc caccggggcc atcaccctcg 80220 gcggtgagca actcctgagc gagaccctcg acccgtggcg cgcccgccac cccggcgtga 80280 ccgtcttcaa cgtgtacggc cccaccgaga ccacgatcaa ctgcgccgaa caccgcatcg 80340 cccccggcac caccctgcct cccggccccg tccccatcgg ccggcccctg tggaacaccc 80400 gcctgtacgt cctcgacggc ggcctgcgcg tcgtgcccac gggcgtcgcc ggcgagctgt 80460 acgtggccgg cgcgggcctg gcccgcggct atctcggacg ccccggcctg acggccgaac 80520 gcttcgtggc ctgccccttc ggcgcaccgg gcgaacgcat gtaccgcacc ggtgacctgg 80580 tgcggtggag aaccgacggc acgctggagt tcgtcggccg cgtcgacgac caggtcaagg 80640 tacgcggctt ccgcatcgag ctcggtgagg tcgaggccac cgtcgccgcc acccccggtg 80700 tggcgcgcgc gatcgtcgct gtccgcgagg accgccccgg cgaccagcgg ctcgtggcgt 80760 acgtgacacc tgccgacgtc gaccccaccg gcggcctgcc gtcggcggtg accgcccatg 80820 ccgccgcccg cctgcccgcg tacatggtgc cgtccgccgt cgtggtactg cacgaggtac 80880 ccctcacccc caacggcaag atcaacaggg cggccctgcc cgcgcccgag gccgtctccg 80940 gcgccggctt ccgtgccccc ggcacggccc gtgaggaagt tctgtgcggc ctgttcgccg 81000 aagtcctcgg cctcgaacgg gtcggcacgg ccgacgactt cttcgaactc ggcggccact 81060 cgctgctcgc cacccgcctg gtgtcccgcg tccgttcggt cctcggcgtc gaactcggcg 81120 tccgcgccct cttcgacgcc cctacccccg gccgcctcga ccggctcctg ggggaacgct 81180 ccggcgcccc cgtccgcgcc cccctgaccg cgcgggaacg caccgggcgg gaccccctgt 81240 cgtacgccca gcagcgcctg tggttcctcc acgaactcga gggccacggc gccacataca 81300 acatccctct cgcgctgcgc ctcaccggtc ctctcgacgt gaccgccctc gaagccgccc 81360 tgacggatgt cgtcgcccgc cacgagagcc tgcgcacact catcgcccgg gacggcaccg 81420 gcaccgcgtg gcagcacatc ctgcccaccg gcgaccctcg cgcccgaatc acccttgagg 81480 ccgtacccct gcacagggac gaactggccg ggcgcctcgc cgaagcggcc cgccacccct 81540 tcgacctcac cgccgagatc cccgtccgcg ccaccgtctt ccgcaccgag cgcgacgacc 81600 acaccctgct cgtcgtcacc caccacatcg caagcgaccg ttggtcccgc gagccgttcc 81660 tccgtgacct gtccgccgcc tacgcagccc ggcgcgcaca ctccgcgccg gaactgcccc 81720 cgctgtccgt gcagtacgct gactacgccg cctggcagcg cgacgtactc ggcaccgagg 81780 acgacgggac gagcgagatg gccggccagc tcgcccactg gcggggcaga ctcgccggcc 81840 tcccgcaggg cctggacctg cccaccgacc gcccccgacg ccccgacgtc ggccgccgcg 81900 gcggccggtg ccggctggag atccccgccg cgctgcaccg cgacatcgtc accctcgccc 81960 gcgtcaccag taccaccgtg ttcatggtgg tccaggcggc cctcgccggt ctgctgtcgc 82020 ggctgggcgc gggcaccgac atccccatcg gcacgccgat cgcgggccgc accgacgagg 82080 ccaccgagca cctcatcggg ttcttcgtga acaccctcgt cctgcgcacc gacgtctccg 82140 gcgatccgac gttcgccgaa ctcctcgcgc gcgtgcgggc caccgacctc gacgcgtacg 82200 cacaccagga cgtgcccttc gaacgcctgg tggaggtcct caacccggaa cgctcactgc 82260 tgcgccaccc cctcttccag atactgctcg ccttccagaa caccgaggac cgcagcatct 82320 ccgaccgccc cgggaccctg ctgcccgacc tgcaggtcac cgaacagccc ctcgacgccg 82380 ggacggccaa gttcgacctc gcgttcgcgt tcaccgagcg gcccccggag aagggcgaac 82440 cctccggcat caccggaatc gtcgaatacc acgccgacct gtacgacgag ggcaccgtcc 82500 ggcagatcgc ggactgcttc gtgcagttcc tcgacgcggc cgtccacgcc ccgggcaccc 82560 gcgtcgacgc ggtcgggctg ctcccggaac acaccctcca caaactgctg acccgcagcc 82620 gcggcactgt caccggcctg ccgcccgcca ccctgcccga gctgttcgag gcccgggtgg 82680 cggcgcaccc cggtcacatc gcggtcgagg tcgccggccg ccggcccgcc actacgacgt 82740 acgacgcact gaaccggcgg gccaaccggc tcgcccggct gctcaccgac cggggcgtac 82800 ggcccgaaca gcgcgtggcg atcgccctgc cccgctccgc ggacctggtg acggcctggc 82860 tcgggatcct caaggccggc gccgtgtgcg tgcccgtcga ccccgcctac cccgacgacc 82920 gcatcgccca catggccgcc gacgcggccc cggcgctcct catcgcctcc gcagccaccc 82980 gcgaccgcat gctccccacc ggcatccccg tactggacct cgacgacccg gccgtcaccg 83040 ccgcactcgc cgccgcgccc gacggcaatc cgcgcggcac gggactgctg cccgcccatc 83100 ccgcctacgt catctacacc tccggctcca ccggcacacc caagggcgtc gtcgtcaccc 83160 acgaaggcat cccggcgctg gccgccaccc agcaggaggc actgcgcgcg ggccccggag 83220 accgggtcct gcaactggtg tcgaccagct tcgacgcctc cgtctgggac ctgtgctccg 83280 cgctgctgtc gggcgcgacc ctcgtcctcg ccccggacgc ggacctcttc ggtgacgaac 83340 tcgccgccgc gctcaccgca caccgcatca cgcacgtcac cctgcccccg gccgcgctgg 83400 ccgctgtccc ggcaggcgcg gcaccccccc ggctgacggt caccgtcacc ggcgacgtgt 83460 gcggacccca actcgtcgac cgctgggccg gtggcgaacg gcggatcctc aacggctacg 83520 ggcccaccga ggtcaccgtc ggcgccacct acgccgtgtg cgaacggacc ggtgacggcg 83580 cgcccgtgcc gatcggcgca ccctggcccg accagcgtgt gtacgtcctc gaacaccggc 83640 tccggcccgt acccgccggc tgcgtcggcg agatctacgt cgccggggcc ggactggccc 83700 gcggctatct gggccgcccc ggacagaccg ccgaacgctt cgtcgccgac cccttcggcg 83760 cccccggcga gcgcatgtac cgcaccggtg acctggcccg ccgccgcagc gacggccacc 83820 tgctgttcga gggacgcgcc gacacgcagg tcaaaatccg cggcttccgc gtcgaactcg 83880 ccgagatcga ggcggccctc gcatcgcacc ccggcgtcga ggacgcggtg gtcaccgtgt 83940 acgacgacgg gctcggcgac cagcggctcg tcgcgtacgt caccggcggc cccggcacac 84000 cgtcggccgc cgcgctgcgc gcccacctgg cgtcccggct gccccggcac atggtgcccg 84060 gtgacgtcct caccctggac gccctgccgc tcaccgccaa cggcaaggtg gaccgcacgg 84120 cgctgcccgg ccccggcacc cagaccgccg cccccgggcg cgcaccccag tcgccgcagg 84180 aacgggtgct gtgcgccttg ttcgccgacg tgctcggccg ggagaccgtc ggcgtggacg 84240 aggggttctt cgacctgggc ggtcactcgc tgctcgccac tcgcctcgcg gcccgggtcc 84300 gcgcggcgct gggcgtggag atctccgtgc gcaccctgtt cgaggcgccg acccctgccc 84360 tgctcgcgtc ggcgtgcacg gcggacgccg cggcgtacga cccgttcgag acggtgctgc 84420 cgctgcggcg cacgggcagc cggccaccgc tgttctgcgt ccacgccgga atgggcctga 84480 gctgggcgta cgccggcctg ctcagccatc tggacgcgga cgtgccggtt tacggactgc 84540 aggcccggag gctcaccgcg cccggcgggc tgcccgggag cgtcgaggag atggctgagg 84600 actacgccgg tgagatccgg cgcctgtgcc cggatgggcc gtaccggctg ctcggctggt 84660 ccttcggcgg cacggtcgcc cacgccgtcg cgacccgcct gcaacagcag ggccacaccg 84720 tcgaactcct cgccgtcctc gacgcctacc ccgtcaccgg ggcccggccc gacgccgagg 84780 tggacgaaca gcgcatcgtc gccgactacc tcgcccagct cggttccccc gtcgcccccg 84840 agcgcctcga gggcgacgcg tggctcccgg agttcctcga gttcgtacgg cgcaccgacg 84900 ggcccgcgag ggacttcgac gccgggcgga tcctcgcgat gaaggacgtc ttcctcaaca 84960 acgcccggct cacccgccgt ttcacacccg gcgtgttcac cggcgacatg gtgttcttcg 85020 cctccgcacg gcccggttcc gagcaggccg ccgaacgcgt cggcctgtgg cacccccacg 85080 tcaccggcga cctcgacctg cacctgatcg actgcgcaca cgaggagatg accgatccag 85140 ccgcactcac ccggatcggc cccgtgctcg ccgcacggct gggcgccggc acctgacccc 85200 caggacccca cacgggacac cggacacggg ggcgcccccc tgtccgtaca cgaaaggaaa 85260 cataccgcca tggccaaccc cttcgagaac aacgacggca gctacctcgt actggtcaac 85320 gacgagggcc agtactccct ttggcccgcg ttcgccgatg tcccggcggg ctggaccgtc 85380 accttcggcg agagcagtcg gcaggaatgc ctcgaccaca tcaacgagaa ctggaccgat 85440 atgcgcccca agagcctcat ccggcagatg gagaacgacc ggacgaccgc ggcctgaccc 85500 gcagccggac agcggagacg gaaggagggc cgacatgagg gcgacatcca ggatgatcca 85560 ggtcaacggc gcccggatcg cctgctccga cagcggctgc ggtgacccgg tgctgatgat 85620 cgccggcacc ggcagtaccg gccgggtgtg ggacgcctac caggtgcctg acctgcacgc 85680 ggccggattc cgcaccatca cgttcaccaa tcgcggcgta ccgccgtccg acgagtgcga 85740 gcggggcttc accctcgccg acctcgccgc cgacaccgcc gcgctgatcg aacaggtggc 85800 gggcggaccc tgccgcgtcg tgggcacgtc cctgggcgcc caggtggccc aggaagtcgc 85860 cctggcccgc ccggacctgg tgacccaggc ggtgttcatg gccacccggg gtcgcaccga 85920 cgcgatgcgg gccgccgcca ccagggcggc cgccgccctg tacgacagcg gcgtcgaact 85980 gccccccgcc tacgcggcgg ctgtccgcgc gctgcagaac ctctcccccc acaccctccg 86040 ggaccgccat caggtcgagg actggctccc actcttcgag tacgccgaac gggacgggcc 86100 gggggtccgt gcgcagttgg aactcggcct gctgcccgac cgcctcgcgg actaccggga 86160 catcaccgtc ccctgcctgg tcatcgcgtt cgaggacgac gtcgtcaccc cgccgtacct 86220 gggccgcgaa gtggccgacg cgatccccgg cgcccgcttc gagaccgttc cccgctgcgg 86280 ccactacggc tacctcgagg atgcgagcgc ggtcaacaag attcttcgcg atttcttccg 86340 aacgagctga aaggcacgac gaccttgtcc agtaccggca gagaggggcc cgtcgtgacc 86400 ggcgaaaccc gcaccaccac ctacctcccc ggcatgaccg tgcacgacta ccacgtgacc 86460 gtcaaggaac agcacccggc gctcttcgag ctcctggacc ccgcacgcct cgtcgccgtc 86520 acggacgagc cttgggtcac ggagggaaac gagttcgacg acgaccacgc cggccgcggc 86580 gtctcctacc gctgtgccca gcagcacggc gaagcccgcc gcaccggcat tgagacgatt 86640 ctcggcatgt tcgccggccc cggcgggctg cgcgacatgg gccgtgtcct cgatgtactc 86700 ggaggcgaag gcctgctcag ccgcgtgtgg cggcaactgg ccggcgccgg cgacggggac 86760 tccgtgccac tggtcaccgg agacctcagc ggccacatgg tggccgcagc cctccggtcc 86820 ggcctgcccg ccgtacgcca gccggccgac cgcatgctgc agcgagacca ctgcctggac 86880 ggcgtgctct tcgcgtacgg cactcaccac gtcgaccgct ctgtacgccc ccgcatgctg 86940 acagaggcct cccgggtcct ggcccctgga ggccgcgtcg tcctccacga cttcgcggag 87000 ggatcccccg aagaacgctg gttccgcgaa gtcgtccacc cccgctccct cgcgggccac 87060 gcgtacgacc acttcaccgc ccacgagatg accggctacc tcgccgacgc gggcttcacc 87120 gacatcaccg tcggccccgt gtacgacccg atgaccctga ccggggagac cgacgagagc 87180 gcactggctc ggctcgtctc ctacatgacc tcgatgtacg gcatcctgcc cgacggcgac 87240 cggagcaacg agcggacgga agccgccctc cgcgacatct tccgtttctc ggccggcgac 87300 ctccccgagg acgtcccccg cgacgaggcg gtcctggaac ttaccgtccg tccgcacggc 87360 aatgccttcc gggccgagct cccccggata gccctcgtcg cccacggacg caaaccatga 87420 cagcgcagga cacccggacg accgggagtg acggtggcgg ccggggcgcc acgtaccacg 87480 agagcccgac ctacggggag ctgctgcgcc tggaggacct gctgaacgtc gcgcacctgc 87540 gcgacgcggc cgccccggtc ctcttccttg ccacgcacca gtcggcggag atctggttcg 87600 gcatcgtgct gcgccacctg gaggaaatcc gcgcggccct cacggacgac gacccggaca 87660 cggcactgca tctgctgccg cgactgccgg agatcttcga actgctcgtc cgccacttcg 87720 acatgctggc cacgctgagt acggaggaat tcggcaagat ccgcgcgggg ctgggcacgg 87780 cgagcggctt ccagtcggcg cagtaccggg agatcgagtt cctgtgcggt ctgcgcgacc 87840 accgccacat ctccacaccg ggcttcacgg aaaccgaacg tcggcgactg cgggaacggg 87900 cccgccagcc ctccgtggcg gaggcctacg acgccttccg gacccgatgc gccaacggga 87960 aggacgcgga acggatcggg gaagcgctcc tgaggttcga cgaacgggtc accgtctggc 88020 gcgcccgcca cgcggccctg gcggaacgct tcctgggccc ccttgaaggg acggccggca 88080 ccgccggagc cgactacttg tggcgggtca cccggcacag gctcttcccc ccggaggcgt 88140 ggggcgccgg ctgacggcac cgccccggcc ccggggacgg gacaggccgg ttcccgcacc 88200 ccggccccgg gggcgggaaa cggccttgcc gtgccgtcag aaggccgtca accggtccca 88260 cacgagggtc cgagcccttc gtcgagcaag cgtcgccact ctgacgttcg gtctgtcgac 88320 gctcataccg gcgggcaccg tcacggccac cggcaccctg gtcaggaagc tggtgaagga 88380 ggcgggcgag gaagcggccg gttgcatcat gtccacgctg accgagcccg cagtgcaggc 88440 gatcgagaac gtcgccgccg acctggcggt tcaggccgca gccaacgcgg tcgggctgca 88500 gaacgggatc gacaccggtc aggccgtcca cgccggcaag gaggggttcc aggacggagt 88560 cgcgggtgcg aaggaaggac tgcgactcgc ctcggtggac ggcggtccgc cgccgggatc 88620 gacgggccgg ctgatgggcg acctcaaggc gaccaagggc tttggcgacc atcgggcgcc 88680 aagacgtgca agaacgaccc cgtggacgtc gccaccggtg agatgctgct cccgcagacc 88740 gtcctggggc tccccggcgt cctgcagctg gtcctggggc ggactcatcc gtgctcggct 88800 gccgaccgtc ggcaacctcg acgccgccgt gaactcatca ggttcgccag tgcggttcac 88860 ctgcgacgcc gatggacgcg tcacctcctg gaccgactgc aacgacgcca ccttccgtac 88920 gtctacgacc aggccggccg ggtggtgcgg accgaaggcc ccgacggcat cctctcctcg 88980 tcctgtgcct atggagagcc ggaacccgac accgggccgc gcacgacgcg caagggcggc 89040 cggtgatccg tcggagctca acgctccgtg gccgcacagc ggtctggcac ttcacctggg 89100 acgctcagga ccggctcgcc gaggccgccg accactgctg ggactgcgcg cggttcccgc 89160 gcctgagagg gggcgcgctg accttggtca gaagccttgc gcgatcacga gcgtcacgtt 89220 ggcgggcgac ttgctccgcc gagttgaagc cgtacgaagt gccgactgga tcgatgcggc 89280 cagccatcct cagggttgcc ctgacagagt ttggtggaca cgaaccggaa caacccggac 89340 cgccagatgt ggttgagttt tccgggacag ttgatccaca caccgtcccg ccgctcagtc 89400 ccgttcggac catgagcctc accgaaggac cccacctgca catgagcacc cccgacactc 89460 gtcccccgcg gtggccttta cctcccgccc cgcccgccca tgaccccgtc ctcttcgcgc 89520 gggcgatgcg ggacatgcgc ctgacgtggc gtgcccgcgg gatcctggcc gaactctccg 89580 tcggctacgg ccccgggcag gaccccacga tcagcgagct ggtcgcgctc aaccgcgacg 89640 agcgtctggc tgcagagggc cgcgaggcct tccgcacggc ggtccgtgag ctgcgcggcc 89700 tcggctacct cactccggac gccaccacgg cctccggcgt cggggagcgt ctgatcgtcg 89760 atctcgcccc ggccgcggaa gcctggctga tcccgcagca acccggtttc gggttctacg 89820 tggacgggag ctgaccgtcc gactctctgc cgggcgtggc cgaacgccgt cctcgtgtga 89880 cggggacggc ccgcctatcc tgcgggcatg gcccaaccca ttgaactcgt catattcgac 89940 tgcgacggcg tactcgtcga cagcgaacgc atcgcggtgc gcgtggacgc actcgtcctg 90000 gccgagctgg ggtggaatct caccgaagcc gagatcgtcg accggttcat gggcctgtcg 90060 agccggtcga tgacgcggca gatcgaggac cacctcgggc gccgtctgcc ggccgactgg 90120 gaggaagagt tcaagcccct ctacgacgag gcgctcgccg ccgaactcac gccggtcgag 90180 ggcatcgtcg acgccctcga cgcgctcacg catctcccca cctgtgtggc atccagcggg 90240 agccacgaca agatgcgttt cacgctgggg atgaccggtc tccgcccgcg cttcgaaggc 90300 cgcattttca gtgccaccga ggtcgagcac ggcaagccgg ccccggatct gttcctacac 90360 gccgcgcgga agatgggggt cgtgcccgag gcgtgcgccg tggtcgagga cagtcagtac 90420 ggtcttcagg cagcccgggc cgcgggcatg cgagccttcg cctacgccgg gggactgact 90480 cccgcggacc gtctcgaagg ccccggcacc gtcgtcttcg acgacatgcg cagactgccc 90540 ggcctcctcg cggatcactg accgccgcct ggatcactcc actccatcgg ccactgt 90597 <210> 2 <211> 390 <212> DNA <213> Streptomyces roseosporus <400> 2 cccctcccca ccacctgccc agtgtgacgt ttgcgcagat gagaacgtgc gtaaacgccg 60 catacgcaaa gatcgtccct gccgggaccc attgacgttc gcaggggcgt ggaacatact 120 ggcgatcaag tcgcacagga accaacaggc acaccaacca caggcgttac agggggggtt 180 ggtgtttcgt ccatatcaag tggtttggtc cgccgaagcg gttggacctc acatgacggc 240 aacagggcat tcgcacatgc ctgatgacgg gacggcacac ctcacgcagc ggcgaccggt 300 cgcaagccgg acgcggaatg actccctgcc ttacaggtat gcgagcgcgg atgcgtcgtt 360 cgaccggagt caggaggggg agtgcctgcc 390 <210> 3 <211> 7140 <212> DNA <213> Streptomyces roseosporus <400> 3 atgacgcagc gcgcgatgga ggacatactt cctctcactc cgctgcagga gggactgctg 60 ttccacagtg tttacgacga gcagtccgtc gacgtgtaca ccgtgcaggt ggtcgtcgac 120 ctcgaggggc ccgtcgaccc cgaagcactg cgcgccgccg cggccgccct gctgcgtcgg 180 cacgccaacc tgcgggcggc cttccggtac gagcggctgc agcgccccgt gcagatcatc 240 ccgcgcgagg ttgcggtgcc gtgggagcac accgacgtcg cgaagctcga gggcgccgag 300 cagaaggccg agatcgaacg cctgctgcac gaccagcggt ggcgccgctt cgatctgacg 360 gctccgcccc tgctgcggtt cctgctcgtg cgcacaggcc acgaccggca ccgtttcgcg 420 ctgactttcc atcacatcct catggacggc tggtcgatgc ccgtcctgct gcgggaactc 480 atcaccctct accgcaccgg cgacgagacc gccctgccct gggtccggcc gtaccgggac 540 tacctggcct ggatctcccg ccgcgaccgg gacgaggccg ggcgggcctg gtccaaggca 600 ctggccgggg ttgacgaggc caccctcgtc gccccgggtg ccgaccgggc cgccgagccg 660 ccgctgtgga ccgagtcccg gctcgaaccg gacctggcgg cgacgctcgc cgcccgcgcc 720 cgcgagttcg gcgtcaccct caacaccctc gtccaggccg cctgggcgct cgtcctcggc 780 cgcctcaccg gccgcgacga cgtcgtgttc ggcgtgaccg tgtccggccg gccgccggag 840 ctcgcaggtg tcgaggacat ggtgggcctc ttcatcaaca ccgtgccgct gcgtgccgag 900 ctgctgccgc acgagagcct ccgggacttc accgtccgcc tccagcgcga acagatacag 960 ctcctcgacc accagtacga acgactggcg gtcatccagc ggctcgccgg ccggacagaa 1020 ctcttcgaca cggtgatggt cttcgagaac taccccgtcg ccgccgcatc ctccgccggc 1080 gccgacggcc ccgcggccga accccgggtc gccgacgtcc acgtacgcga cgccatgcac 1140 taccccctcg gtctgctggt cctgcccggc ccgccgctgc gcctgcgctt tggccaccgg 1200 ccgagcgccc tgcccgccga acgcgtcacg acgatccgcg acagcctcgt gcgagccctg 1260 gagctcatgg ccgaccagcc ggacctcgcc gtcggcaggg ccgacatcct cggcgaggag 1320 gagaaacagc atctcctcac cggcctcaac gacacccacc gcgacgtgcc cccgctcacc 1380 gtgcccggaa tgatcgaggc ccaggcggcc cgcacccccg gcaggccggc ggtccatgcc 1440 cgcgacggcg aactctccta cgccgaactc aacgcgcgcg ccaaccggct cgcacgccac 1500 ctcgccgcgg ccggcgtggg ccccgagcag tacgtcaccc tgctgctccc gctctccgcc 1560 cgcatggtcg tggccgctct cgccgtgatg aagaccggcg ccgcgtacgt tcccgtggac 1620 ccggagtatc cggccgaccg catcgcgtac atgcttggcg acatcggccc cgcgctcgtc 1680 ctcaccgact cccgctcggc cgcggccatg cccgccggcc cggcccgcgt cctcaccctc 1740 gacgacgacg ccctcgacac gggcgttcgc gccctgcccg aacacgacct cggcaccgac 1800 ggtatcgcgc cgcttcccga ccagcccgcg tacgtcatct acacctcggg ctccaccggc 1860 cgccccaagg gcgtcgtgat cctgcaccgt tccgtcaccg gctacctcct gcgcacgatc 1920 gaggaatacc ccgaagccgc cggcaaggca ttcgtgcact cgcccgtgtc cttcgacctc 1980 accgtcggag cgctgtacgc acccctggtg agcggtggct gcctgcgcct cggatcgttc 2040 accgacgaca agatcctcga cctgggcgag gacagcccca ccttcatgaa ggccaccccc 2100 agccatctcg ccgtcctcga ctccctcccc gacgagatct cccccaccgg ggccatcacc 2160 ctcggcggtg agcaactcct gagcgagacc ctcgacccgt ggcgcgcccg ccaccccggc 2220 gtgaccgtct tcaacgtgta cggccccacc gagaccacga tcaactgcgc cgaacaccgc 2280 atcgcccccg gcaccaccct gcctcccggc cccgtcccca tcggccggcc cctgtggaac 2340 acccgcctgt acgtcctcga cggcggcctg cgcgtcgtgc ccacgggcgt cgccggcgag 2400 ctgtacgtgg ccggcgcggg cctggcccgc ggctatctcg gacgccccgg cctgacggcc 2460 gaacgcttcg tggcctgccc cttcggcgca ccgggcgaac gcatgtaccg caccggtgac 2520 ctggtgcggt ggagaaccga cggcacgctg gagttcgtcg gccgcgtcga cgaccaggtc 2580 aaggtacgcg gcttccgcat cgagctcggt gaggtcgagg ccaccgtcgc cgccaccccc 2640 ggtgtggcgc gcgcgatcgt cgctgtccgc gaggaccgcc ccggcgacca gcggctcgtg 2700 gcgtacgtga cacctgccga cgtcgacccc accggcggcc tgccgtcggc ggtgaccgcc 2760 catgccgccg cccgcctgcc cgcgtacatg gtgccgtccg ccgtcgtggt actgcacgag 2820 gtacccctca cccccaacgg caagatcaac agggcggccc tgcccgcgcc cgaggccgtc 2880 tccggcgccg gcttccgtgc ccccggcacg gcccgtgagg aagttctgtg cggcctgttc 2940 gccgaagtcc tcggcctcga acgggtcggc acggccgacg acttcttcga actcggcggc 3000 cactcgctgc tcgccacccg cctggtgtcc cgcgtccgtt cggtcctcgg cgtcgaactc 3060 ggcgtccgcg ccctcttcga cgcccctacc cccggccgcc tcgaccggct cctgggggaa 3120 cgctccggcg cccccgtccg cgcccccctg accgcgcggg aacgcaccgg gcgggacccc 3180 ctgtcgtacg cccagcagcg cctgtggttc ctccacgaac tcgagggcca cggcgccaca 3240 tacaacatcc ctctcgcgct gcgcctcacc ggtcctctcg acgtgaccgc cctcgaagcc 3300 gccctgacgg atgtcgtcgc ccgccacgag agcctgcgca cactcatcgc ccgggacggc 3360 accggcaccg cgtggcagca catcctgccc accggcgacc ctcgcgcccg aatcaccctt 3420 gaggccgtac ccctgcacag ggacgaactg gccgggcgcc tcgccgaagc ggcccgccac 3480 cccttcgacc tcaccgccga gatccccgtc cgcgccaccg tcttccgcac cgagcgcgac 3540 gaccacaccc tgctcgtcgt cacccaccac atcgcaagcg accgttggtc ccgcgagccg 3600 ttcctccgtg acctgtccgc cgcctacgca gcccggcgcg cacactccgc gccggaactg 3660 cccccgctgt ccgtgcagta cgctgactac gccgcctggc agcgcgacgt actcggcacc 3720 gaggacgacg ggacgagcga gatggccggc cagctcgccc actggcgggg cagactcgcc 3780 ggcctcccgc agggcctgga cctgcccacc gaccgccccc gacgccccga cgtcggccgc 3840 cgcggcggcc ggtgccggct ggagatcccc gccgcgctgc accgcgacat cgtcaccctc 3900 gcccgcgtca ccagtaccac cgtgttcatg gtggtccagg cggccctcgc cggtctgctg 3960 tcgcggctgg gcgcgggcac cgacatcccc atcggcacgc cgatcgcggg ccgcaccgac 4020 gaggccaccg agcacctcat cgggttcttc gtgaacaccc tcgtcctgcg caccgacgtc 4080 tccggcgatc cgacgttcgc cgaactcctc gcgcgcgtgc gggccaccga cctcgacgcg 4140 tacgcacacc aggacgtgcc cttcgaacgc ctggtggagg tcctcaaccc ggaacgctca 4200 ctgctgcgcc accccctctt ccagatactg ctcgccttcc agaacaccga ggaccgcagc 4260 atctccgacc gccccgggac cctgctgccc gacctgcagg tcaccgaaca gcccctcgac 4320 gccgggacgg ccaagttcga cctcgcgttc gcgttcaccg agcggccccc ggagaagggc 4380 gaaccctccg gcatcaccgg aatcgtcgaa taccacgccg acctgtacga cgagggcacc 4440 gtccggcaga tcgcggactg cttcgtgcag ttcctcgacg cggccgtcca cgccccgggc 4500 acccgcgtcg acgcggtcgg gctgctcccg gaacacaccc tccacaaact gctgacccgc 4560 agccgcggca ctgtcaccgg cctgccgccc gccaccctgc ccgagctgtt cgaggcccgg 4620 gtggcggcgc accccggtca catcgcggtc gaggtcgccg gccgccggcc cgccactacg 4680 acgtacgacg cactgaaccg gcgggccaac cggctcgccc ggctgctcac cgaccggggc 4740 gtacggcccg aacagcgcgt ggcgatcgcc ctgccccgct ccgcggacct ggtgacggcc 4800 tggctcggga tcctcaaggc cggcgccgtg tgcgtgcccg tcgaccccgc ctaccccgac 4860 gaccgcatcg cccacatggc cgccgacgcg gccccggcgc tcctcatcgc ctccgcagcc 4920 acccgcgacc gcatgctccc caccggcatc cccgtactgg acctcgacga cccggccgtc 4980 accgccgcac tcgccgccgc gcccgacggc aatccgcgcg gcacgggact gctgcccgcc 5040 catcccgcct acgtcatcta cacctccggc tccaccggca cacccaaggg cgtcgtcgtc 5100 acccacgaag gcatcccggc gctggccgcc acccagcagg aggcactgcg cgcgggcccc 5160 ggagaccggg tcctgcaact ggtgtcgacc agcttcgacg cctccgtctg ggacctgtgc 5220 tccgcgctgc tgtcgggcgc gaccctcgtc ctcgccccgg acgcggacct cttcggtgac 5280 gaactcgccg ccgcgctcac cgcacaccgc atcacgcacg tcaccctgcc cccggccgcg 5340 ctggccgctg tcccggcagg cgcggcaccc ccccggctga cggtcaccgt caccggcgac 5400 gtgtgcggac cccaactcgt cgaccgctgg gccggtggcg aacggcggat cctcaacggc 5460 tacgggccca ccgaggtcac cgtcggcgcc acctacgccg tgtgcgaacg gaccggtgac 5520 ggcgcgcccg tgccgatcgg cgcaccctgg cccgaccagc gtgtgtacgt cctcgaacac 5580 cggctccggc ccgtacccgc cggctgcgtc ggcgagatct acgtcgccgg ggccggactg 5640 gcccgcggct atctgggccg ccccggacag accgccgaac gcttcgtcgc cgaccccttc 5700 ggcgcccccg gcgagcgcat gtaccgcacc ggtgacctgg cccgccgccg cagcgacggc 5760 cacctgctgt tcgagggacg cgccgacacg caggtcaaaa tccgcggctt ccgcgtcgaa 5820 ctcgccgaga tcgaggcggc cctcgcatcg caccccggcg tcgaggacgc ggtggtcacc 5880 gtgtacgacg acgggctcgg cgaccagcgg ctcgtcgcgt acgtcaccgg cggccccggc 5940 acaccgtcgg ccgccgcgct gcgcgcccac ctggcgtccc ggctgccccg gcacatggtg 6000 cccggtgacg tcctcaccct ggacgccctg ccgctcaccg ccaacggcaa ggtggaccgc 6060 acggcgctgc ccggccccgg cacccagacc gccgcccccg ggcgcgcacc ccagtcgccg 6120 caggaacggg tgctgtgcgc cttgttcgcc gacgtgctcg gccgggagac cgtcggcgtg 6180 gacgaggggt tcttcgacct gggcggtcac tcgctgctcg ccactcgcct cgcggcccgg 6240 gtccgcgcgg cgctgggcgt ggagatctcc gtgcgcaccc tgttcgaggc gccgacccct 6300 gccctgctcg cgtcggcgtg cacggcggac gccgcggcgt acgacccgtt cgagacggtg 6360 ctgccgctgc ggcgcacggg cagccggcca ccgctgttct gcgtccacgc cggaatgggc 6420 ctgagctggg cgtacgccgg cctgctcagc catctggacg cggacgtgcc ggtttacgga 6480 ctgcaggccc ggaggctcac cgcgcccggc gggctgcccg ggagcgtcga ggagatggct 6540 gaggactacg ccggtgagat ccggcgcctg tgcccggatg ggccgtaccg gctgctcggc 6600 tggtccttcg gcggcacggt cgcccacgcc gtcgcgaccc gcctgcaaca gcagggccac 6660 accgtcgaac tcctcgccgt cctcgacgcc taccccgtca ccggggcccg gcccgacgcc 6720 gaggtggacg aacagcgcat cgtcgccgac tacctcgccc agctcggttc ccccgtcgcc 6780 cccgagcgcc tcgagggcga cgcgtggctc ccggagttcc tcgagttcgt acggcgcacc 6840 gacgggcccg cgagggactt cgacgccggg cggatcctcg cgatgaagga cgtcttcctc 6900 aacaacgccc ggctcacccg ccgtttcaca cccggcgtgt tcaccggcga catggtgttc 6960 ttcgcctccg cacggcccgg ttccgagcag gccgccgaac gcgtcggcct gtggcacccc 7020 cacgtcaccg gcgacctcga cctgcacctg atcgactgcg cacacgagga gatgaccgat 7080 ccagccgcac tcacccggat cggccccgtg ctcgccgcac ggctgggcgc cggcacctga 7140 <210> 4 <211> 853 <212> DNA <213> Streptomyces roseosporus <400> 4 cccgcagccg gacagcggag acggaaggag ggccgacatg agggcgacat ccaggatgat 60 ccaggtcaac ggcgcccgga tcgcctgctc cgacagcggc tgcggtgacc cggtgctgat 120 gatcgccggc accggcagta ccggccgggt gtgggacgcc taccaggtgc ctgacctgca 180 cgcggccgga ttccgcacca tcacgttcac caatcgcggc gtaccgccgt ccgacgagtg 240 cgagcggggc ttcaccctcg ccgacctcgc cgccgacacc gccgcgctga tcgaacaggt 300 ggcgggcgga ccctgccgcg tcgtgggcac gtccctgggc gcccaggtgg cccaggaagt 360 cgccctggcc cgcccggacc tggtgaccca ggcggtgttc atggccaccc ggggtcgcac 420 cgacgcgatg cgggccgccg ccaccagggc ggccgccgcc ctgtacgaca gcggcgtcga 480 actgcccccc gcctacgcgg cggctgtccg cgcgctgcag aacctctccc cccacaccct 540 ccgggaccgc catcaggtcg aggactggct cccactcttc gagtacgccg aacgggacgg 600 gccgggggtc cgtgcgcagt tggaactcgg cctgctgccc gaccgcctcg cggactaccg 660 ggacatcacc gtcccctgcc tggtcatcgc gttcgaggac gacgtcgtca ccccgccgta 720 cctgggccgc gaagtggccg acgcgatccc cggcgcccgc ttcgagaccg ttccccgctg 780 cggccactac ggctacctcg aggatgcgag cgcggtcaac aagattcttc gcgatttctt 840 ccgaacgagc tga 853 <210> 5 <211> 37 <212> DNA <213> Streptomyces roseosporus <400> 5 cccgcagccg gacagcggag acggaaggag ggccgac 37 <210> 6 <211> 816 <212> DNA <213> Streptomyces roseosporus <400> 6 atgagggcga catccaggat gatccaggtc aacggcgccc ggatcgcctg ctccgacagc 60 ggctgcggtg acccggtgct gatgatcgcc ggcaccggca gtaccggccg ggtgtgggac 120 gcctaccagg tgcctgacct gcacgcggcc ggattccgca ccatcacgtt caccaatcgc 180 ggcgtaccgc cgtccgacga gtgcgagcgg ggcttcaccc tcgccgacct cgccgccgac 240 accgccgcgc tgatcgaaca ggtggcgggc ggaccctgcc gcgtcgtggg cacgtccctg 300 ggcgcccagg tggcccagga agtcgccctg gcccgcccgg acctggtgac ccaggcggtg 360 ttcatggcca cccggggtcg caccgacgcg atgcgggccg ccgccaccag ggcggccgcc 420 gccctgtacg acagcggcgt cgaactgccc cccgcctacg cggcggctgt ccgcgcgctg 480 cagaacctct ccccccacac cctccgggac cgccatcagg tcgaggactg gctcccactc 540 ttcgagtacg ccgaacggga cgggccgggg gtccgtgcgc agttggaact cggcctgctg 600 cccgaccgcc tcgcggacta ccgggacatc accgtcccct gcctggtcat cgcgttcgag 660 gacgacgtcg tcaccccgcc gtacctgggc cgcgaagtgg ccgacgcgat ccccggcgcc 720 cgcttcgaga ccgttccccg ctgcggccac tacggctacc tcgaggatgc gagcgcggtc 780 aacaagattc ttcgcgattt cttccgaacg agctga 816 <210> 7 <211> 2379 <212> PRT <213> Streptomyces roseosporus <400> 7 Met Thr Gln Arg Ala Met Glu Asp Ile Leu Pro Leu Thr Pro Leu Gln 1 5 10 15 Glu Gly Leu Leu Phe His Ser Val Tyr Asp Glu Gln Ser Val Asp Val 20 25 30 Tyr Thr Val Gln Val Val Val Asp Leu Glu Gly Pro Val Asp Pro Glu 35 40 45 Ala Leu Arg Ala Ala Ala Ala Ala Leu Leu Arg Arg His Ala Asn Leu 50 55 60 Arg Ala Ala Phe Arg Tyr Glu Arg Leu Gln Arg Pro Val Gln Ile Ile 65 70 75 80 Pro Arg Glu Val Ala Val Pro Trp Glu His Thr Asp Val Ala Lys Leu 85 90 95 Glu Gly Ala Glu Gln Lys Ala Glu Ile Glu Arg Leu Leu His Asp Gln 100 105 110 Arg Trp Arg Arg Phe Asp Leu Thr Ala Pro Pro Leu Leu Arg Phe Leu 115 120 125 Leu Val Arg Thr Gly His Asp Arg His Arg Phe Ala Leu Thr Phe His 130 135 140 His Ile Leu Met Asp Gly Trp Ser Met Pro Val Leu Leu Arg Glu Leu 145 150 155 160 Ile Thr Leu Tyr Arg Thr Gly Asp Glu Thr Ala Leu Pro Trp Val Arg 165 170 175 Pro Tyr Arg Asp Tyr Leu Ala Trp Ile Ser Arg Arg Asp Arg Asp Glu 180 185 190 Ala Gly Arg Ala Trp Ser Lys Ala Leu Ala Gly Val Asp Glu Ala Thr 195 200 205 Leu Val Ala Pro Gly Ala Asp Arg Ala Ala Glu Pro Pro Leu Trp Thr 210 215 220 Glu Ser Arg Leu Glu Pro Asp Leu Ala Ala Thr Leu Ala Ala Arg Ala 225 230 235 240 Arg Glu Phe Gly Val Thr Leu Asn Thr Leu Val Gln Ala Ala Trp Ala 245 250 255 Leu Val Leu Gly Arg Leu Thr Gly Arg Asp Asp Val Val Phe Gly Val 260 265 270 Thr Val Ser Gly Arg Pro Pro Glu Leu Ala Gly Val Glu Asp Met Val 275 280 285 Gly Leu Phe Ile Asn Thr Val Pro Leu Arg Ala Glu Leu Leu Pro His 290 295 300 Glu Ser Leu Arg Asp Phe Thr Val Arg Leu Gln Arg Glu Gln Ile Gln 305 310 315 320 Leu Leu Asp His Gln Tyr Glu Arg Leu Ala Val Ile Gln Arg Leu Ala 325 330 335 Gly Arg Thr Glu Leu Phe Asp Thr Val Met Val Phe Glu Asn Tyr Pro 340 345 350 Val Ala Ala Ala Ser Ser Ala Gly Ala Asp Gly Pro Ala Ala Glu Pro 355 360 365 Arg Val Ala Asp Val His Val Arg Asp Ala Met His Tyr Pro Leu Gly 370 375 380 Leu Leu Val Leu Pro Gly Pro Pro Leu Arg Leu Arg Phe Gly His Arg 385 390 395 400 Pro Ser Ala Leu Pro Ala Glu Arg Val Thr Thr Ile Arg Asp Ser Leu 405 410 415 Val Arg Ala Leu Glu Leu Met Ala Asp Gln Pro Asp Leu Ala Val Gly 420 425 430 Arg Ala Asp Ile Leu Gly Glu Glu Glu Lys Gln His Leu Leu Thr Gly 435 440 445 Leu Asn Asp Thr His Arg Asp Val Pro Pro Leu Thr Val Pro Gly Met 450 455 460 Ile Glu Ala Gln Ala Ala Arg Thr Pro Gly Arg Pro Ala Val His Ala 465 470 475 480 Arg Asp Gly Glu Leu Ser Tyr Ala Glu Leu Asn Ala Arg Ala Asn Arg 485 490 495 Leu Ala Arg His Leu Ala Ala Ala Gly Val Gly Pro Glu Gln Tyr Val 500 505 510 Thr Leu Leu Leu Pro Leu Ser Ala Arg Met Val Val Ala Ala Leu Ala 515 520 525 Val Met Lys Thr Gly Ala Ala Tyr Val Pro Val Asp Pro Glu Tyr Pro 530 535 540 Ala Asp Arg Ile Ala Tyr Met Leu Gly Asp Ile Gly Pro Ala Leu Val 545 550 555 560 Leu Thr Asp Ser Arg Ser Ala Ala Ala Met Pro Ala Gly Pro Ala Arg 565 570 575 Val Leu Thr Leu Asp Asp Asp Ala Leu Asp Thr Gly Val Arg Ala Leu 580 585 590 Pro Glu His Asp Leu Gly Thr Asp Gly Ile Ala Pro Leu Pro Asp Gln 595 600 605 Pro Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly 610 615 620 Val Val Ile Leu His Arg Ser Val Thr Gly Tyr Leu Leu Arg Thr Ile 625 630 635 640 Glu Glu Tyr Pro Glu Ala Ala Gly Lys Ala Phe Val His Ser Pro Val 645 650 655 Ser Phe Asp Leu Thr Val Gly Ala Leu Tyr Ala Pro Leu Val Ser Gly 660 665 670 Gly Cys Leu Arg Leu Gly Ser Phe Thr Asp Asp Lys Ile Leu Asp Leu 675 680 685 Gly Glu Asp Ser Pro Thr Phe Met Lys Ala Thr Pro Ser His Leu Ala 690 695 700 Val Leu Asp Ser Leu Pro Asp Glu Ile Ser Pro Thr Gly Ala Ile Thr 705 710 715 720 Leu Gly Gly Glu Gln Leu Leu Ser Glu Thr Leu Asp Pro Trp Arg Ala 725 730 735 Arg His Pro Gly Val Thr Val Phe Asn Val Tyr Gly Pro Thr Glu Thr 740 745 750 Thr Ile Asn Cys Ala Glu His Arg Ile Ala Pro Gly Thr Thr Leu Pro 755 760 765 Pro Gly Pro Val Pro Ile Gly Arg Pro Leu Trp Asn Thr Arg Leu Tyr 770 775 780 Val Leu Asp Gly Gly Leu Arg Val Val Pro Thr Gly Val Ala Gly Glu 785 790 795 800 Leu Tyr Val Ala Gly Ala Gly Leu Ala Arg Gly Tyr Leu Gly Arg Pro 805 810 815 Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe Gly Ala Pro Gly 820 825 830 Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Arg Thr Asp Gly 835 840 845 Thr Leu Glu Phe Val Gly Arg Val Asp Asp Gln Val Lys Val Arg Gly 850 855 860 Phe Arg Ile Glu Leu Gly Glu Val Glu Ala Thr Val Ala Ala Thr Pro 865 870 875 880 Gly Val Ala Arg Ala Ile Val Ala Val Arg Glu Asp Arg Pro Gly Asp 885 890 895 Gln Arg Leu Val Ala Tyr Val Thr Pro Ala Asp Val Asp Pro Thr Gly 900 905 910 Gly Leu Pro Ser Ala Val Thr Ala His Ala Ala Ala Arg Leu Pro Ala 915 920 925 Tyr Met Val Pro Ser Ala Val Val Val Leu His Glu Val Pro Leu Thr 930 935 940 Pro Asn Gly Lys Ile Asn Arg Ala Ala Leu Pro Ala Pro Glu Ala Val 945 950 955 960 Ser Gly Ala Gly Phe Arg Ala Pro Gly Thr Ala Arg Glu Glu Val Leu 965 970 975 Cys Gly Leu Phe Ala Glu Val Leu Gly Leu Glu Arg Val Gly Thr Ala 980 985 990 Asp Asp Phe Phe Glu Leu Gly Gly His Ser Leu Leu Ala Thr Arg Leu 995 1000 1005 Val Ser Arg Val Arg Ser Val Leu Gly Val Glu Leu Gly Val Arg Ala 1010 1015 1020 Leu Phe Asp Ala Pro Thr Pro Gly Arg Leu Asp Arg Leu Leu Gly Glu 1025 1030 1035 1040 Arg Ser Gly Ala Pro Val Arg Ala Pro Leu Thr Ala Arg Glu Arg Thr 1045 1050 1055 Gly Arg Asp Pro Leu Ser Tyr Ala Gln Gln Arg Leu Trp Phe Leu His 1060 1065 1070 Glu Leu Glu Gly His Gly Ala Thr Tyr Asn Ile Pro Leu Ala Leu Arg 1075 1080 1085 Leu Thr Gly Pro Leu Asp Val Thr Ala Leu Glu Ala Ala Leu Thr Asp 1090 1095 1100 Val Val Ala Arg His Glu Ser Leu Arg Thr Leu Ile Ala Arg Asp Gly 1105 1110 1115 1120 Thr Gly Thr Ala Trp Gln His Ile Leu Pro Thr Gly Asp Pro Arg Ala 1125 1130 1135 Arg Ile Thr Leu Glu Ala Val Pro Leu His Arg Asp Glu Leu Ala Gly 1140 1145 1150 Arg Leu Ala Glu Ala Ala Arg His Pro Phe Asp Leu Thr Ala Glu Ile 1155 1160 1165 Pro Val Arg Ala Thr Val Phe Arg Thr Glu Arg Asp Asp His Thr Leu 1170 1175 1180 Leu Val Val Thr His His Ile Ala Ser Asp Arg Trp Ser Arg Glu Pro 1185 1190 1195 1200 Phe Leu Arg Asp Leu Ser Ala Ala Tyr Ala Ala Arg Arg Ala His Ser 1205 1210 1215 Ala Pro Glu Leu Pro Pro Leu Ser Val Gln Tyr Ala Asp Tyr Ala Ala 1220 1225 1230 Trp Gln Arg Asp Val Leu Gly Thr Glu Asp Asp Gly Thr Ser Glu Met 1235 1240 1245 Ala Gly Gln Leu Ala His Trp Arg Gly Arg Leu Ala Gly Leu Pro Gln 1250 1255 1260 Gly Leu Asp Leu Pro Thr Asp Arg Pro Arg Arg Pro Asp Val Gly Arg 1265 1270 1275 1280 Arg Gly Gly Arg Cys Arg Leu Glu Ile Pro Ala Ala Leu His Arg Asp 1285 1290 1295 Ile Val Thr Leu Ala Arg Val Thr Ser Thr Thr Val Phe Met Val Val 1300 1305 1310 Gln Ala Ala Leu Ala Gly Leu Leu Ser Arg Leu Gly Ala Gly Thr Asp 1315 1320 1325 Ile Pro Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp Glu Ala Thr Glu 1330 1335 1340 His Leu Ile Gly Phe Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val 1345 1350 1355 1360 Ser Gly Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr 1365 1370 1375 Asp Leu Asp Ala Tyr Ala His Gln Asp Val Pro Phe Glu Arg Leu Val 1380 1385 1390 Glu Val Leu Asn Pro Glu Arg Ser Leu Leu Arg His Pro Leu Phe Gln 1395 1400 1405 Ile Leu Leu Ala Phe Gln Asn Thr Glu Asp Arg Ser Ile Ser Asp Arg 1410 1415 1420 Pro Gly Thr Leu Leu Pro Asp Leu Gln Val Thr Glu Gln Pro Leu Asp 1425 1430 1435 1440 Ala Gly Thr Ala Lys Phe Asp Leu Ala Phe Ala Phe Thr Glu Arg Pro 1445 1450 1455 Pro Glu Lys Gly Glu Pro Ser Gly Ile Thr Gly Ile Val Glu Tyr His 1460 1465 1470 Ala Asp Leu Tyr Asp Glu Gly Thr Val Arg Gln Ile Ala Asp Cys Phe 1475 1480 1485 Val Gln Phe Leu Asp Ala Ala Val His Ala Pro Gly Thr Arg Val Asp 1490 1495 1500 Ala Val Gly Leu Leu Pro Glu His Thr Leu His Lys Leu Leu Thr Arg 1505 1510 1515 1520 Ser Arg Gly Thr Val Thr Gly Leu Pro Pro Ala Thr Leu Pro Glu Leu 1525 1530 1535 Phe Glu Ala Arg Val Ala Ala His Pro Gly His Ile Ala Val Glu Val 1540 1545 1550 Ala Gly Arg Arg Pro Ala Thr Thr Thr Tyr Asp Ala Leu Asn Arg Arg 1555 1560 1565 Ala Asn Arg Leu Ala Arg Leu Leu Thr Asp Arg Gly Val Arg Pro Glu 1570 1575 1580 Gln Arg Val Ala Ile Ala Leu Pro Arg Ser Ala Asp Leu Val Thr Ala 1585 1590 1595 1600 Trp Leu Gly Ile Leu Lys Ala Gly Ala Val Cys Val Pro Val Asp Pro 1605 1610 1615 Ala Tyr Pro Asp Asp Arg Ile Ala His Met Ala Ala Asp Ala Ala Pro 1620 1625 1630 Ala Leu Leu Ile Ala Ser Ala Ala Thr Arg Asp Arg Met Leu Pro Thr 1635 1640 1645 Gly Ile Pro Val Leu Asp Leu Asp Asp Pro Ala Val Thr Ala Ala Leu 1650 1655 1660 Ala Ala Ala Pro Asp Gly Asn Pro Arg Gly Thr Gly Leu Leu Pro Ala 1665 1670 1675 1680 His Pro Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys 1685 1690 1695 Gly Val Val Val Thr His Glu Gly Ile Pro Ala Leu Ala Ala Thr Gln 1700 1705 1710 Gln Glu Ala Leu Arg Ala Gly Pro Gly Asp Arg Val Leu Gln Leu Val 1715 1720 1725 Ser Thr Ser Phe Asp Ala Ser Val Trp Asp Leu Cys Ser Ala Leu Leu 1730 1735 1740 Ser Gly Ala Thr Leu Val Leu Ala Pro Asp Ala Asp Leu Phe Gly Asp 1745 1750 1755 1760 Glu Leu Ala Ala Ala Leu Thr Ala His Arg Ile Thr His Val Thr Leu 1765 1770 1775 Pro Pro Ala Ala Leu Ala Ala Val Pro Ala Gly Ala Ala Pro Pro Arg 1780 1785 1790 Leu Thr Val Thr Val Thr Gly Asp Val Cys Gly Pro Gln Leu Val Asp 1795 1800 1805 Arg Trp Ala Gly Gly Glu Arg Arg Ile Leu Asn Gly Tyr Gly Pro Thr 1810 1815 1820 Glu Val Thr Val Gly Ala Thr Tyr Ala Val Cys Glu Arg Thr Gly Asp 1825 1830 1835 1840 Gly Ala Pro Val Pro Ile Gly Ala Pro Trp Pro Asp Gln Arg Val Tyr 1845 1850 1855 Val Leu Glu His Arg Leu Arg Pro Val Pro Ala Gly Cys Val Gly Glu 1860 1865 1870 Ile Tyr Val Ala Gly Ala Gly Leu Ala Arg Gly Tyr Leu Gly Arg Pro 1875 1880 1885 Gly Gln Thr Ala Glu Arg Phe Val Ala Asp Pro Phe Gly Ala Pro Gly 1890 1895 1900 Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg Arg Arg Ser Asp Gly 1905 1910 1915 1920 His Leu Leu Phe Glu Gly Arg Ala Asp Thr Gln Val Lys Ile Arg Gly 1925 1930 1935 Phe Arg Val Glu Leu Ala Glu Ile Glu Ala Ala Leu Ala Ser His Pro 1940 1945 1950 Gly Val Glu Asp Ala Val Val Thr Val Tyr Asp Asp Gly Leu Gly Asp 1955 1960 1965 Gln Arg Leu Val Ala Tyr Val Thr Gly Gly Pro Gly Thr Pro Ser Ala 1970 1975 1980 Ala Ala Leu Arg Ala His Leu Ala Ser Arg Leu Pro Arg His Met Val 1985 1990 1995 2000 Pro Gly Asp Val Leu Thr Leu Asp Ala Leu Pro Leu Thr Ala Asn Gly 2005 2010 2015 Lys Val Asp Arg Thr Ala Leu Pro Gly Pro Gly Thr Gln Thr Ala Ala 2020 2025 2030 Pro Gly Arg Ala Pro Gln Ser Pro Gln Glu Arg Val Leu Cys Ala Leu 2035 2040 2045 Phe Ala Asp Val Leu Gly Arg Glu Thr Val Gly Val Asp Glu Gly Phe 2050 2055 2060 Phe Asp Leu Gly Gly His Ser Leu Leu Ala Thr Arg Leu Ala Ala Arg 2065 2070 2075 2080 Val Arg Ala Ala Leu Gly Val Glu Ile Ser Val Arg Thr Leu Phe Glu 2085 2090 2095 Ala Pro Thr Pro Ala Leu Leu Ala Ser Ala Cys Thr Ala Asp Ala Ala 2100 2105 2110 Ala Tyr Asp Pro Phe Glu Thr Val Leu Pro Leu Arg Arg Thr Gly Ser 2115 2120 2125 Arg Pro Pro Leu Phe Cys Val His Ala Gly Met Gly Leu Ser Trp Ala 2130 2135 2140 Tyr Ala Gly Leu Leu Ser His Leu Asp Ala Asp Val Pro Val Tyr Gly 2145 2150 2155 2160 Leu Gln Ala Arg Arg Leu Thr Ala Pro Gly Gly Leu Pro Gly Ser Val 2165 2170 2175 Glu Glu Met Ala Glu Asp Tyr Ala Gly Glu Ile Arg Arg Leu Cys Pro 2180 2185 2190 Asp Gly Pro Tyr Arg Leu Leu Gly Trp Ser Phe Gly Gly Thr Val Ala 2195 2200 2205 His Ala Val Ala Thr Arg Leu Gln Gln Gln Gly His Thr Val Glu Leu 2210 2215 2220 Leu Ala Val Leu Asp Ala Tyr Pro Val Thr Gly Ala Arg Pro Asp Ala 2225 2230 2235 2240 Glu Val Asp Glu Gln Arg Ile Val Ala Asp Tyr Leu Ala Gln Leu Gly 2245 2250 2255 Ser Pro Val Ala Pro Glu Arg Leu Glu Gly Asp Ala Trp Leu Pro Glu 2260 2265 2270 Phe Leu Glu Phe Val Arg Arg Thr Asp Gly Pro Ala Arg Asp Phe Asp 2275 2280 2285 Ala Gly Arg Ile Leu Ala Met Lys Asp Val Phe Leu Asn Asn Ala Arg 2290 2295 2300 Leu Thr Arg Arg Phe Thr Pro Gly Val Phe Thr Gly Asp Met Val Phe 2305 2310 2315 2320 Phe Ala Ser Ala Arg Pro Gly Ser Glu Gln Ala Ala Glu Arg Val Gly 2325 2330 2335 Leu Trp His Pro His Val Thr Gly Asp Leu Asp Leu His Leu Ile Asp 2340 2345 2350 Cys Ala His Glu Glu Met Thr Asp Pro Ala Ala Leu Thr Arg Ile Gly 2355 2360 2365 Pro Val Leu Ala Ala Arg Leu Gly Ala Gly Thr 2370 2375 <210> 8 <211> 272 <212> PRT <213> Streptomyces roseosporus <400> 8 Met Arg Ala Thr Ser Arg Met Ile Gln Val Asn Gly Ala Arg Ile Ala 1 5 10 15 Cys Ser Asp Ser Gly Cys Gly Asp Pro Val Leu Met Ile Ala Gly Thr 20 25 30 Gly Ser Thr Gly Arg Val Trp Asp Ala Tyr Gln Val Pro Asp Leu His 35 40 45 Ala Ala Gly Phe Arg Thr Ile Thr Phe Thr Asn Arg Gly Val Pro Pro 50 55 60 Ser Asp Glu Cys Glu Arg Gly Phe Thr Leu Ala Asp Leu Ala Ala Asp 65 70 75 80 Thr Ala Ala Leu Ile Glu Gln Val Ala Gly Gly Pro Cys Arg Val Val 85 90 95 Gly Thr Ser Leu Gly Ala Gln Val Ala Gln Glu Val Ala Leu Ala Arg 100 105 110 Pro Asp Leu Val Thr Gln Ala Val Phe Met Ala Thr Arg Gly Arg Thr 115 120 125 Asp Ala Met Arg Ala Ala Ala Thr Arg Ala Ala Ala Ala Leu Tyr Asp 130 135 140 Ser Gly Val Glu Leu Pro Pro Ala Tyr Ala Ala Ala Val Arg Ala Leu 145 150 155 160 Gln Asn Leu Ser Pro His Thr Leu Arg Asp Arg His Gln Val Glu Asp 165 170 175 Trp Leu Pro Leu Phe Glu Tyr Ala Glu Arg Asp Gly Pro Gly Val Arg 180 185 190 Ala Gln Leu Glu Leu Gly Leu Leu Pro Asp Arg Leu Ala Asp Tyr Arg 195 200 205 Asp Ile Thr Val Pro Cys Leu Val Ile Ala Phe Glu Asp Asp Val Val 210 215 220 Thr Pro Pro Tyr Leu Gly Arg Glu Val Ala Asp Ala Ile Pro Gly Ala 225 230 235 240 Arg Phe Glu Thr Val Pro Arg Cys Gly His Tyr Gly Tyr Leu Glu Asp 245 250 255 Ala Ser Ala Val Asn Lys Ile Leu Arg Asp Phe Phe Arg Thr Ser Asn 260 265 270 <210> 9 <211> 5830 <212> PRT <213> Streptomyces roseosporus <400> 9 Met Asp Met Gln Ser Gln Arg Leu Gly Val Thr Ala Ala Gln Gln Ser 1 5 10 15 Val Trp Leu Ala Gly Gln Leu Ala Asp Asp His Arg Leu Tyr His Cys 20 25 30 Ala Ala Tyr Leu Ser Leu Thr Gly Ser Ile Asp Pro Arg Thr Leu Gly 35 40 45 Thr Ala Val Arg Arg Thr Leu Asp Glu Thr Glu Ala Leu Arg Thr Arg 50 55 60 Phe Val Pro Gln Asp Gly Glu Leu Leu Gln Ile Leu Glu Pro Gly Ala 65 70 75 80 Gly Gln Leu Leu Leu Glu Ala Asp Phe Ser Gly Asp Pro Asp Pro Glu 85 90 95 Arg Ala Ala His Asp Trp Met His Ala Ala Leu Ala Ala Pro Val Arg 100 105 110 Leu Asp Arg Ala Gly Thr Ala Thr His Ala Leu Leu Thr Leu Gly Pro 115 120 125 Ser Arg His Leu Leu Tyr Phe Gly Tyr His His Ile Ala Leu Asp Gly 130 135 140 Tyr Gly Ala Leu Leu His Leu Arg Arg Leu Ala His Val Tyr Thr Ala 145 150 155 160 Leu Ser Asn Gly Asp Asp Pro Gly Pro Cys Pro Phe Gly Pro Leu Ala 165 170 175 Gly Val Leu Thr Glu Glu Ala Ala Tyr Arg Asp Ser Asp Asn His Arg 180 185 190 Arg Asp Gly Glu Phe Trp Thr Arg Ser Leu Ala Gly Ala Asp Glu Ala 195 200 205 Pro Gly Leu Ser Glu Arg Glu Ala Gly Ala Leu Ala Val Pro Leu Arg 210 215 220 Arg Thr Val Glu Leu Ser Gly Glu Arg Thr Glu Lys Leu Ala Ala Ser 225 230 235 240 Ala Ala Ala Thr Gly Ala Arg Trp Ser Ser Leu Leu Val Ala Ala Thr 245 250 255 Ala Ala Phe Val Arg Arg His Ala Ala Ala Asp Asp Thr Val Ile Gly 260 265 270 Leu Pro Val Thr Ala Arg Leu Thr Gly Pro Ala Leu Arg Thr Pro Cys 275 280 285 Met Leu Ala Asn Asp Val Pro Leu Arg Leu Asp Ala Arg Leu Asp Ala 290 295 300 Pro Phe Ala Ala Leu Leu Ala Asp Thr Thr Arg Ala Val Gly Thr Leu 305 310 315 320 Ala Arg His Gln Arg Phe Arg Gly Glu Glu Leu His Arg Asn Leu Gly 325 330 335 Gly Val Gly Arg Thr Ala Gly Leu Ala Arg Val Thr Val Asn Val Leu 340 345 350 Ala Tyr Val Asp Asn Ile Arg Phe Gly Asp Cys Arg Ala Val Val His 355 360 365 Glu Leu Ser Ser Gly Pro Val Arg Asp Phe His Ile Asn Ser Tyr Gly 370 375 380 Thr Pro Gly Thr Pro Asp Gly Val Gln Leu Val Phe Ser Gly Asn Pro 385 390 395 400 Ala Leu Tyr Thr Ala Thr Asp Leu Ala Asp His Gln Glu Arg Phe Leu 405 410 415 Arg Phe Leu Asp Ala Val Thr Ala Asp Pro Asp Leu Pro Thr Gly Arg 420 425 430 His Arg Leu Leu Ser Pro Gly Thr Arg Ala Arg Leu Leu Asp Asp Ser 435 440 445 Arg Gly Thr Glu Arg Pro Val Pro Arg Ala Thr Leu Pro Glu Leu Phe 450 455 460 Ala Glu Gln Ala Arg Arg Thr Pro Asp Ala Pro Ala Val Gln His Asp 465 470 475 480 Gly Thr Val Leu Thr Tyr Arg Asp Leu His Arg Ser Val Glu Arg Ala 485 490 495 Ala Gly Arg Leu Ala Gly Leu Gly Leu Arg Thr Glu Asp Val Val Ala 500 505 510 Leu Ala Leu Pro Lys Ser Ala Glu Ser Val Ala Ile Leu Leu Gly Ile 515 520 525 Gln Arg Ala Gly Ala Ala Tyr Val Pro Leu Asp Pro Thr His Pro Ala 530 535 540 Glu Arg Leu Ala Arg Val Leu Asp Asp Thr Arg Pro Arg Tyr Leu Val 545 550 555 560 Thr Thr Gly His Ile Asp Gly Leu Ser His Pro Thr Pro Gln Leu Ala 565 570 575 Ala Ala Asp Leu Leu Arg Glu Gly Gly Pro Glu Pro Ala Pro Gly Arg 580 585 590 Pro Ala Pro Gly Asn Ala Ala Tyr Ile Ile Gln Thr Ser Gly Ser Thr 595 600 605 Gly Arg Pro Lys Gly Val Val Val Thr His Glu Gly Leu Ala Thr Leu 610 615 620 Ala Ala Asp Gln Ile Arg Arg Tyr Arg Thr Gly Pro Asp Ala Arg Val 625 630 635 640 Leu Gln Phe Ile Ser Pro Gly Phe Asp Val Phe Val Ser Glu Leu Ser 645 650 655 Met Thr Leu Leu Ser Gly Gly Cys Leu Val Ile Pro Pro Asp Gly Leu 660 665 670 Thr Gly Arg His Leu Ala Asp Phe Leu Ala Ala Glu Ala Val Thr Thr 675 680 685 Thr Ser Leu Thr Pro Gly Ala Leu Ala Thr Met Pro Ala Thr Asp Leu 690 695 700 Pro His Leu Arg Thr Leu Ile Val Gly Gly Glu Val Cys Pro Pro Glu 705 710 715 720 Ile Phe Asp Gln Trp Gly Arg Gly Arg Asp Ile Val Asn Ala Tyr Gly 725 730 735 Pro Thr Glu Thr Thr Val Glu Ala Thr Ala Trp His Arg Asp Gly Ala 740 745 750 Thr His Gly Pro Val Pro Leu Gly Arg Pro Thr Leu Asn Arg Arg Gly 755 760 765 Tyr Val Leu Asp Pro Ala Leu Glu Pro Val Pro Asp Gly Thr Thr Gly 770 775 780 Glu Leu Tyr Leu Ala Gly Glu Gly Leu Ala Arg Gly Tyr Val Ala Ala 785 790 795 800 Pro Gly Pro Thr Ala Glu Arg Phe Val Ala Asp Pro Phe Gly Pro Pro 805 810 815 Gly Ser Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Arg Arg Ser Gly 820 825 830 Gly Met Leu Glu Phe Val Gly Arg Ala Asp Gly Gln Val Lys Leu Arg 835 840 845 Gly Phe Arg Ile Glu Leu Gly Glu Val Gln Ala Ala Leu Thr Ala Leu 850 855 860 Pro Gly Val Arg Gln Ala Gly Val Leu Ile Arg Glu Asp Arg Pro Gly 865 870 875 880 Asp Pro Arg Leu Val Gly Tyr Ile Val Pro Ala Pro Gly Ala Glu Pro 885 890 895 Asp Ala Gly Glu Leu Arg Ala Ala Leu Ala Arg Thr Leu Pro Pro His 900 905 910 Met Val Pro Trp Ala Leu Val Pro Leu Pro Ala Leu Pro Leu Thr Ser 915 920 925 Asn Gly Lys Leu Asp Arg Ala Ala Leu Pro Val Pro Ala Ala Arg Ala 930 935 940 Gly Gly Ser Gly Gln Arg Pro Val Thr Pro Gln Glu Lys Thr Leu Cys 945 950 955 960 Ala Leu Phe Ala Asp Val Leu Gly Val Thr Glu Val Ala Thr Asp Asp 965 970 975 Val Phe Phe Glu Leu Gly Gly His Ser Leu Asn Gly Thr Arg Leu Leu 980 985 990 Ala Arg Ile Arg Thr Glu Phe Gly Thr Asp Leu Thr Leu Arg Asp Leu 995 1000 1005 Phe Ala Phe Pro Thr Val Ala Gly Leu Leu Pro Leu Leu Asp Asp Asn 1010 1015 1020 Gly Arg Gln His Thr Thr Pro Pro Leu Pro Pro Arg Pro Glu Arg Leu 1025 1030 1035 1040 Pro Leu Ser His Ala Gln Gln Arg Leu Trp Phe Leu Asp Gln Val Glu 1045 1050 1055 Gly Pro Ser Pro Ala Tyr Asn Ile Pro Thr Ala Val Arg Leu Glu Gly 1060 1065 1070 Pro Leu Asp Ile Pro Ala Leu Ala Val Ala Leu Gln Asp Val Thr Asn 1075 1080 1085 Arg His Glu Pro Leu Arg Thr Leu Leu Ala Glu Asp Ser Glu Gly Pro 1090 1095 1100 His Gln Val Ile Leu Pro Pro Glu Ala Ala Arg Pro Glu Leu Thr His 1105 1110 1115 1120 Ser Thr Val Ala Pro Gly Asp Leu Ala Ala Ala Leu Ala Glu Ala Ala 1125 1130 1135 Arg Arg Pro Phe Asp Leu Ala Gly Glu Ile Pro Leu Lys Ala His Leu 1140 1145 1150 Phe Gly Cys Gly Pro Asp Asp His Thr Leu Leu Leu Leu Val His His 1155 1160 1165 Thr Ala Gly Asp Gly Ala Ser Val Glu Val Leu Val Arg Asp Leu Ala 1170 1175 1180 His Ala Tyr Gly Ala Arg Arg Ala Gly Asp Ala Pro His Phe Glu Pro 1185 1190 1195 1200 Leu Pro Leu Gln Tyr Ala Asp His Thr Leu Arg Arg Arg His Leu Leu 1205 1210 1215 Asp Asp Pro Ser Asp Ser Thr Gln Leu Asp His Trp Arg Asp Ala Leu 1220 1225 1230 Ala Gly Leu Pro Glu Gln Leu Glu Leu Pro Thr Asp His Thr Arg Pro 1235 1240 1245 Ala Val Pro Thr Arg Arg Gly Glu Ala Ile Ala Phe Thr Val Pro Glu 1250 1255 1260 His Thr His His Thr Leu Arg Ala Met Ala Gln Ala His Gly Val Thr 1265 1270 1275 1280 Val Phe Met Val Met Gln Ala Ala Leu Ala Ala Leu Leu Ser Arg His 1285 1290 1295 Gly Ala Gly His Asp Ile Pro Leu Gly Thr Pro Val Ala Gly Arg Ser 1300 1305 1310 Asp Asp Gly Thr Glu Asp Leu Val Gly Phe Phe Val Asn Thr Leu Val 1315 1320 1325 Leu Arg Asn Asp Val Ser Gly Asp Pro Thr Phe Ala Glu Leu Val Ser 1330 1335 1340 Arg Val Arg Ala Ala Asn Leu Asp Ala Tyr Ala Tyr Gln Asp Val Pro 1345 1350 1355 1360 Phe Glu Arg Leu Val Asp Val Leu Lys Pro Glu Arg Ser Leu Ser Trp 1365 1370 1375 His Pro Leu Phe Gln Ile Met Ile Ala Tyr Asn Gly Pro Ala Thr Asn 1380 1385 1390 Asp Thr Ala Asp Gly Ser Arg Phe Ala Gly Leu Thr Ser Arg Val His 1395 1400 1405 Ala Val His Thr Gly Met Ser Lys Phe Asp Leu Ser Phe Phe Leu Thr 1410 1415 1420 Glu His Ala Asp Gly Leu Gly Ile Asp Gly Ala Leu Glu Phe Ser Thr 1425 1430 1435 1440 Asp Leu Phe Thr Arg Ile Thr Ala Glu Arg Leu Val Gln Arg Tyr Leu 1445 1450 1455 Thr Val Leu Glu Gln Ala Ala Gly Ala Pro Asp Arg Pro Ile Ser Ser 1460 1465 1470 Tyr Glu Leu Leu Gly Asp Asp Glu Arg Ala Leu Leu Ala Gln Trp Asn 1475 1480 1485 Asp Thr Ala His Pro Thr Pro Pro Gly Thr Val Leu Asp Leu Leu Glu 1490 1495 1500 Ser Arg Ala Ala Arg Thr Pro Asp Arg Pro Ala Val Val Glu Asn Asp 1505 1510 1515 1520 His Val Leu Thr Tyr Ala Asp Leu His Thr Arg Ala Asn Arg Leu Ala 1525 1530 1535 Arg His Leu Ile Thr Ala His Gly Val Gly Pro Glu Arg Leu Val Ala 1540 1545 1550 Val Ala Leu Pro Arg Ser Ala Glu Leu Leu Val Ala Leu Leu Ala Val 1555 1560 1565 Leu Lys Thr Gly Ala Ala Tyr Val Pro Leu Asp Leu Thr His Pro Ala 1570 1575 1580 Glu Arg Thr Ala Val Val Leu Asp Asp Cys Arg Pro Ala Val Ile Leu 1585 1590 1595 1600 Thr Asp Ala Gly Ala Ala Arg Glu Leu Pro Arg Arg Asp Ile Pro Gln 1605 1610 1615 Leu Arg Leu Asp Glu Pro Glu Val His Ala Ala Ile Ala Glu Gln Pro 1620 1625 1630 Gly Gly Pro Val Thr Asp Arg Asp Arg Thr Cys Val Thr Pro Val Ser 1635 1640 1645 Gly Glu His Val Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Arg 1650 1655 1660 Pro Lys Gly Val Ala Val Glu His Arg Ser Leu Ala Asp Phe Val Arg 1665 1670 1675 1680 Tyr Ser Val Thr Ala Tyr Pro Gly Ala Phe Asp Val Thr Leu Leu His 1685 1690 1695 Ser Pro Val Thr Phe Asp Leu Thr Val Thr Ser Leu Phe Pro Pro Leu 1700 1705 1710 Val Val Gly Gly Ala Ile His Val Ala Asp Leu Thr Glu Ala Cys Pro 1715 1720 1725 Pro Ser Leu Ala Ala Ala Gly Gly Pro Thr Phe Val Lys Ala Thr Pro 1730 1735 1740 Ser His Leu Pro Leu Leu Thr His Glu Ala Thr Trp Ala Ala Ser Ala 1745 1750 1755 1760 Lys Val Leu Leu Val Gly Gly Glu Gln Leu Leu Gly Arg Glu Leu Asp 1765 1770 1775 Lys Trp Arg Ala Gly Ser Pro Glu Ala Val Val Phe Asn Asp Tyr Gly 1780 1785 1790 Pro Thr Glu Ala Thr Val Asn Cys Val Asp Phe Arg Ile Asp Pro Gly 1795 1800 1805 Gln Pro Ile Gly Ala Gly Pro Val Ala Ile Gly Arg Pro Leu Arg Asn 1810 1815 1820 Thr Arg Val Phe Val Leu Asp Gly Gly Leu Arg Ala Val Pro Val Gly 1825 1830 1835 1840 Val Val Gly Glu Leu His Val Ala Gly Glu Gly Leu Ala Arg Gly Tyr 1845 1850 1855 Leu Gly Gln Pro Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe 1860 1865 1870 Gly Asp Ala Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp 1875 1880 1885 Arg Ala Asp Gly Met Leu Glu Phe Val Gly Arg Val Asp Asp Gln Val 1890 1895 1900 Lys Val Arg Gly Phe Arg Ile Glu Leu Gly Glu Val Glu Ala Ala Val 1905 1910 1915 1920 Ala Ala Cys Pro Gly Val Asp Arg Ser Val Val Val Val Arg Glu Asp 1925 1930 1935 Arg Pro Gly Asp Arg Arg Leu Val Ala Tyr Val Thr Ala Ala Gly Asp 1940 1945 1950 Glu Ala Glu Gly Leu Ala Pro Leu Ile Val Glu Thr Ala Ala Gly Arg 1955 1960 1965 Leu Pro Gly Tyr Met Val Pro Ser Ala Val Val Val Leu Asp Glu Ile 1970 1975 1980 Pro Leu Thr Pro Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Ala Pro 1985 1990 1995 2000 Arg Val Ala Pro Ala Ala Glu Phe Arg Val Thr Gly Ser Pro Arg Glu 2005 2010 2015 Glu Ala Leu Cys Ala Leu Phe Ala Glu Val Leu Gly Val Glu Arg Val 2020 2025 2030 Gly Val Asp Asp Gly Phe Phe Asp Leu Gly Gly Asp Ser Ile Leu Ser 2035 2040 2045 Ile Gln Leu Val Ala Arg Ala Arg Arg Ala Gly Leu Glu Val Ser Val 2050 2055 2060 Arg Asp Val Phe Glu His Arg Thr Val Arg Ala Leu Ala Gly Val Val 2065 2070 2075 2080 Arg Glu Ser Gly Gly Val Ala Ala Ala Val Val Asp Ser Gly Val Gly 2085 2090 2095 Ala Val Glu Arg Trp Pro Val Val Glu Trp Leu Ala Glu Arg Gly Gly 2100 2105 2110 Gly Gly Leu Gly Gly Ala Val Arg Ala Phe Asn Gln Ser Val Val Val 2115 2120 2125 Ala Thr Pro Ala Gly Ile Thr Trp Asp Glu Leu Arg Thr Val Leu Asp 2130 2135 2140 Ala Val Arg Glu Arg His Asp Ala Trp Arg Leu Arg Val Val Asp Ser 2145 2150 2155 2160 Gly Asp Gly Ala Trp Ser Leu Arg Val Asp Ala Pro Ala Pro Gly Gly 2165 2170 2175 Glu Pro Asp Trp Ile Thr Arg His Gly Met Ala Ser Ala Asp Leu Glu 2180 2185 2190 Glu Gln Val Asn Ala Val Arg Ala Ala Ala Val Glu Ala Arg Ser Arg 2195 2200 2205 Leu Asp Pro Leu Thr Gly Arg Met Val Arg Ala Val Trp Leu Asp Arg 2210 2215 2220 Gly Pro Asp Arg Arg Gly Val Leu Val Leu Val Ala His His Leu Val 2225 2230 2235 2240 Val Asp Gly Val Ser Trp Arg Ile Val Leu Gly Asp Leu Gly Glu Ala 2245 2250 2255 Trp Thr Gln Ala Arg Ala Gly Gly His Val Arg Leu Asp Thr Val Gly 2260 2265 2270 Thr Ser Leu Arg Gly Trp Ala Ala Ala Leu Ala Glu Gln Gly Arg His 2275 2280 2285 Gly Ala Arg Ala Thr Glu Ala Asn Leu Trp Ala Gln Met Val His Gly 2290 2295 2300 Ser Asp Pro Leu Val Gly Pro Arg Ala Val Asp Pro Ser Val Asp Val 2305 2310 2315 2320 Phe Gly Val Val Glu Ser Val Gly Ser Arg Ala Ser Val Gly Val Ser 2325 2330 2335 Arg Ala Leu Leu Thr Glu Val Pro Ser Val Leu Gly Val Gly Val Gln 2340 2345 2350 Glu Val Leu Leu Ala Ala Phe Gly Leu Ala Val Thr Arg Trp Arg Gly 2355 2360 2365 Arg Gly Gly Ser Val Val Val Asp Val Glu Gly His Gly Arg Asn Glu 2370 2375 2380 Asp Ala Val Pro Gly Ala Asp Leu Ser Arg Thr Val Gly Trp Phe Thr 2385 2390 2395 2400 Ser Ile Tyr Pro Val Arg Leu Pro Leu Glu Pro Ala Ala Trp Asp Glu 2405 2410 2415 Ile Arg Ala Gly Gly Pro Ala Val Gly Arg Thr Val Arg Glu Ile Lys 2420 2425 2430 Glu Cys Leu Arg Thr Leu Pro Asp Gln Gly Leu Gly Tyr Gly Ile Leu 2435 2440 2445 Arg Tyr Leu Asp Pro Glu Asn Gly Pro Ala Leu Ala Gln His Pro Thr 2450 2455 2460 Pro His Phe Gly Phe Asn Tyr Leu Gly Arg Val Ser Val Ser Ala Asp 2465 2470 2475 2480 Ala Ala Ser Leu Asp Glu Gly Asp Ala His Ala Asp Gly Leu Gly Gly 2485 2490 2495 Leu Val Gly Gly Arg Ala Ala Ala Asp Ser Asp Glu Glu Gln Trp Ala 2500 2505 2510 Asp Trp Val Pro Val Ser Gly Pro Phe Ala Val Gly Ala Gly Gln Asp 2515 2520 2525 Pro Val Leu Pro Val Ala His Ala Val Glu Phe Asn Ala Ile Thr Leu 2530 2535 2540 Asp Thr Pro Asp Gly Pro Arg Leu Ser Val Thr Trp Ser Trp Pro Thr 2545 2550 2555 2560 Thr Leu Leu Ser Glu Ser Arg Ile Arg Glu Leu Ala Arg Phe Trp Asp 2565 2570 2575 Glu Ala Leu Glu Gly Leu Val Ala His Ala Arg Arg Pro Asp Ala Gly 2580 2585 2590 Gly Leu Thr Pro Ser Asp Leu Pro Leu Val Ala Leu Asp His Ala Glu 2595 2600 2605 Leu Glu Ala Leu Gln Ala Asp Val Thr Gly Gly Val His Asp Ile Leu 2610 2615 2620 Pro Val Ser Pro Leu Gln Glu Gly Leu Leu Phe His Ser Ser Phe Ala 2625 2630 2635 2640 Ala Asp Gly Val Asp Val Tyr Val Gly Gln Leu Thr Phe Asp Leu Thr 2645 2650 2655 Gly Pro Val Asp Ala Asp His Leu His Ala Val Val Glu Ser Leu Val 2660 2665 2670 Thr Arg His Asp Val Leu Arg Thr Gly Tyr Arg Gln Ala Gln Ser Gly 2675 2680 2685 Glu Trp Ile Ala Val Val Ala Arg Gln Val His Thr Pro Trp Gln Tyr 2690 2695 2700 Ile His Thr Leu Asp Thr Asp Ala Asp Thr Leu Thr Asn Asp Glu Arg 2705 2710 2715 2720 Trp Arg Pro Phe Asp Met Thr Gln Gly Pro Leu Ala Arg Phe Thr Leu 2725 2730 2735 Ala Arg Ile Asn Asp Thr His Phe Arg Phe Ile Val Thr Tyr His His 2740 2745 2750 Val Ile Leu Asp Gly Trp Ser Val Ala Val Leu Ile Arg Glu Leu Phe 2755 2760 2765 Thr Thr Tyr Arg Asp Thr Ala Leu Gly Arg Arg Pro Glu Val Pro Tyr 2770 2775 2780 Ser Pro Pro Arg Arg Asp Phe Met Ala Trp Leu Ala Glu Arg Asp Gln 2785 2790 2795 2800 Thr Ala Ala Gly Gln Ala Trp Arg Ser Ala Leu Ala Gly Leu Ala Glu 2805 2810 2815 Pro Thr Val Leu Ala Leu Gly Thr Glu Gly Ser Gly Val Ile Pro Glu 2820 2825 2830 Val Leu Glu Glu Glu Ile Ser Glu Glu Leu Thr Ser Glu Leu Val Ala 2835 2840 2845 Trp Ala Arg Gly Arg Gly Val Thr Val Ala Ser Val Val Gln Ala Ala 2850 2855 2860 Trp Ala Leu Val Leu Gly Arg Leu Val Gly Arg Asp Asp Val Val Phe 2865 2870 2875 2880 Gly Leu Thr Val Ser Gly Arg Pro Ala Glu Val Ala Gly Val Glu Asp 2885 2890 2895 Met Val Gly Leu Phe Val Asn Thr Ile Pro Leu Arg Ala Arg Met Asp 2900 2905 2910 Pro Ala Glu Ser Leu Gly Ala Phe Val Glu Arg Leu Gln Arg Glu Gln 2915 2920 2925 Thr Glu Leu Leu Glu His Gln His Val Arg Leu Ala Glu Val Gln Arg 2930 2935 2940 Trp Ala Gly His Lys Glu Leu Phe Asp Val Gly Met Val Phe Glu Asn 2945 2950 2955 2960 Tyr Pro Met Asp Ser Leu Leu Gln Asp Ser Leu Phe His Gly Ser Gly 2965 2970 2975 Leu Gln Ile Asp Gly Ile Gln Gly Ala Asp Ala Thr His Phe Ala Leu 2980 2985 2990 Asn Leu Ala Val Val Pro Leu Pro Ala Met Arg Phe Arg Leu Gly Tyr 2995 3000 3005 Arg Pro Asp Val Phe Asp Ala Gly Arg Val Arg Glu Leu Trp Gly Trp 3010 3015 3020 Ile Val Arg Ala Leu Glu Cys Val Val Cys Glu Arg Asp Val Pro Val 3025 3030 3035 3040 Ser Gly Val Asp Val Leu Gly Ala Gly Glu Arg Glu Thr Leu Leu Gly 3045 3050 3055 Trp Gly Ala Gly Ala Glu Pro Gly Val Arg Ala Leu Pro Gly Ala Gly 3060 3065 3070 Ala Gly Ala Gly Ala Gly Leu Val Gly Leu Phe Glu Glu Arg Val Arg 3075 3080 3085 Thr Asp Pro Asp Ala Val Ala Val Arg Gly Ala Gly Val Glu Trp Ser 3090 3095 3100 Tyr Ala Glu Leu Asn Ala Arg Ala Asn Ala Val Ala Arg Trp Leu Ile 3105 3110 3115 3120 Gly Arg Gly Val Gly Pro Glu Arg Gly Val Gly Val Val Met Asp Arg 3125 3130 3135 Gly Pro Asp Val Val Ala Met Leu Leu Ala Val Ala Lys Ser Gly Gly 3140 3145 3150 Phe Tyr Leu Pro Val Asp Pro Gln Trp Pro Thr Glu Arg Ile Asp Trp 3155 3160 3165 Val Leu Ala Asp Ala Gly Ile Asp Leu Ala Val Val Gly Glu Asn Leu 3170 3175 3180 Ala Ala Ala Val Glu Ala Val Arg Asp Cys Glu Val Val Asp Tyr Ala 3185 3190 3195 3200 Gln Ile Ala Arg Glu Thr Arg Leu Asn Glu Gln Ala Ala Thr Asp Ala 3205 3210 3215 Gly Asp Val Thr Asp Gly Glu Arg Val Ser Ala Leu Leu Ser Gly His 3220 3225 3230 Pro Leu Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Leu Pro Lys Gly 3235 3240 3245 Val Val Val Thr His Ala Ser Val Gly Ala Tyr Leu Arg Arg Gly Arg 3250 3255 3260 Asn Ala Tyr Arg Gly Ala Ala Asp Gly Leu Gly His Val His Ser Ser 3265 3270 3275 3280 Leu Ala Phe Asp Leu Thr Val Thr Val Leu Phe Thr Pro Leu Val Ser 3285 3290 3295 Gly Gly Cys Val Thr Leu Gly Asp Leu Asp Asp Thr Ala Asn Gly Leu 3300 3305 3310 Gly Ala Thr Phe Leu Lys Ala Thr Pro Ser His Leu Pro Leu Leu Gly 3315 3320 3325 Gln Leu Asp Arg Val Leu Ala Pro Asp Ala Thr Leu Leu Leu Gly Gly 3330 3335 3340 Glu Ala Leu Thr Ala Gly Ala Leu His His Trp Arg Thr His His Pro 3345 3350 3355 3360 His Thr Thr Val Ile Asn Ala Tyr Gly Pro Thr Glu Leu Thr Val Asn 3365 3370 3375 Cys Ala Glu Tyr Arg Ile Pro Pro Gly His Cys Leu Pro Asp Gly Pro 3380 3385 3390 Val Pro Ile Gly Arg Pro Phe Thr Gly His His Leu Phe Val Leu Asp 3395 3400 3405 Pro Ala Leu Arg Leu Thr Pro Pro Asp Thr Ile Gly Glu Leu Tyr Val 3410 3415 3420 Ala Gly Asp Gly Leu Ala Arg Gly Tyr Leu Gly Arg Pro Asp Leu Thr 3425 3430 3435 3440 Ala Glu Arg Phe Val Ala Cys Pro Phe Arg Ser Pro Gly Glu Arg Met 3445 3450 3455 Tyr Arg Thr Gly Asp Leu Ala Arg Trp Arg Ser Asp Gly Thr Leu Glu 3460 3465 3470 Phe Ile Gly Arg Ala Asp Asp Gln Val Lys Ile Arg Gly Phe Arg Ile 3475 3480 3485 Glu Leu Gly Glu Val Glu Ala Ala Val Ala Ala His Pro His Val Ala 3490 3495 3500 Arg Ala Ile Ala Val Val Arg Glu Asp Arg Pro Gly Asp Gln Arg Leu 3505 3510 3515 3520 Val Ala Tyr Val Thr Gly Ser Asp Pro Ser Gly Leu Ser Ser Ala Val 3525 3530 3535 Thr Asp Thr Val Ala Gly Arg Leu Pro Ala Tyr Met Val Pro Ser Ala 3540 3545 3550 Val Val Val Leu Asp Gln Ile Pro Leu Thr Pro Asn Gly Lys Val Asp 3555 3560 3565 Arg Ala Ala Leu Pro Ala Pro Gly Thr Ala Ser Gly Thr Thr Ser Arg 3570 3575 3580 Ala Pro Gly Thr Ala Arg Glu Glu Ile Leu Cys Thr Leu Phe Ala Asp 3585 3590 3595 3600 Val Leu Gly Leu Asp Gln Val Gly Val Asp Glu Asp Phe Phe Asp Leu 3605 3610 3615 Gly Gly His Ser Leu Leu Ala Thr Arg Leu Thr Ser Arg Ile Arg Ser 3620 3625 3630 Ala Leu Gly Ile Asp Leu Gly Val Arg Ala Leu Phe Lys Ala Pro Thr 3635 3640 3645 Val Gly Arg Leu Asp Gln Leu Leu Gln Gln Gln Thr Thr Ser Leu Arg 3650 3655 3660 Ala Pro Leu Val Ala Arg Glu Arg Thr Gly Cys Glu Pro Leu Ser Phe 3665 3670 3675 3680 Ala Gln Gln Arg Leu Trp Phe Leu His Gln Leu Glu Gly Pro Asn Ala 3685 3690 3695 Ala Tyr Asn Ile Pro Met Ala Leu Arg Leu Thr Gly Arg Leu Asp Leu 3700 3705 3710 Thr Ala Leu Glu Ala Ala Leu Thr Asp Val Ile Ala Arg His Glu Ser 3715 3720 3725 Leu Arg Thr Val Ile Ala Gln Asp Asp Ser Gly Gly Val Trp Gln Asn 3730 3735 3740 Ile Leu Pro Thr Asp Asp Thr Arg Thr His Leu Thr Leu Asp Thr Met 3745 3750 3755 3760 Pro Val Asp Ala His Thr Leu Gln Asn Arg Val Asp Glu Ala Ala Arg 3765 3770 3775 His Pro Phe Asp Leu Thr Thr Glu Ile Pro Leu Arg Ala Thr Val Phe 3780 3785 3790 Arg Val Thr Asp Asp Glu His Val Leu Leu Leu Val Leu His His Ile 3795 3800 3805 Ala Gly Asp Gly Trp Ser Met Ala Pro Leu Ala His Asp Leu Ser Ala 3810 3815 3820 Ala Tyr Thr Val Arg Leu Glu His His Ala Pro Gln Leu Pro Ala Leu 3825 3830 3835 3840 Ala Val Gln Tyr Ala Asp Tyr Ala Ala Trp Gln Arg Asp Val Leu Gly 3845 3850 3855 Thr Glu Asn Asn Thr Ser Ser Gln Leu Ser Thr Gln Leu Asp Tyr Trp 3860 3865 3870 Tyr Ser Lys Leu Glu Gly Leu Pro Ala Glu Leu Thr Leu Pro Thr Ser 3875 3880 3885 Arg Val Arg Pro Ala Val Ala Ser His Ala Cys Asp Arg Val Glu Phe 3890 3895 3900 Thr Val Pro His Asp Val His Gln Gly Leu Thr Ala Leu Ala Arg Thr 3905 3910 3915 3920 Gln Gly Ala Thr Val Phe Met Val Val Gln Ala Ala Leu Ala Ala Leu 3925 3930 3935 Leu Ser Arg Leu Gly Ala Gly Thr Asp Ile Pro Ile Gly Thr Pro Ile 3940 3945 3950 Ala Gly Arg Thr Asp Gln Ala Met Glu Asn Leu Ile Gly Leu Phe Val 3955 3960 3965 Asn Thr Leu Val Leu Arg Thr Asp Val Ser Gly Asp Pro Thr Phe Ala 3970 3975 3980 Glu Leu Leu Ala Arg Val Arg Thr Thr Ala Leu Asp Ala Tyr Ala His 3985 3990 3995 4000 Gln Asp Ile Pro Phe Glu Arg Leu Val Glu Ala Ile Asn Pro Glu Arg 4005 4010 4015 Ser Leu Thr Arg His Pro Leu Phe Gln Val Met Leu Ala Phe Asn Asn 4020 4025 4030 Thr Asp Arg Arg Ser Ala Leu Asp Ala Leu Asp Ala Met Pro Gly Leu 4035 4040 4045 His Ala Arg Pro Ala Asp Val Leu Ala Val Thr Ser Pro Tyr Asp Leu 4050 4055 4060 Ala Phe Ser Phe Val Glu Thr Pro Gly Ser Thr Glu Met Pro Gly Ile 4065 4070 4075 4080 Leu Asp Tyr Ala Thr Asp Leu Phe Asp Arg Ser Thr Ala Glu Ala Met 4085 4090 4095 Thr Glu Arg Leu Val Arg Leu Leu Ala Glu Ile Ala Arg Arg Pro Glu 4100 4105 4110 Leu Ser Val Gly Asp Ile Gly Ile Leu Ser Ala Asp Glu Val Lys Ala 4115 4120 4125 Leu Ser Pro Glu Ala Pro Pro Ala Ala Glu Glu Leu His Thr Ser Thr 4130 4135 4140 Leu Pro Glu Leu Phe Glu Glu Gln Val Ala Ala Arg Gly His Ala Val 4145 4150 4155 4160 Ala Val Val Cys Glu Gly Glu Glu Leu Ser Tyr Lys Glu Leu Asn Ala 4165 4170 4175 Arg Ala Asn Arg Leu Ala Arg Val Leu Met Glu Arg Gly Ala Gly Pro 4180 4185 4190 Glu Arg Phe Val Gly Val Ala Leu Pro Arg Gly Leu Asp Leu Ile Val 4195 4200 4205 Ala Leu Leu Ala Val Thr Lys Thr Gly Ala Ala Tyr Val Pro Leu Asp 4210 4215 4220 Pro Glu Tyr Pro Thr Asp Arg Leu Ala Tyr Met Val Thr Asp Ala Asn 4225 4230 4235 4240 Pro Thr Ala Val Val Thr Ser Thr Asp Val His Ile Pro Leu Ile Ala 4245 4250 4255 Pro Arg Ile Glu Leu Asp Asp Glu Ala Ile Arg Thr Glu Leu Ala Ala 4260 4265 4270 Ala Pro Asp Thr Ala Pro Cys Val Gly Ser Gly Pro Ala His Pro Ala 4275 4280 4285 Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Val 4290 4295 4300 Ile Ser His Ala Asn Val Val Arg Leu Phe Thr Ala Cys Ser Asp Ser 4305 4310 4315 4320 Phe Asp Phe Gly Pro Asp His Val Trp Thr Leu Phe His Ser Tyr Ala 4325 4330 4335 Phe Asp Phe Ser Val Trp Glu Ile Trp Gly Ala Leu Leu His Gly Gly 4340 4345 4350 Arg Leu Val Val Val Pro Phe Glu Val Thr Arg Ser Pro Ala Glu Phe 4355 4360 4365 Leu Ala Leu Leu Ala Glu Gln Gln Val Thr Leu Leu Ser Gln Thr Pro 4370 4375 4380 Ser Ala Phe His Gln Leu Thr Glu Ala Ala Arg Gln Glu Pro Ala Arg 4385 4390 4395 4400 Cys Ala Gly Leu Ala Leu Arg His Val Val Phe Gly Gly Glu Ala Leu 4405 4410 4415 Asp Pro Ser Arg Leu Arg Asp Trp Phe Asp Leu Pro Leu Gly Ser Arg 4420 4425 4430 Pro Thr Leu Val Asn Met Tyr Gly Ile Thr Glu Thr Thr Val His Val 4435 4440 4445 Thr Val Leu Pro Leu Glu Asp Arg Ala Thr Ser Leu Ser Gly Ser Pro 4450 4455 4460 Ile Gly Arg Pro Leu Ala Asp Leu Gln Val Tyr Val Leu Asp Glu Arg 4465 4470 4475 4480 Leu Arg Pro Val Pro Pro Gly Thr Val Gly Glu Met Tyr Val Ala Gly 4485 4490 4495 Ala Gly Leu Ala Arg Gly Tyr Leu Gly Arg Pro Ala Leu Thr Ala Glu 4500 4505 4510 Arg Phe Val Ala Asp Pro Asn Ser Arg Ser Gly Gly Arg Leu Tyr Arg 4515 4520 4525 Thr Gly Asp Leu Ala Lys Val Arg Pro Asp Gly Gly Leu Glu Tyr Val 4530 4535 4540 Gly Arg Gly Asp Arg Gln Val Lys Ile Arg Gly Phe Arg Ile Glu Leu 4545 4550 4555 4560 Gly Glu Ile Glu Ala Ala Leu Val Thr His Ala Gly Val Val Gln Ala 4565 4570 4575 Val Val Leu Val Arg Asp Glu Gln Thr Asp Asp Gln Arg Leu Val Ala 4580 4585 4590 His Val Val Pro Ala Leu Pro His Arg Ala Pro Thr Leu Ala Glu Leu 4595 4600 4605 His Glu His Leu Ala Ala Thr Leu Pro Ala Tyr Met Val Pro Ser Ala 4610 4615 4620 Tyr Arg Thr Leu Asp Glu Leu Pro Leu Thr Ala Asn Gly Lys Leu Asp 4625 4630 4635 4640 Arg Ala Ala Leu Ala Gly Gln Trp Gln Gly Gly Thr Arg Thr Arg Arg 4645 4650 4655 Leu Pro Arg Thr Pro Gln Glu Glu Ile Leu Cys Glu Leu Phe Ala Asp 4660 4665 4670 Val Leu Arg Leu Pro Ala Ala Gly Ala Asp Asp Asp Phe Phe Ala Leu 4675 4680 4685 Gly Gly His Ser Leu Leu Ala Thr Arg Leu Leu Ser Ala Val Arg Gly 4690 4695 4700 Thr Leu Gly Val Glu Leu Gly Ile Arg Asp Leu Phe Ala Ala Pro Thr 4705 4710 4715 4720 Pro Ala Gly Leu Ala Thr Val Leu Ala Ala Ser Gly Thr Ala Leu Pro 4725 4730 4735 Pro Val Thr Arg Ile Asp Arg Arg Pro Glu Arg Leu Pro Leu Ser Phe 4740 4745 4750 Ala Gln Arg Arg Leu Trp Phe Leu Ser Lys Leu Glu Gly Pro Ser Ala 4755 4760 4765 Thr Tyr Asn Ile Pro Val Ala Val Arg Leu Thr Gly Ala Leu Asp Val 4770 4775 4780 Pro Ala Leu Arg Ala Ala Leu Gly Asp Val Thr Ala Arg His Glu Ser 4785 4790 4795 4800 Leu Arg Thr Val Phe Pro Asp Asp Gly Gly Glu Pro Arg Gln Leu Val 4805 4810 4815 Leu Pro His Ala Glu Pro Pro Phe Leu Thr His Glu Val Thr Val Gly 4820 4825 4830 Glu Val Ala Glu Gln Ala Ala Ser Ala Thr Gly Tyr Ala Phe Asp Ile 4835 4840 4845 Thr Ser Asp Thr Pro Leu Arg Ala Thr Leu Leu Arg Val Ser Pro Glu 4850 4855 4860 Glu His Val Leu Val Val Val Ile His His Ile Ala Gly Asp Gly Trp 4865 4870 4875 4880 Ser Met Gly Pro Leu Val Arg Asp Leu Val Thr Ala Tyr Arg Ala Arg 4885 4890 4895 Thr Arg Gly Asp Ala Pro Glu Tyr Thr Pro Leu Pro Val Gln Tyr Ala 4900 4905 4910 Asp Tyr Ala Leu Trp Gln His Ala Val Ala Gly Asp Glu Asp Ala Pro 4915 4920 4925 Asp Gly Arg Thr Ala Arg Arg Leu Gly Tyr Trp Arg Glu Met Leu Ala 4930 4935 4940 Gly Leu Pro Glu Glu His Thr Leu Pro Ala Asp Arg Pro Arg Pro Val 4945 4950 4955 4960 Arg Ser Ser His Arg Gly Gly Arg Val Arg Phe Glu Leu Pro Ala Gly 4965 4970 4975 Val His Arg Ser Leu Leu Ala Val Ala Arg Asp Arg Arg Ala Thr Leu 4980 4985 4990 Phe Met Val Val Gln Ala Ala Leu Ala Gly Leu Leu Ser Arg Leu Gly 4995 5000 5005 Ala Gly Asp Asp Ile Pro Ile Gly Thr Pro Val Ala Gly Arg Gly Asp 5010 5015 5020 Glu Ala Leu Asp Asp Val Val Gly Phe Phe Val Asn Thr Leu Val Leu 5025 5030 5035 5040 Arg Thr Asn Leu Ala Gly Asp Pro Ser Phe Ala Asp Leu Val Asp Arg 5045 5050 5055 Val Arg Thr Ala Asp Leu Asp Ala Phe Ala His Gln Asp Val Pro Phe 5060 5065 5070 Glu Arg Leu Val Glu Ala Leu Ala Pro Arg Arg Ser Leu Ala Arg His 5075 5080 5085 Pro Leu Phe Gln Ile Trp Tyr Thr Leu Thr Asn Ala Asp Gln Asp Ile 5090 5095 5100 Thr Gly Gln Ala Leu Asn Ala Leu Pro Gly Leu Thr Gly Asp Glu Tyr 5105 5110 5115 5120 Pro Leu Gly Ala Ser Ala Ala Lys Phe Asp Leu Ser Phe Thr Phe Thr 5125 5130 5135 Glu His Arg Thr Pro Asp Gly Asp Ala Ala Gly Leu Ser Val Leu Leu 5140 5145 5150 Asp Tyr Ser Ser Asp Leu Tyr Asp His Gly Thr Ala Ala Ala Leu Gly 5155 5160 5165 His Arg Leu Thr Gly Phe Phe Ala Ala Leu Ala Ala Asp Pro Thr Ala 5170 5175 5180 Pro Leu Gly Thr Val Pro Leu Leu Thr Asp Asp Glu Arg Asp Arg Ile 5185 5190 5195 5200 Leu Gly Asp Trp Gly Ser Gly Thr His Thr Pro Leu Pro Pro Arg Ser 5205 5210 5215 Val Ala Glu Gln Ile Val Arg Arg Ala Ala Leu Asp Pro Asp Ala Val 5220 5225 5230 Ala Val Ile Thr Ala Glu Glu Glu Leu Ser Tyr Arg Glu Leu Glu Arg 5235 5240 5245 Leu Ser Gly Glu Thr Ala Arg Leu Leu Ala Asp Arg Gly Ile Gly Arg 5250 5255 5260 Glu Ser Leu Val Ala Val Ala Leu Pro Arg Thr Ala Gly Leu Val Thr 5265 5270 5275 5280 Thr Leu Leu Gly Val Leu Arg Thr Gly Ala Ala Tyr Leu Pro Leu Asp 5285 5290 5295 Thr Gly Tyr Pro Ala Glu Arg Leu Ala His Val Leu Ser Asp Ala Arg 5300 5305 5310 Pro Asp Leu Val Leu Thr His Ala Gly Leu Ala Gly Arg Leu Pro Ala 5315 5320 5325 Gly Leu Ala Pro Thr Val Leu Val Asp Glu Pro Gln Pro Pro Ala Ala 5330 5335 5340 Ala Ala Pro Ala Val Pro Thr Ser Pro Ser Gly Asp His Leu Ala Tyr 5345 5350 5355 5360 Val Ile His Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Ala Ile 5365 5370 5375 Ala Glu Ser Ser Leu Arg Ala Phe Leu Ala Asp Ala Val Arg Arg His 5380 5385 5390 Asp Leu Thr Pro His Asp Arg Leu Leu Ala Val Thr Thr Val Gly Phe 5395 5400 5405 Asp Ile Ala Gly Leu Glu Leu Phe Ala Pro Leu Leu Ala Gly Ala Ala 5410 5415 5420 Ile Val Leu Ala Asp Glu Asp Ala Val Arg Asp Pro Ala Ser Ile Thr 5425 5430 5435 5440 Ser Leu Cys Ala Arg His His Val Thr Val Val Gln Ala Thr Pro Ser 5445 5450 5455 Trp Trp Arg Ala Met Leu Asp Gly Ala Pro Ala Asp Ala Ala Ala Arg 5460 5465 5470 Leu Glu His Val Arg Ile Leu Val Gly Gly Glu Pro Leu Pro Ala Asp 5475 5480 5485 Leu Ala Arg Val Leu Thr Ala Thr Gly Ala Ala Val Thr Asn Val Tyr 5490 5495 5500 Gly Pro Thr Glu Ala Thr Ile Trp Ala Thr Ala Ala Pro Leu Thr Ala 5505 5510 5515 5520 Gly Asp Asp Arg Thr Pro Gly Ile Gly Thr Pro Leu Asp Asn Trp Arg 5525 5530 5535 Val His Ile Leu Asp Ala Ala Leu Gly Pro Val Pro Pro Gly Val Pro 5540 5545 5550 Gly Glu Ile His Ile Ala Gly Ser Gly Leu Ala Arg Gly Tyr Leu Arg 5555 5560 5565 Arg Pro Asp Leu Thr Ala Glu Arg Phe Val Ala Asn Pro Phe Ala Pro 5570 5575 5580 Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Gly Arg Phe Arg Pro Asp 5585 5590 5595 5600 Gly Thr Leu Glu His Leu Gly Arg Val Asp Asp Gln Val Lys Val Arg 5605 5610 5615 Gly Phe Arg Ile Glu Leu Gly Asp Val Glu Ala Ala Leu Ala Arg His 5620 5625 5630 Pro Asp Val Gly Arg Ala Ala Ala Ala Val Arg Pro Asp His Arg Gly 5635 5640 5645 Gln Gly Arg Leu Val Ala Tyr Val Val Pro Arg Pro Gly Thr Arg Gly 5650 5655 5660 Pro Asp Ala Gly Glu Leu Arg Glu Thr Val Arg Glu Leu Leu Pro Asp 5665 5670 5675 5680 Tyr Met Val Pro Ser Ala Gln Val Thr Leu Thr Thr Leu Pro His Thr 5685 5690 5695 Pro Asn Gly Lys Leu Asp Arg Ala Ala Leu Pro Ala Pro Val Phe Gly 5700 5705 5710 Thr Pro Ala Gly Arg Ala Pro Ala Thr Arg Glu Glu Lys Ile Leu Ala 5715 5720 5725 Gly Leu Phe Ala Asp Ile Leu Gly Leu Pro Asp Val Gly Ala Asp Ser 5730 5735 5740 Gly Phe Phe Asp Leu Gly Gly Asp Ser Val Leu Ser Ile Gln Leu Val 5745 5750 5755 5760 Ser Arg Ala Arg Arg Glu Gly Leu His Ile Thr Val Arg Asp Val Phe 5765 5770 5775 Glu His Gly Thr Val Gly Ala Leu Ala Ala Ala Ala Leu Pro Ala Pro 5780 5785 5790 Ala Asp Asp Ala Asp Asp Thr Val Pro Gly Thr Asp Val Leu Pro Ser 5795 5800 5805 Ile Ser Asp Asp Glu Phe Glu Glu Phe Glu Leu Glu Leu Gly Leu Glu 5810 5815 5820 Gly Glu Glu Glu Gln Trp 5825 5830 <210> 10 <211> 17493 <212> DNA <213> Streptomyces roseosporus <400> 10 atggacatgc agtcgcagcg cctcggcgtc accgccgccc aacagagcgt ctggctcgcc 60 ggccagctgg cggacgacca ccgcctgtac cactgtgcgg cgtacctgtc actcaccggg 120 tccatcgacc cgcggacact cggcacggcg gtccggcgga ccctcgacga gaccgaggcg 180 ctgcgtaccc ggttcgtacc gcaggacggg gaactgctgc agatcctcga acccggtgcc 240 ggacagctcc tgctggaagc cgacttctcc ggcgacccgg accccgagcg ggcggcacac 300 gactggatgc acgcggcgct cgccgcaccg gtccgcctcg accgcgccgg gaccgccacc 360 cacgccctgc tcaccctcgg cccgtcccgc cacctgctgt acttcggcta ccaccacatc 420 gcgctcgacg gctacggtgc cctgctccac ctgcgccgcc tcgcccacgt ctacaccgcc 480 ctcagcaacg gggacgaccc cggcccctgc ccgttcggcc ccctggccgg tgtcctcacg 540 gaggaggcgg cctaccgtga ctccgacaac catcggcgcg acggggaatt ctggacccgg 600 tccctcgccg gtgcggacga ggcccccggg ctgagcgagc gggaggccgg cgctctcgcc 660 gtcccgctgc gccgcaccgt ggagctgtcc ggcgaacgga cggagaagct ggccgcctcg 720 gccgcggcca ctggagctcg ctggtcgtca ctgctcgtcg ccgccaccgc cgcgttcgta 780 cgccgccacg ctgccgccga cgacaccgtc atcggcctgc ccgtcaccgc ccggctcacc 840 gggccggcgc tgcgtacccc gtgcatgctc gccaacgacg tgccgctgcg cctcgacgcc 900 cggctcgatg ccccgttcgc cgcgctcctt gccgacacca cccgcgccgt cggcacgctg 960 gcgcgccacc agcggttccg cggggaagaa ctccaccgga acctgggggg cgtcggccgc 1020 accgcgggcc tggcgcgggt caccgtcaac gtcctggcgt atgtcgacaa catccggttc 1080 ggcgactgcc gggccgtggt ccacgagttg tcctcgggac cggtccgcga cttccacatc 1140 aactcctacg gcacccccgg cacccccgac ggcgtccagc tggtcttcag cggtaacccc 1200 gccctgtaca cggccaccga tctggccgac caccaggagc ggttcctgcg cttcctcgac 1260 gctgtgaccg ccgacccgga cctgccgacc ggaagacacc gcctcctgtc gccgggcacc 1320 cgcgcccggc tgctcgacga ctcccgcggc acggaacgcc ccgtaccgcg tgccaccttg 1380 ccggaactct tcgccgaaca ggcccggcgc acccccgacg cgcccgccgt ccagcacgac 1440 ggcaccgtcc tcacctaccg cgacctgcac cggagtgtcg aacgggcggc cggacggctg 1500 gccggcctcg gcctgcgtac cgaggacgtc gtcgccctcg ccctccccaa gtccgccgag 1560 agcgtcgcga tcctgctcgg catccagcgg gccggcgccg cctacgtgcc gctggacccc 1620 acccatccgg ccgagcggct ggcccgtgta ctcgacgaca cccgaccccg gtacctcgtc 1680 accaccggac acatcgacgg cctgtcccac cccacgccgc agttggccgc cgccgacctc 1740 ctccgtgagg gcggcccaga gcccgccccg ggccgcccgg cacccggcaa cgcggcgtac 1800 atcatccaga cctccggctc caccggacgg ccgaagggtg tcgtcgtcac tcacgaaggg 1860 ctggccaccc tcgccgccga ccagatccgg cgctaccgca cgggaccgga cgcccgcgta 1920 ctgcagttca tctccccggg gttcgacgtc ttcgtctccg aactgagcat gaccctcctg 1980 tccggcggct gcctggtgat accgccggac ggcctgaccg gccgtcacct cgccgacttc 2040 cttgccgcgg aggccgtcac caccacatcc ctcacccccg gcgcactcgc caccatgccc 2100 gccacagatc tcccgcacct gcggactctg atcgtcggcg gagaggtctg cccgccggag 2160 atcttcgacc agtggggccg gggccgggac atcgtcaacg cgtacgggcc caccgagaca 2220 accgtcgagg cgaccgcctg gcaccgtgac ggtgccaccc acggccccgt cccgctcggc 2280 cgccccaccc tcaaccggcg cggctacgtc ctcgacccgg cgctcgaacc cgtccccgac 2340 gggacgaccg gcgaactgta cctggccggc gagggcctcg cccggggcta cgtcgctgct 2400 cccgggccca ccgccgagcg tttcgtcgcc gacccgttcg gcccgcccgg cagccgcatg 2460 taccgcaccg gtgacctggt gcggcggcgc tccggcggca tgctggaatt cgtcggacga 2520 gccgacggac aggtcaaact ccgcggcttc cgcatcgaac tcggcgaggt ccaggccgcg 2580 ctcaccgctc tccccggggt acgtcaggcc ggcgtcctga tccgcgagga ccgccccggg 2640 gacccccggc tcgtcgggta catcgtgccc gcgcccggcg ccgaaccgga cgccggtgag 2700 ctccgtgcgg ccctggcccg taccctcccg ccccacatgg tgccctgggc gctcgtcccc 2760 ctccccgcac tgccgctgac gtccaacggc aaactggaca gggcggccct tcccgtcccc 2820 gccgcccgcg ccggcggatc cgggcaacgc ccggtcaccc cacaggagaa gacactctgc 2880 gccctgttcg ccgacgtcct cggcgtaacg gaggtcgcca cggacgacgt gttcttcgag 2940 ctcggcggcc actccctcaa cggcacccgg ctgctcgccc ggatcaggac cgagttcggc 3000 accgacctca ccctccgcga cctgttcgcc ttccccaccg tcgccggcct tctcccgctc 3060 ctggacgaca acggacggca gcacaccacc ccgccgctgc ctccgcgccc ggagcgcctc 3120 cccctgtcgc acgcgcagca gcgactgtgg ttcctcgacc aggtcgaagg ccccagcccc 3180 gcgtacaaca tccccaccgc cgtccggctc gaaggcccgc tcgacatccc ggccctcgct 3240 gtcgccctgc aggacgtcac caaccgccac gagcccttgc gtactctcct cgccgaggac 3300 tccgaaggcc cccaccaggt catcctgccc cccgaggccg cccgccccga actgacccac 3360 agcaccgtcg cgcccggcga tctcgccgca gccctcgccg aagccgcacg ccgccccttc 3420 gacctcgccg gtgagatccc actcaaagcc cacctgttcg gctgcggccc ggacgaccac 3480 accctgctgc tcctcgtcca ccacaccgcc ggcgacggag cctccgtcga ggtcctcgta 3540 cgcgatctcg cccacgccta cggcgcccgc cgcgccggcg acgccccgca cttcgagccg 3600 ctgcccctgc agtacgccga ccacaccctg cgccgacggc acctgctgga cgatccgtcg 3660 gacagcacac agctcgacca ctggcgcgac gccctggccg gcctgcccga gcagctcgaa 3720 ctgcccaccg accacacccg gcccgccgtt cccacccgcc ggggcgaggc gatcgccttc 3780 accgtgcccg agcacacgca ccacacgctg cgggccatgg cccaggccca cggcgtcacc 3840 gtgttcatgg tcatgcaggc cgcgctcgcc gccctgctgt cgcggcacgg cgcgggccac 3900 gacatccccc tcggaacacc cgtcgcgggc cgctccgacg acggcacgga agacctcgtc 3960 gggttcttcg tcaacacgct cgtactgcgc aacgacgtct ccggggaccc gacgttcgcg 4020 gaactcgtgt cgcgggtgcg ggccgccaac ctggacgcgt acgcctacca ggacgttccc 4080 ttcgagcgtc tcgtcgacgt actcaaaccg gagcggtccc tgtcctggca cccgctcttc 4140 cagatcatga tcgcgtacaa cggcccggcg acgaacgaca ccgccgacgg gtcccgcttc 4200 gcgggcctca ccagccgcgt ccatgccgtc cacaccggca tgtccaagtt cgacctgtcg 4260 ttcttcctca ccgagcacgc ggacggcctc ggcatcgacg gcgctctcga gttcagcacc 4320 gatctcttca cgcggatcac cgcggagcgc ctggtccagc gctacctcac cgtcctggag 4380 caagccgccg gagcaccgga ccgccccatc agttcgtacg aactcctcgg cgacgacgaa 4440 cgcgcactcc tcgcccaatg gaacgacacc gcccacccca cccccccagg cacggtgctc 4500 gatctcctcg aaagccgtgc ggcgcggacc cccgaccggc cggccgtcgt cgagaacgac 4560 cacgtcctca cctacgccga cctgcacacc cgggccaacc ggctcgcccg ccacctgatc 4620 accgcccacg gcgtcggtcc cgaacgtctc gtcgccgtcg ccctgccccg gtccgccgag 4680 ctgctggtgg cacttctcgc ggtcctcaag accggagccg cctacgtccc tctcgacctc 4740 acccaccccg ccgagcgcac cgccgtcgtc ctcgacgact gccggccggc cgtgatcctc 4800 accgacgccg gtgcggcccg tgaactgccg cggcgcgaca tcccacagct ccgcctcgac 4860 gaacccgagg tccacgcggc gatcgcggaa caaccggggg gtccggtcac cgaccgggac 4920 cgcacgtgcg tcactccggt cagcggcgag cacgtggcat acgtgatcta cacatccggc 4980 tccacgggcc ggcccaaggg tgtggcggtg gaacaccgtt cactggccga cttcgtgcgg 5040 tactccgtga ccgcgtaccc cggagccttc gacgtcaccc tgctgcacag ccccgtgacc 5100 ttcgacctca ccgtgacctc gctgttcccg ccactggtcg tcggtggcgc catccatgtc 5160 gcggacctga ccgaggcgtg cccaccgagc ctggccgcgg cgggcgggcc gacgttcgtc 5220 aaggccacac cgagccatct gccactgctc acgcacgagg cgacatgggc cgcgtccgcg 5280 aaggtgctgc tcgtcggggg cgagcagttg ctgggaaggg agctggacaa gtggcgggcc 5340 gggtcgccgg aggccgtcgt cttcaacgac tacggcccca ccgaggccac ggtcaactgc 5400 gtggacttcc gtatcgatcc gggacaaccg atcggtgcgg ggccggtggc gatcggccgc 5460 ccgttgcgga acacgcgggt gttcgtgctc gacggtgggt tgcgggcggt gccggtcggt 5520 gtggtcggtg agctccatgt ggcgggcgag gggctggcgc ggggttatct cgggcagccg 5580 ggtctgacgg cggagcggtt cgtggcgtgt ccgttcggtg atgccgggga gcggatgtac 5640 cgcacgggtg acctggtgcg gtggcgtgcg gatgggatgc tggagttcgt cggccgggtc 5700 gacgatcagg tcaaggtgcg gggtttccgg atcgagctgg gcgaggtgga ggccgctgtc 5760 gcggcctgcc cgggtgtgga ccgctccgtg gtggtggtac gggaggaccg accgggagac 5820 cgccggctgg tggcgtatgt gacggccgcc ggtgacgagg cggaggggct ggcaccgctg 5880 atcgtggaga cggccgcggg ccgtctgccc gggtacatgg tgccgtcggc cgtggtcgta 5940 ctggacgaga ttcccctgac gccgaacggc aaggtggacc gtgccgcgct gcccgcgccg 6000 cgcgtcgccc cggccgcgga gttccgcgtc accggatcac cccgtgaaga ggctctgtgc 6060 gccctgttcg cggaagtgct gggcgtggaa cgggtcggcg tggacgacgg gttcttcgac 6120 ctcggcggag acagcattct gtccattcaa ctggtggcgc gggcgcgccg ggcgggtctg 6180 gaggtgtcgg tgcgggacgt tttcgagcac cgcaccgtac gggcgctggc cggtgtggtg 6240 cgggagtccg gaggcgtcgc tgccgccgtc gtggactccg gtgtgggtgc ggtggagcgg 6300 tggccggtgg tggagtggct ggcggagcgt ggtggcggtg ggctcggcgg tgcggtcagg 6360 gccttcaacc agtccgtcgt ggtcgccaca ccggccggta tcacctggga cgaactgcgg 6420 acggtcctgg acgcggtacg cgaacgccac gacgcctggc ggctacgggt agtggattcc 6480 ggtgacggcg cctggtccct gcgcgtcgac gcgcccgccc ccggcggtga gcccgactgg 6540 atcacccggc acggcatggc cagcgccgac ctggaggagc aggtgaacgc cgtgcgggcc 6600 gccgccgtgg aggcccggag ccggctcgat ccactgaccg gacggatggt ccgcgcggta 6660 tggctggacc gtggacccga ccgccgggga gtcctggtcc tggtggcgca ccacctggtc 6720 gtcgacggcg tctcctggcg catcgtcctc ggcgacctcg gcgaagcctg gacacaggca 6780 cgcgctggcg ggcatgtgcg gttggacacg gtcggcacat cgctgcgcgg ctgggcggcg 6840 gcgctggcgg aacagggccg ccacggcgcc cgcgccaccg aagcaaacct gtgggcacag 6900 atggtccacg gctcggaccc tctggtcggc ccacgcgcgg tggacccttc ggtggacgtc 6960 ttcggcgtgg tggagtcggt gggttcacgg gcgtcggtgg gggtgtcgcg tgccctgctg 7020 acggaggtcc cgtcggtcct gggtgtgggc gtgcaggaag tgctgctggc ggcattcggc 7080 ctggcagtga cgcgctggcg cggccgcggc ggaagcgtcg tcgtggacgt cgagggtcac 7140 ggccgcaacg aagacgccgt acccggcgcg gacctctccc gcaccgtggg gtggttcacc 7200 agcatctacc ccgtccgcct ccccctcgag ccggcggcct gggacgagat acgcgccggc 7260 ggtcccgccg tcggacgcac cgtccgcgag atcaaggaat gcctccgcac cctgcccgac 7320 cagggcctgg gctacggcat cctgcgctac ctcgaccccg aaaacggacc cgccctcgcc 7380 cagcacccca ccccgcactt cggcttcaac tacctcggac gggtctcggt ctcggcggac 7440 gctgcctcac tggacgaagg cgacgcccat gccgacgggc tcggcggcct cgtcggcggc 7500 agggcagcgg cggactccga cgaggaacag tgggccgact gggttccggt gtcgggtccg 7560 ttcgcggtgg gcgcgggtca ggaccccgtt ctgccggtgg cccacgcggt ggagttcaac 7620 gcgatcaccc tggacacacc cgacggcccc cgcctcagcg tgacatggtc gtggccgacg 7680 acactgctgt ccgaatcccg gatacgagaa ctcgcccgct tctgggacga agccctcgaa 7740 gggctggtcg cacacgcccg ccgtcccgac gcgggcggac tgaccccctc ggacctgccg 7800 ctggtcgccc tcgaccacgc ggaactggag gccctgcagg ccgacgtcac cggtggcgtg 7860 cacgacatcc tgcccgtatc accgcttcag gaaggactgc tcttccacag ctccttcgcc 7920 gccgacgggg tcgacgtcta cgtgggacaa ctcacgttcg acctgaccgg accagtcgac 7980 gccgaccacc tgcacgccgt ggtcgaaagc ctggtgacac gccacgacgt cctgcgcacc 8040 ggctaccgcc aggcacagtc cggcgaatgg atcgccgtcg tggcacgaca agtccacacc 8100 ccctggcagt acatccacac actcgacacg gacgccgaca ccctcacaaa cgacgagcgc 8160 tggcggccgt tcgacatgac gcagggccca ctcgcacgat tcaccctcgc acgcatcaac 8220 gacacccact tccgcttcat cgtcacgtac caccacgtca tcctcgacgg ctggtccgtg 8280 gcggttctca tacgcgaact cttcaccacc tatcgcgaca ccgccctcgg ccgccggccg 8340 gaggttccgt actccccacc gcgccgtgac ttcatggcgt ggctcgccga acgcgaccag 8400 accgctgcgg gacaggcatg gcgttccgcg ctggccggac tcgcggagcc cacagtgctc 8460 gccctcggaa cggagggcag tggggtgatt cccgaagtcc ttgaggaaga gatcagcgag 8520 gaactgacct cggaactggt ggcgtgggcg cgtgggcgtg gtgtgacggt cgcgtcggtg 8580 gtgcaggcgg cctgggcgtt ggtgctgggg cggctggtgg gccgggacga cgtggtgttc 8640 ggcctgaccg tgtcgggccg gcccgccgaa gtggcgggtg tggaggacat ggtcggtctg 8700 ttcgtgaaca ccattccgtt gcgggcccgg atggacccgg cggagtcact gggcgccttc 8760 gtggagcggc tgcagcggga acagacggaa ctgctcgagc accagcacgt ccggctggcc 8820 gaggtccagc gctgggccgg acacaaggaa ctcttcgacg tcggaatggt cttcgagaac 8880 tacccgatgg attccctgct gcaggattca ctgttccacg gcagtggcct gcagatcgac 8940 ggaatacagg gtgccgatgc gacgcatttc gctttgaacc tggcagtggt tccccttccc 9000 gccatgcgat tccggctcgg ctatcggccg gacgtgtttg acgcgggtcg ggtgcgtgag 9060 ctgtggggtt ggatcgtccg ggccttggag tgcgtggtct gcgagcgtga tgtgccggtg 9120 tccggtgtcg atgtgctggg tgccggtgag cgggagacgc tgctgggctg gggtgcgggc 9180 gcggaacccg gcgtgcgtgc gctgccgggt gcgggtgcgg gtgcgggtgc ggggctggtc 9240 gggttgttcg aggagcgggt gcggaccgac ccggacgcgg tggccgtgcg cggcgcggga 9300 gtggaatgga gttacgcgga gctgaacgcg cgggcgaatg cggtggcccg gtggctgatc 9360 ggccggggcg tgggacccga gcgcggtgtc ggggtggtga tggaccgcgg cccggacgtg 9420 gtggccatgc tcctcgcggt cgccaaaagc ggcggcttct acctgcccgt cgacccgcaa 9480 tggcccaccg aacgcatcga ctgggtactc gccgacgccg gcatcgacct ggccgtcgtg 9540 ggcgagaacc tggccgctgc ggtcgaggcc gtccgcgact gcgaggtggt cgactacgcg 9600 cagatcgccc gcgaaacacg gctgaacgag caggcggcca ccgacgccgg tgatgtgacg 9660 gacggggagc gcgtgtcggc tctgctgtcc gggcatccgc tgtatgtcat ctacacctcc 9720 ggctcgacgg gcctgcccaa gggcgtggtg gtcacccacg cctcggtcgg cgcctatctg 9780 cggcgcggcc gcaacgccta ccgcggcgcc gccgacggcc tgggccacgt gcactcctca 9840 ctcgcgttcg acctgaccgt gaccgttctg ttcacccccc tggtctccgg cggctgcgtc 9900 accctcggcg atctcgacga caccgccaac ggcctgggcg ccaccttcct caaggccact 9960 ccttcccacc tgcccctgct cggccaactc gaccgggtac tcgcccccga cgccaccctc 10020 ctcctcggcg gcgaagccct caccgccggc gccctgcacc actggcgcac ccaccacccc 10080 cacaccacgg tcatcaacgc ctacggcccg accgaactca ccgtcaactg cgccgaatac 10140 cgcatccccc ccggccactg cctccccgac ggccccgtcc ccatcggacg ccccttcacc 10200 ggccaccacc tcttcgtcct cgaccccgcc ctccgcctca caccccccga caccatcggc 10260 gaactgtatg tggccggtga cggcctggcg cggggctatc tcgggcgccc ggacctgacc 10320 gccgaacgct tcgtggcctg ccccttccgc agccccggcg aacgcatgta ccgcaccggc 10380 gacctcgcac gctggcgcag cgacggaaca ctcgaattca tcggccgtgc cgacgaccag 10440 gtcaagatcc gcggcttccg catcgaactc ggcgaagtcg aggcggctgt cgcggcgcat 10500 ccgcacgtgg cgcgggccat cgccgtcgta cgcgaggacc ggcccggcga ccagcgcctg 10560 gtcgcgtacg tgacaggcag cgacccgagc ggcctgtcct cggcggtgac ggacaccgtc 10620 gccggccgcc tgcccgcgta catggtgccg tcggccgtcg tcgtactgga ccagatcccc 10680 ctcaccccca acggcaaggt cgaccgcgcc gccctccccg cgcccgggac cgcctccgga 10740 accacctccc gagcacccgg cacagcccgt gaagagatcc tgtgcaccct gttcgccgac 10800 gtactcggtc tggatcaggt cggcgtggac gaggacttct tcgacctcgg cggccattcc 10860 ctgctcgcca cccgcctcac ctcacggatc cggtcggccc tcggcatcga cctcggtgtc 10920 cgagccctct tcaaagcccc gaccgtcggc cgcctggacc agctgctcca gcaacagacc 10980 accagcctcc gggcacccct ggtcgcgcgg gagcgcaccg gttgtgagcc gctgtcgttc 11040 gcgcagcagc gcctgtggtt cctccaccag ctcgaaggcc ccaacgccgc gtacaacatc 11100 cccatggctc tgcgactcac cggccgcctg gacctgaccg cgctggaagc ggccctgacg 11160 gatgtgatcg cccgccacga aagcctgcga acggtcatcg cccaggacga ttcgggcggc 11220 gtgtggcaga acatcctgcc caccgacgac acccgcaccc acctcaccct cgacaccatg 11280 ccggtcgacg cgcacaccct gcagaatcgg gtggacgagg ccgcccgcca tccgttcgac 11340 ctcaccaccg agatccccct ccgcgccacc gtcttccgcg tcaccgacga cgagcacgtc 11400 ctcctgctcg tgctccacca catcgccggc gacggctggt ccatggcccc cctggcccac 11460 gacctgtccg ccgcctacac cgtcagactc gagcaccacg caccgcaact gcccgctctg 11520 gccgtccaat acgccgacta cgccgcctgg caacgcgacg tcctgggcac cgagaacaac 11580 acatcgagcc aactctccac ccaactcgac tactggtaca gcaaactcga aggcctcccc 11640 gccgaactga ccctccccac cagtcgcgtc cggcccgccg tggcctccca cgcatgcgac 11700 cgcgtcgagt tcaccgtgcc ccacgacgtg caccaaggcc tgaccgcact cgcccgcacc 11760 cagggcgcca ccgtcttcat ggtggtgcag gcggccctgg cggccctgct gtcccgactc 11820 ggcgccggca ccgacatccc catcggcacc cccatcgccg gccgcaccga ccaggcgatg 11880 gagaacctga tcggactctt cgtcaacacc ctcgtactgc gcaccgacgt ctccggggac 11940 ccgaccttcg ccgagctcct ggcccgtgtg cgcaccactg ctctcgacgc atacgcacac 12000 caggacatcc ccttcgaacg cctggtagaa gccatcaacc ccgaacgatc cctcacccgg 12060 caccccctct tccaggtcat gctcgccttc aacaacacgg accgccgatc cgcgctcgac 12120 gcgctcgacg ccatgcccgg ccttcacgca cgaccggccg acgtcctggc tgtgaccagc 12180 ccctacgatc tcgcgttctc gttcgtggag acacccggca gcacggagat gcccggcatc 12240 ctggactacg caaccgacct gttcgaccgc tccacggccg aggccatgac cgaacgtctg 12300 gtgcgcctcc tcgcggagat cgcccgccgg cccgagctgt ccgtgggcga catcggcatc 12360 ctgtcggccg acgaggtgaa ggccctcagc cccgaggctc ccccggcagc cgaggaactt 12420 cacacctcca cactgcctga gctgttcgag gagcaggtgg cggctcgggg ccatgcggtc 12480 gcggtggtgt gcgaaggaga ggagctgtcg tacaaggagt tgaacgcgcg ggcgaatcgc 12540 ctggccaggg tgctgatgga gcgcggcgca ggccccgaac ggttcgtggg cgtggcacta 12600 ccgcgtggcc tggacctcat cgtggcactc ctggccgtga ccaaaaccgg cgccgcatac 12660 gttccgctcg accccgaata ccccaccgac cgcctcgcgt acatggtcac cgacgccaac 12720 cccaccgcgg tcgtgacctc aacggacgta cacatccccc tgatcgcccc ccgcatcgag 12780 ctcgacgacg aggcaatccg caccgaactc gccgccgctc ccgacacagc cccctgtgtc 12840 gggagcggcc ccgcccaccc cgcctacgtc atctacacct ccggctccac cggtcgcccc 12900 aagggcgtcg tcatcagcca cgccaatgtc gtacgcctgt tcaccgcatg ctccgacagt 12960 ttcgacttcg gaccggacca cgtctggacg ctcttccact cgtacgcctt cgacttctcg 13020 gtctgggaga tctggggcgc gctgcttcac ggcgggcggc tcgtcgtcgt gccgttcgag 13080 gtgactcgtt ctcccgccga attcctcgcg ctgctcgccg agcagcaggt cacgctgctg 13140 agccagacac cgtccgcgtt ccatcagctg acggaggccg cccgccagga gccggcgcgc 13200 tgcgccgggc tggccctgcg acatgtggtc ttcggcggcg aggcgctcga cccgtcgcga 13260 ctgcgcgact ggttcgacct gccgctcggc tcacggccga cgctcgtgaa catgtacggc 13320 atcaccgaga ccaccgtcca cgtcacggtg ctcccgctgg aggatcgcgc gacgagtctt 13380 tccggcagcc cgatcggtcg gcccttggcc gatctgcagg tgtacgtcct cgacgaacgg 13440 ctccgcccgg tgcccccagg caccgtcggc gagatgtacg tggcaggcgc cggtctggcc 13500 cgcggctatc tgggacgccc cgctctgacc gccgagcggt tcgtggccga cccgaattcc 13560 cgttccggcg gccgtctgta ccgcacaggc gacctggcca aggtgcggcc cgacggggga 13620 ctggagtatg tgggccgcgg ggaccggcag gtgaagatcc gcggcttccg gatcgaactc 13680 ggcgagatcg aggccgcgct ggtcacacac gcgggtgtcg tccaggcggt ggtcctggtg 13740 cgggacgagc agaccgacga ccaacggctt gtcgcgcacg tggtgcccgc gctgccgcac 13800 cgggcgccga ccctggccga actccacgag cacctcgcgg cgaccctgcc ggcgtacatg 13860 gtgccgtccg cgtaccggac cctggacgag ctgccgctga cggccaacgg aaagctcgac 13920 cgcgcggcgc tggccgggca gtggcagggc ggaacccgca cccggagact gcctcggacg 13980 ccgcaggaag agatcctgtg cgagttgttc gccgacgtcc tccggttgcc cgccgccggg 14040 gccgacgacg acttcttcgc cctgggaggc cattccctgc tggcgacgcg cctcctgtcg 14100 gctgtcaggg gcaccctggg tgtggaactc ggcatccgcg acctcttcgc cgcgcccacg 14160 cctgccgggc tcgcgaccgt actggcggcc tccggcaccg ccctgccacc tgtgaccagg 14220 atcgaccggc gccctgaacg gctcccgctg tccttcgcac agcggcgact gtggttcctg 14280 agcaagctgg aagggcccag cgccacctac aacatcccgg tcgccgtccg gctcaccggc 14340 gccctcgacg tcccggctct ccgggccgcc ctgggggacg tcaccgcacg gcacgaatca 14400 ctgcgtacgg tcttccccga cgacgggggc gaaccccgcc agctggtgct cccacacgcc 14460 gaacccccct tcctcacgca cgaggtgacc gtcggagagg tggcggaaca ggcggcgtcc 14520 gccaccgggt acgccttcga catcaccagc gatacgccgc tgcgggccac cctgttgcgc 14580 gtctcaccgg aggaacacgt cctcgtggtg gtcatccacc acatcgccgg cgacggctgg 14640 tccatggggc cgttggtgcg tgacctggtc accgcctacc gggcccgaac gcggggcgac 14700 gccccggagt acaccccgct tcccgtgcag tacgccgact acgccctgtg gcaacacgct 14760 gttgcgggcg acgaggacgc cccggacggc cggacggcgc gtcggctcgg gtactggcgc 14820 gagatgctgg ccgggctgcc cgaggagcac acgctgcccg ccgaccggcc ccggcccgtt 14880 cggtcctcgc accggggcgg ccgggtacgg ttcgaactgc ccgccggcgt gcaccggagt 14940 ctgctggccg tggcgcgtga ccgtcgggcc acgctgttca tggtggtgca ggctgcgctc 15000 gccggtctgt tgtcccggct cggcgcgggc gacgacatcc ccatcggcac cccggtcgcc 15060 gggcggggcg atgaagcgct ggacgacgtc gtcgggtttt tcgtcaatac cctggtcctt 15120 cggacgaatc tcgcggggga tccgtccttc gccgacctgg tggaccgggt caggaccgcc 15180 gacctcgacg cgttcgcgca ccaggacgtg cccttcgaac ggctcgtgga ggcgcttgcg 15240 ccacggcgtt ccctcgcccg ccacccgctg ttccagatct ggtacaccct caccaacgcc 15300 gaccaggaca tcaccggcca ggcactcaac gccctcccgg gcctgaccgg ggacgagtac 15360 ccgctggggg ccagtgccgc caagttcgac ctgtcgttca ccttcactga acaccgcacc 15420 cccgacggag acgccgccgg cctgtccgtt ctgctcgact acagcagcga cctgtacgac 15480 cacggcactg ccgccgcact gggccaccgg ctgaccggat tcttcgcagc actggccgcc 15540 gaccccaccg cccccctggg caccgtcccg ctcctcaccg acgacgagcg ggaccgcatc 15600 ctcggtgact ggggcagcgg tacgcacacc ccgctgcccc cgcgcagcgt ggccgagcag 15660 atcgtccgcc gggccgcgct ggacccggac gccgtcgccg tcatcaccgc ggaagaggaa 15720 ctctcgtacc gggaactgga aaggctcagc ggtgagacgg cgcggctgct ggccgaccgg 15780 gggatcggcc gcgagagcct cgtcgccgtc gccctgcccc gcacggccgg cctggtcacc 15840 accctgctcg gcgtcctgcg caccggcgcc gcctacctcc cgctcgacac cgggtacccc 15900 gccgagcgac tcgcgcacgt gctctccgac gcccgtcccg acctcgtcct cacccacgcc 15960 ggcctcgccg gacggctgcc ggccggcctc gcgccgaccg tcctcgtcga cgagccgcag 16020 ccgcccgccg cagccgcccc cgcggttccc acgtccccgt cgggcgacca cctcgcgtac 16080 gtcatccaca cctccggctc caccggcagg cccaagggcg tcgcgatcgc cgagtcctcc 16140 ctgcgcgcct tcctcgcgga cgcggtccgg cgccacgacc tgaccccgca cgaccggttg 16200 ctcgcggtga ccaccgtcgg cttcgacatc gccggcctcg aactgttcgc cccgctcctc 16260 gccggtgccg cgatcgtgct ggccgacgag gacgccgtac gcgaccccgc ctcgatcacc 16320 tccctgtgcg cacgccacca cgtcaccgtc gtccaggcca cgcccagttg gtggcgggcc 16380 atgctcgacg gagcaccggc cgacgccgcc gcccggctcg agcacgtacg gatcctggtc 16440 ggcggcgaac cgctgcccgc cgacctggcc cgtgtcctga ccgcaaccgg cgccgccgtc 16500 accaacgtgt acggacccac cgaagccacc atctgggcca ccgccgcccc actcaccgcc 16560 ggcgacgacc gcacacccgg catcggcacc cccctggaca actggcgcgt ccacatactc 16620 gacgcggccc tcggacccgt tcccccgggt gttccgggcg agatccacat cgccgggtcc 16680 gggctcgccc gcggctatct gcgccgcccg gacctcaccg ccgaacgctt cgtcgccaac 16740 ccgttcgccc ccggcgagcg gatgtaccgc accggcgacc tcggccggtt ccgcccggac 16800 ggcacgctcg aacacctcgg ccgcgtggac gaccaggtca aggtacgggg cttccgcatc 16860 gaactcggcg acgtcgaggc cgccctcgcc cggcatcccg acgtggggcg cgccgccgcc 16920 gccgtccgcc ccgaccaccg cggccagggc cgccttgtcg cgtacgtcgt cccccgtccc 16980 ggcacccggg gaccggacgc cggcgaactg cgcgagacgg tacgcgaact tctgcctgac 17040 tacatggtcc cctccgccca ggtgactctc accaccctgc ctcacacccc gaacggcaaa 17100 ctcgaccgcg ccgcgctgcc cgcccccgtg ttcggcaccc ctgccggacg cgcccccgcc 17160 acccgcgagg aaaagatcct cgccgggctc ttcgcggaca tcctgggcct gcccgacgtg 17220 ggagccgaca gcggcttctt cgacctcggc ggcgacagcg tgctgtccat ccagctcgtg 17280 agccgcgccc ggagggaagg actgcacatc accgtacgag acgtgttcga gcacgggacg 17340 gtcggcgcac tcgccgccgc ggcccttccg gcaccggccg acgacgcgga cgacaccgtc 17400 cccggcacgg acgtactgcc ttcgatcagc gacgacgaat tcgaggagtt cgagctggag 17460 ctcggactcg agggggagga agagcagtgg tga 17493 <210> 11 <211> 7338 <212> PRT <213> Streptomyces roseosporus <400> 11 Val Asn Arg Arg Ser Lys Val Val Glu Glu Ile Leu Pro Val Ser Ala 1 5 10 15 Leu Gln Glu Gly Leu Leu Phe His Ser Ser Phe Ala Ala Ala Asp Gly 20 25 30 Val Asp Val Tyr Ala Gly Gln Leu Ala Phe Asp Leu Val Gly Ala Val 35 40 45 Asp Thr Gly Arg Leu Arg Ala Ala Val Glu Ser Leu Val Ala Arg His 50 55 60 Gly Val Leu Arg Ser Ser Tyr Arg Gln Ala Arg Ser Gly Glu Trp Val 65 70 75 80 Ala Val Val Ala Arg Arg Val Ala Thr Pro Trp Arg Ala Val Asp Ala 85 90 95 Arg Asp Gly Ala Thr Asp Ala Ala Ala Val Ala Arg Glu Glu Arg Trp 100 105 110 Arg Pro Phe Asp Leu Gly Arg Ala Pro Leu Ala Arg Phe Val Leu Val 115 120 125 Arg Thr Asp Asp Asp Arg Phe Arg Phe Val Ile Thr Tyr His His Val 130 135 140 Ile Leu Asp Gly Trp Ser Leu Pro Val Leu Leu Arg Glu Leu Leu Ala 145 150 155 160 Leu Tyr Gly Ser Gly Ala Asp Pro Ser Val Leu Pro Pro Val Arg Pro 165 170 175 Tyr Gly Asp Phe Leu Arg Trp Ala Ala Ala Arg Asp Asp Ala Ala Ala 180 185 190 Glu Thr Ala Trp Arg Asp Ala Leu Thr Gly Leu Asp Glu Pro Ser Leu 195 200 205 Val Ala Pro Gly Ala Ser Pro Asp Gly Val Val Pro Ala Ser Val His 210 215 220 Ala Glu Leu Asp Lys Ala Gly Thr Glu Asn Leu Ala Ala Trp Ala Arg 225 230 235 240 His Arg Gly Ile Thr Gln Ala Thr Ala Val Arg Ala Ala Trp Ala Leu 245 250 255 Val Leu Gly Gln His Thr Gly Arg Asp Asp Val Val Phe Gly Val Thr 260 265 270 Val Ser Gly Arg Pro Ala Glu Leu Ala Gly Ala Glu His Met Val Gly 275 280 285 Leu Phe Ile Asn Thr Val Pro Leu Arg Thr Val Leu Asp Pro Ala Asp 290 295 300 Thr Leu Gly Thr Phe Ala Ala Arg Leu Gln Ala Glu Gln Thr Thr Leu 305 310 315 320 Leu Glu His Gln His Val Arg Leu Ser Asp Ile Gln Arg Trp Ala Gly 325 330 335 His Lys Glu Leu Phe Asp Thr Ile Val Val Phe Glu Asn Tyr Pro Ile 340 345 350 Gly His Ser Gly Pro Gly Ser Ile Arg Thr Asp Asp Phe Thr Val Thr 355 360 365 Ala Thr Glu Gly Ser Asp Ala Thr His Tyr Pro Leu Thr Leu Thr Ala 370 375 380 Val Pro Gly Glu Thr Leu Arg Leu Lys Leu Asp His Arg Pro Asp Leu 385 390 395 400 Val Asp Thr Thr Thr Ala Thr Ala Leu Leu Arg Arg Val Thr Arg Val 405 410 415 Leu Glu Thr Ala Thr Asp Asp Thr Gly His Thr Leu Ala Arg Leu Asp 420 425 430 Leu Leu Asp Asp Asp Glu Arg His Arg Leu Leu Arg Gly Trp Asn Asp 435 440 445 Thr Thr Arg Glu Gln Pro Pro Thr Tyr Tyr His Gln Glu Phe Glu Glu 450 455 460 Gln Ala Arg Arg Arg Pro His Asp Thr Ala Leu Val Phe Thr Ser Thr 465 470 475 480 Ser Trp Thr Tyr Glu Glu Leu Asn Asp Arg Ala Asn Arg Leu Ala Arg 485 490 495 Leu Leu Val Ala Ala Gly Ala Gly Ser Asp Asp Phe Val Ala Leu Ala 500 505 510 Phe Pro Arg Ser Ala Glu Ser Val Val Ala Ile Leu Ala Val Leu Lys 515 520 525 Ala Gly Ala Ala Tyr Leu Pro Leu Asp Met Asp Gln Pro Ala Glu Arg 530 535 540 Leu Thr Gly Ile Leu Ala Asp Ala His Pro Thr Val Val Leu Thr Thr 545 550 555 560 Thr Thr Ala Thr Pro Leu Pro His Pro Gly Arg Thr Leu Val Leu Asp 565 570 575 Ser Pro Thr Thr Ala Arg Ala Leu Ala Ala Ala Pro Ala His Asn Leu 580 585 590 Thr Asp Ala Asp Arg Arg Thr Pro Leu Asn Ala Arg Asn Ala Ala Tyr 595 600 605 Ile Ile His Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Val Ile 610 615 620 Glu His Arg Ser Leu Ala Asn Leu Phe His Asp His Arg Arg Ala Leu 625 630 635 640 Ile Glu Pro His Ala Ala Gly Gly Ser Arg Leu Lys Ala Gly Leu Thr 645 650 655 Ala Ser Leu Ser Phe Asp Thr Ser Trp Glu Gly Leu Ile Cys Leu Ala 660 665 670 Ala Gly His Glu Leu His Leu Ile Asp Asp Asp Thr Arg Arg Asp Ala 675 680 685 Glu Arg Val Ala Glu Leu Ile Asp Arg Gln Arg Ile Asp Val Ile Asp 690 695 700 Val Thr Pro Ser Phe Ala Gln Gln Leu Val Glu Thr Gly Ile Leu Asp 705 710 715 720 Glu Gly Arg His His Pro Ala Ala Phe Met Leu Gly Gly Glu Gly Val 725 730 735 Asp Ala Lys Leu Trp Thr Arg Leu Ser Asp Val Pro Gly Val Thr Ser 740 745 750 Tyr Asn Tyr Tyr Gly Pro Thr Glu Phe Thr Val Asp Ala Leu Ala Cys 755 760 765 Thr Val Gly Ile Ala Pro Arg Pro Val Ile Gly His Pro Leu Asp Asn 770 775 780 Thr Ala Ala Tyr Ile Leu Asp Gly Phe Leu Arg Pro Val Pro Glu Gly 785 790 795 800 Val Ala Gly Glu Leu Tyr Leu Ala Gly Thr Gln Leu Ala Arg Gly Tyr 805 810 815 Ala Gly Arg Pro Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe 820 825 830 Gly Ala Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Arg 835 840 845 Ser Pro Gly Gly Val Val Glu Tyr Leu Gly Arg Val Asp Asp Gln Ile 850 855 860 Lys Leu Arg Gly Phe Arg Ile Glu Pro Ala Glu Ile Glu Leu Ala Leu 865 870 875 880 Ala Gly His Pro Ala Val Ala Gln Asn Val Val Leu Leu His Arg Ser 885 890 895 Ala Thr Gly Glu Ala Arg Leu Val Ala Tyr Val Val Pro Gly Thr Pro 900 905 910 Val Asp Pro Arg Glu Leu Thr Gly His Leu Ala Ala Arg Leu Pro Ala 915 920 925 Tyr Met Val Pro Ser Ala Phe Val Leu Leu Asp Thr Leu Pro Leu Thr 930 935 940 Pro Asn Gly Lys Leu Asp Arg Gly Ala Leu Pro Glu Pro Ala Phe Gly 945 950 955 960 Thr Ala Pro Arg Pro Glu Arg Pro Arg Thr Pro Val Glu Glu Ile Leu 965 970 975 Cys Gly Leu Tyr Ala Asp Val Leu Gly Leu Pro Ser Phe Gly Ala Asp 980 985 990 Asp Asp Phe Phe Asp Ala Gly Gly His Ser Leu Leu Ala Ser Lys Leu 995 1000 1005 Val Ser Arg Ile Arg Thr Asn Leu Lys Thr Glu Leu Asn Val Arg Ala 1010 1015 1020 Leu Phe Glu His Arg Thr Val Ser Ser Leu Ala Thr Ala Leu His Arg 1025 1030 1035 1040 Ala Ala Gln Ala Gly Pro Ala Leu Thr Ala Gly Pro Arg Pro Ala Arg 1045 1050 1055 Ile Pro Leu Ser Tyr Ala Gln Arg Arg Leu Trp Phe Leu Asn Arg Leu 1060 1065 1070 Asp Arg Asp Ser Ala Ala Tyr Asn Met Pro Val Ala Leu Arg Leu Arg 1075 1080 1085 Gly Pro Leu Asp Ser Thr Ala Met Cys Ala Ala Leu Thr Asp Val Ala 1090 1095 1100 Glu Arg His Glu Ala Leu Arg Thr Val Phe Glu Glu Asp Arg Asp Gly 1105 1110 1115 1120 Ala His Gln Ile Val Leu Pro Ala Thr Gly Leu Gly Pro Leu Leu Thr 1125 1130 1135 Val Thr Gly Ala Asp Gly Thr Thr Leu Arg Ala Leu Ile Thr Glu Phe 1140 1145 1150 Val Arg Arg Pro Phe Asp Leu Ala Ala Glu Ile Pro Phe Arg Ala Ala 1155 1160 1165 Leu Phe Arg Val Gly Asp Glu Glu His Val Leu Val Val Val Leu His 1170 1175 1180 His Ile Ala Gly Asp Gly Trp Ser Met Gly Pro Leu Ala Arg Asp Val 1185 1190 1195 1200 Ala Glu Ala Tyr Arg Ala Arg Ala Ala Gly Arg Ala Pro Asp Trp Glu 1205 1210 1215 Pro Leu Pro Val Gln Tyr Ala Asp Tyr Ala Leu Trp Gln Arg Glu Val 1220 1225 1230 Leu Gly Ala Glu Asp Asp Glu Thr Gly Glu Leu Ser Ala Gln Leu Ala 1235 1240 1245 His Trp Arg Thr Arg Leu Ala Gly Ala Pro Ala Glu Leu Thr Leu Pro 1250 1255 1260 Thr Asp Arg Pro Arg Pro Ala Val Ala Ser Thr Ala Gly Asp Arg Val 1265 1270 1275 1280 Glu Phe Thr Val Pro Ala Gly Leu His Gln Ala Leu Ala Asp Leu Ala 1285 1290 1295 Arg Ala His Gly Ala Thr Val Phe Met Val Val Gln Ala Ala Leu Ala 1300 1305 1310 Val Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile Pro Ile Gly Thr 1315 1320 1325 Pro Val Ala Gly Arg Thr Asp Glu Ala Thr Glu Glu Leu Ile Gly Phe 1330 1335 1340 Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser Gly Asp Pro Thr 1345 1350 1355 1360 Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp Leu Asp Ala Tyr 1365 1370 1375 Ala His Gln Asp Val Pro Phe Glu Arg Leu Val Glu Val Leu Asn Pro 1380 1385 1390 Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val Met Leu Thr Phe 1395 1400 1405 Asn Val Pro Asp Met Asp Gly Val Gly Ser Ala Leu Gly Asn Leu Gly 1410 1415 1420 Glu Leu Glu Val Ser Gly Glu Ala Ile Arg Thr Asp Gln Thr Lys Val 1425 1430 1435 1440 Asp Leu Ala Phe Thr Cys Thr Glu Met Tyr Ala Ala Asp Gly Ala Ala 1445 1450 1455 Ser Gly Met Arg Gly Val Leu Glu Tyr Arg Leu Asp Val Phe Gly Ala 1460 1465 1470 Val Gln Ala Arg Glu Thr Thr Glu Arg Leu Val Arg Val Leu Glu Gly 1475 1480 1485 Val Val Ser Gly Gly Gly Gly Val Ser Val Ser Gly Val Asp Val Leu 1490 1495 1500 Gly Val Gly Glu Arg Glu Arg Leu Leu Gly Trp Gly Val Gly Gly Pro 1505 1510 1515 1520 Val Pro Val Val Pro Gly Gly Gly Leu Val Gly Leu Phe Glu Glu Arg 1525 1530 1535 Val Arg Ala Asp Ala Asp Ala Val Ala Val Arg Gly Ala Gly Val Val 1540 1545 1550 Trp Ser Tyr Gly Glu Leu Asn Ala Arg Val Asn Val Val Ala Arg Trp 1555 1560 1565 Leu Val Gly Arg Gly Val Gly Ala Glu Cys Gly Val Gly Val Val Met 1570 1575 1580 Gly Arg Gly Val Asp Val Val Val Met Leu Leu Ala Val Ala Lys Ala 1585 1590 1595 1600 Gly Gly Phe Tyr Val Pro Val Asp Pro Glu Trp Pro Val Glu Arg Val 1605 1610 1615 Gly Trp Val Leu Ala Asp Ala Gly Val Gly Leu Val Val Val Gly Glu 1620 1625 1630 Gly Leu Ser His Val Val Gly Asp Phe Pro Gly Gly Glu Val Phe Glu 1635 1640 1645 Phe Ser Arg Val Val Arg Glu Ser Cys Leu Val Glu Leu Val Ala Ala 1650 1655 1660 Asp Gly Val Glu Val Arg Asn Val Thr Asp Gly Glu Arg Ala Ser Arg 1665 1670 1675 1680 Leu Leu Pro Gly His Pro Leu Tyr Val Val Tyr Thr Ser Gly Ser Thr 1685 1690 1695 Gly Arg Pro Lys Gly Val Val Val Thr His Ala Ser Val Gly Gly Tyr 1700 1705 1710 Leu Ala Arg Gly Arg Asp Val Tyr Ala Gly Ala Val Gly Gly Val Gly 1715 1720 1725 Phe Val His Ser Ser Leu Ala Phe Asp Leu Thr Val Thr Val Leu Phe 1730 1735 1740 Thr Pro Leu Val Ser Gly Gly Cys Val Val Leu Gly Glu Leu Asp Glu 1745 1750 1755 1760 Ser Ala Gln Gly Val Gly Ala Ser Phe Val Lys Val Thr Pro Ser His 1765 1770 1775 Leu Gly Leu Leu Gly Glu Leu Glu Gly Val Val Ala Gly Asn Gly Met 1780 1785 1790 Leu Leu Val Gly Gly Glu Ala Leu Ser Gly Gly Ala Leu Arg Glu Trp 1795 1800 1805 Arg Glu Arg Asn Pro Gly Val Val Val Val Asn Ala Tyr Gly Pro Thr 1810 1815 1820 Glu Leu Thr Val Asn Cys Ala Glu Phe Leu Ile Ala Pro Gly Glu Glu 1825 1830 1835 1840 Val Pro Asp Gly Pro Val Pro Ile Gly Arg Pro Phe Ala Gly Gln Arg 1845 1850 1855 Met Phe Val Leu Asp Ala Ala Leu Arg Val Val Pro Val Gly Val Val 1860 1865 1870 Gly Glu Leu Tyr Val Ala Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly 1875 1880 1885 Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe Gly Ala 1890 1895 1900 Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Arg Val 1905 1910 1915 1920 Asp Gly Ala Leu Glu Phe Val Gly Arg Ala Asp Asp Gln Val Lys Val 1925 1930 1935 Arg Gly Phe Arg Val Glu Leu Gly Glu Val Glu Gly Ala Val Ala Ala 1940 1945 1950 His Pro Asp Val Val Arg Ala Val Val Val Val Arg Glu Asp Arg Pro 1955 1960 1965 Gly Asp His Arg Leu Val Ala Tyr Val Thr Gly Val Asp Thr Gly Gly 1970 1975 1980 Leu Ser Ser Ala Val Met Arg Ala Val Ala Glu Arg Leu Pro Ala Tyr 1985 1990 1995 2000 Met Val Pro Ser Ala Val Val Val Leu Asp Glu Ile Pro Leu Thr Pro 2005 2010 2015 Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val Pro Gly Val Glu Ala 2020 2025 2030 Gly Ala Gly Tyr Arg Ala Pro Val Ser Pro Arg Glu Glu Val Leu Cys 2035 2040 2045 Gly Leu Phe Ala Glu Val Leu Gly Leu Glu Arg Val Gly Val Asp Asp 2050 2055 2060 Asp Phe Phe Gly Leu Gly Gly His Ser Leu Leu Ala Thr Arg Leu Ile 2065 2070 2075 2080 Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala Gly Val Arg Ala Leu 2085 2090 2095 Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg Leu Leu Arg Glu Arg 2100 2105 2110 Ser Ala Leu Gly Val Arg Val Pro Leu Val Ala Arg Glu Arg Thr Gly 2115 2120 2125 Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu Trp Phe Leu Glu Glu 2130 2135 2140 Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro Met Ala Leu Arg Leu 2145 2150 2155 2160 Ala Gly Val Leu Asp Val Glu Ala Leu His Gln Ala Leu Ile Asp Val 2165 2170 2175 Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile Ala Gln Asp Ala Gly 2180 2185 2190 Thr Ala Trp Gln His Ile Leu Pro Val Asp Asp Pro Arg Thr Arg Pro 2195 2200 2205 Gly Leu Pro Leu Val Asp Ile Gly Ala Asp Ala Leu Gln Glu Arg Leu 2210 2215 2220 Asp Glu Ala Ala Gly Arg Pro Phe Asp Leu Ala Ala Asp Leu Pro Val 2225 2230 2235 2240 Arg Ala Thr Val Phe Arg Leu Thr Asp Asn Asp His Ile Leu Leu Val 2245 2250 2255 Val Ala His His Val Ala Phe Asp Ala Met Ser Arg Val Pro Phe Ile 2260 2265 2270 Arg Asn Val Lys Arg Ala Phe Glu Ala Arg Thr Asn Gly Ala Ala Pro 2275 2280 2285 Asp Trp Arg Pro Leu Pro Val Gln Tyr Ala Asp Tyr Ala Ala Trp Gln 2290 2295 2300 Arg Asp Val Leu Gly Thr Glu Asp Asp Glu Ser Ser Glu Leu Ser Ala 2305 2310 2315 2320 Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala Ser Leu Pro Ala Glu Leu 2325 2330 2335 Ala Leu Pro Thr Asp Arg Ala Arg Pro Ala Val Ala Ser Tyr Glu Gly 2340 2345 2350 Gly Lys Val Glu Phe Thr Val Pro Ala Gly Val Tyr Asp Gly Leu Val 2355 2360 2365 Ala Leu Ala Arg Ala Glu Gly Val Thr Val Phe Met Val Val Gln Ala 2370 2375 2380 Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile Pro 2385 2390 2395 2400 Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp Gln Ala Thr Glu Asp Leu 2405 2410 2415 Ile Gly Phe Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser Gly 2420 2425 2430 Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp Leu 2435 2440 2445 Asp Ala Tyr Ala His Gln Asp Ile Pro Phe Glu Arg Leu Val Glu Ala 2450 2455 2460 Val Asn Pro Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val Met 2465 2470 2475 2480 Leu Thr Phe Asp Asn Thr Ile Asp Arg Glu Val Thr Glu Gly Phe Ala 2485 2490 2495 Gly Leu Gly Val Glu Gly Leu Pro Leu Gly Ala Gly Ala Val Lys Phe 2500 2505 2510 Asp Leu Leu Phe Gly Leu Ser Glu Val Gly Gly Glu Leu Arg Gly Ala 2515 2520 2525 Val Glu Tyr Arg Cys Asp Leu Phe Asp His Pro Thr Val Ala Gln Leu 2530 2535 2540 Ala Glu Arg Leu Val Arg Val Leu Glu Arg Val Ala Ser Asp Ala Ser 2545 2550 2555 2560 Val Arg Thr Gly Glu Leu Pro Val Val Gly Glu Ala Glu Arg Ala Arg 2565 2570 2575 Val Leu Thr Glu Trp Asn Asp Thr Gly Val Pro Gly Val Pro Glu Thr 2580 2585 2590 Phe Leu Glu Leu Phe Glu Ala Gln Val Ala Ala Arg Gly Asp Ala Pro 2595 2600 2605 Ala Val Val Tyr Glu Gly Glu Val Leu Ser Tyr Arg Glu Leu Asp Ala 2610 2615 2620 Arg Ala Asn Arg Leu Ala Gly Leu Leu Val Gly Arg Gly Ala Gly Pro 2625 2630 2635 2640 Glu His Phe Val Gly Val Ala Leu Pro Arg Gly Leu Asp Leu Ile Val 2645 2650 2655 Ala Leu Leu Ala Val Leu Lys Ser Gly Ala Ala Tyr Val Pro Leu Asp 2660 2665 2670 Pro Glu Tyr Pro Ala Glu Arg Leu Val His Met Val Thr Asp Ala Ala 2675 2680 2685 Pro Val Val Val Val Thr Ser Thr Asp Val Arg Thr Leu Arg Thr Val 2690 2695 2700 Pro Arg Val Glu Leu Asp Asp Glu Ala Thr Arg Ala Thr Leu Val Ala 2705 2710 2715 2720 Ala Pro Ala Thr Gly Pro Asp Val Lys Met Ser Ala Ser His Pro Ala 2725 2730 2735 Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Val 2740 2745 2750 Ile Ser His Gly Ser Leu Ala Asn Phe Leu Ala Trp Ala Arg Glu Asp 2755 2760 2765 Leu Gly Ala Glu Arg Leu Arg His Val Val Leu Ser Thr Ser Leu Ser 2770 2775 2780 Phe Asp Val Ser Val Val Glu Leu Phe Ala Pro Leu Ser Cys Gly Gly 2785 2790 2795 2800 Thr Val Glu Ile Val Arg Asn Leu Leu Ala Leu Val Asp Arg Pro Gly 2805 2810 2815 Arg Trp Ser Ala Ser Leu Val Ser Gly Val Pro Ser Ala Phe Ala Gln 2820 2825 2830 Leu Leu Glu Ala Gly Leu Asp Arg Ala Asp Val Gly Met Ile Ala Leu 2835 2840 2845 Ala Gly Glu Ala Leu Ser Ala Arg Asp Val Arg Arg Val Arg Ala Val 2850 2855 2860 Leu Pro Gly Ala Arg Val Ala Asn Phe Tyr Gly Pro Thr Glu Ala Thr 2865 2870 2875 2880 Val Tyr Ala Thr Ala Trp Tyr Gly Asp Thr Pro Met Asp Ala Ala Ala 2885 2890 2895 Pro Met Gly Arg Pro Leu Arg Asn Thr Cys Val Tyr Val Leu Asp Asp 2900 2905 2910 Gly Leu Arg Val Val Pro Val Gly Val Val Gly Glu Leu Tyr Val Ala 2915 2920 2925 Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly Arg Val Gly Leu Thr Ala 2930 2935 2940 Glu Arg Phe Val Ala Cys Pro Phe Gly Ala Arg Gly Glu Arg Met Tyr 2945 2950 2955 2960 Arg Thr Gly Asp Leu Val Arg Trp Arg Val Asp Gly Thr Leu Glu Phe 2965 2970 2975 Val Gly Arg Ala Asp Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu 2980 2985 2990 Leu Gly Glu Val Glu Gly Ala Val Ala Ala His Pro Asp Val Val Arg 2995 3000 3005 Ala Val Val Val Val Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val 3010 3015 3020 Ala Tyr Val Thr Gly Val Asp Thr Gly Gly Leu Ser Ser Ala Val Met 3025 3030 3035 3040 Arg Ala Val Ala Glu Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val 3045 3050 3055 Val Val Leu Asp Glu Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg 3060 3065 3070 Ala Gly Leu Pro Val Pro Val Val Ser Val Ala Gly Phe Cys Ala Pro 3075 3080 3085 Ser Ser Pro Arg Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu 3090 3095 3100 Gly Val Glu Arg Val Gly Val Asp Asp Gly Phe Phe Asp Leu Gly Gly 3105 3110 3115 3120 Asp Ser Ile Leu Ser Ile Gln Leu Val Ala Arg Ala Arg Arg Ala Gly 3125 3130 3135 Leu Glu Leu Ser Val Arg Asp Val Phe Glu Gly Arg Thr Val Arg Ala 3140 3145 3150 Leu Ala Ala Val Val Arg Gly Ser Asp Ala Gly Ala Val Gly Val Val 3155 3160 3165 Gly Gly Ala Glu Ile Val Leu Pro Gly Val Gly Glu Val Glu Arg Trp 3170 3175 3180 Pro Val Val Glu Trp Leu Ala Glu Arg Gly Gly Gly Ser Leu Gly Gly 3185 3190 3195 3200 Val Val Arg Gly Phe Asn Gln Ser Val Val Leu Ala Val Pro Ala Gly 3205 3210 3215 Leu Val Trp Glu Glu Leu Arg Val Leu Leu Gly Ala Val Arg Asp Arg 3220 3225 3230 His Glu Ala Trp Arg Leu Arg Val Leu Asp Ser Gly Ala Leu Cys Val 3235 3240 3245 Asp Gly Val Val Pro Asp Asp Gly Ser Trp Ile Val Arg Cys Asp Leu 3250 3255 3260 Ser Gly Met Gly Val Asp Gly Gln Val Asp Ala Val Arg Ala Ala Ala 3265 3270 3275 3280 Val Glu Ala Arg Ala Trp Leu Asp Pro Ser Val Gly Arg Val Val Arg 3285 3290 3295 Ala Val Trp Leu Glu Arg Gly Gly Asp Arg Ser Gly Val Leu Val Leu 3300 3305 3310 Val Ala His His Leu Val Val Asp Gly Val Ser Trp Arg Val Val Leu 3315 3320 3325 Gly Asp Leu Ala Glu Gly Trp Ala Gln Val Arg Ser Gly Gly Arg Val 3330 3335 3340 Glu Leu Gly Val Val Gly Thr Ser Leu Arg Gly Trp Ala Ala Ala Leu 3345 3350 3355 3360 Ala Glu Gln Gly Arg Arg Gly Glu Arg Ala Gly Glu Val Glu Leu Trp 3365 3370 3375 Ser Arg Met Val Arg Gly Ala Asp Val Leu Val Gly Ser Arg Ala Val 3380 3385 3390 Asp Gly Ala Val Asp Val Phe Gly Gly Val Val Ser Val Asp Ser Arg 3395 3400 3405 Ala Ser Val Ser Val Ser Arg Ala Leu Leu Thr Glu Val Pro Ser Val 3410 3415 3420 Leu Gly Val Gly Val Gln Glu Val Leu Leu Ala Ala Phe Gly Leu Ala 3425 3430 3435 3440 Val Ala Arg Trp Arg Gly Arg Gly Gly Pro Val Val Val Asp Val Glu 3445 3450 3455 Gly His Gly Arg Asn Glu Asp Ala Val Arg Gly Ala Asp Leu Ser Arg 3460 3465 3470 Thr Val Gly Trp Phe Thr Ser Val Tyr Pro Val Arg Val Pro Val Glu 3475 3480 3485 Ser Ala Ser Trp Asp Glu Val Arg Ala Gly Gly Pro Val Val Gly Arg 3490 3495 3500 Val Val Arg Glu Val Lys Glu Thr Leu Arg Ser Leu Pro Asp Gln Gly 3505 3510 3515 3520 Leu Gly Tyr Gly Ile Leu Arg Tyr Leu Asp Pro Glu His Gly Pro Ala 3525 3530 3535 Leu Ala Arg His Ala Thr Pro Gln Phe Gly Phe Asn Tyr Leu Gly Arg 3540 3545 3550 Phe Thr Thr Gly Thr Asp Asp Thr Gly Asp Glu Gly Met Thr Asp Trp 3555 3560 3565 Val Pro Val Ser Gly Pro Phe Ala Val Gly Ala Gly Gln Asp Pro Glu 3570 3575 3580 Leu Pro Val Ala His Ala Val Glu Phe Asn Ala Ile Thr Leu Asp Thr 3585 3590 3595 3600 Pro Glu Gly Pro Arg Leu Gly Val Thr Trp Ser Trp Pro Thr Thr Leu 3605 3610 3615 Leu Pro Glu Ser Arg Ile Arg Glu Leu Ala Arg Tyr Trp Asp Glu Ala 3620 3625 3630 Leu Glu Gly Leu Val Glu His Ala Arg His Pro Glu Ala Gly Gly Leu 3635 3640 3645 Thr Pro Ser Asp Val Thr Leu Val Glu Val Asn Gln Val Glu Leu Asp 3650 3655 3660 Arg Leu Gln Ala Gly Val Ala Gly Gly Ala Glu Glu Ile Leu Pro Val 3665 3670 3675 3680 Ser Ala Leu Gln Glu Gly Leu Leu Phe His Ser Ala Leu Ala Ser Gly 3685 3690 3695 Gly Val Asp Val Tyr Val Gly Gln Leu Val Phe Asp Leu Val Gly Pro 3700 3705 3710 Val Asp Val Asp Arg Leu Arg Ala Ala Val Glu Gly Leu Val Ala Arg 3715 3720 3725 His Gly Val Leu Arg Ser Gly Tyr Arg Gln Leu Arg Ser Gly Glu Trp 3730 3735 3740 Val Ala Val Val Ala Arg Gln Val Asp Leu Pro Trp Gln Ser Ile Asp 3745 3750 3755 3760 Val Arg Asp Gly Gly Ile Asp Gly Leu Val Glu Glu Glu Arg Trp Arg 3765 3770 3775 Arg Phe Asp Met Gly Arg Gly Pro Leu Ala Arg Phe Val Leu Ile Arg 3780 3785 3790 Thr His Asp Asp Arg Phe Arg Phe Val Ile Thr Tyr His His Val Val 3795 3800 3805 Leu Asp Gly Trp Ser Val Pro Val Leu Leu Arg Glu Leu Leu Ala Leu 3810 3815 3820 Tyr Gly Ser Ser Gly Asp Val Ser Val Leu Pro Gly Val Arg Ser Tyr 3825 3830 3835 3840 Gly Asp Phe Leu Arg Trp Val Ala Ala Arg Asp Ala Ala Ala Ala Glu 3845 3850 3855 Gly Ala Trp Arg Arg Ala Leu Thr Gly Leu Glu Glu Pro Ser Leu Val 3860 3865 3870 Ala Pro Gly Val Ser Arg Asp Gly Val Val Pro Ala Ala Phe His Gly 3875 3880 3885 Ala Val Asp Gly Asp Leu Ser Gln Lys Ile Val Ala Trp Ala Arg Gly 3890 3895 3900 Arg Gly Val Thr Val Ala Ser Val Val Gln Ala Ala Trp Ala Leu Val 3905 3910 3915 3920 Leu Gly Arg Leu Met Gly Arg Asp Asp Val Val Phe Gly Val Thr Val 3925 3930 3935 Ser Gly Arg Pro Ala Glu Val Val Gly Val Glu Asp Met Val Gly Leu 3940 3945 3950 Phe Val Asn Thr Ile Pro Leu Arg Ala Arg Leu Asp Pro Ala Glu Ser 3955 3960 3965 Leu Gly Gly Phe Val Glu Arg Leu Gln Arg Glu Gln Thr Glu Leu Leu 3970 3975 3980 Glu His Gln His Val Arg Leu Ala Glu Val Gln Arg Trp Ala Gly His 3985 3990 3995 4000 Lys Glu Leu Phe Asp Val Gly Met Val Phe Asp Asn Tyr Pro Val Ser 4005 4010 4015 Ser Glu Ser Pro Glu Ala Glu Phe Gln Ile Ser Arg Thr Gly Gly Tyr 4020 4025 4030 Asn Gly Thr His Tyr Ala Leu Asn Leu Val Ala Ser Met His Gly Leu 4035 4040 4045 Glu Leu Glu Leu Glu Ile Gly Tyr Arg Pro Asp Val Phe Asp Ala Gly 4050 4055 4060 Arg Val Arg Glu Val Trp Gly Trp Leu Val Arg Val Leu Glu Gly Val 4065 4070 4075 4080 Val Ser Gly Gly Gly Gly Val Ser Val Ser Gly Val Asp Val Leu Gly 4085 4090 4095 Val Gly Glu Arg Glu Arg Leu Leu Gly Trp Gly Val Gly Gly Pro Val 4100 4105 4110 Pro Val Val Pro Gly Gly Gly Leu Val Gly Leu Phe Glu Glu Arg Val 4115 4120 4125 Arg Ala Asp Ala Asp Ala Val Ala Val Arg Gly Ala Gly Val Val Trp 4130 4135 4140 Ser Tyr Gly Glu Leu Asn Ala Arg Val Asn Val Val Ala Arg Trp Leu 4145 4150 4155 4160 Val Gly Arg Gly Val Gly Ala Glu Cys Gly Val Gly Val Val Met Gly 4165 4170 4175 Arg Gly Val Asp Val Val Val Met Leu Leu Ala Val Ala Lys Ala Gly 4180 4185 4190 Gly Phe Tyr Val Pro Val Asp Pro Glu Trp Pro Val Glu Arg Val Gly 4195 4200 4205 Trp Val Leu Ala Asp Ala Gly Val Gly Leu Val Val Val Gly Glu Gly 4210 4215 4220 Leu Ser His Val Val Gly Asp Phe Pro Gly Gly Glu Val Phe Glu Phe 4225 4230 4235 4240 Ser Arg Val Val Arg Glu Ser Cys Leu Val Glu Leu Val Ala Ala Asp 4245 4250 4255 Gly Val Glu Val Arg Asn Val Thr Asp Gly Glu Arg Ala Ser Arg Leu 4260 4265 4270 Leu Pro Gly His Pro Leu Tyr Val Val Tyr Thr Ser Gly Ser Thr Gly 4275 4280 4285 Arg Pro Lys Gly Val Val Val Thr His Ala Ser Val Gly Gly Tyr Leu 4290 4295 4300 Ala Arg Gly Arg Asp Val Tyr Ala Gly Ala Val Gly Gly Val Gly Phe 4305 4310 4315 4320 Val His Ser Ser Leu Ala Phe Asp Leu Thr Val Thr Val Leu Phe Thr 4325 4330 4335 Pro Leu Val Ser Gly Gly Cys Val Val Leu Gly Glu Leu Asp Glu Ser 4340 4345 4350 Ala Gln Gly Val Gly Ala Ser Phe Val Lys Val Thr Pro Ser His Leu 4355 4360 4365 Gly Leu Leu Gly Glu Leu Glu Gly Val Val Ala Gly Asn Gly Met Leu 4370 4375 4380 Leu Val Gly Gly Glu Ala Leu Ser Gly Gly Ala Leu Arg Glu Trp Arg 4385 4390 4395 4400 Glu Arg Asn Pro Gly Val Val Val Val Asn Ala Tyr Gly Pro Thr Glu 4405 4410 4415 Leu Thr Val Asn Cys Ala Glu Phe Leu Ile Ala Pro Gly Glu Glu Val 4420 4425 4430 Pro Asp Gly Pro Val Pro Ile Gly Arg Pro Phe Ala Gly Gln Arg Met 4435 4440 4445 Phe Val Leu Asp Ala Ala Leu Arg Val Val Pro Val Gly Val Val Gly 4450 4455 4460 Glu Leu Tyr Val Ala Gly Val Gly Leu Ala Arg Gly Tyr Leu Gly Arg 4465 4470 4475 4480 Val Gly Leu Thr Ala Glu Arg Phe Val Ala Cys Pro Phe Gly Val Pro 4485 4490 4495 Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Arg Val Asp 4500 4505 4510 Gly Ala Leu Glu Phe Val Gly Arg Ala Asp Asp Gln Val Lys Val Arg 4515 4520 4525 Gly Phe Arg Val Glu Leu Gly Glu Val Glu Gly Ala Val Ala Ala His 4530 4535 4540 Pro Asp Val Val Arg Ala Val Val Val Val Arg Glu Asp Arg Pro Gly 4545 4550 4555 4560 Asp His Arg Leu Val Ala Tyr Val Thr Ala Gly Gly Val Gly Gly Asp 4565 4570 4575 Gly Leu Arg Ser Ala Ile Ser Gly Leu Val Ala Glu Arg Leu Pro Ala 4580 4585 4590 Tyr Met Val Pro Ser Ala Val Val Val Leu Asp Glu Ile Pro Leu Thr 4595 4600 4605 Pro Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val Pro Glu Val Glu 4610 4615 4620 Ala Gly Thr Gly Tyr Arg Ala Pro Val Ser Pro Arg Glu Glu Val Leu 4625 4630 4635 4640 Cys Gly Leu Phe Ala Glu Val Leu Gly Val Glu Arg Val Gly Val Asp 4645 4650 4655 Asp Asp Phe Phe Glu Leu Gly Gly His Ser Leu Leu Ala Thr Arg Leu 4660 4665 4670 Ile Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala Gly Val Arg Ala 4675 4680 4685 Leu Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg Leu Leu Arg Glu 4690 4695 4700 Arg Ser Gly Leu Gly Val Arg Val Pro Leu Val Ala Arg Glu Arg Thr 4705 4710 4715 4720 Gly Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu Trp Phe Leu Glu 4725 4730 4735 Glu Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro Met Ala Leu Arg 4740 4745 4750 Leu Ala Gly Val Leu Asp Val Glu Ala Leu His Gln Ala Leu Ile Asp 4755 4760 4765 Val Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile Ala Gln Asp Ala 4770 4775 4780 Gly Thr Ala Trp Gln His Ile Leu Pro Val Asp Asp Pro Arg Thr Arg 4785 4790 4795 4800 Pro Gly Leu Pro Leu Val Asp Ile Gly Ala Asp Ala Leu Gln Glu Arg 4805 4810 4815 Leu Asp Glu Ala Ala Gly Arg Pro Phe Asp Leu Ala Ala Asp Leu Pro 4820 4825 4830 Val Arg Ala Thr Val Phe Arg Leu Thr Asp Asn Asp His Ile Leu Leu 4835 4840 4845 Leu Val Leu His His Ile Ala Gly Asp Gly Trp Ser Met Gly Pro Leu 4850 4855 4860 Ala Arg Asp Leu Ser Thr Ala Tyr Ser Ala Arg Ala Ala Gly Ala Ala 4865 4870 4875 4880 Ser Ala Trp Arg Pro Leu Ser Val Gln Tyr Ala Asp Tyr Ala Ala Trp 4885 4890 4895 Gln Arg Asp Val Leu Gly Thr Glu Asp Asp Glu Ser Ser Glu Leu Ser 4900 4905 4910 Ala Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala Ser Leu Pro Ala Glu 4915 4920 4925 Leu Ala Leu Pro Thr Asp Arg Ala Arg Pro Ala Val Ala Thr Tyr Arg 4930 4935 4940 Gly Gly Arg Ile Glu Phe Thr Ile Pro Ala Asp Val His Arg Ser Leu 4945 4950 4955 4960 Ala Asp Leu Ala Arg Ala Glu Gly Val Thr Val Phe Met Val Val Gln 4965 4970 4975 Ala Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly Ala Gly Asp Asp Ile 4980 4985 4990 Pro Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp Gln Ala Thr Glu Asp 4995 5000 5005 Leu Ile Gly Phe Phe Val Asn Thr Leu Val Leu Arg Thr Asp Val Ser 5010 5015 5020 Gly Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg Val Arg Ala Thr Asp 5025 5030 5035 5040 Leu Asp Ala Tyr Ala His Gln Asp Ile Pro Phe Glu Arg Leu Val Glu 5045 5050 5055 Ala Val Asn Pro Glu Arg Ser Leu Ala Arg His Pro Leu Phe Gln Val 5060 5065 5070 Met Leu Ala Phe Asn Asn Ala Glu Thr Ser Thr Pro Leu Pro Met Ala 5075 5080 5085 Glu Gly Leu Ala Ala Ser Arg Gln Asp Ile Glu Pro Gly Val Ala Lys 5090 5095 5100 Phe Asp Leu Ala Leu Tyr Cys Asn Glu Ser Arg Gly Glu Thr Gly Asp 5105 5110 5115 5120 His Gln Gly Ile Arg Ser Val Phe Glu Tyr Arg Arg Asp Leu Trp Asp 5125 5130 5135 Glu Asp Thr Val Arg Gln Leu Ala Asp Arg Phe Leu His Val Leu Ala 5140 5145 5150 Ala Phe Ala Ala Ala Pro Glu Gln Arg Ala Ser Ser Val Asp Val Leu 5155 5160 5165 Arg Ala Gly Glu Arg Asp Gln Leu Leu His Glu Trp Asn Asp Thr Ala 5170 5175 5180 Ala Ala Leu Pro Pro Ala Leu Leu Pro Gln Leu Phe Glu Glu Gln Val 5185 5190 5195 5200 Arg Arg Thr Pro His Asp Val Ala Leu Val Ser Gly Asn Ile Arg Leu 5205 5210 5215 Thr Tyr Ala Glu Leu Asp Ala Arg Ala Asn Arg Leu Ala His Leu Leu 5220 5225 5230 Leu Ala Arg Gly Ala Ala Pro Glu Thr Phe Val Ala Val Ala Leu Pro 5235 5240 5245 Arg Thr Glu Glu Leu Leu Val Ala Leu Leu Ala Val Gln Lys Thr Gly 5250 5255 5260 Ala Gly His Leu Pro Leu Asp Pro Gly Phe Pro Ala Glu Arg Leu Ser 5265 5270 5275 5280 Tyr Met Leu Asp Asp Ala Arg Pro Ala Val Val Leu Thr Thr Glu Asp 5285 5290 5295 Ile Ser Ala Arg Ile Pro Gly Gly Ser His Val Val Leu Asp Ser Glu 5300 5305 5310 Gln Val Thr Gly Glu Leu His Asp His Pro Ala Thr Ser Pro Ala Gly 5315 5320 5325 Arg Gly Asn Pro Ala Gly Pro Ala Tyr Val Ile Tyr Thr Ser Gly Ser 5330 5335 5340 Thr Gly Gln Pro Lys Gly Val Val Val Pro Ser Ala Ala Leu Val Asn 5345 5350 5355 5360 Phe Leu Ala Asp Met Val Pro Arg Leu Gly Leu Arg Gly Gly Asp Arg 5365 5370 5375 Leu Leu Ser Val Thr Thr Val Gly Phe Asp Ile Ala Ala Leu Glu Leu 5380 5385 5390 Phe Val Pro Leu Leu Ser Gly Ala Thr Val Val Leu Ala Asp Gly Glu 5395 5400 5405 Thr Val Arg Asp Pro Ala Leu Ala Arg Gln Thr Cys Glu Asp His Gly 5410 5415 5420 Val Thr Met Val Gln Ala Thr Pro Ser Trp Trp His Gly Met Leu Ala 5425 5430 5435 5440 Asp Ala Gly Asp Ser Leu Arg Gly Val His Ala Val Val Gly Gly Glu 5445 5450 5455 Ala Leu Ser Pro Gly Leu Arg Asp Ala Leu Thr Arg Gly Ala Arg Ser 5460 5465 5470 Val Thr Asn Met Tyr Gly Pro Thr Glu Thr Thr Ile Trp Ser Thr Ser 5475 5480 5485 Ala Gly Gln Ala Ala Gly Asp Ser Ala Pro Pro Ser Ile Gly Thr Pro 5490 5495 5500 Ile Leu Asn Thr Arg Val Tyr Val Leu Asp Ala Ala Leu Cys Val Val 5505 5510 5515 5520 Pro Pro Gly Val Ala Gly Glu Leu Tyr Ile Ala Gly Asp Gly Leu Ala 5525 5530 5535 Arg Gly Tyr Leu Gly Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala 5540 5545 5550 Cys Pro Phe Gly Ala Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu 5555 5560 5565 Val Arg Trp Arg Val Asp Gly Ala Leu Glu Phe Val Gly Arg Ala Asp 5570 5575 5580 Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu Leu Gly Glu Val Glu 5585 5590 5595 5600 Gly Ala Val Ala Ala His Pro Asp Val Val Arg Ala Val Val Val Val 5605 5610 5615 Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val Ala Tyr Val Thr Gly 5620 5625 5630 Val Asp Thr Gly Gly Leu Ser Ser Ala Val Met Arg Ala Val Ala Glu 5635 5640 5645 Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val Val Val Leu Asp Glu 5650 5655 5660 Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg Ala Ala Leu Pro Val 5665 5670 5675 5680 Pro Gly Val Glu Ala Gly Ala Gly Tyr Arg Ala Pro Val Ser Pro Arg 5685 5690 5695 Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu Gly Val Glu Arg 5700 5705 5710 Val Gly Val Asp Asp Asp Phe Phe Gly Leu Gly Gly His Ser Leu Leu 5715 5720 5725 Ala Thr Arg Leu Ile Ser Arg Val Arg Ala Val Leu Gly Val Glu Ala 5730 5735 5740 Gly Val Arg Ala Leu Phe Glu Ala Pro Thr Val Ser Arg Leu Glu Arg 5745 5750 5755 5760 Leu Leu Arg Glu Arg Ser Gly Leu Gly Val Arg Val Pro Leu Val Ala 5765 5770 5775 Arg Glu Arg Thr Gly Arg Glu Pro Leu Ser Phe Ala Gln Gln Arg Leu 5780 5785 5790 Trp Phe Leu Glu Glu Leu Glu Gly Pro Gly Ala Ala Tyr Asn Ile Pro 5795 5800 5805 Met Ala Leu Arg Leu Ala Gly Val Leu Asp Val Glu Ala Leu His Gln 5810 5815 5820 Ala Leu Ile Asp Val Ile Ala Arg His Glu Ser Leu Arg Thr Leu Ile 5825 5830 5835 5840 Ala Arg Asp Ser Asp Gly Thr Ala Arg Gln Gln Val Leu Pro Val Gly 5845 5850 5855 Asp Pro Ala Ala Arg Pro Ala Leu Pro Val Val Gln Thr Asp Ala Asp 5860 5865 5870 Thr Leu Val Ala Lys Leu Asn Glu Ala Val Gly Arg Pro Phe Asp Leu 5875 5880 5885 Thr Ala Glu Met Pro Leu Arg Ala Thr Val Phe Arg Val Ala Asp Glu 5890 5895 5900 Asp His Ala Leu Leu Leu Val Phe His His Ile Ala Gly Asp Gly Trp 5905 5910 5915 5920 Ser Thr Gly Leu Leu Ala Arg Asp Leu Ser Thr Ala Tyr Ala Ala Arg 5925 5930 5935 Leu Glu Gly Arg Asp Pro Gln Leu Pro Pro Leu Pro Val Gln Tyr Ala 5940 5945 5950 Asp Tyr Ala Ala Trp Gln Arg Asp Val Leu Gly Thr Glu Asp Asp Glu 5955 5960 5965 Ser Ser Glu Leu Ser Ala Gln Leu Ala Tyr Trp Arg Thr Gln Leu Ala 5970 5975 5980 Asp Leu Pro Ala Glu Leu Ala Leu Pro Ala Asp Arg Val Arg Pro Ala 5985 5990 5995 6000 Arg Ala Ser Tyr Glu Gly Gly Arg Val Gly Phe Thr Val Pro Ala Gly 6005 6010 6015 Val Leu Arg Asp Leu Thr Arg Leu Ala Arg Val Glu Gly Val Thr Val 6020 6025 6030 Phe Met Val Val Gln Ala Ala Leu Ala Ala Leu Leu Ser Arg Leu Gly 6035 6040 6045 Ala Gly Asp Asp Ile Pro Ile Gly Thr Pro Ile Ala Gly Arg Thr Asp 6050 6055 6060 Gln Ala Thr Glu Asp Leu Ile Gly Phe Phe Val Asn Thr Leu Val Leu 6065 6070 6075 6080 Arg Thr Asp Val Ser Gly Asp Pro Thr Phe Ala Glu Leu Leu Ala Arg 6085 6090 6095 Val Arg Ala Thr Asp Leu Asp Ala Tyr Ala His Gln Asp Ile Pro Phe 6100 6105 6110 Glu Arg Leu Val Glu Ala Val Asn Pro Glu Arg Ser Leu Ala Arg His 6115 6120 6125 Pro Leu Phe Gln Val Met Leu Ala Phe Asp Asn Thr Ala Asp Gly Gly 6130 6135 6140 Pro Val Glu Asp Phe Pro Gly Leu Ser Ala Ala Gly Leu Pro Leu Gly 6145 6150 6155 6160 Ala Gly Ala Ala Lys Phe Asp Leu Leu Phe Gly Leu Ser Glu Val Gly 6165 6170 6175 Gly Glu Leu Arg Gly Ala Val Glu Tyr Arg Cys Asp Leu Phe Asp His 6180 6185 6190 Pro Thr Ala Ala Arg Ile Ala Glu Arg Leu Val Arg Val Leu Glu Arg 6195 6200 6205 Val Ala Ala Asp Ala Ser Val Arg Leu Gly Glu Leu Pro Val Val Ser 6210 6215 6220 Asp Ala Glu Arg Ala Cys Val Leu Thr Glu Trp Asn Asp Thr Ala Val 6225 6230 6235 6240 Pro Gly Val Thr Gly Thr Leu Ser Ala Leu Phe Glu Ala Arg Ala Ala 6245 6250 6255 Ala Arg Gly Asp Ala Pro Ala Val Val Tyr Glu Gly Glu Glu Leu Ser 6260 6265 6270 Tyr Arg Glu Leu Asn Thr Arg Ala Asn Arg Leu Ala His Val Leu Ala 6275 6280 6285 Glu His Gly Ala Gly Pro Glu Arg Phe Val Gly Val Ala Leu Pro Arg 6290 6295 6300 Ser Pro Asp Leu Val Val Ala Leu Leu Ala Val Val Lys Ser Gly Ala 6305 6310 6315 6320 Ala Tyr Val Pro Leu Asp Pro Glu Tyr Pro Ala Asp Arg Leu Ala Tyr 6325 6330 6335 Met Ala Gly Asp Ala Ala Pro Val Ala Val Leu Thr Arg Gly Asp Val 6340 6345 6350 Glu Leu Pro Gly Ser Val Pro Arg Ile Gly Leu Asp Asp Thr Glu Ile 6355 6360 6365 Arg Ala Thr Leu Ala Thr Ala Pro Gly Thr Asn Pro Gly Thr Pro Val 6370 6375 6380 Thr Glu Ala His Pro Ala Tyr Met Ile Tyr Thr Ser Gly Ser Thr Gly 6385 6390 6395 6400 Arg Pro Lys Gly Val Val Val Ser His Gly Ala Ile Val Asn Arg Leu 6405 6410 6415 Ala Trp Met Gln Ala Glu Tyr Arg Leu Asp Ala Thr Asp Arg Val Leu 6420 6425 6430 Gln Lys Thr Pro Ala Gly Phe Asp Val Ser Val Trp Glu Phe Phe Trp 6435 6440 6445 Pro Leu Leu Glu Gly Ala Val Leu Val Phe Ala Arg Pro Gly Gly His 6450 6455 6460 Arg Asp Ala Ala Tyr Leu Ala Gly Leu Ile Glu Arg Glu Arg Ile Thr 6465 6470 6475 6480 Thr Ala His Phe Val Pro Ser Met Leu Arg Val Phe Leu Glu Glu Pro 6485 6490 6495 Gly Ala Ala Leu Cys Thr Gly Leu Arg Arg Val Ile Cys Ser Gly Glu 6500 6505 6510 Ala Leu Gly Thr Asp Leu Ala Val Asp Phe Arg Ala Lys Leu Pro Val 6515 6520 6525 Pro Leu His Asn Leu Tyr Gly Pro Thr Glu Ala Ala Val Asp Val Thr 6530 6535 6540 His His Ala Tyr Glu Pro Ala Thr Gly Thr Ala Thr Val Pro Ile Gly 6545 6550 6555 6560 Arg Pro Ile Trp Asn Ile Arg Thr Tyr Val Leu Asp Ala Ala Leu Arg 6565 6570 6575 Pro Val Pro Pro Gly Val Pro Gly Glu Leu Tyr Leu Ala Gly Ala Gly 6580 6585 6590 Leu Ala Arg Gly Tyr His Gly Arg Pro Ala Leu Thr Ala Glu Arg Phe 6595 6600 6605 Val Ala Cys Pro Phe Gly Val Pro Gly Glu Arg Met Tyr Arg Thr Gly 6610 6615 6620 Asp Leu Val Arg Trp Arg Val Asp Gly Thr Leu Glu Phe Val Gly Arg 6625 6630 6635 6640 Ala Asp Asp Gln Val Lys Val Arg Gly Phe Arg Val Glu Leu Gly Glu 6645 6650 6655 Val Glu Gly Ala Val Ala Ala His Pro Asp Val Val Arg Ala Val Val 6660 6665 6670 Val Val Arg Glu Asp Arg Pro Gly Asp His Arg Leu Val Ala Tyr Val 6675 6680 6685 Thr Val Gly Gly Val Gly Gly Asp Gly Leu Arg Ser Ala Ile Ser Gly 6690 6695 6700 Leu Val Ala Glu Arg Leu Pro Ala Tyr Met Val Pro Ser Ala Val Val 6705 6710 6715 6720 Val Leu Asp Glu Ile Pro Leu Thr Pro Asn Gly Lys Val Asp Arg Ala 6725 6730 6735 Gly Leu Pro Val Pro Val Val Ser Val Ala Gly Phe Cys Ala Pro Ser 6740 6745 6750 Ser Pro Arg Glu Glu Val Leu Cys Gly Leu Phe Ala Glu Val Leu Gly 6755 6760 6765 Val Glu Arg Val Gly Val Asp Asp Gly Phe Phe Asp Leu Gly Gly Asp 6770 6775 6780 Ser Ile Leu Ser Ile Gln Leu Val Ala Arg Ala Arg Arg Ala Gly Leu 6785 6790 6795 6800 Glu Leu Ser Val Arg Asp Val Phe Glu Gly Arg Thr Val Arg Ala Leu 6805 6810 6815 Ala Ala Val Val Arg Gly Ser Asp Ala Gly Ala Val Gly Val Val Gly 6820 6825 6830 Gly Ala Glu Ile Val Leu Pro Gly Val Gly Glu Val Glu Arg Trp Pro 6835 6840 6845 Val Val Glu Trp Leu Ala Glu Arg Gly Gly Gly Ser Leu Gly Gly Val 6850 6855 6860 Val Arg Gly Phe Asn Gln Ser Val Val Leu Ala Val Pro Ala Gly Leu 6865 6870 6875 6880 Val Trp Glu Glu Leu Arg Val Leu Leu Gly Ala Val Arg Asp Arg His 6885 6890 6895 Glu Ala Trp Arg Leu Arg Val Leu Asp Ser Gly Ala Leu Cys Val Asp 6900 6905 6910 Gly Val Val Pro Asp Asp Gly Ser Trp Ile Val Arg Cys Asp Leu Ser 6915 6920 6925 Gly Met Gly Val Asp Gly Gln Val Asp Ala Val Arg Ala Ala Ala Val 6930 6935 6940 Glu Ala Arg Ala Trp Leu Asp Pro Ser Val Gly Arg Val Val Arg Ala 6945 6950 6955 6960 Val Trp Leu Glu Arg Gly Gly Asp Arg Ser Gly Val Leu Val Leu Val 6965 6970 6975 Ala His His Leu Val Val Asp Gly Val Ser Trp Arg Val Val Leu Gly 6980 6985 6990 Asp Leu Ala Glu Gly Trp Ala Gln Val Arg Ser Gly Gly Arg Val Glu 6995 7000 7005 Leu Gly Val Val Gly Thr Ser Leu Arg Gly Trp Ala Ala Ala Leu Ala 7010 7015 7020 Glu Gln Gly Arg Arg Gly Glu Arg Ala Gly Glu Val Glu Leu Trp Ser 7025 7030 7035 7040 Arg Met Val Arg Gly Ala Asp Val Leu Val Gly Ser Arg Ala Val Asp 7045 7050 7055 Gly Ala Val Asp Val Phe Gly Gly Val Val Ser Val Asp Ser Arg Ala 7060 7065 7070 Ser Val Ser Val Ser Arg Ala Leu Leu Thr Glu Val Pro Ser Val Leu 7075 7080 7085 Gly Val Gly Val Gln Glu Val Leu Leu Ala Ala Phe Gly Leu Ala Val 7090 7095 7100 Ala Arg Trp Arg Gly Arg Gly Gly Pro Val Val Val Asp Val Glu Gly 7105 7110 7115 7120 His Gly Arg Asn Glu Asp Ala Val Arg Gly Ala Asp Leu Ser Arg Thr 7125 7130 7135 Val Gly Trp Phe Thr Ser Val Tyr Pro Val Arg Val Pro Val Glu Ser 7140 7145 7150 Ala Ser Trp Asp Glu Val Arg Ala Gly Gly Pro Val Val Gly Arg Val 7155 7160 7165 Val Arg Glu Val Lys Glu Thr Leu Arg Ser Leu Pro Asp Gln Gly Leu 7170 7175 7180 Gly Tyr Gly Ile Leu Arg Tyr Leu Asp Pro Glu His Gly Pro Ala Leu 7185 7190 7195 7200 Ala Arg His Ala Thr Pro Gln Phe Gly Phe Asn Tyr Leu Gly Arg Phe 7205 7210 7215 Thr Thr Gly Thr Asp Glu Thr Thr Thr Ala Asp Ala Leu Asp Arg Ala 7220 7225 7230 Pro Ala Trp Ser Leu Leu Ala Arg Ser Ala Ala Gly Gln Asp Pro Glu 7235 7240 7245 Leu Pro Val Ala His Ala Val Glu Phe Asn Ala Ile Thr Leu Asp Thr 7250 7255 7260 Pro Glu Gly Pro Arg Leu Gly Val Thr Trp Ser Trp Pro Thr Thr Leu 7265 7270 7275 7280 Leu Pro Glu Ser Arg Ile Arg Glu Leu Ala Arg Tyr Trp Asp Glu Ala 7285 7290 7295 Leu Glu Gly Leu Val Glu His Ala Arg His Pro Glu Ala Gly Gly Leu 7300 7305 7310 Thr Pro Ser Asp Val Gly Leu Ala Glu Leu Ser Phe Ala Glu Ile Glu 7315 7320 7325 Leu Leu Glu Asp Asp Trp Arg Thr Gln Gly 7330 7335 <210> 12 <211> 22017 <212> DNA <213> Streptomyces roseosporus <400> 12 gtgaaccgcc ggtcgaaggt agtcgaggag atcctgcctg tctcggcgct ccaggaagga 60 ctgctgttcc acagctcctt cgccgccgcc gacggagtcg acgtgtacgc gggacagctc 120 gcgttcgacc tggtcggcgc ggtggacacc ggtcggctgc gggccgccgt cgaaagcctc 180 gtggcgcggc acggcgtcct gcgctcaagc taccgtcagg cgcgctccgg ggagtgggtc 240 gcggtcgtgg cgcggcgcgt cgcgacgcca tggcgcgccg tcgacgcccg cgacggtgcc 300 acggacgctg ccgccgtggc ccgggaggaa cgctggcgcc cgttcgacct gggccgggcc 360 ccgctggctc ggttcgtgct cgtacggacc gacgacgacc gtttccggtt cgtgatcacg 420 taccaccacg tcatcctcga cggctggtcg ctgccggtac tgctgcgcga actccttgcc 480 ctgtacggaa gcggcgccga cccgtcggtg ctgccgcccg tccgccccta cggcgacttt 540 ctccggtggg ccgccgcgcg cgacgacgcc gccgccgaaa ccgcctggcg cgacgcgctc 600 accggcctgg acgagccctc cctggtcgca cccggcgctt cccccgacgg cgtcgtgccg 660 gcctccgtcc acgccgaact cgacaaggcc ggcaccgaga acctcgccgc ctgggccagg 720 caccgcggca tcacccaggc caccgccgtc cgcgccgcgt gggccctcgt tctcggccag 780 cacaccggcc gcgacgacgt cgtgttcggc gtcaccgtct ccggacggcc cgccgaactc 840 gccggcgccg agcacatggt cggactcttc atcaacaccg tccccctgcg cacggtcctc 900 gaccccgccg acaccctcgg cacgttcgcc gctcgcctcc aggccgaaca gaccaccctc 960 ctcgaacacc agcacgtgcg gctctccgac atccagcgct gggccggaca caaagaactc 1020 ttcgacacca ttgtcgtctt cgagaactac cccatcggcc acagcggccc cggctccatc 1080 cgcaccgacg acttcaccgt caccgccacc gaaggctccg acgccaccca ctaccccctc 1140 accctcaccg ccgtacccgg cgaaaccctg cgcctcaagc tcgaccaccg ccccgacctc 1200 gtcgacacca ccaccgccac cgccctgctg cgccgcgtga cccgcgtcct ggaaaccgcc 1260 accgacgaca ccgggcacac cctcgcccgc ctcgacctcc tcgacgacga cgaacgccac 1320 cgcctgctgc gcggctggaa cgacaccacg cgcgagcagc cgcccaccta ctaccaccag 1380 gaattcgagg aacaggcgcg gaggcggccc cacgacacgg cccttgtctt caccagcacc 1440 tcctggacgt acgaagaact caacgaccgc gccaaccggc tcgcccgcct gctcgtcgcc 1500 gccggcgccg gctccgacga cttcgtcgcg ctcgccttcc cccgttccgc ggaatccgtc 1560 gtcgccatcc tcgccgtact caaagcgggc gccgcctacc tgccgctcga catggaccag 1620 cccgccgaac ggctcaccgg catcctcgcc gacgcacacc cgaccgtcgt cctcacgacc 1680 accaccgcca ccccgctgcc gcaccccggc cgcaccctcg tcctcgacag ccccaccacc 1740 gcccgcgccc tcgctgcggc acccgcacac aacctcaccg acgccgaccg ccgtaccccg 1800 ctcaacgccc gcaacgccgc ctacatcatc cacacctccg gctccaccgg acgccccaag 1860 ggcgtcgtca tcgaacaccg cagtctcgcc aacctcttcc acgaccatcg gcgcgccctc 1920 atagaacccc atgccgccgg aggatcacgg ctcaaggccg gcctcaccgc ctccctctcc 1980 ttcgacacct cctgggaagg tctgatctgc ctggccgccg gccacgaact gcaccttatt 2040 gacgacgaca cccgccgaga cgccgaacgc gtcgccgaac tcatcgaccg gcagcgcatc 2100 gacgtcatcg acgtcacccc ctccttcgcc cagcaactcg tagagaccgg aatcctcgac 2160 gagggccgcc accaccccgc cgccttcatg ctcggcggtg aaggcgtcga cgcgaaactc 2220 tggaccaggc tctccgacgt ccccggcgtc acctcgtaca actactacgg ccccaccgaa 2280 ttcaccgtcg acgccctcgc ctgcacggtc ggcatcgcac cccgccccgt catcggccac 2340 cccctcgaca acacggccgc ctacatcctc gacggcttcc tgcgtcccgt acccgaaggc 2400 gtcgccggcg agctctacct cgccggcacc cagctcgccc gcggctacgc cggccggccc 2460 ggcctgacgg ccgaacgctt cgtggcctgc cccttcggcg cgccgggcga acgcatgtac 2520 cgcaccggcg acctcgtccg gcgcagtccc ggcggcgtgg tcgaatacct cggacgcgtg 2580 gacgatcaga tcaaactccg cggcttccgc atcgaacccg ccgagatcga gctcgccctg 2640 gccggccacc ccgccgtcgc ccagaacgtc gtcctcctgc accgctccgc caccggagag 2700 gctcgcctcg tggcgtacgt cgtccccggc acacccgtcg acccgcggga actcaccggg 2760 cacctcgccg cccggctgcc cgcgtacatg gtgccctcgg ctttcgttct cctcgacacc 2820 ctcccgctca cccccaacgg caaactggac cgcggcgccc tgccggagcc cgccttcggt 2880 accgcgcccc gccccgagcg cccccgcaca cccgtcgagg agatcctctg cggcctgtac 2940 gccgacgtgc tcgggcttcc ctcgttcggc gccgacgacg acttcttcga cgccggcggg 3000 cactcgctgc tggccagcaa actcgtcagc cgtatccgta cgaacctgaa aaccgaactc 3060 aacgtccgcg ccctcttcga gcaccgcacg gtctcctccc tggccaccgc cctccaccgg 3120 gccgcgcagg ccggccccgc gctcaccgcc ggaccgcgcc ccgcacggat cccgctgtcg 3180 tacgcccagc gccgcctgtg gttcctcaac cggctcgacc gcgacagcgc cgcgtacaac 3240 atgcccgtcg cactccgcct gcgtggcccc ctggacagca ccgccatgtg cgccgcactc 3300 accgacgtcg ccgaacgcca cgaggcgctg cgcaccgtgt tcgaggagga ccgggacggt 3360 gcccaccaga tcgtgctgcc cgcgaccggc ctcggccctc tgctcaccgt gaccggggcc 3420 gacgggacga ccctgcgtgc cctcatcacc gagttcgtac gcaggccctt cgacctggcg 3480 gcggagatcc ccttccgcgc cgcactgttc cgcgtcggcg acgaggaaca tgtactggtc 3540 gtcgtcctgc accacatcgc cggggacggc tggtccatgg gaccgctcgc acgcgacgtg 3600 gccgaggcct accgggcgcg ggcggccggg agggcacccg actgggaacc gctgcccgtg 3660 cagtacgccg actacgcgct ctggcagcgg gaggtgctgg gcgcggagga cgacgagacc 3720 ggcgaactct ccgcccaact cgcccactgg cgcacccgcc tcgcaggggc ccccgcagaa 3780 ctcacgctgc ccaccgaccg cccacgcccc gctgtcgcct ccaccgccgg agaccgcgtc 3840 gaattcaccg tgcccgccgg actccaccag gccctcgccg acctggcacg ggcccacggc 3900 gcgacggtct tcatggtcgt ccaggccgcc ctcgccgtcc tgctgtcacg tctcggcgcc 3960 ggcgacgaca tccccatcgg caccccggtc gccggccgca ccgacgaggc cacggaggaa 4020 ctgatcgggt tcttcgtcaa cacgctggtg ctgcgcaccg acgtgtccgg cgacccgacg 4080 ttcgccgaac tcctcgcgcg ggtgcgggcc accgacctcg acgcgtacgc acaccaggac 4140 gtgccattcg aacgtctggt cgaggtgttg aacccggagc ggtcactggc acggcatcca 4200 ctgttccagg tcatgctgac gttcaacgtc ccggacatgg acggggtcgg aagcgcgctg 4260 gggaatctgg gggaactgga ggtctccggt gaggccatcc ggacggatca gaccaaggtg 4320 gatctcgctt tcacgtgcac ggagatgtac gccgcggacg gtgcggcctc gggaatgcgc 4380 ggggtgctgg aataccggct tgatgtgttc ggtgcggtac aggcccggga aacgacggag 4440 cggttggtgc gggtgttgga gggtgtggtt tctggtgggg gtggggtgtc tgtgtcgggg 4500 gttgatgtgt tgggtgtggg tgagcgggag aggttgttgg ggtggggtgt gggtgggccg 4560 gtgcctgtgg tgccgggtgg tgggttggtg gggttgttcg aggagcgggt gcgggccgac 4620 gcggacgcgg tggccgtgcg tggcgcgggg gtggtgtgga gttatgggga gttgaatgcg 4680 cgggtgaatg tggtggcgcg gtggttggtg ggtcggggtg tgggggcgga gtgtggtgtg 4740 ggtgtggtga tgggccgcgg ggtggatgtg gtggtgatgt tgctggcggt ggcgaaggcg 4800 ggtgggtttt atgtgccggt ggatccggag tggccggtgg agcgggtggg gtgggtgctg 4860 gcggatgccg gggtggggct ggttgtggtg ggggaggggt tgtcgcatgt ggtgggggat 4920 tttcctgggg gtgaggtttt cgagttttcg cgggttgttc gtgagtcgtg tcttgtggag 4980 ttggtggctg cggatggggt tgaggttcgg aatgtgacgg atggtgagcg ggcgtcgcgt 5040 ctgttgccgg ggcatccgtt gtatgtggtt tatacgtcgg gttcgacggg gcggccgaag 5100 ggtgttgtgg tgacgcatgc ttcggtgggt gggtatttgg cgcgtggtcg ggatgtgtat 5160 gcgggtgccg ttggtggtgt ggggtttgtg cattcgtcgc ttgcgttcga tctgacggtg 5220 acggttctgt tcacgccttt ggtgtctggc ggttgtgttg tgttgggtga gttggacgag 5280 tcggcgcagg gggtgggtgc ctcgttcgtg aaggtgactc cgtcgcatct gggtttgctg 5340 ggtgagctgg agggtgtggt ggcggggaac ggcatgctgc tggtgggggg tgaggcgttg 5400 tcgggtggtg cgctgcgtga gtggcgtgag cgtaatccgg gtgtggtggt ggtgaatgct 5460 tatggtccga cggagctgac ggtgaactgt gccgagttcc ttatcgcgcc tggtgaggag 5520 gttccggatg ggcctgtgcc gatcgggcgt cctttcgcgg gtcagcggat gtttgttctg 5580 gatgcggcgc tgcgggtggt gccggtcggt gtggtgggtg agttgtatgt ggcgggtgtg 5640 ggtctggcgc ggggctatct cgggcgtgcg ggtctgacgg cggagcggtt cgtggcctgc 5700 cccttcggtg cgccgggtga gcgtatgtac cgtacggggg atctggtgcg gtggcgggtg 5760 gacggcgcgc ttgagtttgt tggtcgtgcg gatgatcagg tgaaggtccg tggtttccgt 5820 gtggagttgg gtgaggtgga gggtgctgtt gcggcgcatc ctgatgtggt gcgtgcggtt 5880 gttgtggtgc gtgaggaccg gccgggtgat caccggttgg ttgcgtatgt caccggtgtt 5940 gacacgggtg gactgtcctc tgcggtgatg cgtgccgttg ctgagcgtct gcctgcgtac 6000 atggtgccgt cggcggtggt ggttctggat gagatcccgt tgacgccgaa tgggaaggtg 6060 gaccgggcgg cgcttccggt gccgggggtg gaggcgggcg cgggctaccg ggcgcctgtt 6120 tcgccgcggg aggaggtgtt gtgtggtctg ttcgcggagg tgctggggct ggagcgggtg 6180 ggggtggacg atgatttctt cgggttgggt ggtcattctc ttctggcgac tcgtctgatt 6240 tcgcgtgtcc gtgcggtgtt gggtgttgag gcgggtgtgc gggcgttgtt cgaggcgccg 6300 acggtgagcc gtttggagcg gttgctgcgg gagcggtcgg ctttgggggt gcgggtgcct 6360 ctggtggcac gggagcggac gggtcgggag ccgttgtcgt tcgctcagca gcgtctgtgg 6420 ttccttgagg aactggaagg gcccggtgct gcgtacaaca ttccgatggc gctgcgtctg 6480 gccggtgttc tggacgtcga agcgctgcac caggcgctca ttgatgtcat cgcccgccac 6540 gaaagcctcc gcaccctcat cgcgcaggat gcgggtactg cctggcagca catcctgccc 6600 gttgacgacc ctcgcacccg tcccggtctc cctcttgtgg acatcggtgc cgacgccctt 6660 caggagcggc tcgacgaagc cgccggccgg cccttcgatc tcgcggccga tctcccggtc 6720 cgggccacag tcttccgcct caccgacaac gaccacatcc tcctggtcgt ggcccatcac 6780 gtggccttcg acgcgatgtc ccgtgtgccg ttcatccgga acgtcaagcg cgccttcgag 6840 gcccgtacga acggcgcggc ccccgactgg aggccgctgc ccgtgcagta cgcggattat 6900 gcggcctggc agcgcgacgt actcggcacg gaggacgacg agtcgagcga gctgtcggcc 6960 cagctcgcct actggcgcac ccaactagcc tcactaccgg ccgagttggc gctcccgacg 7020 gaccgggccc ggcccgccgt cgcctcgtac gaaggcggca aggtcgagtt caccgtcccc 7080 gccggggtgt atgacggcct ggtggctctc gcccgtgccg agggtgtcac ggtcttcatg 7140 gtcgtgcagg cggcgctggc cgcgctcctc tcccggctcg gcgccggcga cgacatcccc 7200 atcggcaccc cgatcgccgg ccgcaccgac caggccaccg aagatctcat cggcttcttc 7260 gtgaacaccc tcgtcctgcg caccgacgtg tccggcgacc cgacgttcgc cgaactcctc 7320 gcgcgcgtcc gggccaccga cctcgacgcc tacgcccacc aggacatccc cttcgaacga 7380 ctggtcgaag cggtcaaccc cgagcgctcc ctcgcccgcc accccctctt ccaggtcatg 7440 ctgaccttcg acaacacgat tgaccgtgag gtcacggagg gcttcgcggg cctcggggtg 7500 gaaggcctgc cgctgggtgc gggagcggtc aaattcgatc tgctcttcgg tctctccgag 7560 gtgggcggcg agctgcgcgg agccgtggag taccgctgcg atctcttcga ccacccgacg 7620 gtggcgcagc tcgcggagcg cctggtgcgg gtactggagc gcgtggcttc cgacgcttcg 7680 gtacgcacgg gtgaactgcc ggtcgtcggc gaggcggagc gcgcccgtgt cctgacggag 7740 tggaatgaca cgggcgtccc cggtgtgccg gaaacattcc tggagttgtt cgaggcgcag 7800 gtcgcggccc ggggtgacgc gccggcggtc gtgtacgagg gtgaggttct gtcgtaccgg 7860 gaactcgacg cgcgggcgaa ccgcctggcc gggctgctgg tggggcgcgg tgcgggcccg 7920 gagcatttcg tgggggtggc gctgccgcgt gggctggatc tgatcgtggc cctgctggcc 7980 gtgctcaagt ccggtgccgc gtacgttccc ctggacccgg agtacccggc cgagcggctg 8040 gtccacatgg tcaccgacgc cgcccccgtc gtggtcgtga cctccaccga cgtacgtact 8100 ctgcggaccg ttccccgggt cgagctggac gacgaggcga cccgcgccac cctggtcgca 8160 gcccccgcca cagggcccga cgtgaagatg tccgcctccc accccgcgta cgtgatctac 8220 acctccgggt ccacgggccg ccccaagggc gtcgtcatca gccacggcag cctggccaac 8280 ttcctcgcct gggcgcggga agacctgggt gccgagcggc tccggcacgt cgtgttgtcc 8340 acgtccctca gcttcgacgt ctccgtggtc gaactcttcg ccccgctgtc ctgcggcggc 8400 accgtcgaga tcgtccggaa tctgctggcc ctcgtcgacc gccccggccg atggtccgcg 8460 agcctggtca gcggcgtgcc gtcggccttc gcgcagctgc tggaagccgg cctcgaccgg 8520 gccgacgtgg gcatgatcgc cctggccggc gaggcgctgt ccgctcgcga cgtgcgccgc 8580 gtccgcgctg tgctgcccgg ggcccgcgtg gccaacttct acggcccgac cgaagccacc 8640 gtctacgcca cggcctggta cggcgacacc cccatggacg ccgcggcccc catgggccgg 8700 cccctgcgca acacgtgtgt gtatgtgctg gacgacgggc tgcgcgtggt gccggtcggt 8760 gtggtgggtg agctgtatgt ggcgggtgtg ggtctggcgc ggggctatct cgggcgtgtg 8820 ggtctgacgg cggagcggtt tgtggcgtgt ccgttcggtg cgcggggtga gcgtatgtat 8880 cgcacggggg atttggtgcg gtggcgggtg gacggcacgc ttgagtttgt tggtcgtgcg 8940 gatgatcagg tgaaggtccg tggtttccgt gtggagttgg gtgaggtgga gggtgctgtt 9000 gcggcgcatc ctgatgtggt gcgtgcggtt gttgtggtgc gtgaggaccg gccgggtgat 9060 caccggttgg ttgcgtatgt caccggtgtt gacacgggtg gactgtcctc tgcggtgatg 9120 cgtgccgttg ctgagcgtct gcctgcgtac atggtgccgt cggcggtggt ggttctggat 9180 gagatcccgt tgacgccgaa cgggaaggtg gaccgggcgg gtcttccggt gccggtggtg 9240 tcggtggcgg ggttctgtgc gccgtcgtcg ccgcgggagg aggtgttgtg tggtctgttc 9300 gcggaggtgc tgggtgttga gcgggtgggg gtggacgatg ggttcttcga tctgggcggg 9360 gacagcattc tgtcgattca gttggtggcg cgggctcgtc gggcgggtct ggagttgtcg 9420 gttcgggatg ttttcgaggg ccgtacggta cgtgctctgg cggctgtggt gcgtggttcg 9480 gacgctgggg cggttggtgt ggtggggggt gctgagattg tgctgccggg tgtgggtgag 9540 gtggagcggt ggccggtggt ggagtggctg gcggagcgtg gtggggggtc gctgggtggt 9600 gtggttcggg gtttcaatca gtctgttgtg cttgctgtgc ctgctgggtt ggtgtgggag 9660 gagttgcggg tgttgttggg tgcggtgcgg gatcggcatg aggcgtggcg gttgcgggtg 9720 ctggattccg gggcgttgtg tgttgatggt gttgttccgg atgacgggtc gtggattgtc 9780 cggtgtgacc tgagcggtat gggtgtggat ggtcaggtgg atgctgtgcg ggctgcggct 9840 gtggaggcgc gtgcgtggct ggatccgtcg gtgggccggg tggtgcgggc ggtgtggctg 9900 gagcgtggtg gtgatcgttc gggggtgttg gtgctggtgg cgcatcacct ggtggtggac 9960 ggtgtgtcgt ggcgggtggt gctgggggat ctggcggagg ggtgggcgca ggtgcgttcg 10020 ggtggccgtg tggagttggg tgtggtgggg acgtcgttgc ggggttgggc ggcggcgttg 10080 gcggagcagg gccggcgggg cgagcgtgcg ggggaggtgg agttgtggtc gcggatggtt 10140 cggggtgcgg atgttctggt ggggtcgcgt gctgtggatg gtgcggtgga tgttttcggc 10200 ggggtggtgt cggttgattc gcgggcgtcg gtgtcggtgt cgcgtgcgtt gctgacggag 10260 gtgccgtcgg ttctgggtgt tggtgtgcag gaggtgttgc tggcggcatt cgggctggcg 10320 gtcgcgcggt ggcgcggccg gggtgggccg gttgtggtgg atgttgaggg gcacgggcgt 10380 aatgaggacg ctgtgcgggg tgctgatctg tctcgtactg tcggttggtt caccagtgtg 10440 tatccggtcc gtgtgccggt ggagtccgct tcgtgggacg aggtgcgtgc gggtggtccg 10500 gtggtgggcc gtgtggtgcg tgaggtgaag gagactctgc gttcgctgcc tgaccagggt 10560 ctgggttatg gcatcctgcg ctatctcgat cccgagcacg gtcctgctct ggcccggcat 10620 gccaccccgc agttcggttt caactacctc ggccgcttca ccaccggaac cgacgacacc 10680 ggtgacgagg ggatgacgga ctgggtcccc gtgtcagggc cgttcgcggt gggagccggc 10740 caggaccccg aactgcccgt ggcgcacgcg gtcgagttca acgcgatcac gctggacacc 10800 ccggagggcc cgcgcctggg cgtgacatgg tcgtggccga cgacgctgct gccggagtcc 10860 cggatacggg agctggcccg ctactgggac gaggccctgg aagggctggt cgaacacgcc 10920 cggcaccccg aagccggcgg cctcacgccg tccgacgtga cgctggtgga agtgaaccag 10980 gtggagctcg accgtctgca ggcgggggtc gccggtggtg cggaggagat tctgccggtg 11040 tcggccctgc aagaggggct gctgttccac agcgcgttgg cctctggtgg ggtggacgtg 11100 tatgtggggc agctggtgtt cgatctggtc ggtccggtgg acgtcgaccg gctgcgcgcg 11160 gctgtcgaag gtctggtggc gcggcacggg gtgctgcggt cgggataccg ccaactgcgg 11220 tcgggcgaat gggttgcggt cgtcgcacga caggtggatc tgccgtggca gtccatcgac 11280 gtgcgcgacg gcggtatcga cgggttggtg gaagaggagc gctggcgccg gttcgacatg 11340 ggccggggtc cactggcgcg cttcgtgctc atccggacgc acgacgatcg tttccggttc 11400 gtcatcacgt accaccacgt cgtcctcgac ggctggtccg tcccggtgct gctgcgtgag 11460 ctgctggccc tgtacggcag ctcgggggac gtatcggttc tgccgggggt ccgctcgtac 11520 ggcgatttcc tgcgatgggt cgccgcgcga gacgccgcag ccgccgaagg cgcatggcgg 11580 cgggcgctga cgggcctgga ggagccgtcg ctcgtcgcgc caggcgtttc ccgagacggg 11640 gtcgtcccgg cggcgttcca cggtgcggtc gacggcgacc tctcgcagaa gatcgtggcg 11700 tgggcgcgcg ggcgtggtgt gacggttgcg tcggtggtac aggcggcgtg ggccttggtg 11760 ctggggcggt tgatgggtcg ggacgatgtg gtgttcgggg tgacggtgtc gggtcggcct 11820 gccgaggtgg tgggtgtgga ggacatggtc ggtctgttcg tgaacaccat tccgttgcgg 11880 gcgcggctgg atccggcgga gtcgctgggt ggtttcgtgg agcggctgca gcgggagcag 11940 acggagctgc tggagcatca gcatgtccgg ctggcggaag tccagcggtg ggccgggcac 12000 aaggaactct tcgatgtcgg aatggtcttc gacaactacc cggtttcttc tgaatccccg 12060 gaagcggaat tccagatctc acgaacaggc ggatacaacg gaacccacta cgcactgaac 12120 ctcgttgctt ccatgcacgg cctggagctg gaactggaaa tcggttatcg gccggatgtg 12180 tttgatgcgg gtcgggtgcg tgaggtgtgg ggatggttgg tgcgggtgtt ggagggtgtg 12240 gtttctggtg ggggtggggt gtctgtgtcg ggggttgatg tgttgggtgt gggtgagcgg 12300 gagaggttgt tggggtgggg tgtgggtggg ccggtgcctg tggtgccggg tggtgggttg 12360 gtggggttgt tcgaggagcg ggtgcgggcc gacgcggacg cggtggccgt gcgtggcgcg 12420 ggggtggtgt ggagttatgg ggagttgaat gcgcgggtga atgtggtggc gcggtggttg 12480 gtgggtcggg gtgtgggggc ggagtgtggt gtgggtgtgg tgatgggccg cggggtggat 12540 gtggtggtga tgttgctggc ggtggcgaag gcgggtgggt tttatgtgcc ggtggatccg 12600 gagtggccgg tggagcgggt ggggtgggtg ctggcggatg ccggggtggg gctggttgtg 12660 gtgggggagg ggttgtcgca tgtggtgggg gattttcctg ggggtgaggt tttcgagttt 12720 tcgcgggttg ttcgtgagtc gtgtcttgtg gagttggtgg ctgcggatgg ggttgaggtt 12780 cggaatgtga cggatggtga gcgggcgtcg cgtctgttgc cggggcatcc gttgtatgtg 12840 gtttatacgt cgggttcgac ggggcggccg aagggtgttg tggtgacgca tgcttcggtg 12900 ggtgggtatt tggcgcgtgg tcgggatgtg tatgcgggtg ccgttggtgg tgtggggttt 12960 gtgcattcgt cgcttgcgtt cgatctgacg gtgacggttc tgttcacgcc tttggtgtct 13020 ggcggttgtg ttgtgttggg tgagttggac gagtcggcgc agggggtggg tgcctcgttc 13080 gtgaaggtga ctccgtcgca tctgggtttg ctgggtgagc tggagggtgt ggtggcgggg 13140 aacggcatgc tgctggtggg gggtgaggcg ttgtcgggtg gtgcgctgcg tgagtggcgt 13200 gagcgtaatc cgggtgtggt ggtggtgaat gcttatggtc cgacggagct gacggtgaac 13260 tgtgccgagt tccttatcgc gcctggtgag gaggttccgg atgggcctgt gccgatcggg 13320 cgtcctttcg cgggtcagcg gatgtttgtt ctggatgcgg cgctgcgggt ggtgccggtc 13380 ggtgtggtgg gtgagttgta tgtggcgggt gtgggtctgg cgcggggcta tctcgggcgt 13440 gtgggtctga cggcggagcg gtttgtggcg tgtccgttcg gtgtgccggg tgagcgtatg 13500 tatcgcacgg gggatttggt gcggtggcgg gtggacggcg cgcttgagtt cgttggccgt 13560 gcggatgatc aggtgaaggt ccgtggtttc cgtgtggagt tgggtgaggt ggagggtgct 13620 gttgcggcgc atcctgatgt ggtgcgtgcg gttgttgtgg tgcgtgagga ccggccgggt 13680 gatcaccggt tggtggctta cgtgactgcg ggtggtgttg gtggggatgg tcttcgttcc 13740 gcgatctctg gtttggtggc tgagcgtctg cctgcgtaca tggtgccgtc ggcggtggtg 13800 gttctggatg agatcccgtt gacgccgaac gggaaggtgg accgggcggc gcttccggtg 13860 ccggaggtgg aggcgggcac gggctaccgg gcgcctgttt cgccgcggga ggaggtgttg 13920 tgtggtctgt tcgcggaggt gctgggtgtt gagcgggtgg gggtggacga tgacttcttc 13980 gagttgggtg gtcattctct tctggcgact cgtctgattt cgcgtgtccg tgcggtgttg 14040 ggtgttgagg cgggtgtgcg ggcgttgttc gaggcgccga cggtgagccg tctggagcgg 14100 ttgctccggg agcggtcggg tttgggggtg cgggtgcctc tggtggcacg ggagcggacg 14160 ggtcgggagc cgttgtcgtt cgctcagcag cgtctgtggt tccttgagga actcgaaggg 14220 cccggtgctg cgtacaacat tccgatggcg ctgcgtctgg ccggtgttct ggacgtcgaa 14280 gcgctgcacc aggcgctcat tgatgtcatc gcccgccatg aaagcctccg caccctcatc 14340 gcgcaggatg cgggtactgc ctggcagcac atcctgcccg ttgacgaccc tcgcacccgt 14400 cccggtctcc ctcttgtgga catcggtgcc gacgcccttc aggagcggct cgacgaagcc 14460 gccggccggc ccttcgacct cgcggccgat ctcccggtcc gggccacagt cttccgcctc 14520 accgacaacg accacatcct cctgctggtc ctgcaccaca tcgccggcga cggctggtcg 14580 atgggcccgc tcgcccgcga tctctccacg gcgtacagcg cacgcgccgc aggagccgcc 14640 tcggcctggc ggcccctctc cgtgcagtac gcggattatg cggcctggca gcgcgacgta 14700 ctcggcacgg aggacgacga gtcgagcgag ctgtcggccc agctcgccta ctggcgcacc 14760 caactagcgt cactcccagc cgagttggcg ctcccgacgg accgggcccg gcccgccgtc 14820 gccacctacc ggggcggacg catcgagttc accatccccg ccgacgtcca ccgcagcctc 14880 gccgacctcg cccgtgccga gggtgtcacg gtcttcatgg tcgtgcaggc ggcgctggcc 14940 gcgctcctct cccggctcgg cgccggcgac gacatcccca tcggcacccc gatcgccggc 15000 cgcaccgacc aggccaccga agatctcatc ggcttcttcg tgaacaccct cgtcctgcgc 15060 accgacgtct ccggcgaccc gacgttcgcc gaactcctcg cgcgcgtccg ggccaccgac 15120 ctcgacgcct acgcccacca ggacatcccc ttcgaacgac tggtcgaagc ggtcaacccc 15180 gagcgctccc tcgcccgcca ccccctcttc caggtcatgc tcgccttcaa caacgccgag 15240 acgagcaccc cgctgcccat ggccgaaggc ctggctgcct cccggcagga catcgaaccg 15300 ggcgtggcga aattcgatct ggccctgtat tgcaacgaat cccgcggtga gacgggcgac 15360 caccagggca tcagaagtgt cttcgagtac cgccgcgacc tgtgggacga ggacaccgtg 15420 cggcagctcg ccgaccggtt cctgcatgtt ctcgctgctt ttgcggcagc cccggagcaa 15480 cgtgcgagca gcgtcgacgt gctccgggcg ggcgagcgcg accaactgct gcacgagtgg 15540 aacgacacgg ctgccgctct ccccccggca ctgctgcccc agctgttcga ggagcaggtg 15600 cggcgcaccc cgcacgatgt cgctctcgtc tcggggaaca tccggctcac gtacgcggag 15660 ctggacgcgc gcgcgaaccg cctggcccac ttgctgctcg cccggggcgc ggcccccgag 15720 acgttcgtcg cggtggccct gccccggacc gaagagctcc tggtggccct gctggccgta 15780 cagaaaacag gtgccggaca tctgccgctg gatcccggct tcccggccga gcggctcagc 15840 tacatgctgg atgacgcccg ccctgcggtg gtcctcacca cggaggacat cagcgcccgc 15900 atacccggcg gaagccatgt ggtactcgac tccgagcagg tgaccggcga gctccacgac 15960 cacccggcca cgtcccccgc cggccggggc aaccccgccg gcccggcgta cgtgatctac 16020 acctccggat ccaccggcca gcccaagggc gtcgtcgtac cgtcggccgc cctggtgaac 16080 ttcctggccg acatggtgcc caggctcggg ctccgcggtg gcgaccgcct gctgtccgtg 16140 accaccgtgg gcttcgacat cgcggccctc gagctcttcg tcccgctact gagcggcgcc 16200 accgtcgtcc tcgcggacgg ggagacggtc cgcgacccgg cgctggcccg ccagacgtgc 16260 gaggaccacg gcgtcaccat ggtccaggcg acaccgagct ggtggcacgg catgctcgcc 16320 gacgcgggcg acagcctgcg cggcgtgcac gccgtcgtgg gcggtgaggc cctgagcccc 16380 gggttgcgcg acgcgctgac acgaggcgcg cggtccgtca cgaacatgta cggcccgacg 16440 gagacgacca tctggtccac cagcgccggg caggccgccg gggacagcgc tcccccttcg 16500 atcggcacac ccatcctcaa cactcgcgtg tatgtgctcg acgctgcttt gtgtgtcgtg 16560 ccaccgggcg tcgcaggcga gctgtacatc gcgggcgacg gcctcgcgcg gggctatctc 16620 gggcgtgcgg gtctgacggc ggagcggttc gtggcctgcc ccttcggtgc gccgggtgag 16680 cgtatgtacc gtacggggga tctggtgcgg tggcgggtgg acggcgcgct tgagtttgtt 16740 ggtcgtgcgg atgatcaggt gaaggtccgt ggtttccgtg tggagttggg tgaggtggag 16800 ggtgctgttg cggcgcatcc tgatgtggtg cgtgcggttg ttgtggtgcg tgaggaccgg 16860 ccgggtgatc accggttggt tgcgtatgtc accggtgttg acacgggtgg actgtcctct 16920 gcggtgatgc gtgccgttgc tgagcgtctg cctgcgtaca tggtgccgtc ggcggtggtg 16980 gttctggatg agatcccgtt gacgccgaat gggaaggtgg accgggcggc gcttccggtg 17040 ccgggggtgg aggcgggcgc gggctaccgg gcgcctgttt cgccgcggga ggaggtgttg 17100 tgtggtctgt tcgcggaggt gctgggtgtt gagcgggtgg gggtggacga tgatttcttc 17160 gggttgggtg gtcattctct tctggcgact cgtctgattt cgcgtgtccg tgcggtgttg 17220 ggtgttgagg cgggtgtgcg ggcgttgttc gaggcgccga cggtgagccg tttggagcgg 17280 ttgctgcggg agcggtcggg tttgggggtg cgggtgcctc tggtggcacg ggagcggacg 17340 ggtcgggagc cgttgtcgtt cgctcagcag cgtctgtggt tccttgagga actggaaggg 17400 cccggtgctg cgtacaacat tccgatggcg ctgcgtctgg ccggtgttct ggacgtcgaa 17460 gcgctgcacc aggcgctcat tgatgtcatc gcccgccacg aaagcctccg caccctcatc 17520 gcccgcgaca gtgacggcac ggcccggcag caggtgctgc ccgtcggtga ccccgccgcg 17580 cgaccggctc ttccggtcgt acagaccgac gccgacaccc tcgtcgcgaa actgaacgag 17640 gccgtcggcc gccccttcga cctcacggcc gagatgcccc tgcgtgccac cgtcttccgg 17700 gtggccgacg aggaccacgc gctgctgctg gtgttccacc acatcgccgg cgacggctgg 17760 tcgacgggcc tgctcgcccg cgacctgtcc accgcgtacg cagccaggct cgaaggccgg 17820 gacccccaac tgccacccct ccccgtgcag tacgcggact acgcggcctg gcagcgcgac 17880 gtactcggca cggaggacga cgagtcgagc gagctgtcgg cccagctcgc ctactggcgc 17940 acccaacttg ccgacctccc agccgagttg gccctcccgg cggaccgggt ccggcccgcc 18000 agggcctcgt acgaaggagg ccgggtcggc ttcaccgtcc ccgccggggt cctccgcgac 18060 ctcacgcgcc tggcccgtgt cgagggtgtc acggtcttca tggtcgtgca ggcggcgctg 18120 gccgcgctcc tctcccggct cggcgccggc gacgacatcc ccatcggcac cccgatcgcc 18180 ggccgcaccg accaggccac cgaagatctc atcggcttct tcgtgaacac cctcgtcctg 18240 cgcaccgacg tctccggcga cccgacgttc gccgaactcc tcgcgcgcgt ccgggccacc 18300 gacctcgacg cctacgccca ccaggacatc cccttcgaac gactggtcga agcggtcaac 18360 cccgagcgct ccctcgcccg ccaccccctc ttccaggtca tgctcgcctt cgacaacacg 18420 gccgacggag gccccgtaga agacttcccc ggactgtccg cagccgggct gccgttgggt 18480 gcgggcgcgg cgaagttcga tctgctcttc ggtctctccg aggtgggcgg cgagctgcgc 18540 ggagccgtgg agtaccgctg cgatctcttc gaccacccga cggccgcacg gatcgcggag 18600 cgcctggtgc gggtgctgga gcgggtcgcc gccgacgcgt cggtacgcct gggcgagctg 18660 cccgtggtga gcgacgccga gcgggcctgc gtcctgacgg agtggaacga caccgccgtc 18720 cccggcgtga cgggaacgct gtcggcgctg ttcgaggcac gggccgcagc ccggggcgac 18780 gcgccggcgg tcgtgtacga gggtgaagaa ctgtcgtacc gtgaactgaa cacacgcgcc 18840 aaccgcctcg cccatgtcct ggccgagcac ggcgcaggcc ccgagcggtt cgtcggtgtg 18900 gccctgcccc gcagtccgga cctcgtagtg gcactgctgg cggtcgtgaa atcgggcgcg 18960 gcctacgtac cgctcgaccc cgagtacccg gccgaccggc tcgcgtacat ggccggcgac 19020 gctgcccccg tggcggtcct gacccgcggg gacgtcgaac tccccgggtc cgtcccgcgg 19080 atcgggctgg acgacacaga gatccgcgcg acactcgcca ccgcccccgg cacgaacccc 19140 ggcacgccgg tgaccgaggc ccaccccgcg tacatgatct acacctccgg atccaccggc 19200 cgccccaagg gcgtcgtcgt ctcccacggc gccatcgtca accggctcgc ctggatgcag 19260 gcggagtacc gtctcgacgc gaccgatcgt gtcttgcaga agactccggc cggtttcgac 19320 gtgtcggtct gggagttctt ctggccgctg ctcgagggcg cggtcctcgt gttcgcccgg 19380 cccggcggcc accgggacgc ggcgtatctg gccggactca tcgagcgcga gcgcatcacc 19440 acggcacatt tcgtgccctc catgctgcgc gtcttcctcg aagagcccgg cgcggcactc 19500 tgcaccggac tgaggcgggt gatatgcagc ggcgaggccc tcggcacgga cctggccgtg 19560 gacttccgcg cgaaactgcc cgtccccctg cacaatctgt acggcccgac cgaagcggct 19620 gtcgatgtca cccaccacgc gtatgagccc gccaccggca cggccacggt ccccattggc 19680 cgccccatct ggaacatccg cacctacgtc ctcgacgccg ccctgcgtcc tgtgccaccg 19740 ggcgtgcccg gcgagctgta tctggccggc gccggcctgg cccgcggcta ccacggccgc 19800 ccggcactga cggcggagcg gtttgtggcg tgtccgttcg gtgtgccggg tgagcgtatg 19860 tatcgcacgg gggatttggt gcggtggcgg gtggacggca cgcttgagtt tgttggtcgt 19920 gcggatgatc aggtgaaggt ccgtggtttc cgtgtggagt tgggtgaggt ggagggtgct 19980 gttgcggcgc atcctgatgt ggtgcgtgcg gttgttgtgg tgcgtgagga ccggccgggt 20040 gatcaccggt tggtggctta cgtgactgtg ggtggtgttg gtggggatgg ccttcgttcc 20100 gcgatctctg gtctggtggc tgagcgtctg cctgcgtaca tggtgccgtc ggcggtggtg 20160 gttctggatg agatcccgtt gacgccgaac gggaaggtgg accgggcggg tcttccggtg 20220 ccggtggtgt cggtggcggg gttctgtgcg ccgtcgtcgc cgcgggagga ggtgttgtgt 20280 ggtctgttcg cggaggtgct gggtgttgag cgggtggggg tggacgatgg gttcttcgat 20340 ctgggcgggg acagcattct gtcgattcag ttggtggcgc gggctcgtcg ggcgggtctg 20400 gagttgtcgg ttcgggatgt tttcgagggc cgtacggtac gtgctctggc ggctgtggtg 20460 cgtggttcgg acgctggggc ggttggtgtg gtggggggtg ctgagattgt gctgccgggt 20520 gtgggtgagg tggagcggtg gccggtggtg gagtggctgg cggagcgtgg tggggggtcg 20580 ctgggtggtg tggttcgggg tttcaatcag tctgttgtgc ttgctgtgcc tgctgggttg 20640 gtgtgggagg agttgcgggt gttgttgggt gcggtgcggg atcggcatga ggcgtggcgg 20700 ttgcgggtgc tggattccgg ggcgttgtgt gttgatggtg ttgttccgga tgacgggtcg 20760 tggattgtcc ggtgtgacct gagcggtatg ggtgtggatg gtcaggtgga tgctgtgcgg 20820 gctgcggctg tggaggcgcg tgcgtggctg gatccgtcgg tgggccgggt ggtgcgggcg 20880 gtgtggctgg agcgtggtgg tgatcgttcg ggggtgttgg tgctggtggc gcatcacctg 20940 gtggtggacg gtgtgtcgtg gcgggtggtg ctgggggatc tggcggaggg gtgggcgcag 21000 gtgcgttcgg gtggccgtgt ggagttgggt gtggtgggga cgtcgttgcg gggttgggcg 21060 gcggcgttgg cggagcaggg ccggcggggc gagcgtgcgg gggaggtgga gttgtggtcg 21120 cggatggttc ggggtgcgga tgttctggtg gggtcgcgtg ctgtggatgg tgcggtggat 21180 gttttcggcg gggtggtgtc ggttgattcg cgggcgtcgg tgtcggtgtc gcgtgcgttg 21240 ctgacggagg tgccgtcggt tctgggtgtt ggtgtgcagg aggtgttgct ggcggcattc 21300 gggctggcgg tcgcgcggtg gcgcggccgg ggtgggccgg ttgtggtgga tgttgagggg 21360 cacgggcgta atgaggacgc tgtgcggggc gctgatctgt ctcgtactgt cggttggttc 21420 accagtgtgt atccggtccg tgtgccggtg gagtccgctt cgtgggacga ggtgcgtgcg 21480 ggcggtccgg tggtgggccg tgtggtgcgt gaggtgaagg agactctgcg ttcgctgcct 21540 gaccagggtc tgggttatgg catcctgcgc tatctcgatc ccgagcacgg tcctgctctg 21600 gcccggcatg ccaccccgca gttcggtttc aactacctcg gccgcttcac caccggaacc 21660 gacgaaacca ccacggccga cgccctcgac cgggcccccg cgtggagcct tctcgcccgc 21720 agcgccgccg gccaggaccc cgaactgccc gtggcgcacg cggtcgagtt caacgcgatc 21780 acgctggaca ccccggaggg cccgcgcctg ggcgtgacat ggtcgtggcc gacgacgctg 21840 ctgccggagt cccggatacg ggagctggcc cgctactggg acgaagccct ggaagggctg 21900 gtcgaacacg cccggcaccc cgaagccggc ggcctcacgc cgtccgacgt gggcctcgcg 21960 gaactctcct ttgctgagat cgaactgctc gaagacgact ggaggacaca gggatga 22017 <210> 13 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Linker <400> 13 gtcttcacca cgggg 15 <210> 14 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Linker <400> 14 gtggtgaaga c 11 <210> 15 <211> 597 <212> PRT <213> Streptomyces roseosporus <400> 15 Val Ser Glu Ser Arg Cys Ala Gly Gln Gly Leu Val Gly Ala Leu Arg 1 5 10 15 Thr Trp Ala Arg Thr Arg Ala Arg Glu Thr Ala Val Val Leu Val Arg 20 25 30 Asp Thr Gly Thr Thr Asp Asp Thr Ala Ser Val Asp Tyr Gly Gln Leu 35 40 45 Asp Glu Trp Ala Arg Ser Ile Ala Val Thr Leu Arg Gln Gln Leu Ala 50 55 60 Pro Gly Gly Arg Ala Leu Leu Leu Leu Pro Ser Gly Pro Glu Phe Thr 65 70 75 80 Ala Ala Tyr Leu Gly Cys Leu Tyr Ala Gly Leu Ala Ala Val Pro Ala 85 90 95 Pro Leu Pro Gly Gly Arg His Phe Glu Arg Arg Arg Val Ala Ala Ile 100 105 110 Ala Ala Asp Ser Gly Ala Gly Val Val Leu Thr Val Ala Gly Glu Thr 115 120 125 Ala Ser Val His Asp Trp Leu Thr Glu Thr Thr Ala Pro Ala Thr Arg 130 135 140 Val Val Ala Val Asp Asp Arg Ala Ala Leu Gly Asp Pro Ala Gln Trp 145 150 155 160 Asp Asp Pro Gly Val Ala Pro Asp Asp Val Ala Leu Ile Gln Tyr Thr 165 170 175 Ser Gly Ser Thr Gly Asn Pro Lys Gly Val Val Val Thr His Ala Asn 180 185 190 Leu Leu Ala Asn Ala Arg Asn Leu Ala Glu Ala Cys Glu Leu Thr Ala 195 200 205 Ala Thr Pro Met Gly Gly Trp Leu Pro Met Tyr His Asp Met Gly Leu 210 215 220 Leu Gly Thr Leu Thr Pro Ala Leu Tyr Leu Gly Thr Thr Cys Val Leu 225 230 235 240 Met Ser Ser Thr Ala Phe Ile Lys Arg Pro His Leu Trp Leu Arg Thr 245 250 255 Ile Asp Arg Phe Gly Leu Val Trp Ser Ser Ala Pro Asp Phe Ala Tyr 260 265 270 Asp Met Cys Leu Lys Arg Val Thr Asp Glu Gln Ile Ala Gly Leu Asp 275 280 285 Leu Ser Arg Trp Arg Trp Ala Gly Asn Gly Ala Glu Pro Ile Arg Ala 290 295 300 Ala Thr Val Arg Ala Phe Gly Glu Arg Phe Ala Arg Tyr Gly Leu Arg 305 310 315 320 Pro Glu Ala Leu Thr Ala Gly Tyr Gly Leu Ala Glu Ala Thr Leu Phe 325 330 335 Val Ser Arg Ser Gln Gly Leu His Thr Ala Arg Val Ala Thr Ala Ala 340 345 350 Leu Glu Arg His Glu Phe Arg Leu Ala Val Pro Gly Glu Ala Ala Arg 355 360 365 Glu Ile Val Ser Cys Gly Pro Val Gly His Phe Arg Ala Arg Ile Val 370 375 380 Glu Pro Gly Gly His Arg Val Leu Pro Pro Gly Gln Val Gly Glu Leu 385 390 395 400 Val Leu Gln Gly Ala Ala Val Cys Ala Gly Tyr Trp Gln Ala Lys Glu 405 410 415 Glu Thr Glu Gln Thr Phe Gly Leu Thr Leu Asp Gly Glu Asp Gly His 420 425 430 Trp Leu Arg Thr Gly Asp Leu Ala Ala Leu His Glu Gly Asn Leu His 435 440 445 Ile Thr Gly Arg Cys Lys Glu Ala Leu Val Ile Arg Gly Arg Asn Leu 450 455 460 Tyr Pro Gln Asp Ile Glu His Glu Leu Arg Leu Gln His Pro Glu Leu 465 470 475 480 Glu Ser Val Gly Ala Ala Phe Thr Val Pro Ala Ala Pro Gly Thr Pro 485 490 495 Gly Leu Met Val Val His Glu Val Arg Thr Pro Val Pro Ala Asp Asp 500 505 510 His Pro Ala Leu Val Ser Ala Leu Arg Gly Thr Ile Asn Arg Glu Phe 515 520 525 Gly Leu Asp Ala Gln Gly Ile Ala Leu Val Ser Arg Gly Thr Val Leu 530 535 540 Arg Thr Thr Ser Gly Lys Val Arg Arg Gly Ala Met Arg Asp Leu Cys 545 550 555 560 Leu Arg Gly Glu Leu Asn Ile Val His Ala Asp Lys Gly Trp His Ala 565 570 575 Ile Ala Gly Thr Ala Gly Glu Asp Ile Ala Pro Thr Asp His Ala Pro 580 585 590 His Pro His Pro Ala 595 <210> 16 <211> 1794 <212> DNA <213> Streptomyces roseosporus <400> 16 gtgagtgaga gccgctgtgc cgggcagggc ctggtggggg cactgcggac ctgggcacgg 60 acacgtgccc gggagactgc cgtggttctc gtacgggaca ccggaaccac cgacgacacg 120 gcgtcggtgg actacggaca gctggacgag tgggccagaa gcatcgcggt gaccctccga 180 cagcaactcg cgccgggggg acgggcactt ctgctgctgc cgtccggccc ggagttcacg 240 gccgcgtacc tcggctgcct gtacgcgggt ctggccgccg taccggcgcc gctgcccggg 300 gggcgccact tcgaacgccg ccgtgtcgcg gccatcgccg ccgacagcgg agccggcgtg 360 gtgctgaccg tcgcgggtga gaccgcctcc gtccacgact ggctgaccga gaccacggcc 420 ccggctactc gcgtcgtggc cgtggacgac cgggcggcgc tcggcgaccc ggcgcagtgg 480 gacgacccgg gcgtcgcgcc cgacgacgtg gctctcatcc agtacacctc gggctcgacc 540 ggcaacccca agggcgtggt cgtgacccac gccaacctgc tggcgaacgc gcggaatctc 600 gccgaggcct gcgagctgac cgccgccact cccatgggcg gctggctgcc catgtaccac 660 gacatggggc tcctgggcac gctgacaccg gccctgtacc tcggcaccac gtgcgtgctg 720 atgagctcca cggcattcat caaacggccg cacctgtggc tacggaccat cgaccggttc 780 ggcctggtct ggtcgtcggc tcccgacttc gcgtacgaca tgtgtctgaa gcgcgtcacc 840 gacgagcaga tcgccgggct ggacctgtcc cgctggcggt gggccggcaa cggcgcggag 900 cccatccggg cagccaccgt acgggccttc ggcgaacggt tcgcccggta cggcctgcgc 960 cccgaggcgc tcaccgccgg ctacgggctg gccgaggcca ccctgttcgt gtcgaggtcg 1020 caggggctgc acacggcacg agtcgccacc gccgccctcg aacgccacga attccgcctc 1080 gccgtacccg gcgaggcagc ccgggagatc gtcagctgcg gtcccgtcgg ccacttccgc 1140 gcccgcatcg tcgaacccgg cgggcaccgt gttctgccgc ccggccaggt cggcgagctg 1200 gtcctccagg gagccgccgt ctgcgccggc tactggcagg ccaaggagga gaccgagcag 1260 accttcggcc tcaccctcga cggcgaggac ggtcactggc tgcgcaccgg cgatctcgcc 1320 gccctgcacg aagggaatct ccacatcacc ggccgctgca aagaggccct ggtgatacga 1380 ggacgcaatc tgtacccgca ggacatcgag cacgaactcc gcctgcaaca cccggaactt 1440 gagagcgtcg gcgccgcgtt caccgtcccg gcggcacctg gcacgccggg cttgatggtg 1500 gtccacgaag tccgcacccc ggtccccgcc gacgaccacc cggccctggt cagcgccctg 1560 cgggggacga tcaaccgcga attcggactc gacgcccagg gcatcgccct ggtgagccgc 1620 ggcaccgtac tgcgtaccac cagcggcaag gtccgccggg gcgccatgcg tgacctctgc 1680 ctccgcgggg agctgaacat cgtccacgcg gacaagggct ggcacgccat cgccggcacg 1740 gccggagagg acatcgcccc cactgaccac gctccacatc cgcaccccgc gtaa 1794 <210> 17 <211> 89 <212> PRT <213> Streptomyces roseosporus <400> 17 Met Asn Pro Pro Glu Ala Val Ser Thr Pro Ser Glu Val Thr Ala Trp 1 5 10 15 Ile Thr Gly Gln Ile Ala Glu Phe Val Asn Glu Thr Pro Asp Arg Ile 20 25 30 Ala Gly Asp Ala Pro Leu Thr Asp His Gly Leu Asp Ser Val Ser Gly 35 40 45 Val Ala Leu Cys Ala Gln Val Glu Asp Arg Tyr Gly Ile Glu Val Asp 50 55 60 Pro Glu Leu Leu Trp Ser Val Pro Thr Leu Asn Glu Phe Val Gln Ala 65 70 75 80 Leu Met Pro Gln Leu Ala Asp Arg Thr 85 <210> 18 <211> 270 <212> DNA <213> Streptomyces roseosporus <400> 18 atgaacccgc ccgaagcggt cagcacgccc agcgaggtca ccgcgtggat caccggacag 60 atcgccgagt tcgtgaacga gacacccgac cggatcgccg gtgacgcacc cctgaccgac 120 catggcctcg actccgtctc cggagttgcc ctctgcgcgc aggtcgagga ccgctacggg 180 atcgaggtcg acccggagct gctgtggagc gtccccacac tcaacgagtt cgtccaggca 240 ctgatgcccc agttggccga ccgcacctga 270 <210> 19 <211> 545 <212> PRT <213> Streptomyces roseosporus <400> 19 Met Ile Gly Val Ala Pro Pro Ala Tyr Asp Pro Ala Ala Pro Glu Ser 1 5 10 15 Ala Thr Thr Leu Pro Val Gly Thr Pro Thr Thr Val Arg Ser Tyr Val 20 25 30 Arg Ser Leu Leu Arg Arg His Arg Arg Ala Phe Thr Val Leu Ile Ala 35 40 45 Val Asn Ala Val Ala Val Val Ala Ser Ile Thr Gly Pro Tyr Leu Leu 50 55 60 Gly Gly Leu Val Glu Asp Leu Ser Ala Gly Val Thr Asp Leu His Leu 65 70 75 80 Glu Arg Thr Ala Ala Ile Phe Ala Val Ala Leu Val Val Gln Val Leu 85 90 95 Phe Thr Arg Ser Met Arg Leu Arg Gly Ala Met Leu Gly Glu Glu Met 100 105 110 Leu Ala Asp Leu Arg Glu Asp Phe Leu Val Arg Ser Val Gly Leu Pro 115 120 125 Pro Gly Val Leu Glu Arg Ala Gly Thr Gly Asp Leu Leu Ser Arg Ile 130 135 140 Thr Thr Asp Ile Asp Arg Leu Ala Asn Ala Met Arg Glu Ala Val Pro 145 150 155 160 Gln Leu Ala Ile Gly Val Val Trp Ala Gly Leu Leu Leu Gly Ala Leu 165 170 175 Thr Val Thr Ala Pro Pro Leu Ala Leu Ala Val Leu Ile Ala Leu Pro 180 185 190 Val Leu Ile Val Gly Cys Arg Trp Tyr Phe Arg Arg Ala Pro Ser Ala 195 200 205 Tyr Arg Ser Glu Ala Ala Gly Tyr Ala Ala Val Ala Ala Met Leu Ala 210 215 220 Glu Thr Val Asp Ala Gly Arg Thr Val Glu Ala His Arg Leu Gly Gly 225 230 235 240 Arg Arg Val Ala Leu Ser Asp Arg Arg Ile Ser Gln Trp Thr Ala Trp 245 250 255 Glu Arg Tyr Thr Leu Phe Leu Arg Ser Val Leu Phe Pro Val Ile Asn 260 265 270 Ala Thr Tyr Val Thr Ile Leu Gly Ala Val Leu Leu Leu Gly Gly Trp 275 280 285 Phe Val Leu Glu Gly Trp Leu Thr Val Gly Gln Leu Thr Thr Gly Ala 290 295 300 Leu Leu Ala Gln Met Met Val Asp Pro Ile Gly Leu Ile Leu Arg Trp 305 310 315 320 Tyr Asp Glu Leu Gln Val Ala Gln Val Ser Leu Ala Arg Leu Val Gly 325 330 335 Val Arg Asp Ile Glu Pro Asp Ala Gly Asp Ala Glu Val Gly Pro Glu 340 345 350 Gly Arg Asp Val Arg Ala Asp Glu Val Arg Phe Gly Tyr Arg Glu Gly 355 360 365 Val Asp Val Leu His Lys Val Ser Leu Asp Val Ala Pro Gly Thr Arg 370 375 380 Leu Ala Leu Val Gly Pro Ser Gly Ala Gly Lys Ser Thr Leu Gly Arg 385 390 395 400 Leu Leu Ala Gly Ile Tyr Ala Pro Arg Thr Gly Glu Val Thr Leu Gly 405 410 415 Gly Ala Glu Leu Ser Arg Met Thr Ala Glu Arg Val Arg Glu His Val 420 425 430 Ala Leu Val Asn Gln Glu His His Val Phe Val Gly Ser Leu Arg Asp 435 440 445 Asn Leu Arg Leu Ala Arg Glu Gly Ala Lys Asp Ala Glu Leu Trp Ala 450 455 460 Ser Leu Ala Ala Val Asp Ala Asp Gly Trp Ala Lys Ala Leu Glu Lys 465 470 475 480 Gly Leu Asp Thr Glu Val Gly Ser Gly Gly Phe Thr Leu Thr Pro Ala 485 490 495 Gln Ala Gln Gln Ile Ala Leu Ala Arg Leu Val Leu Ala Asp Pro His 500 505 510 Thr Leu Val Leu Asp Glu Ala Thr Ser Leu Leu Asp Pro Arg Ala Ala 515 520 525 Arg His Leu Glu Arg Ser Leu Ala Arg Val Leu Glu Gly Arg Thr Val 530 535 540 Val 545 <210> 20 <211> 1637 <212> DNA <213> Streptomyces roseosporus <400> 20 gccaccaccg tacggccctc cagcacccgg gccagggaac gctccagatg acgggcggcc 60 cgcgggtcca gcagcgacgt cgcctcgtcc agcaccagcg tgtgcggatc ggccagcacc 120 agccgggcca gcgcgatctg ctgcgcctgg gccggggtca gcgtgaaccc gcccgaaccg 180 acctcggtgt ccagcccctt ctccagcgcc ttcgcccagc cgtccgcgtc gaccgcggcc 240 agcgacgccc acagctcggc gtccttcgcc ccttccctgg ccaggcgcag attgtcccgg 300 agcgaaccga cgaagacatg gtgctcctgg ttgaccaggg ccacatgctc acggacccgc 360 tccgccgtca tccgcgacaa ctccgccccg ccgagcgtca cctcaccggt gcgcggtgcg 420 tagatccccg ccagcagccg gcccagcgtc gacttgcccg cgccggacgg gccgaccagg 480 gcgagccggg tgcccggagc cacgtcgagc gacaccttgt gcaggacgtc gacaccttcc 540 cggtacccga agcggacctc gtccgcccgt acgtcccggc cttccgggcc gacctcggcg 600 tcgcccgcgt ccggctcgat gtcccggacg ccgaccagcc gggccagcga cacctgggcc 660 acctggagct cgtcgtacca gcgcaggatc agaccgatcg ggtcgaccat catctgggcc 720 agcaacgccc ccgtcgtcag ctgcccgacc gtcagccacc cctccagcac gaaccagccg 780 ccgagcagca ggaccgcgcc gaggatcgtc acgtacgtgg cgttgatgac ggggaagagc 840 accgagcgga ggaagagtgt gtaccgttcc cacgctgtcc attgagaaat ccgccggtcc 900 gacagcgcca cccggcggcc gccgaggcgg tgcgcctcca cggtccgccc cgcgtccacg 960 gtctccgcga gcatcgcggc gacggcggcg taaccggcgg cctccgagcg gtacgcggag 1020 ggggcccggc ggaagtacca gcggcagccc acgatcagca ccggcagcgc gatcagcacg 1080 gccagcgcca gcgggggagc ggtcaccgtc agcgcgccga gcagcagccc ggcccacacg 1140 acgccgatcg ccagctgcgg cacggcctcg cgcatcgcgt tcgccagccg gtcgatgtcc 1200 gtggtgatcc gggacagcag atcgcccgtc ccggcccgct ccagcacacc gggcggcagc 1260 ccgacggacc ggacgaggaa gtcctcgcgc agatccgcga gcatctcctc gcccagcatc 1320 gcgccgcgca gccgcatgga gcgggtgaac aggacctgga cgaccagcgc caccgcgaag 1380 atcgcggccg tacgctccag atgcaggtcg gtgaccccgg ccgagaggtc ctcgaccaga 1440 ccgcccagca gatacggtcc ggtgatcgag gcgaccaccg ccaccgcgtt gaccgcgatc 1500 aggacggtga acgccctgcg gtgccgacgc agcagactcc gtacgtaact ccgcacggtc 1560 gtcggtgtgc ccacgggcag tgtcgtcgcc gactccgggg ccgcggggtc gtacgccggg 1620 ggtgcgacgc cgatcat 1637 <210> 21 <211> 368 <212> PRT <213> Streptomyces roseosporus <400> 21 Met Ser Pro Pro Ala Pro Pro Glu Ala Leu Gln Arg Pro Ala Pro Thr 1 5 10 15 Ala Gln Glu Pro Val Arg Thr Gly Ser Arg Thr Gly Leu Val Ala Ile 20 25 30 Cys Val Ser Leu Phe Ala Ala Leu Val Val Ser Val Val Val Ala Ile 35 40 45 Gly Leu Gly Pro Ala Val Val Pro Pro Ala Glu Thr Ala Arg Phe Leu 50 55 60 Trp Ala Ala Leu Ser Gly Gly Pro Ile Ser Ala Asp Glu Val Thr Thr 65 70 75 80 Tyr Gln Ile Ile Trp Gln Ile Arg Thr Pro Arg Val Leu Leu Ala Ala 85 90 95 Leu Val Gly Ala Gly Leu Ser Ala Val Gly Val Ala Ile Gln Ala Leu 100 105 110 Val Arg Asn Ala Leu Ala Asp Pro Phe Val Leu Gly Val Ser Ser Gly 115 120 125 Ala Ser Val Gly Ala Val Gly Val Thr Val Met Gly Gly Leu Ala Val 130 135 140 Phe Gly Ile Tyr Ala Val Ser Val Gly Ala Phe Leu Gly Ala Leu Val 145 150 155 160 Ala Ser Val Leu Val Tyr Gly Ala Ser Ser Thr Lys Gly Ala Leu Ser 165 170 175 Pro Leu Arg Leu Val Leu Thr Gly Val Ala Met Ser Leu Gly Phe Gln 180 185 190 Ala Val Met Ser Val Ile Ile Tyr Phe Ala Pro Ser Ser Glu Ala Thr 195 200 205 Ser Met Val Leu Tyr Trp Thr Met Gly Ser Phe Gly Ala Ala Ser Trp 210 215 220 Gly Ser Leu Pro Val Val Thr Ala Ala Val Leu Leu Gly Val Leu Val 225 230 235 240 Leu His Arg His Gly Arg Pro Leu Asp Val Leu Ala Leu Gly Asp Glu 245 250 255 Thr Ala Ala Ser Leu Gly Ile Ser Pro Asp Arg His Arg Lys Ser Leu 260 265 270 Leu Val Leu Val Ser Leu Val Thr Gly Val Met Val Ala Val Ser Gly 275 280 285 Ser Ile Ala Phe Val Gly Leu Val Met Pro His Leu Val Arg Met Val 290 295 300 Val Gly Ala Thr His Ala Arg Val Leu Ala Val Ala Pro Leu Ala Gly 305 310 315 320 Ala Val Phe Met Val Trp Val Asp Leu Val Ser Arg Thr Leu Val Ala 325 330 335 Pro Arg Glu Leu Pro Leu Gly Val Ile Thr Ala Leu Val Gly Val Pro 340 345 350 Val Phe Ile Thr Leu Met Arg Arg Lys Ser Tyr Met Phe Gly Gly Arg 355 360 365 <210> 22 <211> 1869 <212> DNA <213> Streptomyces roseosporus <400> 22 tcatgccctc tcctcgattt cctcgatgct cttcatggcg gggacgtcgc cgctcttcat 60 gacggagacg tcgtcaccga cgccgttcac cgcgtccgcc gcggccgcct cgtcgtcggt 120 ctcgcgggtg acgaccgccc ggtagcgcgg ttcgttgcgc agcaggtcgt ggtgggttcc 180 cacggcgacg accgtgccct cgtggacgag gaccacccgg tcggcggcgt cgagcagcag 240 cggcgacgag gcgaacgcca ccgtcgtacg accctggcgc agcttcgcga tgccggcggc 300 gacccgtgcc tcggtgtgcg agtcgaccgc ggaggtcggc tcgtccagca ccagcgcctc 360 cgggtcggtg accagggacc gggccagcgc cagacgctgg cgctggccgc cggacaggga 420 ccggccgcgc tcggtgatcc gggtccgcat cgggtccccg tcgttgtcga cggacgcctg 480 ggccagagcg ctcagcacat cggcgcactg ggccgcctcc agcgccgtgt ccggggtgac 540 caggcccgag gacgggacgt ccagcagctc ctggagcgtg ccggacagca gcaccgggtc 600 cttgtcctgg accaggaccg ccgctcgtgc ggcgtccagc gggatctcgt ccagggcgac 660 cccgccgagc agcaccgacg gggtcgccgc ggcggccttg tcgtcctcct cgccggtctc 720 cgcgtgcccg ccgagccgtt cggccagccg gcccgcctcg tccgggtcac cgcagacgac 780 ggccgtgaac tgcccgcgcg gagccatcag cccggtcgcc gggtcgtaca gatcaccggt 840 gggcgtcaca ccctccaccg tggcctcctg cgcactgcgg tgcagcgaca gcacccgcac 900 cgcacgctgc gcggacggcc gggagaagga gtacgccatc gcgatctcct cgaagtgacg 960 cagggggaac agcatcaggg tggccgcgct gtagaccgtg acgagctggc cgacgtcgat 1020 gcggccgtcc cgggcgagcg tcgccccgta ccagaccagg cagatcagca ggatccccgg 1080 cagcagcacc tgcaccgccg agatcagcgc ccacatcctg gcgctgcgca cggccgcgcg 1140 gcggacctcc tgggaggcgc ggcggtagcg gccgaggaac agctcctcgc cgccgatacc 1200 gcgcagcacc cgcagaccgg ccacggtgtc cgaggccagc tcggtggcct tgcccgcctt 1260 ctcgcgctgc tcgtcggcgc ggcgggtggc gcgcggcagc aacggcagca cggccagggc 1320 cagcaccggc atggcgagcg ccaccaccag cccgagggac ggcagataga ccgccaggcc 1380 gacgcagatc accacgaggg cggtggccgc ggccgcgaac cgggagagcg cctcgacgaa 1440 ccagccgatc ttctccacgt caccggtcga cacggccacg acctcaccgg ccgcgacccg 1500 tcgggtcagc gcggagccca gctcggcggt cttgcgggcg agtagttgct ggacccgcgc 1560 ggcggcggtg atccagttgg tcacggcggt ccggtggagc atggtgtcgc cgacggcgat 1620 cagtacgccg agggccacga tgaggccgcc cgccagggcg agccgccctc cggagcggtc 1680 gatgacggcc tggacggcga gccccacggt gaccggcaga ccggcgatgc cgagctggtg 1740 cagcagcccc caggagaggg acttcagctg cccgccgagc tgattgcgcc cgagccagaa 1800 caggaagcga gggcccgaac gtacatcggg gtcgccggga tccgaatacg gaaggtcgcg 1860 aatctgcat 1869 <210> 23 <211> 494 <212> PRT <213> Streptomyces roseosporus <400> 23 Met Asn Asp Asp Ala Arg Pro Ala Pro Glu Pro Gln Asp Ile Pro Pro 1 5 10 15 His Ser Gly Ala Ala Asp Glu Val Asn Arg Gln Asp Pro Ser Arg Arg 20 25 30 Ser Val Leu Trp Thr Thr Ala Gly Val Ala Gly Ala Gly Leu Gly Leu 35 40 45 Gly Ala Leu Gly Ala Gly Thr Ala Ser Ala Ala Gly Arg Ser Ala Pro 50 55 60 Asp Ala Val Ala Ala Ala Glu Ala Val Ala Ala Ala Pro Pro Arg Gln 65 70 75 80 Gly Arg Thr Met Ala Gly Val Pro Phe Glu Arg Arg Ser Thr Val Arg 85 90 95 Val Gly Ile Ile Gly Leu Gly Asn Arg Gly Asp Ser Met Ile Asp Leu 100 105 110 Phe Leu Ala Leu Pro Gly Val Gln Val Lys Ala Val Cys Asp Thr Val 115 120 125 Arg Asp Lys Ala Glu Lys Ala Ala Lys Lys Val Thr Ala Ala Gly Gln 130 135 140 Pro Ala Pro Ala Ile Tyr Ala Lys Asp Glu His Asp Tyr Glu Asn Leu 145 150 155 160 Cys Lys Arg Gly Asp Ile Asp Phe Val Tyr Val Val Thr Pro Trp Glu 165 170 175 Leu His Phe Pro Met Ala Lys Thr Ala Met Leu Asn Gly Lys His Val 180 185 190 Gly Val Glu Cys Pro Ile Ala Met Arg Leu Glu Glu Leu Trp Gln Leu 195 200 205 Val Asp Leu Ser Glu Arg Thr Arg Arg His Cys Met Gln Leu Glu Asn 210 215 220 Cys Cys Tyr Gly Lys Asn Glu Met Arg Val Leu Arg Met Ala His Ala 225 230 235 240 Gly Leu Phe Gly Glu Leu Gln His Gly Ala Gly Ala Tyr Asn His Asp 245 250 255 Leu Arg Glu Leu Met Phe Asp Pro Asp Tyr Tyr Glu Gly Pro Trp Arg 260 265 270 Arg Leu Trp His Thr Arg Leu Arg Gly Asp Leu Tyr Pro Asn His Gly 275 280 285 Phe Gly Pro Val Ala Asn Tyr Met Asp Val Asn Arg Gly Asp Arg Val 290 295 300 Val Ser Ile Ser Ser Val Gly Thr Thr Pro Leu Gly Leu Ala Ala Tyr 305 310 315 320 Arg Glu Glu His Met Pro Ala Gly Asp Pro Ser Trp Lys Glu Ser Tyr 325 330 335 Ile Gly Ala Asp Arg Thr Ile Ser Leu Val Gln Thr Ala Lys Gly Arg 340 345 350 Val Ile Arg Leu Glu His Asp Val Ser Ser Pro His Pro Tyr Ser Arg 355 360 365 Ile Asn Ser Leu Gly Gly Thr Lys Gly Val Phe Glu Asp Tyr Pro Glu 370 375 380 Arg Ile Tyr Leu Glu Pro Thr Asn Thr Asn His Gln Trp Asp Asp Phe 385 390 395 400 Lys Lys Tyr Ala Glu Trp Asp His Trp Leu Trp Lys Glu His Ala Asn 405 410 415 Pro Pro Gly Gly His Gly Gly Met Asp Tyr Ile Met Val Phe Arg Leu 420 425 430 Met Gln Cys Met Arg Leu Gly Leu Val Pro Asp Phe Asp Val Tyr Asp 435 440 445 Ala Ala Val Trp Thr Ala Pro Val Pro Leu Ser His Leu Ser Ile Lys 450 455 460 Ala Lys Gly Val Pro Leu Pro Ile Pro Asp Phe Thr Arg Gly Glu Trp 465 470 475 480 Lys Lys Thr Arg Ser Gly Met Asp Ser Glu Lys Pro Ala Glu 485 490 <210> 24 <211> 1486 <212> DNA <213> Streptomyces roseosporus <400> 24 gtcactccgc gggcttctcc gagtccatgc cggaccgggt cttcttccac tcgccccggg 60 tgaagtccgg gatcggcagg ggcacgccct tggccttgat ggacagatgg ctcagcggca 120 cgggggccgt ccagaccgcc gcgtcgtaca cgtcgaagtc gggcaccaga ccgagccgca 180 tgcactgcat caggcggaac accatgatgt agtccatccc gccgtggccg cccggcggat 240 tggcgtgctc cttccacagc cagtggtccc actcggcgta cttcttgaag tcgtcccact 300 ggtggttggt gttcgtgggc tccagataga tccgctccgg gtagtcctcg aacacgccct 360 tggtcccgcc gaggctgttg atccgcgagt acgggtgggg cgacgacacg tcgtgctcca 420 ggcggatcac ccggcccttg gcggtctgca cgaggctgat cgtccggtcg gccccgatgt 480 acgactcctt ccagctcggg tcgcccgcag gcatgtgctc ctcgcggtag gcggcgaggc 540 ccaggggggt ggtgccgaca ctgctgatgc tgacgacccg gtcgccccgg ttgacgtcca 600 tgtagttggc gaccggaccg aacccgtggt tggggtagag gtcaccgcgc agccgggtgt 660 gccacagccg ccgccacgga ccctcgtagt agtcggggtc gaacatcagc tcacgcagat 720 cgtggttgta ggccccggcg ccgtgctgca gctcaccgaa gagacccgcg tgcgccatcc 780 gcagcacccg catctcgttc ttgccgtaac aacagttctc cagctgcatg cagtgccgcc 840 gggtgcgctc ggagagatcc acgagctgcc acagctcttc caggcgcatc gcgatcgggc 900 actccacccc gacgtgcttg ccgttcagca tcgccgtctt cgccatcggg aagtgcagct 960 cccacggcgt caccacgtag acgaagtcga tgtccccgcg cttgcagagg ttctcgtagt 1020 cgtgctcgtc cttggcatag atcgccgggg cgggctgacc ggcggccgtc accttcttgg 1080 cggccttctc cgccttgtcc cggaccgtgt cgcacaccgc cttgacctgg acgcccggga 1140 gggcgaggaa gaggtcgatc atgctgtcgc cgcggttgcc gaggccgatg atgccgaccc 1200 ggaccgtgga gcgccgctcg aagggcacgc ccgccatggt gcggccctgc cggggagggg 1260 cggcggccac ggcttccgcg gcggcgacgg cgtccggggc gctccgcccg gccgccgaag 1320 cggtgcctgc gcccagtgcg ccgaggccga gtccggcccc ggccacgccc gccgtggtcc 1380 acagcaccga acggcggctg ggatcctgcc ggttcacctc gtcggccgcg ccgctgtgcg 1440 ggggtatgtc ctgcggttcc ggtgcgggcc gggcgtcgtc gttcat 1486 <210> 25 <211> 984 <212> PRT <213> Streptomyces roseosporus <400> 25 Met Pro Leu Leu Glu Pro Asp Pro Glu Ala Leu Arg Pro Gly Thr Ala 1 5 10 15 Arg Glu Pro Ala Pro Asp Arg Val Thr Asp Gly Ser Ala Gly Gly Thr 20 25 30 Pro Glu Pro Leu Arg Ser Glu Leu Thr Ala Leu Leu Gly Ala Asp Lys 35 40 45 Val Leu Trp Lys Ile Ser Asp Leu Val Arg Tyr Ala Ser Asp Ala Ser 50 55 60 Pro Tyr Arg Phe Leu Pro Arg Val Val Leu Val Pro Glu Asp Leu Asp 65 70 75 80 Asp Val Ser Ala Ile Leu Ser Tyr Ala His Gly Lys Gly Arg Ser Val 85 90 95 Val Phe Arg Ala Ala Gly Thr Ser Leu Asn Gly Gln Ala Gln Gly Glu 100 105 110 Asp Ile Leu Val Asp Val Arg Arg His Trp Thr Gly Val Glu Val Leu 115 120 125 Asp Asp Gly Ala Arg Ala Arg Ile Leu Pro Gly Thr Thr Val Met Arg 130 135 140 Ala Asn Ala Ala Leu Ala Arg Tyr Gly Arg Leu Leu Gly Pro Asp Pro 145 150 155 160 Ala Ser Ala Ile Ala Cys Thr Leu Gly Gly Val Val Ala Asn Asn Ala 165 170 175 Ser Gly Met Thr Ala Gly Thr Thr Arg Asn Ser Tyr Arg Thr Leu Ala 180 185 190 Ser Leu Thr Phe Val Leu Pro Ser Gly Thr Val Val Asp Thr Ala His 195 200 205 Pro Ala Ala Asp Glu Glu Leu Ala His Ala Glu Pro Glu Leu Cys Ala 210 215 220 Gly Leu Leu Glu Leu Lys Ala Glu Ile Glu Ala Asp Ala Glu Leu Thr 225 230 235 240 Ala Arg Ile Arg Ala Lys Tyr Thr Ile Lys Asn Thr Asn Gly Tyr Arg 245 250 255 Leu Asp Ala Phe Leu Asp Gly Ala Thr Pro Val Gln Ile Leu Arg Gly 260 265 270 Leu Met Val Gly Ser Glu Gly Thr Phe Gly Phe Ile Ser Glu Val Val 275 280 285 Phe Asp Thr Leu Pro Leu Asp Arg Arg Val Ser Ser Gly Leu Leu Phe 290 295 300 Phe Pro Ser Leu Thr Ala Ala Ala Ala Ala Val Pro Arg Phe Asn Glu 305 310 315 320 Ala Gly Ala Ile Ala Val Glu Leu Met Asp Gly Asn Thr Leu Arg Ala 325 330 335 Ser Val Ser Val Pro Gly Val Pro Ala Asp Trp Ala Ala Leu Pro Arg 340 345 350 Glu Thr Thr Ala Leu Leu Val Glu Phe Arg Ala Ala Asp Glu Ala Gly 355 360 365 Arg Ala Ala Phe Glu Arg Ala Ala Asp Ala Val Val Ala Gly Leu Asp 370 375 380 Leu Val Arg Pro Ala Ala Ser Val Thr Asn Ala Phe Thr Arg Asp Ala 385 390 395 400 Gly Thr Ile Ala Gly Tyr Trp Lys Ala Arg Lys Ala Phe Val Thr Ala 405 410 415 Val Gly Gly Ser Arg Pro Ser Gly Thr Thr Leu Ile Thr Glu Asp Phe 420 425 430 Ala Val Pro Pro Ala Arg Leu Ala Asp Ala Cys Ala Ala Leu Leu Glu 435 440 445 Leu Gln Ser Arg His Gly Phe Asp Ala Ala Val Ala Gly His Ala Ala 450 455 460 His Gly Asn Leu His Phe Leu Leu Ala Phe Asp Ala Ala Lys Pro Ala 465 470 475 480 Asp Val Ala Arg Tyr Asp Ala Phe Met Gln Glu Phe Cys Ala Leu Val 485 490 495 Val Asp Arg Phe Asp Gly Ser Leu Lys Ala Glu His Ala Thr Gly Arg 500 505 510 Asn Ile Ala Pro Phe Leu Glu Arg Glu Trp Gly Pro Arg Ala Thr Glu 515 520 525 Leu Met Trp Arg Thr Lys Gln Val Ile Asp Pro Ala Gly Val Leu Ala 530 535 540 Pro Arg Ile Val Leu Asp Arg Asp Pro Arg Ala His Leu Arg Gly Leu 545 550 555 560 Lys Thr Ile Pro Lys Val Glu Ala Val Ala Asp Pro Cys Ile Glu Cys 565 570 575 Gly Phe Cys Glu Pro Thr Cys Pro Ser Glu Asp Leu Thr Thr Thr Pro 580 585 590 Arg Gln Arg Ile Val Leu Arg Arg Glu Met Met Arg Gln Thr Asp Gly 595 600 605 Ser Pro Val Glu Ser Gly Leu Leu Asp Ala Tyr Gly Tyr Asp Ala Val 610 615 620 Asp Thr Cys Ala Gly Asp Ser Thr Cys Lys Leu Ala Cys Pro Val Gly 625 630 635 640 Ile Asp Thr Gly Ala Met Met Lys Gly Phe Arg His Arg Arg His Thr 645 650 655 Pro Arg Glu Glu Arg Ile Ala Ala Leu Thr Ala Lys Asn Phe Arg Ala 660 665 670 Val Glu Ala Ser Ala Arg Leu Ala Val Ala Ala Ala Asp Thr Val Gly 675 680 685 Asn Arg Val Gly Asp Ala Pro Leu Gln Ala Val Thr Arg Leu Ala Arg 690 695 700 Lys Ala Val Arg Pro Asp Leu Val Pro Glu Trp Leu Pro Gln Ile Pro 705 710 715 720 Gly Ala Ala Ala Arg Arg Leu Pro Asp Thr Ala Arg Val Gly Ala Ser 725 730 735 Ala Val Tyr Tyr Pro Ala Cys Val Asn Arg Ile Phe Ala Gly Pro Asp 740 745 750 Asp Gly Asp Ala Gly Pro Ala Leu Ser Leu Ala Glu Ala Val Val Ala 755 760 765 Val Ser Gly Arg Ala Gly Lys Pro Val Trp Ile Pro Glu Asp Val Thr 770 775 780 Gly Thr Cys Cys Ala Thr Ile Trp His Ser Lys Gly Tyr Asp Ala Gly 785 790 795 800 Asn Arg Ile Met Ala Asn Arg Ile Val Glu Ala Ala Trp Gly Trp Thr 805 810 815 Ala Gly Gly Thr Leu Pro Leu Val Val Asp Ala Ser Ser Cys Thr Leu 820 825 830 Gly Ile Ala Glu Glu Val Val Pro Tyr Leu Thr Glu Asp Asn Arg Ala 835 840 845 Leu His Arg Glu Leu Thr Val Val Asp Ser Leu Val Trp Ala Ala Glu 850 855 860 Glu Leu Leu Pro His Leu Thr Val Phe Arg Thr Ala Gly Ser Ala Val 865 870 875 880 Leu His Pro Thr Cys Ser Met Glu His Leu Gly Asp Val Gly Gln Leu 885 890 895 Arg Ala Leu Ala Glu Ala Cys Ala Gln Glu Val Val Val Pro Asp Asp 900 905 910 Ala Gly Cys Cys Ala Phe Ala Gly Asp Arg Gly Met Leu His Lys Glu 915 920 925 Leu Thr Asp Ser Ala Thr Ala Lys Glu Ala Ala Glu Val Asp Arg Arg 930 935 940 Pro Tyr Asp Ala Tyr Leu Ser Ala Asn Arg Met Cys Glu Ile Gly Met 945 950 955 960 Glu Arg Ala Thr Gly His Pro Tyr Arg Ser Ala Leu Ile Glu Leu Glu 965 970 975 His Ala Thr Arg Pro Thr Leu Pro 980 <210> 26 <211> 2955 <212> DNA <213> Streptomyces roseosporus <400> 26 tcacgggaga gtcggccggg tggcgtgttc cagttcgatc agcgccgagc ggtacgggtg 60 cccggtggcg cgttccatgc cgatctcgca catccggttc gccgacagat aggcgtcgta 120 ggggcggcgg tcgacctcgg cggcctcctt ggccgtcgcc gagtcggtca actccttgtg 180 gagcatgccc cggtcgcccg cgaacgcaca gcaccccgcg tcgtccggga ccacgacctc 240 ctgcgcgcag gcctcggcca gcgcccgcaa ctgccccacg tcacccagat gttccatcga 300 acaggtcgga tgcaggaccg ccgagccggc cgtccggaac accgtcagat gcggcagcag 360 ctcctcggcc gcccacacca gcgagtccac gacggtcagt tcgcggtgga gcgcccggtt 420 gtcctcggtg aggtagggca ccacctcctc ggcgatgccg agcgtgcacg aggaggcgtc 480 cacgaccagc ggcagcgtcc cgcccgccgt ccagccccag gcggcctcca cgatccggtt 540 cgccatgatc ctgttgcccg cgtcgtatcc cttggaatgc cagatcgtcg cgcagcacgt 600 gcccgtgacg tcctcgggga tccacaccgg ctttccggcc cgcccggaca cggcgaccac 660 cgcctcggcc agggagagag cgggccccgc gtcgccgtcg tcgggcccgg cgaagatgcg 720 gttgacacag gccgggtagt agacggcgct cgcccccacg cgtgcggtgt ccggcagccg 780 ccgggccgca gcaccgggga tctgcggcag ccactccggt acgagatcgg ggcgcacggc 840 cttgcgggcg aggcgcgtca cggcctgcag cggtgcgtcc cccacccggt tcccgacggt 900 gtcggccgcc gccacggcca gccgcgccga agcctccacc gcgcggaagt tcttcgcggt 960 gagggccgcg atccgctcct cgcgcggggt gtgcctgcgg tgccggaagc ccttcatcat 1020 cgccccggtg tcgatgccga ccgggcaggc gagtttgcag gtggaatccc cggcgcaggt 1080 gtccacggcg tcatagccgt acgcgtccag aaggccggac tccaccggtg agccgtcggt 1140 ctgccgcatc atctcccggc gcagcacgat ccgctggcgc ggagtggtgg tcagatcctc 1200 actggggcag gtcggctcgc agaagccgca ctcgatgcac gggtcggcga ccgcctccac 1260 cttcggaatg gtcttcaggc cccgcagatg ggcccgcggg tcccggtcca gcacgatgcg 1320 tggagcgagc accccggcgg ggtcgatgac ctgcttggtc cgccacatca gctcggtggc 1380 gcgcggcccc cactcgcgct ccaggaacgg cgcgatattg cgtccggtgg cgtgctccgc 1440 cttgagcgat ccgtcgaacc ggtccaccac cagcgcgcag aactcctgca tgaacgcgtc 1500 gtaccgggcc acgtcggccg gcttcgccgc gtcgaacgcg agcaggaagt gcagattgcc 1560 gtgtgccgcg tgccccgcca cggcggcgtc gaagccgtgg cgcgactgga gctccagcag 1620 cgccgcgcag gcgtccgcca gccgggcggg cggcaccgcg aagtcctccg tgatcagggt 1680 ggtgcccgag ggccgggagc cgccgacggc ggtcacgaac gccttgcggg ccttccagta 1740 cccggcgatc gtcccggcgt cccgggtgaa cgcgttggtc acggacgccg ccggacgcac 1800 gaggtccaga ccggccacga ccgcgtccgc cgcccgctcg aacgccgccc ggcccgcctc 1860 gtcggccgcc cggaactcca ccagcagcgc ggtcgtctcc cggggcagcg ccgcccagtc 1920 cgccggaacg cccggcacgc tgacggaggc gcgcagggtg ttgccgtcca tcagctccac 1980 ggcgatcgcc cccgcctcgt tgaaccgggg cacggccgcc gcggcggcgg tgagggaggg 2040 gaagaacagc aggccgctgg agacccgccg gtcgagcggg agggtgtcga agacgacctc 2100 ggagatgaag ccgaacgtgc cctcggagcc gaccatcagc ccgcgcagga tctgcaccgg 2160 cgtcgccccg tcgaggaagg cgtccaggcg atagccattg gtgttcttga tcgtgtactt 2220 ggcgcggatc cgggcggtca gctccgcgtc cgcctcgatc tccgccttca gctccagcag 2280 ccccgcgcac agctccggtt cggcgtgggc cagctcctcg tcggcggcgg ggtgcgcggt 2340 gtcgacgacg gtgccgctcg gcagcacgaa ggtgagcgag gcgagcgtgc ggtaggagtt 2400 gcgggtggtg cccgccgtca tgcccgaggc gttgttggcg acgaccccgc cgagggtgca 2460 ggcgatggcg ctggccggat cggggcccag cagcctgccg taccgggcga gggcggcgtt 2520 ggcccgcatg acggtggtgc ccggcaggat ccgggcccgc gccccgtcgt ccagcacctc 2580 cacgccggtc cagtgacggc gtacgtcgac gaggatgtcc tcgccctggg cctggccgtt 2640 gaggctggtg cccgcggccc ggaagaccac ggatcggccc ttgccatggg cgtacgacag 2700 gatcgcggac acgtcgtcga ggtcctcggg gaccagcacg acccggggga ggaagcggta 2760 ggggctggcg tcggaggcgt accgcacgag gtcggagatc ttccagagca ccttgtccgc 2820 gccgagcagc gcggtcagct cgctccgcag cggctccggg gtgccgcccg cgctgccgtc 2880 ggtgacccgg tcgggggcgg gttcccgcgc cgttccgggg cgcagcgctt ccgggtcggg 2940 ctccagcagc ggcat 2955 <210> 27 <211> 166 <212> PRT <213> Streptomyces roseosporus <400> 27 Met Asp Ala Pro Asp Ser Pro Asp Ser Pro Asp Ser Pro Glu Ser Arg 1 5 10 15 Asp Ser Arg Asp Ser Arg Asp Ser Arg Asp Gly Leu Leu Ala Glu Gln 20 25 30 Leu Leu Arg Leu Thr Arg Arg Leu His Arg Ile Gln Arg Arg Gln Leu 35 40 45 Glu Pro Ile Asp Ile Thr Pro Ala Gln Phe Arg Leu Leu Arg Thr Val 50 55 60 Ala Ser Tyr Asp Ala Ala Pro Arg Met Ala Asp Leu Ala Arg Arg Leu 65 70 75 80 Asp Val Val Pro Arg Ala Val Thr Thr Leu Val Asp Ala Leu Glu Ala 85 90 95 Ser Gly Arg Val Arg Arg Ala Pro Asp Pro Asp Ser Arg Arg Val Val 100 105 110 Arg Ile Glu Ile Thr Asp Glu Gly Arg Ala Thr Leu Arg Ser Leu Arg 115 120 125 Ser Ala Arg Arg Ala Ala Ala Glu Glu Ile Leu Ala Pro Leu Thr Ala 130 135 140 Asp Gln Arg Glu Val Phe Gly Glu Leu Leu Ser Ala Leu Val Asp Gly 145 150 155 160 Met Pro Glu Arg His Cys 165 <210> 28 <211> 501 <212> DNA <213> Streptomyces roseosporus <400> 28 tcagcagtgg cgctccggca ttccgtcgac cagagcggac agcagctcgc cgaacacctc 60 gcgctgatcg gcggtcaatg gagccaggat ctcctctgcg gcggcccggc gcgcgctgcg 120 cagggaccgc agcgtggcgc gcccctcgtc ggtgatctcg atacggacca cccggcggct 180 gtcgggatcc ggggcgcggc gcacccggcc gctcgcctcc agggcgtcga ccagcgtggt 240 cacggcgcgc gggacgacgt cgagccgtcg ggccagatcc gccatccggg gggccgcgtc 300 gtaactcgcg accgtccgca acaggcggaa ctgggccgga gtgatgtcga tcggctccag 360 ctggcggcgc tggatgcggt gcagccgccg ggtgagccgc agcagctgtt cggcgagcaa 420 gccgtcacgg gagtcccggg aatcgcgaga gtcccgggac tcgggggaat caggggagtc 480 gggggaatcc ggggcgtcca t 501 <210> 29 <211> 607 <212> PRT <213> Streptomyces roseosporus <400> 29 Met Lys Pro Asp Glu Pro Thr Trp Thr Pro Pro Pro Asp Ala Arg Pro 1 5 10 15 Ala Ala Asp Arg Arg Pro Ala Glu Val Arg Arg Ile Leu Arg Leu Phe 20 25 30 Arg Pro Tyr Arg Gly Arg Leu Ala Val Val Gly Leu Leu Val Gly Ala 35 40 45 Ser Ser Leu Val Gly Val Ala Ser Pro Phe Leu Leu Arg Glu Ile Leu 50 55 60 Asp Thr Ala Ile Pro Gln Gly Arg Thr Gly Leu Leu Thr Leu Leu Ala 65 70 75 80 Leu Gly Met Ile Leu Thr Ala Val Met Thr Ser Val Phe Gly Val Leu 85 90 95 Gln Thr Leu Ile Ser Thr Thr Val Gly Gln Arg Val Met His Asp Leu 100 105 110 Arg Thr Ala Val Tyr Thr Gln Leu Gln Arg Met Pro Leu Ala Phe Phe 115 120 125 Thr Arg Thr Arg Thr Gly Glu Val Gln Ser Arg Ile Ala Asn Asp Ile 130 135 140 Gly Gly Met Gln Ala Thr Val Thr Ser Thr Ala Thr Ser Leu Val Ser 145 150 155 160 Asn Leu Thr Ala Val Ile Ala Thr Val Val Ala Met Leu Ala Leu Asp 165 170 175 Trp Arg Leu Thr Val Val Ser Leu Leu Leu Leu Pro Val Phe Val Ala 180 185 190 Ile Ser Arg Arg Val Gly Arg Glu Arg Lys Lys Ile Thr Thr Gln Arg 195 200 205 Gln Lys Gln Met Ala Ala Met Ala Ala Thr Val Thr Glu Ser Leu Ser 210 215 220 Val Ser Gly Ile Leu Leu Gly Arg Thr Met Gly Arg Ser Asp Ser Leu 225 230 235 240 Thr Gln Gly Phe Ala Glu Glu Ser Glu Arg Leu Val Asp Leu Glu Val 245 250 255 Arg Ser Asn Met Ala Gly Arg Trp Arg Met Ser Val Ile Gly Ile Val 260 265 270 Met Ala Ala Met Pro Ala Val Ile Tyr Trp Ala Ala Gly Leu Thr Phe 275 280 285 Ala Ser Gly Ala Ala Ala Val Ser Ile Gly Thr Leu Val Ala Phe Val 290 295 300 Thr Leu Gln Gln Gly Leu Phe Arg Pro Ala Val Ser Leu Leu Ser Thr 305 310 315 320 Gly Val Gln Met Gln Thr Ser Leu Ala Leu Phe Gln Arg Ile Phe Glu 325 330 335 Tyr Leu Asp Leu Thr Val Asp Ile Thr Glu Pro Glu His Pro Val Arg 340 345 350 Leu Glu Arg Ile Arg Gly Glu Ile Ala Phe Glu Asp Val Asp Phe Ser 355 360 365 Tyr Asp Glu Lys Asn Gly Pro Thr Leu Thr Gly Ile Asp Val Thr Val 370 375 380 Pro Ala Gly Asp Ser Leu Ala Val Val Gly Ser Thr Gly Ser Gly Lys 385 390 395 400 Ser Thr Leu Ser Tyr Leu Val Pro Arg Leu Tyr Asp Val Thr Gly Gly 405 410 415 Arg Val Thr Leu Asp Gly Ile Asp Val Arg Asp Leu Asp Phe Asp Thr 420 425 430 Leu Ala Arg Ala Val Gly Val Val Ser Gln Glu Thr Tyr Leu Phe His 435 440 445 Ala Ser Val Ala Asp Asn Leu Arg Phe Ala Lys Pro Glu Ala Thr Asp 450 455 460 Glu Glu Ile Glu Ala Ala Ala Arg Ala Ala Gln Ile His Asp His Ile 465 470 475 480 Ala Ser Leu Pro Asp Gly Tyr Asp Thr Met Val Gly Glu Arg Gly Tyr 485 490 495 Arg Phe Ser Gly Gly Glu Lys Gln Arg Leu Ala Ile Ala Arg Thr Ile 500 505 510 Leu Arg Asp Pro Pro Val Leu Ile Leu Asp Glu Ala Thr Ser Ala Leu 515 520 525 Asp Thr Arg Thr Glu Gln Ala Val Gln Glu Ala Ile Asp Ala Leu Ser 530 535 540 Ala Gly Arg Thr Thr Leu Thr Ile Ala His Arg Leu Ser Thr Val Arg 545 550 555 560 Asp Ala Asp Gln Ile Val Val Leu Glu Asp Gly Arg Val Ala Glu Arg 565 570 575 Gly Thr His Glu Glu Leu Leu Asp Arg Asp Gly Arg Tyr Ala Ala Leu 580 585 590 Ile Arg Arg Asp Ser His Pro Val Pro Val Pro Val Pro Ala Pro 595 600 605 <210> 30 <211> 1824 <212> DNA <213> Streptomyces roseosporus <400> 30 atgaaacccg acgaacccac gtggacgccc ccgcccgatg cccgccccgc cgccgaccgg 60 cggcccgccg aggtgcgccg catcctccgc ctcttccgcc cctatcgcgg ccgcctggcc 120 gtcgtcggcc tgctggtcgg cgcatcctcc ctggtcgggg tcgcctcccc gttcctgctg 180 cgcgagatcc tcgacaccgc catcccgcag ggacgcacgg gcctgctgac cctgctggcg 240 ctcggcatga tcctcaccgc cgtgatgacc agcgtcttcg gcgtgctcca gaccctcatc 300 tcgaccaccg tcggccagcg cgtcatgcac gacctgcgca ccgccgtcta cacccagctc 360 cagcggatgc cgctcgcctt cttcacccgg acccgcacgg gcgaggtcca gtcccgcatc 420 gccaacgaca tcggcggcat gcaggcgacg gtcacctcca ccgcgacctc gctggtctcc 480 aacctcacgg ccgtcatcgc gaccgtcgtc gccatgctcg ccctcgactg gcggctcacc 540 gtcgtctcgc tgctcctgct gccggtcttc gtcgcgatca gccgccgcgt cggccgggaa 600 cgcaagaaga tcaccaccca gcgccagaaa cagatggccg cgatggccgc caccgtcacc 660 gagtccctct cggtcagcgg catcctcctc ggccgcacga tgggccgctc cgactccctc 720 acccagggct tcgccgagga gtccgagcgc ctggtcgacc tcgaagtgcg ctccaacatg 780 gccggccgct ggcggatgtc cgtgatcggc attgtgatgg ccgccatgcc cgccgtcatc 840 tactgggcgg ccggactcac cttcgcgtcc ggagccgccg ccgtctccat cggcacactc 900 gtcgccttcg tcacgctcca gcaggggctg ttccgcccgg cggtcagcct gctctccacc 960 ggtgtgcaga tgcagacctc cctcgccctc ttccagcgca tcttcgaata cctcgacctc 1020 acggtggaca tcaccgaacc ggaacacccg gtccggctgg agaggatccg cggcgagatc 1080 gccttcgagg acgtcgactt cagctacgac gagaagaacg gcccgacgct gaccggcatc 1140 gacgtgaccg tccccgcggg cgacagcctc gcggtcgtcg gctccaccgg ctccggcaag 1200 tccaccctca gctacctggt gccccggctg tacgacgtca ccggcggccg ggtcacgctc 1260 gacggcatcg acgtccgcga cctggacttc gacaccctcg cccgggccgt cggcgtcgtc 1320 tcccaggaga cgtacctctt ccacgcctcg gtcgccgaca acctccgctt cgccaagccg 1380 gaggccaccg acgaggagat cgaggccgcg gcccgcgccg cgcagatcca cgaccacatc 1440 gcctccctgc ccgacggcta cgacacgatg gtcggcgagc gcggctaccg cttctcgggc 1500 ggcgagaagc agcgcctcgc catcgcccgc accatcctgc gcgaccctcc ggtgctgatc 1560 ctcgacgagg cgaccagcgc gctcgacacc cgtacggaac aggccgtgca ggaggcgatc 1620 gacgccctgt ccgccggacg gaccacgctc accatcgcgc accggctctc caccgtccgc 1680 gacgcggacc agatcgtcgt cctggaggac ggccgggtcg ccgagcgcgg tacgcacgag 1740 gaactgctcg accgcgacgg ccgctacgcc gccctgatcc gccgcgactc ccacccggtc 1800 ccggtcccgg tcccggctcc ctga 1824 <210> 31 <211> 262 <212> PRT <213> Streptomyces roseosporus <400> 31 His Arg His Leu Ala Glu Arg Pro Arg Arg Cys Ala Val Leu Ala Leu 1 5 10 15 Leu Arg Pro Ala Ala Gly Pro Ala Gly Arg Ala Gly Arg Arg Pro Gly 20 25 30 Pro Ala Ala Arg Ser Asp Pro Leu His Arg Gln Gly Gly Arg Arg Pro 35 40 45 His Arg Asp Ile Gly Glu Ala Ala Gly Arg Ala Ala Arg Pro Ala Ala 50 55 60 Asp Thr Gln Thr Ala Ala Ala Glu Pro Ala Gln Arg Pro Gly Val His 65 70 75 80 Arg Gln Leu His Arg Ala Ala Arg Arg Met Gln His Arg Gly Glu Asp 85 90 95 Pro Gly Gly Gly Ala Arg His Asp Gly His Ala Gly Ser Arg Gly Asp 100 105 110 Gly Gln Ala Arg Pro Arg Pro Val Leu Pro Ala Ala Pro Leu Arg Pro 115 120 125 Arg Gly Pro Gly Arg Ala Ala Leu Ser His Gly Gly Ser Arg Pro Val 130 135 140 Gly Arg Gly Val Pro Gly Pro Ser Ala His Pro Gly Pro Pro Asp Ala 145 150 155 160 Arg His Pro Arg Gly Gly Gly Asp Gly Gly Thr Arg Val Arg Arg Ala 165 170 175 Ala Ala Leu His Arg Thr Gly Ser Gly Glu Arg Leu Ser Arg Pro Ala 180 185 190 Ala Tyr Thr Gln His Thr Ala His Arg Ala His Gly Ala His Ser Thr 195 200 205 His Gly Gly Ala Ala Ala Pro Val Gly Arg Gly Ala Thr Ala Pro Gly 210 215 220 Gly Ala Met Val Arg Arg Ala Asn Pro Arg Ser Gly Arg Arg Arg Gln 225 230 235 240 Ala Gly Trp Ser Gly Ser Ser Ser Gly Leu Ser Pro Cys Thr Trp Cys 245 250 255 Ile Cys Gly Thr Ala Gln 260 <210> 32 <211> 612 <212> DNA <213> Streptomyces roseosporus <400> 32 atgagagctc tcctcggggt ggaactcccc ggctaccgca ccgtcgacac cgacacctgg 60 ctgaacgacc acggcgatgt gctgtccttg cacttcttcg acctgccgcc ggacctgccg 120 gccgcgctgg acgacggccc ggccctgcgg cacggtctga cccacttcac cgccagggcg 180 ggcggcggcc tcatcgagac atcggtgaag cggctgggcg agctgcccgc cctgcggcag 240 atactcaaac tgccgctgcc gaaccagccc agcggccagg cgttcatcgg cagcttcacc 300 gtgccgcgcg ccggatgcag caccgtggtg aagatccagg cggcggagcg cggcatgacg 360 ggcatgcggg aagccgtggt gatggccaag ctcggccccg accagtactt ccggccgcac 420 ccctacgccc ccgaggtcca gggcgggctg ccctttcaca cggcggatca cgtccagtgg 480 gacgcggagt tcccggacca tccgctcacc cgggtccgcc ggacgctcga caccctcgcg 540 gcggcggtga cggtggcacc cgagttcgcc gcgctgccgc ccttcaccgg accggctcag 600 gcgaacggct ga 612 <210> 33 <211> 286 <212> PRT <213> Streptomyces roseosporus <400> 33 Met Val Asn Glu Ser Pro Asp Ala Arg Pro Arg Arg Arg Leu Arg Pro 1 5 10 15 Thr Arg Arg Gly Lys Ile Val Leu Val Val Gly Ala Leu Leu Val Val 20 25 30 Thr Ala Ala Val Leu Ile Pro Leu Ser Leu Thr Gly Ser Asp Glu Pro 35 40 45 Pro Lys Lys Gln Glu Thr Pro Gln Ser Thr Leu Met Ile Pro Glu Gly 50 55 60 Arg Arg Val Ser Gln Val Tyr Glu Ala Val Asp Lys Ala Leu Asp Leu 65 70 75 80 Lys Pro Gly Ser Thr Leu Lys Ala Ala Ser Thr Val Asp Leu Lys Leu 85 90 95 Pro Ala Gln Ala Glu Gly Asn Pro Glu Gly Tyr Leu Phe Pro Ala Thr 100 105 110 Tyr Pro Ile Asp Asp Thr Thr Glu Pro Ala Gly Leu Leu Arg Tyr Met 115 120 125 Ala Asp Thr Ala Arg Lys His Phe Ala Ala Asp His Val Thr Ala Gly 130 135 140 Ala Gln Arg Asn Asn Val Ser Val Tyr Asp Thr Val Thr Ile Ala Ser 145 150 155 160 Ile Val Gln Ala Glu Ala Asp Thr Pro Ala Asp Met Gly Lys Val Ala 165 170 175 Arg Val Val Tyr Asn Arg Leu Leu Lys Asp Met Pro Leu Gln Met Asp 180 185 190 Ser Thr Ile Asn Tyr Ala Leu Lys Arg Ser Thr Leu Asp Thr Ser Thr 195 200 205 Ala Asp Thr Gln Leu Asp Ser Pro Tyr Asn Ser Tyr Arg Ile Lys Gly 210 215 220 Leu Pro Pro Thr Pro Ile Gly Asn Pro Gly Glu Asp Ala Leu Arg Ala 225 230 235 240 Ala Val Arg Pro Thr Pro Gly Pro Trp Leu Tyr Phe Val Thr Val Gly 245 250 255 Pro Gly Asp Thr Arg Phe Thr Asp Ser Tyr Asp Glu Gln Gln Lys Asn 260 265 270 Val Glu Glu Phe Asn Arg Gly Arg Gly Ser Ala Thr Thr Gly 275 280 285 <210> 34 <211> 861 <212> DNA <213> Streptomyces roseosporus <400> 34 atggtgaacg agtccccgga cgcccgaccc cgtcgcagac tccgcccgac ccgccgcgga 60 aagatcgtcc tggtcgtcgg cgcactgctc gtcgtgacgg ccgccgtcct gatccccctg 120 tccctgaccg gatcggacga gccgccgaag aagcaggaga ccccgcagag cacgctgatg 180 atccccgaag gccgccgagt gtcccaggtg tacgaagcgg tcgacaaggc gctcgacctg 240 aagcccggca gcacgctgaa ggccgcgtcg acggtggacc tgaagctgcc cgcccaggcc 300 gagggcaacc ccgaggggta cctcttcccg gccacgtatc cgatcgacga cacgaccgag 360 cccgcgggcc tgctgcgcta catggccgac accgcccgca aacacttcgc cgcggaccat 420 gtcacggccg gggcccagcg gaacaacgtc tccgtctacg acacggtcac catcgccagc 480 atcgtccagg ccgaggccga caccccggcc gacatgggca aggtggcccg cgtcgtctac 540 aaccggctgc tcaaggacat gccgctccag atggactcca ccatcaacta cgccctcaag 600 cgctccaccc tggacacgtc gaccgccgac acccagctgg acagcccgta caacagctac 660 cggatcaagg gcctgccgcc gacgcccatc ggcaatccgg gagaggacgc gctgcgcgcc 720 gccgtcaggc ccacgcccgg cccctggctc tacttcgtca cggtcggccc cggcgacacc 780 cggttcacgg acagctacga cgagcagcag aagaacgtcg aggagttcaa ccgcggccgt 840 ggctccgcca cgacgggctg a 861 <210> 35 <211> 386 <212> PRT <213> Streptomyces roseosporus <400> 35 Met Ile Pro Gly Ala Arg Arg Val Ser Arg Ser Val Asn Ile Ser Gly 1 5 10 15 Val Arg Glu Leu Asp Val Val Val Ile Gly Ala Gly Gln Ala Gly Leu 20 25 30 Ser Ala Ala Tyr His Leu Arg Arg Val Gly Leu Glu Pro Asp Asn Asp 35 40 45 Phe Val Val Leu Asp His Ala Pro Arg Pro Gly Gly Ala Trp Gln Phe 50 55 60 Arg Trp Pro Ser Leu Thr Tyr Gly Lys Val His Gly Met His Ala Leu 65 70 75 80 Pro Gly Met Glu Leu Thr Gly Ala Asp Pro Asp Arg Pro Ser Ser Glu 85 90 95 Val Ile Gly Ala Tyr Phe Ala Ala Tyr Glu Asp Arg Phe Gly Leu Arg 100 105 110 Val His Arg Pro Val Glu Val Ser Ala Val Arg Glu Gly Ser Gly Gly 115 120 125 Arg Leu Leu Val Glu Thr Ser Glu Gly Thr Tyr Ala Ala Arg Ala Leu 130 135 140 Ile Asn Ala Thr Gly Thr Trp Asp Arg Pro Phe Trp Pro Arg Tyr Pro 145 150 155 160 Gly Gln Glu Thr Phe Arg Gly Arg Gln Leu His Thr Ala Asn Tyr Pro 165 170 175 Gly Pro Glu Glu Phe Ala Gly Gln Arg Val Leu Val Val Gly Gly Gly 180 185 190 Ala Ser Gly Thr Gln His Leu Met Glu Ile Ala Glu His Ala Ala Asp 195 200 205 Thr Phe Trp Val Thr Arg Ser Glu Pro Val Phe Arg Glu Gly Pro Phe 210 215 220 Thr Glu Glu Trp Gly Arg Ala Ala Val Ala Met Val Glu Glu Arg Val 225 230 235 240 Arg Asn Gly Leu Pro Pro Lys Ser Val Val Ser Val Thr Gly Leu Pro 245 250 255 Leu Asn Asp Ala Val Arg Arg Ala Arg Glu Arg Gly Val Leu Asp Arg 260 265 270 Leu Pro Met Phe Asp Arg Ile Thr Pro Thr Gly Val Ala Trp Asp Asp 275 280 285 Gly Arg Thr Val Glu Thr Asp Val Ile Leu Trp Ala Thr Gly Phe Arg 290 295 300 Pro Ala Val Asp His Leu Ala Pro Leu Lys Leu Arg Glu Pro Gly Gly 305 310 315 320 Gly Ile Arg Ala Glu Asp Thr Arg Ala Val Arg Asp Gly Arg Val His 325 330 335 Leu Val Gly Tyr Gly Pro Ser Ala Ser Thr Ile Gly Ala Asn Arg Ala 340 345 350 Gly Arg Ala Ala Val Arg Ser Val Met Arg Leu Leu Lys Glu Thr Gly 355 360 365 Ala Asp Gly Gly Ala Ser Ala Val Val Ser Val Pro Ala Pro Val Pro 370 375 380 Gly Val 385 <210> 36 <211> 1161 <212> DNA <213> Streptomyces roseosporus <400> 36 tcacaccccc ggcacgggcg cgggcacgga gacgaccgcc gaggcccctc cgtcggcgcc 60 cgtctccttc agcagccgca tgaccgaccg gaccgccgcg cggccggcgc ggttcgcgcc 120 gatggtgctg gcggaagggc cgtacccgac gagatggacg cgcccgtccc gtacggcacg 180 ggtgtcctcg gcccggatgc caccacccgg ctcgcgcagc ttcagcgggg ccagatggtc 240 cacggcgggc cggaacccgg tcgcccagag gatcacgtcg gtctcgacgg tacggccgtc 300 gtcccaggcc acaccggtcg gcgtgatccg gtcgaacatc ggcagccggt ccagcactcc 360 ccgctcccgg gcccgccgca cggcatcgtt cagcggcagc ccggtcacgc tgaccacgct 420 cttcggcggc agcccgttgc gtacccgctc ctccaccatc gccacggccg cccgccccca 480 ctcctcggtg aacggacctt cgcggaacac cggttcgctg cgggtcaccc agaaggtgtc 540 ggccgcgtgc tcggcgatct ccatcagatg ctgcgtaccg gaagcgccac ccccgaccac 600 gaggacgcgc tgcccggcga actcctcggg ccccggatag ttcgccgtgt gcaactgccg 660 cccccggaac gtctcctggc ccggatagcg cggccagaac ggccggtccc aggtgccggt 720 ggcgttgatc agagcccgcg cggcgtacgt cccctcggac gtctccacca gcagccgacc 780 gccgcttccc tcccgtacgg cgctcacctc cacgggccgg tggacccgca ggccgaagcg 840 gtcctcgtac gcggcgaagt acgcgccgat cacctccgac gagggccggt cggggtcggc 900 cccggtcagc tccatgcccg gaagcgcgtg catcccgtgg accttgccgt acgtcagcga 960 gggccagcgg aactgccacg caccgcccgg ccggggcgcg tggtccagca cgacgaagtc 1020 gttgtccggc tccagcccga cgcggcgcag atggtaggcg gcggacagtc ccgcctgacc 1080 cgcgccgatg acgaccacgt ccagctcgcg caccccagaa atgttcacgc ttctactaac 1140 tcgtcgggcg cccgggatca t 1161 <210> 37 <211> 182 <212> PRT <213> Streptomyces roseosporus <400> 37 Val Pro Gly Leu Ala Arg Pro Thr Arg Ser Thr Pro Pro Arg Gln Leu 1 5 10 15 Arg Arg Gly His Pro Pro Ser Leu Ser Arg Pro Pro Thr Glu Pro Leu 20 25 30 Thr Thr Pro Pro Pro Pro Glu Pro Pro Thr Gln Arg His Thr Ser Leu 35 40 45 Cys Asn Thr Asp Ser Leu Ala Val Ala Met Ser Glu Arg Pro Arg His 50 55 60 Arg Pro Gln Lys Arg Ser Ile Ala Cys Gly Ala Cys Arg Ala Gly Ser 65 70 75 80 Ser Pro Leu Ala His Thr Gly Val Gly Leu Val Arg Gly Gly Ala Gly 85 90 95 Thr Ala Leu Val Gly Ser His Ala Glu Val Ala Asp Arg Ile Glu Glu 100 105 110 Tyr His Ala Leu Gly Val Glu His Phe Val Leu Ser Gly Tyr Pro His 115 120 125 Leu Glu Glu Ala Tyr Trp Phe Gly Glu Gly Val Thr Pro Glu Leu Ser 130 135 140 Arg Arg Gly Leu Leu Ser Thr Val Pro Ala Ser Pro Leu Leu Gly Val 145 150 155 160 Ser Gly Ala Glu Ser Arg Thr Ala Thr Ala Pro Gly Gly Ala Pro Leu 165 170 175 Leu Leu Ala Gly Gly Arg 180 <210> 38 <211> 279 <212> DNA <213> Streptomyces roseosporus <400> 38 tcagcgaccc ccggcgagca gcaggggagc cccgcccggc gccgtggcgg tccggctctc 60 ggcgccactc acacccagca gcggcgacgc gggcacggtc gacagcagcc cgcggcggga 120 cagctcgggt gtgacgccct cgccgaacca gtacgcctcc tccagatgcg gatatccgga 180 gagcacgaag tgctccacgc ccagcgcgtg gtactcctcg atccggtccg cgacctccgc 240 atggctgccc accagcgcgg tcccggcccc gccgcgcac 279 <210> 39 <211> 391 <212> PRT <213> Streptomyces roseosporus <400> 39 Val Ala Val Val Ala Glu Asp Leu Arg Arg Arg Phe Ala Ala Thr Lys 1 5 10 15 Val Thr Phe Leu Ile Val Asp Leu Thr Gly Arg Ala Leu Ala Arg Leu 20 25 30 Ser Thr Thr Thr Ala Ala Gly Ser Glu Asn Glu Thr Glu Arg Ile Pro 35 40 45 Leu Phe Gly Gly Ser Val Tyr Glu Gln Val Ile Arg Thr Gln Arg Pro 50 55 60 His His Glu Pro Ala Gly Gln Glu Gln Arg Val Ile Val Pro Val Thr 65 70 75 80 Asn Arg Gly Asp Ala Ile Gly Leu Leu Glu Leu Leu Leu Pro Ala Gly 85 90 95 Arg Ser Asp Glu Glu Glu Val Val Leu Ala Val Gly Glu Ala Ala His 100 105 110 Ala Leu Ala Tyr Val Val Ile Ala Asn Gly Arg Phe Thr Asp Phe Tyr 115 120 125 Thr Trp Gly Lys Arg Ser Arg Pro Pro Thr Leu Ala Ala Glu Ile Gln 130 135 140 Tyr Gln Leu Leu Pro Gln Ala Leu Ser Cys Glu Ala Ala Gln Phe Thr 145 150 155 160 Leu Ser Gly Ser Leu Glu Pro Ser Glu Asp Leu Ser Gly Asp Thr Phe 165 170 175 Asp Tyr Ala Leu Asp Arg Asp Thr Leu His Leu Ser Val Thr Asp Pro 180 185 190 Met Gly His Asp Leu Gly Ala Ala Leu Ala Ala Thr Val Leu Val Gly 195 200 205 Ala Leu Arg Arg Ala Arg Arg Ala Gly Ala Pro Leu Ala Glu Gln Ala 210 215 220 Arg Gln Gly Asp Gln Ala Leu Thr Ser His Gly Gln Gly His Ala Thr 225 230 235 240 Gly Gln Leu Leu Arg Ile Asn Leu His Thr Gly Lys Ala Glu Leu Val 245 250 255 Asn Ala Gly His Pro Trp Pro Met Arg Met Arg Ala Gly Met Val Glu 260 265 270 Thr Ile Pro Cys Gln Val Asp Gln Pro Phe Gly Leu Ala Val Val Ser 275 280 285 Pro Arg Pro Tyr Arg Val Gln Thr Leu Asp Leu His Pro Gly Asp Arg 290 295 300 Leu Leu Met Leu Thr Asp Gly Met Leu Glu Arg His Gly Glu Lys Ile 305 310 315 320 Asp Val Ala Ala Leu Leu Arg Gln Thr Arg Ser Leu His Pro Arg Glu 325 330 335 Thr Thr Leu Met Leu Thr Ser Ala Val Arg Asp Ala Ala Gly Gly Arg 340 345 350 Leu Glu Asp Asp Ala Thr Val Val Cys Leu Asp Trp His Gly Pro Gln 355 360 365 Glu Val His Arg His Val Ser Ser Gly Ala Asp Thr His Gln Ala Ser 370 375 380 Ala Ala Arg Pro Pro Asn Arg 385 390 <210> 40 <211> 1176 <212> DNA <213> Streptomyces roseosporus <400> 40 tcaacggttc ggtgggcggg cggctgaggc ttggtgggtg tccgcgccgg agctgacgtg 60 gcggtgtact tcttgtgggc cgtgccagtc caggcacacc acggtggcgt cgtcttcgag 120 gcggccgcct gcggcgtcgc gtacggcgga ggtcagcatc agggtggtct cgcgtgggtg 180 caggctgcgg gtctgccgta gcagggcagc tacgtcgatc ttctctccgt ggcgttcgag 240 catgccgtcc gtcagcatga ggagccggtc tcccgggtgc aggtccaggg tttggacgcg 300 gtaggggcgg ggcgagacga cggccagccc gaaaggctgg tcgacctggc aggggatggt 360 ttccaccatg cctgcacgca tgcgcatggg ccagggatgg ccggcgttga cgagctcggc 420 ctttccggtg tggaggttga tgcgcagcag ttgtccggtg gcgtggccct gtccgtggct 480 ggtcagggcc tggtcgccct ggcgggcctg ttcggcgagg ggggctccgg cgcggcgggc 540 tctgcgcagg gcgcccacca ggacggtggc cgccagggct gcgccgaggt catggcccat 600 ggggtcggtc accgacaggt gcagggtgtc gcggtccagt gcgtagtcga acgtgtcgcc 660 gctgaggtcc tcggagggct ccaggctccc gctcagggtg aactgcgcgg cctcgcagga 720 cagggcctgt ggaagcagct gatactggat ctccgctgcc agggtcgggg gtctggagcg 780 tttgccccag gtgtagaagt cggtgaagcg cccgttggcg atcacgacgt aggccagcgc 840 gtgagcggct tccccgacag cgagcacaac ctcttcctcg tcgctcctgc cggccggcag 900 gagcagttcg agcagaccga tcgcgtcccc ccggttggtc acgggaacta ttacccgctg 960 ttcttgtccg gcgggctcgt gatgcggccg ctgggtgcgg atcacctgct cgtagacgct 1020 ccccccgaac agagggatcc gctccgtttc gttttcactg cccgcggcag tcgtggtgga 1080 gagccgcgcg agcgctctac cggtcagatc cacaatcagg aatgtgacct tcgtagccgc 1140 gaaccgcctg cgcagatctt ctgcgaccac ggccac 1176 <210> 41 <211> 219 <212> PRT <213> Streptomyces roseosporus <400> 41 Met Arg Val Arg Leu Gln Val Gly Val Ala Leu Cys Gly Leu Gly Val 1 5 10 15 Leu Val Thr Gln Glu Arg Glu Arg Arg Arg Cys Gly Ala Arg Ser Ala 20 25 30 Gly Met Val Pro Asp Pro Leu Leu Leu Ala Val Ala Phe Glu Ala Gly 35 40 45 Ala Phe Ala Phe Gln Gly Ala Ser Arg Ser Arg Val Arg Ala Glu His 50 55 60 Gly Gln Gly Gly Ala Leu Arg Gln Thr Ala Arg Lys Phe Ala Asn Ser 65 70 75 80 Gly Pro Ala Thr Gly Arg Ala Val Gly Gln Asp Asp Pro Met Ser Gln 85 90 95 Asp Leu Val Thr Phe Leu His Ala Arg Leu Asp Glu Glu Ala Asn Leu 100 105 110 Ala Gly Arg Cys Asp Gly Asp Gly Cys Gly Glu Trp Ala Pro His Gly 115 120 125 His Thr Val Asp Phe Cys Gln Gly Glu Leu Ser Gly Phe His Ser Thr 130 135 140 Ile Ala Leu His Val Ala Leu His Asp Pro Ala Arg Val Leu Arg Glu 145 150 155 160 Ala Glu Ala Lys Arg Arg Val Leu Ala Arg His Gly Leu Ser Pro Ala 165 170 175 Thr Gly Asp Pro Glu Leu Pro Trp Asp Asn Arg Asp Asp Cys Arg Tyr 180 185 190 Asp Gly Ala Thr Trp Pro Cys Asp Asp Leu Leu Gly Leu Ala Ser Pro 195 200 205 Tyr Ala Asp His Pro Asp Tyr Pro Gln Arg Pro 210 215 <210> 42 <211> 660 <212> DNA <213> Streptomyces roseosporus <400> 42 tcaggggcgt tgggggtagt cagggtgatc tgcgtagggt gacgcgagac cgagcaggtc 60 atcgcatggc caggtcgcgc cgtcgtaccg acagtcatcg cggttgtccc acggcagttc 120 ggggtcaccc gtggcagggc tgagcccatg tcgggcgagc acgcgccgct tggcctcggc 180 ttcccgcagg acgcgagccg ggtcgtgcag cgcgacgtgc agggcgatcg tggaatggaa 240 gccggagagt tctccctggc agaagtcgac cgtgtgtccg tgaggggccc actccccgca 300 gccgtcaccg tcgcaccggc cggccaggtt ggcctcctcg tccagccgag cgtggaggaa 360 cgtcacaagg tcttggctca tggggtcatc ctggccgacg gctcggccgg tggccggccc 420 actgtttgcg aacttgcggg cggtctgtcg cagggcaccg ccctgtccgt gttcggcacg 480 gacgcgggag cgggaggccc cttggaacgc gaatgctcca gcttcgaagg caacggcgag 540 cagcaagggg tccggcacca tccccgcact ccgtgcgcca cacctgcgcc tctcgcgctc 600 ttgtgtcacg agaactccca gaccgcaaag cgccacaccc acctgcagtc ggacgcgcat 660 <210> 43 <211> 270 <212> PRT <213> Streptomyces roseosporus <400> 43 Met Ser Val Arg Asp Leu Val Gly Met Pro Cys His Pro Cys Glu Pro 1 5 10 15 Pro Arg Arg Ala Glu Gly Arg Arg Arg Gly Val Gly Arg Met Arg Trp 20 25 30 Trp Lys Gly Val Leu Met Thr Val Arg His Gln Gly Val Arg Trp Trp 35 40 45 Phe Ala Leu Leu Ala Leu Val Gly Cys Val Val Cys Val Leu Cys Val 50 55 60 Val Ala Leu Ser Gly Ala Gly His Tyr Phe Gly Leu Ser Leu Trp Ala 65 70 75 80 Gly Ile Ala Leu Val Val Val Gly Ala Leu Phe Pro Leu Gly Gly Leu 85 90 95 Gly Phe Leu Tyr Trp Val Asp Asp Gly Arg Ser Glu Asp Ser Phe Leu 100 105 110 Val Lys Phe Leu Cys Phe Val Ala His Ser Ala Val Leu Gly Leu Ala 115 120 125 Ala Val Ser Cys Thr Gly Ala Glu Ala Trp Ala Phe Glu Gln Arg Gly 130 135 140 Arg Trp Thr Glu Ala Thr Val Val Gly Tyr Ser Pro Pro Arg Val Val 145 150 155 160 Pro Gly Asp Pro Pro Thr Lys Val Arg Ala Ser Cys Ala Leu Glu Thr 165 170 175 Ala Glu Gly Glu Arg Val Arg Pro Arg Leu Pro Glu Gly Arg Gly Cys 180 185 190 Arg Asp Gly Val Arg His Gly Ser Arg Leu Asp Val Leu Tyr Asp Pro 195 200 205 Arg Gly Leu Leu Ala Pro Arg Ala Thr Glu Pro Met Asp His Gly Val 210 215 220 Thr Val Pro Val Leu Gly Gly Val Ala Thr Leu Ser Gly Phe Leu Gly 225 230 235 240 Cys Val Ala Leu Ala Trp Arg Trp Glu Thr Leu Arg Val Arg Ser Ala 245 250 255 Arg Arg Thr Ala Ala Arg Arg Gly Arg Glu Ser Ala Ala Gly 260 265 270 <210> 44 <211> 813 <212> DNA <213> Streptomyces roseosporus <400> 44 atgtcggtac gcgatctcgt cgggatgccg tgtcacccgt gcgaaccgcc acgccgcgcc 60 gaggggcgcc ggcgcggcgt ggggaggatg aggtggtgga agggggtgct gatgacggtt 120 cggcatcagg gggtgcggtg gtggttcgct cttctcgctc tcgtcgggtg cgtggtctgt 180 gtcctctgcg tcgtcgcgct cagcggggcg gggcactact tcgggctctc cttgtgggcg 240 ggcatcgcgc tcgtggtggt gggggcgctg tttcccctcg gggggctggg cttcctgtac 300 tgggtggacg acggccggtc cgaggacagc ttcctcgtga agttcctgtg cttcgtcgcc 360 cactccgccg tcctcgggct ggcagccgtc tcgtgcaccg gggctgaggc gtgggccttt 420 gagcagcgcg ggcggtggac ggaggcgacg gtcgtgggat acagcccgcc ccgggtggtc 480 ccgggtgatc cgccgacgaa ggtgcgggcg tcctgcgcgc tggagaccgc cgagggcgaa 540 cgcgtccggc cccggctgcc ggagggccgc ggctgccgcg acggggtgcg gcacgggtcc 600 cgcctcgacg tgctgtacga cccccggggt ctgctggcgc cccgggccac cgagcccatg 660 gaccacggcg tcaccgtccc ggtcctcggg ggcgtggcga ccctgtccgg tttcctcggc 720 tgtgtcgccc tcgcctggcg gtgggaaacc ctccgggtac gcagcgcgcg ccgcacggca 780 gcgcgccgag ggcgggaatc cgcagccggt tag 813 <210> 45 <211> 327 <212> PRT <213> Streptomyces roseosporus <400> 45 Met Lys Phe Thr Lys Leu Ala Ile Pro Val Ala Ala Ser Ala Leu Leu 1 5 10 15 Leu Thr Gly Cys Gly Ala Glu Val Glu Ser Gln Gly Lys Gly Ser Gly 20 25 30 Lys Ser Thr Val Lys Arg Cys Gly Glu Ser Val Glu Tyr Thr Val Pro 35 40 45 Lys Arg Ala Val Ala Tyr Glu Gly Gly Ser Ala Asp Lys Leu Phe Ser 50 55 60 Leu Gly Leu Ala Asp His Val His Gly Tyr Val Met Pro Pro Ala Asn 65 70 75 80 Pro Pro Val Ser Glu Ser Pro Trp Ala Lys Asp Tyr Ala Lys Val Lys 85 90 95 Met Leu Ser Asp Asp Leu Leu Asn Lys Glu Ile Val Val Asp Ala Lys 100 105 110 Ser Asp Phe Val Val Ala Gly Trp Asn Ser Gly Phe Ser Asp Gln Arg 115 120 125 Gly Ile Thr Pro Glu Ile Leu Asp Lys Leu Gly Val Gln Ser Phe Met 130 135 140 His Ser Glu Ser Cys Tyr Asn Tyr Pro Gly His Pro Glu Lys Leu Thr 145 150 155 160 Pro Phe Lys Gly Leu Tyr Thr Asp Leu Glu Arg Leu Gly Arg Ile Phe 165 170 175 Gln Val Glu Glu Glu Ala Glu Lys Val Val Ala Gly Leu Lys Lys Arg 180 185 190 Glu Ala Ala Val Ala Glu Gln Ala Pro Lys Gly Lys Pro Val Pro Val 195 200 205 Phe Leu Tyr Asp Ser Gly Thr Asp Gln Pro Phe Thr Ala Gly Asn Gln 210 215 220 Val Pro Pro Asn Asp Ile Ile Lys Thr Ala Gly Gly Lys Asn Ile Phe 225 230 235 240 Asp Gly Leu Glu Glu Arg Trp Thr Gln Val Asn Trp Glu Ala Val Thr 245 250 255 Gln Ala Glu Pro Glu Val Ile Met Ile Phe Asp Tyr Gly Asp Gln Pro 260 265 270 Ala Glu Lys Lys Ile Glu Phe Leu Lys Lys Ser Pro His Thr Lys Glu 275 280 285 Leu Pro Ala Val Lys Lys Asn Asn Phe Phe Val Leu Asp Tyr Asn Glu 290 295 300 Gly Ile Ser Ser Pro Arg Asn Ile Asp Gly Leu Glu Lys Phe Gly Lys 305 310 315 320 Tyr Met Arg Ala Phe Lys Lys 325 <210> 46 <211> 984 <212> DNA <213> Streptomyces roseosporus <400> 46 tcatttcttg aatgcgcgca tgtactttcc gaacttctcc aggccgtcga tattgcgcgg 60 gctgctgatg ccctcgttgt agtcgaggac gaagaagttg ttcttcttca cggccggcag 120 ttccttggtg tgcggcgact tcttcaggaa ctcgatcttc ttctcggcgg gctggtcgcc 180 gtagtcgaag atcatgatga cctcgggctc ggcctgggtg acggcttccc agttcacctg 240 ggtccagcgc tcctccaggc cgtcgaagat gttcttcccg cccgcggtct tgatgatgtc 300 gttgggcggc acctggttgc ccgccgtgaa cggctggtcg gtcccggagt cgtagaggaa 360 cacgggcacg ggcttgccct tcggagcctg ctcggcgacg gcggcctcgc gcttcttcaa 420 gccggcgacg accttctccg cctcctcttc gacctggaag atccgtccga ggcgttcgag 480 gtcggtgtag aggcccttga aaggcgtcaa cttctccgga tggcccgggt agttgtagca 540 gctctcactg tgcatgaagc tctgtacgcc gagcttgtcg aggatctccg gggtgatgcc 600 ccgctggtcg ctgaagcccg agttccagcc ggcgacgacg aagtccgact tggcgtccac 660 gacgatctcc ttgttgagga ggtcgtcgct gagcatcttc accttggcgt agtccttcgc 720 ccagggagac tcgctgaccg gcgggttggc cggcggcatg acgtagccgt gcacgtggtc 780 ggccaggccc agactgaaca gcttgtcggc gctgccgccc tcgtaggcga cggcccgctt 840 cggcaccgtg tactcgacgg actcgccgca gcgcttcacg gtgctcttcc cggagccctt 900 gccctgggat tcgacctcgg cgccacaccc cgtgagcagg agcgcggacg cggcgacggg 960 gatggcgagt ttggtgaact tcat 984 <210> 47 <211> 255 <212> PRT <213> Streptomyces roseosporus <400> 47 Met Asp Leu Glu Leu Asp Gly Leu Ser Val Val Thr Asp Gly Lys Ser 1 5 10 15 Leu Val Arg Asp Leu Ser Leu Asp Val Gly Ser Gly Gln Val Val Gly 20 25 30 Leu Val Gly Pro Asn Gly Ser Gly Lys Ser Thr Ala Leu Arg Cys Val 35 40 45 Tyr Arg Ala Leu Lys Pro Ser Ser Gly Thr Val Lys Val Asp Gly Gln 50 55 60 Glu Leu Ser Ser Leu Thr Met Arg Arg Ser Ala Gln Leu Ile Ala Ala 65 70 75 80 Met Thr Gln Asp Gly Ala Val Asp Leu Asp Phe Thr Val Glu Glu Val 85 90 95 Ile Ala Leu Gly Arg Thr Pro His Gln Arg Gly Ser Thr Pro Leu Asn 100 105 110 Gly His Glu Arg Asp Leu Cys Glu His Ala Met Arg Arg Leu Asp Ile 115 120 125 Leu His Leu Ala Arg Arg Gly Ile Leu Thr Leu Ser Gly Gly Glu Arg 130 135 140 Gln Arg Val Leu Leu Ala Arg Ala Leu Val Gln Glu Pro Lys Ile Leu 145 150 155 160 Val Leu Asp Glu Pro Thr Asn His Leu Asp Val Arg His Gln Val Arg 165 170 175 Leu Leu Ser Leu Leu Arg Gly Ala Gly Leu Thr Val Leu Val Val Leu 180 185 190 His Asp Leu Asn Leu Ala Ala Ala Ala Cys Asp Arg Ile Gly Val Leu 195 200 205 Ser Glu Gly Arg Leu Ile Thr Ser Gly Thr Pro Lys Asp Val Leu Thr 210 215 220 Pro Glu Leu Val Asp Glu Val Phe Gly Val Arg Ala Ser Val Val Pro 225 230 235 240 His Pro Leu Thr Gly Asp Pro Gln Leu Leu Tyr Ser Leu Asp Ser 245 250 255 <210> 48 <211> 768 <212> DNA <213> Streptomyces roseosporus <400> 48 tcaggaatcg agtgagtaga gcaactgggg gtcgcccgtc agcggatgcg ggacgacgga 60 ggcgcggacc ccgaatacct cgtcgacgag ttcgggcgtg aggacgtcct tgggcgtgcc 120 cgaggtgatc aggcggcctt cgctgagtac gccgatccgg tcgcacgcgg cggccgcgag 180 gttcaggtcg tggagtacga cgaggacggt caggccggca ccgcgcagca gggacaggag 240 ccgcacctga tggcgtacgt cgagatggtt cgtcggctcg tcgaggacga ggatcttcgg 300 ctcctgcacg agggcgcggg cgagcaggac gcgctggcgc tcgccgccgg agagggtgag 360 gatgccgcgt cgggccaggt gcaggatgtc gagccgacgc atggcgtgct cgcacagatc 420 ccgttcgtga ccgttcaacg gggtgctgcc gcgctggtgg ggtgtgcggc cgagggcgat 480 cacctcctcg acggtgaagt cgaggtcgac ggcgccgtcc tgggtcatcg ccgcgatgag 540 ctgggcgctg cggcgcatgg tcagcgacga gagctcctgg ccgtccacct tcacggtgcc 600 ggagctgggt ttcagggccc ggtacacgca ccgcagggcg gtggacttgc cgctgccgtt 660 ggggccgacg aggccgacca cctgaccgct gccgacgtcc agggagaggt cccgtaccag 720 gctcttgccg tcggtcacca ccgagagccc gtcgagttcg aggtccat 768 <210> 49 <211> 368 <212> PRT <213> Streptomyces roseosporus <400> 49 Met Ser Pro Pro Ala Pro Pro Glu Ala Leu Gln Arg Pro Ala Pro Thr 1 5 10 15 Ala Gln Glu Pro Val Arg Thr Gly Ser Arg Thr Gly Leu Val Ala Ile 20 25 30 Cys Val Ser Leu Phe Ala Ala Leu Val Val Ser Val Val Val Ala Ile 35 40 45 Gly Leu Gly Pro Ala Val Val Pro Pro Ala Glu Thr Ala Arg Phe Leu 50 55 60 Trp Ala Ala Leu Ser Gly Gly Pro Ile Ser Ala Asp Glu Val Thr Thr 65 70 75 80 Tyr Gln Ile Ile Trp Gln Ile Arg Thr Pro Arg Val Leu Leu Ala Ala 85 90 95 Leu Val Gly Ala Gly Leu Ser Ala Val Gly Val Ala Ile Gln Ala Leu 100 105 110 Val Arg Asn Ala Leu Ala Asp Pro Phe Val Leu Gly Val Ser Ser Gly 115 120 125 Ala Ser Val Gly Ala Val Gly Val Thr Val Met Gly Gly Leu Ala Val 130 135 140 Phe Gly Ile Tyr Ala Val Ser Val Gly Ala Phe Leu Gly Ala Leu Val 145 150 155 160 Ala Ser Val Leu Val Tyr Gly Ala Ser Ser Thr Lys Gly Ala Leu Ser 165 170 175 Pro Leu Arg Leu Val Leu Thr Gly Val Ala Met Ser Leu Gly Phe Gln 180 185 190 Ala Val Met Ser Val Ile Ile Tyr Phe Ala Pro Ser Ser Glu Ala Thr 195 200 205 Ser Met Val Leu Tyr Trp Thr Met Gly Ser Phe Gly Ala Ala Ser Trp 210 215 220 Gly Ser Leu Pro Val Val Thr Ala Ala Val Leu Leu Gly Val Leu Val 225 230 235 240 Leu His Arg His Gly Arg Pro Leu Asp Val Leu Ala Leu Gly Asp Glu 245 250 255 Thr Ala Ala Ser Leu Gly Ile Ser Pro Asp Arg His Arg Lys Ser Leu 260 265 270 Leu Val Leu Val Ser Leu Val Thr Gly Val Met Val Ala Val Ser Gly 275 280 285 Ser Ile Ala Phe Val Gly Leu Val Met Pro His Leu Val Arg Met Val 290 295 300 Val Gly Ala Thr His Ala Arg Val Leu Ala Val Ala Pro Leu Ala Gly 305 310 315 320 Ala Val Phe Met Val Trp Val Asp Leu Val Ser Arg Thr Leu Val Ala 325 330 335 Pro Arg Glu Leu Pro Leu Gly Val Ile Thr Ala Leu Val Gly Val Pro 340 345 350 Val Phe Ile Thr Leu Met Arg Arg Lys Ser Tyr Met Phe Gly Gly Arg 355 360 365 <210> 50 <211> 1107 <212> DNA <213> Streptomyces roseosporus <400> 50 tcaacggcct ccgaacatgt aggacttgcg gcgcatcagg gtgatgaaca ccgggacgcc 60 gaccagcgcg gtgatgacgc cgagcggcag ctcgcggggg gcgaccaggg tccgcgacac 120 gagatcgacc cagaccatga agaccgcccc ggcgagtggt gcgacggcga gcacccgcgc 180 gtgcgtcgcg cccaccacca tgcgtacgag gtgcggcatg acgaggccga cgaaggcgat 240 ggaaccgctg acggcgacca tcacgcccgt caccagggag acgagcacga gcagggactt 300 gcggtgtcgg tcggggctga tgcccaggct ggctgcggtc tcgtcaccga gagccaggac 360 gtcgagcggg cggccgtgcc ggtgcaggac gaggacaccg agcagcacgg cggcggtgac 420 caccggcagc gaaccccagg aagcggcgcc gaagctgccc atggtccagt acaggaccat 480 gctggtcgcc tcggagctgg gcgcgaagta gatgatgaca ctcatcacgg cctggaaacc 540 cagcgacatg gcgacaccgg tcagtacgag ccgcagcggc gagagcgccc ccttggtgga 600 cgaggcgccg tacaccagga ctgaggccac gagcgcgccg aggaaggcgc ccacggacac 660 cgcgtagatc ccgaacacgg cgagcccgcc catgaccgtc acaccgacgg cgcccacgga 720 ggcccccgag gagacgccca gaacgaacgg gtcggccagc gcgttgcgca ccagggcctg 780 gatggcgaca ccgaccgcgc tgagcccggc ccccacgagc gccgcgagca ggacgcgcgg 840 ggtgcggatc tgccagatga tctggtacgt cgtcacctcg tccgccgaga tcggcccgcc 900 actgagcgcg gcccagagga agcgcgcggt ctcggccggg gggaccacgg caggcccgag 960 accgatggcg acgacgacgg agacgacgag cgcggcgaac aggctcacgc agatcgccac 1020 caggcccgtc cgggagccgg tccgaaccgg ctcttgcgcg gtgggcgcgg gacgttgcag 1080 cgcctcgggt ggcgcgggcg gtgacat 1107 <210> 51 <211> 417 <212> PRT <213> Streptomyces roseosporus <400> 51 Val Ser Ala Gly Thr Ser Arg Ser Ala Val Ala Pro Glu Lys Ser Pro 1 5 10 15 Glu Met Pro Gly Asp Leu Lys Met Ala Arg Ala Leu Trp Pro Val Leu 20 25 30 Val Ala Ser Ala Val Gly Leu Leu Pro Phe Thr Val Phe Ser Thr Tyr 35 40 45 Leu Val Pro Ile Ala Glu Glu Thr Gly Ser Gly Val Ala Ala Val Gly 50 55 60 Gly Leu Arg Gly Leu Gly Gly Leu Ala Ala Leu Ala Val Gly Thr Ala 65 70 75 80 Leu Ala Pro Leu Ile Asp Arg Val Pro Lys Ser Lys Ala Val Ala Val 85 90 95 Gly Leu Val Val Leu Ala Val Ser Ser Ala Leu Gly Ala Ser Gly Asp 100 105 110 Phe Leu Leu Thr Ala Val Phe Cys Leu Leu Val Gly Ala Gly Thr Ala 115 120 125 Val Ile Asn Pro Ala Leu Thr Ala Ala Ala Ala Asp Arg Phe Gly Asp 130 135 140 Gly Lys Ser Ala Ala Arg Ala Ala Thr Leu Val Thr Ser Thr Thr Ser 145 150 155 160 Met Thr Ala Met Leu Ala Ala Pro Leu Ile Ala Leu Pro Ala Leu Leu 165 170 175 Trp Gly Trp Glu Gly Asp Leu Leu Ala Val Thr Val Val Ser Leu Leu 180 185 190 Leu Ala Ala Val Phe Leu Val Arg Gly Arg Lys Gly Glu Asp Pro Val 195 200 205 Val Glu Gly Gly Pro Arg Thr Gly Tyr Phe Ala Ser Phe Lys Ala Leu 210 215 220 Ala Gln Val Arg Gly Ser Val Pro Leu Leu Ala Ile Ser Phe Leu Arg 225 230 235 240 Thr Ala Val Phe Met Gly Tyr Leu Ala Tyr Leu Ala Val Tyr Tyr Asp 245 250 255 Asp Arg Phe His Leu Asp Pro Ala Leu Phe Ser Leu Val Trp Thr Leu 260 265 270 Ser Gly Ala Ser Phe Phe Val Ser Asn Leu Leu Thr Gly Arg Ile Thr 275 280 285 Asn Ala Glu Lys Ser Thr Val Gly Thr Glu Gln Leu Leu Leu Val Gly 290 295 300 Leu Leu Ala Ala Leu Val Thr Ala Thr Gly Phe Trp Phe Thr Thr Trp 305 310 315 320 Leu Pro Leu Ala Leu Ala Phe Thr Ser Leu His Ala Ala Ser His Ala 325 330 335 Ala Val Ala Ala Cys Ala Val Ser Leu Leu Val Arg Arg Cys Gly Ser 340 345 350 Met Arg Gly Ser Ala Leu Ser Leu Asn Ala Ala Gly Gln Ser Leu Gly 355 360 365 Val Phe Ala Gly Ala Ala Leu Gly Gly Ala Gly Leu Gly Leu Ala Gly 370 375 380 Tyr Pro Gly Ile Ala Ala Ala Phe Gly Leu Leu Val Ala Val Ala Val 385 390 395 400 Val Ala Gly Leu Leu Val Leu Arg Ser Glu Asp Glu Ile Pro Gly Ser 405 410 415 Ala <210> 52 <211> 1254 <212> DNA <213> Streptomyces roseosporus <400> 52 ctacgccgaa ccggggatct cgtcctcgga gcgcagcacc aggagcccgg ccaccacggc 60 cacggcgacg agcagcccga acgcggcggc gatccccggg taccccgcga gcccgagtcc 120 cgctccgccg agggcggcgc cggcgaagac gccgaggctc tggcccgccg cgttgaggct 180 cagcgcggaa ccccgcatcg atccgcagcg cctgaccagc agactgacgg cgcaggcggc 240 gacggccgcg tggctagcgg cgtgcagcga agtaaaggcc agggcgagcg gcagccaggt 300 cgtgaaccag aaaccggtag cggtgaccag ggccgccaac agtccgacga gcaagagctg 360 ttcggtaccc acggtggatt tctcggcgtt ggtgatgcgg cccgtgagca ggttgctgac 420 gaagaacgag gcgccgctga gcgtccacac cagcgagaac agggcggggt cgaggtggaa 480 ccggtcgtcg tagtagaccg cgaggtaggc gaggtagccc atgaagaccg cggtgcgcag 540 gaaggagatg gcgagcagcg gcaccgagcc gcggacctgg gccagggcct tgaacgaggc 600 gaagtagccc gtgcgcgggc caccctcgac caccgggtcc tcgcccttcc tgccgcgtac 660 gaggaagacc gcggcgagca gcagcgagac gacggtgacg gcgagcaggt cgccctccca 720 tccccacagc agggccggca gggcgatcag gggcgcggcg agcatcgccg tcatcgaggt 780 cgtcgacgtg acgagggtgg ccgcacgggc ggcggacttg ccgtcgccga accggtcggc 840 ggcggcagcg gtgagcgccg ggttgatcac cgcggtgccg gcgccgacca gcaggcagaa 900 caccgcggtc aggaggaagt ctccgctcgc gccgagggct gaggagacgg cgagtacgac 960 gagaccgacc gcgaccgcct tcgacttggg tacccggtcg atcagggggg ccagggccgt 1020 gcccacggcg agcgccgcga ggccccccag gccgcgcagg ccgcccaccg cggcgacacc 1080 gctcccggtc tcctcggcga tcggcaccag atacgtgctg aagacggtga acggcagcag 1140 gccgacggcg gaggccacca ggaccggcca cagggctcgc gccatcttca ggtcgccggg 1200 catctcgggg gacttctccg gtgcgacggc cgaacgggag gtgccggcgc tcac 1254 <210> 53 <211> 286 <212> PRT <213> Streptomyces roseosporus <400> 53 Met Thr Pro Pro Pro Thr Arg Arg Lys Pro Ser Asp Met Pro Phe Pro 1 5 10 15 Thr Pro Gln Ser Val Ala Glu Leu Thr Asp Ala Val Leu Ala Gly Asp 20 25 30 Tyr Gly Pro Asp Pro Lys Asp Met Thr Val Thr Ser Ala Phe Trp Leu 35 40 45 Tyr His Thr Thr Arg Leu Ala Gly Gly Pro Val Thr Tyr His Asn His 50 55 60 Tyr Leu Val Leu Arg Val Gly Arg Ser Phe Gly Gly Cys Ser Phe Glu 65 70 75 80 Ala Gly Glu Leu Thr Pro Asp Phe Cys Glu Asn Ala Ser Gly His Pro 85 90 95 Leu Glu Lys Leu Leu Arg His Glu Ser Ala Pro Val Arg Ile Ala Ala 100 105 110 Leu Asp Ala Tyr Leu Ala Gln Ile Gln Pro His Arg Glu Ala Pro Glu 115 120 125 Gln Glu Ala Val Pro Leu Pro Val Gly Thr Pro Glu Val Arg Ala Lys 130 135 140 Ala Arg Asp Ala Ser Ile Ala Gly Leu Leu Asp Ile Glu Glu Gly Ala 145 150 155 160 Lys Val Ala Leu Ile Gly Val Val Asn Pro Leu Val Ala Ala Ile Arg 165 170 175 Glu Arg Gly Gly Val Cys Leu Pro Cys Asp Leu Asn Leu Arg Thr Thr 180 185 190 Gln Trp Gly Glu Pro Val Ala Asp Asp Met Thr Glu Val Leu Ala Glu 195 200 205 Ala His Ala Val Val Ala Thr Gly Met Thr Leu Ser Asn Gly Thr Phe 210 215 220 Asp Leu Ile Leu Glu His Cys Arg Glu Gln Lys Val Pro Leu Val Val 225 230 235 240 Tyr Ala Gln Thr Gly Ser Ala Val Ala Arg Ala Phe Leu Gly Ser Gly 245 250 255 Val Thr Ala Leu Asn Ala Glu Pro Phe Pro Phe Ser Gln Phe Ser Ala 260 265 270 Asp Glu Thr Thr Met Tyr Arg Tyr Arg Ala Gly Gly Asp Leu 275 280 285 <210> 54 <211> 861 <212> DNA <213> Streptomyces roseosporus <400> 54 tcacaggtca ccgcctgcgc ggtagcggta catcgtcgtc tcgtcggcgc tgaactgtga 60 gaacgggaag ggctcggcgt tcagggcggt gacgcccgag ccgaggaacg cgcgggcgac 120 ggcgctgccc gtctgggcgt acacgacgag cggcaccttc tgctcgcggc agtgttccag 180 gatcaggtcg aaggtgccgt tggagagtgt catccccgtg gcgacgacgg cgtgggcctc 240 tgcgaggacc tcggtcatgt cgtccgcgac cggctctccc cactgggtgg ttcgcaggtt 300 gaggtcgcac ggcaggcaga cgccgccccg ctcgcggatc gcggcgacga gcgggttgac 360 gacgccgatg agcgcgacct tggcgccctc ctcgatgtcg agcagcccgg cgatggacgc 420 gtcccgcgcc ttcgcccgca cctcgggggt ccccaccggc agcgggacgg cctcctgctc 480 cggggcttcc cgatgcggct gtatctgtgc gaggtaggcg tcgagcgccg ctatgcgcac 540 cggggcggac tcgtggcgca gcaacttctc cagcgggtgc ccggaggcgt tctcgcagaa 600 gtccggggtg agttcgcctg cctcgaagga gcagccgccg aaggaccggc cgacacgcag 660 caccaggtag tggttgtggt acgtcaccgg tccgccggcg agccgtgtcg tgtggtagag 720 ccagaacgcg ctggtgacgg tcatgtcctt cgggtcgggg ccgtagtccc cggcgaggac 780 ggcatcggtg agctcggcga ccgactgcgg cgtgggaaag ggcatgtcag agggctttct 840 tctggtcgga ggtggagtca t 861 <210> 55 <211> 337 <212> PRT <213> Streptomyces roseosporus <400> 55 Met Tyr Glu His Ile Ala Glu Ala Ile Lys Lys Pro Asp Leu Ile Ala 1 5 10 15 Leu Arg Pro Asp Leu Val Cys Leu Arg Phe Glu Thr Met Lys Ile Tyr 20 25 30 Ser Ala Leu Gly Ala Val Arg His Leu Leu Glu Ser Gly Thr Val Lys 35 40 45 Pro Gly Asp Thr Leu Val Asp Ser Ser Ser Gly Ile Tyr Ala Gln Ala 50 55 60 Leu Ala Leu Ala Cys His Arg Tyr Gly Met Lys Cys His Ile Val Gly 65 70 75 80 Ser Thr Thr Val Asp Arg Thr Leu Lys Ala Gln Leu Glu Ile Leu Gly 85 90 95 Ala Thr Leu Glu Gln Val Arg Pro Ser Arg Asn Leu Arg Leu Asp Gln 100 105 110 Glu Leu Arg Val Arg Arg Ile Ala Glu Ile Leu Glu Glu Asn Pro Ser 115 120 125 Tyr His Trp Met Arg Gln Tyr His Asp Ser Ile His Tyr Tyr Gly Tyr 130 135 140 Arg Glu Val Ala Glu Thr Ile Ala Asp Glu Val Pro Ala Gly Pro Leu 145 150 155 160 Thr Leu Val Gly Gly Val Gly Ser Gly Ala Ser Thr Gly Ala Ile Ala 165 170 175 Ser Tyr Leu Arg Glu Ala Gly Arg Asp Val Ser Leu Val Gly Val Gln 180 185 190 Pro Phe Gly Ser Val Thr Phe Gly Ser Glu His Val Ser Asp Pro Asp 195 200 205 Met Ile Ile Ala Gly Ile Gly Ser Ala Ile Pro Phe Glu Asn Val Arg 210 215 220 His Asp Leu Tyr Asp Arg Ile His Trp Val Ser Phe Asp Ser Ala Leu 225 230 235 240 Ala Gly Ala Val His Leu Leu Arg Ser Ser Gly Ile Phe Ala Gly Leu 245 250 255 Ser Ala Gly Ala Ala Tyr Leu Thr Thr Arg Trp Glu Arg Ser Lys Asp 260 265 270 Asp Ser Arg Thr Tyr Val Phe Ile Ala Ala Asp Thr Gly His Arg Tyr 275 280 285 Val Asp Ser Ala Tyr Ala Lys His Thr Glu Ala Pro Asp Ile Glu Asp 290 295 300 Leu Glu Pro Arg Glu Ile Thr Ser Leu Asp Glu Leu Ser His Pro Trp 305 310 315 320 Ser Ala Met Thr Trp Thr Asp Asp Ser Thr Ser Asp Gln Lys Lys Ala 325 330 335 Leu <210> 56 <211> 1014 <212> DNA <213> Streptomyces roseosporus <400> 56 tcagagggct ttcttctggt cggaggtgga gtcatcggtc cacgtcatgg cggaccaggg 60 gtggctgagc tcgtcgagcg aggtgatctc gcgcggttcg aggtcctcga tgtcgggcgc 120 ctcggtgtgc ttggcgtacg cgctgtcgac gtagcggtga cctgtgtccg ccgcgatgaa 180 gacgtacgtc cgggaatcgt ccttcgaccg ctcccaccgg gtggtcaggt aggcggcgcc 240 cgcggacagg cctgcgaaga tgccgctgga gcggagcagg tggacggcgc ctgcgagcgc 300 ggagtcgaag ctgacccagt ggatccggtc gtacagatcg tgccggacgt tctcgaacgg 360 gatggcgctg ccgatgccgg cgatgatcat gtccgggtcc gagacgtgct ccgagccgaa 420 cgtgacgctg ccgaagggct ggactccgac gagggagacg tctcggcccg cctcgcgcag 480 atacgaggcg atggcgcctg tcgacgcgcc ggaacccacg ccgcccacca aggtcagggg 540 cccggcgggc acctcgtcgg cgatcgtttc ggccacttcg cggtagccgt agtagtggat 600 gctgtcgtgg tactgccgca tccagtggta cgaggggttc tcctccagga tctcggcgat 660 gcgccgcacc cggagctcct ggtcgaggcg gagattcctg gacggccgca cctgctcgag 720 cgtggcaccg agaatctcga gctgcgcctt gagcgtgcgg tccaccgtgg tcgaccccac 780 gatgtggcac ttcatgccgt agcggtggca ggcgagggcg agggcctgcg cgtagatgcc 840 gctcgaactg tcgacgaggg tgtcaccggg tttgacggtg cccgactcaa ggaggtgccg 900 caccgccccc agagccgagt agatcttcat ggtctcgaac cgcagacaga ccaggtccgg 960 ccgcagtgct atgagatcgg gtttcttgat cgcttcagct atgtgctcgt acat 1014 <210> 57 <211> 299 <212> PRT <213> Streptomyces roseosporus <400> 57 Met Asp Thr Gly Val Gly Thr Ala Tyr Gly Thr Phe Gly Glu Leu Leu 1 5 10 15 Gln Gly Glu Leu Pro Glu Glu Ala Gly Asp Phe Leu Val Thr Leu Pro 20 25 30 Val Ala Arg Trp Ala Arg Ala Ser Phe Arg Cys Asp Pro Ala Met Gly 35 40 45 Asp Val Ile Val Arg Pro Ser His Lys Glu Lys Ala Arg Arg Leu Ala 50 55 60 Cys Leu Ile Leu Glu Glu Ala Pro Gly Met Thr Gly Gly Val Leu Thr 65 70 75 80 Val Asn Ser Val Ile Pro Glu Gly Lys Gly Leu Ala Ser Ser Ser Ala 85 90 95 Asp Leu Val Ala Thr Ala Arg Ala Val Gly Arg Ala Leu Arg Leu Asp 100 105 110 Met Pro Pro Ser Arg Ile Glu Gly Leu Leu Arg Leu Ile Glu Pro Thr 115 120 125 Asp Gly Val Leu Tyr Pro Gly Ile Val Ala Phe His His Arg Ala Val 130 135 140 Arg Leu Arg Ala Met Leu Gly Ser Leu Pro Ala Met Ser Val Val Gly 145 150 155 160 Val Asp Glu Gly Gly Ala Val Asp Thr Val Asp Phe Asn Arg Ile Pro 165 170 175 Lys Pro Phe Thr Pro Ala Asp Arg Arg Glu Tyr Ala Asp Leu Leu Asn 180 185 190 Arg Leu Ser Gly Ala Val Arg Ser Arg Asp Leu Ala Glu Val Gly Arg 195 200 205 Val Ala Thr Arg Ser Ala Leu Met Asn Gln Pro Leu Arg Tyr Lys Arg 210 215 220 Leu Leu Glu Pro Met Arg Glu Ile Cys Arg Asp Ala Gly Gly Leu Gly 225 230 235 240 Val Ala Val Gly His Ser Gly Thr Ala Leu Gly Val Leu Leu Asp Ala 245 250 255 Ala Asp Pro Ala Tyr Pro His Arg Ala Thr Ala Val Ala Arg Ala Cys 260 265 270 Gly Asp Leu Ala Gly Ala Val Ala Val Tyr Arg Thr Leu Ser Phe Pro 275 280 285 Asn Ala Val Ser His Gly Gly Arg Thr Val Gly 290 295 <210> 58 <211> 900 <212> DNA <213> Streptomyces roseosporus <400> 58 atggacactg gagtgggcac cgcctacgga acgttcgggg aactgctcca gggtgaactg 60 ccggaggagg caggcgattt cctcgtcacg ctgcctgtcg cccggtgggc gagggcgtcc 120 ttccggtgcg acccggccat gggagatgtc atcgtcaggc cgtcgcacaa ggagaaggcg 180 aggcggctgg cctgcctgat cctggaggag gcaccgggga tgaccggtgg ggtgctgacg 240 gtcaacagcg tgatcccgga gggcaaaggg ctggccagtt catccgccga cctggtcgcc 300 acggcgcgcg cggtggggcg ggccctgcgg ctcgacatgc cgccatcgcg gatcgagggg 360 ctgctgaggc tgatcgaacc gaccgatggt gtcctgtacc cgggaatagt cgccttccat 420 catcgagcgg tgcgactgcg cgcgatgctg ggctcgttgc ccgccatgtc ggtcgtcggt 480 gtcgacgagg gcggggccgt ggacacggtc gacttcaacc gcatacccaa gccgttcacg 540 ccggcggacc ggcgtgagta cgccgacctg ctgaaccggc tgagtggggc cgttcgctca 600 cgcgacctcg cggaggtggg cagggtggcg acgcgcagcg cgctcatgaa ccagccgctt 660 cggtacaagc gactgctgga gcccatgcgg gagatctgca gggatgccgg tggtctgggc 720 gtggccgtgg gccacagtgg gacggcgctc ggcgtgctcc tggacgccgc ggatcccgcg 780 tacccgcacc gggccaccgc ggtggcccgg gcgtgcgggg atctggccgg ggccgtcgcg 840 gtctatcgga ccctcagttt cccgaacgcc gtcagccatg gtggtcggac cgtcggctga 900 <210> 59 <211> 255 <212> PRT <213> Streptomyces roseosporus <400> 59 Met Leu Thr Ala Gln Gln Pro Ala Pro Gly Val Val Pro Ala Arg Ile 1 5 10 15 His Val Thr Asp Arg Leu Glu Ala Ala His Pro Leu Ala Ala Asp Gly 20 25 30 Ala Val Val Leu Thr Gly Val Glu Pro Ser Gly Asp Gly Leu Val Leu 35 40 45 Ala Ala Ala Ala Val Leu Gly Glu Arg Leu Gln Gln Val Phe Pro His 50 55 60 Arg Leu Arg Ala Ser Asp Gly Ser Asn Phe Val His Leu His Ala Asp 65 70 75 80 Ser Phe Asp Phe Val Val Asn Val Gly Gly Val Glu His Arg Arg Arg 85 90 95 Asp Pro Asp Glu Asp Tyr Val Leu Ile Gln Cys Val Arg Gln Ser Asp 100 105 110 Ser Gly Gly Asp Ser Phe Val Ala Asp Ala Tyr Arg Phe Val Asp His 115 120 125 Cys Ala Thr Ala Asp Pro Glu Leu Trp Asp Phe Leu Thr Arg Gly Asp 130 135 140 Val Asp Leu Tyr Gly Ala Trp Ser Gly Leu Arg Gly Met Pro Ala Thr 145 150 155 160 Pro Phe Val Gly Arg His Val Glu Tyr Thr Arg Ala Gly Arg Arg Ile 165 170 175 Val Arg Arg Gly Asp Gly Val Thr Pro Leu His Arg Asp Pro Gly Ala 180 185 190 Asp His Thr Arg Arg Met Leu Ala Arg Leu Glu Glu Ala Val His Ala 195 200 205 Leu Glu Glu Thr Leu Pro Arg Phe Arg Leu Asp Lys Gly Glu Ile Leu 210 215 220 Val Leu Asp Asn Tyr Arg Cys Trp His Gly Arg Glu Ala His Thr Gly 225 230 235 240 Asp Arg Ala Val Arg Ile Leu Thr Val Arg Ser Ser Asp Ala Arg 245 250 255 <210> 60 <211> 768 <212> DNA <213> Streptomyces roseosporus <400> 60 atgctcaccg cacagcagcc tgctcccggc gtcgtgcccg cccggatcca cgtcacggac 60 aggttggagg ccgctcaccc gctcgccgct gacggggctg tcgtcctgac aggcgtcgag 120 ccctccggtg acggcctggt cctcgccgcc gcagccgtcc tgggggagcg gctgcagcag 180 gtgttccctc accggctgcg ggcgtccgac ggctcgaact tcgtccacct tcatgcggac 240 agcttcgact tcgtcgtcaa cgtagggggc gtcgagcatc gccgacgtga tccggatgag 300 gactatgtcc tcatccagtg cgtccggcag tccgactccg gcggcgactc cttcgtggct 360 gacgcctatc gcttcgtgga ccactgcgcg acggccgatc ctgaactgtg ggacttcctg 420 acccgagggg acgtcgacct gtacggcgcg tggtccggac tgcgtggtat gcccgcaacc 480 ccctttgtgg gcaggcatgt cgagtacacc cgcgccggtc ggcgtatcgt ccggcgcggc 540 gacggggtga cccctctgca ccgggaccct ggcgcggacc acacccggcg gatgctcgcc 600 cgtctggagg aagccgtcca tgcgctggag gagacgctcc cgcgattccg gctcgacaag 660 ggcgaaatcc tcgtcctgga caactaccgc tgctggcacg gccgcgaggc tcacacggga 720 gatcgcgcgg tacgtatcct cacggtgcgc agcagcgacg cccgctga 768 <210> 61 <211> 247 <212> PRT <213> Streptomyces roseosporus <400> 61 Met Thr Thr Met Phe Asn Asn Asn Pro Pro Phe Pro Pro Ala Thr Glu 1 5 10 15 Leu Arg Asn Glu Arg Val Arg Phe Gln Arg Leu Ser Ala Gly Tyr Pro 20 25 30 Gly Arg Pro Val Leu His Gln Leu Ser Ala Ala Ile Pro Pro Leu Ala 35 40 45 Met Thr Ala Leu Val Gly Pro Asn Gly Ser Gly Lys Ser Thr Leu Leu 50 55 60 Gly Val Leu Ala Gly Val Ile Thr Ala Thr Ser Gly Gln Leu Arg Tyr 65 70 75 80 Ala Glu Gly Ser Pro Pro Ala Phe Val Pro Gln Arg Gly Ala Val Gly 85 90 95 Asp Thr Leu Pro Leu Thr Ala Arg Gln Thr Val Glu Met Gly Arg Trp 100 105 110 Gly Gln Arg Gly Leu Trp Arg Arg Leu Thr Arg Thr Asp Arg Thr Ala 115 120 125 Val Asp Ser Ala Met Glu Arg Leu Gly Val Ala Asp Leu Gly Ala Arg 130 135 140 Gln Leu Gly Glu Leu Ser Gly Gly Gln Arg Gln Arg Val Leu Ile Ala 145 150 155 160 Gln Gly Leu Ala Gln Gln Ser Asp Leu Leu Leu Leu Asp Glu Pro Thr 165 170 175 Thr Gly Leu Asp Pro Glu Ala Arg Glu Arg Ile Thr Ala Leu Leu Thr 180 185 190 Asp Leu Val Ala Asp Gly Thr Thr Val Val Gln Ala Thr His Asp Leu 195 200 205 Asp Ala Ala Arg Ser Ala Asp Ala Cys Leu Leu Leu Ala Asp Gly Arg 210 215 220 Leu Ile Gly Gln Gly Ser Pro Glu Glu Val Leu Thr Pro Glu Ala Leu 225 230 235 240 Ala Arg Ile Trp Gln Pro Ala 245 <210> 62 <211> 744 <212> DNA <213> Streptomyces roseosporus <400> 62 tcacgccggc tgccagatcc gggccagtgc ctccggggtg agtacttcct ccggtgatcc 60 ctgcccgatc agtcgtccgt cggccaggag caggcaggcg tcggccgagc gggcggcgtc 120 caggtcgtgg gtggcctgga cgacggtggt gccgtcggcg accaggtccg tcagcagggc 180 cgtgatccgc tcccgcgcct cggggtcgag tccggtggtc ggctcgtcca ggagaagcag 240 gtcggactgt tgggcgaggc cctgcgcgat cagcacgcgc tgacgctggc cgcccgacag 300 ctcgccgagc tggcgggcgc cgaggtcggc gacccccagc ctctccatgg cggagtcgac 360 cgcggtccgg tccgtgcggg tcagccgccg ccacaggccc cgctgtcccc agcggcccat 420 ctccaccgtc tgccgcgccg tgagggggag ggtgtcgccg acggcaccgc gctgcgggac 480 gaaagccggc ggggagccct ctgcgtaccg gagttgtccg gatgtggcgg tgatcactcc 540 ggccaggacg cccagcagcg tcgacttgcc gcttccgttg ggtccgacca gggcggtcat 600 ggccaacggc ggtattgcgg cgctgagttg gtggagcacg gggcggccgg ggtagccggc 660 gctcagccgc tggaaccgga cgcgttcatt ccgcagttcg gtggccggcg ggaacggagg 720 gttgttattg aacatggttg tcat 744 <210> 63 <211> 319 <212> PRT <213> Streptomyces roseosporus <400> 63 Met Glu Trp Leu Thr Ala Pro Phe Glu Val Ala Phe Val Gln Arg Ala 1 5 10 15 Leu Trp Ala Gly Ile Leu Val Ser Ala Ile Cys Ala Leu Ala Gly Thr 20 25 30 Trp Val Val Leu Arg Gly Met Ala Phe Leu Gly Asp Ala Met Ser His 35 40 45 Gly Leu Leu Pro Gly Val Ala Val Ala Ser Leu Leu Gly Gly Asn Leu 50 55 60 Leu Val Gly Ala Val Val Ser Ala Ala Val Met Ala Ala Gly Val Thr 65 70 75 80 Ala Leu Gly Arg Thr Pro Arg Leu Ser Gln Asp Thr Gly Ile Gly Leu 85 90 95 Leu Phe Val Gly Met Leu Ser Leu Gly Val Ile Ile Val Ser Arg Ser 100 105 110 Gln Ser Phe Ala Val Asp Leu Thr Gly Phe Leu Phe Gly Asp Val Leu 115 120 125 Ala Val Arg Gly Ser Asp Leu Leu Leu Leu Gly Val Ala Leu Leu Leu 130 135 140 Ala Leu Ala Val Ser Val Leu Gly Tyr Arg Ala Phe Leu Ala Leu Ala 145 150 155 160 Phe Asp Glu Arg Lys Ala Arg Thr Leu Gly Leu Arg Pro Arg Leu Ala 165 170 175 His Ala Val Leu Leu Gly Leu Leu Ala Leu Ala Ile Val Ala Ser Phe 180 185 190 His Ile Val Gly Thr Leu Leu Val Leu Gly Leu Leu Ile Ala Pro Pro 195 200 205 Ala Ala Ala Met Pro Trp Ala Arg Ser Val Gln Ala Val Met Val Leu 210 215 220 Ala Ala Leu Leu Gly Ala Ala Ala Thr Phe Gly Gly Leu Leu Leu Ser 225 230 235 240 Trp His Leu Arg Thr Ala Ala Gly Ala Thr Val Ser Ala Leu Ala Val 245 250 255 Ala Leu Phe Phe Leu Ser His Leu Ala Ser Gly Leu Arg His Arg Arg 260 265 270 Arg Ala Arg Arg Gly Gly Leu Ala Glu Pro Ala Val Ala Pro Gly Arg 275 280 285 Asp Leu Leu His Val Leu Thr Glu Arg Asn Leu Arg Arg Ser Pro Cys 290 295 300 Ser Ser Glu Lys Thr Ser His Arg Trp Leu Arg Arg Leu Arg Pro 305 310 315 <210> 64 <211> 960 <212> DNA <213> Streptomyces roseosporus <400> 64 atggagtggt tgacggcccc tttcgaggtg gcctttgtgc agagggccct atgggccggg 60 atcctggtgt cggcgatatg cgccctcgcg ggaacgtggg tggtgctgcg cgggatggcc 120 ttcctcggtg acgcgatgtc gcacgggctg ctgcccggcg tcgcggtcgc ctccctgctg 180 ggaggcaacc tgctggtggg ggcggtggtg agcgcggccg tgatggcggc gggcgtcacg 240 gccctcgggc ggactccgcg actgtcccag gacaccggca tcggcctgct gttcgtgggc 300 atgctgtcgc tcggcgtcat catcgtgtcg cggtcgcagt ccttcgcggt ggacctcacc 360 ggcttcctgt tcggagacgt cctcgccgtg cgggggagcg atctgctgct tcttggagta 420 gccctgctgc tggcgctggc cgtctcggtg ctcggctacc gggctttcct ggccctcgcg 480 ttcgacgagc gcaaggcccg gacactcggg ctgcgtcccc ggctcgccca tgccgtgctg 540 ctcggcctgc tggcgctggc catcgtggcc tccttccaca tcgtgggcac gctgctcgtc 600 ctcggtctgc tcatcgcccc gcccgcggcg gccatgccct gggcgcgaag cgtccaggcg 660 gtcatggtcc tcgcggcgct cctcggcgcc gccgccacct tcggcggcct gctcctgtcc 720 tggcatctgc gcaccgcggc cggagcgacc gtctcggccc tcgccgtcgc tctcttcttc 780 ctgtcccacc tggcatccgg acttcggcac cgccgccgtg cgcgccgggg cggtcttgcc 840 gaaccggcgg tcgccccggg ccgcgacctc ctccacgtcc tgaccgagag aaacctgagg 900 cgatctcctt gctcgtccga aaaaacgtca catcgctggc tccggcgctt gcggccgtga 960 <210> 65 <211> 396 <212> PRT <213> Streptomyces roseosporus <400> 65 Val Ile Leu Leu Thr Ala Gly Cys Gly Gly Gly Asp Glu Ala Lys Ser 1 5 10 15 Gly Ser Gly Pro Ala Ser Ser Ser Pro Thr Pro His Gly Tyr Val Glu 20 25 30 Gly Ala Thr Glu Ala Ala Glu Gln Gln Ser Arg Leu Leu Leu Gly Asp 35 40 45 Pro Gly Ser Gly Glu Thr Arg Val Leu Asp Leu Ile Thr Gly Lys Val 50 55 60 Tyr Asp Ile Ala Arg Ser Pro Gly Ala Thr Ala Leu Thr Thr Asp Gly 65 70 75 80 Arg Phe Gly Tyr Phe His Gly Pro Asp Gly Ile Arg Val Leu Asp Ser 85 90 95 Gly Ala Trp Met Val Asp His Gly Asp His Val His Tyr Tyr Arg Ala 100 105 110 Lys Ile Lys Glu Val Gly Glu Leu Pro Gly Gly Thr Gly Thr Ser Ile 115 120 125 Arg Gly Asp Ala Gly Val Thr Val Ala Ser Ser Ala Asp Gly Lys Ala 130 135 140 Ser Val Tyr Arg Arg Ala Asp Leu Glu Lys Gly Ala Leu Gly Thr Pro 145 150 155 160 Ser Pro Leu Pro Gly Thr Phe Ala Gly Ala Val Val Pro Tyr Ala Glu 165 170 175 His Leu Val Thr Leu Thr Ala Glu Ser Gly Ala Pro Ala Lys Val Ala 180 185 190 Val Leu Asp Arg Ser Gly Lys Arg Val Ala Ala Pro Glu Ala Glu Cys 195 200 205 Glu Glu Pro Gln Gly Asp Ala Val Thr Arg Arg Gly Val Val Leu Gly 210 215 220 Cys Ala Asp Gly Ala Leu Leu Val His Glu Asp Asp Gly Ala Phe Thr 225 230 235 240 Ala Glu Lys Ile Pro Tyr Gly Glu Asp Val Pro Lys Thr Glu Arg Ala 245 250 255 Val Glu Phe Arg His Arg Pro Gly Ser Ser Thr Leu Thr Ala Pro Ala 260 265 270 Gly Lys Asp Ala Val Trp Val Leu Asp Ala Gly Glu Gly Ala Trp Thr 275 280 285 Arg Val Lys Thr Gly Pro Val Val Ala Ala Asn Thr Ala Gly Glu Gly 290 295 300 Ser Pro Leu Val Val Leu Glu Thr Asp Gly Ala Leu His Gly Tyr Asp 305 310 315 320 Ile Pro Thr Gly Lys Glu Thr Gly Val Thr Asp Pro Leu Leu Lys Glu 325 330 335 Leu Pro Gly Thr Gly Ala Gly Gly Gly Ala Ala Pro Val Ile Glu Val 340 345 350 Asp Arg Ser Arg Ala Tyr Leu Asn Asp Pro Glu Gly Lys Arg Val Tyr 355 360 365 Glu Ile Asp Tyr Asn Asp Asp Leu Arg Val Ala Arg Thr Phe Asp Val 370 375 380 Asp Val Arg Pro Ser Leu Met Val Glu Thr Gly Arg 385 390 395 <210> 66 <211> 1191 <212> DNA <213> Streptomyces roseosporus <400> 66 gtgatcctcc tgaccgccgg atgcgggggc ggggacgagg ccaagtccgg ttccgggccc 60 gcctcttcgt cccccactcc gcacggctat gtcgaaggcg ccaccgaggc ggccgagcag 120 cagtccagac ttctgctcgg cgaccccggg agcggtgaga cccgcgtgct ggacctgatc 180 accggcaagg tgtacgacat cgcccgcagc cccggtgcca ccgcactcac cacggacggc 240 cgcttcggct acttccacgg cccggacggc atacgggtgc tcgacagcgg tgcgtggatg 300 gtggaccacg gcgaccacgt ccactattac cgcgcgaaga tcaaggaggt cggcgaactc 360 ccgggcggca ccggtacgag catccgcggc gacgcgggcg tgaccgtggc ctcgtcggcg 420 gacgggaagg cgagcgtgta tcgcagggcg gacctggaga aaggcgccct gggcacgccg 480 tccccgctgc ccggcacgtt cgccggcgcc gtcgtgccgt acgcggaaca cctggtgaca 540 ctcaccgctg agagcggggc tccggcgaag gtcgccgtgc tggaccgttc cggcaagcgc 600 gtcgccgctc cggaggcgga gtgcgaggag cctcagggcg acgcggtcac ccggcgcggg 660 gttgtcctcg gctgcgccga cggcgctctg ctcgtccatg aggacgacgg cgccttcacg 720 gcggagaaga ttccgtacgg cgaggacgtg ccgaagaccg agcgggccgt ggagttccgg 780 caccgcccgg gcagcagcac cctcacggca cccgccggca aggacgctgt ctgggtcctg 840 gatgccggcg agggcgcctg gacccgggtg aagaccggcc ccgtggtcgc cgccaacacg 900 gccggcgaag gctcgccgct ggtcgtcctg gagaccgacg gggccctgca cggctacgac 960 atacccaccg gcaaggagac cggcgtgacc gatcccctgc tcaaggaact gcccggaacc 1020 ggtgcgggcg gcggcgcggc tccggtgatc gaggtggacc gcagccgggc ctacctcaac 1080 gaccccgagg gcaagcgcgt gtacgagatc gactacaacg acgatctccg cgtggcccgt 1140 acgttcgacg tcgacgtacg gccgtccctg atggtggaga cgggccgatg a 1191 <210> 67 <211> 320 <212> PRT <213> Streptomyces roseosporus <400> 67 Met Ser Ala Arg Val Gly Ala Pro Arg Met Arg Ala Leu Leu Val Ser 1 5 10 15 Leu Ala Gly Phe Phe Val Val Ala Gly Ala Ala Thr Gly Cys Ala Gly 20 25 30 Gly Gly Asp Glu Arg Pro Arg Val Val Val Thr Thr Asn Ile Leu Gly 35 40 45 Asp Ile Thr Arg Glu Ile Val Gly Asp Glu Ala Gly Val Ser Val Leu 50 55 60 Met Lys Pro Asn Ala Asp Pro His Ser Phe Gly Leu Ser Ala Val Gln 65 70 75 80 Ala Ala Glu Leu Glu Asn Ala Asp Leu Val Val Tyr Asn Gly Leu Gly 85 90 95 Leu Glu Glu Asn Val Leu Arg His Val Glu Ala Ala Arg Glu Ser Gly 100 105 110 Val Ala Ala Phe Ala Ala Gly Glu Ala Ala Asp Pro Leu Thr Phe His 115 120 125 Ala Gly Gln Asp Gly Gly Pro Glu Glu Asp Ala Gly Lys Pro Asp Pro 130 135 140 His Phe Trp Thr Asp Pro Asp Arg Val Arg Glu Ala Ala Gly Leu Ile 145 150 155 160 Ala Asp Gln Val Ala Glu His Val Glu Gly Val Asp Glu Lys Lys Val 165 170 175 Arg Glu Asn Ala Glu Arg Tyr Asp Gly Gln Leu Ala Asp Leu Thr Gly 180 185 190 Trp Met Glu Lys Ser Phe Ala Ala Ile Pro Glu Asp Arg Arg Ala Leu 195 200 205 Val Thr Asn His His Val Phe Gly Tyr Leu Ala Asp Arg Phe Gly Leu 210 215 220 Arg Val Ile Gly Ala Val Ile Pro Ser Gly Thr Thr Leu Ala Ser Pro 225 230 235 240 Ser Ser Ser Asp Leu Arg Ser Leu Thr Gln Ala Met Glu Lys Ala Lys 245 250 255 Val Arg Thr Val Phe Ala Asp Ser Ser Gln Pro Thr Arg Leu Ala Glu 260 265 270 Val Leu Arg Gln Glu Met Gly Gly Asp Val Asp Val Val Ser Leu Tyr 275 280 285 Ser Glu Ser Leu Thr Glu Lys Gly Lys Gly Ala Gly Thr Tyr Leu Glu 290 295 300 Met Met Arg Ala Asn Thr Ser Ala Met Ala Glu Gly Leu Thr Gly Asp 305 310 315 320 <210> 68 <211> 963 <212> DNA <213> Streptomyces roseosporus <400> 68 atgagcgcgc gcgtgggcgc tccacggatg cgtgccctgc tggtgtccct ggccggattc 60 ttcgtcgtcg ccggtgcggc gaccggctgc gcgggcggcg gagacgaacg gccccgggtc 120 gtggtgacca ccaacatcct cggcgacatc acccgggaga tcgtcgggga cgaggccggc 180 gtcagtgtcc tgatgaagcc caacgccgac ccgcactcct tcggcctctc ggccgtgcag 240 gccgctgagt tggagaacgc cgacctggtc gtctacaacg ggctcggcct ggaggagaac 300 gtgttgcggc acgtggaggc tgcccgcgag tccggagtgg ccgccttcgc cgcgggtgag 360 gcggccgacc cgctcacctt ccatgccgga caggacggcg gccccgaaga ggacgccggc 420 aagcccgatc cgcacttctg gaccgacccc gaccgcgtac gcgaggccgc cggcctgatc 480 gccgaccagg tcgccgagca tgtggagggc gtcgacgaga agaaggtccg ggagaacgcc 540 gagcggtacg acggacaact cgccgacctc acgggatgga tggagaagtc cttcgccgcc 600 atccccgagg accggcgtgc cctggtgacc aaccaccacg tcttcggcta cctcgccgac 660 cgcttcggcc tccgcgtcat cggcgcggtc atccccagcg gaaccacgct cgcctcgccc 720 agctcctccg acctgcgctc tctcacccag gccatggaga aggccaaggt gcgcaccgtc 780 ttcgccgact cctcccagcc cacccggctc gccgaggtcc tgcgccagga gatgggcggc 840 gacgtggacg tcgtctcgct ctactccgag tcgctgaccg agaagggcaa gggcgccgga 900 acctacctgg agatgatgcg cgccaacacc tccgccatgg ccgagggcct caccggcgac 960 tga 963 <210> 69 <211> 401 <212> PRT <213> Streptomyces roseosporus <400> 69 Met Asn Lys Pro Thr Arg Ala Arg Val Phe Thr Gly Thr Ala Leu Val 1 5 10 15 Val Ala Ala Ser Met Ala Leu Thr Ala Cys Gly Gly Asn Gly Asn Asp 20 25 30 Asp Ala Pro Ser Gly Lys Glu Pro Lys Glu Gln Lys Ser Ser Glu Ala 35 40 45 Ala Ala Val Gly Asn Pro Ile Val Ala Ser Tyr Asp Gly Gly Leu Tyr 50 55 60 Val Leu Asp Gly Glu Thr Leu Lys Leu Ala Lys Thr Ile Ala Leu Pro 65 70 75 80 Gly Phe Asn Arg Val Asn Pro Ala Gly Asp Asn Glu His Val Val Val 85 90 95 Ser Thr Asp Ser Gly Phe Arg Val Phe Asp Ala Thr Arg Gln Glu Phe 100 105 110 Thr Asp Ala Glu Phe Lys Gly Ser Lys Pro Gly His Val Val Arg His 115 120 125 Gly Gly Lys Thr Val Leu Phe Thr Asp Gly Thr Gly Glu Val Asn Val 130 135 140 Phe Asp Pro Ala Asp Leu Ser Asp Gly Lys Lys Pro Asp Gly Arg Thr 145 150 155 160 Tyr Thr Ser Ala Lys Pro His His Gly Val Ala Ile Glu Leu Ala Gly 165 170 175 Gly Glu Leu Val Thr Thr Leu Gly Thr Glu Glu Lys Arg Thr Gly Ala 180 185 190 Leu Val Leu Asp Lys Asp Asn Lys Glu Ile Ala Arg Ala Glu Asn Cys 195 200 205 Pro Gly Val His Gly Glu Ala Ala Ala Gln Gly Glu Val Ala Gly Phe 210 215 220 Gly Cys Glu Asp Gly Val Leu Leu Tyr Lys Asp Gly Lys Phe Thr Lys 225 230 235 240 Val Asp Ala Pro Gly Asp Tyr Ala Arg Thr Gly Asn Gln Ala Gly Ser 245 250 255 Asp Ala Ser Pro Ile Leu Leu Gly Asp Tyr Lys Thr Asp Pro Asp Ala 260 265 270 Glu Leu Glu Arg Pro Thr Arg Ile Ser Leu Ile Asp Thr Arg Thr Ala 275 280 285 Lys Met Lys Leu Val Asp Leu Gly Thr Ser Tyr Ser Phe Arg Ser Leu 290 295 300 Ala Arg Gly Pro His Gly Glu Ala Leu Val Leu Gly Thr Asn Gly Thr 305 310 315 320 Leu His Val Ile Asp Pro Glu Thr Gly Lys Val Glu Lys Lys Ile Asp 325 330 335 Ala Val Gly Asp Trp Thr Glu Pro Leu Asp Trp Gln Gln Pro Arg Pro 340 345 350 Thr Leu Phe Val Arg Asp His Thr Ala Tyr Val Ser Glu Pro Gly Lys 355 360 365 Arg Gln Leu His Ser Ile Asp Leu Glu Ser Gly Lys Lys Leu Ala Ser 370 375 380 Val Thr Leu Pro Lys Gly Thr Asn Glu Leu Ser Gly Thr Val Ala Gly 385 390 395 400 His <210> 70 <211> 1206 <212> DNA <213> Streptomyces roseosporus <400> 70 atgaacaagc ccacccgcgc cagagtcttc acgggcacgg cgctggtcgt ggcggcgtcg 60 atggcgctga ccgcctgcgg cggcaacggc aacgacgacg ccccttccgg caaagagccc 120 aaggagcaga agagcagcga ggccgcggcg gtcgggaacc cgatcgtcgc ctcgtacgac 180 gggggactgt acgtcctcga cggcgagacc ctgaagctcg cgaagacgat cgcactgccc 240 ggcttcaacc gggtcaaccc ggcgggcgac aacgagcacg tcgtcgtctc cacggactcc 300 ggcttccgcg tgttcgacgc cacccgacag gagttcaccg acgccgagtt caagggttcc 360 aagccggggc acgtcgtccg gcacggcggc aagacggtcc tgttcaccga cggcacggga 420 gaggtgaacg tcttcgaccc cgccgacctg tccgacggga agaagccgga cggccgcacc 480 tacacgtccg cgaagcccca ccacggtgtc gccatcgaac tggccggcgg agaactcgtc 540 accaccctcg gcaccgagga gaagcgcacc ggagccctcg tcctggacaa ggacaacaag 600 gagatcgcac gcgccgagaa ctgccccgga gtgcacggcg aggccgccgc ccagggcgag 660 gtggccggct tcggctgcga ggacggcgtc ctgctctaca aggacggcaa gttcaccaag 720 gtcgacgccc ccggcgacta cgcccgcacc ggcaaccagg ccggcagcga cgcctccccg 780 atcctcctcg gcgactacaa gaccgacccc gacgccgaac tggaacgccc cacccgcata 840 tccctgatcg acacccgtac ggcgaagatg aagctggtcg acctcggcac cagctactcc 900 ttccgctccc tcgcccgcgg cccgcacggc gaagccctcg tgctcggcac caacggcacc 960 ctccacgtca tcgacccgga gaccggaaag gtcgagaaga agatcgacgc ggtcggcgac 1020 tggaccgagc ccctggactg gcagcagccc aggcccaccc tgttcgtccg ggaccacacg 1080 gcgtacgtct ccgaaccggg caagcgccaa ctccactcca tcgacctgga atcggggaag 1140 aagctggcat ccgtcaccct gccgaagggc accaacgaac tgtccggcac ggtcgccggt 1200 cactga 1206 <210> 71 <211> 206 <212> PRT <213> Streptomyces roseosporus <400> 71 Val Ser Trp Met Asn Asp Val Leu Thr Ala Val Ser Asp Met Asn Pro 1 5 10 15 Val Thr Arg Phe Ala Leu Ala Ser Val Phe Ala Phe Ala Glu Ser Gly 20 25 30 Leu Gly Ala Gly Met Ala Val Pro Gly Glu Val Ala Val Leu Ala Leu 35 40 45 Ser Ala Gly Thr Glu Gly Thr Arg Pro Leu Leu Ala Leu Phe Leu Val 50 55 60 Val Thr Leu Ser Ser Ser Ala Gly Asp His Ile Gly Tyr Phe Leu Gly 65 70 75 80 Ile Arg Tyr Gly Gln Arg Met Arg Glu Thr Arg Leu Val Arg Arg Ile 85 90 95 Gly Gln His His Trp Asp Arg Ala Gln Glu Leu Cys His Arg Tyr Gly 100 105 110 Ala Arg Ala Val Phe Leu Thr Arg Leu Leu Pro Val Val Arg Thr Leu 115 120 125 Thr Pro Ala Thr Ala Gly Val Gly Ser Val Arg Tyr Leu Arg Phe Leu 130 135 140 Pro Ala Ser Leu Ala Gly Ala Ala Met Trp Ser Ala Leu Tyr Val Ser 145 150 155 160 Ala Gly Thr Leu Val Ser Thr Ser Leu Arg Glu Ala Glu Ser Val Leu 165 170 175 Ser Thr Ile Leu Trp Ala Leu Leu Gly Val Ala Ala Ala Phe Thr Leu 180 185 190 Ala Ile Val Trp Trp Arg Arg Arg His Arg Arg Arg Ser Ser 195 200 205 <210> 72 <211> 612 <212> DNA <213> Streptomyces roseosporus <400> 72 tcacgagctg cggcggcggt gcctgcgccg ccaccacacg atcgcgagcg tgaaggcggc 60 cgcaacgccc agcagggccc acaggatggt ggagagcacg ctctcggcct cgcgcaggga 120 ggtcgagacc agtgttcccg cggacacgta gagcgcggac cacatcgcgg ctccggcgag 180 ggaggcgggc aggaagcgga ggtagcgcac ggagccgacg ccggcggtcg cgggggtgag 240 ggtgcgtacc acgggcaaaa ggcgggtcag gaagacggcg cgcgccccgt accggtggca 300 gagctcttgc gcgcggtccc agtggtgctg cccaatccgc cgtaccaggc gcgtctcccg 360 catccgctgc ccgtagcgga tgccgaggaa gtagccgatg tggtcgccgg ccgagctgct 420 gagtgtgacg acgaggaaga gggccaacag cgggcgtgtc ccctccgttc cggcgctcag 480 ggccagtacc gcgacctcgc cggggacggc catgccggcc ccaaggccgg attccgcgaa 540 cgcgaatacg gaggccagcg cgaatctggt gaccgggttc atgtccgaca ccgctgtcag 600 tacatcgttc at 612 <210> 73 <211> 60 <212> PRT <213> Streptomyces roseosporus <400> 73 Met Glu Leu Cys Ala Leu His Ser Arg Asp Arg Asp Ala Thr Val Lys 1 5 10 15 Thr Cys Ala Ala Gly Arg Pro Lys Arg Lys Pro Ser Tyr Gly Phe Leu 20 25 30 Gly Arg Pro Thr Ala Ala Glu Glu Leu Ala Ala Val Thr Ser Cys Gly 35 40 45 Gly Gly Ala Cys Ala Ala Thr Thr Arg Ser Arg Ala 50 55 60 <210> 74 <211> 183 <212> DNA <213> Streptomyces roseosporus <400> 74 atggaactgt gcgcgctcca ctccagggac cgtgacgcca ccgtcaagac ctgtgccgcc 60 ggccgcccga aacgcaagcc gtcgtacggc ttcctgggcc gtcccacagc cgccgaggag 120 ctcgccgcgg tcacgagctg cggcggcggt gcctgcgccg ccaccacacg atcgcgagcg 180 tga 183 <210> 75 <211> 319 <212> PRT <213> Streptomyces roseosporus <400> 75 Met Gly Gly Ser Ala Ile Arg Thr Arg Gln Leu Thr Lys His Phe Gly 1 5 10 15 Ala Val Gln Ala Leu Val Gly Val Asp Leu Glu Val Pro Ala Gly Ser 20 25 30 Val Leu Gly Leu Leu Gly His Asn Gly Ala Gly Lys Thr Thr Leu Ile 35 40 45 Gln Ile Leu Ser Thr Val Leu Pro Pro Ser Gly Gly Ser Ala Glu Val 50 55 60 Ala Gly Phe Asp Ile Val Arg Asp Ala Arg Arg Val Arg Ala Cys Ile 65 70 75 80 Gly Val Thr Gly Gln Phe Ala Ala Leu Asp Glu His Leu Ser Gly Leu 85 90 95 Ala Asn Leu Val Leu Ile Ser Arg Leu Leu Gly Ala Arg Pro Arg Glu 100 105 110 Ala Arg Arg Arg Ala Ala Glu Leu Val Glu Gln Phe Gly Leu Thr Glu 115 120 125 Ala Ala Asp Arg Pro Met Arg Thr Tyr Ser Gly Gly Met Arg Arg Arg 130 135 140 Ile Asp Leu Ala Ala Ser Leu Val Ala Arg Pro Ser Val Leu Phe Leu 145 150 155 160 Asp Glu Pro Thr Thr Gly Leu Asp Pro Val Ser Arg Thr Ala Leu Trp 165 170 175 Glu Thr Val Glu Gly Leu Val Ala Glu Gly Thr Thr Val Leu Leu Thr 180 185 190 Thr Gln Tyr Leu Asp Glu Ala Asp Arg Leu Ala Asp Arg Ile Ala Val 195 200 205 Leu Ser Ser Gly His Val Val Thr Val Gly Thr Ala Ala Glu Leu Lys 210 215 220 Ala Ala Gly Thr Arg Ser Val Arg Leu Thr Phe Gly Ser Ala Ala Asp 225 230 235 240 Leu Glu Ser Ala Glu Gly Ala Leu Arg Leu Glu Gly Leu Gly Leu Thr 245 250 255 Thr Asp Pro Val Ser Arg Thr Val Ser Leu Pro Leu Ala Ala Thr Ala 260 265 270 Glu Leu Ala Gly Ile Phe Arg Ile Leu Gly Ala Ala Gly Val Glu Leu 275 280 285 Ala Glu Leu Ala Leu Lys Glu Pro Thr Leu Asp Asp Val Tyr Leu Ser 290 295 300 Leu Ala Glu Ser Trp Glu Thr Thr Ser Gly Gly Thr Val Arg Cys 305 310 315 <210> 76 <211> 960 <212> DNA <213> Streptomyces roseosporus <400> 76 atgggcggga gcgcgatcag gacccggcag ctgaccaagc acttcggtgc ggtgcaggcg 60 ctggtcggcg tggatctgga ggtgcccgcg gggagcgtgc tggggctcct gggacacaac 120 ggtgccggga agaccacgct gatccagatc ctctcgacgg tgctcccccc gtccggtggg 180 tccgccgagg tcgccggctt cgacatcgtg cgcgatgccc gacgggtacg cgcctgtatc 240 ggggtgacgg ggcagttcgc tgccctggac gagcatctgt ccgggctcgc caatctggtg 300 ctgatctccc ggctgctggg tgcccggccg agggaggcca gacgccgggc ggccgaactg 360 gtcgaacaat tcggtctcac cgaggcagcg gacagaccga tgcggaccta ctccggcgga 420 atgcggcggc gcatcgacct ggcggcgagt ctggtggcca ggccctcggt gctgttcctc 480 gacgagccca ccaccgggct ggacccggtg agccgcaccg cactctggga gacggtggaa 540 gggctggtcg ccgagggcac gacggttctg ctgaccaccc agtacctcga cgaggccgac 600 cggctggcgg accggatagc ggtgctgtcg tccggccacg tggtgacggt cggcacggcg 660 gcggagctca aggcggcggg cacccggtcc gtccgcctga ccttcgggtc cgcggcggat 720 ctggagagcg cggaaggagc gctgcgcctg gagggcctcg gcctcacaac ggatccggtg 780 tcccggacgg tgtcactgcc gctggcggca acggccgagc tggccgggat cttccggatt 840 ctcggcgcgg cgggcgtgga gctcgccgaa ctggcgctca aggagcccac gctggacgac 900 gtgtatctga gcctggcgga gagctgggag accacgagcg ggggaacggt ccggtgctga 960 <210> 77 <211> 288 <212> PRT <213> Streptomyces roseosporus <400> 77 Leu Thr Thr Arg Arg Thr Gly Pro Gly Thr Ser Pro Val Ala Asp Gly 1 5 10 15 Pro Gly Trp Arg Gly Gly Gly Ala Gly Ile Gly Thr Gln Phe Arg Val 20 25 30 Leu Thr Gly Arg Gln Phe Arg Ile Ile Tyr Gly Asp Arg Arg Ile Ala 35 40 45 Leu Phe Ser Leu Leu Gln Pro Ile Ile Met Leu Met Leu Phe Ser Gln 50 55 60 Val Leu Gly Arg Met Ala Asn Pro Glu Ile Phe Pro Pro Gly Val Arg 65 70 75 80 Tyr Leu Asp Tyr Leu Val Pro Ala Leu Leu Leu Thr Thr Gly Ile Gly 85 90 95 Ser Ala Gln Gly Gly Gly Leu Gly Leu Val Arg Asp Met Glu Ser Gly 100 105 110 Met Met Val Arg Leu Arg Val Met Pro Val Arg Leu Pro Leu Val Leu 115 120 125 Val Ala Arg Ser Leu Ala Asp Leu Ala Arg Val Ala Leu Gln Leu Val 130 135 140 Ala Leu Leu Ala Cys Ala Met Gly Pro Leu Gly Tyr Arg Pro Ala Gly 145 150 155 160 Gly Val Ser Gly Ile Val Gly Ala Thr Leu Leu Ala Leu Leu Val Ala 165 170 175 Trp Ser Leu Ile Trp Val Phe Leu Ala Leu Ala Ala Trp Leu Arg Ser 180 185 190 Ile Glu Val Leu Ser Ser Ile Gly Phe Leu Val Thr Phe Pro Leu Met 195 200 205 Phe Ala Ser Ser Ala Phe Val Pro Leu Asp Ile Leu Pro Gly Trp Leu 210 215 220 Arg Val Ile Ala Thr Val Asn Pro Leu Thr Tyr Ala Val Glu Ala Ser 225 230 235 240 Arg Asp Leu Ala Leu Asp His Ser Ala Leu Gly Ala Ala Leu Ala Ala 245 250 255 Val Gly Thr Ser Leu Ala Leu Leu Ala Val Thr Gly Leu Leu Ala Val 260 265 270 Arg Gly Leu Arg Arg Pro Pro Gly Ala Gly Gly Pro His Arg Thr Pro 275 280 285 <210> 78 <211> 870 <212> DNA <213> Streptomyces roseosporus <400> 78 gtgctgacca cacgacgtac gggtccgggg acctcgccgg tggcggacgg gcccgggtgg 60 cgcggcgggg gtgcggggat cggcacccag ttccgggtgc tgaccggccg gcagttccgg 120 atcatctacg gggaccggcg gatcgcgctg ttcagcctgc tccagccgat catcatgctc 180 atgctgttca gtcaggtgct gggccgcatg gccaatccgg agatcttccc gccgggtgtg 240 cgctacctcg actacctggt gccggctctg ctgctgacga ccgggatcgg ttccgcgcag 300 ggcggcgggc tgggtctcgt cagggacatg gagtccggga tgatggtccg gctgcgggtg 360 atgccggtac ggctgccgct ggtcctggtg gcccggtcgc tggccgatct ggcgcgggtc 420 gccctgcagc tcgtggcgtt gctcgcctgt gcgatggggc cgctgggcta ccggccggcc 480 gggggcgtgt cggggatcgt cggcgcgacg ctgctcgcgt tgctcgtcgc gtggtcgctg 540 atctgggtgt tcctggccct cgccgcgtgg ctgcggagca tcgaggtgct gtccagcatc 600 gggttcctcg tcaccttccc cctgatgttc gcgtcgagtg ccttcgtccc gctcgacatt 660 ctgccgggat ggctcagggt catcgcgacg gtcaatcccc tcacgtacgc ggtggaggcg 720 tcccgcgatc tggcgctgga ccacagcgcg ctgggcgcgg cgctcgcggc cgtcggcacc 780 agtcttgcgc tcttggcggt gaccggtctg ctggcggtac gcgggctgcg gcgcccgccg 840 ggtgcgggcg gcccgcaccg gacgccctga 870 <210> 79 <211> 75 <212> PRT <213> Streptomyces roseosporus <400> 79 Met Ala Asn Pro Phe Glu Asn Asn Asp Gly Ser Tyr Leu Val Leu Val 1 5 10 15 Asn Asp Glu Gly Gln Tyr Ser Leu Trp Pro Ala Phe Ala Asp Val Pro 20 25 30 Ala Gly Trp Thr Val Thr Phe Gly Glu Ser Ser Arg Gln Glu Cys Leu 35 40 45 Asp His Ile Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Ile 50 55 60 Arg Gln Met Glu Asn Asp Arg Thr Thr Ala Ala 65 70 75 <210> 80 <211> 228 <212> DNA <213> Streptomyces roseosporus <400> 80 atggccaacc ccttcgagaa caacgacggc agctacctcg tactggtcaa cgacgagggc 60 cagtactccc tttggcccgc gttcgccgat gtcccggcgg gctggaccgt caccttcggc 120 gagagcagtc ggcaggaatg cctcgaccac atcaacgaga actggaccga tatgcgcccc 180 aagagcctca tccggcagat ggagaacgac cggacgaccg cggcctga 228 <210> 81 <211> 328 <212> PRT <213> Streptomyces roseosporus <400> 81 Met Thr Val His Asp Tyr His Val Thr Val Lys Glu Gln His Pro Ala 1 5 10 15 Leu Phe Glu Leu Leu Asp Pro Ala Arg Leu Val Ala Val Thr Asp Glu 20 25 30 Pro Trp Val Thr Glu Gly Asn Glu Phe Asp Asp Asp His Ala Gly Arg 35 40 45 Gly Val Ser Tyr Arg Cys Ala Gln Gln His Gly Glu Ala Arg Arg Thr 50 55 60 Gly Ile Glu Thr Ile Leu Gly Met Phe Ala Gly Pro Gly Gly Leu Arg 65 70 75 80 Asp Met Gly Arg Val Leu Asp Val Leu Gly Gly Glu Gly Leu Leu Ser 85 90 95 Arg Val Trp Arg Gln Leu Ala Gly Ala Gly Asp Gly Asp Ser Val Pro 100 105 110 Leu Val Thr Gly Asp Leu Ser Gly His Met Val Ala Ala Ala Leu Arg 115 120 125 Ser Gly Leu Pro Ala Val Arg Gln Pro Ala Asp Arg Met Leu Gln Arg 130 135 140 Asp His Cys Leu Asp Gly Val Leu Phe Ala Tyr Gly Thr His His Val 145 150 155 160 Asp Arg Ser Val Arg Pro Arg Met Leu Thr Glu Ala Ser Arg Val Leu 165 170 175 Ala Pro Gly Gly Arg Val Val Leu His Asp Phe Ala Glu Gly Ser Pro 180 185 190 Glu Glu Arg Trp Phe Arg Glu Val Val His Pro Arg Ser Leu Ala Gly 195 200 205 His Ala Tyr Asp His Phe Thr Ala His Glu Met Thr Gly Tyr Leu Ala 210 215 220 Asp Ala Gly Phe Thr Asp Ile Thr Val Gly Pro Val Tyr Asp Pro Met 225 230 235 240 Thr Leu Thr Gly Glu Thr Asp Glu Ser Ala Leu Ala Arg Leu Val Ser 245 250 255 Tyr Met Thr Ser Met Phe Gly Ile Leu Pro Asp Gly Asp Arg Ser Asn 260 265 270 Glu Arg Thr Glu Ala Ala Leu Arg Asp Ile Phe Arg Phe Ser Ala Gly 275 280 285 Asp Leu Pro Glu Asp Val Pro Arg Asp Glu Ala Val Leu Glu Leu Thr 290 295 300 Val Arg Pro His Gly Asn Ala Phe Arg Ala Glu Leu Pro Arg Ile Ala 305 310 315 320 Leu Val Ala His Gly Arg Lys Pro 325 <210> 82 <211> 987 <212> DNA <213> Streptomyces roseosporus <400> 82 atgaccgtgc acgactacca cgtgaccgtc aaggaacagc acccggcgct cttcgagctc 60 ctggaccccg cacgcctcgt cgccgtcacg gacgagcctt gggtcacgga gggaaacgag 120 ttcgacgacg accacgccgg ccgcggcgtc tcctaccgct gtgcccagca gcacggcgaa 180 gcccgccgca ccggcattga gacgattctc ggcatgttcg ccggccccgg cgggctgcgc 240 gacatgggcc gtgtcctcga tgtactcgga ggcgaaggcc tgctcagccg cgtgtggcgg 300 caactggccg gcgccggcga cggggactcc gtgccactgg tcaccggaga cctcagcggc 360 cacatggtgg ccgcagccct ccggtccggc ctgcccgccg tacgccagcc ggccgaccgc 420 atgctgcagc gagaccactg cctggacggc gtgctcttcg cgtacggcac tcaccacgtc 480 gaccgctctg tacgcccccg catgctgaca gaggcctccc gggtcctggc ccctggaggc 540 cgcgtcgtcc tccacgactt cgcggaggga tcccccgaag aacgctggtt ccgcgaagtc 600 gtccaccccc gctccctcgc gggccacgcg tacgaccact tcaccgccca cgagatgacc 660 ggctacctcg ccgacgcggg cttcaccgac atcaccgtcg gccccgtgta cgacccgatg 720 accctgaccg gggagaccga cgagagcgca ctggctcggc tcgtctccta catgacctcg 780 atgtacggca tcctgcccga cggcgaccgg agcaacgagc ggacggaagc cgccctccgc 840 gacatcttcc gtttctcggc cggcgacctc cccgaggacg tcccccgcga cgaggcggtc 900 ctggaactta ccgtccgtcc gcacggcaat gccttccggg ccgagctccc ccggatagcc 960 ctcgtcgccc acggacgcaa accatga 987 <210> 83 <211> 244 <212> PRT <213> Streptomyces roseosporus <220> <221> MOD_RES <222> (141) <223> Variable amino acid <400> 83 Met Thr Ala Gln Asp Thr Arg Thr Thr Gly Ser Asp Gly Gly Gly Arg 1 5 10 15 Gly Ala Thr Tyr His Glu Ser Pro Thr Tyr Gly Glu Leu Leu Arg Leu 20 25 30 Glu Asp Leu Leu Asn Val Ala His Leu Arg Asp Ala Ala Ala Pro Val 35 40 45 Leu Phe Leu Ala Thr His Gln Ser Ala Glu Ile Trp Phe Gly Ile Val 50 55 60 Leu Arg His Leu Glu Glu Ile Arg Ala Ala Leu Thr Asp Asp Asp Pro 65 70 75 80 Asp Thr Ala Leu His Leu Leu Pro Arg Leu Pro Glu Ile Phe Glu Leu 85 90 95 Leu Val Arg His Phe Asp Met Leu Ala Thr Leu Ser Thr Glu Glu Phe 100 105 110 Gly Lys Ile Arg Ala Gly Leu Gly Thr Ala Ser Gly Phe Gln Ser Ala 115 120 125 Gln Tyr Arg Glu Ile Glu Phe Leu Cys Gly Leu Arg Xaa His Arg His 130 135 140 Ile Ser Thr Pro Gly Phe Thr Glu Thr Glu Arg Arg Asp Cys Gly Asn 145 150 155 160 Gly Pro Ala Ser Pro Pro Trp Arg Arg Leu Arg Arg Leu Pro Asp Pro 165 170 175 Met Arg Gln Arg Glu Gly Arg Glu Arg Ile Gly Glu Ala Leu Leu Arg 180 185 190 Phe Asp Glu Arg Val Thr Val Trp Arg Ala Arg His Ala Ala Leu Ala 195 200 205 Glu Arg Phe Leu Gly Pro Leu Glu Gly Thr Ala Gly Thr Ala Gly Ala 210 215 220 Asp Tyr Leu Trp Arg Val Thr Arg His Arg Leu Phe Pro Pro Glu Ala 225 230 235 240 Trp Gly Ala Gly <210> 84 <211> 738 <212> DNA <213> Streptomyces roseosporus <400> 84 atgacagcgc aggacacccg gacgaccggg agtgacggtg gcggccgggg cgccacgtac 60 cacgagagcc cgacctacgg ggagctgctg cgcctggagg acctgctgaa cgtcgcgcac 120 ctgcgcgacg cggccgcccc ggtcctcttc cttgccacgc accagtcggc ggagatctgg 180 ttcggcatcg tgctgcgcca cctggaggaa atccgcgcgg ccctcacgga cgacgacccg 240 gacacggcac tgcatctgct gccgcgactg ccggagatct tcgaactgct cgtccgccac 300 ttcgacatgc tggccacgct gagtacggag gaattcggca agatccgcgc ggggctgggc 360 acggcgagcg gcttccagtc ggcgcagtac cgggagatcg agttcctgtg cggtctgcgc 420 gaccaccgcc acatctccac accgggcttc acggaaaccg aacgtcggcg actgcgggaa 480 cgggcccgcc agccctccgt ggcggaggcc tacgacgcct tccggacccg atgcgccaac 540 gggaaggacg cggaacggat cggggaagcg ctcctgaggt tcgacgaacg ggtcaccgtc 600 tggcgcgccc gccacgcggc cctggcggaa cgcttcctgg gcccccttga agggacggcc 660 ggcaccgccg gagccgacta cttgtggcgg gtcacccggc acaggctctt ccccccggag 720 gcgtggggcg ccggctga 738 <210> 85 <211> 321 <212> PRT <213> Streptomyces roseosporus <400> 85 Met Asp Arg Glu Ala Glu Ala Pro Leu Arg Ala Ala Pro His Ala Thr 1 5 10 15 Pro Ala Glu Arg Ala Ala Leu Gly Lys Ala Ala Arg Arg Glu Ala Pro 20 25 30 Arg Ser Gly His Ala Glu Phe Ser Pro Ser Pro Arg Arg Pro Asp Pro 35 40 45 Leu Thr Val Leu Glu Ala Gln Ser Ala Asp Arg Val Pro Glu Leu Val 50 55 60 Pro Ile Arg Tyr Ala Arg Met Thr Glu Ser Pro Phe Arg Phe Tyr Arg 65 70 75 80 Gly Ala Ala Ala Leu Met Ala Ala Asp Leu Ala Gly Thr Pro Val Ser 85 90 95 Gly Ile Arg Ala Gln Leu Cys Gly Asp Ala His Leu Leu Asn Phe Arg 100 105 110 Leu Leu Ala Ser Pro Glu Arg Asn Leu Leu Phe Asp Ile Asn Asp Phe 115 120 125 Asp Glu Thr Leu Pro Gly Pro Trp Glu Trp Asp Val Lys Arg Leu Ala 130 135 140 Ala Ser Leu Val Ile Ala Gly Arg Ala Asn Ser Phe Thr Leu Arg Glu 145 150 155 160 Arg Ala Gly Val Val Arg Ala Thr Val Arg Ser Tyr Arg Glu Ala Met 165 170 175 Ala Arg Phe Ala Gly Met Arg Asn Leu Asp Val Trp Tyr Ala Arg Thr 180 185 190 Asp Ala Glu Arg Leu Arg Thr Val Ala Thr Glu Gln Leu Gly Gly Arg 195 200 205 Gly Arg Arg Asn Val Asp Arg Ala Leu Gly Lys Ala Arg Ser Arg Asp 210 215 220 Ser Leu Gln Ala Phe Gly Lys Leu Ala Glu Val Val Asp Gly Arg Leu 225 230 235 240 Arg Ile Ala Ala Asp Pro Pro Met Val Val Pro Leu Thr Asp Leu Thr 245 250 255 Pro Gly Val Asp Arg Asp Ala Val Phe Arg Gln Phe Gly Ser Met Leu 260 265 270 Ala Gly Tyr Ala Arg Ser Leu Pro Ser Asp Arg Arg Ser Leu Leu Glu 275 280 285 Asp Phe Ala Leu Val Asp Val Ala Arg Lys Val Val Gly Val Gly Ser 290 295 300 Val Gly Thr Arg Cys Trp Ile Val Leu Leu Leu Gly Arg Asp Gly Gly 305 310 315 320 Asp <210> 86 <211> 965 <212> DNA <213> Streptomyces roseosporus <400> 86 ggatccccgc cgtcccggcc gagcagcagg acgatccagc accgggtgcc gacactgccc 60 acaccgacga ccttccgggc cacgtccacc agcgcgaagt cctccagcag actgcgccga 120 tcggatggca ggctgcgtgc gtaccccgcc agcatggagc cgaactgccg gaacaccgcg 180 tcccggtcca cccccggcgt cagatcggtc agcgggacga ccatcggcgg atccgccgcg 240 atccgcagcc gcccgtcgac cacctcggcg agcttcccga acgcctgaag gctgtcccgg 300 gaccgggcct tccccaacgc ccggtcgaca ttcctgcgcc cccgcccgcc caactgttcc 360 gtggccaccg tgcgcagccg ctcggcatcc gtccgcgcgt accagacgtc cagattgcgc 420 atgcccgcga accgggccat cgcctcccgg tacgagcgga ccgtggcccg gacgaccccg 480 gcccgctccc ggagcgtgaa gctgttcgcc cgccccgcga tgacgaggct cgccgcgagc 540 cgcttgacgt cccactccca gggacccggc agcgtctcgt cgaagtcgtt gatgtcgaac 600 aggagattcc gctcggggga ggccagcagc cggaagttca gcagatgggc gtcaccgcac 660 aactgcgccc tgattcccga caccggggtg ccggccaggt cggcggccat cagcgcggcc 720 gctccccggt agaagcggaa cggggactcc gtcatccggg catagcggat cgggaccagc 780 tcgggaaccc ggtccgccga ctgggcttcg aggacggtca gcggatcggg gcggcgcggc 840 gacggggaga actccgcatg gcccgaccgg ggcgcctcac ggcgggccgc cttgcccagt 900 gccgcccgtt cggccggtgt cgcgtgcggt gcggcgcgca gcggcgcctc ggcttcccgg 960 tccat 965 <210> 87 <211> 319 <212> PRT <213> Streptomyces roseosporus <400> 87 Met Ile His Ile Arg Ala Val Ser Pro Pro Asp Leu Thr Asp Glu Val 1 5 10 15 Val Gly Leu Leu Ser Ala Asp Pro Cys Val Leu Asn Leu Ile Val Gln 20 25 30 Arg Asp Ala Ala Arg Arg Pro Asp Gly Asp Ala Ile Ala Cys Asp Val 35 40 45 Leu Thr Gly Ala Ala Asn Asp Val Leu His Arg Leu Arg Ala Ala His 50 55 60 Leu Asp Arg Arg Gly Ser Leu Val Ile Glu Pro Val Asp Met Ala Phe 65 70 75 80 Ser Gly Ala Ala Thr Glu Gly Gly Gln Arg Glu Leu Gly Pro Leu Ser 85 90 95 Arg Ala Pro Val Trp Glu Gln Val Glu Ala Arg Ile Arg Ser Gly Gly 100 105 110 Arg Tyr Pro Pro Ser Phe Tyr Leu Tyr Leu Val Ile Ala Gly Leu Ile 115 120 125 Gly Ser Val Gly Ile Val Thr Asn Ser Gln Ile Leu Ile Val Gly Ala 130 135 140 Met Val Val Gly Pro Glu Tyr Gly Ala Ile Val Ser Val Ala Leu Gly 145 150 155 160 Ile Asp Arg Arg His Arg Ser Met Val Arg Ser Gly Leu Ala Ala Leu 165 170 175 Gly Val Gly Leu Leu Leu Thr Ile Val Val Thr Phe Leu Phe Ala Leu 180 185 190 Leu Ile Arg Gly Phe Gly Leu Glu Ser Glu Ala Phe Asp Arg Gly Leu 195 200 205 Arg Pro Val Ser His Leu Ile Asn Thr Pro Asn Phe Phe Ser Val Ala 210 215 220 Val Ala Thr Leu Ala Gly Ile Val Gly Ile Val Ser Leu Thr Glu Ala 225 230 235 240 Arg Thr Ser Ala Leu Leu Gly Val Phe Ile Ser Val Thr Thr Ile Pro 245 250 255 Ala Ala Ala Asp Ile Ala Val Ser Thr Ala Tyr Thr Ser Trp Ser Asp 260 265 270 Val Arg Gly Ser Ala Ile Gln Leu Val Val Asn Ile Leu Val Leu Ile 275 280 285 Val Val Gly Ala Phe Ala Leu Lys Ala Gln Arg Ala Ile Trp Gln Arg 290 295 300 Val Arg Leu Arg Arg Asp Arg Glu Arg Arg Ile Ala Glu Gln Ala 305 310 315 <210> 88 <211> 960 <212> DNA <213> Streptomyces roseosporus <400> 88 tcaggcctgt tcggcgatcc ggcgctcacg gtcgcggcgg aggcggaccc gctgccagat 60 cgcccgctgg gccttgagcg cgaacgcgcc caccacgatc agcacgagga tgttgacgac 120 gagctgtatg gccgagcccc gtacgtcgga ccagctggtg tacgccgtgg agacggcgat 180 gtccgcggcg gccgggatcg tcgtcacgga gatgaacacc ccgagcagag cactggttct 240 ggcctcggtg agcgacacga tcccgacgat tccggccagg gtggcgacgg cgacggagaa 300 gaagttcggc gtgttgatga gatgggagac gggccgcagc ccccggtcga acgcctccga 360 ctccagcccg aaaccccgga tgaggagggc gaagaggaag gtgaccacga tggtcaggag 420 aaggccgacg cccagggcgg ccagcccgct gcgcaccatg gaccggtggc gccggtcgat 480 ccccagcgcc acgctgacga tggcgccgta ctccgggccg acgaccatcg ccccgacgat 540 caggatctgc gagttggtga cgatgccgac cgacccgatc agaccggcga tgaccaggta 600 gaggtagaag ctcggcggat accggccccc ggacctgatg cgggcctcga cctgttccca 660 gaccggcgcc cggctcagcg gccccagctc gcgctgcccg ccctcggtgg ccgcgccgga 720 gaaggccatg tcgacgggtt cgatgacgag ggagccccgc cggtcgaggt gggcggcgcg 780 cagccggtgc agtacgtcgt tggccgcccc cgtcagtacg tcgcaggcga tggcgtcgcc 840 gtcggggcgg cgcgcggcgt cgcgctggac gatcagattg agcacgcacg ggtcggccga 900 gagcaggccg acgacctcgt cggtcaggtc cggcgggctc accgcgcgga tgtggatcat 960 <210> 89 <211> 97 <212> PRT <213> Streptomyces roseosporus <400> 89 Val Thr Arg Pro Gly Trp Asp His Glu Gly Val Asp Thr Pro Asp Thr 1 5 10 15 Pro Asp Ala Phe Pro Glu Pro Leu Pro Gly Ala Asp Glu Ala Val Arg 20 25 30 Glu Glu Arg Ala Thr Asp Asp Gly Thr Pro Glu Gly Arg Arg Leu Val 35 40 45 Arg Cys Arg Leu Cys Gly Arg Pro Leu Thr Gly Ala Asp Ser Arg Arg 50 55 60 Ala Gly Leu Gly Pro Ser Cys Asp Ala Lys Leu His Pro Ala Pro Pro 65 70 75 80 Asp Ile Arg Thr Arg Arg His Glu Val Asp Gln Asp Pro Leu Pro Gly 85 90 95 Thr <210> 90 <211> 294 <212> DNA <213> Streptomyces roseosporus <400> 90 gtgacccgcc cgggctggga tcatgaaggg gtggacaccc ccgacacacc cgatgccttc 60 cccgaaccgc tgcccggggc cgacgaagcg gtccgggagg agagggccac cgacgacggg 120 acgccggagg gccgccgcct cgtccgctgc cgtctctgcg gccggcccct gaccggggcc 180 gactcgcggc gggccggcct cggcccgtcc tgcgacgcca agctgcaccc ggcgccgccg 240 gacatccgca cccgccgcca cgaggtcgac caggacccgc tgccgggcac ctga 294 <210> 91 <211> 290 <212> PRT <213> Streptomyces roseosporus <400> 91 Met Thr Asn Pro Ala Glu Arg Leu Val Asp Leu Leu Asp Leu Glu Arg 1 5 10 15 Ile Glu Val Asn Ile Phe Arg Gly Arg Ser Pro Glu Glu Ser Leu Gln 20 25 30 Arg Val Phe Gly Gly Gln Val Ala Gly Gln Ala Leu Val Ala Ala Gly 35 40 45 Arg Thr Thr Asp Gly Glu Arg Pro Val His Ser Leu His Ala Tyr Phe 50 55 60 Leu Arg Pro Gly Arg Pro Gly Val Pro Ile Val Tyr Gln Val Glu Arg 65 70 75 80 Val Arg Asp Gly Arg Ser Phe Thr Thr Arg Arg Val Thr Ala Val Gln 85 90 95 Glu Gly Arg Thr Ile Phe Asn Leu Thr Ala Ser Phe His Arg Pro Glu 100 105 110 Glu Ala Gly Phe Glu His Gln Leu Pro Pro Ala Arg Ile Val Pro Asp 115 120 125 Pro Glu Glu Leu Pro Thr Val Ala Glu Glu Val Arg Glu His Leu Gly 130 135 140 Ala Leu Pro Glu Ala Leu Glu Arg Met Ala Arg Arg Gln Pro Phe Asp 145 150 155 160 Ile Arg Tyr Val Asp Arg Leu Arg Trp Thr Lys Asp Glu Ile Gln Asp 165 170 175 Ala Asp Pro Arg Ser Ala Val Trp Met Arg Ala Val Gly Pro Leu Gly 180 185 190 Asp Asp Pro Leu Val His Thr Cys Ala Leu Thr Tyr Ala Ser Asp Met 195 200 205 Thr Leu Leu Asp Ala Val Arg Ile Pro Val Glu Pro Leu Trp Gly Pro 210 215 220 Arg Gly Tyr Asp Leu Ala Ser Leu Asp His Ala Met Trp Phe His Arg 225 230 235 240 Pro Phe Arg Ala Asp Glu Trp Phe Leu Tyr Asp Gln Glu Ser Pro Ile 245 250 255 Ala Thr Gly Gly Arg Gly Leu Ala Arg Gly Arg Ile Tyr Asp Arg Ser 260 265 270 Gly Gln Leu Leu Val Ser Val Val Gln Glu Gly Leu Phe Arg Arg Leu 275 280 285 Glu Gln 290 <210> 92 <211> 873 <212> DNA <213> Streptomyces roseosporus <400> 92 ctactgctcc agccgccgga acagcccctc ctgcaccacc gacaccagca gctgccccga 60 acggtcgtag atccgccccc gcgccaggcc ccgcccgccc gtggcgatcg gcgactcctg 120 gtcgtacagg aaccactcgt ccgcccggaa cggccggtgg aaccacatgg cgtggtccag 180 ggacgcaagg tcatatccgc gcgggcccca cagcggctcc accgggatac ggaccgcgtc 240 cagcagcgtc atgtcgctcg cgtacgtcag cgcgcacgtg tgcaccagcg ggtcgtcgcc 300 cagcgggccc accgcccgca tccacaccgc gctgcgcgga tcggcgtcct ggatctcgtc 360 cttcgtccag cgcagccggt cgacgtaacg gatgtcgaag ggctggcggc gggccatccg 420 ctccagcgcc tccggcagcg cgcccagatg ctcgcgcacc tcctcggcga ccgtcggcag 480 ctcctccggg tccgggacga tccgggcggg cggcagctgg tgttcgaagc ccgcctcctc 540 ggggcggtgg aaggacgccg tcaggttgaa gatcgtccgg ccctcctgga ccgccgtcac 600 ccgacgggtg gtgaaggacc ggccgtcccg cacccgctcc acctggtaga cgatcggcac 660 accgggacgc cccggccgca ggaaataggc gtgcagcgag tgcaccggcc gctccccgtc 720 ggtggtccgg cccgccgcca ccagcgcctg gcccgcgacc tgcccgccga agacccgttg 780 cagggactcc tccgggctgc gcccccggaa gatgttgacc tcgatccgct ccaggtcgag 840 caggtcgacc agacgctcgg ccggattcgt cat 873 <210> 93 <211> 857 <212> PRT <213> Streptomyces roseosporus <400> 93 Val Ile Phe Val Pro Ser Ala Gly Ser Leu Ile Arg Ala Glu Asp Arg 1 5 10 15 Gln Asp Gly Gly Val Thr Leu Ile Asp Gln Leu Pro Gln Thr Ala Asp 20 25 30 Pro Asp Ala Leu Phe Glu Ala Phe Ser Ser Trp Thr Glu Ser Gln Gly 35 40 45 Ile Thr Met Tyr Pro Ala Gln Glu Glu Ala Leu Ile Glu Val Val Ser 50 55 60 Gly Ala Asn Val Ile Leu Ser Thr Pro Thr Gly Ser Gly Lys Ser Leu 65 70 75 80 Val Ala Ala Gly Ala His Phe Thr Ala Leu Ala Gln Asp Lys Val Thr 85 90 95 Phe Tyr Thr Ala Pro Ile Lys Ala Leu Val Ser Glu Lys Phe Phe Asp 100 105 110 Leu Cys Lys Leu Phe Gly Thr Glu Asn Val Gly Met Leu Thr Gly Asp 115 120 125 Ala Ser Val Asn Ala Asp Ala Pro Val Ile Cys Cys Thr Ala Glu Val 130 135 140 Leu Ala Ser Ile Ala Leu Arg Asp Gly Lys Tyr Ala Asp Ile Gly Gln 145 150 155 160 Val Val Met Asp Glu Phe His Phe Tyr Ala Glu Pro Asp Arg Gly Trp 165 170 175 Ala Trp Gln Ile Pro Leu Leu Glu Leu Pro Gln Ala Gln Phe Val Leu 180 185 190 Met Ser Ala Thr Leu Gly Asp Val Ser Met Phe Glu Lys Asp Leu Thr 195 200 205 Arg Arg Thr Gly Arg Pro Thr Ser Val Val Arg Ser Ala Thr Arg Pro 210 215 220 Val Pro Leu Ser Tyr Glu Tyr Arg Phe Thr Pro Ile Thr Glu Thr Leu 225 230 235 240 Thr Glu Leu Leu Asp Thr Arg Gln Ser Pro Val Tyr Ile Val His Phe 245 250 255 Thr Gln Ala Ala Ala Val Glu Arg Ala Gln Ser Leu Met Ser Ile Asn 260 265 270 Met Cys Thr Lys Glu Glu Lys Glu Lys Ile Ala Asp Leu Ile Gly Ser 275 280 285 Phe Arg Phe Thr Thr Lys Phe Gly Gln Asn Leu Ser Arg Tyr Val Arg 290 295 300 His Gly Ile Gly Val His His Ala Gly Met Leu Pro Lys Tyr Arg Arg 305 310 315 320 Leu Val Glu Lys Leu Ala Gln Ala Gly Leu Leu Lys Val Ile Cys Gly 325 330 335 Thr Asp Thr Leu Gly Val Gly Val Asn Val Pro Ile Arg Thr Val Leu 340 345 350 Phe Thr Ala Leu Thr Lys Tyr Asp Gly Asn Arg Val Arg Thr Leu Arg 355 360 365 Ala Arg Glu Phe His Gln Ile Ala Gly Arg Ala Gly Arg Ala Gly Phe 370 375 380 Asp Thr Ala Gly Phe Val Val Ala Gln Ala Pro Glu His Val Ile Glu 385 390 395 400 Asn Glu Lys Ala Leu Lys Lys Ala Gly Asp Asp Pro Lys Lys Lys Arg 405 410 415 Lys Val Val Arg Lys Lys Ala Pro Glu Gly Phe Val Ala Trp Ser Glu 420 425 430 Ser Thr Phe Asp Lys Leu Ile Gln Ser Glu Pro Glu Pro Leu Thr Ser 435 440 445 Arg Phe Arg Val Thr His Thr Met Leu Leu Ala Val Ile Ala Arg Pro 450 455 460 Gly Asn Ala Phe Glu Ala Met Arg His Leu Leu Glu Asp Asn His Glu 465 470 475 480 Pro Arg Arg Ala Gln Leu Arg His Ile Arg Arg Ala Ile Ala Ile Tyr 485 490 495 Arg Ser Leu Leu Asp Gly Gly Val Val Glu Gln Leu Asp Thr Pro Asp 500 505 510 Ala Glu Gly Arg Ile Val Arg Leu Thr Val Asp Leu Gln Gln Asp Phe 515 520 525 Ala Leu Asn Gln Pro Leu Ser Thr Phe Ala Leu Ala Ala Phe Asp Leu 530 535 540 Leu Asp Ala Glu Ser Pro Ser Tyr Ala Leu Asp Met Val Ser Val Val 545 550 555 560 Glu Ser Thr Leu Asp Asp Pro Arg Gln Ile Leu Ala Ala Gln Gln Asn 565 570 575 Lys Ala Arg Gly Glu Ala Val Gly Gln Met Lys Ala Asp Gly Val Glu 580 585 590 Tyr Glu Glu Arg Met Glu Arg Leu Gln Glu Val Thr Tyr Pro Lys Pro 595 600 605 Leu Ser Glu Leu Leu Trp His Ala Tyr Asp Val Tyr Arg Thr Ser His 610 615 620 Pro Trp Val Asn Asp His Pro Val Ser Pro Lys Ser Val Ile Arg Asp 625 630 635 640 Met Tyr Glu Arg Ala Met Thr Phe Thr Glu Phe Thr Ser His Tyr Glu 645 650 655 Leu Ala Arg Thr Glu Gly Ile Val Leu Arg Tyr Leu Ala Ser Ala Tyr 660 665 670 Lys Ala Leu Glu His Thr Ile Pro Asp Asp Val Lys Ser Glu Asp Leu 675 680 685 Gln Asp Leu Ile Ser Trp Leu Gly Glu Met Val Arg Gln Val Asp Ser 690 695 700 Ser Leu Leu Asp Glu Trp Glu Gln Leu Ala Asn Pro Glu Val Glu Thr 705 710 715 720 Ala Glu Gln Ala Gln Glu Lys Ala Asp Glu Val Lys Pro Val Thr Ala 725 730 735 Asn Ala Arg Ala Phe Arg Val Leu Val Arg Asn Ala Met Phe Arg Arg 740 745 750 Val Glu Leu Ala Ala Leu Asp Arg Ala Gly Ala Leu Gly Glu Leu Asp 755 760 765 Gly Glu Ser Gly Trp Asp Glu Asp Ala Trp Gly Glu Ala Leu Asp Ala 770 775 780 Tyr Trp Asp Ala His Glu Glu Ile Gly Thr Gly Pro Asp Ala Arg Gly 785 790 795 800 Pro Lys Leu Leu Lys Ile Glu Glu Asp Pro Ala His Gly Leu Trp Arg 805 810 815 Val Trp Gln Ala Phe Ala Asp Pro Ala Gly Asp His Asp Trp Gly Ile 820 825 830 Lys Ala Glu Val Asp Leu Ala Ala Ser Asp Glu Glu Gly Arg Ala Val 835 840 845 Val Arg Val Thr Glu Val Gly Gln Leu 850 855 <210> 94 <211> 2574 <212> DNA <213> Streptomyces roseosporus <400> 94 tcacagctgg ccgacctcgg tgacccggac gaccgcccgg ccctcctcgt cggacgccgc 60 gaggtccacc tcggccttga tgccccagtc gtgatcgccc gccggatcgg cgaacgcctg 120 ccagacccgc cacagcccgt gcgccgggtc ctcctcgatc ttcagcagct tcgggccccg 180 cgcgtccgga ccggtcccga tctcctcgtg cgcgtcccag tacgcgtcca gcgcctcgcc 240 ccacgcgtcc tcgtcccacc cggactcgcc gtccagctcg cccagcgcgc cggcccggtc 300 cagcgcggcc agctccaccc ggcggaacat cgcgttgcgc accagcaccc ggaaggcgcg 360 cgcgttcgcc gtgaccggct tgacctcgtc cgccttctcc tgagcctgct ccgcggtctc 420 cacctcgggg ttggccagct gctcccactc gtccagcaga ctggagtcca cctgacgcac 480 catctcgccc agccaggaga tcaggtcctg gaggtcctcc gacttcacgt cgtccgggat 540 cgtgtgctcc agcgccttgt acgcgctcgc cagataccgc agcacgatgc cctcggtccg 600 ggccagctcg tagtgcgaag tgaactccgt gaacgtcatg gcccgctcgt acatgtcccg 660 gatcaccgac ttcggcgaca ccggatggtc gttcacccac gggtggctcg tgcggtacac 720 gtcgtacgcg tgccacagca gctcgctcag cggcttgggg tacgtgacct cctggagccg 780 ctccatccgc tcctcgtact cgaccccgtc cgccttcatc tgccccacgg cctcgccgcg 840 cgccttgttc tgctgggcgg ccaggatctg ccggggatcg tccagcgtcg actcgacgac 900 cgagaccatg tccagcgcat acgacggcga ttcggcgtcc agcaggtcga acgcggccag 960 cgcgaacgtg gacagcggct ggttcagcgc gaagtcctgc tggaggtcga ccgtcagccg 1020 cacgatccgg ccctcggcgt ccggggtgtc caactgctcc accaccccgc cgtccagcag 1080 cgagcggtag atggcgatgg cccgccggat gtgccgcagc tgcgcccggc gcggctcgtg 1140 gttgtcctcc agcagatgcc gcatcgcctc gaaggcgttg cccgggcggg cgatgaccgc 1200 gagcagcatc gtgtgggtga cccggaaacg ggaggtcagc ggctccggct cggactggat 1260 cagcttgtcg aacgtcgact ccgaccaggc gacgaagccc tccggggcct tcttgcggac 1320 caccttgcgc ttcttcttcg ggtcgtcgcc cgccttcttc agcgccttct cgttctcgat 1380 gacatgctcg ggggcctgtg ccacgacgaa cccggccgtg tcgaacccgg cccgcccggc 1440 ccggcccgcg atctggtgga actcccgcgc gcgcagcgtc cgcacccggt tcccgtcgta 1500 cttggtgagc gccgtgaaca gcaccgtacg gatggggacg ttgacgccga cgccgagcgt 1560 gtccgtcccg cagatcacct tcagcagccc cgcctgggcc agcttctcca ccaggcggcg 1620 gtacttcggc agcatccccg cgtggtgcac cccgatgccg tggcgtacgt aacgggagag 1680 gttctggccg aacttggtgg tgaagcggaa gctgccgatc agatcggcga tcttctcctt 1740 ctcctccttc gtgcacatgt tgatgctcat cagcgactgc gcccgctcca cggccgccgc 1800 ctgcgtgaag tgcacgatgt agaccggcga ctgccgggtg tccagcagct cggtgagcgt 1860 ctcggtgatc ggcgtgaagc ggtactcgta gctcagcggc accgggcggg tcgccgagcg 1920 caccaccgag gtcgggcggc cggtacggcg ggtcaggtcc ttctcgaaca tcgagacgtc 1980 gccgagcgtc gccgacatca gcacgaactg cgcctgcggc agctccagca gcggaatctg 2040 ccaggcccag ccccggtccg gctcggcgta gaagtggaac tcgtccatca cgacctggcc 2100 gatgtcggcg tacttgccgt cgcgcagcgc gatggaggcc agcacctcgg ccgtacagca 2160 gatcaccggg gcgtccgcgt tgaccgaggc gtcgccggtg agcatgccga cgttctcggt 2220 gccgaagagc ttgcacaggt cgaagaactt ctccgacacc agcgccttga tcggagccgt 2280 gtagaaggtg accttgtcct gggccagcgc cgtgaagtgc gcgcccgccg ccaccaggct 2340 cttgcccgag ccggtcgggg tggacaggat cacgttcgcc ccggagacca cctcgatcag 2400 cgcctcctcc tgagccgggt acatcgtgat gccctggctc tcggtccatg aggagaaggc 2460 ctcgaagagg gcgtccgggt cggcggtctg gggaagctgg tcgatgaggg tcacgccccc 2520 atcttgcctg tcttccgccc ggatgaggga accggcggac ggcacgaaga tcac 2574 <210> 95 <211> 263 <212> PRT <213> Streptomyces roseosporus <400> 95 Met Met Gly Pro Ala His Ser Leu Ser Gly Ala Ala Ala Trp Leu Gly 1 5 10 15 Val Gly Ala Ala Ala Ala Ala Ala Gly His Thr Met Pro Trp Pro Val 20 25 30 Leu Val Val Gly Ala Leu Ile Cys Ala Gly Ala Ala Leu Ala Pro Asp 35 40 45 Leu Asp His Lys Ser Ala Thr Ile Ser Arg Ala Phe Gly Pro Val Ser 50 55 60 Lys Ala Leu Cys Glu Ile Val Asp Lys Leu Ser Tyr Ala Val Tyr Lys 65 70 75 80 Ala Thr Lys Ser Ala Gly Asp Pro Arg Arg Thr Gly Gly His Arg Thr 85 90 95 Leu Thr His Thr Trp Leu Trp Ala Val Leu Ile Gly Gly Gly Cys Ser 100 105 110 Val Ala Ala Ile Thr Gly Gly Arg Trp Ala Val Leu Val Ile Leu Phe 115 120 125 Val His Leu Val Leu Ala Val Glu Gly Leu Leu Trp Arg Ala Ala Arg 130 135 140 Val Ser Ser Asp Val Leu Val Trp Leu Leu Gly Ala Thr Ser Ala Trp 145 150 155 160 Ile Leu Ala Gly Val Leu Asp Lys Pro Gly Tyr Gly Ala Asp Trp Leu 165 170 175 Phe Asp Ala Pro Gly Gln Glu Tyr Met Trp Leu Gly Leu Pro Ile Val 180 185 190 Leu Gly Ala Leu Val His Asp Ile Gly Asp Ala Leu Thr Val Ser Gly 195 200 205 Cys Pro Ile Leu Trp Pro Ile Pro Ile Gly Arg Lys Arg Trp Tyr Pro 210 215 220 Ile Gly Pro Pro Lys Ala Met Arg Phe Arg Ala Gly Ser Trp Val Glu 225 230 235 240 Met Lys Val Leu Met Pro Ala Phe Met Val Leu Gly Gly Val Gly Gly 245 250 255 Ala Ala Ala Leu Asn Tyr Ile 260 <210> 96 <211> 792 <212> DNA <213> Streptomyces roseosporus <400> 96 atgatgggac cggcacactc tctgtcaggg gcagcggcct ggctgggggt gggcgcggcg 60 gccgccgccg cgggccacac gatgccctgg cccgtcctcg tcgtcggggc gctgatctgc 120 gcgggagccg cactcgcccc cgacctcgac cacaagtccg cgaccatctc gcgcgccttc 180 ggcccggtct ccaaagccct ctgcgagatc gtcgacaagc tctcctacgc cgtctacaag 240 gccaccaaga gcgccgggga cccccgcagg accggcgggc accgcaccct cacccacacc 300 tggctgtggg ccgtcctcat cggcggcggc tgctccgtgg cggcgatcac cggcggccgc 360 tgggccgtcc tcgtgatcct cttcgtccac ctcgtgctcg ccgtcgaggg cctgctgtgg 420 cgggccgccc gcgtctccag cgacgttctg gtgtggctgc tcggcgcgac cagcgcgtgg 480 atcctggccg gcgtcctgga caagcccggc tacggggccg actggctctt cgacgccccc 540 ggccaggagt acatgtggct cggcctgccc atcgtgctcg gcgccctcgt ccacgacatc 600 ggcgacgccc tcacggtctc gggctgcccg atcctgtggc ccatcccgat cggccgcaag 660 cgctggtacc cgatcggccc gccgaaggcc atgcgcttcc gggccggcag ctgggtggag 720 atgaaggtgc tgatgcccgc cttcatggtc ctcgggggag tgggcggggc cgccgccctc 780 aactacatat ga 792 <210> 97 <211> 255 <212> PRT <213> Streptomyces roseosporus <220> <221> MOD_RES <222> (245) <223> Variable amino acid <400> 97 Met Leu Leu Ala Glu Leu Ala Gln Val Ser Leu Glu Val Ala Ala Thr 1 5 10 15 Ser Ala Arg Ser Lys Lys Val Ala Leu Leu Ala Gly Leu Phe Arg Asp 20 25 30 Ala Gly Pro Glu Asp Val Pro Val Val Ile Pro Tyr Leu Ala Gly Arg 35 40 45 Leu Pro Gln Gly Arg Ile Gly Val Gly Trp Arg Ser Leu Gly Asp Pro 50 55 60 Val Glu Pro Ala Ala Glu Pro Thr Leu Thr Val Thr Gly Val Asp Ala 65 70 75 80 Arg Leu Thr Ala Leu Ala Ala Val Ser Gly Pro Gly Ser Gln Ala Arg 85 90 95 Arg Lys Glu His Leu Arg Ala Leu Phe Ala Ala Ala Thr Glu Asp Glu 100 105 110 Gln Arg Phe Leu Arg Ala Leu Leu Thr Gly Glu Val Arg Gln Gly Ala 115 120 125 Leu Asp Ala Leu Ala Ala Asp Ala Leu Ala Arg Ala Ala Asp Ala Pro 130 135 140 Pro Ala Asp Val Arg Arg Ala Val Met Leu Ala Gly Ser Leu Gln Glu 145 150 155 160 Val Ala Gly Val Leu Leu Ala Asp Gly Pro Glu Ala Leu Ala Ala Phe 165 170 175 Arg Leu Thr Val Gly Arg Pro Val Gln Pro Met Leu Ala His Thr Ala 180 185 190 Ala Ser Val Gly Glu Ala Leu Asp Lys Leu Gly Ala Cys Ala Val Glu 195 200 205 Glu Lys Leu Asp Gly Ile Arg Val Gln Val His Arg Asp Gly Asp Arg 210 215 220 Ile Arg Ala Tyr Thr Arg Thr Leu Asp Asp Ile Thr Asp Arg Leu Pro 225 230 235 240 Glu Leu Thr Ala Xaa Val Ala Ala Leu Pro Ala Gly Arg Phe Ile 245 250 255 <210> 98 <211> 1553 <212> DNA <213> Streptomyces roseosporus <400> 98 atgctgctcg ccgagctcgc ccaggtgtcc ctggaggtcg ccgccacctc cgcccggtcc 60 aagaaggtgg cgctcctcgc cggactcttc cgggacgccg gacccgagga cgtccccgtc 120 gtcatcccgt acctcgccgg acggctgccc cagggccgga tcggcgtggg gtggcgctcc 180 ctcggcgacc cggtggagcc cgcggcggaa cccaccctca ccgtcaccgg cgtcgacgcc 240 cggctgaccg ccctcgccgc cgtctcgggc cccggctccc aggcccggcg caaggagcac 300 ctgcgcgccc tcttcgccgc cgccaccgag gacgaacagc gcttcctgcg ggccctgctc 360 accggcgagg tacgccaggg ggccctggac gccctcgccg ccgacgccct ggcccgcgcc 420 gccgacgccc cgcccgccga cgtccggcgc gccgtgatgc tcgccggatc gctccaggaa 480 gtcgccgggg tcctcctcgc ggacgggccc gaggcgctcg ccgccttccg gctcaccgtc 540 ggacggcccg tccagccgat gctggcgcac accgccgcct cggtcggcga ggccctcgac 600 aaactgggcg cgtgcgcggt cgaggagaag ctcgacggca ttcgggtgca ggtccaccgc 660 gacggcgacc ggatccgcgc ctacacccgg accctcgacg acatcaccga ccggctgccc 720 gagctcaccg ccgccgtcgc cgccctcccg gccggccgct tcatcctgga cggcgaggtg 780 atcgccctgg gggaggacgg caggccccgg cccttccagg agaccgcctc ccgggtgggc 840 tcgcggcggg acgtggcgga ggcggcggcg cacgtgcccg tcgccccggt cttcttcgac 900 gcgctcctcg tcgacgacga ggacctgctc gacctgccct tcaccgaccg ccacgccgcc 960 ctggcccggc tcctccccga gcacctgcgc gtccgccgca ccctcgttcc cgacgcggag 1020 gacccgaaag cccgcgcggc ggccgacgcg ttcctcaccg acaccctgga acgcggccac 1080 gagggagtcg tcgtcaagga cctcgccgcc gcctacagcg cgggccgccg gggcgcgtcc 1140 tggctgaagg tgaagcccgt gcacaccctg gacctggtgg tgctggccgt cgagtggggc 1200 agcggccggc gcaccggcaa gctctccaac ctgcacctgg gcgcccgccg ccccgacggt 1260 acgttcgcga tgctcggcaa gaccttcaag gggctcacgg acgccctgct cgactggcag 1320 acccagcgcc tgggcgagct ggccaccgac gacgacggcc acgtcgtcac cgtacgcccg 1380 gaactcgtcg tggagatcgc ctacgacgga ctccagcgct ccacccgcta ccccgccggg 1440 gtcaccctcc gcttcgcccg cgtcctgcgc taccgcgacg acaagaccgc ccaggaggcg 1500 gacaccgtgg agacggtcct gtcccggcgg cggtgagcgc gcccccgtcc tga 1553 <210> 99 <211> 475 <212> PRT <213> Streptomyces roseosporus <400> 99 Val Asn His Pro Val Asn Gly Ala Gly Glu Arg Arg Thr Thr Gln Ala 1 5 10 15 Arg Glu Gly Thr Gln Thr Val Ala Pro Pro Arg Ile Leu Val Val Gly 20 25 30 Ala Gly Phe Ala Gly Val Glu Cys Val Arg Arg Leu Glu Arg Arg Leu 35 40 45 Ala Pro Gly Glu Ala Gln Ile Thr Leu Val Thr Pro Phe Ser Tyr Gln 50 55 60 Leu Tyr Leu Pro Leu Leu Pro Gln Val Ala Ser Gly Val Leu Thr Pro 65 70 75 80 Gln Ser Val Ala Val Ser Leu Arg Arg Ser Arg Arg His Arg Thr Arg 85 90 95 Ile Val Pro Gly Gly Ala Ile Gly Val Asp Thr Gln Ala Lys Val Cys 100 105 110 Val Ile Arg Lys Ile Thr Asp Glu Ile Val Asn Glu Pro Tyr Asp Tyr 115 120 125 Leu Val Leu Ala Ala Gly Ser Val Thr Arg Thr Phe Asp Ile Pro Gly 130 135 140 Leu Leu Asp Asn Ala Arg Gly Met Lys Thr Leu Ala Glu Ala Ala Tyr 145 150 155 160 Val Arg Asp His Val Ile Ala Gln Leu Asp Leu Ala Asp Ala Ser His 165 170 175 Asp Glu Ala Glu Arg Ala Ser Arg Leu Gln Phe Val Val Val Gly Gly 180 185 190 Gly Tyr Ala Gly Thr Glu Thr Ala Ala Cys Leu Gln Arg Leu Thr Thr 195 200 205 Asn Ala Val Lys His Tyr Pro Arg Leu Asp Pro Arg Leu Ile Lys Trp 210 215 220 His Leu Ile Asp Ile Ala Pro Lys Leu Met Pro Glu Leu Gly Asp Lys 225 230 235 240 Leu Gly Gln Ala Ala Leu Glu Val Leu Arg Lys Arg Asn Ile Glu Val 245 250 255 Ser Leu Gly Val Ser Ile Ala Glu Ala Gly Pro Glu Glu Val Thr Phe 260 265 270 Thr Asp Gly Arg Val Leu Pro Cys Arg Thr Leu Ile Trp Thr Ala Gly 275 280 285 Val Ala Ala Ser Pro Leu Val Ala Thr Leu Gly Ala Glu Thr Val Arg 290 295 300 Gly Arg Leu Ala Val Thr Pro Gln Met Arg Leu Pro Gly Ala Asp Gly 305 310 315 320 Val Phe Ser Leu Gly Asp Ala Ala Ala Val Pro Asp Leu Ala Lys Gly 325 330 335 Asp Gly Ala Val Cys Pro Pro Thr Ala Gln His Ala Met Arg Gln Gly 340 345 350 Arg Val Leu Ala Asp Asn Leu Ile Ala Ser Leu Arg His Glu Pro Leu 355 360 365 Lys Asp Tyr Val His Lys Asp Leu Gly Leu Val Val Asp Leu Gly Gly 370 375 380 Thr Asp Ala Val Ser Lys Pro Leu Gly Ile Glu Leu Arg Gly Leu Pro 385 390 395 400 Ala Gln Ala Val Ala Arg Gly Tyr His Trp Ser Ala Leu Arg Thr Asn 405 410 415 Val Ala Lys Thr Arg Val Met Thr Asn Trp Leu Leu Asn Ala Val Ala 420 425 430 Gly Asp Asp Phe Val Arg Thr Gly Phe Gln Ser Arg Lys Pro Ala Thr 435 440 445 Leu Arg Asp Phe Glu Tyr Thr Asp Val Tyr Leu Thr Pro Glu Gln Ile 450 455 460 Lys Glu His Thr Ala Ala Thr Val Ile Lys His 465 470 475 <210> 100 <211> 1428 <212> DNA <213> Streptomyces roseosporus <400> 100 cagtgcttga tgaccgtcgc cgccgtgtgc tccttgatct gctcgggcgt caggtagacg 60 tccgtgtact cgaagtcccg cagcgtcgcc ggcttgcggg actggaaccc ggtccgtacg 120 aagtcgtcac cggcgaccgc gttcagcagc cagttcgtca tgacgcgggt cttcgccacg 180 ttcgtccgca gcgccgacca gtggtagccc cgggccaccg cctgcgcggg cagcccgcgc 240 agctcgatgc ccagcggctt ggacacggcg tccgtgccgc cgaggtccac gacgagcccc 300 agatccttgt gcacgtagtc cttgagcggc tcgtggcgca gcgaggcgat caggttgtcc 360 gccagcaccc ggccctgacg catcgcgtgc tgtgcggtgg gcgggcagac cgccccgtcg 420 cccttcgcca gatcgggcac ggcggccgcg tcgccgagcg agaacacccc gtccgcgccc 480 ggcagtctca tctgcggggt cacggcgagc cggccgcgta ccgtctccgc gccgagcgtg 540 gcgaccagcg gactcgcggc cacgccggcg gtccagatca gcgtccggca gggcagcacc 600 cggccgtcgg tgaacgtgac ctcctccggc cccgcctcgg cgatcgacac cccgagcgac 660 acctcgatgt tccgcttgcg gagcacctcc agcgcggcct gcccgagctt gtcgccgagc 720 tccggcatca gcttcggcgc gatgtcgatc agatgccatt tgatcaggcg cgggtcaaga 780 cgcggatagt gcttcaccgc gttggtggtc agacgctgga gacaggcggc cgtctccgtg 840 cccgcgtacc cgccgccgac caccacgaac tggagccggg aggcccgctc ggcctcgtcg 900 tgactggcgt ccgccaggtc cagctgggcg atgacgtgat cccgtacgta cgcggcctcg 960 gccagcgtct tcatcccccg cgcgttgtcc agcagcccgg ggatgtcgaa ggtgcgggtg 1020 acgctgcccg ccgccagcac gaggtagtcg tacggctcgt tcacgatctc gtccgtgatc 1080 ttccggatca cacagacctt cgcctgcgtg tccacgccga tcgccccgcc cggcacgatc 1140 ctggtccggt gacggcggct gcggcgcagc gacaccgcca cggactgcgg cgtgagcacc 1200 ccggaggcca cctgggggag cagcggcaga tacagctggt aggagaacgg tgtgacgagc 1260 gtgatctggg cctcgcccgg agcgagcctg cgctccagac ggcgtacgca ctcgacgcct 1320 gcgaagccgg cgccgacgac gagaatcctg ggtggtgcca cggtctgcgt cccttctcgg 1380 gcttgcgtgg ttctgcgctc gcctgccccg tttaccgggt gattcacc 1428 <210> 101 <211> 343 <212> PRT <213> Streptomyces roseosporus <400> 101 Val Thr Gly Arg Asp Leu Thr Trp Thr Asp Thr Thr Ser Thr Val Asp 1 5 10 15 Arg Gly Arg Phe Pro Asp Ala Val Thr Pro Trp Glu Asp Pro Ala Trp 20 25 30 Arg Ala Glu Ala Leu Ala Trp Val Thr Glu Gly Leu Ala Ala His Gly 35 40 45 Leu Thr Glu Thr Gly Pro Arg Ala Val Arg Leu Arg Pro Trp Ser Val 50 55 60 Leu Val Arg Leu Ala Val Ala Gly Pro Ala Pro Val Trp Phe Lys Ala 65 70 75 80 Val Pro Pro Ala Ala Ala Phe Glu Ala Gly Leu Thr Glu Ala Leu Ala 85 90 95 Arg Trp Val Pro Ala Arg Val Leu Ala Pro Leu Ala Val Glu Ala Glu 100 105 110 Arg Gly Trp Ile Leu Val Pro Asp Gly Gly Pro Val Leu Ser Glu Val 115 120 125 Leu Asp Gly Arg Pro Gly Ala Pro Asp Pro Gly Tyr Trp Glu Glu Pro 130 135 140 Leu Arg Gln Tyr Ala Ala Met Gln Arg Glu Leu Thr Pro Tyr Ala Glu 145 150 155 160 Ala Ile Glu Ala Leu Gly Val Pro Ala Ala Arg Pro Arg Asp Leu Pro 165 170 175 Ala Leu Phe Asp Arg Leu Val Ala Gly Asn Ala Ala Leu Pro Arg Glu 180 185 190 Asp Arg Val Ala Leu Glu Val Leu Arg Pro Arg Val Ala Asp Trp Cys 195 200 205 Glu Glu Leu Ala Ser Ser Gly Val Ala Asp Ser Leu Asp His Ala Asp 210 215 220 Leu His Glu Lys Gln Leu Phe Ala Pro Val Ser Gly Arg Tyr Ala Phe 225 230 235 240 Phe Asp Trp Gly Asp Ala Leu Val Gly His Pro Phe Cys Ser Leu Leu 245 250 255 Val Pro Ala Arg Ala Ala Arg Glu Arg Cys Gly Pro Glu Val Leu Pro 260 265 270 Arg Leu Arg Asp Ala Tyr Leu Glu Pro Trp Thr Gly Gly Gly Val Thr 275 280 285 Ala Ala Gly Leu Arg Arg Ala Val Ser Leu Ala Trp Arg Leu Ala Ala 290 295 300 Leu Gly Arg Ala Ala Ser Trp Gly Arg Met Phe Pro Val Pro Pro Gly 305 310 315 320 Gly Pro Gly Val Ala Gly Asp Ala Glu Gly Ala His Trp Leu Arg Glu 325 330 335 Leu Ala Ala Ala Pro Pro Leu 340 <210> 102 <211> 864 <212> DNA <213> Streptomyces roseosporus <400> 102 cacaggggcg gggcggccgc cagctcccgc agccagtggg caccctcggc gtccccggcc 60 acgcccggac cacccggcgg tacggggaac atccgccccc acgaggcggc ccggcccagc 120 gccgccagcc gccacgccag gctcaccgca cggcgcagcc cggccgccgt gacgcccccg 180 ccggtccacg gctccagata ggcgtcccgc agccggggca gcacctcggg accacagcgc 240 tcacgggccg cacgggcggg taccagcagg ctgcagaacg gatggccgac gagggcgtcc 300 ccccagtcga agaaggcgta ccgcccggac acgggcgcga acagctgctt ctcgtgcaga 360 tcggcgtggt ccagcgagtc cgccaccccc gacgacgcca gctcctcgca ccagtcggcc 420 acccggggcc gcagcacctc cagcgccacc cggtcctccc ggggcagcgc ggcgttcccc 480 gcgaccagcc ggtcgaacag cgcgggaagg tcgcgcggcc gggccgccgg aacccccagg 540 gcctcgatcg cctccgcgta cggggtcagc tcccgctgca tcgcggcgta ctggcgcagc 600 ggctcctccc agtagccggg gtcaggggcg ccgggacgcc cgtcgaggac ctccgacagc 660 accgggccgc cgtccgggac gagtatccag ccgcgttccg cctcgacggc gagcggggcc 720 agcacccggg ccgggaccca gcgcgccagc gcctcggtga gccccgcctc gaaggccgcg 780 gcgggcggaa cggccttgaa ccagacgggc gcgggcccgg cgacggccag ccgcaccagc 840 accgaccagg gacgcagccg cacc 864 <210> 103 <211> 13013 <212> DNA <213> Streptomyces roseosporus <400> 103 ggatccccgc cgtcccggcc gagcagcagg acgatccagc accgggtgcc gacactgccc 60 acaccgacga ccttccgggc cacgtccacc agcgcgaagt cctccagcag actgcgccga 120 tcggatggca ggctgcgtgc gtaccccgcc agcatggagc cgaactgccg gaacaccgcg 180 tcccggtcca cccccggcgt cagatcggtc agcgggacga ccatcggcgg atccgccgcg 240 atccgcagcc gcccgtcgac cacctcggcg agcttcccga acgcctgaag gctgtcccgg 300 gaccgggcct tccccaacgc ccggtcgaca ttcctgcgcc cccgcccgcc caactgttcc 360 gtggccaccg tgcgcagccg ctcggcatcc gtccgcgcgt accagacgtc cagattgcgc 420 atgcccgcga accgggccat cgcctcccgg tacgagcgga ccgtggcccg gacgaccccg 480 gcccgctccc ggagcgtgaa gctgttcgcc cgccccgcga tgacgaggct cgccgcgagc 540 cgcttgacgt cccactccca gggacccggc agcgtctcgt cgaagtcgtt gatgtcgaac 600 aggagattcc gctcggggga ggccagcagc cggaagttca gcagatgggc gtcaccgcac 660 aactgcgccc tgattcccga caccggggtg ccggccaggt cggcggccat cagcgcggcc 720 gctccccggt agaagcggaa cggggactcc gtcatccggg catagcggat cgggaccagc 780 tcgggaaccc ggtccgccga ctgggcttcg aggacggtca gcggatcggg gcggcgcggc 840 gacggggaga actccgcatg gcccgaccgg ggcgcctcac ggcgggccgc cttgcccagt 900 gccgcccgtt cggccggtgt cgcgtgcggt gcggcgcgca gcggcgcctc ggcttcccgg 960 tccatgacgt ggctccttcc ggtcttcctc aggcctgttc ggcgatccgg cgctcacggt 1020 cgcggcggag gcggacccgc tgccagatcg cccgctgggc cttgagcgcg aacgcgccca 1080 ccacgatcag cacgaggatg ttgacgacga gctgtatggc cgagccccgt acgtcggacc 1140 agctggtgta cgccgtggag acggcgatgt ccgcggcggc cgggatcgtc gtcacggaga 1200 tgaacacccc gagcagagca ctggttctgg cctcggtgag cgacacgatc ccgacgattc 1260 cggccagggt ggcgacggcg acggagaaga agttcggcgt gttgatgaga tgggagacgg 1320 gccgcagccc ccggtcgaac gcctccgact ccagcccgaa accccggatg aggagggcga 1380 agaggaaggt gaccacgatg gtcaggagaa ggccgacgcc cagggcggcc agcccgctgc 1440 gcaccatgga ccggtggcgc cggtcgatcc ccagcgccac gctgacgatg gcgccgtact 1500 ccgggccgac gaccatcgcc ccgacgatca ggatctgcga gttggtgacg atgccgaccg 1560 acccgatcag accggcgatg accaggtaga ggtagaagct cggcggatac cggcccccgg 1620 acctgatgcg ggcctcgacc tgttcccaga ccggcgcccg gctcagcggc cccagctcgc 1680 gctgcccgcc ctcggtggcc gcgccggaga aggccatgtc gacgggttcg atgacgaggg 1740 agccccgccg gtcgaggtgg gcggcgcgca gccggtgcag tacgtcgttg gccgcccccg 1800 tcagtacgtc gcaggcgatg gcgtcgccgt cggggcggcg cgcggcgtcg cgctggacga 1860 tcagattgag cacgcacggg tcggccgaga gcaggccgac gacctcgtcg gtcaggtccg 1920 gcgggctcac cgcgcggatg tggatcatgt ccatcccggc acctccgcgg ctccctgccc 1980 cgtcacacgg agctgtgccc ggcaggcggc ccggggctca ctccagtaac gcggcaccgg 2040 caacgttcgg caaaccggcg gtcgcccgca cgggccgggg caccggggcc gcgggcgggt 2100 gacccgcccg ggctgggatc atgaaggggt ggacaccccc gacacacccg atgccttccc 2160 cgaaccgctg cccggggccg acgaagcggt ccgggaggag agggccaccg acgacgggac 2220 gccggagggc cgccgcctcg tccgctgccg tctctgcggc cggcccctga ccggggccga 2280 ctcgcggcgg gccggcctcg gcccgtcctg cgacgccaag ctgcacccgg cgccgccgga 2340 catccgcacc cgccgccacg aggtcgacca ggacccgctg ccgggcacct gagccggaac 2400 ggggctactg ctccagccgc cggaacagcc cctcctgcac caccgacacc agcagctgcc 2460 ccgaacggtc gtagatccgc ccccgcgcca ggccccgccc gcccgtggcg atcggcgact 2520 cctggtcgta caggaaccac tcgtccgccc ggaacggccg gtggaaccac atggcgtggt 2580 ccagggacgc aaggtcatat ccgcgcgggc cccacagcgg ctccaccggg atacggaccg 2640 cgtccagcag cgtcatgtcg ctcgcgtacg tcagcgcgca cgtgtgcacc agcgggtcgt 2700 cgcccagcgg gcccaccgcc cgcatccaca ccgcgctgcg cggatcggcg tcctggatct 2760 cgtccttcgt ccagcgcagc cggtcgacgt aacggatgtc gaagggctgg cggcgggcca 2820 tccgctccag cgcctccggc agcgcgccca gatgctcgcg cacctcctcg gcgaccgtcg 2880 gcagctcctc cgggtccggg acgatccggg cgggcggcag ctggtgttcg aagcccgcct 2940 cctcggggcg gtggaaggac gccgtcaggt tgaagatcgt ccggccctcc tggaccgccg 3000 tcacccgacg ggtggtgaag gaccggccgt cccgcacccg ctccacctgg tagacgatcg 3060 gcacaccggg acgccccggc cgcaggaaat aggcgtgcag cgagtgcacc ggccgctccc 3120 cgtcggtggt ccggcccgcc gccaccagcg cctggcccgc gacctgcccg ccgaagaccc 3180 gttgcaggga ctcctccggg ctgcgccccc ggaagatgtt gacctcgatc cgctccaggt 3240 cgagcaggtc gaccagacgc tcggccggat tcgtcatgcc gcacctctcc cgtcacacgt 3300 cagggtccgc ttcacagctg gccgacctcg gtgacccgga cgaccgcccg gccctcctcg 3360 tcggacgccg cgaggtccac ctcggccttg atgccccagt cgtgatcgcc cgccggatcg 3420 gcgaacgcct gccagacccg ccacagcccg tgcgccgggt cctcctcgat cttcagcagc 3480 ttcgggcccc gcgcgtccgg accggtcccg atctcctcgt gcgcgtccca gtacgcgtcc 3540 agcgcctcgc cccacgcgtc ctcgtcccac ccggactcgc cgtccagctc gcccagcgcg 3600 ccggcccggt ccagcgcggc cagctccacc cggcggaaca tcgcgttgcg caccagcacc 3660 cggaaggcgc gcgcgttcgc cgtgaccggc ttgacctcgt ccgccttctc ctgagcctgc 3720 tccgcggtct ccacctcggg gttggccagc tgctcccact cgtccagcag actggagtcc 3780 acctgacgca ccatctcgcc cagccaggag atcaggtcct ggaggtcctc cgacttcacg 3840 tcgtccggga tcgtgtgctc cagcgccttg tacgcgctcg ccagataccg cagcacgatg 3900 ccctcggtcc gggccagctc gtagtgcgaa gtgaactccg tgaacgtcat ggcccgctcg 3960 tacatgtccc ggatcaccga cttcggcgac accggatggt cgttcaccca cgggtggctc 4020 gtgcggtaca cgtcgtacgc gtgccacagc agctcgctca gcggcttggg gtacgtgacc 4080 tcctggagcc gctccatccg ctcctcgtac tcgaccccgt ccgccttcat ctgccccacg 4140 gcctcgccgc gcgccttgtt ctgctgggcg gccaggatct gccggggatc gtccagcgtc 4200 gactcgacga ccgagaccat gtccagcgca tacgacggcg attcggcgtc cagcaggtcg 4260 aacgcggcca gcgcgaacgt ggacagcggc tggttcagcg cgaagtcctg ctggaggtcg 4320 accgtcagcc gcacgatccg gccctcggcg tccggggtgt ccaactgctc caccaccccg 4380 ccgtccagca gcgagcggta gatggcgatg gcccgccgga tgtgccgcag ctgcgcccgg 4440 cgcggctcgt ggttgtcctc cagcagatgc cgcatcgcct cgaaggcgtt gcccgggcgg 4500 gcgatgaccg cgagcagcat cgtgtgggtg acccggaaac gggaggtcag cggctccggc 4560 tcggactgga tcagcttgtc gaacgtcgac tccgaccagg cgacgaagcc ctccggggcc 4620 ttcttgcgga ccaccttgcg cttcttcttc gggtcgtcgc ccgccttctt cagcgccttc 4680 tcgttctcga tgacatgctc gggggcctgt gccacgacga acccggccgt gtcgaacccg 4740 gcccgcccgg cccggcccgc gatctggtgg aactcccgcg cgcgcagcgt ccgcacccgg 4800 ttcccgtcgt acttggtgag cgccgtgaac agcaccgtac ggatggggac gttgacgccg 4860 acgccgagcg tgtccgtccc gcagatcacc ttcagcagcc ccgcctgggc cagcttctcc 4920 accaggcggc ggtacttcgg cagcatcccc gcgtggtgca ccccgatgcc gtggcgtacg 4980 taacgggaga ggttctggcc gaacttggtg gtgaagcgga agctgccgat cagatcggcg 5040 atcttctcct tctcctcctt cgtgcacatg ttgatgctca tcagcgactg cgcccgctcc 5100 acggccgccg cctgcgtgaa gtgcacgatg tagaccggcg actgccgggt gtccagcagc 5160 tcggtgagcg tctcggtgat cggcgtgaag cggtactcgt agctcagcgg caccgggcgg 5220 gtcgccgagc gcaccaccga ggtcgggcgg ccggtacggc gggtcaggtc cttctcgaac 5280 atcgagacgt cgccgagcgt cgccgacatc agcacgaact gcgcctgcgg cagctccagc 5340 agcggaatct gccaggccca gccccggtcc ggctcggcgt agaagtggaa ctcgtccatc 5400 acgacctggc cgatgtcggc gtacttgccg tcgcgcagcg cgatggaggc cagcacctcg 5460 gccgtacagc agatcaccgg ggcgtccgcg ttgaccgagg cgtcgccggt gagcatgccg 5520 acgttctcgg tgccgaagag cttgcacagg tcgaagaact tctccgacac cagcgccttg 5580 atcggagccg tgtagaaggt gaccttgtcc tgggccagcg ccgtgaagtg cgcgcccgcc 5640 gccaccaggc tcttgcccga gccggtcggg gtggacagga tcacgttcgc cccggagacc 5700 acctcgatca gcgcctcctc ctgagccggg tacatcgtga tgccctggct ctcggtccat 5760 gaggagaagg cctcgaagag ggcgtccggg tcggcggtct ggggaagctg gtcgatgagg 5820 gtcacgcccc catcttgcct gtcttccgcc cggatgaggg aaccggcgga cggcacgaag 5880 atcacggacg gtacgctgcg gactcaacct gcccgcgccg caccggtgat gggcgcacga 5940 accactgggg gcgggacaga ccatgatggg accggcacac tctctgtcag gggcagcggc 6000 ctggctgggg gtgggcgcgg cggccgccgc cgcgggccac acgatgccct ggcccgtcct 6060 cgtcgtcggg gcgctgatct gcgcgggagc cgcactcgcc cccgacctcg accacaagtc 6120 cgcgaccatc tcgcgcgcct tcggcccggt ctccaaagcc ctctgcgaga tcgtcgacaa 6180 gctctcctac gccgtctaca aggccaccaa gagcgccggg gacccccgca ggaccggcgg 6240 gcaccgcacc ctcacccaca cctggctgtg ggccgtcctc atcggcggcg gctgctccgt 6300 ggcggcgatc accggcggcc gctgggccgt cctcgtgatc ctcttcgtcc acctcgtgct 6360 cgccgtcgag ggcctgctgt ggcgggccgc ccgcgtctcc agcgacgttc tggtgtggct 6420 gctcggcgcg accagcgcgt ggatcctggc cggcgtcctg gacaagcccg gctacggggc 6480 cgactggctc ttcgacgccc ccggccagga gtacatgtgg ctcggcctgc ccatcgtgct 6540 cggcgccctc gtccacgaca tcggcgacgc cctcacggtc tcgggctgcc cgatcctgtg 6600 gcccatcccg atcggccgca agcgctggta cccgatcggc ccgccgaagg ccatgcgctt 6660 ccgggccggc agctgggtgg agatgaaggt gctgatgccc gccttcatgg tcctcggggg 6720 agtgggcggg gccgccgccc tcaactacat atgacgcacc gccggtcgcg cccggtgcgt 6780 ctccggcggg cggcgcgtcc ggtgtccttc cggcgggcgg cgcgctccgc cccgtagcac 6840 catgggcgca tgctgctcgc cgagctcgcc caggtgtccc tggaggtcgc cgccacctcc 6900 gcccggtcca agaaggtggc gctcctcgcc ggactcttcc gggacgccgg acccgaggac 6960 gtccccgtcg tcatcccgta cctcgccgga cggctgcccc agggccggat cggcgtgggg 7020 tggcgctccc tcggcgaccc ggtggagccc gcggcggaac ccaccctcac cgtcaccggc 7080 gtcgacgccc ggctgaccgc cctcgccgcc gtctcgggcc ccggctccca ggcccggcgc 7140 aaggagcacc tgcgcgccct cttcgccgcc gccaccgagg acgaacagcg cttcctgcgg 7200 gccctgctca ccggcgaggt acgccagggg gccctggacg ccctcgccgc cgacgccctg 7260 gcccgcgccg ccgacgcccc gcccgccgac gtccggcgcg ccgtgatgct cgccggatcg 7320 ctccaggaag tcgccggggt cctcctcgcg gacgggcccg aggcgctcgc cgccttccgg 7380 ctcaccgtcg gacggcccgt ccagccgatg ctggcgcaca ccgccgcctc ggtcggcgag 7440 gccctcgaca aactgggcgc gtgcgcggtc gaggagaagc tcgacggcat tcgggtgcag 7500 gtccaccgcg acggcgaccg gatccgcgcc tacacccgga ccctcgacga catcaccgac 7560 cggctgcccg agctcaccgc cgccgtcgcc gccctcccgg ccggccgctt catcctggac 7620 ggcgaggtga tcgccctggg ggaggacggc aggccccggc ccttccagga gaccgcctcc 7680 cgggtgggct cgcggcggga cgtggcggag gcggcggcgc acgtgcccgt cgccccggtc 7740 ttcttcgacg cgctcctcgt cgacgacgag gacctgctcg acctgccctt caccgaccgc 7800 cacgccgccc tggcccggct cctccccgag cacctgcgcg tccgccgcac cctcgttccc 7860 gacgcggagg acccgaaagc ccgcgcggcg gccgacgcgt tcctcaccga caccctggaa 7920 cgcggccacg agggagtcgt cgtcaaggac ctcgccgccg cctacagcgc gggccgccgg 7980 ggcgcgtcct ggctgaaggt gaagcccgtg cacaccctgg acctggtggt gctggccgtc 8040 gagtggggca gcggccggcg caccggcaag ctctccaacc tgcacctggg cgcccgccgc 8100 cccgacggta cgttcgcgat gctcggcaag accttcaagg ggctcacgga cgccctgctc 8160 gactggcaga cccagcgcct gggcgagctg gccaccgacg acgacggcca cgtcgtcacc 8220 gtacgcccgg aactcgtcgt ggagatcgcc tacgacggac tccagcgctc cacccgctac 8280 cccgccgggg tcaccctccg cttcgcccgc gtcctgcgct accgcgacga caagaccgcc 8340 caggaggcgg acaccgtgga gacggtcctg tcccggcggc ggtgagcgcg cccccgtcct 8400 gaaggggcgc gctcgtacag ggcccggcgg ctcagtgctt gatgaccgtc gccgccgtgt 8460 gctccttgat ctgctcgggc gtcaggtaga cgtccgtgta ctcgaagtcc cgcagcgtcg 8520 ccggcttgcg ggactggaac ccggtccgta cgaagtcgtc accggcgacc gcgttcagca 8580 gccagttcgt catgacgcgg gtcttcgcca cgttcgtccg cagcgccgac cagtggtagc 8640 cccgggccac cgcctgcgcg ggcagcccgc gcagctcgat gcccagcggc ttggacacgg 8700 cgtccgtgcc gccgaggtcc acgacgagcc ccagatcctt gtgcacgtag tccttgagcg 8760 gctcgtggcg cagcgaggcg atcaggttgt ccgccagcac ccggccctga cgcatcgcgt 8820 gctgtgcggt gggcgggcag accgccccgt cgcccttcgc cagatcgggc acggcggccg 8880 cgtcgccgag cgagaacacc ccgtccgcgc ccggcagtct catctgcggg gtcacggcga 8940 gccggccgcg taccgtctcc gcgccgagcg tggcgaccag cggactcgcg gccacgccgg 9000 cggtccagat cagcgtccgg cagggcagca cccggccgtc ggtgaacgtg acctcctccg 9060 gccccgcctc ggcgatcgac accccgagcg acacctcgat gttccgcttg cggagcacct 9120 ccagcgcggc ctgcccgagc ttgtcgccga gctccggcat cagcttcggc gcgatgtcga 9180 tcagatgcca tttgatcagg cgcgggtcaa gacgcggata gtgcttcacc gcgttggtgg 9240 tcagacgctg gagacaggcg gccgtctccg tgcccgcgta cccgccgccg accaccacga 9300 actggagccg ggaggcccgc tcggcctcgt cgtgactggc gtccgccagg tccagctggg 9360 cgatgacgtg atcccgtacg tacgcggcct cggccagcgt cttcatcccc cgcgcgttgt 9420 ccagcagccc ggggatgtcg aaggtgcggg tgacgctgcc cgccgccagc acgaggtagt 9480 cgtacggctc gttcacgatc tcgtccgtga tcttccggat cacacagacc ttcgcctgcg 9540 tgtccacgcc gatcgccccg cccggcacga tcctggtccg gtgacggcgg ctgcggcgca 9600 gcgacaccgc cacggactgc ggcgtgagca ccccggaggc cacctggggg agcagcggca 9660 gatacagctg gtaggagaac ggtgtgacga gcgtgatctg ggcctcgccc ggagcgagcc 9720 tgcgctccag acggcgtacg cactcgacgc ctgcgaagcc ggcgccgacg acgagaatcc 9780 tgggtggtgc cacggtctgc gtcccttctc gggcttgcgt ggttctgcgc tcgcctgccc 9840 cgtttaccgg gtgattcacc cctcatcctc accggaggct ccggcatccg cctcctggca 9900 ggggtgaaac ggggcccggt cacaggggcg gggcggccgc cagctcccgc agccagtggg 9960 caccctcggc gtccccggcc acgcccggac cacccggcgg tacggggaac atccgccccc 10020 acgaggcggc ccggcccagc gccgccagcc gccacgccag gctcaccgca cggcgcagcc 10080 cggccgccgt gacgcccccg ccggtccacg gctccagata ggcgtcccgc agccggggca 10140 gcacctcggg accacagcgc tcacgggccg cacgggcggg taccagcagg ctgcagaacg 10200 gatggccgac gagggcgtcc ccccagtcga agaaggcgta ccgcccggac acgggcgcga 10260 acagctgctt ctcgtgcaga tcggcgtggt ccagcgagtc cgccaccccc gacgacgcca 10320 gctcctcgca ccagtcggcc acccggggcc gcagcacctc cagcgccacc cggtcctccc 10380 ggggcagcgc ggcgttcccc gcgaccagcc ggtcgaacag cgcgggaagg tcgcgcggcc 10440 gggccgccgg aacccccagg gcctcgatcg cctccgcgta cggggtcagc tcccgctgca 10500 tcgcggcgta ctggcgcagc ggctcctccc agtagccggg gtcaggggcg ccgggacgcc 10560 cgtcgaggac ctccgacagc accgggccgc cgtccgggac gagtatccag ccgcgttccg 10620 cctcgacggc gagcggggcc agcacccggg ccgggaccca gcgcgccagc gcctcggtga 10680 gccccgcctc gaaggccgcg gcgggcggaa cggccttgaa ccagacgggc gcgggcccgg 10740 cgacggccag ccgcaccagc accgaccagg gacgcagccg caccgcccgg gggcccgtct 10800 ccgtcagccc gtgagcggcg aggccctcgg tcacccaggc gagggcctcc gcccgccagg 10860 ccgggtcctc ccagggcgtc acggcgtccg ggaagcgccc ccggtccacg gtcgaggtcg 10920 tgtcggtcca ggtcaggtct cttccggtca cggcggtcgt ggtcgtgccg gggccggtca 10980 cggcggtcgt ggtcacggca tccggggccg cgtcgggcat gggcatctcg tctccgcgca 11040 tccgatcatg ggatcaccgg ccccggcgcg tgcgcaccgc aatttccggg aacacccgtt 11100 cccgtcctgc ccggatcggc tgtcctcccc cctccggccc ctggaacggc gggagttcgg 11160 ccgcccgccc cgtgcgagga tgctgtggtg accacctcgc cctcctcgcc cgtggccgac 11220 gactcttccg tgtcttccgt ggacgacgcc ccgccccgcg accaggggct gagctcccgg 11280 gccgcggcgg tcctcgtctt cgggtcctcc gccgcggtcc tcgtggtcga gatcgtcgcc 11340 ctgcggctgc tcgccccgta cctcggcctc accctggaga ccagcacgct ggtgatcggc 11400 atcgcgctga ccgccatcgc cctgggttcc tggctgggcg ggcgcatcgc ggaccaggtc 11460 gatccgcacc ggctcatcgc ccccgcgctc ggggtgtcgg gcgtgggcgt cgcgctcacc 11520 ccgctcctgc tccgtaccac cgcggagtgg tctcccgcgc tgctcctgct ggtcgcttcg 11580 gcgaccctcc tggtgccggg cgcgctgctc tccgcggtga ccccgttcgt gacgaagttg 11640 cggctcacca gcctcgccga gaccgggacg gtcgtcgggc ggctgtcggg cgtcggcacc 11700 ttcggagcca tcgtcggcac ggtgctcacc ggattcgtcc tggtcacgcg gctgcccgtc 11760 agctccatcc tgatcggcct cggcacgctg ctggtgctcg gggcggccct cgtcggatgg 11820 caggcccggc ggtggcggcg cgccacggcc gtggccctcg ccaccgtcgt cgcgggcact 11880 ctcgccaccg ggttcgctcc cggcggctgc gacgcggaga cccgctacca ctgcgcccgg 11940 gtcgtcgcgg accccgaccg ggacagcggc cgcaccctcg tcctggacgg cctgcgccac 12000 tcctacgtcg atgtcgagga ccccgagtac ctgaagttcg cgtacgtacg cgccttcgcc 12060 tccgtggtcg acacggcctt ccccgagggc gagccgctga ccgcccacca catcgggggc 12120 ggcggcctca ccttcccccg ctacctcgcg gccacccgcc ccggaacccg cagcctcgtc 12180 tccgagatcg accccggggt cgtccgcatc gaccgcgacc ggctcggcct cggcacccct 12240 gccgcgaccg gcatcgacgt acgcgtcgag gacgggcgtc tcggcctgcg gcggctggac 12300 gcgggcagcc acgacctggt cgtcggcgac gccttcggag gcgtcagcgc gccctggcac 12360 ctcacgacgt cccaggcact caaggacgta cgccgggcgc tcgacgcgga cggcctgtac 12420 gtcaccaacc tcatcgacca cggccggctc gccttcgccc gcgccgaggt cgccaccctc 12480 gccgcgacct tcccgcatgt cgcgctgctc gggcagcccg cggacatcgg cctggacccc 12540 acggcttcga gcatcggcgg caacatggtg gtcgtcgcct ccgcccggcc gctcgacgcc 12600 cccgccatcc aggaagccat ggacgcccgg gacgtcggct ggaggatcgc caccggcgac 12660 accctcacca cctggacggg gaacgcccgg gtgctcaccg acgaccacgc gcccgtcgac 12720 caactcctcc agccccaccc cgtcccagcg gcccggtgag gcccgaacgg gcccgatgat 12780 cccgcccgaa cgccccggtg acgcacgaac ggcccggtga tccccggccg ttcgcgcggg 12840 gatcaccggg ccgttcggcc aagacgcctc acccgtgcca ggaccgccac agcgacgcgt 12900 acgcgccgcc cgccgccacc agctcgtcat ggctgcccag ttcactgatc cggccgtcct 12960 ccacgaccgc gatcacatcc gcgtcgtgcg cggtgtgcag ccggtgcgcg atc 13013 <210> 104 <211> 217 <212> PRT <213> Streptomyces roseosporus <400> 104 Met Ala Gln Pro Ile Glu Leu Val Ile Phe Asp Cys Asp Gly Val Leu 1 5 10 15 Val Asp Ser Glu Arg Ile Ala Val Arg Val Asp Ala Leu Val Leu Ala 20 25 30 Glu Leu Gly Trp Asn Leu Thr Glu Ala Glu Ile Val Asp Arg Phe Met 35 40 45 Gly Leu Ser Ser Arg Ser Met Thr Arg Gln Ile Glu Asp His Leu Gly 50 55 60 Arg Arg Leu Pro Ala Asp Trp Glu Glu Glu Phe Lys Pro Leu Tyr Asp 65 70 75 80 Glu Ala Leu Ala Ala Glu Leu Thr Pro Val Glu Gly Ile Val Asp Ala 85 90 95 Leu Asp Ala Leu Thr His Leu Pro Thr Cys Val Ala Ser Ser Gly Ser 100 105 110 His Asp Lys Met Arg Phe Thr Leu Gly Met Thr Gly Leu Arg Pro Arg 115 120 125 Phe Glu Gly Arg Ile Phe Ser Ala Thr Glu Val Glu His Gly Lys Pro 130 135 140 Ala Pro Asp Leu Phe Leu His Ala Ala Arg Lys Met Gly Val Val Pro 145 150 155 160 Glu Ala Cys Ala Val Val Glu Asp Ser Gln Tyr Gly Leu Gln Ala Ala 165 170 175 Arg Ala Ala Gly Met Arg Ala Phe Ala Tyr Ala Gly Gly Leu Thr Pro 180 185 190 Ala Asp Arg Leu Glu Gly Pro Gly Thr Val Val Phe Asp Asp Met Arg 195 200 205 Arg Leu Pro Gly Leu Leu Ala Asp His 210 215 <210> 105 <211> 654 <212> DNA <213> Streptomyces roseosporus <400> 105 atggcccaac ccattgaact cgtcatattc gactgcgacg gcgtactcgt cgacagcgaa 60 cgcatcgcgg tgcgcgtgga cgcactcgtc ctggccgagc tggggtggaa tctcaccgaa 120 gccgagatcg tcgaccggtt catgggcctg tcgagccggt cgatgacgcg gcagatcgag 180 gaccacctcg ggcgccgtct gccggccgac tgggaggaag agttcaagcc cctctacgac 240 gaggcgctcg ccgccgaact cacgccggtc gagggcatcg tcgacgccct cgacgcgctc 300 acgcatctcc ccacctgtgt ggcatccagc gggagccacg acaagatgcg tttcacgctg 360 gggatgaccg gtctccgccc gcgcttcgaa ggccgcattt tcagtgccac cgaggtcgag 420 cacggcaagc cggccccgga tctgttccta cacgccgcgc ggaagatggg ggtcgtgccc 480 gaggcgtgcg ccgtggtcga ggacagtcag tacggtcttc aggcagcccg ggccgcgggc 540 atgcgagcct tcgcctacgc cgggggactg actcccgcgg accgtctcga aggccccggc 600 accgtcgtct tcgacgacat gcgcagactg cccggcctcc tcgcggatca ctga 654 <210> 106 <211> 23949 <212> DNA <213> Streptomyces roseosporus <220> <221> modified_base <222> (50) <223> a, t, c, g, unknown or other <400> 106 cgccgtagag ccacgcagga gaggcggtcg gcccatcggg gtcgaccgcn tctcccgttt 60 ccctcaggtc aggtcagcac gcgcccgccg ggcggtcccg cttcacgacg ttcgtgtaac 120 cggtcgtgcc gtccagccag acgacgcgct tgccctcgtc ggccgaggcg tagacctggt 180 cgccgcggtt gcaggacacg cgctgggcgc cgcccttgcc gtcgggtgcc acctggaaca 240 gcttcggcag ggtctcgttg gcccatgagg tggccggcgg cagcgaggtg acgttgaccg 300 cgtcgtcgga ggccgtcagc tggtaggcgt gcagggagcc ttggccggtt tcggggacga 360 ccgtggtgcg gttcgtgccg tcggcgtcgg cgcgcacgac ggcggccttg gcggggtcgg 420 tgccggcgcc gtcctcgatc cagaagacac cgtcgtcggt gaaggccgtc tggccgatgc 480 cctgcgcgcc ctcggctccg gccggcatca tccgggtggt gccggtggcg gtgtccagga 540 ccccgatgcc cagttggacg tcgctgccgt cgatccacat cgtggcgtag gcgatcttcc 600 cgtcccggat cgagggcatg gccgtgacct cgatgccctt ggcgaggatc atgcccgcct 660 cccgggtcct gatgttgatg tagccgatct gctgccggcc ggtctgcggg ttcgtcaccg 720 tgtaggcgag gaagtcgcct tcgaggacga gctgcgagac attggctccg acgccgccga 780 cgaccctggc cgggccgccg cccaccggac ggacatggaa gaggaccgac cccggggaga 840 actcggccca ggcgacgttc ttgccgtccg tcgtcgcgta gacgttgtag ttgccgttgt 900 tgccgctcac cagctgcggc ttgcccttgc cgtcggtgtt gccgagccac accgagtacg 960 gttcgctgcc ttcctcgtcg gagcgggaga cggcgtactt gccaccgccg gcgccgacgc 1020 cggtgcccgc cacgttgacc ttggacacga gggtgtccgt gtcgacaccg agcgccttct 1080 cccagccggg gacgatgccg tgcgcgtcga acgaacgctt cacgatcttc gtctgcgcct 1140 tggtggcgcc cagctcctgc gctgcggcga tgaccgccgc gcggccctcg gtgaagccgt 1200 cgagcggcgt catgtacgcg gacagcgcgc ggtagacgat ctggtcggcc ggctcggcgc 1260 cgaggtcctc gcgcatgtcc cacagggcgc ccgagaagat cgtggagttg aggtgtacgc 1320 caccgttgtc gccgttgtgg ctgacgccga tgaagtcctt cgacgtggtg gcaccgtcgt 1380 tgaggtcccg cagcgcgcag tcgcgcgggc cgagcgtggt gcacaggtcc tcgccgagca 1440 gaccggcgtc cgggtcgtcc atcgaccggc cgtcggcctc caggtcgatg gcgttgccga 1500 agtagtcggc tatcgcctcg ttcacggcgc cggactggcc cgcgtacacc aggttcgcgg 1560 tgtgctcgat gacaccgtgc gtcatctcgt ggccgaccac gtcggtgtcc gccgagaagg 1620 tgcggtagtc gccgccgccc tggccgtaca ccatcttggt gccgtcccag aaggcgttgt 1680 tgaacggctt cccgccgttc accacaccca cgagcgagta catgaacccg tccttgccgt 1740 ccaggctctt acggccgaag tggttcttgt agtagtcgta gaccttcccg gccgcccagt 1800 gggcgtccac cgccccggag tcggtgaact ccttgcccag gtcgggggtg tccgagcgga 1860 acgtctggat gccgctgggc cacgtgccgg acgccgtggc ggcctcccgg ccacgcgcgt 1920 cccaggtcga cagcagcgga ccgtcgtacg ggctgtcggc gccccgcttg ctgtagtcgt 1980 acatctggta ggcgccgtcg gcgccctggt acaggttgat ctcggcctcc tcgccgttgt 2040 agcgggtgcc cgagcccttg acgaccagct gctgcgtggc ctccgcggtg gcgtcggccg 2100 tgggcgcgtc gccggtggcg ccgctgctcg taccggcgcc cgaacccggt gcgccgaacg 2160 acttgatgcc gctgtactgc atcacgggga agccggagtg ggcgtcgatg tacacctcct 2220 gcttcaccgg cgtgccgtcg gccgggctga cgccggtgac ggtgatgtgc cgggtcagca 2280 caccggatcc ctggggcagg acggtcacgt caccggccgt acccgacagc tgaaccccgc 2340 cgggcttctc gcccttggcc ggggccctga gcaggccccc gcccagctgc gcggagacgg 2400 cgccgaccgc gcgctcgatc gcggtcttct cggagacctc cggcgtcacc gtgtcgagct 2460 tcagctcggt gaagtagctg ccggacgtgc cggtgacggt gcgcttgccg tccttcttcg 2520 tcatccggac caggtactgg ccgccgagga ccgtgacgcc gcggtacttc tgctggagac 2580 ggaccgtctc cctgccgccc ctcccggtcg tggtcccggc cgcggccagg tccttcgccg 2640 aggtgtgcgc gatgcggtag cggctcttct tcgccttgag gtggccacgg gcggcgtccg 2700 ccgcggtgcc ggtggcgtcg gcctcctcgt tgagtcccgt gacgagcgag ggggtcccgg 2760 tcccggcacc cggcgtcacc tcggacgcgg cggacgtggt ggcggtgtcc gcgtgagcgg 2820 cgggcgtggc cgtcatcaac aggcccgcgg cggccagtac cgccaccacg ccctggccga 2880 cgaacgtggt gccggacccc tgacctggtc cggccgatct gctgcgcgat gaactccgca 2940 cagttgcccc tcccgaatgc gattgctgca tgaacggatc tcggatgccg acatggaagt 3000 accggggcgg gggtgggaac aatgcgttcc gcgcgtgcac ttgtggacgt acacacttgt 3060 gtggcctgca ttgacaggtg acaattccgc cggtggggcg gactgggtgg gacacgcaat 3120 ggcaggcgct cgggctcgga gcggacgaac tccgggtgta cgaagcgctc ctcgacgcac 3180 ccgtacccgc ctcccgtacc gccctcgccc agcacctggg gctgaccgtg cgccgggtca 3240 cgaacgccct ggatcacctg gccgagcgcc gcttcaccca cccggcccgg ggcgccgggc 3300 tgcccgtggc catggccccc gccaccgccc tgcgcaatct gatccatctg caccaggcgg 3360 aactcctgca ccgatcggcg gagttggagg agctcagcgg atccgtcgac cggatcgcgg 3420 cccaactgct gagctccgtg cacacccccc gcgccaccgg catcgagacg gtccgcggcg 3480 gagcggcgat cgccgcccgg gtggcctccc tgctggtgtc ggcgagcgag gagatcgccc 3540 tcctggaccg gccgccgtac gcgtcgagcg agccggacgg gatgcccgtc cccctcgaca 3600 tggccgaacc ggtacgtcgg ggggtacgcg tccgggtcgt ggtggaccgc gaggggctga 3660 gcttccacgg gcgcgcccgc ggcctgggcg atctggccgt gcagggggtg cagatccggg 3720 tgggcacgga tctgccgacg aagctgatca cggtcgaccg gcgggtgacc ctcctgccgc 3780 cgacggacgc ggcggacccg acggcctccg cactggtggt gagcgacgcg ctgctgagca 3840 acgcgctggt gccgctgttc gagtcggtct gggaacgggc gctccccatc ggctccgtga 3900 cgcatgatca gatcacggac ggcgaccggg agttgctgac gatgctcgcc tccggcctga 3960 aggacgaggc gatggcccgg cgcctcgaca tccatgtgca cacggtccgg cgccgcatca 4020 cccgtctgat gcaggtcctc aacgcggaga cccgtttcca ggccggggta caggccgcgc 4080 tccggggctg gctcaccggg tgagccagcc ccggccccct cagcccgcct tcaccgtccc 4140 gccgagacgg gcgcggtgcc gccgcaggac gcacggatga tcaggttggg ccacaactcg 4200 actcggtgca ccgggcgttc gacgggatcg acggcgcgtg ccagggccat ttcggcggcc 4260 aggacgccga gccggtgctt ctgcgggcgc acggcggtca ggggagggtc ggcggcggct 4320 gccacctcgt cgtcgtaggt gatgacggcg aggtcctcgg ggaccgcgag tccgtgttcg 4380 tgggcgcgct ccaccaggcc gacggcctca ccgtcggagt ggacgaacag ggcggtggcg 4440 ccggcctcgc ggcagctgcg gagggccgcg tcgtaggcgt ccgcccagcc gggggagccg 4500 tacgacggta cgtcgtgtgc gaggccgtcg ccggagggca ggccgagaga ggcggtggtc 4560 tcctgccacc cctcgcgcag ggccttggtg gtggggctga agcgcgcggt gacgaaggcg 4620 atacggtgat ggcccagggt gaccagatgc cgtacggcca ggcccgcgcc gaggctgtgg 4680 gcggtggtga cggcgtcgag cggcagggtg ggcagagcgg gcggcggcag ccgttcgacg 4740 aggatgacgg ggacgttcag cgagcccagc cagcgcagca ggtcctggcc ggcctcgccg 4800 gtgttggtgg gggcgacgag cagcgtgcgc acaccgcggt cgaggaggcc ggtgacctgg 4860 cggcggtcct ccgccgcgtc gtaggcggaa gcgcgcagga ccagccgtcc cccggcggcg 4920 gccaccgccg actgggcgcc ctggatgacc gccggccagt agtactcgac ggtggggacg 4980 accatgccga cgaacgcctg gtcgggcagg cggccgtggg tgaacacgcc ccgggtggcc 5040 cgctcgtcgg ccgtcggccc gcgatagggg agggtgacgc ctccgtggac gcgcgacacc 5100 agcccccggt cggccaggat cgtgacgtcc cggcggaccg tcacggcggt gacgcccagc 5160 cgctcgacca gatcggccag gcgcacggtg ccgcgttccc gcacggtggc gaggatgaac 5220 tcctgccgtt ccgatgcgag tgccatcccg gcctctcctt ttccttctga tcgaactgtg 5280 tcgttcgact tctcttcgac ttctcgtgga tgtcgtctgt tctatcgcag gcgcccccga 5340 tccaggaagg cgctacccgc tttgccggga atgcgagcta gcgggagggc tctcggatcg 5400 ggagcggggc ctctccggag ctcgttgagc tttgctttcc tatcgatcct gatcgattca 5460 tttcgctacc gttgaccgaa aatcggccag gggctgaagt gtgcgaacac cttcctgcac 5520 gaaaggaaac ccctggtgct cggcttctcc tccgacgccg gtgacagcgc acacgcccct 5580 cggacgcacc gatcgcggag gtccctgctg cggacctccg cgggcctggg ggcagcgctt 5640 ctcgccggcg gcacactcac cggctgttcg ggccggacct ccggaaccgt ccgggtccgt 5700 atgtggtcgt ggctgaccgg catggaccgg tacgtcgccg cgttcaactc ctcccagcgc 5760 gacgtccggg tcgacctgag cgtgatcgcc gccggtacgt ccgggggcta cgcccagcag 5820 accaacgcga tccgcgccca caacgccccg gacatcctgc acgtcgagta ccaggccctg 5880 ccgcagatcg cgaccaccgg cgggctgcgc gatctgagcg cggacgtgga cgatctcgcc 5940 gacggcttcc tgcccgccgc gtggcagagc gtccgccccg gcgggaagac ctgggcggtg 6000 cccatggact tctgcccgat ggcgttcttc taccgcaagg acctgttcga ccgggccggc 6060 atcggagtgc cccgtacctg ggaggagttc cgccgggccg cctcggccgt ccgcacggcc 6120 gaccgggatg cgcggatcac caccttcccg ctcaacgacg gcgccttctt cgccgggatg 6180 gcctgccagg ccggcgaccc ctggtgggac atcgccggga acgcgtggcg ggtcgggatc 6240 gacggcgcgg gcacgatgcg cgtggccgag tactggcagg acatggtgtc ctccggtctt 6300 gccgcgcgcg acgccaccgg cacccagagc tggatctccg cgatgcacca cggccggctc 6360 tgggggatgc tcggggccac ctggggcgtg ggcatgctga agaagtccct gcccgcccac 6420 carggccgct gggcggtcgc acccctgccc acctggggcg acgacccgtc caccggggtc 6480 tggggagggt cggcgttcgg ggtctccgcc gagagcgagg tgcccgaggc cgccctgacg 6540 ttcctgcgct ggctcagcac cgaccccgcg gttccccgga tcggctcggm gttcaccttc 6600 ccctcgcccg ctttcctcgc caaccggaag gtggcccgta ccgcctacga ggacgggtac 6660 ttcaccggcg accccgtctt cgacgtgctg gacgagtccg cgacccgggt ccccgggtgg 6720 acgtggggcc cgacctcgct gagcaccttc gccacgatcg ccgaggcgct cggcccggtc 6780 tccaccggag ccaccaccat cccccgggcg ctgcaccggg ttcacacctc gaccgtcgcc 6840 gcgatgcggg cccgcggcct ggccgtcacc gaagggagcc ggacatgaca gccgtcccca 6900 caccggcgac gacgccccct ggcccggcct ccgcgcggtc acgccgggca gcccgccggc 6960 gccgcttcac cggggccgca ctggcggcac cgttcgcact gctgctgctc tgtaccgtgc 7020 tgatcccgat cgggtacgcc ttctacctca gcctcttcgc cgaccgcctc tccgggctcg 7080 gcttcgacgg gtaccgccag gtcctcaccg gcttcgacaa ctacaccgac gtcctcgccg 7140 acccggccgc ccgcgacagc gtggccaacg tcgcccgcta cgccgcgatc cacatccccg 7200 tcatgttcgg cggcgccctg ctcatcgcgc tgctgctcaa ctccgccacc gtacggctgc 7260 gccaactctg gtccctggcg gtcttcctgc cgtacgcggt gcccggtgtg atcgccggtc 7320 tgatctgggg ctacctctac agccccggca tcggcccgct cgccgacgtc ctgccgttcg 7380 acccgttcgg cgagtccgga gtgctgccct cgatcgtcaa catggccacc tggcagtgga 7440 cgggctacaa cgtgatcatc ttctacacgg ccctgcagac cgtgccccgc gacgtgctgg 7500 aggccgcgcg ggccgacgga gccggcgccc tgcgcaccgc gctgtccatc aagatcccca 7560 tgatccgccc gacgatcttc gtcgccctcg tcttcaccac catcggctcc ctccagctgt 7620 tcaccgaacc catggtcctg cgcaccttca ccggcgcggt caccagcacc tggaccccca 7680 gcctctacat ctacgacgcg gccttcatca ggaacgacta cgggcgcgcc gccgccgcgt 7740 ccattctgct cgccctcgcc tcggccctgc tctcggcgct ggtgatgcgg ctgtcctccc 7800 ggaggtcacg atgagtgcga ccgtcaccac ctcaccgccc ctggcgacgc gcggaacatc 7860 cggccgccgc cgcgccgccc ccgacctacc gccgtacggt ccccgcggct cccgctggac 7920 ctcacgcgcc gcggtccacg gcgtgctcct gctcgccgcc ctctacagcg tcctcccgct 7980 ggtgtggctg gtcacctcgg ccaccaaatc cgtcggcgac ttctccgcca ccagcgcctt 8040 cgaactcgcc gacttcaacc tctggggcaa tctgcgcgac ctgttcgccc gggaggacgg 8100 cgtcttcctc cactggatac gcaactcgct gctgtacgcg ggcgtcggag ccgttctggg 8160 cgcgctgatc tgcaccgcct gcggatacgc cgtcgccaaa ctcgacttcc ccggacggcg 8220 cgccctgttc gccgtgaccc tggccggggt cctcgtaccg cccaccgcgc tcgctctgcc 8280 cctgtacctg ctcgcctcga acctgcacct cgtgaacacc ttctgggcgg tgttcctccc 8340 gctgctcagc aaccccttcg gcgtctacct cgcacgcacc ttcgcggacg cagccgtccc 8400 cgacgaggtc ctggaggcgg cacgactcga cggggcgggt gagttccgca tcttcctgac 8460 cgtcgccctg ccgatgatga tgcccggctt cgtcaccatc gtgctgttcc agttcgtcag 8520 catctggaac aacttcttcc tgccgctggt gatgctcacc gaccccgaac tgttccccat 8580 gaccctcggc atctaccagt ggaacacccg ggccccgcag ttccccgact acaaccccct 8640 ggtcatcacg ggatcgctgc tcgccgtcgt accgctgatc atcgccttcg tcgtcctgca 8700 gcgccagtgg cgcagcggcc tggccgcagg gagcgtcaag tgaccgccac cgcgaccccg 8760 tccaccggat ccggggcggc cacggctccc cgcaggcccg agaccctgct gctgatgaac 8820 gaccggaccc ggcacaccca gttcgggccc gaggagttgg accggctgca cgccgtcgcc 8880 tcgctcggac agccgctcgg cgccgcggac ctggactccg gcgccgtccg cgcccgcctc 8940 gccgaggtgg aggtgctgat cacctcctgg ggctgcccca ccctcgacca ccgcgtcctg 9000 cgagccgccc cgcgcctgcg tgccgtgctg cacgcggcgg gatcggtacg gggccatgtc 9060 cccgacgccg tgttcgaccg gggtctgctc gtcaccacgg ccgccgacag caacgccgaa 9120 cccgtcgccc agtacacgct cggcgcgatc ctctgggcgt tcaagaaggt gccgttcctc 9180 gccatggacg cccggcgctc ccgcgaggac tggagctacc tgcaccgcag gggagagctc 9240 agcggccgtg accgcaccgt cgtcctcgtc ggcttctccc gcatcggccg ccgcgtcgtc 9300 gacctcctgc gcaccctgga cctggcccgg gtcctggtcg tcgacccggt ggcggacccc 9360 gccgaggtcg tggccgcggg agcccggccg gcccagctcg cggaggcgct cccgcaggcc 9420 gacgtactca gcctgcacgc accggcactg cccgggaccc ggcacatgat cggagcggca 9480 cagctggccg tgctgccccc cggcgccgtc ctcgtcaaca ccgcccgcgg ctccctcgtc 9540 gacaccgcgg ccctggaggc ggcctgccgc gccggactgc acgccgtcct ggacgtcacc 9600 gaccccgaac ccctgcccgc cgacagcccg ttgtacgacc tccacaacgt cgtcctcact 9660 ccgcacatcg ccgggtccct cggctccgag acccgcacga tggccggcgc cgccctcacc 9720 gaactggagc gctacgccgc cgggctgccc ccactggccc cggtcacccg gcagtccctg 9780 accacgcagg cctgacctgc tccggctccg accggaccct ccacccaccc cagaggagcg 9840 tcatgaacca tcagcatccc ggccgaagga ccgtactgcg ggcgggcggc ctggcaggcc 9900 tcgcggccgc cgccggcctc gccgcgaacc cggcggccgc agcccccgcc gccgcccggc 9960 tcccgcgcat cgacgatctg ggccccgctg tgagccagtt ctccctcatg agcgccgtac 10020 tgaccggcga caccgtccac atcggctccc gcaacatcga acccgtccag atcatctccg 10080 tacacctgcc gacccgaaag gtggtggccc gcaccgagct gtccaacggc cactccatcc 10140 aggcgctcgc cgcggacgac agcggcaggt acctgtacgc cggaatcctc cagaaggcct 10200 ccggcgaccg gcccaacctc ttccgctggg acctgagcac ccccgacgag ccggccgaac 10260 ccctcggcgc catcggcgac cgcgacgtcc gcgccctcgc cgtggcaccc gacggtgtcg 10320 tctacgcggt cggcggcggc agcagcggcg ccccggccct gtgggagtac gaccccgaga 10380 ccggcaggat cagcaacgtg ggaaccccgg atcccagggc caccctcgca cgggccgtcg 10440 cggcgacccg cacccacgcc ttcttcggcg cgggcaccac cttcaacggc ggcggggaca 10500 ccagcagggc cgccctctac gcctacgacc ggtccgccgg gaccttcacc tcgatcgcgc 10560 ccccggagat gctgcgcgac ccgagcatcc gcgacctcgc ggtcctcggg gaccggctcg 10620 ccgtcagcac cgccggttcc acggaggacg cgaaggtcgc cctcatggac ctgaaggacc 10680 tgtcctcgta caagatcgcg acctcgatcg gcaaggtcgc caagtcgttc accatgaccg 10740 gcgacaccgt ccactacgcc aacgaatccg gtctgctcgc ctacctgccg tccgcgaaca 10800 ccgtgacccc cgtcgcgtac gacggccccg gactcggcga gatctggggc gtggacagcc 10860 gcgcgggcaa ggccgtcgtc acctcggcct tcggcttcgt ggccgagatc gacccggcca 10920 ggaggaccgc cgccgtcatc gatctcggca ccgccggcgc ccccatggcc ccgcagacgg 10980 tcatgggcat cgccgccggc ggcggccacg tctacgtcgg cggaaacgcg acgatcgccc 11040 gccacacccc cggccgcgac acggtcgtca agctccgcgc acccggcgag gccaaggacg 11100 ccgtcgtcgt caacggcatc ctgtacaccg gccagtacaa ctccgagggc atctggtgcc 11160 acgacccccg caccggaaag accggccagg tggccgcctt cccgtccgag cagaaccgcc 11220 cgctggacgt caccttcgac gaggacaccg gtctcgtgct cgtcggagtg cagtccgaca 11280 ccgagggcgg cggcgccctc tggacgtatc accccaggac cggccggcaa cggagcttcg 11340 ccgacccggt cgacgaagcg cagtgcgtcc ggggcatcgc gagccggaac ggcgtcgcct 11400 tcctcggcgg cgacaacacc gcccccaccg gaccgcgcag caccgtcgtc gcgttcgacc 11460 cggtggccgg ccgggagctg tggcggatcg acccgcaaca gacggcgggc accgccgccc 11520 tcgcggtacg cggacggcac ctctacggac tgtcccgcaa gggcggcctc ttcgtcatcg 11580 acatcccgcg gcgcgaactg atccaccgcg cggacgtcac ctcggtcagc aacgggttcg 11640 ccgccctggt gaccaaccgc ggtgtcgtct acggcgtctc cgacaccacc gtcttccgct 11700 tccaccccag gaccttcgcc gtctccgtcg tcgtccccga catcgacggc ggctggtaca 11760 gcggcgcgca catcaccaac gacgagcacg gccggctcta caccatgcgg ggccgcaacc 11820 tggtccggat caccgaccgc cccggccact gacgtcgggg tgtctccccc caccccgggc 11880 accccgcgcc atccccccac gccctcccag ggagcttcca tgaagaacgc gcacaagagg 11940 atctgcatcg ccgtctgcct gggcgccgtc gccggcgccg gttacgccac gaccgccacc 12000 gcgacgccgg agaagtcggc ccggccgcag caggcgtccg acctgctcga cgtcgactac 12060 gagtccgggg ccctcgactc cggcatcccc gggctgacca cgacgcacgc caaggcctcg 12120 gacgcctcca cggtcgagag cggcggcgac gggagcgcac actcggtctc gcacaaggtg 12180 acgctgaacg acccggatta cgtctccgac ggcgcacccc gcagcgagag cgcgaacaac 12240 gagatcgaga agtcgctcat ccacgtgggc gacgtgcacc gctacgagtt cagcgtcatg 12300 ctcaaggact gggagaccag cagcagcaag gcgggcgaca tcatcttcca gggcaagcac 12360 gcgggcggga acaagccgtc gttctacctc atggcacagc gcaacgcgat cgcgttccgc 12420 tccccgctcc tcgacctgca ggcgccggtg gtcgaggact tccgccccta tgtcgaccag 12480 tggatgcggt tccgcatcga cgtccgctgg gccgagagca ggaccggcta ctacaaggtg 12540 tccgtccggc tcccgggaga gaaggacttc accctcaaga agacgtacac cgacgtcaac 12600 accttccacc cggagaaccc cacggccttc ggctacatca agtggggcct gtaccgcccc 12660 gcctcctcga cggaagcggg cgatcccgcg acccgcgtgg tccggcacga cgacatccgg 12720 gtgatcgacc tcgggtgagc tcggcgcggg gtgatcgcct gccgcaggcg gtcaccccgc 12780 ggtcacgtcg accagaccac cttgccctgg tgcacgatga ccaccttggc gtcgggcctc 12840 agcaccatct gggcgccgcc aaagtcatgc gtcttggaag cccagatggc ccggtcgtcg 12900 ccgttgtgga tgaccaggtt gccgtcgggc tggaagatcg cccggtggtt ctcgccgaag 12960 gtcatggcgg cccagatcgg cttgttccgc tcgttgtaga cgacgaggtt gccgtcctgc 13020 tgcatcgtca tgcggatgcg gttggtggcc caggactggc cgaccccgat ggaactggtc 13080 gcggagaccg tctgggtgcc ccagtccggc ttcggggccg ccttgggctt cggcttcggt 13140 gaggccttcg gcttctcggc gggggcgctc gtccggggtg cgggcgaagg ggccacgggt 13200 gcgggagcgg ccttcggcgg ggtggtcttc ttctgttccg tcggggacgg cgtgggcttc 13260 accgccacgt agtcgtccag ggccgccggg gccgactcgg ggttgaggac cgtgtcggcg 13320 ctcccggcca ccggtgccgt accgctgtta cggggcttct cgtcgttcgc gctgcccatc 13380 agcagcacgg gtatcgcgac cagtgcggcg ccgacgaacg ccgcccccgc caggaccggt 13440 gcgcgggggc ggcccctgtc ggcagcggtg agggtcttgg tgtccggctt cgcggcgacg 13500 gccgctgcca gggcgatggc ctccgtgcgg ccttcgggtg cttccgtggt tgtggttgtg 13560 gccggggcct gggtctgggc tttttcggta ccggtcgttg cggcgggctc ggtcgggggc 13620 tccccggtgc cggccgtcgt ggcggcctcg ctccggggct tccgcgcctc ggccggggcg 13680 gcggacggcg gggcggcggg gccggactcc tccgtggtgg gcggcaggga agcggtgccg 13740 gacttctccg tggctgccgc cgcggactcg gtgccggggg cggggggctc ggggggcatg 13800 cgctgactcc tcctcggggg cgagcccaac gtagcccgtc ggacgagcgg gagaagccac 13860 tcgcctcgat acgcccctgt cgctttgtca tccctcgccg agcctgtccc ggaaagttcc 13920 tcactcgggc agagaacggg caggtaaacg gcctatacgg gcctgcggcc ggaccccgtg 13980 aacgaggctc gtatgacatc ctgttggggc cgttcggcac tcacatattc gtacggagcc 14040 aagagttcag gtggatgcct ccctcgtgcc ggaagccgtg aaggacgccg cacgccgtgc 14100 gcccggccac tgggtcggca tcgtcgatcc ggagtggacg caggcgcgga cgcccccgga 14160 gtgggccgtg ctgggggagt ggcagtcgga cgagagcggg agcgtgggcg agtaccgcgc 14220 caaccccggc taccgtccct ccgcccgggt cctcggctgg ccggagccca ccgatccggt 14280 ggacgcggcc gcccagcggg ccgccacggg gtacggcacg gtggacgagg cgctggccgc 14340 actcgcggag gcggacgtca ccgtcgtacg cgggcccgac ggcgggccac tcctggccgc 14400 ggggcgggac ggggcgctgg tggcgctcct gttcacctcg cccacccacg cgttcatgtc 14460 cgcggcactt caccatgaca ccgtgtccgc ccgggagctg gccgggtcgc tggcgcagac 14520 cggcgtcctg ctgtcggtca acgccggtgc cgcggctccg ctgctcgttc ccaccgacag 14580 ccttgccggt gccgtgagtt ccggcccgga gaccgcggcc gacggccccg cgccgaccga 14640 accctggccc cacaccacag ggagaacccc gtgacgcgtt cgtcgtccca gcagcccccc 14700 gcctccgctt ccgctcccgc acaggcgaag accgaagccg cgccggccga ggccaccgag 14760 gcggagaagg tcaaggaggt cgaggagggg gagaaggccg agcagggcga gcgctccgag 14820 gcccagtcct ccgagcgcca gtccccccag gtccaggccc aagcccccgg cgccggggcg 14880 gaaaacccca aggcgcccac cgcctccgag accgacccgg accccggcgc ctccgccgcc 14940 gcccagagtc ggctccccgc cctcgtacgg accatgaccg ccaccgccat cgggaagccg 15000 cagcaggagg cggggcccgt ggggcggccg ggcaaggccg cgctcgcggg ggcggcggtc 15060 gtgggcgcgc tgctcgtgtc ggtgcccttc ctcgtgctcg ccgggaacaa cgacgacggg 15120 cccgagcgga cgaaggccgc cggggccggg accgtcctcg acgggagcgg accggaggcg 15180 ccgggcgagt tcgccgtcac cgcgcccgag gccggcgcgc ccgccgagga cagggagaag 15240 agggagaagg acgaggcgaa gccggagaag ggcggcaatc ccgttccggc catccctccg 15300 gggggcggcg gcaaagcgga gacgaaggag gacaacgccc ccaacgaccc gccgaagaag 15360 gccgattcgt ccaaggggaa gtccaaggag cagcccgagg cgggcagcgg cggcggcagg 15420 aaccagccgg ccaaggccca gcccgccgtc acgttcagcg ggcccgtctc cttccgcagc 15480 cacctctccg gccgctgcct cgacgtcccc gggcacaact tcaacgacgg ccagccgctg 15540 ttcatgtggg actgcaacgg cgccgacgcc cagaagtggc gcttcggctc ggacggcacg 15600 atccgggcca gggacaagtg cctggacgtg gccaacgccg acttcgccaa cggctcccgg 15660 atccagctcg cctggtgcaa cggctccgcc gcccagaagt tcaccctgaa cggcgcccac 15720 gacctggtca acaccgtcgt cggcaagtgc gtcgacatcc cgaaccacag caagggccgg 15780 ggcccggaga cctacctgat cctgtgggag tgcacggggc tcgacaacca gaagtggagc 15840 acctgaccca ggcgcgggca gcgagacatg atgagatcgc cggagcgccg aaccctgtcc 15900 ccggcgaaga ggggcgtccg gtcaggacgc cgccgtagca aggaggttgg tgcgtgtcgc 15960 gccaggtact gacggtcggc cccgcggacc gcttttccac gatcggtgag gcgctcgccg 16020 ccgcccgtac cggtgcgctc atcagcgtcc ggcccgggac gtacgcggag aacctggtga 16080 tccacacccg ggtgaccctc accgcagccg aggggcgggg cacggtggag atccggccgc 16140 gttcgggcag cgtcgtcgcg ctgcgcgccg acgccgtcat gctctccgaa ctcaccctgc 16200 gcggcgggga ctccgagctg cccgccgtcg acgtacggcg cgggcaggcc gcgttcgacg 16260 ggtgcgagat cgtcggcgcg gcctggaccg cgatgctggc cggcgggacc gggtccctcg 16320 cgctgcggga ctgccgggtg agcaacccgc ggggcgcggg catcgtggtc acctccgcca 16380 cccccaccac cgtcgagtcc tgcacgctcg aacacctcgg caccagcggc atcgtcctcg 16440 ccgagcaggg cgaggcgcgc gtccgcgact gcacggtgcg gggcgcccgg ggcaacgggc 16500 tgctggccaa cggcgagacc cggggcaccg tcgaggactg cgacatctcc tccaccgaca 16560 agccctccat cgccctggag ggggactccg ccgtctccgt cgtccggacc gtggtgcatg 16620 acaccagcac cggcgtgcat ctgagcagcg cgggccgcac caccctggag gacgtccgcg 16680 tcaccggcgc ctccggcaac gggatcgtcc tcgccgtggg caccgacccc gtactgcgcc 16740 gctgccgtgt ctcgcgcgca cgggggcacg ggctgttcgt caccgaccgg gcgcgcggca 16800 ccttcgagga ctgctgggtg gacggggcac agggcgccgc gctgcgggtc gccggggcct 16860 cctccccggc gctgaccgga ctgaccgtcc gcgactgcga aggggccggg ctgcttctgg 16920 aggaggacgc ggcgcccgag ctggaccgcc tggaggtcat cggctcctcg cccgccgtcg 16980 ctctgcaggg cggcgccaac ccgctgctgc gccgggcccg gctggtcgaa cccgccggtg 17040 acggcatcgc ggccaccaag gacgcccggg gccgcgcaga ggactgcgag atcgtccgcc 17100 cgaagggcgc cggtgtacgg gtggcctccg gctccaccct ctacctggcc ggtggcgggg 17160 tctccgacac ggccaccaac ggcctggtcg tggaggacgg cggcaatgtc accgtccgtg 17220 acttccgcgt cgaaatatcg ggtgaggagg gtgtggtcgt cgccgccggt ggtgaactga 17280 ccgccaaccg caccaccgtc cacgccccca agggacacgg tttcctcctc cgcgagggcg 17340 ctctcgcctc gctcagcggc tgcgaggcca acgggggcgc ccaggacggc ttccgggtcg 17400 agtccaccgc cccggtctcg ctcgtcaact gcaccgcccg cgagaacgag ggcggcggcc 17460 tggtgcagac cgcgcccggc gaacggctcg ccgtggacgg cctgaacagc gtcgggaacg 17520 gcaagcgcga cgcctggggc agcggcagtg ccgagaacac cgacccggcc gggtccggcg 17580 ccgccgacgc gcccccgccg gaccgtgcgg acggcccgct cggcgccctc aacgcgctga 17640 tcggcctgga gaacgtcaag cagcaggtcc gcaccctcgt caacctcacc cagctcgccc 17700 agcgacgcga gcaactcggc atgcccgcac cgccgatgag cagacacctg atcttcgccg 17760 gaccgcccgg caccggtaag accaccgtcg cccgcctcta cggggcgatc ctggccgagc 17820 tgggctcgct gcgcagtgga cacctggtcg aggtctcccg cgcggacctg gtcgcccaag 17880 tcgtcggcgg cactgccatc aagacctccg agaccttcca acgagcgctg ggaggggtcc 17940 tgttcatcga cgaggcgtac accctcaccg ccgacagcgg caacggcgga gccgacttcg 18000 gccgcgaggc cgtggacacc ctgctcaagc tcatggagga ccaccgcgac gacgtggtcg 18060 tggtcgccgc cggatactcc cgcgagatgg aatccttcct cagctccaac ccgggcctcg 18120 cgtcccgctt ctcgcggacc gtcgagttcg agaactactc cgtggacgac ctggtcgcga 18180 tcatggagag catgtgcacc cagcaccagt acgagctggg ggagggcacg gcccaggcgc 18240 tcgccgccca cttcggggcc atggaccggg acgccggatt cggcaacggc cgtgccgcac 18300 gcggggtgtt cgaggagatg gtggaccggc aggcgatccg gctctccgcc caggcccagg 18360 tcagcgagaa cgatctgcgg ctcctgctcc ccgaggacgt ctccgccacc gccgccgcct 18420 cggccgccga gaccgccgta ccggccgacg acccgctcac ccgcctgggc gacatgatcg 18480 gactggccgg ggtgaagcgt gaggtcgccg atctggtcaa cctcatcacc accgcccgcc 18540 accgcgccgc cgccgggctg cccgtcccca ccctcagcaa ccacctggtc ttcaccggcc 18600 cgcccggcac cggcaagacc accgtcgccc ggctctacgg cgaggtgctc acccagctcg 18660 gcgtgctgga gcgcggccag ctgatcgagg ccgcgcgcgc cgacctcgtc ggccgctaca 18720 taggccacac cgcccagttg acccgtgagg tcttcgaaaa ggcccgcggc ggcgtgctgt 18780 tcatcgacga ggcctacacc ctcaccccgc gcggcggcgg cgccgacttc gggcaggagg 18840 cggtggacac cctgctgaag ctgatggagg accaccgcga cgaggtcgtc gtcatcgtcg 18900 ccggatacac cgacgagatg gaacgcttcc tcgcctccaa ccccggcctc tcctcccgct 18960 tcccacgccg gatcgccttc gccgactact cctccgagga actggtcacc atcgtgcgcg 19020 cccaggccgc cgccatgggg tacgagtgcg gccccggcac cggaccgctg ctcaaggagc 19080 acttcgacgc ggtaccccgc gaccggtcct tcggcaacgc ccggctggcc cgccaggtcg 19140 tcgagtcgat ggtcacccgc caggcgggca ggatcagttc gctggccgcg cccaccctgg 19200 acgacctgcg catcctcctc ccggcggacg tcacggccgc ggccccgaag gcggtgcagc 19260 agtgaggccg cccgcgcgac gggcgaccgg gaggccccga gcaggccggc tgttgtacgg 19320 ggtctcgctc gccgccgccc tggtggtgcc ggtggccgta cccgcccagg cggcacctgt 19380 cacccttaca ccggccgctg acggggccaa gggacaggag ctgcccggga tgcccaccgc 19440 gctcgacgcg cgggccgagg ccgtcgcctg cacccccgcc tccaaggagc aggcgaagaa 19500 gcaggactgg tcgcgccagc gcctcgacct ggaccggctg caccggcaca ccaccgggtc 19560 gggggtgacc gtcgcgctga tctccaccgg cgtcgacccc ggggccgagg gactcgacgg 19620 ccgcgtgacc gcccagggcc aggccgccga cgactgcgtc ggacagggga cgttcctggc 19680 cgggctgatc gccgggaccg gcggccccac cccgcgcctc gccggggtcg ccccgggcgc 19740 gaagatcctc gccctgcgcg gcaccgaccg gcgcgggcag ccggaccccg cgctcgtcac 19800 ggcggcggta cgggccgcca ccacggccga ggccgacgtc atcgcggtcg cggtggccct 19860 tccccgtaag gacaccgcgc tcacccgggc cgtcgccgag gcccgcaagg cgggggcggt 19920 ggtggtcgcg tcggccaccc cggagccgcc gtcgcgcggc tcggccgacg agatcccctc 19980 gcgtacctac tggcccgccg gtgagcccgg cgtcctcgcg gtcgccgaca tgctgcccgc 20040 cggggcccgg ccggacgccg ccctccccac cgagggcatc gatctggccg ccccgggcgc 20100 cggagtggtc tccggcgggc cgcgcggcaa ggggcactac ctcggcggcg gggtcgcggt 20160 ggccaccgcg tacgcggccg gggccgtagc cgctgtccgc gccacccacc ccgaggcgac 20220 ggccgacgcg gtggcccgtc ggctgaccgc caccgcgtac ccggccgaca tcccccagct 20280 ggacgtctac gccgccgtca ccacggtcct cggcgacgcg ggcgcgccgg tcggcggtgc 20340 ggagcgggcc gccgaacccg tggccgtacg cgacacctcc gacaccgacc gcgccaccgg 20400 ccgggccgtc ctcttcgtcc tcctcggctc ggcgggcgtc ctctccctcc tctgggccgg 20460 tttcgccgtc acccgggccc gcgcccgggg ctggcgaccg gcgggggcgg gcaccccgga 20520 ccagggctga acgtggaagg ggccccctcc ggccggaggg ggmmccttcc acgttcgctc 20580 ggtcctattc caccagggcc gtctgcacca gccgcggctt gcggcgctgg atgtgcaggg 20640 cccggcccgg cggcaggttc agcggcttcg cgttgccgaa caggcggccc tccgtgggcg 20700 ggcaggagag caggaccgcc gggttgttgg cctcgtccag gcggcggatc aggccgtcgc 20760 tcagaccgcg ccccgctccc atcgcgctgc gggcgacgac caggtgcagg cccatctcgt 20820 agccgagggt cagatgctcg aagagcggct cgaaggggct ctggaacgag ttgcccgaca 20880 ccatgtcgta gtcgtcgacc aggacgaaca ggcgcgggcc cgtccaccag tcgcaccggc 20940 gcatccgggc gggtgagatg tcggccccgg gcacccgggt cttcatcgcg cgggccgcgc 21000 cctcgatggt ctcgttgagg ttgtcgaggg agatgacatg cccgatgcgg tactcctcgg 21060 ggatggcgtc gaccagggtg cggcggtagt ccaccgcgat gatcttcgcc tcctcggggg 21120 cgtaccgggc ggtgatgccc tgcgtgatca ggcgcagcag attggtcttg ccgctctcgg 21180 tgtcgccgac cgcgatcagg tgcggcgtcc ggctgaagtc gtgccagacc ggctccagcg 21240 cgtcctggtc gagaccgagc acgaggcgca tgccgccgcc ctccgtggcc tcgggggagg 21300 ggagttcgga gaccggcagc cggtgcggga gcatccgcac ctgcggggcg gcgggaccgg 21360 accagtgccg ggagatctcg ccgacgaggt gggccacgcc ctcgcccaga tcctccaggg 21420 agccgctgcc gtccagccgg ggcaggcccg cgaggaagtg catcttgctg tcggcggtga 21480 tgccccggcc gccggtgcgc ggcaccgaac gggccttgcg ggtgtcgatc tcggagtcca 21540 tcggatcacc catccgcagt tcgaggcggg tggcggcctg gtcgcggacc tgcgcggaca 21600 gctccaccca gcgggtcgtg gtgatgagca gatggatgcc gtaattgagg ccccgggcgg 21660 cgagttcgtt gaacttcggg atcaggccgt cgtagtcctg gcggaccgtg gaccagccgt 21720 cgaccaccat gaagacatcg ccgaacggct cgtcggggaa ctccccggcg gcgcggcgcc 21780 gccggtagga ctgcatggag tccagcgtgt ggtctacgaa gaactgctca cggcgggcca 21840 gcagcgtcat cacctcggcc accgtccggt gcacccgctc cgggttgagc cgcgccgcga 21900 ctccgccgac gtgcgggagc gcggcgagct gggagaggcc gccgccgccg aagtccaggc 21960 agtagaactg cacttcggcc ggggtgtggg tgagcgcgag ggcggcgatg agggtccggg 22020 cgaccgtgga cttgccgctc tgcgaaccgc ccgcgacggc gacatggccg cccgccccgg 22080 acaggtccac gaccagcgga tcgcgccgct gctcgaacgg cttgtccacc aggccgaccg 22140 gcacccgcag cttccccgtg cccgcccagc ttgccgccat cagcccccgc tccttgtccg 22200 gcgtgatccc gggcagcagc gcgtccagcg gggacggctc gtccagcggc ggcagccaca 22260 cctggtgggc gtccggcccg gagccgcgca gccggtccag cgccacatcg agcagcgcct 22320 cctcgtcctc ggcctcctcc gtctccggct ccgggtcggg cggtgtctcc agggtgcgcg 22380 gcaccaccca tccgctggtc cacggcacca cctggctcgc cacccgggcc tgcaccaccg 22440 caccggtcct gcgccggtac gtccccgagg agtacgcggc acggaaccgg gtcagggcct 22500 ccaccccgga cttcagatag ccgctgccgg gcgcggcggg caactcgtag gcatcgggaa 22560 cgccgagcac gccacggctc tccatcgcgg agaaggtccg cagcccgatg cggtacgaca 22620 ggtggctctc cagctggtgc atacgcccct cgtccaggcg ctgtgaagcg agcagcagat 22680 ggacgcccag ggaccggccg aggcggccga tcatcacgaa cagctccatg aactcccggt 22740 gggtggagag cagttcgctg aactcgtcga ccaccacgaa gaggctgggc agcggtgcca 22800 ggtcggcgcc ggcggcgcgg gcccgctcgt actccagcgc cgaggtgtag ttgcccgccg 22860 cgcgcaacag ctcctggcgg cggatgagtt cgccgtgcag ggcgtcctgc atgcgttcca 22920 ccagggcgac ttcgtcggcc aggttggtga tcacggcgga ggtgtgcggg agttcctcca 22980 ggccgaggaa ggtggcgccg cccttgaagt cgaccaggac gaagttgagg gtctcggagg 23040 agttggtcag ggcgagaccg aggacgaggg tgcgcagcag ctcgctcttg ccggagccgg 23100 tggccccgat cagcatgccg tgcgggccca tgccgccctg cgcggactcc ttgatgtcga 23160 gctcgaccgg gcggccgtcc accccgaccg cgatcggcac ccgcagccgg ccggagccgg 23220 agtgccgggc gaacagggtc cccgggtcgt gccggtgcag atcggggatg ccgagcaggg 23280 tggtcagctc gacatcggtg tccagcggct gcgcgatatc cgtgccgagg ctcatccggc 23340 gcggggtgag cagccgggcc agcgcctccg cgccgagcgg gccgagccgg tcggggcggc 23400 cgagcggcac cgtgcgctcc ttgcggctgc ggtcggtgcg caccaggttc acctggccgg 23460 gccccacggt gaggcgcagc gtgttgcggc cgggccgcca gcgcagtgcc ccggacacgt 23520 ccaggatcag ggcgttgcgg tagccgtggc cctcccagcg gtggccctcc gggacgctga 23580 cgccgtccag gacgacgacg gtgtacggct cgtcgcggcc gggccgggcg tccgggtcga 23640 acccggggcg ctcggcgaac tcggcgccga gcagatcgtc cagctcggtg aggtctgcgg 23700 tgatccggcg ggcctgcccc gccccgtcct cctcgtgcgg atccagcacg tgcggcagcc 23760 acttgaccca ctcccagtcg gcccgccgtt cgtcgctgac gcagaacgcg atccacagct 23820 cctcgggcgc gtggaacacc gccaactgcc cgagcatcgc ccgcaccagg gcccgtacgg 23880 cgtcgtgctc cgggggatga gcgccgggcg tggcaccgtc cggcgcctcc tccggacgca 23940 gcaggatcc 23949 <210> 107 <211> 2868 <212> DNA <213> Streptomyces roseosporus <400> 107 tcagcacgcg cccgccgggc ggtcccgctt cacgacgttc gtgtaaccgg tcgtgccgtc 60 cagccagacg acgcgcttgc cctcgtcggc cgaggcgtag acctggtcgc cgcggttgca 120 ggacacgcgc tgggcgccgc ccttgccgtc gggtgccacc tggaacagct tcggcagggt 180 ctcgttggcc catgaggtgg ccggcggcag cgaggtgacg ttgaccgcgt cgtcggaggc 240 cgtcagctgg taggcgtgca gggagccttg gccggtttcg gggacgaccg tggtgcggtt 300 cgtgccgtcg gcgtcggcgc gcacgacggc ggccttggcg gggtcggtgc cggcgccgtc 360 ctcgatccag aagacaccgt cgtcggtgaa ggccgtctgg ccgatgccct gcgcgccctc 420 ggctccggcc ggcatcatcc gggtggtgcc ggtggcggtg tccaggaccc cgatgcccag 480 ttggacgtcg ctgccgtcga tccacatcgt ggcgtaggcg atcttcccgt cccggatcga 540 gggcatggcc gtgacctcga tgcccttggc gaggatcatg cccgcctccc gggtcctgat 600 gttgatgtag ccgatctgct gccggccggt ctgcgggttc gtcaccgtgt aggcgaggaa 660 gtcgccttcg aggacgagct gcgagacatt ggctccgacg ccgccgacga ccctggccgg 720 gccgccgccc accggacgga catggaagag gaccgacccc ggggagaact cggcccaggc 780 gacgttcttg ccgtccgtcg tcgcgtagac gttgtagttg ccgttgttgc cgctcaccag 840 ctgcggcttg cccttgccgt cggtgttgcc gagccacacc gagtacggtt cgctgccttc 900 ctcgtcggag cgggagacgg cgtacttgcc accgccggcg ccgacgccgg tgcccgccac 960 gttgaccttg gacacgaggg tgtccgtgtc gacaccgagc gccttctccc agccggggac 1020 gatgccgtgc gcgtcgaacg aacgcttcac gatcttcgtc tgcgccttgg tggcgcccag 1080 ctcctgcgct gcggcgatga ccgccgcgcg gccctcggtg aagccgtcga gcggcgtcat 1140 gtacgcggac agcgcgcggt agacgatctg gtcggccggc tcggcgccga ggtcctcgcg 1200 catgtcccac agggcgcccg agaagatcgt ggagttgagg tgtacgccac cgttgtcgcc 1260 gttgtggctg acgccgatga agtccttcga cgtggtggca ccgtcgttga ggtcccgcag 1320 cgcgcagtcg cgcgggccga gcgtggtgca caggtcctcg ccgagcagac cggcgtccgg 1380 gtcgtccatc gaccggccgt cggcctccag gtcgatggcg ttgccgaagt agtcggctat 1440 cgcctcgttc acggcgccgg actggcccgc gtacaccagg ttcgcggtgt gctcgatgac 1500 accgtgcgtc atctcgtggc cgaccacgtc ggtgtccgcc gagaaggtgc ggtagtcgcc 1560 gccgccctgg ccgtacacca tcttggtgcc gtcccagaag gcgttgttga acggcttccc 1620 gccgttcacc acacccacga gcgagtacat gaacccgtcc ttgccgtcca ggctcttacg 1680 gccgaagtgg ttcttgtagt agtcgtagac cttcccggcc gcccagtggg cgtccaccgc 1740 cccggagtcg gtgaactcct tgcccaggtc gggggtgtcc gagcggaacg tctggatgcc 1800 gctgggccac gtgccggacg ccgtggcggc ctcccggcca cgcgcgtccc aggtcgacag 1860 cagcggaccg tcgtacgggc tgtcggcgcc ccgcttgctg tagtcgtaca tctggtaggc 1920 gccgtcggcg ccctggtaca ggttgatctc ggcctcctcg ccgttgtagc gggtgcccga 1980 gcccttgacg accagctgct gcgtggcctc cgcggtggcg tcggccgtgg gcgcgtcgcc 2040 ggtggcgccg ctgctcgtac cggcgcccga acccggtgcg ccgaacgact tgatgccgct 2100 gtactgcatc acggggaagc cggagtgggc gtcgatgtac acctcctgct tcaccggcgt 2160 gccgtcggcc gggctgacgc cggtgacggt gatgtgccgg gtcagcacac cggatccctg 2220 gggcaggacg gtcacgtcac cggccgtacc cgacagctga accccgccgg gcttctcgcc 2280 cttggccggg gccctgagca ggcccccgcc cagctgcgcg gagacggcgc cgaccgcgcg 2340 ctcgatcgcg gtcttctcgg agacctccgg cgtcaccgtg tcgagcttca gctcggtgaa 2400 gtagctgccg gacgtgccgg tgacggtgcg cttgccgtcc ttcttcgtca tccggaccag 2460 gtactggccg ccgaggaccg tgacgccgcg gtacttctgc tggagacgga ccgtctccct 2520 gccgcccctc ccggtcgtgg tcccggccgc ggccaggtcc ttcgccgagg tgtgcgcgat 2580 gcggtagcgg ctcttcttcg ccttgaggtg gccacgggcg gcgtccgccg cggtgccggt 2640 ggcgtcggcc tcctcgttga gtcccgtgac gagcgagggg gtcccggtcc cggcacccgg 2700 cgtcacctcg gacgcggcgg acgtggtggc ggtgtccgcg tgagcggcgg gcgtggccgt 2760 catcaacagg cccgcggcgg ccagtaccgc caccacgccc tggccgacga acgtggtgcc 2820 ggacccctga cctggtccgg ccgatctgct gcgcgatgaa ctccgcac 2868 <210> 108 <211> 955 <212> PRT <213> Streptomyces roseosporus <400> 108 Val Arg Ser Ser Ser Arg Ser Arg Ser Ala Gly Pro Gly Gln Gly Ser 1 5 10 15 Gly Thr Thr Phe Val Gly Gln Gly Val Val Ala Val Leu Ala Ala Ala 20 25 30 Gly Leu Leu Met Thr Ala Thr Pro Ala Ala His Ala Asp Thr Ala Thr 35 40 45 Thr Ser Ala Ala Ser Glu Val Thr Pro Gly Ala Gly Thr Gly Thr Pro 50 55 60 Ser Leu Val Thr Gly Leu Asn Glu Glu Ala Asp Ala Thr Gly Thr Ala 65 70 75 80 Ala Asp Ala Ala Arg Gly His Leu Lys Ala Lys Lys Ser Arg Tyr Arg 85 90 95 Ile Ala His Thr Ser Ala Lys Asp Leu Ala Ala Ala Gly Thr Thr Thr 100 105 110 Gly Arg Gly Gly Arg Glu Thr Val Arg Leu Gln Gln Lys Tyr Arg Gly 115 120 125 Val Thr Val Leu Gly Gly Gln Tyr Leu Val Arg Met Thr Lys Lys Asp 130 135 140 Gly Lys Arg Thr Val Thr Gly Thr Ser Gly Ser Tyr Phe Thr Glu Leu 145 150 155 160 Lys Leu Asp Thr Val Thr Pro Glu Val Ser Glu Lys Thr Ala Ile Glu 165 170 175 Arg Ala Val Gly Ala Val Ser Ala Gln Leu Gly Gly Gly Leu Leu Arg 180 185 190 Ala Pro Ala Lys Gly Glu Lys Pro Gly Gly Val Gln Leu Ser Gly Thr 195 200 205 Ala Gly Asp Val Thr Val Leu Pro Gln Gly Ser Gly Val Leu Thr Arg 210 215 220 His Ile Thr Val Thr Gly Val Ser Pro Ala Asp Gly Thr Pro Val Lys 225 230 235 240 Gln Glu Val Tyr Ile Asp Ala His Ser Gly Phe Pro Val Met Gln Tyr 245 250 255 Ser Gly Ile Lys Ser Phe Gly Ala Pro Gly Ser Gly Ala Gly Thr Ser 260 265 270 Ser Gly Ala Thr Gly Asp Ala Pro Thr Ala Asp Ala Thr Ala Glu Ala 275 280 285 Thr Gln Gln Leu Val Val Lys Gly Ser Gly Thr Arg Tyr Asn Gly Glu 290 295 300 Glu Ala Glu Ile Asn Leu Tyr Gln Gly Ala Asp Gly Ala Tyr Gln Met 305 310 315 320 Tyr Asp Tyr Ser Lys Arg Gly Ala Asp Ser Pro Tyr Asp Gly Pro Leu 325 330 335 Leu Ser Thr Trp Asp Ala Arg Gly Arg Glu Ala Ala Thr Ala Ser Gly 340 345 350 Thr Trp Pro Ser Gly Ile Gln Thr Phe Arg Ser Asp Thr Pro Asp Leu 355 360 365 Gly Lys Glu Phe Thr Asp Ser Gly Ala Val Asp Ala His Trp Ala Ala 370 375 380 Gly Lys Val Tyr Asp Tyr Tyr Lys Asn His Phe Gly Arg Lys Ser Leu 385 390 395 400 Asp Gly Lys Asp Gly Phe Met Tyr Ser Leu Val Gly Val Val Asn Gly 405 410 415 Gly Lys Pro Phe Asn Asn Ala Phe Trp Asp Gly Thr Lys Met Val Tyr 420 425 430 Gly Gln Gly Gly Gly Asp Tyr Arg Thr Phe Ser Ala Asp Thr Asp Val 435 440 445 Val Gly His Glu Met Thr His Gly Val Ile Glu His Thr Ala Asn Leu 450 455 460 Val Tyr Ala Gly Gln Ser Gly Ala Val Asn Glu Ala Ile Ala Asp Tyr 465 470 475 480 Phe Gly Asn Ala Ile Asp Leu Glu Ala Asp Gly Arg Ser Met Asp Asp 485 490 495 Pro Asp Ala Gly Leu Leu Gly Glu Asp Leu Cys Thr Thr Leu Gly Pro 500 505 510 Arg Asp Cys Ala Leu Arg Asp Leu Asn Asp Gly Ala Thr Thr Ser Lys 515 520 525 Asp Phe Ile Gly Val Ser His Asn Gly Asp Asn Gly Gly Val His Leu 530 535 540 Asn Ser Thr Ile Phe Ser Gly Ala Leu Trp Asp Met Arg Glu Asp Leu 545 550 555 560 Gly Ala Glu Pro Ala Asp Gln Ile Val Tyr Arg Ala Leu Ser Ala Tyr 565 570 575 Met Thr Pro Leu Asp Gly Phe Thr Glu Gly Arg Ala Ala Val Ile Ala 580 585 590 Ala Ala Gln Glu Leu Gly Ala Thr Lys Ala Gln Thr Lys Ile Val Lys 595 600 605 Arg Ser Phe Asp Ala His Gly Ile Val Pro Gly Trp Glu Lys Ala Leu 610 615 620 Gly Val Asp Thr Asp Thr Leu Val Ser Lys Val Asn Val Ala Gly Thr 625 630 635 640 Gly Val Gly Ala Gly Gly Gly Lys Tyr Ala Val Ser Arg Ser Asp Glu 645 650 655 Glu Gly Ser Glu Pro Tyr Ser Val Trp Leu Gly Asn Thr Asp Gly Lys 660 665 670 Gly Lys Pro Gln Leu Val Ser Gly Asn Asn Gly Asn Tyr Asn Val Tyr 675 680 685 Ala Thr Thr Asp Gly Lys Asn Val Ala Trp Ala Glu Phe Ser Pro Gly 690 695 700 Ser Val Leu Phe His Val Arg Pro Val Gly Gly Gly Pro Ala Arg Val 705 710 715 720 Val Gly Gly Val Gly Ala Asn Val Ser Gln Leu Val Leu Glu Gly Asp 725 730 735 Phe Leu Ala Tyr Thr Val Thr Asn Pro Gln Thr Gly Arg Gln Gln Ile 740 745 750 Gly Tyr Ile Asn Ile Arg Thr Arg Glu Ala Gly Met Ile Leu Ala Lys 755 760 765 Gly Ile Glu Val Thr Ala Met Pro Ser Ile Arg Asp Gly Lys Ile Ala 770 775 780 Tyr Ala Thr Met Trp Ile Asp Gly Ser Asp Val Gln Leu Gly Ile Gly 785 790 795 800 Val Leu Asp Thr Ala Thr Gly Thr Thr Arg Met Met Pro Ala Gly Ala 805 810 815 Glu Gly Ala Gln Gly Ile Gly Gln Thr Ala Phe Thr Asp Asp Gly Val 820 825 830 Phe Trp Ile Glu Asp Gly Ala Gly Thr Asp Pro Ala Lys Ala Ala Val 835 840 845 Val Arg Ala Asp Ala Asp Gly Thr Asn Arg Thr Thr Val Val Pro Glu 850 855 860 Thr Gly Gln Gly Ser Leu His Ala Tyr Gln Leu Thr Ala Ser Asp Asp 865 870 875 880 Ala Val Asn Val Thr Ser Leu Pro Pro Ala Thr Ser Trp Ala Asn Glu 885 890 895 Thr Leu Pro Lys Leu Phe Gln Val Ala Pro Asp Gly Lys Gly Gly Ala 900 905 910 Gln Arg Val Ser Cys Asn Arg Gly Asp Gln Val Tyr Ala Ser Ala Asp 915 920 925 Glu Gly Lys Arg Val Val Trp Leu Asp Gly Thr Thr Gly Tyr Thr Asn 930 935 940 Val Val Lys Arg Asp Arg Pro Ala Gly Ala Cys 945 950 955 <210> 109 <211> 1026 <212> DNA <213> Streptomyces roseosporus <400> 109 gtgacaattc cgccggtggg gcggactggg tgggacacgc aatggcaggc gctcgggctc 60 ggagcggacg aactccgggt gtacgaagcg ctcctcgacg cacccgtacc cgcctcccgt 120 accgccctcg cccagcacct ggggctgacc gtgcgccggg tcacgaacgc cctggatcac 180 ctggccgagc gccgcttcac ccacccggcc cggggcgccg ggctgcccgt ggccatggcc 240 cccgccaccg ccctgcgcaa tctgatccat ctgcaccagg cggaactcct gcaccgatcg 300 gcggagttgg aggagctcag cggatccgtc gaccggatcg cggcccaact gctgagctcc 360 gtgcacaccc cccgcgccac cggcatcgag acggtccgcg gcggagcggc gatcgccgcc 420 cgggtggcct ccctgctggt gtcggcgagc gaggagatcg ccctcctgga ccggccgccg 480 tacgcgtcga gcgagccgga cgggatgccc gtccccctcg acatggccga accggtacgt 540 cggggggtac gcgtccgggt cgtggtggac cgcgaggggc tgagcttcca cgggcgcgcc 600 cgcggcctgg gcgatctggc cgtgcagggg gtgcagatcc gggtgggcac ggatctgccg 660 acgaagctga tcacggtcga ccggcgggtg accctcctgc cgccgacgga cgcggcggac 720 ccgacggcct ccgcactggt ggtgagcgac gcgctgctga gcaacgcgct ggtgccgctg 780 ttcgagtcgg tctgggaacg ggcgctcccc atcggctccg tgacgcatga tcagatcacg 840 gacggcgacc gggagttgct gacgatgctc gcctccggcc tgaaggacga ggcgatggcc 900 cggcgcctcg acatccatgt gcacacggtc cggcgccgca tcacccgtct gatgcaggtc 960 ctcaacgcgg agacccgttt ccaggccggg gtacaggccg cgctccgggg ctggctcacc 1020 gggtga 1026 <210> 110 <211> 341 <212> PRT <213> Streptomyces roseosporus <400> 110 Val Thr Ile Pro Pro Val Gly Arg Thr Gly Trp Asp Thr Gln Trp Gln 1 5 10 15 Ala Leu Gly Leu Gly Ala Asp Glu Leu Arg Val Tyr Glu Ala Leu Leu 20 25 30 Asp Ala Pro Val Pro Ala Ser Arg Thr Ala Leu Ala Gln His Leu Gly 35 40 45 Leu Thr Val Arg Arg Val Thr Asn Ala Leu Asp His Leu Ala Glu Arg 50 55 60 Arg Phe Thr His Pro Ala Arg Gly Ala Gly Leu Pro Val Ala Met Ala 65 70 75 80 Pro Ala Thr Ala Leu Arg Asn Leu Ile His Leu His Gln Ala Glu Leu 85 90 95 Leu His Arg Ser Ala Glu Leu Glu Glu Leu Ser Gly Ser Val Asp Arg 100 105 110 Ile Ala Ala Gln Leu Leu Ser Ser Val His Thr Pro Arg Ala Thr Gly 115 120 125 Ile Glu Thr Val Arg Gly Gly Ala Ala Ile Ala Ala Arg Val Ala Ser 130 135 140 Leu Leu Val Ser Ala Ser Glu Glu Ile Ala Leu Leu Asp Arg Pro Pro 145 150 155 160 Tyr Ala Ser Ser Glu Pro Asp Gly Met Pro Val Pro Leu Asp Met Ala 165 170 175 Glu Pro Val Arg Arg Gly Val Arg Val Arg Val Val Val Asp Arg Glu 180 185 190 Gly Leu Ser Phe His Gly Arg Ala Arg Gly Leu Gly Asp Leu Ala Val 195 200 205 Gln Gly Val Gln Ile Arg Val Gly Thr Asp Leu Pro Thr Lys Leu Ile 210 215 220 Thr Val Asp Arg Arg Val Thr Leu Leu Pro Pro Thr Asp Ala Ala Asp 225 230 235 240 Pro Thr Ala Ser Ala Leu Val Val Ser Asp Ala Leu Leu Ser Asn Ala 245 250 255 Leu Val Pro Leu Phe Glu Ser Val Trp Glu Arg Ala Leu Pro Ile Gly 260 265 270 Ser Val Thr His Asp Gln Ile Thr Asp Gly Asp Arg Glu Leu Leu Thr 275 280 285 Met Leu Ala Ser Gly Leu Lys Asp Glu Ala Met Ala Arg Arg Leu Asp 290 295 300 Ile His Val His Thr Val Arg Arg Arg Ile Thr Arg Leu Met Gln Val 305 310 315 320 Leu Asn Ala Glu Thr Arg Phe Gln Ala Gly Val Gln Ala Ala Leu Arg 325 330 335 Gly Trp Leu Thr Gly 340 <210> 111 <211> 1116 <212> DNA <213> Streptomyces roseosporus <400> 111 tcaccgtccc gccgagacgg gcgcggtgcc gccgcaggac gcacggatga tcaggttggg 60 ccacaactcg actcggtgca ccgggcgttc gacgggatcg acggcgcgtg ccagggccat 120 ttcggcggcc aggacgccga gccggtgctt ctgcgggcgc acggcggtca ggggagggtc 180 ggcggcggct gccacctcgt cgtcgtaggt gatgacggcg aggtcctcgg ggaccgcgag 240 tccgtgttcg tgggcgcgct ccaccaggcc gacggcctca ccgtcggagt ggacgaacag 300 ggcggtggcg ccggcctcgc ggcagctgcg gagggccgcg tcgtaggcgt ccgcccagcc 360 gggggagccg tacgacggta cgtcgtgtgc gaggccgtcg ccggagggca ggccgagaga 420 ggcggtggtc tcctgccacc cctcgcgcag ggccttggtg gtggggctga agcgcgcggt 480 gacgaaggcg atacggtgat ggcccagggt gaccagatgc cgtacggcca ggcccgcgcc 540 gaggctgtgg gcggtggtga cggcgtcgag cggcagggtg ggcagagcgg gcggcggcag 600 ccgttcgacg aggatgacgg ggacgttcag cgagcccagc cagcgcagca ggtcctggcc 660 ggcctcgccg gtgttggtgg gggcgacgag cagcgtgcgc acaccgcggt cgaggaggcc 720 ggtgacctgg cggcggtcct ccgccgcgtc gtaggcggaa gcgcgcagga ccagccgtcc 780 cccggcggcg gccaccgccg actgggcgcc ctggatgacc gccggccagt agtactcgac 840 ggtggggacg accatgccga cgaacgcctg gtcgggcagg cggccgtggg tgaacacgcc 900 ccgggtggcc cgctcgtcgg ccgtcggccc gcgatagggg agggtgacgc ctccgtggac 960 gcgcgacacc agcccccggt cggccaggat cgtgacgtcc cggcggaccg tcacggcggt 1020 gacgcccagc cgctcgacca gatcggccag gcgcacggtg ccgcgttccc gcacggtggc 1080 gaggatgaac tcctgccgtt ccgatgcgag tgccat 1116 <210> 112 <211> 371 <212> PRT <213> Streptomyces roseosporus <400> 112 Met Ala Leu Ala Ser Glu Arg Gln Glu Phe Ile Leu Ala Thr Val Arg 1 5 10 15 Glu Arg Gly Thr Val Arg Leu Ala Asp Leu Val Glu Arg Leu Gly Val 20 25 30 Thr Ala Val Thr Val Arg Arg Asp Val Thr Ile Leu Ala Asp Arg Gly 35 40 45 Leu Val Ser Arg Val His Gly Gly Val Thr Leu Pro Tyr Arg Gly Pro 50 55 60 Thr Ala Asp Glu Arg Ala Thr Arg Gly Val Phe Thr His Gly Arg Leu 65 70 75 80 Pro Asp Gln Ala Phe Val Gly Met Val Val Pro Thr Val Glu Tyr Tyr 85 90 95 Trp Pro Ala Val Ile Gln Gly Ala Gln Ser Ala Val Ala Ala Ala Gly 100 105 110 Gly Arg Leu Val Leu Arg Ala Ser Ala Tyr Asp Ala Ala Glu Asp Arg 115 120 125 Arg Gln Val Thr Gly Leu Leu Asp Arg Gly Val Arg Thr Leu Leu Val 130 135 140 Ala Pro Thr Asn Thr Gly Glu Ala Gly Gln Asp Leu Leu Arg Trp Leu 145 150 155 160 Gly Ser Leu Asn Val Pro Val Ile Leu Val Glu Arg Leu Pro Pro Pro 165 170 175 Ala Leu Pro Thr Leu Pro Leu Asp Ala Val Thr Thr Ala His Ser Leu 180 185 190 Gly Ala Gly Leu Ala Val Arg His Leu Val Thr Leu Gly His His Arg 195 200 205 Ile Ala Phe Val Thr Ala Arg Phe Ser Pro Thr Thr Lys Ala Leu Arg 210 215 220 Glu Gly Trp Gln Glu Thr Thr Ala Ser Leu Gly Leu Pro Ser Gly Asp 225 230 235 240 Gly Leu Ala His Asp Val Pro Ser Tyr Gly Ser Pro Gly Trp Ala Asp 245 250 255 Ala Tyr Asp Ala Ala Leu Arg Ser Cys Arg Glu Ala Gly Ala Thr Ala 260 265 270 Leu Phe Val His Ser Asp Gly Glu Ala Val Gly Leu Val Glu Arg Ala 275 280 285 His Glu His Gly Leu Ala Val Pro Glu Asp Leu Ala Val Ile Thr Tyr 290 295 300 Asp Asp Glu Val Ala Ala Ala Ala Asp Pro Pro Leu Thr Ala Val Arg 305 310 315 320 Pro Gln Lys His Arg Leu Gly Val Leu Ala Ala Glu Met Ala Leu Ala 325 330 335 Arg Ala Val Asp Pro Val Glu Arg Pro Val His Arg Val Glu Leu Trp 340 345 350 Pro Asn Leu Ile Ile Arg Ala Ser Cys Gly Gly Thr Ala Pro Val Ser 355 360 365 Ala Gly Arg 370 <210> 113 <211> 1353 <212> DNA <213> Streptomyces roseosporus <400> 113 gtgctcggct tctcctccga cgccggtgac agcgcacacg cccctcggac gcaccgatcg 60 cggaggtccc tgctgcggac ctccgcgggc ctgggggcag cgcttctcgc cggcggcaca 120 ctcaccggct gttcgggccg gacctccgga accgtccggg tccgtatgtg gtcgtggctg 180 accggcatgg accggtacgt cgccgcgttc aactcctccc agcgcgacgt ccgggtcgac 240 ctgagcgtga tcgccgccgg tacgtccggg ggctacgccc agcagaccaa cgcgatccgc 300 gcccacaacg ccccggacat cctgcacgtc gagtaccagg ccctgccgca gatcgcgacc 360 accggcgggc tgcgcgatct gagcgcggac gtggacgatc tcgccgacgg cttcctgccc 420 gccgcgtggc agagcgtccg ccccggcggg aagacctggg cggtgcccat ggacttctgc 480 ccgatggcgt tcttctaccg caaggacctg ttcgaccggg ccggcatcgg agtgccccgt 540 acctgggagg agttccgccg ggccgcctcg gccgtccgca cggccgaccg ggatgcgcgg 600 atcaccacct tcccgctcaa cgacggcgcc ttcttcgccg ggatggcctg ccaggccggc 660 gacccctggt gggacatcgc cgggaacgcg tggcgggtcg ggatcgacgg cgcgggcacg 720 atgcgcgtgg ccgagtactg gcaggacatg gtgtcctccg gtcttgccgc gcgcgacgcc 780 accggcaccc agagctggat ctccgcgatg caccacggcc ggctctgggg gatgctcggg 840 gccacctggg gcgtgggcat gctgaagaag tccctgcccg cccaccargg ccgctgggcg 900 gtcgcacccc tgcccacctg gggcgacgac ccgtccaccg gggtctgggg agggtcggcg 960 ttcggggtct ccgccgagag cgaggtgccc gaggccgccc tgacgttcct gcgctggctc 1020 agcaccgacc ccgcggttcc ccggatcggc tcggmgttca ccttcccctc gcccgctttc 1080 ctcgccaacc ggaaggtggc ccgtaccgcc tacgaggacg ggtacttcac cggcgacccc 1140 gtcttcgacg tgctggacga gtccgcgacc cgggtccccg ggtggacgtg gggcccgacc 1200 tcgctgagca ccttcgccac gatcgccgag gcgctcggcc cggtctccac cggagccacc 1260 accatccccc gggcgctgca ccgggttcac acctcgaccg tcgccgcgat gcgggcccgc 1320 ggcctggccg tcaccgaagg gagccggaca tga 1353 <210> 114 <211> 450 <212> PRT <213> Streptomyces roseosporus <400> 114 Val Leu Gly Phe Ser Ser Asp Ala Gly Asp Ser Ala His Ala Pro Arg 1 5 10 15 Thr His Arg Ser Arg Arg Ser Leu Leu Arg Thr Ser Ala Gly Leu Gly 20 25 30 Ala Ala Leu Leu Ala Gly Gly Thr Leu Thr Gly Cys Ser Gly Arg Thr 35 40 45 Ser Gly Thr Val Arg Val Arg Met Trp Ser Trp Leu Thr Gly Met Asp 50 55 60 Arg Tyr Val Ala Ala Phe Asn Ser Ser Gln Arg Asp Val Arg Val Asp 65 70 75 80 Leu Ser Val Ile Ala Ala Gly Thr Ser Gly Gly Tyr Ala Gln Gln Thr 85 90 95 Asn Ala Ile Arg Ala His Asn Ala Pro Asp Ile Leu His Val Glu Tyr 100 105 110 Gln Ala Leu Pro Gln Ile Ala Thr Thr Gly Gly Leu Arg Asp Leu Ser 115 120 125 Ala Asp Val Asp Asp Leu Ala Asp Gly Phe Leu Pro Ala Ala Trp Gln 130 135 140 Ser Val Arg Pro Gly Gly Lys Thr Trp Ala Val Pro Met Asp Phe Cys 145 150 155 160 Pro Met Ala Phe Phe Tyr Arg Lys Asp Leu Phe Asp Arg Ala Gly Ile 165 170 175 Gly Val Pro Arg Thr Trp Glu Glu Phe Arg Arg Ala Ala Ser Ala Val 180 185 190 Arg Thr Ala Asp Arg Asp Ala Arg Ile Thr Thr Phe Pro Leu Asn Asp 195 200 205 Gly Ala Phe Phe Ala Gly Met Ala Cys Gln Ala Gly Asp Pro Trp Trp 210 215 220 Asp Ile Ala Gly Asn Ala Trp Arg Val Gly Ile Asp Gly Ala Gly Thr 225 230 235 240 Met Arg Val Ala Glu Tyr Trp Gln Asp Met Val Ser Ser Gly Leu Ala 245 250 255 Ala Arg Asp Ala Thr Gly Thr Gln Ser Trp Ile Ser Ala Met His His 260 265 270 Gly Arg Leu Trp Gly Met Leu Gly Ala Thr Trp Gly Val Gly Met Leu 275 280 285 Lys Lys Ser Leu Pro Ala His Gln Gly Arg Trp Ala Val Ala Pro Leu 290 295 300 Pro Thr Trp Gly Asp Asp Pro Ser Thr Gly Val Trp Gly Gly Ser Ala 305 310 315 320 Phe Gly Val Ser Ala Glu Ser Glu Val Pro Glu Ala Ala Leu Thr Phe 325 330 335 Leu Arg Trp Leu Ser Thr Asp Pro Ala Val Pro Arg Ile Gly Ser Glu 340 345 350 Phe Thr Phe Pro Ser Pro Ala Phe Leu Ala Asn Arg Lys Val Ala Arg 355 360 365 Thr Ala Tyr Glu Asp Gly Tyr Phe Thr Gly Asp Pro Val Phe Asp Val 370 375 380 Leu Asp Glu Ser Ala Thr Arg Val Pro Gly Trp Thr Trp Gly Pro Thr 385 390 395 400 Ser Leu Ser Thr Phe Ala Thr Ile Ala Glu Ala Leu Gly Pro Val Ser 405 410 415 Thr Gly Ala Thr Thr Ile Pro Arg Ala Leu His Arg Val His Thr Ser 420 425 430 Thr Val Ala Ala Met Arg Ala Arg Gly Leu Ala Val Thr Glu Gly Ser 435 440 445 Arg Thr 450 <210> 115 <211> 798 <212> DNA <213> Streptomyces roseosporus <400> 115 gtgctgatcc cgatcgggta cgccttctac ctcagcctct tcgccgaccg cctctccggg 60 ctcggcttcg acgggtaccg ccaggtcctc accggcttcg acaactacac cgacgtcctc 120 gccgacccgg ccgcccgcga cagcgtggcc aacgtcgccc gctacgccgc gatccacatc 180 cccgtcatgt tcggcggcgc cctgctcatc gcgctgctgc tcaactccgc caccgtacgg 240 ctgcgccaac tctggtccct ggcggtcttc ctgccgtacg cggtgcccgg tgtgatcgcc 300 ggtctgatct ggggctacct ctacagcccc ggcatcggcc cgctcgccga cgtcctgccg 360 ttcgacccgt tcggcgagtc cggagtgctg ccctcgatcg tcaacatggc cacctggcag 420 tggacgggct acaacgtgat catcttctac acggccctgc agaccgtgcc ccgcgacgtg 480 ctggaggccg cgcgggccga cggagccggc gccctgcgca ccgcgctgtc catcaagatc 540 cccatgatcc gcccgacgat cttcgtcgcc ctcgtcttca ccaccatcgg ctccctccag 600 ctgttcaccg aacccatggt cctgcgcacc ttcaccggcg cggtcaccag cacctggacc 660 cccagcctct acatctacga cgcggccttc atcaggaacg actacgggcg cgccgccgcc 720 gcgtccattc tgctcgccct cgcctcggcc ctgctctcgg cgctggtgat gcggctgtcc 780 tcccggaggt cacgatga 798 <210> 116 <211> 265 <212> PRT <213> Streptomyces roseosporus <400> 116 Val Leu Ile Pro Ile Gly Tyr Ala Phe Tyr Leu Ser Leu Phe Ala Asp 1 5 10 15 Arg Leu Ser Gly Leu Gly Phe Asp Gly Tyr Arg Gln Val Leu Thr Gly 20 25 30 Phe Asp Asn Tyr Thr Asp Val Leu Ala Asp Pro Ala Ala Arg Asp Ser 35 40 45 Val Ala Asn Val Ala Arg Tyr Ala Ala Ile His Ile Pro Val Met Phe 50 55 60 Gly Gly Ala Leu Leu Ile Ala Leu Leu Leu Asn Ser Ala Thr Val Arg 65 70 75 80 Leu Arg Gln Leu Trp Ser Leu Ala Val Phe Leu Pro Tyr Ala Val Pro 85 90 95 Gly Val Ile Ala Gly Leu Ile Trp Gly Tyr Leu Tyr Ser Pro Gly Ile 100 105 110 Gly Pro Leu Ala Asp Val Leu Pro Phe Asp Pro Phe Gly Glu Ser Gly 115 120 125 Val Leu Pro Ser Ile Val Asn Met Ala Thr Trp Gln Trp Thr Gly Tyr 130 135 140 Asn Val Ile Ile Phe Tyr Thr Ala Leu Gln Thr Val Pro Arg Asp Val 145 150 155 160 Leu Glu Ala Ala Arg Ala Asp Gly Ala Gly Ala Leu Arg Thr Ala Leu 165 170 175 Ser Ile Lys Ile Pro Met Ile Arg Pro Thr Ile Phe Val Ala Leu Val 180 185 190 Phe Thr Thr Ile Gly Ser Leu Gln Leu Phe Thr Glu Pro Met Val Leu 195 200 205 Arg Thr Phe Thr Gly Ala Val Thr Ser Thr Trp Thr Pro Ser Leu Tyr 210 215 220 Ile Tyr Asp Ala Ala Phe Ile Arg Asn Asp Tyr Gly Arg Ala Ala Ala 225 230 235 240 Ala Ser Ile Leu Leu Ala Leu Ala Ser Ala Leu Leu Ser Ala Leu Val 245 250 255 Met Arg Leu Ser Ser Arg Arg Ser Arg 260 265 <210> 117 <211> 801 <212> DNA <213> Streptomyces roseosporus <400> 117 gtgctcctgc tcgccgccct ctacagcgtc ctcccgctgg tgtggctggt cacctcggcc 60 accaaatccg tcggcgactt ctccgccacc agcgccttcg aactcgccga cttcaacctc 120 tggggcaatc tgcgcgacct gttcgcccgg gaggacggcg tcttcctcca ctggatacgc 180 aactcgctgc tgtacgcggg cgtcggagcc gttctgggcg cgctgatctg caccgcctgc 240 ggatacgccg tcgccaaact cgacttcccc ggacggcgcg ccctgttcgc cgtgaccctg 300 gccggggtcc tcgtaccgcc caccgcgctc gctctgcccc tgtacctgct cgcctcgaac 360 ctgcacctcg tgaacacctt ctgggcggtg ttcctcccgc tgctcagcaa ccccttcggc 420 gtctacctcg cacgcacctt cgcggacgca gccgtccccg acgaggtcct ggaggcggca 480 cgactcgacg gggcgggtga gttccgcatc ttcctgaccg tcgccctgcc gatgatgatg 540 cccggcttcg tcaccatcgt gctgttccag ttcgtcagca tctggaacaa cttcttcctg 600 ccgctggtga tgctcaccga ccccgaactg ttccccatga ccctcggcat ctaccagtgg 660 aacacccggg ccccgcagtt ccccgactac aaccccctgg tcatcacggg atcgctgctc 720 gccgtcgtac cgctgatcat cgccttcgtc gtcctgcagc gccagtggcg cagcggcctg 780 gccgcaggga gcgtcaagtg a 801 <210> 118 <211> 266 <212> PRT <213> Streptomyces roseosporus <400> 118 Val Leu Leu Leu Ala Ala Leu Tyr Ser Val Leu Pro Leu Val Trp Leu 1 5 10 15 Val Thr Ser Ala Thr Lys Ser Val Gly Asp Phe Ser Ala Thr Ser Ala 20 25 30 Phe Glu Leu Ala Asp Phe Asn Leu Trp Gly Asn Leu Arg Asp Leu Phe 35 40 45 Ala Arg Glu Asp Gly Val Phe Leu His Trp Ile Arg Asn Ser Leu Leu 50 55 60 Tyr Ala Gly Val Gly Ala Val Leu Gly Ala Leu Ile Cys Thr Ala Cys 65 70 75 80 Gly Tyr Ala Val Ala Lys Leu Asp Phe Pro Gly Arg Arg Ala Leu Phe 85 90 95 Ala Val Thr Leu Ala Gly Val Leu Val Pro Pro Thr Ala Leu Ala Leu 100 105 110 Pro Leu Tyr Leu Leu Ala Ser Asn Leu His Leu Val Asn Thr Phe Trp 115 120 125 Ala Val Phe Leu Pro Leu Leu Ser Asn Pro Phe Gly Val Tyr Leu Ala 130 135 140 Arg Thr Phe Ala Asp Ala Ala Val Pro Asp Glu Val Leu Glu Ala Ala 145 150 155 160 Arg Leu Asp Gly Ala Gly Glu Phe Arg Ile Phe Leu Thr Val Ala Leu 165 170 175 Pro Met Met Met Pro Gly Phe Val Thr Ile Val Leu Phe Gln Phe Val 180 185 190 Ser Ile Trp Asn Asn Phe Phe Leu Pro Leu Val Met Leu Thr Asp Pro 195 200 205 Glu Leu Phe Pro Met Thr Leu Gly Ile Tyr Gln Trp Asn Thr Arg Ala 210 215 220 Pro Gln Phe Pro Asp Tyr Asn Pro Leu Val Ile Thr Gly Ser Leu Leu 225 230 235 240 Ala Val Val Pro Leu Ile Ile Ala Phe Val Val Leu Gln Arg Gln Trp 245 250 255 Arg Ser Gly Leu Ala Ala Gly Ser Val Lys 260 265 <210> 119 <211> 981 <212> DNA <213> Streptomyces roseosporus <400> 119 atgaacgacc ggacccggca cacccagttc gggcccgagg agttggaccg gctgcacgcc 60 gtcgcctcgc tcggacagcc gctcggcgcc gcggacctgg actccggcgc cgtccgcgcc 120 cgcctcgccg aggtggaggt gctgatcacc tcctggggct gccccaccct cgaccaccgc 180 gtcctgcgag ccgccccgcg cctgcgtgcc gtgctgcacg cggcgggatc ggtacggggc 240 catgtccccg acgccgtgtt cgaccggggt ctgctcgtca ccacggccgc cgacagcaac 300 gccgaacccg tcgcccagta cacgctcggc gcgatcctct gggcgttcaa gaaggtgccg 360 ttcctcgcca tggacgcccg gcgctcccgc gaggactgga gctacctgca ccgcagggga 420 gagctcagcg gccgtgaccg caccgtcgtc ctcgtcggct tctcccgcat cggccgccgc 480 gtcgtcgacc tcctgcgcac cctggacctg gcccgggtcc tggtcgtcga cccggtggcg 540 gaccccgccg aggtcgtggc cgcgggagcc cggccggccc agctcgcgga ggcgctcccg 600 caggccgacg tactcagcct gcacgcaccg gcactgcccg ggacccggca catgatcgga 660 gcggcacagc tggccgtgct gccccccggc gccgtcctcg tcaacaccgc ccgcggctcc 720 ctcgtcgaca ccgcggccct ggaggcggcc tgccgcgccg gactgcacgc cgtcctggac 780 gtcaccgacc ccgaacccct gcccgccgac agcccgttgt acgacctcca caacgtcgtc 840 ctcactccgc acatcgccgg gtccctcggc tccgagaccc gcacgatggc cggcgccgcc 900 ctcaccgaac tggagcgcta cgccgccggg ctgcccccac tggccccggt cacccggcag 960 tccctgacca cgcaggcctg a 981 <210> 120 <211> 326 <212> PRT <213> Streptomyces roseosporus <400> 120 Met Asn Asp Arg Thr Arg His Thr Gln Phe Gly Pro Glu Glu Leu Asp 1 5 10 15 Arg Leu His Ala Val Ala Ser Leu Gly Gln Pro Leu Gly Ala Ala Asp 20 25 30 Leu Asp Ser Gly Ala Val Arg Ala Arg Leu Ala Glu Val Glu Val Leu 35 40 45 Ile Thr Ser Trp Gly Cys Pro Thr Leu Asp His Arg Val Leu Arg Ala 50 55 60 Ala Pro Arg Leu Arg Ala Val Leu His Ala Ala Gly Ser Val Arg Gly 65 70 75 80 His Val Pro Asp Ala Val Phe Asp Arg Gly Leu Leu Val Thr Thr Ala 85 90 95 Ala Asp Ser Asn Ala Glu Pro Val Ala Gln Tyr Thr Leu Gly Ala Ile 100 105 110 Leu Trp Ala Phe Lys Lys Val Pro Phe Leu Ala Met Asp Ala Arg Arg 115 120 125 Ser Arg Glu Asp Trp Ser Tyr Leu His Arg Arg Gly Glu Leu Ser Gly 130 135 140 Arg Asp Arg Thr Val Val Leu Val Gly Phe Ser Arg Ile Gly Arg Arg 145 150 155 160 Val Val Asp Leu Leu Arg Thr Leu Asp Leu Ala Arg Val Leu Val Val 165 170 175 Asp Pro Val Ala Asp Pro Ala Glu Val Val Ala Ala Gly Ala Arg Pro 180 185 190 Ala Gln Leu Ala Glu Ala Leu Pro Gln Ala Asp Val Leu Ser Leu His 195 200 205 Ala Pro Ala Leu Pro Gly Thr Arg His Met Ile Gly Ala Ala Gln Leu 210 215 220 Ala Val Leu Pro Pro Gly Ala Val Leu Val Asn Thr Ala Arg Gly Ser 225 230 235 240 Leu Val Asp Thr Ala Ala Leu Glu Ala Ala Cys Arg Ala Gly Leu His 245 250 255 Ala Val Leu Asp Val Thr Asp Pro Glu Pro Leu Pro Ala Asp Ser Pro 260 265 270 Leu Tyr Asp Leu His Asn Val Val Leu Thr Pro His Ile Ala Gly Ser 275 280 285 Leu Gly Ser Glu Thr Arg Thr Met Ala Gly Ala Ala Leu Thr Glu Leu 290 295 300 Glu Arg Tyr Ala Ala Gly Leu Pro Pro Leu Ala Pro Val Thr Arg Gln 305 310 315 320 Ser Leu Thr Thr Gln Ala 325 <210> 121 <211> 2010 <212> DNA <213> Streptomyces roseosporus <400> 121 atgaaccatc agcatcccgg ccgaaggacc gtactgcggg cgggcggcct ggcaggcctc 60 gcggccgccg ccggcctcgc cgcgaacccg gcggccgcag cccccgccgc cgcccggctc 120 ccgcgcatcg acgatctggg ccccgctgtg agccagttct ccctcatgag cgccgtactg 180 accggcgaca ccgtccacat cggctcccgc aacatcgaac ccgtccagat catctccgta 240 cacctgccga cccgaaaggt ggtggcccgc accgagctgt ccaacggcca ctccatccag 300 gcgctcgccg cggacgacag cggcaggtac ctgtacgccg gaatcctcca gaaggcctcc 360 ggcgaccggc ccaacctctt ccgctgggac ctgagcaccc ccgacgagcc ggccgaaccc 420 ctcggcgcca tcggcgaccg cgacgtccgc gccctcgccg tggcacccga cggtgtcgtc 480 tacgcggtcg gcggcggcag cagcggcgcc ccggccctgt gggagtacga ccccgagacc 540 ggcaggatca gcaacgtggg aaccccggat cccagggcca ccctcgcacg ggccgtcgcg 600 gcgacccgca cccacgcctt cttcggcgcg ggcaccacct tcaacggcgg cggggacacc 660 agcagggccg ccctctacgc ctacgaccgg tccgccggga ccttcacctc gatcgcgccc 720 ccggagatgc tgcgcgaccc gagcatccgc gacctcgcgg tcctcgggga ccggctcgcc 780 gtcagcaccg ccggttccac ggaggacgcg aaggtcgccc tcatggacct gaaggacctg 840 tcctcgtaca agatcgcgac ctcgatcggc aaggtcgcca agtcgttcac catgaccggc 900 gacaccgtcc actacgccaa cgaatccggt ctgctcgcct acctgccgtc cgcgaacacc 960 gtgacccccg tcgcgtacga cggccccgga ctcggcgaga tctggggcgt ggacagccgc 1020 gcgggcaagg ccgtcgtcac ctcggccttc ggcttcgtgg ccgagatcga cccggccagg 1080 aggaccgccg ccgtcatcga tctcggcacc gccggcgccc ccatggcccc gcagacggtc 1140 atgggcatcg ccgccggcgg cggccacgtc tacgtcggcg gaaacgcgac gatcgcccgc 1200 cacacccccg gccgcgacac ggtcgtcaag ctccgcgcac ccggcgaggc caaggacgcc 1260 gtcgtcgtca acggcatcct gtacaccggc cagtacaact ccgagggcat ctggtgccac 1320 gacccccgca ccggaaagac cggccaggtg gccgccttcc cgtccgagca gaaccgcccg 1380 ctggacgtca ccttcgacga ggacaccggt ctcgtgctcg tcggagtgca gtccgacacc 1440 gagggcggcg gcgccctctg gacgtatcac cccaggaccg gccggcaacg gagcttcgcc 1500 gacccggtcg acgaagcgca gtgcgtccgg ggcatcgcga gccggaacgg cgtcgccttc 1560 ctcggcggcg acaacaccgc ccccaccgga ccgcgcagca ccgtcgtcgc gttcgacccg 1620 gtggccggcc gggagctgtg gcggatcgac ccgcaacaga cggcgggcac cgccgccctc 1680 gcggtacgcg gacggcacct ctacggactg tcccgcaagg gcggcctctt cgtcatcgac 1740 atcccgcggc gcgaactgat ccaccgcgcg gacgtcacct cggtcagcaa cgggttcgcc 1800 gccctggtga ccaaccgcgg tgtcgtctac ggcgtctccg acaccaccgt cttccgcttc 1860 caccccagga ccttcgccgt ctccgtcgtc gtccccgaca tcgacggcgg ctggtacagc 1920 ggcgcgcaca tcaccaacga cgagcacggc cggctctaca ccatgcgggg ccgcaacctg 1980 gtccggatca ccgaccgccc cggccactga 2010 <210> 122 <211> 669 <212> PRT <213> Streptomyces roseosporus <400> 122 Met Asn His Gln His Pro Gly Arg Arg Thr Val Leu Arg Ala Gly Gly 1 5 10 15 Leu Ala Gly Leu Ala Ala Ala Ala Gly Leu Ala Ala Asn Pro Ala Ala 20 25 30 Ala Ala Pro Ala Ala Ala Arg Leu Pro Arg Ile Asp Asp Leu Gly Pro 35 40 45 Ala Val Ser Gln Phe Ser Leu Met Ser Ala Val Leu Thr Gly Asp Thr 50 55 60 Val His Ile Gly Ser Arg Asn Ile Glu Pro Val Gln Ile Ile Ser Val 65 70 75 80 His Leu Pro Thr Arg Lys Val Val Ala Arg Thr Glu Leu Ser Asn Gly 85 90 95 His Ser Ile Gln Ala Leu Ala Ala Asp Asp Ser Gly Arg Tyr Leu Tyr 100 105 110 Ala Gly Ile Leu Gln Lys Ala Ser Gly Asp Arg Pro Asn Leu Phe Arg 115 120 125 Trp Asp Leu Ser Thr Pro Asp Glu Pro Ala Glu Pro Leu Gly Ala Ile 130 135 140 Gly Asp Arg Asp Val Arg Ala Leu Ala Val Ala Pro Asp Gly Val Val 145 150 155 160 Tyr Ala Val Gly Gly Gly Ser Ser Gly Ala Pro Ala Leu Trp Glu Tyr 165 170 175 Asp Pro Glu Thr Gly Arg Ile Ser Asn Val Gly Thr Pro Asp Pro Arg 180 185 190 Ala Thr Leu Ala Arg Ala Val Ala Ala Thr Arg Thr His Ala Phe Phe 195 200 205 Gly Ala Gly Thr Thr Phe Asn Gly Gly Gly Asp Thr Ser Arg Ala Ala 210 215 220 Leu Tyr Ala Tyr Asp Arg Ser Ala Gly Thr Phe Thr Ser Ile Ala Pro 225 230 235 240 Pro Glu Met Leu Arg Asp Pro Ser Ile Arg Asp Leu Ala Val Leu Gly 245 250 255 Asp Arg Leu Ala Val Ser Thr Ala Gly Ser Thr Glu Asp Ala Lys Val 260 265 270 Ala Leu Met Asp Leu Lys Asp Leu Ser Ser Tyr Lys Ile Ala Thr Ser 275 280 285 Ile Gly Lys Val Ala Lys Ser Phe Thr Met Thr Gly Asp Thr Val His 290 295 300 Tyr Ala Asn Glu Ser Gly Leu Leu Ala Tyr Leu Pro Ser Ala Asn Thr 305 310 315 320 Val Thr Pro Val Ala Tyr Asp Gly Pro Gly Leu Gly Glu Ile Trp Gly 325 330 335 Val Asp Ser Arg Ala Gly Lys Ala Val Val Thr Ser Ala Phe Gly Phe 340 345 350 Val Ala Glu Ile Asp Pro Ala Arg Arg Thr Ala Ala Val Ile Asp Leu 355 360 365 Gly Thr Ala Gly Ala Pro Met Ala Pro Gln Thr Val Met Gly Ile Ala 370 375 380 Ala Gly Gly Gly His Val Tyr Val Gly Gly Asn Ala Thr Ile Ala Arg 385 390 395 400 His Thr Pro Gly Arg Asp Thr Val Val Lys Leu Arg Ala Pro Gly Glu 405 410 415 Ala Lys Asp Ala Val Val Val Asn Gly Ile Leu Tyr Thr Gly Gln Tyr 420 425 430 Asn Ser Glu Gly Ile Trp Cys His Asp Pro Arg Thr Gly Lys Thr Gly 435 440 445 Gln Val Ala Ala Phe Pro Ser Glu Gln Asn Arg Pro Leu Asp Val Thr 450 455 460 Phe Asp Glu Asp Thr Gly Leu Val Leu Val Gly Val Gln Ser Asp Thr 465 470 475 480 Glu Gly Gly Gly Ala Leu Trp Thr Tyr His Pro Arg Thr Gly Arg Gln 485 490 495 Arg Ser Phe Ala Asp Pro Val Asp Glu Ala Gln Cys Val Arg Gly Ile 500 505 510 Ala Ser Arg Asn Gly Val Ala Phe Leu Gly Gly Asp Asn Thr Ala Pro 515 520 525 Thr Gly Pro Arg Ser Thr Val Val Ala Phe Asp Pro Val Ala Gly Arg 530 535 540 Glu Leu Trp Arg Ile Asp Pro Gln Gln Thr Ala Gly Thr Ala Ala Leu 545 550 555 560 Ala Val Arg Gly Arg His Leu Tyr Gly Leu Ser Arg Lys Gly Gly Leu 565 570 575 Phe Val Ile Asp Ile Pro Arg Arg Glu Leu Ile His Arg Ala Asp Val 580 585 590 Thr Ser Val Ser Asn Gly Phe Ala Ala Leu Val Thr Asn Arg Gly Val 595 600 605 Val Tyr Gly Val Ser Asp Thr Thr Val Phe Arg Phe His Pro Arg Thr 610 615 620 Phe Ala Val Ser Val Val Val Pro Asp Ile Asp Gly Gly Trp Tyr Ser 625 630 635 640 Gly Ala His Ile Thr Asn Asp Glu His Gly Arg Leu Tyr Thr Met Arg 645 650 655 Gly Arg Asn Leu Val Arg Ile Thr Asp Arg Pro Gly His 660 665 <210> 123 <211> 879 <212> DNA <213> Streptomyces roseosporus <400> 123 gtgtctcccc ccaccccggg caccccgcgc catcccccca cgccctccca gggagcttcc 60 atgaagaacg cgcacaagag gatctgcatc gccgtctgcc tgggcgccgt cgccggcgcc 120 ggttacgcca cgaccgccac cgcgacgccg gagaagtcgg cccggccgca gcaggcgtcc 180 gacctgctcg acgtcgacta cgagtccggg gccctcgact ccggcatccc cgggctgacc 240 acgacgcacg ccaaggcctc ggacgcctcc acggtcgaga gcggcggcga cgggagcgca 300 cactcggtct cgcacaaggt gacgctgaac gacccggatt acgtctccga cggcgcaccc 360 cgcagcgaga gcgcgaacaa cgagatcgag aagtcgctca tccacgtggg cgacgtgcac 420 cgctacgagt tcagcgtcat gctcaaggac tgggagacca gcagcagcaa ggcgggcgac 480 atcatcttcc agggcaagca cgcgggcggg aacaagccgt cgttctacct catggcacag 540 cgcaacgcga tcgcgttccg ctccccgctc ctcgacctgc aggcgccggt ggtcgaggac 600 ttccgcccct atgtcgacca gtggatgcgg ttccgcatcg acgtccgctg ggccgagagc 660 aggaccggct actacaaggt gtccgtccgg ctcccgggag agaaggactt caccctcaag 720 aagacgtaca ccgacgtcaa caccttccac ccggagaacc ccacggcctt cggctacatc 780 aagtggggcc tgtaccgccc cgcctcctcg acggaagcgg gcgatcccgc gacccgcgtg 840 gtccggcacg acgacatccg ggtgatcgac ctcgggtga 879 <210> 124 <211> 292 <212> PRT <213> Streptomyces roseosporus <400> 124 Val Ser Pro Pro Thr Pro Gly Thr Pro Arg His Pro Pro Thr Pro Ser 1 5 10 15 Gln Gly Ala Ser Met Lys Asn Ala His Lys Arg Ile Cys Ile Ala Val 20 25 30 Cys Leu Gly Ala Val Ala Gly Ala Gly Tyr Ala Thr Thr Ala Thr Ala 35 40 45 Thr Pro Glu Lys Ser Ala Arg Pro Gln Gln Ala Ser Asp Leu Leu Asp 50 55 60 Val Asp Tyr Glu Ser Gly Ala Leu Asp Ser Gly Ile Pro Gly Leu Thr 65 70 75 80 Thr Thr His Ala Lys Ala Ser Asp Ala Ser Thr Val Glu Ser Gly Gly 85 90 95 Asp Gly Ser Ala His Ser Val Ser His Lys Val Thr Leu Asn Asp Pro 100 105 110 Asp Tyr Val Ser Asp Gly Ala Pro Arg Ser Glu Ser Ala Asn Asn Glu 115 120 125 Ile Glu Lys Ser Leu Ile His Val Gly Asp Val His Arg Tyr Glu Phe 130 135 140 Ser Val Met Leu Lys Asp Trp Glu Thr Ser Ser Ser Lys Ala Gly Asp 145 150 155 160 Ile Ile Phe Gln Gly Lys His Ala Gly Gly Asn Lys Pro Ser Phe Tyr 165 170 175 Leu Met Ala Gln Arg Asn Ala Ile Ala Phe Arg Ser Pro Leu Leu Asp 180 185 190 Leu Gln Ala Pro Val Val Glu Asp Phe Arg Pro Tyr Val Asp Gln Trp 195 200 205 Met Arg Phe Arg Ile Asp Val Arg Trp Ala Glu Ser Arg Thr Gly Tyr 210 215 220 Tyr Lys Val Ser Val Arg Leu Pro Gly Glu Lys Asp Phe Thr Leu Lys 225 230 235 240 Lys Thr Tyr Thr Asp Val Asn Thr Phe His Pro Glu Asn Pro Thr Ala 245 250 255 Phe Gly Tyr Ile Lys Trp Gly Leu Tyr Arg Pro Ala Ser Ser Thr Glu 260 265 270 Ala Gly Asp Pro Ala Thr Arg Val Val Arg His Asp Asp Ile Arg Val 275 280 285 Ile Asp Leu Gly 290 <210> 125 <211> 1017 <212> DNA <213> Streptomyces roseosporus <400> 125 tcacgtcgac cagaccacct tgccctggtg cacgatgacc accttggcgt cgggcctcag 60 caccatctgg gcgccgccaa agtcatgcgt cttggaagcc cagatggccc ggtcgtcgcc 120 gttgtggatg accaggttgc cgtcgggctg gaagatcgcc cggtggttct cgccgaaggt 180 catggcggcc cagatcggct tgttccgctc gttgtagacg acgaggttgc cgtcctgctg 240 catcgtcatg cggatgcggt tggtggccca ggactggccg accccgatgg aactggtcgc 300 ggagaccgtc tgggtgcccc agtccggctt cggggccgcc ttgggcttcg gcttcggtga 360 ggccttcggc ttctcggcgg gggcgctcgt ccggggtgcg ggcgaagggg ccacgggtgc 420 gggagcggcc ttcggcgggg tggtcttctt ctgttccgtc ggggacggcg tgggcttcac 480 cgccacgtag tcgtccaggg ccgccggggc cgactcgggg ttgaggaccg tgtcggcgct 540 cccggccacc ggtgccgtac cgctgttacg gggcttctcg tcgttcgcgc tgcccatcag 600 cagcacgggt atcgcgacca gtgcggcgcc gacgaacgcc gcccccgcca ggaccggtgc 660 gcgggggcgg cccctgtcgg cagcggtgag ggtcttggtg tccggcttcg cggcgacggc 720 cgctgccagg gcgatggcct ccgtgcggcc ttcgggtgct tccgtggttg tggttgtggc 780 cggggcctgg gtctgggctt tttcggtacc ggtcgttgcg gcgggctcgg tcgggggctc 840 cccggtgccg gccgtcgtgg cggcctcgct ccggggcttc cgcgcctcgg ccggggcggc 900 ggacggcggg gcggcggggc cggactcctc cgtggtgggc ggcagggaag cggtgccgga 960 cttctccgtg gctgccgccg cggactcggt gccgggggcg gggggctcgg ggggcat 1017 <210> 126 <211> 338 <212> PRT <213> Streptomyces roseosporus <400> 126 Met Pro Pro Glu Pro Pro Ala Pro Gly Thr Glu Ser Ala Ala Ala Ala 1 5 10 15 Thr Glu Lys Ser Gly Thr Ala Ser Leu Pro Pro Thr Thr Glu Glu Ser 20 25 30 Gly Pro Ala Ala Pro Pro Ser Ala Ala Pro Ala Glu Ala Arg Lys Pro 35 40 45 Arg Ser Glu Ala Ala Thr Thr Ala Gly Thr Gly Glu Pro Pro Thr Glu 50 55 60 Pro Ala Ala Thr Thr Gly Thr Glu Lys Ala Gln Thr Gln Ala Pro Ala 65 70 75 80 Thr Thr Thr Thr Thr Glu Ala Pro Glu Gly Arg Thr Glu Ala Ile Ala 85 90 95 Leu Ala Ala Ala Val Ala Ala Lys Pro Asp Thr Lys Thr Leu Thr Ala 100 105 110 Ala Asp Arg Gly Arg Pro Arg Ala Pro Val Leu Ala Gly Ala Ala Phe 115 120 125 Val Gly Ala Ala Leu Val Ala Ile Pro Val Leu Leu Met Gly Ser Ala 130 135 140 Asn Asp Glu Lys Pro Arg Asn Ser Gly Thr Ala Pro Val Ala Gly Ser 145 150 155 160 Ala Asp Thr Val Leu Asn Pro Glu Ser Ala Pro Ala Ala Leu Asp Asp 165 170 175 Tyr Val Ala Val Lys Pro Thr Pro Ser Pro Thr Glu Gln Lys Lys Thr 180 185 190 Thr Pro Pro Lys Ala Ala Pro Ala Pro Val Ala Pro Ser Pro Ala Pro 195 200 205 Arg Thr Ser Ala Pro Ala Glu Lys Pro Lys Ala Ser Pro Lys Pro Lys 210 215 220 Pro Lys Ala Ala Pro Lys Pro Asp Trp Gly Thr Gln Thr Val Ser Ala 225 230 235 240 Thr Ser Ser Ile Gly Val Gly Gln Ser Trp Ala Thr Asn Arg Ile Arg 245 250 255 Met Thr Met Gln Gln Asp Gly Asn Leu Val Val Tyr Asn Glu Arg Asn 260 265 270 Lys Pro Ile Trp Ala Ala Met Thr Phe Gly Glu Asn His Arg Ala Ile 275 280 285 Phe Gln Pro Asp Gly Asn Leu Val Ile His Asn Gly Asp Asp Arg Ala 290 295 300 Ile Trp Ala Ser Lys Thr His Asp Phe Gly Gly Ala Gln Met Val Leu 305 310 315 320 Arg Pro Asp Ala Lys Val Val Ile Val His Gln Gly Lys Val Val Trp 325 330 335 Ser Thr <210> 127 <211> 624 <212> DNA <213> Streptomyces roseosporus <400> 127 gtggatgcct ccctcgtgcc ggaagccgtg aaggacgccg cacgccgtgc gcccggccac 60 tgggtcggca tcgtcgatcc ggagtggacg caggcgcgga cgcccccgga gtgggccgtg 120 ctgggggagt ggcagtcgga cgagagcggg agcgtgggcg agtaccgcgc caaccccggc 180 taccgtccct ccgcccgggt cctcggctgg ccggagccca ccgatccggt ggacgcggcc 240 gcccagcggg ccgccacggg gtacggcacg gtggacgagg cgctggccgc actcgcggag 300 gcggacgtca ccgtcgtacg cgggcccgac ggcgggccac tcctggccgc ggggcgggac 360 ggggcgctgg tggcgctcct gttcacctcg cccacccacg cgttcatgtc cgcggcactt 420 caccatgaca ccgtgtccgc ccgggagctg gccgggtcgc tggcgcagac cggcgtcctg 480 ctgtcggtca acgccggtgc cgcggctccg ctgctcgttc ccaccgacag ccttgccggt 540 gccgtgagtt ccggcccgga gaccgcggcc gacggccccg cgccgaccga accctggccc 600 cacaccacag ggagaacccc gtga 624 <210> 128 <211> 207 <212> PRT <213> Streptomyces roseosporus <400> 128 Val Asp Ala Ser Leu Val Pro Glu Ala Val Lys Asp Ala Ala Arg Arg 1 5 10 15 Ala Pro Gly His Trp Val Gly Ile Val Asp Pro Glu Trp Thr Gln Ala 20 25 30 Arg Thr Pro Pro Glu Trp Ala Val Leu Gly Glu Trp Gln Ser Asp Glu 35 40 45 Ser Gly Ser Val Gly Glu Tyr Arg Ala Asn Pro Gly Tyr Arg Pro Ser 50 55 60 Ala Arg Val Leu Gly Trp Pro Glu Pro Thr Asp Pro Val Asp Ala Ala 65 70 75 80 Ala Gln Arg Ala Ala Thr Gly Tyr Gly Thr Val Asp Glu Ala Leu Ala 85 90 95 Ala Leu Ala Glu Ala Asp Val Thr Val Val Arg Gly Pro Asp Gly Gly 100 105 110 Pro Leu Leu Ala Ala Gly Arg Asp Gly Ala Leu Val Ala Leu Leu Phe 115 120 125 Thr Ser Pro Thr His Ala Phe Met Ser Ala Ala Leu His His Asp Thr 130 135 140 Val Ser Ala Arg Glu Leu Ala Gly Ser Leu Ala Gln Thr Gly Val Leu 145 150 155 160 Leu Ser Val Asn Ala Gly Ala Ala Ala Pro Leu Leu Val Pro Thr Asp 165 170 175 Ser Leu Ala Gly Ala Val Ser Ser Gly Pro Glu Thr Ala Ala Asp Gly 180 185 190 Pro Ala Pro Thr Glu Pro Trp Pro His Thr Thr Gly Arg Thr Pro 195 200 205 <210> 129 <211> 1176 <212> DNA <213> Streptomyces roseosporus <400> 129 gtgacgcgtt cgtcgtccca gcagcccccc gcctccgctt ccgctcccgc acaggcgaag 60 accgaagccg cgccggccga ggccaccgag gcggagaagg tcaaggaggt cgaggagggg 120 gagaaggccg agcagggcga gcgctccgag gcccagtcct ccgagcgcca gtccccccag 180 gtccaggccc aagcccccgg cgccggggcg gaaaacccca aggcgcccac cgcctccgag 240 accgacccgg accccggcgc ctccgccgcc gcccagagtc ggctccccgc cctcgtacgg 300 accatgaccg ccaccgccat cgggaagccg cagcaggagg cggggcccgt ggggcggccg 360 ggcaaggccg cgctcgcggg ggcggcggtc gtgggcgcgc tgctcgtgtc ggtgcccttc 420 ctcgtgctcg ccgggaacaa cgacgacggg cccgagcgga cgaaggccgc cggggccggg 480 accgtcctcg acgggagcgg accggaggcg ccgggcgagt tcgccgtcac cgcgcccgag 540 gccggcgcgc ccgccgagga cagggagaag agggagaagg acgaggcgaa gccggagaag 600 ggcggcaatc ccgttccggc catccctccg gggggcggcg gcaaagcgga gacgaaggag 660 gacaacgccc ccaacgaccc gccgaagaag gccgattcgt ccaaggggaa gtccaaggag 720 cagcccgagg cgggcagcgg cggcggcagg aaccagccgg ccaaggccca gcccgccgtc 780 acgttcagcg ggcccgtctc cttccgcagc cacctctccg gccgctgcct cgacgtcccc 840 gggcacaact tcaacgacgg ccagccgctg ttcatgtggg actgcaacgg cgccgacgcc 900 cagaagtggc gcttcggctc ggacggcacg atccgggcca gggacaagtg cctggacgtg 960 gccaacgccg acttcgccaa cggctcccgg atccagctcg cctggtgcaa cggctccgcc 1020 gcccagaagt tcaccctgaa cggcgcccac gacctggtca acaccgtcgt cggcaagtgc 1080 gtcgacatcc cgaaccacag caagggccgg ggcccggaga cctacctgat cctgtgggag 1140 tgcacggggc tcgacaacca gaagtggagc acctga 1176 <210> 130 <211> 391 <212> PRT <213> Streptomyces roseosporus <400> 130 Val Thr Arg Ser Ser Ser Gln Gln Pro Pro Ala Ser Ala Ser Ala Pro 1 5 10 15 Ala Gln Ala Lys Thr Glu Ala Ala Pro Ala Glu Ala Thr Glu Ala Glu 20 25 30 Lys Val Lys Glu Val Glu Glu Gly Glu Lys Ala Glu Gln Gly Glu Arg 35 40 45 Ser Glu Ala Gln Ser Ser Glu Arg Gln Ser Pro Gln Val Gln Ala Gln 50 55 60 Ala Pro Gly Ala Gly Ala Glu Asn Pro Lys Ala Pro Thr Ala Ser Glu 65 70 75 80 Thr Asp Pro Asp Pro Gly Ala Ser Ala Ala Ala Gln Ser Arg Leu Pro 85 90 95 Ala Leu Val Arg Thr Met Thr Ala Thr Ala Ile Gly Lys Pro Gln Gln 100 105 110 Glu Ala Gly Pro Val Gly Arg Pro Gly Lys Ala Ala Leu Ala Gly Ala 115 120 125 Ala Val Val Gly Ala Leu Leu Val Ser Val Pro Phe Leu Val Leu Ala 130 135 140 Gly Asn Asn Asp Asp Gly Pro Glu Arg Thr Lys Ala Ala Gly Ala Gly 145 150 155 160 Thr Val Leu Asp Gly Ser Gly Pro Glu Ala Pro Gly Glu Phe Ala Val 165 170 175 Thr Ala Pro Glu Ala Gly Ala Pro Ala Glu Asp Arg Glu Lys Arg Glu 180 185 190 Lys Asp Glu Ala Lys Pro Glu Lys Gly Gly Asn Pro Val Pro Ala Ile 195 200 205 Pro Pro Gly Gly Gly Gly Lys Ala Glu Thr Lys Glu Asp Asn Ala Pro 210 215 220 Asn Asp Pro Pro Lys Lys Ala Asp Ser Ser Lys Gly Lys Ser Lys Glu 225 230 235 240 Gln Pro Glu Ala Gly Ser Gly Gly Gly Arg Asn Gln Pro Ala Lys Ala 245 250 255 Gln Pro Ala Val Thr Phe Ser Gly Pro Val Ser Phe Arg Ser His Leu 260 265 270 Ser Gly Arg Cys Leu Asp Val Pro Gly His Asn Phe Asn Asp Gly Gln 275 280 285 Pro Leu Phe Met Trp Asp Cys Asn Gly Ala Asp Ala Gln Lys Trp Arg 290 295 300 Phe Gly Ser Asp Gly Thr Ile Arg Ala Arg Asp Lys Cys Leu Asp Val 305 310 315 320 Ala Asn Ala Asp Phe Ala Asn Gly Ser Arg Ile Gln Leu Ala Trp Cys 325 330 335 Asn Gly Ser Ala Ala Gln Lys Phe Thr Leu Asn Gly Ala His Asp Leu 340 345 350 Val Asn Thr Val Val Gly Lys Cys Val Asp Ile Pro Asn His Ser Lys 355 360 365 Gly Arg Gly Pro Glu Thr Tyr Leu Ile Leu Trp Glu Cys Thr Gly Leu 370 375 380 Asp Asn Gln Lys Trp Ser Thr 385 390 <210> 131 <211> 3312 <212> DNA <213> Streptomyces roseosporus <400> 131 gtgtcgcgcc aggtactgac ggtcggcccc gcggaccgct tttccacgat cggtgaggcg 60 ctcgccgccg cccgtaccgg tgcgctcatc agcgtccggc ccgggacgta cgcggagaac 120 ctggtgatcc acacccgggt gaccctcacc gcagccgagg ggcggggcac ggtggagatc 180 cggccgcgtt cgggcagcgt cgtcgcgctg cgcgccgacg ccgtcatgct ctccgaactc 240 accctgcgcg gcggggactc cgagctgccc gccgtcgacg tacggcgcgg gcaggccgcg 300 ttcgacgggt gcgagatcgt cggcgcggcc tggaccgcga tgctggccgg cgggaccggg 360 tccctcgcgc tgcgggactg ccgggtgagc aacccgcggg gcgcgggcat cgtggtcacc 420 tccgccaccc ccaccaccgt cgagtcctgc acgctcgaac acctcggcac cagcggcatc 480 gtcctcgccg agcagggcga ggcgcgcgtc cgcgactgca cggtgcgggg cgcccggggc 540 aacgggctgc tggccaacgg cgagacccgg ggcaccgtcg aggactgcga catctcctcc 600 accgacaagc cctccatcgc cctggagggg gactccgccg tctccgtcgt ccggaccgtg 660 gtgcatgaca ccagcaccgg cgtgcatctg agcagcgcgg gccgcaccac cctggaggac 720 gtccgcgtca ccggcgcctc cggcaacggg atcgtcctcg ccgtgggcac cgaccccgta 780 ctgcgccgct gccgtgtctc gcgcgcacgg gggcacgggc tgttcgtcac cgaccgggcg 840 cgcggcacct tcgaggactg ctgggtggac ggggcacagg gcgccgcgct gcgggtcgcc 900 ggggcctcct ccccggcgct gaccggactg accgtccgcg actgcgaagg ggccgggctg 960 cttctggagg aggacgcggc gcccgagctg gaccgcctgg aggtcatcgg ctcctcgccc 1020 gccgtcgctc tgcagggcgg cgccaacccg ctgctgcgcc gggcccggct ggtcgaaccc 1080 gccggtgacg gcatcgcggc caccaaggac gcccggggcc gcgcagagga ctgcgagatc 1140 gtccgcccga agggcgccgg tgtacgggtg gcctccggct ccaccctcta cctggccggt 1200 ggcggggtct ccgacacggc caccaacggc ctggtcgtgg aggacggcgg caatgtcacc 1260 gtccgtgact tccgcgtcga aatatcgggt gaggagggtg tggtcgtcgc cgccggtggt 1320 gaactgaccg ccaaccgcac caccgtccac gcccccaagg gacacggttt cctcctccgc 1380 gagggcgctc tcgcctcgct cagcggctgc gaggccaacg ggggcgccca ggacggcttc 1440 cgggtcgagt ccaccgcccc ggtctcgctc gtcaactgca ccgcccgcga gaacgagggc 1500 ggcggcctgg tgcagaccgc gcccggcgaa cggctcgccg tggacggcct gaacagcgtc 1560 gggaacggca agcgcgacgc ctggggcagc ggcagtgccg agaacaccga cccggccggg 1620 tccggcgccg ccgacgcgcc cccgccggac cgtgcggacg gcccgctcgg cgccctcaac 1680 gcgctgatcg gcctggagaa cgtcaagcag caggtccgca ccctcgtcaa cctcacccag 1740 ctcgcccagc gacgcgagca actcggcatg cccgcaccgc cgatgagcag acacctgatc 1800 ttcgccggac cgcccggcac cggtaagacc accgtcgccc gcctctacgg ggcgatcctg 1860 gccgagctgg gctcgctgcg cagtggacac ctggtcgagg tctcccgcgc ggacctggtc 1920 gcccaagtcg tcggcggcac tgccatcaag acctccgaga ccttccaacg agcgctggga 1980 ggggtcctgt tcatcgacga ggcgtacacc ctcaccgccg acagcggcaa cggcggagcc 2040 gacttcggcc gcgaggccgt ggacaccctg ctcaagctca tggaggacca ccgcgacgac 2100 gtggtcgtgg tcgccgccgg atactcccgc gagatggaat ccttcctcag ctccaacccg 2160 ggcctcgcgt cccgcttctc gcggaccgtc gagttcgaga actactccgt ggacgacctg 2220 gtcgcgatca tggagagcat gtgcacccag caccagtacg agctggggga gggcacggcc 2280 caggcgctcg ccgcccactt cggggccatg gaccgggacg ccggattcgg caacggccgt 2340 gccgcacgcg gggtgttcga ggagatggtg gaccggcagg cgatccggct ctccgcccag 2400 gcccaggtca gcgagaacga tctgcggctc ctgctccccg aggacgtctc cgccaccgcc 2460 gccgcctcgg ccgccgagac cgccgtaccg gccgacgacc cgctcacccg cctgggcgac 2520 atgatcggac tggccggggt gaagcgtgag gtcgccgatc tggtcaacct catcaccacc 2580 gcccgccacc gcgccgccgc cgggctgccc gtccccaccc tcagcaacca cctggtcttc 2640 accggcccgc ccggcaccgg caagaccacc gtcgcccggc tctacggcga ggtgctcacc 2700 cagctcggcg tgctggagcg cggccagctg atcgaggccg cgcgcgccga cctcgtcggc 2760 cgctacatag gccacaccgc ccagttgacc cgtgaggtct tcgaaaaggc ccgcggcggc 2820 gtgctgttca tcgacgaggc ctacaccctc accccgcgcg gcggcggcgc cgacttcggg 2880 caggaggcgg tggacaccct gctgaagctg atggaggacc accgcgacga ggtcgtcgtc 2940 atcgtcgccg gatacaccga cgagatggaa cgcttcctcg cctccaaccc cggcctctcc 3000 tcccgcttcc cacgccggat cgccttcgcc gactactcct ccgaggaact ggtcaccatc 3060 gtgcgcgccc aggccgccgc catggggtac gagtgcggcc ccggcaccgg accgctgctc 3120 aaggagcact tcgacgcggt accccgcgac cggtccttcg gcaacgcccg gctggcccgc 3180 caggtcgtcg agtcgatggt cacccgccag gcgggcagga tcagttcgct ggccgcgccc 3240 accctggacg acctgcgcat cctcctcccg gcggacgtca cggccgcggc cccgaaggcg 3300 gtgcagcagt ga 3312 <210> 132 <211> 1103 <212> PRT <213> Streptomyces roseosporus <400> 132 Val Ser Arg Gln Val Leu Thr Val Gly Pro Ala Asp Arg Phe Ser Thr 1 5 10 15 Ile Gly Glu Ala Leu Ala Ala Ala Arg Thr Gly Ala Leu Ile Ser Val 20 25 30 Arg Pro Gly Thr Tyr Ala Glu Asn Leu Val Ile His Thr Arg Val Thr 35 40 45 Leu Thr Ala Ala Glu Gly Arg Gly Thr Val Glu Ile Arg Pro Arg Ser 50 55 60 Gly Ser Val Val Ala Leu Arg Ala Asp Ala Val Met Leu Ser Glu Leu 65 70 75 80 Thr Leu Arg Gly Gly Asp Ser Glu Leu Pro Ala Val Asp Val Arg Arg 85 90 95 Gly Gln Ala Ala Phe Asp Gly Cys Glu Ile Val Gly Ala Ala Trp Thr 100 105 110 Ala Met Leu Ala Gly Gly Thr Gly Ser Leu Ala Leu Arg Asp Cys Arg 115 120 125 Val Ser Asn Pro Arg Gly Ala Gly Ile Val Val Thr Ser Ala Thr Pro 130 135 140 Thr Thr Val Glu Ser Cys Thr Leu Glu His Leu Gly Thr Ser Gly Ile 145 150 155 160 Val Leu Ala Glu Gln Gly Glu Ala Arg Val Arg Asp Cys Thr Val Arg 165 170 175 Gly Ala Arg Gly Asn Gly Leu Leu Ala Asn Gly Glu Thr Arg Gly Thr 180 185 190 Val Glu Asp Cys Asp Ile Ser Ser Thr Asp Lys Pro Ser Ile Ala Leu 195 200 205 Glu Gly Asp Ser Ala Val Ser Val Val Arg Thr Val Val His Asp Thr 210 215 220 Ser Thr Gly Val His Leu Ser Ser Ala Gly Arg Thr Thr Leu Glu Asp 225 230 235 240 Val Arg Val Thr Gly Ala Ser Gly Asn Gly Ile Val Leu Ala Val Gly 245 250 255 Thr Asp Pro Val Leu Arg Arg Cys Arg Val Ser Arg Ala Arg Gly His 260 265 270 Gly Leu Phe Val Thr Asp Arg Ala Arg Gly Thr Phe Glu Asp Cys Trp 275 280 285 Val Asp Gly Ala Gln Gly Ala Ala Leu Arg Val Ala Gly Ala Ser Ser 290 295 300 Pro Ala Leu Thr Gly Leu Thr Val Arg Asp Cys Glu Gly Ala Gly Leu 305 310 315 320 Leu Leu Glu Glu Asp Ala Ala Pro Glu Leu Asp Arg Leu Glu Val Ile 325 330 335 Gly Ser Ser Pro Ala Val Ala Leu Gln Gly Gly Ala Asn Pro Leu Leu 340 345 350 Arg Arg Ala Arg Leu Val Glu Pro Ala Gly Asp Gly Ile Ala Ala Thr 355 360 365 Lys Asp Ala Arg Gly Arg Ala Glu Asp Cys Glu Ile Val Arg Pro Lys 370 375 380 Gly Ala Gly Val Arg Val Ala Ser Gly Ser Thr Leu Tyr Leu Ala Gly 385 390 395 400 Gly Gly Val Ser Asp Thr Ala Thr Asn Gly Leu Val Val Glu Asp Gly 405 410 415 Gly Asn Val Thr Val Arg Asp Phe Arg Val Glu Ile Ser Gly Glu Glu 420 425 430 Gly Val Val Val Ala Ala Gly Gly Glu Leu Thr Ala Asn Arg Thr Thr 435 440 445 Val His Ala Pro Lys Gly His Gly Phe Leu Leu Arg Glu Gly Ala Leu 450 455 460 Ala Ser Leu Ser Gly Cys Glu Ala Asn Gly Gly Ala Gln Asp Gly Phe 465 470 475 480 Arg Val Glu Ser Thr Ala Pro Val Ser Leu Val Asn Cys Thr Ala Arg 485 490 495 Glu Asn Glu Gly Gly Gly Leu Val Gln Thr Ala Pro Gly Glu Arg Leu 500 505 510 Ala Val Asp Gly Leu Asn Ser Val Gly Asn Gly Lys Arg Asp Ala Trp 515 520 525 Gly Ser Gly Ser Ala Glu Asn Thr Asp Pro Ala Gly Ser Gly Ala Ala 530 535 540 Asp Ala Pro Pro Pro Asp Arg Ala Asp Gly Pro Leu Gly Ala Leu Asn 545 550 555 560 Ala Leu Ile Gly Leu Glu Asn Val Lys Gln Gln Val Arg Thr Leu Val 565 570 575 Asn Leu Thr Gln Leu Ala Gln Arg Arg Glu Gln Leu Gly Met Pro Ala 580 585 590 Pro Pro Met Ser Arg His Leu Ile Phe Ala Gly Pro Pro Gly Thr Gly 595 600 605 Lys Thr Thr Val Ala Arg Leu Tyr Gly Ala Ile Leu Ala Glu Leu Gly 610 615 620 Ser Leu Arg Ser Gly His Leu Val Glu Val Ser Arg Ala Asp Leu Val 625 630 635 640 Ala Gln Val Val Gly Gly Thr Ala Ile Lys Thr Ser Glu Thr Phe Gln 645 650 655 Arg Ala Leu Gly Gly Val Leu Phe Ile Asp Glu Ala Tyr Thr Leu Thr 660 665 670 Ala Asp Ser Gly Asn Gly Gly Ala Asp Phe Gly Arg Glu Ala Val Asp 675 680 685 Thr Leu Leu Lys Leu Met Glu Asp His Arg Asp Asp Val Val Val Val 690 695 700 Ala Ala Gly Tyr Ser Arg Glu Met Glu Ser Phe Leu Ser Ser Asn Pro 705 710 715 720 Gly Leu Ala Ser Arg Phe Ser Arg Thr Val Glu Phe Glu Asn Tyr Ser 725 730 735 Val Asp Asp Leu Val Ala Ile Met Glu Ser Met Cys Thr Gln His Gln 740 745 750 Tyr Glu Leu Gly Glu Gly Thr Ala Gln Ala Leu Ala Ala His Phe Gly 755 760 765 Ala Met Asp Arg Asp Ala Gly Phe Gly Asn Gly Arg Ala Ala Arg Gly 770 775 780 Val Phe Glu Glu Met Val Asp Arg Gln Ala Ile Arg Leu Ser Ala Gln 785 790 795 800 Ala Gln Val Ser Glu Asn Asp Leu Arg Leu Leu Leu Pro Glu Asp Val 805 810 815 Ser Ala Thr Ala Ala Ala Ser Ala Ala Glu Thr Ala Val Pro Ala Asp 820 825 830 Asp Pro Leu Thr Arg Leu Gly Asp Met Ile Gly Leu Ala Gly Val Lys 835 840 845 Arg Glu Val Ala Asp Leu Val Asn Leu Ile Thr Thr Ala Arg His Arg 850 855 860 Ala Ala Ala Gly Leu Pro Val Pro Thr Leu Ser Asn His Leu Val Phe 865 870 875 880 Thr Gly Pro Pro Gly Thr Gly Lys Thr Thr Val Ala Arg Leu Tyr Gly 885 890 895 Glu Val Leu Thr Gln Leu Gly Val Leu Glu Arg Gly Gln Leu Ile Glu 900 905 910 Ala Ala Arg Ala Asp Leu Val Gly Arg Tyr Ile Gly His Thr Ala Gln 915 920 925 Leu Thr Arg Glu Val Phe Glu Lys Ala Arg Gly Gly Val Leu Phe Ile 930 935 940 Asp Glu Ala Tyr Thr Leu Thr Pro Arg Gly Gly Gly Ala Asp Phe Gly 945 950 955 960 Gln Glu Ala Val Asp Thr Leu Leu Lys Leu Met Glu Asp His Arg Asp 965 970 975 Glu Val Val Val Ile Val Ala Gly Tyr Thr Asp Glu Met Glu Arg Phe 980 985 990 Leu Ala Ser Asn Pro Gly Leu Ser Ser Arg Phe Pro Arg Arg Ile Ala 995 1000 1005 Phe Ala Asp Tyr Ser Ser Glu Glu Leu Val Thr Ile Val Arg Ala Gln 1010 1015 1020 Ala Ala Ala Met Gly Tyr Glu Cys Gly Pro Gly Thr Gly Pro Leu Leu 1025 1030 1035 1040 Lys Glu His Phe Asp Ala Val Pro Arg Asp Arg Ser Phe Gly Asn Ala 1045 1050 1055 Arg Leu Ala Arg Gln Val Val Glu Ser Met Val Thr Arg Gln Ala Gly 1060 1065 1070 Arg Ile Ser Ser Leu Ala Ala Pro Thr Leu Asp Asp Leu Arg Ile Leu 1075 1080 1085 Leu Pro Ala Asp Val Thr Ala Ala Ala Pro Lys Ala Val Gln Gln 1090 1095 1100 <210> 133 <211> 1269 <212> DNA <213> Streptomyces roseosporus <400> 133 gtgaggccgc ccgcgcgacg ggcgaccggg aggccccgag caggccggct gttgtacggg 60 gtctcgctcg ccgccgccct ggtggtgccg gtggccgtac ccgcccaggc ggcacctgtc 120 acccttacac cggccgctga cggggccaag ggacaggagc tgcccgggat gcccaccgcg 180 ctcgacgcgc gggccgaggc cgtcgcctgc acccccgcct ccaaggagca ggcgaagaag 240 caggactggt cgcgccagcg cctcgacctg gaccggctgc accggcacac caccgggtcg 300 ggggtgaccg tcgcgctgat ctccaccggc gtcgaccccg gggccgaggg actcgacggc 360 cgcgtgaccg cccagggcca ggccgccgac gactgcgtcg gacaggggac gttcctggcc 420 gggctgatcg ccgggaccgg cggccccacc ccgcgcctcg ccggggtcgc cccgggcgcg 480 aagatcctcg ccctgcgcgg caccgaccgg cgcgggcagc cggaccccgc gctcgtcacg 540 gcggcggtac gggccgccac cacggccgag gccgacgtca tcgcggtcgc ggtggccctt 600 ccccgtaagg acaccgcgct cacccgggcc gtcgccgagg cccgcaaggc gggggcggtg 660 gtggtcgcgt cggccacccc ggagccgccg tcgcgcggct cggccgacga gatcccctcg 720 cgtacctact ggcccgccgg tgagcccggc gtcctcgcgg tcgccgacat gctgcccgcc 780 ggggcccggc cggacgccgc cctccccacc gagggcatcg atctggccgc cccgggcgcc 840 ggagtggtct ccggcgggcc gcgcggcaag gggcactacc tcggcggcgg ggtcgcggtg 900 gccaccgcgt acgcggccgg ggccgtagcc gctgtccgcg ccacccaccc cgaggcgacg 960 gccgacgcgg tggcccgtcg gctgaccgcc accgcgtacc cggccgacat cccccagctg 1020 gacgtctacg ccgccgtcac cacggtcctc ggcgacgcgg gcgcgccggt cggcggtgcg 1080 gagcgggccg ccgaacccgt ggccgtacgc gacacctccg acaccgaccg cgccaccggc 1140 cgggccgtcc tcttcgtcct cctcggctcg gcgggcgtcc tctccctcct ctgggccggt 1200 ttcgccgtca cccgggcccg cgcccggggc tggcgaccgg cgggggcggg caccccggac 1260 cagggctga 1269 <210> 134 <211> 422 <212> PRT <213> Streptomyces roseosporus <400> 134 Val Arg Pro Pro Ala Arg Arg Ala Thr Gly Arg Pro Arg Ala Gly Arg 1 5 10 15 Leu Leu Tyr Gly Val Ser Leu Ala Ala Ala Leu Val Val Pro Val Ala 20 25 30 Val Pro Ala Gln Ala Ala Pro Val Thr Leu Thr Pro Ala Ala Asp Gly 35 40 45 Ala Lys Gly Gln Glu Leu Pro Gly Met Pro Thr Ala Leu Asp Ala Arg 50 55 60 Ala Glu Ala Val Ala Cys Thr Pro Ala Ser Lys Glu Gln Ala Lys Lys 65 70 75 80 Gln Asp Trp Ser Arg Gln Arg Leu Asp Leu Asp Arg Leu His Arg His 85 90 95 Thr Thr Gly Ser Gly Val Thr Val Ala Leu Ile Ser Thr Gly Val Asp 100 105 110 Pro Gly Ala Glu Gly Leu Asp Gly Arg Val Thr Ala Gln Gly Gln Ala 115 120 125 Ala Asp Asp Cys Val Gly Gln Gly Thr Phe Leu Ala Gly Leu Ile Ala 130 135 140 Gly Thr Gly Gly Pro Thr Pro Arg Leu Ala Gly Val Ala Pro Gly Ala 145 150 155 160 Lys Ile Leu Ala Leu Arg Gly Thr Asp Arg Arg Gly Gln Pro Asp Pro 165 170 175 Ala Leu Val Thr Ala Ala Val Arg Ala Ala Thr Thr Ala Glu Ala Asp 180 185 190 Val Ile Ala Val Ala Val Ala Leu Pro Arg Lys Asp Thr Ala Leu Thr 195 200 205 Arg Ala Val Ala Glu Ala Arg Lys Ala Gly Ala Val Val Val Ala Ser 210 215 220 Ala Thr Pro Glu Pro Pro Ser Arg Gly Ser Ala Asp Glu Ile Pro Ser 225 230 235 240 Arg Thr Tyr Trp Pro Ala Gly Glu Pro Gly Val Leu Ala Val Ala Asp 245 250 255 Met Leu Pro Ala Gly Ala Arg Pro Asp Ala Ala Leu Pro Thr Glu Gly 260 265 270 Ile Asp Leu Ala Ala Pro Gly Ala Gly Val Val Ser Gly Gly Pro Arg 275 280 285 Gly Lys Gly His Tyr Leu Gly Gly Gly Val Ala Val Ala Thr Ala Tyr 290 295 300 Ala Ala Gly Ala Val Ala Ala Val Arg Ala Thr His Pro Glu Ala Thr 305 310 315 320 Ala Asp Ala Val Ala Arg Arg Leu Thr Ala Thr Ala Tyr Pro Ala Asp 325 330 335 Ile Pro Gln Leu Asp Val Tyr Ala Ala Val Thr Thr Val Leu Gly Asp 340 345 350 Ala Gly Ala Pro Val Gly Gly Ala Glu Arg Ala Ala Glu Pro Val Ala 355 360 365 Val Arg Asp Thr Ser Asp Thr Asp Arg Ala Thr Gly Arg Ala Val Leu 370 375 380 Phe Val Leu Leu Gly Ser Ala Gly Val Leu Ser Leu Leu Trp Ala Gly 385 390 395 400 Phe Ala Val Thr Arg Ala Arg Ala Arg Gly Trp Arg Pro Ala Gly Ala 405 410 415 Gly Thr Pro Asp Gln Gly 420 <210> 135 <211> 3363 <212> DNA <213> Streptomyces roseosporus <400> 135 ctattccacc agggccgtct gcaccagccg cggcttgcgg cgctggatgt gcagggcccg 60 gcccggcggc aggttcagcg gcttcgcgtt gccgaacagg cggccctccg tgggcgggca 120 ggagagcagg accgccgggt tgttggcctc gtccaggcgg cggatcaggc cgtcgctcag 180 accgcgcccc gctcccatcg cgctgcgggc gacgaccagg tgcaggccca tctcgtagcc 240 gagggtcaga tgctcgaaga gcggctcgaa ggggctctgg aacgagttgc ccgacaccat 300 gtcgtagtcg tcgaccagga cgaacaggcg cgggcccgtc caccagtcgc accggcgcat 360 ccgggcgggt gagatgtcgg ccccgggcac ccgggtcttc atcgcgcggg ccgcgccctc 420 gatggtctcg ttgaggttgt cgagggagat gacatgcccg atgcggtact cctcggggat 480 ggcgtcgacc agggtgcggc ggtagtccac cgcgatgatc ttcgcctcct cgggggcgta 540 ccgggcggtg atgccctgcg tgatcaggcg cagcagattg gtcttgccgc tctcggtgtc 600 gccgaccgcg atcaggtgcg gcgtccggct gaagtcgtgc cagaccggct ccagcgcgtc 660 ctggtcgaga ccgagcacga ggcgcatgcc gccgccctcc gtggcctcgg gggaggggag 720 ttcggagacc ggcagccggt gcgggagcat ccgcacctgc ggggcggcgg gaccggacca 780 gtgccgggag atctcgccga cgaggtgggc cacgccctcg cccagatcct ccagggagcc 840 gctgccgtcc agccggggca ggcccgcgag gaagtgcatc ttgctgtcgg cggtgatgcc 900 ccggccgccg gtgcgcggca ccgaacgggc cttgcgggtg tcgatctcgg agtccatcgg 960 atcacccatc cgcagttcga ggcgggtggc ggcctggtcg cggacctgcg cggacagctc 1020 cacccagcgg gtcgtggtga tgagcagatg gatgccgtaa ttgaggcccc gggcggcgag 1080 ttcgttgaac ttcgggatca ggccgtcgta gtcctggcgg accgtggacc agccgtcgac 1140 caccatgaag acatcgccga acggctcgtc ggggaactcc ccggcggcgc ggcgccgccg 1200 gtaggactgc atggagtcca gcgtgtggtc tacgaagaac tgctcacggc gggccagcag 1260 cgtcatcacc tcggccaccg tccggtgcac ccgctccggg ttgagccgcg ccgcgactcc 1320 gccgacgtgc gggagcgcgg cgagctggga gaggccgccg ccgccgaagt ccaggcagta 1380 gaactgcact tcggccgggg tgtgggtgag cgcgagggcg gcgatgaggg tccgggcgac 1440 cgtggacttg ccgctctgcg aaccgcccgc gacggcgaca tggccgcccg ccccggacag 1500 gtccacgacc agcggatcgc gccgctgctc gaacggcttg tccaccaggc cgaccggcac 1560 ccgcagcttc cccgtgcccg cccagcttgc cgccatcagc ccccgctcct tgtccggcgt 1620 gatcccgggc agcagcgcgt ccagcgggga cggctcgtcc agcggcggca gccacacctg 1680 gtgggcgtcc ggcccggagc cgcgcagccg gtccagcgcc acatcgagca gcgcctcctc 1740 gtcctcggcc tcctccgtct ccggctccgg gtcgggcggt gtctccaggg tgcgcggcac 1800 cacccatccg ctggtccacg gcaccacctg gctcgccacc cgggcctgca ccaccgcacc 1860 ggtcctgcgc cggtacgtcc ccgaggagta cgcggcacgg aaccgggtca gggcctccac 1920 cccggacttc agatagccgc tgccgggcgc ggcgggcaac tcgtaggcat cgggaacgcc 1980 gagcacgcca cggctctcca tcgcggagaa ggtccgcagc ccgatgcggt acgacaggtg 2040 gctctccagc tggtgcatac gcccctcgtc caggcgctgt gaagcgagca gcagatggac 2100 gcccagggac cggccgaggc ggccgatcat cacgaacagc tccatgaact cccggtgggt 2160 ggagagcagt tcgctgaact cgtcgaccac cacgaagagg ctgggcagcg gtgccaggtc 2220 ggcgccggcg gcgcgggccc gctcgtactc cagcgccgag gtgtagttgc ccgccgcgcg 2280 caacagctcc tggcggcgga tgagttcgcc gtgcagggcg tcctgcatgc gttccaccag 2340 ggcgacttcg tcggccaggt tggtgatcac ggcggaggtg tgcgggagtt cctccaggcc 2400 gaggaaggtg gcgccgccct tgaagtcgac caggacgaag ttgagggtct cggaggagtt 2460 ggtcagggcg agaccgagga cgagggtgcg cagcagctcg ctcttgccgg agccggtggc 2520 cccgatcagc atgccgtgcg ggcccatgcc gccctgcgcg gactccttga tgtcgagctc 2580 gaccgggcgg ccgtccaccc cgaccgcgat cggcacccgc agccggccgg agccggagtg 2640 ccgggcgaac agggtccccg ggtcgtgccg gtgcagatcg gggatgccga gcagggtggt 2700 cagctcgaca tcggtgtcca gcggctgcgc gatatccgtg ccgaggctca tccggcgcgg 2760 ggtgagcagc cgggccagcg cctccgcgcc gagcgggccg agccggtcgg ggcggccgag 2820 cggcaccgtg cgctccttgc ggctgcggtc ggtgcgcacc aggttcacct ggccgggccc 2880 cacggtgagg cgcagcgtgt tgcggccggg ccgccagcgc agtgccccgg acacgtccag 2940 gatcagggcg ttgcggtagc cgtggccctc ccagcggtgg ccctccggga cgctgacgcc 3000 gtccaggacg acgacggtgt acggctcgtc gcggccgggc cgggcgtccg ggtcgaaccc 3060 ggggcgctcg gcgaactcgg cgccgagcag atcgtccagc tcggtgaggt ctgcggtgat 3120 ccggcgggcc tgccccgccc cgtcctcctc gtgcggatcc agcacgtgcg gcagccactt 3180 gacccactcc cagtcggccc gccgttcgtc gctgacgcag aacgcgatcc acagctcctc 3240 gggcgcgtgg aacaccgcca actgcccgag catcgcccgc accagggccc gtacggcgtc 3300 gtgctccggg ggatgagcgc cgggcgtggc accgtccggc gcctcctccg gacgcagcag 3360 gat 3363 <210> 136 <211> 1120 <212> PRT <213> Streptomyces roseosporus <400> 136 Ile Leu Leu Arg Pro Glu Glu Ala Pro Asp Gly Ala Thr Pro Gly Ala 1 5 10 15 His Pro Pro Glu His Asp Ala Val Arg Ala Leu Val Arg Ala Met Leu 20 25 30 Gly Gln Leu Ala Val Phe His Ala Pro Glu Glu Leu Trp Ile Ala Phe 35 40 45 Cys Val Ser Asp Glu Arg Arg Ala Asp Trp Glu Trp Val Lys Trp Leu 50 55 60 Pro His Val Leu Asp Pro His Glu Glu Asp Gly Ala Gly Gln Ala Arg 65 70 75 80 Arg Ile Thr Ala Asp Leu Thr Glu Leu Asp Asp Leu Leu Gly Ala Glu 85 90 95 Phe Ala Glu Arg Pro Gly Phe Asp Pro Asp Ala Arg Pro Gly Arg Asp 100 105 110 Glu Pro Tyr Thr Val Val Val Leu Asp Gly Val Ser Val Pro Glu Gly 115 120 125 His Arg Trp Glu Gly His Gly Tyr Arg Asn Ala Leu Ile Leu Asp Val 130 135 140 Ser Gly Ala Leu Arg Trp Arg Pro Gly Arg Asn Thr Leu Arg Leu Thr 145 150 155 160 Val Gly Pro Gly Gln Val Asn Leu Val Arg Thr Asp Arg Ser Arg Lys 165 170 175 Glu Arg Thr Val Pro Leu Gly Arg Pro Asp Arg Leu Gly Pro Leu Gly 180 185 190 Ala Glu Ala Leu Ala Arg Leu Leu Thr Pro Arg Arg Met Ser Leu Gly 195 200 205 Thr Asp Ile Ala Gln Pro Leu Asp Thr Asp Val Glu Leu Thr Thr Leu 210 215 220 Leu Gly Ile Pro Asp Leu His Arg His Asp Pro Gly Thr Leu Phe Ala 225 230 235 240 Arg His Ser Gly Ser Gly Arg Leu Arg Val Pro Ile Ala Val Gly Val 245 250 255 Asp Gly Arg Pro Val Glu Leu Asp Ile Lys Glu Ser Ala Gln Gly Gly 260 265 270 Met Gly Pro His Gly Met Leu Ile Gly Ala Thr Gly Ser Gly Lys Ser 275 280 285 Glu Leu Leu Arg Thr Leu Val Leu Gly Leu Ala Leu Thr Asn Ser Ser 290 295 300 Glu Thr Leu Asn Phe Val Leu Val Asp Phe Lys Gly Gly Ala Thr Phe 305 310 315 320 Leu Gly Leu Glu Glu Leu Pro His Thr Ser Ala Val Ile Thr Asn Leu 325 330 335 Ala Asp Glu Val Ala Leu Val Glu Arg Met Gln Asp Ala Leu His Gly 340 345 350 Glu Leu Ile Arg Arg Gln Glu Leu Leu Arg Ala Ala Gly Asn Tyr Thr 355 360 365 Ser Ala Leu Glu Tyr Glu Arg Ala Arg Ala Ala Gly Ala Asp Leu Ala 370 375 380 Pro Leu Pro Ser Leu Phe Val Val Val Asp Glu Phe Ser Glu Leu Leu 385 390 395 400 Ser Thr His Arg Glu Phe Met Glu Leu Phe Val Met Ile Gly Arg Leu 405 410 415 Gly Arg Ser Leu Gly Val His Leu Leu Leu Ala Ser Gln Arg Leu Asp 420 425 430 Glu Gly Arg Met His Gln Leu Glu Ser His Leu Ser Tyr Arg Ile Gly 435 440 445 Leu Arg Thr Phe Ser Ala Met Glu Ser Arg Gly Val Leu Gly Val Pro 450 455 460 Asp Ala Tyr Glu Leu Pro Ala Ala Pro Gly Ser Gly Tyr Leu Lys Ser 465 470 475 480 Gly Val Glu Ala Leu Thr Arg Phe Arg Ala Ala Tyr Ser Ser Gly Thr 485 490 495 Tyr Arg Arg Arg Thr Gly Ala Val Val Gln Ala Arg Val Ala Ser Gln 500 505 510 Val Val Pro Trp Thr Ser Gly Trp Val Val Pro Arg Thr Leu Glu Thr 515 520 525 Pro Pro Asp Pro Glu Pro Glu Thr Glu Glu Ala Glu Asp Glu Glu Ala 530 535 540 Leu Leu Asp Val Ala Leu Asp Arg Leu Arg Gly Ser Gly Pro Asp Ala 545 550 555 560 His Gln Val Trp Leu Pro Pro Leu Asp Glu Pro Ser Pro Leu Asp Ala 565 570 575 Leu Leu Pro Gly Ile Thr Pro Asp Lys Glu Arg Gly Leu Met Ala Ala 580 585 590 Ser Trp Ala Gly Thr Gly Lys Leu Arg Val Pro Val Gly Leu Val Asp 595 600 605 Lys Pro Phe Glu Gln Arg Arg Asp Pro Leu Val Val Asp Leu Ser Gly 610 615 620 Ala Gly Gly His Val Ala Val Ala Gly Gly Ser Gln Ser Gly Lys Ser 625 630 635 640 Thr Val Ala Arg Thr Leu Ile Ala Ala Leu Ala Leu Thr His Thr Pro 645 650 655 Ala Glu Val Gln Phe Tyr Cys Leu Asp Phe Gly Gly Gly Gly Leu Ser 660 665 670 Gln Leu Ala Ala Leu Pro His Val Gly Gly Val Ala Ala Arg Leu Asn 675 680 685 Pro Glu Arg Val His Arg Thr Val Ala Glu Val Met Thr Leu Leu Ala 690 695 700 Arg Arg Glu Gln Phe Phe Val Asp His Thr Leu Asp Ser Met Gln Ser 705 710 715 720 Tyr Arg Arg Arg Arg Ala Ala Gly Glu Phe Pro Asp Glu Pro Phe Gly 725 730 735 Asp Val Phe Met Val Val Asp Gly Trp Ser Thr Val Arg Gln Asp Tyr 740 745 750 Asp Gly Leu Ile Pro Lys Phe Asn Glu Leu Ala Ala Arg Gly Leu Asn 755 760 765 Tyr Gly Ile His Leu Leu Ile Thr Thr Thr Arg Trp Val Glu Leu Ser 770 775 780 Ala Gln Val Arg Asp Gln Ala Ala Thr Arg Leu Glu Leu Arg Met Gly 785 790 795 800 Asp Pro Met Asp Ser Glu Ile Asp Thr Arg Lys Ala Arg Ser Val Pro 805 810 815 Arg Thr Gly Gly Arg Gly Ile Thr Ala Asp Ser Lys Met His Phe Leu 820 825 830 Ala Gly Leu Pro Arg Leu Asp Gly Ser Gly Ser Leu Glu Asp Leu Gly 835 840 845 Glu Gly Val Ala His Leu Val Gly Glu Ile Ser Arg His Trp Ser Gly 850 855 860 Pro Ala Ala Pro Gln Val Arg Met Leu Pro His Arg Leu Pro Val Ser 865 870 875 880 Glu Leu Pro Ser Pro Glu Ala Thr Glu Gly Gly Gly Met Arg Leu Val 885 890 895 Leu Gly Leu Asp Gln Asp Ala Leu Glu Pro Val Trp His Asp Phe Ser 900 905 910 Arg Thr Pro His Leu Ile Ala Val Gly Asp Thr Glu Ser Gly Lys Thr 915 920 925 Asn Leu Leu Arg Leu Ile Thr Gln Gly Ile Thr Ala Arg Tyr Ala Pro 930 935 940 Glu Glu Ala Lys Ile Ile Ala Val Asp Tyr Arg Arg Thr Leu Val Asp 945 950 955 960 Ala Ile Pro Glu Glu Tyr Arg Ile Gly His Val Ile Ser Leu Asp Asn 965 970 975 Leu Asn Glu Thr Ile Glu Gly Ala Ala Arg Ala Met Lys Thr Arg Val 980 985 990 Pro Gly Ala Asp Ile Ser Pro Ala Arg Met Arg Arg Cys Asp Trp Trp 995 1000 1005 Thr Gly Pro Arg Leu Phe Val Leu Val Asp Asp Tyr Asp Met Val Ser 1010 1015 1020 Gly Asn Ser Phe Gln Ser Pro Phe Glu Pro Leu Phe Glu His Leu Thr 1025 1030 1035 1040 Leu Gly Tyr Glu Met Gly Leu His Leu Val Val Ala Arg Ser Ala Met 1045 1050 1055 Gly Ala Gly Arg Gly Leu Ser Asp Gly Leu Ile Arg Arg Leu Asp Glu 1060 1065 1070 Ala Asn Asn Pro Ala Val Leu Leu Ser Cys Pro Pro Thr Glu Gly Arg 1075 1080 1085 Leu Phe Gly Asn Ala Lys Pro Leu Asn Leu Pro Pro Gly Arg Ala Leu 1090 1095 1100 His Ile Gln Arg Arg Lys Pro Arg Leu Val Gln Thr Ala Leu Val Glu 1105 1110 1115 1120 <210> 137 <211> 21 <212> DNA <213> Streptomyces roseosporus <400> 137 gctcgtcccc ctccccgcac t 21 <210> 138 <211> 22 <212> DNA <213> Streptomyces roseosporus <400> 138 cgaacaggtg ggctttgagt gg 22 <210> 139 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 139 cttcgtgaac accctcgtcc 20 <210> 140 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 140 gttcgtcgag gtccagtacg 20 <210> 141 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 141 gcaccagcgt gtgcggatcg 20 <210> 142 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 142 cacgtacgtg acgatcctcg 20 <210> 143 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 143 cgtactggac ctcgacgacc 20 <210> 144 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 144 cgaccagcgt gtgtacgtcc 20 <210> 145 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 145 agtcctcagc catctcctcg 20 <210> 146 <211> 19 <212> DNA <213> Streptomyces roseosporus <400> 146 gagaccgtcg gcgtggacg 19 <210> 147 <211> 21 <212> DNA <213> Streptomyces roseosporus <400> 147 agggccacac cgtcgaactc c 21 <210> 148 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 148 atcgtcgccg actacctcgc 20 <210> 149 <211> 19 <212> DNA <213> Streptomyces roseosporus <400> 149 ggcagctacc tcgtactgg 19 <210> 150 <211> 21 <212> DNA <213> Streptomyces roseosporus <400> 150 tgtacgacag cggcgtcgaa c 21 <210> 151 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 151 cgattctcgg catgttcgcc 20 <210> 152 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 152 tcgtctccta catgacctcg 20 <210> 153 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 153 ttcacggaaa ccgaacgtcg 20 <210> 154 <211> 20 <212> DNA <213> Streptomyces roseosporus <400> 154 ggttcaggcc gcagccaacg 20 <210> 155 <211> 21 <212> DNA <213> Streptomyces roseosporus <400> 155 cgctgacctt ggtcagaagc c 21 <210> 156 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 156 gcgaagcttc tggtggcgca tcacctgg 28 <210> 157 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 157 gctctagatg gaagtatgtc ctccatcgc 29 <210> 158 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 158 cggatcccgc cggcacctga ccc 23 <210> 159 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 159 ccgaattccg cctccgagta catcgagg 28 <210> 160 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 160 acsswsggsg tssccttcat gaa 23 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 161 atggtgttcg agaactaycc 20 <210> 162 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 162 scsctscagg agggshtsst sttcc 25 <210> 163 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 163 ccgaasacsa cgtcgtcscg scc 23 <210> 164 <211> 2418 <212> PRT <213> Streptomyces coelicolor <400> 164 Met Ala Lys Ser Gly Leu Glu Asp Ile Leu Pro Leu Ser Pro Leu Gln 1 5 10 15 Glu Gly Met Leu Phe His Asn Leu Phe Asp Glu Glu Glu Leu Asp Ala 20 25 30 Tyr Asn Val Gln Val Phe Ile Asp Leu Glu Gly Gly Thr Asp Pro Glu 35 40 45 Arg Leu Arg Arg Ala Gly Gln Ala Leu Leu Glu Arg His Ala Asn Leu 50 55 60 Arg Ala Ala Phe Arg His Glu Gly Leu Lys Arg Pro Val Gln Leu Ile 65 70 75 80 Pro Arg Arg Val Val Leu Pro Trp Gly Glu Glu Asp Leu Ser Gly Val 85 90 95 Ala Glu Pro Glu Arg Glu Ala Ala Ala Glu Arg Val Ala Glu Arg Asp 100 105 110 Arg Trp Thr Arg Phe Asp Leu Ser Arg Pro Pro Leu Ile Arg Phe Thr 115 120 125 Leu Val Arg Leu Gly Pro Ala Arg His Arg Leu Leu Leu Thr Leu His 130 135 140 His Ile Leu Ala Asp Gly Trp Ser Met Pro Ile Leu Leu Arg Glu Leu 145 150 155 160 Met Thr Leu Tyr Thr Val His Gly Asp Gly Thr Ala Leu Pro Arg Val 165 170 175 Arg Pro Tyr Arg Asp Tyr Leu Gly Trp Leu Gly Gly Arg Asp Arg Asp 180 185 190 Ala Ala Arg Gln Ala Trp Thr Glu Ala Phe Ala Gly Leu Asp Ala Pro 195 200 205 Ser Ile Val Ala Pro Gly Arg Gly Ala Leu Thr Ala Ala Pro Glu Arg 210 215 220 Ile Asp Phe Ser Glu Asp Glu Ala Ala Ser Ala Ala Leu Thr Arg Phe 225 230 235 240 Ala Arg Ser Asn Gly Leu Thr Val Asn Thr Val Ile Gln Gly Cys Trp 245 250 255 Gly Leu Val Leu Ser His Leu Thr Gly Arg Asp Asp Val Val Phe Gly 260 265 270 Val Thr Val Ser Gly Arg Pro Pro Glu Leu Pro Gly Ile Asp Thr Met 275 280 285 Val Gly Leu Phe Met Asn Thr Leu Pro Leu Arg Val Arg Leu Arg Pro 290 295 300 Ala Glu Thr Leu Thr Gly Phe Leu Arg Arg Leu Gln Gly Glu Gln Ala 305 310 315 320 Arg Leu Ile Asp His Gln Trp Val Gly Leu Ala Glu Ile Gln Arg Trp 325 330 335 Ala Gly Ser Gly Glu Leu Phe Asp Thr Ala Met Val Phe Glu Asn Tyr 340 345 350 Pro Leu Asn Ser Ser Arg Gly Arg Pro Pro Gly Ala Ala Pro Asp Ala 355 360 365 Asp Leu Pro Thr Val Leu Gly Val Arg Ser Lys Asp Gln Met His Tyr 370 375 380 Pro Leu Gly Leu Leu Ala Leu Pro Arg Glu Thr Leu Arg Phe Ser Leu 385 390 395 400 Gly Tyr Leu Pro Gln Val Phe Asp Pro Ala Arg Val Glu Ala Val Ile 405 410 415 Ala Ala Phe Arg Arg Ala Leu Arg Thr Val Leu Asp Ala Pro Asp Thr 420 425 430 Arg Val Gly Ala Val Ala Leu Leu Asp Pro Glu Val Arg Gly Thr Val 435 440 445 Leu Glu Lys Trp Ser Gly Ser Asp Asp Val Arg Pro Ala Glu Arg Phe 450 455 460 Thr Asp Leu Phe Glu Glu Gln Val Ala Arg Thr Pro Gly Lys Thr Ala 465 470 475 480 Leu Ile Ala Pro Asp Gly Arg Leu Thr Tyr Ala Glu Leu Asp Ala Ala 485 490 495 Ala Asn Arg Leu Ala Arg Arg Leu Val Glu Leu Gly Val Gly Pro Glu 500 505 510 Arg His Val Ala Val Ala Val Gly Arg Arg Thr Glu Leu Val Val Gly 515 520 525 Met Leu Ala Val Leu Lys Ala Gly Gly Ala Tyr Val Pro Val Asp Pro 530 535 540 Glu Tyr Pro Pro Asp Arg Ile Arg His Met Ile Gln Asp Ala Asp Pro 545 550 555 560 Ala Leu Val Leu Thr Thr Ser Asp Val Asp Asp Arg Ile Gly Glu Glu 565 570 575 Cys Cys Gly Pro Leu Thr Phe Val Met Asp Asp Pro Asn Thr Gly Thr 580 585 590 Ser Leu Gly Arg His Ser Gly Thr Ala Leu Thr Asp Ala Asp Arg Ala 595 600 605 Ala Pro Leu Leu Pro Gly His Pro Ala Tyr Val Ile Tyr Thr Ser Gly 610 615 620 Thr Thr Gly Arg Pro Lys Gly Val Val Val Glu His Arg Ala Leu Ser 625 630 635 640 Ala Phe Val Arg His Cys Arg Ser Ser Gln Ala Pro Asp Ile Ser Gly 645 650 655 Leu Ser Val Met Gln Ala Ser Ala Ser Phe Asp Gln Ser Val Gly Ser 660 665 670 Leu His Ala Pro Leu Ile Ser Gly Gly Cys Val Arg Leu Thr Asp Leu 675 680 685 Arg Ala Leu Ala Glu Thr Ala Gly Ser Glu Pro Gly Phe His Arg Ala 690 695 700 Thr Phe Met Lys Gly Thr Pro Ser His Leu Ala Leu Leu Ala Thr Met 705 710 715 720 Pro Pro Glu Val Ala Pro Ser Gly Thr Leu Thr Leu Gly Gly Glu Glu 725 730 735 Leu Arg Gly Glu Ile Leu Ala Pro Trp Arg Glu Ala Ala Gly Asp Val 740 745 750 Thr Val Val Asn Val Tyr Gly Pro Thr Glu Ala Thr Gly His Cys Leu 755 760 765 Glu His Trp Ile Ala Pro Asp Arg Thr Val Glu Pro Gly Pro Val Pro 770 775 780 Ile Gly Thr Pro His Glu Gly Val Arg Val Tyr Val Leu Asp Ser Ala 785 790 795 800 Leu Arg Pro Val Ala Pro Gly Leu Asp Gly Glu Val Tyr Leu Ala Gly 805 810 815 Val Gln Leu Ala Arg Gly Tyr Leu Gly Arg Gly Gly Leu Thr Ala Glu 820 825 830 Arg Phe Thr Ala Asp Pro Phe Gly Ala Pro Gly Ser Arg Met Tyr Arg 835 840 845 Thr Gly Asp Val Ala His Trp Asn Glu Ala Gly Glu Leu Val Phe Ala 850 855 860 Gly Arg Ala Asp Arg Gln Val Lys Leu Arg Gly Tyr Arg Ile Glu Leu 865 870 875 880 Gly Glu Ile Glu Ala Ala Val Ala Gly Gly Pro Gly Val Arg Gln Ala 885 890 895 Ala Val Val Leu Arg Glu Asp Arg Pro Gly Asp Gln Arg Leu Val Ala 900 905 910 Tyr Val Val Pro Asp Pro Gly His Trp Asp Glu Ala Ala Ala Arg Ala 915 920 925 Arg Leu Ala Leu Ser Leu Pro Asp Phe Met Met Pro Ser Ala Phe Val 930 935 940 Ala Leu Asp Ala Leu Pro Leu Ser Pro Asn Gly Lys Leu Asp Arg Ala 945 950 955 960 Ala Leu Pro Ala Pro Thr Tyr Thr Gly Arg Thr Ala Gly Arg Ala Pro 965 970 975 Arg Thr Pro Ala Glu Glu Ile Leu Cys Asp Leu Tyr Ala Glu Val Leu 980 985 990 Ser Leu Pro Gly Val Thr Val Asp Asp Asp Phe Phe Asp Leu Gly Gly 995 1000 1005 His Ser Leu Leu Ala Thr Arg Leu Val Ser Arg Val Arg Thr Thr Leu 1010 1015 1020 Gly Ala Glu Leu Ser Ile Arg Gln Phe Phe Glu Ala Pro Thr Pro Ala 1025 1030 1035 1040 Ala Leu Ala Val Val Leu Ala Gly Ala Gly Arg Ala Arg Ala Ala Leu 1045 1050 1055 Thr Ala Arg Pro Arg Pro Glu Arg Leu Pro Leu Ser Tyr Ala Gln Gln 1060 1065 1070 Arg Leu Trp Phe Leu His Leu Leu Glu Gly Pro Ser Pro Thr Tyr Asn 1075 1080 1085 Ile Pro Thr Val Leu Arg Leu Ser Gly Pro Leu Arg Pro Asp Ala Leu 1090 1095 1100 Arg Ala Ala Leu Leu Asp Val Val Gly Arg His Glu Ser Leu Arg Thr 1105 1110 1115 1120 Thr Phe Thr Glu Asp Glu Arg Gly Ala Arg Gln Val Val His Pro Ala 1125 1130 1135 Asp Gly Val Arg Pro Val Phe Glu Thr Ala Glu Ser Thr Glu Ala Asp 1140 1145 1150 Tyr Glu Ala Asp Leu Ala Arg Ala Ala Arg His Ala Phe Asp Leu Gly 1155 1160 1165 Ala Glu Ile Pro Val Arg Ala Arg Leu Leu Arg Leu Ser Glu Arg Glu 1170 1175 1180 His Val Leu Leu Leu Leu Val His His Ile Ala Ser Asp Ala Trp Ser 1185 1190 1195 1200 Arg Gly Pro Leu Ala Gln Asp Leu Thr Ala Ala Tyr Thr Ala Arg Cys 1205 1210 1215 Ala Gly Asp Ala Pro Ala Trp Gln Pro Leu Pro Val Gln Tyr Ala Asp 1220 1225 1230 Tyr Ala Leu Trp Gln Gln Glu Ile Leu Gly Asp Asp Thr Asp Pro Asp 1235 1240 1245 Thr Leu Ala Gly Arg Gln Leu Ala Tyr Trp Lys Gln Gln Leu Ala Gly 1250 1255 1260 Leu Pro Glu Arg Leu Asp Leu Pro Thr Asp Arg Pro Arg Pro Ala Thr 1265 1270 1275 1280 Ala Asp His Thr Gly Asp Arg Val Glu Phe Ala Leu Pro Ala Asp Leu 1285 1290 1295 His Thr Arg Leu Thr Glu Leu Ala Arg Ala Thr Asp Thr Thr Leu Tyr 1300 1305 1310 Met Val Leu Gln Ala Ala Leu Ala Thr Leu Leu Thr Arg His Gly Ala 1315 1320 1325 Gly Glu Asp Ile Pro Ile Gly Thr Pro Val Ala Gly Arg Thr Asp Asp 1330 1335 1340 Ala Thr Asp His Leu Val Gly Phe Phe Val Asn Thr Leu Val Leu Arg 1345 1350 1355 1360 Thr Asp Thr Ser Gly Asn Pro Thr Phe Arg Asp Leu Leu Thr Arg Val 1365 1370 1375 Arg Asp Thr Asp Leu Thr Ala Tyr Thr His Gln Asp Leu Pro Phe Glu 1380 1385 1390 Arg Leu Val Glu Ala Leu Asn Pro Thr Arg Ser Leu Thr His His Pro 1395 1400 1405 Leu Phe Gln Val Val Leu Ser Leu Arg Ser Thr Ala Pro Arg Arg Ala 1410 1415 1420 Asp Gly Glu Gly Ala Pro Ala Leu Pro Gly Gly Leu Arg Val Ser Gly 1425 1430 1435 1440 Thr Gly Gly Ala Ala Ala Thr Ala Ala Lys Val Asp Leu Gly Phe Ser 1445 1450 1455 Val Thr Glu Arg Arg Ala Ala Asp His Thr Pro Asp Gly Val Ala Gly 1460 1465 1470 Val Leu Asp Phe Arg Thr Asp Leu Phe Asp Arg Gly Thr Ala Gln Gly 1475 1480 1485 Leu Val Asp Arg Leu Val Arg Val Leu Ala Asp Ala Ala Ala His Pro 1490 1495 1500 Asp Arg Pro Leu Ser Arg Ile Asp Val Leu Gly Pro Arg Glu Arg His 1505 1510 1515 1520 Arg Val Val Glu Glu Trp Asn Ala Thr Ala Lys Gly Leu Ala Pro Ala 1525 1530 1535 Thr Leu Pro Glu Leu Phe Glu Arg His Val Arg Glu Arg Pro Gly Ala 1540 1545 1550 Glu Ala Val Val Ala Gly Asp Thr Ser Leu Ser Tyr Ala Glu Leu Asn 1555 1560 1565 Ala Arg Ala Asn Arg Leu Ala Arg Leu Leu Val Ala Arg Gly Ala Gly 1570 1575 1580 Pro Glu Arg Leu Val Ala Leu Ala Leu Pro Arg Ser Ala Glu Leu Pro 1585 1590 1595 1600 Val Ala Val Leu Ala Val Ala Lys Ala Gly Ala Ala Tyr Leu Pro Leu 1605 1610 1615 Asp Pro Ala His Pro Ala Glu Arg Ile Ala Gly Thr Leu Asp Asp Ala 1620 1625 1630 Ala Pro Val Ala Leu Leu Thr Thr Ala Ala Val Ala Ala Gly Leu Pro 1635 1640 1645 Asp Thr Asp Val Pro Arg Leu Leu Leu Asp Glu Glu Pro Ala Ala Gly 1650 1655 1660 Gly Gly Glu Asp Ala Ala Asp Leu Thr Asp Ala Asp Arg Leu Ala Pro 1665 1670 1675 1680 Leu Leu Pro Gly His Pro Ala Tyr Val Ile Tyr Thr Ser Gly Thr Thr 1685 1690 1695 Gly Arg Pro Lys Gly Val Thr Val Thr His Ser Gly Leu Pro Ala Leu 1700 1705 1710 Leu Asp Ile Phe Thr Ser Gln Leu Asp Val Val Pro Gly Ser Arg Val 1715 1720 1725 Leu His His Leu Ser Pro Ala Phe Asp Gly Gly Phe Trp Glu Leu Ala 1730 1735 1740 Met Gly Leu Leu Thr Gly Ala Ala Leu Val Val Val Glu Pro Gly Thr 1745 1750 1755 1760 Val Pro Gly Pro Ala Leu Ala Ala Leu Ala Val Arg His Arg Val Thr 1765 1770 1775 His Ala Ala Ile Thr Pro Ala Val Leu Gln Leu Ile Pro Glu Gly Ala 1780 1785 1790 Leu Pro Ala Gly Thr Thr Leu Val Val Ala Ala Glu Thr Cys Pro Pro 1795 1800 1805 Glu Leu Val Ala Arg Trp Ser Ala Gly Arg Leu Met Arg Asn Ser Tyr 1810 1815 1820 Gly Pro Thr Glu Thr Thr Val Cys Ala Thr Met Ser Ala Pro Leu Ala 1825 1830 1835 1840 Gly Ala Ala Val Pro Pro Ile Gly Arg Pro Ile Ala Asp Thr Ala Gly 1845 1850 1855 Tyr Val Leu Asp Asp Ala Leu Gln Pro Val Pro Pro Gly Val Pro Gly 1860 1865 1870 Glu Leu Tyr Val Arg Gly Pro Gly Leu Ala Arg Gly Tyr Leu Gly Arg 1875 1880 1885 Pro Ser Leu Thr Ala Gly Arg Phe Val Ala Cys Pro Phe Gly Pro Ala 1890 1895 1900 Gly Gly Val Met Tyr Arg Thr Gly Asp Leu Val Arg His Arg Ala Asp 1905 1910 1915 1920 Gly Asp Leu Glu Tyr Leu Gly Arg Thr Asp Thr Gln Val Lys Leu Arg 1925 1930 1935 Gly Met Arg Val Glu Pro Ala Glu Ile Glu Ala Val Thr Ala Gly Leu 1940 1945 1950 Pro Gly Val Ala Gln Ala Ala Val Leu Val Arg Glu Asp Thr Pro Gly 1955 1960 1965 Asp Arg Arg Leu Val Gly Tyr Val Val Pro Asp Ala Gly Ala Ser Val 1970 1975 1980 Asp Pro Gly Ala Leu Arg Gln Ala Leu Arg Gly Ser Leu Pro Glu Tyr 1985 1990 1995 2000 Met Val Pro Ala Ala Leu Val Val Leu Asp Ala Leu Pro Leu Thr Thr 2005 2010 2015 Asn Gly Lys Leu Asp His Arg Ala Leu Pro Ala Pro Glu Tyr Arg Thr 2020 2025 2030 Val Glu Gly Arg Ser Pro Arg Thr Pro Arg Glu Glu Ala Leu Cys Arg 2035 2040 2045 Leu Phe Ala Glu Val Leu Gly Leu Glu Leu Val Gly Leu Asp Asp Gly 2050 2055 2060 Phe Phe Asp Leu Gly Gly His Ser Leu Leu Ala Ile Arg Leu Val Glu 2065 2070 2075 2080 Arg Val Arg Ala Glu Leu Gly Glu Glu Leu Gly Val Arg Asp Leu Phe 2085 2090 2095 Ala Ala Pro Thr Val Ala Asp Leu Ala Val Arg Leu Ala Ala Arg Gly 2100 2105 2110 Gly Arg Glu Pro Met Glu Arg Leu Leu Pro Leu Arg Ala Ala Gly Thr 2115 2120 2125 Ala Arg Pro Val Phe Cys Val His Pro Gly Ser Gly Met Ser Trp Cys 2130 2135 2140 Tyr Ser Gly Leu Val Arg His Leu Pro Pro Gly Ile Pro Val Tyr Gly 2145 2150 2155 2160 Leu Gln Ala Ala Gly Leu Asp Gly Asp Gly Pro Leu Pro Ala Thr Leu 2165 2170 2175 Gln Glu Met Ala Ala Glu Tyr Ala Asp Leu Val Arg Gln Thr Gln Pro 2180 2185 2190 Glu Gly Pro Tyr Arg Leu Leu Gly Trp Ser Leu Gly Gly Asn Val Ala 2195 2200 2205 Phe Ala Met Ala Arg Glu Leu Arg Ala Arg Gly Gln Glu Val Glu Leu 2210 2215 2220 Leu Ala Phe Leu Asp Ala Tyr Pro Arg Arg Ala Gly Ala Gly Pro Glu 2225 2230 2235 2240 Ala Pro Leu Ala Glu Val Phe Ala His Asn Leu Arg Asp Ala Gly Phe 2245 2250 2255 Asp Val Ala Glu Glu Glu Leu Thr Gly Gly Arg Phe Pro Thr Ala Arg 2260 2265 2270 Tyr Arg Ala Phe Leu Asn Ala Ala Gly Asp Pro Met Gly Arg Leu Asp 2275 2280 2285 Glu Ala Glu Leu Ala Ala Val Leu Glu Val Phe Met Asn Asn Ala Ala 2290 2295 2300 Leu Met Arg Gly His Thr Pro Gly Thr Tyr Asp Gly Asp Val Leu Val 2305 2310 2315 2320 Leu Ala Ala Glu Arg Ala Asp Gly Asp Lys Leu Ala Arg Arg Gly Ala 2325 2330 2335 Glu Ser Trp Arg Pro His Val Arg Gly Arg Ile Glu Arg Val Gly Val 2340 2345 2350 Asp Ala Asp His Leu Gly Leu Val Gln Ser Asp Ala Ala Leu Ala Val 2355 2360 2365 Ile Gly Arg Ala Leu Ala Gly Arg Leu Asp Pro Ala Thr Gly His Ala 2370 2375 2380 Ala Ser Ala Ala Val Pro Glu Thr Glu Gly Val Thr Ala Met Asn Pro 2385 2390 2395 2400 Ser Pro Glu Pro Ala Pro Ser Pro Glu Ser Leu Asp Ser Thr Glu Val 2405 2410 2415 Ala Asn <210> 165 <211> 273 <212> PRT <213> Streptomyces coelicolor <400> 165 Met Pro Val Leu Thr Val Asn Gly Ile Arg Ile Asn Tyr Tyr Asp Asp 1 5 10 15 Ala Pro Pro Ala Gly Ala Gln Asn Ala Pro Ala Val Leu Leu Val Met 20 25 30 Gly Ser Gly Gly Ser Gly Arg Ala Trp His Leu His Gln Val Pro Ala 35 40 45 Leu Val Ala Ala Gly Phe Arg Val Ile Ser Phe Asp Asn Arg Gly Ile 50 55 60 Ala Pro Ser Glu Glu Cys Pro Gly Gly Phe Gly Ile Asp Asp Leu Val 65 70 75 80 Ala Asp Thr Ala Ala Leu Val Glu Glu Leu Arg Leu Gly Pro Cys Arg 85 90 95 Val Ala Gly Ile Ser Met Gly Ala His Ile Ala Gln Glu Leu Ala Leu 100 105 110 Ser Arg Pro Asp Leu Val Asp Arg Leu Val Leu Met Ala Thr Arg Ala 115 120 125 Arg Pro Asp Ala Leu Arg Glu Ala Leu Cys Arg Ala Glu Met Glu Leu 130 135 140 Tyr Asp Gln Gly Ile Arg Leu Pro Ala Ala Tyr Glu Ala Val Val Gln 145 150 155 160 Ala Met Gln Asn Leu Ser Pro Arg Thr Leu Asp Asn Asp Val Gln Ala 165 170 175 Arg Asp Trp Leu Asp Val Leu Glu Leu Thr Arg Arg Ser Gly Ala Gly 180 185 190 Tyr Arg Ala Gln Leu Gly Val Arg Val Asp Gly Asp Arg Arg Glu Ala 195 200 205 Tyr Arg Gly Ile Arg Ala Ala Thr Arg Val Val Ala Phe Gln Asp Asp 210 215 220 Leu Ile Ala Pro Pro His Leu Gly Arg Glu Val Ala Asp Ala Ile Pro 225 230 235 240 Gly Ala Glu Tyr Glu Leu Val Pro Asp Cys Gly His Tyr Gly Tyr Leu 245 250 255 Glu Ser Pro Asp Ala Val Asn Lys Ser Leu Val Glu Phe Leu Arg Arg 260 265 270 Asn

Claims (1)

  1. 답토마이신을 제조하기 위한, 서열 번호 11의 아미노산 서열에 의해 코딩되는 폴리펩티드를 코딩하고 dptBC를 포함하는 분리된 핵산 분자의 용도.
KR1020107004815A 2001-08-06 2002-07-31 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 KR20100039443A (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US31038501P 2001-08-06 2001-08-06
US60/310,385 2001-08-06
WOPCT/US01/32354 2001-10-17
PCT/US2001/032354 WO2002059322A2 (en) 2000-10-17 2001-10-17 Compositions and methods relating to the daptomycin biosynthetic gene cluster
US37986602P 2002-05-10 2002-05-10
US60/379,866 2002-05-10

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7001843A Division KR20040032891A (ko) 2001-08-06 2002-07-31 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및방법

Publications (1)

Publication Number Publication Date
KR20100039443A true KR20100039443A (ko) 2010-04-15

Family

ID=34082747

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020107004815A KR20100039443A (ko) 2001-08-06 2002-07-31 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법
KR10-2004-7001843A KR20040032891A (ko) 2001-08-06 2002-07-31 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR10-2004-7001843A KR20040032891A (ko) 2001-08-06 2002-07-31 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및방법

Country Status (6)

Country Link
US (2) US20050027113A1 (ko)
JP (1) JP2005508622A (ko)
KR (2) KR20100039443A (ko)
AR (1) AR036202A1 (ko)
AU (1) AU2002324580A1 (ko)
IL (1) IL160169A0 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015093839A1 (ko) * 2013-12-18 2015-06-25 동국제약 주식회사 신규한 스트렙토마이세스 필라멘토서스 변이주 및 이를 이용한 답토마이신의 생산 방법
KR20220006800A (ko) * 2020-07-09 2022-01-18 건국대학교 산학협력단 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6696412B1 (en) 2000-01-20 2004-02-24 Cubist Pharmaceuticals, Inc. High purity lipopeptides, Lipopeptide micelles and processes for preparing same
US20060014674A1 (en) 2000-12-18 2006-01-19 Dennis Keith Methods for preparing purified lipopeptides
JP2008534444A (ja) * 2005-03-10 2008-08-28 スミスクライン・ビーチャム・コーポレイション 新規な方法
KR100762315B1 (ko) * 2006-01-24 2007-10-04 한국생명공학연구원 푸자리시딘 생합성 효소 및 이를 코딩하는 유전자
DE102007017861A1 (de) * 2007-04-13 2008-10-16 Philipps-Universität Marburg Protein zur chemoenzymatischen Herstellung von L-threo-Hydroxyaspartat
TW201118170A (en) * 2009-11-20 2011-06-01 Ind Tech Res Inst Expression vector for expressing recombinant protein in cyanobacterium
HUE039967T2 (hu) 2009-11-23 2019-02-28 Cubist Pharmaceuticals Llc Lipopeptid kompozíció és ezzel kapcsolatos eljárások
US9422566B2 (en) * 2011-10-12 2016-08-23 Sanofi Gene cluster for biosynthesis of griselimycin and methylgriselimycin
WO2014144649A1 (en) 2013-03-15 2014-09-18 Modular Genetics, Inc. Generation of acyl amino acids
US11371066B2 (en) 2015-07-13 2022-06-28 Modular Genetics, Inc. Generation of acyl alcohols
WO2018222507A1 (en) * 2017-05-27 2018-12-06 The Rockefeller University Malacidins and methods of use
CN109554321B (zh) * 2018-12-03 2021-12-31 清华大学 一种高产脂肽的基因工程菌及其应用
US20220298517A1 (en) * 2019-06-25 2022-09-22 Novozymes A/S Counter-selection by inhibition of conditionally essential genes
CN111139208B (zh) * 2019-09-04 2022-07-26 湖南省微生物研究院 一种伊短菌素高产工程菌及其制备方法和应用
CN113249401B (zh) * 2020-02-10 2022-11-04 中国科学院分子植物科学卓越创新中心 一种提高链霉菌雷帕霉素产量的方法
US11173189B2 (en) 2020-03-12 2021-11-16 Baxter International Inc. Daptomycin formulations containing a combination of sorbitol and mannitol
CN111575251B (zh) * 2020-05-29 2022-03-11 上海交通大学 一种用于达托霉素生物合成的dptC1突变体的构建
CN113045628B (zh) * 2021-03-23 2022-06-14 山东大学 一种抗菌肽或其变体在制备抗菌产品中的应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4537717A (en) * 1982-05-21 1985-08-27 Eli Lilly And Company Derivatives of A-21978C cyclic peptides
US4885243A (en) * 1984-10-09 1989-12-05 Eli Lilly And Company Process for producing A-21978C derivatives
IT1264712B1 (it) * 1993-07-13 1996-10-04 Eniricerche Spa Metodo di sintesi biologica di peptidi
IT1277466B1 (it) * 1995-08-09 1997-11-10 Eniricerche Spa Peptide sintetasi ingegnerizzate e loro impiego per la produzione via non-ribosomale di peptidi
US5827689A (en) * 1996-11-13 1998-10-27 Smithkline Beecham Corporation FabD polynucleotides
US6258934B1 (en) * 1997-01-24 2001-07-10 Smithkline Beecham Corporation FabD
US6143526A (en) * 1998-03-09 2000-11-07 Baltz; Richard H. Biosynthetic genes for spinosyn insecticide production

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015093839A1 (ko) * 2013-12-18 2015-06-25 동국제약 주식회사 신규한 스트렙토마이세스 필라멘토서스 변이주 및 이를 이용한 답토마이신의 생산 방법
US10301690B2 (en) 2013-12-18 2019-05-28 Dong Kook Pharm Co., Ltd. Streptomyces filamentosus variant and method for producing daptomycin using same
KR20220006800A (ko) * 2020-07-09 2022-01-18 건국대학교 산학협력단 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도

Also Published As

Publication number Publication date
KR20040032891A (ko) 2004-04-17
AU2002324580A1 (en) 2003-02-24
IL160169A0 (en) 2004-07-25
JP2005508622A (ja) 2005-04-07
US20070128694A1 (en) 2007-06-07
US20050027113A1 (en) 2005-02-03
AR036202A1 (es) 2004-08-18

Similar Documents

Publication Publication Date Title
KR20100039443A (ko) 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
US7635765B2 (en) Gene encoding a nonribosomal peptide synthetase for the production of ramoplanin
KR20100049580A (ko) 티오펩티드 전구체 단백질, 그를 코딩하는 유전자 및 그의 용도
US6495348B1 (en) Mitomycin biosynthetic gene cluster
WO2002059322A2 (en) Compositions and methods relating to the daptomycin biosynthetic gene cluster
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
KR102359972B1 (ko) 화합물의 제조를 위한 조성물 및 방법
US20030175888A1 (en) Discrete acyltransferases associated with type I polyketide synthases and methods of use
US20030171562A1 (en) Genes and proteins for the biosynthesis of polyketides
KR101189475B1 (ko) 삼원환 화합물의 생합성을 담당하는 유전자와 단백질
EP1421097A2 (en) Compositions and methods relating to the daptomycin biosynthetic gene cluster
CN106676115B (zh) 2’-氯代喷司他丁和2’-氨基-2’-脱氧腺苷生物合成基因簇及其应用
US20030064491A1 (en) Genes and proteins involved in the biosynthesis of enediyne ring structures
US20030113874A1 (en) Genes and proteins for the biosynthesis of rosaramicin
US20040219645A1 (en) Polyketides and their synthesis
CN101027395A (zh) 用于制备复合聚酮化合物的生物合成基因簇
CA2450691C (en) Genes and proteins involved in the biosynthesis of lipopeptides
US20030157654A1 (en) Biosynthesis of enediyne compounds by manipulation of C-1027 gene pathway
CN107541523B (zh) 曲张链丝菌素生物合成基因簇及其应用
KR100549690B1 (ko) 에프알-008 폴리케타이드 합성에 관여하는 유전자
CN101142313A (zh) 编码产生地索拉唑类的合成途径的基因
JPH1094395A (ja) フレノリシン遺伝子クラスター
US20040132055A1 (en) Recombinant chalcomycin polyketide synthase and modifying genes
WO2003040372A2 (en) Polynucleotides and polypeptides involved in clavulinic acid biosynthesis and use thereof

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application