KR20080032641A - 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 - Google Patents

티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 Download PDF

Info

Publication number
KR20080032641A
KR20080032641A KR1020087004989A KR20087004989A KR20080032641A KR 20080032641 A KR20080032641 A KR 20080032641A KR 1020087004989 A KR1020087004989 A KR 1020087004989A KR 20087004989 A KR20087004989 A KR 20087004989A KR 20080032641 A KR20080032641 A KR 20080032641A
Authority
KR
South Korea
Prior art keywords
ala
leu
val
arg
gly
Prior art date
Application number
KR1020087004989A
Other languages
English (en)
Inventor
안젤리나 라모스 카스트로
알프레도 페르난데스 브라나
펠리페 롬보 브루고스
카르멘 멘데스 페르난데스
호세 안토니오 살라스 페르난데스
아나 벨라스코 아이글레시아스
카르멘 스키레이스너 산체스
Original Assignee
파르마 마르 에스.에이., 소시에다드 유니퍼스널
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파르마 마르 에스.에이., 소시에다드 유니퍼스널 filed Critical 파르마 마르 에스.에이., 소시에다드 유니퍼스널
Publication of KR20080032641A publication Critical patent/KR20080032641A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • C12N15/69Increasing the copy number of the vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/185Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system
    • C12P17/187Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system containing two or more directly linked sulfur atoms, e.g. epithiopiperazines

Abstract

본 발명은 티오코랄린 생합성에 수반되는 유전자 및 그의 이종적 생산에 관한 것이다. 본 발명에 따르면, 티오코랄린 생합성 이행능력이 있는 유전자의 클러스터가 동정되고 클로닝되었다. 상기 유전자 클러스터는 항종양 및 항박테리아 활성을 가진 티오코랄린의 이종적 생산에 이용될 수 있다.

Description

티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적 생산{GENES INVOLVED IN THE BIOSYNTHESIS OF THIOCORALINE AND HETEROLOGOUS PRODUCTION OF SAME}
본 발명은 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터 및 티오코랄린의 이종적 생산에서의 그의 용도에 관한 것이다.
티오코랄린 (I)
Figure 112008014936915-PCT00001
은 해양 방선균, 구체적으로는 미크로모노스포라세 (Micromonosporaceae) 패밀리로부터 분리되는 시클로이량체성 티오뎁시펩티드이다 (Perez Baz et al., J. Antibiotics, 50(9), 738-741, 1997; Romero et al., J. Antibiotics, 50(9), 734-737, 1997). 티오코랄린이 미크로모노스포라 마리나 (Micromonospora marina) 또는 미크로모노스포라 종 (Micromonospora sp .) L-13-ACM-092 으로부터 수득된다는 것이 기재되어 왔지만, 후속적인 연구는 상기 화합물이 방선균 미크로모노스포라 종 (Micromonospora sp .) ML1 로부터도 분리될 수 있다는 것을 보였는데, 이것은 모잠비크의 인도양 해안에서 발견되는 해양 연체동물에서 분리된다 (Espliego, F. Ph.D. Thesis, 1996, University of Leon; de la Calle, F. Ph.D. Thesis, 1998, Autonomous University of Madrid).
시험관내 연구는, 흑색종, 유방암, 작지 않은 (non-microcytic) 폐암 및 대장암과 같은 다양한 타입의 고체 종양의 세포주 성장을 저해하는 티오코랄린의 역량을 보여줬다. 티오코랄린은 또한 인간 암종 이종이식편에 대한 생체내 검정에서 괄목할 항종양 활성을 갖는다는 것이 밝혀졌다 (Faircloth et al. Eur. J. Cancer, 33, 175, 1997 (abstract)). 티오코랄린은 추가로 그람-양성 박테리아에 대한 항박테리아 활성을 보여준다.
상기 해양 방선균 (Micromonospora sp. ML1) 유래의 티오코랄린을 수득하는 것은 작은 규모 상에서 실행가능하지만, 큰 규모에서는 상기 수득은 상기 미생물에서 관찰되는 변이성으로 인해 제한된다. 한편, 상기 유기체에서의 티오코랄린의 생산은 상기 유기체의 느린 성장 속도로 인해 시간 소모적인 프로세스이며, 상이한 뱃치마다 생산 수율에 있어서 상당한 변동성을 나타낸다.
따라서, 한편으로는 상기 해양 방선균에서 티오코랄린을 수득하는 것이 상당히 제한된다는 사실과, 다른 한편으로는 티오코랄린 분자가 복잡한 구조를 가져 공업적 수준에서 그의 합성은 번잡할 수 있다는 사실로 인해, 지령된 방식으로 상기 수득물에 작용할 수단을 창출하고자 하는 목적으로 그의 생합성의 유전적 근간을 이해하는 것이 바람직하다. 자연 생산 균주들은 일반적으로 상기 생성물을 매우 불규칙한 방식으로 낮은 농도로 생산하니, 그러한 이해는 생산될 티오코랄린의 증량을 유도할 수도 있다. 마찬가지로, 이는 또한 자연적으로는 상기 화합물을 생산하지 않는 숙주에서의 티오코랄린 생산을 가능하게 할 수도 있다.
재조합 DNA 기술의 발전은, 주로 방선균 군 유래 박테리아의, 상기 생활성 화합물의 생합성에 수반되는 유전자를 취급함으로써 생활성 화합물을 생성 및 생산하기 위한 흥미있는 연구 분야를 개척했다. 상기 기술은 기존의 공지된 자연 화합물의 생산 개선에 이용될 수 있는데, 이는 자연 균주가 일반적으로 관심대상의 대사물을 낮은 농도로 생산하기 때문이다.
마찬가지로, 유전자 조작 및 발효작용에 더욱 적합한 다른 방선균에서의 티오코랄린의 생합성에 수반되는 유전자 클러스터의 이종적 발현은, 더 짧은 발효작용 시간에 더 큰 재현가능한 수율로 상기 화합물을 생산하는 것을 가능하게 할 것이다.
공지된 바와 같이, 다수의 박테리아 및 진균이, 항종양 및 항박테리아 펩티드 등을 포함하여, 비-리보좀 기원을 가진 광범위한 생물학적 활성 펩티드를 합성한다. 상기 화합물 패밀리의 생합성은 비-리보좀 펩티드 합성효소 (NRPS) 에 의해 수행되는데, 이는 모듈성의 촉매 도메인 구성을 가진 다관능성 효소이다. 각각의 상기 모듈은 연장 순환 (elongation cycle) 을 수행하는데, 즉 특이적 아미노산을 화합물의 최종 구조로 활성화 및 혼입한다. 최소 모듈은 3 개의 도메인에 의해 형 성된다: (i) 특정 아미노산을 선택하고, ATP 를 이용하여 그의 아데닐화 아미노아실 버젼을 생성하는 이행능력이 있는 아데닐화 도메인, (A, 약 550 개의 아미노산이 있음); (ii) 보조인자로서 작용하는 포스포판테테인온 (PP) 보결분자단을 포함하며, 공유 결합에 의해 P 도메인에 결합하는 펩티딜 캐리어 도메인 (P, 약 80 개의 아미노산이 있음); 상기 도메인은 이후 반응 중심으로 이동하기 전에 활성화된 아데닐화 아미노산을 고정하는 이행능력이 있음; 및 (iii) 2 개의 연속적인 P 도메인에 위치하는 2 개의 아데닐화 아미노아실 부분 사이에 신규한 펩티드 결합을 생성하는 축합 도메인 (C, 약 450 개의 아미노산이 있음). C 도메인은 계의 첫번째 아미노산을 활성화시키는 모듈에는 부재한다. 소정의 NRPS 는 D-아미노산을 유도하는 에피머화, N- 또는 C-타입 메틸화, L-Cys 또는 L-Ser 아미노산 상에 작용하는 순환 작용 (circulation) 과 같은 특이적인 활성을 수행하기 위한 가외의 도메인을 갖는다. 마지막 모듈 다음에 위치하는 최종 도메인은 일반적으로 중간체 효소를 방출하고, 선형 또는 환형 펩티드를 생성하는 이행능력을 갖는다. 일반적 규칙으로서, 상이한 모듈의 구조는 생성물 펩티드의 최종 아미노산 서열을 반영한다. 이러한 상관성 규칙은 NRPS 에서의 각 모듈에 대한 특이적인 활성화 관능을 정하도록 해 준다. NRPS 에 대한 정보는, 예를 들어 Quing-Tao, S. et al., 2004. Dissecting and Exploiting Nonribosomal Peptide Synthetases. Acta Biochimica et Biophysica. Sinica, 36 (4): 243-249 에서 찾을 수 있다.
발명의 개요
본 발명의 중요한 목적은 티오코랄린 생산 이행능력이 있는 단백질을 코딩하는 온전한 뉴클레오티드 서열을 분리 및 특징분석하는 것으로 이루어진다. 이를 토대로, 티오코랄린의 생합성에 수반되는 단백질을 포함하는 아미노산 서열의 기능이 분리 및 결정될 수 있다. 상기 목적은 온전한 생합성적 티오코랄린 생산 경로와 관련된 모든 단백질을 코딩하는, 분리되어 임의로는 정제되는 신규한 핵산 분자를 제공함으로써 도달될 수 있다.
본 발명자들은 티오코랄린의 생합성 이행능력이 있는 모든 유전자, 즉 티오코랄린의 생합성에 수반되는 유전자 클러스터를 동정 및 클로닝하여, 지령된 방식으로 상기 화합물의 생산 취급을 개선하기 위한 유전자적 기반을 제공할 수 있었다.
비-리보좀성 펩티드 합성효소 (NRPS) 의 콘센서스 서열로부터 유도된 개시자 올리고뉴클레오티드를 이용함으로써, 미크로모노스포라 종 ML1 염색체의 6 개의 분절을 폴리머라아제 연쇄 반응 (PCR) 으로 증폭하고, 이들 모든 분절이 PSV1, PSV2, PSV3, PSV4, PSV5 및 PSV6 로 지칭되는 추정 (가설적인) NRPS 아데닐화 도메인 절편을 포함한다 (실시예 3). 삽입에 의한 상기 아데닐화 도메인의 불활성화는 이들 중 두가지가 (PSV2 및 PSV5) 티오코랄린을 생산하지 않는 돌연변이체를 생성한다는 것을 나타내어, 이들이 티오코랄린의 생합성에 수반된다는 것을 시사했다 (실시예 7 및 10).
약 64.6 킬로베이스 (kb) 의 DNA 영역 (서열 식별 번호: 1) 의 서열분석은 36 개의 온전한 오픈 리딩 프레임 (ORF) 및 또다른 2 개의 불완전한 ORF 가 존재함을 나타냈다 (실시예 12, 표 1). 26 개의 상기 ORF 를 포함하는 약 53 kb 의 영역의, 스트렙토마이세스 코엘리콜라 (Streptomyces coelicolor), 스트렙토마이세스 알부스 (Streptomyces albus) 및 스트렙토마이세스 리비단스 (Streptomyces lividans) 에서의 이종적 발현은 상기 방선균들에서의 티오코랄린의 생산을 유도한다 (실시예 19).
티오코랄린의 생합성 이행능력이 있는 유전자 클러스터는 도 1 에 도식적으로 나타냈다. 놀랍게도, 티오코랄린 유전자의 클러스터는 펩티드 골격의 아미노산의 갯수를 근거로 예측되는 것보다 더 많은 NRPS 코딩 유전자를 포함한다. 예를 들어 Tio12, Tio17, Tio18, Tio19, Tio20, Tio21, Tio22, Tio27 및 Tio28 로 식별되는 몇가지 NRPS 와 같은, 소정의 동정된 단백질은 티오코랄린 펩티드 구조의 형성에 수반된다. Tio20 및 Tio21 로 식별되는 단백질은 티오코랄린 골격의 생합성에 수반되는 NRPS 를 형성하며, 추측컨대 Tio27 및 Tio28 으로 식별되는 다른 두 NRPS 도 미크로모노스포라 종 ML1 에서의 티오코랄린의 생합성 조절에 수반될 작은 펩티드의 생합성 이행능력이 있을 것이다. 내성 프로세스과 관련될 수도 있는, Tio5, Tio6 및 Tio23 와 같은 몇가지 단백질도 있다. 서열분석 영역에서 동정된 티오코랄린 경로의 가능한 조절자는 Tio3, Tio4, Tio7, Tio24 및 Tio25 에 해당된다. 최종적으로, 개시자 유닛 3-히드록시-퀴날데이트의 생성에 관련된 몇가지 단백질, Tio8, Tio9, Tio10 및 Tio11 도 있다. 유전자들 중, 그의 차단이 티오코랄린을 생산하지 않는 표현형을 생성하는 유전자들은 별표로 도 1 에 표시되었다 (tio20, tio27tio28).
따라서, 본 발명은 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터의 동정 및 클로닝에 관한 것이다. 티오코랄린 생합성 이행능력이 있는 상기 유전자 클러스터 및 적합한 숙주 세포에서의 그의 발현은 티오코랄린의 효율적인 생산을 가능하게 한다.
후속하여, 한 국면에서, 본 발명은 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 하나 이상의 핵산 분자를 포함하는 조성물에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 핵산 분자 또는 그의 절편을 포함하는 프로브에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 핵산 분자를 포함하는 벡터에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 벡터로 형질전환 또는 트랜스펙션된 숙주 세포에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 핵산 분자에 의해 코딩되는 단백질에 관한 것이다.
또다른 국면에서, 본 발명은 그의 게놈이 조작된 바 있는 티오코랄린-생산 유기체의 이용을 포함하는, 티오코랄린의 생합성에 수반되는 단백질의 제조 방법에 관한 것이다.
또다른 국면에서, 본 발명은 또다른 방선균에서의 티오코랄린 생산을 위한, 미크로모노스포라 종 ML1 유래의 티오코랄린의 생합성 이행능력이 있는 유전자의 이용을 기반으로 하는 공정에 관한 것이다.
도면의 간단한 설명
도 1. 서열분석된 미크로모노스포라 종 ML1 염색체 영역의 유전자 구성을 포함하는, 티오코랄린 유전자 및 그것을 둘러싼 유전자의 클러스터의 도식적 도면. 티오코랄린 유전자 클러스터의 이종적 발현을 위한 플라스미드 구축에 이용된 제한 부위를 나타냈다.
도 2. 코스미드 cosV33-D12 및 pCT2c 의 도식적 도면. ori: 에셰리키아 콜라이 (E. coli.) 에 대한 복제 기원, SCP2: 스트렙토마이세스 (Streptomyces) 에 대한 복제 기원. aac (3)IV: 아프라마이신 내성 유전자. neo: 네오마이신 내성 유전자. bla: 앰피실린 내성 유전자. SV40 ori: 에피좀 복제에 대한 진핵 기원.
도 3. 플라스미드 pFL1036 구축을 위해 수행된 클로닝의 다이어그램. ori: 에셰리키아 콜라이에 대한 복제 기원. M13 ori: M13 파아지에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. lacZ: 베타-갈락토시다아제 유전자. kan R : 카나마이신 내성 유전자. aac (3)IV: 아프라마이신 내성 유전자. bla: 앰피실린 내성 유전자.
도 4. 플라스미드 pFL1041 구축을 위해 수행된 클로닝의 다이어그램. ori: 에셰리키아 콜라이에 대한 복제 기원. SCP2: 스트렙토마이세스에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. lacZ: 베타-갈락토시다아제 유전자. aac (3)IV: 아프라마이신 내성 유전자.
도 5. 플라스미드 pAR15AT 구축을 위해 수행된 클로닝의 다이어그램. ori p15A: 에셰리키아 콜라이에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. int φ C31: φC31 파아지 인테그라아제 유전자. attP: 부위-특이적 재조합 부위. kan R : 카나마이신 내성 유전자. aac (3)IV: 아프라마이신 내성 유전자. K: 에셰리키아 콜라이 DNA 폴리머라아제의 Klenow 절편을 이용해 처리한 절단 부위.
도 6. 플라스미드 pAPR 구축을 위해 수행된 클로닝의 다이어그램. ori p15A: 에셰리키아 콜라이에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. ori M13: M13 파아지의 복제 기원. ori: 에셰리키아 콜라이에 대한 복제 기원. lacZ: 베타-칼락토시다아제 유전자. lacI: 락토오스 오페론 억제 유전자. int φ C31: φC31 파아지 인테그라아제 유전자. attP: 부위-특이적 재조합 부위. kan R : 카나마이신 내성 유전자. aac (3)IV: 아프라마이신 유전자. K: 에셰리키아 콜라이 DNA 폴리머라아제의 Klenow 절편을 이용해 처리한 절단 부위. P ermE : ermE 유전자 프로모터.
도 7. 플라스미드 pFL1048, pFL1048r 및 pFL1049 의 도시. ori p15A: 에셰리키아 콜라이에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. int φC31: φC31 파아지 인테그라아제 유전자. attP: 부위-특이적 재조합 부위. aac (3)IV: 아프라마이신 유전자.
도 8A. R5A 배지에서의 성장 7 일 후 스트렙토마이세스 알부스 (Streptomyces albus) (pFL1049) 배양 추출물의 HPLC 크로마토그램. 티오코랄린에 해당하는 정점 및 그의 체류 시간인 27 분을 나타냈다.
도 8B. 도 8A 에 나타낸 27 분의 정점에 존재하는 생성물 (티오코랄린) 의 UV 흡수 스펙트럼.
도 8C. 도 8A 에 나타낸 27 분의 정점에 존재하는 생성물 (티오코랄린) 의 질량 스펙트럼.
발명의 상세한 설명
본 발명에 따르면, 온전한 생합성적 티오코랄린 생산 경로에 수반되는 단백질의 전부 또는 일부를 코딩하는, 신규하며 분리된, 임의로는 정제된 핵산 분자 가 제공된다.
따라서, 한 국면에서, 본 발명은, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는, 이후 본 발명의 핵산 분자로 지칭될, 바람직하게는 임의로는 정제된, 분리된 핵산 분자에 관한 것이다. 상기 생합성적 티오코랄린 생산 경로 단백질은 일반적으로 비-리보좀성 펩티드 합성효소 (NRPS) 이다. NRPS 는 티오코랄린 생합성 이행능력이 있다.
본원에 사용된 바와 같이, 생합성적 티오코랄린 생산 경로 단백질에 적용되는 표현 "생물학적 활성 절편" 은, 전장 단백질의 활성 관능을 보유하는 단백질 구조의 일부분에 관한 것이다. 상기 생물학적 활성 절편은 본 발명의 핵산 분자의 상응하는 영역에 의해 코딩될 수 있다. 본 발명의 핵산 분자의 상기 영역의 크기는 광범위하게 다양할 수 있으나; 그럼에도 불구하고, 한 가지 특별한 구현예에서, 상기 영역은 10, 15, 20, 25, 50, 100, 1,000, 2,500, 5,000, 10,000, 20,000, 25,000 개 이상의 뉴클레오티드의 길이를 가질 수 있다. 상기 영역은 일반적으로 100 내지 10,000 개의 뉴클레오티드, 바람직하게는 100 내지 7,500 개의 길이를 갖고, 생물학적으로 관능성인데, 즉 이들은 생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩할 수 있다.
본 발명의 핵산 분자는 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA) 분자일 수 있다. 본 발명의 핵산 분자는 또한 단일 가닥 핵산 분자 또는 유도된 이중 가닥 핵산 분자일 수 있다. 본 발명의 핵산 분자의 설명을 위한 비제한적 예시에는, 게놈 DNA (gDNA) 분자, 메신저 RNA (mRNA) 분자 및 mRNA 분자에 대한 상보적 DNA (cDNA) 분자가 포함된다.
본 발명의 핵산 분자의 돌연변이체 및 변이체는 본 발명의 범위에 포함된다. 상기 돌연변이체 및 변이체에는, 하나 이상의 분자가 변경, 치환, 결실 또는 삽입된 본 발명의 핵산 분자가 포함된다. 설명을 위해, 본 발명의 핵산 분자의 돌연변이체 및 변이체는 뉴클레오티드에서 1, 2, 3, 4, 5, 10, 15, 25, 50, 100, 200, 500 개 및 그 이상의 변화 (변경, 치환, 결실 또는 삽입) 가 있을 수 있다. 동일한 단백질을 코딩하는 축퇴성 변이체 (degenerate variant) 뿐만 아니라 상이한 단백질을 코딩하는 비축퇴성 변이체 (non-degenerate variant) 가 또한 가능하다. 상기 돌연변이체 및 변이체의 뉴클레오티드 서열은, 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 임의의 오픈 리딩 프레임 (ORF) 에 의해 코딩되는 상응하는 단백질의 하나 이상의 생물학적 활성 또는 관능을 보유하는 단백질 또는 그의 생물학적 활성 절편을 코딩한다. 상기 클러스터의 대립형질 형태 뿐만 아니라 다형질상도 또한 본 발명의 범위에 포함된다.
한 가지 특별한 구현예에서, 본 발명의 핵산 분자는 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 전부 코딩하는 뉴클레오티드 서열을 포함하는, 임의로는 정제된, 분리된 핵산 분자이다. 상기의 경우, 본 발명의 핵산 분자는 티오코랄린 생합성 이행능력이 있는 유전자의 온전한 클러스터를 포함하는 뉴클레오티드 서열을 포함한다.
티오코랄린의 생합성 이행능력이 있는 유전자의 온전한 클러스터의 뉴클레오티드 서열은, 미크로모노스포라 종 ML1 의 64,650 염기쌍(bp) 게놈 DNA 서열의 서열 식별 번호: 1 에 포함되어 있다. 본 발명의 범위는 또한 서열 식별 번호: 1 에 나타낸 뉴클레오티드 서열에 대한 상보적인 가닥, 즉 서열 식별 번호: 1 에 표시된 것과 상보적인 뉴클레오티드 (예를 들어, A 는 T 로 치환되고, C 는 G 로 치환되고, 반대의 경우도 마찬가지) 에 의해 형성되는 것이 포함되며/되거나 역방향 서열 [즉, 리딩 방향 (reading direction) 을, 예를 들어 (5'→3') 를 (3'→5') 로 바꿔 형성되는 서열] 이 포함된다.
본 발명은 추가로 서열 식별 번호: 1 에 나타낸 뉴클레오티드 서열을 갖는 본 발명의 핵산 분자 또는 그의 상보적인 가닥에 혼성화하는 핵산 분자를 포함하는데; 상기 분자는 티오코랄린-생산 유기체로부터 분리되고, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질을 코딩할 수 있다. 당업자에게 공지된 전형적인 혼성화 기술은, 예를 들어 Sambrook et al ., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989) 에 언급되어 있다. 통상적이거나 또는 엄격한 혼성화 기술은 일반적으로 동종 프로브에 대해 이용되며, 덜 엄격한 혼성화 조건은 표적으로 하는 핵산 분자 서열에 대해 100% 미만의 상동성을 가진 부분적 동종 프로브에 이용된다. 후자 (부분적 동종 프로브) 의 경우, 상이한 조건을 이용한 일련의 서던 (Southern) 또는 노던 (Northern) 혼성화가 수행될 수 있다. 설명하자면, 포름아미드를 포함하는 용매에서 혼성화를 수행하는 경우, 바람직한 조건에는 6×SSC, 50% 의 포름아미드를 포함하는 용액 및 약 42℃ 의, 일정한 온도 및 이온 세기의 이용이 포함된다. 덜 엄격한 혼성화 조건에서는, 상기의 경우 어닐링 완충액 중의 포름아미드의 양은 더 적더라도 (약 45% 내지 0%), 동일한 온도 및 이온 세기를 이용할 수 있다. 대안적으로, 혼성화는 포름아미드를 포함하지 않는 수용액에서 수행될 수 있다. 일반적으로, 수성 매질에서의 혼성화를 위해서는, 수용액의 이온 세기는, 일반적으로는 약 1 M Na+ 로 일정하게 유지되며, 어닐링 온도는 68℃ 에서 42℃ 로 강하될 수 있다.
티오코랄린 생합성 이행능력이 있는 유전자의 온전한 클러스터 (서열 식별 번호: 1) 의 서열분석은 36 개의 온전한 오픈 리딩 프레임 (ORF) 및 또다른 2 개의 불완전한 ORF (ORF1 및 ORF38, 하기 참조) 가 존재함을 보여줬다. 표 1 (실시예 12) 은 생합성적 티오코랄린 생산 경로에 수반되는 상이한 ORF 의 위치 뿐만 아니라 상기 ORF 에 의해 코딩되는 아미노산 서열을 보여준다.
티오코랄린 생합성 이행능력이 있는 유전자의 클러스터를 포함하며, 티오코랄린의 생산에 필수적인 생합성적 단백질 전부를 코딩하는 온전한 염색체 (게놈) DNA 분자는 2 개의 플라스미드, 구체적으로는 코스미드 SuperCos1 및 pKC505 에 유효하게 패키지되었다 (실시예 1 및 2). 티오코랄린 생합성 이행능력이 있는 유전자의 클러스터를 포함하는 상기 두 코스미드는, 티오코랄린 생산을 위한 온전한 생합성적 경로를 재형성하기에 충분하다. 따라서, 한 가지 특별한 구현예에서, 본 발명은 티오코랄린 생산에 실질적으로 더욱 효율적인 수단을 이용하도록 하는 두 코스미드에서 생합성적 티오코랄린 유전자의 온전한 클러스터를 제공한다.
한 가지 특별한 구현예에서, 본 발명의 핵산 분자는 임의로는 정제된, 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자이다. 한 가지 특이적인 구현예에서, 본 발명의 핵산 분자는, 하기로 이루어진 군:
- 서열 식별 번호: 1 의 뉴클레오티드 2-535 (orf1) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 993-1130c (orf2) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 1517-2131 (tio3) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 2154-2822c (tio4)를 포함하는 핵산 분자 ;
- 서열 식별 번호: 1 의 뉴클레오티드 2970-3791c (tio5) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 3794-4777c (tio6) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 4904-5611 (tio7) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 5701-6426c (tio8) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 6426-7688c (tio9) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 7733-8524c (tio10) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 8791-10002 (tio11) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 10002-11590c (tio12) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 11847-13634 (tio13) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 13734-15005c (tio14) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 15005-16354c (tio15) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 16441-18744c (tio16) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 18774-19055c (tio17) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 19260-20036 (tio18) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 20146-20880c (tio19) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 21188-28969 (tio20) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 28979-38398 (tio21) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 38449-38661 (tio22) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 38642-41263 (tio23) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 41835-42368 (tio24) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 42395-43255c (tio25) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 43340-43741c (tio26) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 44152-49563 (tio27) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 49635-53669 (tio28) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 53749-55305c (orf29) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 55384-57222c (orf30) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 57895-58467c (orf31) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 58535-59206c (orf32) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 59298-59564c (orf33) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 59611-60114c (orf34) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 60202-60888 (orf35) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 60960-62240 (orf36) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 62300-62833 (orf37) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 62925-64650 (orf38) 를 포함하는 핵산 분자; 또는
생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩하는 이들의 절편으로부터 선택된다.
또다른 특별한 구현예에서, 본 발명의 핵산 분자는 임의로는 정제된, 2 개 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자이다. 한 가지 특이적인 구현예에서, 본 발명의 핵산 분자는 orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20 , tio21 , tio22 , tio23 , tio24 , tio25 , tio26 , tio27 , tio28 , orf29 , orf30, orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38 로 식별되는 유전자 및 생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩하는 그의 절편으로부터 선택되는 2 개 이상의 유전자를 포함하는 뉴클레오티드 서열을 포함한다.
또다른 특별한 구현예에서, 본 발명의 핵산 분자는 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자, 또는 그의 돌연변이체 또는 변이체이며, 여기서 상기 단백질은 ORF1 (서열 식별 번호: 2), ORF2 (서열 식별 번호: 3), Tio3 (서열 식별 번호: 4), Tio4 (서열 식별 번호: 5), Tio5 (서열 식별 번호: 6), Tio6 (서열 식별 번호: 7), Tio7 (서열 식별 번호: 8), Tio8 (서열 식별 번호: 9), Tio9 (서열 식별 번호: 10), Tio10 (서열 식별 번호: 11), Tio11 (서열 식별 번호: 12), Tio12 (서열 식별 번호: 13), Tio13 (서열 식별 번호: 14), Tio14 (서열 식별 번호: 15), Tio15 (서열 식별 번호: 16), Tio16 (서열 식별 번호: 17), Tio17 (서열 식별 번호: 18), Tio18 (서열 식별 번호: 19), Tio19 (서열 식별 번호: 20), Tio20 (서열 식별 번호: 21), Tio21 (서열 식별 번호: 22), Tio22 (서열 식별 번호: 23), Tio23 (서열 식별 번호: 24), Tio24 (서열 식별 번호: 25), Tio25 (서열 식별 번호: 26), Tio26 (서열 식별 번호: 27), Tio27 (서열 식별 번호: 28), Tio28 (서열 식별 번호: 29), ORF29 (서열 식별 번호: 30), ORF30 (서열 식별 번호: 31), ORF31 (서열 식별 번호: 32), ORF32 (서열 식별 번호: 33), ORF33 (서열 식별 번호: 34), ORF34 (서열 식별 번호: 35), ORF35 (서열 식별 번호: 36), ORF36 (서열 식별 번호: 37), ORF37 (서열 식별 번호: 38), ORF38 (서열 식별 번호: 39) 로 이루어지는 군으로부터 선택된다. 상기 단백질은 티오코랄린의 생합성 이행능력이 있는 유전자의 클러스터 (서열 식별 번호: 1) 의 상응하는 상기 언급된 orf (orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20, tio21, tio22, tio23, tio24, tio25, tio26, tio27, tio28, orf29, orf30, orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38), 또는 그의 상응하는 영역, 그의 돌연변이체 또는 변이체로부터 수득될 수 있다.
또다른 특별한 구현예에서, 본 발명의 핵산 분자는 임의로는 정제된, 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편의 하나 이상의 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자이며, 여기서 상기 변이체는 아미노산 서열에 있어서 서열 식별 번호: 2 내지 39 에 나타낸 아미노산 서열을 가진 단백질, 또는 그의 생물학적 활성 절편으로부터 선택된 단백질의 아미노산 서열에 대해 30% 이상, 유리하게는 50% 이상, 바람직하게는 60% 이상, 더욱 바람직하게는 70% 이상, 더욱더 바람직하게는 80% 이상, 특별하게는 90% 이상, 더욱 특별하게는 95% 이상 상동이다. 상기 변이체는 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 임의의 orf 로 코딩되는 상응하는 단백질의 기능의 하나 이상의 생물학적 활성을 보존한다.
또다른 국면에서, 본 발명은 본 발명의 하나 이상의 핵산 분자, 바람직하게는 분리된 핵산 분자를 포함하는 조성물에 관한 것이다. 한 가지 특별한 구현예에서, 상기 조성물은 본 발명의 핵산 분자를 포함한다. 또다른 특별한 구현예에서, 상기 조성물은 2 가지 이상의 본 발명의 핵산 분자를 포함한다. 상기 핵산 분자는 DNA 및 RNA 의 두가지 모두일 수 있다.
본 발명의 핵산 분자는 자연적으로 또는 재조합적으로 티오코랄린을 생산하는 임의의 유기체로부터 분리될 수 있고, 이는 티오코랄린 생합성 이행능력이 있는 클러스터가 적합한 숙주 세포에 삽입되기 때문인데; 그럼에도 불구하고, 한 가지 특별한 구현예에서, 본 발명의 상기 핵산 분자는 해양 방선균 미크로모노스포라 종 ML1 (실험 부분의, 단계 1, 실시예 1 내지 4 를 참조) 에서 분리되었다.
적합한 숙주 세포 유래의 (염색체) 게놈 DNA 및 클로닝된 재조합 DNA 의 분리 및 특징분석은, 적합한 유전자 라이브러리의 추적을 위한 프로브로서 뉴클레오티드 서열 전체 또는 일부를 이용하여, 통상적 또는 엄격한 혼성화 기술로 수행될 수 있다.
따라서, 또다른 국면에서, 본 발명은 본 발명의 핵산 분자 또는 그의 절편을 포함하는 프로브에 관한 것이다. 일반적으로, 적합하게는 5, 10, 15, 20, 25, 30, 40, 50, 60 개 또는 그 이상의 뉴클레오티드의 서열을 포함한다. 20 내지 60 개 뉴클레오티드의 길이를 가진 서열이 바람직하다. 한 가지 특별한 구현예에서, 상기 프로브는 미크로모노스포라 종에서의 티오코랄린의 생합성에 수반되는 유전자를 추적하기 위해 사용될 수 있다. 티오코랄린의 생합성과 관련된 핵산, 예를 들어 gDNA, cDNA 또는 mRNA 를 추적하기 위한 상기 프로브의 이용은 본 발명의 추가적인 국면을 형성한다.
대안적으로, 적합한 숙주 세포 유래의 (염색체) 게놈 DNA 및 클로닝된 재조합 DNA 의 분리 및 특징분석은 핵산의 효소적 증폭을 기반으로 하는 기술로 수행될 수 있다. 설명하자면, 기타 상동이거나 또는 연관된 서열을 증폭 및 동정하기 위해, 효소적 증폭 반응, 예를 들어 PCR 에 이용될 수 있는 개시자 올리고뉴클레오티드가 고안될 수 있다 (티오코랄린 생합성에 수반되는 DNA 및 단백질의 공지된 서열을 기반으로 함).
본 발명의 핵산 분자는 통상적인 방법으로 분리되며, 원하는 경우 정제될 수 있다. 본 발명의 핵산 분자가 일반적으로 재조합 또는 분리 방법으로 수득되지만, 본 발명은 또한 본 발명의 핵산 분자가 화학 합성으로 수득될 가능성도 감안하며, 상기 방법에서 분자는 야생형 (wt) 및 돌연변이체 티오코랄린-생산 유기체 모두에서 유도된 것과 동일하거나, 또는 실질적으로 동일한 구조를 가질 것이다.
또다른 국면에서, 본 발명은, 이후 본 발명의 벡터인, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 본 발명의 핵산 분자을 포함하는 벡터에 관한 것이다. 한 가지 특별한 구현예에서, 본 발명의 벡터는 클로닝 벡터 또는 발현 벡터와 같은 생물학적 관능성 벡터 또는 플라스미드이다.
한 가지 특이적인 구현예에서, 본 발명의 벡터는 클로닝 벡터, 바람직하게는 코스미드이다. 바람직한 클로닝 벡터는 큰 DNA 서열 (예를 들어, 관심대상의 생성물의 생합성에 수반되는 유전자의 온전한 클러스터) 을 혼입하는 그의 용량에 의해 선택된다. 상기 벡터는 일반적으로 통상적인 벡터이며, 보통 입수가능하다. 본 발명은 추가로, 상기 유전자 물질이 당업자에게 공지된 기술에 의한 유전자 조작으로 단일한 클로닝 벡터 또는 플라스미드 (예를 들어, 코스미드) 에 최종적으로 포함되도록 감량될 수 있다는 것도 감안한다. 재배열은 클로닝, PCR, 합성 유전자 또는 당업계에 공지된 임의의 상기 기술의 조합으로 수행될 수 있다.
또다른 특별한 구현예에서, 본 발명의 벡터는 적합한 숙주 세포에 대한 그의 삽입에 적합한 발현 벡터이다. 상기 벡터의 상기 적합한 숙주 세포로의 삽입은 임의의 통상적인 유전자 물질 이동 방법 (예를 들어, 형질전환, 트랜스펙션 등) 에 의해 수행될 수 있다.
따라서, 또다른 국면에서, 본 발명은, 이후 본 발명의 숙주 세포로 지칭되는, 본 발명의 벡터로 형질전환 또는 트랜스펙션된 숙주 세포에 관한 것이다. 본 발명의 상기 숙주 세포는 하나 이상의 본 발명의 핵산 분자를 포함한다. 한 가지 특별한 구현예에서, 본 발명의 숙주 세포는 본 발명의 핵산 분자를 포함한다. 또다른 특별한 구현예에서, 본 발명의 숙주 세포는 2 개 이상의 본 발명의 핵산 분자를 포함하며; 상기의 경우, 상기 본 발명의 핵산 분자는 상동이거나 또는 상이할 수 있다.
본 발명의 바람직한 숙주 세포는 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 (외인성) 핵산 분자를 포함하는 본 발명의 벡터를 사용하여, 티오코랄린의 생합성 및/또는 재배열을 지령하기에 충분한 방식으로 안정하게 형질전환 또는 트랜스펙션된 숙주 세포이다. 숙주 세포는 바람직하게는 미생물, 더욱 바람직하게는 박테리아이다. 한 가지 특별한 구현예에서, 상기 숙주 세포는, 예를 들어 방선균, 스트렙토마이세트와 같은 그람-양성 박테리아이다.
스트렙토마이세스 코엘리컬러 (Streptomyces coelicolor), 스트렙토마이세스 리비단스 ( Streptomyces lividans), 스트렙토마이세스 알부스 (Streptomyces albus) 및 스트렙토마이세스 아베르미틸리스 (Streptomyces avermitilis) 와 같은 상이한 스트렙토마이세트 종이 본 발명의 예시에서 이종성 숙주로서 이용될 수 있지만, 티오코랄린의 생합성에 수반되는 유전자의 이종적 발현이 다른 스트렙토마이세스, 방선균 등에서 수행될 수 있으며, 단 이들은, 바람직하게는 안정한 방식으로, 본 발명의 벡터에 형질전환될 수 있다. 그 단백질의 시험관내 발현은, 원하는 경우 통상적인 방법을 이용하여 수행될 수 있다.
한 가지 특별한 구현예에서, 본 발명은 예를 들어 재조합 박테리아와 같은, 본 발명의 핵산 분자의 하나 이상의 영역이 변경되어 상응하는 비-재조합체, 즉 야생형인 티오코랄린-생산 세포 (박테리아) 에 필적하는 변경된 티오코랄린 수준을 제공하는 재조합 박테리아와 같은 재조합 숙주 세포를 제공하게 되는, 본 발명의 숙주 세포를 제공한다. 그러한 목적으로, 당업자에게 공지된 통상적인 기술이 이용될 수 있으며, 여기에는 예를 들어 티오코랄린 생산에 수반되는 NRPS 의 가장 중요한 도메인에 대한 이행능력이 있는 유전자의 카피수를 증가시키거나, 또는 당업자에게 공지된 유전공학 기술에 의해 상기 유전자의 유전자 발현 조절 서열을 증가시켜 티오코랄린 생산에서 수율을 증가시키는 것이 포함된다.
또다른 국면에서, 본 발명은 본 발명의 핵산 분자에 의해 코딩되는, 이후 본 발명의 단백질로 지칭되는 단백질에 관한 것이다.
본원에 사용된 바와 같이, 용어 "단백질" 은 티오코랄린 생산을 위한 생합성적 경로에 의해 포함되는 본 발명의 핵산 분자에 의해 코딩되는, 폴리펩티드, 효소 등을 의미한다. 본 발명의 단백질에는, 전장 아미노산을 포함하여 다양한 길이의 아미노산 사슬로서 아미노산 부분이 공유 펩티드 결합에 의해 연결되어 있는 아미노산 사슬이 포함되며, 그 뿐만 아니라 티오코랄린의 생합성에 수반되는 상기 단백질의 생물학적 활성 절편 및 그의 생물학적 활성 변이체가 포함된다. 본 발명의 단백질은 자연, 재조합 또는 합성일 수 있다. 설명의 수단으로, 티오코랄린 생합성에 수반되는 상기 단백질은, 적합한 발현 벡터에 단백질을 코딩하는 뉴클레오티드 서열을 삽입하고 적합한 숙주 세포에서 단백질을 발현시키는 통상적인 재조합 DNA 기술을 통하여, 또는 예를 들어 아미노산을 개별적으로 차례차례 아미노산 사슬로 결합해 나가는 Merrifield 의 고상 펩티드 합성 (Merrifield, J. Am. Chem. Soc. 85:2149-2154 (1963)) 을 수단으로 하는 통상적인 화학 펩티드 합성을 통해 생산될 수 있다. 대안적으로, 본 발명의 단백질은 상이한 제조사 (예를 들어, Perkin-Elmer, Inc.) 에 의해 시판되는 자동화된 단백질 합성 장치를 이용하여 합성될 수 있다.
본 발명의 범위에 포함되는 생물학적 활성 변이체는, 본 발명의 핵산 분자에 의해 코딩되는 아미노산 서열의 하나 이상의 생물학적 활성 절편을 포함하며, 즉 단백질의 활성 관능을 보유하는 단백질 구조의 일부, 예를 들어 상기 tio18 유전자에 의해 코딩되는 Tio18 와 동일하거나 또는 실질적으로 동일한 활성을 가진 tio18 유전자에 의해 코딩되는 티오에스테르 부분을 포함하며, 예를 들어 이는 약 70% 이상, 유리하게는 80% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 약 95% 이상의 유사성 또는 파워를 갖는다.
본 발명의 단백질의 생물학적 활성 변이체에는 아미노산, 자연 발생 대립형질 등이 결실, 치환 또는 부가된 활성 아미노산 구조가 포함된다. 생물학적 활성 절편은, 절편 제조를 위해 전장 단백질을 화학적 또는 효소적 절단에 적용한 후 전장 단백질과 동일하거나 또는 실질적으로 동일한 생물학적 활성을 보존하는 아미노산 구조 절편을 검정하여 용이하게 동정할 수 있다.
한 가지 특별한 구현예에서, 본 발명의 단백질은 임의로는 정제된, orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20, tio21, tio22, tio23, tio24, tio25, tio26 , tio27 , tio28 , orf29 , orf30 , orf31, orf32, orf33, orf34, orf35, orf36, orf37orf38 로 식별되는 유전자로 이루어진 군으로부터 선택되는 유전자에 의해 코딩되는 티오코랄린의 생합성에 수반되는 분리된 단백질이다.
또다른 특별한 구현예에서, 본 발명의 단백질은, 임의로는 정제된, ORF1 (서열 식별 번호: 2), ORF2 (서열 식별 번호: 3), Tio3 (서열 식별 번호: 4), Tio4 (서열 식별 번호: 5), Tio5 (서열 식별 번호: 6), Tio6 (서열 식별 번호: 7), Tio7 (서열 식별 번호: 8), Tio8 (서열 식별 번호: 9), Tio9 (서열 식별 번호: 10), Tio10 (서열 식별 번호: 11), Tio11 (서열 식별 번호: 12), Tio12 (서열 식별 번호: 13), Tio13 (서열 식별 번호: 14), Tio14 (서열 식별 번호: 15), Tio15 (서열 식별 번호: 16), Tio16 (서열 식별 번호: 17), Tio17 (서열 식별 번호: 18), Tio18 (서열 식별 번호: 19), Tio19 (서열 식별 번호: 20), Tio20 (서열 식별 번호: 21), Tio21 (서열 식별 번호: 22), Tio22 (서열 식별 번호: 23), Tio23 (서열 식별 번호: 24), Tio24 (서열 식별 번호: 25), Tio25 (서열 식별 번호: 26), Tio26 (서열 식별 번호: 27), Tio27 (서열 식별 번호: 28), Tio28 (서열 식별 번호: 29), ORF29 (서열 식별 번호: 30), ORF30 (서열 식별 번호: 31), ORF31 (서열 식별 번호: 32), ORF32 (서열 식별 번호: 33), ORF33 (서열 식별 번호: 34), ORF34 (서열 식별 번호: 35), ORF35 (서열 식별 번호: 36), ORF36 (서열 식별 번호: 37), ORF37 (서열 식별 번호: 38), ORF38 (서열 식별 번호: 39), 및 이들의 조합으로 식별되는 단백질로 이루어진 군으로부터 선택되는, 티오코랄린의 생합성에 수반되는 분리된 단백질 또는 그의 생물학적 활성 절편이다. 상기 단백질의 추정되는 기능은 표 1 에 포함되어 있다.
상기 화합물의 생합성에 수반되는 단백질을 코딩하는, 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터의 orf 는 통상적인 기술을 이용하여 동정될 수 있다. 상기 기술의 설명을 위한 비제한적 예시에는 정지 및 개시 코돈의 위치, 코돈의 빈도를 근거로 한 리딩 (reading) 프레임의 추정되는 위치, 다른 방선균에서 발현되는 유전자에 대한 유사성에 의한 배열 등을 위한 전산적 분석이 포함된다. 이에, 본 발명의 단백질은 본 발명의 뉴클레오티드 서열을 이용하여 동정될 수 있으며, orf 또는 이들에 의해 코딩되는 단백질은 분리될 수 있고, 원하는 경우 정제되거나 또는 대안적으로는 화학적 방법에 의해 합성될 수 있다. orf 를 근거로 한 상기 생성물의 발현을 위한 유전자 구축물이 고안될 수 있으며, 적합한 발현 조절 구성원 (프로모터, 종결자 등) 이 포함될 수 있고, 상기 유전자 구축물이 하나 이상의 orf 에 의해 코딩되는 단백질 또는 단백질들의 발현을 위해 적합한 숙주 세포에 도입될 수 있다.
본 발명의 단백질은 분리될 수 있으며, 원하는 경우 통상적인 방법에 의해 정제될 수 있다. 일반적으로 약 80% 내지 90% 인 더 낮은 수준의 순도가 또한 허용될 수도 있지만, 단백질은 바람직하게는 실질적으로 순수한 형태로 수득된다. 본 발명은 또한 본 발명의 단백질이 화학 합성에 의해 수득되는 가능성을 감안하며, 여기서 단백질은 야생형 (wt) 및 돌연변이체 티오코랄린-생산 유기체로부터 직접 유도되는 것과 동일하거나 또는 실질적으로 동일한 구조를 갖는다.
또다른 국면에서, 본 발명은 적합한 (영양 및 환경) 조건 하에서의 티오코랄린-생산 유기체의 배양 단계, 및 원하는 경우 티오코랄린의 생합성에 수반되는 하나 이상의 상기 단백질의 분리 단계를 포함하는, 티오코랄린의 생합성에 수반되는 본 발명의 단백질의 제조 방법에 관한 것이다. 원하는 경우, 본 발명의 상기 단백질은 상기 기재된 것들과 같은 통상적인 방법에 의해 분리 및 정제될 수 있다.
또다른 국면에서, 본 발명은 티오코랄린-생산 유기체를 상기 화합물 생산에 적합한 조건 하에 배양하여 티오코랄린 생합성에 수반되는 단백질을 코딩하는 유전자의 카피수를 증가시키는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는, 티오코랄린의 생산 방법에 관한 것이다.
한 가지 특별한 구현예에서, 티오코랄린-생산 유기체는 예를 들어 미크로모노스포라 종과 같은 방선균인데, 여기서 티오코랄린의 생합성에 수반되는 단백질을 코딩하는 유전자의 카피수는 증가된다. 티오코랄린의 생합성에 수반되는 단백질을 코딩하는 유전자의 카피수 증가는 당업자에게 공지된 통상적인 방법에 의해 수행될 수 있다. 상기의 경우, 상기 기재된 방법은 티오코랄린 생산에 수반되는 유전자의 발현에 적합한 영양 및 환경 조건 하에 상기 유기체를 배양하는 것을 포함한다. 원하는 경우, 생산된 티오코랄린은 통상적인 방법에 의해 배양 배지로부터 분리 및 정제될 수 있다.
또다른 국면에서, 본 발명은, 티오코랄린 생합성에 수반되는 단백질을 코딩하는 하나 이상의 유전자의 조작 또는 치환에 의해, 또는 상기 유전자 발현 조절 이행능력이 있는 서열의 조작에 의해 티오코랄린 생합성 이행능력이 있는 단백질을 코딩하는 유전자의 발현이 조절되는 티오코랄린-생산 유기체를 상기 화합물 생산에 적합한 조건 하에 배양하는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는 티오코랄린의 생산 방법에 관한 것이다. 티오코랄린 생합성 이행능력이 있는 상기 단백질을 코딩하는 유전자의 발현은 바람직하게는 개선된다. 상기 목적을 위해, 티오코랄린 생합성 공정에 필수적이지 않은 유전자 서열은 제거되거나, 또는 상기 유전자의 유전자 발현 조절 서열의 효율은 당업자에게 공지된 유전공학적 서열에 의해 증가될 수 있다. 이에 따라, 티오코랄린 생산에서 수율은 증가될 수 있다. 티오코랄린 생합성 과정에서 불필요한 유전자 서열을 제거하거나 또는 상기 유전자의 유전자 발현 조절 서열의 효율 증가를 위한 유전자 조작법은 당업자에게 공지된 유전공학 기술에 의해 수행될 수 있다.
한 가지 특별한 구현예에서, 티오코랄린-생산 유기체는 예를 들어, 미크로모노스포라 종과 같은 방선균인데, 여기서 티오코랄린 생합성 이행능력이 있는 단백질을 코딩하는 유전자는 티오코랄린 생합성에 수반되는 단백질을 코딩하는 하나 이상의 유전자를 조작 또는 치환하거나, 또는 상기 유전자의 발현 조절 이행능력이 있는 서열을 조작함으로써 조절되며, 이는 당업자에게 공지된 통상적인 방법에 의해 수행될 수 있다. 상기의 경우, 상기 기재된 방법은 티오코랄린 생산에 수반되는 유전자 발현을 위한 적합한 영양 및 환경 조건 하에 상기 유기체를 배양하는 단계를 포함한다. 원하는 경우, 생산된 티오코랄린은 통상적인 방법에 의해 배양 배지로부터 분리 및 정제될 수 있다.
또다른 국면에서, 본 발명은 티오코랄린 생산에 적합한 조건 하에서, 티오코랄린 생합성 이행능력이 있는 유전자의 클러스터를 포함하는 본 발명의 벡터로 형질전환 또는 트랜스펙션된 본 발명의 숙주 세포를 배양하는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는 티오코랄린의 제조 방법에 관한 것이다. 상기 (영양, 환경 등) 조건은 숙주 세포의 특성에 따라 선별될 것이다.
한 가지 특별한 구현예에서, 본 발명의 숙주 세포는 티오코랄린을 원래 생산하는 유기체, 원래는 티오코랄린을 생산하지 않는 유기체 및 티오코랄린을 생산하도록 유전적으로 조작된 유기체로부터 선택된다. 한 가지 특별한 구현예에서, 본 발명의 상기 숙주 세포는 방선균 또는 스트렙토마이세트이다.
또다른 국면에서, 본 발명은 하기 단계를 포함하는, 미크로모노스포라 종 ML1 유래의 티오코랄린 생합성 이행능력이 있는 유전자 이용을 근간으로 한, 또다른 방선균에서의 상기 화합물의 생산 방법에 관한 것이다:
(1) 티오코랄린 생합성 경로의 특이적 유전자에 타격을 받은 돌연변이체를 수득하는 단계;
(2) 티오코랄린 생합성 이행능력이 있는 유전자 클러스터를 포함하는 미크로모노스포라 종 ML1 염색체 영역을 분리하는 단계;
(3) 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 뉴클레오티드 서열을 수득하고 분석하는 단계; 및
(4) 다른 방선균에서 티오코랄린을 이종적으로 생산하는 단계.
티오코랄린 생합성 이행능력이 있는 유전자의 클러스터를 포함하는 미크로모노스포라 종 ML1 염색체의 동정 및 분리 뿐만 아니라 상기 클러스터의 뉴클레오티드 서열의 분석은, 명세서에 첨부되어 있는 실시예에서의 비제한적 방식으로 설명되는 본 발명의 교시를 토대로 하여 수행될 수 있다.
티오코랄린 생합성 경로의 특이적 유전자에 타격을 받은 돌연변이체는 통상적인 방법에 의해 동정될 수 있다. 한 가지 특별한 구현예에서, 상기 돌연변이체는, 통상적인 방법, 예를 들어 실시예 5 에 언급된 바와 같이 배양 및 티오코랄린 생산의 HPLC-MS 에 의한 측정을 수단으로 하여 동정될 수 있다.
티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 전부 또는 일부는, 티오코랄린의 이종적 생산을 위해 통상적인 방법, 예를 들어 형질전환 또는 트랜스펙션에 의해 방선균에 도입될 수 있으며, 원하는 경우 상기와 같이 수득된 티오코랄린은 통상적인 방법으로 분리 및/또는 정제될 수 있다.
티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 결정은 상당한 상업적 중요성이 있다. 본 발명에 의해 제공되는 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 분리 및 완전한 설명은 티오코랄린 생산 증가 및 티오코랄린-생산 유기체의 조작을 가능하게 한다. 그러한 맥락에서, 티오코랄린 생산에 수반되는 NRPS 의 가장 중요한 도메인에 대한 이행능력이 있는 유전자의 카피수는 당업자에게 공지된 유전자 조작 기술로 증가될 수 있거나 또는 상기 유전자의 발현 조절 서열의 효율이 당업자에게 공지된 유전공학적 기술로 증가될 수 있고, 그에 따라 그의 생산 수율도 증가될 수 있다.
본 발명에 의해 제공되는 티오코랄린 유전자의 온전한 클러스터의 동정 및 클로닝과 연관된 또다른 장점은 티오코랄린의 효율적인 생산에 관한 것이다. 사실, 이는 더 적은 수의 단계를 거쳐 큰 관심대상인 화합물을 수득하게끔 한다. 클러스터 돌연변이체에서의 생합성 공정에서의 필수적이지 않은 서열의 제거는 관심대상의 화합물의 생산에 필요한 시간을 상당히 줄인다. 나머지 서열들로 충분하며, 티오코랄린 생산을 위해 그의 관능성을 유지한다.
실험부
본 발명의 실험 과정들에는 당업계의 현재의 통상적인 분자생물학적 방법이 포함된다. 본원에서 설명되지 않은 기술의 상세한 설명은, Kieser et al. (Practical Streptomyces genetics. The John Innes Foundation, Norwich, Great Britain, 2000) 및 Sambrook et al. (Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, USA, 2001) 의 매뉴얼에서 찾을 수 있다. 하기의 단계들은 제한성이 없이 본 발명을 상세하게 설명한다.
단계 1. 티오코랄린 생합성 경로 유전자를 포함하는 미크로모노스포라 ML1 염색체 영역의 분리
실시예 1. 미크로모노스포라 종 ML1 염색체 DNA 유래의 SuperCos1 에서의 유전자 라이브러리의 구축
염색체 DNA 는 염석 프로토콜 (Kieser et al. 2000) 을 이용하여, MIAM2 배지 (5 g/l 의 효모 추출물, 3 g/l 의 육류 추출물, 5 g/l 의 트립톤, 5 g/l 의 글루코오스, 20 g/l 의 덱스트린, 4 g/l 의 CaCO3, 10 g/l 의 해수염. pH 6.8) 중의, Pharma Mar, S.A. 배양물 콜렉션에서 입수가능한 미크로모노스포라 종 ML1 배양물로부터 수득했다 (Espliego, F. Ph.D. Thesis, 1996, University of Leon; de la Calle, F. Ph.D. Thesis, 1998, Autonomous University of Madrid). 상기 염색체 DNA 는 BamHI 엔도뉴클레아제를 이용한 부분 효소절단에 적용하고, 수득한 절편은 BamHI 로 효소절단된 코스미드 SuperCos 1 (Stratagene) 에서의 유전자 라이브러리 형성에 이용했다. 에셰리키아 콜라이 XL-1 Blue MR (Stratagene) 에서의 상기 유전자 라이브러리의 형성은, 이미 기재한 과정 (Sambrook et al. 2001) 에 따라, 시험관내 패키징 키트 (in vitro packaging kit) Gigapack III Gold Packaging Extract Kit (Stratagene) 를 이용하여 수행했다.
1,000 개의 에셰리키아 콜라이 형질유도 콜로니는, 일반적 프로토콜 (Sambrook et al. 2001) 을 이용한 제자리 (in situ) 콜로니 혼성화 분석 수행을 위해 나일론 멤브레인으로 옮겼다.
실시예 2. 미크로모노스포라 종 ML1 염색체 DNA 유래의 pKC505 에서의 유전자 라이브러리의 구축
염색체 DNA 는 염석 프로토콜 (Kieser et al. 2000) 을 이용하여 MIAM2 배지 중의 미크로모노스포라 종 ML1 배양물로부터 수득했다. 상기 염색체 DNA 는 Sau3AI 엔도뉴클레아제를 이용한 부분 효소절단에 적용하고, 수득한 절편은 이관능성 코스미드 에셰리키아 콜라이 (Escherichia coli), 스트렙토마이세스 (Streptomyces) pKC505 (Richardson at al. 1987, Gene 61, 231-241) 에서의 유전자 라이브러리 형성에 이용했고, BamHI 로 효소절단했다. 에셰리키아 콜라이 ED8767 에서의 상기 유전자 라이브러리의 형성은, 이미 기재된 과정 (Sambrook et al. 2001) 및 시험관내 패키징 키트 (in vitro packaging kit) Gigapack III Gold Packaging Extract Kit (Stratagene) 을 이용하여 수행했다.
3,300 개의 에셰리키아 콜라이 형질유도 콜로니를 25 ㎍/ml 의 아프라마이신이 있는 TSB 배지 (Merck) 를 포함하는 96-웰 마이크로타이터 플레이트에 넣고, 30℃ 에서 24 시간 동안 인큐베이션했다. 상기 클론은 25 ㎍/ml 의 아프라마이신이 있는 TSA (Tryptic Soy Agar) 플레이트에 복제하고, 30℃ 에서 밤새 둔 후, 콜로니를 일반 프로토콜 (Sambrook et al. 2001) 을 이용하는 제자리 (in situ) 콜로니 혼성화 분석 수행을 위해 나일론 멤브레인에 옮겼다.
실시예 3. NRPS 에서의 아데닐화 도메인에 대한 특이적 올리고뉴클레오티드의 고안 및 미크로모노스포라 종 ML1 염색체 DNA 로부터의 그의 PCR 증폭
티오코랄린의 구조를 근거로, 그의 생합성 이행능력이 있는 NRPS 는 L-시스테인을 활성화시키는 1 내지 3 개의 아데닐화 도메인 및 글리신을 활성화하는 1 개의 도메인을 가질 것으로 예상되었다. 이를 토대로, NRPS 아데닐화 도메인의 증폭을 위해 문헌에 기재된 올리고뉴클레오티드와 조합된 NRPS 아데닐화 도메인을 코딩하는 DNA 절편을 특이적으로 증폭할 수 있는, NRPS 아데닐화 도메인 내부의 보존된 영역을 기준으로 축퇴성 올리고뉴클레오티드를 고안했다.
개시자 올리고뉴클레오티드:
MTF2 (5'-GCNGGYGGYGCNTAYGTNCC-3'; Neilan et al. 1999. J. Bacteriol. 181(13):4089-4097) 및
PSV-4 (5'-SAGSAGGSWGTGGCCGCCSAGCTCGAAGAA-3')
를 이용한 PCR 증폭은 1.3 kb 밴드를 생성하여, pGEM-T Easy vector (Promega) 에 클로닝했다. 사용한 PCR 프로그램은, 95℃-2 분; 60℃-15 분; 72℃-6 분의 개시 싸이클, 이어서 20 싸이클로 95℃-1 분; 60℃-2 분; 72℃-2 분. 미크로모노스포라 종 ML1 염색체 DNA 를 템플레이트로 이용했다.
제한효소절단 절편 길이 다형상 (RFLP) 에 의한 클론의 분석은 펩티드 합성효소에 상응하는 3 개 타입의 상이한 클론 pGPSV1, pGPSV2 및 pGPSV3 이 있음을 보여줬는데, 이들은 각각 PSV1, PSV2 및 PSV3 로 지칭되는 아데닐화 도메인 절편을 포함한다.
후속적으로, 클론의 삽입체는 EcoRI 제한효소절단으로 방출하고, 절편은 pBBR1-MCS2 (Kovach, M.E. et al. 1995. Gene. 166:175-176) 으로 클로닝하여, 각각 플라스미드 pBPSV1, pBPSV2 및 pBPSV3 를 구축했는데, 이는 각각 PSV1, PSV2 및 PSV3 로 지칭되는 아데닐화 도메인 절편을 포함한다.
개시자 올리고뉴클레오티드 MTF2 및 PS4 를 이용하여 수득한 PCR 밴드로부터, 네스티드-PCR (30 싸이클의 95℃-1 분; 60℃-1 분; 72℃-1 분) 을 개시자 올리고뉴클레오티드 PS2-TG: 5'-ACNGGNMRNCCNAARGG-3' 및 MTR: 5'-CCNCGDATYTTNACY-3' (Neilan et al. 1999. J. Bacteriol. 181(13):4089-4097) 을 이용하여 수행하여, 750 bp 밴드를 수득하고, 이를 pGEM-T Easy vector (Promega) 에 클로닝했다. RFLP 에 의한 클론의 분석은 각각 펩티드 합성효소에 해당하는 2 개의 신규한 타입의 상이한 클론 pGPSV4 및 pGPSV5 이 있음을 보여줬는데, 이들은 각각 PSV4 및 PSV5 로 지칭되는 아데닐화 도메인 절편을 포함한다.
개시자 올리고뉴클레오티드 PS2M: 5'- TACACSGGCWSSACSGG-3' 및 PSV-4 를 이용한 PCR 증폭은 1.3 kb 밴드를 제공하여, 이를 pGEM-T Easy vector (Promega) 에 클로닝했다. 사용한 프로그램은, 72℃ 의 어닐링 온도에서 5 싸이클, 이어서 10 싸이클로 70℃ 에서 어닐링하고 68℃ 로 종결한 후, 20 싸이클 (96℃-1 분; 72℃- 68℃-2 분; 72℃-3 분) 로 한 터치 다운 스타팅 (Touch-down starting) 이었다. RFLP 에 의한 클론의 분석은 각각 펩티드 합성효소에 해당하는 신규한 타입의 상이한 클론 pGPSV6 이 있음을 보여줬는데, 이들은 PSV6 로 지칭되는 아데닐화 도메인 절편을 포함했다.
실시예 4. 콜로니 혼성화에 의한 유전자 라이브러리의 분석
SuperCos1 및 pKC505 (실시예 1 및 2) 에서 구축한 유전자 라이브러리는 각각 DIG DNA Labeling and Detection Kit system (Roche) 를 이용한 제자리(in situ) 콜로니 혼성화 분석 (Sambrook et al. 2001) 에 적용했다. PSV1 내지 PSV6 로 지칭되는 6 개의 아데닐화 도메인을 프로브로 이용했다.
하기의 것은 SuperCos1 에서 구축된 유전자 라이브러리로부터 수득했다:
- 절편 PSV1 에 혼성화된, pCT1a, pCT1b 및 pCT1c 로 명명된 3 개의 양성 코스미드 (클론);
- 절편 PSV2 에 혼성화된, pCT2a, pCT2b 및 pCT2c 로 명명된 3 개의 양성 코스미드 (클론); 상기 절편들 중, pCT2c 는 또한 절편 PSV5 와 혼성화함;
- 절편 PSV3 에 혼성화된, pCT3a 및 pCT3b 로 명명된 2 개의 양성 코스미드 (클론); 추가로, 이들 모두는 또한 절편 PSV6 에 혼성화함; 및
- PSV4 에 혼성화된, pCT4a 로 명명된 1 개의 양성 코스미드 (클론).
55 개의 양성 코스미드가 pKC505 에서 구축된 유전자 라이브러리에서 수득되었다:
- 절편 PSV2 에 혼성화된, cosV1-F8, cosV7-D2, cosV7-D12, cosV14-H4, cosV19-B4, cosV29-B9, cosV31-B11, cosV31-H10, cosV33-D12, cosV33-F7 로 명명된 10 개의 양성 코스미드 (클론);
- 절편 PSV5 에 혼성화된, cosV1-B6, cosV6-H8, cosV11-F10, cosV20-F8, cosV22-F7, cosV25-B3, cosV32-B4 로 명명된 7 개의 양성 코스미드; 및
- 절편 PSV1, PSV3, PSV4 또는 PSV6 에 혼성화된, cosV1-B7, cosV1-F5, cosV2-E5, cosV2-F11, cosV3-D9, cosV4-D2, cosV5-D7, cosV5-G6, cosV6-A7, cosV6-A12, cosV7-E7, cosV8-F8, cosV9-H7, cosV10-A3, cosV11-B4, cosV11-G2, cosV12-B12, cosV13-B2, cosV16-H11, cosV17-A3, cosV19-F4, cosV20-B3, cosV20-H5, cosV21-H6, cosV22-B11, cosV23-F8, cosV26-H11, cosV28-G1, cosV29-E1, cosV29-G6, cosV30-G5, cosV31-A12, cosV31-E10, cosV32-A7, cosV32-D10, cosV33-A8, cosV33-D10, cosV33-F10 로 명명된 38 개의 양성 코스미드.
단계 2. 6 개의 분리된 아데닐화 영역에서의 돌연변이체 생성
미크로모노스포라 종 ML1 염색체 DNA 로부터 미리 증폭된 6 개의 아데닐화 도메인 절편 (PSV1, PSV2, PSV3, PSV4, PSV5 및 PSV6) 을 티오코랄린 생합성에 수반되는 영역 평가를 위한 목적으로 독립적인 유전자 차단 실험에 사용했다 (실시예 6 내지 11).
콘쥬게이트성 플라스미드 에셰리키아 콜라이/스트렙토마이세스 pOJ260 (Bierman et al. 1992, Gene 116, 43-49) 를, 각각 영역 PSV1 내지 PSV6 를 포함하는 구축물 pFL903, pFL904, pFL905, pFL906, pFL940 및 pFL941 형성에 이용했다. 상기 구축물들은 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주 (Kieser et al. 2000) 에 도입했고, 그로부터 콘쥬게이션에 의해 기재된 과정 (Kieser et al. 2000) 을 이용하여 미크로모노스포라 종 ML1 균주에 도입했다. 트랜스콘쥬게이트성 클론을 아프라마이신을 이용해 선별하고, 적합한 염색체 영역으로의 통합은 아데닐화 도메인 절편 PSV1 내지 PSV6 의 상응하는 영역을 이용하는 서던 혼성화 (Southern hybridization) 로써 밝혀냈다. PSV 아데닐화 도메인 (PSV1 내지 PSV6) 의 각각의 영역으로부터 선별한 트랜스콘쥬레이트물 (transconjugant) 은 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사체는 아세토니트릴로 추출하고, HPLC-MS 로 분석했다 (실시예 5). 아데닐화 도메인 PSV2 및 PSV5 에 타격을 받은 돌연변이체만은 티오코랄린을 생산하지 않는 표현형을 갖는다 (실시예 7 및 10). PSV1, PSV3, PSV4 및 PSV6 이 결실된 돌연변이체에서의 티오코랄린의 생산은 야생형의 것과 유사했다 (실시예 6, 8, 9 및 11). 상기 실험들은 아데닐화 도메인 PSV2 및 PSV5 가 티오코랄린 생합성에 수반된다는 것을 보여줬다.
실시예 5. 티오코랄린 생산의 HPLC 검출
상이한 분석 균주의 아세토니트릴을 이용한 추출물은 회전 증발기에서 농축하고, HPLC-MS 분석에 사용하기 전에 DMSO 에 재현탁시켰다.
아세토니트릴 및 0.1% 트리플루오로아세트산의 수중 혼합물을 용매로 이용하는 역상 컬럼 (Symmetry C18, 2.1 X 150 mm, Waters) 을 이용하여 샘플 (10 ㎕) 을 HPLC 로 분석했다. 처음 4 분 동안은 10% 의 아세토니트릴이 있는 이동상의 농도는 일정하게 유지되었다. 이후, 30 분까지는 아세토니트릴의 10% 에서 100% 로의 선형구배가 시작되었다. 사용된 유량은 0.25 ml/분이었다. 정점의 분광 검출 및 특징분석은 포토다이드 검출기 (photodiode detector) 를 이용하고, Millennium 컴퓨터 소프트웨어 (Waters) 를 이용하여 수행되었다. 크로마토그램은 230 nm 에서의 흡광도로 추출되었다.
실시예 6. PSV1 영역에서의 유전자 차단
PSV1 영역은 플라스미드 pBPSV1 으로부터 1.3 kb EcoRI 밴드로서 수득했고, 콘쥬게이트성 플라스미드 에셰리키아 콜라이/스트렙토마이세스 pOJ260 의 EcoRI 부위에 클로닝하여, pFL903 을 형성했다. pOJ260 은 스트렙토마이세스에서 아프라마이신 내성을 보유한 유전자를 포함하며, 상기 세포에서 이는 자살 플라스미드이다.
구축물 pFL903 은 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주로 도입되어, 여기에서 콘쥬게이션에 의해, 기재된 과정 (Kieser et al. 2000) 을 이용하여 미크로모노스포라 종 ML1 에 도입되었다. 트랜스콘쥬게이트성 클론은 25 ㎍/ml 의 아프라마이신을 이용하여 선별되었고, 그의 염색체 DNA 로부터 PSV1 영역이 실제로 차단되었다는 것은 서던 혼성화로 밝혔다. 상기의 경우 사용된 프로브는 PSV1 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV1 을 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사를 아세토니트릴로 추출하여, HPLC-MS 로 분석해 (실시예 5 참고) 티오코랄린 생산체라는 것을 밝혀냈다. 리터 당 배양 배지 MT4 의 조성은 하기와 같다: 6 g 대두분, 2.5 g 맥아 추출물, 2.5 g 펩톤, 5 g 덱스트로오스, 20 g 덱스트린, 4 g 의 CaCO3, 10 g 의 해수염, pH 는 6.8 로 조정.
실시예 7. PSV2 영역에서의 유전자 차단
PSV2 영역은 플라스미드 pBPSV2 로부터 1.3 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위에 클로닝하여 pFL904 를 형성했다.
구축물 pFL904 는 콘쥬게이트성 에셰리키아 콜라이 ET12567 균주 (pUB307) 에 도입하고, 이로부터 콘쥬게이션에 의하여 미크로모노스포라 종 ML1 균주에 도입했다. 상호콘쥬게이션 클론은 25 ㎍/ml 의 아프라마이신을 이용하여 선별하고, 그의 염색체 DNA 로부터 PSV2 영역이 실제로 차단되었음을 서던 혼성화로 밝혀냈다. 이 경우에 사용한 프로브는 PSV2 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV2 을 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사는 아세토니트릴을 이용하여 추출하고, HPLC-MS (실시예 5) 로 분석하여, 상기 균주가 티오코랄린을 생산하지 않는다는 결과를 도출했다.
실시예 8. PSV3 영역에서의 유전자 차단
PSV3 영역은 플라스미드 pBPSV3 로부터 1.4 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위에 클로닝하여, pFL905 을 생성했다.
구축물 pFL905 는 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 거기에서 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주로 도입했다. 트랜스콘쥬게이트성 클론을 25 ㎍/ml 의 아프라마이신을 사용하여 선별하고, 그의 염색체 DNA 로부터 PSV3 영역이 실제로 차단되었음을 서던 혼성화에 의해 밝혀냈다. 상기 경우 사용된 프로브는 PSV3 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV3 은 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사는 아세토니트릴로 추출하고 HPLC-MS (실시예 5) 로 분석하여, 티오코랄린 생산체임을 증명했다.
실시예 9. PSV4 영역에서의 유전자 차단
PSV4 영역은 플라스미드 pGPSV4 로부터 1.2 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위에 클로닝하여, pFL906 을 생성했다.
구축물 pFL906 을 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 거기에서 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주로 도입했다. 트랜스콘쥬게이트성 클론은 25 ㎍/ml 의 아프라마이신으로 선별하고, 그의 염색체 DNA 로부터 PSV4 영역이 실제로 차단되었음을 서던 혼성화로 밝혀냈다. 상기 경우 사용된 프로브는 PSV4 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV4 는 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사를 아세토니트릴로 추출하고 HPLC-MS (실시예 5) 로 분석하여, 티오코랄린 생산체임을 증명했다.
실시예 10. PSV5 영역에서의 유전자 차단
PSV5 영역은 플라스미드 pGPSV5 로부터 1.1 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위에 클로닝하여, pFL940 를 생성했다.
구축물 pFL940 을 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 거기에서 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주로 도입했다. 트랜스콘쥬게이트성 클론은 25 ㎍/ml 의 아프라마이신으로 선별하고, 그의 염색체 DNA 로부터 PSV5 영역이 실제로 차단되었음을 서던 혼성화로 밝혔다. 상기 경우 사용된 프로브는 PSV5 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV5 은 티오코랄린 생산 배지 MT4 에서 배양했고, 후속하여 그의 균사는 아세토니트릴로 추출하고 HPLC 로 분석하여, 상기 균주가 티오코랄린을 생산하지 않음을 증명했다.
실시예 11. PSV6 영역에서의 유전자 차단
PSV6 영역은 플라스미드 pGPSV6 로부터 1.1 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위로 클로닝하여, pFL941 를 형성했다.
구축물 pFL941 은 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 그로부터 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주에 도입했다. 트랜스콘쥬게이트성 클론을 25 ㎍/ml 의 아프라마이신을 이용하여 선별하고, 그의 염색체 DNA 로부터 PSV6 영역이 차단되었다는 것은 서던 혼성화로 밝혀냈다. 상기 경우 사용한 프로브는 PSV6 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV6 은 티오코랄린 생산 배지 MT4 에서 배양했고, 후속하여 그의 균사는 아세토니트릴로 추출하고, HPLC 로 분석하여 티오코랄린 생산체라는 것을 증명했다.
단계 3. 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 뉴클레오티드 서열의 수득 및 분석
오직 아데닐화 도메인 PSV2 및 PSV5 의 증폭된 영역에 있어서만이 그의 유전자 차단으로 티오코랄린을 생산하지 않는 표현형을 제공하게 된다는 상기 결과를 토대로, 2 가지의 중복 코스미드, cosV33-D12 (아데닐화 도메인의 영역 PSV2 를 포함) 및 pCT2c (아데닐화 도메인 영역 PSV2 및 PSV5 를 포함) 를 선택하여 서열분석했다. 상기 코스미드로부터 수득된 64,650 bp 의 분석은 36 개의 온전한 ORF 및 2 개의 불완전한 ORF 이 존재함을 보여줬고, 그의 구성은 도 1 에 나타냈다. 상이한 유전자로부터 도출된 생성물의 데이터베이스에 존재하는 단백질 서열의 비교로 이들 대부분의 기능을 유추하게 되었다 (표 1).
실시예 12. 코스미드 cosV33-D12 및 pCT2c 의 삽입체의 뉴클레오티드 서열의 결정 및 분석
두 코스미드를 일반적인 방법으로 서열분석하고, University of Wisconsin 의 Genetics Computer Group 에서의 프로그램 패키지 GCG 를 서열의 컴퓨터 분석에 이용했다 (Devereux et al. 1984, Nucleic Acid Res. 12, 387-395).
이에 64,650 개 뉴클레오티드의 서열을 수득했고, 그의 컴퓨터 분석은 38 개의 ORF [36 개의 온전한 ORF 및 2 개의 불완전한 ORF] 이 존재함을 나타냈고, 그의 구성은 도 1 에 있다. 상기 ORF 의 유전자 발현 생성물은 BLAST 프로그램 (Altschul et al. 1997, Nucleic Acid Res. 25, 3389-3402) 을 이용하여 데이터베이스 내에 존재하는 공지된 기능을 가진 단백질과 비교함으로써, 이들 ORF 대부분에 대한 추정되는 기능들을 정리했다 (표 1).
Figure 112008014936915-PCT00002
Figure 112008014936915-PCT00003
Figure 112008014936915-PCT00004
Figure 112008014936915-PCT00005
동정된 단백질들 중 일부는 예를 들어, 동정된 NRPS 중 일부인, Tio12, Tio17, Tio18, Tio19, Tio20, Tio21, Tio22, Tio27 및 Tio28 과 같이 티오코랄린 펩티드 구조의 형성에 관여한다. Tio5, Tio6 및 Tio23 과 같이, 내성 프로세스에 관련될 수 있는 몇가지 단백질도 있다. 상기 서열 영역에서 동정된 가능한 티오코랄린 경로 조절자들은 Tio3, Tio4, Tio7, Tio24, Tio25 이다. 최종적으로, Tio8, Tio9, Tio10 및 Tio11 과 같이 개시 유닛 3-히드록시-퀴날데이트의 생성에 관련된 몇가지가 있다.
차단되는 경우 티오코랄린을 생산하지 않는 표현형을 양산하게 되는 유전자들은 도 1 에 별표로 표시되어 있다 (tio20, tio27tio28).
실시예 13. tio28 에서의 유전자 차단
티오코랄린 생합성에서 Tio28 단백질의 관여 또는 비관여를 증명하기 위한 목적으로, tio28 유전자, 및 구체적으로는 그것이 가진 아데닐화 도메인들 중 단 하나의 의 유전자 차단에 의한 불활성화를 수행했다.
상기 아데닐화 도메인 (FL-T-102up 및 FL-T-102rp) 내부의 2 가지의 개시자 올리고뉴클레오티드를 고안하고, tio28 에서의 1,428 염기쌍 구역의 증폭에 이용했다. 상기 개시자 올리고뉴클레오티드의 서열은 하기와 같다:
FL-T-102up: 5'-ACCTGAGGTACTGGGCGCAGC-3' (21 뉴클레오티드)
FL-T-102rp: 5'- CCGATCACCACCACCGTGGC-3' (20 뉴클레오티드)
사용한 PCR 프로그램은 하기와 같다: 2 분 동안 94℃, 30 싸이클 (30 초 동안 94℃, 60 초 동안 53℃, 90 초 동안 68℃), 5 분 동안 68℃, 및 15 분 동안 4℃. PCR 반응 혼합물은 하기를 함유했다: 1 ㎕ 의, 코스미드 pCT2c 유래의 템플레이트 DNA, 1 ㎕ 의, 농도가 30 pmol/l 인 각각의 올리고뉴클레오티드, 7.5 ㎕ 의 2 mM dNTP 용액 (dATP, dTTP, dCTP 및 dGTP), 1 ㎕ 의 50 mM MgSO4, 5 ㎕ 의, Pfx 용 반응 완충액 (Invitrogene), 5 ㎕ 의, Pfx 용 인핸서 용액 (Invitrogene), 28 ㎕ 의 증류수 및 0.5 ㎕ 의 Pfx 폴리머라아제 (Invitrogene).
PSV7 로 명명한, 수득된 PCR 생성물을 플라스미드 pOJ260 의 EcoRV 부위로 클로닝하여 pFL971 를 생성했다.
구축물 pFL971 을 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 그로부터 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주에 도입했다. 트랜스콘쥬게이트성 클론은 25 ㎍/ml 의 아프라마이신을 사용하여 선별하고, 그의 염색체 DNA 로부터 PSV7 영역이 실제로 차단되었음을 서던 혼성화로 증명했다. 상기 경우 사용된 프로브는 PCR 생성물 PSV7 였다.
돌연변이체 미크로모노스포라 종 ΔPSV7 은 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사는 아세토니트릴로 추출하고 HPLC-MS (실시예 5) 로 분석하여, 상기 균주가 티오코랄린을 생산하지 않는다는 결과를 제공했다.
단계 4. 다른 방선균에서의 티오코랄린의 이종적 발현
티오코랄린 생합성에서 동정된 유전자의 개입을 밝혀내기 위해, 각종 스트렙토마이세스 종들에서의 티오코랄린 유전자 클러스터의 이종성 발현을 검정했다. 서열 식별 번호: 1 의 위치 1,393 (MseI 제한 부위) 및 위치 54,301 (AclI 제한 부위) 사이에 포함된 DNA 영역을, 에셰리키아 콜라이에서 복제성인 플라스미드 및 후속적으로 에셰리키아 콜라이에서 복제성이며 스트렙토마이세스에 통합성인 플라스미드에 클로닝하기 위한 DNA 절편으로 선택했다. 상기 DNA 영역은 양끝이 모두 포함된 온전한, tio3 tio28 사이에 위치한 모든 ORF 를 포함한다 (도 1). 상기 DNA 영역의 선택은 Tio3 및 Tio28 단백질이 2 차 대사 단백질과 유사성을 보이는 서열분석된 영역 내에서 가장 중요한 단백질이라는 사실 때문이었다.
그의 큰 크기로 인해, 상기 DNA 영역은 3 가지 상이한 코스미드 (cosV33-D12, cosV19-B4 및 pCT2c) 로부터 수득한 3 개의 독립적인 DNA 절편을 합하는 단계에서 수득했다:
- 절편 A (20.2 kb): MseI (서열 식별 번호: 1 의 위치 1,393) - NsiI (서열 식별 번호: 1 의 위치 21,585);
- 절편 B (19 kb): NsiI (서열 식별 번호: 1 의 위치 21,585) - EcoRI (서열 식별 번호: 1 의 위치 40,636); 및
- 절편 C (13.7 kb): EcoRI (서열 식별 번호: 1 의 위치 40,636) - AclI (서열 식별 번호: 1 의 위치 54,301).
서브클로닝을 쉽게 하기 위해, 온전한 DNA 절편을 우선 에셰리키아 콜라이 pOJ260 (실시예 14) 에서 복제성인 플라스미드에 서브클로닝했다. 삽입체를 빼 내고, 에리트로마이신 내성 프로모터 (ermEp) (pARP) [실시예 16] 를 포함하거나 또는 상기 프로모터가 없는 (pAR15AT) [실시예 15], 에셰리키아 콜라이에서 복제성이며/스트렙토마이세스에 통합성인 벡터에 서브클로닝했다. 선별된 DNA 영역을 스트렙토마이세스 pAR15AT 에 통합성인 상기 플라스미드에 양 방향으로 (실시예 17) 및 pARP (실시예 18) 에 클로닝했다. 최종적으로, 상기 구축물은 유전자간 콘쥬게이션으로 몇가지 스트렙토마이세트에 도입했다 (실시예 19).
실시예 14. 선별된 DNA 영역의 에셰리키아 콜라이 플라스미드 pOJ260 으로의 클로닝
제한 부위 EcoRI (서열 식별 번호: 1 의 위치 40,636) 및 AclI (서열 식별 번호: 1 의 위치 54,301) 사이에 위치한 DNA 영역은 일반적인 과정 (Sambrook et al. 2001) 으로 코스미드 pCT2c (도 2) 로부터 수득했다. 상기 DNA 절편을 에셰리키아 콜라이 플라스미드 pUK21 (Vieira et al. 1991, Gene 100, 189-194) 의 특정 제한 부위 EcoRI 및 ClaI 에 클로닝하여, 구축물 pFL1023 (도 3) 을 생성했다.
제한 부위 NsiI (서열 식별 번호: 1 의 위치 21,585) 및 EcoRI (서열 식별 번호: 1 의 위치 40,636) 사이에 위치하는 DNA 영역은 일반적인 과정 (Sambrook et al. 2001) 으로 코스미드 cosV19-B4 로부터 수득했다. 상기 DNA 절편은 에셰리키아 콜라이 플라스미드 pGEM-11Zf (Promega) 의 특정 제한 부위 NsiI 및 EcoRI 으로 클로닝하여, 구축물 pFL1022 (도 3) 를 생성했다.
이어서, 상기 두 DNA 절편을 연결했다. 이를 위해, pFL1022 에 존재하는 제한 부위 NsiI (서열 식별 번호: 1 의 위치 21,585) 및 EcoRI (서열 식별 번호: 1 의 위치 40,636) 사이에 위치하는 DNA 절편을 제한효소 HindIII (NsiI 제한 부위의 바로 앞의 다중 클로닝 부위에 위치) 및 EcoRI 을 사용한 제한효소 절단으로 빼 냈다. 이어서, 상기 절편을 구축물 pFL1023 에 존재하는 특정 제한 부위 HindIII 및 EcoRI 에 클로닝하여, 플라스미드 pFL1024 (도 3) 를 생성했다.
pFL1024 에 클로닝된 전체 영역은 SpeI 밴드 (pUK21 의 다중 클로닝 부위의 양끝에 존재하는 상기 2 개의 제한 부위 덕분에) 로서 빼 내고, 플라스미드 pOJ260 의 특정 SpeI 부위에 클로닝하여, 플라스미드 pFL1036 (도 3) 를 생성했다.
최종적으로, 제한효소 절단 부위 MseI (서열 식별 번호:1 의 위치 1,393) 및 NsiI (서열 식별 번호:1 의 위치 21,585) 사이에 위치한 절편을 코스미드 cosV33-D12 로부터 수득하고, 이를 각각 pFL1036 의 NdeI 및 NsiI 부위에 도입하여, pOJ260 (Bierman et al. 1992, Gene 116, 43-49) 내에 서열 식별 번호: 1 의 위치 1,393 (MseI 제한 부위) 및 54,301 (AclI 제한 부위) 사이, 즉 양끝을 모두 포함하여 온전한 ORF tio3 에서 tio28 까지를 포함하는 구축물 pFL1041 (도 4) 를 생성했다. 더욱이, pFL1041 에서, 상기 영역은 2 개의 SpeI 제한 부위와 인접해 있다. pFL1041 은 에셰리키아 콜라이에서 플라스미드 복제성이다.
실시예 15. 스트렙토마이세스 pAR15AT 에 통합성인 플라스미드의 구축
플라스미드 pACYC184 (Rose 1988, Nucleic Acids Res. 16, 355) 의 복제 기원, ori p15A 은 SgrAI-XbaI 절편으로서 수득했고, 에셰리키아 콜라이 DNA 폴리머라아제의 Klenow 절편으로 처리했다. 상기 복제 기원을 플라스미드 pUKA 의 SmaI 부위에 클로닝하고, 이에 따라 플라스미드 pUO15A (도 5) 를 수득했다. pUKA 는, PstI-AccI 제한 부위로 클로닝되고 코스미드 pKC505 (Richardson at al. 1987, Gene 61, 231-241) 로부터 PstI-EcoRI 밴드로서 수득된 아프라마이신 내성 유전자를 포함하는 플라스미드 pUK21 (Vieira et al. 1991, Gene 100, 189-194) 의 유도체이다.
아프라마이신 내성 유전자 aac (3)IV 다음에 ori p15A 를 포함하는 DNA 절편은 pUO15A 상에서의 BglII-XhoI 제한효소 절단으로써 수득되었다. 상기 절편은 동일한 제한효소를 이용하여 플라스미드 pOJ436 에 클로닝되어 (Bierman et al. 1992, Gene 116, 43-49), pOJ15A (도 5) 를 제공했다.
콘쥬게이션 기원 oriT 를 포함하는 플라스미드 pOJ260 유래의 DraI-BglII 절편 (Klenow 로 처리함) 은 pOJ15A 의 PvuII 제한 부위에 클로닝했다. 이에 따라 플라스미드 pAR15AT 를 최종적으로 수득했다 (도 5).
실시예 16. 스트렙토마이세스 pARP 에 통합성인 플라스미드의 구축
플라스미드 pGB15 (Blanco et al. 2001, Chem. Biol. 8, 253-263) 로부터 Klenow 를 사용하여 처리된 EcoRI-HindIII DNA 절편으로서의, 엘로라마이신 생합성 경로 유래의 elmGT 글리코실트랜스퍼라아제 유전자를, pSL1180 (Amersham Pharmacia) 의 Ecl136II 제한 부위에 클로닝했다. 이에 따라, 구축물 pSLelmGTa (도 6) 를 수득하여, elmGT 유전자는 구성적 ermE 에리트로마이신 내성 유전자 프로모터 (P ermE ) 의 제어 하에 있게 되었다.
P ermE -elmGT 를 포함하는 pSLelmGTa 로부터 수득된 SpeI-NheI 절편은, 실시예 15 에 기재된 플라스미드 pAR15AT 의 XbaI 부위로 클로닝하여, 구축물 pAR15ATG* (도 6) 을 수득했다.
플라스미드 pAR15ATG* 상의 XbaI 제한효소 절단 및 후속된 재-라이게이션으로써 elmGT 유전자를 제거하고, P ermE 프로모터는 유지하여, 플라스미드 pARP (도 6) 를 제공했다.
실시예 17. 양 방향에서의, 스트렙토마이세스 pAR15AT 에 통합성인 플라스미드로의 선별된 DNA 영역의 클로닝
서열 식별 번호: 1 의 위치 1,393 (MseI 제한 부위) 및 54,301 (AclI 제한 부위) 사이에 포함된 영역을 포함하는 pFL1041 (도 4) 유래의 SpeI DNA 절편을, 양 방향에서, 플라스미드 pAR15AT (도 5) 의 XbaI 제한 부위로 클로닝했다. 이에 따라, 에셰리키아 콜라이에서 복제성이며, 스트렙토마이세스에 통합성이고, pFL1048 및 pFL1048r (도 7) 로 명명한, 아프라마이신 내성 유전자를 가진 2 개의 신규한 플라스미드는, φC31 파아지의 attP 영역을 이용한 계를 이용하여 생성되었다.
실시예 18. ErmE 유전자 프로모터 다음의, 선별된 DNA 영역의 스트렙토마이세스 pARP 에 통합성인 플라스미드로의 클로닝
유사한 방식으로, 서열 식별 번호:1 의 위치 1,393 (MseI 제한 부위) 내지 54,301 (AclI 제한 부위) 사이에 포함된 영역을 포함하는 pFL1041 (도 4) 유래의 SpeI DNA 절편은 플라스미드 pARP (도 6) 의 XbaI 제한 부위에 클로닝했다. 이에 pFL1049 (도 7) 이 생성되었으며, 여기서 tio3 (서열 식별 번호:4) 에 해당하는 ORF 는 pARP 에 존재하는 연속적 프로모터 P ermE 의 제어 하에 있다. 상기 플라스미드는 아프라마이신 내성 유전자를 갖고, φC31 파아지의 attP 영역을 이용한 계를 이용하여 에셰리키아 콜라이에서 복제성이며, 스트렙토마이세스에서 통합성이다.
실시예 19. 상이한 스트렙토마이세트에서의 티오코랄린 생합성 경로의 이종성 발현
플라스미드 pFL1048 (도 7) 는 에셰리키아 콜라이 ET12567 (pUB307) 균주 (Kieser et al. 2000) 에서 콘쥬게이션에 의해 스트렙토마이세스 리비단스 (Streptomyces lividans) TK21 (Kieser et al. 2000) 및 스트렙토마이세스 알부스 (Streptomyces albus) J1074 종 (Chater et al. 1980, J. Gene. Microbiol. 116, 323-334) 에 도입되었다.
플라스미드 pFL1049 (도 7) 는 에셰리키아 콜라이 ET12567 (pUB307) 균주로부터 콘쥬게이션에 의해 스트렙토마이세스 코엘리컬러 (Streptomyces coelicolor) M145 (Redenbach et al., 1996, Mol. Microbiol., 21, 77-96), 스트렙토마이세스 리비단스 (Streptomyces lividans) TK21, 스트렙토마이세스 알부스 (Streptomyces albus) J1074 및 스트렙토마이세스 아베르미틸리스 (Streptomyces avermitilis) ATCC 31267 종으로 도입되었다.
최종적으로, 플라스미드 pFL1048r (도 7) 는 에셰리키아 콜라이 ET12567 균주 (pUB307) 로부터의 콘쥬게이션에 의해 스트렙토마이세스 리비단스 (Streptomyces lividans) TK21 종에 도입되었다.
제품 배지 R5A (Fernandez et al. 1998, J. Bacteriol. 180, 4929-4937)에서의 스트렙토마이세스 알부스 (Streptomyces albus. pFL1049) 클론의 배양 결과는 도 8A 에 나타낸다. 도 8B 는 상기 염색체에서 체류 시간이 27 분인 정점의 흡수 스펙트럼을 보여주며, 그의 질량 스펙트럼 (도 8C) 은 이들 모두 정제된 티오코랄린의 것과 상동임을 보여준다.
<110> Pharma Mar, S.A. <120> GENES INVOLVED IN THE BIOSYNTHESIS OF THIOCORALINE AND HETEROLOGOUS PRODUCTION OF SAME <160> 39 <170> PatentIn version 3.1 <210> 1 <211> 64,650 <212> DNA <213> Micromonospora sp., ML1 strain <220> <221> CDS <222> (2)..(535) <223> Open Reading Phase of orf1 <220> <221> CDS <222> (993)..(1130c) <223> Open Reading Phase of orf2 <220> <221> CDS <222> (1517)..(2131) <223> Open Reading Phase of tio3 <220> <221> CDS <222> (2154)..(2822) <223> Open Reading Phase of tio4 <220> <221> CDS <222> (2970)..(3791) <223> Open Reading Phase of tio5 <220> <221> CDS <222> (3794)..(4777c) <223> Open Reading Phase of tio6 <220> <221> CDS <222> (4904)..(5611) <223> Open Reading Phase of tio7 <220> <221> CDS <222> (5701)..(6426c) <223> Open Reading Phase of tio8 <220> <221> CDS <222> (6426)..(7688c) <223> Open Reading Phase of tio9 <220> <221> CDS <222> (7733)..(8524c) <223> Open Reading Phase of tio10 <220> <221> CDS <222> (8791)..(10002) <223> Open Reading Phase of tio11 <220> <221> CDS <222> (10002)..(11590c) <223> Open Reading Phase of tio12 <220> <221> CDS <222> (11847)..(13634) <223> Open Reading Phase of tio13 <220> <221> CDS <222> (13734)..(15005c) <223> Open Reading Phase of tio14 <220> <221> CDS <222> (15005)..(16354c) <223> Open Reading Phase of tio15 <220> <221> CDS <222> (16441)..(18744c) <223> Open Reading Phase of tio16 <220> <221> CDS <222> (18774)..(19055c) <223> Open Reading Phase of tio17 <220> <221> CDS <222> (19260)..(20036) <223> Open Reading Phase of tio18 <220> <221> CDS <222> (20146)..(20880c) <223> Open Reading Phase of tio19 <220> <221> CDS <222> (21188)..(28969) <223> Open Reading Phase of tio20 <220> <221> CDS <222> (28979)..(38398) <223> Open Reading Phase of tio21 <220> <221> CDS <222> (38449)..(38661) <223> Open Reading Phase of tio22 <220> <221> CDS <222> (38642)..(41263) <223> Open Reading Phase of tio23 <220> <221> CDS <222> (41835)..(42368) <223> Open Reading Phase of tio24 <220> <221> CDS <222> (42395)..(43255c) <223> Open Reading Phase of tio25 <220> <221> CDS <222> (43340)..(43741c) <223> Open Reading Phase of tio26 <220> <221> CDS <222> (44152)..(49563) <223> Open Reading Phase of tio27 <220> <221> CDS <222> (49635)..(53669) <223> Open Reading Phase of tio28 <220> <221> CDS <222> (53749)..(55305c) <223> Open Reading Phase of orf29 <220> <221> CDS <222> (55384)..(57222c) <223> Open Reading Phase of orf30 <220> <221> CDS <222> (57895)..(58467c) <223> Open Reading Phase of orf31 <220> <221> CDS <222> (58535)..(59206c) <223> Open Reading Phase of orf32 <220> <221> CDS <222> (59298)..(59564c) <223> Open Reading Phase of orf33 <220> <221> CDS <222> (59611)..(60114c) <223> Open Reading Phase of orf34 <220> <221> CDS <222> (60202)..(60888) <223> Open Reading Phase of orf35 <220> <221> CDS <222> (60960)..(62240) <223> Open Reading Phase of orf36 <220> <221> CDS <222> (62300)..(62833) <223> Open Reading Phase of orf37 <220> <221> CDS <222> (62925)..(64650) <223> Open Reading Phase of orf38 <400> 1 gatccccagc cgcgaatggc agccacacag ctgcggcccc ggggccaaag gaccacgcga 60 gtacctgtgg gcctggatca ccaccgccac cagcgcaggt gagcaccggt ggctgctgat 120 gcgccgcaac cgcagcaccg gtgagctggc cttctacctg tgctggtcac cccgcccggc 180 gccgctgcac accctcgtga ccgtcgctgg ttcccgctgg agcatcgagg agctgttcca 240 gtccggcaaa ggccaggtcg gcctggacca ctaccaggtc cgcggctgga ccggctggca 300 ccgccacgtc accctggcca tgctcgccct ggccgtcctg accatcctcg ccgctcggca 360 gcccgacccc gacccggaga tcatcgcgct gaccgtcgcc gaaatccgcg ggctcctcaa 420 cgccttcgtc ctcgccgtga cgctcccacc cgcgcacacc ctgcactggt cgacctggcg 480 acgaacatcc caagcccgcg cccgacgagc ccactaccag cgcagacagg cgaagtgacg 540 ttggagtact agccattgag ccgataattc agcgcacgac ttgccggaat cggtagggat 600 ggtgtggcga ccatggccgc gatcgatgcc tgggcgcgtc ggcccggtcg acgccgagtc 660 gggcgacgcg ctggcgggtg aaggtggccg cccgtcgaac tttacgactt gaataccagt 720 atcggtgaag aggccgaaga ccgatatctg ccattacgta ccgatcatgt tgcaggaatg 780 cccggaacct ttcggatgtc aggctgccag ttggcaagcg ggtgggtgcc ctctcccgca 840 gggcttcgcg tagtcgcctg aacgtcttcc gacctcgcgt tcgtggtgtc gcggacctga 900 ttggagggtg atttagcacg ggtgtggtcc atcggtgatc tgcagttgct gagacaacat 960 gagacggaga aggaccacac cctcgcatgt catcgtcgct gatcgacgta acccgtcagc 1020 atgccccgcc ccgcccgact caccgactgc tggccgcgag gcgcttggag gccctggcgc 1080 gggttcccga tccgcgtgac ccgtgccaac cgccgcccac acgacctcat cgccaccgtg 1140 aacagcagct accccactat gcaatgaccc tgctctgtcc cgtcgacggg acagagcgcc 1200 cgccgccgga ggaagaaacc tgttgccgtc gcgggatgct gattatattc agcctcatga 1260 ccctgctcat gaagcggcgg gcttcggtcg cgatgcgttt gttccgccga tatctcacta 1320 aacgccggga ctggacagtg tgaacatcat tgcacttcta gctggttgac aacgtatcta 1380 cggtcgccat ggttaattgt ggttgacggc gcgtgtcgcg actgcggagc gccatgtcgt 1440 cgaatctcgg ccagccgtcg ccgtgacatt tgtcaaccag ctccgatgaa ttctgtgcac 1500 tctgggggag ttgctgatgt cggtttcggg aagccgccgg agcgaaggct cctaccgtcg 1560 ttcgggtggt tgtgcccagg gccgctcgcc ccggccagcc agggaagacg tcaagttcgt 1620 ccgttggccg gccgagcggc acctacgcga cctgtgccgt caggagcgga tcccgtgcct 1680 cctggtggtc gagggcggag cagagccgcc ggtctgcagt gatccgcgtg aggactgggt 1740 tcgtacgccg atctcgccat ccgaccttga cgctcgggtg accgctctcc ggcaacgttc 1800 tcacgaccgg cgtacgcctg ttctcgaccc ggccgggacg ttgtcgttca ggactgcgtc 1860 cgtcgtcatg tccagtacgc acctcgaact catggatctg ttcgtcgaac gcttcggcca 1920 ggtggtctac cgctgggagt tgatgaccat cctcacgaag cgcgactcga catcaacgcg 1980 aaacgccctc gatctgcaca tcatgagaat gaggaagcgg atcgcgccgc tcgatctgga 2040 tatagttact gcctggggcc gtggctacgc gctggaagaa aagtcctcat gggccgcggt 2100 ggccagcaag cccgcggctg tcgatcattg ctgacatcgc cggccgatgg ctactcagtt 2160 tcgtcgtggg tagtcttgtc gagggtctct gctgcggccc ggtcgagggt ggagacgatc 2220 cactgatcga gttcgacgct tgattggtgc gcggcctggc gccatcgggt aaggcgtcgg 2280 tcgggtatgg gaatgcgggg catcagtgcg gtcttgatgg tttctgttgt gcggtcggag 2340 cgggtcgctt tgatggccgc gcggagttgt ttgaccgacc acatctgggt ttcggcttcg 2400 tcgagccaac ggtcctgatc gtcgggagac attgcggcta cttcggcgtg gtgttggaaa 2460 ctgaggccgc ttcgacggcg ggccagtggg aagcggccgg cgacccaggc gtagttgcgt 2520 agggtctggt agtccagtcc tacagcctgg acgacgtgcc gatagcggtc ggcgtattgt 2580 tccttgccgt acaccagcca gtcgcccagg caccaggacg aggagtcgac gataccggag 2640 agttgggcgc cggttcgctc ccagtgttcg aagctcattc gttcgggcaa ccgtagaccg 2700 accctggtca gcatcacctg ggccggctct gctgggcgtt gcttcggaac gccagccgtt 2760 gctgcaggga ccacccggag cgctgctacg gcgttgcgtg acgatcggct acccgcgctc 2820 atcccactca acctccccga cagtcggata actcgctatc tctgctctct ttttccgtct 2880 cgcgccgtgc atgtgtgatc ggcgcgcgcg ggatgccacc cgtaaggccg cccttccgac 2940 aaaggcggcc ttgcgggtgt ttccggttac ctcgaccgca ggctgtactt acgggtcgcc 3000 agcggagcga agatggtgat cagcaggacc gaccaggcaa ccgtcagcag cacatccagc 3060 cccggcggat tgccgttgaa caggtcgcgc agcgcgttga ccgtcgcggt catgggactg 3120 gcatcggcgt acacccgcag ccaggtcggc atcgactcgg taggtacgaa cgccgacgag 3180 atcagactga acgggaagat ccagatcagg ccggccgact gcgccgcctc cgggttgggc 3240 accgagaggc cgatcatggc gccgacccag gtgagcgcgt agccgaacag caacagcagc 3300 gcgagtccgc cgagggcaga caggaccccg ccctggaagc ggaagccgat cagcagaccc 3360 atgagcacca cgaccagcat cgacacgacg ttgcgaagga tctccgacag cgtacgcccg 3420 acgaggaccg cggaccggct catcggcatc gagcggaacc ggtccatcag gccgcggtcc 3480 atgtcggtgg agatgccgat cgtggtgccg gcgaccgaac cgaacaacac catctgcacc 3540 aggatgccgg gcagcaggaa ctgggggtag ttcccgccct cgacattgat cgccccgccg 3600 aagacgtagg cgaacagcag gatgaacatg acgggctgaa ccagcgagaa catcaccagt 3660 tcggggctgc gcgtcaggtg ccgcagattg cgcagcgcca tctgccaggc gtcggacagc 3720 caccaggaca ggccggtctg ctgctgtgcg gcggcggcat cgagccgcgg tttcagggac 3780 gtggagacca tcaccgctta ccacccttct tcttgctgtt cacgtcttcg gacgcccggg 3840 ccgtggcggt gtgcccggtg agggcgagga acacgtcatc gagcgtgggc cggcggacgg 3900 ccacgtcggc gattgcgatg ccggaatcgc gcagcggatt gagtagctcg ttgagcgtca 3960 taccctcggg gaggggcgcg tgcacctgca tgccctccgg atcgccgacc ggctcggtcc 4020 ccaacctctc gcgcaggatc tgggtggtct tctcgaccgc ggcggcgtcg atgagagtca 4080 cgtcagccca cgcctggccg acctccgcct tgagttcgtc cggcgcgccg ctggcgatca 4140 ccttgccgct gtcgatcacg gacagcgagt cggcgaggtg gtcggcctcc tcgaggtact 4200 gggtcgtgag cagaaccgtg gtgccctcct cgaccaactc gttgacgatg cgccacacgt 4260 ccatgcgact gcgcggatcg agggcggcgg taggttcgtc gaggaagatg agctggggcc 4320 ggctcatcag ggtggcggcg atgtccagcc ggcggcgcat accgcccgag tacgtcttcg 4380 cctgccggcc ggccgcctcg gtcaggtcga agcgctccag cagttcggtc gcccgcacct 4440 tgatgtccgg cgtggacatc cggaacagct tgccgaccat gtgcaggttc tcccgcccgg 4500 tcagcatgtc gtcgacggtg gtgtactgac cggtcaggcc gatgatggag cgcacctgta 4560 gcgcgttgcg ccgcacgtcg aagccgaata tctcggcctt cccctcatcc ggcctgagaa 4620 gggtggtcag aacccgaacg gtggtggtct tgcccgcacc gttaggtccg agcagaccgt 4680 gcaccttacc ctccggcacg gtgagttcga ggtgatcgag agcggtcacc gagccgaatc 4740 tcttgcacag tccagctact tcaatcgctg ctggcatctc caggattcct ctcaaagggg 4800 ccaacgaagg tcggcgtgct gatcctggaa tctacccctg aacttccctt agaagctttg 4860 accgcagaat gagcggcagc gagtcgctat agtctcaaac gtgatgtatt tccgtccggc 4920 tgatctcgcc catgagcacg gcctttcccc gcaatcggta cgcaactacg agcgtgatgg 4980 tctcatcccg cccgctcggc gtacggagag cggctaccgg cggtacaccg agaagcacgc 5040 cgcagcgcta cgggcgtacc gcgccctcat cccggcgcac gggtacgccg aaagcggcgc 5100 gatcatgcgg gacatcactg ccggacggtt gaacgaggca ttgacaacca tcgaccgcag 5160 tcacgccgaa ctgctgcgag accgcggcac cctggacgct gtcgccgagg tcctgactca 5220 cctgacggga cgctcgaccg gcacctggcg tgccccgaag agcattcagc cctacagcat 5280 cggggagttg gcgcaccggc tcggcgtcaa tgtggcgacc atccggaaat gggagacgtc 5340 gggcgtgctc gcgcccgtcc gccggccgga gaccgggcac cggatgtacg acgccagcga 5400 cgtccgcgac gcggaactgg cgcacttcct gcggcgcggt cgctatccgc tcgagctgat 5460 agccaccgtg gtgcagcagg tccgggcggc cggagacacc caggcgttgg ccgcggccct 5520 cgcggactgg cggcagcgcg tcaccacgcg cggcctggcc atgctgaacg ccgccgcaca 5580 actcgccagc tacctggcga tggaggagaa ctgatccggg gcccgacgcc cccgtgaccc 5640 gctgcgccgg gactgttccg ggcgggtggg gccgtaccga ctccacccac cccgatctca 5700 ctgcgtgtgg gcagtcggct gctcccacac caacgcgtcg tggacctgcg cccgaagctg 5760 ccgcagctgg gcgaagggca gggtgatccg gcgggccaga tagtcgacgc cggtgctgcc 5820 gccggtgccg ttgcgattgc ccaccatctt cgagaccagc gccaggtggg tcatcttcca 5880 ccgccagtag ccgttggcca cgtcgagcag gctgtcggcg atgcggttga gcacgccggc 5940 gccggggccc cgtgcgcaga cctcggcgac gctgatgccg ttgtgctcgg tcagccgctc 6000 gaaggcccgg tagaggcggc cctcctgacg ctcgccgccg agcagccgcg cgagcaggcg 6060 gaactgcgcc gactgcgcac cgctcgcccc gtcgaggaac gggcggaatt cggcgaagtg 6120 acgcagcggc aaccgttcca gcgcgaccac ctgctcgtgc agtacccgga gcagctcagc 6180 ggtgcgctgg agaaattcca gcgccagctc ctcgtcctcg ggtccgtagg gcggcgtcat 6240 cgcgtccgcc gcggcgtcga ggtcgtacgt cacctgcttg agccacagct cgcaggcttg 6300 atgggtgacg atgaagaagt gctcagccag taccacggac cggctcgcgg tgtccggggc 6360 gcgggtctcc tgcagggaca gcagcgtgtc gacctgcagg tagtccgcgt aggtcagggt 6420 cgtcatcggg cggtcccggg gcgttctcgt gcgaactcca gcagctcgcg tacgccgctg 6480 cgcagcaccg acggcgctac gcacatggcg atccggatga ggtgacgcga ccagggcgcc 6540 ggttcgacgg tgatgacccg gccccgggcg tccaggcggg gcatcagcgc gaacccggtg 6600 ccgggaacca ccgcgacgtt ccgggtctcc agcagcccgg tggcgaactc ttcggcggtc 6660 aggccggtcg gcgcgacgtc gagcactgcg taccagccac cggcgggcag ttcgggcagc 6720 aggccggcgt cgcgtacggc gggcagcacc gcatcgcggt tgctgagcac catggcacgg 6780 ttctcgcgta ccacgtgtcc cagccgcagc gcctccagcc ccgcgtattg caccggggtc 6840 gacatcgcga tgaggttggc ctcctgcacg atccggaagg cgtgcgcggt ccggtcgttg 6900 gcggtgctga cgtaccccaa tcggtagccg gtcatcgcca ggctcttcga gaaggagtag 6960 gagctgtgca cgatccgctc ggagaccggc acatcccact ccagtgacgc ggtcgagacg 7020 tgttcgtcgt cgaagacgaa gtgctcgtac gcctcgtcgc tgatgacctg ccagccccgg 7080 gcgcgcgcca tgtcgatcag cgtgctcagg gtcgccgtgt cgaggacggc cccggtcggg 7140 ttggcgggtg agttgatcaa cagcactctg gtgttcgcgg tcgaggccgc cagcaccgac 7200 tcggggtccg tccggtagtc gcgtcccagc gggtagaaca ccggacggag accggcgagc 7260 agcacctgct gcaggtggat gggccagtgc agctccggca gcaggatctc cgcgtcgggt 7320 tcggccacgg cctgcatcag cgcggccagg ccctgacagg agccgggggt gacgaagagc 7380 cgggacacat cggtgtccac gccgttctgg tcagcgagct tctccaccag acgctcgcgg 7440 agctccagca gcccctcgac cgccgtgtag tcggtgcgcc ctgcggtcac cgcctccgcc 7500 agcgcctgcg cgacctcggg tggcggggtg aagtagggct cgccgacatg cagcttggtc 7560 accggaacac cgctgatgcg ctcgcgctcg ccggcatcgc ggaagacgcg atgcagctcc 7620 gacgacggaa tcgtcgacgc gaccgaggga ccgtcgagca ggttgggata ggggcttggc 7680 aggggcatct aatctccgtt tcgatcgtga cggcggtacg gggagggcat caggaggtgc 7740 gaccgccgtc gacgggaatc agcgctccgg tgatccagcc ggaaaactcc gggtcgagca 7800 ggccgcacac ccacccggcg atctcggcgg gctggccgaa ccggcccaaa ggggtcgccg 7860 cgagcagcga cgaccgcagc aacgcggact tcacggagtc caggcccatg tcgtcccaca 7920 tcggtgtgtc cacgggtccg ggtaggacgg cgttgaccct gacgtccggg gccagttccc 7980 gggccagcga tcgggtcaga ctgttcagcg cggccttgct ggcgccgtag aaggaccgcc 8040 ccggcatggc cagcacggca ccgacggacg acacgttcac caccgcgccc cgatgctcac 8100 gcaggtgggg tagggccgcg cggatcaggg cggccggtgc gcggacgttg gtggcgagca 8160 gccggtcgaa gtcctcgtcc gacgccgtgt cgagcgtcgc gaagcgggcc agcccggcgt 8220 tgttgaccag accgtgcacc gtaccgaagc gggtggtcgc ggcggcgacg acgtgttccg 8280 ccgcgcccgg ctcggtgatg tcggcggcga cggtcgcgac ctgcccgcca ccgtctccgg 8340 tcagctcccg caacgccgcc tcgcgacgcc cgaccgcgac cacgttcgcg tcgcgggcca 8400 gcagtcgttc gccgatcgcc cgtcccagtc ccgtgccggc cccggtgacg atcaccgtac 8460 gaccggcgag gccgtcgccc cgctcagcca cggcgggcca tgcctcggct tcggttgggg 8520 acaccgacgg cgtggctggc tgggacggcc ggccgccgag gtgtgcacgg ccgatatccg 8580 cgtccggtaa cgcgatgagc ggttgtgacc atggcctccg cctcgaccag actggtgttc 8640 gagctccaat ctcccgcctg ggaggcggat cggcatccat tccgacagaa ctgagccaga 8700 tgcgcccgcg gccctaccga ggcttgtgac gatgcgggca gttacgactt cgccgccgga 8760 tctccggatc ccgtacggaa ggttctgtcg atgagttcgc ccacggccag caccagcgcg 8820 ctcgacctca ccgacccgac gacgttcgtg cgccacgaca cgcacgtgtt ctgggccgag 8880 gtgcgtgacc acaatcccgt ctactggtac cagggccgcg aggaccgccc cggcttctgg 8940 gtggtatcgc gatatgtcga cgtggtcgcg tcctacaccg acgctgcgag gttgagctcg 9000 gcgcgcggca ccgtgctgga cgtgctgctc cggggcgagg actccgccgg cgggcggatg 9060 ctcgcggtca ccgatcggcc gcgccaccgt gaactgcgca acgtcatgct ccgcgcgttc 9120 tccccccggg tgctcggccg ggtcgtcgag caggtccatc gacgcgccga cgagctgatc 9180 cggcgggtca ccggtaccgg cgccttcgac ttcgccaccg aggtggccga gagcattccg 9240 atgggcacga tctgcgacct gctgtcgatc ccaccggcgg accggccgga cctgttgcgg 9300 tggaacaaga acgccctctc ctccgacgag gccgacgcca acctgtatgc cgcgctggag 9360 gcccgcaacc agatcctgct ctatttcatg gatctggccg agcagcggcg ggccagtccg 9420 ggcgacgacg tgatcagcat gatcgccact gccaccgtcg gcggcgagcc gctctccatc 9480 gacgacgtcg cgctcaactg ctacagcttg atcctcggcg gtgacgagtc ctcacggatg 9540 tcggcgatct gcgcggtcaa ggcgttcgcg gacttccccg accagtggcg ggccgtacgc 9600 gacggtgacg ttgcgatcga caccgcggtc gaggaggtgt tgcggtggtc cacgccggcc 9660 atgcacttcg cccgtaccgc caccacggac ttcgagctgc ggggccagca ggtgcgggcc 9720 ggagacatcg tcaccctgtg gaacctctcg gccaacttcg acgagcggga gttcgaccgg 9780 ccctaccggt tcgaggtggg gcgtaccccg aacaagcacc tgtcgttcgg ccatggcccg 9840 catttctgcc tcggcgccta ccttggccgc gccgagctgc aggcgttgct caccgcgctg 9900 gtcggaaccg tttcgcgcat cgagtccgcc gggtcgcccc ggcgcgtcta ctcgaacttc 9960 ctcaacggcc acagctcgct gcccgtcgcc ttcacgggtc gctgacccgg ccaggccctc 10020 accccgatgt gcgcagggtg accttgtcga ccttgccgac ggcggtgcgg gggaactcct 10080 cgatcggcac cacccgatcc ggaatcttgt aggtggccag accgcgctcg cggaggaagg 10140 acttgacagc cgccggactg atcggctcgt cccggaggat gacgaaggcg acggtcttct 10200 cgcccagcac cgggtcggcc acgccgacca ccgccgcgtc gcggatcgcg gcgtgggcga 10260 gaaggtgctc ctcgatctcc tcggcgggta ccttctcccc gccgcggttg atgatgtcct 10320 tgatccgccc gaccaccacg atgctgccgt ccggccgccg gcggaccatg tcgccggtgc 10380 ggaagtagcc gtcgggggtg aacgagcgcc ggttctgttc ctcggcccgg tagtagccgc 10440 ggatcgtgta gggaccccgc accagcagct cgccctcggc gccatcgggt acgggtcgac 10500 cgtcggtgtc gacaacgagg atctcgtcgt gcgcggccag cggacgtccc tcggtggcga 10560 gaacgacctc ctccggatcg tccaggcgcg tgtaggtcag cagcccttcc ccgacgccga 10620 accactgtgt cagcacggca ccgaggctgg tccggacctc ggcggcgcgg gcggggtcga 10680 acttggagct gcccacctgg agcatgaggt tggggaaccg gacgtccgac ttgcgggcgg 10740 cgtcgagcca cagccgcacc acgggcggca cgagcgtcgt gagcgtcacc cgctcccgct 10800 ccaacagctc gaacacctcg tccggccgga cgctggaggt gagcactgcg gtgccgccga 10860 ccagcagtgc gccgaggacg ccgggacagc cgagcgcgga attgtggccg atcgggttga 10920 ccgccaggta cacgtcctcc gcgccgaacc gcagcgcatc agccgtggcg cgcatgttgt 10980 aggcgtagtc gtcgtgcgtg cgtgggatga gcttgggcag gccggtcgtg ccgccggaga 11040 gcaggaacag cgcgggctcg ctggggtcga cggcaggcag gtcacgcccc cgccggtaga 11100 ggtccgccag cgcggtgaac tcctcggcgt caccggcgac cacgacatgc ttcagtgcgg 11160 gcacctcggc ccgtacctcg cgggccagcg cgcggtggtc gaagcccttg acctggtcga 11220 cgacgaccag ggcgaccgcc tgcgaatgtg cgcacaggtg ggtcagctcg accttacggt 11280 gtcccggcag ggccatgacg gggatggcgc cgatccgcag cagcgcgtag accaccacca 11340 cgaactcggg cacgttgggc agctggacga cgactcggtc caacggttcg atgcccacgt 11400 ccaacagccc gcccgcgacg tctgcggatg ccctcgacag ctcggcgtag gtcatccgcc 11460 gctcgccgca gacgagtgcg gtcttgtcgg cgtgccgggc acatgcctcg gtcagcaggt 11520 ctcccagcgg ccgtccctgc cagtacccct cgcggcggta gagcgcggca agttcctcgg 11580 gccagggcac acaaccatcg agcatcgctt ccacccaaca gagtcgaggt agttgaacag 11640 acacggcgtc tcgacgccat tgccacagcg tgacccaagc cgtgcggccc ggacggcacg 11700 gcgacaggga cgcgaaagga gcgtccgtgg cggcacttgc cctgtcgcaa tcctttcgtg 11760 gccgggcacc ggcgcgcgag cgagcagcta ggttcgggcc ccgtgcagcg ccctcgtacc 11820 cagtaccgag aggacggagt gagcaggtgc ccaccgttgc ggaattgttt gagtccgttg 11880 ttgcgcgctc gggcgaccac gtggcggtga tcttcggcga ccgcctcgtc agctatgccg 11940 aactcgacgc ccgcgcaaac cggttggcgc gggtgctggt cgagcgcggc gtcggccccg 12000 acaccaccgt ggcggtggcc atgccgaagt gcgacgagct gatggtggtg ctgctggcgg 12060 tgctcaaggc cggcggcgcc tacctgccgc tggacccgca gtatcccgcc aagcgactgg 12120 cgtacatggt gcaggacgcc cggcccacgc tgctggtccg gatggcgcag gtgtcgctgg 12180 aactcggggt gccggtcgct gaacttgtcg tggacgaccc cgacacggcg cgggagaccg 12240 agtcgcggcc agatcaccag ctgaccgacg ccagccgcaa cgctccgctg cgcccggaca 12300 acctgatgta cgtcatctac acctcgggct cgacgggtac gcccaagggc gtcgccgtga 12360 cccacaccgg cgtcgccgac atcgtggccg cccagaccgc ttccatcgcg ccccggccgg 12420 gcgaccgcgt gctccagtgg gcgtcggtca gcttcgacgc ggcgttctgg gactggtcgg 12480 cggcgttgct gtccggtgcc acgctgatca tggccccggc cgacgaactg ctcccgggcc 12540 aaccgctgcg cgacaccctg cgccggtacg cggtcaccca cgccgtgctg cccccggtcg 12600 cgctgagcgt caccgagccc gacgatgtgc tcgtcggcgg cacgctgatg tcgaccggcg 12660 atgcgtgcac ccgcgcgctg gtggccaagt gggcgccggg ccggcggatg tacaacggct 12720 acgggccgac cgagaccacg gtcgggtcga ccatcgccgg gcccatcgcc atctccgacg 12780 agatcaccat cggtacgccg tggtcgggca acagggtgta cgtcctcgac gagcgcctgc 12840 gcccggttcc gaacggccgc gacggcgagc tgtacctggc cggcaacggc ctagcccgcg 12900 gctacctgaa ccggccgggc ctgacggcga gccggttcgt gctcgacccc ttcggcccac 12960 ccggcggccg gatgtaccgc tccggcgacc ggggccaccg ccgcgcggac gggcagttgg 13020 tcttcgccag ccgcggcgac gaccaggtga agatccgtgg cttccgcgtc gagctcggcg 13080 aggtcgaggc gcggctggcg gcccaccctg cggtggatgt cgccgccgtg gtcgtggtcg 13140 gcgacctcgc gggcgcccgc ctggccgcct tcgtcagcac cgtggccggc accggggttt 13200 cggctgccga actgagcgca cactcggcgg agaccctgcc ggaacacatg gtgccgtcat 13260 cggtgcaggt gttacagcgg ctcccggtca ccgccaacgg caagatcgac cgggcggcgt 13320 tgcgggacct cgccgagtcg gcggcgcacc ccgacgcagc agcctcggcc ggtcctcccg 13380 gcgaggatcc gacctcggtg gagagccggc tatgtctgct ggtcagggag cttctggcgg 13440 tgccggacgt caggccgggc gacaacttct tcaaactggg cggccactcg gtgctggcga 13500 cccggctcgc cggacggctc cgcgacgagt ggggaatcac cgtgccgatc cgggcggtgt 13560 tcgaggcggc caccctgtcc gagctcgccc tggtcgtgca ggcgtcgaag gcatccatcc 13620 ccaacgggcg cccctgacgc cgacgaggaa ccgaaccagc gttccggcca cacaggaaag 13680 accccctcgg gcgatgccgg accggcaccg cccgaagggg gatccatcgg ctacctgggg 13740 ctacagtgcc tggggcagtc gccacgccgg ggcgggcccc accaaccggc ggtgttgtgg 13800 ttgtttccgt tgcgcgtcgc gaccgcgaag ccggcggacc ggcccgaggc gttgaccgcg 13860 atgacgtacg agcccaggtc gttgtcgccg aggcgggtcg tgcgtccccg gcgcggctcc 13920 cacatgaccg cgctgaacgg gtacgccgac gagccggtga agttgcggat gccgacgatc 13980 tggccggcgt cgttgacccg gtacgccacc cgaccgggaa gctccaccgg ctgggcgttc 14040 gcgctgggcc agtagatggc cgtggtggac tggccggttg cgttgatccg ccaaccgacg 14100 atcaacccgt tctcgttgcg gtcggtggcg tacgtgtcgg cggagccgcc ggtgggaagt 14160 tgctgcacgg cgagggtgcc gggctgccat accaccgccg tgtggtgcca ggactgctcg 14220 ccgacctggg tgaccagccc accggccact ccgccgcgct cgtccagcgt gtgcgcgagg 14280 gccaccggtc cggtgaccga cgtggtgggt ggcggcagcg tggtgtacgt gcggctggcc 14340 gggttccaca ggtacgagcc cacgggaaga ccgacccccg tggcgttggt gccgaccacg 14400 aggaccgtgc ccttgtcgtt gatgtcgacg gcctgggcac cgcccgcgcc gggcggcagc 14460 ggcaggacgt cgagcccggt gcgcgcttcc cagacgaaag gctgaagcag cggctggctg 14520 ccgtccggcg cgggcgtcgg cggcccgatg cccagcccga gcgtgccagc gacgacgccg 14580 aagcggttga tcgcctgcgc tcgcgagcta cccgcctgcg acggcgtgat ttcgatcagg 14640 cggccgccct tgtgccgcgg gttcgcgatg aaggcgtggg ccgtctgggt gcccgggagc 14700 gacgtcacgc cgaccacgtc gccgcggtcg ttgaggtcgg tggcctcact cggcgtaccg 14760 ggtccggcga gcgacccgag gtcgtggaac cggctgagcg cctcggcggg tgcgccaccc 14820 ggcccggacg acgtgctgcc ggtgcccctg agatgggggt tcgcgatgag cgcgtgggtg 14880 gtctgtgtgt cggcgagcgt ggcgacgccc agcacgtcgc cggacgcggc gaccggttcc 14940 acctgatgcg aggtcgccgt cagtgccagt atcgcgacga ccgtcagggt gcggactccc 15000 gtcaccaggt cacccgcacc ggtccgacgc caccgcgcgc caacaggttc aggtcgtagc 15060 gggcgacctg gcggccgagc gcggcgccga cctcgtcgga gtagcggaag tggacacccg 15120 ccaggacccg ggcgtcgatg ttctccttcg tcaacgtcga ccacggcgtg ccacgccggt 15180 agttgcgggt caccacccgg ccgtcacccc gggcgaaggt gatcgagaac gccatcgggg 15240 tgcagggtcc gaccagctgc gaaagcacct gttcggcggc cccagcggtg accgcgtggc 15300 cgctggggta ctcgggatgc ggcggcgtcg gcaggaacga gttccaggtg gggtcggggg 15360 cggtacgggg atcgccgtcg gtgtcggcgt cgcggatggc cgtgaccggc cgccagtgca 15420 ggagggcgta cttggcctcg aaggtggcga tgctggaatc gacgatagcc gcgccgagcg 15480 ccgccagtag ccgcaccttg ctcctgcggg accgggccga atcgccgacc agcaggcgaa 15540 gcaccggcac gtactgcgac agggggtcca gccacgccag gtcgctctgc gcctcggtgc 15600 gctcggaaac ctctccgccg agacggcgta cctcgtccag ggcccgccgg taaggggccg 15660 tgcccagggc cggcggtggt ggcgggcgga accgatcggc ccggccgagc aggaacgggc 15720 gggccagccc gtaaccggcc gccaccgtct gggtcgcccc gggcgtgagc cggtagaccc 15780 ccggtgcctc gggcggcagc gtgaagggca cgttcaccga cgccaggtcg aggccgtcac 15840 cggtacgcac cgcgaccatc gccgccgcgg cctcccgacc ggcggcgatg cccgccttct 15900 tggcctcgct cgcggccagc ccggccagcg agtcggccag caccccgtcg agcttgtccg 15960 cctggccggg gaccagtgcc ttcagcacac cgtgcaccgc cgttgcggtg gcggcatcct 16020 cgaacaccgc ccgctgcccg ggtgcgcgca ccggtgccgc ccgccgtgcg ctgagcgccg 16080 cccacgcggc aatccagctc atcgcccaca tccgctcggg cagcccggcc gtcggtgccg 16140 ccgcgaacgt cgccagcatc tcgtcgaacc aggggcccac gacgtccggg cgggaaccgt 16200 gccggggcga cgccgtggcg gcctcggcct tggtgggcag gatcaacagg cccgcggtgc 16260 cggctgcggt gctggccgcg gcgatcagca ggccgcgtcg ggagagcccc ggaaccaggg 16320 gggataggga cggttcggta gatcttgtcg tcatcgccat gcctttccat cggatacggg 16380 acgggggttc ggtgaggggt ccggttcggg accggtcggg ttcagccaca ggctggttca 16440 gagccggctg agcagcgccg cccggtcgac cttccccgtg ttggtcaggg gcagttcgtc 16500 gagggcgacg atgcgcgtgg ggaccatgta cgacggcagg atcctctgga gggcaccgac 16560 gacctcggcc gtgggaagcg gctcggccgt cggaacgtag aaggcggcca gcgtccgtcc 16620 gcccggcccc gagggagcca ccaccgaggc ggcccggacg cccgcgcact gtaggagggc 16680 gctctgcacc tcgcccagct cgattcggta gccgcgtacc ttcacctggt cgtcgaggcg 16740 ccccaggaac tccaggtcac cgcttggcag ccaacgggcg cggtcaccgg tgtggtacat 16800 gcgttcgccg gtgcggtggg cccacgggtc ggggaggaat ttggcggcgg tcaggccggg 16860 ggaccgggca tagcccaggg cgacgcattc accggcgatg tacagatcgc cctccgcgcc 16920 gttggggcag ggccccaggc cgtggtcgag tacgtagtag cgggcgttct gcatcggctt 16980 cccgtatgga atgctcggcc acccggggtc gacgtcgcct acccggtagt ggttcgacca 17040 gacggtgcac tccgtcgcgc cgcccagggc caccacctcg gcgttcggga aagcggcccg 17100 gatctggtcg ggcagcggca ccggaatcca gtcgccgctg aggaggacca ggcggagcgt 17160 gccacgcccg gccggctcgc ggacctggac gaagggcatg accatggcca gggcggcggg 17220 tgccgagtcc cagatggtga tctcctcctg ttcgaggagg tccaccaggg tgtccggttc 17280 ggccagttcc gccgctgacg ccagccgtac ggacccaccg gcggccagca cgccgaagat 17340 gtcgtagacc gagagatcga agcagaacga ggtgacaaag aggatctggt cggtcggccc 17400 gacccggtag ctgcggttca cccagtcgat gaggttcact gccgaccggt ggctgacgac 17460 gactcccttg ggtgcgcccg tcgagccgga agtgaagatg gtgtagcaga cgtcgtcggc 17520 cgtcgggccg gtggcgagcg gctcgctcgg gcgcagctcg atgtgatggc cggtccacag 17580 cggctcgcgt cccgacgccg ggcggtcgcc ggatggcgcc acgcggatca cggcgtcgta 17640 ccgctgggcc agctcgccgg tgaacgtctc gacctggcgg cggtggacgc tgccgccggt 17700 caccccgggc aggaactcgg gaagacgttc gatgaagtgc ggtgcgaccc ggatgccgga 17760 atagtcactg agatccgggt cgatcaggtc ggcgagcacg atgacgccgt cgtcggcgag 17820 cagtccgagc agcgacccga ggacgctgag caaatagtcg aggtccggca ggaactgcac 17880 ggtgctggcc agcaggatga cgtcgaacgg accctggacc cgctcggcta cctcgtgggc 17940 gaagcacact acgccgtcga cctcgccgcc ggcgcggaac ccgccctcct ggctgcgcgt 18000 cacggacacc ggtgaggggt cggcggcgac gtagcgcgac gcgcgcgggg ccagggcttc 18060 gacgatcaga ccggacccgg atccgatctc gaggatcgag ggtcgtgccg cggccgtcgc 18120 ggccagggcg aaggcagcca catggtcgcg gtactgctgc acatcgttct cgtcgaaggg 18180 acgctccgaa cggcgcatgt tgaagccggc ggcctcgagc tggtcggggg cgctcgacac 18240 gaagtcgaag aagttcacca cgaggtcggg ccggaaggtg gccgaccacg agaactcctc 18300 ggcgatgtcg gggcagagca cgtggcgcag cgagcgcacc tgccaccgaa gctcctgcat 18360 ggagcgcagg tgggtgcggt cggtcagcac cgcggccacg tcgagctggt cgagcagccc 18420 gaccacccgg cgggcgggcc acgacggatc gatcggtacg taggcggcac cgcacttgag 18480 cacggccagc agcccgacga gggccggtgc gtcacgctcg ccgaagagcg ccacggtgtc 18540 gccccgtccc acgccgagat cgcgtagcag ccgcgccagg cggttggcgc gccggtgcag 18600 ctcccggtgg gtcaggacct gcttgtcgga ggtcacgatc gccgggcggt ccgggtgccg 18660 ttcggcggcc tcagcgagca gatcggggat cgtgacgtcg gcgcggaagt gtcgtgcggt 18720 ctggttccat acgctccagg gcacgcccgg agacagggct ggcggggcgc tcatcgggcc 18780 agcgacccga acgcctcgtg ggccgccagc gcgtcggtca gctcgttgac tgtcggatgg 18840 tcgaagaaga gcttgagcga caagcgggtc ccggccagcg caccgagccc ggccatgatc 18900 tcggcgatca gcagggagtg cccgccgatg gcgaagaagt cgtcgtcgtt gtcgaaccgt 18960 tcgtgttgga gtgcggctgc ccacccggcc cgtacgtggg cacgcagcaa ccctcgcgcc 19020 gagccgtcgt tgccgtcgcg atccgggttc gccacctcgg ccgatccgat gtcgttcacc 19080 actcgcttcc ggtcctctcc cggtgccctg cctctgcaac tgcgggccgg tgccgcccgg 19140 tccccgaccg tgcccggccg gtgccagtct caccgcggtg gtccgccgtt gtctgcggat 19200 ctttcagagg tcagtcaggg ttggcgctga tgggcgtcgg cgcggcaatc ctcacgtgca 19260 tgggaacgag aacgaagaat cggtggttcg tagaggtctc gcgcagtcgg ctcaaggagt 19320 gtgccttgta cgccattccg cacgccggcg gcggggtggc cacagtgcgc agtctctgtg 19380 tcgaactcgg cgacgcgttc gacaccttcg gcgtgcgcct gccgggacgg gagtcccggc 19440 tcggtgaccc ggtggtgacg gtcatgtccc ggctcgccga cgaactcgcc ggcgaactgc 19500 tccgccatgc ccaggggcgg ccggtggtgc tgtacggcca ctgctccggc tcggcgatcg 19560 cctacgaggt agcgcgccgt atggaccccg cccagctgcg gggactcgcc gtctcctcgc 19620 atccggcgcc cggcagcgtt cggcgtgcgc ccacctggga actgccgcga caggagttcc 19680 tcaagcaggt cgtgaccgac gggtacctgc cgcccgagat catcgccaac gaggaactgc 19740 tcgacatcta cgagcccgcc gtacgcgccg attacgagct cgtcgagacc tacgagttgg 19800 acctgttcgg gggtgggccc gtcgaggctg tcgccgcgcc gacggtggcc atccacggtc 19860 gcgacgacca caccatcgac ccggtccaca tcgatgcctg gtcggccctc accaccgggc 19920 cgtttcgggt cgtgtcgctg gcggggggcc acaacctgct cctcggccga ccggcggagc 19980 tggccgcggc catctgccag ggcctggcct cagacaaccg actccatgat caccggtagc 20040 ggccggccca ccgcccgtca cgtggcacag gtgcctgccc tgctcggccg actggtcgag 20100 cagggcagcc caccggtgat cgagggccat cagggaagtt gctcacgccc actcccggcc 20160 catgatgtcc gagaccagcc cgtcgacatc gatggacaca tggaagtggc cgcccggtcg 20220 caccgtcagc cggaactcgc ctgtggtgac gtccgcccac tccgtcagcc tcgactcgtc 20280 caccagcggg tcgccgacgc cgtgataaca actcaccggg cacgacagcg gcgtggttcc 20340 ggagccgggc cggtagttgg cgtgcgcgcg caggtccgag cgcagcgtcg gcatgaacaa 20400 ctcgcgtagc tccgcgatct cggcgacccg ggggtcgatg ccgcccagag cgcagatggc 20460 cgcccagaac tcgtcatcgg gcttcaggtg aacgtcccga ttcttcatct ggccgggtgg 20520 gaggcaggcc gaggcgcaga gcctcctcgg ttccaccctc atgtcccgca gcaacatcgc 20580 ggtctcgtac gccaccatgg cgcccaggct gtgtccgaac agcacctggt cgcggcaggg 20640 cagctcaagc aactccacca cgatgtgccc ggccatctcg gccacgtcgt ccacgaggtg 20700 ctcggcgaat cggtcaccgc gtccggggta ctggacggcc acgagttcga cccctggtgg 20760 catcgcgttc gcccagtcgc tgaaggcggt cgccgagcct cctgagtgcg gaaaacacac 20820 caagcgcccg gtgggcttct cgaccgtggt cagcgtgcgt atccagccct tcttccgcat 20880 ccagctcatc gatccgtcct tccgattggt ttccgctttg cactggatgg tcgtcgttct 20940 gacgtcactc aggtcattcg tgaaagaaat tggtcagaca tagctggtgc aacggttgct 21000 ggccccaggg ttggttctgg ccgacatctt tcaggccgtt tgaggactca acaacccgtt 21060 catagtgtgg ggctcacgaa cgacggcggc ttccgccggc cgtggctggg gagctgcgta 21120 cgggaggacc caactgcgct ccgccgcgag tcagtgacga tcgagagtta cttattcggg 21180 agtctggatg ggttacggcg gtgtttcgtc ggcgcaggag gcaatgtggc tggaacagaa 21240 tcttgcacct gaggtgccga acagcaccac gaccatttgg gatgtgcggg gcgagctgca 21300 cctgcctgat ctcgaggacg cgttgcggac cgccctgggc gagacgagcg cactcctggt 21360 gaacttccgg cgggagagcg atgagctgcg gatcgtcccc cggaagctgg acgcgtggga 21420 gcccttccgc attgacgcga gcgacgccgc cgaccctgcg gccgcggccc gggaatttct 21480 caccgaacag attcgccgcc cgttcgacct cggtgcggat gcgctgttcc ggatcggaac 21540 ggtccggctg ggcgacgggc atcatctgct gtgcctgatc atgcatcaca tcctgaccga 21600 cgcgttcggc gtgttcaccc tgctctccca gcgcgtcgcg gagatctacc gcgccctgcg 21660 cgccgattcc cctgtgccgg accggccgga cacgcctgcc gagatcgccg gcgaacggga 21720 ggcgacgtac cggtcgtccg aaaggttcac ggacgcggcg cggttctggc gtgattacgt 21780 cacggccggc ggcacggctg cccgactgcc gaccgggatg cgggcgggcg cgacccgtac 21840 ggcgagcgtc gggttctggg acggtctgac cgcaccgctg ggcgtcgcca gctacaccgc 21900 cagcgtggcg gcgagcgagg tcgcccggtg gcgggcggct gccgattcga ccgaaacgag 21960 cgtcccggac ctgctcacct cggcggccac cgccttcctc caccgcctct gcaacacgcc 22020 cagaccgatg ctctccttca ccgtcaacta ccgcaggggg gacatcaaac aggcctgcgg 22080 cctgtactcg aacgccctgc cgctggtgat cgaggtgccg gcggcaggcg acttcgtcga 22140 cctggcgaag tcggtgcgtc tcgagcgtct gcgggtgctg cggtacgccg agtacaacgt 22200 ctccctgatc aagcgcgcgg ccggtcacgc gggcgacgta cgcagcccgt tcggccccgt 22260 cgtcaacgtc attcccttcc tccgggaact cgacctcgcc ggcgccgtcg gacggttcgc 22320 gggcggcacg ttcgggctac ccgacgaggt ccgtatctcc acctacgtgg acggcggccc 22380 ggacagcgac ctgtacatcc gcttcgacgc gcccggacgg ctgtacaccc acgaggacat 22440 cgccgggctg gccgagaggt tcgtgacctt cgtccgggcg gccctgaccg acccacgggc 22500 gcgggtccgt gacatcagcg ccatcgggga gcaggaaaga gtcgcgctcc tcgaccgctg 22560 tgccggcccg gtagtcgagc tggccggcgt gacggtgccc gtgctgctcg acatgcaggc 22620 gctggccaca ccggatgcgg ccgccgtcgt gcacgagaac gccgtactga cctaccggga 22680 gctggccgcg aggtccgacg ccctggcccg cagactcgcc gagtgcggcg cgggaccgga 22740 acgtctcgtg gcggtcgccg tgccccggtc gatcggcctg gcggtcgcgt tgtgcgcggt 22800 cctcaaggcc ggcgccgcct acctgcccat cgatccggac tctccggcgg agcgcgtgga 22860 gttcatgctc ggcgacgctc ggccgacgct gctgctcacg gtcgccggga ccgacggact 22920 ggccatcacg cccctgcacg gagcgcagcc acgctgggag gccagcgtta tcgagcggac 22980 gaccgcagcg tcaccggcgg ccacgtcgca ggctggcggc accggcgagc acgccgcgta 23040 cctgcggtac cggtcggggc cattcggtcc ggcggccggc gtcgtggtga cgcacgccgc 23100 cctcgtcaac gagctgctct ggatgcagca gcgataccgg ttgaacgaca ccgaccgggt 23160 gctgcacaag gccccggcat ccctcaatgc ctccgggtgg gagatcttct ggccgctgat 23220 cgccggtgcc accgtcgtca tggcgaccca ggacgtccac ggggacgcga ccgcgctcgc 23280 ggcgatgatc cggcggacgg gtgtcaccac cgtgcacgtc gtcccgtccg tgctcgccga 23340 gctggtgcgc gacgaagccg ttgtcaccgc cggcaagggt ctgcggcacg tcatgtgcag 23400 cggggaagtg ctcccggccg acctggcagc ccggttccac gagagctgcg acgtcccggt 23460 gcacagtctt tacgggcccg tcgaggcgat gccggtcgtc acgtcgtgcg actaccgacc 23520 cggctcgccc acggtaccgc tcggacgacc gatctcgaac gccggcgtct acgtgctgga 23580 cagccaactc cagctgacgc cgccgggagt ggtcggcgag gtgtacgtca ccggcgtggg 23640 tctggcccgc ggctacctgc accgcccggc cgcgaccgcg gaccacttcg tcgcgtgccc 23700 gttcggcccc gccggcaccc gcatgtaccg caccggtgac ctggcgcgct ggaccgacga 23760 cggggaactc gagcacgccg gcagcgccga ccagcgggtg cggatacgcg gcttctgggc 23820 cgcgttcctc gagatcgaag cagttctgac cgcccacccg ggagtggacc aggccgccgt 23880 gatcgcccgg cccgacggcc ccgaccgcgc cgcccagctg atcgcctacg tggtacccgc 23940 gaccggcggg cggatgggtg cggccggcct ggacgtggac ttcagcgccg ggctggacgt 24000 ggtcgagctg cggcggttcg tcgctgcccg gctgcccgaa cacctcgtac ccgccaccat 24060 cgtcgtactg gaccggctgc cgctcacggc cgaagggaag cgggaccacg ccgcgctgcc 24120 cgaaccccag gccacccgac gggcccaccg ggtggcccgg accgccgagg aacgcctcct 24180 cgcggacgcc ttcgccgagg tgctgggcgc cggccgcatc ggtctggacg acgacttctt 24240 cgccctgggc ggcgacagca tctcggcgat gcgggtggtg gccctcgccc gtgccggcgg 24300 cctcgcgctc accgcgcgta ccgtcttcga atgccgcacc gtcgccgccc tggcggccgt 24360 ggcggcgccg gccgacgaac cagcggtcgc cgctgcggcc gagggcgacg gcggacgcga 24420 cgacgccggc ccgatcccac ttccgccgat ggcgcggctc ttcgccgaac gtggaccggg 24480 cctggaccgg ctggcccagt ggctggtgct gacgctgccg gcggagatga gccccgacct 24540 gctcaccgga gcggtccgag cggtcctgga ccggcacgat gtgctgcgct cccggctggc 24600 cgacggtcag ctgctgatcc agccgccggg atcggtggac gtcgacaagc tcatccggca 24660 ggtgccctgt tccggtgact ggagcgggcc ctcgtggccg gcgttactgg cggacgaggc 24720 cgcgaaggcg gtcggtcagc tcagcgcctc ggccgggcag gtgatccgca tggtctggtt 24780 cgcgccgccg ggcggtgcac ccggaagact gctcatcgcc gcccaccacc tggtcgtgga 24840 cggaatgtcg tggcgggtgc tcgtcccgga cctcgccgag gccgcggcac agatccgatc 24900 cgggcgtacg ccggcactgg ccccggtggg cacctcgctc cggtcctggc tggacgaact 24960 cgcggccgaa gcggtacggc ccgagcgcgt ggccgagctg gaactctggc gcggcatcct 25020 cgcaccctcc ggcgatccgc tgggtgcccg acccctcgat ccggcggtcg acctgaccag 25080 gacggcccag acgctgcggg tcgaggttcc cgccgaactc agcagggccc tgctcacctc 25140 ggtgccggcc accttccggt gcggtgtcga cgatgtgctg ctcaccgccc ttgcgctcgc 25200 gttggccagc cgtcggcaca acagcgccgg agtcgtccgg ctggaagggc acggacgtca 25260 ggaggaactc gttcccggca ccgacctgac ccgtacggtg ggctggttca ccacggtcca 25320 cccggtccgg ttcgacctgt ccggcctcga cctcaccgac gcgatcaacg gtggcccggc 25380 cgccgcggag gcactccggc gggtaaagga gagccggcgc gtcctgcccg atcggggcat 25440 cggctactcg ctgctgcggt acctcaacca ggcgaccggc gccatgctcc gcgacctccc 25500 cgccgacgag gtcggcttca actacctcgg tcggttctcc ttcgaccgtt cccggacggg 25560 ccgcgagatg gcgtggacgt ccgcgccgga atccgccgca ctcgtggcgg caccggatcc 25620 ggacatgccg ctgatctccg cactcgaact gaactccctg gtcgtcgaca ccgaccacgg 25680 cgaacagcta caggcgctgt tcaccttcgc caccggggtg ctcgccaccg acgaggtccg 25740 gcacctcgcc gacgactggc aggccgcgct gcgtggcatc cgagcacagg cggccacggg 25800 cgcgagcggc ctgaccccat ccgacgtgcc gttggtgcgg gtgcggcagc aggacctgga 25860 cgactggcag agccgtttcg ggcgggtcga cgacgtgtgg ccgctgactc cgctccagca 25920 cgggctgctc taccacagcc tgctgggcga cagcgccgcc gcgtcgtacc agacccagtt 25980 cgtcctccgg atcaacggac cggtggatcc ggcgcgtctt cgtggcgcgg cacagaccct 26040 gctgaaccgg caccccaacc tgcgggtggc cttcctgacc aagtccaccg gcgagccggt 26100 gcaggtggtc gtggacggcg tcgaggtgcc cttcgcgcac gtcgacctcg ccggtcaacc 26160 gcaggccgag gagcgactgg cccggatcct ggccgaggaa cgggaggccc agttccgcca 26220 cgacagcgca ccgctgctgc ggttcagcct catcaccctc accccgaccc aggccgaact 26280 cgcgctgacc gcacatcacg tgctgttcga cggctggtcg ctgccgctca tcgaacaaca 26340 gctgatgcac ctgtacgccg gcggggccga cgcgctggaa ctggtcgagc acggctatcg 26400 cgagttcctg cgctggcact cgcggcagaa cgcggacgag gcgctcgcgg cctggaccga 26460 ggaactggcc gacgcgacgc agcccacgct cctggcatcg gggttcgccc ccgccgagca 26520 ggctgggacg agcaccgaga tcggccaggt cgacgtcctg ctcacccgcc aggaggcggc 26580 atccgcagtg cgtcgggccg cggattgcgg catcacaccg aacgtcctcg tgcagggcgc 26640 ctgggcggtc gtgctcgccc agctcaccgg aaacgccgac gtcctcttcg gcagctccgt 26700 caccgtacgc ccgcccgaac tgccgggcgc gcacacggtc gtcgggatgt tcaccaacac 26760 cgtgccggtg cgggtacggt gcgcgcccgc cgacagcctc gaaggcatgc tccaggccgt 26820 acaggatgcc caggcgagga cgttggatca ctaccacgtc gggctcggcg acatccagcg 26880 ggcgaccgga ctcactaccc tcttcgacac catcgtcatc ttcgagtcgt tcccggtgga 26940 ccgggcggcg ttgtcgaagg ccagcgcgtc ggcggaactg accgtcaccg gcatccggcc 27000 gttcgcgccg acgcactacc cgctgaccgt gctcgcggcg gcggatccgc tgttgagcct 27060 gaccctccag taccaccccg acgcgcttgc accgagcacc gtgcaggcga tcgcggaccg 27120 tttcgcccgg gtgttgcggc agttcgcggc cgacccgcgg acccgcatcg ccgccatcga 27180 cgtgctctcc gaggccgagc ggcagctggt ggtgcacgac tggaacgcca ccgcgctgga 27240 ggtgccgccc gagttcgtgc ccgagcagtt cgcccggcag gcggcagcga caccggacgc 27300 ggtggccgtc gtggtggggg agcagcacct cacctacgcc gagttgagcg agcgggccaa 27360 ccggatggcg cactggctga tcgcgcaggg aatcggcgcc gagagccggg tcgtggtcct 27420 gctgccccgc tcggcggacc tggtggccgc gctgctggcg gtctggcagg ccggcggatg 27480 ctacgtaccc gtggatcccg actatcccgc cgcgcgggtg cggtccgtga tcgacgactg 27540 tgcggccacg ctggtgctgg acgagaacct gctggaccgg accgacctgt cgcgctaccc 27600 ggcacacgcc cccgcgatcg ccgtcgcgcc cggccaggcg gcctacacca tctacacctc 27660 cggctcgacc ggcaagccga agggcgtggt catcggccac gacgccctga ccaactttct 27720 ggccagcatg cagcgaacgc tgcgcctgtc ggcgcaggac cgcttcgccg ccgtcaccac 27780 gatcgccttc gatatcgcgg cgctcgagtt gtttctgccg ctcacgaccg gggcgcgcgt 27840 ggtgctcgcc aaccgggagc acgtcgcgaa tccaccggcc atgctggacc tcgtcgagca 27900 gaccggcgtc accgtcatgc aggcgacccc cgcgctgtgg cagatgctcg cgacgcacga 27960 cgtgcgtcgc ctgtccggcg tacgcgtcct gaccggcggc gaggcactgc cccggccgct 28020 cgccgagggc ctctgcgcgc acgccgcaca ggtgatcaac ttgtacgggc cgaccgagac 28080 gaccgtctgg tcgacccttg cggacgtcgc gacctgcaag ccgccgtcga tcggtacgcc 28140 catcgccaac acccaggtcc tgatcctgga ctcggcactg cggcccgtcc cacccggggt 28200 cggtggagac ctgtggatcg caggggacgg cctggcccgc ggctatcacc ggcaaccggg 28260 gctgaccgcc agccggttcg tggccaaccc gttcggccct cagggtgccc ggatgtaccg 28320 caccggcgac ctggctcgct ggtcggagag cggaaggatc gagttcctcg gccgggccga 28380 cttccagatc aaactccggg gattccggat cgagccgggc gacgtcgaac acgccctgac 28440 ccggcatccc gcggtccgcg aggccgtcgt gacgatccgg gaggaccagc ccgacgacaa 28500 gcggctcgtc gggtacgtgg tcgtcgccga ggatgccgag accccgccga cccgggagtt 28560 gcagcagttc gtgcgggagc agctgcccga ctacatggtc ccgtcggcgg tggtcaccct 28620 gcccgccatt ccgttgacgg cgaacggaaa gctggaccgt tcgcgactgc cccgacccga 28680 ggcgagcagc acgaagtacc gggcgccgga atccgcccgg gaggtcgccc tctgcgggat 28740 cttcgccgaa gtcctcggcg cggagcgggt cggcgtcgac gacgacttct tcgcgctcgg 28800 cgggcactcg ctgctcgcca cccggcttgc cgctcggctg cggtccgacc tgggggtcga 28860 ggtcccgatc cgcaccatct tcgccgcacc gaccgtcgcc gaactcgccc ggcggtggag 28920 cggtctgtcg acctccgtcc ggaagcctct gcgcaggatg accgaaaggt aacagagaat 28980 ggcgcccgtc tcgtatgcgc aacaacgaat gtggttcatc aatcggttcg agggccagac 29040 cgcgacctac aacatcccga tcctgatccg gatgcgcgga cagatcgacc gagacgagct 29100 gcgggctgcg ttcatggacg tcctgtcccg gcacgagatt ctgcgtaccg tctacgacga 29160 gctcgacggg cagccgctgc aacggatcat cgagccggcc gagctgagcc tgccctggac 29220 cgactgggga tgggtgtccc cacagcaggt ggacagcatc gtcgccgcgt cggtccgcga 29280 gggcttcgac ctgtcggtgg acctgccgat ccgggcgtac ctgctgcgtc ccgagccgga 29340 cgtggccctg ctcgcggtgg tgatccacca catcgccggc gacggcggct cgctcggccc 29400 cttcacccgg gacctctcgg ccgcctaccg cgcccggctg gccggggtgg cgcccacctg 29460 ggacgagctg ccggtgcagt actccgacta cgcgctctgg cagcgtgagc tgctgggcga 29520 cgagtccgac ccggacagcg tcttctcgac ccagctgcgc tactggcggc aggaactgga 29580 cggcgtctcc cggccggtcg cgctgcccgt cgaccggccg cgtcccgccc gggccagcta 29640 tcgcggcgac aaccacggat tcgagattcc cgcggcgctg ttcgagaagg tcgagcgcct 29700 cgcccagtcg tacaacgtga cggtgcccat ggtctttcag accgcgctgg tggtcctgct 29760 gcaccgcctc ggcggcgacc gcgacatcac gctcggctcg ccgatcgcgg gccgcaccga 29820 ccaggccctc gagaacctcg tgggcttctt cgtcaacacc tgggtgctgc gggtgggggt 29880 gtgcaccggc gactcgttcg cgcaggtcct ggaacaggtc cggcagaagg ccatcgccgc 29940 gtacgaccac caggacctgc cgttcgagcg gctggtggag ctgctgcgac ccgggcgctc 30000 agtcgcgcat caccccctgt tccaggtcac cctcgcctgg cagaacagcg tccgccagga 30060 actcgacctg cccggcgtca cggcctcgat ggagccggtc gccaccggca cggcaaagtt 30120 cgacctgttc gtcaacctga tgccgaacca ttcgcgcagg tcggtgaccg tcgacctgga 30180 atacgccacc gacctgttcg accccgccac cgtcgaggcg atcgcggcac ggtacctgcg 30240 cgtgctggag caggtggtgg agagcccgga cctcggcgtc ggcatcctcg acgtacccgc 30300 gatgccggcg acgcgcggcg agcggacggt cgacgccggc gaacgcgaga agatcctcta 30360 ccgctggaac gacaccgacc gcagctttcc ctgcccggga ccgatccacc tgccgttcga 30420 gcagcaggcc gccgcgcgtc ccgacgcgat cgccgtgcgc tggtcgggcg gcaccatgac 30480 ctaccgcgag ctcaaccggc aggccaaccg gatcgcctgg accctcaagc gccgcggcgt 30540 gcggccggag accgtggtgg gcgtggccgt gcggcgcggc ccgctcatgg tcgccgccgt 30600 cctcggggtg ctcaaggccg gcggagcgta cctgcccatc ggctccacac tgccctccga 30660 ccgggtcgcc ggcatgctgg ccgacgcgtc cgcgacgctg gtgctgacca ccgaggacac 30720 caacaggtgg acgccaccgg atggcgtgga actcctcgac gtcggccggg ccggcctggc 30780 cctgtcgctc gacggcgaga tcaaccccga gccggtggcg agtgccgaca acacggccta 30840 catcatcttc acctcgggaa gcaccggaaa gcccaagggt gtcactgtgg cccaccggcc 30900 ggtgcacaac ctgctgaact ggtgctaccg gaccttcgac ttcggccccg acgatgtgag 30960 tctctgcgtc acctcgctgg acttcgacct ctccgtgttc gacatcttcg gcctgctcgg 31020 ggcaggcggc gggttctaca tcgcggacgc cacccagcag cgcgatccgg agatgctgct 31080 cgacgtcctg ctgtcggagc cgatcacctt ctggaactcg gtgccgggca cgctgaacca 31140 actggccccg ctgctgccgc agaccgccgg cagcccaggg gtgcaggatc tgcgcctggt 31200 ctttttctcc ggcgactaca ccccgctgtc cctgccggac caggtccgcg cggtcttccc 31260 gcacgccgag atcatcagcc tcggcggcgc gaccgaggcg acggtctggt cgaacttctt 31320 cccggtcggc gcgatcgacc cgcagtggcg cagcattccc tacgggcggc ccatcgacaa 31380 cgcgcgctac tacgtcctcg acgagaagct ggagccgtgc gcggtcggtg tggagggcga 31440 cctctacatc ggcgggccgg tgatcgctct cgggtacgtg aaccgtcccg acctgacggc 31500 cgagcggttc atcgccgacc cgttcggcgg ggttcccggt cagcgcatct accgtacggg 31560 cgaccgcgcc agcttcttcc cggacggcaa catctgtttc cttggtcgcg ccgacggcca 31620 ggtgaaggtg cgggggttcc gcatcgaact gggcgagatc gagtacgccc tcggccgcca 31680 cccggcggtg cgccagggta tcgcgatcac ccgccgggac tccgtcggtg acctgcggct 31740 ggtcagctac gtcctgcccg atttggacac ggtggagagc gtggtcgccg ccgacgaaca 31800 ggtccgcgaa tggcaggaga tctacgacca gggctacctg gaggtcaccg accaggattt 31860 cggcgacgac ttcaacctct gggtgtcgag ctacaccggc gagcccatcc cggtcggcca 31920 gatgcgggag tggcaggacg ccgccgtcga ccggatcctc agcttcacgc cgcggcgcgt 31980 actggaggtg ggtgccggaa ccgggctgct gctcgcgcgg gttgcgggca gcgtggaggc 32040 gtactgggcg accgacttct cggagccggt catcgagcgg ctgggccggc aggtgaccga 32100 ggcgggctgg gccgagcggg tacggctgct gtgccgacgc gcggacgacc tggacgggat 32160 cccacggatc ttcgacaccg tagtgctcaa ctcggtcgtg cagtacttcc cgaacgagcg 32220 ctacctggag caggtgctcg acggcgtctg ggcgatgctg gagccaggtg gccggctcgt 32280 gctcggcgac atccgccggg cccgctcgct gcgcgccttc caggtggccg tgcagcaggc 32340 caagcacggc aacctcccgc cggcgcaact gcgcagcgcg gtcgaacagg gcctgctcct 32400 ggagaaggaa ctggtcatcg acccggagtg gttccagcgc tgggccgagc gcgcgggcgc 32460 ggccggcgtc gacgtgcgcc tgaaggaggg cgcgttccag aacgagttga cccgccaccg 32520 ctacgagatc gtggtgcaca agccgggcac aacggaggcg ggccggccct acgcggtgga 32580 taccgtcccg cgcctggagt ggaacggcga cctggacggc ctggccgagc gcatccgcac 32640 gctgggcggg ccggtggtgc gcatcgccgg catccccaac gcgcgcgtcg cgcaggaggt 32700 ggcggcggcg cgcgacctgg ggctggagga gtccgagccg ccgacgtcgg tgccggtgga 32760 cccgcacgag atggcgacct gggccgcccg gcagggctgg tcgatcgcgc tgacctggtc 32820 cggaagcgcc gtcgaccagt ttgaagcagt cctgttcacc gacgctacga ccgagcaccg 32880 ggcactgtcg ggcacctacc tcccggtggc cgccgccggc acctggatca acgacccggc 32940 cgccgcggcg ggcatcaccg cactcccggc ggtcctgcgg gagtacctgt cgaagacgct 33000 gcccgagtac atggtgccat cggcgatcgt gccgatcggc cgggtgccgc tgacgccgaa 33060 cggcaagctg gaccgggcgg cgctgccggt gccggagtac gccgccgcca gtcgcggccg 33120 gccgccgtgt acctccgagg aggagtcgct ctgcgagatc ttcgccggcg ttctcgggct 33180 cgaccgcgtc ggcgtggacg acaacttctt cacgatcggc ggccactcgc ttctggcgac 33240 ccgggtggtg agccggatcc gcgccgcgca cggtgtcgag atcccgatcc ggacgatctt 33300 cgaggcgccg accgtcgccg aactggtggc ccatttgacc ggccagcgga cggtccggcc 33360 gccgctgcgg ccgcagccgc ggccggaccg gctcccggtt tccttcgccc agcaacggct 33420 gtggttcatc caccgcttcg aagggccatc gccgacctac atcattccgc tctccatgcg 33480 tctgcgcgga aaactggacg tgcccgcgtt gcggcaggcg gtgcacgatg tcgtggtccg 33540 gcacgagtcg ctgcgcaccg tcttcgacga ggtggacggg gcaccctacc agcgggtact 33600 cgacccggac gggttggcga tcccgtggca ggagcacgag gtcaccgagt ccgcccttca 33660 ggaggcgctg cgcctggagg cacgtcggcc cttcgacctg gccgcggaga ttccggtacg 33720 cgccgcgctg ttccgcgtcg gcgagcacga cgcggtgctg ctgcttccgc tgcaccacat 33780 cgcggccgac ggctggtcgc tggggccgct ggccgaggat ctgaccgccg cgtacaccgc 33840 caggtgcgac gggcagcgac cgcaatgggc cgcactgccg gtccagtacg ccgactacac 33900 gctgtggcag cgtgaccttc tcggcggcga tgacccacac agtctgtacc ggcggcagtt 33960 ggactactgg acggggcaac tcgccggact gccggaatcg ctgcaactgc cgacggaccg 34020 ggcccgaccc gccgtcgcgt cgttcgccgg cgaggtgctg cccgtagaac tcgacgaatc 34080 gctgaccgag gacctccgca agttggccct gcgtaccggt accaccgtgt cgatggtgct 34140 ccaggcgggt ctcgcggggc tgctcagcaa gctcggcgcc ggtaacgaca taccgatcgg 34200 gtcgccgatc gccgggcgga cggacgaggc gctcaaccga ttggtgggct tcttcgtcaa 34260 cacctgggtg gcgcgcgtcg acaccagcgg aagccccagc ctgatcgagc tggtggaccg 34320 ggtacgggag gtgagcctcg ccgcctacga ccaccaggac atcccgttcg agcacctggt 34380 cgaggcgctg aatccggtgc gctcgaccgc gcatcatccg ctgttccagg tgtgcctggc 34440 ccttcagaac aacgtgcagc cggccttcga cctgcccgga ctgaaggtgt cccacgagcc 34500 ggtcgacatg ggcgtctccc gtttcgacct gttcttgaat ctgatggagg agaccaccgg 34560 cgaggggacg agccggatcg ccggagtcgt cgagtacgcc acggaactgt tcgaccggga 34620 cacggtcacc gggctgctgg agcgctggcg gcgcctgctg cggcagtggg tcggcgctcc 34680 ggacgccccg atcgacgcgg tggagatcct caaccgggac gacctggccg cccttgagcg 34740 ctggaccggt cgcgctcgcg gcaccgatcg tgtcgtcggg acgattcccg agcgtttcgc 34800 cgccgtggtg gccgagcagc cggaggctgt cgccctggtg gccgccgacg gcgaggagag 34860 ctggacgtac ggcgaactcg accggtgggc caaccgcatc gcccaccatc tccacgcgcg 34920 cggcgtcggt cggcagcacc gggtggcgtt ggtcatggag cggtccccgt tgctggtcgc 34980 ggcggtgctg ggcacgctca aggcgggcgc ctgttatgtg ccggtggaac ccacctggcc 35040 gcgggcccgg atcgacctcg tgctcgccga cctcgatccg gccctcgtga tcgacgagcg 35100 gctggccgag gaggacctga ccggctaccc gacgcgcccg ctggacaccg ccgacgtcgg 35160 cggggagcac ctcgcctacc tgatgtacac ctccggctcc acggggacgc cgaaaggtgt 35220 cgaggtgagc catcgcaacg tgctcagtct cgcgctcgac ccgtgctggg ccgatgctga 35280 ccaccagcga gtgctggtgc atgccccgcc gaccttcgac gcatcgacgt acgagatgtg 35340 ggtgccgctg ctgcacggcg gagcggccgt ggtcgcgccg ccgggaaagc tggacgcggc 35400 ccgactggcg acgctcatcg ccgagcgggg cgtaacggcg ctgtggctgc cggcgggcct 35460 gttcgatcta atcacgcagc atcacccgaa gagcttcgtc caggtacgcg aggtgtgggc 35520 cggcggcgac gtactgtccc cggcggccgt gcgacggctg gtacgcgacg acggcacgct 35580 caccgtcgtg aacgggtacg gtcccaccga gaccaccacc ttcgcggccc ggtaccggat 35640 gtccgcaccg gcgcggtgca aggacccctt gccgatcggc gagccgatgg cgggcagccg 35700 cctctacgcc ctcgacgacc ggctccggca ggtgccgcag ggcgtcatcg gcgaactcta 35760 cgtcggtggc gacggggtgg ctcgcgggta cgcgaaccat cccccgctga ccagcgaacg 35820 attcgtcgcc gatcccttcg gacgcccggg cgagcggatg taccgcaccg gtgacctggt 35880 ccggtggaac cacgacgggc aactcgagtt cctgggccgc gtcgacgagc aggtcaagat 35940 ccgcggtttc cgggttgagc cgggagagat ccgagcggcc ctccggaaac gggacggcgt 36000 ggcacaggcg gtggtggtcc cccgtacgga ccgactcggc gagcggcgcc tggtggccta 36060 cgtggttccg gaggtgccgg cgggcgcgga cgaagactcg accgaacatg tcgagaagtg 36120 gcgcgccatc tacgactcga tgtacgacga gaccgaggcc gacgctaccg agatcggcaa 36180 cgacttcacc gggtggaaga gttcctacac gcgcgacaac atcccgctgt ccgagatgcg 36240 ccggtggcgc gactccgtcg tcgaggaggt ccgcggtctg cgggcgcgcc ggatcctgga 36300 gatcggggtc ggttcgggcc tcctgctcgg gccgttggcg ccggaagcgg aggcgtactg 36360 gggcaccgac ttctcgttgc cggtcatcga gcgcctcgag gtgcaggtcg gcaccgatcc 36420 gtgcctgaag gagaaggtgt cgctgcggtg ccagcacgcc gacgtcgccg acggactgcc 36480 ggtgaagtac ttcgacaccg tcatcctgaa ctccgtcgtg cagtactttc cggacgccgc 36540 ctatctctcc cgggtactgg acgtcgccct ggaccggctc gcgccgggtg gccggatcct 36600 cgtcggtgac gtccggaact acggcaccct gcgggagttc ctgacggccg tccatcacgc 36660 gcaacacccg caggacagcg cgtcggccgt ccgggcggcg gtcgagcgtg ccgtcctggc 36720 cgagaaggaa cttgtcatcg atccggattt cttcaccgag tgggcacgga cccggcccga 36780 cgtcgtggcc gtcgacatcc ggctgaagcc gggcgcggac cagaacgaac tcacccggca 36840 ccgttacgag gtcatcctgc acaagcagcc gagccaacca ctgcgcctcg cggacgtgcg 36900 gacggcgaac tggggctcgg aggtgcccga cctgtccggg ctggagaccg cactggcccg 36960 gcacggcggt cgcctccggt tggcccggat cccgaacgcc aggctggtga gcgaggcggt 37020 ccagtgcggc gtgcccacca acgtaggcgg cacgcccctg gacccgcacg agttggcgag 37080 ctggggaggg cagcggggtt actcggtcca ctgcacgtgg tcggcggagg cgcccggctg 37140 gttcgaggcg gtgatcatcc cggtcgacag cgggcactgc cgcgacggtg tgtaccggcc 37200 ggtggggccc cggccacggc agttggtcaa cctgcccgcc gcggcgcgcc gggtgtctcg 37260 gctgccctcg tggctgcgcg aggaactggc ggcggagctg ccggagcacc tggtgccggg 37320 cgacatcgtg gtcatggaac gactgccgtt gaccaccaac gggaagatcg accacagcag 37380 acttccggag gtggagcagg ccgaccggga gtacggctcg ccgcgcacac ccctggaggc 37440 ggaactggcc ggtctcttcg ccgaggtcct cggcgtggac cgggtgggca tcgaggacga 37500 cttcttcgac tgcggcggta gttctctcca ggtcatccgg ctcatctggc ggatccgcgc 37560 ggagctgggc ttcgacattc cggtcagaac catcttccag catccgaccg tggccgaggt 37620 cgcggaacat ctggcggccg gcagggagga cgtcgagttc gacgacccct tctcggtggt 37680 gctaccgatc cggaccgacg gggaccgggc accgatctgg ttggtgccgc cgggtggcgg 37740 actctcctgg gcctatctcg gcttcgccca gcacctggac cgctcgcgcc ccatctacgg 37800 cctccaggcc cgtggatttg tcggagaccc gcgggcgacc tcgatcgaga gcatggtgga 37860 cgactacgtc gaccagatcc tgcgggtcca gccggaaggt ccctacaacg tgctgggttg 37920 gtcgctgggc ggcccgatcg cccaggcggt ggccgccgaa ctccagcgcc gggagtgcga 37980 ggtggatctg ctggccgtcc tcgactcggg tccggcgagc tacttcgccg acttccagac 38040 tcccgacgag aagttggtgc gcaggtacct ggcgcactac atgggccatc tcgcgggaat 38100 ggcggagttc gagtcgctcg tgcagacatc caccaccctg ttcatcgagc acacggacct 38160 gatgacgcaa ttcacgtcgc cgccgttccg tggcgatctg atcttctttg ccgccctcat 38220 cgaccagggc acccgggaac gacggcaact cgaggtggaa ctggacgtcc aatggcggga 38280 atacaccgag gggaccgtgc ggcgcttcga catcgaatgc gcccacaacg aaatgatgtg 38340 gcccgagaac gcggccatga tcagccgtat cgtcaacgag atcatcgatt cggcccgata 38400 accgcttccg ccctgacctg gagcggacgt gacaactacg gaggaaagat gagcgtcaac 38460 ccgttcgatg acgaggacgg cgagttctac gtgctggtca acgacgagga gcagcactcg 38520 ctgtggccca ccttcggtga cgtgcccgac ggctggcgaa tcgtgttcgg gccggccggc 38580 cgagcggaga gcgtggcata cgtggaggag aactggaccg acatgcggcc caagagcctg 38640 cgtgaggcga tgtcggcagc atgacgtacg tcgtgggctc gcaggcagac gcgtccgcct 38700 gcgggcccac gattttgaac ttccgcgacg ccggtggcgg aaggtgcgta cagaagtctt 38760 cacaggatgt ctaggtatag aactgggatg tggcaagccg gagatcgccg ggggagtgat 38820 cagcccgggt caccccgccg gctccgcgtc gcgcgccaga cactttggag gccccatgac 38880 tgttgcgtcg cccaggcaga gccgagaaga cctatcgctc gtcccggaca cccatgacgt 38940 catccgcgtg gtcggggcac gggagaacaa cctcaaggac atccgactgg agatcccgaa 39000 gcgccggctg accgtgttca ccggtgtctc cggctcgggg aagagttccc tggtgttcga 39060 cacgatcgcc gcggagtcac agcggctgat caacgagacc tacagcgcat tcgtgcaagg 39120 gttcatgccc acgctgtcgc gccccgacgt cgacgtgctc gatggcctca ccacggcgat 39180 catcgtcagc caggagcgga tcggcaacaa tccgcgttcc accgtgggca ccgtgacgga 39240 cgccaacgcg atgctgcgca tcctgttcag ccggctcggc gagccacgac tgggctcccc 39300 gcggtcgtac tcgttcaaca ttccctcgat cagcgtcgcg aacgcggtca ccgtcggcca 39360 agggagccgg gcggtcgagg agcaacgcgg cttcgacgtc gccggcggca tgtgcccacg 39420 ctgcgaaggt acggggtcgg tcaacgacgt cgacctcacc cagctctacg acgccacgaa 39480 gtcgctcgac gagggtgcca ttcgggtgcc cggttaccag gtcggcggct acaaccaccg 39540 gctctacgcc ggttccgggc tgctcgaccc cggcaagccc gtcgagaagt acaccgagaa 39600 ggagctcaac gacttcctcc accgggaacc gacccggctg aagatcggcg actaccacac 39660 gaactacgaa gggctggtcg caagggtcca gaagtcgctg ctcaccaagg acatcgaggc 39720 gcttcagccg cacgtacgcg ctttcgtgga gcgtgcggtc acgttcacgg cgtgcccaga 39780 ctgcggcggt acccggctca acgagcaggc ccgggcatcc aggatcaagg gcatcaacat 39840 cgccgacgcc tccgcgatgc agatcaacga cctcgccgaa tgggtccgcg acctggccga 39900 gccatccgtc gcaccgctgc tggccacgct cctgcacacg ctcgactcgt tcgtgggtat 39960 cgggctgggc tacctctccc tcgaccgggc ctccggcaca ctctccggcg gcgaggcaca 40020 gcgggtcaag atgatccgcc acctcgggtc accgctcacc gacgtcacct acgtcttcga 40080 cgagccgacg atcgggcttc acccccacga catccaacgg atgaacaaac tcctgctgcg 40140 gctccgcgac aagggcaaca cggtgctcgt cgtggagcac aagccggaga ccatcgccat 40200 cgccgaccgc gtcgtcgatc tcggtcccgg cgccggcacc gcaggcggca ccatctgctt 40260 cgagggcacc gtcgcggaac tgcgttccgc cgacacgctg accggccgcc atcttgacga 40320 caaggcgtcg ctgaaggaca gggtgcgtac cccgtcgggc tcgctcgagg tccggggcgc 40380 gagcaaacac aacctgcgag acgtcgacgt cgacatcccg ctcggcgtgc tcgtcgtcgt 40440 gaccggcgtg gcaggctccg gcaagagctc actgatcgaa gggtcggtat cgggacgcga 40500 cggcgtggtc acgatcgacc aggggtcgat caagggctcc cgtcgaagca accccgccac 40560 ctacaccggc ctcctcgatc ccatccgcaa ggcgttcgcc aaagccaacg gcgtgaagcc 40620 ggcgctgttc agctcgaatt ccgagggggc ctgtgccacg tgcaagggtg caggcgtcat 40680 ctacaccgac ctggcgatca tggcgggcgc ggcgaccacc tgtgacgact gcgagggcag 40740 gcggttccag gacttcgtgc tccagtaccg tctcggcggt cgcgacatca gcgaggtgct 40800 ggccatgtcc gtggccgagg ccgggcgttt cttcgctgcg ggtcaggcac gtacgcccgc 40860 cgccgtcgtc atcctcgaac ggctcgccga cgtggggctt ggctaccttt ccctcggcca 40920 gccactcccc acactctccg gaggcgagcg gcagcggctc aagctcgccg cgcacctggc 40980 tgacgaaggt ggcatcgtcg tgctcgacga gccgaccacc ggcctgcacc tcgccgacgt 41040 ggagcagtta ctcggtctgc tcgaccggct cgttgacgct ggccggtcgg tcatggtcat 41100 cgagcatcac caggcggtca tggcccacgc cgactggatc atcgacctcg gtccggccgc 41160 cggccacgac ggcggtcgtg tcgtcttcga aggctgcccg gccgacctcg tagccagccg 41220 cgccaccctc accggcgaac acctcgcggc gtacgtaggg gtctgacggc ccgcctgaca 41280 cggtttccgg ccgcctgccg tggcggccgg tcaccgctcg tacaagcacc cgctctgtcg 41340 gcctcggccc acgcgtgcga tggcatccca tggcggtacc cgaccgccgc ctcaggctcc 41400 atcctgccct gaccaggccg ttctccagca cgcggcgatc ggttcgggcc gatccgggta 41460 gcccggcaca ggtgtttctg ctgtccccgt acctgaccga acccagctct tcgtggccct 41520 ggcgaagttc tttcatcctt gtggcatgcg tgttgcgtga ccccatggtc gcgttgagta 41580 ttgggaatcg taattggata tctcgcctgc ggggggatgc ggtgatggag gcgactggcg 41640 ttgcggctgc gcgggtgcga gcaccggccg agccggcccg tcgcgttcgg ggtcgaggtc 41700 gtcatggaca cacagccggg gcgatgccgc cacggatccg tgcccatgac gctctgacag 41760 attcgttgac cgcgacccgt cgccgatggt gacgggagca gggcctttcg cgagatgttt 41820 tgggggattt gcttgtgggc ggtcggaact ccgatgtcgt cttcatccgc tggcccgctc 41880 aggcggacct gagaacccgg tgccggaagg agggagtgcc gcggctgctc gtcgtggagg 41940 gcggtgcgca gccgccgatc agcaatgacc cggtcgagga ctgggtccgg ccgccggtgt 42000 ccaggaacga cctggaggca cgggtcaagg cactacaaca acgcttcaac agccgacggc 42060 tgccgaccat cgactctacc gggacgttga ccttcggccg tcactcgatc gtcatctcca 42120 acacccaggc ggagctgatg cggctgctca tcgaacgctt cggcgaagtc gtgtaccgca 42180 tcgagttcgt gcagtgcctc gccatccgga cgcccgcgct gaacagaaac tcgctcgacc 42240 tgcacatcat gcggctgcgc cgccggctcc taccgatcga cctggcgatc cggaccgtgt 42300 ggggtcgggg ctacatgttg gcgtatgcgg cctccgccga ggccatcatc agaaacgcca 42360 gcggcatgtg atgatgcctg ccgaaaacag ctcaaatcgc cgtaccgtcg agctgaaggt 42420 tgcggtgcgt ggctaccgcc ggtccggcgg aagcagcgag gagcgcgtcc agcgcgccga 42480 gccggccctc gcggacgaac cattcccggc cgtaggctgc ggcgaagcat gaggggtcga 42540 ggtctgccgc cccgacctgg ctggcgtgcg tggccatcgc ggccatcttc gcgagcaaat 42600 cggcaccttc cgcgtcgaca gcgagcgaga tccgggacgc cggcaccccc atgtccgtca 42660 ggtcgccggc agcacgctgc aacacgtgac gtggccccgc gcgcagagct gaggcatcca 42720 cggtggcctg gtatcccgcc agctgaaggc tgcgggtgac cagagcgccc acccggtgca 42780 cctgaacgtg gtccacgtgc cggtagatgc cgccgggatc atagtgaacc agcgtggtcg 42840 caccctcacg gctggcgatc cgggccacct gtcgggcgac cctcgtggcg gacgccgcgc 42900 cgagggtgcc ggcccggtac gggccgccgt gcgcaccgga atcggcgtag cccagcacct 42960 ccaatctggc tacgccgagc aggtcacagg cacgttcgag ttcggcgaga cggcggctgc 43020 gcaaactctc gccgcgtgac aacggcacgt gtggaacacc ggcggcacca tcggtggcca 43080 tgacgaggat cacgcgggcg ccagcgtcgg ccaggcgacg catggtcagc ccggtgaaga 43140 ttgcctcgtc gtccgggtga gcgtgcagga cgatgaccgt gtgcgaggag agcatgatgt 43200 gatccctttt gatcgcggcg gttgagcacg gtcgcgacga cagcgcgtcc gccacgcgct 43260 gcgacgcacc ccgctcgaac cggaagccga agaagccgac gtgtggtgcc cgcgcgatgt 43320 gctgcgcgga gaacggctag gtcatagcta ccgcacccca ctcgcgtggt ggtacgtcac 43380 ggaggtgtct cgtgaactcc cacaagtgac cttcgaggtc acggaccagg tactggcgca 43440 gtccccacgg cttgtcctgc aggggctgca cgatgtcggc acctgccgct gtggagcgca 43500 tgaagtgctc gtcgacgtcg gagacccaga cgatgacctg cttgcaggtg tgcccgccgg 43560 cgcagctgac cgtgtagggc tcgccggtac gccggaccat gacgatccca ccgccggtgt 43620 ccagatcggc gtgtcggatg gtcccgatgg ccggctgccg gagcagcagg cggaacccga 43680 agacccgtac cagccagtcg acagcacgat cggggtccgt gtaggcgagt tcgacgacca 43740 cgtgagggaa gccgcgggcc gggtcgtaca cagagtctcc ttcgttcggc gagcagcttg 43800 ccgacgtcaa cggttcgacg tcaccgtttc gggacagggt cttcggatgt cggaagttct 43860 cgacatccct gtcgaggcag gctacccacg ttttgagaca ccagggcccg cggcgaagca 43920 tctgcgaaag aggtgccaac cgtcccatcg gacgccgccg ctcgcggtgg aggcggtccc 43980 ggccgccagg gactgcaaga cggtccggac gtcacggtgc gtgccggcgt gcagttctga 44040 tccggccgat ctgagggcga cggttgattg gttggcagga atcaagccgg agagtgtcgg 44100 atctggcgga tccagccggt ccgcgacccc tcgcggaacc cgctgttcca ggtgggcctg 44160 caactgctgg gcagcgccac ccagagcacc gagccgaacc tgcccgggct caccgtcacc 44220 tcgctggacg ccaacccggg cgggcacccg ttcgacctgt cgatcacctg caccgagagc 44280 cccgaccagc tgcggctggt cgccgactac tcggtcgacc tgttcgacga gccgcggatg 44340 gcgcggctgc tgcggcacct ggaacgggtg ttgcggaccg ccgtcgacgc ccccgacacc 44400 ccgctgtcgg cgctgccgtt gctcgacgag gaggagcaaa cgctgctgct gcacacctgg 44460 cagggaccgc agggggagcg cgcccgcgaa ccggtgcacg tgcagatcgc gcggctggcc 44520 gccgaacgac ccgacctggt ggcggccacc ctgcacggtg ccgagctgac ctacggcgag 44580 ctggatcgcc gcgccggggt gctggcgcac cggttccggg cgctcggcgt gggccgggac 44640 gacatcgtgg cgttgctgct ggaacggggc ttcgacctga tcgtcggcat ggtcgccgcg 44700 cagaaggccg gcggcgcgtt cgtggtgatg gacccgggcc acccggtacg ccgcatcgag 44760 ttcatcctcg aagacaccgc ggccaaggcg gtggtcaccc gcagcgcgct ggccgaccgg 44820 ctgcccgagg gtgccgccgc cacgccggtg ctcgtcgaca cggagtggga cgagttgtcg 44880 gcggcggccg ccggcgcggc gccgctggac gaactggccg acgagaactc gctggcctac 44940 gtgctctaca cctcgggctc gaccggcaaa cccaagggcg tgatgatcga gcatcacgca 45000 ctgaacacgt tcctgctctg gctcggcaac atcttcgact tcggccccgg cgaccggttg 45060 ctgcaacaca tggcgcccat cttcgacttc gccgagggcg agatcttcac cgcgctgacc 45120 cgtggcgtga cgatggtctt cgtaccggag gaacaccgca ccgacccgga cgtgatcggg 45180 cagctgctgg tctcggagag gatcacctac atcggcggac cgccggccat cctgggccgc 45240 atcccgccgg gcagctatcc cgacctcaag tacatgatcg ccggaggtga ggcggtcacg 45300 ggtgatctca tcaaccgctg gaacaccccg ggtcgccggt tcatcaacgg gtacggaccg 45360 accgaggcgg ccgtcggctg catcttctac gagtgcgagc accgcacctg gatcggccaa 45420 ccgccgatcg ggcgggccat gcccaaccgg gtcgcctacg tgctggaccg gtggaacaac 45480 ctgcaaccgg tgggggtgcc cggtgaggtg atcaccggcg gggagggtct cgcccggggc 45540 tacctcaacc ggccggagtt gaccgccgag aagttcatcg acaacccgta ccggccgggg 45600 gagcggatgt accgcaccgg cgacctgggc gtgtggaccg aggacgggca gatccagttc 45660 ctcggccgca tcgacaccca ggtcaagctc aacgggctgc gcatcgagct ggaggagatc 45720 gagtcgacgc tcaccgcgca tcccggcgtc gccgaggcgg cggtggcgct gcgcgaggac 45780 agccccggca gcaagcgcct ggtcggctac gtggtcccgg ccggcgcggc ggcaccaccg 45840 accgaggaac tgcgcgagca cctgctcgcc gacctgccgc cgtacatggt gccgcacgtc 45900 ttcgtggccc tggacgtgct accgctgacc agcgtcggca aggtggaccg caaccggctc 45960 ccggttcccg aggagaccgg gtcggccgag gtggagctgg tcgcgccgcg caccccggag 46020 gaggagcggg tcgccgagat cttcgccgcg gtgctcggtg tcgagcgggt cggcgccgac 46080 gcgaacttct tcgagctggg cggcaactcg ctgatggcgg cccgggtgct gtcccggatc 46140 gccgaactcg gcggggccag cgcgaccatg cgggacttct acaccaagcc gcgggtcagc 46200 gagatcgcgc agctgctcgc cggaacgccg tcgagcaccg acccggcgac cccgaccgac 46260 gcggcaccgg tggccgacca gacccgggcc cggttggagc aggagatcgc cgacctggaa 46320 cagcggctac gggccgcgcg ggcggccctc gccgggcagg acggtccggt gtccggcggg 46380 cacgagggac agcggctgcc gctgtcaccg acgcaggagc agctgtggtt cctcgaacag 46440 ctcgcacccg gccagccgac ctaccacatc ccggtgccgg tacggctcac cggaccgctc 46500 gacgtcgacc tgctcggtcg ggcgctgacc gccgtggtgg cccgccacga ggcgctgcgc 46560 accacgttcg gcaccgacga cgacaccccg taccaactgg tgtcacccgc cggtgaggtg 46620 ccgctgccgg tgcacgagct ggacgcgacg gcagccgacg accgggagca ggcgctgcgc 46680 gtcgagctgg aacgcgacgc caccgaaccg ttcgacctgg gtcgcgacct gatgctgcgg 46740 gcccggctga tccgcctcga cggccaggag cacgtgctca gcatggtgtt gcaccacatc 46800 tgcgccgacg gctggtcggc cgggctgctg gtgcgtgatc tcgccgagct gtacgacgcg 46860 ttgcggcacg accggcagcc gcagctgccc gccctgcggt tgcagtacgc cgaccacgcg 46920 ctggcgcagc gccggcagct cgacgccggt gacctggagt cgcagttggc gtactgggcg 46980 cggcagctgg ccgacgcgcc catcctggac ctgcccagcg accggccccg cccggccacg 47040 gccaccaacc gtggcgccct gctggtgcgt cggatgcccg ccgacgtgct ggagggcctg 47100 cgccgggtgg cccagcagga gcaggccagc acgtacgcgg tgctgctcgc cggcttcaag 47160 acggtgctga tgcgctacac cggcgtcgac gacgtggtgg tcggcaccgc cggcgccggt 47220 cgcggccgtc cggagctgga ggatctggtc ggtttcttcg tcaacatgct ggccctgcgt 47280 accgacctct ccggcgaccc gagcttcggt gaggcggtcc gccgcaccat gggcaccctg 47340 ctggccgcct gggaccacca ggacgcgccg ttcgagcggg tcgtcgggcg gctcggtcga 47400 cgccgcgacg ccagccgcaa cccggtcttc caggtctcca tcgatctgct cagcggcgac 47460 ttggtggatt tccggttccc cgggctggcc gccgagttcc tcgacgtcga tcccggggtc 47520 tcccgcttcg acatggcgat caacgcgtac gaggagaccg acggcatcac cttccggatc 47580 gagtacgcca cggacctgtt cgacaccgcc cggatcgagg cgatgttcgg ccacctggag 47640 cgggttctgc gggccgccgt ggcggcaccg cagacgccgc tgtcggccct gccactgctc 47700 gacgacaccg agcgaaccga actgctggcg ctggcccagg ggaagcgacg gccccaccgg 47760 ccggcgaccc tgccggagct gttcgcggcg agcgtggccc gcaccccgca ggccaccgcg 47820 gtcatcgccg ccgagggcac gctgagctac gccgaactcg acgagcgcag ccgtcggctc 47880 gccgcgcggc tgcgcgccgc cggagtgggc accggggacg tcgtgccggt gctgctggaa 47940 cgcagcctcg cggaggtggt gagcgtgctg gccgtgctgc gggccggtgc cgcgtacgcg 48000 ccgatggacc cggccgcgcc gccgagccgg ctggccttcc aggtgcgcga caccggcgcc 48060 cgggtggtgg tgggcgaccc gacgcggctc gacacggtgg tcggggtgac catcgtggac 48120 ccggcggcgg agctgccgga ggcggccgac gagccgtggc tggccgagct gacccccgct 48180 tcgctggcgt acgtgctgta cacctccggt tccaccggcg agcccaaggg cgtgctcatc 48240 gagcacggca tggtcgccgg ctacctggag tggatggtgc cggacttcgg cgtcgagcca 48300 cggtcccgga tgatgcactg ctgcgcgccg gtgttcgacc tggccgtcgg tgaactgttc 48360 ggtgccctca ccgccggtgc gaccgtggtg gtggccggtc acgacgacgt gcaccgcccg 48420 ggcgcgttga ccgcgctggc ccgcgagacc ggcgcgacgc acatcttcac cactcccacc 48480 gtgctgggtc tgctcgatcc ggccgaactg ccgcaactgc ggtcggtgat gatggccggc 48540 gagccggcgc cgccgtcgct ggtggccgcc tggcacgtcg acggtcggcg ggtgctcaac 48600 ctgtacggcc cggccgagac cacggtgggc tgcacctggt acgagtgccc ggccggcacc 48660 gcacccgcgg cgacggtacc gatcggtcgt ccgatgccga accggcgggt gtacgtcgtc 48720 gacgacagcg gcgacctggc gccggtcggt gtgcccggtg agctggtcgt cgccggcaac 48780 ggggtggcgc gtggctatct cgaccgaccc gagctgacgg cctcggcgtt cggcgccgac 48840 gagcgggccg gggagggacg ggcgtaccgc accggtgacc tggcccggtg gaaccgggac 48900 ggccagttgg agttcctcgg ccgccgcgac gggcaggtca agctgcgtgg gctgcgggtc 48960 gagctgggcg aggtcgagca tgccctgcgc acggcggccg gcgtgtccgg ggccgccgcg 49020 gcggtgcacg gcacgggcgc cgaggcggtc ctggtcgggt acgtggtcgg cgagttgtcg 49080 gacgacgacg cggaggcgct gcggacgacg ctcgccggga agctgcccgg gtacatggtg 49140 cccaacgtgg tgctgcgcct gccgcagctg ccgctgaccc gtaccggcaa ggtggaccgc 49200 aagcggttgc ccgcgcccga gtccggtgcc gggcaggcgg cgtacgtgcc gcccggcacc 49260 gacgacgagc ggctcatcgc cggggtcttc gccgacctgc tcggtctgga acgggccggc 49320 cgcgaggacg agttcttcct cagcggcggc aactcgctgc aggcgatccg ggcggtgggc 49380 cggctcaacg acgcactcgg tgtgccgctg accgtgcggg acttctacgc ggcaccgacc 49440 gtcgcggccc tggccgagct ggccggacgc cgacgggccg ccgagcaggc ggcgcagtgg 49500 caactgctcg acgagatcga gcagctcagc gacgacgagg tggaacggct gctggcggcg 49560 gactgatcgc cggtcgcgtc cgcgggcccc gccgccgtgc gcggcggggc cggcggtgtc 49620 ctgaaaggag tgagatgtcc gacgagacct tcgacggcag ggtagcccga ctggacgagc 49680 gccggcggct gctgctggaa cggatgcggc aacagcgccg gcagccaccg gcgacgatcg 49740 gcgcccgccc ggccggcgac gagcgggtgc cgctgtcgcg ggcccaggaa cagttgtggt 49800 tcctcgccca gctcgcgccg gccgagccga cgtacaacct ggtgcaggcc tcgtacctga 49860 ccggcgaggt ggaccccgcc gcgctgcggc gggcgttgga cggcgtggtc gcccagcacg 49920 aggcgttgcg cacggtcgtg gagagcgtcg acggcgtggc gtaccagcgg gtgctgccgc 49980 cggggccggc cagcctggtc gtcgacgacg tgtcccggct gcccgaggag cagcgccggc 50040 cggcggcgct caccctgctc cagcagcagg aggtgcaccg cccgttcgac ctggccaccg 50100 gcccgttgtt ccgggcccgg ctggtccggc tcggtcccac cgagcacgct ctcgccgtcg 50160 cggcgcacca catcgtggtc gacggctggt cgatgggcct gatcctgcgg gagctggccg 50220 ccgcgtacga cgccgaccgg cacggcacgc gagcgcggct ggacccgccc gccctccagt 50280 acccggactt cgcccgctgg cagcatcagc agctggccac cgccgaactg gacaaccacc 50340 tgaggtactg ggcgcagcgg ctggccgacc tgcccaccct ggaactgccg gccgaccgac 50400 cccggccgac caccgcgtcg ttccggggtg cgctgctgga gcaaccactg gatccgcagc 50460 tgcacgccgg ggtgcaggcg ttggccaagg agaccggcgc gagcccgttc atggtgctgg 50520 tggcggcctt cgcggccatg ctcgcccgct acaccggcac cgacgacctg gccgtcggca 50580 ccaccttcag cgggcgcagt cgtccggagc tggagagtgt ggtcgggttc ttcgccaaca 50640 tgggggtgct gcgtctggac acctcgggcg accccagttt cgccaccctg gtcgaccggg 50700 cccgggacac ctgcctgggc gcgtgggagc accaggacgc cccgttcgag cgggtggtgc 50760 agcgactcgc cccaccccgc gacccgggcc gcaacccgct gttccaggtg gccgtgcagc 50820 tgctggacgg ctccacctgg ggcggaccga cgctgcccgg caccgacagc accccggtcg 50880 acctgcggct ggaccggtcc cgcttcgaca tgatggtcag cctcgtcgac cacggcgacc 50940 ggtactcggt gctcaccgag tactccaccg acctgttcga cgcccggcgg gtacgcgcca 51000 tgctcgacca cgtcgcccgg ctgctcgacg cgggcctggc cgacccggct acgacgctgt 51060 cgcggttgcc gatgctcgac cccgccgaac gcgagcgggt cctggccctc ggcgcgggtg 51120 aacgacgtga cgtggcccct gccaccgtcc accagctggt ccgggcgcag gccgaacgca 51180 accccgacgc ggtggccgtc cggcacggcg atcacgagct gacctaccgg gagctgctgg 51240 accgggccgc gcggcgggcg gccggcctgc gcgacgcggg cctgcgaccc ggcgatcggg 51300 tgccggcgct gctggaccgg ggcgtcgacg aggtgctgac gccgatggcg atctggcacg 51360 ccggtggggt gtacgtgccg ctggacaccg ccgccccgcc gaaccggctg cgccggatcc 51420 tgaccaactg tgccgcccgg ctcgtgctca cccgcaccga gcacgccgcc ggggtgccgg 51480 agggcccgtg gcggaccctc ctgctcgaca ccggcgacct ggactccgcc gccgggctcg 51540 ccccggaacc gtccaccggc ccggacgacc tggcgtacgt gctgcacacc tcgggcacga 51600 cgggtgaccc gaagggtgtc cagctgccgc accggggttt cgtcacctac ctggactgga 51660 tgcgcgacca gtggcgctgc gggcccggtg accgggtgtt gcacggctgc gcgccggtgt 51720 tcgacctggc ggcgggtgag gtgctggcgg cgctcacctc cggcgccacg gtggtggtga 51780 tcggcaagga ccggctgctc tcgccgggcg gtctcgccga ggtcctggcg gccgaacgga 51840 tcacgcacct gttcctgacc ccgaccacgc tcggtctggt cgaggacgac accgaccggt 51900 tcgacgcgtt gcgggaggtg ctggtcggtg gcgaggtctg ccccgccgac ctggtggccc 51960 ggtgggcgcg cccggggcgg cgtcggttcg tcaacctgta cggcccgacc gaggccaccg 52020 tgggctgcct cgcccacgac tgcacggact ggtcggcggc caccccaccg ccgatcggcg 52080 cgacgatgcc gaaccgccgc acctacctgg tcgaccgctg ggacaacccg gtcccggtcg 52140 gggtgccggg ggagatcctg gtcggtggcg cggcgctgag caccggctac ctcaacgacg 52200 acgagctgac cggacgccgg ttcaccgcgg atccgttcga tccgcaggga cgggtctacc 52260 gcaccggcga tcgtggtcac tgggacgcgc agggccggct gcacttcggc ggccggctgg 52320 acggccaggt caagttgcgc ggcctacgcg tcgaactcga cgagatcgag gcactgctga 52380 gccggcactc cggggtggcc cgcgccgccg tgaccgtggt ccgcgacggc aacggggtgc 52440 agcggctcgt cgggtacgtg gtggacgccg ccgagccggc cagcgacgcg gacctgcgca 52500 cgcacctgag cacggagctg cccgcccacc tggtgcccgg ccggttcgtc cgactgcccg 52560 ccctgccgtt gaccaccagc ggcaaggtca accggcgggc gctgccggca ccggaggcgg 52620 cggacaccga cgacaccggc gcggccccca ccaccggggc cgagcgccag gtcgcggaga 52680 tcttcgcgga ggtgctgggg gtggcgcggg tgggcgcgga gacgtccttc ttcgacctcg 52740 gcgggcactc gttgcaggcg gcgcacgtgc tggcccgcat cgccggacgg atcggcacgt 52800 cggtgtcgct caagcagttc tacgccaccc cgaccgtccg ggcggtggcc cggttcgtcg 52860 agcacgggcc ggtggtggac gcctcgccac tcgtcacgct caaggccacc ggttcgcggc 52920 cccggctcta ctgcccgcac gcggtctccg gctcgccgta ctggtacctc ccgctgagcc 52980 gggccctgca tccggagcag ccggtggacg gcttcgaggc gccggggctg gagggtggca 53040 tcgagccggt cgacgacctg gtgacgctcg ccgggcggta cgtcggcgcg ctgcgcgaac 53100 ggcagccgca cgggccgtac ctgctcgccg gctggtcgat ggggggcttc ctctgcttcg 53160 agatggcccg acagctcgcc gccgtgggtg ccgcaccgga cctcgtggtg atgatcgact 53220 ccaatgaacc cggcccgttg ccgctgccga gcgagcgaca ggtgatggag accttcgtcg 53280 ccgacctggc cgggctctcc gcggcaccgg caccgccgct ggacgccgag gtggtcgacg 53340 cggccgaccc gatcgcggcg ctcaccgggt tcctggtccg gcacggactg atcccgtcgg 53400 acgtgcgggc cgacttcgtc gccaaccggt acgcggtgtt ccgcgccaac atgcgggcca 53460 tctacggcta ccaaccggca ccgtacgccg gccggacggt gctggtgcag gcggagcggg 53520 aggccagccg cgcggcgtgg cgccggtgga gtccggcgat ggaggtggtg acgctgccgg 53580 gcgaccacta ctcgatgtgg tccccgcagc acctgcccgc gctggcagcc ctcatcgacg 53640 accaggtggc acgggtgctc gacctcggct gaccggcacc ggggcccgcc cagaccatcg 53700 gctgggcggg ccccggacga gcatcgtcac cggcggcgag cctggtcacc tcggcgcgga 53760 acgcgctccg gtcggcgcgg acgactcctc gaccgggccc gttgccggct cgacgtcgac 53820 ctcaccgggg ggtgcgttgc ccggcgccgc cacggcctcg acctgctcgg cggcgtcgcc 53880 gctcggcgcc gtctcagccg acacccgggt ggacagccgc caggtccggt aggccagcag 53940 gaatcccagc atcagcagac cggcgtcgac ccagaggctg cggctcaacc ccagcgcgga 54000 acggctcggg tcgttctcgg cggtcgccag gtagacgccg ccgacgacga ccacgctcac 54060 cacgctggcc agcagcgttc cggtcgagac cagggccgac agggcggcgg cgtagcgggg 54120 gcccacggtc gcggccgtct gctccacgag cgtgctgaaa ccggccgcca tccccgcacc 54180 ggcgagcagc agcagcgccg acaccaccgc gatcggccag ccgccggcca ccacgaccgc 54240 gagtgcggcc agggccaggg cgaacaccag caggccggcg accggcagcg ggcggtggaa 54300 acgtttcggc agccgtgtcc aggtgaggct gacggccgcg aaacccacgg ggtacgggat 54360 gaacatcaac ccggcctgca acggtgtgta gcccagcccg ttctgcacgt gcagggtgag 54420 cggaaacagc accccggcga aggcgaagtt gaggatgcag caggccagca gtcccgactt 54480 gacgcctcgc ggtcgcagcg catcgatctc cagcaccggc tgtccgcccc gggcgcccag 54540 ccgcagctcg taccggacga agaggacgag cccggccgtg ccggcggcga tgctggccag 54600 tgcccacgcg ggccagccct gttcccgccc gaagaccagc ggtgccacca ccgcgcccat 54660 cgagacggcg agcagcagga tgccgacgat gtcgggccgg aaccgcgagc tgggcgtgtg 54720 ccccggcaga taacgcggcg ccgccgccag cagggccagc ccgatcggca cgttgaccag 54780 gaacgcggcc ctccagccgc tgcccagcac gtcggcgctg acgatcacgc cgccggcgat 54840 ctgaccggcg gccactccga gcgccagcac catcgagtag agcccgatgg cgcgggcccg 54900 ggccgacccg gtgaagacga tctggatcac cgagagcacc tgcggcacca tcatggcccc 54960 gaacgccccc tgcagcaggc gggcggcgac cagcgtgccc gcggtcgggg cgatcccgca 55020 gagcagcgag ctggcggtga agccggtcag cccgatcatg aacagccgcc ggtgccccac 55080 gtcgccgccg agtcgcgcgc cggtgaccac gagcaccgcg aacatgagcg tgtatccgga 55140 caggatcagt tgcagaacgg cgccggaggt ctggaggtca tccttgatgg tcttggtggc 55200 cacggcgacg atggagttgt ccatcgtcgc catgacctgt gccaccagga ggatgagcag 55260 caccagccgg gcgccccgtg gtcgaccttc gtcctcagtg gccatcgaca ctcctcgctc 55320 tttctggttg tcacgcccgt tgccgtggta gaggcttccg tgccgacagt ggttgcgcaa 55380 ctacgtgcgg ctgggtgtcg cgggcgtgcg ggcatcccgc ggatcgtcgt cgtcggagac 55440 cgccggtcgg gtcgccggca caacgttgcc ggtcgccgac cacgccaccg acgccgggct 55500 ttcggtgtcg gtggggccgg tgcctggcgc gggaccggtc cgggacaccg gcacagtgcc 55560 gacgccgcga cgcgcgagcg gcccgaccga ggcacccaac tccggcccga acaccagcag 55620 caggacggtg gcggccaggc acagcacacc cagtgcgatg gccggcgcga cgagcccgcc 55680 gccgagggag agaatcagca gcatggcgga cggtccgagg atgccaccga ccttcgtggc 55740 cgccccggcg aagccggagc cggtggcccg catcgcggtc gggtagatct cggcgctgta 55800 cggcagcagc atcgcgttga ccgcggacaa cgacagcacc agcaggccga tggaggccag 55860 cagcagcacc gtcccgccgc tgtcggtggt ccagagggcc actccgccga gcccgaccgc 55920 ggttatcgcg atgaacagcg ccagcgcgcg gcggccgctc caggccgcgt agagcagcac 55980 gaccagcgcg agggccgggg tggagtagag cgccgagtcg gccagcagcc cgctcgcgac 56040 accgccggcc aggcccgcct cgcgcagctg cgcgggcagc atcaccagga agccgaagtt 56100 caccaggccc cagacgacac cgaccacgcc gatcaccgat gtcacgaccg gatacgcccg 56160 cagcatcgcc cccacgccgg gacgcgtcgc ggcggcggca gtgtcggcgg ccgggggcgt 56220 ggcacccagg tgggacccgt agcggcggag caccgcctcc gcctcggtac gccgcccggc 56280 gcgcagcagg tacagcggcg actcggggat caacggcgcc atcagcagca gcagcagtcc 56340 ggagggcagc ccgatcaacc agagtgcgcg ccaggtcagc gccggctcca ggtggcgtgc 56400 cgcctcgctg gccgccaggt aaccgccgag gccaccgatc ccaccgacgg tcaccgccac 56460 ccagccgcgg tgccggcgtg gggtcagctc ggcgatcagc gtgaacacca ggggcaacag 56520 gccaccggcg gaggtgccca tcgtgaagca catgacgagg ttccactcga aggtgggcat 56580 ggccccgcac gccgaggtcg cgatgaacag cagggtggcc aggagcaggg cggtccgtcg 56640 accgtaccgg tcgccgagca ggccccagac gaccgacccg accgcggtgc cggtgagggc 56700 caccaggggc aggatcgaga ccgattcgag ggacatgccg tactcgtcgc tcatgccggg 56760 catgacgaag ccgagggtca gcggcttcat gatgtcgacc accagggcga tggtcagcac 56820 cgcgcaggtg atccagtacg cgggtcgcag ccgcccgtgc tcgatcgact ccacggtgac 56880 gctcgcggag tccggtcggc ggacccccgc gaacagcgcc cgcccggcca ccaccaggcc 56940 gacgacgagc agcagcatgc cgaggatcat cgtcggcgtc cacatgtcca tcggctcgcc 57000 ggggctcatg ccctccatgc ccggcatgct gtccatgtcg tccatgtcgt ccatgccgtc 57060 catgccgggc tcggccgacc ccatccgggc atggtcgatc atcatcttca cgtcgggcag 57120 ttggaacagc acgccggccg tcaccaacgc cacgccgagc aggaatccga gtgtcccgcg 57180 gcgtttcgcg gatgctgtgt cggcagtgcg ggattcggac atggttgacc gacctccgag 57240 ctgtcgcgag acgagaagaa cgtcggcgaa ttggcgacca ccgaaatcta caagggtgct 57300 tcccgggtga caaccgtcaa ttatatgact catttcggta agtggttatg aattgctgcc 57360 tccgggtggc tcaccctgtt tgctaccgat ttggtgggct ctgatcggtc agtcagtcga 57420 cgagcgttgc ccgatcgccc cgtgggatgt taggctcacc ctaagtgatc aactggcggt 57480 cgccggtgct gtccaatggt ccgcttacca cagcttttcg gcaggtcagt gccgttatgg 57540 cggatcgttg gtcgcgggtg acgcgcaccg cgtcgtcgga tccgccgggc ggtggcgctg 57600 tccgcgccag gccggcacgg cgcagcggct gacccgactt cagcaattaa ccgagcgtat 57660 tcttcagtga attgctggca atctctccgt aacgctccgg gccgcacgga aatgctaggg 57720 tcgggagcga tgcccgccgc ccatcgcctt tcgactgagg tcgacggcgg gctggatcgg 57780 gcgtgagctg cgccgtttct cgaatcgcta tccgaccatc cgtacgcgac cgcgaccccg 57840 gcacgcgccg accggcccgg atcgatcccc tcggtcactg tcggtgccgc agatgtgccc 57900 catgtggacc ggtcggcccg atccggcccg tgttgtgcca gcatggacta catgaccatc 57960 cagtccgacc cgatggcgtc gacggacgag gtacgcggtg agccggccga cgagttcgtc 58020 ggcgccctcg tctcgctgag ccgggtcatg gtggccgtcg ccatgcggac gctggcgcgc 58080 atcgacgccg acgtgacgct ccagcagttc cggacgctcg tggtgctggt gcccggcccg 58140 cagcgggtga tcgacctggc gaagctgctc ggcgtgcagt cgtcgaccgc cacccggatg 58200 tgcgaccgac tggtccgcaa ggggctggtg gcacggcacg agcgggtggc ggaccgtcgg 58260 gctgcctggg tcgggctgac cgtcgccggc aaggaactcg tcggcctggg catgcgagcc 58320 cgacaacagg aactggagcg gatgctggcc gacctgcgac ccgacgacac cgacgtcacc 58380 accggcgcgc tggtggcggt actgcgcgcc accggtgagc tcaccgacgg tgcctggtgg 58440 cggcagtggg cggattcggt ggtggagtga cgcaacgccg tcggtcccga gtggccggcg 58500 cagccggggc cggccgtcgg cgcggctggg gtcagacggt gacgcggctg gccgcacggc 58560 ggcgggccat gggcatcgac ggcacctcgg cggccggacg cggtaggtcg gacggtgtca 58620 cgtcgaccgg cgacacgccg gccgagacgg cgtcctgcga cgccgcgttc cggagttgat 58680 cgagggcggc gtcgaggctg tcgaagatcg ggaaaacccc gtcgagcttc atcgtgtgca 58740 gcacggtgcg gatgaacctc gacggcgcgg cgaggcacag ccgcccgcca cgctcgcgta 58800 cgtcgcgatg cgcccggacg agcatgccca gcccgagcga gtcgatgacc tgcacctggg 58860 tcaggtccac caccaccgtc ccggccacgt cgaacgcgcc gcgcagcgcg gcccgcagcg 58920 cgtcgccggt gtcctggtct ccgccgtcgg cgggcaccac caccgccgcc tcggcgaggc 58980 ccgatccagc ccggtcgccg tcaccgaggg agctgcccgg cggcagcgcg ctgcaccggg 59040 ggcagcggtg cgggccggtg gcgaacggcg acccgctcca cccgtggtcg gagaccagcg 59100 tccagacgac ctcggcgtcg ggcagcacgc aggcggtgcc ggtggtggtg tcaccacaga 59160 cgtcgcagat cagggtcatc aggttgtcgt ccggtacgac ggtcatcctg cttcctctcc 59220 ggtgccgcgg ccggtcggcc gcggtgcggg actcggggcg ggggcgggtg aggcaccctc 59280 gccgtacgga ctcctcacag ggagtcggag cgttccttgc cggtggtggc gaccacgatc 59340 accaccgcga ccgcggcgag cccggcctgc acgaccaggc ccaggatgct gaacccctga 59400 acgccggcga gccaggcggt gatggcaccg agcaacgagg cgacggcacc gatggtcatg 59460 gtgagccaca gcggcgcagc cggacggccg ggcaggacca gtcggccgag cgcgccgacg 59520 gcgaggccga cggcgagggc cgtgacgatc ccggcgctgg tcatgctgct cctcgtgctc 59580 gcggtcagat gcgtcggctg cggtgtgtca ggtgcgcacg gtgacggcgg cgcggccgta 59640 cgcggcagcg cgcgggaccg tacccggtgc cggtgtcccg tcggccggcg ggacacccgg 59700 tgcggcggtg accgcctcgg tgaccggggc cgaggcggcg tcggtgtgca ccggcaggat 59760 ctggtccagc cgggcggtct gcaggatgcg ggtgatgcgc gggttcgggt tgcggacggc 59820 cagcacgccc ccggcacgga ccatccggcg gtgcacgtcg agcagtagac cgatggcggc 59880 ggcgtcgatg tgccggcaac ccgccaggtc gatcacgacc tgaccgggac gcagggccag 59940 gagctgatcg aggaccgcgc cggtctccgg caggcagctc agatcgaact cggtgatgga 60000 cacctccacc agcggcaccg aacactcggg gcgtcgtggt gcggtcacgg ccaaggcccc 60060 ctctcctgcg gtctccgagt ggctctcacc ctgcccagcg gggttggcgg ccaccgcgcg 60120 gacggatgac agttgcgtga caaaaccccc ggttgtcgat cgtggttggc ccggcggtca 60180 gggcttgggg atgattccgg tatgacagcg gtactggtga tcgaggacga cgaccggatc 60240 cggttggcgt tgctgctcgc tctggaggac gagggctacg aggcccgggg agcggccacc 60300 gccgaggagg ggctgcgtac gcaacgccgg gatcccgccg actacgtcct ggtcgacctg 60360 atgctgcccg gcatcgacgg cttcgagggc atccgccagt tgcgccgcga cgacgacgtg 60420 ccgatcgtcg tggtcagcgc ccgcgacgac actcacgaca tcgtcgccgc cctcgaggcc 60480 ggcgccgacg actacgtggt caagccggtg gcgatcaagg aactgaccgc tcggctgcgc 60540 gccctgcgcc gacgcgggcg caccacgacc gcgtcggacg gcccgcagcc ggtgccggtg 60600 ctcgccttcg gtgaccttga ggtgagcccc gaggcggggg aggtgcgccg cgccggtgag 60660 ccggtcgcgg tcacccgcac cgagttccgg ctgctgtgcg agctggccga acacgccggc 60720 cgggtgctct cccggcagca gctgctcagc cgggtctggg ggtacgacag cggcgacgaa 60780 cggcttgtcg acgtgcacgt cggtcggctg cgccagaaga tcgaagccga tccggccaac 60840 ccccgacatt tggtgacgct gcgcgggctg ggttacaaac tgcaacgatg agacgcctcg 60900 gactgcgtgc ccgggtcacc gccgcgttcg cggtcggtgc gttgctgctg tccgcctcga 60960 tggccctggt gtcgtacgag ctgacccgcc gcaccctgct cgacgagcgg gaacgcaccg 61020 tgctgcgggc ggcgtactac gacgcggcgg tggtccgcgc cgggctcgac accgacaacc 61080 cggacgtcgc ggaggcgttg cgggcgttgg acaccggcac cggacggcga cccctggtgc 61140 tgctcgacgg cgagtggtac gcccgcagcg ccgacaacgg gctcaccacg atcgttccgg 61200 cccggcttca ggacctggtc gcggcggggg agccggcggt gcagcgggtg cgcgtcaacg 61260 acaccccggt gatgctggtc ggtgtgccgc tgtccgagtc gaccgccttc tacgagatcg 61320 cctcgctgcg ggaactggaa cagaccttcc aggtgctggc gctggcgctc accgcggtcg 61380 cgatcatgat cgccgggtcc ggggcggccc tcggctggta cgccacccgg cacgggctgc 61440 gtccgctgac cgccgtcgcc gacgccgccg agcggatcgc ggccggcgac ttcaccaccc 61500 gcctcgcccc cgacaccgac ccggacctga cccgtctgtc cacctccttc aaccggatgg 61560 tcgacgagtt ggccgggcgg atcgaccggg accggcgttt cgccgccgac gtcagtcacg 61620 aactgcggtc gccgttgcag accctcgccg ccgccgcgag tgtgctgtcc cggcgccggg 61680 agaaccagga cgagcggacc gccaccgcgg cccggctcgt cgccgacgag atcgaccgtt 61740 tccagcaact ggtgaacgac ctgctggacc tggcccgtgg tgaccagccg gtgcaccggg 61800 agtcggtgga cctgcccgag ctggcccggc aggcgtgccg ggaccgggac ctgccggagt 61860 cgatggtgca gttggcaacg gggacaccgc ccgggtggcg ggtggaccgt cgccgggtcg 61920 cccaggtgtt ggccaacctg ctggacaacg ccgagcggta cggtgcggga ccggtcgcgg 61980 tgcggctgtc ccacgacgcg gacacgggcg tgatcgaggt cgacgacgag ggcccgggag 62040 tgccgatgga ggaccgcgag gcgatcttcg accgtttcgt ccgggggcgg gcggccaact 62100 accgtggtgg cggcgacggc accggcctgg gcctggccct ggtggcccag cacgccgccg 62160 cgcacggcgg agacgcgtcg gtcagcgacc gcccggaggg cggtgcccgg ttccgggtca 62220 ccctgccggg gagcctgtca tgacccgccc cggcaccggc cgggccgcgc ggacggtcgg 62280 ggtcgcggcg ctcgtcaccg tgttcgccct gctcggcgcg tgcggggtgc ccgccgagga 62340 tcgaccccgc gcggtgacgc cgccgccggt gccgttcccg gcgaccgcct cggccgcgcc 62400 gacggcggcg gagaccggcg cggtgaccga ggtgctctac ttcgcccgcg acgaacgcct 62460 ggtgccggtg atccgccggg ccgaccaggt gcccgcactc gacgcgcagc tgcgggcgct 62520 gctcgccggg ccgaccccga ccgagcgtga cgacgggctg accagtgccc tgccgggagc 62580 cttcaccagc gcggtggtcg agctggtcga cgggttggcc cgggtcaccg tcgggctgac 62640 ggcggtggac accggccgca gcgacggccg gctggcgtac ggtcagatcg tctgcacgct 62700 caccgcccgc accgatgtca cggcggtgct gttcctggaa ggcggcacgc cgctgagcgt 62760 cccccgggcg gacggctcgc tgtcgtcggg accgctcacc gctgccgact acgccgtgtt 62820 gatcaatcct cgttgacgag ggccggacca cccgacgcac gcgcagcgcg acgactcgta 62880 tcctttccgc gaaccgtcgt gccgacgacc ggaaaggact tggtgtgaac gaccgggccg 62940 agacgttgga gttccaggcc gaagcgcgtc agctgctccg gctgatggtc cactcgatct 63000 actcgaacaa ggacgtcttc ctccgcgagt tgatctcgaa cgcctcagac gcgctggaca 63060 agctgcgcct ggcgtcgatg gtcgacaagg acctcgccgt cgacaccggc gacctgcaca 63120 tcgccatcga ggtcgaccgg gacgcccgca ccctcaccgt gcgggacaac ggcatcggca 63180 tgagccgcga cgaggtggtc tccgtcatcg gcaccatcgc caagtccggc accgcggagc 63240 tgctgcggca gctgcgggag gccaaggacg ccggcgcctc acaggagctg atcggtcagt 63300 tcggcgtcgg cttctacgcc gcgttcatgg tcgccgagcg ggtcgagctg gtcacccgac 63360 gggccggcga gaccggtggt acccgctggg agtccaccgg cgagggcacc tacaccatca 63420 ccgagctgga cgacgccccc cagggcacgg cggtgaccct gcacctcaag cccgccgacg 63480 ccgaggacaa cctgcacgac tacaccgccg aatggacgat ccgggggatc gtcaagcggt 63540 actccgactt catcgcccac ccgatccgga tgaccgtcga gcggcccggc accgacgacg 63600 cccccgccac caccgaggcg gtgacgctca actcgatgaa ggcgctgtgg gcccgcccgc 63660 gcggtgaggt cgagcccgcc gagtaccacg agttctacaa gcacgtcagc cacgactggg 63720 cggacccgct ggagaccatc cacatgcggg gggaggggac cttcgagtac gaggcgctgc 63780 tgttcatccc cacccacgcg ccgctggacc tgttctcccc ccagggccgc cgaggggtgc 63840 agctctacgt caagcgcgtg ttcatcatgg acgactgcga cgcgctgatg cccaactacc 63900 tgcggttcgt caagggtgtg gtggacgccc acgacctgtc gctgaacatc tcccgggaga 63960 tcctccagca ggaccgccag atccgcgccg tccgccgtcg cctggtcaag aagatcctcg 64020 ccacggtcaa ggatctcaag accggccagc cggagcgcta ccgcaccttc tggaccgagt 64080 tcgggacggt ggtcaaggaa ggtctgctgg aggacaccga caaccgggac accctgctgg 64140 agatcctctc ggtggcctcc accaacgacc cggccgagca gaccgacctg gccggctacg 64200 tggaacgcat gcgcgagggc cagcaggaca tctactacgc caccggcgag aaccggagca 64260 ccatcgagaa ctccccgcac attgaggcgt tccgcgccaa gggctacgag gtgctgctgc 64320 taaccgaccc ggtcgacgag gtttgggtgg agcgggtcgg cagctacgcg ggcaagacgc 64380 tgcgctcggt cgccaagggg caggtcgacc tggacaccga gcaggagcgc accgaggccg 64440 aagccgaacg ggagcggcag cgcaccgagt acgccgacct gctcggctgg atgggcgagg 64500 tgttggccga caacgtcaag gaggtccggc tgtcgtcgcg gctgaccacc tcgccggcct 64560 gcgtggtcgg cgacgcgcac gacctcacgc ccaccctgga gaagatgtac cgcgcgatgg 64620 ggcaggaggt gccgaaggtc aagcggatcc 64650 <210> 2 <211> 178 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF1 Protein <400> 2 Ile Pro Ser Arg Glu Trp Gln Pro His Ser Cys Gly Pro Gly Ala Lys 1 5 10 15 Gly Pro Arg Glu Tyr Leu Trp Ala Trp Ile Thr Thr Ala Thr Ser Ala 20 25 30 Gly Glu His Arg Trp Leu Leu Met Arg Arg Asn Arg Ser Thr Gly Glu 35 40 45 Leu Ala Phe Tyr Leu Cys Trp Ser Pro Arg Pro Ala Pro Leu His Thr 50 55 60 Leu Val Thr Val Ala Gly Ser Arg Trp Ser Ile Glu Glu Leu Phe Gln 65 70 75 80 Ser Gly Lys Gly Gln Val Gly Leu Asp His Tyr Gln Val Arg Gly Trp 85 90 95 Thr Gly Trp His Arg His Val Thr Leu Ala Met Leu Ala Leu Ala Val 100 105 110 Leu Thr Ile Leu Ala Ala Arg Gln Pro Asp Pro Asp Pro Glu Ile Ile 115 120 125 Ala Leu Thr Val Ala Glu Ile Arg Gly Leu Leu Asn Ala Phe Val Leu 130 135 140 Ala Val Thr Leu Pro Pro Ala His Thr Leu His Trp Ser Thr Trp Arg 145 150 155 160 Arg Thr Ser Gln Ala Arg Ala Arg Arg Ala His Tyr Gln Arg Arg Gln 165 170 175 Ala Lys <210> 3 <211> 46 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF2 Protein <400> 3 Met Arg Ser Cys Gly Arg Arg Leu Ala Arg Val Thr Arg Ile Gly Asn 5 10 15 Pro Arg Gln Gly Leu Gln Ala Pro Arg Gly Gln Gln Ser Val Ser Arg 20 25 30 Ala Gly Arg Gly Met Leu Thr Gly Tyr Val Asp Gln Arg Arg 35 40 45 <210> 4 <211> 205 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio3 Protein <400> 4 Met Ser Val Ser Gly Ser Arg Arg Ser Glu Gly Ser Tyr Arg Arg Ser 5 10 15 Gly Gly Cys Ala Gln Gly Arg Ser Pro Arg Pro Ala Arg Glu Asp Val 20 25 30 Lys Phe Val Arg Trp Pro Ala Glu Arg His Leu Arg Asp Leu Cys Arg 35 40 45 Gln Glu Arg Ile Pro Cys Leu Leu Val Val Glu Gly Gly Ala Glu Pro 50 55 60 Pro Val Cys Ser Asp Pro Arg Glu Asp Trp Val Arg Thr Pro Ile Ser 65 70 75 80 Pro Ser Asp Leu Asp Ala Arg Val Thr Ala Leu Arg Gln Arg Ser His 85 90 95 Asp Arg Arg Thr Pro Val Leu Asp Pro Ala Gly Thr Leu Ser Phe Arg 100 105 110 Thr Ala Ser Val Val Met Ser Ser Thr His Leu Glu Leu Met Asp Leu 115 120 125 Phe Val Glu Arg Phe Gly Gln Val Val Tyr Arg Trp Glu Leu Met Thr 130 135 140 Ile Leu Thr Lys Arg Asp Ser Thr Ser Thr Arg Asn Ala Leu Asp Leu 145 150 155 160 His Ile Met Arg Met Arg Lys Arg Ile Ala Pro Leu Asp Leu Asp Ile 165 170 175 Val Thr Ala Trp Gly Arg Gly Tyr Ala Leu Glu Glu Lys Ser Ser Trp 180 185 190 Ala Ala Val Ala Ser Lys Pro Ala Ala Val Asp His Cys 195 200 205 <210> 5 <211> 223 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio4 Protein <400> 5 Met Ser Ala Gly Ser Arg Ser Ser Arg Asn Ala Val Ala Ala Leu Arg 5 10 15 Val Val Pro Ala Ala Thr Ala Gly Val Pro Lys Gln Arg Pro Ala Glu 20 25 30 Pro Ala Gln Val Met Leu Thr Arg Val Gly Leu Arg Leu Pro Glu Arg 35 40 45 Met Ser Phe Glu His Trp Glu Arg Thr Gly Ala Gln Leu Ser Gly Ile 50 55 60 Val Asp Ser Ser Ser Trp Cys Leu Gly Asp Trp Leu Val Tyr Gly Lys 65 70 75 80 Glu Gln Tyr Ala Asp Arg Tyr Arg His Val Val Gln Ala Val Gly Leu 85 90 95 Asp Tyr Gln Thr Leu Arg Asn Tyr Ala Trp Val Ala Gly Arg Phe Pro 100 105 110 Leu Ala Arg Arg Arg Ser Gly Leu Ser Phe Gln His His Ala Glu Val 115 120 125 Ala Ala Met Ser Pro Asp Asp Gln Asp Arg Trp Leu Asp Glu Ala Glu 130 135 140 Thr Gln Met Trp Ser Val Lys Gln Leu Arg Ala Ala Ile Lys Ala Thr 145 150 155 160 Arg Ser Asp Arg Thr Thr Glu Thr Ile Lys Thr Ala Leu Met Pro Arg 165 170 175 Ile Pro Ile Pro Asp Arg Arg Leu Thr Arg Trp Arg Gln Ala Ala His 180 185 190 Gln Ser Ser Val Glu Leu Asp Gln Trp Ile Val Ser Thr Leu Asp Arg 195 200 205 Ala Ala Ala Glu Thr Leu Asp Lys Thr Thr His Asp Glu Thr Glu 210 215 220 <210> 6 <211> 274 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio5 Protein <400> 6 Met Val Ser Thr Ser Leu Lys Pro Arg Leu Asp Ala Ala Ala Ala Gln 5 10 15 Gln Gln Thr Gly Leu Ser Trp Trp Leu Ser Asp Ala Trp Gln Met Ala 20 25 30 Leu Arg Asn Leu Arg His Leu Thr Arg Ser Pro Glu Leu Val Met Phe 35 40 45 Ser Leu Val Gln Pro Val Met Phe Ile Leu Leu Phe Ala Tyr Val Phe 50 55 60 Gly Gly Ala Ile Asn Val Glu Gly Gly Asn Tyr Pro Gln Phe Leu Leu 65 70 75 80 Pro Gly Ile Leu Val Gln Met Val Leu Phe Gly Ser Val Ala Gly Thr 85 90 95 Thr Ile Gly Ile Ser Thr Asp Met Asp Arg Gly Leu Met Asp Arg Phe 100 105 110 Arg Ser Met Pro Met Ser Arg Ser Ala Val Leu Val Gly Arg Thr Leu 115 120 125 Ser Glu Ile Leu Arg Asn Val Val Ser Met Leu Val Val Val Leu Met 130 135 140 Gly Leu Leu Ile Gly Phe Arg Phe Gln Gly Gly Val Leu Ser Ala Leu 145 150 155 160 Gly Gly Leu Ala Leu Leu Leu Leu Phe Gly Tyr Ala Leu Thr Trp Val 165 170 175 Gly Ala Met Ile Gly Leu Ser Val Pro Asn Pro Glu Ala Ala Gln Ser 180 185 190 Ala Gly Leu Ile Trp Ile Phe Pro Phe Ser Leu Ile Ser Ser Ala Phe 195 200 205 Val Pro Thr Glu Ser Met Pro Thr Trp Leu Arg Val Tyr Ala Asp Ala 210 215 220 Ser Pro Met Thr Ala Thr Val Asn Ala Leu Arg Asp Leu Phe Asn Gly 225 230 235 240 Asn Pro Pro Gly Leu Asp Val Leu Leu Thr Val Ala Trp Ser Val Leu 245 250 255 Leu Ile Thr Ile Phe Ala Pro Leu Ala Thr Arg Lys Tyr Ser Leu Arg 260 265 270 Ser Arg <210> 7 <211> 328 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio6 Protein <400> 7 Met Pro Ala Ala Ile Glu Val Ala Gly Leu Cys Lys Arg Phe Gly Ser 5 10 15 Val Thr Ala Leu Asp His Leu Glu Leu Thr Val Pro Glu Gly Lys Val 20 25 30 His Gly Leu Leu Gly Pro Asn Gly Ala Gly Lys Thr Thr Thr Val Arg 35 40 45 Val Leu Thr Thr Leu Leu Arg Pro Asp Glu Gly Lys Ala Glu Ile Phe 50 55 60 Gly Phe Asp Val Arg Arg Asn Ala Leu Gln Val Arg Ser Ile Ile Gly 65 70 75 80 Leu Thr Gly Gln Tyr Thr Thr Val Asp Asp Met Leu Thr Gly Arg Glu 85 90 95 Asn Leu His Met Val Gly Lys Leu Phe Arg Met Ser Thr Pro Asp Ile 100 105 110 Lys Val Arg Ala Thr Glu Leu Leu Glu Arg Phe Asp Leu Thr Glu Ala 115 120 125 Ala Gly Arg Gln Ala Lys Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu 130 135 140 Asp Ile Ala Ala Thr Leu Met Ser Arg Pro Gln Leu Ile Phe Leu Asp 145 150 155 160 Glu Pro Thr Ala Ala Leu Asp Pro Arg Ser Arg Met Asp Val Trp Arg 165 170 175 Ile Val Asn Glu Leu Val Glu Glu Gly Thr Thr Val Leu Leu Thr Thr 180 185 190 Gln Tyr Leu Glu Glu Ala Asp His Leu Ala Asp Ser Leu Ser Val Ile 195 200 205 Asp Ser Gly Lys Val Ile Ala Ser Gly Ala Pro Asp Glu Leu Lys Ala 210 215 220 Glu Val Gly Gln Ala Trp Ala Asp Val Thr Leu Ile Asp Ala Ala Ala 225 230 235 240 Val Glu Lys Thr Thr Gln Ile Leu Arg Glu Arg Leu Gly Thr Glu Pro 245 250 255 Val Gly Asp Pro Glu Gly Met Gln Val His Ala Pro Leu Pro Glu Gly 260 265 270 Met Thr Leu Asn Glu Leu Leu Asn Pro Leu Arg Asp Ser Gly Ile Ala 275 280 285 Ile Ala Asp Val Ala Val Arg Arg Pro Thr Leu Asp Asp Val Phe Leu 290 295 300 Ala Leu Thr Gly His Thr Ala Thr Ala Arg Ala Ser Glu Asp Val Asn 305 310 315 320 Ser Lys Lys Lys Gly Gly Lys Arg 325 <210> 8 <211> 236 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio7 Protein <400> 8 Met Tyr Phe Arg Pro Ala Asp Leu Ala His Glu His Gly Leu Ser Pro 5 10 15 Gln Ser Val Arg Asn Tyr Glu Arg Asp Gly Leu Ile Pro Pro Ala Arg 20 25 30 Arg Thr Glu Ser Gly Tyr Arg Arg Tyr Thr Glu Lys His Ala Ala Ala 35 40 45 Leu Arg Ala Tyr Arg Ala Leu Ile Pro Ala His Gly Tyr Ala Glu Ser 50 55 60 Gly Ala Ile Met Arg Asp Ile Thr Ala Gly Arg Leu Asn Glu Ala Leu 65 70 75 80 Thr Thr Ile Asp Arg Ser His Ala Glu Leu Leu Arg Asp Arg Gly Thr 85 90 95 Leu Asp Ala Val Ala Glu Val Leu Thr His Leu Thr Gly Arg Ser Thr 100 105 110 Gly Thr Trp Arg Ala Pro Lys Ser Ile Gln Pro Tyr Ser Ile Gly Glu 115 120 125 Leu Ala His Arg Leu Gly Val Asn Val Ala Thr Ile Arg Lys Trp Glu 130 135 140 Thr Ser Gly Val Leu Ala Pro Val Arg Arg Pro Glu Thr Gly His Arg 145 150 155 160 Met Tyr Asp Ala Ser Asp Val Arg Asp Ala Glu Leu Ala His Phe Leu 165 170 175 Arg Arg Gly Arg Tyr Pro Leu Glu Leu Ile Ala Thr Val Val Gln Gln 180 185 190 Val Arg Ala Ala Gly Asp Thr Gln Ala Leu Ala Ala Ala Leu Ala Asp 195 200 205 Trp Arg Gln Arg Val Thr Thr Arg Gly Leu Ala Met Leu Asn Ala Ala 210 215 220 Ala Gln Leu Ala Ser Tyr Leu Ala Met Glu Glu Asn 225 230 235 <210> 9 <211> 242 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio8 Protein <400> 9 Met Thr Thr Leu Thr Tyr Ala Asp Tyr Leu Gln Val Asp Thr Leu Leu 5 10 15 Ser Leu Gln Glu Thr Arg Ala Pro Asp Thr Ala Ser Arg Ser Val Val 20 25 30 Leu Ala Glu His Phe Phe Ile Val Thr His Gln Ala Cys Glu Leu Trp 35 40 45 Leu Lys Gln Val Thr Tyr Asp Leu Asp Ala Ala Ala Asp Ala Met Thr 50 55 60 Pro Pro Tyr Gly Pro Glu Asp Glu Glu Leu Ala Leu Glu Phe Leu Gln 65 70 75 80 Arg Thr Ala Glu Leu Leu Arg Val Leu His Glu Gln Val Val Ala Leu 85 90 95 Glu Arg Leu Pro Leu Arg His Phe Ala Glu Phe Arg Pro Phe Leu Asp 100 105 110 Gly Ala Ser Gly Ala Gln Ser Ala Gln Phe Arg Leu Leu Ala Arg Leu 115 120 125 Leu Gly Gly Glu Arg Gln Glu Gly Arg Leu Tyr Arg Ala Phe Glu Arg 130 135 140 Leu Thr Glu His Asn Gly Ile Ser Val Ala Glu Val Cys Ala Arg Gly 145 150 155 160 Pro Gly Ala Gly Val Leu Asn Arg Ile Ala Asp Ser Leu Leu Asp Val 165 170 175 Ala Asn Gly Tyr Trp Arg Trp Lys Met Thr His Leu Ala Leu Val Ser 180 185 190 Lys Met Val Gly Asn Arg Asn Gly Thr Gly Gly Ser Thr Gly Val Asp 195 200 205 Tyr Leu Ala Arg Arg Ile Thr Leu Pro Phe Ala Gln Leu Arg Gln Leu 210 215 220 Arg Ala Gln Val His Asp Ala Leu Val Trp Glu Gln Pro Thr Ala His 225 230 235 240 Thr Gln <210> 10 <211> 421 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio9 Protein <400> 10 Met Pro Leu Pro Ser Pro Tyr Pro Asn Leu Leu Asp Gly Pro Ser Val 5 10 15 Ala Ser Thr Ile Pro Ser Ser Glu Leu His Arg Val Phe Arg Asp Ala 20 25 30 Gly Glu Arg Glu Arg Ile Ser Gly Val Pro Val Thr Lys Leu His Val 35 40 45 Gly Glu Pro Tyr Phe Thr Pro Pro Pro Glu Val Ala Gln Ala Leu Ala 50 55 60 Glu Ala Val Thr Ala Gly Arg Thr Asp Tyr Thr Ala Val Glu Gly Leu 65 70 75 80 Leu Glu Leu Arg Glu Arg Leu Val Glu Lys Leu Ala Asp Gln Asn Gly 85 90 95 Val Asp Thr Asp Val Ser Arg Leu Phe Val Thr Pro Gly Ser Cys Gln 100 105 110 Gly Leu Ala Ala Leu Met Gln Ala Val Ala Glu Pro Asp Ala Glu Ile 115 120 125 Leu Leu Pro Glu Leu His Trp Pro Ile His Leu Gln Gln Val Leu Leu 130 135 140 Ala Gly Leu Arg Pro Val Phe Tyr Pro Leu Gly Arg Asp Tyr Arg Thr 145 150 155 160 Asp Pro Glu Ser Val Leu Ala Ala Ser Thr Ala Asn Thr Arg Val Leu 165 170 175 Leu Ile Asn Ser Pro Ala Asn Pro Thr Gly Ala Val Leu Asp Thr Ala 180 185 190 Thr Leu Ser Thr Leu Ile Asp Met Ala Arg Ala Arg Gly Trp Gln Val 195 200 205 Ile Ser Asp Glu Ala Tyr Glu His Phe Val Phe Asp Asp Glu His Val 210 215 220 Ser Thr Ala Ser Leu Glu Trp Asp Val Pro Val Ser Glu Arg Ile Val 225 230 235 240 His Ser Ser Tyr Ser Phe Ser Lys Ser Leu Ala Met Thr Gly Tyr Arg 245 250 255 Leu Gly Tyr Val Ser Thr Ala Asn Asp Arg Thr Ala His Ala Phe Arg 260 265 270 Ile Val Gln Glu Ala Asn Leu Ile Ala Met Ser Thr Pro Val Gln Tyr 275 280 285 Ala Gly Leu Glu Ala Leu Arg Leu Gly His Val Val Arg Glu Asn Arg 290 295 300 Ala Met Val Leu Ser Asn Arg Asp Ala Val Leu Pro Ala Val Arg Asp 305 310 315 320 Ala Gly Leu Leu Pro Glu Leu Pro Ala Gly Gly Trp Tyr Ala Val Leu 325 330 335 Asp Val Ala Pro Thr Gly Leu Thr Ala Glu Glu Phe Ala Thr Gly Leu 340 345 350 Leu Glu Thr Arg Asn Val Ala Val Val Pro Gly Thr Gly Phe Ala Leu 355 360 365 Met Pro Arg Leu Asp Ala Arg Gly Arg Val Ile Thr Val Glu Pro Ala 370 375 380 Pro Trp Ser Arg His Leu Ile Arg Ile Ala Met Cys Val Ala Pro Ser 385 390 395 400 Val Leu Arg Ser Gly Val Arg Glu Leu Leu Glu Phe Ala Arg Glu Arg 405 410 415 Pro Gly Thr Ala Arg 420 <210> 11 <211> 264 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio10 Protein <400> 11 Val Ser Pro Thr Glu Ala Glu Ala Trp Pro Ala Val Ala Glu Arg Gly 5 10 15 Asp Gly Leu Ala Gly Arg Thr Val Ile Val Thr Gly Ala Gly Thr Gly 20 25 30 Leu Gly Arg Ala Ile Gly Glu Arg Leu Leu Ala Arg Asp Ala Asn Val 35 40 45 Val Ala Val Gly Arg Arg Glu Ala Ala Leu Arg Glu Leu Thr Gly Asp 50 55 60 Gly Gly Gly Gln Val Ala Thr Val Ala Ala Asp Ile Thr Glu Pro Gly 65 70 75 80 Ala Ala Glu His Val Val Ala Ala Ala Thr Thr Arg Phe Gly Thr Val 85 90 95 His Gly Leu Val Asn Asn Ala Gly Leu Ala Arg Phe Ala Thr Leu Asp 100 105 110 Thr Ala Ser Asp Glu Asp Phe Asp Arg Leu Leu Ala Thr Asn Val Arg 115 120 125 Ala Pro Ala Ala Leu Ile Arg Ala Ala Leu Pro His Leu Arg Glu His 130 135 140 Arg Gly Ala Val Val Asn Val Ser Ser Val Gly Ala Val Leu Ala Met 145 150 155 160 Pro Gly Arg Ser Phe Tyr Gly Ala Ser Lys Ala Ala Leu Asn Ser Leu 165 170 175 Thr Arg Ser Leu Ala Arg Glu Leu Ala Pro Asp Val Arg Val Asn Ala 180 185 190 Val Leu Pro Gly Pro Val Asp Thr Pro Met Trp Asp Asp Met Gly Leu 195 200 205 Asp Ser Val Lys Ser Ala Leu Leu Arg Ser Ser Leu Leu Ala Ala Thr 210 215 220 Pro Leu Gly Arg Phe Gly Gln Pro Ala Glu Ile Ala Gly Trp Val Cys 225 230 235 240 Gly Leu Leu Asp Pro Glu Phe Ser Gly Trp Ile Thr Gly Ala Leu Ile 245 250 255 Pro Val Asp Gly Gly Arg Thr Ser 260 <210> 12 <211> 404 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio11 Protein <400> 12 Met Ser Ser Pro Thr Ala Ser Thr Ser Ala Leu Asp Leu Thr Asp Pro 5 10 15 Thr Thr Phe Val Arg His Asp Thr His Val Phe Trp Ala Glu Val Arg 20 25 30 Asp His Asn Pro Val Tyr Trp Tyr Gln Gly Arg Glu Asp Arg Pro Gly 35 40 45 Phe Trp Val Val Ser Arg Tyr Val Asp Val Val Ala Ser Tyr Thr Asp 50 55 60 Ala Ala Arg Leu Ser Ser Ala Arg Gly Thr Val Leu Asp Val Leu Leu 65 70 75 80 Arg Gly Glu Asp Ser Ala Gly Gly Arg Met Leu Ala Val Thr Asp Arg 85 90 95 Pro Arg His Arg Glu Leu Arg Asn Val Met Leu Arg Ala Phe Ser Pro 100 105 110 Arg Val Leu Gly Arg Val Val Glu Gln Val His Arg Arg Ala Asp Glu 115 120 125 Leu Ile Arg Arg Val Thr Gly Thr Gly Ala Phe Asp Phe Ala Thr Glu 130 135 140 Val Ala Glu Ser Ile Pro Met Gly Thr Ile Cys Asp Leu Leu Ser Ile 145 150 155 160 Pro Pro Ala Asp Arg Pro Asp Leu Leu Arg Trp Asn Lys Asn Ala Leu 165 170 175 Ser Ser Asp Glu Ala Asp Ala Asn Leu Tyr Ala Ala Leu Glu Ala Arg 180 185 190 Asn Gln Ile Leu Leu Tyr Phe Met Asp Leu Ala Glu Gln Arg Arg Ala 195 200 205 Ser Pro Gly Asp Asp Val Ile Ser Met Ile Ala Thr Ala Thr Val Gly 210 215 220 Gly Glu Pro Leu Ser Ile Asp Asp Val Ala Leu Asn Cys Tyr Ser Leu 225 230 235 240 Ile Leu Gly Gly Asp Glu Ser Ser Arg Met Ser Ala Ile Cys Ala Val 245 250 255 Lys Ala Phe Ala Asp Phe Pro Asp Gln Trp Arg Ala Val Arg Asp Gly 260 265 270 Asp Val Ala Ile Asp Thr Ala Val Glu Glu Val Leu Arg Trp Ser Thr 275 280 285 Pro Ala Met His Phe Ala Arg Thr Ala Thr Thr Asp Phe Glu Leu Arg 290 295 300 Gly Gln Gln Val Arg Ala Gly Asp Ile Val Thr Leu Trp Asn Leu Ser 305 310 315 320 Ala Asn Phe Asp Glu Arg Glu Phe Asp Arg Pro Tyr Arg Phe Glu Val 325 330 335 Gly Arg Thr Pro Asn Lys His Leu Ser Phe Gly His Gly Pro His Phe 340 345 350 Cys Leu Gly Ala Tyr Leu Gly Arg Ala Glu Leu Gln Ala Leu Leu Thr 355 360 365 Ala Leu Val Gly Thr Val Ser Arg Ile Glu Ser Ala Gly Ser Pro Arg 370 375 380 Arg Val Tyr Ser Asn Phe Leu Asn Gly His Ser Ser Leu Pro Val Ala 385 390 395 400 Phe Thr Gly Arg <210> 13 <211> 523 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio12 Protein <400> 13 Val Pro Trp Pro Glu Glu Leu Ala Ala Leu Tyr Arg Arg Glu Gly Tyr 5 10 15 Trp Gln Gly Arg Pro Leu Gly Asp Leu Leu Thr Glu Ala Cys Ala Arg 20 25 30 His Ala Asp Lys Thr Ala Leu Val Cys Gly Glu Arg Arg Met Thr Tyr 35 40 45 Ala Glu Leu Ser Arg Ala Ser Ala Asp Val Ala Gly Gly Leu Leu Asp 50 55 60 Val Gly Ile Glu Pro Leu Asp Arg Val Val Val Gln Leu Pro Asn Val 65 70 75 80 Pro Glu Phe Val Val Val Val Tyr Ala Leu Leu Arg Ile Gly Ala Ile 85 90 95 Pro Val Met Ala Leu Pro Gly His Arg Lys Val Glu Leu Thr His Leu 100 105 110 Cys Ala His Ser Gln Ala Val Ala Leu Val Val Val Asp Gln Val Lys 115 120 125 Gly Phe Asp His Arg Ala Leu Ala Arg Glu Val Arg Ala Glu Val Pro 130 135 140 Ala Leu Lys His Val Val Val Ala Gly Asp Ala Glu Glu Phe Thr Ala 145 150 155 160 Leu Ala Asp Leu Tyr Arg Arg Gly Arg Asp Leu Pro Ala Val Asp Pro 165 170 175 Ser Glu Pro Ala Leu Phe Leu Leu Ser Gly Gly Thr Thr Gly Leu Pro 180 185 190 Lys Leu Ile Pro Arg Thr His Asp Asp Tyr Ala Tyr Asn Met Arg Ala 195 200 205 Thr Ala Asp Ala Leu Arg Phe Gly Ala Glu Asp Val Tyr Leu Ala Val 210 215 220 Asn Pro Ile Gly His Asn Ser Ala Leu Gly Cys Pro Gly Val Leu Gly 225 230 235 240 Ala Leu Leu Val Gly Gly Thr Ala Val Leu Thr Ser Ser Val Arg Pro 245 250 255 Asp Glu Val Phe Glu Leu Leu Glu Arg Glu Arg Val Thr Leu Thr Thr 260 265 270 Leu Val Pro Pro Val Val Arg Leu Trp Leu Asp Ala Ala Arg Lys Ser 275 280 285 Asp Val Arg Phe Pro Asn Leu Met Leu Gln Val Gly Ser Ser Lys Phe 290 295 300 Asp Pro Ala Arg Ala Ala Glu Val Arg Thr Ser Leu Gly Ala Val Leu 305 310 315 320 Thr Gln Trp Phe Gly Val Gly Glu Gly Leu Leu Thr Tyr Thr Arg Leu 325 330 335 Asp Asp Pro Glu Glu Val Val Leu Ala Thr Glu Gly Arg Pro Leu Ala 340 345 350 Ala His Asp Glu Ile Leu Val Val Asp Thr Asp Gly Arg Pro Val Pro 355 360 365 Asp Gly Ala Glu Gly Glu Leu Leu Val Arg Gly Pro Tyr Thr Ile Arg 370 375 380 Gly Tyr Tyr Arg Ala Glu Glu Gln Asn Arg Arg Ser Phe Thr Pro Asp 385 390 395 400 Gly Tyr Phe Arg Thr Gly Asp Met Val Arg Arg Arg Pro Asp Gly Ser 405 410 415 Ile Val Val Val Gly Arg Ile Lys Asp Ile Ile Asn Arg Gly Gly Glu 420 425 430 Lys Val Pro Ala Glu Glu Ile Glu Glu His Leu Leu Ala His Ala Ala 435 440 445 Ile Arg Asp Ala Ala Val Val Gly Val Ala Asp Pro Val Leu Gly Glu 450 455 460 Lys Thr Val Ala Phe Val Ile Leu Arg Asp Glu Pro Ile Ser Pro Ala 465 470 475 480 Ala Val Lys Ser Phe Leu Arg Glu Arg Gly Leu Ala Thr Tyr Lys Ile 485 490 495 Pro Asp Arg Val Val Pro Ile Glu Glu Phe Pro Arg Thr Ala Val Gly 500 505 510 Lys Val Asp Lys Val Thr Leu Arg Thr Ser Gly 515 520 <210> 14 <211> 596 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio13 Protein <400> 14 Val Pro Thr Val Ala Glu Leu Phe Glu Ser Val Val Ala Arg Ser Gly 5 10 15 Asp His Val Ala Val Ile Phe Gly Asp Arg Leu Val Ser Tyr Ala Glu 20 25 30 Leu Asp Ala Arg Ala Asn Arg Leu Ala Arg Val Leu Val Glu Arg Gly 35 40 45 Val Gly Pro Asp Thr Thr Val Ala Val Ala Met Pro Lys Cys Asp Glu 50 55 60 Leu Met Val Val Leu Leu Ala Val Leu Lys Ala Gly Gly Ala Tyr Leu 65 70 75 80 Pro Leu Asp Pro Gln Tyr Pro Ala Lys Arg Leu Ala Tyr Met Val Gln 85 90 95 Asp Ala Arg Pro Thr Leu Leu Val Arg Met Ala Gln Val Ser Leu Glu 100 105 110 Leu Gly Val Pro Val Ala Glu Leu Val Val Asp Asp Pro Asp Thr Ala 115 120 125 Arg Glu Thr Glu Ser Arg Pro Asp His Gln Leu Thr Asp Ala Ser Arg 130 135 140 Asn Ala Pro Leu Arg Pro Asp Asn Leu Met Tyr Val Ile Tyr Thr Ser 145 150 155 160 Gly Ser Thr Gly Thr Pro Lys Gly Val Ala Val Thr His Thr Gly Val 165 170 175 Ala Asp Ile Val Ala Ala Gln Thr Ala Ser Ile Ala Pro Arg Pro Gly 180 185 190 Asp Arg Val Leu Gln Trp Ala Ser Val Ser Phe Asp Ala Ala Phe Trp 195 200 205 Asp Trp Ser Ala Ala Leu Leu Ser Gly Ala Thr Leu Ile Met Ala Pro 210 215 220 Ala Asp Glu Leu Leu Pro Gly Gln Pro Leu Arg Asp Thr Leu Arg Arg 225 230 235 240 Tyr Ala Val Thr His Ala Val Leu Pro Pro Val Ala Leu Ser Val Thr 245 250 255 Glu Pro Asp Asp Val Leu Val Gly Gly Thr Leu Met Ser Thr Gly Asp 260 265 270 Ala Cys Thr Arg Ala Leu Val Ala Lys Trp Ala Pro Gly Arg Arg Met 275 280 285 Tyr Asn Gly Tyr Gly Pro Thr Glu Thr Thr Val Gly Ser Thr Ile Ala 290 295 300 Gly Pro Ile Ala Ile Ser Asp Glu Ile Thr Ile Gly Thr Pro Trp Ser 305 310 315 320 Gly Asn Arg Val Tyr Val Leu Asp Glu Arg Leu Arg Pro Val Pro Asn 325 330 335 Gly Arg Asp Gly Glu Leu Tyr Leu Ala Gly Asn Gly Leu Ala Arg Gly 340 345 350 Tyr Leu Asn Arg Pro Gly Leu Thr Ala Ser Arg Phe Val Leu Asp Pro 355 360 365 Phe Gly Pro Pro Gly Gly Arg Met Tyr Arg Ser Gly Asp Arg Gly His 370 375 380 Arg Arg Ala Asp Gly Gln Leu Val Phe Ala Ser Arg Gly Asp Asp Gln 385 390 395 400 Val Lys Ile Arg Gly Phe Arg Val Glu Leu Gly Glu Val Glu Ala Arg 405 410 415 Leu Ala Ala His Pro Ala Val Asp Val Ala Ala Val Val Val Val Gly 420 425 430 Asp Leu Ala Gly Ala Arg Leu Ala Ala Phe Val Ser Thr Val Ala Gly 435 440 445 Thr Gly Val Ser Ala Ala Glu Leu Ser Ala His Ser Ala Glu Thr Leu 450 455 460 Pro Glu His Met Val Pro Ser Ser Val Gln Val Leu Gln Arg Leu Pro 465 470 475 480 Val Thr Ala Asn Gly Lys Ile Asp Arg Ala Ala Leu Arg Asp Leu Ala 485 490 495 Glu Ser Ala Ala His Pro Asp Ala Ala Ala Ser Ala Gly Pro Pro Gly 500 505 510 Glu Asp Pro Thr Ser Val Glu Ser Arg Leu Cys Leu Leu Val Arg Glu 515 520 525 Leu Leu Ala Val Pro Asp Val Arg Pro Gly Asp Asn Phe Phe Lys Leu 530 535 540 Gly Gly His Ser Val Leu Ala Thr Arg Leu Ala Gly Arg Leu Arg Asp 545 550 555 560 Glu Trp Gly Ile Thr Val Pro Ile Arg Ala Val Phe Glu Ala Ala Thr 565 570 575 Leu Ser Glu Leu Ala Leu Val Val Gln Ala Ser Lys Ala Ser Ile Pro 580 585 590 Asn Gly Arg Pro 595 <210> 15 <211> 424 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio14 Protein <400> 15 Val Thr Gly Val Arg Thr Leu Thr Val Val Ala Ile Leu Ala Leu Thr 5 10 15 Ala Thr Ser His Gln Val Glu Pro Val Ala Ala Ser Gly Asp Val Leu 20 25 30 Gly Val Ala Thr Leu Ala Asp Thr Gln Thr Thr His Ala Leu Ile Ala 35 40 45 Asn Pro His Leu Arg Gly Thr Gly Ser Thr Ser Ser Gly Pro Gly Gly 50 55 60 Ala Pro Ala Glu Ala Leu Ser Arg Phe His Asp Leu Gly Ser Leu Ala 65 70 75 80 Gly Pro Gly Thr Pro Ser Glu Ala Thr Asp Leu Asn Asp Arg Gly Asp 85 90 95 Val Val Gly Val Thr Ser Leu Pro Gly Thr Gln Thr Ala His Ala Phe 100 105 110 Ile Ala Asn Pro Arg His Lys Gly Gly Arg Leu Ile Glu Ile Thr Pro 115 120 125 Ser Gln Ala Gly Ser Ser Arg Ala Gln Ala Ile Asn Arg Phe Gly Val 130 135 140 Val Ala Gly Thr Leu Gly Leu Gly Ile Gly Pro Pro Thr Pro Ala Pro 145 150 155 160 Asp Gly Ser Gln Pro Leu Leu Gln Pro Phe Val Trp Glu Ala Arg Thr 165 170 175 Gly Leu Asp Val Leu Pro Leu Pro Pro Gly Ala Gly Gly Ala Gln Ala 180 185 190 Val Asp Ile Asn Asp Lys Gly Thr Val Leu Val Val Gly Thr Asn Ala 195 200 205 Thr Gly Val Gly Leu Pro Val Gly Ser Tyr Leu Trp Asn Pro Ala Ser 210 215 220 Arg Thr Tyr Thr Thr Leu Pro Pro Pro Thr Thr Ser Val Thr Gly Pro 225 230 235 240 Val Ala Leu Ala His Thr Leu Asp Glu Arg Gly Gly Val Ala Gly Gly 245 250 255 Leu Val Thr Gln Val Gly Glu Gln Ser Trp His His Thr Ala Val Val 260 265 270 Trp Gln Pro Gly Thr Leu Ala Val Gln Gln Leu Pro Thr Gly Gly Ser 275 280 285 Ala Asp Thr Tyr Ala Thr Asp Arg Asn Glu Asn Gly Leu Ile Val Gly 290 295 300 Trp Arg Ile Asn Ala Thr Gly Gln Ser Thr Thr Ala Ile Tyr Trp Pro 305 310 315 320 Ser Ala Asn Ala Gln Pro Val Glu Leu Pro Gly Arg Val Ala Tyr Arg 325 330 335 Val Asn Asp Ala Gly Gln Ile Val Gly Ile Arg Asn Phe Thr Gly Ser 340 345 350 Ser Ala Tyr Pro Phe Ser Ala Val Met Trp Glu Pro Arg Arg Gly Arg 355 360 365 Thr Thr Arg Leu Gly Asp Asn Asp Leu Gly Ser Tyr Val Ile Ala Val 370 375 380 Asn Ala Ser Gly Arg Ser Ala Gly Phe Ala Val Ala Thr Arg Asn Gly 385 390 395 400 Asn Asn His Asn Thr Ala Gly Trp Trp Gly Pro Pro Arg Arg Gly Asp 405 410 415 Cys Pro Arg His Cys Ser Pro Arg 420 <210> 16 <211> 450 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio15 Protein <400> 16 Met Thr Thr Arg Ser Thr Glu Pro Ser Leu Ser Pro Leu Val Pro Gly 5 10 15 Leu Ser Arg Arg Gly Leu Leu Ile Ala Ala Ala Ser Thr Ala Ala Gly 20 25 30 Thr Ala Gly Leu Leu Ile Leu Pro Thr Lys Ala Glu Ala Ala Thr Ala 35 40 45 Ser Pro Arg His Gly Ser Arg Pro Asp Val Val Gly Pro Trp Phe Asp 50 55 60 Glu Met Leu Ala Thr Phe Ala Ala Ala Pro Thr Ala Gly Leu Pro Glu 65 70 75 80 Arg Met Trp Ala Met Ser Trp Ile Ala Ala Trp Ala Ala Leu Ser Ala 85 90 95 Arg Arg Ala Ala Pro Val Arg Ala Pro Gly Gln Arg Ala Val Phe Glu 100 105 110 Asp Ala Ala Thr Ala Thr Ala Val His Gly Val Leu Lys Ala Leu Val 115 120 125 Pro Gly Gln Ala Asp Lys Leu Asp Gly Val Leu Ala Asp Ser Leu Ala 130 135 140 Gly Leu Ala Ala Ser Glu Ala Lys Lys Ala Gly Ile Ala Ala Gly Arg 145 150 155 160 Glu Ala Ala Ala Ala Met Val Ala Val Arg Thr Gly Asp Gly Leu Asp 165 170 175 Leu Ala Ser Val Asn Val Pro Phe Thr Leu Pro Pro Glu Ala Pro Gly 180 185 190 Val Tyr Arg Leu Thr Pro Gly Ala Thr Gln Thr Val Ala Ala Gly Tyr 195 200 205 Gly Leu Ala Arg Pro Phe Leu Leu Gly Arg Ala Asp Arg Phe Arg Pro 210 215 220 Pro Pro Pro Pro Ala Leu Gly Thr Ala Pro Tyr Arg Arg Ala Leu Asp 225 230 235 240 Glu Val Arg Arg Leu Gly Gly Glu Val Ser Glu Arg Thr Glu Ala Gln 245 250 255 Ser Asp Leu Ala Trp Leu Asp Pro Leu Ser Gln Tyr Val Pro Val Leu 260 265 270 Arg Leu Leu Val Gly Asp Ser Ala Arg Ser Arg Arg Ser Lys Val Arg 275 280 285 Leu Leu Ala Ala Leu Gly Ala Ala Ile Val Asp Ser Ser Ile Ala Thr 290 295 300 Phe Glu Ala Lys Tyr Ala Leu Leu His Trp Arg Pro Val Thr Ala Ile 305 310 315 320 Arg Asp Ala Asp Thr Asp Gly Asp Pro Arg Thr Ala Pro Asp Pro Thr 325 330 335 Trp Asn Ser Phe Leu Pro Thr Pro Pro His Pro Glu Tyr Pro Ser Gly 340 345 350 His Ala Val Thr Ala Gly Ala Ala Glu Gln Val Leu Ser Gln Leu Val 355 360 365 Gly Pro Cys Thr Pro Met Ala Phe Ser Ile Thr Phe Ala Arg Gly Asp 370 375 380 Gly Arg Val Val Thr Arg Asn Tyr Arg Arg Gly Thr Pro Trp Ser Thr 385 390 395 400 Leu Thr Lys Glu Asn Ile Asp Ala Arg Val Leu Ala Gly Val His Phe 405 410 415 Arg Tyr Ser Asp Glu Val Gly Ala Ala Leu Gly Arg Gln Val Ala Arg 420 425 430 Tyr Asp Leu Asn Leu Leu Ala Arg Gly Gly Val Gly Pro Val Arg Val 435 440 445 Thr Trp 450 <210> 17 <211> 768 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio16 Protein <400> 17 Val Pro Trp Ser Val Trp Asn Gln Thr Ala Arg His Phe Arg Ala Asp 5 10 15 Val Thr Ile Pro Asp Leu Leu Ala Glu Ala Ala Glu Arg His Pro Asp 20 25 30 Arg Pro Ala Ile Val Thr Ser Asp Lys Gln Val Leu Thr His Arg Glu 35 40 45 Leu His Arg Arg Ala Asn Arg Leu Ala Arg Leu Leu Arg Asp Leu Gly 50 55 60 Val Gly Arg Gly Asp Thr Val Ala Leu Phe Gly Glu Arg Asp Ala Pro 65 70 75 80 Ala Leu Val Gly Leu Leu Ala Val Leu Lys Cys Gly Ala Ala Tyr Val 85 90 95 Pro Ile Asp Pro Ser Trp Pro Ala Arg Arg Val Val Gly Leu Leu Asp 100 105 110 Gln Leu Asp Val Ala Ala Val Leu Thr Asp Arg Thr His Leu Arg Ser 115 120 125 Met Gln Glu Leu Arg Trp Gln Val Arg Ser Leu Arg His Val Leu Cys 130 135 140 Pro Asp Ile Ala Glu Glu Phe Ser Trp Ser Ala Thr Phe Arg Pro Asp 145 150 155 160 Leu Val Val Asn Phe Phe Asp Phe Val Ser Ser Ala Pro Asp Gln Leu 165 170 175 Glu Ala Ala Gly Phe Asn Met Arg Arg Ser Glu Arg Pro Phe Asp Glu 180 185 190 Asn Asp Val Gln Gln Tyr Arg Asp His Val Ala Ala Phe Ala Leu Ala 195 200 205 Ala Thr Ala Ala Ala Arg Pro Ser Ile Leu Glu Ile Gly Ser Gly Ser 210 215 220 Gly Leu Ile Val Glu Ala Leu Ala Pro Arg Ala Ser Arg Tyr Val Ala 225 230 235 240 Ala Asp Pro Ser Pro Val Ser Val Thr Arg Ser Gln Glu Gly Gly Phe 245 250 255 Arg Ala Gly Gly Glu Val Asp Gly Val Val Cys Phe Ala His Glu Val 260 265 270 Ala Glu Arg Val Gln Gly Pro Phe Asp Val Ile Leu Leu Ala Ser Thr 275 280 285 Val Gln Phe Leu Pro Asp Leu Asp Tyr Leu Leu Ser Val Leu Gly Ser 290 295 300 Leu Leu Gly Leu Leu Ala Asp Asp Gly Val Ile Val Leu Ala Asp Leu 305 310 315 320 Ile Asp Pro Asp Leu Ser Asp Tyr Ser Gly Ile Arg Val Ala Pro His 325 330 335 Phe Ile Glu Arg Leu Pro Glu Phe Leu Pro Gly Val Thr Gly Gly Ser 340 345 350 Val His Arg Arg Gln Val Glu Thr Phe Thr Gly Glu Leu Ala Gln Arg 355 360 365 Tyr Asp Ala Val Ile Arg Val Ala Pro Ser Gly Asp Arg Pro Ala Ser 370 375 380 Gly Arg Glu Pro Leu Trp Thr Gly His His Ile Glu Leu Arg Pro Ser 385 390 395 400 Glu Pro Leu Ala Thr Gly Pro Thr Ala Asp Asp Val Cys Tyr Thr Ile 405 410 415 Phe Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Val Val Ser His 420 425 430 Arg Ser Ala Val Asn Leu Ile Asp Trp Val Asn Arg Ser Tyr Arg Val 435 440 445 Gly Pro Thr Asp Gln Ile Leu Phe Val Thr Ser Phe Cys Phe Asp Leu 450 455 460 Ser Val Tyr Asp Ile Phe Gly Val Leu Ala Ala Gly Gly Ser Val Arg 465 470 475 480 Leu Ala Ser Ala Ala Glu Leu Ala Glu Pro Asp Thr Leu Val Asp Leu 485 490 495 Leu Glu Gln Glu Glu Ile Thr Ile Trp Asp Ser Ala Pro Ala Ala Leu 500 505 510 Ala Met Val Met Pro Phe Val Gln Val Arg Glu Pro Ala Gly Arg Gly 515 520 525 Thr Leu Arg Leu Val Leu Leu Ser Gly Asp Trp Ile Pro Val Pro Leu 530 535 540 Pro Asp Gln Ile Arg Ala Ala Phe Pro Asn Ala Glu Val Val Ala Leu 545 550 555 560 Gly Gly Ala Thr Glu Cys Thr Val Trp Ser Asn His Tyr Arg Val Gly 565 570 575 Asp Val Asp Pro Gly Trp Pro Ser Ile Pro Tyr Gly Lys Pro Met Gln 580 585 590 Asn Ala Arg Tyr Tyr Val Leu Asp His Gly Leu Gly Pro Cys Pro Asn 595 600 605 Gly Ala Glu Gly Asp Leu Tyr Ile Ala Gly Glu Cys Val Ala Leu Gly 610 615 620 Tyr Ala Arg Ser Pro Gly Leu Thr Ala Ala Lys Phe Leu Pro Asp Pro 625 630 635 640 Trp Ala His Arg Thr Gly Glu Arg Met Tyr His Thr Gly Asp Arg Ala 645 650 655 Arg Trp Leu Pro Ser Gly Asp Leu Glu Phe Leu Gly Arg Leu Asp Asp 660 665 670 Gln Val Lys Val Arg Gly Tyr Arg Ile Glu Leu Gly Glu Val Gln Ser 675 680 685 Ala Leu Leu Gln Cys Ala Gly Val Arg Ala Ala Ser Val Val Ala Pro 690 695 700 Ser Gly Pro Gly Gly Arg Thr Leu Ala Ala Phe Tyr Val Pro Thr Ala 705 710 715 720 Glu Pro Leu Pro Thr Ala Glu Val Val Gly Ala Leu Gln Arg Ile Leu 725 730 735 Pro Ser Tyr Met Val Pro Thr Arg Ile Val Ala Leu Asp Glu Leu Pro 740 745 750 Leu Thr Asn Thr Gly Lys Val Asp Arg Ala Ala Leu Leu Ser Arg Leu 755 760 765 <210> 18 <211> 94 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio17 Protein <400> 18 Val Ala Asn Pro Asp Arg Asp Gly Asn Asp Gly Ser Ala Arg Gly Leu 5 10 15 Leu Arg Ala His Val Arg Ala Gly Trp Ala Ala Ala Leu Gln His Glu 20 25 30 Arg Phe Asp Asn Asp Asp Asp Phe Phe Ala Ile Gly Gly His Ser Leu 35 40 45 Leu Ile Ala Glu Ile Met Ala Gly Leu Gly Ala Leu Ala Gly Thr Arg 50 55 60 Leu Ser Leu Lys Leu Phe Phe Asp His Pro Thr Val Asn Glu Leu Thr 65 70 75 80 Asp Ala Leu Ala Ala His Glu Ala Phe Gly Ser Leu Ala Arg 85 90 <210> 19 <211> 259 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio18 Protein <400> 19 Met Gly Thr Arg Thr Lys Asn Arg Trp Phe Val Glu Val Ser Arg Ser 5 10 15 Arg Leu Lys Glu Cys Ala Leu Tyr Ala Ile Pro His Ala Gly Gly Gly 20 25 30 Val Ala Thr Val Arg Ser Leu Cys Val Glu Leu Gly Asp Ala Phe Asp 35 40 45 Thr Phe Gly Val Arg Leu Pro Gly Arg Glu Ser Arg Leu Gly Asp Pro 50 55 60 Val Val Thr Val Met Ser Arg Leu Ala Asp Glu Leu Ala Gly Glu Leu 65 70 75 80 Leu Arg His Ala Gln Gly Arg Pro Val Val Leu Tyr Gly His Cys Ser 85 90 95 Gly Ser Ala Ile Ala Tyr Glu Val Ala Arg Arg Met Asp Pro Ala Gln 100 105 110 Leu Arg Gly Leu Ala Val Ser Ser His Pro Ala Pro Gly Ser Val Arg 115 120 125 Arg Ala Pro Thr Trp Glu Leu Pro Arg Gln Glu Phe Leu Lys Gln Val 130 135 140 Val Thr Asp Gly Tyr Leu Pro Pro Glu Ile Ile Ala Asn Glu Glu Leu 145 150 155 160 Leu Asp Ile Tyr Glu Pro Ala Val Arg Ala Asp Tyr Glu Leu Val Glu 165 170 175 Thr Tyr Glu Leu Asp Leu Phe Gly Gly Gly Pro Val Glu Ala Val Ala 180 185 190 Ala Pro Thr Val Ala Ile His Gly Arg Asp Asp His Thr Ile Asp Pro 195 200 205 Val His Ile Asp Ala Trp Ser Ala Leu Thr Thr Gly Pro Phe Arg Val 210 215 220 Val Ser Leu Ala Gly Gly His Asn Leu Leu Leu Gly Arg Pro Ala Glu 225 230 235 240 Leu Ala Ala Ala Ile Cys Gln Gly Leu Ala Ser Asp Asn Arg Leu His 245 250 255 Asp His Arg <210> 20 <211> 245 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio19 Protein <400> 20 Met Arg Lys Lys Gly Trp Ile Arg Thr Leu Thr Thr Val Glu Lys Pro 5 10 15 Thr Gly Arg Leu Val Cys Phe Pro His Ser Gly Gly Ser Ala Thr Ala 20 25 30 Phe Ser Asp Trp Ala Asn Ala Met Pro Pro Gly Val Glu Leu Val Ala 35 40 45 Val Gln Tyr Pro Gly Arg Gly Asp Arg Phe Ala Glu His Leu Val Asp 50 55 60 Asp Val Ala Glu Met Ala Gly His Ile Val Val Glu Leu Leu Glu Leu 65 70 75 80 Pro Cys Arg Asp Gln Val Leu Phe Gly His Ser Leu Gly Ala Met Val 85 90 95 Ala Tyr Glu Thr Ala Met Leu Leu Arg Asp Met Arg Val Glu Pro Arg 100 105 110 Arg Leu Cys Ala Ser Ala Cys Leu Pro Pro Gly Gln Met Lys Asn Arg 115 120 125 Asp Val His Leu Lys Pro Asp Asp Glu Phe Trp Ala Ala Ile Cys Ala 130 135 140 Leu Gly Gly Ile Asp Pro Arg Val Ala Glu Ile Ala Glu Leu Arg Glu 145 150 155 160 Leu Phe Met Pro Thr Leu Arg Ser Asp Leu Arg Ala His Ala Asn Tyr 165 170 175 Arg Pro Gly Ser Gly Thr Thr Pro Leu Ser Cys Pro Val Ser Cys Tyr 180 185 190 His Gly Val Gly Asp Pro Leu Val Asp Glu Ser Arg Leu Thr Glu Trp 195 200 205 Ala Asp Val Thr Thr Gly Glu Phe Arg Leu Thr Val Arg Pro Gly Gly 210 215 220 His Phe His Val Ser Ile Asp Val Asp Gly Leu Val Ser Asp Ile Met 225 230 235 240 Gly Arg Glu Trp Ala 245 <210> 21 <211> 2594 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio20 Protein <400> 21 Met Gly Tyr Gly Gly Val Ser Ser Ala Gln Glu Ala Met Trp Leu Glu 1 5 10 15 Gln Asn Leu Ala Pro Glu Val Pro Asn Ser Thr Thr Thr Ile Trp Asp 20 25 30 Val Arg Gly Glu Leu His Leu Pro Asp Leu Glu Asp Ala Leu Arg Thr 35 40 45 Ala Leu Gly Glu Thr Ser Ala Leu Leu Val Asn Phe Arg Arg Glu Ser 50 55 60 Asp Glu Leu Arg Ile Val Pro Arg Lys Leu Asp Ala Trp Glu Pro Phe 65 70 75 80 Arg Ile Asp Ala Ser Asp Ala Ala Asp Pro Ala Ala Ala Ala Arg Glu 85 90 95 Phe Leu Thr Glu Gln Ile Arg Arg Pro Phe Asp Leu Gly Ala Asp Ala 100 105 110 Leu Phe Arg Ile Gly Thr Val Arg Leu Gly Asp Gly His His Leu Leu 115 120 125 Cys Leu Ile Met His His Ile Leu Thr Asp Ala Phe Gly Val Phe Thr 130 135 140 Leu Leu Ser Gln Arg Val Ala Glu Ile Tyr Arg Ala Leu Arg Ala Asp 145 150 155 160 Ser Pro Val Pro Asp Arg Pro Asp Thr Pro Ala Glu Ile Ala Gly Glu 165 170 175 Arg Glu Ala Thr Tyr Arg Ser Ser Glu Arg Phe Thr Asp Ala Ala Arg 180 185 190 Phe Trp Arg Asp Tyr Val Thr Ala Gly Gly Thr Ala Ala Arg Leu Pro 195 200 205 Thr Gly Met Arg Ala Gly Ala Thr Arg Thr Ala Ser Val Gly Phe Trp 210 215 220 Asp Gly Leu Thr Ala Pro Leu Gly Val Ala Ser Tyr Thr Ala Ser Val 225 230 235 240 Ala Ala Ser Glu Val Ala Arg Trp Arg Ala Ala Ala Asp Ser Thr Glu 245 250 255 Thr Ser Val Pro Asp Leu Leu Thr Ser Ala Ala Thr Ala Phe Leu His 260 265 270 Arg Leu Cys Asn Thr Pro Arg Pro Met Leu Ser Phe Thr Val Asn Tyr 275 280 285 Arg Arg Gly Asp Ile Lys Gln Ala Cys Gly Leu Tyr Ser Asn Ala Leu 290 295 300 Pro Leu Val Ile Glu Val Pro Ala Ala Gly Asp Phe Val Asp Leu Ala 305 310 315 320 Lys Ser Val Arg Leu Glu Arg Leu Arg Val Leu Arg Tyr Ala Glu Tyr 325 330 335 Asn Val Ser Leu Ile Lys Arg Ala Ala Gly His Ala Gly Asp Val Arg 340 345 350 Ser Pro Phe Gly Pro Val Val Asn Val Ile Pro Phe Leu Arg Glu Leu 355 360 365 Asp Leu Ala Gly Ala Val Gly Arg Phe Ala Gly Gly Thr Phe Gly Leu 370 375 380 Pro Asp Glu Val Arg Ile Ser Thr Tyr Val Asp Gly Gly Pro Asp Ser 385 390 395 400 Asp Leu Tyr Ile Arg Phe Asp Ala Pro Gly Arg Leu Tyr Thr His Glu 405 410 415 Asp Ile Ala Gly Leu Ala Glu Arg Phe Val Thr Phe Val Arg Ala Ala 420 425 430 Leu Thr Asp Pro Arg Ala Arg Val Arg Asp Ile Ser Ala Ile Gly Glu 435 440 445 Gln Glu Arg Val Ala Leu Leu Asp Arg Cys Ala Gly Pro Val Val Glu 450 455 460 Leu Ala Gly Val Thr Val Pro Val Leu Leu Asp Met Gln Ala Leu Ala 465 470 475 480 Thr Pro Asp Ala Ala Ala Val Val His Glu Asn Ala Val Leu Thr Tyr 485 490 495 Arg Glu Leu Ala Ala Arg Ser Asp Ala Leu Ala Arg Arg Leu Ala Glu 500 505 510 Cys Gly Ala Gly Pro Glu Arg Leu Val Ala Val Ala Val Pro Arg Ser 515 520 525 Ile Gly Leu Ala Val Ala Leu Cys Ala Val Leu Lys Ala Gly Ala Ala 530 535 540 Tyr Leu Pro Ile Asp Pro Asp Ser Pro Ala Glu Arg Val Glu Phe Met 545 550 555 560 Leu Gly Asp Ala Arg Pro Thr Leu Leu Leu Thr Val Ala Gly Thr Asp 565 570 575 Gly Leu Ala Ile Thr Pro Leu His Gly Ala Gln Pro Arg Trp Glu Ala 580 585 590 Ser Val Ile Glu Arg Thr Thr Ala Ala Ser Pro Ala Ala Thr Ser Gln 595 600 605 Ala Gly Gly Thr Gly Glu His Ala Ala Tyr Leu Arg Tyr Arg Ser Gly 610 615 620 Pro Phe Gly Pro Ala Ala Gly Val Val Val Thr His Ala Ala Leu Val 625 630 635 640 Asn Glu Leu Leu Trp Met Gln Gln Arg Tyr Arg Leu Asn Asp Thr Asp 645 650 655 Arg Val Leu His Lys Ala Pro Ala Ser Leu Asn Ala Ser Gly Trp Glu 660 665 670 Ile Phe Trp Pro Leu Ile Ala Gly Ala Thr Val Val Met Ala Thr Gln 675 680 685 Asp Val His Gly Asp Ala Thr Ala Leu Ala Ala Met Ile Arg Arg Thr 690 695 700 Gly Val Thr Thr Val His Val Val Pro Ser Val Leu Ala Glu Leu Val 705 710 715 720 Arg Asp Glu Ala Val Val Thr Ala Gly Lys Gly Leu Arg His Val Met 725 730 735 Cys Ser Gly Glu Val Leu Pro Ala Asp Leu Ala Ala Arg Phe His Glu 740 745 750 Ser Cys Asp Val Pro Val His Ser Leu Tyr Gly Pro Val Glu Ala Met 755 760 765 Pro Val Val Thr Ser Cys Asp Tyr Arg Pro Gly Ser Pro Thr Val Pro 670 675 680 Leu Gly Arg Pro Ile Ser Asn Ala Gly Val Tyr Val Leu Asp Ser Gln 685 690 695 700 Leu Gln Leu Thr Pro Pro Gly Val Val Gly Glu Val Tyr Val Thr Gly 705 710 715 Val Gly Leu Ala Arg Gly Tyr Leu His Arg Pro Ala Ala Thr Ala Asp 720 725 730 His Phe Val Ala Cys Pro Phe Gly Pro Ala Gly Thr Arg Met Tyr Arg 735 740 745 Thr Gly Asp Leu Ala Arg Trp Thr Asp Asp Gly Glu Leu Glu His Ala 750 755 760 Gly Ser Ala Asp Gln Arg Val Arg Ile Arg Gly Phe Trp Ala Ala Phe 765 770 775 780 Leu Glu Ile Glu Ala Val Leu Thr Ala His Pro Gly Val Asp Gln Ala 785 790 795 Ala Val Ile Ala Arg Pro Asp Gly Pro Asp Arg Ala Ala Gln Leu Ile 800 805 810 Ala Tyr Val Val Pro Ala Thr Gly Gly Arg Met Gly Ala Ala Gly Leu 815 820 825 Asp Val Asp Phe Ser Ala Gly Leu Asp Val Val Glu Leu Arg Arg Phe 830 835 840 Val Ala Ala Arg Leu Pro Glu His Leu Val Pro Ala Thr Ile Val Val 845 850 855 860 Leu Asp Arg Leu Pro Leu Thr Ala Glu Gly Lys Arg Asp His Ala Ala 865 870 875 Leu Pro Glu Pro Gln Ala Thr Arg Arg Ala His Arg Val Ala Arg Thr 880 885 890 Ala Glu Glu Arg Leu Leu Ala Asp Ala Phe Ala Glu Val Leu Gly Ala 895 900 905 Gly Arg Ile Gly Leu Asp Asp Asp Phe Phe Ala Leu Gly Gly Asp Ser 910 915 920 Ile Ser Ala Met Arg Val Val Ala Leu Ala Arg Ala Gly Gly Leu Ala 925 930 935 940 Leu Thr Ala Arg Thr Val Phe Glu Cys Arg Thr Val Ala Ala Leu Ala 945 950 955 Ala Val Ala Ala Pro Ala Asp Glu Pro Ala Val Ala Ala Ala Ala Glu 960 965 970 Gly Asp Gly Gly Arg Asp Asp Ala Gly Pro Ile Pro Leu Pro Pro Met 975 980 985 Ala Arg Leu Phe Ala Glu Arg Gly Pro Gly Leu Asp Arg Leu Ala Gln 990 995 1000 Trp Leu Val Leu Thr Leu Pro Ala Glu Met Ser Pro Asp Leu Leu Thr 1005 1110 1115 1120 Gly Ala Val Arg Ala Val Leu Asp Arg His Asp Val Leu Arg Ser Arg 1125 1130 1135 Leu Ala Asp Gly Gln Leu Leu Ile Gln Pro Pro Gly Ser Val Asp Val 1140 1145 1150 Asp Lys Leu Ile Arg Gln Val Pro Cys Ser Gly Asp Trp Ser Gly Pro 1155 1160 1665 Ser Trp Pro Ala Leu Leu Ala Asp Glu Ala Ala Lys Ala Val Gly Gln 1170 1175 1180 Leu Ser Ala Ser Ala Gly Gln Val Ile Arg Met Val Trp Phe Ala Pro 1185 1190 1195 1200 Pro Gly Gly Ala Pro Gly Arg Leu Leu Ile Ala Ala His His Leu Val 1205 1210 1215 Val Asp Gly Met Ser Trp Arg Val Leu Val Pro Asp Leu Ala Glu Ala 1220 1225 1230 Ala Ala Gln Ile Arg Ser Gly Arg Thr Pro Ala Leu Ala Pro Val Gly 1235 1240 1245 Thr Ser Leu Arg Ser Trp Leu Asp Glu Leu Ala Ala Glu Ala Val Arg 1250 1255 1260 Pro Glu Arg Val Ala Glu Leu Glu Leu Trp Arg Gly Ile Leu Ala Pro 1265 1270 1275 1280 Ser Gly Asp Pro Leu Gly Ala Arg Pro Leu Asp Pro Ala Val Asp Leu 1285 1290 1295 Thr Arg Thr Ala Gln Thr Leu Arg Val Glu Val Pro Ala Glu Leu Ser 1300 1305 1310 Arg Ala Leu Leu Thr Ser Val Pro Ala Thr Phe Arg Cys Gly Val Asp 1315 1320 1325 Asp Val Leu Leu Thr Ala Leu Ala Leu Ala Leu Ala Ser Arg Arg His 1330 1335 1340 Asn Ser Ala Gly Val Val Arg Leu Glu Gly His Gly Arg Gln Glu Glu 1345 1350 1355 1360 Leu Val Pro Gly Thr Asp Leu Thr Arg Thr Val Gly Trp Phe Thr Thr 1365 1370 1375 Val His Pro Val Arg Phe Asp Leu Ser Gly Leu Asp Leu Thr Asp Ala 1380 1385 1390 Ile Asn Gly Gly Pro Ala Ala Ala Glu Ala Leu Arg Arg Val Lys Glu 1395 1400 1405 Ser Arg Arg Val Leu Pro Asp Arg Gly Ile Gly Tyr Ser Leu Leu Arg 1410 1415 1420 Tyr Leu Asn Gln Ala Thr Gly Ala Met Leu Arg Asp Leu Pro Ala Asp 1425 1430 1435 1440 Glu Val Gly Phe Asn Tyr Leu Gly Arg Phe Ser Phe Asp Arg Ser Arg 1445 1450 1455 Thr Gly Arg Glu Met Ala Trp Thr Ser Ala Pro Glu Ser Ala Ala Leu 1460 1465 1470 Val Ala Ala Pro Asp Pro Asp Met Pro Leu Ile Ser Ala Leu Glu Leu 1475 1480 1485 Asn Ser Leu Val Val Asp Thr Asp His Gly Glu Gln Leu Gln Ala Leu 1490 1495 1500 Phe Thr Phe Ala Thr Gly Val Leu Ala Thr Asp Glu Val Arg His Leu 1505 1510 1515 1520 Ala Asp Asp Trp Gln Ala Ala Leu Arg Gly Ile Arg Ala Gln Ala Ala 1525 1530 1535 Thr Gly Ala Ser Gly Leu Thr Pro Ser Asp Val Pro Leu Val Arg Val 1540 1545 1550 Arg Gln Gln Asp Leu Asp Asp Trp Gln Ser Arg Phe Gly Arg Val Asp 1555 1560 1565 Asp Val Trp Pro Leu Thr Pro Leu Gln His Gly Leu Leu Tyr His Ser 1570 1575 1580 Leu Leu Gly Asp Ser Ala Ala Ala Ser Tyr Gln Thr Gln Phe Val Leu 1585 1590 1595 1600 Arg Ile Asn Gly Pro Val Asp Pro Ala Arg Leu Arg Gly Ala Ala Gln 1605 1610 1615 Thr Leu Leu Asn Arg His Pro Asn Leu Arg Val Ala Phe Leu Thr Lys 1620 1625 1630 Ser Thr Gly Glu Pro Val Gln Val Val Val Asp Gly Val Glu Val Pro 1635 1640 1645 Phe Ala His Val Asp Leu Ala Gly Gln Pro Gln Ala Glu Glu Arg Leu 1650 1655 1660 Ala Arg Ile Leu Ala Glu Glu Arg Glu Ala Gln Phe Arg His Asp Ser 1665 1670 1675 1680 Ala Pro Leu Leu Arg Phe Ser Leu Ile Thr Leu Thr Pro Thr Gln Ala 1685 1690 1695 Glu Leu Ala Leu Thr Ala His His Val Leu Phe Asp Gly Trp Ser Leu 1700 1705 1710 Pro Leu Ile Glu Gln Gln Leu Met His Leu Tyr Ala Gly Gly Ala Asp 1715 1720 1725 Ala Leu Glu Leu Val Glu His Gly Tyr Arg Glu Phe Leu Arg Trp His 1730 1735 1740 Ser Arg Gln Asn Ala Asp Glu Ala Leu Ala Ala Trp Thr Glu Glu Leu 1745 1750 1755 1760 Ala Asp Ala Thr Gln Pro Thr Leu Leu Ala Ser Gly Phe Ala Pro Ala 1765 1770 1775 Glu Gln Ala Gly Thr Ser Thr Glu Ile Gly Gln Val Asp Val Leu Leu 1780 1785 1790 Thr Arg Gln Glu Ala Ala Ser Ala Val Arg Arg Ala Ala Asp Cys Gly 1795 1800 1805 Ile Thr Pro Asn Val Leu Val Gln Gly Ala Trp Ala Val Val Leu Ala 1810 1815 1820 Gln Leu Thr Gly Asn Ala Asp Val Leu Phe Gly Ser Ser Val Thr Val 1825 1830 1835 1840 Arg Pro Pro Glu Leu Pro Gly Ala His Thr Val Val Gly Met Phe Thr 1845 1850 1855 Asn Thr Val Pro Val Arg Val Arg Cys Ala Pro Ala Asp Ser Leu Glu 1860 1865 1870 Gly Met Leu Gln Ala Val Gln Asp Ala Gln Ala Arg Thr Leu Asp His 1875 1880 1885 Tyr His Val Gly Leu Gly Asp Ile Gln Arg Ala Thr Gly Leu Thr Thr 1890 1895 1900 Leu Phe Asp Thr Ile Val Ile Phe Glu Ser Phe Pro Val Asp Arg Ala 1905 1910 1915 1920 Ala Leu Ser Lys Ala Ser Ala Ser Ala Glu Leu Thr Val Thr Gly Ile 1925 1930 1935 Arg Pro Phe Ala Pro Thr His Tyr Pro Leu Thr Val Leu Ala Ala Ala 1940 1945 1950 Asp Pro Leu Leu Ser Leu Thr Leu Gln Tyr His Pro Asp Ala Leu Ala 1955 1960 1965 Pro Ser Thr Val Gln Ala Ile Ala Asp Arg Phe Ala Arg Val Leu Arg 1970 1975 1980 Gln Phe Ala Ala Asp Pro Arg Thr Arg Ile Ala Ala Ile Asp Val Leu 1985 1990 1995 2000 Ser Glu Ala Glu Arg Gln Leu Val Val His Asp Trp Asn Ala Thr Ala 2005 2010 2015 Leu Glu Val Pro Pro Glu Phe Val Pro Glu Gln Phe Ala Arg Gln Ala 2020 2025 2030 Ala Ala Thr Pro Asp Ala Val Ala Val Val Val Gly Glu Gln His Leu 2035 2040 2045 Thr Tyr Ala Glu Leu Ser Glu Arg Ala Asn Arg Met Ala His Trp Leu 2050 2055 2060 Ile Ala Gln Gly Ile Gly Ala Glu Ser Arg Val Val Val Leu Leu Pro 2065 2070 2075 2080 Arg Ser Ala Asp Leu Val Ala Ala Leu Leu Ala Val Trp Gln Ala Gly 2085 2090 2095 Gly Cys Tyr Val Pro Val Asp Pro Asp Tyr Pro Ala Ala Arg Val Arg 2100 2105 2110 Ser Val Ile Asp Asp Cys Ala Ala Thr Leu Val Leu Asp Glu Asn Leu 2115 2120 2125 Leu Asp Arg Thr Asp Leu Ser Arg Tyr Pro Ala His Ala Pro Ala Ile 2130 2135 2140 Ala Val Ala Pro Gly Gln Ala Ala Tyr Thr Ile Tyr Thr Ser Gly Ser 2145 2150 2155 2160 Thr Gly Lys Pro Lys Gly Val Val Ile Gly His Asp Ala Leu Thr Asn 2165 2170 2175 Phe Leu Ala Ser Met Gln Arg Thr Leu Arg Leu Ser Ala Gln Asp Arg 2180 2185 2190 Phe Ala Ala Val Thr Thr Ile Ala Phe Asp Ile Ala Ala Leu Glu Leu 2195 2200 2205 Phe Leu Pro Leu Thr Thr Gly Ala Arg Val Val Leu Ala Asn Arg Glu 2210 2215 2220 His Val Ala Asn Pro Pro Ala Met Leu Asp Leu Val Glu Gln Thr Gly 2225 2230 2235 2240 Val Thr Val Met Gln Ala Thr Pro Ala Leu Trp Gln Met Leu Ala Thr 2245 2250 2255 His Asp Val Arg Arg Leu Ser Gly Val Arg Val Leu Thr Gly Gly Glu 2260 2265 2270 Ala Leu Pro Arg Pro Leu Ala Glu Gly Leu Cys Ala His Ala Ala Gln 2275 2280 2285 Val Ile Asn Leu Tyr Gly Pro Thr Glu Thr Thr Val Trp Ser Thr Leu 2290 2295 2300 Ala Asp Val Ala Thr Cys Lys Pro Pro Ser Ile Gly Thr Pro Ile Ala 2305 2310 2315 2320 Asn Thr Gln Val Leu Ile Leu Asp Ser Ala Leu Arg Pro Val Pro Pro 2325 2330 2335 Gly Val Gly Gly Asp Leu Trp Ile Ala Gly Asp Gly Leu Ala Arg Gly 2340 2345 2350 Tyr His Arg Gln Pro Gly Leu Thr Ala Ser Arg Phe Val Ala Asn Pro 2355 2360 2365 Phe Gly Pro Gln Gly Ala Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg 2370 2375 2380 Trp Ser Glu Ser Gly Arg Ile Glu Phe Leu Gly Arg Ala Asp Phe Gln 2385 2390 2395 2400 Ile Lys Leu Arg Gly Phe Arg Ile Glu Pro Gly Asp Val Glu His Ala 2405 2410 2415 Leu Thr Arg His Pro Ala Val Arg Glu Ala Val Val Thr Ile Arg Glu 2420 2425 2430 Asp Gln Pro Asp Asp Lys Arg Leu Val Gly Tyr Val Val Val Ala Glu 2435 2440 2445 Asp Ala Glu Thr Pro Pro Thr Arg Glu Leu Gln Gln Phe Val Arg Glu 2450 2455 2460 Gln Leu Pro Asp Tyr Met Val Pro Ser Ala Val Val Thr Leu Pro Ala 2465 2470 2475 2480 Ile Pro Leu Thr Ala Asn Gly Lys Leu Asp Arg Ser Arg Leu Pro Arg 2485 2490 2495 Pro Glu Ala Ser Ser Thr Lys Tyr Arg Ala Pro Glu Ser Ala Arg Glu 2500 2505 2510 Val Ala Leu Cys Gly Ile Phe Ala Glu Val Leu Gly Ala Glu Arg Val 2515 2520 2525 Gly Val Asp Asp Asp Phe Phe Ala Leu Gly Gly His Ser Leu Leu Ala 2530 2535 2540 Thr Arg Leu Ala Ala Arg Leu Arg Ser Asp Leu Gly Val Glu Val Pro 2545 2550 2555 2560 Ile Arg Thr Ile Phe Ala Ala Pro Thr Val Ala Glu Leu Ala Arg Arg 2565 2570 2575 Trp Ser Gly Leu Ser Thr Ser Val Arg Lys Pro Leu Arg Arg Met Thr 2580 2585 2590 Glu Arg <210> 22 <211> 3140 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio21 Protein <400> 22 Met Ala Pro Val Ser Tyr Ala Gln Gln Arg Met Trp Phe Ile Asn Arg 1 5 10 15 Phe Glu Gly Gln Thr Ala Thr Tyr Asn Ile Pro Ile Leu Ile Arg Met 20 25 30 Arg Gly Gln Ile Asp Arg Asp Glu Leu Arg Ala Ala Phe Met Asp Val 35 50 55 Leu Ser Arg His Glu Ile Leu Arg Thr Val Tyr Asp Glu Leu Asp Gly 50 55 60 Gln Pro Leu Gln Arg Ile Ile Glu Pro Ala Glu Leu Ser Leu Pro Trp 65 70 75 80 Thr Asp Trp Gly Trp Val Ser Pro Gln Gln Val Asp Ser Ile Val Ala 85 90 95 Ala Ser Val Arg Glu Gly Phe Asp Leu Ser Val Asp Leu Pro Ile Arg 100 105 110 Ala Tyr Leu Leu Arg Pro Glu Pro Asp Val Ala Leu Leu Ala Val Val 115 120 125 Ile His His Ile Ala Gly Asp Gly Gly Ser Leu Gly Pro Phe Thr Arg 130 135 140 Asp Leu Ser Ala Ala Tyr Arg Ala Arg Leu Ala Gly Val Ala Pro Thr 145 150 155 160 Trp Asp Glu Leu Pro Val Gln Tyr Ser Asp Tyr Ala Leu Trp Gln Arg 165 170 175 Glu Leu Leu Gly Asp Glu Ser Asp Pro Asp Ser Val Phe Ser Thr Gln 180 185 190 Leu Arg Tyr Trp Arg Gln Glu Leu Asp Gly Val Ser Arg Pro Val Ala 195 200 205 Leu Pro Val Asp Arg Pro Arg Pro Ala Arg Ala Ser Tyr Arg Gly Asp 210 215 220 Asn His Gly Phe Glu Ile Pro Ala Ala Leu Phe Glu Lys Val Glu Arg 225 230 235 240 Leu Ala Gln Ser Tyr Asn Val Thr Val Pro Met Val Phe Gln Thr Ala 245 250 255 Leu Val Val Leu Leu His Arg Leu Gly Gly Asp Arg Asp Ile Thr Leu 260 265 270 Gly Ser Pro Ile Ala Gly Arg Thr Asp Gln Ala Leu Glu Asn Leu Val 275 280 285 Gly Phe Phe Val Asn Thr Trp Val Leu Arg Val Gly Val Cys Thr Gly 290 295 300 Asp Ser Phe Ala Gln Val Leu Glu Gln Val Arg Gln Lys Ala Ile Ala 305 310 315 320 Ala Tyr Asp His Gln Asp Leu Pro Phe Glu Arg Leu Val Glu Leu Leu 325 330 335 Arg Pro Gly Arg Ser Val Ala His His Pro Leu Phe Gln Val Thr Leu 340 345 350 Ala Trp Gln Asn Ser Val Arg Gln Glu Leu Asp Leu Pro Gly Val Thr 355 360 365 Ala Ser Met Glu Pro Val Ala Thr Gly Thr Ala Lys Phe Asp Leu Phe 370 375 380 Val Asn Leu Met Pro Asn His Ser Arg Arg Ser Val Thr Val Asp Leu 385 390 395 400 Glu Tyr Ala Thr Asp Leu Phe Asp Pro Ala Thr Val Glu Ala Ile Ala 405 410 415 Ala Arg Tyr Leu Arg Val Leu Glu Gln Val Val Glu Ser Pro Asp Leu 420 425 430 Gly Val Gly Ile Leu Asp Val Pro Ala Met Pro Ala Thr Arg Gly Glu 435 440 445 Arg Thr Val Asp Ala Gly Glu Arg Glu Lys Ile Leu Tyr Arg Trp Asn 450 455 460 Asp Thr Asp Arg Ser Phe Pro Cys Pro Gly Pro Ile His Leu Pro Phe 465 470 475 480 Glu Gln Gln Ala Ala Ala Arg Pro Asp Ala Ile Ala Val Arg Trp Ser 485 490 495 Gly Gly Thr Met Thr Tyr Arg Glu Leu Asn Arg Gln Ala Asn Arg Ile 500 505 510 Ala Trp Thr Leu Lys Arg Arg Gly Val Arg Pro Glu Thr Val Val Gly 515 520 525 Val Ala Val Arg Arg Gly Pro Leu Met Val Ala Ala Val Leu Gly Val 530 535 540 Leu Lys Ala Gly Gly Ala Tyr Leu Pro Ile Gly Ser Thr Leu Pro Ser 545 550 555 560 Asp Arg Val Ala Gly Met Leu Ala Asp Ala Ser Ala Thr Leu Val Leu 565 570 575 Thr Thr Glu Asp Thr Asn Arg Trp Thr Pro Pro Asp Gly Val Glu Leu 580 585 590 Leu Asp Val Gly Arg Ala Gly Leu Ala Leu Ser Leu Asp Gly Glu Ile 595 600 605 Asn Pro Glu Pro Val Ala Ser Ala Asp Asn Thr Ala Tyr Ile Ile Phe 610 615 620 Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Val Thr Val Ala His Arg 625 630 635 640 Pro Val His Asn Leu Leu Asn Trp Cys Tyr Arg Thr Phe Asp Phe Gly 645 650 655 Pro Asp Asp Val Ser Leu Cys Val Thr Ser Leu Asp Phe Asp Leu Ser 660 665 670 Val Phe Asp Ile Phe Gly Leu Leu Gly Ala Gly Gly Gly Phe Tyr Ile 675 680 685 Ala Asp Ala Thr Gln Gln Arg Asp Pro Glu Met Leu Leu Asp Val Leu 690 695 700 Leu Ser Glu Pro Ile Thr Phe Trp Asn Ser Val Pro Gly Thr Leu Asn 705 710 715 720 Gln Leu Ala Pro Leu Leu Pro Gln Thr Ala Gly Ser Pro Gly Val Gln 725 730 735 Asp Leu Arg Leu Val Phe Phe Ser Gly Asp Tyr Thr Pro Leu Ser Leu 740 745 750 Pro Asp Gln Val Arg Ala Val Phe Pro His Ala Glu Ile Ile Ser Leu 755 760 765 Gly Gly Ala Thr Glu Ala Thr Val Trp Ser Asn Phe Phe Pro Val Gly 770 775 780 Ala Ile Asp Pro Gln Trp Arg Ser Ile Pro Tyr Gly Arg Pro Ile Asp 785 790 795 800 Asn Ala Arg Tyr Tyr Val Leu Asp Glu Lys Leu Glu Pro Cys Ala Val 805 810 815 Gly Val Glu Gly Asp Leu Tyr Ile Gly Gly Pro Val Ile Ala Leu Gly 820 825 830 Tyr Val Asn Arg Pro Asp Leu Thr Ala Glu Arg Phe Ile Ala Asp Pro 835 840 845 Phe Gly Gly Val Pro Gly Gln Arg Ile Tyr Arg Thr Gly Asp Arg Ala 850 855 860 Ser Phe Phe Pro Asp Gly Asn Ile Cys Phe Leu Gly Arg Ala Asp Gly 865 870 875 880 Gln Val Lys Val Arg Gly Phe Arg Ile Glu Leu Gly Glu Ile Glu Tyr 885 890 895 Ala Leu Gly Arg His Pro Ala Val Arg Gln Gly Ile Ala Ile Thr Arg 900 905 910 Arg Asp Ser Val Gly Asp Leu Arg Leu Val Ser Tyr Val Leu Pro Asp 915 920 925 Leu Asp Thr Val Glu Ser Val Val Ala Ala Asp Glu Gln Val Arg Glu 930 935 940 Trp Gln Glu Ile Tyr Asp Gln Gly Tyr Leu Glu Val Thr Asp Gln Asp 945 950 955 960 Phe Gly Asp Asp Phe Asn Leu Trp Val Ser Ser Tyr Thr Gly Glu Pro 965 970 975 Ile Pro Val Gly Gln Met Arg Glu Trp Gln Asp Ala Ala Val Asp Arg 980 985 990 Ile Leu Ser Phe Thr Pro Arg Arg Val Leu Glu Val Gly Ala Gly Thr 995 1000 1005 Gly Leu Leu Leu Ala Arg Val Ala Gly Ser Val Glu Ala Tyr Trp Ala 1010 1015 1020 Thr Asp Phe Ser Glu Pro Val Ile Glu Arg Leu Gly Arg Gln Val Thr 1025 1030 1035 1040 Glu Ala Gly Trp Ala Glu Arg Val Arg Leu Leu Cys Arg Arg Ala Asp 1045 1050 1055 Asp Leu Asp Gly Ile Pro Arg Ile Phe Asp Thr Val Val Leu Asn Ser 1060 1065 1070 Val Val Gln Tyr Phe Pro Asn Glu Arg Tyr Leu Glu Gln Val Leu Asp 1075 1080 1085 Gly Val Trp Ala Met Leu Glu Pro Gly Gly Arg Leu Val Leu Gly Asp 1090 1095 1100 Ile Arg Arg Ala Arg Ser Leu Arg Ala Phe Gln Val Ala Val Gln Gln 1105 1110 1115 1120 Ala Lys His Gly Asn Leu Pro Pro Ala Gln Leu Arg Ser Ala Val Glu 1125 1130 1135 Gln Gly Leu Leu Leu Glu Lys Glu Leu Val Ile Asp Pro Glu Trp Phe 1140 1145 1150 Gln Arg Trp Ala Glu Arg Ala Gly Ala Ala Gly Val Asp Val Arg Leu 1155 1160 1165 Lys Glu Gly Ala Phe Gln Asn Glu Leu Thr Arg His Arg Tyr Glu Ile 1170 1175 1180 Val Val His Lys Pro Gly Thr Thr Glu Ala Gly Arg Pro Tyr Ala Val 1185 1190 1195 1200 Asp Thr Val Pro Arg Leu Glu Trp Asn Gly Asp Leu Asp Gly Leu Ala 1205 1210 1215 Glu Arg Ile Arg Thr Leu Gly Gly Pro Val Val Arg Ile Ala Gly Ile 1220 1225 1230 Pro Asn Ala Arg Val Ala Gln Glu Val Ala Ala Ala Arg Asp Leu Gly 1235 1240 1245 Leu Glu Glu Ser Glu Pro Pro Thr Ser Val Pro Val Asp Pro His Glu 1250 1255 1260 Met Ala Thr Trp Ala Ala Arg Gln Gly Trp Ser Ile Ala Leu Thr Trp 1265 1270 1275 1280 Ser Gly Ser Ala Val Asp Gln Phe Glu Ala Val Leu Phe Thr Asp Ala 1285 1290 1295 Thr Thr Glu His Arg Ala Leu Ser Gly Thr Tyr Leu Pro Val Ala Ala 1300 1305 1310 Ala Gly Thr Trp Ile Asn Asp Pro Ala Ala Ala Ala Gly Ile Thr Ala 1315 1320 1325 Leu Pro Ala Val Leu Arg Glu Tyr Leu Ser Lys Thr Leu Pro Glu Tyr 1330 1335 1340 Met Val Pro Ser Ala Ile Val Pro Ile Gly Arg Val Pro Leu Thr Pro 1345 1350 1355 1360 Asn Gly Lys Leu Asp Arg Ala Ala Leu Pro Val Pro Glu Tyr Ala Ala 1365 1370 1375 Ala Ser Arg Gly Arg Pro Pro Cys Thr Ser Glu Glu Glu Ser Leu Cys 1380 1385 1390 Glu Ile Phe Ala Gly Val Leu Gly Leu Asp Arg Val Gly Val Asp Asp 1395 1400 1405 Asn Phe Phe Thr Ile Gly Gly His Ser Leu Leu Ala Thr Arg Val Val 1410 1415 1420 Ser Arg Ile Arg Ala Ala His Gly Val Glu Ile Pro Ile Arg Thr Ile 1425 1430 1435 1440 Phe Glu Ala Pro Thr Val Ala Glu Leu Val Ala His Leu Thr Gly Gln 1445 1450 1455 Arg Thr Val Arg Pro Pro Leu Arg Pro Gln Pro Arg Pro Asp Arg Leu 1460 1465 1470 Pro Val Ser Phe Ala Gln Gln Arg Leu Trp Phe Ile His Arg Phe Glu 1475 1480 1485 Gly Pro Ser Pro Thr Tyr Ile Ile Pro Leu Ser Met Arg Leu Arg Gly 1490 1495 1500 Lys Leu Asp Val Pro Ala Leu Arg Gln Ala Val His Asp Val Val Val 1505 1510 1515 1520 Arg His Glu Ser Leu Arg Thr Val Phe Asp Glu Val Asp Gly Ala Pro 1525 1530 1535 Tyr Gln Arg Val Leu Asp Pro Asp Gly Leu Ala Ile Pro Trp Gln Glu 1540 1545 1550 His Glu Val Thr Glu Ser Ala Leu Gln Glu Ala Leu Arg Leu Glu Ala 1555 1560 1565 Arg Arg Pro Phe Asp Leu Ala Ala Glu Ile Pro Val Arg Ala Ala Leu 1570 1575 1580 Phe Arg Val Gly Glu His Asp Ala Val Leu Leu Leu Pro Leu His His 1585 1590 1595 1600 Ile Ala Ala Asp Gly Trp Ser Leu Gly Pro Leu Ala Glu Asp Leu Thr 1605 1610 1615 Ala Ala Tyr Thr Ala Arg Cys Asp Gly Gln Arg Pro Gln Trp Ala Ala 1620 1625 1630 Leu Pro Val Gln Tyr Ala Asp Tyr Thr Leu Trp Gln Arg Asp Leu Leu 1635 1640 1645 Gly Gly Asp Asp Pro His Ser Leu Tyr Arg Arg Gln Leu Asp Tyr Trp 1650 1655 1660 Thr Gly Gln Leu Ala Gly Leu Pro Glu Ser Leu Gln Leu Pro Thr Asp 1665 1670 1675 1680 Arg Ala Arg Pro Ala Val Ala Ser Phe Ala Gly Glu Val Leu Pro Val 1685 1690 1695 Glu Leu Asp Glu Ser Leu Thr Glu Asp Leu Arg Lys Leu Ala Leu Arg 1700 1705 1710 Thr Gly Thr Thr Val Ser Met Val Leu Gln Ala Gly Leu Ala Gly Leu 1715 1720 1725 Leu Ser Lys Leu Gly Ala Gly Asn Asp Ile Pro Ile Gly Ser Pro Ile 1730 1735 1740 Ala Gly Arg Thr Asp Glu Ala Leu Asn Arg Leu Val Gly Phe Phe Val 1745 1750 1755 1760 Asn Thr Trp Val Ala Arg Val Asp Thr Ser Gly Ser Pro Ser Leu Ile 1765 1770 1775 Glu Leu Val Asp Arg Val Arg Glu Val Ser Leu Ala Ala Tyr Asp His 1780 1785 1790 Gln Asp Ile Pro Phe Glu His Leu Val Glu Ala Leu Asn Pro Val Arg 1795 1800 1805 Ser Thr Ala His His Pro Leu Phe Gln Val Cys Leu Ala Leu Gln Asn 1810 1815 1820 Asn Val Gln Pro Ala Phe Asp Leu Pro Gly Leu Lys Val Ser His Glu 1825 1830 1835 1840 Pro Val Asp Met Gly Val Ser Arg Phe Asp Leu Phe Leu Asn Leu Met 1845 1850 1855 Glu Glu Thr Thr Gly Glu Gly Thr Ser Arg Ile Ala Gly Val Val Glu 1860 1865 1870 Tyr Ala Thr Glu Leu Phe Asp Arg Asp Thr Val Thr Gly Leu Leu Glu 1875 1880 1885 Arg Trp Arg Arg Leu Leu Arg Gln Trp Val Gly Ala Pro Asp Ala Pro 1890 1895 1900 Ile Asp Ala Val Glu Ile Leu Asn Arg Asp Asp Leu Ala Ala Leu Glu 1905 1910 1915 1920 Arg Trp Thr Gly Arg Ala Arg Gly Thr Asp Arg Val Val Gly Thr Ile 1925 1930 1935 Pro Glu Arg Phe Ala Ala Val Val Ala Glu Gln Pro Glu Ala Val Ala 1940 1945 1950 Leu Val Ala Ala Asp Gly Glu Glu Ser Trp Thr Tyr Gly Glu Leu Asp 1955 1960 1965 Arg Trp Ala Asn Arg Ile Ala His His Leu His Ala Arg Gly Val Gly 1970 1975 1980 Arg Gln His Arg Val Ala Leu Val Met Glu Arg Ser Pro Leu Leu Val 1985 1990 1995 2000 Ala Ala Val Leu Gly Thr Leu Lys Ala Gly Ala Cys Tyr Val Pro Val 2005 2010 2015 Glu Pro Thr Trp Pro Arg Ala Arg Ile Asp Leu Val Leu Ala Asp Leu 2020 2025 2030 Asp Pro Ala Leu Val Ile Asp Glu Arg Leu Ala Glu Glu Asp Leu Thr 2035 2040 2045 Gly Tyr Pro Thr Arg Pro Leu Asp Thr Ala Asp Val Gly Gly Glu His 2050 2055 2060 Leu Ala Tyr Leu Met Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly 2065 2070 2075 2080 Val Glu Val Ser His Arg Asn Val Leu Ser Leu Ala Leu Asp Pro Cys 2085 2090 2095 Trp Ala Asp Ala Asp His Gln Arg Val Leu Val His Ala Pro Pro Thr 2100 2105 2110 Phe Asp Ala Ser Thr Tyr Glu Met Trp Val Pro Leu Leu His Gly Gly 2115 2120 2125 Ala Ala Val Val Ala Pro Pro Gly Lys Leu Asp Ala Ala Arg Leu Ala 2130 2135 2140 Thr Leu Ile Ala Glu Arg Gly Val Thr Ala Leu Trp Leu Pro Ala Gly 2145 2150 2155 2160 Leu Phe Asp Leu Ile Thr Gln His His Pro Lys Ser Phe Val Gln Val 2165 2170 2175 Arg Glu Val Trp Ala Gly Gly Asp Val Leu Ser Pro Ala Ala Val Arg 2180 2185 2190 Arg Leu Val Arg Asp Asp Gly Thr Leu Thr Val Val Asn Gly Tyr Gly 2195 2200 2205 Pro Thr Glu Thr Thr Thr Phe Ala Ala Arg Tyr Arg Met Ser Ala Pro 2210 2215 2220 Ala Arg Cys Lys Asp Pro Leu Pro Ile Gly Glu Pro Met Ala Gly Ser 2225 2230 2235 2240 Arg Leu Tyr Ala Leu Asp Asp Arg Leu Arg Gln Val Pro Gln Gly Val 2245 2250 2255 Ile Gly Glu Leu Tyr Val Gly Gly Asp Gly Val Ala Arg Gly Tyr Ala 2260 2265 2270 Asn His Pro Pro Leu Thr Ser Glu Arg Phe Val Ala Asp Pro Phe Gly 2275 2280 2285 Arg Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Asn 2290 2295 2300 His Asp Gly Gln Leu Glu Phe Leu Gly Arg Val Asp Glu Gln Val Lys 2305 2310 2315 2320 Ile Arg Gly Phe Arg Val Glu Pro Gly Glu Ile Arg Ala Ala Leu Arg 2325 2330 2335 Lys Arg Asp Gly Val Ala Gln Ala Val Val Val Pro Arg Thr Asp Arg 2340 2345 2350 Leu Gly Glu Arg Arg Leu Val Ala Tyr Val Val Pro Glu Val Pro Ala 2355 2360 2365 Gly Ala Asp Glu Asp Ser Thr Glu His Val Glu Lys Trp Arg Ala Ile 2370 2375 2380 Tyr Asp Ser Met Tyr Asp Glu Thr Glu Ala Asp Ala Thr Glu Ile Gly 2385 2390 2395 2400 Asn Asp Phe Thr Gly Trp Lys Ser Ser Tyr Thr Arg Asp Asn Ile Pro 2405 2410 2415 Leu Ser Glu Met Arg Arg Trp Arg Asp Ser Val Val Glu Glu Val Arg 2420 2425 2403 Gly Leu Arg Ala Arg Arg Ile Leu Glu Ile Gly Val Gly Ser Gly Leu 2435 2440 2445 Leu Leu Gly Pro Leu Ala Pro Glu Ala Glu Ala Tyr Trp Gly Thr Asp 2450 2455 2460 Phe Ser Leu Pro Val Ile Glu Arg Leu Glu Val Gln Val Gly Thr Asp 2465 2470 2475 2480 Pro Cys Leu Lys Glu Lys Val Ser Leu Arg Cys Gln His Ala Asp Val 2485 2490 2495 Ala Asp Gly Leu Pro Val Lys Tyr Phe Asp Thr Val Ile Leu Asn Ser 2500 2505 2510 Val Val Gln Tyr Phe Pro Asp Ala Ala Tyr Leu Ser Arg Val Leu Asp 2515 2520 2525 Val Ala Leu Asp Arg Leu Ala Pro Gly Gly Arg Ile Leu Val Gly Asp 2530 2535 2540 Val Arg Asn Tyr Gly Thr Leu Arg Glu Phe Leu Thr Ala Val His His 2545 2550 2555 2560 Ala Gln His Pro Gln Asp Ser Ala Ser Ala Val Arg Ala Ala Val Glu 2565 2570 2575 Arg Ala Val Leu Ala Glu Lys Glu Leu Val Ile Asp Pro Asp Phe Phe 2580 2585 2590 Thr Glu Trp Ala Arg Thr Arg Pro Asp Val Val Ala Val Asp Ile Arg 2595 2600 2605 Leu Lys Pro Gly Ala Asp Gln Asn Glu Leu Thr Arg His Arg Tyr Glu 2610 2615 2620 Val Ile Leu His Lys Gln Pro Ser Gln Pro Leu Arg Leu Ala Asp Val 2625 2630 2635 2640 Arg Thr Ala Asn Trp Gly Ser Glu Val Pro Asp Leu Ser Gly Leu Glu 2645 2650 2655 Thr Ala Leu Ala Arg His Gly Gly Arg Leu Arg Leu Ala Arg Ile Pro 2660 2665 2670 Asn Ala Arg Leu Val Ser Glu Ala Val Gln Cys Gly Val Pro Thr Asn 2675 2680 2685 Val Gly Gly Thr Pro Leu Asp Pro His Glu Leu Ala Ser Trp Gly Gly 2690 2695 2700 Gln Arg Gly Tyr Ser Val His Cys Thr Trp Ser Ala Glu Ala Pro Gly 2705 2710 2715 2720 Trp Phe Glu Ala Val Ile Ile Pro Val Asp Ser Gly His Cys Arg Asp 2725 2730 2735 Gly Val Tyr Arg Pro Val Gly Pro Arg Pro Arg Gln Leu Val Asn Leu 2740 2745 2750 Pro Ala Ala Ala Arg Arg Val Ser Arg Leu Pro Ser Trp Leu Arg Glu 2755 2760 2765 Glu Leu Ala Ala Glu Leu Pro Glu His Leu Val Pro Gly Asp Ile Val 2770 2775 2780 Val Met Glu Arg Leu Pro Leu Thr Thr Asn Gly Lys Ile Asp His Ser 2785 2790 2795 2800 Arg Leu Pro Glu Val Glu Gln Ala Asp Arg Glu Tyr Gly Ser Pro Arg 2805 2810 2815 Thr Pro Leu Glu Ala Glu Leu Ala Gly Leu Phe Ala Glu Val Leu Gly 2820 2825 2830 Val Asp Arg Val Gly Ile Glu Asp Asp Phe Phe Asp Cys Gly Gly Ser 2835 2840 2845 Ser Leu Gln Val Ile Arg Leu Ile Trp Arg Ile Arg Ala Glu Leu Gly 2850 2855 2860 Phe Asp Ile Pro Val Arg Thr Ile Phe Gln His Pro Thr Val Ala Glu 2865 2870 2875 2880 Val Ala Glu His Leu Ala Ala Gly Arg Glu Asp Val Glu Phe Asp Asp 2885 2890 2895 Pro Phe Ser Val Val Leu Pro Ile Arg Thr Asp Gly Asp Arg Ala Pro 2900 2905 2910 Ile Trp Leu Val Pro Pro Gly Gly Gly Leu Ser Trp Ala Tyr Leu Gly 2915 2920 2925 Phe Ala Gln His Leu Asp Arg Ser Arg Pro Ile Tyr Gly Leu Gln Ala 2930 2935 2940 Arg Gly Phe Val Gly Asp Pro Arg Ala Thr Ser Ile Glu Ser Met Val 2945 2950 2955 2960 Asp Asp Tyr Val Asp Gln Ile Leu Arg Val Gln Pro Glu Gly Pro Tyr 2965 2970 2975 Asn Val Leu Gly Trp Ser Leu Gly Gly Pro Ile Ala Gln Ala Val Ala 2980 2985 2990 Ala Glu Leu Gln Arg Arg Glu Cys Glu Val Asp Leu Leu Ala Val Leu 2995 3000 3005 Asp Ser Gly Pro Ala Ser Tyr Phe Ala Asp Phe Gln Thr Pro Asp Glu 3010 3015 3020 Lys Leu Val Arg Arg Tyr Leu Ala His Tyr Met Gly His Leu Ala Gly 3025 3030 3035 3040 Met Ala Glu Phe Glu Ser Leu Val Gln Thr Ser Thr Thr Leu Phe Ile 3045 3050 3055 Glu His Thr Asp Leu Met Thr Gln Phe Thr Ser Pro Pro Phe Arg Gly 3060 3065 3070 Asp Leu Ile Phe Phe Ala Ala Leu Ile Asp Gln Gly Thr Arg Glu Arg 3075 3080 3085 Arg Gln Leu Glu Val Glu Leu Asp Val Gln Trp Arg Glu Tyr Thr Glu 3090 3095 3100 Gly Thr Val Arg Arg Phe Asp Ile Glu Cys Ala His Asn Glu Met Met 3105 3110 3115 3120 Trp Pro Glu Asn Ala Ala Met Ile Ser Arg Ile Val Asn Glu Ile Ile 3125 3130 3135 Asp Ser Ala Arg 3140 <210> 23 <211> 71 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio22 Protein <400> 23 Met Ser Val Asn Pro Phe Asp Asp Glu Asp Gly Glu Phe Tyr Val Leu 1 5 10 15 Val Asn Asp Glu Glu Gln His Ser Leu Trp Pro Thr Phe Gly Asp Val 20 25 30 Pro Asp Gly Trp Arg Ile Val Phe Gly Pro Ala Gly Arg Ala Glu Ser 35 40 45 Val Ala Tyr Val Glu Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu 50 55 60 Arg Glu Ala Met Ser Ala Ala 65 70 <210> 24 <211> 874 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio23 Protein <400> 24 Val Arg Arg Cys Arg Gln His Asp Val Arg Arg Gly Leu Ala Gly Arg 1 5 10 15 Arg Val Arg Leu Arg Ala His Asp Phe Glu Leu Pro Arg Arg Arg Trp 20 25 30 Arg Lys Val Arg Thr Glu Val Phe Thr Gly Cys Leu Gly Ile Glu Leu 35 40 45 Gly Cys Gly Lys Pro Glu Ile Ala Gly Gly Val Ile Ser Pro Gly His 50 55 60 Pro Ala Gly Ser Ala Ser Arg Ala Arg His Phe Gly Gly Pro Met Thr 65 70 75 80 Val Ala Ser Pro Arg Gln Ser Arg Glu Asp Leu Ser Leu Val Pro Asp 85 90 95 Thr His Asp Val Ile Arg Val Val Gly Ala Arg Glu Asn Asn Leu Lys 100 105 110 Asp Ile Arg Leu Glu Ile Pro Lys Arg Arg Leu Thr Val Phe Thr Gly 115 120 125 Val Ser Gly Ser Gly Lys Ser Ser Leu Val Phe Asp Thr Ile Ala Ala 130 135 140 Glu Ser Gln Arg Leu Ile Asn Glu Thr Tyr Ser Ala Phe Val Gln Gly 145 150 155 160 Phe Met Pro Thr Leu Ser Arg Pro Asp Val Asp Val Leu Asp Gly Leu 165 170 175 Thr Thr Ala Ile Ile Val Ser Gln Glu Arg Ile Gly Asn Asn Pro Arg 180 185 190 Ser Thr Val Gly Thr Val Thr Asp Ala Asn Ala Met Leu Arg Ile Leu 195 200 205 Phe Ser Arg Leu Gly Glu Pro Arg Leu Gly Ser Pro Arg Ser Tyr Ser 210 215 220 Phe Asn Ile Pro Ser Ile Ser Val Ala Asn Ala Val Thr Val Gly Gln 225 230 235 240 Gly Ser Arg Ala Val Glu Glu Gln Arg Gly Phe Asp Val Ala Gly Gly 245 250 255 Met Cys Pro Arg Cys Glu Gly Thr Gly Ser Val Asn Asp Val Asp Leu 260 265 270 Thr Gln Leu Tyr Asp Ala Thr Lys Ser Leu Asp Glu Gly Ala Ile Arg 275 280 285 Val Pro Gly Tyr Gln Val Gly Gly Tyr Asn His Arg Leu Tyr Ala Gly 290 295 300 Ser Gly Leu Leu Asp Pro Gly Lys Pro Val Glu Lys Tyr Thr Glu Lys 305 310 315 320 Glu Leu Asn Asp Phe Leu His Arg Glu Pro Thr Arg Leu Lys Ile Gly 325 330 335 Asp Tyr His Thr Asn Tyr Glu Gly Leu Val Ala Arg Val Gln Lys Ser 340 345 350 Leu Leu Thr Lys Asp Ile Glu Ala Leu Gln Pro His Val Arg Ala Phe 355 360 365 Val Glu Arg Ala Val Thr Phe Thr Ala Cys Pro Asp Cys Gly Gly Thr 370 375 380 Arg Leu Asn Glu Gln Ala Arg Ala Ser Arg Ile Lys Gly Ile Asn Ile 385 390 395 400 Ala Asp Ala Ser Ala Met Gln Ile Asn Asp Leu Ala Glu Trp Val Arg 405 410 415 Asp Leu Ala Glu Pro Ser Val Ala Pro Leu Leu Ala Thr Leu Leu His 420 425 430 Thr Leu Asp Ser Phe Val Gly Ile Gly Leu Gly Tyr Leu Ser Leu Asp 435 440 445 Arg Ala Ser Gly Thr Leu Ser Gly Gly Glu Ala Gln Arg Val Lys Met 450 455 460 Ile Arg His Leu Gly Ser Pro Leu Thr Asp Val Thr Tyr Val Phe Asp 465 470 475 480 Glu Pro Thr Ile Gly Leu His Pro His Asp Ile Gln Arg Met Asn Lys 485 490 495 Leu Leu Leu Arg Leu Arg Asp Lys Gly Asn Thr Val Leu Val Val Glu 500 505 510 His Lys Pro Glu Thr Ile Ala Ile Ala Asp Arg Val Val Asp Leu Gly 515 520 525 Pro Gly Ala Gly Thr Ala Gly Gly Thr Ile Cys Phe Glu Gly Thr Val 530 535 540 Ala Glu Leu Arg Ser Ala Asp Thr Leu Thr Gly Arg His Leu Asp Asp 545 550 555 560 Lys Ala Ser Leu Lys Asp Arg Val Arg Thr Pro Ser Gly Ser Leu Glu 565 570 575 Val Arg Gly Ala Ser Lys His Asn Leu Arg Asp Val Asp Val Asp Ile 580 585 590 Pro Leu Gly Val Leu Val Val Val Thr Gly Val Ala Gly Ser Gly Lys 595 600 605 Ser Ser Leu Ile Glu Gly Ser Val Ser Gly Arg Asp Gly Val Val Thr 610 615 620 Ile Asp Gln Gly Ser Ile Lys Gly Ser Arg Arg Ser Asn Pro Ala Thr 625 630 635 640 Tyr Thr Gly Leu Leu Asp Pro Ile Arg Lys Ala Phe Ala Lys Ala Asn 645 650 655 Gly Val Lys Pro Ala Leu Phe Ser Ser Asn Ser Glu Gly Ala Cys Ala 660 665 670 Thr Cys Lys Gly Ala Gly Val Ile Tyr Thr Asp Leu Ala Ile Met Ala 675 680 685 Gly Ala Ala Thr Thr Cys Asp Asp Cys Glu Gly Arg Arg Phe Gln Asp 690 695 700 Phe Val Leu Gln Tyr Arg Leu Gly Gly Arg Asp Ile Ser Glu Val Leu 705 710 715 720 Ala Met Ser Val Ala Glu Ala Gly Arg Phe Phe Ala Ala Gly Gln Ala 725 730 735 Arg Thr Pro Ala Ala Val Val Ile Leu Glu Arg Leu Ala Asp Val Gly 740 745 750 Leu Gly Tyr Leu Ser Leu Gly Gln Pro Leu Pro Thr Leu Ser Gly Gly 755 760 765 Glu Arg Gln Arg Leu Lys Leu Ala Ala His Leu Ala Asp Glu Gly Gly 770 775 780 Ile Val Val Leu Asp Glu Pro Thr Thr Gly Leu His Leu Ala Asp Val 785 790 795 800 Glu Gln Leu Leu Gly Leu Leu Asp Arg Leu Val Asp Ala Gly Arg Ser 805 810 815 Val Met Val Ile Glu His His Gln Ala Val Met Ala His Ala Asp Trp 820 825 830 Ile Ile Asp Leu Gly Pro Ala Ala Gly His Asp Gly Gly Arg Val Val 835 840 845 Phe Glu Gly Cys Pro Ala Asp Leu Val Ala Ser Arg Ala Thr Leu Thr 850 855 860 Gly Glu His Leu Ala Ala Tyr Val Gly Val 865 870 <210> 25 <211> 178 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio24 Protein <400> 25 Val Gly Gly Arg Asn Ser Asp Val Val Phe Ile Arg Trp Pro Ala Gln 1 5 10 15 Ala Asp Leu Arg Thr Arg Cys Arg Lys Glu Gly Val Pro Arg Leu Leu 20 25 30 Val Val Glu Gly Gly Ala Gln Pro Pro Ile Ser Asn Asp Pro Val Glu 35 40 45 Asp Trp Val Arg Pro Pro Val Ser Arg Asn Asp Leu Glu Ala Arg Val 50 55 60 Lys Ala Leu Gln Gln Arg Phe Asn Ser Arg Arg Leu Pro Thr Ile Asp 65 70 75 80 Ser Thr Gly Thr Leu Thr Phe Gly Arg His Ser Ile Val Ile Ser Asn 85 90 95 Thr Gln Ala Glu Leu Met Arg Leu Leu Ile Glu Arg Phe Gly Glu Val 100 105 110 Val Tyr Arg Ile Glu Phe Val Gln Cys Leu Ala Ile Arg Thr Pro Ala 115 120 125 Leu Asn Arg Asn Ser Leu Asp Leu His Ile Met Arg Leu Arg Arg Arg 130 135 140 Leu Leu Pro Ile Asp Leu Ala Ile Arg Thr Val Trp Gly Arg Gly Tyr 145 150 155 160 Met Leu Ala Tyr Ala Ala Ser Ala Glu Ala Ile Ile Arg Asn Ala Ser 165 170 175 Gly Met <210> 26 <211> 287 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio25 Protein <400> 26 Val Ala Asp Ala Leu Ser Ser Arg Pro Cys Ser Thr Ala Ala Ile Lys 1 5 10 15 Arg Asp His Ile Met Leu Ser Ser His Thr Val Ile Val Leu His Ala 20 25 30 His Pro Asp Asp Glu Ala Ile Phe Thr Gly Leu Thr Met Arg Arg Leu 35 40 45 Ala Asp Ala Gly Ala Arg Val Ile Leu Val Met Ala Thr Asp Gly Ala 50 55 60 Ala Gly Val Pro His Val Pro Leu Ser Arg Gly Glu Ser Leu Arg Ser 65 70 75 80 Arg Arg Leu Ala Glu Leu Glu Arg Ala Cys Asp Leu Leu Gly Val Ala 85 90 95 Arg Leu Glu Val Leu Gly Tyr Ala Asp Ser Gly Ala His Gly Gly Pro 100 105 110 Tyr Arg Ala Gly Thr Leu Gly Ala Ala Ser Ala Thr Arg Val Ala Arg 115 120 125 Gln Val Ala Arg Ile Ala Ser Arg Glu Gly Ala Thr Thr Leu Val His 130 135 140 Tyr Asp Pro Gly Gly Ile Tyr Arg His Val Asp His Val Gln Val His 145 150 155 160 Arg Val Gly Ala Leu Val Thr Arg Ser Leu Gln Leu Ala Gly Tyr Gln 165 170 175 Ala Thr Val Asp Ala Ser Ala Leu Arg Ala Gly Pro Arg His Val Leu 180 185 190 Gln Arg Ala Ala Gly Asp Leu Thr Asp Met Gly Val Pro Ala Ser Arg 195 200 205 Ile Ser Leu Ala Val Asp Ala Glu Gly Ala Asp Leu Leu Ala Lys Met 210 215 220 Ala Ala Met Ala Thr His Ala Ser Gln Val Gly Ala Ala Asp Leu Asp 225 230 235 240 Pro Ser Cys Phe Ala Ala Ala Tyr Gly Arg Glu Trp Phe Val Arg Glu 245 250 255 Gly Arg Leu Gly Ala Leu Asp Ala Leu Leu Ala Ala Ser Ala Gly Pro 260 265 270 Ala Val Ala Thr His Arg Asn Leu Gln Leu Asp Gly Thr Ala Ile 275 280 285 <210> 27 <211> 134 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio26 Protein <400> 27 Val Val Val Glu Leu Ala Tyr Thr Asp Pro Asp Arg Ala Val Asp Trp 1 5 10 15 Leu Val Arg Val Phe Gly Phe Arg Leu Leu Leu Arg Gln Pro Ala Ile 20 25 30 Gly Thr Ile Arg His Ala Asp Leu Asp Thr Gly Gly Gly Ile Val Met 35 40 45 Val Arg Arg Thr Gly Glu Pro Tyr Thr Val Ser Cys Ala Gly Gly His 50 55 60 Thr Cys Lys Gln Val Ile Val Trp Val Ser Asp Val Asp Glu His Phe 65 70 75 80 Met Arg Ser Thr Ala Ala Gly Ala Asp Ile Val Gln Pro Leu Gln Asp 85 90 95 Lys Pro Trp Gly Leu Arg Gln Tyr Leu Val Arg Asp Leu Glu Gly His 100 105 110 Leu Trp Glu Phe Thr Arg His Leu Arg Asp Val Pro Pro Arg Glu Trp 115 120 125 Gly Ala Val Ala Met Thr 130 <210> 28 <211> 1804 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio27 Protein <400> 28 Val Gly Leu Gln Leu Leu Gly Ser Ala Thr Gln Ser Thr Glu Pro Asn 1 5 10 15 Leu Pro Gly Leu Thr Val Thr Ser Leu Asp Ala Asn Pro Gly Gly His 20 25 30 Pro Phe Asp Leu Ser Ile Thr Cys Thr Glu Ser Pro Asp Gln Leu Arg 35 40 45 Leu Val Ala Asp Tyr Ser Val Asp Leu Phe Asp Glu Pro Arg Met Ala 50 55 60 Arg Leu Leu Arg His Leu Glu Arg Val Leu Arg Thr Ala Val Asp Ala 65 70 75 80 Pro Asp Thr Pro Leu Ser Ala Leu Pro Leu Leu Asp Glu Glu Glu Gln 85 90 95 Thr Leu Leu Leu His Thr Trp Gln Gly Pro Gln Gly Glu Arg Ala Arg 100 105 110 Glu Pro Val His Val Gln Ile Ala Arg Leu Ala Ala Glu Arg Pro Asp 115 120 125 Leu Val Ala Ala Thr Leu His Gly Ala Glu Leu Thr Tyr Gly Glu Leu 130 135 140 Asp Arg Arg Ala Gly Val Leu Ala His Arg Phe Arg Ala Leu Gly Val 145 150 155 160 Gly Arg Asp Asp Ile Val Ala Leu Leu Leu Glu Arg Gly Phe Asp Leu 165 170 175 Ile Val Gly Met Val Ala Ala Gln Lys Ala Gly Gly Ala Phe Val Val 180 185 190 Met Asp Pro Gly His Pro Val Arg Arg Ile Glu Phe Ile Leu Glu Asp 195 200 205 Thr Ala Ala Lys Ala Val Val Thr Arg Ser Ala Leu Ala Asp Arg Leu 210 215 220 Pro Glu Gly Ala Ala Ala Thr Pro Val Leu Val Asp Thr Glu Trp Asp 225 230 235 240 Glu Leu Ser Ala Ala Ala Ala Gly Ala Ala Pro Leu Asp Glu Leu Ala 245 250 255 Asp Glu Asn Ser Leu Ala Tyr Val Leu Tyr Thr Ser Gly Ser Thr Gly 260 265 270 Lys Pro Lys Gly Val Met Ile Glu His His Ala Leu Asn Thr Phe Leu 275 280 285 Leu Trp Leu Gly Asn Ile Phe Asp Phe Gly Pro Gly Asp Arg Leu Leu 290 295 300 Gln His Met Ala Pro Ile Phe Asp Phe Ala Glu Gly Glu Ile Phe Thr 305 310 315 320 Ala Leu Thr Arg Gly Val Thr Met Val Phe Val Pro Glu Glu His Arg 325 330 335 Thr Asp Pro Asp Val Ile Gly Gln Leu Leu Val Ser Glu Arg Ile Thr 340 345 350 Tyr Ile Gly Gly Pro Pro Ala Ile Leu Gly Arg Ile Pro Pro Gly Ser 355 360 365 Tyr Pro Asp Leu Lys Tyr Met Ile Ala Gly Gly Glu Ala Val Thr Gly 370 375 380 Asp Leu Ile Asn Arg Trp Asn Thr Pro Gly Arg Arg Phe Ile Asn Gly 385 390 395 400 Tyr Gly Pro Thr Glu Ala Ala Val Gly Cys Ile Phe Tyr Glu Cys Glu 405 410 415 His Arg Thr Trp Ile Gly Gln Pro Pro Ile Gly Arg Ala Met Pro Asn 420 425 430 Arg Val Ala Tyr Val Leu Asp Arg Trp Asn Asn Leu Gln Pro Val Gly 435 440 445 Val Pro Gly Glu Val Ile Thr Gly Gly Glu Gly Leu Ala Arg Gly Tyr 450 455 460 Leu Asn Arg Pro Glu Leu Thr Ala Glu Lys Phe Ile Asp Asn Pro Tyr 465 470 475 480 Arg Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Gly Val Trp Thr 485 490 495 Glu Asp Gly Gln Ile Gln Phe Leu Gly Arg Ile Asp Thr Gln Val Lys 500 505 510 Leu Asn Gly Leu Arg Ile Glu Leu Glu Glu Ile Glu Ser Thr Leu Thr 515 520 525 Ala His Pro Gly Val Ala Glu Ala Ala Val Ala Leu Arg Glu Asp Ser 530 535 540 Pro Gly Ser Lys Arg Leu Val Gly Tyr Val Val Pro Ala Gly Ala Ala 545 550 555 560 Ala Pro Pro Thr Glu Glu Leu Arg Glu His Leu Leu Ala Asp Leu Pro 565 570 575 Pro Tyr Met Val Pro His Val Phe Val Ala Leu Asp Val Leu Pro Leu 580 585 590 Thr Ser Val Gly Lys Val Asp Arg Asn Arg Leu Pro Val Pro Glu Glu 595 600 605 Thr Gly Ser Ala Glu Val Glu Leu Val Ala Pro Arg Thr Pro Glu Glu 610 615 620 Glu Arg Val Ala Glu Ile Phe Ala Ala Val Leu Gly Val Glu Arg Val 625 630 635 640 Gly Ala Asp Ala Asn Phe Phe Glu Leu Gly Gly Asn Ser Leu Met Ala 645 650 655 Ala Arg Val Leu Ser Arg Ile Ala Glu Leu Gly Gly Ala Ser Ala Thr 660 665 670 Met Arg Asp Phe Tyr Thr Lys Pro Arg Val Ser Glu Ile Ala Gln Leu 675 680 685 Leu Ala Gly Thr Pro Ser Ser Thr Asp Pro Ala Thr Pro Thr Asp Ala 690 695 700 Ala Pro Val Ala Asp Gln Thr Arg Ala Arg Leu Glu Gln Glu Ile Ala 705 710 715 720 Asp Leu Glu Gln Arg Leu Arg Ala Ala Arg Ala Ala Leu Ala Gly Gln 725 730 735 Asp Gly Pro Val Ser Gly Gly His Glu Gly Gln Arg Leu Pro Leu Ser 740 745 750 Pro Thr Gln Glu Gln Leu Trp Phe Leu Glu Gln Leu Ala Pro Gly Gln 755 760 765 Pro Thr Tyr His Ile Pro Val Pro Val Arg Leu Thr Gly Pro Leu Asp 770 775 780 Val Asp Leu Leu Gly Arg Ala Leu Thr Ala Val Val Ala Arg His Glu 785 790 795 800 Ala Leu Arg Thr Thr Phe Gly Thr Asp Asp Asp Thr Pro Tyr Gln Leu 805 810 815 Val Ser Pro Ala Gly Glu Val Pro Leu Pro Val His Glu Leu Asp Ala 820 825 830 Thr Ala Ala Asp Asp Arg Glu Gln Ala Leu Arg Val Glu Leu Glu Arg 835 840 845 Asp Ala Thr Glu Pro Phe Asp Leu Gly Arg Asp Leu Met Leu Arg Ala 850 855 860 Arg Leu Ile Arg Leu Asp Gly Gln Glu His Val Leu Ser Met Val Leu 865 870 875 880 His His Ile Cys Ala Asp Gly Trp Ser Ala Gly Leu Leu Val Arg Asp 885 890 895 Leu Ala Glu Leu Tyr Asp Ala Leu Arg His Asp Arg Gln Pro Gln Leu 900 905 910 Pro Ala Leu Arg Leu Gln Tyr Ala Asp His Ala Leu Ala Gln Arg Arg 915 920 925 Gln Leu Asp Ala Gly Asp Leu Glu Ser Gln Leu Ala Tyr Trp Ala Arg 930 935 940 Gln Leu Ala Asp Ala Pro Ile Leu Asp Leu Pro Ser Asp Arg Pro Arg 945 950 955 960 Pro Ala Thr Ala Thr Asn Arg Gly Ala Leu Leu Val Arg Arg Met Pro 965 970 975 Ala Asp Val Leu Glu Gly Leu Arg Arg Val Ala Gln Gln Glu Gln Ala 980 985 990 Ser Thr Tyr Ala Val Leu Leu Ala Gly Phe Lys Thr Val Leu Met Arg 995 1000 1005 Tyr Thr Gly Val Asp Asp Val Val Val Gly Thr Ala Gly Ala Gly Arg 1010 1015 1020 Gly Arg Pro Glu Leu Glu Asp Leu Val Gly Phe Phe Val Asn Met Leu 1025 1030 1035 1040 Ala Leu Arg Thr Asp Leu Ser Gly Asp Pro Ser Phe Gly Glu Ala Val 1045 1050 1055 Arg Arg Thr Met Gly Thr Leu Leu Ala Ala Trp Asp His Gln Asp Ala 1060 1065 1070 Pro Phe Glu Arg Val Val Gly Arg Leu Gly Arg Arg Arg Asp Ala Ser 1075 1080 1085 Arg Asn Pro Val Phe Gln Val Ser Ile Asp Leu Leu Ser Gly Asp Leu 1090 1095 1100 Val Asp Phe Arg Phe Pro Gly Leu Ala Ala Glu Phe Leu Asp Val Asp 1105 1110 1115 1120 Pro Gly Val Ser Arg Phe Asp Met Ala Ile Asn Ala Tyr Glu Glu Thr 1125 1130 1135 Asp Gly Ile Thr Phe Arg Ile Glu Tyr Ala Thr Asp Leu Phe Asp Thr 1140 1145 1150 Ala Arg Ile Glu Ala Met Phe Gly His Leu Glu Arg Val Leu Arg Ala 1155 1160 1165 Ala Val Ala Ala Pro Gln Thr Pro Leu Ser Ala Leu Pro Leu Leu Asp 1170 1175 1180 Asp Thr Glu Arg Thr Glu Leu Leu Ala Leu Ala Gln Gly Lys Arg Arg 1185 1190 1195 1200 Pro His Arg Pro Ala Thr Leu Pro Glu Leu Phe Ala Ala Ser Val Ala 1205 1210 1215 Arg Thr Pro Gln Ala Thr Ala Val Ile Ala Ala Glu Gly Thr Leu Ser 1220 1225 1230 Tyr Ala Glu Leu Asp Glu Arg Ser Arg Arg Leu Ala Ala Arg Leu Arg 1235 1240 1245 Ala Ala Gly Val Gly Thr Gly Asp Val Val Pro Val Leu Leu Glu Arg 1250 1255 1260 Ser Leu Ala Glu Val Val Ser Val Leu Ala Val Leu Arg Ala Gly Ala 1265 1270 1275 1280 Ala Tyr Ala Pro Met Asp Pro Ala Ala Pro Pro Ser Arg Leu Ala Phe 1285 1290 1295 Gln Val Arg Asp Thr Gly Ala Arg Val Val Val Gly Asp Pro Thr Arg 1300 1305 1310 Leu Asp Thr Val Val Gly Val Thr Ile Val Asp Pro Ala Ala Glu Leu 1315 1320 1325 Pro Glu Ala Ala Asp Glu Pro Trp Leu Ala Glu Leu Thr Pro Ala Ser 1330 1335 1340 Leu Ala Tyr Val Leu Tyr Thr Ser Gly Ser Thr Gly Glu Pro Lys Gly 1345 1350 1355 1360 Val Leu Ile Glu His Gly Met Val Ala Gly Tyr Leu Glu Trp Met Val 1365 1370 1375 Pro Asp Phe Gly Val Glu Pro Arg Ser Arg Met Met His Cys Cys Ala 1380 1385 1390 Pro Val Phe Asp Leu Ala Val Gly Glu Leu Phe Gly Ala Leu Thr Ala 1395 1400 1405 Gly Ala Thr Val Val Val Ala Gly His Asp Asp Val His Arg Pro Gly 1410 1415 1420 Ala Leu Thr Ala Leu Ala Arg Glu Thr Gly Ala Thr His Ile Phe Thr 1425 1430 1435 1440 Thr Pro Thr Val Leu Gly Leu Leu Asp Pro Ala Glu Leu Pro Gln Leu 1445 1450 1455 Arg Ser Val Met Met Ala Gly Glu Pro Ala Pro Pro Ser Leu Val Ala 1460 1465 1470 Ala Trp His Val Asp Gly Arg Arg Val Leu Asn Leu Tyr Gly Pro Ala 1475 1480 1485 Glu Thr Thr Val Gly Cys Thr Trp Tyr Glu Cys Pro Ala Gly Thr Ala 1490 1495 1500 Pro Ala Ala Thr Val Pro Ile Gly Arg Pro Met Pro Asn Arg Arg Val 1505 1510 1515 1520 Tyr Val Val Asp Asp Ser Gly Asp Leu Ala Pro Val Gly Val Pro Gly 1525 1530 1535 Glu Leu Val Val Ala Gly Asn Gly Val Ala Arg Gly Tyr Leu Asp Arg 1540 1545 1550 Pro Glu Leu Thr Ala Ser Ala Phe Gly Ala Asp Glu Arg Ala Gly Glu 1555 1560 1565 Gly Arg Ala Tyr Arg Thr Gly Asp Leu Ala Arg Trp Asn Arg Asp Gly 1570 1575 1580 Gln Leu Glu Phe Leu Gly Arg Arg Asp Gly Gln Val Lys Leu Arg Gly 1585 1590 1595 1600 Leu Arg Val Glu Leu Gly Glu Val Glu His Ala Leu Arg Thr Ala Ala 1605 1610 1615 Gly Val Ser Gly Ala Ala Ala Ala Val His Gly Thr Gly Ala Glu Ala 1620 1625 1630 Val Leu Val Gly Tyr Val Val Gly Glu Leu Ser Asp Asp Asp Ala Glu 1635 1640 1645 Ala Leu Arg Thr Thr Leu Ala Gly Lys Leu Pro Gly Tyr Met Val Pro 1650 1655 1660 Asn Val Val Leu Arg Leu Pro Gln Leu Pro Leu Thr Arg Thr Gly Lys 1665 1670 1675 1680 Val Asp Arg Lys Arg Leu Pro Ala Pro Glu Ser Gly Ala Gly Gln Ala 1685 1690 1695 Ala Tyr Val Pro Pro Gly Thr Asp Asp Glu Arg Leu Ile Ala Gly Val 1700 1705 1710 Phe Ala Asp Leu Leu Gly Leu Glu Arg Ala Gly Arg Glu Asp Glu Phe 1715 1720 1725 Phe Leu Ser Gly Gly Asn Ser Leu Gln Ala Ile Arg Ala Val Gly Arg 1730 1735 1740 Leu Asn Asp Ala Leu Gly Val Pro Leu Thr Val Arg Asp Phe Tyr Ala 1745 1750 1755 1760 Ala Pro Thr Val Ala Ala Leu Ala Glu Leu Ala Gly Arg Arg Arg Ala 1765 1770 1775 Ala Glu Gln Ala Ala Gln Trp Gln Leu Leu Asp Glu Ile Glu Gln Leu 1780 1785 1790 Ser Asp Asp Glu Val Glu Arg Leu Leu Ala Ala Asp 1795 1800 <210> 29 <211> 1345 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> Tio28 Protein <400> 29 Met Ser Asp Glu Thr Phe Asp Gly Arg Val Ala Arg Leu Asp Glu Arg 1 5 10 15 Arg Arg Leu Leu Leu Glu Arg Met Arg Gln Gln Arg Arg Gln Pro Pro 20 25 30 Ala Thr Ile Gly Ala Arg Pro Ala Gly Asp Glu Arg Val Pro Leu Ser 35 40 45 Arg Ala Gln Glu Gln Leu Trp Phe Leu Ala Gln Leu Ala Pro Ala Glu 50 55 60 Pro Thr Tyr Asn Leu Val Gln Ala Ser Tyr Leu Thr Gly Glu Val Asp 65 70 75 80 Pro Ala Ala Leu Arg Arg Ala Leu Asp Gly Val Val Ala Gln His Glu 85 90 95 Ala Leu Arg Thr Val Val Glu Ser Val Asp Gly Val Ala Tyr Gln Arg 100 105 110 Val Leu Pro Pro Gly Pro Ala Ser Leu Val Val Asp Asp Val Ser Arg 115 120 125 Leu Pro Glu Glu Gln Arg Arg Pro Ala Ala Leu Thr Leu Leu Gln Gln 130 135 140 Gln Glu Val His Arg Pro Phe Asp Leu Ala Thr Gly Pro Leu Phe Arg 145 150 155 160 Ala Arg Leu Val Arg Leu Gly Pro Thr Glu His Ala Leu Ala Val Ala 165 170 175 Ala His His Ile Val Val Asp Gly Trp Ser Met Gly Leu Ile Leu Arg 180 185 190 Glu Leu Ala Ala Ala Tyr Asp Ala Asp Arg His Gly Thr Arg Ala Arg 195 200 205 Leu Asp Pro Pro Ala Leu Gln Tyr Pro Asp Phe Ala Arg Trp Gln His 210 215 220 Gln Gln Leu Ala Thr Ala Glu Leu Asp Asn His Leu Arg Tyr Trp Ala 225 230 235 240 Gln Arg Leu Ala Asp Leu Pro Thr Leu Glu Leu Pro Ala Asp Arg Pro 245 250 255 Arg Pro Thr Thr Ala Ser Phe Arg Gly Ala Leu Leu Glu Gln Pro Leu 260 265 270 Asp Pro Gln Leu His Ala Gly Val Gln Ala Leu Ala Lys Glu Thr Gly 275 280 285 Ala Ser Pro Phe Met Val Leu Val Ala Ala Phe Ala Ala Met Leu Ala 290 295 300 Arg Tyr Thr Gly Thr Asp Asp Leu Ala Val Gly Thr Thr Phe Ser Gly 305 310 315 320 Arg Ser Arg Pro Glu Leu Glu Ser Val Val Gly Phe Phe Ala Asn Met 325 330 335 Gly Val Leu Arg Leu Asp Thr Ser Gly Asp Pro Ser Phe Ala Thr Leu 340 345 350 Val Asp Arg Ala Arg Asp Thr Cys Leu Gly Ala Trp Glu His Gln Asp 355 360 365 Ala Pro Phe Glu Arg Val Val Gln Arg Leu Ala Pro Pro Arg Asp Pro 370 375 380 Gly Arg Asn Pro Leu Phe Gln Val Ala Val Gln Leu Leu Asp Gly Ser 385 390 395 400 Thr Trp Gly Gly Pro Thr Leu Pro Gly Thr Asp Ser Thr Pro Val Asp 405 410 415 Leu Arg Leu Asp Arg Ser Arg Phe Asp Met Met Val Ser Leu Val Asp 420 425 430 His Gly Asp Arg Tyr Ser Val Leu Thr Glu Tyr Ser Thr Asp Leu Phe 435 440 445 Asp Ala Arg Arg Val Arg Ala Met Leu Asp His Val Ala Arg Leu Leu 450 455 560 Asp Ala Gly Leu Ala Asp Pro Ala Thr Thr Leu Ser Arg Leu Pro Met 465 470 475 480 Leu Asp Pro Ala Glu Arg Glu Arg Val Leu Ala Leu Gly Ala Gly Glu 485 490 495 Arg Arg Asp Val Ala Pro Ala Thr Val His Gln Leu Val Arg Ala Gln 500 505 510 Ala Glu Arg Asn Pro Asp Ala Val Ala Val Arg His Gly Asp His Glu 515 520 525 Leu Thr Tyr Arg Glu Leu Leu Asp Arg Ala Ala Arg Arg Ala Ala Gly 530 535 540 Leu Arg Asp Ala Gly Leu Arg Pro Gly Asp Arg Val Pro Ala Leu Leu 545 550 555 560 Asp Arg Gly Val Asp Glu Val Leu Thr Pro Met Ala Ile Trp His Ala 565 570 575 Gly Gly Val Tyr Val Pro Leu Asp Thr Ala Ala Pro Pro Asn Arg Leu 580 585 590 Arg Arg Ile Leu Thr Asn Cys Ala Ala Arg Leu Val Leu Thr Arg Thr 595 600 605 Glu His Ala Ala Gly Val Pro Glu Gly Pro Trp Arg Thr Leu Leu Leu 610 615 620 Asp Thr Gly Asp Leu Asp Ser Ala Ala Gly Leu Ala Pro Glu Pro Ser 625 630 635 640 Thr Gly Pro Asp Asp Leu Ala Tyr Val Leu His Thr Ser Gly Thr Thr 645 650 655 Gly Asp Pro Lys Gly Val Gln Leu Pro His Arg Gly Phe Val Thr Tyr 660 665 670 Leu Asp Trp Met Arg Asp Gln Trp Arg Cys Gly Pro Gly Asp Arg Val 675 680 685 Leu His Gly Cys Ala Pro Val Phe Asp Leu Ala Ala Gly Glu Val Leu 690 695 700 Ala Ala Leu Thr Ser Gly Ala Thr Val Val Val Ile Gly Lys Asp Arg 705 710 715 720 Leu Leu Ser Pro Gly Gly Leu Ala Glu Val Leu Ala Ala Glu Arg Ile 725 730 735 Thr His Leu Phe Leu Thr Pro Thr Thr Leu Gly Leu Val Glu Asp Asp 740 745 750 Thr Asp Arg Phe Asp Ala Leu Arg Glu Val Leu Val Gly Gly Glu Val 755 760 765 Cys Pro Ala Asp Leu Val Ala Arg Trp Ala Arg Pro Gly Arg Arg Arg 770 775 780 Phe Val Asn Leu Tyr Gly Pro Thr Glu Ala Thr Val Gly Cys Leu Ala 785 790 795 800 His Asp Cys Thr Asp Trp Ser Ala Ala Thr Pro Pro Pro Ile Gly Ala 805 810 815 Thr Met Pro Asn Arg Arg Thr Tyr Leu Val Asp Arg Trp Asp Asn Pro 820 825 830 Val Pro Val Gly Val Pro Gly Glu Ile Leu Val Gly Gly Ala Ala Leu 835 840 845 Ser Thr Gly Tyr Leu Asn Asp Asp Glu Leu Thr Gly Arg Arg Phe Thr 850 855 860 Ala Asp Pro Phe Asp Pro Gln Gly Arg Val Tyr Arg Thr Gly Asp Arg 865 870 875 880 Gly His Trp Asp Ala Gln Gly Arg Leu His Phe Gly Gly Arg Leu Asp 885 890 895 Gly Gln Val Lys Leu Arg Gly Leu Arg Val Glu Leu Asp Glu Ile Glu 900 905 910 Ala Leu Leu Ser Arg His Ser Gly Val Ala Arg Ala Ala Val Thr Val 915 920 925 Val Arg Asp Gly Asn Gly Val Gln Arg Leu Val Gly Tyr Val Val Asp 930 935 940 Ala Ala Glu Pro Ala Ser Asp Ala Asp Leu Arg Thr His Leu Ser Thr 945 950 955 960 Glu Leu Pro Ala His Leu Val Pro Gly Arg Phe Val Arg Leu Pro Ala 965 970 975 Leu Pro Leu Thr Thr Ser Gly Lys Val Asn Arg Arg Ala Leu Pro Ala 980 985 990 Pro Glu Ala Ala Asp Thr Asp Asp Thr Gly Ala Ala Pro Thr Thr Gly 995 1000 1005 Ala Glu Arg Gln Val Ala Glu Ile Phe Ala Glu Val Leu Gly Val Ala 1010 1015 1020 Arg Val Gly Ala Glu Thr Ser Phe Phe Asp Leu Gly Gly His Ser Leu 1025 1030 1035 1040 Gln Ala Ala His Val Leu Ala Arg Ile Ala Gly Arg Ile Gly Thr Ser 1045 1050 1055 Val Ser Leu Lys Gln Phe Tyr Ala Thr Pro Thr Val Arg Ala Val Ala 1060 1065 1070 Arg Phe Val Glu His Gly Pro Val Val Asp Ala Ser Pro Leu Val Thr 1075 1080 1085 Leu Lys Ala Thr Gly Ser Arg Pro Arg Leu Tyr Cys Pro His Ala Val 1090 1095 1100 Ser Gly Ser Pro Tyr Trp Tyr Leu Pro Leu Ser Arg Ala Leu His Pro 1105 1110 1115 1120 Glu Gln Pro Val Asp Gly Phe Glu Ala Pro Gly Leu Glu Gly Gly Ile 1125 1130 1135 Glu Pro Val Asp Asp Leu Val Thr Leu Ala Gly Arg Tyr Val Gly Ala 1140 1145 1150 Leu Arg Glu Arg Gln Pro His Gly Pro Tyr Leu Leu Ala Gly Trp Ser 1155 1160 1165 Met Gly Gly Phe Leu Cys Phe Glu Met Ala Arg Gln Leu Ala Ala Val 1170 1175 1180 Gly Ala Ala Pro Asp Leu Val Val Met Ile Asp Ser Asn Glu Pro Gly 1185 1190 1195 1200 Pro Leu Pro Leu Pro Ser Glu Arg Gln Val Met Glu Thr Phe Val Ala 1205 1210 1215 Asp Leu Ala Gly Leu Ser Ala Ala Pro Ala Pro Pro Leu Asp Ala Glu 1220 1225 1230 Val Val Asp Ala Ala Asp Pro Ile Ala Ala Leu Thr Gly Phe Leu Val 1235 1240 1245 Arg His Gly Leu Ile Pro Ser Asp Val Arg Ala Asp Phe Val Ala Asn 1250 1255 1260 Arg Tyr Ala Val Phe Arg Ala Asn Met Arg Ala Ile Tyr Gly Tyr Gln 1265 1270 1275 1280 Pro Ala Pro Tyr Ala Gly Arg Thr Val Leu Val Gln Ala Glu Arg Glu 1285 1290 1295 Ala Ser Arg Ala Ala Trp Arg Arg Trp Ser Pro Ala Met Glu Val Val 1300 1305 1310 Thr Leu Pro Gly Asp His Tyr Ser Met Trp Ser Pro Gln His Leu Pro 1315 1320 1325 Ala Leu Ala Ala Leu Ile Asp Asp Gln Val Ala Arg Val Leu Asp Leu 1330 1335 1340 Gly 1345 <210> 30 <211> 519 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF29 Protein <400> 30 Met Ala Thr Glu Asp Glu Gly Arg Pro Arg Gly Ala Arg Leu Val Leu 1 5 10 15 Leu Ile Leu Leu Val Ala Gln Val Met Ala Thr Met Asp Asn Ser Ile 20 25 30 Val Ala Val Ala Thr Lys Thr Ile Lys Asp Asp Leu Gln Thr Ser Gly 35 40 45 Ala Val Leu Gln Leu Ile Leu Ser Gly Tyr Thr Leu Met Phe Ala Val 50 55 60 Leu Val Val Thr Gly Ala Arg Leu Gly Gly Asp Val Gly His Arg Arg 65 70 75 80 Leu Phe Met Ile Gly Leu Thr Gly Phe Thr Ala Ser Ser Leu Leu Cys 85 90 95 Gly Ile Ala Pro Thr Ala Gly Thr Leu Val Ala Ala Arg Leu Leu Gln 100 105 110 Gly Ala Phe Gly Ala Met Met Val Pro Gln Val Leu Ser Val Ile Gln 115 120 125 Ile Val Phe Thr Gly Ser Ala Arg Ala Arg Ala Ile Gly Leu Tyr Ser 130 135 140 Met Val Leu Ala Leu Gly Val Ala Ala Gly Gln Ile Ala Gly Gly Val 145 150 155 160 Ile Val Ser Ala Asp Val Leu Gly Ser Gly Trp Arg Ala Ala Phe Leu 165 170 175 Val Asn Val Pro Ile Gly Leu Ala Leu Leu Ala Ala Ala Pro Arg Tyr 180 185 190 Leu Pro Gly His Thr Pro Ser Ser Arg Phe Arg Pro Asp Ile Val Gly 195 200 205 Ile Leu Leu Leu Ala Val Ser Met Gly Ala Val Val Ala Pro Leu Val 210 215 220 Phe Gly Arg Glu Gln Gly Trp Pro Ala Trp Ala Leu Ala Ser Ile Ala 225 230 235 240 Ala Gly Thr Ala Gly Leu Val Leu Phe Val Arg Tyr Glu Leu Arg Leu 245 250 255 Gly Ala Arg Gly Gly Gln Pro Val Leu Glu Ile Asp Ala Leu Arg Pro 260 265 270 Arg Gly Val Lys Ser Gly Leu Leu Ala Cys Cys Ile Leu Asn Phe Ala 275 280 285 Phe Ala Gly Val Leu Phe Pro Leu Thr Leu His Val Gln Asn Gly Leu 290 295 300 Gly Tyr Thr Pro Leu Gln Ala Gly Leu Met Phe Ile Pro Tyr Pro Val 305 310 315 320 Gly Phe Ala Ala Val Ser Leu Thr Trp Thr Arg Leu Pro Lys Arg Phe 325 330 335 His Arg Pro Leu Pro Val Ala Gly Leu Leu Val Phe Ala Leu Ala Leu 340 345 350 Ala Ala Leu Ala Val Val Val Ala Gly Gly Trp Pro Ile Ala Val Val 355 360 365 Ser Ala Leu Leu Leu Leu Ala Gly Ala Gly Met Ala Ala Gly Phe Ser 370 375 380 Thr Leu Val Glu Gln Thr Ala Ala Thr Val Gly Pro Arg Tyr Ala Ala 385 390 395 400 Ala Leu Ser Ala Leu Val Ser Thr Gly Thr Leu Leu Ala Ser Val Val 405 410 415 Ser Val Val Val Val Gly Gly Val Tyr Leu Ala Thr Ala Glu Asn Asp 420 425 430 Pro Ser Arg Ser Ala Leu Gly Leu Ser Arg Ser Leu Trp Val Asp Ala 435 440 445 Gly Leu Leu Met Leu Gly Phe Leu Leu Ala Tyr Arg Thr Trp Arg Leu 450 455 460 Ser Thr Arg Val Ser Ala Glu Thr Ala Pro Ser Gly Asp Ala Ala Glu 465 470 475 480 Gln Val Glu Ala Val Ala Ala Pro Gly Asn Ala Pro Pro Gly Glu Val 485 490 495 Asp Val Glu Pro Ala Thr Gly Pro Val Glu Glu Ser Ser Ala Pro Thr 500 505 510 Gly Ala Arg Ser Ala Pro Arg 515 <210> 31 <211> 613 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF30 Protein <400> 31 Met Ser Glu Ser Arg Thr Ala Asp Thr Ala Ser Ala Lys Arg Arg Gly 1 5 10 15 Thr Leu Gly Phe Leu Leu Gly Val Ala Leu Val Thr Ala Gly Val Leu 20 25 30 Phe Gln Leu Pro Asp Val Lys Met Met Ile Asp His Ala Arg Met Gly 35 40 45 Ser Ala Glu Pro Gly Met Asp Gly Met Asp Asp Met Asp Asp Met Asp 50 55 60 Ser Met Pro Gly Met Glu Gly Met Ser Pro Gly Glu Pro Met Asp Met 65 70 75 80 Trp Thr Pro Thr Met Ile Leu Gly Met Leu Leu Leu Val Val Gly Leu 85 90 95 Val Val Ala Gly Arg Ala Leu Phe Ala Gly Val Arg Arg Pro Asp Ser 100 105 110 Ala Ser Val Thr Val Glu Ser Ile Glu His Gly Arg Leu Arg Pro Ala 115 120 125 Tyr Trp Ile Thr Cys Ala Val Leu Thr Ile Ala Leu Val Val Asp Ile 130 135 140 Met Lys Pro Leu Thr Leu Gly Phe Val Met Pro Gly Met Ser Asp Glu 145 150 155 160 Tyr Gly Met Ser Leu Glu Ser Val Ser Ile Leu Pro Leu Val Ala Leu 165 170 175 Thr Gly Thr Ala Val Gly Ser Val Val Trp Gly Leu Leu Gly Asp Arg 180 185 190 Tyr Gly Arg Arg Thr Ala Leu Leu Leu Ala Thr Leu Leu Phe Ile Ala 195 200 205 Thr Ser Ala Cys Gly Ala Met Pro Thr Phe Glu Trp Asn Leu Val Met 210 215 220 Cys Phe Thr Met Gly Thr Ser Ala Gly Gly Leu Leu Pro Leu Val Phe 225 230 235 240 Thr Leu Ile Ala Glu Leu Thr Pro Arg Arg His Arg Gly Trp Val Ala 245 250 255 Val Thr Val Gly Gly Ile Gly Gly Leu Gly Gly Tyr Leu Ala Ala Ser 260 265 270 Glu Ala Ala Arg His Leu Glu Pro Ala Leu Thr Trp Arg Ala Leu Trp 275 280 285 Leu Ile Gly Leu Pro Ser Gly Leu Leu Leu Leu Leu Met Ala Pro Leu 290 295 300 Ile Pro Glu Ser Pro Leu Tyr Leu Leu Arg Ala Gly Arg Arg Thr Glu 305 310 315 320 Ala Glu Ala Val Leu Arg Arg Tyr Gly Ser His Leu Gly Ala Thr Pro 325 330 335 Pro Ala Ala Asp Thr Ala Ala Ala Ala Thr Arg Pro Gly Val Gly Ala 340 345 350 Met Leu Arg Ala Tyr Pro Val Val Thr Ser Val Ile Gly Val Val Gly 355 360 365 Val Val Trp Gly Leu Val Asn Phe Gly Phe Leu Val Met Leu Pro Ala 370 375 380 Gln Leu Arg Glu Ala Gly Leu Ala Gly Gly Val Ala Ser Gly Leu Leu 385 390 395 400 Ala Asp Ser Ala Leu Tyr Ser Thr Pro Ala Leu Ala Leu Val Val Leu 405 410 415 Leu Tyr Ala Ala Trp Ser Gly Arg Arg Ala Leu Ala Leu Phe Ile Ala 420 425 430 Ile Thr Ala Val Gly Leu Gly Gly Val Ala Leu Trp Thr Thr Asp Ser 435 440 445 Gly Gly Thr Val Leu Leu Leu Ala Ser Ile Gly Leu Leu Val Leu Ser 450 455 460 Leu Ser Ala Val Asn Ala Met Leu Leu Pro Tyr Ser Ala Glu Ile Tyr 465 470 475 480 Pro Thr Ala Met Arg Ala Thr Gly Ser Gly Phe Ala Gly Ala Ala Thr 485 490 495 Lys Val Gly Gly Ile Leu Gly Pro Ser Ala Met Leu Leu Ile Leu Ser 500 505 510 Leu Gly Gly Gly Leu Val Ala Pro Ala Ile Ala Leu Gly Val Leu Cys 515 520 525 Leu Ala Ala Thr Val Leu Leu Leu Val Phe Gly Pro Glu Leu Gly Ala 530 535 540 Ser Val Gly Pro Leu Ala Arg Arg Gly Val Gly Thr Val Pro Val Ser 545 550 555 560 Arg Thr Gly Pro Ala Pro Gly Thr Gly Pro Thr Asp Thr Glu Ser Pro 565 570 575 Ala Ser Val Ala Trp Ser Ala Thr Gly Asn Val Val Pro Ala Thr Arg 580 585 590 Pro Ala Val Ser Asp Asp Asp Asp Pro Arg Asp Ala Arg Thr Pro Ala 595 600 605 Thr Pro Ser Arg Thr 610 <210> 32 <211> 191 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF31 Protein <400> 32 Val Pro His Val Asp Arg Ser Ala Arg Ser Gly Pro Cys Cys Ala Ser 1 5 10 15 Met Asp Tyr Met Thr Ile Gln Ser Asp Pro Met Ala Ser Thr Asp Glu 20 25 30 Val Arg Gly Glu Pro Ala Asp Glu Phe Val Gly Ala Leu Val Ser Leu 35 40 45 Ser Arg Val Met Val Ala Val Ala Met Arg Thr Leu Ala Arg Ile Asp 50 55 60 Ala Asp Val Thr Leu Gln Gln Phe Arg Thr Leu Val Val Leu Val Pro 65 70 75 80 Gly Pro Gln Arg Val Ile Asp Leu Ala Lys Leu Leu Gly Val Gln Ser 85 90 95 Ser Thr Ala Thr Arg Met Cys Asp Arg Leu Val Arg Lys Gly Leu Val 100 105 110 Ala Arg His Glu Arg Val Ala Asp Arg Arg Ala Ala Trp Val Gly Leu 115 120 125 Thr Val Ala Gly Lys Glu Leu Val Gly Leu Gly Met Arg Ala Arg Gln 130 135 140 Gln Glu Leu Glu Arg Met Leu Ala Asp Leu Arg Pro Asp Asp Thr Asp 145 150 155 160 Val Thr Thr Gly Ala Leu Val Ala Val Leu Arg Ala Thr Gly Glu Leu 165 170 175 Thr Asp Gly Ala Trp Trp Arg Gln Trp Ala Asp Ser Val Val Glu 180 185 190 <210> 33 <211> 224 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF32 Protein <400> 33 Met Thr Val Val Pro Asp Asp Asn Leu Met Thr Leu Ile Cys Asp Val 1 5 10 15 Cys Gly Asp Thr Thr Thr Gly Thr Ala Cys Val Leu Pro Asp Ala Glu 20 25 30 Val Val Trp Thr Leu Val Ser Asp His Gly Trp Ser Gly Ser Pro Phe 35 40 45 Ala Thr Gly Pro His Arg Cys Pro Arg Cys Ser Ala Leu Pro Pro Gly 50 55 60 Ser Ser Leu Gly Asp Gly Asp Arg Ala Gly Ser Gly Leu Ala Glu Ala 65 70 75 80 Ala Val Val Val Pro Ala Asp Gly Gly Asp Gln Asp Thr Gly Asp Ala 85 90 95 Leu Arg Ala Ala Leu Arg Gly Ala Phe Asp Val Ala Gly Thr Val Val 100 105 110 Val Asp Leu Thr Gln Val Gln Val Ile Asp Ser Leu Gly Leu Gly Met 115 120 125 Leu Val Arg Ala His Arg Asp Val Arg Glu Arg Gly Gly Arg Leu Cys 130 135 140 Leu Ala Ala Pro Ser Arg Phe Ile Arg Thr Val Leu His Thr Met Lys 145 150 155 160 Leu Asp Gly Val Phe Pro Ile Phe Asp Ser Leu Asp Ala Ala Leu Asp 165 170 175 Gln Leu Arg Asn Ala Ala Ser Gln Asp Ala Val Ser Ala Gly Val Ser 180 185 190 Pro Val Asp Val Thr Pro Ser Asp Leu Pro Arg Pro Ala Ala Glu Val 195 200 205 Pro Ser Met Pro Met Ala Arg Arg Arg Ala Ala Ser Arg Val Thr Val 210 215 220 <210> 34 <211> 89 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF33 Protein <400> 34 Met Thr Ser Ala Gly Ile Val Thr Ala Leu Ala Val Gly Leu Ala Val 1 5 10 15 Gly Ala Leu Gly Arg Leu Val Leu Pro Gly Arg Pro Ala Ala Pro Leu 20 25 30 Trp Leu Thr Met Thr Ile Gly Ala Val Ala Ser Leu Leu Gly Ala Ile 35 40 45 Thr Ala Trp Leu Ala Gly Val Gln Gly Phe Ser Ile Leu Gly Leu Val 50 55 60 Val Gln Ala Gly Leu Ala Ala Val Ala Val Val Ile Val Val Ala Thr 65 70 75 80 Thr Gly Lys Glu Arg Ser Asp Ser Leu 85 <210> 35 <211> 168 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF34 Protein <400> 35 Val Ala Ala Asn Pro Ala Gly Gln Gly Glu Ser His Ser Glu Thr Ala 1 5 10 15 Gly Glu Gly Ala Leu Ala Val Thr Ala Pro Arg Arg Pro Glu Cys Ser 20 25 30 Val Pro Leu Val Glu Val Ser Ile Thr Glu Phe Asp Leu Ser Cys Leu 35 40 45 Pro Glu Thr Gly Ala Val Leu Asp Gln Leu Leu Ala Leu Arg Pro Gly 50 55 60 Gln Val Val Ile Asp Leu Ala Gly Cys Arg His Ile Asp Ala Ala Ala 65 70 75 80 Ile Gly Leu Leu Leu Asp Val His Arg Arg Met Val Arg Ala Gly Gly 85 90 95 Val Leu Ala Val Arg Asn Pro Asn Pro Arg Ile Thr Arg Ile Leu Gln 100 105 110 Thr Ala Arg Leu Asp Gln Ile Leu Pro Val His Thr Asp Ala Ala Ser 115 120 125 Ala Pro Val Thr Glu Ala Val Thr Ala Ala Pro Gly Val Pro Pro Ala 130 135 140 Asp Gly Thr Pro Ala Pro Gly Thr Val Pro Arg Ala Ala Ala Tyr Gly 145 150 155 160 Arg Ala Ala Val Thr Val Arg Thr 165 <210> 36 <211> 229 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF35 Protein <400> 36 Met Thr Ala Val Leu Val Ile Glu Asp Asp Asp Arg Ile Arg Leu Ala 1 5 10 15 Leu Leu Leu Ala Leu Glu Asp Glu Gly Tyr Glu Ala Arg Gly Ala Ala 20 25 30 Thr Ala Glu Glu Gly Leu Arg Thr Gln Arg Arg Asp Pro Ala Asp Tyr 35 40 45 Val Leu Val Asp Leu Met Leu Pro Gly Ile Asp Gly Phe Glu Gly Ile 50 55 60 Arg Gln Leu Arg Arg Asp Asp Asp Val Pro Ile Val Val Val Ser Ala 65 70 75 80 Arg Asp Asp Thr His Asp Ile Val Ala Ala Leu Glu Ala Gly Ala Asp 85 90 95 Asp Tyr Val Val Lys Pro Val Ala Ile Lys Glu Leu Thr Ala Arg Leu 100 105 110 Arg Ala Leu Arg Arg Arg Gly Arg Thr Thr Thr Ala Ser Asp Gly Pro 115 120 125 Gln Pro Val Pro Val Leu Ala Phe Gly Asp Leu Glu Val Ser Pro Glu 130 135 140 Ala Gly Glu Val Arg Arg Ala Gly Glu Pro Val Ala Val Thr Arg Thr 145 150 155 160 Glu Phe Arg Leu Leu Cys Glu Leu Ala Glu His Ala Gly Arg Val Leu 165 170 175 Ser Arg Gln Gln Leu Leu Ser Arg Val Trp Gly Tyr Asp Ser Gly Asp 180 185 190 Glu Arg Leu Val Asp Val His Val Gly Arg Leu Arg Gln Lys Ile Glu 195 200 205 Ala Asp Pro Ala Asn Pro Arg His Leu Val Thr Leu Arg Gly Leu Gly 210 215 220 Tyr Lys Leu Gln Arg 225 <210> 37 <211> 427 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF36 Protein <400> 37 Met Ala Leu Val Ser Tyr Glu Leu Thr Arg Arg Thr Leu Leu Asp Glu 1 5 10 15 Arg Glu Arg Thr Val Leu Arg Ala Ala Tyr Tyr Asp Ala Ala Val Val 20 25 30 Arg Ala Gly Leu Asp Thr Asp Asn Pro Asp Val Ala Glu Ala Leu Arg 35 40 45 Ala Leu Asp Thr Gly Thr Gly Arg Arg Pro Leu Val Leu Leu Asp Gly 50 55 60 Glu Trp Tyr Ala Arg Ser Ala Asp Asn Gly Leu Thr Thr Ile Val Pro 65 70 75 80 Ala Arg Leu Gln Asp Leu Val Ala Ala Gly Glu Pro Ala Val Gln Arg 85 90 95 Val Arg Val Asn Asp Thr Pro Val Met Leu Val Gly Val Pro Leu Ser 100 105 110 Glu Ser Thr Ala Phe Tyr Glu Ile Ala Ser Leu Arg Glu Leu Glu Gln 115 120 125 Thr Phe Gln Val Leu Ala Leu Ala Leu Thr Ala Val Ala Ile Met Ile 130 135 140 Ala Gly Ser Gly Ala Ala Leu Gly Trp Tyr Ala Thr Arg His Gly Leu 145 150 155 160 Arg Pro Leu Thr Ala Val Ala Asp Ala Ala Glu Arg Ile Ala Ala Gly 165 170 175 Asp Phe Thr Thr Arg Leu Ala Pro Asp Thr Asp Pro Asp Leu Thr Arg 180 185 190 Leu Ser Thr Ser Phe Asn Arg Met Val Asp Glu Leu Ala Gly Arg Ile 195 200 205 Asp Arg Asp Arg Arg Phe Ala Ala Asp Val Ser His Glu Leu Arg Ser 210 215 220 Pro Leu Gln Thr Leu Ala Ala Ala Ala Ser Val Leu Ser Arg Arg Arg 225 230 235 240 Glu Asn Gln Asp Glu Arg Thr Ala Thr Ala Ala Arg Leu Val Ala Asp 245 250 255 Glu Ile Asp Arg Phe Gln Gln Leu Val Asn Asp Leu Leu Asp Leu Ala 260 265 270 Arg Gly Asp Gln Pro Val His Arg Glu Ser Val Asp Leu Pro Glu Leu 275 280 285 Ala Arg Gln Ala Cys Arg Asp Arg Asp Leu Pro Glu Ser Met Val Gln 290 295 300 Leu Ala Thr Gly Thr Pro Pro Gly Trp Arg Val Asp Arg Arg Arg Val 305 310 315 320 Ala Gln Val Leu Ala Asn Leu Leu Asp Asn Ala Glu Arg Tyr Gly Ala 325 330 335 Gly Pro Val Ala Val Arg Leu Ser His Asp Ala Asp Thr Gly Val Ile 340 345 350 Glu Val Asp Asp Glu Gly Pro Gly Val Pro Met Glu Asp Arg Glu Ala 355 360 365 Ile Phe Asp Arg Phe Val Arg Gly Arg Ala Ala Asn Tyr Arg Gly Gly 370 375 380 Gly Asp Gly Thr Gly Leu Gly Leu Ala Leu Val Ala Gln His Ala Ala 385 390 395 400 Ala His Gly Gly Asp Ala Ser Val Ser Asp Arg Pro Glu Gly Gly Ala 405 410 415 Arg Phe Arg Val Thr Leu Pro Gly Ser Leu Ser 420 425 <210> 38 <211> 178 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF37 Protein <400> 38 Val Phe Ala Leu Leu Gly Ala Cys Gly Val Pro Ala Glu Asp Arg Pro 1 5 10 15 Arg Ala Val Thr Pro Pro Pro Val Pro Phe Pro Ala Thr Ala Ser Ala 20 25 30 Ala Pro Thr Ala Ala Glu Thr Gly Ala Val Thr Glu Val Leu Tyr Phe 35 40 45 Ala Arg Asp Glu Arg Leu Val Pro Val Ile Arg Arg Ala Asp Gln Val 50 55 60 Pro Ala Leu Asp Ala Gln Leu Arg Ala Leu Leu Ala Gly Pro Thr Pro 65 70 75 80 Thr Glu Arg Asp Asp Gly Leu Thr Ser Ala Leu Pro Gly Ala Phe Thr 85 90 95 Ser Ala Val Val Glu Leu Val Asp Gly Leu Ala Arg Val Thr Val Gly 100 105 110 Leu Thr Ala Val Asp Thr Gly Arg Ser Asp Gly Arg Leu Ala Tyr Gly 115 120 125 Gln Ile Val Cys Thr Leu Thr Ala Arg Thr Asp Val Thr Ala Val Leu 130 135 140 Phe Leu Glu Gly Gly Thr Pro Leu Ser Val Pro Arg Ala Asp Gly Ser 145 150 155 160 Leu Ser Ser Gly Pro Leu Thr Ala Ala Asp Tyr Ala Val Leu Ile Asn 165 170 175 Pro Arg <210> 39 <211> 574 <212> PRT <213> Micromonospora sp., ML1 strain <220> <223> ORF38 Protein <400> 39 Val Asn Asp Arg Ala Glu Thr Leu Glu Phe Gln Ala Glu Ala Arg Gln 1 5 10 15 Leu Leu Arg Leu Met Val His Ser Ile Tyr Ser Asn Lys Asp Val Phe 20 25 30 Leu Arg Glu Leu Ile Ser Asn Ala Ser Asp Ala Leu Asp Lys Leu Arg 35 40 45 Leu Ala Ser Met Val Asp Lys Asp Leu Ala Val Asp Thr Gly Asp Leu 50 55 60 His Ile Ala Ile Glu Val Asp Arg Asp Ala Arg Thr Leu Thr Val Arg 65 70 75 80 Asp Asn Gly Ile Gly Met Ser Arg Asp Glu Val Val Ser Val Ile Gly 85 90 95 Thr Ile Ala Lys Ser Gly Thr Ala Glu Leu Leu Arg Gln Leu Arg Glu 100 105 110 Ala Lys Asp Ala Gly Ala Ser Gln Glu Leu Ile Gly Gln Phe Gly Val 115 120 125 Gly Phe Tyr Ala Ala Phe Met Val Ala Glu Arg Val Glu Leu Val Thr 130 135 140 Arg Arg Ala Gly Glu Thr Gly Gly Thr Arg Trp Glu Ser Thr Gly Glu 145 150 155 160 Gly Thr Tyr Thr Ile Thr Glu Leu Asp Asp Ala Pro Gln Gly Thr Ala 165 170 175 Val Thr Leu His Leu Lys Pro Ala Asp Ala Glu Asp Asn Leu His Asp 180 185 190 Tyr Thr Ala Glu Trp Thr Ile Arg Gly Ile Val Lys Arg Tyr Ser Asp 195 200 205 Phe Ile Ala His Pro Ile Arg Met Thr Val Glu Arg Pro Gly Thr Asp 210 215 220 Asp Ala Pro Ala Thr Thr Glu Ala Val Thr Leu Asn Ser Met Lys Ala 225 230 235 240 Leu Trp Ala Arg Pro Arg Gly Glu Val Glu Pro Ala Glu Tyr His Glu 245 250 255 Phe Tyr Lys His Val Ser His Asp Trp Ala Asp Pro Leu Glu Thr Ile 260 265 270 His Met Arg Gly Glu Gly Thr Phe Glu Tyr Glu Ala Leu Leu Phe Ile 275 280 285 Pro Thr His Ala Pro Leu Asp Leu Phe Ser Pro Gln Gly Arg Arg Gly 290 295 300 Val Gln Leu Tyr Val Lys Arg Val Phe Ile Met Asp Asp Cys Asp Ala 305 310 315 320 Leu Met Pro Asn Tyr Leu Arg Phe Val Lys Gly Val Val Asp Ala His 325 330 335 Asp Leu Ser Leu Asn Ile Ser Arg Glu Ile Leu Gln Gln Asp Arg Gln 340 345 350 Ile Arg Ala Val Arg Arg Arg Leu Val Lys Lys Ile Leu Ala Thr Val 355 360 365 Lys Asp Leu Lys Thr Gly Gln Pro Glu Arg Tyr Arg Thr Phe Trp Thr 370 375 380 Glu Phe Gly Thr Val Val Lys Glu Gly Leu Leu Glu Asp Thr Asp Asn 385 390 395 400 Arg Asp Thr Leu Leu Glu Ile Leu Ser Val Ala Ser Thr Asn Asp Pro 405 410 415 Ala Glu Gln Thr Asp Leu Ala Gly Tyr Val Glu Arg Met Arg Glu Gly 420 425 430 Gln Gln Asp Ile Tyr Tyr Ala Thr Gly Glu Asn Arg Ser Thr Ile Glu 435 440 445 Asn Ser Pro His Ile Glu Ala Phe Arg Ala Lys Gly Tyr Glu Val Leu 450 455 460 Leu Leu Thr Asp Pro Val Asp Glu Val Trp Val Glu Arg Val Gly Ser 465 470 475 480 Tyr Ala Gly Lys Thr Leu Arg Ser Val Ala Lys Gly Gln Val Asp Leu 485 490 495 Asp Thr Glu Gln Glu Arg Thr Glu Ala Glu Ala Glu Arg Glu Arg Gln 500 505 510 Arg Thr Glu Tyr Ala Asp Leu Leu Gly Trp Met Gly Glu Val Leu Ala 515 520 525 Asp Asn Val Lys Glu Val Arg Leu Ser Ser Arg Leu Thr Thr Ser Pro 530 535 540 Ala Cys Val Val Gly Asp Ala His Asp Leu Thr Pro Thr Leu Glu Lys 545 550 555 560 Met Tyr Arg Ala Met Gly Gln Glu Val Pro Lys Val Lys Arg 565 570

Claims (26)

  1. 하나 이상의 생합성적 티오코랄린(thiocoraline) 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자.
  2. 제 1 항에 있어서, 모든 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
  3. 제 1 항 또는 제 2 항에 있어서, 서열 식별 번호: 1 에 제시된 뉴클레오티드 서열 또는 그의 상보적 가닥을 포함하는 핵산 분자.
  4. 제 3 항의 핵산 분자와 혼성화하며, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 핵산 분자.
  5. 제 1 항에 있어서, 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
  6. 제 5 항에 있어서, 하기로 이루어지는 군으로부터 선택되는 핵산 분자:
    - 서열 식별 번호: 1 의 뉴클레오티드 2-535 (orf1) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 993-1130c (orf2) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 1517-2131 (tio3) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 2154-2822c (tio4)를 포함하는 핵산 분자 ;
    - 서열 식별 번호: 1 의 뉴클레오티드 2970-3791c (tio5) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 3794-4777c (tio6) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 4904-5611 (tio7) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 5701-6426c (tio8) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 6426-7688c (tio9) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 7733-8524c (tio10) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 8791-10002 (tio11) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 10002-11590c (tio12) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 11847-13634 (tio13) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 13734-15005c (tio14) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 15005-16354c (tio15) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 16441-18744c (tio16) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 18774-19055c (tio17) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 19260-20036 (tio18) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 20146-20880c (tio19) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 21188-28969 (tio20) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 28979-38398 (tio21) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 38449-38661 (tio22) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 38642-41263 (tio23) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 41835-42368 (tio24) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 42395-43255c (tio25) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 43340-43741c (tio26) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 44152-49563 (tio27) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 49635-53669 (tio28) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 53749-55305c (orf29) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 55384-57222c (orf30) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 57895-58467c (orf31) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 58535-59206c (orf32) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 59298-59564c (orf33) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 59611-60114c (orf34) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 60202-60888 (orf35) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 60960-62240 (orf36) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 62300-62833 (orf37) 를 포함하는 핵산 분자;
    - 서열 식별 번호: 1 의 뉴클레오티드 62925-64650 (orf38) 를 포함하는 핵산 분자; 또는
    생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩하는 이들의 절편.
  7. 제 1 항에 있어서, 2 개 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
  8. 제 7 항에 있어서, orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20 , tio21 , tio22 , tio23 , tio24 , tio25 , tio26 , tio27, tio28 , orf29 , orf30 , orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38 로서 식별되는 유전자 및 생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩하는 이들의 절편으로부터 선택되는 2 개 이상의 유전자를 포함하는 핵산 분자.
  9. 제 1 항에 있어서, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자, 또는 그의 돌연변이체 또는 변이체로서, 상기 단백질이 ORF1 (서열 식별 번호: 2), ORF2 (서열 식별 번호: 3), Tio3 (서열 식별 번호: 4), Tio4 (서열 식별 번호: 5), Tio5 (서열 식별 번호: 6), Tio6 (서열 식별 번호: 7), Tio7 (서열 식별 번호: 8), Tio8 (서열 식별 번호: 9), Tio9 (서열 식별 번호: 10), Tio10 (서열 식별 번호: 11), Tio11 (서열 식별 번호: 12), Tio12 (서열 식별 번호: 13), Tio13 (서열 식별 번호: 14), Tio14 (서열 식별 번호: 15), Tio15 (서열 식별 번호: 16), Tio16 (서열 식별 번호: 17), Tio17 (서열 식별 번호: 18), Tio18 (서열 식별 번호: 19), Tio19 (서열 식별 번호: 20), Tio20 (서열 식별 번호: 21), Tio21 (서열 식별 번호: 22), Tio22 (서열 식별 번호: 23), Tio23 (서열 식별 번호: 24), Tio24 (서열 식별 번호: 25), Tio25 (서열 식별 번호: 26), Tio26 (서열 식별 번호: 27), Tio27 (서열 식별 번호: 28), Tio28 (서열 식별 번호: 29), ORF29 (서열 식별 번호: 30), ORF30 (서열 식별 번호: 31), ORF31 (서열 식별 번호: 32), ORF32 (서열 식별 번호: 33), ORF33 (서열 식별 번호: 34), ORF34 (서열 식별 번호: 35), ORF35 (서열 식별 번호: 36), ORF36 (서열 식별 번호: 37), ORF37 (서열 식별 번호: 38), ORF38 (서열 식별 번호: 39) 로 식별되는 단백질 및 이들의 조합으로 이루어진 군으로부터 선택되는 핵산 분자.
  10. 제 1 항에 있어서, orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20 , tio21 , tio22 , tio23 , tio24, tio25 , tio26 , tio27 , tio28 , orf29 , orf30 , orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38 및 이들의 조합, 또는 이들의 상응하는 영역, 돌연변이체 또는 변이체로 이루어지는 군으로부터 선택되는 orf를 포함하는 뉴클레오티드 서열을 포함하는 핵산 분자.
  11. 제 1 항에 있어서, 미크로모노스포라 종 (Micromonospora sp.) 으로부터 분리된 핵산 분자.
  12. 제 1 항 내지 제 11 항 중 어느 한 항의 하나 이상의 핵산 분자를 함유하는 조성물.
  13. 제 1 항 내지 제 11 항 중 어느 한 항의 핵산 분자 또는 그의 절편을 포함하는 프로브.
  14. 제 1 항 내지 제 11 항 중 어느 한 항의 핵산 분자 또는 제 12 항의 조성물을 포함하는 벡터.
  15. 본 발명의 벡터로 형질전환 또는 트랜스펙션된 숙주 세포.
  16. 제 15 항에 있어서, 상기 숙주 세포는 미생물, 바람직하게는 박테리아인 숙주 세포.
  17. 제 16 항에 있어서, 상기 박테리아가 그람-양성 (Gram-positive) 박테리아, 바람직하게는 방선균 (actinomycete) 또는 스트렙토마이세트 (streptomycete) 인 숙주 세포.
  18. 본 발명의 핵산 분자에 의해 코딩되는 단백질.
  19. 제 18 항에 있어서, ORF1 (서열 식별 번호: 2), ORF2 (서열 식별 번호: 3), Tio3 (서열 식별 번호: 4), Tio4 (서열 식별 번호: 5), Tio5 (서열 식별 번호: 6), Tio6 (서열 식별 번호: 7), Tio7 (서열 식별 번호: 8), Tio8 (서열 식별 번호: 9), Tio9 (서열 식별 번호: 10), Tio10 (서열 식별 번호: 11), Tio11 (서열 식별 번호: 12), Tio12 (서열 식별 번호: 13), Tio13 (서열 식별 번호: 14), Tio14 (서열 식별 번호: 15), Tio15 (서열 식별 번호: 16), Tio16 (서열 식별 번호: 17), Tio17 (서열 식별 번호: 18), Tio18 (서열 식별 번호: 19), Tio19 (서열 식별 번호: 20), Tio20 (서열 식별 번호: 21), Tio21 (서열 식별 번호: 22), Tio22 (서열 식별 번호: 23), Tio23 (서열 식별 번호: 24), Tio24 (서열 식별 번호: 25), Tio25 (서열 식별 번호: 26), Tio26 (서열 식별 번호: 27), Tio27 (서열 식별 번호: 28), Tio28 (서열 식별 번호: 29), ORF29 (서열 식별 번호: 30), ORF30 (서열 식별 번호: 31), ORF31 (서열 식별 번호: 32), ORF32 (서열 식별 번호: 33), ORF33 (서열 식별 번호: 34), ORF34 (서열 식별 번호: 35), ORF35 (서열 식별 번호: 36), ORF36 (서열 식별 번호: 37), ORF37 (서열 식별 번호: 38), ORF38 (서열 식별 번호: 39) 로 식 별되는 단백질 및 이들의 조합으로 이루어지는 군으로부터 선택되는 단백질, 또는 그의 생물학적 활성 절편.
  20. 적합한 조건 하에서 티오코랄린-생산 유기체를 배양하는 단계, 및 원하는 경우 티오코랄린의 생합성에 수반되는 하나 이상의 상기 단백질을 분리하는 단계를 포함하는, 제 18 항 또는 제 19 항의 티오코랄린 생합성에 수반되는 단백질을 제조하는 방법.
  21. 티오코랄린 화합물 생산에 적합한 조건 하에 티오코랄린-생산 유기체를 배양하여 티오코랄린의 생합성에 수반되는 단백질을 코딩하는 유전자의 카피수를 증가시키는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는, 티오코랄린의 제조 방법.
  22. 티오코랄린의 생합성 이행능력이 있는 단백질을 코딩하는 유전자의 발현이, 티오코랄린의 생합성에 수반되는 단백질을 코딩하는 하나 이상의 유전자의 조작 또는 치환으로 또는 상기 유전자의 발현 조절 이행능력이 있는 서열의 조작으로 조절되는 티오코랄린-생산 유기체를, 티오코랄린 화합물 생산에 적합한 조건 하에서 배양하는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는 티오코랄린의 제조 방법.
  23. 제 21 항 또는 제 22 항에 있어서, 상기 티오코랄린-생산 유기체가 방선균, 바람직하게는 미크로모노스포라 종인 방법.
  24. 티오코랄린 화합물 제조에 적합한 조건 하에서, 제 15 항 내지 제 17 항 중 어느 한 항의 숙주 세포를 배양하는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는 티오코랄린의 제조 방법.
  25. 제 24 항에 있어서, 상기 숙주 세포가 방선균 또는 스트렙토세트인 방법.
  26. 하기 단계를 포함하며, 미크로모노스포라 종 ML1 유래의 티오코랄린의 생합성 이행능력이 있는 유전자를 이용하는, 또다른 방선균에서의 상기 티오코랄린 화합물의 제조 방법:
    (1) 티오코랄린 생합성 경로의 특이적인 유전자에 타격을 받은 돌연변이체를 수득하는 단계;
    (2) 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터를 포함하는 미크로모노스포라 종 ML1 염색체 영역을 분리하는 단계;
    (3) 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터의 뉴클레오티드 서열을 수득하고 분석하는 단계; 및
    (4) 다른 방선균에서 티오코랄린을 이종적으로 생산하는 단계.
KR1020087004989A 2005-08-02 2006-08-01 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 KR20080032641A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ESP200501932 2005-08-02
ES200501932 2005-08-02

Publications (1)

Publication Number Publication Date
KR20080032641A true KR20080032641A (ko) 2008-04-15

Family

ID=37708972

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087004989A KR20080032641A (ko) 2005-08-02 2006-08-01 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산

Country Status (11)

Country Link
US (1) US20090130675A1 (ko)
EP (1) EP1925668A2 (ko)
JP (1) JP2009502187A (ko)
KR (1) KR20080032641A (ko)
CN (1) CN101278050A (ko)
AU (1) AU2006274822A1 (ko)
CA (1) CA2617592A1 (ko)
IL (1) IL189158A0 (ko)
MX (1) MX2008001585A (ko)
RU (1) RU2008107974A (ko)
WO (1) WO2007014971A2 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JOP20190254A1 (ar) 2017-04-27 2019-10-27 Pharma Mar Sa مركبات مضادة للأورام

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6927286B1 (en) * 1999-01-06 2005-08-09 The Regents Of The University Of California Bleomycin gene cluster components and their uses
DE60237984D1 (de) * 2001-11-22 2010-11-25 Univ Bonn Neuer gen-cluster aus genen der pederin-biosynthese

Also Published As

Publication number Publication date
RU2008107974A (ru) 2009-09-10
WO2007014971A3 (es) 2007-05-10
CA2617592A1 (en) 2007-02-08
US20090130675A1 (en) 2009-05-21
MX2008001585A (es) 2008-04-22
WO2007014971A2 (es) 2007-02-08
JP2009502187A (ja) 2009-01-29
CN101278050A (zh) 2008-10-01
AU2006274822A1 (en) 2007-02-08
IL189158A0 (en) 2008-08-07
EP1925668A2 (en) 2008-05-28

Similar Documents

Publication Publication Date Title
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
JPH09224687A (ja) ポリケチドシンターゼ遺伝子
JPH09224686A (ja) プラテノリドシンターゼ遺伝子
KR20070033979A (ko) 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna
KR20100039443A (ko) 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법
KR20100049580A (ko) 티오펩티드 전구체 단백질, 그를 코딩하는 유전자 및 그의 용도
CN101275141A (zh) 阿嗪霉素的生物合成基因簇
CN107794286B (zh) 一种环脂肽类化合物生物合成基因簇及其激活方法与应用
CN101818158B (zh) Fr901464的生物合成基因簇
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
CN107540682B (zh) 曲张链丝菌素衍生物及其制备方法和应用
US20020164747A1 (en) Gene cluster for ramoplanin biosynthesis
KR20190005872A (ko) 화합물의 제조를 위한 조성물 및 방법
CN110857447B (zh) 提高米尔贝霉素a3/a4或其衍生物产量的方法
CN101063140B (zh) 万古霉素生物合成基因簇
US20030175888A1 (en) Discrete acyltransferases associated with type I polyketide synthases and methods of use
KR101189475B1 (ko) 삼원환 화합물의 생합성을 담당하는 유전자와 단백질
US20030064491A1 (en) Genes and proteins involved in the biosynthesis of enediyne ring structures
KR20080032641A (ko) 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산
US20030171562A1 (en) Genes and proteins for the biosynthesis of polyketides
CA2391131C (en) Genes and proteins for rosaramicin biosynthesis
CN107164394B (zh) 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用
CN106676115A (zh) 2’‑氯代喷司他丁和2’‑氨基‑2’‑脱氧腺苷生物合成基因簇及其应用
CN102517309A (zh) 一种手霉素类抗生素生物合成基因簇
US20040219645A1 (en) Polyketides and their synthesis

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid