KR20080032641A - 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 - Google Patents
티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 Download PDFInfo
- Publication number
- KR20080032641A KR20080032641A KR1020087004989A KR20087004989A KR20080032641A KR 20080032641 A KR20080032641 A KR 20080032641A KR 1020087004989 A KR1020087004989 A KR 1020087004989A KR 20087004989 A KR20087004989 A KR 20087004989A KR 20080032641 A KR20080032641 A KR 20080032641A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- val
- arg
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/36—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
- C12N15/69—Increasing the copy number of the vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/76—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/185—Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system
- C12P17/187—Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system containing two or more directly linked sulfur atoms, e.g. epithiopiperazines
Abstract
본 발명은 티오코랄린 생합성에 수반되는 유전자 및 그의 이종적 생산에 관한 것이다. 본 발명에 따르면, 티오코랄린 생합성 이행능력이 있는 유전자의 클러스터가 동정되고 클로닝되었다. 상기 유전자 클러스터는 항종양 및 항박테리아 활성을 가진 티오코랄린의 이종적 생산에 이용될 수 있다.
Description
본 발명은 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터 및 티오코랄린의 이종적 생산에서의 그의 용도에 관한 것이다.
티오코랄린 (I)
은 해양 방선균, 구체적으로는 미크로모노스포라세 (Micromonosporaceae) 패밀리로부터 분리되는 시클로이량체성 티오뎁시펩티드이다 (Perez Baz et al., J. Antibiotics, 50(9), 738-741, 1997; Romero et al., J. Antibiotics, 50(9), 734-737, 1997). 티오코랄린이 미크로모노스포라 마리나 (Micromonospora marina) 또는 미크로모노스포라 종 (Micromonospora sp .) L-13-ACM-092 으로부터 수득된다는 것이 기재되어 왔지만, 후속적인 연구는 상기 화합물이 방선균 미크로모노스포라 종 (Micromonospora sp .) ML1 로부터도 분리될 수 있다는 것을 보였는데, 이것은 모잠비크의 인도양 해안에서 발견되는 해양 연체동물에서 분리된다 (Espliego, F. Ph.D. Thesis, 1996, University of Leon; de la Calle, F. Ph.D. Thesis, 1998, Autonomous University of Madrid).
시험관내 연구는, 흑색종, 유방암, 작지 않은 (non-microcytic) 폐암 및 대장암과 같은 다양한 타입의 고체 종양의 세포주 성장을 저해하는 티오코랄린의 역량을 보여줬다. 티오코랄린은 또한 인간 암종 이종이식편에 대한 생체내 검정에서 괄목할 항종양 활성을 갖는다는 것이 밝혀졌다 (Faircloth et al. Eur. J. Cancer, 33, 175, 1997 (abstract)). 티오코랄린은 추가로 그람-양성 박테리아에 대한 항박테리아 활성을 보여준다.
상기 해양 방선균 (Micromonospora sp. ML1) 유래의 티오코랄린을 수득하는 것은 작은 규모 상에서 실행가능하지만, 큰 규모에서는 상기 수득은 상기 미생물에서 관찰되는 변이성으로 인해 제한된다. 한편, 상기 유기체에서의 티오코랄린의 생산은 상기 유기체의 느린 성장 속도로 인해 시간 소모적인 프로세스이며, 상이한 뱃치마다 생산 수율에 있어서 상당한 변동성을 나타낸다.
따라서, 한편으로는 상기 해양 방선균에서 티오코랄린을 수득하는 것이 상당히 제한된다는 사실과, 다른 한편으로는 티오코랄린 분자가 복잡한 구조를 가져 공업적 수준에서 그의 합성은 번잡할 수 있다는 사실로 인해, 지령된 방식으로 상기 수득물에 작용할 수단을 창출하고자 하는 목적으로 그의 생합성의 유전적 근간을 이해하는 것이 바람직하다. 자연 생산 균주들은 일반적으로 상기 생성물을 매우 불규칙한 방식으로 낮은 농도로 생산하니, 그러한 이해는 생산될 티오코랄린의 증량을 유도할 수도 있다. 마찬가지로, 이는 또한 자연적으로는 상기 화합물을 생산하지 않는 숙주에서의 티오코랄린 생산을 가능하게 할 수도 있다.
재조합 DNA 기술의 발전은, 주로 방선균 군 유래 박테리아의, 상기 생활성 화합물의 생합성에 수반되는 유전자를 취급함으로써 생활성 화합물을 생성 및 생산하기 위한 흥미있는 연구 분야를 개척했다. 상기 기술은 기존의 공지된 자연 화합물의 생산 개선에 이용될 수 있는데, 이는 자연 균주가 일반적으로 관심대상의 대사물을 낮은 농도로 생산하기 때문이다.
마찬가지로, 유전자 조작 및 발효작용에 더욱 적합한 다른 방선균에서의 티오코랄린의 생합성에 수반되는 유전자 클러스터의 이종적 발현은, 더 짧은 발효작용 시간에 더 큰 재현가능한 수율로 상기 화합물을 생산하는 것을 가능하게 할 것이다.
공지된 바와 같이, 다수의 박테리아 및 진균이, 항종양 및 항박테리아 펩티드 등을 포함하여, 비-리보좀 기원을 가진 광범위한 생물학적 활성 펩티드를 합성한다. 상기 화합물 패밀리의 생합성은 비-리보좀 펩티드 합성효소 (NRPS) 에 의해 수행되는데, 이는 모듈성의 촉매 도메인 구성을 가진 다관능성 효소이다. 각각의 상기 모듈은 연장 순환 (elongation cycle) 을 수행하는데, 즉 특이적 아미노산을 화합물의 최종 구조로 활성화 및 혼입한다. 최소 모듈은 3 개의 도메인에 의해 형 성된다: (i) 특정 아미노산을 선택하고, ATP 를 이용하여 그의 아데닐화 아미노아실 버젼을 생성하는 이행능력이 있는 아데닐화 도메인, (A, 약 550 개의 아미노산이 있음); (ii) 보조인자로서 작용하는 포스포판테테인온 (PP) 보결분자단을 포함하며, 공유 결합에 의해 P 도메인에 결합하는 펩티딜 캐리어 도메인 (P, 약 80 개의 아미노산이 있음); 상기 도메인은 이후 반응 중심으로 이동하기 전에 활성화된 아데닐화 아미노산을 고정하는 이행능력이 있음; 및 (iii) 2 개의 연속적인 P 도메인에 위치하는 2 개의 아데닐화 아미노아실 부분 사이에 신규한 펩티드 결합을 생성하는 축합 도메인 (C, 약 450 개의 아미노산이 있음). C 도메인은 계의 첫번째 아미노산을 활성화시키는 모듈에는 부재한다. 소정의 NRPS 는 D-아미노산을 유도하는 에피머화, N- 또는 C-타입 메틸화, L-Cys 또는 L-Ser 아미노산 상에 작용하는 순환 작용 (circulation) 과 같은 특이적인 활성을 수행하기 위한 가외의 도메인을 갖는다. 마지막 모듈 다음에 위치하는 최종 도메인은 일반적으로 중간체 효소를 방출하고, 선형 또는 환형 펩티드를 생성하는 이행능력을 갖는다. 일반적 규칙으로서, 상이한 모듈의 구조는 생성물 펩티드의 최종 아미노산 서열을 반영한다. 이러한 상관성 규칙은 NRPS 에서의 각 모듈에 대한 특이적인 활성화 관능을 정하도록 해 준다. NRPS 에 대한 정보는, 예를 들어 Quing-Tao, S. et al., 2004. Dissecting and Exploiting Nonribosomal Peptide Synthetases. Acta Biochimica et Biophysica. Sinica, 36 (4): 243-249 에서 찾을 수 있다.
발명의 개요
본 발명의 중요한 목적은 티오코랄린 생산 이행능력이 있는 단백질을 코딩하는 온전한 뉴클레오티드 서열을 분리 및 특징분석하는 것으로 이루어진다. 이를 토대로, 티오코랄린의 생합성에 수반되는 단백질을 포함하는 아미노산 서열의 기능이 분리 및 결정될 수 있다. 상기 목적은 온전한 생합성적 티오코랄린 생산 경로와 관련된 모든 단백질을 코딩하는, 분리되어 임의로는 정제되는 신규한 핵산 분자를 제공함으로써 도달될 수 있다.
본 발명자들은 티오코랄린의 생합성 이행능력이 있는 모든 유전자, 즉 티오코랄린의 생합성에 수반되는 유전자 클러스터를 동정 및 클로닝하여, 지령된 방식으로 상기 화합물의 생산 취급을 개선하기 위한 유전자적 기반을 제공할 수 있었다.
비-리보좀성 펩티드 합성효소 (NRPS) 의 콘센서스 서열로부터 유도된 개시자 올리고뉴클레오티드를 이용함으로써, 미크로모노스포라 종 ML1 염색체의 6 개의 분절을 폴리머라아제 연쇄 반응 (PCR) 으로 증폭하고, 이들 모든 분절이 PSV1, PSV2, PSV3, PSV4, PSV5 및 PSV6 로 지칭되는 추정 (가설적인) NRPS 아데닐화 도메인 절편을 포함한다 (실시예 3). 삽입에 의한 상기 아데닐화 도메인의 불활성화는 이들 중 두가지가 (PSV2 및 PSV5) 티오코랄린을 생산하지 않는 돌연변이체를 생성한다는 것을 나타내어, 이들이 티오코랄린의 생합성에 수반된다는 것을 시사했다 (실시예 7 및 10).
약 64.6 킬로베이스 (kb) 의 DNA 영역 (서열 식별 번호: 1) 의 서열분석은 36 개의 온전한 오픈 리딩 프레임 (ORF) 및 또다른 2 개의 불완전한 ORF 가 존재함을 나타냈다 (실시예 12, 표 1). 26 개의 상기 ORF 를 포함하는 약 53 kb 의 영역의, 스트렙토마이세스 코엘리콜라 (Streptomyces coelicolor), 스트렙토마이세스 알부스 (Streptomyces albus) 및 스트렙토마이세스 리비단스 (Streptomyces lividans) 에서의 이종적 발현은 상기 방선균들에서의 티오코랄린의 생산을 유도한다 (실시예 19).
티오코랄린의 생합성 이행능력이 있는 유전자 클러스터는 도 1 에 도식적으로 나타냈다. 놀랍게도, 티오코랄린 유전자의 클러스터는 펩티드 골격의 아미노산의 갯수를 근거로 예측되는 것보다 더 많은 NRPS 코딩 유전자를 포함한다. 예를 들어 Tio12, Tio17, Tio18, Tio19, Tio20, Tio21, Tio22, Tio27 및 Tio28 로 식별되는 몇가지 NRPS 와 같은, 소정의 동정된 단백질은 티오코랄린 펩티드 구조의 형성에 수반된다. Tio20 및 Tio21 로 식별되는 단백질은 티오코랄린 골격의 생합성에 수반되는 NRPS 를 형성하며, 추측컨대 Tio27 및 Tio28 으로 식별되는 다른 두 NRPS 도 미크로모노스포라 종 ML1 에서의 티오코랄린의 생합성 조절에 수반될 작은 펩티드의 생합성 이행능력이 있을 것이다. 내성 프로세스과 관련될 수도 있는, Tio5, Tio6 및 Tio23 와 같은 몇가지 단백질도 있다. 서열분석 영역에서 동정된 티오코랄린 경로의 가능한 조절자는 Tio3, Tio4, Tio7, Tio24 및 Tio25 에 해당된다. 최종적으로, 개시자 유닛 3-히드록시-퀴날데이트의 생성에 관련된 몇가지 단백질, Tio8, Tio9, Tio10 및 Tio11 도 있다. 유전자들 중, 그의 차단이 티오코랄린을 생산하지 않는 표현형을 생성하는 유전자들은 별표로 도 1 에 표시되었다 (tio20, tio27 및 tio28).
따라서, 본 발명은 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터의 동정 및 클로닝에 관한 것이다. 티오코랄린 생합성 이행능력이 있는 상기 유전자 클러스터 및 적합한 숙주 세포에서의 그의 발현은 티오코랄린의 효율적인 생산을 가능하게 한다.
후속하여, 한 국면에서, 본 발명은 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 하나 이상의 핵산 분자를 포함하는 조성물에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 핵산 분자 또는 그의 절편을 포함하는 프로브에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 핵산 분자를 포함하는 벡터에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 벡터로 형질전환 또는 트랜스펙션된 숙주 세포에 관한 것이다.
또다른 국면에서, 본 발명은 본 발명에 의해 제공되는 핵산 분자에 의해 코딩되는 단백질에 관한 것이다.
또다른 국면에서, 본 발명은 그의 게놈이 조작된 바 있는 티오코랄린-생산 유기체의 이용을 포함하는, 티오코랄린의 생합성에 수반되는 단백질의 제조 방법에 관한 것이다.
또다른 국면에서, 본 발명은 또다른 방선균에서의 티오코랄린 생산을 위한, 미크로모노스포라 종 ML1 유래의 티오코랄린의 생합성 이행능력이 있는 유전자의 이용을 기반으로 하는 공정에 관한 것이다.
도면의 간단한 설명
도 1. 서열분석된 미크로모노스포라 종 ML1 염색체 영역의 유전자 구성을 포함하는, 티오코랄린 유전자 및 그것을 둘러싼 유전자의 클러스터의 도식적 도면. 티오코랄린 유전자 클러스터의 이종적 발현을 위한 플라스미드 구축에 이용된 제한 부위를 나타냈다.
도 2. 코스미드 cosV33-D12 및 pCT2c 의 도식적 도면. ori: 에셰리키아 콜라이 (E. coli.) 에 대한 복제 기원, SCP2: 스트렙토마이세스 (Streptomyces) 에 대한 복제 기원. aac (3)IV: 아프라마이신 내성 유전자. neo: 네오마이신 내성 유전자. bla: 앰피실린 내성 유전자. SV40 ori: 에피좀 복제에 대한 진핵 기원.
도 3. 플라스미드 pFL1036 구축을 위해 수행된 클로닝의 다이어그램. ori: 에셰리키아 콜라이에 대한 복제 기원. M13 ori: M13 파아지에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. lacZ: 베타-갈락토시다아제 유전자. kan R : 카나마이신 내성 유전자. aac (3)IV: 아프라마이신 내성 유전자. bla: 앰피실린 내성 유전자.
도 4. 플라스미드 pFL1041 구축을 위해 수행된 클로닝의 다이어그램. ori: 에셰리키아 콜라이에 대한 복제 기원. SCP2: 스트렙토마이세스에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. lacZ: 베타-갈락토시다아제 유전자. aac (3)IV: 아프라마이신 내성 유전자.
도 5. 플라스미드 pAR15AT 구축을 위해 수행된 클로닝의 다이어그램. ori p15A: 에셰리키아 콜라이에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. int φ C31: φC31 파아지 인테그라아제 유전자. attP: 부위-특이적 재조합 부위. kan R : 카나마이신 내성 유전자. aac (3)IV: 아프라마이신 내성 유전자. K: 에셰리키아 콜라이 DNA 폴리머라아제의 Klenow 절편을 이용해 처리한 절단 부위.
도 6. 플라스미드 pAPR 구축을 위해 수행된 클로닝의 다이어그램. ori p15A: 에셰리키아 콜라이에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. ori M13: M13 파아지의 복제 기원. ori: 에셰리키아 콜라이에 대한 복제 기원. lacZ: 베타-칼락토시다아제 유전자. lacI: 락토오스 오페론 억제 유전자. int φ C31: φC31 파아지 인테그라아제 유전자. attP: 부위-특이적 재조합 부위. kan R : 카나마이신 내성 유전자. aac (3)IV: 아프라마이신 유전자. K: 에셰리키아 콜라이 DNA 폴리머라아제의 Klenow 절편을 이용해 처리한 절단 부위. P ermE : ermE 유전자 프로모터.
도 7. 플라스미드 pFL1048, pFL1048r 및 pFL1049 의 도시. ori p15A: 에셰리키아 콜라이에 대한 복제 기원. oriT: 콘쥬게이트성 (conjugative) 이동 기원. int φC31: φC31 파아지 인테그라아제 유전자. attP: 부위-특이적 재조합 부위. aac (3)IV: 아프라마이신 유전자.
도 8A. R5A 배지에서의 성장 7 일 후 스트렙토마이세스 알부스 (Streptomyces albus) (pFL1049) 배양 추출물의 HPLC 크로마토그램. 티오코랄린에 해당하는 정점 및 그의 체류 시간인 27 분을 나타냈다.
도 8B. 도 8A 에 나타낸 27 분의 정점에 존재하는 생성물 (티오코랄린) 의 UV 흡수 스펙트럼.
도 8C. 도 8A 에 나타낸 27 분의 정점에 존재하는 생성물 (티오코랄린) 의 질량 스펙트럼.
발명의 상세한 설명
본 발명에 따르면, 온전한 생합성적 티오코랄린 생산 경로에 수반되는 단백질의 전부 또는 일부를 코딩하는, 신규하며 분리된, 임의로는 정제된 핵산 분자 가 제공된다.
따라서, 한 국면에서, 본 발명은, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는, 이후 본 발명의 핵산 분자로 지칭될, 바람직하게는 임의로는 정제된, 분리된 핵산 분자에 관한 것이다. 상기 생합성적 티오코랄린 생산 경로 단백질은 일반적으로 비-리보좀성 펩티드 합성효소 (NRPS) 이다. NRPS 는 티오코랄린 생합성 이행능력이 있다.
본원에 사용된 바와 같이, 생합성적 티오코랄린 생산 경로 단백질에 적용되는 표현 "생물학적 활성 절편" 은, 전장 단백질의 활성 관능을 보유하는 단백질 구조의 일부분에 관한 것이다. 상기 생물학적 활성 절편은 본 발명의 핵산 분자의 상응하는 영역에 의해 코딩될 수 있다. 본 발명의 핵산 분자의 상기 영역의 크기는 광범위하게 다양할 수 있으나; 그럼에도 불구하고, 한 가지 특별한 구현예에서, 상기 영역은 10, 15, 20, 25, 50, 100, 1,000, 2,500, 5,000, 10,000, 20,000, 25,000 개 이상의 뉴클레오티드의 길이를 가질 수 있다. 상기 영역은 일반적으로 100 내지 10,000 개의 뉴클레오티드, 바람직하게는 100 내지 7,500 개의 길이를 갖고, 생물학적으로 관능성인데, 즉 이들은 생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩할 수 있다.
본 발명의 핵산 분자는 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA) 분자일 수 있다. 본 발명의 핵산 분자는 또한 단일 가닥 핵산 분자 또는 유도된 이중 가닥 핵산 분자일 수 있다. 본 발명의 핵산 분자의 설명을 위한 비제한적 예시에는, 게놈 DNA (gDNA) 분자, 메신저 RNA (mRNA) 분자 및 mRNA 분자에 대한 상보적 DNA (cDNA) 분자가 포함된다.
본 발명의 핵산 분자의 돌연변이체 및 변이체는 본 발명의 범위에 포함된다. 상기 돌연변이체 및 변이체에는, 하나 이상의 분자가 변경, 치환, 결실 또는 삽입된 본 발명의 핵산 분자가 포함된다. 설명을 위해, 본 발명의 핵산 분자의 돌연변이체 및 변이체는 뉴클레오티드에서 1, 2, 3, 4, 5, 10, 15, 25, 50, 100, 200, 500 개 및 그 이상의 변화 (변경, 치환, 결실 또는 삽입) 가 있을 수 있다. 동일한 단백질을 코딩하는 축퇴성 변이체 (degenerate variant) 뿐만 아니라 상이한 단백질을 코딩하는 비축퇴성 변이체 (non-degenerate variant) 가 또한 가능하다. 상기 돌연변이체 및 변이체의 뉴클레오티드 서열은, 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 임의의 오픈 리딩 프레임 (ORF) 에 의해 코딩되는 상응하는 단백질의 하나 이상의 생물학적 활성 또는 관능을 보유하는 단백질 또는 그의 생물학적 활성 절편을 코딩한다. 상기 클러스터의 대립형질 형태 뿐만 아니라 다형질상도 또한 본 발명의 범위에 포함된다.
한 가지 특별한 구현예에서, 본 발명의 핵산 분자는 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 전부 코딩하는 뉴클레오티드 서열을 포함하는, 임의로는 정제된, 분리된 핵산 분자이다. 상기의 경우, 본 발명의 핵산 분자는 티오코랄린 생합성 이행능력이 있는 유전자의 온전한 클러스터를 포함하는 뉴클레오티드 서열을 포함한다.
티오코랄린의 생합성 이행능력이 있는 유전자의 온전한 클러스터의 뉴클레오티드 서열은, 미크로모노스포라 종 ML1 의 64,650 염기쌍(bp) 게놈 DNA 서열의 서열 식별 번호: 1 에 포함되어 있다. 본 발명의 범위는 또한 서열 식별 번호: 1 에 나타낸 뉴클레오티드 서열에 대한 상보적인 가닥, 즉 서열 식별 번호: 1 에 표시된 것과 상보적인 뉴클레오티드 (예를 들어, A 는 T 로 치환되고, C 는 G 로 치환되고, 반대의 경우도 마찬가지) 에 의해 형성되는 것이 포함되며/되거나 역방향 서열 [즉, 리딩 방향 (reading direction) 을, 예를 들어 (5'→3') 를 (3'→5') 로 바꿔 형성되는 서열] 이 포함된다.
본 발명은 추가로 서열 식별 번호: 1 에 나타낸 뉴클레오티드 서열을 갖는 본 발명의 핵산 분자 또는 그의 상보적인 가닥에 혼성화하는 핵산 분자를 포함하는데; 상기 분자는 티오코랄린-생산 유기체로부터 분리되고, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질을 코딩할 수 있다. 당업자에게 공지된 전형적인 혼성화 기술은, 예를 들어 Sambrook et al ., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989) 에 언급되어 있다. 통상적이거나 또는 엄격한 혼성화 기술은 일반적으로 동종 프로브에 대해 이용되며, 덜 엄격한 혼성화 조건은 표적으로 하는 핵산 분자 서열에 대해 100% 미만의 상동성을 가진 부분적 동종 프로브에 이용된다. 후자 (부분적 동종 프로브) 의 경우, 상이한 조건을 이용한 일련의 서던 (Southern) 또는 노던 (Northern) 혼성화가 수행될 수 있다. 설명하자면, 포름아미드를 포함하는 용매에서 혼성화를 수행하는 경우, 바람직한 조건에는 6×SSC, 50% 의 포름아미드를 포함하는 용액 및 약 42℃ 의, 일정한 온도 및 이온 세기의 이용이 포함된다. 덜 엄격한 혼성화 조건에서는, 상기의 경우 어닐링 완충액 중의 포름아미드의 양은 더 적더라도 (약 45% 내지 0%), 동일한 온도 및 이온 세기를 이용할 수 있다. 대안적으로, 혼성화는 포름아미드를 포함하지 않는 수용액에서 수행될 수 있다. 일반적으로, 수성 매질에서의 혼성화를 위해서는, 수용액의 이온 세기는, 일반적으로는 약 1 M Na+ 로 일정하게 유지되며, 어닐링 온도는 68℃ 에서 42℃ 로 강하될 수 있다.
티오코랄린 생합성 이행능력이 있는 유전자의 온전한 클러스터 (서열 식별 번호: 1) 의 서열분석은 36 개의 온전한 오픈 리딩 프레임 (ORF) 및 또다른 2 개의 불완전한 ORF (ORF1 및 ORF38, 하기 참조) 가 존재함을 보여줬다. 표 1 (실시예 12) 은 생합성적 티오코랄린 생산 경로에 수반되는 상이한 ORF 의 위치 뿐만 아니라 상기 ORF 에 의해 코딩되는 아미노산 서열을 보여준다.
티오코랄린 생합성 이행능력이 있는 유전자의 클러스터를 포함하며, 티오코랄린의 생산에 필수적인 생합성적 단백질 전부를 코딩하는 온전한 염색체 (게놈) DNA 분자는 2 개의 플라스미드, 구체적으로는 코스미드 SuperCos1 및 pKC505 에 유효하게 패키지되었다 (실시예 1 및 2). 티오코랄린 생합성 이행능력이 있는 유전자의 클러스터를 포함하는 상기 두 코스미드는, 티오코랄린 생산을 위한 온전한 생합성적 경로를 재형성하기에 충분하다. 따라서, 한 가지 특별한 구현예에서, 본 발명은 티오코랄린 생산에 실질적으로 더욱 효율적인 수단을 이용하도록 하는 두 코스미드에서 생합성적 티오코랄린 유전자의 온전한 클러스터를 제공한다.
한 가지 특별한 구현예에서, 본 발명의 핵산 분자는 임의로는 정제된, 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자이다. 한 가지 특이적인 구현예에서, 본 발명의 핵산 분자는, 하기로 이루어진 군:
- 서열 식별 번호: 1 의 뉴클레오티드 2-535 (orf1) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 993-1130c (orf2) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 1517-2131 (tio3) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 2154-2822c (tio4)를 포함하는 핵산 분자 ;
- 서열 식별 번호: 1 의 뉴클레오티드 2970-3791c (tio5) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 3794-4777c (tio6) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 4904-5611 (tio7) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 5701-6426c (tio8) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 6426-7688c (tio9) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 7733-8524c (tio10) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 8791-10002 (tio11) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 10002-11590c (tio12) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 11847-13634 (tio13) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 13734-15005c (tio14) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 15005-16354c (tio15) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 16441-18744c (tio16) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 18774-19055c (tio17) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 19260-20036 (tio18) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 20146-20880c (tio19) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 21188-28969 (tio20) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 28979-38398 (tio21) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 38449-38661 (tio22) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 38642-41263 (tio23) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 41835-42368 (tio24) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 42395-43255c (tio25) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 43340-43741c (tio26) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 44152-49563 (tio27) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 49635-53669 (tio28) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 53749-55305c (orf29) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 55384-57222c (orf30) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 57895-58467c (orf31) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 58535-59206c (orf32) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 59298-59564c (orf33) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 59611-60114c (orf34) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 60202-60888 (orf35) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 60960-62240 (orf36) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 62300-62833 (orf37) 를 포함하는 핵산 분자;
- 서열 식별 번호: 1 의 뉴클레오티드 62925-64650 (orf38) 를 포함하는 핵산 분자; 또는
생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩하는 이들의 절편으로부터 선택된다.
또다른 특별한 구현예에서, 본 발명의 핵산 분자는 임의로는 정제된, 2 개 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자이다. 한 가지 특이적인 구현예에서, 본 발명의 핵산 분자는 orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20 , tio21 , tio22 , tio23 , tio24 , tio25 , tio26 , tio27 , tio28 , orf29 , orf30, orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38 로 식별되는 유전자 및 생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩하는 그의 절편으로부터 선택되는 2 개 이상의 유전자를 포함하는 뉴클레오티드 서열을 포함한다.
또다른 특별한 구현예에서, 본 발명의 핵산 분자는 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자, 또는 그의 돌연변이체 또는 변이체이며, 여기서 상기 단백질은 ORF1 (서열 식별 번호: 2), ORF2 (서열 식별 번호: 3), Tio3 (서열 식별 번호: 4), Tio4 (서열 식별 번호: 5), Tio5 (서열 식별 번호: 6), Tio6 (서열 식별 번호: 7), Tio7 (서열 식별 번호: 8), Tio8 (서열 식별 번호: 9), Tio9 (서열 식별 번호: 10), Tio10 (서열 식별 번호: 11), Tio11 (서열 식별 번호: 12), Tio12 (서열 식별 번호: 13), Tio13 (서열 식별 번호: 14), Tio14 (서열 식별 번호: 15), Tio15 (서열 식별 번호: 16), Tio16 (서열 식별 번호: 17), Tio17 (서열 식별 번호: 18), Tio18 (서열 식별 번호: 19), Tio19 (서열 식별 번호: 20), Tio20 (서열 식별 번호: 21), Tio21 (서열 식별 번호: 22), Tio22 (서열 식별 번호: 23), Tio23 (서열 식별 번호: 24), Tio24 (서열 식별 번호: 25), Tio25 (서열 식별 번호: 26), Tio26 (서열 식별 번호: 27), Tio27 (서열 식별 번호: 28), Tio28 (서열 식별 번호: 29), ORF29 (서열 식별 번호: 30), ORF30 (서열 식별 번호: 31), ORF31 (서열 식별 번호: 32), ORF32 (서열 식별 번호: 33), ORF33 (서열 식별 번호: 34), ORF34 (서열 식별 번호: 35), ORF35 (서열 식별 번호: 36), ORF36 (서열 식별 번호: 37), ORF37 (서열 식별 번호: 38), ORF38 (서열 식별 번호: 39) 로 이루어지는 군으로부터 선택된다. 상기 단백질은 티오코랄린의 생합성 이행능력이 있는 유전자의 클러스터 (서열 식별 번호: 1) 의 상응하는 상기 언급된 orf (orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20, tio21, tio22, tio23, tio24, tio25, tio26, tio27, tio28, orf29, orf30, orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38), 또는 그의 상응하는 영역, 그의 돌연변이체 또는 변이체로부터 수득될 수 있다.
또다른 특별한 구현예에서, 본 발명의 핵산 분자는 임의로는 정제된, 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편의 하나 이상의 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자이며, 여기서 상기 변이체는 아미노산 서열에 있어서 서열 식별 번호: 2 내지 39 에 나타낸 아미노산 서열을 가진 단백질, 또는 그의 생물학적 활성 절편으로부터 선택된 단백질의 아미노산 서열에 대해 30% 이상, 유리하게는 50% 이상, 바람직하게는 60% 이상, 더욱 바람직하게는 70% 이상, 더욱더 바람직하게는 80% 이상, 특별하게는 90% 이상, 더욱 특별하게는 95% 이상 상동이다. 상기 변이체는 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 임의의 orf 로 코딩되는 상응하는 단백질의 기능의 하나 이상의 생물학적 활성을 보존한다.
또다른 국면에서, 본 발명은 본 발명의 하나 이상의 핵산 분자, 바람직하게는 분리된 핵산 분자를 포함하는 조성물에 관한 것이다. 한 가지 특별한 구현예에서, 상기 조성물은 본 발명의 핵산 분자를 포함한다. 또다른 특별한 구현예에서, 상기 조성물은 2 가지 이상의 본 발명의 핵산 분자를 포함한다. 상기 핵산 분자는 DNA 및 RNA 의 두가지 모두일 수 있다.
본 발명의 핵산 분자는 자연적으로 또는 재조합적으로 티오코랄린을 생산하는 임의의 유기체로부터 분리될 수 있고, 이는 티오코랄린 생합성 이행능력이 있는 클러스터가 적합한 숙주 세포에 삽입되기 때문인데; 그럼에도 불구하고, 한 가지 특별한 구현예에서, 본 발명의 상기 핵산 분자는 해양 방선균 미크로모노스포라 종 ML1 (실험 부분의, 단계 1, 실시예 1 내지 4 를 참조) 에서 분리되었다.
적합한 숙주 세포 유래의 (염색체) 게놈 DNA 및 클로닝된 재조합 DNA 의 분리 및 특징분석은, 적합한 유전자 라이브러리의 추적을 위한 프로브로서 뉴클레오티드 서열 전체 또는 일부를 이용하여, 통상적 또는 엄격한 혼성화 기술로 수행될 수 있다.
따라서, 또다른 국면에서, 본 발명은 본 발명의 핵산 분자 또는 그의 절편을 포함하는 프로브에 관한 것이다. 일반적으로, 적합하게는 5, 10, 15, 20, 25, 30, 40, 50, 60 개 또는 그 이상의 뉴클레오티드의 서열을 포함한다. 20 내지 60 개 뉴클레오티드의 길이를 가진 서열이 바람직하다. 한 가지 특별한 구현예에서, 상기 프로브는 미크로모노스포라 종에서의 티오코랄린의 생합성에 수반되는 유전자를 추적하기 위해 사용될 수 있다. 티오코랄린의 생합성과 관련된 핵산, 예를 들어 gDNA, cDNA 또는 mRNA 를 추적하기 위한 상기 프로브의 이용은 본 발명의 추가적인 국면을 형성한다.
대안적으로, 적합한 숙주 세포 유래의 (염색체) 게놈 DNA 및 클로닝된 재조합 DNA 의 분리 및 특징분석은 핵산의 효소적 증폭을 기반으로 하는 기술로 수행될 수 있다. 설명하자면, 기타 상동이거나 또는 연관된 서열을 증폭 및 동정하기 위해, 효소적 증폭 반응, 예를 들어 PCR 에 이용될 수 있는 개시자 올리고뉴클레오티드가 고안될 수 있다 (티오코랄린 생합성에 수반되는 DNA 및 단백질의 공지된 서열을 기반으로 함).
본 발명의 핵산 분자는 통상적인 방법으로 분리되며, 원하는 경우 정제될 수 있다. 본 발명의 핵산 분자가 일반적으로 재조합 또는 분리 방법으로 수득되지만, 본 발명은 또한 본 발명의 핵산 분자가 화학 합성으로 수득될 가능성도 감안하며, 상기 방법에서 분자는 야생형 (wt) 및 돌연변이체 티오코랄린-생산 유기체 모두에서 유도된 것과 동일하거나, 또는 실질적으로 동일한 구조를 가질 것이다.
또다른 국면에서, 본 발명은, 이후 본 발명의 벡터인, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 본 발명의 핵산 분자을 포함하는 벡터에 관한 것이다. 한 가지 특별한 구현예에서, 본 발명의 벡터는 클로닝 벡터 또는 발현 벡터와 같은 생물학적 관능성 벡터 또는 플라스미드이다.
한 가지 특이적인 구현예에서, 본 발명의 벡터는 클로닝 벡터, 바람직하게는 코스미드이다. 바람직한 클로닝 벡터는 큰 DNA 서열 (예를 들어, 관심대상의 생성물의 생합성에 수반되는 유전자의 온전한 클러스터) 을 혼입하는 그의 용량에 의해 선택된다. 상기 벡터는 일반적으로 통상적인 벡터이며, 보통 입수가능하다. 본 발명은 추가로, 상기 유전자 물질이 당업자에게 공지된 기술에 의한 유전자 조작으로 단일한 클로닝 벡터 또는 플라스미드 (예를 들어, 코스미드) 에 최종적으로 포함되도록 감량될 수 있다는 것도 감안한다. 재배열은 클로닝, PCR, 합성 유전자 또는 당업계에 공지된 임의의 상기 기술의 조합으로 수행될 수 있다.
또다른 특별한 구현예에서, 본 발명의 벡터는 적합한 숙주 세포에 대한 그의 삽입에 적합한 발현 벡터이다. 상기 벡터의 상기 적합한 숙주 세포로의 삽입은 임의의 통상적인 유전자 물질 이동 방법 (예를 들어, 형질전환, 트랜스펙션 등) 에 의해 수행될 수 있다.
따라서, 또다른 국면에서, 본 발명은, 이후 본 발명의 숙주 세포로 지칭되는, 본 발명의 벡터로 형질전환 또는 트랜스펙션된 숙주 세포에 관한 것이다. 본 발명의 상기 숙주 세포는 하나 이상의 본 발명의 핵산 분자를 포함한다. 한 가지 특별한 구현예에서, 본 발명의 숙주 세포는 본 발명의 핵산 분자를 포함한다. 또다른 특별한 구현예에서, 본 발명의 숙주 세포는 2 개 이상의 본 발명의 핵산 분자를 포함하며; 상기의 경우, 상기 본 발명의 핵산 분자는 상동이거나 또는 상이할 수 있다.
본 발명의 바람직한 숙주 세포는 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 (외인성) 핵산 분자를 포함하는 본 발명의 벡터를 사용하여, 티오코랄린의 생합성 및/또는 재배열을 지령하기에 충분한 방식으로 안정하게 형질전환 또는 트랜스펙션된 숙주 세포이다. 숙주 세포는 바람직하게는 미생물, 더욱 바람직하게는 박테리아이다. 한 가지 특별한 구현예에서, 상기 숙주 세포는, 예를 들어 방선균, 스트렙토마이세트와 같은 그람-양성 박테리아이다.
스트렙토마이세스 코엘리컬러 (Streptomyces coelicolor), 스트렙토마이세스 리비단스 ( Streptomyces lividans), 스트렙토마이세스 알부스 (Streptomyces albus) 및 스트렙토마이세스 아베르미틸리스 (Streptomyces avermitilis) 와 같은 상이한 스트렙토마이세트 종이 본 발명의 예시에서 이종성 숙주로서 이용될 수 있지만, 티오코랄린의 생합성에 수반되는 유전자의 이종적 발현이 다른 스트렙토마이세스, 방선균 등에서 수행될 수 있으며, 단 이들은, 바람직하게는 안정한 방식으로, 본 발명의 벡터에 형질전환될 수 있다. 그 단백질의 시험관내 발현은, 원하는 경우 통상적인 방법을 이용하여 수행될 수 있다.
한 가지 특별한 구현예에서, 본 발명은 예를 들어 재조합 박테리아와 같은, 본 발명의 핵산 분자의 하나 이상의 영역이 변경되어 상응하는 비-재조합체, 즉 야생형인 티오코랄린-생산 세포 (박테리아) 에 필적하는 변경된 티오코랄린 수준을 제공하는 재조합 박테리아와 같은 재조합 숙주 세포를 제공하게 되는, 본 발명의 숙주 세포를 제공한다. 그러한 목적으로, 당업자에게 공지된 통상적인 기술이 이용될 수 있으며, 여기에는 예를 들어 티오코랄린 생산에 수반되는 NRPS 의 가장 중요한 도메인에 대한 이행능력이 있는 유전자의 카피수를 증가시키거나, 또는 당업자에게 공지된 유전공학 기술에 의해 상기 유전자의 유전자 발현 조절 서열을 증가시켜 티오코랄린 생산에서 수율을 증가시키는 것이 포함된다.
또다른 국면에서, 본 발명은 본 발명의 핵산 분자에 의해 코딩되는, 이후 본 발명의 단백질로 지칭되는 단백질에 관한 것이다.
본원에 사용된 바와 같이, 용어 "단백질" 은 티오코랄린 생산을 위한 생합성적 경로에 의해 포함되는 본 발명의 핵산 분자에 의해 코딩되는, 폴리펩티드, 효소 등을 의미한다. 본 발명의 단백질에는, 전장 아미노산을 포함하여 다양한 길이의 아미노산 사슬로서 아미노산 부분이 공유 펩티드 결합에 의해 연결되어 있는 아미노산 사슬이 포함되며, 그 뿐만 아니라 티오코랄린의 생합성에 수반되는 상기 단백질의 생물학적 활성 절편 및 그의 생물학적 활성 변이체가 포함된다. 본 발명의 단백질은 자연, 재조합 또는 합성일 수 있다. 설명의 수단으로, 티오코랄린 생합성에 수반되는 상기 단백질은, 적합한 발현 벡터에 단백질을 코딩하는 뉴클레오티드 서열을 삽입하고 적합한 숙주 세포에서 단백질을 발현시키는 통상적인 재조합 DNA 기술을 통하여, 또는 예를 들어 아미노산을 개별적으로 차례차례 아미노산 사슬로 결합해 나가는 Merrifield 의 고상 펩티드 합성 (Merrifield, J. Am. Chem. Soc. 85:2149-2154 (1963)) 을 수단으로 하는 통상적인 화학 펩티드 합성을 통해 생산될 수 있다. 대안적으로, 본 발명의 단백질은 상이한 제조사 (예를 들어, Perkin-Elmer, Inc.) 에 의해 시판되는 자동화된 단백질 합성 장치를 이용하여 합성될 수 있다.
본 발명의 범위에 포함되는 생물학적 활성 변이체는, 본 발명의 핵산 분자에 의해 코딩되는 아미노산 서열의 하나 이상의 생물학적 활성 절편을 포함하며, 즉 단백질의 활성 관능을 보유하는 단백질 구조의 일부, 예를 들어 상기 tio18 유전자에 의해 코딩되는 Tio18 와 동일하거나 또는 실질적으로 동일한 활성을 가진 tio18 유전자에 의해 코딩되는 티오에스테르 부분을 포함하며, 예를 들어 이는 약 70% 이상, 유리하게는 80% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 약 95% 이상의 유사성 또는 파워를 갖는다.
본 발명의 단백질의 생물학적 활성 변이체에는 아미노산, 자연 발생 대립형질 등이 결실, 치환 또는 부가된 활성 아미노산 구조가 포함된다. 생물학적 활성 절편은, 절편 제조를 위해 전장 단백질을 화학적 또는 효소적 절단에 적용한 후 전장 단백질과 동일하거나 또는 실질적으로 동일한 생물학적 활성을 보존하는 아미노산 구조 절편을 검정하여 용이하게 동정할 수 있다.
한 가지 특별한 구현예에서, 본 발명의 단백질은 임의로는 정제된, orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20, tio21, tio22, tio23, tio24, tio25, tio26 , tio27 , tio28 , orf29 , orf30 , orf31, orf32, orf33, orf34, orf35, orf36, orf37 및 orf38 로 식별되는 유전자로 이루어진 군으로부터 선택되는 유전자에 의해 코딩되는 티오코랄린의 생합성에 수반되는 분리된 단백질이다.
또다른 특별한 구현예에서, 본 발명의 단백질은, 임의로는 정제된, ORF1 (서열 식별 번호: 2), ORF2 (서열 식별 번호: 3), Tio3 (서열 식별 번호: 4), Tio4 (서열 식별 번호: 5), Tio5 (서열 식별 번호: 6), Tio6 (서열 식별 번호: 7), Tio7 (서열 식별 번호: 8), Tio8 (서열 식별 번호: 9), Tio9 (서열 식별 번호: 10), Tio10 (서열 식별 번호: 11), Tio11 (서열 식별 번호: 12), Tio12 (서열 식별 번호: 13), Tio13 (서열 식별 번호: 14), Tio14 (서열 식별 번호: 15), Tio15 (서열 식별 번호: 16), Tio16 (서열 식별 번호: 17), Tio17 (서열 식별 번호: 18), Tio18 (서열 식별 번호: 19), Tio19 (서열 식별 번호: 20), Tio20 (서열 식별 번호: 21), Tio21 (서열 식별 번호: 22), Tio22 (서열 식별 번호: 23), Tio23 (서열 식별 번호: 24), Tio24 (서열 식별 번호: 25), Tio25 (서열 식별 번호: 26), Tio26 (서열 식별 번호: 27), Tio27 (서열 식별 번호: 28), Tio28 (서열 식별 번호: 29), ORF29 (서열 식별 번호: 30), ORF30 (서열 식별 번호: 31), ORF31 (서열 식별 번호: 32), ORF32 (서열 식별 번호: 33), ORF33 (서열 식별 번호: 34), ORF34 (서열 식별 번호: 35), ORF35 (서열 식별 번호: 36), ORF36 (서열 식별 번호: 37), ORF37 (서열 식별 번호: 38), ORF38 (서열 식별 번호: 39), 및 이들의 조합으로 식별되는 단백질로 이루어진 군으로부터 선택되는, 티오코랄린의 생합성에 수반되는 분리된 단백질 또는 그의 생물학적 활성 절편이다. 상기 단백질의 추정되는 기능은 표 1 에 포함되어 있다.
상기 화합물의 생합성에 수반되는 단백질을 코딩하는, 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터의 orf 는 통상적인 기술을 이용하여 동정될 수 있다. 상기 기술의 설명을 위한 비제한적 예시에는 정지 및 개시 코돈의 위치, 코돈의 빈도를 근거로 한 리딩 (reading) 프레임의 추정되는 위치, 다른 방선균에서 발현되는 유전자에 대한 유사성에 의한 배열 등을 위한 전산적 분석이 포함된다. 이에, 본 발명의 단백질은 본 발명의 뉴클레오티드 서열을 이용하여 동정될 수 있으며, orf 또는 이들에 의해 코딩되는 단백질은 분리될 수 있고, 원하는 경우 정제되거나 또는 대안적으로는 화학적 방법에 의해 합성될 수 있다. orf 를 근거로 한 상기 생성물의 발현을 위한 유전자 구축물이 고안될 수 있으며, 적합한 발현 조절 구성원 (프로모터, 종결자 등) 이 포함될 수 있고, 상기 유전자 구축물이 하나 이상의 orf 에 의해 코딩되는 단백질 또는 단백질들의 발현을 위해 적합한 숙주 세포에 도입될 수 있다.
본 발명의 단백질은 분리될 수 있으며, 원하는 경우 통상적인 방법에 의해 정제될 수 있다. 일반적으로 약 80% 내지 90% 인 더 낮은 수준의 순도가 또한 허용될 수도 있지만, 단백질은 바람직하게는 실질적으로 순수한 형태로 수득된다. 본 발명은 또한 본 발명의 단백질이 화학 합성에 의해 수득되는 가능성을 감안하며, 여기서 단백질은 야생형 (wt) 및 돌연변이체 티오코랄린-생산 유기체로부터 직접 유도되는 것과 동일하거나 또는 실질적으로 동일한 구조를 갖는다.
또다른 국면에서, 본 발명은 적합한 (영양 및 환경) 조건 하에서의 티오코랄린-생산 유기체의 배양 단계, 및 원하는 경우 티오코랄린의 생합성에 수반되는 하나 이상의 상기 단백질의 분리 단계를 포함하는, 티오코랄린의 생합성에 수반되는 본 발명의 단백질의 제조 방법에 관한 것이다. 원하는 경우, 본 발명의 상기 단백질은 상기 기재된 것들과 같은 통상적인 방법에 의해 분리 및 정제될 수 있다.
또다른 국면에서, 본 발명은 티오코랄린-생산 유기체를 상기 화합물 생산에 적합한 조건 하에 배양하여 티오코랄린 생합성에 수반되는 단백질을 코딩하는 유전자의 카피수를 증가시키는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는, 티오코랄린의 생산 방법에 관한 것이다.
한 가지 특별한 구현예에서, 티오코랄린-생산 유기체는 예를 들어 미크로모노스포라 종과 같은 방선균인데, 여기서 티오코랄린의 생합성에 수반되는 단백질을 코딩하는 유전자의 카피수는 증가된다. 티오코랄린의 생합성에 수반되는 단백질을 코딩하는 유전자의 카피수 증가는 당업자에게 공지된 통상적인 방법에 의해 수행될 수 있다. 상기의 경우, 상기 기재된 방법은 티오코랄린 생산에 수반되는 유전자의 발현에 적합한 영양 및 환경 조건 하에 상기 유기체를 배양하는 것을 포함한다. 원하는 경우, 생산된 티오코랄린은 통상적인 방법에 의해 배양 배지로부터 분리 및 정제될 수 있다.
또다른 국면에서, 본 발명은, 티오코랄린 생합성에 수반되는 단백질을 코딩하는 하나 이상의 유전자의 조작 또는 치환에 의해, 또는 상기 유전자 발현 조절 이행능력이 있는 서열의 조작에 의해 티오코랄린 생합성 이행능력이 있는 단백질을 코딩하는 유전자의 발현이 조절되는 티오코랄린-생산 유기체를 상기 화합물 생산에 적합한 조건 하에 배양하는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는 티오코랄린의 생산 방법에 관한 것이다. 티오코랄린 생합성 이행능력이 있는 상기 단백질을 코딩하는 유전자의 발현은 바람직하게는 개선된다. 상기 목적을 위해, 티오코랄린 생합성 공정에 필수적이지 않은 유전자 서열은 제거되거나, 또는 상기 유전자의 유전자 발현 조절 서열의 효율은 당업자에게 공지된 유전공학적 서열에 의해 증가될 수 있다. 이에 따라, 티오코랄린 생산에서 수율은 증가될 수 있다. 티오코랄린 생합성 과정에서 불필요한 유전자 서열을 제거하거나 또는 상기 유전자의 유전자 발현 조절 서열의 효율 증가를 위한 유전자 조작법은 당업자에게 공지된 유전공학 기술에 의해 수행될 수 있다.
한 가지 특별한 구현예에서, 티오코랄린-생산 유기체는 예를 들어, 미크로모노스포라 종과 같은 방선균인데, 여기서 티오코랄린 생합성 이행능력이 있는 단백질을 코딩하는 유전자는 티오코랄린 생합성에 수반되는 단백질을 코딩하는 하나 이상의 유전자를 조작 또는 치환하거나, 또는 상기 유전자의 발현 조절 이행능력이 있는 서열을 조작함으로써 조절되며, 이는 당업자에게 공지된 통상적인 방법에 의해 수행될 수 있다. 상기의 경우, 상기 기재된 방법은 티오코랄린 생산에 수반되는 유전자 발현을 위한 적합한 영양 및 환경 조건 하에 상기 유기체를 배양하는 단계를 포함한다. 원하는 경우, 생산된 티오코랄린은 통상적인 방법에 의해 배양 배지로부터 분리 및 정제될 수 있다.
또다른 국면에서, 본 발명은 티오코랄린 생산에 적합한 조건 하에서, 티오코랄린 생합성 이행능력이 있는 유전자의 클러스터를 포함하는 본 발명의 벡터로 형질전환 또는 트랜스펙션된 본 발명의 숙주 세포를 배양하는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는 티오코랄린의 제조 방법에 관한 것이다. 상기 (영양, 환경 등) 조건은 숙주 세포의 특성에 따라 선별될 것이다.
한 가지 특별한 구현예에서, 본 발명의 숙주 세포는 티오코랄린을 원래 생산하는 유기체, 원래는 티오코랄린을 생산하지 않는 유기체 및 티오코랄린을 생산하도록 유전적으로 조작된 유기체로부터 선택된다. 한 가지 특별한 구현예에서, 본 발명의 상기 숙주 세포는 방선균 또는 스트렙토마이세트이다.
또다른 국면에서, 본 발명은 하기 단계를 포함하는, 미크로모노스포라 종 ML1 유래의 티오코랄린 생합성 이행능력이 있는 유전자 이용을 근간으로 한, 또다른 방선균에서의 상기 화합물의 생산 방법에 관한 것이다:
(1) 티오코랄린 생합성 경로의 특이적 유전자에 타격을 받은 돌연변이체를 수득하는 단계;
(2) 티오코랄린 생합성 이행능력이 있는 유전자 클러스터를 포함하는 미크로모노스포라 종 ML1 염색체 영역을 분리하는 단계;
(3) 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 뉴클레오티드 서열을 수득하고 분석하는 단계; 및
(4) 다른 방선균에서 티오코랄린을 이종적으로 생산하는 단계.
티오코랄린 생합성 이행능력이 있는 유전자의 클러스터를 포함하는 미크로모노스포라 종 ML1 염색체의 동정 및 분리 뿐만 아니라 상기 클러스터의 뉴클레오티드 서열의 분석은, 명세서에 첨부되어 있는 실시예에서의 비제한적 방식으로 설명되는 본 발명의 교시를 토대로 하여 수행될 수 있다.
티오코랄린 생합성 경로의 특이적 유전자에 타격을 받은 돌연변이체는 통상적인 방법에 의해 동정될 수 있다. 한 가지 특별한 구현예에서, 상기 돌연변이체는, 통상적인 방법, 예를 들어 실시예 5 에 언급된 바와 같이 배양 및 티오코랄린 생산의 HPLC-MS 에 의한 측정을 수단으로 하여 동정될 수 있다.
티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 전부 또는 일부는, 티오코랄린의 이종적 생산을 위해 통상적인 방법, 예를 들어 형질전환 또는 트랜스펙션에 의해 방선균에 도입될 수 있으며, 원하는 경우 상기와 같이 수득된 티오코랄린은 통상적인 방법으로 분리 및/또는 정제될 수 있다.
티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 결정은 상당한 상업적 중요성이 있다. 본 발명에 의해 제공되는 티오코랄린 생합성 이행능력이 있는 유전자 클러스터의 분리 및 완전한 설명은 티오코랄린 생산 증가 및 티오코랄린-생산 유기체의 조작을 가능하게 한다. 그러한 맥락에서, 티오코랄린 생산에 수반되는 NRPS 의 가장 중요한 도메인에 대한 이행능력이 있는 유전자의 카피수는 당업자에게 공지된 유전자 조작 기술로 증가될 수 있거나 또는 상기 유전자의 발현 조절 서열의 효율이 당업자에게 공지된 유전공학적 기술로 증가될 수 있고, 그에 따라 그의 생산 수율도 증가될 수 있다.
본 발명에 의해 제공되는 티오코랄린 유전자의 온전한 클러스터의 동정 및 클로닝과 연관된 또다른 장점은 티오코랄린의 효율적인 생산에 관한 것이다. 사실, 이는 더 적은 수의 단계를 거쳐 큰 관심대상인 화합물을 수득하게끔 한다. 클러스터 돌연변이체에서의 생합성 공정에서의 필수적이지 않은 서열의 제거는 관심대상의 화합물의 생산에 필요한 시간을 상당히 줄인다. 나머지 서열들로 충분하며, 티오코랄린 생산을 위해 그의 관능성을 유지한다.
실험부
본 발명의 실험 과정들에는 당업계의 현재의 통상적인 분자생물학적 방법이 포함된다. 본원에서 설명되지 않은 기술의 상세한 설명은, Kieser et al. (Practical Streptomyces genetics. The John Innes Foundation, Norwich, Great Britain, 2000) 및 Sambrook et al. (Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, USA, 2001) 의 매뉴얼에서 찾을 수 있다. 하기의 단계들은 제한성이 없이 본 발명을 상세하게 설명한다.
단계 1.
티오코랄린
생합성 경로 유전자를 포함하는
미크로모노스포라
종
ML1
염색체 영역의 분리
실시예 1. 미크로모노스포라 종 ML1 염색체 DNA 유래의 SuperCos1 에서의 유전자 라이브러리의 구축
염색체 DNA 는 염석 프로토콜 (Kieser et al. 2000) 을 이용하여, MIAM2 배지 (5 g/l 의 효모 추출물, 3 g/l 의 육류 추출물, 5 g/l 의 트립톤, 5 g/l 의 글루코오스, 20 g/l 의 덱스트린, 4 g/l 의 CaCO3, 10 g/l 의 해수염. pH 6.8) 중의, Pharma Mar, S.A. 배양물 콜렉션에서 입수가능한 미크로모노스포라 종 ML1 배양물로부터 수득했다 (Espliego, F. Ph.D. Thesis, 1996, University of Leon; de la Calle, F. Ph.D. Thesis, 1998, Autonomous University of Madrid). 상기 염색체 DNA 는 BamHI 엔도뉴클레아제를 이용한 부분 효소절단에 적용하고, 수득한 절편은 BamHI 로 효소절단된 코스미드 SuperCos 1 (Stratagene) 에서의 유전자 라이브러리 형성에 이용했다. 에셰리키아 콜라이 XL-1 Blue MR (Stratagene) 에서의 상기 유전자 라이브러리의 형성은, 이미 기재한 과정 (Sambrook et al. 2001) 에 따라, 시험관내 패키징 키트 (in vitro packaging kit) Gigapack III Gold Packaging Extract Kit (Stratagene) 를 이용하여 수행했다.
1,000 개의 에셰리키아 콜라이 형질유도 콜로니는, 일반적 프로토콜 (Sambrook et al. 2001) 을 이용한 제자리 (in situ) 콜로니 혼성화 분석 수행을 위해 나일론 멤브레인으로 옮겼다.
실시예 2. 미크로모노스포라 종 ML1 염색체 DNA 유래의 pKC505 에서의 유전자 라이브러리의 구축
염색체 DNA 는 염석 프로토콜 (Kieser et al. 2000) 을 이용하여 MIAM2 배지 중의 미크로모노스포라 종 ML1 배양물로부터 수득했다. 상기 염색체 DNA 는 Sau3AI 엔도뉴클레아제를 이용한 부분 효소절단에 적용하고, 수득한 절편은 이관능성 코스미드 에셰리키아 콜라이 (Escherichia coli), 스트렙토마이세스 (Streptomyces) pKC505 (Richardson at al. 1987, Gene 61, 231-241) 에서의 유전자 라이브러리 형성에 이용했고, BamHI 로 효소절단했다. 에셰리키아 콜라이 ED8767 에서의 상기 유전자 라이브러리의 형성은, 이미 기재된 과정 (Sambrook et al. 2001) 및 시험관내 패키징 키트 (in vitro packaging kit) Gigapack III Gold Packaging Extract Kit (Stratagene) 을 이용하여 수행했다.
3,300 개의 에셰리키아 콜라이 형질유도 콜로니를 25 ㎍/ml 의 아프라마이신이 있는 TSB 배지 (Merck) 를 포함하는 96-웰 마이크로타이터 플레이트에 넣고, 30℃ 에서 24 시간 동안 인큐베이션했다. 상기 클론은 25 ㎍/ml 의 아프라마이신이 있는 TSA (Tryptic Soy Agar) 플레이트에 복제하고, 30℃ 에서 밤새 둔 후, 콜로니를 일반 프로토콜 (Sambrook et al. 2001) 을 이용하는 제자리 (in situ) 콜로니 혼성화 분석 수행을 위해 나일론 멤브레인에 옮겼다.
실시예 3. NRPS 에서의 아데닐화 도메인에 대한 특이적 올리고뉴클레오티드의 고안 및 미크로모노스포라 종 ML1 염색체 DNA 로부터의 그의 PCR 증폭
티오코랄린의 구조를 근거로, 그의 생합성 이행능력이 있는 NRPS 는 L-시스테인을 활성화시키는 1 내지 3 개의 아데닐화 도메인 및 글리신을 활성화하는 1 개의 도메인을 가질 것으로 예상되었다. 이를 토대로, NRPS 아데닐화 도메인의 증폭을 위해 문헌에 기재된 올리고뉴클레오티드와 조합된 NRPS 아데닐화 도메인을 코딩하는 DNA 절편을 특이적으로 증폭할 수 있는, NRPS 아데닐화 도메인 내부의 보존된 영역을 기준으로 축퇴성 올리고뉴클레오티드를 고안했다.
개시자 올리고뉴클레오티드:
MTF2 (5'-GCNGGYGGYGCNTAYGTNCC-3'; Neilan et al. 1999. J. Bacteriol. 181(13):4089-4097) 및
PSV-4 (5'-SAGSAGGSWGTGGCCGCCSAGCTCGAAGAA-3')
를 이용한 PCR 증폭은 1.3 kb 밴드를 생성하여, pGEM-T Easy vector (Promega) 에 클로닝했다. 사용한 PCR 프로그램은, 95℃-2 분; 60℃-15 분; 72℃-6 분의 개시 싸이클, 이어서 20 싸이클로 95℃-1 분; 60℃-2 분; 72℃-2 분. 미크로모노스포라 종 ML1 염색체 DNA 를 템플레이트로 이용했다.
제한효소절단 절편 길이 다형상 (RFLP) 에 의한 클론의 분석은 펩티드 합성효소에 상응하는 3 개 타입의 상이한 클론 pGPSV1, pGPSV2 및 pGPSV3 이 있음을 보여줬는데, 이들은 각각 PSV1, PSV2 및 PSV3 로 지칭되는 아데닐화 도메인 절편을 포함한다.
후속적으로, 클론의 삽입체는 EcoRI 제한효소절단으로 방출하고, 절편은 pBBR1-MCS2 (Kovach, M.E. et al. 1995. Gene. 166:175-176) 으로 클로닝하여, 각각 플라스미드 pBPSV1, pBPSV2 및 pBPSV3 를 구축했는데, 이는 각각 PSV1, PSV2 및 PSV3 로 지칭되는 아데닐화 도메인 절편을 포함한다.
개시자 올리고뉴클레오티드 MTF2 및 PS4 를 이용하여 수득한 PCR 밴드로부터, 네스티드-PCR (30 싸이클의 95℃-1 분; 60℃-1 분; 72℃-1 분) 을 개시자 올리고뉴클레오티드 PS2-TG: 5'-ACNGGNMRNCCNAARGG-3' 및 MTR: 5'-CCNCGDATYTTNACY-3' (Neilan et al. 1999. J. Bacteriol. 181(13):4089-4097) 을 이용하여 수행하여, 750 bp 밴드를 수득하고, 이를 pGEM-T Easy vector (Promega) 에 클로닝했다. RFLP 에 의한 클론의 분석은 각각 펩티드 합성효소에 해당하는 2 개의 신규한 타입의 상이한 클론 pGPSV4 및 pGPSV5 이 있음을 보여줬는데, 이들은 각각 PSV4 및 PSV5 로 지칭되는 아데닐화 도메인 절편을 포함한다.
개시자 올리고뉴클레오티드 PS2M: 5'- TACACSGGCWSSACSGG-3' 및 PSV-4 를 이용한 PCR 증폭은 1.3 kb 밴드를 제공하여, 이를 pGEM-T Easy vector (Promega) 에 클로닝했다. 사용한 프로그램은, 72℃ 의 어닐링 온도에서 5 싸이클, 이어서 10 싸이클로 70℃ 에서 어닐링하고 68℃ 로 종결한 후, 20 싸이클 (96℃-1 분; 72℃- 68℃-2 분; 72℃-3 분) 로 한 터치 다운 스타팅 (Touch-down starting) 이었다. RFLP 에 의한 클론의 분석은 각각 펩티드 합성효소에 해당하는 신규한 타입의 상이한 클론 pGPSV6 이 있음을 보여줬는데, 이들은 PSV6 로 지칭되는 아데닐화 도메인 절편을 포함했다.
실시예 4. 콜로니 혼성화에 의한 유전자 라이브러리의 분석
SuperCos1 및 pKC505 (실시예 1 및 2) 에서 구축한 유전자 라이브러리는 각각 DIG DNA Labeling and Detection Kit system (Roche) 를 이용한 제자리(in situ) 콜로니 혼성화 분석 (Sambrook et al. 2001) 에 적용했다. PSV1 내지 PSV6 로 지칭되는 6 개의 아데닐화 도메인을 프로브로 이용했다.
하기의 것은 SuperCos1 에서 구축된 유전자 라이브러리로부터 수득했다:
- 절편 PSV1 에 혼성화된, pCT1a, pCT1b 및 pCT1c 로 명명된 3 개의 양성 코스미드 (클론);
- 절편 PSV2 에 혼성화된, pCT2a, pCT2b 및 pCT2c 로 명명된 3 개의 양성 코스미드 (클론); 상기 절편들 중, pCT2c 는 또한 절편 PSV5 와 혼성화함;
- 절편 PSV3 에 혼성화된, pCT3a 및 pCT3b 로 명명된 2 개의 양성 코스미드 (클론); 추가로, 이들 모두는 또한 절편 PSV6 에 혼성화함; 및
- PSV4 에 혼성화된, pCT4a 로 명명된 1 개의 양성 코스미드 (클론).
55 개의 양성 코스미드가 pKC505 에서 구축된 유전자 라이브러리에서 수득되었다:
- 절편 PSV2 에 혼성화된, cosV1-F8, cosV7-D2, cosV7-D12, cosV14-H4, cosV19-B4, cosV29-B9, cosV31-B11, cosV31-H10, cosV33-D12, cosV33-F7 로 명명된 10 개의 양성 코스미드 (클론);
- 절편 PSV5 에 혼성화된, cosV1-B6, cosV6-H8, cosV11-F10, cosV20-F8, cosV22-F7, cosV25-B3, cosV32-B4 로 명명된 7 개의 양성 코스미드; 및
- 절편 PSV1, PSV3, PSV4 또는 PSV6 에 혼성화된, cosV1-B7, cosV1-F5, cosV2-E5, cosV2-F11, cosV3-D9, cosV4-D2, cosV5-D7, cosV5-G6, cosV6-A7, cosV6-A12, cosV7-E7, cosV8-F8, cosV9-H7, cosV10-A3, cosV11-B4, cosV11-G2, cosV12-B12, cosV13-B2, cosV16-H11, cosV17-A3, cosV19-F4, cosV20-B3, cosV20-H5, cosV21-H6, cosV22-B11, cosV23-F8, cosV26-H11, cosV28-G1, cosV29-E1, cosV29-G6, cosV30-G5, cosV31-A12, cosV31-E10, cosV32-A7, cosV32-D10, cosV33-A8, cosV33-D10, cosV33-F10 로 명명된 38 개의 양성 코스미드.
단계 2. 6 개의 분리된
아데닐화
영역에서의 돌연변이체 생성
미크로모노스포라 종 ML1 염색체 DNA 로부터 미리 증폭된 6 개의 아데닐화 도메인 절편 (PSV1, PSV2, PSV3, PSV4, PSV5 및 PSV6) 을 티오코랄린 생합성에 수반되는 영역 평가를 위한 목적으로 독립적인 유전자 차단 실험에 사용했다 (실시예 6 내지 11).
콘쥬게이트성 플라스미드 에셰리키아 콜라이/스트렙토마이세스 pOJ260 (Bierman et al. 1992, Gene 116, 43-49) 를, 각각 영역 PSV1 내지 PSV6 를 포함하는 구축물 pFL903, pFL904, pFL905, pFL906, pFL940 및 pFL941 형성에 이용했다. 상기 구축물들은 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주 (Kieser et al. 2000) 에 도입했고, 그로부터 콘쥬게이션에 의해 기재된 과정 (Kieser et al. 2000) 을 이용하여 미크로모노스포라 종 ML1 균주에 도입했다. 트랜스콘쥬게이트성 클론을 아프라마이신을 이용해 선별하고, 적합한 염색체 영역으로의 통합은 아데닐화 도메인 절편 PSV1 내지 PSV6 의 상응하는 영역을 이용하는 서던 혼성화 (Southern hybridization) 로써 밝혀냈다. PSV 아데닐화 도메인 (PSV1 내지 PSV6) 의 각각의 영역으로부터 선별한 트랜스콘쥬레이트물 (transconjugant) 은 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사체는 아세토니트릴로 추출하고, HPLC-MS 로 분석했다 (실시예 5). 아데닐화 도메인 PSV2 및 PSV5 에 타격을 받은 돌연변이체만은 티오코랄린을 생산하지 않는 표현형을 갖는다 (실시예 7 및 10). PSV1, PSV3, PSV4 및 PSV6 이 결실된 돌연변이체에서의 티오코랄린의 생산은 야생형의 것과 유사했다 (실시예 6, 8, 9 및 11). 상기 실험들은 아데닐화 도메인 PSV2 및 PSV5 가 티오코랄린 생합성에 수반된다는 것을 보여줬다.
실시예 5. 티오코랄린 생산의 HPLC 검출
상이한 분석 균주의 아세토니트릴을 이용한 추출물은 회전 증발기에서 농축하고, HPLC-MS 분석에 사용하기 전에 DMSO 에 재현탁시켰다.
아세토니트릴 및 0.1% 트리플루오로아세트산의 수중 혼합물을 용매로 이용하는 역상 컬럼 (Symmetry C18, 2.1 X 150 mm, Waters) 을 이용하여 샘플 (10 ㎕) 을 HPLC 로 분석했다. 처음 4 분 동안은 10% 의 아세토니트릴이 있는 이동상의 농도는 일정하게 유지되었다. 이후, 30 분까지는 아세토니트릴의 10% 에서 100% 로의 선형구배가 시작되었다. 사용된 유량은 0.25 ml/분이었다. 정점의 분광 검출 및 특징분석은 포토다이드 검출기 (photodiode detector) 를 이용하고, Millennium 컴퓨터 소프트웨어 (Waters) 를 이용하여 수행되었다. 크로마토그램은 230 nm 에서의 흡광도로 추출되었다.
실시예 6. PSV1 영역에서의 유전자 차단
PSV1 영역은 플라스미드 pBPSV1 으로부터 1.3 kb EcoRI 밴드로서 수득했고, 콘쥬게이트성 플라스미드 에셰리키아 콜라이/스트렙토마이세스 pOJ260 의 EcoRI 부위에 클로닝하여, pFL903 을 형성했다. pOJ260 은 스트렙토마이세스에서 아프라마이신 내성을 보유한 유전자를 포함하며, 상기 세포에서 이는 자살 플라스미드이다.
구축물 pFL903 은 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주로 도입되어, 여기에서 콘쥬게이션에 의해, 기재된 과정 (Kieser et al. 2000) 을 이용하여 미크로모노스포라 종 ML1 에 도입되었다. 트랜스콘쥬게이트성 클론은 25 ㎍/ml 의 아프라마이신을 이용하여 선별되었고, 그의 염색체 DNA 로부터 PSV1 영역이 실제로 차단되었다는 것은 서던 혼성화로 밝혔다. 상기의 경우 사용된 프로브는 PSV1 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV1 을 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사를 아세토니트릴로 추출하여, HPLC-MS 로 분석해 (실시예 5 참고) 티오코랄린 생산체라는 것을 밝혀냈다. 리터 당 배양 배지 MT4 의 조성은 하기와 같다: 6 g 대두분, 2.5 g 맥아 추출물, 2.5 g 펩톤, 5 g 덱스트로오스, 20 g 덱스트린, 4 g 의 CaCO3, 10 g 의 해수염, pH 는 6.8 로 조정.
실시예 7. PSV2 영역에서의 유전자 차단
PSV2 영역은 플라스미드 pBPSV2 로부터 1.3 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위에 클로닝하여 pFL904 를 형성했다.
구축물 pFL904 는 콘쥬게이트성 에셰리키아 콜라이 ET12567 균주 (pUB307) 에 도입하고, 이로부터 콘쥬게이션에 의하여 미크로모노스포라 종 ML1 균주에 도입했다. 상호콘쥬게이션 클론은 25 ㎍/ml 의 아프라마이신을 이용하여 선별하고, 그의 염색체 DNA 로부터 PSV2 영역이 실제로 차단되었음을 서던 혼성화로 밝혀냈다. 이 경우에 사용한 프로브는 PSV2 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV2 을 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사는 아세토니트릴을 이용하여 추출하고, HPLC-MS (실시예 5) 로 분석하여, 상기 균주가 티오코랄린을 생산하지 않는다는 결과를 도출했다.
실시예 8. PSV3 영역에서의 유전자 차단
PSV3 영역은 플라스미드 pBPSV3 로부터 1.4 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위에 클로닝하여, pFL905 을 생성했다.
구축물 pFL905 는 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 거기에서 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주로 도입했다. 트랜스콘쥬게이트성 클론을 25 ㎍/ml 의 아프라마이신을 사용하여 선별하고, 그의 염색체 DNA 로부터 PSV3 영역이 실제로 차단되었음을 서던 혼성화에 의해 밝혀냈다. 상기 경우 사용된 프로브는 PSV3 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV3 은 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사는 아세토니트릴로 추출하고 HPLC-MS (실시예 5) 로 분석하여, 티오코랄린 생산체임을 증명했다.
실시예 9. PSV4 영역에서의 유전자 차단
PSV4 영역은 플라스미드 pGPSV4 로부터 1.2 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위에 클로닝하여, pFL906 을 생성했다.
구축물 pFL906 을 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 거기에서 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주로 도입했다. 트랜스콘쥬게이트성 클론은 25 ㎍/ml 의 아프라마이신으로 선별하고, 그의 염색체 DNA 로부터 PSV4 영역이 실제로 차단되었음을 서던 혼성화로 밝혀냈다. 상기 경우 사용된 프로브는 PSV4 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV4 는 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사를 아세토니트릴로 추출하고 HPLC-MS (실시예 5) 로 분석하여, 티오코랄린 생산체임을 증명했다.
실시예 10. PSV5 영역에서의 유전자 차단
PSV5 영역은 플라스미드 pGPSV5 로부터 1.1 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위에 클로닝하여, pFL940 를 생성했다.
구축물 pFL940 을 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 거기에서 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주로 도입했다. 트랜스콘쥬게이트성 클론은 25 ㎍/ml 의 아프라마이신으로 선별하고, 그의 염색체 DNA 로부터 PSV5 영역이 실제로 차단되었음을 서던 혼성화로 밝혔다. 상기 경우 사용된 프로브는 PSV5 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV5 은 티오코랄린 생산 배지 MT4 에서 배양했고, 후속하여 그의 균사는 아세토니트릴로 추출하고 HPLC 로 분석하여, 상기 균주가 티오코랄린을 생산하지 않음을 증명했다.
실시예 11. PSV6 영역에서의 유전자 차단
PSV6 영역은 플라스미드 pGPSV6 로부터 1.1 kb EcoRI 밴드로서 수득하고, 플라스미드 pOJ260 의 EcoRI 부위로 클로닝하여, pFL941 를 형성했다.
구축물 pFL941 은 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 그로부터 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주에 도입했다. 트랜스콘쥬게이트성 클론을 25 ㎍/ml 의 아프라마이신을 이용하여 선별하고, 그의 염색체 DNA 로부터 PSV6 영역이 차단되었다는 것은 서던 혼성화로 밝혀냈다. 상기 경우 사용한 프로브는 PSV6 밴드였다.
돌연변이체 미크로모노스포라 종 ΔPSV6 은 티오코랄린 생산 배지 MT4 에서 배양했고, 후속하여 그의 균사는 아세토니트릴로 추출하고, HPLC 로 분석하여 티오코랄린 생산체라는 것을 증명했다.
단계 3.
티오코랄린
생합성 이행능력이 있는 유전자 클러스터의 뉴클레오티드 서열의 수득 및 분석
오직 아데닐화 도메인 PSV2 및 PSV5 의 증폭된 영역에 있어서만이 그의 유전자 차단으로 티오코랄린을 생산하지 않는 표현형을 제공하게 된다는 상기 결과를 토대로, 2 가지의 중복 코스미드, cosV33-D12 (아데닐화 도메인의 영역 PSV2 를 포함) 및 pCT2c (아데닐화 도메인 영역 PSV2 및 PSV5 를 포함) 를 선택하여 서열분석했다. 상기 코스미드로부터 수득된 64,650 bp 의 분석은 36 개의 온전한 ORF 및 2 개의 불완전한 ORF 이 존재함을 보여줬고, 그의 구성은 도 1 에 나타냈다. 상이한 유전자로부터 도출된 생성물의 데이터베이스에 존재하는 단백질 서열의 비교로 이들 대부분의 기능을 유추하게 되었다 (표 1).
실시예 12. 코스미드 cosV33-D12 및 pCT2c 의 삽입체의 뉴클레오티드 서열의 결정 및 분석
두 코스미드를 일반적인 방법으로 서열분석하고, University of Wisconsin 의 Genetics Computer Group 에서의 프로그램 패키지 GCG 를 서열의 컴퓨터 분석에 이용했다 (Devereux et al. 1984, Nucleic Acid Res. 12, 387-395).
이에 64,650 개 뉴클레오티드의 서열을 수득했고, 그의 컴퓨터 분석은 38 개의 ORF [36 개의 온전한 ORF 및 2 개의 불완전한 ORF] 이 존재함을 나타냈고, 그의 구성은 도 1 에 있다. 상기 ORF 의 유전자 발현 생성물은 BLAST 프로그램 (Altschul et al. 1997, Nucleic Acid Res. 25, 3389-3402) 을 이용하여 데이터베이스 내에 존재하는 공지된 기능을 가진 단백질과 비교함으로써, 이들 ORF 대부분에 대한 추정되는 기능들을 정리했다 (표 1).
동정된 단백질들 중 일부는 예를 들어, 동정된 NRPS 중 일부인, Tio12, Tio17, Tio18, Tio19, Tio20, Tio21, Tio22, Tio27 및 Tio28 과 같이 티오코랄린 펩티드 구조의 형성에 관여한다. Tio5, Tio6 및 Tio23 과 같이, 내성 프로세스에 관련될 수 있는 몇가지 단백질도 있다. 상기 서열 영역에서 동정된 가능한 티오코랄린 경로 조절자들은 Tio3, Tio4, Tio7, Tio24, Tio25 이다. 최종적으로, Tio8, Tio9, Tio10 및 Tio11 과 같이 개시 유닛 3-히드록시-퀴날데이트의 생성에 관련된 몇가지가 있다.
차단되는 경우 티오코랄린을 생산하지 않는 표현형을 양산하게 되는 유전자들은 도 1 에 별표로 표시되어 있다 (tio20, tio27 및 tio28).
실시예 13. tio28 에서의 유전자 차단
티오코랄린 생합성에서 Tio28 단백질의 관여 또는 비관여를 증명하기 위한 목적으로, tio28 유전자, 및 구체적으로는 그것이 가진 아데닐화 도메인들 중 단 하나의 의 유전자 차단에 의한 불활성화를 수행했다.
상기 아데닐화 도메인 (FL-T-102up 및 FL-T-102rp) 내부의 2 가지의 개시자 올리고뉴클레오티드를 고안하고, tio28 에서의 1,428 염기쌍 구역의 증폭에 이용했다. 상기 개시자 올리고뉴클레오티드의 서열은 하기와 같다:
FL-T-102up: 5'-ACCTGAGGTACTGGGCGCAGC-3' (21 뉴클레오티드)
FL-T-102rp: 5'- CCGATCACCACCACCGTGGC-3' (20 뉴클레오티드)
사용한 PCR 프로그램은 하기와 같다: 2 분 동안 94℃, 30 싸이클 (30 초 동안 94℃, 60 초 동안 53℃, 90 초 동안 68℃), 5 분 동안 68℃, 및 15 분 동안 4℃. PCR 반응 혼합물은 하기를 함유했다: 1 ㎕ 의, 코스미드 pCT2c 유래의 템플레이트 DNA, 1 ㎕ 의, 농도가 30 pmol/l 인 각각의 올리고뉴클레오티드, 7.5 ㎕ 의 2 mM dNTP 용액 (dATP, dTTP, dCTP 및 dGTP), 1 ㎕ 의 50 mM MgSO4, 5 ㎕ 의, Pfx 용 반응 완충액 (Invitrogene), 5 ㎕ 의, Pfx 용 인핸서 용액 (Invitrogene), 28 ㎕ 의 증류수 및 0.5 ㎕ 의 Pfx 폴리머라아제 (Invitrogene).
PSV7 로 명명한, 수득된 PCR 생성물을 플라스미드 pOJ260 의 EcoRV 부위로 클로닝하여 pFL971 를 생성했다.
구축물 pFL971 을 콘쥬게이트성 에셰리키아 콜라이 ET12567 (pUB307) 균주에 도입하고, 그로부터 콘쥬게이션에 의해 미크로모노스포라 종 ML1 균주에 도입했다. 트랜스콘쥬게이트성 클론은 25 ㎍/ml 의 아프라마이신을 사용하여 선별하고, 그의 염색체 DNA 로부터 PSV7 영역이 실제로 차단되었음을 서던 혼성화로 증명했다. 상기 경우 사용된 프로브는 PCR 생성물 PSV7 였다.
돌연변이체 미크로모노스포라 종 ΔPSV7 은 티오코랄린 생산 배지 MT4 에서 배양하고, 후속하여 그의 균사는 아세토니트릴로 추출하고 HPLC-MS (실시예 5) 로 분석하여, 상기 균주가 티오코랄린을 생산하지 않는다는 결과를 제공했다.
단계 4. 다른
방선균에서의
티오코랄린의
이종적
발현
티오코랄린 생합성에서 동정된 유전자의 개입을 밝혀내기 위해, 각종 스트렙토마이세스 종들에서의 티오코랄린 유전자 클러스터의 이종성 발현을 검정했다. 서열 식별 번호: 1 의 위치 1,393 (MseI 제한 부위) 및 위치 54,301 (AclI 제한 부위) 사이에 포함된 DNA 영역을, 에셰리키아 콜라이에서 복제성인 플라스미드 및 후속적으로 에셰리키아 콜라이에서 복제성이며 스트렙토마이세스에 통합성인 플라스미드에 클로닝하기 위한 DNA 절편으로 선택했다. 상기 DNA 영역은 양끝이 모두 포함된 온전한, tio3 및 tio28 사이에 위치한 모든 ORF 를 포함한다 (도 1). 상기 DNA 영역의 선택은 Tio3 및 Tio28 단백질이 2 차 대사 단백질과 유사성을 보이는 서열분석된 영역 내에서 가장 중요한 단백질이라는 사실 때문이었다.
그의 큰 크기로 인해, 상기 DNA 영역은 3 가지 상이한 코스미드 (cosV33-D12, cosV19-B4 및 pCT2c) 로부터 수득한 3 개의 독립적인 DNA 절편을 합하는 단계에서 수득했다:
- 절편 A (20.2 kb): MseI (서열 식별 번호: 1 의 위치 1,393) - NsiI (서열 식별 번호: 1 의 위치 21,585);
- 절편 B (19 kb): NsiI (서열 식별 번호: 1 의 위치 21,585) - EcoRI (서열 식별 번호: 1 의 위치 40,636); 및
- 절편 C (13.7 kb): EcoRI (서열 식별 번호: 1 의 위치 40,636) - AclI (서열 식별 번호: 1 의 위치 54,301).
서브클로닝을 쉽게 하기 위해, 온전한 DNA 절편을 우선 에셰리키아 콜라이 pOJ260 (실시예 14) 에서 복제성인 플라스미드에 서브클로닝했다. 삽입체를 빼 내고, 에리트로마이신 내성 프로모터 (ermEp) (pARP) [실시예 16] 를 포함하거나 또는 상기 프로모터가 없는 (pAR15AT) [실시예 15], 에셰리키아 콜라이에서 복제성이며/스트렙토마이세스에 통합성인 벡터에 서브클로닝했다. 선별된 DNA 영역을 스트렙토마이세스 pAR15AT 에 통합성인 상기 플라스미드에 양 방향으로 (실시예 17) 및 pARP (실시예 18) 에 클로닝했다. 최종적으로, 상기 구축물은 유전자간 콘쥬게이션으로 몇가지 스트렙토마이세트에 도입했다 (실시예 19).
실시예 14. 선별된 DNA 영역의 에셰리키아 콜라이 플라스미드 pOJ260 으로의 클로닝
제한 부위 EcoRI (서열 식별 번호: 1 의 위치 40,636) 및 AclI (서열 식별 번호: 1 의 위치 54,301) 사이에 위치한 DNA 영역은 일반적인 과정 (Sambrook et al. 2001) 으로 코스미드 pCT2c (도 2) 로부터 수득했다. 상기 DNA 절편을 에셰리키아 콜라이 플라스미드 pUK21 (Vieira et al. 1991, Gene 100, 189-194) 의 특정 제한 부위 EcoRI 및 ClaI 에 클로닝하여, 구축물 pFL1023 (도 3) 을 생성했다.
제한 부위 NsiI (서열 식별 번호: 1 의 위치 21,585) 및 EcoRI (서열 식별 번호: 1 의 위치 40,636) 사이에 위치하는 DNA 영역은 일반적인 과정 (Sambrook et al. 2001) 으로 코스미드 cosV19-B4 로부터 수득했다. 상기 DNA 절편은 에셰리키아 콜라이 플라스미드 pGEM-11Zf (Promega) 의 특정 제한 부위 NsiI 및 EcoRI 으로 클로닝하여, 구축물 pFL1022 (도 3) 를 생성했다.
이어서, 상기 두 DNA 절편을 연결했다. 이를 위해, pFL1022 에 존재하는 제한 부위 NsiI (서열 식별 번호: 1 의 위치 21,585) 및 EcoRI (서열 식별 번호: 1 의 위치 40,636) 사이에 위치하는 DNA 절편을 제한효소 HindIII (NsiI 제한 부위의 바로 앞의 다중 클로닝 부위에 위치) 및 EcoRI 을 사용한 제한효소 절단으로 빼 냈다. 이어서, 상기 절편을 구축물 pFL1023 에 존재하는 특정 제한 부위 HindIII 및 EcoRI 에 클로닝하여, 플라스미드 pFL1024 (도 3) 를 생성했다.
pFL1024 에 클로닝된 전체 영역은 SpeI 밴드 (pUK21 의 다중 클로닝 부위의 양끝에 존재하는 상기 2 개의 제한 부위 덕분에) 로서 빼 내고, 플라스미드 pOJ260 의 특정 SpeI 부위에 클로닝하여, 플라스미드 pFL1036 (도 3) 를 생성했다.
최종적으로, 제한효소 절단 부위 MseI (서열 식별 번호:1 의 위치 1,393) 및 NsiI (서열 식별 번호:1 의 위치 21,585) 사이에 위치한 절편을 코스미드 cosV33-D12 로부터 수득하고, 이를 각각 pFL1036 의 NdeI 및 NsiI 부위에 도입하여, pOJ260 (Bierman et al. 1992, Gene 116, 43-49) 내에 서열 식별 번호: 1 의 위치 1,393 (MseI 제한 부위) 및 54,301 (AclI 제한 부위) 사이, 즉 양끝을 모두 포함하여 온전한 ORF tio3 에서 tio28 까지를 포함하는 구축물 pFL1041 (도 4) 를 생성했다. 더욱이, pFL1041 에서, 상기 영역은 2 개의 SpeI 제한 부위와 인접해 있다. pFL1041 은 에셰리키아 콜라이에서 플라스미드 복제성이다.
실시예 15. 스트렙토마이세스 pAR15AT 에 통합성인 플라스미드의 구축
플라스미드 pACYC184 (Rose 1988, Nucleic Acids Res. 16, 355) 의 복제 기원, ori p15A 은 SgrAI-XbaI 절편으로서 수득했고, 에셰리키아 콜라이 DNA 폴리머라아제의 Klenow 절편으로 처리했다. 상기 복제 기원을 플라스미드 pUKA 의 SmaI 부위에 클로닝하고, 이에 따라 플라스미드 pUO15A (도 5) 를 수득했다. pUKA 는, PstI-AccI 제한 부위로 클로닝되고 코스미드 pKC505 (Richardson at al. 1987, Gene 61, 231-241) 로부터 PstI-EcoRI 밴드로서 수득된 아프라마이신 내성 유전자를 포함하는 플라스미드 pUK21 (Vieira et al. 1991, Gene 100, 189-194) 의 유도체이다.
아프라마이신 내성 유전자 aac (3)IV 다음에 ori p15A 를 포함하는 DNA 절편은 pUO15A 상에서의 BglII-XhoI 제한효소 절단으로써 수득되었다. 상기 절편은 동일한 제한효소를 이용하여 플라스미드 pOJ436 에 클로닝되어 (Bierman et al. 1992, Gene 116, 43-49), pOJ15A (도 5) 를 제공했다.
콘쥬게이션 기원 oriT 를 포함하는 플라스미드 pOJ260 유래의 DraI-BglII 절편 (Klenow 로 처리함) 은 pOJ15A 의 PvuII 제한 부위에 클로닝했다. 이에 따라 플라스미드 pAR15AT 를 최종적으로 수득했다 (도 5).
실시예 16. 스트렙토마이세스 pARP 에 통합성인 플라스미드의 구축
플라스미드 pGB15 (Blanco et al. 2001, Chem. Biol. 8, 253-263) 로부터 Klenow 를 사용하여 처리된 EcoRI-HindIII DNA 절편으로서의, 엘로라마이신 생합성 경로 유래의 elmGT 글리코실트랜스퍼라아제 유전자를, pSL1180 (Amersham Pharmacia) 의 Ecl136II 제한 부위에 클로닝했다. 이에 따라, 구축물 pSLelmGTa (도 6) 를 수득하여, elmGT 유전자는 구성적 ermE 에리트로마이신 내성 유전자 프로모터 (P ermE ) 의 제어 하에 있게 되었다.
P ermE -elmGT 를 포함하는 pSLelmGTa 로부터 수득된 SpeI-NheI 절편은, 실시예 15 에 기재된 플라스미드 pAR15AT 의 XbaI 부위로 클로닝하여, 구축물 pAR15ATG* (도 6) 을 수득했다.
플라스미드 pAR15ATG* 상의 XbaI 제한효소 절단 및 후속된 재-라이게이션으로써 elmGT 유전자를 제거하고, P ermE 프로모터는 유지하여, 플라스미드 pARP (도 6) 를 제공했다.
실시예 17. 양 방향에서의, 스트렙토마이세스 pAR15AT 에 통합성인 플라스미드로의 선별된 DNA 영역의 클로닝
서열 식별 번호: 1 의 위치 1,393 (MseI 제한 부위) 및 54,301 (AclI 제한 부위) 사이에 포함된 영역을 포함하는 pFL1041 (도 4) 유래의 SpeI DNA 절편을, 양 방향에서, 플라스미드 pAR15AT (도 5) 의 XbaI 제한 부위로 클로닝했다. 이에 따라, 에셰리키아 콜라이에서 복제성이며, 스트렙토마이세스에 통합성이고, pFL1048 및 pFL1048r (도 7) 로 명명한, 아프라마이신 내성 유전자를 가진 2 개의 신규한 플라스미드는, φC31 파아지의 attP 영역을 이용한 계를 이용하여 생성되었다.
실시예 18. ErmE 유전자 프로모터 다음의, 선별된 DNA 영역의 스트렙토마이세스 pARP 에 통합성인 플라스미드로의 클로닝
유사한 방식으로, 서열 식별 번호:1 의 위치 1,393 (MseI 제한 부위) 내지 54,301 (AclI 제한 부위) 사이에 포함된 영역을 포함하는 pFL1041 (도 4) 유래의 SpeI DNA 절편은 플라스미드 pARP (도 6) 의 XbaI 제한 부위에 클로닝했다. 이에 pFL1049 (도 7) 이 생성되었으며, 여기서 tio3 (서열 식별 번호:4) 에 해당하는 ORF 는 pARP 에 존재하는 연속적 프로모터 P ermE 의 제어 하에 있다. 상기 플라스미드는 아프라마이신 내성 유전자를 갖고, φC31 파아지의 attP 영역을 이용한 계를 이용하여 에셰리키아 콜라이에서 복제성이며, 스트렙토마이세스에서 통합성이다.
실시예 19. 상이한 스트렙토마이세트에서의 티오코랄린 생합성 경로의 이종성 발현
플라스미드 pFL1048 (도 7) 는 에셰리키아 콜라이 ET12567 (pUB307) 균주 (Kieser et al. 2000) 에서 콘쥬게이션에 의해 스트렙토마이세스 리비단스 (Streptomyces lividans) TK21 (Kieser et al. 2000) 및 스트렙토마이세스 알부스 (Streptomyces albus) J1074 종 (Chater et al. 1980, J. Gene. Microbiol. 116, 323-334) 에 도입되었다.
플라스미드 pFL1049 (도 7) 는 에셰리키아 콜라이 ET12567 (pUB307) 균주로부터 콘쥬게이션에 의해 스트렙토마이세스 코엘리컬러 (Streptomyces coelicolor) M145 (Redenbach et al., 1996, Mol. Microbiol., 21, 77-96), 스트렙토마이세스 리비단스 (Streptomyces lividans) TK21, 스트렙토마이세스 알부스 (Streptomyces albus) J1074 및 스트렙토마이세스 아베르미틸리스 (Streptomyces avermitilis) ATCC 31267 종으로 도입되었다.
최종적으로, 플라스미드 pFL1048r (도 7) 는 에셰리키아 콜라이 ET12567 균주 (pUB307) 로부터의 콘쥬게이션에 의해 스트렙토마이세스 리비단스 (Streptomyces lividans) TK21 종에 도입되었다.
제품 배지 R5A (Fernandez et al. 1998, J. Bacteriol. 180, 4929-4937)에서의 스트렙토마이세스 알부스 (Streptomyces albus. pFL1049) 클론의 배양 결과는 도 8A 에 나타낸다. 도 8B 는 상기 염색체에서 체류 시간이 27 분인 정점의 흡수 스펙트럼을 보여주며, 그의 질량 스펙트럼 (도 8C) 은 이들 모두 정제된 티오코랄린의 것과 상동임을 보여준다.
<110> Pharma Mar, S.A.
<120> GENES INVOLVED IN THE BIOSYNTHESIS OF THIOCORALINE AND
HETEROLOGOUS PRODUCTION OF SAME
<160> 39
<170> PatentIn version 3.1
<210> 1
<211> 64,650
<212> DNA
<213> Micromonospora sp., ML1 strain
<220>
<221> CDS
<222> (2)..(535)
<223> Open Reading Phase of orf1
<220>
<221> CDS
<222> (993)..(1130c)
<223> Open Reading Phase of orf2
<220>
<221> CDS
<222> (1517)..(2131)
<223> Open Reading Phase of tio3
<220>
<221> CDS
<222> (2154)..(2822)
<223> Open Reading Phase of tio4
<220>
<221> CDS
<222> (2970)..(3791)
<223> Open Reading Phase of tio5
<220>
<221> CDS
<222> (3794)..(4777c)
<223> Open Reading Phase of tio6
<220>
<221> CDS
<222> (4904)..(5611)
<223> Open Reading Phase of tio7
<220>
<221> CDS
<222> (5701)..(6426c)
<223> Open Reading Phase of tio8
<220>
<221> CDS
<222> (6426)..(7688c)
<223> Open Reading Phase of tio9
<220>
<221> CDS
<222> (7733)..(8524c)
<223> Open Reading Phase of tio10
<220>
<221> CDS
<222> (8791)..(10002)
<223> Open Reading Phase of tio11
<220>
<221> CDS
<222> (10002)..(11590c)
<223> Open Reading Phase of tio12
<220>
<221> CDS
<222> (11847)..(13634)
<223> Open Reading Phase of tio13
<220>
<221> CDS
<222> (13734)..(15005c)
<223> Open Reading Phase of tio14
<220>
<221> CDS
<222> (15005)..(16354c)
<223> Open Reading Phase of tio15
<220>
<221> CDS
<222> (16441)..(18744c)
<223> Open Reading Phase of tio16
<220>
<221> CDS
<222> (18774)..(19055c)
<223> Open Reading Phase of tio17
<220>
<221> CDS
<222> (19260)..(20036)
<223> Open Reading Phase of tio18
<220>
<221> CDS
<222> (20146)..(20880c)
<223> Open Reading Phase of tio19
<220>
<221> CDS
<222> (21188)..(28969)
<223> Open Reading Phase of tio20
<220>
<221> CDS
<222> (28979)..(38398)
<223> Open Reading Phase of tio21
<220>
<221> CDS
<222> (38449)..(38661)
<223> Open Reading Phase of tio22
<220>
<221> CDS
<222> (38642)..(41263)
<223> Open Reading Phase of tio23
<220>
<221> CDS
<222> (41835)..(42368)
<223> Open Reading Phase of tio24
<220>
<221> CDS
<222> (42395)..(43255c)
<223> Open Reading Phase of tio25
<220>
<221> CDS
<222> (43340)..(43741c)
<223> Open Reading Phase of tio26
<220>
<221> CDS
<222> (44152)..(49563)
<223> Open Reading Phase of tio27
<220>
<221> CDS
<222> (49635)..(53669)
<223> Open Reading Phase of tio28
<220>
<221> CDS
<222> (53749)..(55305c)
<223> Open Reading Phase of orf29
<220>
<221> CDS
<222> (55384)..(57222c)
<223> Open Reading Phase of orf30
<220>
<221> CDS
<222> (57895)..(58467c)
<223> Open Reading Phase of orf31
<220>
<221> CDS
<222> (58535)..(59206c)
<223> Open Reading Phase of orf32
<220>
<221> CDS
<222> (59298)..(59564c)
<223> Open Reading Phase of orf33
<220>
<221> CDS
<222> (59611)..(60114c)
<223> Open Reading Phase of orf34
<220>
<221> CDS
<222> (60202)..(60888)
<223> Open Reading Phase of orf35
<220>
<221> CDS
<222> (60960)..(62240)
<223> Open Reading Phase of orf36
<220>
<221> CDS
<222> (62300)..(62833)
<223> Open Reading Phase of orf37
<220>
<221> CDS
<222> (62925)..(64650)
<223> Open Reading Phase of orf38
<400> 1
gatccccagc cgcgaatggc agccacacag ctgcggcccc ggggccaaag gaccacgcga 60
gtacctgtgg gcctggatca ccaccgccac cagcgcaggt gagcaccggt ggctgctgat 120
gcgccgcaac cgcagcaccg gtgagctggc cttctacctg tgctggtcac cccgcccggc 180
gccgctgcac accctcgtga ccgtcgctgg ttcccgctgg agcatcgagg agctgttcca 240
gtccggcaaa ggccaggtcg gcctggacca ctaccaggtc cgcggctgga ccggctggca 300
ccgccacgtc accctggcca tgctcgccct ggccgtcctg accatcctcg ccgctcggca 360
gcccgacccc gacccggaga tcatcgcgct gaccgtcgcc gaaatccgcg ggctcctcaa 420
cgccttcgtc ctcgccgtga cgctcccacc cgcgcacacc ctgcactggt cgacctggcg 480
acgaacatcc caagcccgcg cccgacgagc ccactaccag cgcagacagg cgaagtgacg 540
ttggagtact agccattgag ccgataattc agcgcacgac ttgccggaat cggtagggat 600
ggtgtggcga ccatggccgc gatcgatgcc tgggcgcgtc ggcccggtcg acgccgagtc 660
gggcgacgcg ctggcgggtg aaggtggccg cccgtcgaac tttacgactt gaataccagt 720
atcggtgaag aggccgaaga ccgatatctg ccattacgta ccgatcatgt tgcaggaatg 780
cccggaacct ttcggatgtc aggctgccag ttggcaagcg ggtgggtgcc ctctcccgca 840
gggcttcgcg tagtcgcctg aacgtcttcc gacctcgcgt tcgtggtgtc gcggacctga 900
ttggagggtg atttagcacg ggtgtggtcc atcggtgatc tgcagttgct gagacaacat 960
gagacggaga aggaccacac cctcgcatgt catcgtcgct gatcgacgta acccgtcagc 1020
atgccccgcc ccgcccgact caccgactgc tggccgcgag gcgcttggag gccctggcgc 1080
gggttcccga tccgcgtgac ccgtgccaac cgccgcccac acgacctcat cgccaccgtg 1140
aacagcagct accccactat gcaatgaccc tgctctgtcc cgtcgacggg acagagcgcc 1200
cgccgccgga ggaagaaacc tgttgccgtc gcgggatgct gattatattc agcctcatga 1260
ccctgctcat gaagcggcgg gcttcggtcg cgatgcgttt gttccgccga tatctcacta 1320
aacgccggga ctggacagtg tgaacatcat tgcacttcta gctggttgac aacgtatcta 1380
cggtcgccat ggttaattgt ggttgacggc gcgtgtcgcg actgcggagc gccatgtcgt 1440
cgaatctcgg ccagccgtcg ccgtgacatt tgtcaaccag ctccgatgaa ttctgtgcac 1500
tctgggggag ttgctgatgt cggtttcggg aagccgccgg agcgaaggct cctaccgtcg 1560
ttcgggtggt tgtgcccagg gccgctcgcc ccggccagcc agggaagacg tcaagttcgt 1620
ccgttggccg gccgagcggc acctacgcga cctgtgccgt caggagcgga tcccgtgcct 1680
cctggtggtc gagggcggag cagagccgcc ggtctgcagt gatccgcgtg aggactgggt 1740
tcgtacgccg atctcgccat ccgaccttga cgctcgggtg accgctctcc ggcaacgttc 1800
tcacgaccgg cgtacgcctg ttctcgaccc ggccgggacg ttgtcgttca ggactgcgtc 1860
cgtcgtcatg tccagtacgc acctcgaact catggatctg ttcgtcgaac gcttcggcca 1920
ggtggtctac cgctgggagt tgatgaccat cctcacgaag cgcgactcga catcaacgcg 1980
aaacgccctc gatctgcaca tcatgagaat gaggaagcgg atcgcgccgc tcgatctgga 2040
tatagttact gcctggggcc gtggctacgc gctggaagaa aagtcctcat gggccgcggt 2100
ggccagcaag cccgcggctg tcgatcattg ctgacatcgc cggccgatgg ctactcagtt 2160
tcgtcgtggg tagtcttgtc gagggtctct gctgcggccc ggtcgagggt ggagacgatc 2220
cactgatcga gttcgacgct tgattggtgc gcggcctggc gccatcgggt aaggcgtcgg 2280
tcgggtatgg gaatgcgggg catcagtgcg gtcttgatgg tttctgttgt gcggtcggag 2340
cgggtcgctt tgatggccgc gcggagttgt ttgaccgacc acatctgggt ttcggcttcg 2400
tcgagccaac ggtcctgatc gtcgggagac attgcggcta cttcggcgtg gtgttggaaa 2460
ctgaggccgc ttcgacggcg ggccagtggg aagcggccgg cgacccaggc gtagttgcgt 2520
agggtctggt agtccagtcc tacagcctgg acgacgtgcc gatagcggtc ggcgtattgt 2580
tccttgccgt acaccagcca gtcgcccagg caccaggacg aggagtcgac gataccggag 2640
agttgggcgc cggttcgctc ccagtgttcg aagctcattc gttcgggcaa ccgtagaccg 2700
accctggtca gcatcacctg ggccggctct gctgggcgtt gcttcggaac gccagccgtt 2760
gctgcaggga ccacccggag cgctgctacg gcgttgcgtg acgatcggct acccgcgctc 2820
atcccactca acctccccga cagtcggata actcgctatc tctgctctct ttttccgtct 2880
cgcgccgtgc atgtgtgatc ggcgcgcgcg ggatgccacc cgtaaggccg cccttccgac 2940
aaaggcggcc ttgcgggtgt ttccggttac ctcgaccgca ggctgtactt acgggtcgcc 3000
agcggagcga agatggtgat cagcaggacc gaccaggcaa ccgtcagcag cacatccagc 3060
cccggcggat tgccgttgaa caggtcgcgc agcgcgttga ccgtcgcggt catgggactg 3120
gcatcggcgt acacccgcag ccaggtcggc atcgactcgg taggtacgaa cgccgacgag 3180
atcagactga acgggaagat ccagatcagg ccggccgact gcgccgcctc cgggttgggc 3240
accgagaggc cgatcatggc gccgacccag gtgagcgcgt agccgaacag caacagcagc 3300
gcgagtccgc cgagggcaga caggaccccg ccctggaagc ggaagccgat cagcagaccc 3360
atgagcacca cgaccagcat cgacacgacg ttgcgaagga tctccgacag cgtacgcccg 3420
acgaggaccg cggaccggct catcggcatc gagcggaacc ggtccatcag gccgcggtcc 3480
atgtcggtgg agatgccgat cgtggtgccg gcgaccgaac cgaacaacac catctgcacc 3540
aggatgccgg gcagcaggaa ctgggggtag ttcccgccct cgacattgat cgccccgccg 3600
aagacgtagg cgaacagcag gatgaacatg acgggctgaa ccagcgagaa catcaccagt 3660
tcggggctgc gcgtcaggtg ccgcagattg cgcagcgcca tctgccaggc gtcggacagc 3720
caccaggaca ggccggtctg ctgctgtgcg gcggcggcat cgagccgcgg tttcagggac 3780
gtggagacca tcaccgctta ccacccttct tcttgctgtt cacgtcttcg gacgcccggg 3840
ccgtggcggt gtgcccggtg agggcgagga acacgtcatc gagcgtgggc cggcggacgg 3900
ccacgtcggc gattgcgatg ccggaatcgc gcagcggatt gagtagctcg ttgagcgtca 3960
taccctcggg gaggggcgcg tgcacctgca tgccctccgg atcgccgacc ggctcggtcc 4020
ccaacctctc gcgcaggatc tgggtggtct tctcgaccgc ggcggcgtcg atgagagtca 4080
cgtcagccca cgcctggccg acctccgcct tgagttcgtc cggcgcgccg ctggcgatca 4140
ccttgccgct gtcgatcacg gacagcgagt cggcgaggtg gtcggcctcc tcgaggtact 4200
gggtcgtgag cagaaccgtg gtgccctcct cgaccaactc gttgacgatg cgccacacgt 4260
ccatgcgact gcgcggatcg agggcggcgg taggttcgtc gaggaagatg agctggggcc 4320
ggctcatcag ggtggcggcg atgtccagcc ggcggcgcat accgcccgag tacgtcttcg 4380
cctgccggcc ggccgcctcg gtcaggtcga agcgctccag cagttcggtc gcccgcacct 4440
tgatgtccgg cgtggacatc cggaacagct tgccgaccat gtgcaggttc tcccgcccgg 4500
tcagcatgtc gtcgacggtg gtgtactgac cggtcaggcc gatgatggag cgcacctgta 4560
gcgcgttgcg ccgcacgtcg aagccgaata tctcggcctt cccctcatcc ggcctgagaa 4620
gggtggtcag aacccgaacg gtggtggtct tgcccgcacc gttaggtccg agcagaccgt 4680
gcaccttacc ctccggcacg gtgagttcga ggtgatcgag agcggtcacc gagccgaatc 4740
tcttgcacag tccagctact tcaatcgctg ctggcatctc caggattcct ctcaaagggg 4800
ccaacgaagg tcggcgtgct gatcctggaa tctacccctg aacttccctt agaagctttg 4860
accgcagaat gagcggcagc gagtcgctat agtctcaaac gtgatgtatt tccgtccggc 4920
tgatctcgcc catgagcacg gcctttcccc gcaatcggta cgcaactacg agcgtgatgg 4980
tctcatcccg cccgctcggc gtacggagag cggctaccgg cggtacaccg agaagcacgc 5040
cgcagcgcta cgggcgtacc gcgccctcat cccggcgcac gggtacgccg aaagcggcgc 5100
gatcatgcgg gacatcactg ccggacggtt gaacgaggca ttgacaacca tcgaccgcag 5160
tcacgccgaa ctgctgcgag accgcggcac cctggacgct gtcgccgagg tcctgactca 5220
cctgacggga cgctcgaccg gcacctggcg tgccccgaag agcattcagc cctacagcat 5280
cggggagttg gcgcaccggc tcggcgtcaa tgtggcgacc atccggaaat gggagacgtc 5340
gggcgtgctc gcgcccgtcc gccggccgga gaccgggcac cggatgtacg acgccagcga 5400
cgtccgcgac gcggaactgg cgcacttcct gcggcgcggt cgctatccgc tcgagctgat 5460
agccaccgtg gtgcagcagg tccgggcggc cggagacacc caggcgttgg ccgcggccct 5520
cgcggactgg cggcagcgcg tcaccacgcg cggcctggcc atgctgaacg ccgccgcaca 5580
actcgccagc tacctggcga tggaggagaa ctgatccggg gcccgacgcc cccgtgaccc 5640
gctgcgccgg gactgttccg ggcgggtggg gccgtaccga ctccacccac cccgatctca 5700
ctgcgtgtgg gcagtcggct gctcccacac caacgcgtcg tggacctgcg cccgaagctg 5760
ccgcagctgg gcgaagggca gggtgatccg gcgggccaga tagtcgacgc cggtgctgcc 5820
gccggtgccg ttgcgattgc ccaccatctt cgagaccagc gccaggtggg tcatcttcca 5880
ccgccagtag ccgttggcca cgtcgagcag gctgtcggcg atgcggttga gcacgccggc 5940
gccggggccc cgtgcgcaga cctcggcgac gctgatgccg ttgtgctcgg tcagccgctc 6000
gaaggcccgg tagaggcggc cctcctgacg ctcgccgccg agcagccgcg cgagcaggcg 6060
gaactgcgcc gactgcgcac cgctcgcccc gtcgaggaac gggcggaatt cggcgaagtg 6120
acgcagcggc aaccgttcca gcgcgaccac ctgctcgtgc agtacccgga gcagctcagc 6180
ggtgcgctgg agaaattcca gcgccagctc ctcgtcctcg ggtccgtagg gcggcgtcat 6240
cgcgtccgcc gcggcgtcga ggtcgtacgt cacctgcttg agccacagct cgcaggcttg 6300
atgggtgacg atgaagaagt gctcagccag taccacggac cggctcgcgg tgtccggggc 6360
gcgggtctcc tgcagggaca gcagcgtgtc gacctgcagg tagtccgcgt aggtcagggt 6420
cgtcatcggg cggtcccggg gcgttctcgt gcgaactcca gcagctcgcg tacgccgctg 6480
cgcagcaccg acggcgctac gcacatggcg atccggatga ggtgacgcga ccagggcgcc 6540
ggttcgacgg tgatgacccg gccccgggcg tccaggcggg gcatcagcgc gaacccggtg 6600
ccgggaacca ccgcgacgtt ccgggtctcc agcagcccgg tggcgaactc ttcggcggtc 6660
aggccggtcg gcgcgacgtc gagcactgcg taccagccac cggcgggcag ttcgggcagc 6720
aggccggcgt cgcgtacggc gggcagcacc gcatcgcggt tgctgagcac catggcacgg 6780
ttctcgcgta ccacgtgtcc cagccgcagc gcctccagcc ccgcgtattg caccggggtc 6840
gacatcgcga tgaggttggc ctcctgcacg atccggaagg cgtgcgcggt ccggtcgttg 6900
gcggtgctga cgtaccccaa tcggtagccg gtcatcgcca ggctcttcga gaaggagtag 6960
gagctgtgca cgatccgctc ggagaccggc acatcccact ccagtgacgc ggtcgagacg 7020
tgttcgtcgt cgaagacgaa gtgctcgtac gcctcgtcgc tgatgacctg ccagccccgg 7080
gcgcgcgcca tgtcgatcag cgtgctcagg gtcgccgtgt cgaggacggc cccggtcggg 7140
ttggcgggtg agttgatcaa cagcactctg gtgttcgcgg tcgaggccgc cagcaccgac 7200
tcggggtccg tccggtagtc gcgtcccagc gggtagaaca ccggacggag accggcgagc 7260
agcacctgct gcaggtggat gggccagtgc agctccggca gcaggatctc cgcgtcgggt 7320
tcggccacgg cctgcatcag cgcggccagg ccctgacagg agccgggggt gacgaagagc 7380
cgggacacat cggtgtccac gccgttctgg tcagcgagct tctccaccag acgctcgcgg 7440
agctccagca gcccctcgac cgccgtgtag tcggtgcgcc ctgcggtcac cgcctccgcc 7500
agcgcctgcg cgacctcggg tggcggggtg aagtagggct cgccgacatg cagcttggtc 7560
accggaacac cgctgatgcg ctcgcgctcg ccggcatcgc ggaagacgcg atgcagctcc 7620
gacgacggaa tcgtcgacgc gaccgaggga ccgtcgagca ggttgggata ggggcttggc 7680
aggggcatct aatctccgtt tcgatcgtga cggcggtacg gggagggcat caggaggtgc 7740
gaccgccgtc gacgggaatc agcgctccgg tgatccagcc ggaaaactcc gggtcgagca 7800
ggccgcacac ccacccggcg atctcggcgg gctggccgaa ccggcccaaa ggggtcgccg 7860
cgagcagcga cgaccgcagc aacgcggact tcacggagtc caggcccatg tcgtcccaca 7920
tcggtgtgtc cacgggtccg ggtaggacgg cgttgaccct gacgtccggg gccagttccc 7980
gggccagcga tcgggtcaga ctgttcagcg cggccttgct ggcgccgtag aaggaccgcc 8040
ccggcatggc cagcacggca ccgacggacg acacgttcac caccgcgccc cgatgctcac 8100
gcaggtgggg tagggccgcg cggatcaggg cggccggtgc gcggacgttg gtggcgagca 8160
gccggtcgaa gtcctcgtcc gacgccgtgt cgagcgtcgc gaagcgggcc agcccggcgt 8220
tgttgaccag accgtgcacc gtaccgaagc gggtggtcgc ggcggcgacg acgtgttccg 8280
ccgcgcccgg ctcggtgatg tcggcggcga cggtcgcgac ctgcccgcca ccgtctccgg 8340
tcagctcccg caacgccgcc tcgcgacgcc cgaccgcgac cacgttcgcg tcgcgggcca 8400
gcagtcgttc gccgatcgcc cgtcccagtc ccgtgccggc cccggtgacg atcaccgtac 8460
gaccggcgag gccgtcgccc cgctcagcca cggcgggcca tgcctcggct tcggttgggg 8520
acaccgacgg cgtggctggc tgggacggcc ggccgccgag gtgtgcacgg ccgatatccg 8580
cgtccggtaa cgcgatgagc ggttgtgacc atggcctccg cctcgaccag actggtgttc 8640
gagctccaat ctcccgcctg ggaggcggat cggcatccat tccgacagaa ctgagccaga 8700
tgcgcccgcg gccctaccga ggcttgtgac gatgcgggca gttacgactt cgccgccgga 8760
tctccggatc ccgtacggaa ggttctgtcg atgagttcgc ccacggccag caccagcgcg 8820
ctcgacctca ccgacccgac gacgttcgtg cgccacgaca cgcacgtgtt ctgggccgag 8880
gtgcgtgacc acaatcccgt ctactggtac cagggccgcg aggaccgccc cggcttctgg 8940
gtggtatcgc gatatgtcga cgtggtcgcg tcctacaccg acgctgcgag gttgagctcg 9000
gcgcgcggca ccgtgctgga cgtgctgctc cggggcgagg actccgccgg cgggcggatg 9060
ctcgcggtca ccgatcggcc gcgccaccgt gaactgcgca acgtcatgct ccgcgcgttc 9120
tccccccggg tgctcggccg ggtcgtcgag caggtccatc gacgcgccga cgagctgatc 9180
cggcgggtca ccggtaccgg cgccttcgac ttcgccaccg aggtggccga gagcattccg 9240
atgggcacga tctgcgacct gctgtcgatc ccaccggcgg accggccgga cctgttgcgg 9300
tggaacaaga acgccctctc ctccgacgag gccgacgcca acctgtatgc cgcgctggag 9360
gcccgcaacc agatcctgct ctatttcatg gatctggccg agcagcggcg ggccagtccg 9420
ggcgacgacg tgatcagcat gatcgccact gccaccgtcg gcggcgagcc gctctccatc 9480
gacgacgtcg cgctcaactg ctacagcttg atcctcggcg gtgacgagtc ctcacggatg 9540
tcggcgatct gcgcggtcaa ggcgttcgcg gacttccccg accagtggcg ggccgtacgc 9600
gacggtgacg ttgcgatcga caccgcggtc gaggaggtgt tgcggtggtc cacgccggcc 9660
atgcacttcg cccgtaccgc caccacggac ttcgagctgc ggggccagca ggtgcgggcc 9720
ggagacatcg tcaccctgtg gaacctctcg gccaacttcg acgagcggga gttcgaccgg 9780
ccctaccggt tcgaggtggg gcgtaccccg aacaagcacc tgtcgttcgg ccatggcccg 9840
catttctgcc tcggcgccta ccttggccgc gccgagctgc aggcgttgct caccgcgctg 9900
gtcggaaccg tttcgcgcat cgagtccgcc gggtcgcccc ggcgcgtcta ctcgaacttc 9960
ctcaacggcc acagctcgct gcccgtcgcc ttcacgggtc gctgacccgg ccaggccctc 10020
accccgatgt gcgcagggtg accttgtcga ccttgccgac ggcggtgcgg gggaactcct 10080
cgatcggcac cacccgatcc ggaatcttgt aggtggccag accgcgctcg cggaggaagg 10140
acttgacagc cgccggactg atcggctcgt cccggaggat gacgaaggcg acggtcttct 10200
cgcccagcac cgggtcggcc acgccgacca ccgccgcgtc gcggatcgcg gcgtgggcga 10260
gaaggtgctc ctcgatctcc tcggcgggta ccttctcccc gccgcggttg atgatgtcct 10320
tgatccgccc gaccaccacg atgctgccgt ccggccgccg gcggaccatg tcgccggtgc 10380
ggaagtagcc gtcgggggtg aacgagcgcc ggttctgttc ctcggcccgg tagtagccgc 10440
ggatcgtgta gggaccccgc accagcagct cgccctcggc gccatcgggt acgggtcgac 10500
cgtcggtgtc gacaacgagg atctcgtcgt gcgcggccag cggacgtccc tcggtggcga 10560
gaacgacctc ctccggatcg tccaggcgcg tgtaggtcag cagcccttcc ccgacgccga 10620
accactgtgt cagcacggca ccgaggctgg tccggacctc ggcggcgcgg gcggggtcga 10680
acttggagct gcccacctgg agcatgaggt tggggaaccg gacgtccgac ttgcgggcgg 10740
cgtcgagcca cagccgcacc acgggcggca cgagcgtcgt gagcgtcacc cgctcccgct 10800
ccaacagctc gaacacctcg tccggccgga cgctggaggt gagcactgcg gtgccgccga 10860
ccagcagtgc gccgaggacg ccgggacagc cgagcgcgga attgtggccg atcgggttga 10920
ccgccaggta cacgtcctcc gcgccgaacc gcagcgcatc agccgtggcg cgcatgttgt 10980
aggcgtagtc gtcgtgcgtg cgtgggatga gcttgggcag gccggtcgtg ccgccggaga 11040
gcaggaacag cgcgggctcg ctggggtcga cggcaggcag gtcacgcccc cgccggtaga 11100
ggtccgccag cgcggtgaac tcctcggcgt caccggcgac cacgacatgc ttcagtgcgg 11160
gcacctcggc ccgtacctcg cgggccagcg cgcggtggtc gaagcccttg acctggtcga 11220
cgacgaccag ggcgaccgcc tgcgaatgtg cgcacaggtg ggtcagctcg accttacggt 11280
gtcccggcag ggccatgacg gggatggcgc cgatccgcag cagcgcgtag accaccacca 11340
cgaactcggg cacgttgggc agctggacga cgactcggtc caacggttcg atgcccacgt 11400
ccaacagccc gcccgcgacg tctgcggatg ccctcgacag ctcggcgtag gtcatccgcc 11460
gctcgccgca gacgagtgcg gtcttgtcgg cgtgccgggc acatgcctcg gtcagcaggt 11520
ctcccagcgg ccgtccctgc cagtacccct cgcggcggta gagcgcggca agttcctcgg 11580
gccagggcac acaaccatcg agcatcgctt ccacccaaca gagtcgaggt agttgaacag 11640
acacggcgtc tcgacgccat tgccacagcg tgacccaagc cgtgcggccc ggacggcacg 11700
gcgacaggga cgcgaaagga gcgtccgtgg cggcacttgc cctgtcgcaa tcctttcgtg 11760
gccgggcacc ggcgcgcgag cgagcagcta ggttcgggcc ccgtgcagcg ccctcgtacc 11820
cagtaccgag aggacggagt gagcaggtgc ccaccgttgc ggaattgttt gagtccgttg 11880
ttgcgcgctc gggcgaccac gtggcggtga tcttcggcga ccgcctcgtc agctatgccg 11940
aactcgacgc ccgcgcaaac cggttggcgc gggtgctggt cgagcgcggc gtcggccccg 12000
acaccaccgt ggcggtggcc atgccgaagt gcgacgagct gatggtggtg ctgctggcgg 12060
tgctcaaggc cggcggcgcc tacctgccgc tggacccgca gtatcccgcc aagcgactgg 12120
cgtacatggt gcaggacgcc cggcccacgc tgctggtccg gatggcgcag gtgtcgctgg 12180
aactcggggt gccggtcgct gaacttgtcg tggacgaccc cgacacggcg cgggagaccg 12240
agtcgcggcc agatcaccag ctgaccgacg ccagccgcaa cgctccgctg cgcccggaca 12300
acctgatgta cgtcatctac acctcgggct cgacgggtac gcccaagggc gtcgccgtga 12360
cccacaccgg cgtcgccgac atcgtggccg cccagaccgc ttccatcgcg ccccggccgg 12420
gcgaccgcgt gctccagtgg gcgtcggtca gcttcgacgc ggcgttctgg gactggtcgg 12480
cggcgttgct gtccggtgcc acgctgatca tggccccggc cgacgaactg ctcccgggcc 12540
aaccgctgcg cgacaccctg cgccggtacg cggtcaccca cgccgtgctg cccccggtcg 12600
cgctgagcgt caccgagccc gacgatgtgc tcgtcggcgg cacgctgatg tcgaccggcg 12660
atgcgtgcac ccgcgcgctg gtggccaagt gggcgccggg ccggcggatg tacaacggct 12720
acgggccgac cgagaccacg gtcgggtcga ccatcgccgg gcccatcgcc atctccgacg 12780
agatcaccat cggtacgccg tggtcgggca acagggtgta cgtcctcgac gagcgcctgc 12840
gcccggttcc gaacggccgc gacggcgagc tgtacctggc cggcaacggc ctagcccgcg 12900
gctacctgaa ccggccgggc ctgacggcga gccggttcgt gctcgacccc ttcggcccac 12960
ccggcggccg gatgtaccgc tccggcgacc ggggccaccg ccgcgcggac gggcagttgg 13020
tcttcgccag ccgcggcgac gaccaggtga agatccgtgg cttccgcgtc gagctcggcg 13080
aggtcgaggc gcggctggcg gcccaccctg cggtggatgt cgccgccgtg gtcgtggtcg 13140
gcgacctcgc gggcgcccgc ctggccgcct tcgtcagcac cgtggccggc accggggttt 13200
cggctgccga actgagcgca cactcggcgg agaccctgcc ggaacacatg gtgccgtcat 13260
cggtgcaggt gttacagcgg ctcccggtca ccgccaacgg caagatcgac cgggcggcgt 13320
tgcgggacct cgccgagtcg gcggcgcacc ccgacgcagc agcctcggcc ggtcctcccg 13380
gcgaggatcc gacctcggtg gagagccggc tatgtctgct ggtcagggag cttctggcgg 13440
tgccggacgt caggccgggc gacaacttct tcaaactggg cggccactcg gtgctggcga 13500
cccggctcgc cggacggctc cgcgacgagt ggggaatcac cgtgccgatc cgggcggtgt 13560
tcgaggcggc caccctgtcc gagctcgccc tggtcgtgca ggcgtcgaag gcatccatcc 13620
ccaacgggcg cccctgacgc cgacgaggaa ccgaaccagc gttccggcca cacaggaaag 13680
accccctcgg gcgatgccgg accggcaccg cccgaagggg gatccatcgg ctacctgggg 13740
ctacagtgcc tggggcagtc gccacgccgg ggcgggcccc accaaccggc ggtgttgtgg 13800
ttgtttccgt tgcgcgtcgc gaccgcgaag ccggcggacc ggcccgaggc gttgaccgcg 13860
atgacgtacg agcccaggtc gttgtcgccg aggcgggtcg tgcgtccccg gcgcggctcc 13920
cacatgaccg cgctgaacgg gtacgccgac gagccggtga agttgcggat gccgacgatc 13980
tggccggcgt cgttgacccg gtacgccacc cgaccgggaa gctccaccgg ctgggcgttc 14040
gcgctgggcc agtagatggc cgtggtggac tggccggttg cgttgatccg ccaaccgacg 14100
atcaacccgt tctcgttgcg gtcggtggcg tacgtgtcgg cggagccgcc ggtgggaagt 14160
tgctgcacgg cgagggtgcc gggctgccat accaccgccg tgtggtgcca ggactgctcg 14220
ccgacctggg tgaccagccc accggccact ccgccgcgct cgtccagcgt gtgcgcgagg 14280
gccaccggtc cggtgaccga cgtggtgggt ggcggcagcg tggtgtacgt gcggctggcc 14340
gggttccaca ggtacgagcc cacgggaaga ccgacccccg tggcgttggt gccgaccacg 14400
aggaccgtgc ccttgtcgtt gatgtcgacg gcctgggcac cgcccgcgcc gggcggcagc 14460
ggcaggacgt cgagcccggt gcgcgcttcc cagacgaaag gctgaagcag cggctggctg 14520
ccgtccggcg cgggcgtcgg cggcccgatg cccagcccga gcgtgccagc gacgacgccg 14580
aagcggttga tcgcctgcgc tcgcgagcta cccgcctgcg acggcgtgat ttcgatcagg 14640
cggccgccct tgtgccgcgg gttcgcgatg aaggcgtggg ccgtctgggt gcccgggagc 14700
gacgtcacgc cgaccacgtc gccgcggtcg ttgaggtcgg tggcctcact cggcgtaccg 14760
ggtccggcga gcgacccgag gtcgtggaac cggctgagcg cctcggcggg tgcgccaccc 14820
ggcccggacg acgtgctgcc ggtgcccctg agatgggggt tcgcgatgag cgcgtgggtg 14880
gtctgtgtgt cggcgagcgt ggcgacgccc agcacgtcgc cggacgcggc gaccggttcc 14940
acctgatgcg aggtcgccgt cagtgccagt atcgcgacga ccgtcagggt gcggactccc 15000
gtcaccaggt cacccgcacc ggtccgacgc caccgcgcgc caacaggttc aggtcgtagc 15060
gggcgacctg gcggccgagc gcggcgccga cctcgtcgga gtagcggaag tggacacccg 15120
ccaggacccg ggcgtcgatg ttctccttcg tcaacgtcga ccacggcgtg ccacgccggt 15180
agttgcgggt caccacccgg ccgtcacccc gggcgaaggt gatcgagaac gccatcgggg 15240
tgcagggtcc gaccagctgc gaaagcacct gttcggcggc cccagcggtg accgcgtggc 15300
cgctggggta ctcgggatgc ggcggcgtcg gcaggaacga gttccaggtg gggtcggggg 15360
cggtacgggg atcgccgtcg gtgtcggcgt cgcggatggc cgtgaccggc cgccagtgca 15420
ggagggcgta cttggcctcg aaggtggcga tgctggaatc gacgatagcc gcgccgagcg 15480
ccgccagtag ccgcaccttg ctcctgcggg accgggccga atcgccgacc agcaggcgaa 15540
gcaccggcac gtactgcgac agggggtcca gccacgccag gtcgctctgc gcctcggtgc 15600
gctcggaaac ctctccgccg agacggcgta cctcgtccag ggcccgccgg taaggggccg 15660
tgcccagggc cggcggtggt ggcgggcgga accgatcggc ccggccgagc aggaacgggc 15720
gggccagccc gtaaccggcc gccaccgtct gggtcgcccc gggcgtgagc cggtagaccc 15780
ccggtgcctc gggcggcagc gtgaagggca cgttcaccga cgccaggtcg aggccgtcac 15840
cggtacgcac cgcgaccatc gccgccgcgg cctcccgacc ggcggcgatg cccgccttct 15900
tggcctcgct cgcggccagc ccggccagcg agtcggccag caccccgtcg agcttgtccg 15960
cctggccggg gaccagtgcc ttcagcacac cgtgcaccgc cgttgcggtg gcggcatcct 16020
cgaacaccgc ccgctgcccg ggtgcgcgca ccggtgccgc ccgccgtgcg ctgagcgccg 16080
cccacgcggc aatccagctc atcgcccaca tccgctcggg cagcccggcc gtcggtgccg 16140
ccgcgaacgt cgccagcatc tcgtcgaacc aggggcccac gacgtccggg cgggaaccgt 16200
gccggggcga cgccgtggcg gcctcggcct tggtgggcag gatcaacagg cccgcggtgc 16260
cggctgcggt gctggccgcg gcgatcagca ggccgcgtcg ggagagcccc ggaaccaggg 16320
gggataggga cggttcggta gatcttgtcg tcatcgccat gcctttccat cggatacggg 16380
acgggggttc ggtgaggggt ccggttcggg accggtcggg ttcagccaca ggctggttca 16440
gagccggctg agcagcgccg cccggtcgac cttccccgtg ttggtcaggg gcagttcgtc 16500
gagggcgacg atgcgcgtgg ggaccatgta cgacggcagg atcctctgga gggcaccgac 16560
gacctcggcc gtgggaagcg gctcggccgt cggaacgtag aaggcggcca gcgtccgtcc 16620
gcccggcccc gagggagcca ccaccgaggc ggcccggacg cccgcgcact gtaggagggc 16680
gctctgcacc tcgcccagct cgattcggta gccgcgtacc ttcacctggt cgtcgaggcg 16740
ccccaggaac tccaggtcac cgcttggcag ccaacgggcg cggtcaccgg tgtggtacat 16800
gcgttcgccg gtgcggtggg cccacgggtc ggggaggaat ttggcggcgg tcaggccggg 16860
ggaccgggca tagcccaggg cgacgcattc accggcgatg tacagatcgc cctccgcgcc 16920
gttggggcag ggccccaggc cgtggtcgag tacgtagtag cgggcgttct gcatcggctt 16980
cccgtatgga atgctcggcc acccggggtc gacgtcgcct acccggtagt ggttcgacca 17040
gacggtgcac tccgtcgcgc cgcccagggc caccacctcg gcgttcggga aagcggcccg 17100
gatctggtcg ggcagcggca ccggaatcca gtcgccgctg aggaggacca ggcggagcgt 17160
gccacgcccg gccggctcgc ggacctggac gaagggcatg accatggcca gggcggcggg 17220
tgccgagtcc cagatggtga tctcctcctg ttcgaggagg tccaccaggg tgtccggttc 17280
ggccagttcc gccgctgacg ccagccgtac ggacccaccg gcggccagca cgccgaagat 17340
gtcgtagacc gagagatcga agcagaacga ggtgacaaag aggatctggt cggtcggccc 17400
gacccggtag ctgcggttca cccagtcgat gaggttcact gccgaccggt ggctgacgac 17460
gactcccttg ggtgcgcccg tcgagccgga agtgaagatg gtgtagcaga cgtcgtcggc 17520
cgtcgggccg gtggcgagcg gctcgctcgg gcgcagctcg atgtgatggc cggtccacag 17580
cggctcgcgt cccgacgccg ggcggtcgcc ggatggcgcc acgcggatca cggcgtcgta 17640
ccgctgggcc agctcgccgg tgaacgtctc gacctggcgg cggtggacgc tgccgccggt 17700
caccccgggc aggaactcgg gaagacgttc gatgaagtgc ggtgcgaccc ggatgccgga 17760
atagtcactg agatccgggt cgatcaggtc ggcgagcacg atgacgccgt cgtcggcgag 17820
cagtccgagc agcgacccga ggacgctgag caaatagtcg aggtccggca ggaactgcac 17880
ggtgctggcc agcaggatga cgtcgaacgg accctggacc cgctcggcta cctcgtgggc 17940
gaagcacact acgccgtcga cctcgccgcc ggcgcggaac ccgccctcct ggctgcgcgt 18000
cacggacacc ggtgaggggt cggcggcgac gtagcgcgac gcgcgcgggg ccagggcttc 18060
gacgatcaga ccggacccgg atccgatctc gaggatcgag ggtcgtgccg cggccgtcgc 18120
ggccagggcg aaggcagcca catggtcgcg gtactgctgc acatcgttct cgtcgaaggg 18180
acgctccgaa cggcgcatgt tgaagccggc ggcctcgagc tggtcggggg cgctcgacac 18240
gaagtcgaag aagttcacca cgaggtcggg ccggaaggtg gccgaccacg agaactcctc 18300
ggcgatgtcg gggcagagca cgtggcgcag cgagcgcacc tgccaccgaa gctcctgcat 18360
ggagcgcagg tgggtgcggt cggtcagcac cgcggccacg tcgagctggt cgagcagccc 18420
gaccacccgg cgggcgggcc acgacggatc gatcggtacg taggcggcac cgcacttgag 18480
cacggccagc agcccgacga gggccggtgc gtcacgctcg ccgaagagcg ccacggtgtc 18540
gccccgtccc acgccgagat cgcgtagcag ccgcgccagg cggttggcgc gccggtgcag 18600
ctcccggtgg gtcaggacct gcttgtcgga ggtcacgatc gccgggcggt ccgggtgccg 18660
ttcggcggcc tcagcgagca gatcggggat cgtgacgtcg gcgcggaagt gtcgtgcggt 18720
ctggttccat acgctccagg gcacgcccgg agacagggct ggcggggcgc tcatcgggcc 18780
agcgacccga acgcctcgtg ggccgccagc gcgtcggtca gctcgttgac tgtcggatgg 18840
tcgaagaaga gcttgagcga caagcgggtc ccggccagcg caccgagccc ggccatgatc 18900
tcggcgatca gcagggagtg cccgccgatg gcgaagaagt cgtcgtcgtt gtcgaaccgt 18960
tcgtgttgga gtgcggctgc ccacccggcc cgtacgtggg cacgcagcaa ccctcgcgcc 19020
gagccgtcgt tgccgtcgcg atccgggttc gccacctcgg ccgatccgat gtcgttcacc 19080
actcgcttcc ggtcctctcc cggtgccctg cctctgcaac tgcgggccgg tgccgcccgg 19140
tccccgaccg tgcccggccg gtgccagtct caccgcggtg gtccgccgtt gtctgcggat 19200
ctttcagagg tcagtcaggg ttggcgctga tgggcgtcgg cgcggcaatc ctcacgtgca 19260
tgggaacgag aacgaagaat cggtggttcg tagaggtctc gcgcagtcgg ctcaaggagt 19320
gtgccttgta cgccattccg cacgccggcg gcggggtggc cacagtgcgc agtctctgtg 19380
tcgaactcgg cgacgcgttc gacaccttcg gcgtgcgcct gccgggacgg gagtcccggc 19440
tcggtgaccc ggtggtgacg gtcatgtccc ggctcgccga cgaactcgcc ggcgaactgc 19500
tccgccatgc ccaggggcgg ccggtggtgc tgtacggcca ctgctccggc tcggcgatcg 19560
cctacgaggt agcgcgccgt atggaccccg cccagctgcg gggactcgcc gtctcctcgc 19620
atccggcgcc cggcagcgtt cggcgtgcgc ccacctggga actgccgcga caggagttcc 19680
tcaagcaggt cgtgaccgac gggtacctgc cgcccgagat catcgccaac gaggaactgc 19740
tcgacatcta cgagcccgcc gtacgcgccg attacgagct cgtcgagacc tacgagttgg 19800
acctgttcgg gggtgggccc gtcgaggctg tcgccgcgcc gacggtggcc atccacggtc 19860
gcgacgacca caccatcgac ccggtccaca tcgatgcctg gtcggccctc accaccgggc 19920
cgtttcgggt cgtgtcgctg gcggggggcc acaacctgct cctcggccga ccggcggagc 19980
tggccgcggc catctgccag ggcctggcct cagacaaccg actccatgat caccggtagc 20040
ggccggccca ccgcccgtca cgtggcacag gtgcctgccc tgctcggccg actggtcgag 20100
cagggcagcc caccggtgat cgagggccat cagggaagtt gctcacgccc actcccggcc 20160
catgatgtcc gagaccagcc cgtcgacatc gatggacaca tggaagtggc cgcccggtcg 20220
caccgtcagc cggaactcgc ctgtggtgac gtccgcccac tccgtcagcc tcgactcgtc 20280
caccagcggg tcgccgacgc cgtgataaca actcaccggg cacgacagcg gcgtggttcc 20340
ggagccgggc cggtagttgg cgtgcgcgcg caggtccgag cgcagcgtcg gcatgaacaa 20400
ctcgcgtagc tccgcgatct cggcgacccg ggggtcgatg ccgcccagag cgcagatggc 20460
cgcccagaac tcgtcatcgg gcttcaggtg aacgtcccga ttcttcatct ggccgggtgg 20520
gaggcaggcc gaggcgcaga gcctcctcgg ttccaccctc atgtcccgca gcaacatcgc 20580
ggtctcgtac gccaccatgg cgcccaggct gtgtccgaac agcacctggt cgcggcaggg 20640
cagctcaagc aactccacca cgatgtgccc ggccatctcg gccacgtcgt ccacgaggtg 20700
ctcggcgaat cggtcaccgc gtccggggta ctggacggcc acgagttcga cccctggtgg 20760
catcgcgttc gcccagtcgc tgaaggcggt cgccgagcct cctgagtgcg gaaaacacac 20820
caagcgcccg gtgggcttct cgaccgtggt cagcgtgcgt atccagccct tcttccgcat 20880
ccagctcatc gatccgtcct tccgattggt ttccgctttg cactggatgg tcgtcgttct 20940
gacgtcactc aggtcattcg tgaaagaaat tggtcagaca tagctggtgc aacggttgct 21000
ggccccaggg ttggttctgg ccgacatctt tcaggccgtt tgaggactca acaacccgtt 21060
catagtgtgg ggctcacgaa cgacggcggc ttccgccggc cgtggctggg gagctgcgta 21120
cgggaggacc caactgcgct ccgccgcgag tcagtgacga tcgagagtta cttattcggg 21180
agtctggatg ggttacggcg gtgtttcgtc ggcgcaggag gcaatgtggc tggaacagaa 21240
tcttgcacct gaggtgccga acagcaccac gaccatttgg gatgtgcggg gcgagctgca 21300
cctgcctgat ctcgaggacg cgttgcggac cgccctgggc gagacgagcg cactcctggt 21360
gaacttccgg cgggagagcg atgagctgcg gatcgtcccc cggaagctgg acgcgtggga 21420
gcccttccgc attgacgcga gcgacgccgc cgaccctgcg gccgcggccc gggaatttct 21480
caccgaacag attcgccgcc cgttcgacct cggtgcggat gcgctgttcc ggatcggaac 21540
ggtccggctg ggcgacgggc atcatctgct gtgcctgatc atgcatcaca tcctgaccga 21600
cgcgttcggc gtgttcaccc tgctctccca gcgcgtcgcg gagatctacc gcgccctgcg 21660
cgccgattcc cctgtgccgg accggccgga cacgcctgcc gagatcgccg gcgaacggga 21720
ggcgacgtac cggtcgtccg aaaggttcac ggacgcggcg cggttctggc gtgattacgt 21780
cacggccggc ggcacggctg cccgactgcc gaccgggatg cgggcgggcg cgacccgtac 21840
ggcgagcgtc gggttctggg acggtctgac cgcaccgctg ggcgtcgcca gctacaccgc 21900
cagcgtggcg gcgagcgagg tcgcccggtg gcgggcggct gccgattcga ccgaaacgag 21960
cgtcccggac ctgctcacct cggcggccac cgccttcctc caccgcctct gcaacacgcc 22020
cagaccgatg ctctccttca ccgtcaacta ccgcaggggg gacatcaaac aggcctgcgg 22080
cctgtactcg aacgccctgc cgctggtgat cgaggtgccg gcggcaggcg acttcgtcga 22140
cctggcgaag tcggtgcgtc tcgagcgtct gcgggtgctg cggtacgccg agtacaacgt 22200
ctccctgatc aagcgcgcgg ccggtcacgc gggcgacgta cgcagcccgt tcggccccgt 22260
cgtcaacgtc attcccttcc tccgggaact cgacctcgcc ggcgccgtcg gacggttcgc 22320
gggcggcacg ttcgggctac ccgacgaggt ccgtatctcc acctacgtgg acggcggccc 22380
ggacagcgac ctgtacatcc gcttcgacgc gcccggacgg ctgtacaccc acgaggacat 22440
cgccgggctg gccgagaggt tcgtgacctt cgtccgggcg gccctgaccg acccacgggc 22500
gcgggtccgt gacatcagcg ccatcgggga gcaggaaaga gtcgcgctcc tcgaccgctg 22560
tgccggcccg gtagtcgagc tggccggcgt gacggtgccc gtgctgctcg acatgcaggc 22620
gctggccaca ccggatgcgg ccgccgtcgt gcacgagaac gccgtactga cctaccggga 22680
gctggccgcg aggtccgacg ccctggcccg cagactcgcc gagtgcggcg cgggaccgga 22740
acgtctcgtg gcggtcgccg tgccccggtc gatcggcctg gcggtcgcgt tgtgcgcggt 22800
cctcaaggcc ggcgccgcct acctgcccat cgatccggac tctccggcgg agcgcgtgga 22860
gttcatgctc ggcgacgctc ggccgacgct gctgctcacg gtcgccggga ccgacggact 22920
ggccatcacg cccctgcacg gagcgcagcc acgctgggag gccagcgtta tcgagcggac 22980
gaccgcagcg tcaccggcgg ccacgtcgca ggctggcggc accggcgagc acgccgcgta 23040
cctgcggtac cggtcggggc cattcggtcc ggcggccggc gtcgtggtga cgcacgccgc 23100
cctcgtcaac gagctgctct ggatgcagca gcgataccgg ttgaacgaca ccgaccgggt 23160
gctgcacaag gccccggcat ccctcaatgc ctccgggtgg gagatcttct ggccgctgat 23220
cgccggtgcc accgtcgtca tggcgaccca ggacgtccac ggggacgcga ccgcgctcgc 23280
ggcgatgatc cggcggacgg gtgtcaccac cgtgcacgtc gtcccgtccg tgctcgccga 23340
gctggtgcgc gacgaagccg ttgtcaccgc cggcaagggt ctgcggcacg tcatgtgcag 23400
cggggaagtg ctcccggccg acctggcagc ccggttccac gagagctgcg acgtcccggt 23460
gcacagtctt tacgggcccg tcgaggcgat gccggtcgtc acgtcgtgcg actaccgacc 23520
cggctcgccc acggtaccgc tcggacgacc gatctcgaac gccggcgtct acgtgctgga 23580
cagccaactc cagctgacgc cgccgggagt ggtcggcgag gtgtacgtca ccggcgtggg 23640
tctggcccgc ggctacctgc accgcccggc cgcgaccgcg gaccacttcg tcgcgtgccc 23700
gttcggcccc gccggcaccc gcatgtaccg caccggtgac ctggcgcgct ggaccgacga 23760
cggggaactc gagcacgccg gcagcgccga ccagcgggtg cggatacgcg gcttctgggc 23820
cgcgttcctc gagatcgaag cagttctgac cgcccacccg ggagtggacc aggccgccgt 23880
gatcgcccgg cccgacggcc ccgaccgcgc cgcccagctg atcgcctacg tggtacccgc 23940
gaccggcggg cggatgggtg cggccggcct ggacgtggac ttcagcgccg ggctggacgt 24000
ggtcgagctg cggcggttcg tcgctgcccg gctgcccgaa cacctcgtac ccgccaccat 24060
cgtcgtactg gaccggctgc cgctcacggc cgaagggaag cgggaccacg ccgcgctgcc 24120
cgaaccccag gccacccgac gggcccaccg ggtggcccgg accgccgagg aacgcctcct 24180
cgcggacgcc ttcgccgagg tgctgggcgc cggccgcatc ggtctggacg acgacttctt 24240
cgccctgggc ggcgacagca tctcggcgat gcgggtggtg gccctcgccc gtgccggcgg 24300
cctcgcgctc accgcgcgta ccgtcttcga atgccgcacc gtcgccgccc tggcggccgt 24360
ggcggcgccg gccgacgaac cagcggtcgc cgctgcggcc gagggcgacg gcggacgcga 24420
cgacgccggc ccgatcccac ttccgccgat ggcgcggctc ttcgccgaac gtggaccggg 24480
cctggaccgg ctggcccagt ggctggtgct gacgctgccg gcggagatga gccccgacct 24540
gctcaccgga gcggtccgag cggtcctgga ccggcacgat gtgctgcgct cccggctggc 24600
cgacggtcag ctgctgatcc agccgccggg atcggtggac gtcgacaagc tcatccggca 24660
ggtgccctgt tccggtgact ggagcgggcc ctcgtggccg gcgttactgg cggacgaggc 24720
cgcgaaggcg gtcggtcagc tcagcgcctc ggccgggcag gtgatccgca tggtctggtt 24780
cgcgccgccg ggcggtgcac ccggaagact gctcatcgcc gcccaccacc tggtcgtgga 24840
cggaatgtcg tggcgggtgc tcgtcccgga cctcgccgag gccgcggcac agatccgatc 24900
cgggcgtacg ccggcactgg ccccggtggg cacctcgctc cggtcctggc tggacgaact 24960
cgcggccgaa gcggtacggc ccgagcgcgt ggccgagctg gaactctggc gcggcatcct 25020
cgcaccctcc ggcgatccgc tgggtgcccg acccctcgat ccggcggtcg acctgaccag 25080
gacggcccag acgctgcggg tcgaggttcc cgccgaactc agcagggccc tgctcacctc 25140
ggtgccggcc accttccggt gcggtgtcga cgatgtgctg ctcaccgccc ttgcgctcgc 25200
gttggccagc cgtcggcaca acagcgccgg agtcgtccgg ctggaagggc acggacgtca 25260
ggaggaactc gttcccggca ccgacctgac ccgtacggtg ggctggttca ccacggtcca 25320
cccggtccgg ttcgacctgt ccggcctcga cctcaccgac gcgatcaacg gtggcccggc 25380
cgccgcggag gcactccggc gggtaaagga gagccggcgc gtcctgcccg atcggggcat 25440
cggctactcg ctgctgcggt acctcaacca ggcgaccggc gccatgctcc gcgacctccc 25500
cgccgacgag gtcggcttca actacctcgg tcggttctcc ttcgaccgtt cccggacggg 25560
ccgcgagatg gcgtggacgt ccgcgccgga atccgccgca ctcgtggcgg caccggatcc 25620
ggacatgccg ctgatctccg cactcgaact gaactccctg gtcgtcgaca ccgaccacgg 25680
cgaacagcta caggcgctgt tcaccttcgc caccggggtg ctcgccaccg acgaggtccg 25740
gcacctcgcc gacgactggc aggccgcgct gcgtggcatc cgagcacagg cggccacggg 25800
cgcgagcggc ctgaccccat ccgacgtgcc gttggtgcgg gtgcggcagc aggacctgga 25860
cgactggcag agccgtttcg ggcgggtcga cgacgtgtgg ccgctgactc cgctccagca 25920
cgggctgctc taccacagcc tgctgggcga cagcgccgcc gcgtcgtacc agacccagtt 25980
cgtcctccgg atcaacggac cggtggatcc ggcgcgtctt cgtggcgcgg cacagaccct 26040
gctgaaccgg caccccaacc tgcgggtggc cttcctgacc aagtccaccg gcgagccggt 26100
gcaggtggtc gtggacggcg tcgaggtgcc cttcgcgcac gtcgacctcg ccggtcaacc 26160
gcaggccgag gagcgactgg cccggatcct ggccgaggaa cgggaggccc agttccgcca 26220
cgacagcgca ccgctgctgc ggttcagcct catcaccctc accccgaccc aggccgaact 26280
cgcgctgacc gcacatcacg tgctgttcga cggctggtcg ctgccgctca tcgaacaaca 26340
gctgatgcac ctgtacgccg gcggggccga cgcgctggaa ctggtcgagc acggctatcg 26400
cgagttcctg cgctggcact cgcggcagaa cgcggacgag gcgctcgcgg cctggaccga 26460
ggaactggcc gacgcgacgc agcccacgct cctggcatcg gggttcgccc ccgccgagca 26520
ggctgggacg agcaccgaga tcggccaggt cgacgtcctg ctcacccgcc aggaggcggc 26580
atccgcagtg cgtcgggccg cggattgcgg catcacaccg aacgtcctcg tgcagggcgc 26640
ctgggcggtc gtgctcgccc agctcaccgg aaacgccgac gtcctcttcg gcagctccgt 26700
caccgtacgc ccgcccgaac tgccgggcgc gcacacggtc gtcgggatgt tcaccaacac 26760
cgtgccggtg cgggtacggt gcgcgcccgc cgacagcctc gaaggcatgc tccaggccgt 26820
acaggatgcc caggcgagga cgttggatca ctaccacgtc gggctcggcg acatccagcg 26880
ggcgaccgga ctcactaccc tcttcgacac catcgtcatc ttcgagtcgt tcccggtgga 26940
ccgggcggcg ttgtcgaagg ccagcgcgtc ggcggaactg accgtcaccg gcatccggcc 27000
gttcgcgccg acgcactacc cgctgaccgt gctcgcggcg gcggatccgc tgttgagcct 27060
gaccctccag taccaccccg acgcgcttgc accgagcacc gtgcaggcga tcgcggaccg 27120
tttcgcccgg gtgttgcggc agttcgcggc cgacccgcgg acccgcatcg ccgccatcga 27180
cgtgctctcc gaggccgagc ggcagctggt ggtgcacgac tggaacgcca ccgcgctgga 27240
ggtgccgccc gagttcgtgc ccgagcagtt cgcccggcag gcggcagcga caccggacgc 27300
ggtggccgtc gtggtggggg agcagcacct cacctacgcc gagttgagcg agcgggccaa 27360
ccggatggcg cactggctga tcgcgcaggg aatcggcgcc gagagccggg tcgtggtcct 27420
gctgccccgc tcggcggacc tggtggccgc gctgctggcg gtctggcagg ccggcggatg 27480
ctacgtaccc gtggatcccg actatcccgc cgcgcgggtg cggtccgtga tcgacgactg 27540
tgcggccacg ctggtgctgg acgagaacct gctggaccgg accgacctgt cgcgctaccc 27600
ggcacacgcc cccgcgatcg ccgtcgcgcc cggccaggcg gcctacacca tctacacctc 27660
cggctcgacc ggcaagccga agggcgtggt catcggccac gacgccctga ccaactttct 27720
ggccagcatg cagcgaacgc tgcgcctgtc ggcgcaggac cgcttcgccg ccgtcaccac 27780
gatcgccttc gatatcgcgg cgctcgagtt gtttctgccg ctcacgaccg gggcgcgcgt 27840
ggtgctcgcc aaccgggagc acgtcgcgaa tccaccggcc atgctggacc tcgtcgagca 27900
gaccggcgtc accgtcatgc aggcgacccc cgcgctgtgg cagatgctcg cgacgcacga 27960
cgtgcgtcgc ctgtccggcg tacgcgtcct gaccggcggc gaggcactgc cccggccgct 28020
cgccgagggc ctctgcgcgc acgccgcaca ggtgatcaac ttgtacgggc cgaccgagac 28080
gaccgtctgg tcgacccttg cggacgtcgc gacctgcaag ccgccgtcga tcggtacgcc 28140
catcgccaac acccaggtcc tgatcctgga ctcggcactg cggcccgtcc cacccggggt 28200
cggtggagac ctgtggatcg caggggacgg cctggcccgc ggctatcacc ggcaaccggg 28260
gctgaccgcc agccggttcg tggccaaccc gttcggccct cagggtgccc ggatgtaccg 28320
caccggcgac ctggctcgct ggtcggagag cggaaggatc gagttcctcg gccgggccga 28380
cttccagatc aaactccggg gattccggat cgagccgggc gacgtcgaac acgccctgac 28440
ccggcatccc gcggtccgcg aggccgtcgt gacgatccgg gaggaccagc ccgacgacaa 28500
gcggctcgtc gggtacgtgg tcgtcgccga ggatgccgag accccgccga cccgggagtt 28560
gcagcagttc gtgcgggagc agctgcccga ctacatggtc ccgtcggcgg tggtcaccct 28620
gcccgccatt ccgttgacgg cgaacggaaa gctggaccgt tcgcgactgc cccgacccga 28680
ggcgagcagc acgaagtacc gggcgccgga atccgcccgg gaggtcgccc tctgcgggat 28740
cttcgccgaa gtcctcggcg cggagcgggt cggcgtcgac gacgacttct tcgcgctcgg 28800
cgggcactcg ctgctcgcca cccggcttgc cgctcggctg cggtccgacc tgggggtcga 28860
ggtcccgatc cgcaccatct tcgccgcacc gaccgtcgcc gaactcgccc ggcggtggag 28920
cggtctgtcg acctccgtcc ggaagcctct gcgcaggatg accgaaaggt aacagagaat 28980
ggcgcccgtc tcgtatgcgc aacaacgaat gtggttcatc aatcggttcg agggccagac 29040
cgcgacctac aacatcccga tcctgatccg gatgcgcgga cagatcgacc gagacgagct 29100
gcgggctgcg ttcatggacg tcctgtcccg gcacgagatt ctgcgtaccg tctacgacga 29160
gctcgacggg cagccgctgc aacggatcat cgagccggcc gagctgagcc tgccctggac 29220
cgactgggga tgggtgtccc cacagcaggt ggacagcatc gtcgccgcgt cggtccgcga 29280
gggcttcgac ctgtcggtgg acctgccgat ccgggcgtac ctgctgcgtc ccgagccgga 29340
cgtggccctg ctcgcggtgg tgatccacca catcgccggc gacggcggct cgctcggccc 29400
cttcacccgg gacctctcgg ccgcctaccg cgcccggctg gccggggtgg cgcccacctg 29460
ggacgagctg ccggtgcagt actccgacta cgcgctctgg cagcgtgagc tgctgggcga 29520
cgagtccgac ccggacagcg tcttctcgac ccagctgcgc tactggcggc aggaactgga 29580
cggcgtctcc cggccggtcg cgctgcccgt cgaccggccg cgtcccgccc gggccagcta 29640
tcgcggcgac aaccacggat tcgagattcc cgcggcgctg ttcgagaagg tcgagcgcct 29700
cgcccagtcg tacaacgtga cggtgcccat ggtctttcag accgcgctgg tggtcctgct 29760
gcaccgcctc ggcggcgacc gcgacatcac gctcggctcg ccgatcgcgg gccgcaccga 29820
ccaggccctc gagaacctcg tgggcttctt cgtcaacacc tgggtgctgc gggtgggggt 29880
gtgcaccggc gactcgttcg cgcaggtcct ggaacaggtc cggcagaagg ccatcgccgc 29940
gtacgaccac caggacctgc cgttcgagcg gctggtggag ctgctgcgac ccgggcgctc 30000
agtcgcgcat caccccctgt tccaggtcac cctcgcctgg cagaacagcg tccgccagga 30060
actcgacctg cccggcgtca cggcctcgat ggagccggtc gccaccggca cggcaaagtt 30120
cgacctgttc gtcaacctga tgccgaacca ttcgcgcagg tcggtgaccg tcgacctgga 30180
atacgccacc gacctgttcg accccgccac cgtcgaggcg atcgcggcac ggtacctgcg 30240
cgtgctggag caggtggtgg agagcccgga cctcggcgtc ggcatcctcg acgtacccgc 30300
gatgccggcg acgcgcggcg agcggacggt cgacgccggc gaacgcgaga agatcctcta 30360
ccgctggaac gacaccgacc gcagctttcc ctgcccggga ccgatccacc tgccgttcga 30420
gcagcaggcc gccgcgcgtc ccgacgcgat cgccgtgcgc tggtcgggcg gcaccatgac 30480
ctaccgcgag ctcaaccggc aggccaaccg gatcgcctgg accctcaagc gccgcggcgt 30540
gcggccggag accgtggtgg gcgtggccgt gcggcgcggc ccgctcatgg tcgccgccgt 30600
cctcggggtg ctcaaggccg gcggagcgta cctgcccatc ggctccacac tgccctccga 30660
ccgggtcgcc ggcatgctgg ccgacgcgtc cgcgacgctg gtgctgacca ccgaggacac 30720
caacaggtgg acgccaccgg atggcgtgga actcctcgac gtcggccggg ccggcctggc 30780
cctgtcgctc gacggcgaga tcaaccccga gccggtggcg agtgccgaca acacggccta 30840
catcatcttc acctcgggaa gcaccggaaa gcccaagggt gtcactgtgg cccaccggcc 30900
ggtgcacaac ctgctgaact ggtgctaccg gaccttcgac ttcggccccg acgatgtgag 30960
tctctgcgtc acctcgctgg acttcgacct ctccgtgttc gacatcttcg gcctgctcgg 31020
ggcaggcggc gggttctaca tcgcggacgc cacccagcag cgcgatccgg agatgctgct 31080
cgacgtcctg ctgtcggagc cgatcacctt ctggaactcg gtgccgggca cgctgaacca 31140
actggccccg ctgctgccgc agaccgccgg cagcccaggg gtgcaggatc tgcgcctggt 31200
ctttttctcc ggcgactaca ccccgctgtc cctgccggac caggtccgcg cggtcttccc 31260
gcacgccgag atcatcagcc tcggcggcgc gaccgaggcg acggtctggt cgaacttctt 31320
cccggtcggc gcgatcgacc cgcagtggcg cagcattccc tacgggcggc ccatcgacaa 31380
cgcgcgctac tacgtcctcg acgagaagct ggagccgtgc gcggtcggtg tggagggcga 31440
cctctacatc ggcgggccgg tgatcgctct cgggtacgtg aaccgtcccg acctgacggc 31500
cgagcggttc atcgccgacc cgttcggcgg ggttcccggt cagcgcatct accgtacggg 31560
cgaccgcgcc agcttcttcc cggacggcaa catctgtttc cttggtcgcg ccgacggcca 31620
ggtgaaggtg cgggggttcc gcatcgaact gggcgagatc gagtacgccc tcggccgcca 31680
cccggcggtg cgccagggta tcgcgatcac ccgccgggac tccgtcggtg acctgcggct 31740
ggtcagctac gtcctgcccg atttggacac ggtggagagc gtggtcgccg ccgacgaaca 31800
ggtccgcgaa tggcaggaga tctacgacca gggctacctg gaggtcaccg accaggattt 31860
cggcgacgac ttcaacctct gggtgtcgag ctacaccggc gagcccatcc cggtcggcca 31920
gatgcgggag tggcaggacg ccgccgtcga ccggatcctc agcttcacgc cgcggcgcgt 31980
actggaggtg ggtgccggaa ccgggctgct gctcgcgcgg gttgcgggca gcgtggaggc 32040
gtactgggcg accgacttct cggagccggt catcgagcgg ctgggccggc aggtgaccga 32100
ggcgggctgg gccgagcggg tacggctgct gtgccgacgc gcggacgacc tggacgggat 32160
cccacggatc ttcgacaccg tagtgctcaa ctcggtcgtg cagtacttcc cgaacgagcg 32220
ctacctggag caggtgctcg acggcgtctg ggcgatgctg gagccaggtg gccggctcgt 32280
gctcggcgac atccgccggg cccgctcgct gcgcgccttc caggtggccg tgcagcaggc 32340
caagcacggc aacctcccgc cggcgcaact gcgcagcgcg gtcgaacagg gcctgctcct 32400
ggagaaggaa ctggtcatcg acccggagtg gttccagcgc tgggccgagc gcgcgggcgc 32460
ggccggcgtc gacgtgcgcc tgaaggaggg cgcgttccag aacgagttga cccgccaccg 32520
ctacgagatc gtggtgcaca agccgggcac aacggaggcg ggccggccct acgcggtgga 32580
taccgtcccg cgcctggagt ggaacggcga cctggacggc ctggccgagc gcatccgcac 32640
gctgggcggg ccggtggtgc gcatcgccgg catccccaac gcgcgcgtcg cgcaggaggt 32700
ggcggcggcg cgcgacctgg ggctggagga gtccgagccg ccgacgtcgg tgccggtgga 32760
cccgcacgag atggcgacct gggccgcccg gcagggctgg tcgatcgcgc tgacctggtc 32820
cggaagcgcc gtcgaccagt ttgaagcagt cctgttcacc gacgctacga ccgagcaccg 32880
ggcactgtcg ggcacctacc tcccggtggc cgccgccggc acctggatca acgacccggc 32940
cgccgcggcg ggcatcaccg cactcccggc ggtcctgcgg gagtacctgt cgaagacgct 33000
gcccgagtac atggtgccat cggcgatcgt gccgatcggc cgggtgccgc tgacgccgaa 33060
cggcaagctg gaccgggcgg cgctgccggt gccggagtac gccgccgcca gtcgcggccg 33120
gccgccgtgt acctccgagg aggagtcgct ctgcgagatc ttcgccggcg ttctcgggct 33180
cgaccgcgtc ggcgtggacg acaacttctt cacgatcggc ggccactcgc ttctggcgac 33240
ccgggtggtg agccggatcc gcgccgcgca cggtgtcgag atcccgatcc ggacgatctt 33300
cgaggcgccg accgtcgccg aactggtggc ccatttgacc ggccagcgga cggtccggcc 33360
gccgctgcgg ccgcagccgc ggccggaccg gctcccggtt tccttcgccc agcaacggct 33420
gtggttcatc caccgcttcg aagggccatc gccgacctac atcattccgc tctccatgcg 33480
tctgcgcgga aaactggacg tgcccgcgtt gcggcaggcg gtgcacgatg tcgtggtccg 33540
gcacgagtcg ctgcgcaccg tcttcgacga ggtggacggg gcaccctacc agcgggtact 33600
cgacccggac gggttggcga tcccgtggca ggagcacgag gtcaccgagt ccgcccttca 33660
ggaggcgctg cgcctggagg cacgtcggcc cttcgacctg gccgcggaga ttccggtacg 33720
cgccgcgctg ttccgcgtcg gcgagcacga cgcggtgctg ctgcttccgc tgcaccacat 33780
cgcggccgac ggctggtcgc tggggccgct ggccgaggat ctgaccgccg cgtacaccgc 33840
caggtgcgac gggcagcgac cgcaatgggc cgcactgccg gtccagtacg ccgactacac 33900
gctgtggcag cgtgaccttc tcggcggcga tgacccacac agtctgtacc ggcggcagtt 33960
ggactactgg acggggcaac tcgccggact gccggaatcg ctgcaactgc cgacggaccg 34020
ggcccgaccc gccgtcgcgt cgttcgccgg cgaggtgctg cccgtagaac tcgacgaatc 34080
gctgaccgag gacctccgca agttggccct gcgtaccggt accaccgtgt cgatggtgct 34140
ccaggcgggt ctcgcggggc tgctcagcaa gctcggcgcc ggtaacgaca taccgatcgg 34200
gtcgccgatc gccgggcgga cggacgaggc gctcaaccga ttggtgggct tcttcgtcaa 34260
cacctgggtg gcgcgcgtcg acaccagcgg aagccccagc ctgatcgagc tggtggaccg 34320
ggtacgggag gtgagcctcg ccgcctacga ccaccaggac atcccgttcg agcacctggt 34380
cgaggcgctg aatccggtgc gctcgaccgc gcatcatccg ctgttccagg tgtgcctggc 34440
ccttcagaac aacgtgcagc cggccttcga cctgcccgga ctgaaggtgt cccacgagcc 34500
ggtcgacatg ggcgtctccc gtttcgacct gttcttgaat ctgatggagg agaccaccgg 34560
cgaggggacg agccggatcg ccggagtcgt cgagtacgcc acggaactgt tcgaccggga 34620
cacggtcacc gggctgctgg agcgctggcg gcgcctgctg cggcagtggg tcggcgctcc 34680
ggacgccccg atcgacgcgg tggagatcct caaccgggac gacctggccg cccttgagcg 34740
ctggaccggt cgcgctcgcg gcaccgatcg tgtcgtcggg acgattcccg agcgtttcgc 34800
cgccgtggtg gccgagcagc cggaggctgt cgccctggtg gccgccgacg gcgaggagag 34860
ctggacgtac ggcgaactcg accggtgggc caaccgcatc gcccaccatc tccacgcgcg 34920
cggcgtcggt cggcagcacc gggtggcgtt ggtcatggag cggtccccgt tgctggtcgc 34980
ggcggtgctg ggcacgctca aggcgggcgc ctgttatgtg ccggtggaac ccacctggcc 35040
gcgggcccgg atcgacctcg tgctcgccga cctcgatccg gccctcgtga tcgacgagcg 35100
gctggccgag gaggacctga ccggctaccc gacgcgcccg ctggacaccg ccgacgtcgg 35160
cggggagcac ctcgcctacc tgatgtacac ctccggctcc acggggacgc cgaaaggtgt 35220
cgaggtgagc catcgcaacg tgctcagtct cgcgctcgac ccgtgctggg ccgatgctga 35280
ccaccagcga gtgctggtgc atgccccgcc gaccttcgac gcatcgacgt acgagatgtg 35340
ggtgccgctg ctgcacggcg gagcggccgt ggtcgcgccg ccgggaaagc tggacgcggc 35400
ccgactggcg acgctcatcg ccgagcgggg cgtaacggcg ctgtggctgc cggcgggcct 35460
gttcgatcta atcacgcagc atcacccgaa gagcttcgtc caggtacgcg aggtgtgggc 35520
cggcggcgac gtactgtccc cggcggccgt gcgacggctg gtacgcgacg acggcacgct 35580
caccgtcgtg aacgggtacg gtcccaccga gaccaccacc ttcgcggccc ggtaccggat 35640
gtccgcaccg gcgcggtgca aggacccctt gccgatcggc gagccgatgg cgggcagccg 35700
cctctacgcc ctcgacgacc ggctccggca ggtgccgcag ggcgtcatcg gcgaactcta 35760
cgtcggtggc gacggggtgg ctcgcgggta cgcgaaccat cccccgctga ccagcgaacg 35820
attcgtcgcc gatcccttcg gacgcccggg cgagcggatg taccgcaccg gtgacctggt 35880
ccggtggaac cacgacgggc aactcgagtt cctgggccgc gtcgacgagc aggtcaagat 35940
ccgcggtttc cgggttgagc cgggagagat ccgagcggcc ctccggaaac gggacggcgt 36000
ggcacaggcg gtggtggtcc cccgtacgga ccgactcggc gagcggcgcc tggtggccta 36060
cgtggttccg gaggtgccgg cgggcgcgga cgaagactcg accgaacatg tcgagaagtg 36120
gcgcgccatc tacgactcga tgtacgacga gaccgaggcc gacgctaccg agatcggcaa 36180
cgacttcacc gggtggaaga gttcctacac gcgcgacaac atcccgctgt ccgagatgcg 36240
ccggtggcgc gactccgtcg tcgaggaggt ccgcggtctg cgggcgcgcc ggatcctgga 36300
gatcggggtc ggttcgggcc tcctgctcgg gccgttggcg ccggaagcgg aggcgtactg 36360
gggcaccgac ttctcgttgc cggtcatcga gcgcctcgag gtgcaggtcg gcaccgatcc 36420
gtgcctgaag gagaaggtgt cgctgcggtg ccagcacgcc gacgtcgccg acggactgcc 36480
ggtgaagtac ttcgacaccg tcatcctgaa ctccgtcgtg cagtactttc cggacgccgc 36540
ctatctctcc cgggtactgg acgtcgccct ggaccggctc gcgccgggtg gccggatcct 36600
cgtcggtgac gtccggaact acggcaccct gcgggagttc ctgacggccg tccatcacgc 36660
gcaacacccg caggacagcg cgtcggccgt ccgggcggcg gtcgagcgtg ccgtcctggc 36720
cgagaaggaa cttgtcatcg atccggattt cttcaccgag tgggcacgga cccggcccga 36780
cgtcgtggcc gtcgacatcc ggctgaagcc gggcgcggac cagaacgaac tcacccggca 36840
ccgttacgag gtcatcctgc acaagcagcc gagccaacca ctgcgcctcg cggacgtgcg 36900
gacggcgaac tggggctcgg aggtgcccga cctgtccggg ctggagaccg cactggcccg 36960
gcacggcggt cgcctccggt tggcccggat cccgaacgcc aggctggtga gcgaggcggt 37020
ccagtgcggc gtgcccacca acgtaggcgg cacgcccctg gacccgcacg agttggcgag 37080
ctggggaggg cagcggggtt actcggtcca ctgcacgtgg tcggcggagg cgcccggctg 37140
gttcgaggcg gtgatcatcc cggtcgacag cgggcactgc cgcgacggtg tgtaccggcc 37200
ggtggggccc cggccacggc agttggtcaa cctgcccgcc gcggcgcgcc gggtgtctcg 37260
gctgccctcg tggctgcgcg aggaactggc ggcggagctg ccggagcacc tggtgccggg 37320
cgacatcgtg gtcatggaac gactgccgtt gaccaccaac gggaagatcg accacagcag 37380
acttccggag gtggagcagg ccgaccggga gtacggctcg ccgcgcacac ccctggaggc 37440
ggaactggcc ggtctcttcg ccgaggtcct cggcgtggac cgggtgggca tcgaggacga 37500
cttcttcgac tgcggcggta gttctctcca ggtcatccgg ctcatctggc ggatccgcgc 37560
ggagctgggc ttcgacattc cggtcagaac catcttccag catccgaccg tggccgaggt 37620
cgcggaacat ctggcggccg gcagggagga cgtcgagttc gacgacccct tctcggtggt 37680
gctaccgatc cggaccgacg gggaccgggc accgatctgg ttggtgccgc cgggtggcgg 37740
actctcctgg gcctatctcg gcttcgccca gcacctggac cgctcgcgcc ccatctacgg 37800
cctccaggcc cgtggatttg tcggagaccc gcgggcgacc tcgatcgaga gcatggtgga 37860
cgactacgtc gaccagatcc tgcgggtcca gccggaaggt ccctacaacg tgctgggttg 37920
gtcgctgggc ggcccgatcg cccaggcggt ggccgccgaa ctccagcgcc gggagtgcga 37980
ggtggatctg ctggccgtcc tcgactcggg tccggcgagc tacttcgccg acttccagac 38040
tcccgacgag aagttggtgc gcaggtacct ggcgcactac atgggccatc tcgcgggaat 38100
ggcggagttc gagtcgctcg tgcagacatc caccaccctg ttcatcgagc acacggacct 38160
gatgacgcaa ttcacgtcgc cgccgttccg tggcgatctg atcttctttg ccgccctcat 38220
cgaccagggc acccgggaac gacggcaact cgaggtggaa ctggacgtcc aatggcggga 38280
atacaccgag gggaccgtgc ggcgcttcga catcgaatgc gcccacaacg aaatgatgtg 38340
gcccgagaac gcggccatga tcagccgtat cgtcaacgag atcatcgatt cggcccgata 38400
accgcttccg ccctgacctg gagcggacgt gacaactacg gaggaaagat gagcgtcaac 38460
ccgttcgatg acgaggacgg cgagttctac gtgctggtca acgacgagga gcagcactcg 38520
ctgtggccca ccttcggtga cgtgcccgac ggctggcgaa tcgtgttcgg gccggccggc 38580
cgagcggaga gcgtggcata cgtggaggag aactggaccg acatgcggcc caagagcctg 38640
cgtgaggcga tgtcggcagc atgacgtacg tcgtgggctc gcaggcagac gcgtccgcct 38700
gcgggcccac gattttgaac ttccgcgacg ccggtggcgg aaggtgcgta cagaagtctt 38760
cacaggatgt ctaggtatag aactgggatg tggcaagccg gagatcgccg ggggagtgat 38820
cagcccgggt caccccgccg gctccgcgtc gcgcgccaga cactttggag gccccatgac 38880
tgttgcgtcg cccaggcaga gccgagaaga cctatcgctc gtcccggaca cccatgacgt 38940
catccgcgtg gtcggggcac gggagaacaa cctcaaggac atccgactgg agatcccgaa 39000
gcgccggctg accgtgttca ccggtgtctc cggctcgggg aagagttccc tggtgttcga 39060
cacgatcgcc gcggagtcac agcggctgat caacgagacc tacagcgcat tcgtgcaagg 39120
gttcatgccc acgctgtcgc gccccgacgt cgacgtgctc gatggcctca ccacggcgat 39180
catcgtcagc caggagcgga tcggcaacaa tccgcgttcc accgtgggca ccgtgacgga 39240
cgccaacgcg atgctgcgca tcctgttcag ccggctcggc gagccacgac tgggctcccc 39300
gcggtcgtac tcgttcaaca ttccctcgat cagcgtcgcg aacgcggtca ccgtcggcca 39360
agggagccgg gcggtcgagg agcaacgcgg cttcgacgtc gccggcggca tgtgcccacg 39420
ctgcgaaggt acggggtcgg tcaacgacgt cgacctcacc cagctctacg acgccacgaa 39480
gtcgctcgac gagggtgcca ttcgggtgcc cggttaccag gtcggcggct acaaccaccg 39540
gctctacgcc ggttccgggc tgctcgaccc cggcaagccc gtcgagaagt acaccgagaa 39600
ggagctcaac gacttcctcc accgggaacc gacccggctg aagatcggcg actaccacac 39660
gaactacgaa gggctggtcg caagggtcca gaagtcgctg ctcaccaagg acatcgaggc 39720
gcttcagccg cacgtacgcg ctttcgtgga gcgtgcggtc acgttcacgg cgtgcccaga 39780
ctgcggcggt acccggctca acgagcaggc ccgggcatcc aggatcaagg gcatcaacat 39840
cgccgacgcc tccgcgatgc agatcaacga cctcgccgaa tgggtccgcg acctggccga 39900
gccatccgtc gcaccgctgc tggccacgct cctgcacacg ctcgactcgt tcgtgggtat 39960
cgggctgggc tacctctccc tcgaccgggc ctccggcaca ctctccggcg gcgaggcaca 40020
gcgggtcaag atgatccgcc acctcgggtc accgctcacc gacgtcacct acgtcttcga 40080
cgagccgacg atcgggcttc acccccacga catccaacgg atgaacaaac tcctgctgcg 40140
gctccgcgac aagggcaaca cggtgctcgt cgtggagcac aagccggaga ccatcgccat 40200
cgccgaccgc gtcgtcgatc tcggtcccgg cgccggcacc gcaggcggca ccatctgctt 40260
cgagggcacc gtcgcggaac tgcgttccgc cgacacgctg accggccgcc atcttgacga 40320
caaggcgtcg ctgaaggaca gggtgcgtac cccgtcgggc tcgctcgagg tccggggcgc 40380
gagcaaacac aacctgcgag acgtcgacgt cgacatcccg ctcggcgtgc tcgtcgtcgt 40440
gaccggcgtg gcaggctccg gcaagagctc actgatcgaa gggtcggtat cgggacgcga 40500
cggcgtggtc acgatcgacc aggggtcgat caagggctcc cgtcgaagca accccgccac 40560
ctacaccggc ctcctcgatc ccatccgcaa ggcgttcgcc aaagccaacg gcgtgaagcc 40620
ggcgctgttc agctcgaatt ccgagggggc ctgtgccacg tgcaagggtg caggcgtcat 40680
ctacaccgac ctggcgatca tggcgggcgc ggcgaccacc tgtgacgact gcgagggcag 40740
gcggttccag gacttcgtgc tccagtaccg tctcggcggt cgcgacatca gcgaggtgct 40800
ggccatgtcc gtggccgagg ccgggcgttt cttcgctgcg ggtcaggcac gtacgcccgc 40860
cgccgtcgtc atcctcgaac ggctcgccga cgtggggctt ggctaccttt ccctcggcca 40920
gccactcccc acactctccg gaggcgagcg gcagcggctc aagctcgccg cgcacctggc 40980
tgacgaaggt ggcatcgtcg tgctcgacga gccgaccacc ggcctgcacc tcgccgacgt 41040
ggagcagtta ctcggtctgc tcgaccggct cgttgacgct ggccggtcgg tcatggtcat 41100
cgagcatcac caggcggtca tggcccacgc cgactggatc atcgacctcg gtccggccgc 41160
cggccacgac ggcggtcgtg tcgtcttcga aggctgcccg gccgacctcg tagccagccg 41220
cgccaccctc accggcgaac acctcgcggc gtacgtaggg gtctgacggc ccgcctgaca 41280
cggtttccgg ccgcctgccg tggcggccgg tcaccgctcg tacaagcacc cgctctgtcg 41340
gcctcggccc acgcgtgcga tggcatccca tggcggtacc cgaccgccgc ctcaggctcc 41400
atcctgccct gaccaggccg ttctccagca cgcggcgatc ggttcgggcc gatccgggta 41460
gcccggcaca ggtgtttctg ctgtccccgt acctgaccga acccagctct tcgtggccct 41520
ggcgaagttc tttcatcctt gtggcatgcg tgttgcgtga ccccatggtc gcgttgagta 41580
ttgggaatcg taattggata tctcgcctgc ggggggatgc ggtgatggag gcgactggcg 41640
ttgcggctgc gcgggtgcga gcaccggccg agccggcccg tcgcgttcgg ggtcgaggtc 41700
gtcatggaca cacagccggg gcgatgccgc cacggatccg tgcccatgac gctctgacag 41760
attcgttgac cgcgacccgt cgccgatggt gacgggagca gggcctttcg cgagatgttt 41820
tgggggattt gcttgtgggc ggtcggaact ccgatgtcgt cttcatccgc tggcccgctc 41880
aggcggacct gagaacccgg tgccggaagg agggagtgcc gcggctgctc gtcgtggagg 41940
gcggtgcgca gccgccgatc agcaatgacc cggtcgagga ctgggtccgg ccgccggtgt 42000
ccaggaacga cctggaggca cgggtcaagg cactacaaca acgcttcaac agccgacggc 42060
tgccgaccat cgactctacc gggacgttga ccttcggccg tcactcgatc gtcatctcca 42120
acacccaggc ggagctgatg cggctgctca tcgaacgctt cggcgaagtc gtgtaccgca 42180
tcgagttcgt gcagtgcctc gccatccgga cgcccgcgct gaacagaaac tcgctcgacc 42240
tgcacatcat gcggctgcgc cgccggctcc taccgatcga cctggcgatc cggaccgtgt 42300
ggggtcgggg ctacatgttg gcgtatgcgg cctccgccga ggccatcatc agaaacgcca 42360
gcggcatgtg atgatgcctg ccgaaaacag ctcaaatcgc cgtaccgtcg agctgaaggt 42420
tgcggtgcgt ggctaccgcc ggtccggcgg aagcagcgag gagcgcgtcc agcgcgccga 42480
gccggccctc gcggacgaac cattcccggc cgtaggctgc ggcgaagcat gaggggtcga 42540
ggtctgccgc cccgacctgg ctggcgtgcg tggccatcgc ggccatcttc gcgagcaaat 42600
cggcaccttc cgcgtcgaca gcgagcgaga tccgggacgc cggcaccccc atgtccgtca 42660
ggtcgccggc agcacgctgc aacacgtgac gtggccccgc gcgcagagct gaggcatcca 42720
cggtggcctg gtatcccgcc agctgaaggc tgcgggtgac cagagcgccc acccggtgca 42780
cctgaacgtg gtccacgtgc cggtagatgc cgccgggatc atagtgaacc agcgtggtcg 42840
caccctcacg gctggcgatc cgggccacct gtcgggcgac cctcgtggcg gacgccgcgc 42900
cgagggtgcc ggcccggtac gggccgccgt gcgcaccgga atcggcgtag cccagcacct 42960
ccaatctggc tacgccgagc aggtcacagg cacgttcgag ttcggcgaga cggcggctgc 43020
gcaaactctc gccgcgtgac aacggcacgt gtggaacacc ggcggcacca tcggtggcca 43080
tgacgaggat cacgcgggcg ccagcgtcgg ccaggcgacg catggtcagc ccggtgaaga 43140
ttgcctcgtc gtccgggtga gcgtgcagga cgatgaccgt gtgcgaggag agcatgatgt 43200
gatccctttt gatcgcggcg gttgagcacg gtcgcgacga cagcgcgtcc gccacgcgct 43260
gcgacgcacc ccgctcgaac cggaagccga agaagccgac gtgtggtgcc cgcgcgatgt 43320
gctgcgcgga gaacggctag gtcatagcta ccgcacccca ctcgcgtggt ggtacgtcac 43380
ggaggtgtct cgtgaactcc cacaagtgac cttcgaggtc acggaccagg tactggcgca 43440
gtccccacgg cttgtcctgc aggggctgca cgatgtcggc acctgccgct gtggagcgca 43500
tgaagtgctc gtcgacgtcg gagacccaga cgatgacctg cttgcaggtg tgcccgccgg 43560
cgcagctgac cgtgtagggc tcgccggtac gccggaccat gacgatccca ccgccggtgt 43620
ccagatcggc gtgtcggatg gtcccgatgg ccggctgccg gagcagcagg cggaacccga 43680
agacccgtac cagccagtcg acagcacgat cggggtccgt gtaggcgagt tcgacgacca 43740
cgtgagggaa gccgcgggcc gggtcgtaca cagagtctcc ttcgttcggc gagcagcttg 43800
ccgacgtcaa cggttcgacg tcaccgtttc gggacagggt cttcggatgt cggaagttct 43860
cgacatccct gtcgaggcag gctacccacg ttttgagaca ccagggcccg cggcgaagca 43920
tctgcgaaag aggtgccaac cgtcccatcg gacgccgccg ctcgcggtgg aggcggtccc 43980
ggccgccagg gactgcaaga cggtccggac gtcacggtgc gtgccggcgt gcagttctga 44040
tccggccgat ctgagggcga cggttgattg gttggcagga atcaagccgg agagtgtcgg 44100
atctggcgga tccagccggt ccgcgacccc tcgcggaacc cgctgttcca ggtgggcctg 44160
caactgctgg gcagcgccac ccagagcacc gagccgaacc tgcccgggct caccgtcacc 44220
tcgctggacg ccaacccggg cgggcacccg ttcgacctgt cgatcacctg caccgagagc 44280
cccgaccagc tgcggctggt cgccgactac tcggtcgacc tgttcgacga gccgcggatg 44340
gcgcggctgc tgcggcacct ggaacgggtg ttgcggaccg ccgtcgacgc ccccgacacc 44400
ccgctgtcgg cgctgccgtt gctcgacgag gaggagcaaa cgctgctgct gcacacctgg 44460
cagggaccgc agggggagcg cgcccgcgaa ccggtgcacg tgcagatcgc gcggctggcc 44520
gccgaacgac ccgacctggt ggcggccacc ctgcacggtg ccgagctgac ctacggcgag 44580
ctggatcgcc gcgccggggt gctggcgcac cggttccggg cgctcggcgt gggccgggac 44640
gacatcgtgg cgttgctgct ggaacggggc ttcgacctga tcgtcggcat ggtcgccgcg 44700
cagaaggccg gcggcgcgtt cgtggtgatg gacccgggcc acccggtacg ccgcatcgag 44760
ttcatcctcg aagacaccgc ggccaaggcg gtggtcaccc gcagcgcgct ggccgaccgg 44820
ctgcccgagg gtgccgccgc cacgccggtg ctcgtcgaca cggagtggga cgagttgtcg 44880
gcggcggccg ccggcgcggc gccgctggac gaactggccg acgagaactc gctggcctac 44940
gtgctctaca cctcgggctc gaccggcaaa cccaagggcg tgatgatcga gcatcacgca 45000
ctgaacacgt tcctgctctg gctcggcaac atcttcgact tcggccccgg cgaccggttg 45060
ctgcaacaca tggcgcccat cttcgacttc gccgagggcg agatcttcac cgcgctgacc 45120
cgtggcgtga cgatggtctt cgtaccggag gaacaccgca ccgacccgga cgtgatcggg 45180
cagctgctgg tctcggagag gatcacctac atcggcggac cgccggccat cctgggccgc 45240
atcccgccgg gcagctatcc cgacctcaag tacatgatcg ccggaggtga ggcggtcacg 45300
ggtgatctca tcaaccgctg gaacaccccg ggtcgccggt tcatcaacgg gtacggaccg 45360
accgaggcgg ccgtcggctg catcttctac gagtgcgagc accgcacctg gatcggccaa 45420
ccgccgatcg ggcgggccat gcccaaccgg gtcgcctacg tgctggaccg gtggaacaac 45480
ctgcaaccgg tgggggtgcc cggtgaggtg atcaccggcg gggagggtct cgcccggggc 45540
tacctcaacc ggccggagtt gaccgccgag aagttcatcg acaacccgta ccggccgggg 45600
gagcggatgt accgcaccgg cgacctgggc gtgtggaccg aggacgggca gatccagttc 45660
ctcggccgca tcgacaccca ggtcaagctc aacgggctgc gcatcgagct ggaggagatc 45720
gagtcgacgc tcaccgcgca tcccggcgtc gccgaggcgg cggtggcgct gcgcgaggac 45780
agccccggca gcaagcgcct ggtcggctac gtggtcccgg ccggcgcggc ggcaccaccg 45840
accgaggaac tgcgcgagca cctgctcgcc gacctgccgc cgtacatggt gccgcacgtc 45900
ttcgtggccc tggacgtgct accgctgacc agcgtcggca aggtggaccg caaccggctc 45960
ccggttcccg aggagaccgg gtcggccgag gtggagctgg tcgcgccgcg caccccggag 46020
gaggagcggg tcgccgagat cttcgccgcg gtgctcggtg tcgagcgggt cggcgccgac 46080
gcgaacttct tcgagctggg cggcaactcg ctgatggcgg cccgggtgct gtcccggatc 46140
gccgaactcg gcggggccag cgcgaccatg cgggacttct acaccaagcc gcgggtcagc 46200
gagatcgcgc agctgctcgc cggaacgccg tcgagcaccg acccggcgac cccgaccgac 46260
gcggcaccgg tggccgacca gacccgggcc cggttggagc aggagatcgc cgacctggaa 46320
cagcggctac gggccgcgcg ggcggccctc gccgggcagg acggtccggt gtccggcggg 46380
cacgagggac agcggctgcc gctgtcaccg acgcaggagc agctgtggtt cctcgaacag 46440
ctcgcacccg gccagccgac ctaccacatc ccggtgccgg tacggctcac cggaccgctc 46500
gacgtcgacc tgctcggtcg ggcgctgacc gccgtggtgg cccgccacga ggcgctgcgc 46560
accacgttcg gcaccgacga cgacaccccg taccaactgg tgtcacccgc cggtgaggtg 46620
ccgctgccgg tgcacgagct ggacgcgacg gcagccgacg accgggagca ggcgctgcgc 46680
gtcgagctgg aacgcgacgc caccgaaccg ttcgacctgg gtcgcgacct gatgctgcgg 46740
gcccggctga tccgcctcga cggccaggag cacgtgctca gcatggtgtt gcaccacatc 46800
tgcgccgacg gctggtcggc cgggctgctg gtgcgtgatc tcgccgagct gtacgacgcg 46860
ttgcggcacg accggcagcc gcagctgccc gccctgcggt tgcagtacgc cgaccacgcg 46920
ctggcgcagc gccggcagct cgacgccggt gacctggagt cgcagttggc gtactgggcg 46980
cggcagctgg ccgacgcgcc catcctggac ctgcccagcg accggccccg cccggccacg 47040
gccaccaacc gtggcgccct gctggtgcgt cggatgcccg ccgacgtgct ggagggcctg 47100
cgccgggtgg cccagcagga gcaggccagc acgtacgcgg tgctgctcgc cggcttcaag 47160
acggtgctga tgcgctacac cggcgtcgac gacgtggtgg tcggcaccgc cggcgccggt 47220
cgcggccgtc cggagctgga ggatctggtc ggtttcttcg tcaacatgct ggccctgcgt 47280
accgacctct ccggcgaccc gagcttcggt gaggcggtcc gccgcaccat gggcaccctg 47340
ctggccgcct gggaccacca ggacgcgccg ttcgagcggg tcgtcgggcg gctcggtcga 47400
cgccgcgacg ccagccgcaa cccggtcttc caggtctcca tcgatctgct cagcggcgac 47460
ttggtggatt tccggttccc cgggctggcc gccgagttcc tcgacgtcga tcccggggtc 47520
tcccgcttcg acatggcgat caacgcgtac gaggagaccg acggcatcac cttccggatc 47580
gagtacgcca cggacctgtt cgacaccgcc cggatcgagg cgatgttcgg ccacctggag 47640
cgggttctgc gggccgccgt ggcggcaccg cagacgccgc tgtcggccct gccactgctc 47700
gacgacaccg agcgaaccga actgctggcg ctggcccagg ggaagcgacg gccccaccgg 47760
ccggcgaccc tgccggagct gttcgcggcg agcgtggccc gcaccccgca ggccaccgcg 47820
gtcatcgccg ccgagggcac gctgagctac gccgaactcg acgagcgcag ccgtcggctc 47880
gccgcgcggc tgcgcgccgc cggagtgggc accggggacg tcgtgccggt gctgctggaa 47940
cgcagcctcg cggaggtggt gagcgtgctg gccgtgctgc gggccggtgc cgcgtacgcg 48000
ccgatggacc cggccgcgcc gccgagccgg ctggccttcc aggtgcgcga caccggcgcc 48060
cgggtggtgg tgggcgaccc gacgcggctc gacacggtgg tcggggtgac catcgtggac 48120
ccggcggcgg agctgccgga ggcggccgac gagccgtggc tggccgagct gacccccgct 48180
tcgctggcgt acgtgctgta cacctccggt tccaccggcg agcccaaggg cgtgctcatc 48240
gagcacggca tggtcgccgg ctacctggag tggatggtgc cggacttcgg cgtcgagcca 48300
cggtcccgga tgatgcactg ctgcgcgccg gtgttcgacc tggccgtcgg tgaactgttc 48360
ggtgccctca ccgccggtgc gaccgtggtg gtggccggtc acgacgacgt gcaccgcccg 48420
ggcgcgttga ccgcgctggc ccgcgagacc ggcgcgacgc acatcttcac cactcccacc 48480
gtgctgggtc tgctcgatcc ggccgaactg ccgcaactgc ggtcggtgat gatggccggc 48540
gagccggcgc cgccgtcgct ggtggccgcc tggcacgtcg acggtcggcg ggtgctcaac 48600
ctgtacggcc cggccgagac cacggtgggc tgcacctggt acgagtgccc ggccggcacc 48660
gcacccgcgg cgacggtacc gatcggtcgt ccgatgccga accggcgggt gtacgtcgtc 48720
gacgacagcg gcgacctggc gccggtcggt gtgcccggtg agctggtcgt cgccggcaac 48780
ggggtggcgc gtggctatct cgaccgaccc gagctgacgg cctcggcgtt cggcgccgac 48840
gagcgggccg gggagggacg ggcgtaccgc accggtgacc tggcccggtg gaaccgggac 48900
ggccagttgg agttcctcgg ccgccgcgac gggcaggtca agctgcgtgg gctgcgggtc 48960
gagctgggcg aggtcgagca tgccctgcgc acggcggccg gcgtgtccgg ggccgccgcg 49020
gcggtgcacg gcacgggcgc cgaggcggtc ctggtcgggt acgtggtcgg cgagttgtcg 49080
gacgacgacg cggaggcgct gcggacgacg ctcgccggga agctgcccgg gtacatggtg 49140
cccaacgtgg tgctgcgcct gccgcagctg ccgctgaccc gtaccggcaa ggtggaccgc 49200
aagcggttgc ccgcgcccga gtccggtgcc gggcaggcgg cgtacgtgcc gcccggcacc 49260
gacgacgagc ggctcatcgc cggggtcttc gccgacctgc tcggtctgga acgggccggc 49320
cgcgaggacg agttcttcct cagcggcggc aactcgctgc aggcgatccg ggcggtgggc 49380
cggctcaacg acgcactcgg tgtgccgctg accgtgcggg acttctacgc ggcaccgacc 49440
gtcgcggccc tggccgagct ggccggacgc cgacgggccg ccgagcaggc ggcgcagtgg 49500
caactgctcg acgagatcga gcagctcagc gacgacgagg tggaacggct gctggcggcg 49560
gactgatcgc cggtcgcgtc cgcgggcccc gccgccgtgc gcggcggggc cggcggtgtc 49620
ctgaaaggag tgagatgtcc gacgagacct tcgacggcag ggtagcccga ctggacgagc 49680
gccggcggct gctgctggaa cggatgcggc aacagcgccg gcagccaccg gcgacgatcg 49740
gcgcccgccc ggccggcgac gagcgggtgc cgctgtcgcg ggcccaggaa cagttgtggt 49800
tcctcgccca gctcgcgccg gccgagccga cgtacaacct ggtgcaggcc tcgtacctga 49860
ccggcgaggt ggaccccgcc gcgctgcggc gggcgttgga cggcgtggtc gcccagcacg 49920
aggcgttgcg cacggtcgtg gagagcgtcg acggcgtggc gtaccagcgg gtgctgccgc 49980
cggggccggc cagcctggtc gtcgacgacg tgtcccggct gcccgaggag cagcgccggc 50040
cggcggcgct caccctgctc cagcagcagg aggtgcaccg cccgttcgac ctggccaccg 50100
gcccgttgtt ccgggcccgg ctggtccggc tcggtcccac cgagcacgct ctcgccgtcg 50160
cggcgcacca catcgtggtc gacggctggt cgatgggcct gatcctgcgg gagctggccg 50220
ccgcgtacga cgccgaccgg cacggcacgc gagcgcggct ggacccgccc gccctccagt 50280
acccggactt cgcccgctgg cagcatcagc agctggccac cgccgaactg gacaaccacc 50340
tgaggtactg ggcgcagcgg ctggccgacc tgcccaccct ggaactgccg gccgaccgac 50400
cccggccgac caccgcgtcg ttccggggtg cgctgctgga gcaaccactg gatccgcagc 50460
tgcacgccgg ggtgcaggcg ttggccaagg agaccggcgc gagcccgttc atggtgctgg 50520
tggcggcctt cgcggccatg ctcgcccgct acaccggcac cgacgacctg gccgtcggca 50580
ccaccttcag cgggcgcagt cgtccggagc tggagagtgt ggtcgggttc ttcgccaaca 50640
tgggggtgct gcgtctggac acctcgggcg accccagttt cgccaccctg gtcgaccggg 50700
cccgggacac ctgcctgggc gcgtgggagc accaggacgc cccgttcgag cgggtggtgc 50760
agcgactcgc cccaccccgc gacccgggcc gcaacccgct gttccaggtg gccgtgcagc 50820
tgctggacgg ctccacctgg ggcggaccga cgctgcccgg caccgacagc accccggtcg 50880
acctgcggct ggaccggtcc cgcttcgaca tgatggtcag cctcgtcgac cacggcgacc 50940
ggtactcggt gctcaccgag tactccaccg acctgttcga cgcccggcgg gtacgcgcca 51000
tgctcgacca cgtcgcccgg ctgctcgacg cgggcctggc cgacccggct acgacgctgt 51060
cgcggttgcc gatgctcgac cccgccgaac gcgagcgggt cctggccctc ggcgcgggtg 51120
aacgacgtga cgtggcccct gccaccgtcc accagctggt ccgggcgcag gccgaacgca 51180
accccgacgc ggtggccgtc cggcacggcg atcacgagct gacctaccgg gagctgctgg 51240
accgggccgc gcggcgggcg gccggcctgc gcgacgcggg cctgcgaccc ggcgatcggg 51300
tgccggcgct gctggaccgg ggcgtcgacg aggtgctgac gccgatggcg atctggcacg 51360
ccggtggggt gtacgtgccg ctggacaccg ccgccccgcc gaaccggctg cgccggatcc 51420
tgaccaactg tgccgcccgg ctcgtgctca cccgcaccga gcacgccgcc ggggtgccgg 51480
agggcccgtg gcggaccctc ctgctcgaca ccggcgacct ggactccgcc gccgggctcg 51540
ccccggaacc gtccaccggc ccggacgacc tggcgtacgt gctgcacacc tcgggcacga 51600
cgggtgaccc gaagggtgtc cagctgccgc accggggttt cgtcacctac ctggactgga 51660
tgcgcgacca gtggcgctgc gggcccggtg accgggtgtt gcacggctgc gcgccggtgt 51720
tcgacctggc ggcgggtgag gtgctggcgg cgctcacctc cggcgccacg gtggtggtga 51780
tcggcaagga ccggctgctc tcgccgggcg gtctcgccga ggtcctggcg gccgaacgga 51840
tcacgcacct gttcctgacc ccgaccacgc tcggtctggt cgaggacgac accgaccggt 51900
tcgacgcgtt gcgggaggtg ctggtcggtg gcgaggtctg ccccgccgac ctggtggccc 51960
ggtgggcgcg cccggggcgg cgtcggttcg tcaacctgta cggcccgacc gaggccaccg 52020
tgggctgcct cgcccacgac tgcacggact ggtcggcggc caccccaccg ccgatcggcg 52080
cgacgatgcc gaaccgccgc acctacctgg tcgaccgctg ggacaacccg gtcccggtcg 52140
gggtgccggg ggagatcctg gtcggtggcg cggcgctgag caccggctac ctcaacgacg 52200
acgagctgac cggacgccgg ttcaccgcgg atccgttcga tccgcaggga cgggtctacc 52260
gcaccggcga tcgtggtcac tgggacgcgc agggccggct gcacttcggc ggccggctgg 52320
acggccaggt caagttgcgc ggcctacgcg tcgaactcga cgagatcgag gcactgctga 52380
gccggcactc cggggtggcc cgcgccgccg tgaccgtggt ccgcgacggc aacggggtgc 52440
agcggctcgt cgggtacgtg gtggacgccg ccgagccggc cagcgacgcg gacctgcgca 52500
cgcacctgag cacggagctg cccgcccacc tggtgcccgg ccggttcgtc cgactgcccg 52560
ccctgccgtt gaccaccagc ggcaaggtca accggcgggc gctgccggca ccggaggcgg 52620
cggacaccga cgacaccggc gcggccccca ccaccggggc cgagcgccag gtcgcggaga 52680
tcttcgcgga ggtgctgggg gtggcgcggg tgggcgcgga gacgtccttc ttcgacctcg 52740
gcgggcactc gttgcaggcg gcgcacgtgc tggcccgcat cgccggacgg atcggcacgt 52800
cggtgtcgct caagcagttc tacgccaccc cgaccgtccg ggcggtggcc cggttcgtcg 52860
agcacgggcc ggtggtggac gcctcgccac tcgtcacgct caaggccacc ggttcgcggc 52920
cccggctcta ctgcccgcac gcggtctccg gctcgccgta ctggtacctc ccgctgagcc 52980
gggccctgca tccggagcag ccggtggacg gcttcgaggc gccggggctg gagggtggca 53040
tcgagccggt cgacgacctg gtgacgctcg ccgggcggta cgtcggcgcg ctgcgcgaac 53100
ggcagccgca cgggccgtac ctgctcgccg gctggtcgat ggggggcttc ctctgcttcg 53160
agatggcccg acagctcgcc gccgtgggtg ccgcaccgga cctcgtggtg atgatcgact 53220
ccaatgaacc cggcccgttg ccgctgccga gcgagcgaca ggtgatggag accttcgtcg 53280
ccgacctggc cgggctctcc gcggcaccgg caccgccgct ggacgccgag gtggtcgacg 53340
cggccgaccc gatcgcggcg ctcaccgggt tcctggtccg gcacggactg atcccgtcgg 53400
acgtgcgggc cgacttcgtc gccaaccggt acgcggtgtt ccgcgccaac atgcgggcca 53460
tctacggcta ccaaccggca ccgtacgccg gccggacggt gctggtgcag gcggagcggg 53520
aggccagccg cgcggcgtgg cgccggtgga gtccggcgat ggaggtggtg acgctgccgg 53580
gcgaccacta ctcgatgtgg tccccgcagc acctgcccgc gctggcagcc ctcatcgacg 53640
accaggtggc acgggtgctc gacctcggct gaccggcacc ggggcccgcc cagaccatcg 53700
gctgggcggg ccccggacga gcatcgtcac cggcggcgag cctggtcacc tcggcgcgga 53760
acgcgctccg gtcggcgcgg acgactcctc gaccgggccc gttgccggct cgacgtcgac 53820
ctcaccgggg ggtgcgttgc ccggcgccgc cacggcctcg acctgctcgg cggcgtcgcc 53880
gctcggcgcc gtctcagccg acacccgggt ggacagccgc caggtccggt aggccagcag 53940
gaatcccagc atcagcagac cggcgtcgac ccagaggctg cggctcaacc ccagcgcgga 54000
acggctcggg tcgttctcgg cggtcgccag gtagacgccg ccgacgacga ccacgctcac 54060
cacgctggcc agcagcgttc cggtcgagac cagggccgac agggcggcgg cgtagcgggg 54120
gcccacggtc gcggccgtct gctccacgag cgtgctgaaa ccggccgcca tccccgcacc 54180
ggcgagcagc agcagcgccg acaccaccgc gatcggccag ccgccggcca ccacgaccgc 54240
gagtgcggcc agggccaggg cgaacaccag caggccggcg accggcagcg ggcggtggaa 54300
acgtttcggc agccgtgtcc aggtgaggct gacggccgcg aaacccacgg ggtacgggat 54360
gaacatcaac ccggcctgca acggtgtgta gcccagcccg ttctgcacgt gcagggtgag 54420
cggaaacagc accccggcga aggcgaagtt gaggatgcag caggccagca gtcccgactt 54480
gacgcctcgc ggtcgcagcg catcgatctc cagcaccggc tgtccgcccc gggcgcccag 54540
ccgcagctcg taccggacga agaggacgag cccggccgtg ccggcggcga tgctggccag 54600
tgcccacgcg ggccagccct gttcccgccc gaagaccagc ggtgccacca ccgcgcccat 54660
cgagacggcg agcagcagga tgccgacgat gtcgggccgg aaccgcgagc tgggcgtgtg 54720
ccccggcaga taacgcggcg ccgccgccag cagggccagc ccgatcggca cgttgaccag 54780
gaacgcggcc ctccagccgc tgcccagcac gtcggcgctg acgatcacgc cgccggcgat 54840
ctgaccggcg gccactccga gcgccagcac catcgagtag agcccgatgg cgcgggcccg 54900
ggccgacccg gtgaagacga tctggatcac cgagagcacc tgcggcacca tcatggcccc 54960
gaacgccccc tgcagcaggc gggcggcgac cagcgtgccc gcggtcgggg cgatcccgca 55020
gagcagcgag ctggcggtga agccggtcag cccgatcatg aacagccgcc ggtgccccac 55080
gtcgccgccg agtcgcgcgc cggtgaccac gagcaccgcg aacatgagcg tgtatccgga 55140
caggatcagt tgcagaacgg cgccggaggt ctggaggtca tccttgatgg tcttggtggc 55200
cacggcgacg atggagttgt ccatcgtcgc catgacctgt gccaccagga ggatgagcag 55260
caccagccgg gcgccccgtg gtcgaccttc gtcctcagtg gccatcgaca ctcctcgctc 55320
tttctggttg tcacgcccgt tgccgtggta gaggcttccg tgccgacagt ggttgcgcaa 55380
ctacgtgcgg ctgggtgtcg cgggcgtgcg ggcatcccgc ggatcgtcgt cgtcggagac 55440
cgccggtcgg gtcgccggca caacgttgcc ggtcgccgac cacgccaccg acgccgggct 55500
ttcggtgtcg gtggggccgg tgcctggcgc gggaccggtc cgggacaccg gcacagtgcc 55560
gacgccgcga cgcgcgagcg gcccgaccga ggcacccaac tccggcccga acaccagcag 55620
caggacggtg gcggccaggc acagcacacc cagtgcgatg gccggcgcga cgagcccgcc 55680
gccgagggag agaatcagca gcatggcgga cggtccgagg atgccaccga ccttcgtggc 55740
cgccccggcg aagccggagc cggtggcccg catcgcggtc gggtagatct cggcgctgta 55800
cggcagcagc atcgcgttga ccgcggacaa cgacagcacc agcaggccga tggaggccag 55860
cagcagcacc gtcccgccgc tgtcggtggt ccagagggcc actccgccga gcccgaccgc 55920
ggttatcgcg atgaacagcg ccagcgcgcg gcggccgctc caggccgcgt agagcagcac 55980
gaccagcgcg agggccgggg tggagtagag cgccgagtcg gccagcagcc cgctcgcgac 56040
accgccggcc aggcccgcct cgcgcagctg cgcgggcagc atcaccagga agccgaagtt 56100
caccaggccc cagacgacac cgaccacgcc gatcaccgat gtcacgaccg gatacgcccg 56160
cagcatcgcc cccacgccgg gacgcgtcgc ggcggcggca gtgtcggcgg ccgggggcgt 56220
ggcacccagg tgggacccgt agcggcggag caccgcctcc gcctcggtac gccgcccggc 56280
gcgcagcagg tacagcggcg actcggggat caacggcgcc atcagcagca gcagcagtcc 56340
ggagggcagc ccgatcaacc agagtgcgcg ccaggtcagc gccggctcca ggtggcgtgc 56400
cgcctcgctg gccgccaggt aaccgccgag gccaccgatc ccaccgacgg tcaccgccac 56460
ccagccgcgg tgccggcgtg gggtcagctc ggcgatcagc gtgaacacca ggggcaacag 56520
gccaccggcg gaggtgccca tcgtgaagca catgacgagg ttccactcga aggtgggcat 56580
ggccccgcac gccgaggtcg cgatgaacag cagggtggcc aggagcaggg cggtccgtcg 56640
accgtaccgg tcgccgagca ggccccagac gaccgacccg accgcggtgc cggtgagggc 56700
caccaggggc aggatcgaga ccgattcgag ggacatgccg tactcgtcgc tcatgccggg 56760
catgacgaag ccgagggtca gcggcttcat gatgtcgacc accagggcga tggtcagcac 56820
cgcgcaggtg atccagtacg cgggtcgcag ccgcccgtgc tcgatcgact ccacggtgac 56880
gctcgcggag tccggtcggc ggacccccgc gaacagcgcc cgcccggcca ccaccaggcc 56940
gacgacgagc agcagcatgc cgaggatcat cgtcggcgtc cacatgtcca tcggctcgcc 57000
ggggctcatg ccctccatgc ccggcatgct gtccatgtcg tccatgtcgt ccatgccgtc 57060
catgccgggc tcggccgacc ccatccgggc atggtcgatc atcatcttca cgtcgggcag 57120
ttggaacagc acgccggccg tcaccaacgc cacgccgagc aggaatccga gtgtcccgcg 57180
gcgtttcgcg gatgctgtgt cggcagtgcg ggattcggac atggttgacc gacctccgag 57240
ctgtcgcgag acgagaagaa cgtcggcgaa ttggcgacca ccgaaatcta caagggtgct 57300
tcccgggtga caaccgtcaa ttatatgact catttcggta agtggttatg aattgctgcc 57360
tccgggtggc tcaccctgtt tgctaccgat ttggtgggct ctgatcggtc agtcagtcga 57420
cgagcgttgc ccgatcgccc cgtgggatgt taggctcacc ctaagtgatc aactggcggt 57480
cgccggtgct gtccaatggt ccgcttacca cagcttttcg gcaggtcagt gccgttatgg 57540
cggatcgttg gtcgcgggtg acgcgcaccg cgtcgtcgga tccgccgggc ggtggcgctg 57600
tccgcgccag gccggcacgg cgcagcggct gacccgactt cagcaattaa ccgagcgtat 57660
tcttcagtga attgctggca atctctccgt aacgctccgg gccgcacgga aatgctaggg 57720
tcgggagcga tgcccgccgc ccatcgcctt tcgactgagg tcgacggcgg gctggatcgg 57780
gcgtgagctg cgccgtttct cgaatcgcta tccgaccatc cgtacgcgac cgcgaccccg 57840
gcacgcgccg accggcccgg atcgatcccc tcggtcactg tcggtgccgc agatgtgccc 57900
catgtggacc ggtcggcccg atccggcccg tgttgtgcca gcatggacta catgaccatc 57960
cagtccgacc cgatggcgtc gacggacgag gtacgcggtg agccggccga cgagttcgtc 58020
ggcgccctcg tctcgctgag ccgggtcatg gtggccgtcg ccatgcggac gctggcgcgc 58080
atcgacgccg acgtgacgct ccagcagttc cggacgctcg tggtgctggt gcccggcccg 58140
cagcgggtga tcgacctggc gaagctgctc ggcgtgcagt cgtcgaccgc cacccggatg 58200
tgcgaccgac tggtccgcaa ggggctggtg gcacggcacg agcgggtggc ggaccgtcgg 58260
gctgcctggg tcgggctgac cgtcgccggc aaggaactcg tcggcctggg catgcgagcc 58320
cgacaacagg aactggagcg gatgctggcc gacctgcgac ccgacgacac cgacgtcacc 58380
accggcgcgc tggtggcggt actgcgcgcc accggtgagc tcaccgacgg tgcctggtgg 58440
cggcagtggg cggattcggt ggtggagtga cgcaacgccg tcggtcccga gtggccggcg 58500
cagccggggc cggccgtcgg cgcggctggg gtcagacggt gacgcggctg gccgcacggc 58560
ggcgggccat gggcatcgac ggcacctcgg cggccggacg cggtaggtcg gacggtgtca 58620
cgtcgaccgg cgacacgccg gccgagacgg cgtcctgcga cgccgcgttc cggagttgat 58680
cgagggcggc gtcgaggctg tcgaagatcg ggaaaacccc gtcgagcttc atcgtgtgca 58740
gcacggtgcg gatgaacctc gacggcgcgg cgaggcacag ccgcccgcca cgctcgcgta 58800
cgtcgcgatg cgcccggacg agcatgccca gcccgagcga gtcgatgacc tgcacctggg 58860
tcaggtccac caccaccgtc ccggccacgt cgaacgcgcc gcgcagcgcg gcccgcagcg 58920
cgtcgccggt gtcctggtct ccgccgtcgg cgggcaccac caccgccgcc tcggcgaggc 58980
ccgatccagc ccggtcgccg tcaccgaggg agctgcccgg cggcagcgcg ctgcaccggg 59040
ggcagcggtg cgggccggtg gcgaacggcg acccgctcca cccgtggtcg gagaccagcg 59100
tccagacgac ctcggcgtcg ggcagcacgc aggcggtgcc ggtggtggtg tcaccacaga 59160
cgtcgcagat cagggtcatc aggttgtcgt ccggtacgac ggtcatcctg cttcctctcc 59220
ggtgccgcgg ccggtcggcc gcggtgcggg actcggggcg ggggcgggtg aggcaccctc 59280
gccgtacgga ctcctcacag ggagtcggag cgttccttgc cggtggtggc gaccacgatc 59340
accaccgcga ccgcggcgag cccggcctgc acgaccaggc ccaggatgct gaacccctga 59400
acgccggcga gccaggcggt gatggcaccg agcaacgagg cgacggcacc gatggtcatg 59460
gtgagccaca gcggcgcagc cggacggccg ggcaggacca gtcggccgag cgcgccgacg 59520
gcgaggccga cggcgagggc cgtgacgatc ccggcgctgg tcatgctgct cctcgtgctc 59580
gcggtcagat gcgtcggctg cggtgtgtca ggtgcgcacg gtgacggcgg cgcggccgta 59640
cgcggcagcg cgcgggaccg tacccggtgc cggtgtcccg tcggccggcg ggacacccgg 59700
tgcggcggtg accgcctcgg tgaccggggc cgaggcggcg tcggtgtgca ccggcaggat 59760
ctggtccagc cgggcggtct gcaggatgcg ggtgatgcgc gggttcgggt tgcggacggc 59820
cagcacgccc ccggcacgga ccatccggcg gtgcacgtcg agcagtagac cgatggcggc 59880
ggcgtcgatg tgccggcaac ccgccaggtc gatcacgacc tgaccgggac gcagggccag 59940
gagctgatcg aggaccgcgc cggtctccgg caggcagctc agatcgaact cggtgatgga 60000
cacctccacc agcggcaccg aacactcggg gcgtcgtggt gcggtcacgg ccaaggcccc 60060
ctctcctgcg gtctccgagt ggctctcacc ctgcccagcg gggttggcgg ccaccgcgcg 60120
gacggatgac agttgcgtga caaaaccccc ggttgtcgat cgtggttggc ccggcggtca 60180
gggcttgggg atgattccgg tatgacagcg gtactggtga tcgaggacga cgaccggatc 60240
cggttggcgt tgctgctcgc tctggaggac gagggctacg aggcccgggg agcggccacc 60300
gccgaggagg ggctgcgtac gcaacgccgg gatcccgccg actacgtcct ggtcgacctg 60360
atgctgcccg gcatcgacgg cttcgagggc atccgccagt tgcgccgcga cgacgacgtg 60420
ccgatcgtcg tggtcagcgc ccgcgacgac actcacgaca tcgtcgccgc cctcgaggcc 60480
ggcgccgacg actacgtggt caagccggtg gcgatcaagg aactgaccgc tcggctgcgc 60540
gccctgcgcc gacgcgggcg caccacgacc gcgtcggacg gcccgcagcc ggtgccggtg 60600
ctcgccttcg gtgaccttga ggtgagcccc gaggcggggg aggtgcgccg cgccggtgag 60660
ccggtcgcgg tcacccgcac cgagttccgg ctgctgtgcg agctggccga acacgccggc 60720
cgggtgctct cccggcagca gctgctcagc cgggtctggg ggtacgacag cggcgacgaa 60780
cggcttgtcg acgtgcacgt cggtcggctg cgccagaaga tcgaagccga tccggccaac 60840
ccccgacatt tggtgacgct gcgcgggctg ggttacaaac tgcaacgatg agacgcctcg 60900
gactgcgtgc ccgggtcacc gccgcgttcg cggtcggtgc gttgctgctg tccgcctcga 60960
tggccctggt gtcgtacgag ctgacccgcc gcaccctgct cgacgagcgg gaacgcaccg 61020
tgctgcgggc ggcgtactac gacgcggcgg tggtccgcgc cgggctcgac accgacaacc 61080
cggacgtcgc ggaggcgttg cgggcgttgg acaccggcac cggacggcga cccctggtgc 61140
tgctcgacgg cgagtggtac gcccgcagcg ccgacaacgg gctcaccacg atcgttccgg 61200
cccggcttca ggacctggtc gcggcggggg agccggcggt gcagcgggtg cgcgtcaacg 61260
acaccccggt gatgctggtc ggtgtgccgc tgtccgagtc gaccgccttc tacgagatcg 61320
cctcgctgcg ggaactggaa cagaccttcc aggtgctggc gctggcgctc accgcggtcg 61380
cgatcatgat cgccgggtcc ggggcggccc tcggctggta cgccacccgg cacgggctgc 61440
gtccgctgac cgccgtcgcc gacgccgccg agcggatcgc ggccggcgac ttcaccaccc 61500
gcctcgcccc cgacaccgac ccggacctga cccgtctgtc cacctccttc aaccggatgg 61560
tcgacgagtt ggccgggcgg atcgaccggg accggcgttt cgccgccgac gtcagtcacg 61620
aactgcggtc gccgttgcag accctcgccg ccgccgcgag tgtgctgtcc cggcgccggg 61680
agaaccagga cgagcggacc gccaccgcgg cccggctcgt cgccgacgag atcgaccgtt 61740
tccagcaact ggtgaacgac ctgctggacc tggcccgtgg tgaccagccg gtgcaccggg 61800
agtcggtgga cctgcccgag ctggcccggc aggcgtgccg ggaccgggac ctgccggagt 61860
cgatggtgca gttggcaacg gggacaccgc ccgggtggcg ggtggaccgt cgccgggtcg 61920
cccaggtgtt ggccaacctg ctggacaacg ccgagcggta cggtgcggga ccggtcgcgg 61980
tgcggctgtc ccacgacgcg gacacgggcg tgatcgaggt cgacgacgag ggcccgggag 62040
tgccgatgga ggaccgcgag gcgatcttcg accgtttcgt ccgggggcgg gcggccaact 62100
accgtggtgg cggcgacggc accggcctgg gcctggccct ggtggcccag cacgccgccg 62160
cgcacggcgg agacgcgtcg gtcagcgacc gcccggaggg cggtgcccgg ttccgggtca 62220
ccctgccggg gagcctgtca tgacccgccc cggcaccggc cgggccgcgc ggacggtcgg 62280
ggtcgcggcg ctcgtcaccg tgttcgccct gctcggcgcg tgcggggtgc ccgccgagga 62340
tcgaccccgc gcggtgacgc cgccgccggt gccgttcccg gcgaccgcct cggccgcgcc 62400
gacggcggcg gagaccggcg cggtgaccga ggtgctctac ttcgcccgcg acgaacgcct 62460
ggtgccggtg atccgccggg ccgaccaggt gcccgcactc gacgcgcagc tgcgggcgct 62520
gctcgccggg ccgaccccga ccgagcgtga cgacgggctg accagtgccc tgccgggagc 62580
cttcaccagc gcggtggtcg agctggtcga cgggttggcc cgggtcaccg tcgggctgac 62640
ggcggtggac accggccgca gcgacggccg gctggcgtac ggtcagatcg tctgcacgct 62700
caccgcccgc accgatgtca cggcggtgct gttcctggaa ggcggcacgc cgctgagcgt 62760
cccccgggcg gacggctcgc tgtcgtcggg accgctcacc gctgccgact acgccgtgtt 62820
gatcaatcct cgttgacgag ggccggacca cccgacgcac gcgcagcgcg acgactcgta 62880
tcctttccgc gaaccgtcgt gccgacgacc ggaaaggact tggtgtgaac gaccgggccg 62940
agacgttgga gttccaggcc gaagcgcgtc agctgctccg gctgatggtc cactcgatct 63000
actcgaacaa ggacgtcttc ctccgcgagt tgatctcgaa cgcctcagac gcgctggaca 63060
agctgcgcct ggcgtcgatg gtcgacaagg acctcgccgt cgacaccggc gacctgcaca 63120
tcgccatcga ggtcgaccgg gacgcccgca ccctcaccgt gcgggacaac ggcatcggca 63180
tgagccgcga cgaggtggtc tccgtcatcg gcaccatcgc caagtccggc accgcggagc 63240
tgctgcggca gctgcgggag gccaaggacg ccggcgcctc acaggagctg atcggtcagt 63300
tcggcgtcgg cttctacgcc gcgttcatgg tcgccgagcg ggtcgagctg gtcacccgac 63360
gggccggcga gaccggtggt acccgctggg agtccaccgg cgagggcacc tacaccatca 63420
ccgagctgga cgacgccccc cagggcacgg cggtgaccct gcacctcaag cccgccgacg 63480
ccgaggacaa cctgcacgac tacaccgccg aatggacgat ccgggggatc gtcaagcggt 63540
actccgactt catcgcccac ccgatccgga tgaccgtcga gcggcccggc accgacgacg 63600
cccccgccac caccgaggcg gtgacgctca actcgatgaa ggcgctgtgg gcccgcccgc 63660
gcggtgaggt cgagcccgcc gagtaccacg agttctacaa gcacgtcagc cacgactggg 63720
cggacccgct ggagaccatc cacatgcggg gggaggggac cttcgagtac gaggcgctgc 63780
tgttcatccc cacccacgcg ccgctggacc tgttctcccc ccagggccgc cgaggggtgc 63840
agctctacgt caagcgcgtg ttcatcatgg acgactgcga cgcgctgatg cccaactacc 63900
tgcggttcgt caagggtgtg gtggacgccc acgacctgtc gctgaacatc tcccgggaga 63960
tcctccagca ggaccgccag atccgcgccg tccgccgtcg cctggtcaag aagatcctcg 64020
ccacggtcaa ggatctcaag accggccagc cggagcgcta ccgcaccttc tggaccgagt 64080
tcgggacggt ggtcaaggaa ggtctgctgg aggacaccga caaccgggac accctgctgg 64140
agatcctctc ggtggcctcc accaacgacc cggccgagca gaccgacctg gccggctacg 64200
tggaacgcat gcgcgagggc cagcaggaca tctactacgc caccggcgag aaccggagca 64260
ccatcgagaa ctccccgcac attgaggcgt tccgcgccaa gggctacgag gtgctgctgc 64320
taaccgaccc ggtcgacgag gtttgggtgg agcgggtcgg cagctacgcg ggcaagacgc 64380
tgcgctcggt cgccaagggg caggtcgacc tggacaccga gcaggagcgc accgaggccg 64440
aagccgaacg ggagcggcag cgcaccgagt acgccgacct gctcggctgg atgggcgagg 64500
tgttggccga caacgtcaag gaggtccggc tgtcgtcgcg gctgaccacc tcgccggcct 64560
gcgtggtcgg cgacgcgcac gacctcacgc ccaccctgga gaagatgtac cgcgcgatgg 64620
ggcaggaggt gccgaaggtc aagcggatcc 64650
<210> 2
<211> 178
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF1 Protein
<400> 2
Ile Pro Ser Arg Glu Trp Gln Pro His Ser Cys Gly Pro Gly Ala Lys
1 5 10 15
Gly Pro Arg Glu Tyr Leu Trp Ala Trp Ile Thr Thr Ala Thr Ser Ala
20 25 30
Gly Glu His Arg Trp Leu Leu Met Arg Arg Asn Arg Ser Thr Gly Glu
35 40 45
Leu Ala Phe Tyr Leu Cys Trp Ser Pro Arg Pro Ala Pro Leu His Thr
50 55 60
Leu Val Thr Val Ala Gly Ser Arg Trp Ser Ile Glu Glu Leu Phe Gln
65 70 75 80
Ser Gly Lys Gly Gln Val Gly Leu Asp His Tyr Gln Val Arg Gly Trp
85 90 95
Thr Gly Trp His Arg His Val Thr Leu Ala Met Leu Ala Leu Ala Val
100 105 110
Leu Thr Ile Leu Ala Ala Arg Gln Pro Asp Pro Asp Pro Glu Ile Ile
115 120 125
Ala Leu Thr Val Ala Glu Ile Arg Gly Leu Leu Asn Ala Phe Val Leu
130 135 140
Ala Val Thr Leu Pro Pro Ala His Thr Leu His Trp Ser Thr Trp Arg
145 150 155 160
Arg Thr Ser Gln Ala Arg Ala Arg Arg Ala His Tyr Gln Arg Arg Gln
165 170 175
Ala Lys
<210> 3
<211> 46
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF2 Protein
<400> 3
Met Arg Ser Cys Gly Arg Arg Leu Ala Arg Val Thr Arg Ile Gly Asn
5 10 15
Pro Arg Gln Gly Leu Gln Ala Pro Arg Gly Gln Gln Ser Val Ser Arg
20 25 30
Ala Gly Arg Gly Met Leu Thr Gly Tyr Val Asp Gln Arg Arg
35 40 45
<210> 4
<211> 205
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio3 Protein
<400> 4
Met Ser Val Ser Gly Ser Arg Arg Ser Glu Gly Ser Tyr Arg Arg Ser
5 10 15
Gly Gly Cys Ala Gln Gly Arg Ser Pro Arg Pro Ala Arg Glu Asp Val
20 25 30
Lys Phe Val Arg Trp Pro Ala Glu Arg His Leu Arg Asp Leu Cys Arg
35 40 45
Gln Glu Arg Ile Pro Cys Leu Leu Val Val Glu Gly Gly Ala Glu Pro
50 55 60
Pro Val Cys Ser Asp Pro Arg Glu Asp Trp Val Arg Thr Pro Ile Ser
65 70 75 80
Pro Ser Asp Leu Asp Ala Arg Val Thr Ala Leu Arg Gln Arg Ser His
85 90 95
Asp Arg Arg Thr Pro Val Leu Asp Pro Ala Gly Thr Leu Ser Phe Arg
100 105 110
Thr Ala Ser Val Val Met Ser Ser Thr His Leu Glu Leu Met Asp Leu
115 120 125
Phe Val Glu Arg Phe Gly Gln Val Val Tyr Arg Trp Glu Leu Met Thr
130 135 140
Ile Leu Thr Lys Arg Asp Ser Thr Ser Thr Arg Asn Ala Leu Asp Leu
145 150 155 160
His Ile Met Arg Met Arg Lys Arg Ile Ala Pro Leu Asp Leu Asp Ile
165 170 175
Val Thr Ala Trp Gly Arg Gly Tyr Ala Leu Glu Glu Lys Ser Ser Trp
180 185 190
Ala Ala Val Ala Ser Lys Pro Ala Ala Val Asp His Cys
195 200 205
<210> 5
<211> 223
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio4 Protein
<400> 5
Met Ser Ala Gly Ser Arg Ser Ser Arg Asn Ala Val Ala Ala Leu Arg
5 10 15
Val Val Pro Ala Ala Thr Ala Gly Val Pro Lys Gln Arg Pro Ala Glu
20 25 30
Pro Ala Gln Val Met Leu Thr Arg Val Gly Leu Arg Leu Pro Glu Arg
35 40 45
Met Ser Phe Glu His Trp Glu Arg Thr Gly Ala Gln Leu Ser Gly Ile
50 55 60
Val Asp Ser Ser Ser Trp Cys Leu Gly Asp Trp Leu Val Tyr Gly Lys
65 70 75 80
Glu Gln Tyr Ala Asp Arg Tyr Arg His Val Val Gln Ala Val Gly Leu
85 90 95
Asp Tyr Gln Thr Leu Arg Asn Tyr Ala Trp Val Ala Gly Arg Phe Pro
100 105 110
Leu Ala Arg Arg Arg Ser Gly Leu Ser Phe Gln His His Ala Glu Val
115 120 125
Ala Ala Met Ser Pro Asp Asp Gln Asp Arg Trp Leu Asp Glu Ala Glu
130 135 140
Thr Gln Met Trp Ser Val Lys Gln Leu Arg Ala Ala Ile Lys Ala Thr
145 150 155 160
Arg Ser Asp Arg Thr Thr Glu Thr Ile Lys Thr Ala Leu Met Pro Arg
165 170 175
Ile Pro Ile Pro Asp Arg Arg Leu Thr Arg Trp Arg Gln Ala Ala His
180 185 190
Gln Ser Ser Val Glu Leu Asp Gln Trp Ile Val Ser Thr Leu Asp Arg
195 200 205
Ala Ala Ala Glu Thr Leu Asp Lys Thr Thr His Asp Glu Thr Glu
210 215 220
<210> 6
<211> 274
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio5 Protein
<400> 6
Met Val Ser Thr Ser Leu Lys Pro Arg Leu Asp Ala Ala Ala Ala Gln
5 10 15
Gln Gln Thr Gly Leu Ser Trp Trp Leu Ser Asp Ala Trp Gln Met Ala
20 25 30
Leu Arg Asn Leu Arg His Leu Thr Arg Ser Pro Glu Leu Val Met Phe
35 40 45
Ser Leu Val Gln Pro Val Met Phe Ile Leu Leu Phe Ala Tyr Val Phe
50 55 60
Gly Gly Ala Ile Asn Val Glu Gly Gly Asn Tyr Pro Gln Phe Leu Leu
65 70 75 80
Pro Gly Ile Leu Val Gln Met Val Leu Phe Gly Ser Val Ala Gly Thr
85 90 95
Thr Ile Gly Ile Ser Thr Asp Met Asp Arg Gly Leu Met Asp Arg Phe
100 105 110
Arg Ser Met Pro Met Ser Arg Ser Ala Val Leu Val Gly Arg Thr Leu
115 120 125
Ser Glu Ile Leu Arg Asn Val Val Ser Met Leu Val Val Val Leu Met
130 135 140
Gly Leu Leu Ile Gly Phe Arg Phe Gln Gly Gly Val Leu Ser Ala Leu
145 150 155 160
Gly Gly Leu Ala Leu Leu Leu Leu Phe Gly Tyr Ala Leu Thr Trp Val
165 170 175
Gly Ala Met Ile Gly Leu Ser Val Pro Asn Pro Glu Ala Ala Gln Ser
180 185 190
Ala Gly Leu Ile Trp Ile Phe Pro Phe Ser Leu Ile Ser Ser Ala Phe
195 200 205
Val Pro Thr Glu Ser Met Pro Thr Trp Leu Arg Val Tyr Ala Asp Ala
210 215 220
Ser Pro Met Thr Ala Thr Val Asn Ala Leu Arg Asp Leu Phe Asn Gly
225 230 235 240
Asn Pro Pro Gly Leu Asp Val Leu Leu Thr Val Ala Trp Ser Val Leu
245 250 255
Leu Ile Thr Ile Phe Ala Pro Leu Ala Thr Arg Lys Tyr Ser Leu Arg
260 265 270
Ser Arg
<210> 7
<211> 328
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio6 Protein
<400> 7
Met Pro Ala Ala Ile Glu Val Ala Gly Leu Cys Lys Arg Phe Gly Ser
5 10 15
Val Thr Ala Leu Asp His Leu Glu Leu Thr Val Pro Glu Gly Lys Val
20 25 30
His Gly Leu Leu Gly Pro Asn Gly Ala Gly Lys Thr Thr Thr Val Arg
35 40 45
Val Leu Thr Thr Leu Leu Arg Pro Asp Glu Gly Lys Ala Glu Ile Phe
50 55 60
Gly Phe Asp Val Arg Arg Asn Ala Leu Gln Val Arg Ser Ile Ile Gly
65 70 75 80
Leu Thr Gly Gln Tyr Thr Thr Val Asp Asp Met Leu Thr Gly Arg Glu
85 90 95
Asn Leu His Met Val Gly Lys Leu Phe Arg Met Ser Thr Pro Asp Ile
100 105 110
Lys Val Arg Ala Thr Glu Leu Leu Glu Arg Phe Asp Leu Thr Glu Ala
115 120 125
Ala Gly Arg Gln Ala Lys Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu
130 135 140
Asp Ile Ala Ala Thr Leu Met Ser Arg Pro Gln Leu Ile Phe Leu Asp
145 150 155 160
Glu Pro Thr Ala Ala Leu Asp Pro Arg Ser Arg Met Asp Val Trp Arg
165 170 175
Ile Val Asn Glu Leu Val Glu Glu Gly Thr Thr Val Leu Leu Thr Thr
180 185 190
Gln Tyr Leu Glu Glu Ala Asp His Leu Ala Asp Ser Leu Ser Val Ile
195 200 205
Asp Ser Gly Lys Val Ile Ala Ser Gly Ala Pro Asp Glu Leu Lys Ala
210 215 220
Glu Val Gly Gln Ala Trp Ala Asp Val Thr Leu Ile Asp Ala Ala Ala
225 230 235 240
Val Glu Lys Thr Thr Gln Ile Leu Arg Glu Arg Leu Gly Thr Glu Pro
245 250 255
Val Gly Asp Pro Glu Gly Met Gln Val His Ala Pro Leu Pro Glu Gly
260 265 270
Met Thr Leu Asn Glu Leu Leu Asn Pro Leu Arg Asp Ser Gly Ile Ala
275 280 285
Ile Ala Asp Val Ala Val Arg Arg Pro Thr Leu Asp Asp Val Phe Leu
290 295 300
Ala Leu Thr Gly His Thr Ala Thr Ala Arg Ala Ser Glu Asp Val Asn
305 310 315 320
Ser Lys Lys Lys Gly Gly Lys Arg
325
<210> 8
<211> 236
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio7 Protein
<400> 8
Met Tyr Phe Arg Pro Ala Asp Leu Ala His Glu His Gly Leu Ser Pro
5 10 15
Gln Ser Val Arg Asn Tyr Glu Arg Asp Gly Leu Ile Pro Pro Ala Arg
20 25 30
Arg Thr Glu Ser Gly Tyr Arg Arg Tyr Thr Glu Lys His Ala Ala Ala
35 40 45
Leu Arg Ala Tyr Arg Ala Leu Ile Pro Ala His Gly Tyr Ala Glu Ser
50 55 60
Gly Ala Ile Met Arg Asp Ile Thr Ala Gly Arg Leu Asn Glu Ala Leu
65 70 75 80
Thr Thr Ile Asp Arg Ser His Ala Glu Leu Leu Arg Asp Arg Gly Thr
85 90 95
Leu Asp Ala Val Ala Glu Val Leu Thr His Leu Thr Gly Arg Ser Thr
100 105 110
Gly Thr Trp Arg Ala Pro Lys Ser Ile Gln Pro Tyr Ser Ile Gly Glu
115 120 125
Leu Ala His Arg Leu Gly Val Asn Val Ala Thr Ile Arg Lys Trp Glu
130 135 140
Thr Ser Gly Val Leu Ala Pro Val Arg Arg Pro Glu Thr Gly His Arg
145 150 155 160
Met Tyr Asp Ala Ser Asp Val Arg Asp Ala Glu Leu Ala His Phe Leu
165 170 175
Arg Arg Gly Arg Tyr Pro Leu Glu Leu Ile Ala Thr Val Val Gln Gln
180 185 190
Val Arg Ala Ala Gly Asp Thr Gln Ala Leu Ala Ala Ala Leu Ala Asp
195 200 205
Trp Arg Gln Arg Val Thr Thr Arg Gly Leu Ala Met Leu Asn Ala Ala
210 215 220
Ala Gln Leu Ala Ser Tyr Leu Ala Met Glu Glu Asn
225 230 235
<210> 9
<211> 242
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio8 Protein
<400> 9
Met Thr Thr Leu Thr Tyr Ala Asp Tyr Leu Gln Val Asp Thr Leu Leu
5 10 15
Ser Leu Gln Glu Thr Arg Ala Pro Asp Thr Ala Ser Arg Ser Val Val
20 25 30
Leu Ala Glu His Phe Phe Ile Val Thr His Gln Ala Cys Glu Leu Trp
35 40 45
Leu Lys Gln Val Thr Tyr Asp Leu Asp Ala Ala Ala Asp Ala Met Thr
50 55 60
Pro Pro Tyr Gly Pro Glu Asp Glu Glu Leu Ala Leu Glu Phe Leu Gln
65 70 75 80
Arg Thr Ala Glu Leu Leu Arg Val Leu His Glu Gln Val Val Ala Leu
85 90 95
Glu Arg Leu Pro Leu Arg His Phe Ala Glu Phe Arg Pro Phe Leu Asp
100 105 110
Gly Ala Ser Gly Ala Gln Ser Ala Gln Phe Arg Leu Leu Ala Arg Leu
115 120 125
Leu Gly Gly Glu Arg Gln Glu Gly Arg Leu Tyr Arg Ala Phe Glu Arg
130 135 140
Leu Thr Glu His Asn Gly Ile Ser Val Ala Glu Val Cys Ala Arg Gly
145 150 155 160
Pro Gly Ala Gly Val Leu Asn Arg Ile Ala Asp Ser Leu Leu Asp Val
165 170 175
Ala Asn Gly Tyr Trp Arg Trp Lys Met Thr His Leu Ala Leu Val Ser
180 185 190
Lys Met Val Gly Asn Arg Asn Gly Thr Gly Gly Ser Thr Gly Val Asp
195 200 205
Tyr Leu Ala Arg Arg Ile Thr Leu Pro Phe Ala Gln Leu Arg Gln Leu
210 215 220
Arg Ala Gln Val His Asp Ala Leu Val Trp Glu Gln Pro Thr Ala His
225 230 235 240
Thr Gln
<210> 10
<211> 421
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio9 Protein
<400> 10
Met Pro Leu Pro Ser Pro Tyr Pro Asn Leu Leu Asp Gly Pro Ser Val
5 10 15
Ala Ser Thr Ile Pro Ser Ser Glu Leu His Arg Val Phe Arg Asp Ala
20 25 30
Gly Glu Arg Glu Arg Ile Ser Gly Val Pro Val Thr Lys Leu His Val
35 40 45
Gly Glu Pro Tyr Phe Thr Pro Pro Pro Glu Val Ala Gln Ala Leu Ala
50 55 60
Glu Ala Val Thr Ala Gly Arg Thr Asp Tyr Thr Ala Val Glu Gly Leu
65 70 75 80
Leu Glu Leu Arg Glu Arg Leu Val Glu Lys Leu Ala Asp Gln Asn Gly
85 90 95
Val Asp Thr Asp Val Ser Arg Leu Phe Val Thr Pro Gly Ser Cys Gln
100 105 110
Gly Leu Ala Ala Leu Met Gln Ala Val Ala Glu Pro Asp Ala Glu Ile
115 120 125
Leu Leu Pro Glu Leu His Trp Pro Ile His Leu Gln Gln Val Leu Leu
130 135 140
Ala Gly Leu Arg Pro Val Phe Tyr Pro Leu Gly Arg Asp Tyr Arg Thr
145 150 155 160
Asp Pro Glu Ser Val Leu Ala Ala Ser Thr Ala Asn Thr Arg Val Leu
165 170 175
Leu Ile Asn Ser Pro Ala Asn Pro Thr Gly Ala Val Leu Asp Thr Ala
180 185 190
Thr Leu Ser Thr Leu Ile Asp Met Ala Arg Ala Arg Gly Trp Gln Val
195 200 205
Ile Ser Asp Glu Ala Tyr Glu His Phe Val Phe Asp Asp Glu His Val
210 215 220
Ser Thr Ala Ser Leu Glu Trp Asp Val Pro Val Ser Glu Arg Ile Val
225 230 235 240
His Ser Ser Tyr Ser Phe Ser Lys Ser Leu Ala Met Thr Gly Tyr Arg
245 250 255
Leu Gly Tyr Val Ser Thr Ala Asn Asp Arg Thr Ala His Ala Phe Arg
260 265 270
Ile Val Gln Glu Ala Asn Leu Ile Ala Met Ser Thr Pro Val Gln Tyr
275 280 285
Ala Gly Leu Glu Ala Leu Arg Leu Gly His Val Val Arg Glu Asn Arg
290 295 300
Ala Met Val Leu Ser Asn Arg Asp Ala Val Leu Pro Ala Val Arg Asp
305 310 315 320
Ala Gly Leu Leu Pro Glu Leu Pro Ala Gly Gly Trp Tyr Ala Val Leu
325 330 335
Asp Val Ala Pro Thr Gly Leu Thr Ala Glu Glu Phe Ala Thr Gly Leu
340 345 350
Leu Glu Thr Arg Asn Val Ala Val Val Pro Gly Thr Gly Phe Ala Leu
355 360 365
Met Pro Arg Leu Asp Ala Arg Gly Arg Val Ile Thr Val Glu Pro Ala
370 375 380
Pro Trp Ser Arg His Leu Ile Arg Ile Ala Met Cys Val Ala Pro Ser
385 390 395 400
Val Leu Arg Ser Gly Val Arg Glu Leu Leu Glu Phe Ala Arg Glu Arg
405 410 415
Pro Gly Thr Ala Arg
420
<210> 11
<211> 264
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio10 Protein
<400> 11
Val Ser Pro Thr Glu Ala Glu Ala Trp Pro Ala Val Ala Glu Arg Gly
5 10 15
Asp Gly Leu Ala Gly Arg Thr Val Ile Val Thr Gly Ala Gly Thr Gly
20 25 30
Leu Gly Arg Ala Ile Gly Glu Arg Leu Leu Ala Arg Asp Ala Asn Val
35 40 45
Val Ala Val Gly Arg Arg Glu Ala Ala Leu Arg Glu Leu Thr Gly Asp
50 55 60
Gly Gly Gly Gln Val Ala Thr Val Ala Ala Asp Ile Thr Glu Pro Gly
65 70 75 80
Ala Ala Glu His Val Val Ala Ala Ala Thr Thr Arg Phe Gly Thr Val
85 90 95
His Gly Leu Val Asn Asn Ala Gly Leu Ala Arg Phe Ala Thr Leu Asp
100 105 110
Thr Ala Ser Asp Glu Asp Phe Asp Arg Leu Leu Ala Thr Asn Val Arg
115 120 125
Ala Pro Ala Ala Leu Ile Arg Ala Ala Leu Pro His Leu Arg Glu His
130 135 140
Arg Gly Ala Val Val Asn Val Ser Ser Val Gly Ala Val Leu Ala Met
145 150 155 160
Pro Gly Arg Ser Phe Tyr Gly Ala Ser Lys Ala Ala Leu Asn Ser Leu
165 170 175
Thr Arg Ser Leu Ala Arg Glu Leu Ala Pro Asp Val Arg Val Asn Ala
180 185 190
Val Leu Pro Gly Pro Val Asp Thr Pro Met Trp Asp Asp Met Gly Leu
195 200 205
Asp Ser Val Lys Ser Ala Leu Leu Arg Ser Ser Leu Leu Ala Ala Thr
210 215 220
Pro Leu Gly Arg Phe Gly Gln Pro Ala Glu Ile Ala Gly Trp Val Cys
225 230 235 240
Gly Leu Leu Asp Pro Glu Phe Ser Gly Trp Ile Thr Gly Ala Leu Ile
245 250 255
Pro Val Asp Gly Gly Arg Thr Ser
260
<210> 12
<211> 404
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio11 Protein
<400> 12
Met Ser Ser Pro Thr Ala Ser Thr Ser Ala Leu Asp Leu Thr Asp Pro
5 10 15
Thr Thr Phe Val Arg His Asp Thr His Val Phe Trp Ala Glu Val Arg
20 25 30
Asp His Asn Pro Val Tyr Trp Tyr Gln Gly Arg Glu Asp Arg Pro Gly
35 40 45
Phe Trp Val Val Ser Arg Tyr Val Asp Val Val Ala Ser Tyr Thr Asp
50 55 60
Ala Ala Arg Leu Ser Ser Ala Arg Gly Thr Val Leu Asp Val Leu Leu
65 70 75 80
Arg Gly Glu Asp Ser Ala Gly Gly Arg Met Leu Ala Val Thr Asp Arg
85 90 95
Pro Arg His Arg Glu Leu Arg Asn Val Met Leu Arg Ala Phe Ser Pro
100 105 110
Arg Val Leu Gly Arg Val Val Glu Gln Val His Arg Arg Ala Asp Glu
115 120 125
Leu Ile Arg Arg Val Thr Gly Thr Gly Ala Phe Asp Phe Ala Thr Glu
130 135 140
Val Ala Glu Ser Ile Pro Met Gly Thr Ile Cys Asp Leu Leu Ser Ile
145 150 155 160
Pro Pro Ala Asp Arg Pro Asp Leu Leu Arg Trp Asn Lys Asn Ala Leu
165 170 175
Ser Ser Asp Glu Ala Asp Ala Asn Leu Tyr Ala Ala Leu Glu Ala Arg
180 185 190
Asn Gln Ile Leu Leu Tyr Phe Met Asp Leu Ala Glu Gln Arg Arg Ala
195 200 205
Ser Pro Gly Asp Asp Val Ile Ser Met Ile Ala Thr Ala Thr Val Gly
210 215 220
Gly Glu Pro Leu Ser Ile Asp Asp Val Ala Leu Asn Cys Tyr Ser Leu
225 230 235 240
Ile Leu Gly Gly Asp Glu Ser Ser Arg Met Ser Ala Ile Cys Ala Val
245 250 255
Lys Ala Phe Ala Asp Phe Pro Asp Gln Trp Arg Ala Val Arg Asp Gly
260 265 270
Asp Val Ala Ile Asp Thr Ala Val Glu Glu Val Leu Arg Trp Ser Thr
275 280 285
Pro Ala Met His Phe Ala Arg Thr Ala Thr Thr Asp Phe Glu Leu Arg
290 295 300
Gly Gln Gln Val Arg Ala Gly Asp Ile Val Thr Leu Trp Asn Leu Ser
305 310 315 320
Ala Asn Phe Asp Glu Arg Glu Phe Asp Arg Pro Tyr Arg Phe Glu Val
325 330 335
Gly Arg Thr Pro Asn Lys His Leu Ser Phe Gly His Gly Pro His Phe
340 345 350
Cys Leu Gly Ala Tyr Leu Gly Arg Ala Glu Leu Gln Ala Leu Leu Thr
355 360 365
Ala Leu Val Gly Thr Val Ser Arg Ile Glu Ser Ala Gly Ser Pro Arg
370 375 380
Arg Val Tyr Ser Asn Phe Leu Asn Gly His Ser Ser Leu Pro Val Ala
385 390 395 400
Phe Thr Gly Arg
<210> 13
<211> 523
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio12 Protein
<400> 13
Val Pro Trp Pro Glu Glu Leu Ala Ala Leu Tyr Arg Arg Glu Gly Tyr
5 10 15
Trp Gln Gly Arg Pro Leu Gly Asp Leu Leu Thr Glu Ala Cys Ala Arg
20 25 30
His Ala Asp Lys Thr Ala Leu Val Cys Gly Glu Arg Arg Met Thr Tyr
35 40 45
Ala Glu Leu Ser Arg Ala Ser Ala Asp Val Ala Gly Gly Leu Leu Asp
50 55 60
Val Gly Ile Glu Pro Leu Asp Arg Val Val Val Gln Leu Pro Asn Val
65 70 75 80
Pro Glu Phe Val Val Val Val Tyr Ala Leu Leu Arg Ile Gly Ala Ile
85 90 95
Pro Val Met Ala Leu Pro Gly His Arg Lys Val Glu Leu Thr His Leu
100 105 110
Cys Ala His Ser Gln Ala Val Ala Leu Val Val Val Asp Gln Val Lys
115 120 125
Gly Phe Asp His Arg Ala Leu Ala Arg Glu Val Arg Ala Glu Val Pro
130 135 140
Ala Leu Lys His Val Val Val Ala Gly Asp Ala Glu Glu Phe Thr Ala
145 150 155 160
Leu Ala Asp Leu Tyr Arg Arg Gly Arg Asp Leu Pro Ala Val Asp Pro
165 170 175
Ser Glu Pro Ala Leu Phe Leu Leu Ser Gly Gly Thr Thr Gly Leu Pro
180 185 190
Lys Leu Ile Pro Arg Thr His Asp Asp Tyr Ala Tyr Asn Met Arg Ala
195 200 205
Thr Ala Asp Ala Leu Arg Phe Gly Ala Glu Asp Val Tyr Leu Ala Val
210 215 220
Asn Pro Ile Gly His Asn Ser Ala Leu Gly Cys Pro Gly Val Leu Gly
225 230 235 240
Ala Leu Leu Val Gly Gly Thr Ala Val Leu Thr Ser Ser Val Arg Pro
245 250 255
Asp Glu Val Phe Glu Leu Leu Glu Arg Glu Arg Val Thr Leu Thr Thr
260 265 270
Leu Val Pro Pro Val Val Arg Leu Trp Leu Asp Ala Ala Arg Lys Ser
275 280 285
Asp Val Arg Phe Pro Asn Leu Met Leu Gln Val Gly Ser Ser Lys Phe
290 295 300
Asp Pro Ala Arg Ala Ala Glu Val Arg Thr Ser Leu Gly Ala Val Leu
305 310 315 320
Thr Gln Trp Phe Gly Val Gly Glu Gly Leu Leu Thr Tyr Thr Arg Leu
325 330 335
Asp Asp Pro Glu Glu Val Val Leu Ala Thr Glu Gly Arg Pro Leu Ala
340 345 350
Ala His Asp Glu Ile Leu Val Val Asp Thr Asp Gly Arg Pro Val Pro
355 360 365
Asp Gly Ala Glu Gly Glu Leu Leu Val Arg Gly Pro Tyr Thr Ile Arg
370 375 380
Gly Tyr Tyr Arg Ala Glu Glu Gln Asn Arg Arg Ser Phe Thr Pro Asp
385 390 395 400
Gly Tyr Phe Arg Thr Gly Asp Met Val Arg Arg Arg Pro Asp Gly Ser
405 410 415
Ile Val Val Val Gly Arg Ile Lys Asp Ile Ile Asn Arg Gly Gly Glu
420 425 430
Lys Val Pro Ala Glu Glu Ile Glu Glu His Leu Leu Ala His Ala Ala
435 440 445
Ile Arg Asp Ala Ala Val Val Gly Val Ala Asp Pro Val Leu Gly Glu
450 455 460
Lys Thr Val Ala Phe Val Ile Leu Arg Asp Glu Pro Ile Ser Pro Ala
465 470 475 480
Ala Val Lys Ser Phe Leu Arg Glu Arg Gly Leu Ala Thr Tyr Lys Ile
485 490 495
Pro Asp Arg Val Val Pro Ile Glu Glu Phe Pro Arg Thr Ala Val Gly
500 505 510
Lys Val Asp Lys Val Thr Leu Arg Thr Ser Gly
515 520
<210> 14
<211> 596
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio13 Protein
<400> 14
Val Pro Thr Val Ala Glu Leu Phe Glu Ser Val Val Ala Arg Ser Gly
5 10 15
Asp His Val Ala Val Ile Phe Gly Asp Arg Leu Val Ser Tyr Ala Glu
20 25 30
Leu Asp Ala Arg Ala Asn Arg Leu Ala Arg Val Leu Val Glu Arg Gly
35 40 45
Val Gly Pro Asp Thr Thr Val Ala Val Ala Met Pro Lys Cys Asp Glu
50 55 60
Leu Met Val Val Leu Leu Ala Val Leu Lys Ala Gly Gly Ala Tyr Leu
65 70 75 80
Pro Leu Asp Pro Gln Tyr Pro Ala Lys Arg Leu Ala Tyr Met Val Gln
85 90 95
Asp Ala Arg Pro Thr Leu Leu Val Arg Met Ala Gln Val Ser Leu Glu
100 105 110
Leu Gly Val Pro Val Ala Glu Leu Val Val Asp Asp Pro Asp Thr Ala
115 120 125
Arg Glu Thr Glu Ser Arg Pro Asp His Gln Leu Thr Asp Ala Ser Arg
130 135 140
Asn Ala Pro Leu Arg Pro Asp Asn Leu Met Tyr Val Ile Tyr Thr Ser
145 150 155 160
Gly Ser Thr Gly Thr Pro Lys Gly Val Ala Val Thr His Thr Gly Val
165 170 175
Ala Asp Ile Val Ala Ala Gln Thr Ala Ser Ile Ala Pro Arg Pro Gly
180 185 190
Asp Arg Val Leu Gln Trp Ala Ser Val Ser Phe Asp Ala Ala Phe Trp
195 200 205
Asp Trp Ser Ala Ala Leu Leu Ser Gly Ala Thr Leu Ile Met Ala Pro
210 215 220
Ala Asp Glu Leu Leu Pro Gly Gln Pro Leu Arg Asp Thr Leu Arg Arg
225 230 235 240
Tyr Ala Val Thr His Ala Val Leu Pro Pro Val Ala Leu Ser Val Thr
245 250 255
Glu Pro Asp Asp Val Leu Val Gly Gly Thr Leu Met Ser Thr Gly Asp
260 265 270
Ala Cys Thr Arg Ala Leu Val Ala Lys Trp Ala Pro Gly Arg Arg Met
275 280 285
Tyr Asn Gly Tyr Gly Pro Thr Glu Thr Thr Val Gly Ser Thr Ile Ala
290 295 300
Gly Pro Ile Ala Ile Ser Asp Glu Ile Thr Ile Gly Thr Pro Trp Ser
305 310 315 320
Gly Asn Arg Val Tyr Val Leu Asp Glu Arg Leu Arg Pro Val Pro Asn
325 330 335
Gly Arg Asp Gly Glu Leu Tyr Leu Ala Gly Asn Gly Leu Ala Arg Gly
340 345 350
Tyr Leu Asn Arg Pro Gly Leu Thr Ala Ser Arg Phe Val Leu Asp Pro
355 360 365
Phe Gly Pro Pro Gly Gly Arg Met Tyr Arg Ser Gly Asp Arg Gly His
370 375 380
Arg Arg Ala Asp Gly Gln Leu Val Phe Ala Ser Arg Gly Asp Asp Gln
385 390 395 400
Val Lys Ile Arg Gly Phe Arg Val Glu Leu Gly Glu Val Glu Ala Arg
405 410 415
Leu Ala Ala His Pro Ala Val Asp Val Ala Ala Val Val Val Val Gly
420 425 430
Asp Leu Ala Gly Ala Arg Leu Ala Ala Phe Val Ser Thr Val Ala Gly
435 440 445
Thr Gly Val Ser Ala Ala Glu Leu Ser Ala His Ser Ala Glu Thr Leu
450 455 460
Pro Glu His Met Val Pro Ser Ser Val Gln Val Leu Gln Arg Leu Pro
465 470 475 480
Val Thr Ala Asn Gly Lys Ile Asp Arg Ala Ala Leu Arg Asp Leu Ala
485 490 495
Glu Ser Ala Ala His Pro Asp Ala Ala Ala Ser Ala Gly Pro Pro Gly
500 505 510
Glu Asp Pro Thr Ser Val Glu Ser Arg Leu Cys Leu Leu Val Arg Glu
515 520 525
Leu Leu Ala Val Pro Asp Val Arg Pro Gly Asp Asn Phe Phe Lys Leu
530 535 540
Gly Gly His Ser Val Leu Ala Thr Arg Leu Ala Gly Arg Leu Arg Asp
545 550 555 560
Glu Trp Gly Ile Thr Val Pro Ile Arg Ala Val Phe Glu Ala Ala Thr
565 570 575
Leu Ser Glu Leu Ala Leu Val Val Gln Ala Ser Lys Ala Ser Ile Pro
580 585 590
Asn Gly Arg Pro
595
<210> 15
<211> 424
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio14 Protein
<400> 15
Val Thr Gly Val Arg Thr Leu Thr Val Val Ala Ile Leu Ala Leu Thr
5 10 15
Ala Thr Ser His Gln Val Glu Pro Val Ala Ala Ser Gly Asp Val Leu
20 25 30
Gly Val Ala Thr Leu Ala Asp Thr Gln Thr Thr His Ala Leu Ile Ala
35 40 45
Asn Pro His Leu Arg Gly Thr Gly Ser Thr Ser Ser Gly Pro Gly Gly
50 55 60
Ala Pro Ala Glu Ala Leu Ser Arg Phe His Asp Leu Gly Ser Leu Ala
65 70 75 80
Gly Pro Gly Thr Pro Ser Glu Ala Thr Asp Leu Asn Asp Arg Gly Asp
85 90 95
Val Val Gly Val Thr Ser Leu Pro Gly Thr Gln Thr Ala His Ala Phe
100 105 110
Ile Ala Asn Pro Arg His Lys Gly Gly Arg Leu Ile Glu Ile Thr Pro
115 120 125
Ser Gln Ala Gly Ser Ser Arg Ala Gln Ala Ile Asn Arg Phe Gly Val
130 135 140
Val Ala Gly Thr Leu Gly Leu Gly Ile Gly Pro Pro Thr Pro Ala Pro
145 150 155 160
Asp Gly Ser Gln Pro Leu Leu Gln Pro Phe Val Trp Glu Ala Arg Thr
165 170 175
Gly Leu Asp Val Leu Pro Leu Pro Pro Gly Ala Gly Gly Ala Gln Ala
180 185 190
Val Asp Ile Asn Asp Lys Gly Thr Val Leu Val Val Gly Thr Asn Ala
195 200 205
Thr Gly Val Gly Leu Pro Val Gly Ser Tyr Leu Trp Asn Pro Ala Ser
210 215 220
Arg Thr Tyr Thr Thr Leu Pro Pro Pro Thr Thr Ser Val Thr Gly Pro
225 230 235 240
Val Ala Leu Ala His Thr Leu Asp Glu Arg Gly Gly Val Ala Gly Gly
245 250 255
Leu Val Thr Gln Val Gly Glu Gln Ser Trp His His Thr Ala Val Val
260 265 270
Trp Gln Pro Gly Thr Leu Ala Val Gln Gln Leu Pro Thr Gly Gly Ser
275 280 285
Ala Asp Thr Tyr Ala Thr Asp Arg Asn Glu Asn Gly Leu Ile Val Gly
290 295 300
Trp Arg Ile Asn Ala Thr Gly Gln Ser Thr Thr Ala Ile Tyr Trp Pro
305 310 315 320
Ser Ala Asn Ala Gln Pro Val Glu Leu Pro Gly Arg Val Ala Tyr Arg
325 330 335
Val Asn Asp Ala Gly Gln Ile Val Gly Ile Arg Asn Phe Thr Gly Ser
340 345 350
Ser Ala Tyr Pro Phe Ser Ala Val Met Trp Glu Pro Arg Arg Gly Arg
355 360 365
Thr Thr Arg Leu Gly Asp Asn Asp Leu Gly Ser Tyr Val Ile Ala Val
370 375 380
Asn Ala Ser Gly Arg Ser Ala Gly Phe Ala Val Ala Thr Arg Asn Gly
385 390 395 400
Asn Asn His Asn Thr Ala Gly Trp Trp Gly Pro Pro Arg Arg Gly Asp
405 410 415
Cys Pro Arg His Cys Ser Pro Arg
420
<210> 16
<211> 450
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio15 Protein
<400> 16
Met Thr Thr Arg Ser Thr Glu Pro Ser Leu Ser Pro Leu Val Pro Gly
5 10 15
Leu Ser Arg Arg Gly Leu Leu Ile Ala Ala Ala Ser Thr Ala Ala Gly
20 25 30
Thr Ala Gly Leu Leu Ile Leu Pro Thr Lys Ala Glu Ala Ala Thr Ala
35 40 45
Ser Pro Arg His Gly Ser Arg Pro Asp Val Val Gly Pro Trp Phe Asp
50 55 60
Glu Met Leu Ala Thr Phe Ala Ala Ala Pro Thr Ala Gly Leu Pro Glu
65 70 75 80
Arg Met Trp Ala Met Ser Trp Ile Ala Ala Trp Ala Ala Leu Ser Ala
85 90 95
Arg Arg Ala Ala Pro Val Arg Ala Pro Gly Gln Arg Ala Val Phe Glu
100 105 110
Asp Ala Ala Thr Ala Thr Ala Val His Gly Val Leu Lys Ala Leu Val
115 120 125
Pro Gly Gln Ala Asp Lys Leu Asp Gly Val Leu Ala Asp Ser Leu Ala
130 135 140
Gly Leu Ala Ala Ser Glu Ala Lys Lys Ala Gly Ile Ala Ala Gly Arg
145 150 155 160
Glu Ala Ala Ala Ala Met Val Ala Val Arg Thr Gly Asp Gly Leu Asp
165 170 175
Leu Ala Ser Val Asn Val Pro Phe Thr Leu Pro Pro Glu Ala Pro Gly
180 185 190
Val Tyr Arg Leu Thr Pro Gly Ala Thr Gln Thr Val Ala Ala Gly Tyr
195 200 205
Gly Leu Ala Arg Pro Phe Leu Leu Gly Arg Ala Asp Arg Phe Arg Pro
210 215 220
Pro Pro Pro Pro Ala Leu Gly Thr Ala Pro Tyr Arg Arg Ala Leu Asp
225 230 235 240
Glu Val Arg Arg Leu Gly Gly Glu Val Ser Glu Arg Thr Glu Ala Gln
245 250 255
Ser Asp Leu Ala Trp Leu Asp Pro Leu Ser Gln Tyr Val Pro Val Leu
260 265 270
Arg Leu Leu Val Gly Asp Ser Ala Arg Ser Arg Arg Ser Lys Val Arg
275 280 285
Leu Leu Ala Ala Leu Gly Ala Ala Ile Val Asp Ser Ser Ile Ala Thr
290 295 300
Phe Glu Ala Lys Tyr Ala Leu Leu His Trp Arg Pro Val Thr Ala Ile
305 310 315 320
Arg Asp Ala Asp Thr Asp Gly Asp Pro Arg Thr Ala Pro Asp Pro Thr
325 330 335
Trp Asn Ser Phe Leu Pro Thr Pro Pro His Pro Glu Tyr Pro Ser Gly
340 345 350
His Ala Val Thr Ala Gly Ala Ala Glu Gln Val Leu Ser Gln Leu Val
355 360 365
Gly Pro Cys Thr Pro Met Ala Phe Ser Ile Thr Phe Ala Arg Gly Asp
370 375 380
Gly Arg Val Val Thr Arg Asn Tyr Arg Arg Gly Thr Pro Trp Ser Thr
385 390 395 400
Leu Thr Lys Glu Asn Ile Asp Ala Arg Val Leu Ala Gly Val His Phe
405 410 415
Arg Tyr Ser Asp Glu Val Gly Ala Ala Leu Gly Arg Gln Val Ala Arg
420 425 430
Tyr Asp Leu Asn Leu Leu Ala Arg Gly Gly Val Gly Pro Val Arg Val
435 440 445
Thr Trp
450
<210> 17
<211> 768
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio16 Protein
<400> 17
Val Pro Trp Ser Val Trp Asn Gln Thr Ala Arg His Phe Arg Ala Asp
5 10 15
Val Thr Ile Pro Asp Leu Leu Ala Glu Ala Ala Glu Arg His Pro Asp
20 25 30
Arg Pro Ala Ile Val Thr Ser Asp Lys Gln Val Leu Thr His Arg Glu
35 40 45
Leu His Arg Arg Ala Asn Arg Leu Ala Arg Leu Leu Arg Asp Leu Gly
50 55 60
Val Gly Arg Gly Asp Thr Val Ala Leu Phe Gly Glu Arg Asp Ala Pro
65 70 75 80
Ala Leu Val Gly Leu Leu Ala Val Leu Lys Cys Gly Ala Ala Tyr Val
85 90 95
Pro Ile Asp Pro Ser Trp Pro Ala Arg Arg Val Val Gly Leu Leu Asp
100 105 110
Gln Leu Asp Val Ala Ala Val Leu Thr Asp Arg Thr His Leu Arg Ser
115 120 125
Met Gln Glu Leu Arg Trp Gln Val Arg Ser Leu Arg His Val Leu Cys
130 135 140
Pro Asp Ile Ala Glu Glu Phe Ser Trp Ser Ala Thr Phe Arg Pro Asp
145 150 155 160
Leu Val Val Asn Phe Phe Asp Phe Val Ser Ser Ala Pro Asp Gln Leu
165 170 175
Glu Ala Ala Gly Phe Asn Met Arg Arg Ser Glu Arg Pro Phe Asp Glu
180 185 190
Asn Asp Val Gln Gln Tyr Arg Asp His Val Ala Ala Phe Ala Leu Ala
195 200 205
Ala Thr Ala Ala Ala Arg Pro Ser Ile Leu Glu Ile Gly Ser Gly Ser
210 215 220
Gly Leu Ile Val Glu Ala Leu Ala Pro Arg Ala Ser Arg Tyr Val Ala
225 230 235 240
Ala Asp Pro Ser Pro Val Ser Val Thr Arg Ser Gln Glu Gly Gly Phe
245 250 255
Arg Ala Gly Gly Glu Val Asp Gly Val Val Cys Phe Ala His Glu Val
260 265 270
Ala Glu Arg Val Gln Gly Pro Phe Asp Val Ile Leu Leu Ala Ser Thr
275 280 285
Val Gln Phe Leu Pro Asp Leu Asp Tyr Leu Leu Ser Val Leu Gly Ser
290 295 300
Leu Leu Gly Leu Leu Ala Asp Asp Gly Val Ile Val Leu Ala Asp Leu
305 310 315 320
Ile Asp Pro Asp Leu Ser Asp Tyr Ser Gly Ile Arg Val Ala Pro His
325 330 335
Phe Ile Glu Arg Leu Pro Glu Phe Leu Pro Gly Val Thr Gly Gly Ser
340 345 350
Val His Arg Arg Gln Val Glu Thr Phe Thr Gly Glu Leu Ala Gln Arg
355 360 365
Tyr Asp Ala Val Ile Arg Val Ala Pro Ser Gly Asp Arg Pro Ala Ser
370 375 380
Gly Arg Glu Pro Leu Trp Thr Gly His His Ile Glu Leu Arg Pro Ser
385 390 395 400
Glu Pro Leu Ala Thr Gly Pro Thr Ala Asp Asp Val Cys Tyr Thr Ile
405 410 415
Phe Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Val Val Ser His
420 425 430
Arg Ser Ala Val Asn Leu Ile Asp Trp Val Asn Arg Ser Tyr Arg Val
435 440 445
Gly Pro Thr Asp Gln Ile Leu Phe Val Thr Ser Phe Cys Phe Asp Leu
450 455 460
Ser Val Tyr Asp Ile Phe Gly Val Leu Ala Ala Gly Gly Ser Val Arg
465 470 475 480
Leu Ala Ser Ala Ala Glu Leu Ala Glu Pro Asp Thr Leu Val Asp Leu
485 490 495
Leu Glu Gln Glu Glu Ile Thr Ile Trp Asp Ser Ala Pro Ala Ala Leu
500 505 510
Ala Met Val Met Pro Phe Val Gln Val Arg Glu Pro Ala Gly Arg Gly
515 520 525
Thr Leu Arg Leu Val Leu Leu Ser Gly Asp Trp Ile Pro Val Pro Leu
530 535 540
Pro Asp Gln Ile Arg Ala Ala Phe Pro Asn Ala Glu Val Val Ala Leu
545 550 555 560
Gly Gly Ala Thr Glu Cys Thr Val Trp Ser Asn His Tyr Arg Val Gly
565 570 575
Asp Val Asp Pro Gly Trp Pro Ser Ile Pro Tyr Gly Lys Pro Met Gln
580 585 590
Asn Ala Arg Tyr Tyr Val Leu Asp His Gly Leu Gly Pro Cys Pro Asn
595 600 605
Gly Ala Glu Gly Asp Leu Tyr Ile Ala Gly Glu Cys Val Ala Leu Gly
610 615 620
Tyr Ala Arg Ser Pro Gly Leu Thr Ala Ala Lys Phe Leu Pro Asp Pro
625 630 635 640
Trp Ala His Arg Thr Gly Glu Arg Met Tyr His Thr Gly Asp Arg Ala
645 650 655
Arg Trp Leu Pro Ser Gly Asp Leu Glu Phe Leu Gly Arg Leu Asp Asp
660 665 670
Gln Val Lys Val Arg Gly Tyr Arg Ile Glu Leu Gly Glu Val Gln Ser
675 680 685
Ala Leu Leu Gln Cys Ala Gly Val Arg Ala Ala Ser Val Val Ala Pro
690 695 700
Ser Gly Pro Gly Gly Arg Thr Leu Ala Ala Phe Tyr Val Pro Thr Ala
705 710 715 720
Glu Pro Leu Pro Thr Ala Glu Val Val Gly Ala Leu Gln Arg Ile Leu
725 730 735
Pro Ser Tyr Met Val Pro Thr Arg Ile Val Ala Leu Asp Glu Leu Pro
740 745 750
Leu Thr Asn Thr Gly Lys Val Asp Arg Ala Ala Leu Leu Ser Arg Leu
755 760 765
<210> 18
<211> 94
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio17 Protein
<400> 18
Val Ala Asn Pro Asp Arg Asp Gly Asn Asp Gly Ser Ala Arg Gly Leu
5 10 15
Leu Arg Ala His Val Arg Ala Gly Trp Ala Ala Ala Leu Gln His Glu
20 25 30
Arg Phe Asp Asn Asp Asp Asp Phe Phe Ala Ile Gly Gly His Ser Leu
35 40 45
Leu Ile Ala Glu Ile Met Ala Gly Leu Gly Ala Leu Ala Gly Thr Arg
50 55 60
Leu Ser Leu Lys Leu Phe Phe Asp His Pro Thr Val Asn Glu Leu Thr
65 70 75 80
Asp Ala Leu Ala Ala His Glu Ala Phe Gly Ser Leu Ala Arg
85 90
<210> 19
<211> 259
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio18 Protein
<400> 19
Met Gly Thr Arg Thr Lys Asn Arg Trp Phe Val Glu Val Ser Arg Ser
5 10 15
Arg Leu Lys Glu Cys Ala Leu Tyr Ala Ile Pro His Ala Gly Gly Gly
20 25 30
Val Ala Thr Val Arg Ser Leu Cys Val Glu Leu Gly Asp Ala Phe Asp
35 40 45
Thr Phe Gly Val Arg Leu Pro Gly Arg Glu Ser Arg Leu Gly Asp Pro
50 55 60
Val Val Thr Val Met Ser Arg Leu Ala Asp Glu Leu Ala Gly Glu Leu
65 70 75 80
Leu Arg His Ala Gln Gly Arg Pro Val Val Leu Tyr Gly His Cys Ser
85 90 95
Gly Ser Ala Ile Ala Tyr Glu Val Ala Arg Arg Met Asp Pro Ala Gln
100 105 110
Leu Arg Gly Leu Ala Val Ser Ser His Pro Ala Pro Gly Ser Val Arg
115 120 125
Arg Ala Pro Thr Trp Glu Leu Pro Arg Gln Glu Phe Leu Lys Gln Val
130 135 140
Val Thr Asp Gly Tyr Leu Pro Pro Glu Ile Ile Ala Asn Glu Glu Leu
145 150 155 160
Leu Asp Ile Tyr Glu Pro Ala Val Arg Ala Asp Tyr Glu Leu Val Glu
165 170 175
Thr Tyr Glu Leu Asp Leu Phe Gly Gly Gly Pro Val Glu Ala Val Ala
180 185 190
Ala Pro Thr Val Ala Ile His Gly Arg Asp Asp His Thr Ile Asp Pro
195 200 205
Val His Ile Asp Ala Trp Ser Ala Leu Thr Thr Gly Pro Phe Arg Val
210 215 220
Val Ser Leu Ala Gly Gly His Asn Leu Leu Leu Gly Arg Pro Ala Glu
225 230 235 240
Leu Ala Ala Ala Ile Cys Gln Gly Leu Ala Ser Asp Asn Arg Leu His
245 250 255
Asp His Arg
<210> 20
<211> 245
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio19 Protein
<400> 20
Met Arg Lys Lys Gly Trp Ile Arg Thr Leu Thr Thr Val Glu Lys Pro
5 10 15
Thr Gly Arg Leu Val Cys Phe Pro His Ser Gly Gly Ser Ala Thr Ala
20 25 30
Phe Ser Asp Trp Ala Asn Ala Met Pro Pro Gly Val Glu Leu Val Ala
35 40 45
Val Gln Tyr Pro Gly Arg Gly Asp Arg Phe Ala Glu His Leu Val Asp
50 55 60
Asp Val Ala Glu Met Ala Gly His Ile Val Val Glu Leu Leu Glu Leu
65 70 75 80
Pro Cys Arg Asp Gln Val Leu Phe Gly His Ser Leu Gly Ala Met Val
85 90 95
Ala Tyr Glu Thr Ala Met Leu Leu Arg Asp Met Arg Val Glu Pro Arg
100 105 110
Arg Leu Cys Ala Ser Ala Cys Leu Pro Pro Gly Gln Met Lys Asn Arg
115 120 125
Asp Val His Leu Lys Pro Asp Asp Glu Phe Trp Ala Ala Ile Cys Ala
130 135 140
Leu Gly Gly Ile Asp Pro Arg Val Ala Glu Ile Ala Glu Leu Arg Glu
145 150 155 160
Leu Phe Met Pro Thr Leu Arg Ser Asp Leu Arg Ala His Ala Asn Tyr
165 170 175
Arg Pro Gly Ser Gly Thr Thr Pro Leu Ser Cys Pro Val Ser Cys Tyr
180 185 190
His Gly Val Gly Asp Pro Leu Val Asp Glu Ser Arg Leu Thr Glu Trp
195 200 205
Ala Asp Val Thr Thr Gly Glu Phe Arg Leu Thr Val Arg Pro Gly Gly
210 215 220
His Phe His Val Ser Ile Asp Val Asp Gly Leu Val Ser Asp Ile Met
225 230 235 240
Gly Arg Glu Trp Ala
245
<210> 21
<211> 2594
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio20 Protein
<400> 21
Met Gly Tyr Gly Gly Val Ser Ser Ala Gln Glu Ala Met Trp Leu Glu
1 5 10 15
Gln Asn Leu Ala Pro Glu Val Pro Asn Ser Thr Thr Thr Ile Trp Asp
20 25 30
Val Arg Gly Glu Leu His Leu Pro Asp Leu Glu Asp Ala Leu Arg Thr
35 40 45
Ala Leu Gly Glu Thr Ser Ala Leu Leu Val Asn Phe Arg Arg Glu Ser
50 55 60
Asp Glu Leu Arg Ile Val Pro Arg Lys Leu Asp Ala Trp Glu Pro Phe
65 70 75 80
Arg Ile Asp Ala Ser Asp Ala Ala Asp Pro Ala Ala Ala Ala Arg Glu
85 90 95
Phe Leu Thr Glu Gln Ile Arg Arg Pro Phe Asp Leu Gly Ala Asp Ala
100 105 110
Leu Phe Arg Ile Gly Thr Val Arg Leu Gly Asp Gly His His Leu Leu
115 120 125
Cys Leu Ile Met His His Ile Leu Thr Asp Ala Phe Gly Val Phe Thr
130 135 140
Leu Leu Ser Gln Arg Val Ala Glu Ile Tyr Arg Ala Leu Arg Ala Asp
145 150 155 160
Ser Pro Val Pro Asp Arg Pro Asp Thr Pro Ala Glu Ile Ala Gly Glu
165 170 175
Arg Glu Ala Thr Tyr Arg Ser Ser Glu Arg Phe Thr Asp Ala Ala Arg
180 185 190
Phe Trp Arg Asp Tyr Val Thr Ala Gly Gly Thr Ala Ala Arg Leu Pro
195 200 205
Thr Gly Met Arg Ala Gly Ala Thr Arg Thr Ala Ser Val Gly Phe Trp
210 215 220
Asp Gly Leu Thr Ala Pro Leu Gly Val Ala Ser Tyr Thr Ala Ser Val
225 230 235 240
Ala Ala Ser Glu Val Ala Arg Trp Arg Ala Ala Ala Asp Ser Thr Glu
245 250 255
Thr Ser Val Pro Asp Leu Leu Thr Ser Ala Ala Thr Ala Phe Leu His
260 265 270
Arg Leu Cys Asn Thr Pro Arg Pro Met Leu Ser Phe Thr Val Asn Tyr
275 280 285
Arg Arg Gly Asp Ile Lys Gln Ala Cys Gly Leu Tyr Ser Asn Ala Leu
290 295 300
Pro Leu Val Ile Glu Val Pro Ala Ala Gly Asp Phe Val Asp Leu Ala
305 310 315 320
Lys Ser Val Arg Leu Glu Arg Leu Arg Val Leu Arg Tyr Ala Glu Tyr
325 330 335
Asn Val Ser Leu Ile Lys Arg Ala Ala Gly His Ala Gly Asp Val Arg
340 345 350
Ser Pro Phe Gly Pro Val Val Asn Val Ile Pro Phe Leu Arg Glu Leu
355 360 365
Asp Leu Ala Gly Ala Val Gly Arg Phe Ala Gly Gly Thr Phe Gly Leu
370 375 380
Pro Asp Glu Val Arg Ile Ser Thr Tyr Val Asp Gly Gly Pro Asp Ser
385 390 395 400
Asp Leu Tyr Ile Arg Phe Asp Ala Pro Gly Arg Leu Tyr Thr His Glu
405 410 415
Asp Ile Ala Gly Leu Ala Glu Arg Phe Val Thr Phe Val Arg Ala Ala
420 425 430
Leu Thr Asp Pro Arg Ala Arg Val Arg Asp Ile Ser Ala Ile Gly Glu
435 440 445
Gln Glu Arg Val Ala Leu Leu Asp Arg Cys Ala Gly Pro Val Val Glu
450 455 460
Leu Ala Gly Val Thr Val Pro Val Leu Leu Asp Met Gln Ala Leu Ala
465 470 475 480
Thr Pro Asp Ala Ala Ala Val Val His Glu Asn Ala Val Leu Thr Tyr
485 490 495
Arg Glu Leu Ala Ala Arg Ser Asp Ala Leu Ala Arg Arg Leu Ala Glu
500 505 510
Cys Gly Ala Gly Pro Glu Arg Leu Val Ala Val Ala Val Pro Arg Ser
515 520 525
Ile Gly Leu Ala Val Ala Leu Cys Ala Val Leu Lys Ala Gly Ala Ala
530 535 540
Tyr Leu Pro Ile Asp Pro Asp Ser Pro Ala Glu Arg Val Glu Phe Met
545 550 555 560
Leu Gly Asp Ala Arg Pro Thr Leu Leu Leu Thr Val Ala Gly Thr Asp
565 570 575
Gly Leu Ala Ile Thr Pro Leu His Gly Ala Gln Pro Arg Trp Glu Ala
580 585 590
Ser Val Ile Glu Arg Thr Thr Ala Ala Ser Pro Ala Ala Thr Ser Gln
595 600 605
Ala Gly Gly Thr Gly Glu His Ala Ala Tyr Leu Arg Tyr Arg Ser Gly
610 615 620
Pro Phe Gly Pro Ala Ala Gly Val Val Val Thr His Ala Ala Leu Val
625 630 635 640
Asn Glu Leu Leu Trp Met Gln Gln Arg Tyr Arg Leu Asn Asp Thr Asp
645 650 655
Arg Val Leu His Lys Ala Pro Ala Ser Leu Asn Ala Ser Gly Trp Glu
660 665 670
Ile Phe Trp Pro Leu Ile Ala Gly Ala Thr Val Val Met Ala Thr Gln
675 680 685
Asp Val His Gly Asp Ala Thr Ala Leu Ala Ala Met Ile Arg Arg Thr
690 695 700
Gly Val Thr Thr Val His Val Val Pro Ser Val Leu Ala Glu Leu Val
705 710 715 720
Arg Asp Glu Ala Val Val Thr Ala Gly Lys Gly Leu Arg His Val Met
725 730 735
Cys Ser Gly Glu Val Leu Pro Ala Asp Leu Ala Ala Arg Phe His Glu
740 745 750
Ser Cys Asp Val Pro Val His Ser Leu Tyr Gly Pro Val Glu Ala Met
755 760 765
Pro Val Val Thr Ser Cys Asp Tyr Arg Pro Gly Ser Pro Thr Val Pro
670 675 680
Leu Gly Arg Pro Ile Ser Asn Ala Gly Val Tyr Val Leu Asp Ser Gln
685 690 695 700
Leu Gln Leu Thr Pro Pro Gly Val Val Gly Glu Val Tyr Val Thr Gly
705 710 715
Val Gly Leu Ala Arg Gly Tyr Leu His Arg Pro Ala Ala Thr Ala Asp
720 725 730
His Phe Val Ala Cys Pro Phe Gly Pro Ala Gly Thr Arg Met Tyr Arg
735 740 745
Thr Gly Asp Leu Ala Arg Trp Thr Asp Asp Gly Glu Leu Glu His Ala
750 755 760
Gly Ser Ala Asp Gln Arg Val Arg Ile Arg Gly Phe Trp Ala Ala Phe
765 770 775 780
Leu Glu Ile Glu Ala Val Leu Thr Ala His Pro Gly Val Asp Gln Ala
785 790 795
Ala Val Ile Ala Arg Pro Asp Gly Pro Asp Arg Ala Ala Gln Leu Ile
800 805 810
Ala Tyr Val Val Pro Ala Thr Gly Gly Arg Met Gly Ala Ala Gly Leu
815 820 825
Asp Val Asp Phe Ser Ala Gly Leu Asp Val Val Glu Leu Arg Arg Phe
830 835 840
Val Ala Ala Arg Leu Pro Glu His Leu Val Pro Ala Thr Ile Val Val
845 850 855 860
Leu Asp Arg Leu Pro Leu Thr Ala Glu Gly Lys Arg Asp His Ala Ala
865 870 875
Leu Pro Glu Pro Gln Ala Thr Arg Arg Ala His Arg Val Ala Arg Thr
880 885 890
Ala Glu Glu Arg Leu Leu Ala Asp Ala Phe Ala Glu Val Leu Gly Ala
895 900 905
Gly Arg Ile Gly Leu Asp Asp Asp Phe Phe Ala Leu Gly Gly Asp Ser
910 915 920
Ile Ser Ala Met Arg Val Val Ala Leu Ala Arg Ala Gly Gly Leu Ala
925 930 935 940
Leu Thr Ala Arg Thr Val Phe Glu Cys Arg Thr Val Ala Ala Leu Ala
945 950 955
Ala Val Ala Ala Pro Ala Asp Glu Pro Ala Val Ala Ala Ala Ala Glu
960 965 970
Gly Asp Gly Gly Arg Asp Asp Ala Gly Pro Ile Pro Leu Pro Pro Met
975 980 985
Ala Arg Leu Phe Ala Glu Arg Gly Pro Gly Leu Asp Arg Leu Ala Gln
990 995 1000
Trp Leu Val Leu Thr Leu Pro Ala Glu Met Ser Pro Asp Leu Leu Thr
1005 1110 1115 1120
Gly Ala Val Arg Ala Val Leu Asp Arg His Asp Val Leu Arg Ser Arg
1125 1130 1135
Leu Ala Asp Gly Gln Leu Leu Ile Gln Pro Pro Gly Ser Val Asp Val
1140 1145 1150
Asp Lys Leu Ile Arg Gln Val Pro Cys Ser Gly Asp Trp Ser Gly Pro
1155 1160 1665
Ser Trp Pro Ala Leu Leu Ala Asp Glu Ala Ala Lys Ala Val Gly Gln
1170 1175 1180
Leu Ser Ala Ser Ala Gly Gln Val Ile Arg Met Val Trp Phe Ala Pro
1185 1190 1195 1200
Pro Gly Gly Ala Pro Gly Arg Leu Leu Ile Ala Ala His His Leu Val
1205 1210 1215
Val Asp Gly Met Ser Trp Arg Val Leu Val Pro Asp Leu Ala Glu Ala
1220 1225 1230
Ala Ala Gln Ile Arg Ser Gly Arg Thr Pro Ala Leu Ala Pro Val Gly
1235 1240 1245
Thr Ser Leu Arg Ser Trp Leu Asp Glu Leu Ala Ala Glu Ala Val Arg
1250 1255 1260
Pro Glu Arg Val Ala Glu Leu Glu Leu Trp Arg Gly Ile Leu Ala Pro
1265 1270 1275 1280
Ser Gly Asp Pro Leu Gly Ala Arg Pro Leu Asp Pro Ala Val Asp Leu
1285 1290 1295
Thr Arg Thr Ala Gln Thr Leu Arg Val Glu Val Pro Ala Glu Leu Ser
1300 1305 1310
Arg Ala Leu Leu Thr Ser Val Pro Ala Thr Phe Arg Cys Gly Val Asp
1315 1320 1325
Asp Val Leu Leu Thr Ala Leu Ala Leu Ala Leu Ala Ser Arg Arg His
1330 1335 1340
Asn Ser Ala Gly Val Val Arg Leu Glu Gly His Gly Arg Gln Glu Glu
1345 1350 1355 1360
Leu Val Pro Gly Thr Asp Leu Thr Arg Thr Val Gly Trp Phe Thr Thr
1365 1370 1375
Val His Pro Val Arg Phe Asp Leu Ser Gly Leu Asp Leu Thr Asp Ala
1380 1385 1390
Ile Asn Gly Gly Pro Ala Ala Ala Glu Ala Leu Arg Arg Val Lys Glu
1395 1400 1405
Ser Arg Arg Val Leu Pro Asp Arg Gly Ile Gly Tyr Ser Leu Leu Arg
1410 1415 1420
Tyr Leu Asn Gln Ala Thr Gly Ala Met Leu Arg Asp Leu Pro Ala Asp
1425 1430 1435 1440
Glu Val Gly Phe Asn Tyr Leu Gly Arg Phe Ser Phe Asp Arg Ser Arg
1445 1450 1455
Thr Gly Arg Glu Met Ala Trp Thr Ser Ala Pro Glu Ser Ala Ala Leu
1460 1465 1470
Val Ala Ala Pro Asp Pro Asp Met Pro Leu Ile Ser Ala Leu Glu Leu
1475 1480 1485
Asn Ser Leu Val Val Asp Thr Asp His Gly Glu Gln Leu Gln Ala Leu
1490 1495 1500
Phe Thr Phe Ala Thr Gly Val Leu Ala Thr Asp Glu Val Arg His Leu
1505 1510 1515 1520
Ala Asp Asp Trp Gln Ala Ala Leu Arg Gly Ile Arg Ala Gln Ala Ala
1525 1530 1535
Thr Gly Ala Ser Gly Leu Thr Pro Ser Asp Val Pro Leu Val Arg Val
1540 1545 1550
Arg Gln Gln Asp Leu Asp Asp Trp Gln Ser Arg Phe Gly Arg Val Asp
1555 1560 1565
Asp Val Trp Pro Leu Thr Pro Leu Gln His Gly Leu Leu Tyr His Ser
1570 1575 1580
Leu Leu Gly Asp Ser Ala Ala Ala Ser Tyr Gln Thr Gln Phe Val Leu
1585 1590 1595 1600
Arg Ile Asn Gly Pro Val Asp Pro Ala Arg Leu Arg Gly Ala Ala Gln
1605 1610 1615
Thr Leu Leu Asn Arg His Pro Asn Leu Arg Val Ala Phe Leu Thr Lys
1620 1625 1630
Ser Thr Gly Glu Pro Val Gln Val Val Val Asp Gly Val Glu Val Pro
1635 1640 1645
Phe Ala His Val Asp Leu Ala Gly Gln Pro Gln Ala Glu Glu Arg Leu
1650 1655 1660
Ala Arg Ile Leu Ala Glu Glu Arg Glu Ala Gln Phe Arg His Asp Ser
1665 1670 1675 1680
Ala Pro Leu Leu Arg Phe Ser Leu Ile Thr Leu Thr Pro Thr Gln Ala
1685 1690 1695
Glu Leu Ala Leu Thr Ala His His Val Leu Phe Asp Gly Trp Ser Leu
1700 1705 1710
Pro Leu Ile Glu Gln Gln Leu Met His Leu Tyr Ala Gly Gly Ala Asp
1715 1720 1725
Ala Leu Glu Leu Val Glu His Gly Tyr Arg Glu Phe Leu Arg Trp His
1730 1735 1740
Ser Arg Gln Asn Ala Asp Glu Ala Leu Ala Ala Trp Thr Glu Glu Leu
1745 1750 1755 1760
Ala Asp Ala Thr Gln Pro Thr Leu Leu Ala Ser Gly Phe Ala Pro Ala
1765 1770 1775
Glu Gln Ala Gly Thr Ser Thr Glu Ile Gly Gln Val Asp Val Leu Leu
1780 1785 1790
Thr Arg Gln Glu Ala Ala Ser Ala Val Arg Arg Ala Ala Asp Cys Gly
1795 1800 1805
Ile Thr Pro Asn Val Leu Val Gln Gly Ala Trp Ala Val Val Leu Ala
1810 1815 1820
Gln Leu Thr Gly Asn Ala Asp Val Leu Phe Gly Ser Ser Val Thr Val
1825 1830 1835 1840
Arg Pro Pro Glu Leu Pro Gly Ala His Thr Val Val Gly Met Phe Thr
1845 1850 1855
Asn Thr Val Pro Val Arg Val Arg Cys Ala Pro Ala Asp Ser Leu Glu
1860 1865 1870
Gly Met Leu Gln Ala Val Gln Asp Ala Gln Ala Arg Thr Leu Asp His
1875 1880 1885
Tyr His Val Gly Leu Gly Asp Ile Gln Arg Ala Thr Gly Leu Thr Thr
1890 1895 1900
Leu Phe Asp Thr Ile Val Ile Phe Glu Ser Phe Pro Val Asp Arg Ala
1905 1910 1915 1920
Ala Leu Ser Lys Ala Ser Ala Ser Ala Glu Leu Thr Val Thr Gly Ile
1925 1930 1935
Arg Pro Phe Ala Pro Thr His Tyr Pro Leu Thr Val Leu Ala Ala Ala
1940 1945 1950
Asp Pro Leu Leu Ser Leu Thr Leu Gln Tyr His Pro Asp Ala Leu Ala
1955 1960 1965
Pro Ser Thr Val Gln Ala Ile Ala Asp Arg Phe Ala Arg Val Leu Arg
1970 1975 1980
Gln Phe Ala Ala Asp Pro Arg Thr Arg Ile Ala Ala Ile Asp Val Leu
1985 1990 1995 2000
Ser Glu Ala Glu Arg Gln Leu Val Val His Asp Trp Asn Ala Thr Ala
2005 2010 2015
Leu Glu Val Pro Pro Glu Phe Val Pro Glu Gln Phe Ala Arg Gln Ala
2020 2025 2030
Ala Ala Thr Pro Asp Ala Val Ala Val Val Val Gly Glu Gln His Leu
2035 2040 2045
Thr Tyr Ala Glu Leu Ser Glu Arg Ala Asn Arg Met Ala His Trp Leu
2050 2055 2060
Ile Ala Gln Gly Ile Gly Ala Glu Ser Arg Val Val Val Leu Leu Pro
2065 2070 2075 2080
Arg Ser Ala Asp Leu Val Ala Ala Leu Leu Ala Val Trp Gln Ala Gly
2085 2090 2095
Gly Cys Tyr Val Pro Val Asp Pro Asp Tyr Pro Ala Ala Arg Val Arg
2100 2105 2110
Ser Val Ile Asp Asp Cys Ala Ala Thr Leu Val Leu Asp Glu Asn Leu
2115 2120 2125
Leu Asp Arg Thr Asp Leu Ser Arg Tyr Pro Ala His Ala Pro Ala Ile
2130 2135 2140
Ala Val Ala Pro Gly Gln Ala Ala Tyr Thr Ile Tyr Thr Ser Gly Ser
2145 2150 2155 2160
Thr Gly Lys Pro Lys Gly Val Val Ile Gly His Asp Ala Leu Thr Asn
2165 2170 2175
Phe Leu Ala Ser Met Gln Arg Thr Leu Arg Leu Ser Ala Gln Asp Arg
2180 2185 2190
Phe Ala Ala Val Thr Thr Ile Ala Phe Asp Ile Ala Ala Leu Glu Leu
2195 2200 2205
Phe Leu Pro Leu Thr Thr Gly Ala Arg Val Val Leu Ala Asn Arg Glu
2210 2215 2220
His Val Ala Asn Pro Pro Ala Met Leu Asp Leu Val Glu Gln Thr Gly
2225 2230 2235 2240
Val Thr Val Met Gln Ala Thr Pro Ala Leu Trp Gln Met Leu Ala Thr
2245 2250 2255
His Asp Val Arg Arg Leu Ser Gly Val Arg Val Leu Thr Gly Gly Glu
2260 2265 2270
Ala Leu Pro Arg Pro Leu Ala Glu Gly Leu Cys Ala His Ala Ala Gln
2275 2280 2285
Val Ile Asn Leu Tyr Gly Pro Thr Glu Thr Thr Val Trp Ser Thr Leu
2290 2295 2300
Ala Asp Val Ala Thr Cys Lys Pro Pro Ser Ile Gly Thr Pro Ile Ala
2305 2310 2315 2320
Asn Thr Gln Val Leu Ile Leu Asp Ser Ala Leu Arg Pro Val Pro Pro
2325 2330 2335
Gly Val Gly Gly Asp Leu Trp Ile Ala Gly Asp Gly Leu Ala Arg Gly
2340 2345 2350
Tyr His Arg Gln Pro Gly Leu Thr Ala Ser Arg Phe Val Ala Asn Pro
2355 2360 2365
Phe Gly Pro Gln Gly Ala Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg
2370 2375 2380
Trp Ser Glu Ser Gly Arg Ile Glu Phe Leu Gly Arg Ala Asp Phe Gln
2385 2390 2395 2400
Ile Lys Leu Arg Gly Phe Arg Ile Glu Pro Gly Asp Val Glu His Ala
2405 2410 2415
Leu Thr Arg His Pro Ala Val Arg Glu Ala Val Val Thr Ile Arg Glu
2420 2425 2430
Asp Gln Pro Asp Asp Lys Arg Leu Val Gly Tyr Val Val Val Ala Glu
2435 2440 2445
Asp Ala Glu Thr Pro Pro Thr Arg Glu Leu Gln Gln Phe Val Arg Glu
2450 2455 2460
Gln Leu Pro Asp Tyr Met Val Pro Ser Ala Val Val Thr Leu Pro Ala
2465 2470 2475 2480
Ile Pro Leu Thr Ala Asn Gly Lys Leu Asp Arg Ser Arg Leu Pro Arg
2485 2490 2495
Pro Glu Ala Ser Ser Thr Lys Tyr Arg Ala Pro Glu Ser Ala Arg Glu
2500 2505 2510
Val Ala Leu Cys Gly Ile Phe Ala Glu Val Leu Gly Ala Glu Arg Val
2515 2520 2525
Gly Val Asp Asp Asp Phe Phe Ala Leu Gly Gly His Ser Leu Leu Ala
2530 2535 2540
Thr Arg Leu Ala Ala Arg Leu Arg Ser Asp Leu Gly Val Glu Val Pro
2545 2550 2555 2560
Ile Arg Thr Ile Phe Ala Ala Pro Thr Val Ala Glu Leu Ala Arg Arg
2565 2570 2575
Trp Ser Gly Leu Ser Thr Ser Val Arg Lys Pro Leu Arg Arg Met Thr
2580 2585 2590
Glu Arg
<210> 22
<211> 3140
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio21 Protein
<400> 22
Met Ala Pro Val Ser Tyr Ala Gln Gln Arg Met Trp Phe Ile Asn Arg
1 5 10 15
Phe Glu Gly Gln Thr Ala Thr Tyr Asn Ile Pro Ile Leu Ile Arg Met
20 25 30
Arg Gly Gln Ile Asp Arg Asp Glu Leu Arg Ala Ala Phe Met Asp Val
35 50 55
Leu Ser Arg His Glu Ile Leu Arg Thr Val Tyr Asp Glu Leu Asp Gly
50 55 60
Gln Pro Leu Gln Arg Ile Ile Glu Pro Ala Glu Leu Ser Leu Pro Trp
65 70 75 80
Thr Asp Trp Gly Trp Val Ser Pro Gln Gln Val Asp Ser Ile Val Ala
85 90 95
Ala Ser Val Arg Glu Gly Phe Asp Leu Ser Val Asp Leu Pro Ile Arg
100 105 110
Ala Tyr Leu Leu Arg Pro Glu Pro Asp Val Ala Leu Leu Ala Val Val
115 120 125
Ile His His Ile Ala Gly Asp Gly Gly Ser Leu Gly Pro Phe Thr Arg
130 135 140
Asp Leu Ser Ala Ala Tyr Arg Ala Arg Leu Ala Gly Val Ala Pro Thr
145 150 155 160
Trp Asp Glu Leu Pro Val Gln Tyr Ser Asp Tyr Ala Leu Trp Gln Arg
165 170 175
Glu Leu Leu Gly Asp Glu Ser Asp Pro Asp Ser Val Phe Ser Thr Gln
180 185 190
Leu Arg Tyr Trp Arg Gln Glu Leu Asp Gly Val Ser Arg Pro Val Ala
195 200 205
Leu Pro Val Asp Arg Pro Arg Pro Ala Arg Ala Ser Tyr Arg Gly Asp
210 215 220
Asn His Gly Phe Glu Ile Pro Ala Ala Leu Phe Glu Lys Val Glu Arg
225 230 235 240
Leu Ala Gln Ser Tyr Asn Val Thr Val Pro Met Val Phe Gln Thr Ala
245 250 255
Leu Val Val Leu Leu His Arg Leu Gly Gly Asp Arg Asp Ile Thr Leu
260 265 270
Gly Ser Pro Ile Ala Gly Arg Thr Asp Gln Ala Leu Glu Asn Leu Val
275 280 285
Gly Phe Phe Val Asn Thr Trp Val Leu Arg Val Gly Val Cys Thr Gly
290 295 300
Asp Ser Phe Ala Gln Val Leu Glu Gln Val Arg Gln Lys Ala Ile Ala
305 310 315 320
Ala Tyr Asp His Gln Asp Leu Pro Phe Glu Arg Leu Val Glu Leu Leu
325 330 335
Arg Pro Gly Arg Ser Val Ala His His Pro Leu Phe Gln Val Thr Leu
340 345 350
Ala Trp Gln Asn Ser Val Arg Gln Glu Leu Asp Leu Pro Gly Val Thr
355 360 365
Ala Ser Met Glu Pro Val Ala Thr Gly Thr Ala Lys Phe Asp Leu Phe
370 375 380
Val Asn Leu Met Pro Asn His Ser Arg Arg Ser Val Thr Val Asp Leu
385 390 395 400
Glu Tyr Ala Thr Asp Leu Phe Asp Pro Ala Thr Val Glu Ala Ile Ala
405 410 415
Ala Arg Tyr Leu Arg Val Leu Glu Gln Val Val Glu Ser Pro Asp Leu
420 425 430
Gly Val Gly Ile Leu Asp Val Pro Ala Met Pro Ala Thr Arg Gly Glu
435 440 445
Arg Thr Val Asp Ala Gly Glu Arg Glu Lys Ile Leu Tyr Arg Trp Asn
450 455 460
Asp Thr Asp Arg Ser Phe Pro Cys Pro Gly Pro Ile His Leu Pro Phe
465 470 475 480
Glu Gln Gln Ala Ala Ala Arg Pro Asp Ala Ile Ala Val Arg Trp Ser
485 490 495
Gly Gly Thr Met Thr Tyr Arg Glu Leu Asn Arg Gln Ala Asn Arg Ile
500 505 510
Ala Trp Thr Leu Lys Arg Arg Gly Val Arg Pro Glu Thr Val Val Gly
515 520 525
Val Ala Val Arg Arg Gly Pro Leu Met Val Ala Ala Val Leu Gly Val
530 535 540
Leu Lys Ala Gly Gly Ala Tyr Leu Pro Ile Gly Ser Thr Leu Pro Ser
545 550 555 560
Asp Arg Val Ala Gly Met Leu Ala Asp Ala Ser Ala Thr Leu Val Leu
565 570 575
Thr Thr Glu Asp Thr Asn Arg Trp Thr Pro Pro Asp Gly Val Glu Leu
580 585 590
Leu Asp Val Gly Arg Ala Gly Leu Ala Leu Ser Leu Asp Gly Glu Ile
595 600 605
Asn Pro Glu Pro Val Ala Ser Ala Asp Asn Thr Ala Tyr Ile Ile Phe
610 615 620
Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Val Thr Val Ala His Arg
625 630 635 640
Pro Val His Asn Leu Leu Asn Trp Cys Tyr Arg Thr Phe Asp Phe Gly
645 650 655
Pro Asp Asp Val Ser Leu Cys Val Thr Ser Leu Asp Phe Asp Leu Ser
660 665 670
Val Phe Asp Ile Phe Gly Leu Leu Gly Ala Gly Gly Gly Phe Tyr Ile
675 680 685
Ala Asp Ala Thr Gln Gln Arg Asp Pro Glu Met Leu Leu Asp Val Leu
690 695 700
Leu Ser Glu Pro Ile Thr Phe Trp Asn Ser Val Pro Gly Thr Leu Asn
705 710 715 720
Gln Leu Ala Pro Leu Leu Pro Gln Thr Ala Gly Ser Pro Gly Val Gln
725 730 735
Asp Leu Arg Leu Val Phe Phe Ser Gly Asp Tyr Thr Pro Leu Ser Leu
740 745 750
Pro Asp Gln Val Arg Ala Val Phe Pro His Ala Glu Ile Ile Ser Leu
755 760 765
Gly Gly Ala Thr Glu Ala Thr Val Trp Ser Asn Phe Phe Pro Val Gly
770 775 780
Ala Ile Asp Pro Gln Trp Arg Ser Ile Pro Tyr Gly Arg Pro Ile Asp
785 790 795 800
Asn Ala Arg Tyr Tyr Val Leu Asp Glu Lys Leu Glu Pro Cys Ala Val
805 810 815
Gly Val Glu Gly Asp Leu Tyr Ile Gly Gly Pro Val Ile Ala Leu Gly
820 825 830
Tyr Val Asn Arg Pro Asp Leu Thr Ala Glu Arg Phe Ile Ala Asp Pro
835 840 845
Phe Gly Gly Val Pro Gly Gln Arg Ile Tyr Arg Thr Gly Asp Arg Ala
850 855 860
Ser Phe Phe Pro Asp Gly Asn Ile Cys Phe Leu Gly Arg Ala Asp Gly
865 870 875 880
Gln Val Lys Val Arg Gly Phe Arg Ile Glu Leu Gly Glu Ile Glu Tyr
885 890 895
Ala Leu Gly Arg His Pro Ala Val Arg Gln Gly Ile Ala Ile Thr Arg
900 905 910
Arg Asp Ser Val Gly Asp Leu Arg Leu Val Ser Tyr Val Leu Pro Asp
915 920 925
Leu Asp Thr Val Glu Ser Val Val Ala Ala Asp Glu Gln Val Arg Glu
930 935 940
Trp Gln Glu Ile Tyr Asp Gln Gly Tyr Leu Glu Val Thr Asp Gln Asp
945 950 955 960
Phe Gly Asp Asp Phe Asn Leu Trp Val Ser Ser Tyr Thr Gly Glu Pro
965 970 975
Ile Pro Val Gly Gln Met Arg Glu Trp Gln Asp Ala Ala Val Asp Arg
980 985 990
Ile Leu Ser Phe Thr Pro Arg Arg Val Leu Glu Val Gly Ala Gly Thr
995 1000 1005
Gly Leu Leu Leu Ala Arg Val Ala Gly Ser Val Glu Ala Tyr Trp Ala
1010 1015 1020
Thr Asp Phe Ser Glu Pro Val Ile Glu Arg Leu Gly Arg Gln Val Thr
1025 1030 1035 1040
Glu Ala Gly Trp Ala Glu Arg Val Arg Leu Leu Cys Arg Arg Ala Asp
1045 1050 1055
Asp Leu Asp Gly Ile Pro Arg Ile Phe Asp Thr Val Val Leu Asn Ser
1060 1065 1070
Val Val Gln Tyr Phe Pro Asn Glu Arg Tyr Leu Glu Gln Val Leu Asp
1075 1080 1085
Gly Val Trp Ala Met Leu Glu Pro Gly Gly Arg Leu Val Leu Gly Asp
1090 1095 1100
Ile Arg Arg Ala Arg Ser Leu Arg Ala Phe Gln Val Ala Val Gln Gln
1105 1110 1115 1120
Ala Lys His Gly Asn Leu Pro Pro Ala Gln Leu Arg Ser Ala Val Glu
1125 1130 1135
Gln Gly Leu Leu Leu Glu Lys Glu Leu Val Ile Asp Pro Glu Trp Phe
1140 1145 1150
Gln Arg Trp Ala Glu Arg Ala Gly Ala Ala Gly Val Asp Val Arg Leu
1155 1160 1165
Lys Glu Gly Ala Phe Gln Asn Glu Leu Thr Arg His Arg Tyr Glu Ile
1170 1175 1180
Val Val His Lys Pro Gly Thr Thr Glu Ala Gly Arg Pro Tyr Ala Val
1185 1190 1195 1200
Asp Thr Val Pro Arg Leu Glu Trp Asn Gly Asp Leu Asp Gly Leu Ala
1205 1210 1215
Glu Arg Ile Arg Thr Leu Gly Gly Pro Val Val Arg Ile Ala Gly Ile
1220 1225 1230
Pro Asn Ala Arg Val Ala Gln Glu Val Ala Ala Ala Arg Asp Leu Gly
1235 1240 1245
Leu Glu Glu Ser Glu Pro Pro Thr Ser Val Pro Val Asp Pro His Glu
1250 1255 1260
Met Ala Thr Trp Ala Ala Arg Gln Gly Trp Ser Ile Ala Leu Thr Trp
1265 1270 1275 1280
Ser Gly Ser Ala Val Asp Gln Phe Glu Ala Val Leu Phe Thr Asp Ala
1285 1290 1295
Thr Thr Glu His Arg Ala Leu Ser Gly Thr Tyr Leu Pro Val Ala Ala
1300 1305 1310
Ala Gly Thr Trp Ile Asn Asp Pro Ala Ala Ala Ala Gly Ile Thr Ala
1315 1320 1325
Leu Pro Ala Val Leu Arg Glu Tyr Leu Ser Lys Thr Leu Pro Glu Tyr
1330 1335 1340
Met Val Pro Ser Ala Ile Val Pro Ile Gly Arg Val Pro Leu Thr Pro
1345 1350 1355 1360
Asn Gly Lys Leu Asp Arg Ala Ala Leu Pro Val Pro Glu Tyr Ala Ala
1365 1370 1375
Ala Ser Arg Gly Arg Pro Pro Cys Thr Ser Glu Glu Glu Ser Leu Cys
1380 1385 1390
Glu Ile Phe Ala Gly Val Leu Gly Leu Asp Arg Val Gly Val Asp Asp
1395 1400 1405
Asn Phe Phe Thr Ile Gly Gly His Ser Leu Leu Ala Thr Arg Val Val
1410 1415 1420
Ser Arg Ile Arg Ala Ala His Gly Val Glu Ile Pro Ile Arg Thr Ile
1425 1430 1435 1440
Phe Glu Ala Pro Thr Val Ala Glu Leu Val Ala His Leu Thr Gly Gln
1445 1450 1455
Arg Thr Val Arg Pro Pro Leu Arg Pro Gln Pro Arg Pro Asp Arg Leu
1460 1465 1470
Pro Val Ser Phe Ala Gln Gln Arg Leu Trp Phe Ile His Arg Phe Glu
1475 1480 1485
Gly Pro Ser Pro Thr Tyr Ile Ile Pro Leu Ser Met Arg Leu Arg Gly
1490 1495 1500
Lys Leu Asp Val Pro Ala Leu Arg Gln Ala Val His Asp Val Val Val
1505 1510 1515 1520
Arg His Glu Ser Leu Arg Thr Val Phe Asp Glu Val Asp Gly Ala Pro
1525 1530 1535
Tyr Gln Arg Val Leu Asp Pro Asp Gly Leu Ala Ile Pro Trp Gln Glu
1540 1545 1550
His Glu Val Thr Glu Ser Ala Leu Gln Glu Ala Leu Arg Leu Glu Ala
1555 1560 1565
Arg Arg Pro Phe Asp Leu Ala Ala Glu Ile Pro Val Arg Ala Ala Leu
1570 1575 1580
Phe Arg Val Gly Glu His Asp Ala Val Leu Leu Leu Pro Leu His His
1585 1590 1595 1600
Ile Ala Ala Asp Gly Trp Ser Leu Gly Pro Leu Ala Glu Asp Leu Thr
1605 1610 1615
Ala Ala Tyr Thr Ala Arg Cys Asp Gly Gln Arg Pro Gln Trp Ala Ala
1620 1625 1630
Leu Pro Val Gln Tyr Ala Asp Tyr Thr Leu Trp Gln Arg Asp Leu Leu
1635 1640 1645
Gly Gly Asp Asp Pro His Ser Leu Tyr Arg Arg Gln Leu Asp Tyr Trp
1650 1655 1660
Thr Gly Gln Leu Ala Gly Leu Pro Glu Ser Leu Gln Leu Pro Thr Asp
1665 1670 1675 1680
Arg Ala Arg Pro Ala Val Ala Ser Phe Ala Gly Glu Val Leu Pro Val
1685 1690 1695
Glu Leu Asp Glu Ser Leu Thr Glu Asp Leu Arg Lys Leu Ala Leu Arg
1700 1705 1710
Thr Gly Thr Thr Val Ser Met Val Leu Gln Ala Gly Leu Ala Gly Leu
1715 1720 1725
Leu Ser Lys Leu Gly Ala Gly Asn Asp Ile Pro Ile Gly Ser Pro Ile
1730 1735 1740
Ala Gly Arg Thr Asp Glu Ala Leu Asn Arg Leu Val Gly Phe Phe Val
1745 1750 1755 1760
Asn Thr Trp Val Ala Arg Val Asp Thr Ser Gly Ser Pro Ser Leu Ile
1765 1770 1775
Glu Leu Val Asp Arg Val Arg Glu Val Ser Leu Ala Ala Tyr Asp His
1780 1785 1790
Gln Asp Ile Pro Phe Glu His Leu Val Glu Ala Leu Asn Pro Val Arg
1795 1800 1805
Ser Thr Ala His His Pro Leu Phe Gln Val Cys Leu Ala Leu Gln Asn
1810 1815 1820
Asn Val Gln Pro Ala Phe Asp Leu Pro Gly Leu Lys Val Ser His Glu
1825 1830 1835 1840
Pro Val Asp Met Gly Val Ser Arg Phe Asp Leu Phe Leu Asn Leu Met
1845 1850 1855
Glu Glu Thr Thr Gly Glu Gly Thr Ser Arg Ile Ala Gly Val Val Glu
1860 1865 1870
Tyr Ala Thr Glu Leu Phe Asp Arg Asp Thr Val Thr Gly Leu Leu Glu
1875 1880 1885
Arg Trp Arg Arg Leu Leu Arg Gln Trp Val Gly Ala Pro Asp Ala Pro
1890 1895 1900
Ile Asp Ala Val Glu Ile Leu Asn Arg Asp Asp Leu Ala Ala Leu Glu
1905 1910 1915 1920
Arg Trp Thr Gly Arg Ala Arg Gly Thr Asp Arg Val Val Gly Thr Ile
1925 1930 1935
Pro Glu Arg Phe Ala Ala Val Val Ala Glu Gln Pro Glu Ala Val Ala
1940 1945 1950
Leu Val Ala Ala Asp Gly Glu Glu Ser Trp Thr Tyr Gly Glu Leu Asp
1955 1960 1965
Arg Trp Ala Asn Arg Ile Ala His His Leu His Ala Arg Gly Val Gly
1970 1975 1980
Arg Gln His Arg Val Ala Leu Val Met Glu Arg Ser Pro Leu Leu Val
1985 1990 1995 2000
Ala Ala Val Leu Gly Thr Leu Lys Ala Gly Ala Cys Tyr Val Pro Val
2005 2010 2015
Glu Pro Thr Trp Pro Arg Ala Arg Ile Asp Leu Val Leu Ala Asp Leu
2020 2025 2030
Asp Pro Ala Leu Val Ile Asp Glu Arg Leu Ala Glu Glu Asp Leu Thr
2035 2040 2045
Gly Tyr Pro Thr Arg Pro Leu Asp Thr Ala Asp Val Gly Gly Glu His
2050 2055 2060
Leu Ala Tyr Leu Met Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly
2065 2070 2075 2080
Val Glu Val Ser His Arg Asn Val Leu Ser Leu Ala Leu Asp Pro Cys
2085 2090 2095
Trp Ala Asp Ala Asp His Gln Arg Val Leu Val His Ala Pro Pro Thr
2100 2105 2110
Phe Asp Ala Ser Thr Tyr Glu Met Trp Val Pro Leu Leu His Gly Gly
2115 2120 2125
Ala Ala Val Val Ala Pro Pro Gly Lys Leu Asp Ala Ala Arg Leu Ala
2130 2135 2140
Thr Leu Ile Ala Glu Arg Gly Val Thr Ala Leu Trp Leu Pro Ala Gly
2145 2150 2155 2160
Leu Phe Asp Leu Ile Thr Gln His His Pro Lys Ser Phe Val Gln Val
2165 2170 2175
Arg Glu Val Trp Ala Gly Gly Asp Val Leu Ser Pro Ala Ala Val Arg
2180 2185 2190
Arg Leu Val Arg Asp Asp Gly Thr Leu Thr Val Val Asn Gly Tyr Gly
2195 2200 2205
Pro Thr Glu Thr Thr Thr Phe Ala Ala Arg Tyr Arg Met Ser Ala Pro
2210 2215 2220
Ala Arg Cys Lys Asp Pro Leu Pro Ile Gly Glu Pro Met Ala Gly Ser
2225 2230 2235 2240
Arg Leu Tyr Ala Leu Asp Asp Arg Leu Arg Gln Val Pro Gln Gly Val
2245 2250 2255
Ile Gly Glu Leu Tyr Val Gly Gly Asp Gly Val Ala Arg Gly Tyr Ala
2260 2265 2270
Asn His Pro Pro Leu Thr Ser Glu Arg Phe Val Ala Asp Pro Phe Gly
2275 2280 2285
Arg Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Val Arg Trp Asn
2290 2295 2300
His Asp Gly Gln Leu Glu Phe Leu Gly Arg Val Asp Glu Gln Val Lys
2305 2310 2315 2320
Ile Arg Gly Phe Arg Val Glu Pro Gly Glu Ile Arg Ala Ala Leu Arg
2325 2330 2335
Lys Arg Asp Gly Val Ala Gln Ala Val Val Val Pro Arg Thr Asp Arg
2340 2345 2350
Leu Gly Glu Arg Arg Leu Val Ala Tyr Val Val Pro Glu Val Pro Ala
2355 2360 2365
Gly Ala Asp Glu Asp Ser Thr Glu His Val Glu Lys Trp Arg Ala Ile
2370 2375 2380
Tyr Asp Ser Met Tyr Asp Glu Thr Glu Ala Asp Ala Thr Glu Ile Gly
2385 2390 2395 2400
Asn Asp Phe Thr Gly Trp Lys Ser Ser Tyr Thr Arg Asp Asn Ile Pro
2405 2410 2415
Leu Ser Glu Met Arg Arg Trp Arg Asp Ser Val Val Glu Glu Val Arg
2420 2425 2403
Gly Leu Arg Ala Arg Arg Ile Leu Glu Ile Gly Val Gly Ser Gly Leu
2435 2440 2445
Leu Leu Gly Pro Leu Ala Pro Glu Ala Glu Ala Tyr Trp Gly Thr Asp
2450 2455 2460
Phe Ser Leu Pro Val Ile Glu Arg Leu Glu Val Gln Val Gly Thr Asp
2465 2470 2475 2480
Pro Cys Leu Lys Glu Lys Val Ser Leu Arg Cys Gln His Ala Asp Val
2485 2490 2495
Ala Asp Gly Leu Pro Val Lys Tyr Phe Asp Thr Val Ile Leu Asn Ser
2500 2505 2510
Val Val Gln Tyr Phe Pro Asp Ala Ala Tyr Leu Ser Arg Val Leu Asp
2515 2520 2525
Val Ala Leu Asp Arg Leu Ala Pro Gly Gly Arg Ile Leu Val Gly Asp
2530 2535 2540
Val Arg Asn Tyr Gly Thr Leu Arg Glu Phe Leu Thr Ala Val His His
2545 2550 2555 2560
Ala Gln His Pro Gln Asp Ser Ala Ser Ala Val Arg Ala Ala Val Glu
2565 2570 2575
Arg Ala Val Leu Ala Glu Lys Glu Leu Val Ile Asp Pro Asp Phe Phe
2580 2585 2590
Thr Glu Trp Ala Arg Thr Arg Pro Asp Val Val Ala Val Asp Ile Arg
2595 2600 2605
Leu Lys Pro Gly Ala Asp Gln Asn Glu Leu Thr Arg His Arg Tyr Glu
2610 2615 2620
Val Ile Leu His Lys Gln Pro Ser Gln Pro Leu Arg Leu Ala Asp Val
2625 2630 2635 2640
Arg Thr Ala Asn Trp Gly Ser Glu Val Pro Asp Leu Ser Gly Leu Glu
2645 2650 2655
Thr Ala Leu Ala Arg His Gly Gly Arg Leu Arg Leu Ala Arg Ile Pro
2660 2665 2670
Asn Ala Arg Leu Val Ser Glu Ala Val Gln Cys Gly Val Pro Thr Asn
2675 2680 2685
Val Gly Gly Thr Pro Leu Asp Pro His Glu Leu Ala Ser Trp Gly Gly
2690 2695 2700
Gln Arg Gly Tyr Ser Val His Cys Thr Trp Ser Ala Glu Ala Pro Gly
2705 2710 2715 2720
Trp Phe Glu Ala Val Ile Ile Pro Val Asp Ser Gly His Cys Arg Asp
2725 2730 2735
Gly Val Tyr Arg Pro Val Gly Pro Arg Pro Arg Gln Leu Val Asn Leu
2740 2745 2750
Pro Ala Ala Ala Arg Arg Val Ser Arg Leu Pro Ser Trp Leu Arg Glu
2755 2760 2765
Glu Leu Ala Ala Glu Leu Pro Glu His Leu Val Pro Gly Asp Ile Val
2770 2775 2780
Val Met Glu Arg Leu Pro Leu Thr Thr Asn Gly Lys Ile Asp His Ser
2785 2790 2795 2800
Arg Leu Pro Glu Val Glu Gln Ala Asp Arg Glu Tyr Gly Ser Pro Arg
2805 2810 2815
Thr Pro Leu Glu Ala Glu Leu Ala Gly Leu Phe Ala Glu Val Leu Gly
2820 2825 2830
Val Asp Arg Val Gly Ile Glu Asp Asp Phe Phe Asp Cys Gly Gly Ser
2835 2840 2845
Ser Leu Gln Val Ile Arg Leu Ile Trp Arg Ile Arg Ala Glu Leu Gly
2850 2855 2860
Phe Asp Ile Pro Val Arg Thr Ile Phe Gln His Pro Thr Val Ala Glu
2865 2870 2875 2880
Val Ala Glu His Leu Ala Ala Gly Arg Glu Asp Val Glu Phe Asp Asp
2885 2890 2895
Pro Phe Ser Val Val Leu Pro Ile Arg Thr Asp Gly Asp Arg Ala Pro
2900 2905 2910
Ile Trp Leu Val Pro Pro Gly Gly Gly Leu Ser Trp Ala Tyr Leu Gly
2915 2920 2925
Phe Ala Gln His Leu Asp Arg Ser Arg Pro Ile Tyr Gly Leu Gln Ala
2930 2935 2940
Arg Gly Phe Val Gly Asp Pro Arg Ala Thr Ser Ile Glu Ser Met Val
2945 2950 2955 2960
Asp Asp Tyr Val Asp Gln Ile Leu Arg Val Gln Pro Glu Gly Pro Tyr
2965 2970 2975
Asn Val Leu Gly Trp Ser Leu Gly Gly Pro Ile Ala Gln Ala Val Ala
2980 2985 2990
Ala Glu Leu Gln Arg Arg Glu Cys Glu Val Asp Leu Leu Ala Val Leu
2995 3000 3005
Asp Ser Gly Pro Ala Ser Tyr Phe Ala Asp Phe Gln Thr Pro Asp Glu
3010 3015 3020
Lys Leu Val Arg Arg Tyr Leu Ala His Tyr Met Gly His Leu Ala Gly
3025 3030 3035 3040
Met Ala Glu Phe Glu Ser Leu Val Gln Thr Ser Thr Thr Leu Phe Ile
3045 3050 3055
Glu His Thr Asp Leu Met Thr Gln Phe Thr Ser Pro Pro Phe Arg Gly
3060 3065 3070
Asp Leu Ile Phe Phe Ala Ala Leu Ile Asp Gln Gly Thr Arg Glu Arg
3075 3080 3085
Arg Gln Leu Glu Val Glu Leu Asp Val Gln Trp Arg Glu Tyr Thr Glu
3090 3095 3100
Gly Thr Val Arg Arg Phe Asp Ile Glu Cys Ala His Asn Glu Met Met
3105 3110 3115 3120
Trp Pro Glu Asn Ala Ala Met Ile Ser Arg Ile Val Asn Glu Ile Ile
3125 3130 3135
Asp Ser Ala Arg
3140
<210> 23
<211> 71
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio22 Protein
<400> 23
Met Ser Val Asn Pro Phe Asp Asp Glu Asp Gly Glu Phe Tyr Val Leu
1 5 10 15
Val Asn Asp Glu Glu Gln His Ser Leu Trp Pro Thr Phe Gly Asp Val
20 25 30
Pro Asp Gly Trp Arg Ile Val Phe Gly Pro Ala Gly Arg Ala Glu Ser
35 40 45
Val Ala Tyr Val Glu Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu
50 55 60
Arg Glu Ala Met Ser Ala Ala
65 70
<210> 24
<211> 874
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio23 Protein
<400> 24
Val Arg Arg Cys Arg Gln His Asp Val Arg Arg Gly Leu Ala Gly Arg
1 5 10 15
Arg Val Arg Leu Arg Ala His Asp Phe Glu Leu Pro Arg Arg Arg Trp
20 25 30
Arg Lys Val Arg Thr Glu Val Phe Thr Gly Cys Leu Gly Ile Glu Leu
35 40 45
Gly Cys Gly Lys Pro Glu Ile Ala Gly Gly Val Ile Ser Pro Gly His
50 55 60
Pro Ala Gly Ser Ala Ser Arg Ala Arg His Phe Gly Gly Pro Met Thr
65 70 75 80
Val Ala Ser Pro Arg Gln Ser Arg Glu Asp Leu Ser Leu Val Pro Asp
85 90 95
Thr His Asp Val Ile Arg Val Val Gly Ala Arg Glu Asn Asn Leu Lys
100 105 110
Asp Ile Arg Leu Glu Ile Pro Lys Arg Arg Leu Thr Val Phe Thr Gly
115 120 125
Val Ser Gly Ser Gly Lys Ser Ser Leu Val Phe Asp Thr Ile Ala Ala
130 135 140
Glu Ser Gln Arg Leu Ile Asn Glu Thr Tyr Ser Ala Phe Val Gln Gly
145 150 155 160
Phe Met Pro Thr Leu Ser Arg Pro Asp Val Asp Val Leu Asp Gly Leu
165 170 175
Thr Thr Ala Ile Ile Val Ser Gln Glu Arg Ile Gly Asn Asn Pro Arg
180 185 190
Ser Thr Val Gly Thr Val Thr Asp Ala Asn Ala Met Leu Arg Ile Leu
195 200 205
Phe Ser Arg Leu Gly Glu Pro Arg Leu Gly Ser Pro Arg Ser Tyr Ser
210 215 220
Phe Asn Ile Pro Ser Ile Ser Val Ala Asn Ala Val Thr Val Gly Gln
225 230 235 240
Gly Ser Arg Ala Val Glu Glu Gln Arg Gly Phe Asp Val Ala Gly Gly
245 250 255
Met Cys Pro Arg Cys Glu Gly Thr Gly Ser Val Asn Asp Val Asp Leu
260 265 270
Thr Gln Leu Tyr Asp Ala Thr Lys Ser Leu Asp Glu Gly Ala Ile Arg
275 280 285
Val Pro Gly Tyr Gln Val Gly Gly Tyr Asn His Arg Leu Tyr Ala Gly
290 295 300
Ser Gly Leu Leu Asp Pro Gly Lys Pro Val Glu Lys Tyr Thr Glu Lys
305 310 315 320
Glu Leu Asn Asp Phe Leu His Arg Glu Pro Thr Arg Leu Lys Ile Gly
325 330 335
Asp Tyr His Thr Asn Tyr Glu Gly Leu Val Ala Arg Val Gln Lys Ser
340 345 350
Leu Leu Thr Lys Asp Ile Glu Ala Leu Gln Pro His Val Arg Ala Phe
355 360 365
Val Glu Arg Ala Val Thr Phe Thr Ala Cys Pro Asp Cys Gly Gly Thr
370 375 380
Arg Leu Asn Glu Gln Ala Arg Ala Ser Arg Ile Lys Gly Ile Asn Ile
385 390 395 400
Ala Asp Ala Ser Ala Met Gln Ile Asn Asp Leu Ala Glu Trp Val Arg
405 410 415
Asp Leu Ala Glu Pro Ser Val Ala Pro Leu Leu Ala Thr Leu Leu His
420 425 430
Thr Leu Asp Ser Phe Val Gly Ile Gly Leu Gly Tyr Leu Ser Leu Asp
435 440 445
Arg Ala Ser Gly Thr Leu Ser Gly Gly Glu Ala Gln Arg Val Lys Met
450 455 460
Ile Arg His Leu Gly Ser Pro Leu Thr Asp Val Thr Tyr Val Phe Asp
465 470 475 480
Glu Pro Thr Ile Gly Leu His Pro His Asp Ile Gln Arg Met Asn Lys
485 490 495
Leu Leu Leu Arg Leu Arg Asp Lys Gly Asn Thr Val Leu Val Val Glu
500 505 510
His Lys Pro Glu Thr Ile Ala Ile Ala Asp Arg Val Val Asp Leu Gly
515 520 525
Pro Gly Ala Gly Thr Ala Gly Gly Thr Ile Cys Phe Glu Gly Thr Val
530 535 540
Ala Glu Leu Arg Ser Ala Asp Thr Leu Thr Gly Arg His Leu Asp Asp
545 550 555 560
Lys Ala Ser Leu Lys Asp Arg Val Arg Thr Pro Ser Gly Ser Leu Glu
565 570 575
Val Arg Gly Ala Ser Lys His Asn Leu Arg Asp Val Asp Val Asp Ile
580 585 590
Pro Leu Gly Val Leu Val Val Val Thr Gly Val Ala Gly Ser Gly Lys
595 600 605
Ser Ser Leu Ile Glu Gly Ser Val Ser Gly Arg Asp Gly Val Val Thr
610 615 620
Ile Asp Gln Gly Ser Ile Lys Gly Ser Arg Arg Ser Asn Pro Ala Thr
625 630 635 640
Tyr Thr Gly Leu Leu Asp Pro Ile Arg Lys Ala Phe Ala Lys Ala Asn
645 650 655
Gly Val Lys Pro Ala Leu Phe Ser Ser Asn Ser Glu Gly Ala Cys Ala
660 665 670
Thr Cys Lys Gly Ala Gly Val Ile Tyr Thr Asp Leu Ala Ile Met Ala
675 680 685
Gly Ala Ala Thr Thr Cys Asp Asp Cys Glu Gly Arg Arg Phe Gln Asp
690 695 700
Phe Val Leu Gln Tyr Arg Leu Gly Gly Arg Asp Ile Ser Glu Val Leu
705 710 715 720
Ala Met Ser Val Ala Glu Ala Gly Arg Phe Phe Ala Ala Gly Gln Ala
725 730 735
Arg Thr Pro Ala Ala Val Val Ile Leu Glu Arg Leu Ala Asp Val Gly
740 745 750
Leu Gly Tyr Leu Ser Leu Gly Gln Pro Leu Pro Thr Leu Ser Gly Gly
755 760 765
Glu Arg Gln Arg Leu Lys Leu Ala Ala His Leu Ala Asp Glu Gly Gly
770 775 780
Ile Val Val Leu Asp Glu Pro Thr Thr Gly Leu His Leu Ala Asp Val
785 790 795 800
Glu Gln Leu Leu Gly Leu Leu Asp Arg Leu Val Asp Ala Gly Arg Ser
805 810 815
Val Met Val Ile Glu His His Gln Ala Val Met Ala His Ala Asp Trp
820 825 830
Ile Ile Asp Leu Gly Pro Ala Ala Gly His Asp Gly Gly Arg Val Val
835 840 845
Phe Glu Gly Cys Pro Ala Asp Leu Val Ala Ser Arg Ala Thr Leu Thr
850 855 860
Gly Glu His Leu Ala Ala Tyr Val Gly Val
865 870
<210> 25
<211> 178
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio24 Protein
<400> 25
Val Gly Gly Arg Asn Ser Asp Val Val Phe Ile Arg Trp Pro Ala Gln
1 5 10 15
Ala Asp Leu Arg Thr Arg Cys Arg Lys Glu Gly Val Pro Arg Leu Leu
20 25 30
Val Val Glu Gly Gly Ala Gln Pro Pro Ile Ser Asn Asp Pro Val Glu
35 40 45
Asp Trp Val Arg Pro Pro Val Ser Arg Asn Asp Leu Glu Ala Arg Val
50 55 60
Lys Ala Leu Gln Gln Arg Phe Asn Ser Arg Arg Leu Pro Thr Ile Asp
65 70 75 80
Ser Thr Gly Thr Leu Thr Phe Gly Arg His Ser Ile Val Ile Ser Asn
85 90 95
Thr Gln Ala Glu Leu Met Arg Leu Leu Ile Glu Arg Phe Gly Glu Val
100 105 110
Val Tyr Arg Ile Glu Phe Val Gln Cys Leu Ala Ile Arg Thr Pro Ala
115 120 125
Leu Asn Arg Asn Ser Leu Asp Leu His Ile Met Arg Leu Arg Arg Arg
130 135 140
Leu Leu Pro Ile Asp Leu Ala Ile Arg Thr Val Trp Gly Arg Gly Tyr
145 150 155 160
Met Leu Ala Tyr Ala Ala Ser Ala Glu Ala Ile Ile Arg Asn Ala Ser
165 170 175
Gly Met
<210> 26
<211> 287
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio25 Protein
<400> 26
Val Ala Asp Ala Leu Ser Ser Arg Pro Cys Ser Thr Ala Ala Ile Lys
1 5 10 15
Arg Asp His Ile Met Leu Ser Ser His Thr Val Ile Val Leu His Ala
20 25 30
His Pro Asp Asp Glu Ala Ile Phe Thr Gly Leu Thr Met Arg Arg Leu
35 40 45
Ala Asp Ala Gly Ala Arg Val Ile Leu Val Met Ala Thr Asp Gly Ala
50 55 60
Ala Gly Val Pro His Val Pro Leu Ser Arg Gly Glu Ser Leu Arg Ser
65 70 75 80
Arg Arg Leu Ala Glu Leu Glu Arg Ala Cys Asp Leu Leu Gly Val Ala
85 90 95
Arg Leu Glu Val Leu Gly Tyr Ala Asp Ser Gly Ala His Gly Gly Pro
100 105 110
Tyr Arg Ala Gly Thr Leu Gly Ala Ala Ser Ala Thr Arg Val Ala Arg
115 120 125
Gln Val Ala Arg Ile Ala Ser Arg Glu Gly Ala Thr Thr Leu Val His
130 135 140
Tyr Asp Pro Gly Gly Ile Tyr Arg His Val Asp His Val Gln Val His
145 150 155 160
Arg Val Gly Ala Leu Val Thr Arg Ser Leu Gln Leu Ala Gly Tyr Gln
165 170 175
Ala Thr Val Asp Ala Ser Ala Leu Arg Ala Gly Pro Arg His Val Leu
180 185 190
Gln Arg Ala Ala Gly Asp Leu Thr Asp Met Gly Val Pro Ala Ser Arg
195 200 205
Ile Ser Leu Ala Val Asp Ala Glu Gly Ala Asp Leu Leu Ala Lys Met
210 215 220
Ala Ala Met Ala Thr His Ala Ser Gln Val Gly Ala Ala Asp Leu Asp
225 230 235 240
Pro Ser Cys Phe Ala Ala Ala Tyr Gly Arg Glu Trp Phe Val Arg Glu
245 250 255
Gly Arg Leu Gly Ala Leu Asp Ala Leu Leu Ala Ala Ser Ala Gly Pro
260 265 270
Ala Val Ala Thr His Arg Asn Leu Gln Leu Asp Gly Thr Ala Ile
275 280 285
<210> 27
<211> 134
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio26 Protein
<400> 27
Val Val Val Glu Leu Ala Tyr Thr Asp Pro Asp Arg Ala Val Asp Trp
1 5 10 15
Leu Val Arg Val Phe Gly Phe Arg Leu Leu Leu Arg Gln Pro Ala Ile
20 25 30
Gly Thr Ile Arg His Ala Asp Leu Asp Thr Gly Gly Gly Ile Val Met
35 40 45
Val Arg Arg Thr Gly Glu Pro Tyr Thr Val Ser Cys Ala Gly Gly His
50 55 60
Thr Cys Lys Gln Val Ile Val Trp Val Ser Asp Val Asp Glu His Phe
65 70 75 80
Met Arg Ser Thr Ala Ala Gly Ala Asp Ile Val Gln Pro Leu Gln Asp
85 90 95
Lys Pro Trp Gly Leu Arg Gln Tyr Leu Val Arg Asp Leu Glu Gly His
100 105 110
Leu Trp Glu Phe Thr Arg His Leu Arg Asp Val Pro Pro Arg Glu Trp
115 120 125
Gly Ala Val Ala Met Thr
130
<210> 28
<211> 1804
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio27 Protein
<400> 28
Val Gly Leu Gln Leu Leu Gly Ser Ala Thr Gln Ser Thr Glu Pro Asn
1 5 10 15
Leu Pro Gly Leu Thr Val Thr Ser Leu Asp Ala Asn Pro Gly Gly His
20 25 30
Pro Phe Asp Leu Ser Ile Thr Cys Thr Glu Ser Pro Asp Gln Leu Arg
35 40 45
Leu Val Ala Asp Tyr Ser Val Asp Leu Phe Asp Glu Pro Arg Met Ala
50 55 60
Arg Leu Leu Arg His Leu Glu Arg Val Leu Arg Thr Ala Val Asp Ala
65 70 75 80
Pro Asp Thr Pro Leu Ser Ala Leu Pro Leu Leu Asp Glu Glu Glu Gln
85 90 95
Thr Leu Leu Leu His Thr Trp Gln Gly Pro Gln Gly Glu Arg Ala Arg
100 105 110
Glu Pro Val His Val Gln Ile Ala Arg Leu Ala Ala Glu Arg Pro Asp
115 120 125
Leu Val Ala Ala Thr Leu His Gly Ala Glu Leu Thr Tyr Gly Glu Leu
130 135 140
Asp Arg Arg Ala Gly Val Leu Ala His Arg Phe Arg Ala Leu Gly Val
145 150 155 160
Gly Arg Asp Asp Ile Val Ala Leu Leu Leu Glu Arg Gly Phe Asp Leu
165 170 175
Ile Val Gly Met Val Ala Ala Gln Lys Ala Gly Gly Ala Phe Val Val
180 185 190
Met Asp Pro Gly His Pro Val Arg Arg Ile Glu Phe Ile Leu Glu Asp
195 200 205
Thr Ala Ala Lys Ala Val Val Thr Arg Ser Ala Leu Ala Asp Arg Leu
210 215 220
Pro Glu Gly Ala Ala Ala Thr Pro Val Leu Val Asp Thr Glu Trp Asp
225 230 235 240
Glu Leu Ser Ala Ala Ala Ala Gly Ala Ala Pro Leu Asp Glu Leu Ala
245 250 255
Asp Glu Asn Ser Leu Ala Tyr Val Leu Tyr Thr Ser Gly Ser Thr Gly
260 265 270
Lys Pro Lys Gly Val Met Ile Glu His His Ala Leu Asn Thr Phe Leu
275 280 285
Leu Trp Leu Gly Asn Ile Phe Asp Phe Gly Pro Gly Asp Arg Leu Leu
290 295 300
Gln His Met Ala Pro Ile Phe Asp Phe Ala Glu Gly Glu Ile Phe Thr
305 310 315 320
Ala Leu Thr Arg Gly Val Thr Met Val Phe Val Pro Glu Glu His Arg
325 330 335
Thr Asp Pro Asp Val Ile Gly Gln Leu Leu Val Ser Glu Arg Ile Thr
340 345 350
Tyr Ile Gly Gly Pro Pro Ala Ile Leu Gly Arg Ile Pro Pro Gly Ser
355 360 365
Tyr Pro Asp Leu Lys Tyr Met Ile Ala Gly Gly Glu Ala Val Thr Gly
370 375 380
Asp Leu Ile Asn Arg Trp Asn Thr Pro Gly Arg Arg Phe Ile Asn Gly
385 390 395 400
Tyr Gly Pro Thr Glu Ala Ala Val Gly Cys Ile Phe Tyr Glu Cys Glu
405 410 415
His Arg Thr Trp Ile Gly Gln Pro Pro Ile Gly Arg Ala Met Pro Asn
420 425 430
Arg Val Ala Tyr Val Leu Asp Arg Trp Asn Asn Leu Gln Pro Val Gly
435 440 445
Val Pro Gly Glu Val Ile Thr Gly Gly Glu Gly Leu Ala Arg Gly Tyr
450 455 460
Leu Asn Arg Pro Glu Leu Thr Ala Glu Lys Phe Ile Asp Asn Pro Tyr
465 470 475 480
Arg Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Gly Val Trp Thr
485 490 495
Glu Asp Gly Gln Ile Gln Phe Leu Gly Arg Ile Asp Thr Gln Val Lys
500 505 510
Leu Asn Gly Leu Arg Ile Glu Leu Glu Glu Ile Glu Ser Thr Leu Thr
515 520 525
Ala His Pro Gly Val Ala Glu Ala Ala Val Ala Leu Arg Glu Asp Ser
530 535 540
Pro Gly Ser Lys Arg Leu Val Gly Tyr Val Val Pro Ala Gly Ala Ala
545 550 555 560
Ala Pro Pro Thr Glu Glu Leu Arg Glu His Leu Leu Ala Asp Leu Pro
565 570 575
Pro Tyr Met Val Pro His Val Phe Val Ala Leu Asp Val Leu Pro Leu
580 585 590
Thr Ser Val Gly Lys Val Asp Arg Asn Arg Leu Pro Val Pro Glu Glu
595 600 605
Thr Gly Ser Ala Glu Val Glu Leu Val Ala Pro Arg Thr Pro Glu Glu
610 615 620
Glu Arg Val Ala Glu Ile Phe Ala Ala Val Leu Gly Val Glu Arg Val
625 630 635 640
Gly Ala Asp Ala Asn Phe Phe Glu Leu Gly Gly Asn Ser Leu Met Ala
645 650 655
Ala Arg Val Leu Ser Arg Ile Ala Glu Leu Gly Gly Ala Ser Ala Thr
660 665 670
Met Arg Asp Phe Tyr Thr Lys Pro Arg Val Ser Glu Ile Ala Gln Leu
675 680 685
Leu Ala Gly Thr Pro Ser Ser Thr Asp Pro Ala Thr Pro Thr Asp Ala
690 695 700
Ala Pro Val Ala Asp Gln Thr Arg Ala Arg Leu Glu Gln Glu Ile Ala
705 710 715 720
Asp Leu Glu Gln Arg Leu Arg Ala Ala Arg Ala Ala Leu Ala Gly Gln
725 730 735
Asp Gly Pro Val Ser Gly Gly His Glu Gly Gln Arg Leu Pro Leu Ser
740 745 750
Pro Thr Gln Glu Gln Leu Trp Phe Leu Glu Gln Leu Ala Pro Gly Gln
755 760 765
Pro Thr Tyr His Ile Pro Val Pro Val Arg Leu Thr Gly Pro Leu Asp
770 775 780
Val Asp Leu Leu Gly Arg Ala Leu Thr Ala Val Val Ala Arg His Glu
785 790 795 800
Ala Leu Arg Thr Thr Phe Gly Thr Asp Asp Asp Thr Pro Tyr Gln Leu
805 810 815
Val Ser Pro Ala Gly Glu Val Pro Leu Pro Val His Glu Leu Asp Ala
820 825 830
Thr Ala Ala Asp Asp Arg Glu Gln Ala Leu Arg Val Glu Leu Glu Arg
835 840 845
Asp Ala Thr Glu Pro Phe Asp Leu Gly Arg Asp Leu Met Leu Arg Ala
850 855 860
Arg Leu Ile Arg Leu Asp Gly Gln Glu His Val Leu Ser Met Val Leu
865 870 875 880
His His Ile Cys Ala Asp Gly Trp Ser Ala Gly Leu Leu Val Arg Asp
885 890 895
Leu Ala Glu Leu Tyr Asp Ala Leu Arg His Asp Arg Gln Pro Gln Leu
900 905 910
Pro Ala Leu Arg Leu Gln Tyr Ala Asp His Ala Leu Ala Gln Arg Arg
915 920 925
Gln Leu Asp Ala Gly Asp Leu Glu Ser Gln Leu Ala Tyr Trp Ala Arg
930 935 940
Gln Leu Ala Asp Ala Pro Ile Leu Asp Leu Pro Ser Asp Arg Pro Arg
945 950 955 960
Pro Ala Thr Ala Thr Asn Arg Gly Ala Leu Leu Val Arg Arg Met Pro
965 970 975
Ala Asp Val Leu Glu Gly Leu Arg Arg Val Ala Gln Gln Glu Gln Ala
980 985 990
Ser Thr Tyr Ala Val Leu Leu Ala Gly Phe Lys Thr Val Leu Met Arg
995 1000 1005
Tyr Thr Gly Val Asp Asp Val Val Val Gly Thr Ala Gly Ala Gly Arg
1010 1015 1020
Gly Arg Pro Glu Leu Glu Asp Leu Val Gly Phe Phe Val Asn Met Leu
1025 1030 1035 1040
Ala Leu Arg Thr Asp Leu Ser Gly Asp Pro Ser Phe Gly Glu Ala Val
1045 1050 1055
Arg Arg Thr Met Gly Thr Leu Leu Ala Ala Trp Asp His Gln Asp Ala
1060 1065 1070
Pro Phe Glu Arg Val Val Gly Arg Leu Gly Arg Arg Arg Asp Ala Ser
1075 1080 1085
Arg Asn Pro Val Phe Gln Val Ser Ile Asp Leu Leu Ser Gly Asp Leu
1090 1095 1100
Val Asp Phe Arg Phe Pro Gly Leu Ala Ala Glu Phe Leu Asp Val Asp
1105 1110 1115 1120
Pro Gly Val Ser Arg Phe Asp Met Ala Ile Asn Ala Tyr Glu Glu Thr
1125 1130 1135
Asp Gly Ile Thr Phe Arg Ile Glu Tyr Ala Thr Asp Leu Phe Asp Thr
1140 1145 1150
Ala Arg Ile Glu Ala Met Phe Gly His Leu Glu Arg Val Leu Arg Ala
1155 1160 1165
Ala Val Ala Ala Pro Gln Thr Pro Leu Ser Ala Leu Pro Leu Leu Asp
1170 1175 1180
Asp Thr Glu Arg Thr Glu Leu Leu Ala Leu Ala Gln Gly Lys Arg Arg
1185 1190 1195 1200
Pro His Arg Pro Ala Thr Leu Pro Glu Leu Phe Ala Ala Ser Val Ala
1205 1210 1215
Arg Thr Pro Gln Ala Thr Ala Val Ile Ala Ala Glu Gly Thr Leu Ser
1220 1225 1230
Tyr Ala Glu Leu Asp Glu Arg Ser Arg Arg Leu Ala Ala Arg Leu Arg
1235 1240 1245
Ala Ala Gly Val Gly Thr Gly Asp Val Val Pro Val Leu Leu Glu Arg
1250 1255 1260
Ser Leu Ala Glu Val Val Ser Val Leu Ala Val Leu Arg Ala Gly Ala
1265 1270 1275 1280
Ala Tyr Ala Pro Met Asp Pro Ala Ala Pro Pro Ser Arg Leu Ala Phe
1285 1290 1295
Gln Val Arg Asp Thr Gly Ala Arg Val Val Val Gly Asp Pro Thr Arg
1300 1305 1310
Leu Asp Thr Val Val Gly Val Thr Ile Val Asp Pro Ala Ala Glu Leu
1315 1320 1325
Pro Glu Ala Ala Asp Glu Pro Trp Leu Ala Glu Leu Thr Pro Ala Ser
1330 1335 1340
Leu Ala Tyr Val Leu Tyr Thr Ser Gly Ser Thr Gly Glu Pro Lys Gly
1345 1350 1355 1360
Val Leu Ile Glu His Gly Met Val Ala Gly Tyr Leu Glu Trp Met Val
1365 1370 1375
Pro Asp Phe Gly Val Glu Pro Arg Ser Arg Met Met His Cys Cys Ala
1380 1385 1390
Pro Val Phe Asp Leu Ala Val Gly Glu Leu Phe Gly Ala Leu Thr Ala
1395 1400 1405
Gly Ala Thr Val Val Val Ala Gly His Asp Asp Val His Arg Pro Gly
1410 1415 1420
Ala Leu Thr Ala Leu Ala Arg Glu Thr Gly Ala Thr His Ile Phe Thr
1425 1430 1435 1440
Thr Pro Thr Val Leu Gly Leu Leu Asp Pro Ala Glu Leu Pro Gln Leu
1445 1450 1455
Arg Ser Val Met Met Ala Gly Glu Pro Ala Pro Pro Ser Leu Val Ala
1460 1465 1470
Ala Trp His Val Asp Gly Arg Arg Val Leu Asn Leu Tyr Gly Pro Ala
1475 1480 1485
Glu Thr Thr Val Gly Cys Thr Trp Tyr Glu Cys Pro Ala Gly Thr Ala
1490 1495 1500
Pro Ala Ala Thr Val Pro Ile Gly Arg Pro Met Pro Asn Arg Arg Val
1505 1510 1515 1520
Tyr Val Val Asp Asp Ser Gly Asp Leu Ala Pro Val Gly Val Pro Gly
1525 1530 1535
Glu Leu Val Val Ala Gly Asn Gly Val Ala Arg Gly Tyr Leu Asp Arg
1540 1545 1550
Pro Glu Leu Thr Ala Ser Ala Phe Gly Ala Asp Glu Arg Ala Gly Glu
1555 1560 1565
Gly Arg Ala Tyr Arg Thr Gly Asp Leu Ala Arg Trp Asn Arg Asp Gly
1570 1575 1580
Gln Leu Glu Phe Leu Gly Arg Arg Asp Gly Gln Val Lys Leu Arg Gly
1585 1590 1595 1600
Leu Arg Val Glu Leu Gly Glu Val Glu His Ala Leu Arg Thr Ala Ala
1605 1610 1615
Gly Val Ser Gly Ala Ala Ala Ala Val His Gly Thr Gly Ala Glu Ala
1620 1625 1630
Val Leu Val Gly Tyr Val Val Gly Glu Leu Ser Asp Asp Asp Ala Glu
1635 1640 1645
Ala Leu Arg Thr Thr Leu Ala Gly Lys Leu Pro Gly Tyr Met Val Pro
1650 1655 1660
Asn Val Val Leu Arg Leu Pro Gln Leu Pro Leu Thr Arg Thr Gly Lys
1665 1670 1675 1680
Val Asp Arg Lys Arg Leu Pro Ala Pro Glu Ser Gly Ala Gly Gln Ala
1685 1690 1695
Ala Tyr Val Pro Pro Gly Thr Asp Asp Glu Arg Leu Ile Ala Gly Val
1700 1705 1710
Phe Ala Asp Leu Leu Gly Leu Glu Arg Ala Gly Arg Glu Asp Glu Phe
1715 1720 1725
Phe Leu Ser Gly Gly Asn Ser Leu Gln Ala Ile Arg Ala Val Gly Arg
1730 1735 1740
Leu Asn Asp Ala Leu Gly Val Pro Leu Thr Val Arg Asp Phe Tyr Ala
1745 1750 1755 1760
Ala Pro Thr Val Ala Ala Leu Ala Glu Leu Ala Gly Arg Arg Arg Ala
1765 1770 1775
Ala Glu Gln Ala Ala Gln Trp Gln Leu Leu Asp Glu Ile Glu Gln Leu
1780 1785 1790
Ser Asp Asp Glu Val Glu Arg Leu Leu Ala Ala Asp
1795 1800
<210> 29
<211> 1345
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> Tio28 Protein
<400> 29
Met Ser Asp Glu Thr Phe Asp Gly Arg Val Ala Arg Leu Asp Glu Arg
1 5 10 15
Arg Arg Leu Leu Leu Glu Arg Met Arg Gln Gln Arg Arg Gln Pro Pro
20 25 30
Ala Thr Ile Gly Ala Arg Pro Ala Gly Asp Glu Arg Val Pro Leu Ser
35 40 45
Arg Ala Gln Glu Gln Leu Trp Phe Leu Ala Gln Leu Ala Pro Ala Glu
50 55 60
Pro Thr Tyr Asn Leu Val Gln Ala Ser Tyr Leu Thr Gly Glu Val Asp
65 70 75 80
Pro Ala Ala Leu Arg Arg Ala Leu Asp Gly Val Val Ala Gln His Glu
85 90 95
Ala Leu Arg Thr Val Val Glu Ser Val Asp Gly Val Ala Tyr Gln Arg
100 105 110
Val Leu Pro Pro Gly Pro Ala Ser Leu Val Val Asp Asp Val Ser Arg
115 120 125
Leu Pro Glu Glu Gln Arg Arg Pro Ala Ala Leu Thr Leu Leu Gln Gln
130 135 140
Gln Glu Val His Arg Pro Phe Asp Leu Ala Thr Gly Pro Leu Phe Arg
145 150 155 160
Ala Arg Leu Val Arg Leu Gly Pro Thr Glu His Ala Leu Ala Val Ala
165 170 175
Ala His His Ile Val Val Asp Gly Trp Ser Met Gly Leu Ile Leu Arg
180 185 190
Glu Leu Ala Ala Ala Tyr Asp Ala Asp Arg His Gly Thr Arg Ala Arg
195 200 205
Leu Asp Pro Pro Ala Leu Gln Tyr Pro Asp Phe Ala Arg Trp Gln His
210 215 220
Gln Gln Leu Ala Thr Ala Glu Leu Asp Asn His Leu Arg Tyr Trp Ala
225 230 235 240
Gln Arg Leu Ala Asp Leu Pro Thr Leu Glu Leu Pro Ala Asp Arg Pro
245 250 255
Arg Pro Thr Thr Ala Ser Phe Arg Gly Ala Leu Leu Glu Gln Pro Leu
260 265 270
Asp Pro Gln Leu His Ala Gly Val Gln Ala Leu Ala Lys Glu Thr Gly
275 280 285
Ala Ser Pro Phe Met Val Leu Val Ala Ala Phe Ala Ala Met Leu Ala
290 295 300
Arg Tyr Thr Gly Thr Asp Asp Leu Ala Val Gly Thr Thr Phe Ser Gly
305 310 315 320
Arg Ser Arg Pro Glu Leu Glu Ser Val Val Gly Phe Phe Ala Asn Met
325 330 335
Gly Val Leu Arg Leu Asp Thr Ser Gly Asp Pro Ser Phe Ala Thr Leu
340 345 350
Val Asp Arg Ala Arg Asp Thr Cys Leu Gly Ala Trp Glu His Gln Asp
355 360 365
Ala Pro Phe Glu Arg Val Val Gln Arg Leu Ala Pro Pro Arg Asp Pro
370 375 380
Gly Arg Asn Pro Leu Phe Gln Val Ala Val Gln Leu Leu Asp Gly Ser
385 390 395 400
Thr Trp Gly Gly Pro Thr Leu Pro Gly Thr Asp Ser Thr Pro Val Asp
405 410 415
Leu Arg Leu Asp Arg Ser Arg Phe Asp Met Met Val Ser Leu Val Asp
420 425 430
His Gly Asp Arg Tyr Ser Val Leu Thr Glu Tyr Ser Thr Asp Leu Phe
435 440 445
Asp Ala Arg Arg Val Arg Ala Met Leu Asp His Val Ala Arg Leu Leu
450 455 560
Asp Ala Gly Leu Ala Asp Pro Ala Thr Thr Leu Ser Arg Leu Pro Met
465 470 475 480
Leu Asp Pro Ala Glu Arg Glu Arg Val Leu Ala Leu Gly Ala Gly Glu
485 490 495
Arg Arg Asp Val Ala Pro Ala Thr Val His Gln Leu Val Arg Ala Gln
500 505 510
Ala Glu Arg Asn Pro Asp Ala Val Ala Val Arg His Gly Asp His Glu
515 520 525
Leu Thr Tyr Arg Glu Leu Leu Asp Arg Ala Ala Arg Arg Ala Ala Gly
530 535 540
Leu Arg Asp Ala Gly Leu Arg Pro Gly Asp Arg Val Pro Ala Leu Leu
545 550 555 560
Asp Arg Gly Val Asp Glu Val Leu Thr Pro Met Ala Ile Trp His Ala
565 570 575
Gly Gly Val Tyr Val Pro Leu Asp Thr Ala Ala Pro Pro Asn Arg Leu
580 585 590
Arg Arg Ile Leu Thr Asn Cys Ala Ala Arg Leu Val Leu Thr Arg Thr
595 600 605
Glu His Ala Ala Gly Val Pro Glu Gly Pro Trp Arg Thr Leu Leu Leu
610 615 620
Asp Thr Gly Asp Leu Asp Ser Ala Ala Gly Leu Ala Pro Glu Pro Ser
625 630 635 640
Thr Gly Pro Asp Asp Leu Ala Tyr Val Leu His Thr Ser Gly Thr Thr
645 650 655
Gly Asp Pro Lys Gly Val Gln Leu Pro His Arg Gly Phe Val Thr Tyr
660 665 670
Leu Asp Trp Met Arg Asp Gln Trp Arg Cys Gly Pro Gly Asp Arg Val
675 680 685
Leu His Gly Cys Ala Pro Val Phe Asp Leu Ala Ala Gly Glu Val Leu
690 695 700
Ala Ala Leu Thr Ser Gly Ala Thr Val Val Val Ile Gly Lys Asp Arg
705 710 715 720
Leu Leu Ser Pro Gly Gly Leu Ala Glu Val Leu Ala Ala Glu Arg Ile
725 730 735
Thr His Leu Phe Leu Thr Pro Thr Thr Leu Gly Leu Val Glu Asp Asp
740 745 750
Thr Asp Arg Phe Asp Ala Leu Arg Glu Val Leu Val Gly Gly Glu Val
755 760 765
Cys Pro Ala Asp Leu Val Ala Arg Trp Ala Arg Pro Gly Arg Arg Arg
770 775 780
Phe Val Asn Leu Tyr Gly Pro Thr Glu Ala Thr Val Gly Cys Leu Ala
785 790 795 800
His Asp Cys Thr Asp Trp Ser Ala Ala Thr Pro Pro Pro Ile Gly Ala
805 810 815
Thr Met Pro Asn Arg Arg Thr Tyr Leu Val Asp Arg Trp Asp Asn Pro
820 825 830
Val Pro Val Gly Val Pro Gly Glu Ile Leu Val Gly Gly Ala Ala Leu
835 840 845
Ser Thr Gly Tyr Leu Asn Asp Asp Glu Leu Thr Gly Arg Arg Phe Thr
850 855 860
Ala Asp Pro Phe Asp Pro Gln Gly Arg Val Tyr Arg Thr Gly Asp Arg
865 870 875 880
Gly His Trp Asp Ala Gln Gly Arg Leu His Phe Gly Gly Arg Leu Asp
885 890 895
Gly Gln Val Lys Leu Arg Gly Leu Arg Val Glu Leu Asp Glu Ile Glu
900 905 910
Ala Leu Leu Ser Arg His Ser Gly Val Ala Arg Ala Ala Val Thr Val
915 920 925
Val Arg Asp Gly Asn Gly Val Gln Arg Leu Val Gly Tyr Val Val Asp
930 935 940
Ala Ala Glu Pro Ala Ser Asp Ala Asp Leu Arg Thr His Leu Ser Thr
945 950 955 960
Glu Leu Pro Ala His Leu Val Pro Gly Arg Phe Val Arg Leu Pro Ala
965 970 975
Leu Pro Leu Thr Thr Ser Gly Lys Val Asn Arg Arg Ala Leu Pro Ala
980 985 990
Pro Glu Ala Ala Asp Thr Asp Asp Thr Gly Ala Ala Pro Thr Thr Gly
995 1000 1005
Ala Glu Arg Gln Val Ala Glu Ile Phe Ala Glu Val Leu Gly Val Ala
1010 1015 1020
Arg Val Gly Ala Glu Thr Ser Phe Phe Asp Leu Gly Gly His Ser Leu
1025 1030 1035 1040
Gln Ala Ala His Val Leu Ala Arg Ile Ala Gly Arg Ile Gly Thr Ser
1045 1050 1055
Val Ser Leu Lys Gln Phe Tyr Ala Thr Pro Thr Val Arg Ala Val Ala
1060 1065 1070
Arg Phe Val Glu His Gly Pro Val Val Asp Ala Ser Pro Leu Val Thr
1075 1080 1085
Leu Lys Ala Thr Gly Ser Arg Pro Arg Leu Tyr Cys Pro His Ala Val
1090 1095 1100
Ser Gly Ser Pro Tyr Trp Tyr Leu Pro Leu Ser Arg Ala Leu His Pro
1105 1110 1115 1120
Glu Gln Pro Val Asp Gly Phe Glu Ala Pro Gly Leu Glu Gly Gly Ile
1125 1130 1135
Glu Pro Val Asp Asp Leu Val Thr Leu Ala Gly Arg Tyr Val Gly Ala
1140 1145 1150
Leu Arg Glu Arg Gln Pro His Gly Pro Tyr Leu Leu Ala Gly Trp Ser
1155 1160 1165
Met Gly Gly Phe Leu Cys Phe Glu Met Ala Arg Gln Leu Ala Ala Val
1170 1175 1180
Gly Ala Ala Pro Asp Leu Val Val Met Ile Asp Ser Asn Glu Pro Gly
1185 1190 1195 1200
Pro Leu Pro Leu Pro Ser Glu Arg Gln Val Met Glu Thr Phe Val Ala
1205 1210 1215
Asp Leu Ala Gly Leu Ser Ala Ala Pro Ala Pro Pro Leu Asp Ala Glu
1220 1225 1230
Val Val Asp Ala Ala Asp Pro Ile Ala Ala Leu Thr Gly Phe Leu Val
1235 1240 1245
Arg His Gly Leu Ile Pro Ser Asp Val Arg Ala Asp Phe Val Ala Asn
1250 1255 1260
Arg Tyr Ala Val Phe Arg Ala Asn Met Arg Ala Ile Tyr Gly Tyr Gln
1265 1270 1275 1280
Pro Ala Pro Tyr Ala Gly Arg Thr Val Leu Val Gln Ala Glu Arg Glu
1285 1290 1295
Ala Ser Arg Ala Ala Trp Arg Arg Trp Ser Pro Ala Met Glu Val Val
1300 1305 1310
Thr Leu Pro Gly Asp His Tyr Ser Met Trp Ser Pro Gln His Leu Pro
1315 1320 1325
Ala Leu Ala Ala Leu Ile Asp Asp Gln Val Ala Arg Val Leu Asp Leu
1330 1335 1340
Gly
1345
<210> 30
<211> 519
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF29 Protein
<400> 30
Met Ala Thr Glu Asp Glu Gly Arg Pro Arg Gly Ala Arg Leu Val Leu
1 5 10 15
Leu Ile Leu Leu Val Ala Gln Val Met Ala Thr Met Asp Asn Ser Ile
20 25 30
Val Ala Val Ala Thr Lys Thr Ile Lys Asp Asp Leu Gln Thr Ser Gly
35 40 45
Ala Val Leu Gln Leu Ile Leu Ser Gly Tyr Thr Leu Met Phe Ala Val
50 55 60
Leu Val Val Thr Gly Ala Arg Leu Gly Gly Asp Val Gly His Arg Arg
65 70 75 80
Leu Phe Met Ile Gly Leu Thr Gly Phe Thr Ala Ser Ser Leu Leu Cys
85 90 95
Gly Ile Ala Pro Thr Ala Gly Thr Leu Val Ala Ala Arg Leu Leu Gln
100 105 110
Gly Ala Phe Gly Ala Met Met Val Pro Gln Val Leu Ser Val Ile Gln
115 120 125
Ile Val Phe Thr Gly Ser Ala Arg Ala Arg Ala Ile Gly Leu Tyr Ser
130 135 140
Met Val Leu Ala Leu Gly Val Ala Ala Gly Gln Ile Ala Gly Gly Val
145 150 155 160
Ile Val Ser Ala Asp Val Leu Gly Ser Gly Trp Arg Ala Ala Phe Leu
165 170 175
Val Asn Val Pro Ile Gly Leu Ala Leu Leu Ala Ala Ala Pro Arg Tyr
180 185 190
Leu Pro Gly His Thr Pro Ser Ser Arg Phe Arg Pro Asp Ile Val Gly
195 200 205
Ile Leu Leu Leu Ala Val Ser Met Gly Ala Val Val Ala Pro Leu Val
210 215 220
Phe Gly Arg Glu Gln Gly Trp Pro Ala Trp Ala Leu Ala Ser Ile Ala
225 230 235 240
Ala Gly Thr Ala Gly Leu Val Leu Phe Val Arg Tyr Glu Leu Arg Leu
245 250 255
Gly Ala Arg Gly Gly Gln Pro Val Leu Glu Ile Asp Ala Leu Arg Pro
260 265 270
Arg Gly Val Lys Ser Gly Leu Leu Ala Cys Cys Ile Leu Asn Phe Ala
275 280 285
Phe Ala Gly Val Leu Phe Pro Leu Thr Leu His Val Gln Asn Gly Leu
290 295 300
Gly Tyr Thr Pro Leu Gln Ala Gly Leu Met Phe Ile Pro Tyr Pro Val
305 310 315 320
Gly Phe Ala Ala Val Ser Leu Thr Trp Thr Arg Leu Pro Lys Arg Phe
325 330 335
His Arg Pro Leu Pro Val Ala Gly Leu Leu Val Phe Ala Leu Ala Leu
340 345 350
Ala Ala Leu Ala Val Val Val Ala Gly Gly Trp Pro Ile Ala Val Val
355 360 365
Ser Ala Leu Leu Leu Leu Ala Gly Ala Gly Met Ala Ala Gly Phe Ser
370 375 380
Thr Leu Val Glu Gln Thr Ala Ala Thr Val Gly Pro Arg Tyr Ala Ala
385 390 395 400
Ala Leu Ser Ala Leu Val Ser Thr Gly Thr Leu Leu Ala Ser Val Val
405 410 415
Ser Val Val Val Val Gly Gly Val Tyr Leu Ala Thr Ala Glu Asn Asp
420 425 430
Pro Ser Arg Ser Ala Leu Gly Leu Ser Arg Ser Leu Trp Val Asp Ala
435 440 445
Gly Leu Leu Met Leu Gly Phe Leu Leu Ala Tyr Arg Thr Trp Arg Leu
450 455 460
Ser Thr Arg Val Ser Ala Glu Thr Ala Pro Ser Gly Asp Ala Ala Glu
465 470 475 480
Gln Val Glu Ala Val Ala Ala Pro Gly Asn Ala Pro Pro Gly Glu Val
485 490 495
Asp Val Glu Pro Ala Thr Gly Pro Val Glu Glu Ser Ser Ala Pro Thr
500 505 510
Gly Ala Arg Ser Ala Pro Arg
515
<210> 31
<211> 613
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF30 Protein
<400> 31
Met Ser Glu Ser Arg Thr Ala Asp Thr Ala Ser Ala Lys Arg Arg Gly
1 5 10 15
Thr Leu Gly Phe Leu Leu Gly Val Ala Leu Val Thr Ala Gly Val Leu
20 25 30
Phe Gln Leu Pro Asp Val Lys Met Met Ile Asp His Ala Arg Met Gly
35 40 45
Ser Ala Glu Pro Gly Met Asp Gly Met Asp Asp Met Asp Asp Met Asp
50 55 60
Ser Met Pro Gly Met Glu Gly Met Ser Pro Gly Glu Pro Met Asp Met
65 70 75 80
Trp Thr Pro Thr Met Ile Leu Gly Met Leu Leu Leu Val Val Gly Leu
85 90 95
Val Val Ala Gly Arg Ala Leu Phe Ala Gly Val Arg Arg Pro Asp Ser
100 105 110
Ala Ser Val Thr Val Glu Ser Ile Glu His Gly Arg Leu Arg Pro Ala
115 120 125
Tyr Trp Ile Thr Cys Ala Val Leu Thr Ile Ala Leu Val Val Asp Ile
130 135 140
Met Lys Pro Leu Thr Leu Gly Phe Val Met Pro Gly Met Ser Asp Glu
145 150 155 160
Tyr Gly Met Ser Leu Glu Ser Val Ser Ile Leu Pro Leu Val Ala Leu
165 170 175
Thr Gly Thr Ala Val Gly Ser Val Val Trp Gly Leu Leu Gly Asp Arg
180 185 190
Tyr Gly Arg Arg Thr Ala Leu Leu Leu Ala Thr Leu Leu Phe Ile Ala
195 200 205
Thr Ser Ala Cys Gly Ala Met Pro Thr Phe Glu Trp Asn Leu Val Met
210 215 220
Cys Phe Thr Met Gly Thr Ser Ala Gly Gly Leu Leu Pro Leu Val Phe
225 230 235 240
Thr Leu Ile Ala Glu Leu Thr Pro Arg Arg His Arg Gly Trp Val Ala
245 250 255
Val Thr Val Gly Gly Ile Gly Gly Leu Gly Gly Tyr Leu Ala Ala Ser
260 265 270
Glu Ala Ala Arg His Leu Glu Pro Ala Leu Thr Trp Arg Ala Leu Trp
275 280 285
Leu Ile Gly Leu Pro Ser Gly Leu Leu Leu Leu Leu Met Ala Pro Leu
290 295 300
Ile Pro Glu Ser Pro Leu Tyr Leu Leu Arg Ala Gly Arg Arg Thr Glu
305 310 315 320
Ala Glu Ala Val Leu Arg Arg Tyr Gly Ser His Leu Gly Ala Thr Pro
325 330 335
Pro Ala Ala Asp Thr Ala Ala Ala Ala Thr Arg Pro Gly Val Gly Ala
340 345 350
Met Leu Arg Ala Tyr Pro Val Val Thr Ser Val Ile Gly Val Val Gly
355 360 365
Val Val Trp Gly Leu Val Asn Phe Gly Phe Leu Val Met Leu Pro Ala
370 375 380
Gln Leu Arg Glu Ala Gly Leu Ala Gly Gly Val Ala Ser Gly Leu Leu
385 390 395 400
Ala Asp Ser Ala Leu Tyr Ser Thr Pro Ala Leu Ala Leu Val Val Leu
405 410 415
Leu Tyr Ala Ala Trp Ser Gly Arg Arg Ala Leu Ala Leu Phe Ile Ala
420 425 430
Ile Thr Ala Val Gly Leu Gly Gly Val Ala Leu Trp Thr Thr Asp Ser
435 440 445
Gly Gly Thr Val Leu Leu Leu Ala Ser Ile Gly Leu Leu Val Leu Ser
450 455 460
Leu Ser Ala Val Asn Ala Met Leu Leu Pro Tyr Ser Ala Glu Ile Tyr
465 470 475 480
Pro Thr Ala Met Arg Ala Thr Gly Ser Gly Phe Ala Gly Ala Ala Thr
485 490 495
Lys Val Gly Gly Ile Leu Gly Pro Ser Ala Met Leu Leu Ile Leu Ser
500 505 510
Leu Gly Gly Gly Leu Val Ala Pro Ala Ile Ala Leu Gly Val Leu Cys
515 520 525
Leu Ala Ala Thr Val Leu Leu Leu Val Phe Gly Pro Glu Leu Gly Ala
530 535 540
Ser Val Gly Pro Leu Ala Arg Arg Gly Val Gly Thr Val Pro Val Ser
545 550 555 560
Arg Thr Gly Pro Ala Pro Gly Thr Gly Pro Thr Asp Thr Glu Ser Pro
565 570 575
Ala Ser Val Ala Trp Ser Ala Thr Gly Asn Val Val Pro Ala Thr Arg
580 585 590
Pro Ala Val Ser Asp Asp Asp Asp Pro Arg Asp Ala Arg Thr Pro Ala
595 600 605
Thr Pro Ser Arg Thr
610
<210> 32
<211> 191
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF31 Protein
<400> 32
Val Pro His Val Asp Arg Ser Ala Arg Ser Gly Pro Cys Cys Ala Ser
1 5 10 15
Met Asp Tyr Met Thr Ile Gln Ser Asp Pro Met Ala Ser Thr Asp Glu
20 25 30
Val Arg Gly Glu Pro Ala Asp Glu Phe Val Gly Ala Leu Val Ser Leu
35 40 45
Ser Arg Val Met Val Ala Val Ala Met Arg Thr Leu Ala Arg Ile Asp
50 55 60
Ala Asp Val Thr Leu Gln Gln Phe Arg Thr Leu Val Val Leu Val Pro
65 70 75 80
Gly Pro Gln Arg Val Ile Asp Leu Ala Lys Leu Leu Gly Val Gln Ser
85 90 95
Ser Thr Ala Thr Arg Met Cys Asp Arg Leu Val Arg Lys Gly Leu Val
100 105 110
Ala Arg His Glu Arg Val Ala Asp Arg Arg Ala Ala Trp Val Gly Leu
115 120 125
Thr Val Ala Gly Lys Glu Leu Val Gly Leu Gly Met Arg Ala Arg Gln
130 135 140
Gln Glu Leu Glu Arg Met Leu Ala Asp Leu Arg Pro Asp Asp Thr Asp
145 150 155 160
Val Thr Thr Gly Ala Leu Val Ala Val Leu Arg Ala Thr Gly Glu Leu
165 170 175
Thr Asp Gly Ala Trp Trp Arg Gln Trp Ala Asp Ser Val Val Glu
180 185 190
<210> 33
<211> 224
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF32 Protein
<400> 33
Met Thr Val Val Pro Asp Asp Asn Leu Met Thr Leu Ile Cys Asp Val
1 5 10 15
Cys Gly Asp Thr Thr Thr Gly Thr Ala Cys Val Leu Pro Asp Ala Glu
20 25 30
Val Val Trp Thr Leu Val Ser Asp His Gly Trp Ser Gly Ser Pro Phe
35 40 45
Ala Thr Gly Pro His Arg Cys Pro Arg Cys Ser Ala Leu Pro Pro Gly
50 55 60
Ser Ser Leu Gly Asp Gly Asp Arg Ala Gly Ser Gly Leu Ala Glu Ala
65 70 75 80
Ala Val Val Val Pro Ala Asp Gly Gly Asp Gln Asp Thr Gly Asp Ala
85 90 95
Leu Arg Ala Ala Leu Arg Gly Ala Phe Asp Val Ala Gly Thr Val Val
100 105 110
Val Asp Leu Thr Gln Val Gln Val Ile Asp Ser Leu Gly Leu Gly Met
115 120 125
Leu Val Arg Ala His Arg Asp Val Arg Glu Arg Gly Gly Arg Leu Cys
130 135 140
Leu Ala Ala Pro Ser Arg Phe Ile Arg Thr Val Leu His Thr Met Lys
145 150 155 160
Leu Asp Gly Val Phe Pro Ile Phe Asp Ser Leu Asp Ala Ala Leu Asp
165 170 175
Gln Leu Arg Asn Ala Ala Ser Gln Asp Ala Val Ser Ala Gly Val Ser
180 185 190
Pro Val Asp Val Thr Pro Ser Asp Leu Pro Arg Pro Ala Ala Glu Val
195 200 205
Pro Ser Met Pro Met Ala Arg Arg Arg Ala Ala Ser Arg Val Thr Val
210 215 220
<210> 34
<211> 89
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF33 Protein
<400> 34
Met Thr Ser Ala Gly Ile Val Thr Ala Leu Ala Val Gly Leu Ala Val
1 5 10 15
Gly Ala Leu Gly Arg Leu Val Leu Pro Gly Arg Pro Ala Ala Pro Leu
20 25 30
Trp Leu Thr Met Thr Ile Gly Ala Val Ala Ser Leu Leu Gly Ala Ile
35 40 45
Thr Ala Trp Leu Ala Gly Val Gln Gly Phe Ser Ile Leu Gly Leu Val
50 55 60
Val Gln Ala Gly Leu Ala Ala Val Ala Val Val Ile Val Val Ala Thr
65 70 75 80
Thr Gly Lys Glu Arg Ser Asp Ser Leu
85
<210> 35
<211> 168
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF34 Protein
<400> 35
Val Ala Ala Asn Pro Ala Gly Gln Gly Glu Ser His Ser Glu Thr Ala
1 5 10 15
Gly Glu Gly Ala Leu Ala Val Thr Ala Pro Arg Arg Pro Glu Cys Ser
20 25 30
Val Pro Leu Val Glu Val Ser Ile Thr Glu Phe Asp Leu Ser Cys Leu
35 40 45
Pro Glu Thr Gly Ala Val Leu Asp Gln Leu Leu Ala Leu Arg Pro Gly
50 55 60
Gln Val Val Ile Asp Leu Ala Gly Cys Arg His Ile Asp Ala Ala Ala
65 70 75 80
Ile Gly Leu Leu Leu Asp Val His Arg Arg Met Val Arg Ala Gly Gly
85 90 95
Val Leu Ala Val Arg Asn Pro Asn Pro Arg Ile Thr Arg Ile Leu Gln
100 105 110
Thr Ala Arg Leu Asp Gln Ile Leu Pro Val His Thr Asp Ala Ala Ser
115 120 125
Ala Pro Val Thr Glu Ala Val Thr Ala Ala Pro Gly Val Pro Pro Ala
130 135 140
Asp Gly Thr Pro Ala Pro Gly Thr Val Pro Arg Ala Ala Ala Tyr Gly
145 150 155 160
Arg Ala Ala Val Thr Val Arg Thr
165
<210> 36
<211> 229
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF35 Protein
<400> 36
Met Thr Ala Val Leu Val Ile Glu Asp Asp Asp Arg Ile Arg Leu Ala
1 5 10 15
Leu Leu Leu Ala Leu Glu Asp Glu Gly Tyr Glu Ala Arg Gly Ala Ala
20 25 30
Thr Ala Glu Glu Gly Leu Arg Thr Gln Arg Arg Asp Pro Ala Asp Tyr
35 40 45
Val Leu Val Asp Leu Met Leu Pro Gly Ile Asp Gly Phe Glu Gly Ile
50 55 60
Arg Gln Leu Arg Arg Asp Asp Asp Val Pro Ile Val Val Val Ser Ala
65 70 75 80
Arg Asp Asp Thr His Asp Ile Val Ala Ala Leu Glu Ala Gly Ala Asp
85 90 95
Asp Tyr Val Val Lys Pro Val Ala Ile Lys Glu Leu Thr Ala Arg Leu
100 105 110
Arg Ala Leu Arg Arg Arg Gly Arg Thr Thr Thr Ala Ser Asp Gly Pro
115 120 125
Gln Pro Val Pro Val Leu Ala Phe Gly Asp Leu Glu Val Ser Pro Glu
130 135 140
Ala Gly Glu Val Arg Arg Ala Gly Glu Pro Val Ala Val Thr Arg Thr
145 150 155 160
Glu Phe Arg Leu Leu Cys Glu Leu Ala Glu His Ala Gly Arg Val Leu
165 170 175
Ser Arg Gln Gln Leu Leu Ser Arg Val Trp Gly Tyr Asp Ser Gly Asp
180 185 190
Glu Arg Leu Val Asp Val His Val Gly Arg Leu Arg Gln Lys Ile Glu
195 200 205
Ala Asp Pro Ala Asn Pro Arg His Leu Val Thr Leu Arg Gly Leu Gly
210 215 220
Tyr Lys Leu Gln Arg
225
<210> 37
<211> 427
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF36 Protein
<400> 37
Met Ala Leu Val Ser Tyr Glu Leu Thr Arg Arg Thr Leu Leu Asp Glu
1 5 10 15
Arg Glu Arg Thr Val Leu Arg Ala Ala Tyr Tyr Asp Ala Ala Val Val
20 25 30
Arg Ala Gly Leu Asp Thr Asp Asn Pro Asp Val Ala Glu Ala Leu Arg
35 40 45
Ala Leu Asp Thr Gly Thr Gly Arg Arg Pro Leu Val Leu Leu Asp Gly
50 55 60
Glu Trp Tyr Ala Arg Ser Ala Asp Asn Gly Leu Thr Thr Ile Val Pro
65 70 75 80
Ala Arg Leu Gln Asp Leu Val Ala Ala Gly Glu Pro Ala Val Gln Arg
85 90 95
Val Arg Val Asn Asp Thr Pro Val Met Leu Val Gly Val Pro Leu Ser
100 105 110
Glu Ser Thr Ala Phe Tyr Glu Ile Ala Ser Leu Arg Glu Leu Glu Gln
115 120 125
Thr Phe Gln Val Leu Ala Leu Ala Leu Thr Ala Val Ala Ile Met Ile
130 135 140
Ala Gly Ser Gly Ala Ala Leu Gly Trp Tyr Ala Thr Arg His Gly Leu
145 150 155 160
Arg Pro Leu Thr Ala Val Ala Asp Ala Ala Glu Arg Ile Ala Ala Gly
165 170 175
Asp Phe Thr Thr Arg Leu Ala Pro Asp Thr Asp Pro Asp Leu Thr Arg
180 185 190
Leu Ser Thr Ser Phe Asn Arg Met Val Asp Glu Leu Ala Gly Arg Ile
195 200 205
Asp Arg Asp Arg Arg Phe Ala Ala Asp Val Ser His Glu Leu Arg Ser
210 215 220
Pro Leu Gln Thr Leu Ala Ala Ala Ala Ser Val Leu Ser Arg Arg Arg
225 230 235 240
Glu Asn Gln Asp Glu Arg Thr Ala Thr Ala Ala Arg Leu Val Ala Asp
245 250 255
Glu Ile Asp Arg Phe Gln Gln Leu Val Asn Asp Leu Leu Asp Leu Ala
260 265 270
Arg Gly Asp Gln Pro Val His Arg Glu Ser Val Asp Leu Pro Glu Leu
275 280 285
Ala Arg Gln Ala Cys Arg Asp Arg Asp Leu Pro Glu Ser Met Val Gln
290 295 300
Leu Ala Thr Gly Thr Pro Pro Gly Trp Arg Val Asp Arg Arg Arg Val
305 310 315 320
Ala Gln Val Leu Ala Asn Leu Leu Asp Asn Ala Glu Arg Tyr Gly Ala
325 330 335
Gly Pro Val Ala Val Arg Leu Ser His Asp Ala Asp Thr Gly Val Ile
340 345 350
Glu Val Asp Asp Glu Gly Pro Gly Val Pro Met Glu Asp Arg Glu Ala
355 360 365
Ile Phe Asp Arg Phe Val Arg Gly Arg Ala Ala Asn Tyr Arg Gly Gly
370 375 380
Gly Asp Gly Thr Gly Leu Gly Leu Ala Leu Val Ala Gln His Ala Ala
385 390 395 400
Ala His Gly Gly Asp Ala Ser Val Ser Asp Arg Pro Glu Gly Gly Ala
405 410 415
Arg Phe Arg Val Thr Leu Pro Gly Ser Leu Ser
420 425
<210> 38
<211> 178
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF37 Protein
<400> 38
Val Phe Ala Leu Leu Gly Ala Cys Gly Val Pro Ala Glu Asp Arg Pro
1 5 10 15
Arg Ala Val Thr Pro Pro Pro Val Pro Phe Pro Ala Thr Ala Ser Ala
20 25 30
Ala Pro Thr Ala Ala Glu Thr Gly Ala Val Thr Glu Val Leu Tyr Phe
35 40 45
Ala Arg Asp Glu Arg Leu Val Pro Val Ile Arg Arg Ala Asp Gln Val
50 55 60
Pro Ala Leu Asp Ala Gln Leu Arg Ala Leu Leu Ala Gly Pro Thr Pro
65 70 75 80
Thr Glu Arg Asp Asp Gly Leu Thr Ser Ala Leu Pro Gly Ala Phe Thr
85 90 95
Ser Ala Val Val Glu Leu Val Asp Gly Leu Ala Arg Val Thr Val Gly
100 105 110
Leu Thr Ala Val Asp Thr Gly Arg Ser Asp Gly Arg Leu Ala Tyr Gly
115 120 125
Gln Ile Val Cys Thr Leu Thr Ala Arg Thr Asp Val Thr Ala Val Leu
130 135 140
Phe Leu Glu Gly Gly Thr Pro Leu Ser Val Pro Arg Ala Asp Gly Ser
145 150 155 160
Leu Ser Ser Gly Pro Leu Thr Ala Ala Asp Tyr Ala Val Leu Ile Asn
165 170 175
Pro Arg
<210> 39
<211> 574
<212> PRT
<213> Micromonospora sp., ML1 strain
<220>
<223> ORF38 Protein
<400> 39
Val Asn Asp Arg Ala Glu Thr Leu Glu Phe Gln Ala Glu Ala Arg Gln
1 5 10 15
Leu Leu Arg Leu Met Val His Ser Ile Tyr Ser Asn Lys Asp Val Phe
20 25 30
Leu Arg Glu Leu Ile Ser Asn Ala Ser Asp Ala Leu Asp Lys Leu Arg
35 40 45
Leu Ala Ser Met Val Asp Lys Asp Leu Ala Val Asp Thr Gly Asp Leu
50 55 60
His Ile Ala Ile Glu Val Asp Arg Asp Ala Arg Thr Leu Thr Val Arg
65 70 75 80
Asp Asn Gly Ile Gly Met Ser Arg Asp Glu Val Val Ser Val Ile Gly
85 90 95
Thr Ile Ala Lys Ser Gly Thr Ala Glu Leu Leu Arg Gln Leu Arg Glu
100 105 110
Ala Lys Asp Ala Gly Ala Ser Gln Glu Leu Ile Gly Gln Phe Gly Val
115 120 125
Gly Phe Tyr Ala Ala Phe Met Val Ala Glu Arg Val Glu Leu Val Thr
130 135 140
Arg Arg Ala Gly Glu Thr Gly Gly Thr Arg Trp Glu Ser Thr Gly Glu
145 150 155 160
Gly Thr Tyr Thr Ile Thr Glu Leu Asp Asp Ala Pro Gln Gly Thr Ala
165 170 175
Val Thr Leu His Leu Lys Pro Ala Asp Ala Glu Asp Asn Leu His Asp
180 185 190
Tyr Thr Ala Glu Trp Thr Ile Arg Gly Ile Val Lys Arg Tyr Ser Asp
195 200 205
Phe Ile Ala His Pro Ile Arg Met Thr Val Glu Arg Pro Gly Thr Asp
210 215 220
Asp Ala Pro Ala Thr Thr Glu Ala Val Thr Leu Asn Ser Met Lys Ala
225 230 235 240
Leu Trp Ala Arg Pro Arg Gly Glu Val Glu Pro Ala Glu Tyr His Glu
245 250 255
Phe Tyr Lys His Val Ser His Asp Trp Ala Asp Pro Leu Glu Thr Ile
260 265 270
His Met Arg Gly Glu Gly Thr Phe Glu Tyr Glu Ala Leu Leu Phe Ile
275 280 285
Pro Thr His Ala Pro Leu Asp Leu Phe Ser Pro Gln Gly Arg Arg Gly
290 295 300
Val Gln Leu Tyr Val Lys Arg Val Phe Ile Met Asp Asp Cys Asp Ala
305 310 315 320
Leu Met Pro Asn Tyr Leu Arg Phe Val Lys Gly Val Val Asp Ala His
325 330 335
Asp Leu Ser Leu Asn Ile Ser Arg Glu Ile Leu Gln Gln Asp Arg Gln
340 345 350
Ile Arg Ala Val Arg Arg Arg Leu Val Lys Lys Ile Leu Ala Thr Val
355 360 365
Lys Asp Leu Lys Thr Gly Gln Pro Glu Arg Tyr Arg Thr Phe Trp Thr
370 375 380
Glu Phe Gly Thr Val Val Lys Glu Gly Leu Leu Glu Asp Thr Asp Asn
385 390 395 400
Arg Asp Thr Leu Leu Glu Ile Leu Ser Val Ala Ser Thr Asn Asp Pro
405 410 415
Ala Glu Gln Thr Asp Leu Ala Gly Tyr Val Glu Arg Met Arg Glu Gly
420 425 430
Gln Gln Asp Ile Tyr Tyr Ala Thr Gly Glu Asn Arg Ser Thr Ile Glu
435 440 445
Asn Ser Pro His Ile Glu Ala Phe Arg Ala Lys Gly Tyr Glu Val Leu
450 455 460
Leu Leu Thr Asp Pro Val Asp Glu Val Trp Val Glu Arg Val Gly Ser
465 470 475 480
Tyr Ala Gly Lys Thr Leu Arg Ser Val Ala Lys Gly Gln Val Asp Leu
485 490 495
Asp Thr Glu Gln Glu Arg Thr Glu Ala Glu Ala Glu Arg Glu Arg Gln
500 505 510
Arg Thr Glu Tyr Ala Asp Leu Leu Gly Trp Met Gly Glu Val Leu Ala
515 520 525
Asp Asn Val Lys Glu Val Arg Leu Ser Ser Arg Leu Thr Thr Ser Pro
530 535 540
Ala Cys Val Val Gly Asp Ala His Asp Leu Thr Pro Thr Leu Glu Lys
545 550 555 560
Met Tyr Arg Ala Met Gly Gln Glu Val Pro Lys Val Lys Arg
565 570
Claims (26)
- 하나 이상의 생합성적 티오코랄린(thiocoraline) 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 분리된 핵산 분자.
- 제 1 항에 있어서, 모든 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
- 제 1 항 또는 제 2 항에 있어서, 서열 식별 번호: 1 에 제시된 뉴클레오티드 서열 또는 그의 상보적 가닥을 포함하는 핵산 분자.
- 제 3 항의 핵산 분자와 혼성화하며, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 핵산 분자.
- 제 1 항에 있어서, 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
- 제 5 항에 있어서, 하기로 이루어지는 군으로부터 선택되는 핵산 분자:- 서열 식별 번호: 1 의 뉴클레오티드 2-535 (orf1) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 993-1130c (orf2) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 1517-2131 (tio3) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 2154-2822c (tio4)를 포함하는 핵산 분자 ;- 서열 식별 번호: 1 의 뉴클레오티드 2970-3791c (tio5) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 3794-4777c (tio6) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 4904-5611 (tio7) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 5701-6426c (tio8) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 6426-7688c (tio9) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 7733-8524c (tio10) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 8791-10002 (tio11) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 10002-11590c (tio12) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 11847-13634 (tio13) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 13734-15005c (tio14) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 15005-16354c (tio15) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 16441-18744c (tio16) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 18774-19055c (tio17) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 19260-20036 (tio18) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 20146-20880c (tio19) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 21188-28969 (tio20) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 28979-38398 (tio21) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 38449-38661 (tio22) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 38642-41263 (tio23) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 41835-42368 (tio24) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 42395-43255c (tio25) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 43340-43741c (tio26) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 44152-49563 (tio27) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 49635-53669 (tio28) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 53749-55305c (orf29) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 55384-57222c (orf30) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 57895-58467c (orf31) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 58535-59206c (orf32) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 59298-59564c (orf33) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 59611-60114c (orf34) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 60202-60888 (orf35) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 60960-62240 (orf36) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 62300-62833 (orf37) 를 포함하는 핵산 분자;- 서열 식별 번호: 1 의 뉴클레오티드 62925-64650 (orf38) 를 포함하는 핵산 분자; 또는생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩하는 이들의 절편.
- 제 1 항에 있어서, 2 개 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자.
- 제 7 항에 있어서, orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20 , tio21 , tio22 , tio23 , tio24 , tio25 , tio26 , tio27, tio28 , orf29 , orf30 , orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38 로서 식별되는 유전자 및 생합성적 티오코랄린 생산 경로 단백질의 생물학적 활성 절편을 코딩하는 이들의 절편으로부터 선택되는 2 개 이상의 유전자를 포함하는 핵산 분자.
- 제 1 항에 있어서, 하나 이상의 생합성적 티오코랄린 생산 경로 단백질 또는 그의 생물학적 활성 절편을 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자, 또는 그의 돌연변이체 또는 변이체로서, 상기 단백질이 ORF1 (서열 식별 번호: 2), ORF2 (서열 식별 번호: 3), Tio3 (서열 식별 번호: 4), Tio4 (서열 식별 번호: 5), Tio5 (서열 식별 번호: 6), Tio6 (서열 식별 번호: 7), Tio7 (서열 식별 번호: 8), Tio8 (서열 식별 번호: 9), Tio9 (서열 식별 번호: 10), Tio10 (서열 식별 번호: 11), Tio11 (서열 식별 번호: 12), Tio12 (서열 식별 번호: 13), Tio13 (서열 식별 번호: 14), Tio14 (서열 식별 번호: 15), Tio15 (서열 식별 번호: 16), Tio16 (서열 식별 번호: 17), Tio17 (서열 식별 번호: 18), Tio18 (서열 식별 번호: 19), Tio19 (서열 식별 번호: 20), Tio20 (서열 식별 번호: 21), Tio21 (서열 식별 번호: 22), Tio22 (서열 식별 번호: 23), Tio23 (서열 식별 번호: 24), Tio24 (서열 식별 번호: 25), Tio25 (서열 식별 번호: 26), Tio26 (서열 식별 번호: 27), Tio27 (서열 식별 번호: 28), Tio28 (서열 식별 번호: 29), ORF29 (서열 식별 번호: 30), ORF30 (서열 식별 번호: 31), ORF31 (서열 식별 번호: 32), ORF32 (서열 식별 번호: 33), ORF33 (서열 식별 번호: 34), ORF34 (서열 식별 번호: 35), ORF35 (서열 식별 번호: 36), ORF36 (서열 식별 번호: 37), ORF37 (서열 식별 번호: 38), ORF38 (서열 식별 번호: 39) 로 식별되는 단백질 및 이들의 조합으로 이루어진 군으로부터 선택되는 핵산 분자.
- 제 1 항에 있어서, orf1, orf2, tio3, tio4, tio5, tio6, tio7, tio8, tio9, tio10, tio11, tio12, tio13, tio14, tio15, tio16, tio17, tio18, tio19, tio20 , tio21 , tio22 , tio23 , tio24, tio25 , tio26 , tio27 , tio28 , orf29 , orf30 , orf31, orf32, orf33, orf34, orf35, orf36, orf37, orf38 및 이들의 조합, 또는 이들의 상응하는 영역, 돌연변이체 또는 변이체로 이루어지는 군으로부터 선택되는 orf를 포함하는 뉴클레오티드 서열을 포함하는 핵산 분자.
- 제 1 항에 있어서, 미크로모노스포라 종 (Micromonospora sp.) 으로부터 분리된 핵산 분자.
- 제 1 항 내지 제 11 항 중 어느 한 항의 하나 이상의 핵산 분자를 함유하는 조성물.
- 제 1 항 내지 제 11 항 중 어느 한 항의 핵산 분자 또는 그의 절편을 포함하는 프로브.
- 제 1 항 내지 제 11 항 중 어느 한 항의 핵산 분자 또는 제 12 항의 조성물을 포함하는 벡터.
- 본 발명의 벡터로 형질전환 또는 트랜스펙션된 숙주 세포.
- 제 15 항에 있어서, 상기 숙주 세포는 미생물, 바람직하게는 박테리아인 숙주 세포.
- 제 16 항에 있어서, 상기 박테리아가 그람-양성 (Gram-positive) 박테리아, 바람직하게는 방선균 (actinomycete) 또는 스트렙토마이세트 (streptomycete) 인 숙주 세포.
- 본 발명의 핵산 분자에 의해 코딩되는 단백질.
- 제 18 항에 있어서, ORF1 (서열 식별 번호: 2), ORF2 (서열 식별 번호: 3), Tio3 (서열 식별 번호: 4), Tio4 (서열 식별 번호: 5), Tio5 (서열 식별 번호: 6), Tio6 (서열 식별 번호: 7), Tio7 (서열 식별 번호: 8), Tio8 (서열 식별 번호: 9), Tio9 (서열 식별 번호: 10), Tio10 (서열 식별 번호: 11), Tio11 (서열 식별 번호: 12), Tio12 (서열 식별 번호: 13), Tio13 (서열 식별 번호: 14), Tio14 (서열 식별 번호: 15), Tio15 (서열 식별 번호: 16), Tio16 (서열 식별 번호: 17), Tio17 (서열 식별 번호: 18), Tio18 (서열 식별 번호: 19), Tio19 (서열 식별 번호: 20), Tio20 (서열 식별 번호: 21), Tio21 (서열 식별 번호: 22), Tio22 (서열 식별 번호: 23), Tio23 (서열 식별 번호: 24), Tio24 (서열 식별 번호: 25), Tio25 (서열 식별 번호: 26), Tio26 (서열 식별 번호: 27), Tio27 (서열 식별 번호: 28), Tio28 (서열 식별 번호: 29), ORF29 (서열 식별 번호: 30), ORF30 (서열 식별 번호: 31), ORF31 (서열 식별 번호: 32), ORF32 (서열 식별 번호: 33), ORF33 (서열 식별 번호: 34), ORF34 (서열 식별 번호: 35), ORF35 (서열 식별 번호: 36), ORF36 (서열 식별 번호: 37), ORF37 (서열 식별 번호: 38), ORF38 (서열 식별 번호: 39) 로 식 별되는 단백질 및 이들의 조합으로 이루어지는 군으로부터 선택되는 단백질, 또는 그의 생물학적 활성 절편.
- 적합한 조건 하에서 티오코랄린-생산 유기체를 배양하는 단계, 및 원하는 경우 티오코랄린의 생합성에 수반되는 하나 이상의 상기 단백질을 분리하는 단계를 포함하는, 제 18 항 또는 제 19 항의 티오코랄린 생합성에 수반되는 단백질을 제조하는 방법.
- 티오코랄린 화합물 생산에 적합한 조건 하에 티오코랄린-생산 유기체를 배양하여 티오코랄린의 생합성에 수반되는 단백질을 코딩하는 유전자의 카피수를 증가시키는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는, 티오코랄린의 제조 방법.
- 티오코랄린의 생합성 이행능력이 있는 단백질을 코딩하는 유전자의 발현이, 티오코랄린의 생합성에 수반되는 단백질을 코딩하는 하나 이상의 유전자의 조작 또는 치환으로 또는 상기 유전자의 발현 조절 이행능력이 있는 서열의 조작으로 조절되는 티오코랄린-생산 유기체를, 티오코랄린 화합물 생산에 적합한 조건 하에서 배양하는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는 티오코랄린의 제조 방법.
- 제 21 항 또는 제 22 항에 있어서, 상기 티오코랄린-생산 유기체가 방선균, 바람직하게는 미크로모노스포라 종인 방법.
- 티오코랄린 화합물 제조에 적합한 조건 하에서, 제 15 항 내지 제 17 항 중 어느 한 항의 숙주 세포를 배양하는 단계, 및 원하는 경우 티오코랄린을 분리하는 단계를 포함하는 티오코랄린의 제조 방법.
- 제 24 항에 있어서, 상기 숙주 세포가 방선균 또는 스트렙토세트인 방법.
- 하기 단계를 포함하며, 미크로모노스포라 종 ML1 유래의 티오코랄린의 생합성 이행능력이 있는 유전자를 이용하는, 또다른 방선균에서의 상기 티오코랄린 화합물의 제조 방법:(1) 티오코랄린 생합성 경로의 특이적인 유전자에 타격을 받은 돌연변이체를 수득하는 단계;(2) 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터를 포함하는 미크로모노스포라 종 ML1 염색체 영역을 분리하는 단계;(3) 티오코랄린의 생합성 이행능력이 있는 유전자 클러스터의 뉴클레오티드 서열을 수득하고 분석하는 단계; 및(4) 다른 방선균에서 티오코랄린을 이종적으로 생산하는 단계.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ESP200501932 | 2005-08-02 | ||
ES200501932 | 2005-08-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20080032641A true KR20080032641A (ko) | 2008-04-15 |
Family
ID=37708972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087004989A KR20080032641A (ko) | 2005-08-02 | 2006-08-01 | 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20090130675A1 (ko) |
EP (1) | EP1925668A2 (ko) |
JP (1) | JP2009502187A (ko) |
KR (1) | KR20080032641A (ko) |
CN (1) | CN101278050A (ko) |
AU (1) | AU2006274822A1 (ko) |
CA (1) | CA2617592A1 (ko) |
IL (1) | IL189158A0 (ko) |
MX (1) | MX2008001585A (ko) |
RU (1) | RU2008107974A (ko) |
WO (1) | WO2007014971A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JOP20190254A1 (ar) | 2017-04-27 | 2019-10-27 | Pharma Mar Sa | مركبات مضادة للأورام |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6927286B1 (en) * | 1999-01-06 | 2005-08-09 | The Regents Of The University Of California | Bleomycin gene cluster components and their uses |
DE60237984D1 (de) * | 2001-11-22 | 2010-11-25 | Univ Bonn | Neuer gen-cluster aus genen der pederin-biosynthese |
-
2006
- 2006-08-01 RU RU2008107974/13A patent/RU2008107974A/ru unknown
- 2006-08-01 EP EP06807903A patent/EP1925668A2/en not_active Withdrawn
- 2006-08-01 US US11/997,692 patent/US20090130675A1/en not_active Abandoned
- 2006-08-01 JP JP2008524531A patent/JP2009502187A/ja not_active Withdrawn
- 2006-08-01 KR KR1020087004989A patent/KR20080032641A/ko not_active Application Discontinuation
- 2006-08-01 WO PCT/ES2006/000455 patent/WO2007014971A2/es active Application Filing
- 2006-08-01 CA CA002617592A patent/CA2617592A1/en not_active Abandoned
- 2006-08-01 MX MX2008001585A patent/MX2008001585A/es not_active Application Discontinuation
- 2006-08-01 CN CNA2006800367391A patent/CN101278050A/zh active Pending
- 2006-08-01 AU AU2006274822A patent/AU2006274822A1/en not_active Abandoned
-
2008
- 2008-01-31 IL IL189158A patent/IL189158A0/en unknown
Also Published As
Publication number | Publication date |
---|---|
RU2008107974A (ru) | 2009-09-10 |
WO2007014971A3 (es) | 2007-05-10 |
CA2617592A1 (en) | 2007-02-08 |
US20090130675A1 (en) | 2009-05-21 |
MX2008001585A (es) | 2008-04-22 |
WO2007014971A2 (es) | 2007-02-08 |
JP2009502187A (ja) | 2009-01-29 |
CN101278050A (zh) | 2008-10-01 |
AU2006274822A1 (en) | 2007-02-08 |
IL189158A0 (en) | 2008-08-07 |
EP1925668A2 (en) | 2008-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2271666T3 (da) | Nrps-pks-gengruppe og dens manipulation og anvendelighed | |
JPH09224687A (ja) | ポリケチドシンターゼ遺伝子 | |
JPH09224686A (ja) | プラテノリドシンターゼ遺伝子 | |
KR20070033979A (ko) | 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna | |
KR20100039443A (ko) | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 | |
KR20100049580A (ko) | 티오펩티드 전구체 단백질, 그를 코딩하는 유전자 및 그의 용도 | |
CN101275141A (zh) | 阿嗪霉素的生物合成基因簇 | |
CN107794286B (zh) | 一种环脂肽类化合物生物合成基因簇及其激活方法与应用 | |
CN101818158B (zh) | Fr901464的生物合成基因簇 | |
CN101691575B (zh) | 一种萨菲菌素的生物合成基因簇 | |
CN107540682B (zh) | 曲张链丝菌素衍生物及其制备方法和应用 | |
US20020164747A1 (en) | Gene cluster for ramoplanin biosynthesis | |
KR20190005872A (ko) | 화합물의 제조를 위한 조성물 및 방법 | |
CN110857447B (zh) | 提高米尔贝霉素a3/a4或其衍生物产量的方法 | |
CN101063140B (zh) | 万古霉素生物合成基因簇 | |
US20030175888A1 (en) | Discrete acyltransferases associated with type I polyketide synthases and methods of use | |
KR101189475B1 (ko) | 삼원환 화합물의 생합성을 담당하는 유전자와 단백질 | |
US20030064491A1 (en) | Genes and proteins involved in the biosynthesis of enediyne ring structures | |
KR20080032641A (ko) | 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 | |
US20030171562A1 (en) | Genes and proteins for the biosynthesis of polyketides | |
CA2391131C (en) | Genes and proteins for rosaramicin biosynthesis | |
CN107164394B (zh) | 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用 | |
CN106676115A (zh) | 2’‑氯代喷司他丁和2’‑氨基‑2’‑脱氧腺苷生物合成基因簇及其应用 | |
CN102517309A (zh) | 一种手霉素类抗生素生物合成基因簇 | |
US20040219645A1 (en) | Polyketides and their synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |