KR101110175B1 - 스피라마이신의 생합성에 관여하는 폴리펩티드, 이들폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도 - Google Patents

스피라마이신의 생합성에 관여하는 폴리펩티드, 이들폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도 Download PDF

Info

Publication number
KR101110175B1
KR101110175B1 KR1020057006111A KR20057006111A KR101110175B1 KR 101110175 B1 KR101110175 B1 KR 101110175B1 KR 1020057006111 A KR1020057006111 A KR 1020057006111A KR 20057006111 A KR20057006111 A KR 20057006111A KR 101110175 B1 KR101110175 B1 KR 101110175B1
Authority
KR
South Korea
Prior art keywords
gene
delete delete
spiramycin
sequence
genes
Prior art date
Application number
KR1020057006111A
Other languages
English (en)
Other versions
KR20050084843A (ko
Inventor
마리 헬렌 브롱델레-라우올
헬렌 도밍게즈
엠마뉘엘 다르봉-롱제르
클로드 제르보
안느 곤드랑
파트마 카레이
파트리샤 라크로아
나탈리 오스트리셔-메르메-부비에르
장-뤽 뻬르노데
카린 투필
Original Assignee
쌩뜨레 나티오날 데 라 르세르쉬 생띠끄 (씨. 엔. 알. 에스)
아방티 파르마 소시에테 아노님
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR0212489A external-priority patent/FR2845394A1/fr
Priority claimed from FR0302439A external-priority patent/FR2851773A1/fr
Application filed by 쌩뜨레 나티오날 데 라 르세르쉬 생띠끄 (씨. 엔. 알. 에스), 아방티 파르마 소시에테 아노님 filed Critical 쌩뜨레 나티오날 데 라 르세르쉬 생띠끄 (씨. 엔. 알. 에스)
Publication of KR20050084843A publication Critical patent/KR20050084843A/ko
Application granted granted Critical
Publication of KR101110175B1 publication Critical patent/KR101110175B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • C12P19/62Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin the hetero ring having eight or more ring members and only oxygen as ring hetero atoms, e.g. erythromycin, spiramycin, nystatin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/465Streptomyces

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 스피라마이신에 대한 생합성 경로의 신규한 유전자의 분리와 동정, 및 이러한 생합성에 관여하는 신규한 폴리펩티드에 관한 것이다. 본 발명은 또한, 이들 폴리펩티드의 생성 방법에 관한 것이다. 본 발명은 또한, 스피라마이신의 생성 수준을 증가시키고, 생성된 스피라마이신의 순도를 증가시킬 목적으로 상기 유전자를 사용하는 것에 관한 것이다. 본 발명은 특히, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 않는 미생물, 및 이러한 미생물의 용도에 관한 것이다. 본 발명은 또한, 신규한 항생제를 합성할 수 있게 하거나 또는 유도된 형태의 스피라마이신을 생성시킬 수 있는 돌연변이체를 작제하기 위한, 스피라마이신에 대한 생합성 경로의 유전자의 용도에 관한 것이다. 본 발명은 또한, 이들 유전자의 발현을 통하여 생성된 분자에 관한 것이고, 이러한 유전자의 발현을 통하여 생성된 분자의 약리학적 활성 조성물에 관한 것이다.
Figure R1020057006111
스피라마이신, 스트렙토마이세스 속 균주, 매크롤리드, 항생제, 스트렙토마이세스 암보파시엔스

Description

스피라마이신의 생합성에 관여하는 폴리펩티드, 이들 폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도{Polypeptides involved in spiramycin biosynthesis, nucleotide sequences encoding said polypeptides and uses thereof}
본 발명은 스피라마이신(spiramycin)에 대한 생합성 경로의 신규한 유전자의 분리와 동정, 및 이러한 생합성에 관여하는 신규한 폴리펩티드에 관한 것이다. 본 발명은 또한, 스피라마이신의 생성 수준을 증가시키고, 생성된 스피라마이신의 순도를 증가시킬 목적으로 상기 유전자를 사용하는 것에 관한 것이다.
본 발명은 또한, 신규한 항생제를 합성할 수 있게 하거나 유도된 형태의 스피라마이신을 생성시킬 수 있는 돌연변이체를 작제하기 위한 상기 유전자의 용도에 관한 것이다. 본 발명은 또한, 이들 유전자의 발현을 통하여 생성된 분자에 관한 것이고, 최종적으로는 이러한 유전자의 발현을 통하여 생성된 분자의 약리학적 활성 조성물에 관한 것이다.
스트렙토마이세스(Streptomyces)는 그람-양성 사상 토양 세균(gram-positive filamentous soil baterium)이다. 이들 세균은 이들이 분비하는 상당히 광범위한 분해성 효소로 인해 유기 물질의 분해와 광화 작용(mineralization)에 있어 중요한 역할을 한다. 이들은 특별히 다양한 화학 구조와 생물학적 활성을 지닌 2차 대사물 생성을 특징으로 하는 대사적 분화를 수반하는, 원핵생물에서 독특한 형태학적 분화 현상을 나타낸다. 이들 대사물로는 특히, 세균 스트렙토마이세스 암보파시엔스(Streptomyces ambofaciens)에 의해 천연적으로 생산되는 스피라마이신이 있다.
스피라마이신은 수의학 분야와 인체 의학 분야 모두에 사용되는 매크롤리드(macrolide) 계열의 항생제이다. 매크롤리드는 1개 이상의 당이 접목된 락톤 환의 존재를 특징으로 한다. 스트렙토마이세스 암보파시엔스는 본래, 스피라마이신 I, II 및 III(도 1 참조)을 생산하지만; 스피라마이신 I의 항생제 활성이 스피라마이신 II 및 III 보다 훨신 더 크다[참조: Liu et al., 1990]. 스피라마이신 I 분자는 플라테놀리드(platenolide)로 불리우는 락톤계 매크로사이클과, 3개의 당, 즉 포로사민, 미카미노스 및 미카로스 로 이루어진다(도 1 참조). 스피라마이신의 항생제 활성은, 이러한 항생제가 세균성 리보솜에 결합하는 것에 관여하는 기전을 통하여 원핵생물에서 단백질 합성을 억제하는 것에 기인한다.
매크롤리드 계열의 구성원이고 락톤 환을 보유하기도 하는 특정 화합물은 항생제 분야 이외에서도 사용된다. 따라서, 생성물 FK506은 면역억제 효과를 지니고 있으며, 기관 이식 분야와 류마티스성 관절염 분야에 치료학적으로 적용될 전망이며, 보다 일반적으로는, 자가면역 반응과 관련된 병리학적 질환에 치료학적으로 적 용될 전망이다. 기타 매크롤리드, 예를 들면, 아베르멕틴(avermectin)은 살곤충 활성과 구충 활성을 지닌다.
현재까지, 각종 부류에 속하는 항생제와 기타 2차 대사물에 관한 많은 생합성 경로(참조: K, Chater, 1990)가 스트렙토마이세스에서 이미 연구되었다. 그러나, 스피라마이신에 대한 생합성 경로에 관해서는 극히 부분적인 지식만이 지금까지 알려져 있다.
스피라마이신 생합성은 많은 단계를 포함하고 많은 효소들이 관여하는 복잡한 과정이다[참조: Omura et al., 1979a, Omura et al., 1979b]. 스피라마이신은 토양에서 발견되는 미생물들 중에 특히 풍부한 복합 분자를 포함하는 큰 부류의 폴리케티드(polyketide)에 속한다. 이들 분자는 이들의 구조적 유사상에 근거하여 분류되는 것이 아니라, 이들의 생합성 경로 단계 상의 특정의 유사성에 근거하여 분류된다. 구체적으로 언급하면, 폴리케티드는 복합적인 연속 반응에 의해 생성되는데, 이러한 반응은 "폴리케티드 신타제"(PKS)로 불리우는 한 가지 이상의 효소에 의해 촉매된 일련의 반응들이 이의 생합성 경로에 존재한다는 공통점을 가진다. 스트렙토마이세스 암보파시엔스에서는, 스피라마이신의 락톤계 매크로사이클(플라테놀리드)의 생합성이 5개의 PKS 유전자에 의해 암호화된 일련의 8개 모듈(module)에 의해 수행된다[참조: S. Kuhstoss, 1996, 미국 특허 제5,945,320호]. 스피라마이신은 이러한 락톤 환으로부터 수득된다. 그러나, 당 합성에 관여하고, 이를 락톤 환에 부착시키고 이러한 환을 변형시켜 스피라마이신을 수득하도록 하는데 관여하는 각종 효소와 단계는 오늘날까지 여전히 공지되어 있지 않다.
미국 특허 제5,514,544호에는 스트렙토마이세스 암보파시엔스에서 srmR로 지칭된 서열을 클로닝하는 것에 관해 기재되어 있다. 상기 특허에서는, srmR 유전자가 매크롤리드 생합성에 관여하는 유전자의 전사를 조절하는 단백질을 암호화한다는 가설이 제안되었다.
1987년에, 리차드슨(Richardson) 등은 에스. 암보파시엔스(S. ambofaciens)의 스피라마이신 내성이 적어도 3가지 유전자, 즉 srmA, srmBsrmC로 지칭된 유전자에 의해 부여된다는 사실을 밝혀내었다[참조: Richardson et al., 1987]. 미국 특허 제4,886,757호에는 srmC 유전자를 함유하는 에스. 암보파시엔스의 DNA 단편의 성상 확인이 보다 특별히 기재되어 있다. 그러나, 이러한 유전자의 서열은 기재되지 않았다. 1990년에, 리차드슨 등은 srmB 에 근접한 스피라마이신 생합성을 위한 유전자가 3가지 존재한다는 가설을 제시하였다[참조: Richardson et al., 1990]. 미국 특허 제5,098,837호에는 스피라마이신 생합성에 잠재적으로 관여하는 5가지 유전자의 클로닝에 관해 보고되었다. 이들 유전자는 srmD, srmE, srmF, srmG srmH으로 지칭되었다.
스피라마이신과 같은 화합물을 제조하는데 있어서 가장 곤란한 점 중의 하나는 비교적 소량의 생성물을 제조하기 위해서도 매우 큰 발효 용적이 필요하다는 사실이다. 따라서, 이러한 분자의 생산 비용을 줄이기 위해서는 이의 생산 효율을 증대시킬 수 있도록 하는 것이 요망된다.
스피라마이신에 대한 생합성 경로는 복잡한 과정이고, 이러한 과정 중에 존재할 수도 있는 기생(parasitic) 반응을 동정 및 제거하는 것이 바람직할 것이다. 이러한 조작의 목적은 보다 순수한 항생제를 수득하고/하거나 생산성을 향상시키는 것이다. 이러한 측면에서, 스트렙토마이세스 암보파시엔스는 본래, 스피라마이신 I, II 및 III(도 1 참조)을 생산하지만; 스피라마이신 I의 항생제 활성이 스피라마이신 II 및 III 보다 훨신 더 크다[참조: Liu et al., 1990]. 따라서, 스피라마이신 I 만을 생산하는 균주를 갖는 것이 바람직할 것이다.
매크롤리드 항생제의 상업적 가치 때문에, 신규한 유도체, 특히 유리한 특성을 지닌 스피라마이신의 동족체를 생성시키고자 하는 연구가 집중적으로 수행되고 있다. 특히 스피라마이신-유도된 하이브리드 항생제를 제조할 목적으로, 스피라마이신 또는 스피라마이신 유도체에 대한 생합성 경로의 생합성 중간체를 충분한 양으로 생성시킬 수 있는 것이 바람직할 것이다.
발명의 일반적인 설명
본 발명은 스피라마이신 생합성에 관여하는 생성물을 생성시키는 유전자를 클로닝함으로써 비롯된 것이다. 본 발명은 무엇 보다도, 스피라마이신에 대한 생합성 경로의 신규한 유전자, 및 이러한 생합성에 관여하는 신규한 폴리펩티드에 관한 것이다.
상기 생합성 경로의 유전자와 이와 연관된 암호화 서열을 클로닝하고, 각 클론의 DNA 서열을 결정하였다. 이와 같이 클로닝된 암호화 서열은 orf1*c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8*, orf9*, orf10*, orf1, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10, orf11c, orf12, orf13c, orf14, orf15c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, orf23c, orf24c, orf25c, orf26, orf27, orf28c, orf29, orf30c, orf31, orf32c, orf33 orf34c로 명명될 것이다. 스피라마이신에 대한 생합성 경로에 있어서 이들 서열에 의해 암호화된 단백질의 기능은 다음 토의에서 전개되며, 이는 도 4, 5, 6 및 8로써 예시된다.
1) 본 발명의 제1 주제는 스피라마이신 생합성에 관여하는 폴리펩티드를 암호화하는 폴리뉴클레오티드에 관한 것이며, 이러한 폴리뉴클레오티드의 서열은 다음과 같다:
(a) 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 서열들 중의 하나,
(b) 서열 (a)의 변이체로 이루어진 서열들 중의 하나,
(c) 유전 암호 축퇴성(degeneracy)으로 인해 서열 (a) 및 (b)로부터 유도된 서열 중의 하나.
2) 본 발명의 주제는 또한, 고도로 엄격한 하이브리드화 조건 하에서, 상기 1)에 따르는 폴리뉴클레오티드 중의 하나 이상과 하이브리드화되는 폴리뉴클레오티드이다.
3) 본 발명은 또한, 상기 단락 1)에 따르는 폴리뉴클레오티드의 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 또는 1900개 이상의 연속되는 뉴클레오티드를 포함하는 폴리뉴클레오티드와 70%, 80%, 85%, 90%, 95% 또는 98% 이상의 뉴클레오티드 동일성을 나타내는 폴리뉴클레오티드에 관한 것이다.
4) 본 발명은 또한, 스트렙토마이세스 속(genus) 세균으로부터 분리되는, 상기 단락 2) 또는 3)에 따르는 폴리뉴클레오티드에 관한 것이다.
5) 본 발명은 또한, 매크롤리드의 생합성에 관여하는 단백질을 암호화하는, 상기 단락 2), 3) 또는 4)에 따르는 폴리뉴클레오티드에 관한 것이다.
6) 본 발명은 또한, 당해 폴리뉴클레오티드와 하이브리드화되거나 또는 당해 폴리뉴클레오티와 동일성을 나타내는 폴리뉴클레오티드에 의해 암호화된 단백질과 유사한 활성을 지닌 단백질을 암호화하는, 상기 단락 2), 3) 또는 4)에 따르는 폴리뉴클레오티드에 관한 것이다.
7) 본 발명은 또한, 상기 단락 1), 2), 3), 4), 5) 또는 6)에 따르는 폴리뉴클레오티드의 발현으로부터 생성된 폴리펩티드에 관한 것이다.
8) 본 발명의 또 다른 국면은 스피라마이신 생합성에 관여하는 폴리펩티드에 관한 것이며, 이러한 폴리펩티드의 서열은 다음과 같다:
(a) 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 및 150의 서열들 중의 하나,
(b) 상기 서열 (a) 전반에 걸쳐, 이러한 서열의 기능적 특성에는 전혀 영향을 미치지 않으면서 1개 이상의 아미노산이 치환, 삽입 또는 결실된 것을 제외하고는, 상기 (a)에 규정된 바와 같은 서열들 중의 하나,
(c) 서열 (a) 및 (b)의 변이체로 이루어진 서열들 중의 하나.
9) 본 발명의 또 다른 주제는 상기 단락 8)에 따르는 폴리펩티드의 10, 15, 20, 30 내지 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 또는 640개 이상의 연속되는 아미노산을 포함하는 폴리펩티드와 70%, 80%, 85%, 90%, 95% 또는 98% 이상의 아미노산 동일성을 나타내는 폴리펩티드에 관한 것이다.
10) 본 발명의 또 다른 국면은 스트렙토마이세스 속 세균으로부터 분리되는, 상기 단락 9)에 따르는 폴리펩티드에 관한 것이다.
11) 본 발명의 또 다른 국면은 매크롤리드의 생합성에 관여하는 단백질을 암호화하는, 상기 단락 9) 또는 10)에 따르는 폴리펩티드에 관한 것이다.
12) 본 발명의 또 다른 국면은 동일성을 공유하고 있는 폴리펩티드와 유사한 활성을 지니고 있는, 상기 단락 9), 10) 또는 11)에 따르는 폴리펩티드에 관한 것이다.
13) 본 발명의 또 다른 국면은 상기 단락 1), 2), 3), 4), 5) 및 6) 중의 하나에 따르는 하나 이상의 폴리뉴클레오티드를 포함하는 재조합 DNA에 관한 것이다.
14) 본 발명의 또 다른 국면은 상기 재조합 DNA가 벡터 내에 포함되어 있는, 상기 단락 13)에 따르는 재조합 DNA에 관한 것이다.
15) 본 발명의 또 다른 국면은 상기 벡터가 박테리오파아지, 플라스미드, 파아지미드, 통합(integrative) 벡터, 포스미드, 코스미드, 셔틀 벡터, BAC 및 PAC 중에서 선택되는, 상기 단락 14)에 따르는 재조합 DNA에 관한 것이다.
16) 본 발명의 또 다른 국면은 pOS49.1, pOS49.11, pOSC49.12, pOS49.14, pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5, pSPM7, pOS49.67, pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504, pSPM507, pSPM508, pSPM509, pSPM1, pBXL1111, pBXL1112, pBXL1113, pSPM520, pSPM521, pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, pSPM47, pSPM48, pSPM50, pSPM51,pSPM52, pSPM53, pSPM55, pSPM56, pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74, pSPM75, pSPM79, pSPM83, pSPM107, pSPM543 및 pSPM106 중에서 선택되는, 상기 단락 15)에 따르는 재조합 DNA에 관한 것이다.
17) 본 발명의 또 다른 국면은 상기 단락 7), 8), 9), 10), 11) 또는 12)에 따르는 폴리펩티드를 암호화하는 하나 이상의 핵산 서열을 포함하는 발현 벡터에 관한 것이다.
18) 본 발명은 또한, 적합한 발현 벡터와, 상기 단락 7), 8), 9), 10), 11) 또는 12)에 따르는 하나 이상의 폴리펩티드의 발현을 허용해 주는 숙주 세포를 포 함하는 발현 시스템에 관한 것이다.
19) 본 발명은 또한, 원핵성 발현 시스템과 진핵성 발현 시스템 중에서 선택되는, 상기 단락 18)에 따르는 발현 시스템에 관한 것이다.
20) 본 발명은 또한, 이. 콜라이(E. coli) 세균에서의 발현 시스템, 곤충 세포에서의 발현을 허용해주는 바쿨로바이러스(baculovirus) 발현 시스템, 효모 세포에서의 발현을 허용해주는 발현 시스템, 및 포유류 세포에서의 발현을 허용해주는 발현 시스템 중에서 선택되는, 상기 단락 19)에 따르는 발현 시스템에 관한 것이다.
21) 본 발명은 또한, 상기 단락 1), 2), 3), 4), 5), 6), 13), 14), 15), 16) 및 17) 중의 하나에 따르는 하나 이상의 폴리뉴클레오티드 및/또는 하나 이상의 재조합 DNA 및/또는 하나 이상의 발현 벡터가 도입된 숙주 세포에 관한 것이다.
22) a) 폴리펩티드를 암호화하는 하나 이상의 핵산을 적합한 벡터 내로 삽입하는 단계;
b) 단계 a)의 벡터로 미리 형질전환 또는 형질감염시킨 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계;
e) 경우에 따라, 이로써 생성된 재조합 폴리펩티드를 성상 확인하는 단계
를 포함하는, 상기 단락 7), 8), 9), 10), 11) 또는 12)에 따르는 폴리펩티 드의 생성 방법에 관한 것이다.
23) 본 발명의 또 다른 국면은 하나 이상의 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물에 관한 것이다.
24) 본 발명의 또 다른 국면은 이들 매크롤리드를 생산하는 미생물에서 상기 매크롤리드의 생합성에 관여하는 하나 이상의 단백질의 기능을 불활성화시킴으로써 수득되는, 상기 단락 23)에 따르는 미생물에 관한 것이다.
25) 본 발명의 또 다른 국면은 이들 단백질을 불활성화시키는 것이, 상기 단백질을 암호화하는 유전자에서 돌연변이 유발시키거나 또는 상기 단백질을 암호화하는 메신저 RNA에 상보적인 하나 이상의 안티센스 RNA를 발현시킴으로써 수행되는, 상기 단락 24)에 따르는 미생물에 관한 것이다.
26) 본 발명의 또 다른 국면은 이들 단백질을 불활성화시키는 것이, 방사선조사를 통하여 돌연변이 유발시키거나, 돌연변이 유발성 화학 제제를 작용시키거나, 부위-지시된 돌연변이 유발시키거나, 또는 유전자 대체시킴으로써 수행되는, 상기 단락 25)에 따르는 미생물에 관한 것이다.
27) 본 발명의 또 다른 국면은 돌연변이 유발시키는 것이, 시험관내 또는 원위치에서, 고려 중인 유전자 내의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키거나 또는 유전자 불활성화시킴으로써 수행되는, 상기 25) 또는 26)에 따르는 미생물에 관한 것이다.
28) 본 발명의 또 다른 국면은 상기 미생물이 스트렙토마이세스 속 세균인, 상기 단락 23), 24), 25), 26) 또는 27)에 따르는 미생물에 관한 것이다.
29) 본 발명의 또 다른 국면은 매크롤리드가 스피라마이신인, 상기 단락 23), 24), 25), 26), 27) 또는 28)에 따르는 미생물에 관한 것이다.
30) 본 발명의 또 다른 국면은 상기 미생물이 에스. 암보파시엔스 균주인, 상기 단락 23), 24), 25), 26), 27), 28) 또는 29)에 따르는 미생물에 관한 것이다.
31) 본 발명의 또 다른 국면은 돌연변이 유발이 상기 단락 1), 2), 3), 4), 5) 및 6) 중의 하나에 따르는 서열을 포함하는 하나 이상의 유전자에서 수행되는, 상기 단락 23), 24), 25), 26), 27), 28), 29) 또는 30)에 따르는 미생물에 관한 것이다.
32) 본 발명의 또 다른 국면은 돌연변이 유발이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 서열들 중의 하나 이상에 상응하는 서열들 중의 하나를 포함하는 하나 이상의 유전자에서 수행되는, 상기 단락 25), 26), 27), 28), 29), 30) 또는 31)에 따르는 미생물에 관한 것이다.
33) 본 발명의 또 다른 국면은 돌연변이 유발이 서열 번호 13에 상응하는 서열을 포함하는 유전자를 유전자 불활성화시키는 것으로 이루어지는, 상기 단락 25), 26), 27), 28), 29), 30), 31) 또는 32)에 따르는 미생물에 관한 것이다.
34) 본 발명의 또 다른 국면은 2002년 7월 10일자로 기탁 기관(Collection Nationale de Cultures de Microorganismes [National Collection of Cultures and Microorganisms]) (CNCM)에 등록 번호 I-2909, I-2911, I-2912, I-2913, I-2914, I-2915, I-2916 또는 I-2917로 기탁된 균주들 중의 하나로부터 선택된 균주인 스트렙토마이세스 암보파시엔스 균주에 관한 것이다.
35) 본 발명의 또 다른 국면은
a) 상기 단락 23), 24), 25), 26), 27), 28), 29), 30), 31), 32), 33) 또는 34) 중의 하나에 따르는 미생물을 적합한 배양 배지에서 배양하는 단계;
b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
c) 단계 b)에서 수득된 추출물로부터 또는 상기 배양 배지로부터 매크롤리드 생합성 중간체를 분리 및 정제하는 단계
를 포함하는, 상기 매크롤리드 생합성 중간체의 제조 방법에 관한 것이다.
36) 본 발명의 또 다른 국면은 생합성 중간체를 상기 단락 35)의 방법에 따라서 제조하고, 이로써 제조된 중간체를 변형시키는, 매크롤리드로부터 유도된 분자의 제조 방법에 관한 것이다.
37) 본 발명의 또 다른 국면은 상기 중간체가 화학적, 생화학적, 효소적 및/또는 미생물적으로 변형되는, 상기 단락 36)에 따르는 제조 방법에 관한 것이다.
38) 본 발명의 또 다른 국면은 상기 중간체를 기질로서 사용함으로써 이러한 중간체를 변형시킬 수 있는 단백질을 암호화하는 하나 이상의 유전자를 상기 미생물 내로 도입하는, 상기 단락 36) 또는 37)에 따르는 제조 방법에 관한 것이다.
39) 본 발명의 또 다른 국면은 매크롤리드가 스피라마이신인, 상기 단락 36), 37) 또는 38)에 따르는 제조 방법에 관한 것이다.
40) 본 발명의 또 다른 국면은 사용된 미생물이 에스. 암보파시엔스의 균주인, 상기 단락 36), 37), 38) 또는 39)에 따르는 제조 방법에 관한 것이다.
41) 본 발명의 또 다른 국면은 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 않는 미생물에 관한 것이다.
42) 본 발명의 또 다른 국면은 스피라마이신 I의 생합성에 요구되는 유전자 모두를 포함하긴 하지만, 서열 번호 13의 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 이의 변이체들 중의 하나를 암호화하는 유전자는 발현되지 않거나 또는 이를 불활성으로 만든, 상기 단락 41)에 따르는 미생물에 관한 것이다.
43) 본 발명의 또 다른 국면은 상기 불활성화가, 상기 단백질을 암호화하는 유전자에서 돌연변이 유발시키거나 또는 상기 단백질을 암호화하는 메신저 RNA에 상보적인 안티센스 RNA를 발현시킴으로써 수행되는, 상기 단락 42)에 따르는 미생물에 관한 것이다.
44) 본 발명의 또 다른 국면은 상기 돌연변이 유발이, 상기 유전자의 프로모터, 암호화 서열 또는 비-암호화 서열에서 수행되어, 암호화된 단백질을 불활성으로 만들거나, 또는 이의 발현이나 이로부터의 해독을 방지시키도록 하는, 상기 단락 43)에 따르는 미생물에 관한 것이다.
45) 본 발명의 또 다른 국면은 돌연변이 유발이, 방사선조사, 돌연변이 유발성 화학 제제의 작용, 부위-지시된 돌연변이 유발 또는 유전자 대체에 의해 수행되는, 상기 단락 43) 또는 44)에 따르는 미생물에 관한 것이다.
46) 본 발명의 또 다른 국면은 돌연변이 유발이, 시험관내 또는 원위치에서, 고려 중인 유전자 내의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키거나 또는 유전자 불활성화시킴으로써 수행되는, 상기 단락 43), 44) 또는 45)에 따르는 미생물에 관한 것이다.
47) 본 발명의 또 다른 국면은 상기 미생물이, 스피라마이신에 대한 생합성 경로의 유전자를 발현시킴으로써 수득되는데, 이들 유전자가 서열 번호 13에 상응하는 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 이의 변이체들 중의 하나를 암호화하는 유전자는 포함하지 않는, 상기 단락 41) 또는 42)에 따르는 미생물에 관한 것이다.
48) 본 발명의 또 다른 국면은 상기 미생물이 스트렙토마이세스 속 세균인, 상기 단락 41), 42), 43), 44), 45), 46) 또는 47)에 따르는 미생물에 관한 것이다.
49) 본 발명의 또 다른 국면은 상기 미생물이 스피라마이신 I, II 및 III을 생산하는 출발 균주로부터 수득되는, 상기 단락 41), 42), 43), 44), 45), 46), 47) 또는 48)에 따르는 미생물에 관한 것이다.
50) 본 발명의 또 다른 국면은 서열 번호 13에 상응하는 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 동일한 기능을 갖는 이의 변이체 들 중의 하나를 암호화하는 유전자 내에서 돌연변이 유발시킴으로써 수득되는, 상기 단락 41), 42), 43), 44), 45), 46), 47), 48) 또는 49)에 따르는 미생물 에 관한 것이다.
51) 본 발명의 또 다른 국면은 상기 미생물이 서열 번호 13에 상응하는 서열 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자의 유전자 불활성화가 수행되는, 스피라마이신 I, II 및 III을 생산하는 에스. 암보파시엔스 균주로부터 수득되는, 상기 단락 41), 42), 43), 44), 45), 46), 47), 48), 49) 또는 50)에 따르는 미생물에 관한 것이다.
52) 본 발명의 또 다른 국면은 2002년 7월 10일자로 기탁 기관(Collection Nationale de Cultures de Microorganismes)(CNCM)에 등록 번호 I-2910으로 기탁된 균주인 에스. 암보파시엔스 균주에 관한 것이다.
53) 본 발명의 또 다른 국면은
a) 상기 단락 41), 42), 43), 44), 45), 46), 47), 48), 49), 50), 51) 및 52) 중의 하나에 따르는 미생물을 적합한 배양 배지에서 배양하는 단계;
b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
c) 단계 b)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 스피라마이신 I을 분리 및 정제하는 단계
를 포함하는, 스피라마이신 I의 생성 방법에 관한 것이다.
54) 본 발명의 또 다른 국면은 미생물의 매크롤리드 생산을 향상시키기 위한, 상기 단락 1), 2), 3), 4), 5) 및 6) 중의 하나에 따르는 폴리뉴클레오티드의 용도에 관한 것이다.
55) 본 발명의 또 다른 국면은 상기 단락 1), 2), 3), 4), 5) 또는 6) 중의 하나에 따르는 서열을 포함하는 하나 이상의 유전자에서 유전자 변형을 지니고 있고, 상기 단락 1), 2), 3), 4), 5) 및 6) 중의 하나에 따르는 서열을 포함하는 하나 이상의 유전자를 과발현하는, 매크롤리드-생산 돌연변이체 미생물에 관한 것이다.
56) 본 발명의 또 다른 국면은 상기 유전자 변형이, 보다 큰 활성을 지닌 하나 이상의 단백질을 발현시키거나 또는 이들 단백질을 보다 높은 수준으로 발현시킬 목적으로, 고려 중인 유전자 내의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키는 것으로 이루어지는, 상기 단락 55)에 따르는 돌연변이체 미생물에 관한 것이다.
57) 본 발명의 또 다른 국면은 고려 중인 유전자의 과발현이, 이러한 유전자에 대한 복사물 수를 증가시키고/시키거나 야생형 프로모터 보다 더 활성인 프로모터를 도입함으로써 획득되는, 상기 단락 55)에 따르는 돌연변이체 미생물에 관한 것이다.
58) 본 발명의 또 다른 국면은 고려 중인 유전자의 과발현이, 매크롤리드-생산 미생물을 상기 단락 13), 14) 또는 17)에 따르는 재조합 DNA 작제물로 형질전환시켜 상기 유전자의 과발현을 허용함으로써 획득되는, 상기 단락 55) 또는 57)에 따르는 돌연변이체 미생물에 관한 것이다.
59) 본 발명의 또 다른 국면은 상기 유전자 변형이, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149 중의 하나 이상의 서열에 상응하는 서열들 중의 하나, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 하나 이상의 유전자에서 수행되는, 상기 단락 55), 56), 57) 또는 58)에 따르는 돌연변이체 미생물에 관한 것이다.
60) 본 발명의 또 다른 국면은 상기 미생물이, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149 중의 하나 이상의 서열에 상응하는 서열들 중의 하나, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 하나 이상의 유전자를 과발현하는, 상기 단락 55), 56), 57), 58) 또는 59)에 따르는 돌연변이체 미생물에 관한 것이다.
61) 본 발명의 또 다른 국면은 상기 미생물이 스트렙토마이세스 속 세균인, 상기 단락 55), 56), 57), 58), 59) 또는 60)에 따르는 돌연변이체 미생물에 관한 것이다.
62) 본 발명의 또 다른 국면은 매크롤리드가 스피라마이신인, 상기 단락 55), 56), 57), 58), 59), 60) 또는 61)에 따르는 돌연변이체 미생물에 관한 것이다.
63) 본 발명의 또 다른 국면은 상기 미생물이 에스. 암보파시엔스 균주인, 상기 단락 55), 56), 57), 58), 59), 60), 61) 또는 62)에 따르는 돌연변이체 미생물에 관한 것이다.
64) 본 발명의 또 다른 국면은
a) 상기 단락 55), 56), 57), 58), 59), 60), 61), 62), 63) 및 64) 중의 하나에 따르는 미생물을 적합한 배양 배지에서 배양하는 단계;
b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
c) 단계 b)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 생성된 매크롤리드(들)를 분리 및 정제하는 단계
를 포함하는, 상기 매크롤리드의 생성 방법에 관한 것이다.
65) 본 발명의 또 다른 국면은 하이브리드 항생제를 제조하기 위한, 상기 단락 1), 2), 3), 4), 5), 6), 7), 8), 9), 10), 11), 12), 13), 14), 15), 16) 및 17) 중의 하나에 따르는 서열 및/또는 재조합 DNA 및/또는 벡터의 용도에 관한 것이다.
66) 본 발명의 또 다른 국면은 한 가지 이상의 생체전환(bioconversion)을 수행하기 위한, 상기 단락 1), 2), 3), 4), 5), 6), 7), 8), 9), 10), 11), 12), 13), 14), 15), 16), 17) 및 21) 중의 하나에 따르는 하나 이상의 폴리뉴클레오티드 및/또는 하나 이상의 재조합 DNA 및/또는 하나 이상의 발현 벡터 및/또는 하나 이상의 폴리펩티드 및/또는 하나 이상의 숙주 세포의 용도에 관한 것이다.
67) 본 발명의 또 다른 국면은 상기 단락 1), 2), 3), 4), 5) 또는 6)에 따르는 폴리뉴클레오티드 중의 하나에 상보적인 폴리뉴클레오티드에 관한 것이다.
68) 본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하는, 하나 이상의 스피라마이신을 생산하는 미생물에 관한 것이다.
69) 본 발명의 또 다른 국면은 스트렙토마이세스 속 세균인, 단락 68 또는 90에 따르는 미생물에 관한 것이다.
70) 본 발명의 또 다른 국면은 스트렙토마이세스 암보파시엔스 종 세균인, 단락 68, 69 또는 90에 따르는 미생물에 관한 것이다.
71) 본 발명의 또 다른 국면은 상기 유전자의 과발현이, 해당 미생물을 발현 벡터로 형질전환시킴으로써 수득되는, 단락 68, 69, 70 또는 90에 따르는 미생물에 관한 것이다.
72) 본 발명의 또 다른 국면은 2003년 10월 6일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes(CNCM)[National Collection of Cultures and Microorganisms] Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-3101로 기탁된 균주 OSC2/pSPM75(1) 또는 균주 OSC2/pSPM75(2)인, 스트렙토마이세스 암보파시엔스 균주에 관한 것이다.
73) 본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응에 의해 수득될 수 있는 폴리뉴클레오티드; 또는
- 이러한 폴리뉴클레오티드의 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, 1480, 1490 또는 1500개 이상의 연속되는 뉴클레오티드의 단편
을 포함하는 재조합 DNA에 관한 것이다.
74) 본 발명의 또 다른 국면은 벡터인, 단락 73 또는 91에 따르는 재조합 DNA에 관한 것이다.
75) 본 발명의 또 다른 국면은 발현 벡터인, 단락 73, 74 또는 91에 따르는 재조합 DNA에 관한 것이다.
76) 본 발명의 또 다른 국면은 단락 73, 74, 75 및 91 중의 하나에 따르는 하나 이상의 재조합 DNA를 도입시킨 숙주 세포에 관한 것이다.
77) 본 발명의 또 다른 국면은
a) 단락 75에 따르는 하나 이상의 발현 벡터로 숙주 세포를 형질전환시키는 단계;
b) 상기 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계;
e) 경우에 따라, 이로써 생성된 재조합 폴리펩티드를 성상 확인하는 단계
를 포함하는, 폴리펩티드의 생성 방법에 관한 것이다.
78) 본 발명의 또 다른 국면은 유전자 불활성화가, 서열 번호 13에 상응하는 서열 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자 또는 이의 일부를 동위상(in-phase) 결실시킴으로써 수행되는, 단락 51에 따르는 미생물에 관한 것이다.
79) 본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응에 의해 수득될 수 있는 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하기도 하는, 단락 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 및 78 중의 하나에 따르는 미생물에 관한 것이다.
80) 본 발명의 또 다른 국면은 서열 번호 47의 폴리뉴클레오티드 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 폴리뉴클레오티드가, 스트렙토마이세스 암보파시엔스에서 상기 폴리뉴클레오티드에 의해 암호화된 단백질의 발현을 허용해 주는 프로모터의 제어 하에 위치되어 있는 발현 벡터에 관한 것이다.
81) 본 발명의 또 다른 국면은 플라스미드 pSPM524 또는 pSPM525인, 단락 80에 따르는 발현 벡터에 관한 것이다.
82) 본 발명의 또 다른 국면은 단락 80 또는 81에 따르는 벡터로 형질전환시킨 스트렙토마이세스 암보파시엔스 균주에 관한 것이다.
83) 본 발명의 또 다른 국면은 서열 번호 47의 암호화 서열 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 암호화 서열을 갖는 유전자를 과발현하기도 하는, 단락 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 78, 79 및 92 중의 하나에 따르는 미생물에 관한 것이다.
84) 본 발명의 또 다른 국면은 2003년 2월 26일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25 rue duDocteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-2977로 기탁된 균주 SPM502 pSPM525인, 단락 83에 따르는 미생물에 관한 것이다.
85) 본 발명의 또 다른 국면은
a) 단락 68, 69, 70, 71, 72, 78, 79, 82, 83, 84, 90 및 92 중의 하나에 따르는 미생물을 적합한 배양 배지에서 배양하는 단계;
b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
c) 단계 b)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 스피라마이신을 분리 및 정제하는 단계
를 포함하는, 상기 스피라마이신(들)의 생성 방법에 관한 것이다.
86) 본 발명의 또 다른 국면은 서열 번호 112 또는 서열 번호 142의 서열을 포함하는 폴리펩티드에 관한 것이다.
87) 본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자의 암호화 서열, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자의 암호화 서열
로부터 해독된 서열에 상응하는 서열을 갖는 폴리펩티드에 관한 것이다.
88) 본 발명의 또 다른 국면은 스트렙토마이세스 암보파시엔스에서 단락 86, 87 또는 93에 따르는 폴리펩티드의 발현을 허용해 주는 발현 벡터에 관한 것이다.
89) 본 발명의 또 다른 국면은 플라스미드 pSPM75인, 단락 88에 따르는 발현 벡터에 관한 것이다.
90) 본 발명의 또 다른 국면은 폴리머라제 연쇄 증폭에 의해 수득될 수 있는 유전자가 서열 번호 141의 암호화 서열의 유전자, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자인, 단락 68에 따르는 미생물에 관한 것이다.
91) 본 발명의 또 다른 국면은 폴리머라제 연쇄 증폭에 의해 수득될 수 있는 폴리뉴클레오티드가 서열 번호 141의 폴리뉴클레오티드인, 단락 73에 따르는 재조합 DNA에 관한 것이다.
92) 본 발명의 또 다른 국면은 폴리머라제 연쇄 증폭에 의해 수득될 수 있는 유전자가 서열 번호 141의 암호화 서열의 유전자, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자인, 단락 79에 따르는 미생물에 관한 것이다.
93) 본 발명의 또 다른 국면은 서열 번호 142의 서열로 이루어진 폴리펩티드에 관한 것이다.
일반적인 정의
본 발명의 목적상, 용어 "분리된"이란 본래의 환경(본래 위치하는 환경)으로부터 제거된 생물학적 물질(핵산 또는 단백질)을 의미한다.
예를 들어, 식물 또는 동물에 천연 상태로 존재하는 폴리뉴클레오티드는 분리되지 않은 것이다. 식물 또는 동물의 게놈 내에 천연적으로 삽입되는 인접한 핵산으로부터 격리된 동일한 폴리뉴클레오티드는 "분리된" 것으로 간주된다.
이러한 폴리뉴클레오티드는 벡터 내에 포함될 수 있고/있거나 상기 폴리뉴클레오티드는 조성물 내에 포함될 수 있는데, 그럼에도 불구하고 분리된 상태로 유지될 수 있는 것은, 이러한 벡터 또는 조성물이 이의 본래 환경을 구성하고 있지 않다는 사실 때문이다.
용어 "정제된"이란 해당 물질이 기타 화합물의 존재를 배제한, 절대적으로 순수한 형태로만 존재해야 한다는 것을 의미하지는 않는다. 이는 오히려 상대적인 의미이다.
출발 물질 또는 천연 물질을 1 차수 (order-of-magnitude ) 이상, 바람직하게는 2 또는 3, 우선적으로는 4 또는 5 차수로 정제시킨 후 "정제된" 상태의 폴리뉴클레오티드이다.
본 발명의 목적상, 용어 ORF("개방 판독 프레임")는 특히 유전자의 암호화 서열을 의미하기 위해 사용되었다.
본 발명의 목적상, 표현 "뉴클레오티드 서열"은 폴리뉴클레오티드 또는 핵산에 동등하게 지칭되도록 사용될 수 있다. 표현 "뉴클레오티드 서열"은 유전 물질 그 자체를 포괄하므로, 이의 서열에 관한 정보로 제한되지 않는다.
용어 "핵산", "폴리뉴클레오티드", "올리고뉴클레오티드" 또는 "뉴클레오티드 서열"은 일본쇄 형태 또는 이중체 형태의, 1개 이상 뉴클레오티드의 RNA, DNA 또는 cDNA 서열, 또는 RNA/DAN 하이브리드 서열을 포괄한다.
용어 "뉴클레오티드"는 천연 뉴클레오티드(A, T, G, C)와, 하나 이상의 변형을 포함하는 변형된 뉴클레오티드, 예를 들면, (1) 푸린 동족체, (2) 피리미딘 동 족체 또는 (3) 당 동족체 둘 다를 의미하며, 이러한 변형된 뉴클레오티드의 예는 예를 들어, PCT 국제공개공보 WO 95/04064에 기재되어 있다.
본 발명의 목적상, 제1 폴리뉴클레오티드의 각 염기가, 이와 역배향인 제2 폴리뉴클레오티드의 상보적 염기와 쌍을 형성하는 경우에, 이러한 제1 폴리뉴클레오티드는 제2 폴리뉴클레오티드에 "상보적"인 것으로 간주된다. 상보적 염기는 A와 T(또는 A와 U), 또는 C와 G이다.
용어 "스피라마이신에 대한 생합성 경로의 유전자"에는 또한, 조절성 유전자와, 생산자 미생물에 내성을 부여해 주는 유전자가 포함된다.
본 발명에 따르면, 기준 핵산의 "단편"이란 용어는 기준 핵산과 비교해서 보다 짧고, 기준 핵산과 동일한 뉴클레오티드 서열을 공통 부분 위에 포함하는 뉴클레오티드 서열을 의미할 것이다.
본 발명에 따르면, 이러한 핵산 "단편"은 경우에 따라, 보다 큰 폴리뉴클레오티드 내에 구성분으로 포함될 수도 있다.
상기 단편은 본 발명에 따르는 핵산의 8, 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 또는 1900개의 연속되는 뉴클레오티드 길이의 폴리뉴클레오티드를 포함하거나 또는 이들로 이루어진다.
본 발명에 따르면, 폴리펩티드의 "단편"이란 용어는 이의 아미노산 서열이 기준 폴리펩티드의 아미노산 서열 보다 짧고, 이들 기준 폴리펩티드와 공통인 전체 부분 전반에 걸쳐 동일한 아미노산 서열을 포함하는 폴리펩티드를 의미할 것이다.
이러한 단편은 경우에 따라, 이를 일부로 하는 보다 큰 폴리펩티드 내에 포함될 수도 있다.
본 발명에 따르는 폴리펩티드의 상기 단편은 10, 15, 20, 30 내지 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 또는 640개 아미노산 길이일 수 있다.
본 발명의 목적상, "고도로 엄격한 하이브리드화 조건"이란 표현은 비-상동성 핵산 쇄의 하이브리드화에는 바람직하지 못한 하이브리드화 조건을 의미할 것이다. 고도로 엄격한 하이브리드화 조건은, 예를 들어, 하이브리드화 온도 55 내지 65℃, 바람직하게는 하이브리드화 온도 55℃, 보다 더 바람직하게는 하이브리드화 온도 60℃, 가장 바람직하게는 하이브리드화 온도 65℃에서 문헌[참조: Church & Gilbert, 1984]에 기재된 완충액 중에서 하이브리드화시킨 다음, 55 내지 65℃, 바람직하게는 55℃, 보다 더 바람직하게는 60℃, 가장 바람직하게는 65℃에서 2X SSC 완충액(1X SSC 완충액은 0.15M NaCl, 15mM 나트륨 시트레이트의 수용액에 상응한다)에서 1회 이상의 세척을 수행한 다음, 55 내지 65℃, 바람직하게는 55℃, 보다 더 바람직하게는 60℃, 가장 바람직하게는 65℃에서 0.5X SSC 완충액에서 1회 이상 세척하는 조건으로서 서술될 수 있다.
상기 언급된 하이브리드화 조건은 당업자에게 공지된 기술에 따라서, 하이브 리드화하고자 하는 핵산의 길이 또는 선택된 표지화 유형의 함수로서 조정할 수 있다. 적합한 하이브리드화 조건은, 예를 들어, 문헌[참조: F. Ausubel et al (2002)]에 따라서 조정할 수 있다.
본 발명에 따르는 핵산의 "변이체"란 용어는 기준 폴리뉴클레오티드와 비교해서 1개 이상의 염기가 상이한 핵산을 의미할 것이다. 변이체 핵산은 천연 기원, 예를 들면, 천연상 발견되는 대립유전자성 변이체일 수 있거나, 또는 예를 들어, 돌연변이 유발 기술에 의해 수득된 비-천연 변이체일 수도 있다.
일반적으로, 기준 핵산과 변이체 핵산 간의 차이는 작기 때문에, 기준 핵산의 뉴클레오티드 서열과 변이체 핵산의 뉴클레오티드 서열은 매우 유사하고, 많은 영역에 있어 동일하다. 변이체 핵산에 존재하는 뉴클레오티드 변형은 침묵(silent) 변형일 수 있는데, 이는 이러한 변형으로는, 상기 변이체 핵산에 의해 암호화된 아미노산 서열을 변형시키지 못한다는 것을 의미한다.
그러나, 변이체 핵산 상의 뉴클레오티드 변화로 인해, 기준 핵산에 의해 암호화된 펩티드와 비교해서 변이체 핵산에 의해 암호화된 폴리펩티드 내에서 치환, 부가 및/또는 결실이 유발될 수도 있다. 또한, 암호화 영역 상의 뉴클레오티드 변형으로 인해, 아미노산 서열 내에 보존적 또는 비-보존적 치환이 야기될 수 있다.
바람직하게는, 본 발명에 따르는 변이체 핵산이, 기준 핵산의 폴리펩티드와 실질적으로 동일한 기능 또는 생물학적 활성을 보존하고 있거나 또는 초기 핵산에 의해 암호화된 폴리펩티드에 대한 항체에 의해 인식될 수 있는 능력을 보존하고 있는 폴리펩티드를 암호화한다.
따라서, 몇몇 변이체 핵산은 폴리펩티드의 돌연변이된 형태를 암호화할 것인데, 이에 관한 체계적인 연구는 문제의 단백질의 구조-활성 관계를 추론할 수 있게 해줄 것이다.
본 발명에 따르는 폴리펩티드의 "변이체"란 용어는 기준 폴리펩티드의 아미노산 서열과 비교해서, 1개 이상의 아미노산 잔기의 한 가지 이상의 치환, 부가 또는 결실을 함유하는 아미노산 서열을 갖는 폴리펩티드를 주로 의미할 것인데, 이러한 아미노산 치환은 차별 없이 보존적 또는 비-보존적일 수 있다.
바람직하게는, 본 발명에 따르는 변이체 폴리펩티드가, 기준 폴리펩티드와 실질적으로 동일한 기능 또는 생물학적 활성을 보존하고 있거나 또는 초기 폴리펩티드에 대한 항체에 의해 인식될 수 있는 능력을 보존하고 있다.
본 발명의 목적상, 기준 폴리펩티드와 "유사한 활성"을 지닌 폴리펩티드는 기준 폴리펩티드의 생물학적 활성을 측정하는데 적합한 생물학적 검정으로 측정된 바와 같이, 기준 폴리펩티드의 생물학적 활성과 유사하긴 하지만, 반드시 동일할 필요는 없는 생물학적 활성을 지닌 폴리펩티드를 의미한다.
본 발명의 목적상, 용어 "하이브리드 항생제"는 재조합 DNA 기술을 사용하여 인공 생합성 경로를 작제함으로써 생성된 화합물을 의미한다.
본 발명의 주제는 보다 특히, 다음의 상세한 설명에 제시된 바와 같은, 스피라마이신에 대한 생합성 경로의 신규한 유전자 및 이러한 생합성에 관여하는 신규한 폴리펩티드이다.
상기 생합성 경로의 유전자를 클로닝하고, 이들 유전자의 DNA 서열을 결정한다. 수득된 서열은 프레임플롯(FramePlot) 프로그램[참조: J. Ishikawa & K. Hotta, 1999]을 사용하여 분석하였다. 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정한다. 이러한 분석 결과, 상기 영역이 효소 "폴리케티드 신타제"(PKS)를 암호화하는 5개 유전자의 어느 한쪽에 위치되고, 스트렙토마이세스 특유의 코돈 활용을 나타내는 44개 ORF를 포함한다는 사실이 밝혀졌다. PKS를 암호화하는 이들 5개 유전자의 어느 한쪽에, 10개 및 34개 ORF가 각각 하류 및 상류에서 동정되었다(하류 및 상류는 동일한 방향으로 모두 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 3 및 37 참조). 따라서, 대략 41.7 kb의 영역을 점유하고 있는 상기 유형의 34개 개방 판독 프레임[참조: 25개 ORF를 함유하는 31 kb의 제1 영역을 나타내는 서열 번호 1, 및 대략 12.1 kb의 영역(이의 1.4 kb는 선행 서열(서열 번호 1)과 중복되고, 이의 대략 10.7 kb는 후속 서열에 상응한데, 대략 10.7 kb의 후자 부분은 9개의 부가 ORF(부분 서열의 1개 ORF 포함)를 함유한다)을 나타내는 서열 번호 14(또한, 하기 도 3 및 37 참조)]을, 상기 PKS를 암호화하는 5개 유전자의 상류에서 동정하고, 대략 11.1 kb 영역을 점유하고 있는 10개(서열 번호 2 및 도 3)는 PKS 유전자의 하류에서 동정하였다. 따라서, 5개 PKS 유전자의 하류에 위치된 10개 유전자는 orf1*c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8*, orf9* orf10* (서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21)으로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(따라서, 암호화 쇄는 이들 유전자에 대해 서열 번호 2에 제시된 서열에 상보적인 쇄이다). 동일한 명명법을 사용하여, PKS 유전자의 상류의 34개 ORF는 orf1, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10, orf11c, orf12, orf13c, orf14, orf15c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, orf23c, orf24c, orf25c, orf26, orf27, orf28c, orf29, orf30c, orf31, orf32c, orf33 orf34c (서열 번호 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149)로 명명되었다(참조: 도 3 및 37).
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치, COGs(Cluster of Orthologous Groups)(이들 3가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990], BEAUTY[참조: K.C. Worley et al., 1995](이들 2가지 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
PKS를 암호화하는 유전자의 하류에 위치한 유전자
해당 영역의 조직을 다이아그램으로 표시한 것이 도 3에 도시되어 있다. 다음에서 입증되는 바와 같이, PKS를 암호화하는 유전자의 하류에서 동정된 10개의 유전자 중에 9개가 스피라마이신의 생합성에 관여하거나 스피라마이신에 대한 내성을 나타내는 것으로 여겨진다. 이들 9개 유전자는 다음과 같다: orf1*c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8* orf9*.
다음 표 1에는, 5개의 PKS 유전자의 하류에서 동정된 10개 유전자의 DNA 서열과 아미노산 서열을 기준(참조)으로 하여 제시되어 있다.
Figure 112005018477118-pct00001
유전자 명칭에 부가된 "c"는 암호화 서열이 역배향으로 존재한다는 것을 지시한다(따라서, 암호화 쇄는 이들 유전자에 대해 서열 번호 2에 제시된 서열에 상보적인 쇄이다).
동정된 폴리펩티드의 기능을 결정할 목적으로, 3가지 유형의 실험을 수행하였다: 동정된 서열을 공지된 기능의 서열과 비교하는 실험; 돌연변이체 균주를 작제시켜 주는 유전자 불활성화 실험; 및 이들 돌연변이체 균주에 의한 스피라마이신 생합성 중간체의 생산과 스피라마이신의 생산에 대한 분석 실험.
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 우선적으로, 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치, COGs(Cluster of Orthologous Groups), FASTA[참조: W.R. Pearson & D.J. Lipman, 1988 and W.R. Pearson, 1990], BEAUTY[참조: K.C. Worley et al., 1995]. 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다. 표 2에는 5개의 PKS 유전자의 하류에 위치한 10개 유전자 생성물과 강력한 유사성을 나타내는 단백질이 제시되어 있다.
Figure 112005018477118-pct00002
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
이들 결과를 확인하기 위해, 유전자 불활성화 실험을 수행하였다. 사용된 방법은 유전자 대체를 수행하는 것으로 이루어진다. 개입중단된(interrupted) 표적 유전자를, 항생제[예를 들면, 아프라마이신(apramycin), 제네티신(geneticin) 또는 히그로마이신(hygromycin)]에 대한 내성을 부여해 주는 카세트에 의해 개입중단된 상기 유전자의 복사물로 대체시킨다. 사용된 카세트는 어느 한 쪽이, 모든 판독 프레임 내의 해독 종결 코돈과 접해있고, 스트렙토마이세스에서 활성인 전사 종결인자와 접해있다. 상기 카세트를 표적 유전자 내로 삽입하는 것은 이러한 표적 유전자에서의 결실을 수반하거나 수반하지 않을 수 있다. 상기 카세트를 플랭킹하는 영역의 크기는 수 백개 염기쌍에서 부터 수 천개 염기쌍 범위일 수 있다. "절제 가능한 카세트"로 지칭되는 제2 유형의 카세트를 유전자 불활성화에 사용할 수 있다. 이들 카세트는 에스. 암보파시엔스의 게놈 내로 도입된 후 부위-특이적 재조합 사건에 의해 스트렙토마이세스에서 절단될 수 있다는 이점을 지니고 있다. 이러한 목적은 최종 균주 내에, 이러한 균주에 속하지 않는 큰 DNA 서열이나 선별 마커를 잔존시키지 않으면서, 스트렙토마이세스 균주 내의 특정의 유전자를 불활성화시키는 것이다. 절제 후, 약 30개 염기쌍의 짧은 서열("반흔성(cicatricial)" 부위로 지칭됨) 만이 상기 균주의 게놈 내에 잔존한다(도 10 참조). 이러한 시스템의 사용은 초기에는, 표적 유전자의 야생형 복사물을 (2회 상동 재조합 사건을 통하여: 도 9 참조), 절제 가능한 카세트를 상기 표적 유전자 내로 삽입시킨 작제물로 대체시키는 것으로 이루어진다. 이러한 카세트의 삽입은 표적 유전자의 결실을 수반하게 된다(도 9 참조). 그 다음, 상기 균주의 게놈으로부터 절제 가능한 카세트를 절제시킨다. 절제 가능한 카세트는 부위-특이적 재조합 시스템을 통하여 기능하고, 결국에는 내성 유전자를 수반하지 않는 스트렙토마이세스 돌연변이체를 획득할 수 있게 해주는 이점을 지니고 있다. 불활성화된 유전자(들)의 하류에 위치한 유전자의 발현에 대한 가능한 극성 효과를 또한 피할 수 있다(도 10 참조). 이와 같이 하여 작제된 균주를 대상으로 하여, 이들의 스피라마이신 생산을 알아보기 위해 시험하였다.
orf1*c, orf2*c, orf3*c orf4*c 유전자는 불활성화시키지 않았는데, 이는 서열 비교 실험 결과, 이들 유전자가 비교적 밀접한 항생제의 생합성에 관여하는 유전자와 비교적 높은 유사성을 지니고 있다는 사실을 결정할 수 있었기 때문이다. 따라서, orf1*c 유전자는 틸로신(tylosine)의 생합성에 관여하고 스트렙토마이세스 프라디애(Streptomyces fradiae)에서 미카미노스의 생성 동안 3-N-메틸화를 촉매하는 N-메틸트랜스퍼라제를 암호화하는 tylMI 유전자에 의해 암호화된 단백질과 66%의 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[참조: A.R. Gandecha et al., 1997; 젠뱅크(GenBank) 수탁 번호: CAA57473; BLAST 스코어: 287]. 이와 같이, 비교적 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질, 보다 특히 미카미노스의 생합성에 관여하는 단백질과의 유사성은 orf1*c 유전자가 포로사민 또는 미카미노스의 생합성 동안 N-메틸화에 책임이 있는 N-메틸트랜스퍼라제를 암호화한다는 사실을 제시해준다(도 5 및 6 참조). 이러한 가설은 orf1*c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 3 참조).
Figure 112005018477118-pct00003
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf2*c 유전자는 스트렙토마이세스 프라디애에서 틸로신의 생합성에 관여하는 NDP 헥소스 3,4-이소머라제를 암호화하는 tylMIII 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성(35% 동일성)을 나타내는 단백질을 암호화한다[참조: A.R. Gandecha et al., 1997; 젠뱅크 수탁 번호: CAA57471; BLAST 스코어: 130]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질, 보다 특히 미카미노스의 생합성에 관여하는 단백질과의 유사성은 orf2*c 유전자가 스피라마이신의 당 중의 하나, 가능하게는 미카미노스의 생합성 동안 이성체화에 책임이 있는 NDP 헥소스 3,4-이소머라제를 암호화한다는 사실을 강력히 제시해준다(도 5 및 6 참조).
orf3*c 유전자는 스트렙토마이세스 프라디애에서 틸로신 생합성에 관여하는 글리코실트랜스퍼라제를 암호화하는 tylMII 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성(59% 동일성)을 나타내는 단백질을 암호화한다[참조: A.R. Gandecha et al., 1997; 젠뱅크 수탁 번호: CAA57472; BLAST 스코어: 448]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf3*c 유전자가 글리코실트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf3*c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 4 참조)
Figure 112005018477118-pct00004
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf4*c 유전자는 몇 가지 크로토닐-CoA 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf4*c에 의해 암호화된 단백질은 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor)로부터의 크로토닐-CoA 리덕타제와 상당히 유사하다[참조: M. Redenbach et al., 1996; 젠뱅크 수탁 번호: NP_630556; BLAST 스코어: 772]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf4*c 유전자가 크로토닐-CoA 리덕타제를 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf4*c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 5 참조).
Figure 112005018477118-pct00005
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf6* 유전자는 매크롤리드 항생제를 생산하는 스트렙토마이세스 미카로파시엔스(Streptomyces mycarofaciens)에 존재하는 mdmB 유전자와 특정의 유사성을 나타낸다[참조: Hara and Hutchinson, 1992; 젠뱅크 수탁 번호: A42719; BLAST 스코어: 489]. 이러한 생산자에서, 상기 유전자는 락톤 환의 아실화 반응에 관여한다. 따라서, orf6* 유전자는 아실트랜스퍼라제를 암호화하는 것으로 여겨진다. 이러한 가설은 orf6* 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 6 참조).
Figure 112005018477118-pct00006
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf6* 유전자의 불활성화는 동위상 결실/역위에 의해 유발되었는데, 이는 생성된 균주가 스피라마이신 II와 III을 더 이상 생산하지 않고, 스피라마이신 I 만을 생산한다는 사실을 제시하였다(도 1 참조). 이는 orf6* 유전자가 실제로 스피라마이신 II와 III의 합성에 관여한다는 것을 확인시켜 준다. 상기 유전자에 의해 암호화된 효소는, 아세틸 또는 부티릴 그룹을 3-위치 내의 탄소에 부착시킴으로써 스피라마이신 II와 III의 형성에 책임이 있다. orf6* 유전자에 의해 암호화된 단백질을 더 이상 발현하지 않는 균주가 특히 유리한데, 이는 이들이 스피라마이신 II와 III은 더 이상 생산하지 않고, 스피라마이신 I 만을 생산하기 때문이다. 상기에 구체화된 바와 같이, 스피라마이신 I의 항생제 활성은 스피라마이신 II와 III의 항생제 활성 보다 훨씬 더 크다[참조: Liu et al., 1990].
orf5* 유전자는 몇 가지 O-메틸트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf5*에 의해 암호화된 단백질은 스트렙토마이세스 미카로파시엔스로부터의 O-메틸트랜스퍼라제(EC 2.1.1.-) MdmC와 상당한 유사성을 지닌다[참조: Hara & Hutchinson, 1992; 젠뱅크 수탁 번호: A42719; BLAST 스코어: 355]. 이와 같이, 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf5* 유전자가 O-메틸트랜스퍼라제를 또한 암호화한다는 사실을 강력히 제시해준다. orf5* 유전자는 락톤 환 내로 혼입된 전구체의 형성에 관여하는 것으로 여겨진다. 사실상, 서열 비교에 따르면, orf5* 유전자 생성물은 다음에 따르는 하이드록시말로닐-ACP의 메틸화에 책임이 있는 FkbG와 비교적 밀접하다[참조: Wu et al., 2000; Hoffmeister et al., 2000; 젠뱅크 수탁 번호: AAF86386; BLAST 스코어: 247](도 8 참조). 이러한 가설은 orf5* 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 7 참조).
Figure 112005018477118-pct00007
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf6* 유전자 내로의 비-절제된 카세트의 삽입에 관한 극성 효과 때문에, orf5* 유전자가 스피라마이신에 대한 생합성 경로에 필수적이라는 사실을 결정할 수 있었다. 구체적으로 언급하면, 절제 가능한 카세트를 orf6* 유전자의 암호화 부위 내로 삽입하면, 스피라마이신 생산이 완전히 억제된다. 그러나, 삽입된 카세트가 일단 절제되면(그리고, 이에 따라 orf6* 유전자 만이 불활성화되는 경우; 실시예 14 및 15 참조), 스피라마이신 I의 생산이 다시 관찰된다. 이는 orf5* 유전자가 스피라마이신에 대한 생합성 경로에 필수적이란 사실을 보여주는데, 이는 이를 불활성화시키면 스피라마이신 생산이 완전히 억제되기 때문이다.
orf5* 유전자는 몇 가지 O-메틸트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. orf5* 유전자는 플라테놀리드의 합성에 직접적으로 관여하거나, 또는 PKS에 의해 플라테놀리드 내로 혼입된 메틸화 전구체(메톡시말로닐, 도 8 참조)의 합성에 관여하는 O-메틸트랜스퍼라제인 것으로 여겨진다. 이러한 가설을 입증하기 위해, LC/SM 및 NMR 분석 실험을 유전자형: orf6*::att1Ωhyg+의 에스. 암보파시엔스 균주 상에서 수행하였다. 이러한 균주에서는, orf5* 유전자가 발현되지 않았는데, 이는 전사 종결인자를 함유하는 카세트가 orf6* 유전자 내로 삽입됨에 따른 극성 효과 때문이다(실시예 27 참조). 상기 균주는 UV 스펙트럼이 스피라마이신 I과 유사한 외형을 지니지만, 질량 스펙트럼은 829에서 분자상 이온을 나타내는 분자를 생산한다는 사실이 밝혀졌다. 스피라마이신의 질량과 비교한 14 질량 상의 차이점은 락톤 환(이러한 화합물의 구조는 도 39에 도시되어 있다)의 탄소 번호 4에 의해 생성된 산소 상의 메틸 부재로써 설명할 수 있다. NMR에 의해 수득된 결과는 이러한 가설에 부합된다. 829 하의 특정 화합물이 존재하면, orf5*이 스피라마이신 생합성에 있어 일정 역할을 한다는 가설을 실증할 수 있다. 또한, 메틸 그룹을 갖지 않는 스피라마이신에 상응하는 생성물은 변형되지 않은 스피라마이신과 비교해서 극히 약한 미생물 활성(10배 정도 더 약함)을 나타내는데, 이는 미생물 미크로코쿠스 루테우스(Micrococcus luteus) 상에서 시험하였다.
orf7*c 유전자는 스트렙토마이세스 미카로파시엔스의 mdmA에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화하는데, 전자 단백질은 생산자 효소에서 미데카마이신 내성에 관여하는 단백질을 암호화한다[참조: Hara et al., 1990; 젠뱅크 수탁 번호: A60725; BLAST 스코어: 380]. 이와 같이, 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf7*c 유전자가 스피로마이신 내성에 관여한 단백질을 또한 암호화한다는 사실을 강력히 제시해준다. 보다 특히, orf7*c 유전자에 의해 암호화된 효소는 메틸트랜스퍼라제 활성을 지니고 있고, 스트렙토마이세스 암보파시엔스에서 스피라마이신 내성에 관여한다. 상기 유전자가 MLS I 유형의 내성(이러한 내성은 23S 리보솜성 RNA의 위치 A2058에서의 모노메틸화에 기인한 것으로 공지되어 있다)을 부여해 주는 것으로 입증되었다[참조: Pernodet et al., 1996]. 이러한 가설은 orf7*c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 8 참조).
Figure 112005018477118-pct00008
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf8* 유전자는 스트렙토마이세스 그리세우스(Streptomyces griseus)에서 ABC 수송인자 유형의 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: Campelo, 2002; 젠뱅크 수탁 번호: CAC22119; BLAST 스코어: 191]. 이와 같이, ABC 수송인자 유형의 단백질과의 유사성은 orf8* 유전자가 스피라마이신 내성에 관여할 수 있는 ABC 수송인자 유형의 단백질을 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf8* 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 9 참조).
Figure 112005018477118-pct00009
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf9* 유전자는 스트렙토마이세스 그리세우스에서 ABC 수송인자 유형의 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: Campelo, 2002; 젠뱅크 수탁 번호: CAC22118; BLAST 스코어: 269]. 이와 같이, ABC 수송인자 유형의 단백질과의 유사성은 orf9* 유전자가 스피라마이신 내성에 관여할 수 있는 ABC 수송인자 유형의 단백질을 또한 암호화한다는 사실을 제시해준다. 이러한 가설은 orf9* 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 10 참조).
Figure 112005018477118-pct00010
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf10* 유전자는 공지되지 않은 기능의 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 그러나, orf10*과 유사한 유전자는 항생제 생합성에 관여하는 유전자의 몇몇 그룹 중에서 발견된다. 따라서, orf10*와 밀접한 유전자는 에스. 코엘리콜로르(S. coelicolor)에서 발견된다[참조: Redenbach et al., 1996, 젠뱅크 수탁 번호: NP_627432, BLAST 스코어: 109]. 밀접한 유전자(CouY)가 또한, 에스. 리쉬리엔시스(S. rishiriensis)에서 발견된다[참조: Wang et al., 2000, 젠뱅크 수탁 번호: AAG29779, BLAST 스코어 97].
PKS를 암호화하는 유전자의 상류에 위치한 유전자
PKS를 암호화하는 유전자의 상류에 위치한 DNA 서열에서는(하류 및 상류는 동일한 방향으로 모두 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 3 참조), 34개 ORF가 동정되었다(상기 참조). 따라서, 이러한 유형의 34개 개방 판독 프레임은 대략 41.7 kb의 영역[참조: 25개 ORF를 함유하는 31 kb의 제1 영역을 나타내는 서열 번호 1, 및 대략 12.1 kb의 영역(이의 1.4 kb는 선행 서열(서열 번호 1)과 중복되고, 이의 대략 10.7 kb는 후속 서열에 상응한데, 대략 10.7 kb의 후자 부분은 9개의 부가 ORF(ORF 부분 서열 포함)를 함유한다)을 나타내는 서열 번호 140(또한, 하기 도 3 및 37 참조)]을 차지한다. 해당 영역의 조직을 다이아그램으로 표시한 것이 도 5 및 37에 도시되어 있다. 동정된 34개 유전자는 다음과 같이 명명되었다: orf1, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10, orf11c, orf12, orf13c, orf14, orf15c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, orf23c, orf24c, orf25c, orf26, orf27, orf28c, orf29, orf30c, orf31, orf32c, orf33 orf34c.
다음 표 11에는, 5개의 PKS 유전자의 상류에서 동정된 34개 유전자의 DNA 서열과 아미노산 서열을 기준(참조)으로 하여 제시되어 있다.
Figure 112005018477118-pct00012
1유전자 명칭에 부가된 "c"는 암호화 서열이 역배향으로 존재한다는 것을 지시한다(따라서, 암호화 쇄는 이들 유전자에 대해 서열 번호 1 또는 서열 번호 140에 제시된 서열에 상보적인 쇄이다).
2몇 가지 단백질 서열이 단일 orf로 지시된 경우에는, 상응하는 단백질이 여러 개의 가능한 해독 개시 부위로부터 유도된 것이다.
상기 표 11에 동정된 폴리펩티드의 기능을 결정할 목적으로, 3가지 유형의 실험을 수행하였다: 동정된 서열을 공지된 기능의 서열과 비교하는 실험; 유전자 불활성화 실험; 및 이들 돌연변이체 균주에 의한 스피라마이신 생산에 대한 분석 실험.
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 우선적으로, 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치, COGs(Cluster of Orthologous Groups), FASTA[참조: W.R. Pearson & D.J. Lipman, 1988 and W.R. Pearson, 1990], BEAUTY[참조: K.C. Worley et al., 1995](상기 참조). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다. 표 12에는 5개의 PKS 유전자의 상류에 위치한 34개 유전자와 강력한 유사성을 나타내는 단백질이 제시되어 있다.
Figure 112005018477118-pct00013
Figure 112005018477118-pct00014
Figure 112005018477118-pct00015
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
이들 결과를 확인하기 위해, 유전자 불활성화 실험을 수행하였다. 사용된 방법은 유전자 대체를 수행하는 것으로 이루어진다. 개입중단시키고자 하는 표적 유전자를, 항생제(예를 들면, 아프라마이신 또는 히그로마이신)에 대한 내성을 부여해 주는 카세트에 의해 개입중단된 상기 유전자의 복사물로 대체시킨다. 사용된 카세트는 어느 한쪽이, 모든 판독 프레임 내의 해독 종결 코돈과 접해있고, 스트렙토마이세스에서 활성인 전사 종결인자와 접해있다. 상기 카세트를 표적 유전자 내로 삽입하는 것은 이러한 표적 유전자에서의 결실을 수반하거나 수반하지 않을 수 있다. 상기 카세트를 플랭킹하는 영역의 크기는 수 백개 염기쌍에서 부터 수 천개 염기쌍 범위일 수 있다. "절제 가능한 카세트"(상기 참조)로 지칭되는 제2 유형의 카세트를 유전자 불활성화에 사용할 수 있다. 이와 같이 하여 작제된 균주를 대상으로 하여, 이들의 스피라마이신 생산을 알아보기 위해 시험하였다.
orf1 유전자는 몇 가지 시토크롬 P450와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf1에 의해 암호화된 단백질은 스트렙토마이세스 프라디애에서 틸로신의 생합성에 관여하는 tylI 유전자에 의해 암호화된 단백질과 상당히 유사하다[참조: L.A. Merson-Davies et al., 1994; 젠뱅크 수탁 번호: S49051; BLAST 스코어: 530]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf1 유전자가 시토크롬 P450을 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf1 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 13 참조).
Figure 112005018477118-pct00016
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf2 유전자는 아네우리니바실루스 더모애로필루스(Aneurinibacillus thermoaerophilus)의 dTDP-6-데옥시-3,4-케토헥술로스 이소머라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: Pfoestl, A. et al., 2003, 젠뱅크 수탁 번호: AAO06351; BLAST 스코어: 118]. 이와 같은 유사성은 orf2 유전자가 스피라마이신 분자에 존재하는 당 중의 하나, 가능하게는 미카로스의 생합성에 요구되는 이성체화 반응에 책임이 있는 이소머라제를 암호화한다는 사실을 강력히 제시해준다(도 5 참조). orf2 유전자의 불활성화를 수행하였다. 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 못한다는 사실이 밝혀졌다. 이는 orf2 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다.
orf3 유전자는 몇 가지 아미노트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf3에 의해 암호화된 단백질은 올레안도마이신 생합성에 관여하는 스트렙토마이세스 안티비오티쿠스(Streptomyces antibioticus)의 아미노트랜스퍼라제와 상당히 유사하다[참조: G. Draeger et al., 1999; 젠뱅크 수탁 번호: AAF59939; BLAST 스코어: 431]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf3 유전자가 스피라마이신의 아미노 당 중의 하나의 생합성에 필요한 아민기 전이 반응에 책임이 있는 3-아미노트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 5 참조). 이러한 가설은 orf3 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 15 참조).
Figure 112005018477118-pct00017
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf3 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf3 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다. 스피라마이신 생성은 에스. 프라디애(S. fradiae)의 TylB 단백질의 발현에 의해 보충될 수 있다(실시예 23 참조). 이는 orf3 유전자가 미카미노스 생합성에 필요한 아민기 전이 반응에 책임이 있는 3-아미노트랜스퍼라제를 암호화한다는 사실을 입증해준다(도 5 참조). 미카미노스는 플라테놀리드에 부착될 제1 당이기 때문에, orf3 녹아웃(knockout)을 나타내는 균주(OS49.67)는 플라테놀리드를 축적할 것으로 예상된다.
orf3 유전자 녹아웃을 나타내는 균주의 생합성 중간체를 대상으로 연구하였다(실시예 20 참조). 이들 실험 결과, 상기 균주가 2가지 형태의 플라테놀리드, 즉 플라테놀리드 A와 플라테놀리드 B를 생산한다는 사실을 입증할 수 있었으며, 상기 2가지 분자의 추론되는 구조가 도 36에 도시되어 있다. 이러한 균주는 또한, 플라테놀리드 A + 미카로스와 플라테놀리드 B + 미카로스를 생산한다(실시예 20 및 도 40 참조). 이들 화합물은 당을 포함하지만, 어떠한 미카미노스도 포함하지 않는다. 또한, 이들을 스피라마이신과 비교할 경우(도 1 참조), 이들 화합물은 미카미노스 대신 미카로스를 포함한다. 이러한 결과는 orf3 유전자 생성물이 미카미노스 생합성에 관여하고 미카미노스 생합성에 요구되는 아민기 전이 반응에 책임이 있는 3-아미노트랜스퍼라제로서 역할을 한다는 사실과 일치한다(도 5 참조). 당화 특이성이 절대적인 것으로 여겨지지는 않는데, 이는 미카미노스에 의해 통상 점유된 위치에 부착된 미카로스를 갖는 분자가 발견되기 때문이라는 것을 인지할 수 있다(도 40 참조).
orf4 유전자는 몇 가지 NDP-글루코스 신테타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf4에 의해 암호화된 단백질은 스트렙토마이세스 베네주엘래(Streptomyces venezuelae)의 알파-D-글루코스-1-포스페이트 티미딜릴트랜스퍼라제와 상당히 유사하다[참조: Y. Xue et al., 1998; 젠뱅크 수탁 번호: AAC68682; BLAST 스코어: 404]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf4 유전자가 스피라마이신 분자 내로 혼입된 3가지 불규칙한 당의 생합성에 필요한 NDP-글루코스의 합성에 책임이 있는 NDP-글루코스 신테타제를 암호화한다는 사실을 강력히 제시해준다(도 4, 5 및 6 참조). 이러한 가설은 orf4 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 16 참조).
Figure 112005018477118-pct00018
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf5 유전자는 몇 가지 글루코스 데하이드라타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf5에 의해 암호화된 단백질은 스트렙토마이세스 테네브라리우스(Streptomyces tenebrarius)의 dTDP-글루코스-4,6-데하이드라타제와 상당히 유사하다[참조: T.B.Li et al., 2001; 젠뱅크 수탁 번호: AAG18457; BLAST 스코어: 476]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf5 유전자가 스피라마이신 분자 내로 혼입된 3가지 불규칙한 당의 생합성에 필요한 NDP-글루코스 데하이드라타제를 암호화한다는 사실을 강력히 제시해준다(도 4, 5 및 6 참조). 이러한 가설은 orf5 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 17 참조).
Figure 112005018477118-pct00019
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf6 유전자는 몇 가지 티오에스테라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf6에 의해 암호화된 단백질은 스트렙토마이세스 아베르미틸리스(Streptomyces avermitilis)의 티오에스테라제와 상당히 유사하다[참조: S. Omura et al., 2001; 젠뱅크 수탁 번호: BAB69315; BLAST 스코어: 234]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf6 유전자가 티오에스테라제를 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf6 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 18 참조).
Figure 112005018477118-pct00020
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf7 유전자는 몇 가지 헥소스 데하이드라타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf7에 의해 암호화된 단백질은 틸로신 생합성에 관여하는 스트렙토마이세스 프라디애의 dNTP-헥소스 2,3-데하이드라타제(TylCVI 유전자에 의해 암호화됨)와 상당히 유사하다[참조: L.A. Merson-Davies et al., 1994; 젠뱅크 수탁 번호: AAF29379; BLAST 스코어: 461]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf7 유전자가 스피라마이신 분자 내로 혼입된 2가지 불규칙한 당의 생합성에 필요한 헥소스 2,3-데하이드라타제를 또한 암호화한다는 사실을 강력히 제시해준다(도 4 및 6 참조). 이러한 가설은 orf7 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 19 참조).
Figure 112005018477118-pct00021
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf8 유전자는 몇 가지 아미노트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf8에 의해 암호화된 단백질은 삭카로폴리스포라 스피노사(Saccharopolyspora spinosa)에서 포로사민 생합성에 관여하는 것으로 추정되는 아미노트랜스퍼라제와 상당히 유사하다[참조: C. Waldron et al., 2001; 젠뱅크 수탁 번호: AAG23279; BLAST 스코어: 465]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf8 유전자가 포로사민 생합성에 필요한 아민기 전이 반응에 책임이 있는 4-아미노트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 6 참조). 이러한 가설은 orf8 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 20 참조).
Figure 112005018477118-pct00022
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf8 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf8 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다. orf8 유전자 생성물이 포로사민 생합성에 있어 일정한 역할을 한다는 가설의 실증은, orf8 유전자에 대한 불활성화된 돌연변이체가 포로시딘을 생산하므로, 이러한 돌연변이체가 포로시딘 기(stage)에서 차단되고 어떠한 네오-스피라마이신도 생산하지 못한다는 사실에 의해 제공된다(도 7 및 실시예 25 참조). 이들 결과는 orf8 유전자 생성물이 포로사민 생합성에 관여한다는 사실에 부합된다(도 6 참조).
orf9c 유전자는 스트렙토마이세스 암보파시엔스에서 이미 동정되었으며, srmX로 명명되었다[참조: M. Geistlich et al., 1992]. 이러한 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 메틸트랜스퍼라제와 유사하다는 것은, orf9c 유전자가 미카미노스 또는 포로사민 생합성에 필요한 메틸화 반응에 책임이 있는 메틸트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 5 및 6 참조). 이러한 가설은 orf9c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 21 참조).
Figure 112005018477118-pct00023
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf10 유전자는 스트렙토마이세스 암보파시엔스에서 이미 동정되었으며, srmR로 명명되었다[참조: M. Geistlich et al., 1992]. 이러한 유전자에 의해 암호화된 단백질은 스트렙토마이세스 암보파시엔스에서 스피라마이신에 대한 생합성 경로의 조절에 관여한다. orf10 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf10 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 단백질은 스피라마이신 생합성에 명백하게 필수적이다.
또한, orf10의 해독 개시 지점을 결정하였으며, 이러한 유전자를 과발현시키면, 스피라마이신 생산이 향상된다는 사실을 밝혀낼 수 있었다. 상기 해독 개시 부위는 문헌[참조: M. Geistlich et al., 1992]에 제안된 ATG의 상류에 위치한 ATG에 상응한다. 또한, 이러한 5' 말단이 Orf10의 기능에 필수적이란 사실이 입증되었는데, 이는 5'-절단된 메신저가 불활성이기 때문이다(실시예 17 참조). 스피라마이신 생산에 대한 목적하는 효과를 획득하기 위해서는, orf10의 5'-절단된 메신저는 발현되지 않도록 주의하면서 orf10의 과발현을 수행하는 것이 필수적이다.
orf11c 유전자는 스트렙토마이세스 암보파시엔스에서 이미 동정되었으며, srmB로 명명되었다[참조: M. Geistlich et al., 1992; and B. Schoner et al., 1992]. 이러한 유전자에 의해 암호화된 단백질은 스트렙토마이세스 암보파시엔스에서 스피라마이신 내성에 관여하고, 이는 ABC-유형 수송인자이다.
orf12 유전자는 몇 가지 헥소스 데하이드라타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf12에 의해 암호화된 단백질은 스트렙토마이세스 프라디애의 UrdQ 유전자에 의해 암호화되고 우르다마이신(urdamycin) 생합성에 관여하는 NDP-헥소스 3,4-데하이드라타제와 상당히 유사하다[참조: D. Hoffmeister et al., 1994; 젠뱅크 수탁 번호: AAF72550; BLAST 스코어: 634]. 이와 같이, 밀접한 또 다른 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf12 유전자가 포로사민 생합성에 필요한 탈수 반응에 책임이 있는 3,4-데하이드라타제를 암호화한다는 사실을 강력히 제시해준다(도 6 참조). 이러한 가설은 orf12 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 22 참조).
Figure 112005018477118-pct00024
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf12 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf12 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다. orf12가 포로사민 생합성에 있어 일정한 역할을 한다는 가설의 실증은, orf12 유전자에 대한 불활성화된 돌연변이체가 더 이상 포로사민을 생산하지 못한다는 사실에 의해 제공된다. 그러나, 이는 소량의 포로시딘을 생산한다. 따라서, 이러한 변이체는 포로시딘 기에서 차단되고 어떠한 네오-스피라마이신도 생산하지 못한다(도 7 및 실시예 26 참조). 상기 돌연변이체는 또한, 도 38에 제시된 구조를 갖는 화합물을 생산한다. 후자 화합물은 2개의 당, 즉 미카미노스와 미카로스를 함유하지만, 포로사민은 전혀 함유하지 않는다. 또한, 이를 스피라마이신의 구조와 비교할 경우(도 1 참조), 상기 화합물은 포로사민의 예상된 위치에 당 미카로스를 함유한다. 이들 결과는 orf12 유전자 생성물이 포로사민 생합성에 관여한다는 사실에 부합된다(도 6 참조). 당화 특이성이 절대적인 것으로 여겨지지는 않는데, 이는 미카로스가 포로사민에 의해 통상 점유된 위치에 부착된 분자가 발견되기 때문이라는 것을 인지할 수 있다(도 38 참조).
orf13c 유전자는 스트렙토마이세스 코엘리콜로르에서 공지되지 않은 기능의 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 이러한 단백질은 SC4H2.17(젠뱅크 수탁 번호: T35116; BLAST 스코어: 619)로 명명된다. orf13c 유전자에 의해 암호화된 단백질은 기타 유기체의 기타 단백질과 강력한 유사성을 또한 나타낸다(표 23 참조).
Figure 112005018477118-pct00025
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf13c에 의해 암호화된 것과 밀접한 단백질에 기인하는 정확한 어떠한 기능도 없었다. 스트렙토마이세스 암보파시엔스에서 스피라마이신에 대한 생합성 경로에 있어서 상기 유전자의 기능을 연구할 목적으로 orf13c 유전자를 불활성화시켰다. 이로써 생성된 균주가 스피라마이신을 생산한다는 사실을 밝혀낼 수 있었다. 이는 orf13c 유전자가 스피라마이신 생합성에 필수적이지 않고 상기 세균의 생존에 필수적이지 않다는 것을 지시한다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 책임이 없다.
orf14 유전자는 추정상의 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: M. Redenbach et al., 1996; Bentley et al., 2002; 젠뱅크 수탁 번호: CAB90862; BLAST 스코어: 147].
orf14 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf14 유전자가 실제로 스피라마이신 생합성에 관여한다는 것을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 효소는 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다. orf14 유전자 녹아웃을 나타내는 균주의 생합성 중간체를 대상으로 연구하였다(실시예 20 참조). 이들 실험 결과, 상기 균주가 플라테놀리드 A는 생산하지만, 플라테놀리드 B는 생산하지 못한다는 사실을 입증할 수 있었다(도 36 참조).
orf15c 유전자는 몇 가지 케토 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf15c에 의해 암호화된 단백질은 스트렙토마이세스 안티비오티쿠스에서 3-케토 리덕타제와 상당히 유사하다[젠뱅크 수탁 번호: T51102; BLAST 스코어: 285]. 이러한 유사성은 orf15c 유전자가 포로사민 생합성에 필요한 환원 반응에 책임이 있는 3-케토 리덕타제를 암호화한다는 사실을 강력히 제시해준다(도 6 참조). 이러한 가설은 orf15c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 24 참조).
Figure 112005018477118-pct00026
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf16 유전자는 몇 가지 이소머라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf16에 의해 암호화된 단백질은 스트렙토마이세스 프라디애에서 NDP-헥소스 3,4-이소머라제와 상당히 유사하다[참조: Gandecha et al., 1997; 젠뱅크 수탁 번호: CAA57471; BLAST 스코어: 209]. 이러한 유사성은 orf16 유전자가 스피라마이신의 당 중의 하나의 생합성에 관여하는 단백질을 암호화한다는 사실을 강력히 제시해준다(도 5 및 6 참조). 이러한 가설은 orf16 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 25 참조).
Figure 112005018477118-pct00027
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf17 유전자는 몇 가지 글리코실트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf17에 의해 암호화된 단백질은 스트렙토마이세스 베네주엘래의 글리코실트랜스퍼라제와 상당히 유사하다[참조: Y. Xue et al., 1998; 젠뱅크 수탁 번호: AAC68677; BLAST 스코어: 400]. orf17 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 글리코실 트랜스퍼라제 유사하다는 것은, 상기 유전자가 글리코실트랜스퍼라제를 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf17 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 26 참조).
Figure 112005018477118-pct00028
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf18 유전자는 몇 가지 글리코실트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf18에 의해 암호화된 단백질은 스트렙토마이세스 리쉬리엔시스의 글리코실트랜스퍼라제와 상당히 유사하다[참조: Wang et al., 2000; 젠뱅크 수탁 번호: AAG29785; BLAST 스코어: 185]. orf18 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 글리코실 트랜스퍼라제와 유사하다는 것은, 상기 유전자가 글리코실트랜스퍼라제를 또한 암호화한다는 사실을 강력히 제시해준다. 이러한 가설은 orf18 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 27 참조).
Figure 112005018477118-pct00029
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf19 유전자는 몇 가지 케토 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf19에 의해 암호화된 단백질은 스트렙토마이세스 프라디애의 NDP-헥소스 4-케토 리덕타제(TylCIV)와 상당히 유사하다[참조: Bate et al., 2000; 젠뱅크 수탁 번호: AAD41822; BLAST 스코어: 266]. orf19 유전자에 의해 암호화된 단백질이, 밀접한 특정 항생제에 대한 생합성 경로에 관여하는 상기 케토 리덕타제와 유사하다는 것은, 상기 유전자가 미카로스 생합성에 필요한 환원 반응에 책임이 있는 4-케토 리덕타제를 또한 암호화한다는 사실을 강력히 제시해준다(도 4 참조). 이러한 가설은 orf19 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 28 참조).
Figure 112005018477118-pct00030
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf20 유전자는 몇 가지 헥소스 리덕타제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf20에 의해 암호화된 단백질은 dTDP-4-케토-L-6-데옥시헥소스 2,3-리덕타제를 암호화하는 삭카로폴리스포라 에리트래아(Saccharopolyspora erythraea)의 EryBII와 상당히 유사하다[참조: R.G. Summers et al., 1997; 젠뱅크 수탁 번호: AAB84068; BLAST 스코어: 491]. orf20c 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 헥소스 리덕타제와 유사하다는 것은, 상기 유전자가 미카로스 생합성에 필요한 환원 반응에 책임이 있는 2,3-리덕타제를 암호화한다는 사실을 강력히 제시해준다(도 4 참조). 이러한 가설은 orf20c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 29 참조).
Figure 112005018477118-pct00031
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf21c 유전자는 몇 가지 헥소스 메틸트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. 특히, orf21c에 의해 암호화된 단백질은 NDP-헥소스 3-C-메틸트랜스퍼라제를 암호화하는 스트렙토마이세스 프라디애의 TylCIII 유전자와 상당히 유사하다[참조: N. Bate et al., 2000; 젠뱅크 수탁 번호: AAD41823; BLAST 스코어: 669]. orf21c 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 헥소스 메틸트랜스퍼라제와 유사하다는 것은, 상기 유전자가 미카로스 생합성에 필요한 메틸화 반응에 책임이 있는 헥소스 메틸트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 4 참조). 이러한 가설은 orf21c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 30 참조).
Figure 112005018477118-pct00032
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf22c 유전자는 메톡시말로닐 생합성에 관여하는 효소를 암호화하는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스(Streptomyces hygroscopicus var. ascomyceticus)의 fkbH 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: K. Wu et al., 2000; 젠뱅크 수탁 번호: AAF86387; BLAST 스코어: 463]. orf22c 유전자에 의해 암호화된 단백질이, 밀접한 또 다른 매크롤리드에 대한 생합성 경로에 관여하는 상기 단백질과 유사하다는 것은, 이러한 유전자가 스트렙토마이세스 암보파시엔스에서 메톡시말로닐 생합성에 관여하는 효소를 또한 암호화한다는 사실을 강력히 제시해준다(도 8 참조).
orf23c 유전자는 메톡시말로닐에 관여하는 아실-CoA 데하이드로게나제를 암호화하는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스의 fkbI 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: K. Wu et al., 2000; 젠뱅크 수탁 번호: AAF86388; BLAST 스코어: 387]. orf23c 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 아실-CoA 데하이드로게나제와 유사하다는 것은, 이러한 유전자가 메톡시말로닐 생합성에 관여하는 아실-CoA 데하이드로게나제를 암호화한다는 사실을 강력히 제시해준다(도 8 참조). 이러한 가설은 orf23c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 31 참조).
Figure 112005018477118-pct00033
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf24c 유전자는 메톡시말로닐 생합성에 관여하는 아실 운반체 단백질(ACP)를 암호화하는 것으로 여겨지는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스의 fkbJ 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: K. Wu et al., 2000; 젠뱅크 수탁 번호: AAF86389; BLAST 스코어: 87]. orf24c 유전자에 의해 암호화된 단백질이, 밀접한 또 다른 매크롤리드에 대한 생합성 경로에 관여하는 상기 단백질과 유사하다는 것은, 이러한 유전자가 스트렙토마이세스 암보파시엔스에서 메톡시말로닐 생합성에 관여하는 단백질을 암호화한다는 사실을 강력히 제시해준다(도 8 참조).
orf25c 유전자는 메톡시말로닐 생합성에 관여하는 아실-CoA 데하이드로게나제를 암호화하는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스의 fkbK 유전자에 의해 암호화된 단백질과 비교적 강력한 유사성을 나타내는 단백질을 암호화한다[참조: K. Wu et al., 2000; 젠뱅크 수탁 번호: AAF86390; BLAST 스코어: 268]. orf25c 유전자에 의해 암호화된 단백질이, 밀접한 기타 항생제에 대한 생합성 경로에 관여하는 몇 가지 아실-CoA 데하이드로게나제와 유사하다는 것은, 이러한 유전자가 메톡시말로닐 생합성에 관여하는 아실-CoA 데하이드로게나제를 암호화한다는 사실을 강력히 제시해준다(도 8 참조). 이러한 가설은 orf25c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 32 참조).
Figure 112005018477118-pct00034
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf26 유전자는 스트렙토마이세스 프라디애에서 틸로신 생합성에 관여하는 미카로실트랜스퍼라제를 암호화하는 tylCV 유전자에 의해 암호화된 단백질과 65% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[참조: N. Bate et al., 2000; 젠뱅크 수탁 번호: AAD41824; BLAST 스코어: 471]. 보다 특히, TylCV는 틸로신 합성 동안 미카로스 분자와 결합하는 글리코실트랜스퍼라제이다. 이와 같이, 비교적 밀접한 또 다른 항생제에 대한 생합성 경로, 보다 특히 미카로스 전이에 관여하는 단백질과의 유사성은 orf26 유전자가 글리코실트랜스퍼라제라는 사실을 제시해준다. 이러한 가설은 orf26 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 33 참조).
Figure 112005018477118-pct00035
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf27 유전자는 스트렙토마이세스 프라디애에서 틸로신 생합성에 관여하는 NDP-헥소스 3,5-(또는 5-) 에피머라제를 암호화하는 tylCVII 유전자에 의해 암호화된 단백질과 70% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[참조: N. Bate et al., 2000; 젠뱅크 수탁 번호: AAD41825; BLAST 스코어: 243]. 보다 특히, TylCVII는 미카로스 생합성에 관여하는 헥소스 3,5-(또는 5-) 에피머라제이다. 이와 같이, 비교적 밀접한 또 다른 항생제에 대한 생합성 경로, 보다 특히 미카로스 생합성에 관여하는 단백질과의 유사성은 orf27 유전자가 에피머라제를 암호화한다는 사실을 제시해준다. 이러한 가설은 orf27 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 34 참조). BLAST 프로그램을 사용하여 수득된 밀접한 서열 분석 결과는, orf27 유전자가 미카로스 생합성에 필요한 에피머화 반응에 책임이 있는 5-에피머라제를 암호화한다는 사실을 강력히 제시해준다(도 4 참조).
Figure 112005018477118-pct00036
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf28c의 서열을 초기에 부분적으로 결정하였는데, 이는 대략 450개 염기쌍 영역의 서열 만이 서열 분석 후에 결정되었기 때문이다(이러한 영역은 서열 번호 106의 불완전 서열에서 "N"으로 상징된다). 그럼에도 불구하고, 이러한 ORF의 부분 서열(서열 번호 111)은 상기 설명된 바와 같은 각종 컴퓨터 프로그램을 이용한 분석에 사용되었다. 따라서, orf28c 유전자가, 스트렙토마이세스 더모톨레란스(Streptomyces thermotolerans)에서 카보마이신 생합성에 관여하는 조절성 단백질을 암호화하는 acyB2 유전자에 의해 암호화된 단백질과, 결정된 서열(Orf28c 단백질의 부분 서열인 서열 번호 112) 상에서 64% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다는 것을 결정할 수 있었다[참조: A. Arisawa et al., 1993; 젠뱅크 수탁 번호: JC2032; BLAST 스코어: 329]. 이와 같은, 비교적 밀접한 항생제에 대한 생합성 경로에 관여하는 단백질과의 유사성은, orf28c 유전자가 스피라마이신 생합성에 관여하는 조절성 단백질을 암호화한다는 사실을 제시해준다. 이러한 가설은 orf28c 유전자에 의해 암호화된 단백질이 스트렙토마이세스 프라디애에서 틸로신 생합성에 관여하는 조절성 단백질인 TylR 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다[참조: N. Bate et al., 1999; 젠뱅크 수탁 번호: AAF29380; BLAST 스코어: 167].
결정되지 않은 서열의 어느 한쪽에 위치한 올리고뉴클레오티드를 사용하여 orf28c 유전자를 증폭시키고, 이를 발현 벡터 내로 아클로닝시키는 것이 가능하였다. 따라서, orf28c 유전자의 과발현이 OSC2 균주에서 스피라마이신 생산을 상당히 증가시킨다는 사실을 결정할 수 있었다(실시예 24 참조). 이는, orf28c 유전자를 과발현시키면, 스피라마이신 생산이 증가된다는 것을 입증해주며, 스피라마이신에 대한 생합성 경로의 조절인자로서의 이의 역할을 확인시켜 준다.
orf28c의 부분 서열을 후속 완성시키고, 대략 450개 염기쌍의 결손 영역을 결정하였다(서열 번호 140 및 서열 번호 141 참조). 이러한 ORF의 완전한 서열(서열 번호 141)은 상기 설명된 바와 같은 각종 컴퓨터 프로그램을 이용한 분석에 사용되었다. 따라서, orf28c 유전자가, 스트렙토마이세스 더모톨레란스에서 카보마이신 생합성에 관여하는 조절성 단백질을 암호화하는 acyB2 유전자에 의해 암호화된 단백질과, 결정된 서열(Orf28c 단백질의 완전한 서열인 서열 번호 142) 상에서 69% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다는 것을 결정할 수 있었다[참조: A. Arisawa et al., 1993; 젠뱅크 수탁 번호: JC2032; BLAST 스코어: 451]. 이와 같은, 비교적 밀접한 항생제의 생합성을 조절하는데 관여하는 단백질과의 유사성은, orf28c 유전자가 스피라마이신 생합성에 관여하는 조절성 단백질을 암호화한다는 사실을 제시해준다. 이러한 가설은 orf28c 유전자에 의해 암호화된 단백질이 스트렙토마이세스 프라디애에서 틸로신 생합성을 조절하는데 관여하는 조절성 단백질인 TylR 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다[참조: N. Bate et al., 1999; 젠뱅크 수탁 번호: AAF29380; BLAST 스코어: 224]. 상기 유전자를 과발현시킨 결과(실시예 24 참조), 이것이 스피라마이신 생합성 경로의 조절인자로 역할을 한다는 사실을 확인하였다.
orf28c 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf28c 유전자가 명백하게도 스피라마이신 생합성에 관여하고 있고, 스피라마이신 생합성에 필수적이란 사실을 확인시켜 준다. 이들 결과를, 상기 유전자의 과발현 결과와 조합해 보면(실시예 24 참조), Orf28c가 스피라마이신 생합성에 필수적인 활성인자로서의 역할을 한다는 사실과 일치한다.
orf29 유전자는 소란기움 셀룰로숨(Sorangium cellulosum)에서 소라펜(soraphen) A(폴리케티드 부류의 항진균제)의 생합성에 관여하는 유전자 그룹 내에 위치한 것으로 예상되는 글리코실 하이드롤라제와 31% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[참조: J. Ligon et al., 2002; 젠뱅크 수탁 번호: AAK19890; BLAST 스코어: 139]. 이와 같이, 비교적 밀접한 분자에 대한 생합성 경로에 관여하는 단백질과의 유사성은 orf29 유전자가 글리코실 하이드롤라제 활성을 지닌 단백질을 암호화한다는 사실을 제시해준다. 이러한 가설은 orf29 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 35 참조). CD-서치 프로그램(상기 참조)을 사용하여, orf29에 의해 암호화된 단백질의 서열을 분석한 결과는 orf29 유전자가 글리코실 하이드롤라제를 암호화한다는 사실을 또한 제시해준다.
Figure 112005018477118-pct00037
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
SignalP 프로그램(http://www.cbs.dtu.dk/services/SignalP/)[참조: Nielsen, H., et al., 1997]을 사용하여, orf29로부터 추론된 단백질 서열을 분석한 결과, 상기 단백질이 위치 30과 31 사이에 예정된 절단 부위를 갖는 C-말단 시그널 서열(QSA/QA)를 갖는 것으로 밝혀졌다. 이러한 단백질은 세포외 단백질인 것으로 예상할 수 있다. 이는 글리코실하이드롤라제로서, 글리코실트랜스퍼라제 GimA 및/또는 GimB에 의한 당화에 의해 불활성화된 스피라마이신의 재활성화에 일정 역할을 할 수도 있다[참조: Gourmelen et al, 1998].
orf30c 유전자는 코리네박테륨 글루타미쿰(Corynebacterium glutamicum)에서 뉴클레오시드-디포스페이트 당 에피머라제와 31% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[젠뱅크 수탁 번호: NP_600590; BLAST 스코어: 89]. 이러한 유사성은 orf30c 유전자가 에피머라제를 암호화한다는 사실을 제시해준다. 이러한 가설은 CD-서치 프로그램(상기 참조)을 사용하여 상기 서열을 분석한 결과, orf30c 유전자가 에피머라제를 암호화한다는 사실을 또한 제시해준다는 사실에 의해 뒷받침된다.
orf30c은 각각 345개 및 282개 아미노산의 2가지 가능한 단백질(서열 번호 116 및 117)을 제공해주는 2가지 가능한 개시 코돈(서열 번호 115 참조)을 나타낸다. 그러나, 코돈 활용은 단지 제2 ATG로부터 유래된 스트렙토마이세스에 전형적인 것이며; 또한, 제1 ATG와 제2 ATG 간의 서열의 추론된 단백질 서열은 동정된 밀접한 서열과 정렬되지 않는 반면, 보다 짧은 단백질 서열(제2 ATG로부터 유래됨: 서열 번호 144)은 이들 단백질의 개시부와 정확하게 정렬된다. 따라서, 이로부터, 제2 ATG가 정확한 개시 코돈이므로, 이러한 orf의 서열이 서열 번호 143에 제시된 것인데, 이는 일단 해독되면, 서열 번호 144의 단백질에 상응한다는 사실을 추론할 수 있다.
orf31 유전자는 스트렙토마이세스 코엘리콜로르에서 옥시도리턱타제와 52% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[젠뱅크 수탁 번호: NP_631148; BLAST 스코어: 261]. 이러한 유사성은 orf31 유전자가 리덕타제를 암호화한다는 사실을 제시해준다. 이러한 가설은 CD-서치 프로그램(상기 참조)을 사용하여 상기 서열을 분석한 결과, orf31 유전자가 리덕타제를 암호화한다는 사실을 또한 제시해준다는 사실에 의해 뒷받침된다. 이러한 가설은 또한, orf31 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 36 참조).
Figure 112005018477118-pct00038
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
orf31 유전자를 불활성화시킨다. 따라서, 이로써 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 밝혀낼 수 있었다. 이는 orf31 유전자가 실제로 스피라마이신 생합성에 관여한다는 사실을 확인시켜 준다. 따라서, 상기 유전자에 의해 암호화된 단백질은 스피라마이신 생합성에 필수적인 생체전환 단계에 명백히 책임이 있다.
orf32c의 서열을 우선적으로, 부분적으로 결정하였는데(실시예 19 참조), 이는 5' 위치에서의 암호화 서열이 제2 단계에서만 결정되었기 때문이다. 그러나, 이러한 orf의 부분 서열(서열 번호 120)은 상기 설명된 바와 같은 각종 컴퓨터 프로그램을 이용한 분석에 사용되었다. 따라서, orf32c 유전자가, 스트렙토마이세스 코엘리콜로르에서 GntR 계열의 조절성 단백질과, 결정된 서열(Orf32c 단백질의 부분 서열인 서열 번호 121) 상에서 47% 동일성(BLAST를 사용하여 결정함)을 나타내는 단백질을 암호화한다는 것을 결정할 수 있었다[젠뱅크 수탁 번호: NP_625576; BLAST 스코어: 229]. 이러한 유사성은, orf32c 유전자가 GntR 계열의 전사 조절인자를 암호화한다는 사실을 제시해준다. 이러한 가설은 orf32c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다.
orf32c의 부분 서열을 후속 완성시키고, 결손 영역을 결정하였다(서열 번호 140 및 서열 번호 145 참조). 이러한 orf의 완전한 서열은 스트렙토마이세스 아베르미틸리스에서 GntR 계열의 조절성 단백질과 44% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[젠뱅크 수탁 번호: NP_824604; BLAST 스코어: 282]. 이러한 유사성은, orf32c 유전자가 GntR 계열의 전사 조절인자를 암호화한다는 사실을 제시해준다. 이러한 가설은 orf32c 유전자에 의해 암호화된 단백질이 기타 유기체 내의 유사한 기능의 기타 단백질과 강력한 유사성을 나타낸다는 사실에 의해 뒷받침된다(표 37 참조).
Figure 112005018477118-pct00039
* 보다 큰 서열 유사성은 보다 높은 BLAST 스코어와 연관이 있다[참조: Altschul et al., 1990].
스트렙토마이세스 암보파시엔스에서 스피라마이신 생합성 경로에 있어서의 상기 유전자의 기능을 연구할 목적으로 orf32c 유전자를 불활성화시켰다. 이로써 생성된 균주가 스피라마이신을 생산한다는 사실을 밝혀낼 수 있었다. 이는 orf32c 유전자가 스피라마이신 생합성에 필수적이지 않고 상기 세균의 생존에 필수적이지 않다는 것을 지시한다.
orf33 유전자는 크산토모나스 캄페스트리스(Xanthomonas campestris)의 가상의 단백질과 49% 동일성(BLAST 프로그램을 사용하여 결정함)을 나타내는 단백질을 암호화한다[젠뱅크 수탁 번호: NP_635564; BLAST 스코어: 54].
orf34c의 서열은 부분적이다. 사실상, 이러한 orf의 생성물과 데이터베이스 간에 수행된 비교 결과는, 상기 단백질의 C-말단 부분이 해당 뉴클레오티드 서열로부터 추론된 생성물 내에 존재하지 않으므로, 상기 orf가 서열 분석된 영역 보다 더 길고 이러한 영역을 벗어나서 연장된다는 사실을 제시해준다. 그러나, 상기 ORF의 부분 서열은 상기 설명된 바와 같은 각종 컴퓨터 프로그램을 이용한 분석에 사용되었다. 따라서, orf34c 유전자가, 스트렙토마이세스 코엘리콜로르로부터의 아라비노푸라노시다제와, 결정된 서열(Orf34c 단백질의 부분 서열인 서열 번호 150) 상에서 91% 동일성(BLAST를 사용하여 결정함)을 나타내는 단백질을 암호화한다는 것을 결정할 수 있었다[참조: Bentley et al., 2002; 젠뱅크 수탁 번호: NP_630049; BLAST 스코어: 654]. 에스. 코엘리콜로르(S. coelicolor)에서는, 이러한 아라비노푸라노시다제를 암호화하는 유전자가 2차 대사물 생합성에 관여하는 것으로 여겨지지 않는다. 따라서, 에스. 암보파시엔스에서는 상기 유전자가 스피라마이신 생합성에 관여하지 않는 것으로 예상된다.
본 발명의 주제는 또한, 고도로 엄격한 하이브리드화 조건 하에서, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 하나 이상의 폴리뉴클레오티드, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나와 하이브리드화되는 폴리뉴클레오티드이다. 우선적으로는, 이들 폴리뉴클레오티드를 스트렙토마이세스 속 세균으로부터 분리시키고, 보다 우선적으로는 이들 폴리뉴클레오티드가 매크롤리드의 생합성에 관여하는 단백질을 암호화하며, 보다 더 우선적으로는 이들 폴리뉴클레오티드가, 이들과 하이브리드화되는 폴리뉴클레오티드에 의해 암호화된 단백질과 유사한 활성을 지닌 단백질을 암호화한다. 고도로 엄격한 하이브리드화 조건은 비-상동성 핵산 쇄의 하이브리드화에는 바람직하지 못한 하이브리드화 조건으로서 규정될 수 있다. 고도로 엄격한 하이브리드화 조건은, 예를 들어, 하이브리드화 온도 55 내지 65℃, 바람직하게는 하이브리드화 온도 55℃, 보다 더 바람직하게는 하이브리드화 온도 60℃, 가장 바람직하게는 하이브리드화 온도 65℃ 하에 문헌[참조: Church & Gilbert, 1984]에 기재된 완충액 중에서 하이브리드화시킨 다음, 55 내지 65℃, 바람직하게는 55℃, 보다 더 바람직하게는 60℃, 가장 바람직하게는 65℃ 하에 2X SSC 완충액에서 1회 이상의 세척을 수행한 다음, 55 내지 65℃, 바람직하게는 55℃, 보다 더 바람직하게는 60℃, 가장 바람직하게는 65℃ 하에 0.5X SSC 완충액에서 1회 이상 세척하는 조건으로서 서술될 수 있다. 상기 언급된 하이브리드화 조건은 당업자에게 공지된 기술에 따라서, 하이브리드화하고자 하는 핵산의 길이 또는 선택된 표지화 유형의 함수로서 조정할 수 있다. 적합한 하이브리드화 조건은, 예를 들어, 문헌[참조: F. Ausubel et al (2002)]에 따라서 조정할 수 있다.
본 발명은 또한, 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 뉴클레오티드 서열, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나로 이루어진 그룹 중에서 선택된 폴리뉴클레오티드, 또는 상보적 서열의 폴리뉴클레오티드의 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 또는 1900개 이상의 연속되는 뉴클레오티드를 포함하는 폴리뉴클레오티드와 70% 이상, 보다 바람직하게는 80%, 보다 바람직하게는 85%, 보다 더 바람직하게는 90%, 보다 더 바람직하게는 95%, 가장 바람직하게는 98% 뉴클레오티드 동일성을 나타내는 폴리뉴클레오티드에 관한 것이다. 우선적으로는, 이들 폴리뉴클레오티드를 스트렙토마이세스 속 세균으로부터 분리시키고, 보다 우선적으로는 이들 폴리뉴클레오티드가 매크롤리드의 생합성에 관여하는 단백질을 암호화하며, 보다 더 우선적으로는 이들 폴리뉴클레오티드가, 이들과 동일성을 나타내는 폴리뉴클레오티드에 의해 암호화된 단백질과 유사한 활성을 지닌 단백질을 암호화한다. 가장 바람직하게는, 본 발명에 따르는 폴리뉴클레오티드가 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 뉴클레오티드 서열로 이루어진 그룹 중에서 선택되거나 또는 상보 서열의 폴리뉴클레오티드이다.
비교를 위해 서열을 최적으로 정렬시키는 것은 공지된 연산방식, 예를 들면, 특히 공급원[INFOBIOGEN resource center, Evry, France]로부터 입수 가능한 FASTA 패키지[참조: W.R. Pearson & D.J. Lipman, 1988 and W.R. Pearson, 1990]의 연산방식을 이용하여 컴퓨터 상에서 수행할 수 있다. 예시하자면, 서열 동일성(%)은 LFASTA[참조: K.-M. Chao et al., 1992] 또는 LALIGN[참조: X. Huang and W. Miller, 1991] 소프트웨어를 사용하여 결정할 수 있다. LFASTA 및 LALIGN 프로그램은 FASTA 패키지의 일부이다. LALIGN은 최적의 국소 정렬을 제공해주는데, 이러한 프로그램은 보다 정밀하지만, LFASTA 보다 느리다.
본 발명의 또 다른 국면은 상기 규정된 바와 같은 핵산 서열의 발현으로부터 비롯되는 폴리펩티드에 관한 것이다. 우선적으로, 본 발명에 따르는 폴리펩티드는 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 및 150; 또는 기능적 특성에는 전혀 영향을 미치지 않으면서, 모든 서열을 따라 1개 이상의 아미노산이 치환, 삽입 또는 결실된 것을 제외한 상기 서열들 중의 하나; 또는 이들 서열의 변이체들 중의 하나 중에서 선택된 폴리펩티드의 10, 15, 20, 30 내지 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 또는 640개 이상의 연속되는 아미노산을 포함하는 폴리펩티드와 70% 이상, 보다 바람직하게는 80%, 보다 바람직하게는 85%, 보다 더 바람직하게는 90%, 보다 더 바람직하게는 95%, 가장 바람직하게는 98% 이상의 아미노산 동일성을 나타낸다. 우선적으로는, 본 발명에 따르는 폴리펩티드가 스트렙토마이세스 속 세균에 의해 천연 상태로 발현되고, 보다 우선적으로는 이들 폴리펩티드가 매크롤리드의 생합성에 관여하며, 보다 더 우선적으로는 이들 폴리펩티드가, 이들과 동일성을 공유하는 폴리펩티드와 유사한 활성을 지닌다. 바람직하게는, 본 발명에 따르는 폴리펩티드가 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 및 150의 폴리펩티드 서열; 또는 기능적 특성에는 전혀 영향을 미치지 않으면서, 모든 서열을 따라 1개 이상의 아미노산이 치환, 삽입 또는 결실된 것을 제외한 상기 서열들 중의 하나; 또는 이들 서열의 변이체들 중의 하나로 이루어진 그룹 중에서 선택된다. 가장 바람직하게는, 본 발명에 따르는 폴리펩티드가 서열 번호 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144, 146, 148 및 150의 폴리펩티드 서열로 이루어진 그룹 중에서 선택된다.
비교를 위해 서열을 최적으로 정렬시키는 것은 공지된 연산방식, 예를 들면, 특히 공급원[INFOBIOGEN resource center, Evry, France]로부터 입수 가능한 FASTA 패키지[참조: W.R. Pearson & D.J. Lipman, 1988 and W.R. Pearson, 1990]의 연산방식을 이용하여 컴퓨터 상에서 수행할 수 있다. 예시하자면, 서열 동일성(%)은 공급원[INFOBIOGEN resource center, Evry, France]에 의해 규정된 바와 같은 디폴트(default) 파라미터를 이용하는 LFASTA[참조: K.-M. Chao et al., 1992] 또는 LALIGN[참조: X. Huang and W. Miller, 1991] 소프트웨어를 사용하여 결정할 수 있다. LFASTA 및 LALIGN 프로그램은 FASTA 패키지의 일부이다. LALIGN은 최적의 국소 정렬을 제공해주는데, 이러한 프로그램은 보다 정밀하지만, LFASTA 보다 느리다.
본 발명의 또 다른 국면은 상기 규정된 바와 같은 하나 이상의 폴리뉴클레오티드를 포함하는 재조합 DNA에 관한 것이다. 우선적으로는, 이러한 재조합 DNA가 벡터이다. 보다 더 우선적으로는, 상기 벡터가 박테리오파아지, 플라스미드, 파아지미드, 통합 벡터, 포스미드, 코스미드, 셔틀 벡터, BAC(세균성 인공 염색체) 및 PAC(P1-유도된 인공 염색체) 중에서 선택된다. 예시하자면, 람다 파아지와 M13 파아지가 박테리오파아지로서 언급될 수 있다. 플라스미드로서, 이. 콜라이에서 복제되는 플라스미드, 예를 들면, pBR322 및 이의 유도체, pUC18 및 이의 유도체, pUC19 및 이의 유도체, pGB2 및 이의 유도체[참조: G. Churchward et al., 1984], pACYC177(젠뱅크 수탁 번호: X06402) 및 이의 유도체, 및 pACYC184(젠뱅크 수탁 번호: X06403) 및 이의 유도체가 언급될 수 있다. 또한, 스트렙토마이세스에서 복제되는 플라스미드, 예를 들면, pIJ101 및 이의 유도체, pSG5 및 이의 유도체, SLP1 및 이의 유도체, 및 SCP2* 및 이의 유도체[참조: Kieser et al. 2000]를 언급할 수 있다. 파아지미드로서, 예를 들면, pBluescript II 및 이의 유도체[특히, Stratagene(LaJolla, California, USA) 회사로부터 시판됨], pGEM-T 및 이의 유도체[Promega(Madison, Wisconsin, USA) 회사로부터 시판됨], [lacuna] IS117 통합 시스템[참조: Kieser et al., 2000]을 언급할 수 있다. 포스미드로서, 예를 들면, 포스미드 pFOS1[New England Bioloabs Inc., Beverly, Massachussetts, USA 회사로부터 시판됨] 및 이의 유도체를 언급할 수 있다. 코스미드로서, 예를 들면, 코스미드 SuperCos 및 이의 유도체[특히, Stratagene(LaJolla, California, USA) 회사로부터 시판됨] 및 코스미드 pWED15[참조: Wahl et al., 1987] 및 이의 유도체가 언급될 수 있다. 셔틀 벡터로서, 이. 콜라이/스트렙토마이세스 셔틀 플라스미드, 예를 들면, pIJ903 및 이의 유도체, 플라스미드 pUWL, pCAO106, pWHM3 및 pOJ446 시리즈 및 이의 유도체[참조: Kieser et al. 2000], 및 이. 콜라이/스트렙토마이세스 셔틀 BAC, 예를 들면, WO 01/40497에 기재된 것을 언급할 수 있다. BAC (세균성 인공 염색체)로서, 예를 들면, BAC pBeloBAC11(젠뱅크 수탁 번호: U51113)를 언급할 수 있다. PAC(P1-유도된 인공 염색체)로서, 예를 들면, 벡터 pCYPAC6(젠뱅크 수탁 번호: AF133437)를 언급할 수 있다. 가장 바람직하게는, 본 발명에 따르는 벡터가 pOS49.1, pOS49.11, pOSC49.12, pOS49.14, pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5, pSPM7, pOS49.67, pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504, pSPM507, pSPM508, pSPM509, pSPM1, pBXL1111, pBXL1112, pBXL1113, pSPM520, pSPM521, pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, pSPM47, pSPM48, pSPM50, pSPM51, pSPM52, pSPM53, pSPM55, pSPM56, pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74, pSPM75, pSPM79, pSPM83, pSPM107, pSPM543 및 pSPM106 중에서 선택된다.
본 발명의 또 다른 국면은 생물학적 시스템에서 상기 언급된 바와 같은 하나 이상의 폴리펩티드의 발현을 허용해 주는 숙주 세포와 적합한 발현 벡터를 포함하는 발현 시스템에 관한 것이다. 본 발명에 따르는 발현 벡터는 상기 언급된 바와 같은 하나 이상의 폴리펩티드를 암호화하는 핵산 서열을 포함하고, 당업자에게 널리 공지된 각종 숙주 세포에서 본 발명에 따르는 각종 폴리펩티드의 발현을 위해 의도될 수 있다. 예를 들면, 원핵성 발현 시스템, 예를 들어, 세균 이. 콜라이에서의 발현 시스템, 및 진핵성 발현 시스템, 예를 들어, 곤충 세포에서의 발현을 허용해 주는 바쿨로바이러스 발현 시스템, 및 효모 세포에서의 발현을 허용해 주는 발현 시스템, 또는 포유류 세포, 특히 사람 세포에서의 발현을 허용해 주는 발현 시스템을 언급할 수 있다. 이러한 시스템에 사용될 수 있는 발현 벡터는 당업자에게 널리 공지되어 있는데, 원핵성 세포에 관해서는, 예를 들어, 이. 콜라이에서의 발현 벡터, 예를 들면, pET[Stratagene (LaJolla, California, USA) 회사에 의해 시판됨], GATEWAY 계열의 벡터[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨], pBAD 계열의 벡터[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨], pMAL 계열의 벡터[New England Bioloabs Inc. (Beverly, Massachussetts, USA) 회사에 의해 시판됨], 및 공개문헌[참조: B. Wilms et al., 2001]에 언급된 람노스-유도성 발현 벡터 및 이의 유도체를 언급할 수 있고; 또한, 스트렙토마이세스에서의 발현 벡터, 예를 들면, 벡터 pIJ4123, pIJ6021, pPM927, pANT849, pANT 850, pANT 851, pANT1200, pANT1201 및 pANT1202, 및 이의 유도체[참조: Kieser et al., 2000]를 언급할 수 있다. 효모 세포에 관해서는, 예를 들어, 벡터 pESC[Stratagene (LaJolla, California, USA) 회사에 의해 시판됨]를 언급할 수 있다. 곤충 세포에서의 발현을 허용해 주는 바쿨로바이러스 발현 시스템에 관해서는, 예를 들어, 벡터 BacPAK6[BD Biosciences Clontech, (Palo Alto, California, USA) 회사에 의해 시판됨]를 언급할 수 있다. 포유류 세포에 관해서는, 예를 들어, CMV(시토메갈로바이러스) 즉발 초기(immediate early) 유전자 프로모터를 포함하는 벡터[예를 들면, Stratagene (LaJolla, California, USA) 회사에 의해 시판된 벡터 pCMV 및 이의 유도체], 또는 공포형성(vacuolating) 원숭이 바이러스의 SV40 초기 프로모터를 포함하는 벡터[예를 들면, Stratagene (LaJolla, California, USA) 회사에 의해 시판된 벡터 pSG5]를 언급할 수 있다.
본 발명은 또한,
a) 폴리펩티드를 암호화하는 핵산을 적합한 벡터 내로 삽입하는 단계;
b) 단계 a)의 벡터로 미리 형질전환 또는 형질감염시킨 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을, 예를 들어, 초음파 처리하거나 삼투압 쇽에 의해 회수하는 단계;
d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계;
e) 경우에 따라, 이로써 생성된 재조합 폴리펩티드를 성상 확인하는 단계
를 포함하는, 상기 언급된 바와 같은 폴리펩티드의 생성 방법에 관한 것이다.
본 발명에 따르는 재조합 폴리펩티드는 당업자에게 공지되어 있고, 예를 들어, 문헌[참조: F. Ausubel et al., (2002)]에 언급된 방법에 따라서, 적당한 일련의 크로마토그래피 칼럼 상으로 통과시킴으로써 정제할 수 있다. 예시하자면, 생성하고자 하는 폴리펩티드에 짧은 폴리히스티딘 서열을 부가하는 것으로 이루어진 "히스티딘-태그" 기술을 언급할 수 있는데, 이는 상기 폴리펩티드가 닉켈 칼럼 상에서 정제될 수 있게 해준다. 본 발명에 따르는 폴리펩티드는 시험관내 합성 기술에 의해 제조할 수도 있다. 이러한 기술의 예를 들면, 본 발명에 따르는 폴리펩티드를 "신속한 해독 시스템(RTS)"[Roche Diagnostics France S.A., Meylan, France 회사에 의해 시판됨]을 사용하여 제조할 수 있다.
본 발명의 또 다른 국면은 본 발명에 따르는 하나 이상의 폴리뉴클레오티드 및/또는 하나 이상의 재조합 DNA 및/또는 하나 이상의 발현 벡터를 도입시킨 숙주 세포에 관한 것이다.
본 발명의 또 다른 국면은 하나 이상의 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물에 관한 것이다. 이점은 첫째, 돌연변이된 단백질의 기능을 연구하는데 있고, 둘째 생합성 중간체를 생산하는 미생물을 생성시키는데 있다. 이들 중간체는 임의로 분리 후, 특정 성분을 생산 배지에 부가함으로써 변형시키거나, 또는 이로써 돌연변이된 미생물에, 상기 중간체를 기질로서 사용함으로써 이를 변형시킬 수 있는 단백질을 암호화하는 기타 유전자를 도입함으로써 변형시킬 수 있다. 따라서, 이들 중간체는 화학적, 생화학적, 효소적 및/또는 미생물적으로 변형시킬 수 있다. 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물은, 이러한 매크롤리드(들)를 생산하는 미생물에서 이러한 매크롤리드(들)의 생합성에 관여하는 하나 이상의 단백질의 기능을 불활성화시킴으로써 수득할 수 있다. 불활성화된 단백질(들)에 따라서, 상기 매크롤리드(들)에 대한 생합성 경로의 각종 단계에서 차단된 미생물을 수득할 수 있다. 이러한 단백질(들)의 불활성화는 당업자에게 공지된 모든 방법에 의해 수행할 수 있는데, 예를 들어, 상기 단백질(들)을 암호화하는 유전자에서 돌연변이 유발시키거나 또는 상기 단백질(들)을 암호화하는 메신저 RNA(s)에 상보적인 하나 이상의 안티센스 RNA(s)를 발현시킴으로써 수행할 수 있다. 상기 돌연변이 유발은, 예를 들여, 방사선조사, 돌연변이 유발성 화학 제제의 작용, 부위-지시된 돌연변이 유발, 유전자 대체, 또는 당업자에게 공지된 기타 방법에 의해 수행될 수 있다. 이러한 돌연변이 유발에 적합한 조건은, 예를 들어, 문헌[참조: T. Kieser et al., (2000) and Ausubel et al., (2002)]에 기재된 교시에 따라서 조정할 수 있다. 돌연변이 유발은 시험관내 또는 원위치에서, 고려 중인 유전자 중의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키거나, 또는 유전자 불활성화시킴으로써 수행할 수 있다. 이러한 돌연변이 유발은 상기 언급된 바와 같은 서열을 포함하는 유전자에서 수행할 수 있다. 우선적으로는, 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 문제의 매크롤리드(들)의 생합성에 관여한 하나 이상의 단백질의 기능을 불활성화시키는 것은 돌연변이 유발에 의해 수행한다. 보다 더 우선적으로는, 문제의 매크롤리드가 스피라마이신이고 돌연변이 유발(들)이 수행되는 미생물이 에스. 암보파시엔스 균주이다. 보다 우선적으로는, 돌연변이 유발이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 서열 하나 이상에 상응하는 서열들 중의 하나를 포함하는 하나 이상의 유전자에서 수행된다. 바람직하게는, 돌연변이 유발(들)이 유전자 불활성화에 의해 수행된다. 가장 바람직하게는, 돌연변이 유발이 서열 번호 13에 상응하는 서열을 포함하는 유전자의 유전자 불활성화로 이루어진다.
예시하자면, 이러한 미생물의 예로서 다음 미생물을 언급할 수 있다: OS49.16(orf3:: Ωhyg, 실시예 2 참조), OS49.67(orf3 동위상 결실, 실시예 6 참조), OS49.107(orf8:: Ωhyg, 실시예 7 참조), OS49.50(orf10:: Ωhyg, 실시예 8 참조), SPM21(orf2::att3Ωaac-, 실시예 10 참조), SPM22(orf2::att3 동위상 결실, 실시예 10 참조), SPM501(orf6*::att1Ωhyg+, 실시예 14 참조), SPM502(orf6*::att1 동위상 결실, 실시예 14 참조), SPM507(orf12::att3Ωaac-, 실시예 11 참조), SPM508(orf13c::att3Ωaac-, 실시예 12 참조), 및 SPM509(orf14::att3Ωaac-, 실시예 13 참조), SPM107(orf28c::att3aac+, 실시예 29 참조), SPM543(orf31::att3aac+, 실시예 30 참조), SPM106(orf32c::att3aac+, 실시예 31 참조).
본 발명의 또 다른 국면은 상기 언급된 바와 같은, 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물을 사용하여, 매크롤리드 생합성 중간체를 제조하는 방법에 관한 것이다. 이러한 방법은 상기 언급된 바와 같은, 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물을 적합한 배양 배지에서 배양하는 단계; 이와 같이 조건화된 배양 배지 또는 세포 추출물을, 예를 들어, 초음파 처리하거나 삼투압 쇽에 의해 회수하는 단계; 및 전 단계에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 상기 생합성 중간체를 분리 및 정제하는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[참조: Kieser et al., (2000)]의 교시를 참조할 수 있다. 생성된 중간체는 당업자에게 공지된 모든 기술에 의해 회수할 수 있다. 당업자는, 예를 들어, 미국 특허 제3,000,785호에 교시된 기술, 보다 특히 상기 특허에 기재된 스피라마이신 추출 방법을 참조할 수 있다.
본 발명의 또 다른 국면은 상기 언급된 바와 같은, 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물을 사용하여, 매크롤리드로부터 유도된 분자를 제조하는 방법에 관한 것이다. 이러한 방법은 상기 방법에 따라서 생합성 중간체를 수득하는 단계; 및 이로써 생성된 중간체를 임의로 해당 배지로부터 분리시킨 후에, 이러한 중간체를 변형시키는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[참조: Kieser et al., (2000)]의 교시를 참조할 수 있다. 생성된 중간체는 임의 분리 후, 적합한 성분을 생산 배지에 부가함으로써 변형시키거나, 또는 해당 미생물에, 상기 중간체를 기질로서 사용함으로써 이를 변형시킬 수 있는 단백질을 암호화하는 기타 유전자를 도입함으로써 변형시킬 수 있다. 따라서, 이들 중간체는 화학적, 생화학적, 효소적 및/또는 미생물적으로 변형시킬 수 있다. 보다 우선적으로는, 문제의 매크롤리드가 스피라마이신이고 돌연변이 유발(들)이 수행되는 미생물이 에스. 암보파시엔스 균주이다.
본 발명은 또한, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물에 관한 것이다. 이러한 미생물은 스피라마이신 I의 생합성에 필요한 유전자 모두를 포함하지만, 스피라마이신 II와 III은 생산하지 못하는데, 이는 서열 번호 13에 상응하는 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 이의 변이체들 중의 하나를 암호화하는 유전자가 발현되지 않거나 또는 불활성화되었기 때문이다. 상기 단백질의 불활성화는 당업자에게 공지된 모든 방법, 예를 들면, 상기 단백질을 암호화하는 유전자에서 돌연변이 유발시키거나 또는 상기 단백질을 암호화하는 메신저 RNA에 상보적인 안티센스 RNA를 발현시킴으로써 수행할 수 있는데, orf5*의 발현이 이러한 조작에 의해 영향을 받을 경우에는, orf5* 유전자가 정확하게 발현되도록 또 다른 변형을 수행하는 것이 필요할 것이란 사실을 인지해야 한다. 돌연변이 유발은 암호화된 단백질을 불활성으로 만들거나 또는 이로부터 이의 발현 또는 해독을 방지하기 위해 비-암호화 서열 또는 암호화 서열에서 수행할 수 있다. 돌연변이 유발은 부위-지시된 돌연변이 유발, 유전자 대체, 또는 당업자에게 공지된 기타 모든 방법에 의해 수행할 수 있다. 이러한 돌연변이 유발에 적합한 조건은, 예를 들어, 문헌[참조: T. Kieser et al., (2000) and Ausubel et al., (2002)]에 기재된 교시에 따라서 조정할 수 있다. 돌연변이 유발은 시험관내 또는 원위치에서, 고려 중인 유전자 중의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가시키거나, 또는 유전자 불활성화시킴으로써 수행할 수 있다. 미생물은 또한, 서열 번호 13의 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 이의 변이체들 중의 하나를 암호화하는 유전자를 포함하지 않으면서, 스피라마이신에 대한 생합성 경로의 유전자를 발현시킴으로써 수득할 수 있다. 우선적으로는, 상기 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물이, 스피라마이신 I, II 및 III을 생산하는 출발 미생물로부터 수득된다. 보다 더 우선적으로는, 상기 미생물이 서열 번호 13의 서열 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하고 서열 번호 14의 폴리펩티드 또는 동일한 기능을 갖는 이의 변이체들 중의 하나를 암호화하는 유전자에서 돌연변이 유발시킴으로써 수득된다. 보다 더 우선적으로는, 이러한 돌연변이 유발이 유전자 불활성화에 의해 수행된다. 바람직하게는, 상기 미생물이 스피라마이신 I, II 및 III을 생산하는 에스. 암보파시엔스의 균주로부터 수득되는데, 서열 번호 13의 서열, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자의 불활성화가 수행된다. 가장 바람직하게는, 유전자 불활성화가 서열 번호 13의 서열, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자 또는 이의 일부를 동위상 결실시킴으로써 수행된다. 예시하자면, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물로서, 균주 SPM502(orf6*::att1, 실시예 14 참조)를 언급할 수 있다.
본 발명은 또한,
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
를 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응에 의해 수득될 수 있는 유전자, 보다 바람직하게는 서열 번호 141의 암호화 서열의 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하는, 상기 언급된 바와 같이, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물에 관한 것이다.
이러한 유전자의 서열의 한 예가 서열 번호 111(DNA)에 제시되어 있지만, 이러한 서열은 부분적인데, 이는 상응하는 암호화 서열의 3' 부분을 포함하지 않기 때문이다. 이러한 암호화 서열 부분을 단백질로 해독시킨 것이 서열 번호 112에 제시되어 있다. 당업자는 특히 실시예 24에 제시된 교시를 이용하여 이를 용이하게 완성할 수 있을 것이다. 서열 번호 111에서 결정되지 않은 서열을 제2 단계에서 결정하였는데, 이러한 orf(orf28c)의 완전한 서열이 서열 번호 141에 제시되어 있다. 이러한 암호화 서열을 단백질로 해독시킨 것이 서열 번호 142에 제시되어 있다. 실시예 24에는 orf28c 유전자의 클로닝 방법과, orf28c의 발현을 허용해 주는 발현 벡터의 생성 방법이 제시되어 있다. 상기 실시예는 또한, 균주 OSC2에서 orf28c 유전자를 과발현시키면, 이러한 균주에서의 스피라마이신 생산이 향상된다는 사실을 나타낸다. orf28c 유전자의 과발현은 이러한 유전자의 복사물 수를 증가시키고/시키거나 야생형 프로모터 보다 더 활성인 프로모터를 도입함으로써 획득될 수 있다. 바람직하게는, 상기 유전자의 과발현이, 이러한 유전자의 과발현을 허용해 주는 재조합 DNA 작제물을 해당 미생물 내로 도입함으로써 획득된다. 바람직하게는, 이러한 재조합 DNA 작제물이 상기 유전자의 복사물 수를 증가시키고 상기 유전자의 과발현 획득을 가능하게 만든다. 이러한 재조합 DNA 작제물에서는, 유전자의 암호화 서열을, 야생형 프로모터 보다 더 활성인 프로모터의 제어 하에 위치시킬 수 있다. 예시하자면, 스트렙토마이세스 암보파시엔스에서 활성인 ptrc 프로모터[참조: E. Amann et al., 1988], 및 ermE* 프로모터를 언급할 수 있다. 따라서, 바람직하게는, 작제물 pSPM75의 경우와 같이(실시예 24 참조), 도입된 orf28c 유전자의 복사물(들)을 ermE* 프로모터의 제어 하에 위치시킨다.
본 발명은 또한, 서열 번호 47의 암호화 서열을 갖거나 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 암호화 서열을 갖는 유전자를 과발현하기도 하는, 상기 언급된 바와 같이, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물에 관한 것이다. 우선적으로는, 이러한 미생물이 2003년 2월 26일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes [National Collection of Cultures and Microorganisms] (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-2977로 기탁된 균주 SPM502 pSPM525이다.
본 발명은 또한, 스피라마이신 I의 생성 방법에 관한 것이다. 이러한 방법은 상기 언급된 바와 같이, 스피라마이신 I은 생산하지만, 스피라마이신 II와 III은 생산하지 못하는 미생물을 적합한 배양 배지에서 배양하는 단계; 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및 전 단계에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 스피라마이신 I을 분리 및 정제하는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[참조: Kieser et al., (2000)]의 교시를 참조할 수 있다. 생성된 스피라마이신 I은 당업자에게 공지된 모든 기술에 의해 회수할 수 있다. 당업자는, 예를 들어, 미국 특허 제3,000,785호에 교시된 기술, 보다 특히 상기 특허에 기재된 스피라마이신 추출 방법을 참조할 수 있다.
본 발명의 또 다른 국면은 미생물의 매크롤리드 생산을 향상시키기 위한, 본 발명에 따르는 뉴클레오티드 서열의 용도에 관한 것이다. 따라서, 본 발명은 상기 규정된 바와 같은 서열을 포함하는 하나 이상의 유전자에서 유전자 변형을 나타내고/내거나 상기 규정된 바와 같은 서열을 포함하는 하나 이상의 유전자를 과발현하는 매크롤리드-생산 돌연변이체 미생물에 관한 것이다. 상기 유전자 변형은 보다 큰 활성을 지닌 하나 이상의 단백질을 발현할 목적으로 또는 이러한 단백질(들)을 보다 높은 수준으로 발현할 목적으로, 고려 중인 유전자(들) 내의 하나 이상의 염기를 억제, 치환, 결실 및/또는 부가하는 것으로 이루어질 수 있다. 고려 중인 유전자의 과발현은 이러한 유전자의 복사물 수를 증가시키고/시키거나 야생형 프로모터 보다 더 활성인 프로모터를 도입함으로써 획득될 수 있다. 예시하자면, 스트렙토마이세스 암보파시엔스에서 활성인 ptrc 프로모터[참조: E. Amann et al., 1988], 및 ermE* 프로모터[참조: Bibb et al., 1985 and Bibb et al., 1994]를 언급할 수 있다. 따라서, 고려 중인 유전자의 과발현은, 이러한 유전자의 과발현을 허용해 주는 본 발명에 따르는 재조합 DNA 작제물을, 고려 중인 매크롤리드-생산 미생물 내로 도입함으로써 획득할 수 있다. 구체적으로 언급하면, 매크롤리드 생합성의 특정 단계들이 제한성이고, 이들 제한성 단계에 관여한 야생형 단백질(들) 보다 활성이거나 이들 단백질 보다 높은 수준으로 발현되는 하나 이상의 단백질이 발현되는 경우에는, 관련 매크롤리드(들)의 생산을 향상시키는 것이 가능하다. 틸로신의 생산율을 증가시키는 것은, 예를 들어, 매크로신을 틸로신으로 전환시키는 제한성 메틸트랜스퍼라제를 암호화하는 유전자를 복제시킴으로써 스트렙토마이세스 프라디애에서 획득할 수 있다[참조: R. Baltz, 1997]. 보다 활성인 단백질의 발현 생성은 특히 돌연변이 유발에 의해 획득할 수 있는데; 당업자는 예를 들어, 이와 관련하여 문헌[F. Ausubel et al., (2002)]의 연구 내용을 참조할 수 있다. 우선적으로는, 이들의 매크롤리드 생산 측면에서 향상된 돌연변이체 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 문제의 매크롤리드가 스피라마이신이고, 돌연변이 유발(들)이 수행되는 미생물은 에스. 암보파시엔스 균주이다. 보다 우선적으로는, 유전자 변형이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 하나 이상에 상응하는 서열들 중의 하나, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 하나 이상의 유전자에서 수행된다. 바람직하게는, 상기 미생물이 서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 및 149의 하나 이상에 상응하는 서열들 중의 하나, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 하나 이상의 유전자를 과발현한다. 바람직하게는, 상기 미생물이 서얼 번호 111 또는 141에 상응하는 서열, 또는 이의 변이체들 중의 하나, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 서열들 중의 하나를 포함하는 유전자를 과발현한다. 서열 번호 111에 제시된 서열은 부분적이지만; 당업자는 특히 실시예 24에 제시된 교시를 이용하여 이를 용이하게 완성할 수 있을 것이다. 서열 번호 111에 결정되지 않은 서열을 제2 단계에서 결정하고, 이러한 orf(orf28c)의 완전한 서열이 서열 번호 141에 제시되어 있다. 이러한 암호화 서열을 단백질로 해독한 것이 서열 번호 142에 제시되어 있다. 실시예 24에는 orf28c 유전자의 클로닝 방법과, orf28c의 발현을 허용해 주는 발현 벡터의 생성 방법이 제시되어 있다. 상기 실시예는 또한, 균주 OSC2에서 orf28c 유전자를 과발현시키면, 이러한 균주에서의 스피라마이신 생산이 향상된다는 사실을 나타낸다. orf28c 유전자의 과발현은 이러한 유전자의 복사물 수를 증가시키고/시키거나 야생형 프로모터 보다 더 활성인 프로모터를 도입함으로써 획득될 수 있다. 바람직하게는, 상기 유전자의 과발현이, 이러한 유전자의 과발현을 허용해 주는 재조합 DNA 작제물을 해당 미생물 내로 도입함으로써 획득된다. 바람직하게는, 이러한 재조합 DNA 작제물이 상기 유전자의 복사물 수를 증가시키고 상기 유전자의 과발현 획득을 가능하게 만든다. 이러한 재조합 DNA 작제물에서는, 유전자의 암호화 서열을, 야생형 프로모터 보다 더 활성인 프로모터의 제어 하에 위치시킬 수 있다. 예시하자면, 스트렙토마이세스 암보파시엔스에서 활성인 ptrc 프로모터[참조: E. Amann et al., 1988], 및 ermE* 프로모터를 언급할 수 있다. 따라서, 바람직하게는, 작제물 pSPM75의 경우와 같이(실시예 24 참조), 도입된 orf28c 유전자의 복사물(들)을 ermE* 프로모터의 제어 하에 위치시킨다.
본 발명의 또 다른 국면은 전 단락에서 언급된 미생물을 사용하여, 매크롤리드를 생산하는 방법에 관한 것이다. 이러한 방법은 전 단락에서 규정된 미생물을 적합한 배양 배지에서 배양하는 단계; 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및 전 단계에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 생성된 매크롤리드(들)를 분리 및 정제하는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[Kieser et al., (2000)]의 교시를 참조할 수 있다. 이로써 생성된 매크롤리드는 당업자에게 공지된 모든 기술에 의해 회수할 수 있다. 당업자는, 예를 들어, 미국 특허 제3,000,785호에 교시된 기술, 보다 특히 상기 특허에 기재된 스피라마이신 추출 방법을 참조할 수 있다. 우선적으로는, 이러한 방법에 사용된 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 문제의 매크롤리드가 스피라마이신이고, 이들의 스피라마이신 생산 측면에서 향상된 돌연변이체 미생물이 에스. 암보파시엔스이다.
본 발명의 또 다른 국면은 하이브리드 항생제를 제조하기 위한, 본 발명에 따르는 서열 및/또는 벡터의 용도에 관한 것이다. 구체적으로 언급하면, 본 발명에 따르는 폴리뉴클레오티드는, 기질 특이성 측면에서 변형을 유발시키는 하나 이상의 돌연변이체 단백질을 발현하는 미생물을 수득하는데 사용될 수 있거나, 또는 하이브리드 항생제 제조 목적으로 수 많은 항생제-생산 미생물에서 발현될 수 있다. 따라서, 본 발명에 따르는 폴리뉴클레오티드는 생산자 미생물들 간의 유전자 전이에 의해, 유리한 약리학적 특성을 지닌 하이브리드 항생제를 생성시킬 수 있다[참조: Hopwood et al., 1985a, Hopwood et al., 1985b, Hutchinson et al., 1989]. 하이브리드 항생제 생성을 가져다 줄 수 있는 유전 공학 원리는 호프우드(Hopwood) 등에 의해(1981년) 가장 먼저 제안되었다. 항생제의 생합성에 관여하는 효소가, 구조적으로는 관련되긴 하지만 이의 천연 기질과는 상이한 기질을 종종 수용한다는 사실이 제안되었다. 항생제에 대한 생합성 경로의 유전자에 의해 암호화된 효소가 1차 대사 효소 보다 덜 엄격한 기질 특이성을 나타낸다는 사실이 일반적으로 받아들여지고 있다[참조: Hopwood 1981, Hutchinson 1988, Robinson 1988]. 따라서, 다수의 비-천연 기질이 항생제-생산 미생물에 의해, 이들 항생제에 대한 생합성 경로의 돌연변이체 또는 정제된 효소로 전환된다는 것을 밝혀내는 것이 가능하였다[참조: Hutchinson 1988]. 이러한 교시를 이용하여, 당업자는 하이브리드 항생제를 생성시킬 목적으로, 기질 특이성 측면에서 변형을 유발시키는 하나 이상의 돌연변이체 단백질을 발현하는 미생물을 작제할 수 있다.
본 발명은 또한, 한 가지 이상의 생체전환을 수행하기 위한, 하나 이상의 폴리뉴클레오티드 및/또는 하나 이상의 재조합 DNA 및/또는 하나 이상의 발현 벡터 및/또는 하나 이상의 폴리펩티드 및/또는 하나 이상의 숙주 세포의 용도에 관한 것이다. 따라서, 본 발명은 본 발명에 따르는 하나 이상의 단백질을 적합한 발현 시그널의 제어 하에 발현시키는 세균성 또는 진균성 균주를 작제하는 것을 가능케 한다. 이어서, 이러한 균주를 사용하여 한 가지 이상의 생체전환을 수행할 수 있다. 이러한 생체전환은 완전 세포를 사용하거나, 또는 이러한 세포의 비세포성 추출물을 사용하여 수행할 수 있다. 이러한 생체전환은 생합성 경로 효소를 사용하여, 특정 분자를 유도된 형태로 전환시킬 수 있다. 예를 들어, 문헌[참조: Carreras et al., 2002]에는 신규한 에리트로마이신 유도체를 생성시키기 위한, 삭카로폴리스포라 에리트래아 및 스트렙토마이세스 코엘리콜로르 균주의 용도가 기재되어 있다. 문헌[참조: Walczak et al., 2001]에는 데스아세틸아드리아미신(안트라사이클린 동족체)를 신규한 안트라사이클린으로 생체전환시키기 위한, 스트렙토마이세스 P450 모노옥시게나제의 용도가 기재되어 있다. 문헌[참조: Olonao et al., 1999]에는 엡실론-로도마이시논을 로도마이신 D로 생체전환시키기 위한, 스트렙토마이세스 리비단스(Streptomyces lividans)의 변형된 균주의 용도가 기재되어 있다. 당업자는 이러한 원리를 모든 생합성 중간체에 적용할 수 있다.
본 발명은 또한,
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
을 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응에 의해 수득될 수 있는 폴리뉴클레오티드, 보다 바람직하게는 서열 번호 141의 폴리뉴클레오티드; 또는
- 이러한 폴리뉴클레오티드의 10, 12, 15, 18, 20 내지 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, 1480, 1490 또는 1500개 이상의 연속되는 뉴클레오티드의 단편
을 포함하는 재조합 DNA에 관한 것이다.
우선적으로는, 이러한 재조합 DNA가 벡터이다. 보다 더 우선적으로는, 상기 벡터가 박테리오파아지, 플라스미드, 파아지미드, 통합 벡터, 포스미드, 코스미드, 셔틀 벡터, BAC(세균성 인공 염색체) 및 PAC(P1-유도된 인공 염색체) 중에서 선택된다. 예시하자면, 람다 파아지와 M13 파아지가 박테리오파아지로서 언급될 수 있다. 플라스미드로서, 이. 콜라이에서 복제되는 플라스미드, 예를 들면, pBR322 및 이의 유도체, pUC18 및 이의 유도체, pUC19 및 이의 유도체, pGB2 및 이의 유도체[참조: G. Churchward et al., 1984], pACYC177(젠뱅크 수탁 번호: X06402) 및 이의 유도체, 및 pACYC184(젠뱅크 수탁 번호: X06403) 및 이의 유도체가 언급될 수 있다. 또한, 스트렙토마이세스에서 복제되는 플라스미드, 예를 들면, pIJ101 및 이의 유도체, pSG5 및 이의 유도체, SLP1 및 이의 유도체, 및 SCP2* 및 이의 유도체[참조: Kieser et al. 2000]를 언급할 수 있다. 파아지미드로서, 예를 들면, pBluescript II 및 이의 유도체[특히, Stratagene(LaJolla, California, USA) 회사로부터 시판됨], pGEM-T 및 이의 유도체[Promega(Madison, Wisconsin, USA) 회사로부터 시판됨], λZAPII 및 이의 유도체[Stratagene(LaJolla, California, USA) 회사로부터 시판됨]를 언급할 수 있다. 통합 벡터로서, 예를 들어, 스트렙토마이세스에서 통합되는 벡터, 예를 들면, SLP1로부터 유도된 벡터[참조: Kieser et al, 2000], pSAM2로부터 유도된 벡터[참조: Kieser et al, 2000], PhiC31 파아지 통합 시스템을 이용하는 벡터[참조:Kieser et al, 2000][예를 들면, pSET152(참조: Bierman et al., 1992)] 또는 VWB 통합 시스템을 이용하는 벡터[참조: L. van Mellaert et al. 1998], 및 IS117 통합 시스템을 이용하는 벡터[참조: Kieser et al., 2000]을 언급할 수 있다. 포스미드로서, 예를 들면, 포스미드 pFOS1[New England Bioloabs Inc., Beverly, Massachussetts, USA 회사로부터 시판됨] 및 이의 유도체를 언급할 수 있다. 코스미드로서, 예를 들면, 코스미드 SuperCos 및 이의 유도체[특히, Stratagene(LaJolla, California, USA) 회사로부터 시판됨] 및 코스미드 pWED15[참조: Wahl et al., 1987] 및 이의 유도체가 언급될 수 있다. 셔틀 벡터로서, 이. 콜라이/스트렙토마이세스 셔틀 플라스미드, 예를 들면, pIJ903 및 이의 유도체, 플라스미드 pUWL, pCAO106, pWHM3 및 pOJ446 시리즈 및 이의 유도체[참조: Kieser et al. 2000], 및 이. 콜라이/스트렙토마이세스 셔틀 BAC, 예를 들면, WO 01/40497에 기재된 것을 언급할 수 있다. BAC(세균성 인공 염색체)로서, 예를 들면, BAC pBeloBAC11(젠뱅크 수탁 번호: U51113)를 언급할 수 있다. PAC(P1-유도된 인공 염색체)로서, 예를 들면, 벡터 pCYPAC6(젠뱅크 수탁 번호: AF133437)를 언급할 수 있다. 보다 우선적으로는, 상기 재조합 DNA가 발현 벡터이다. 이러한 시스템에 사용될 수 있는 발현 벡터는 당업자에게 널리 공지되어 있는데, 원핵성 세포에 관해서는, 예를 들어, 이. 콜라이에서의 발현 벡터, 예를 들면, pET[Stratagene (LaJolla, California, USA) 회사에 의해 시판됨], GATEWAY 계열의 벡터[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨], pBAD 계열의 벡터[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨], pMAL 계열의 벡터[New England Bioloabs Inc. (Beverly, Massachussetts, USA) 회사에 의해 시판됨], 및 공개문헌[참조: B. Wilms et al., 2001]에 언급된 람노스-유도성 발현 벡터 및 이의 유도체를 언급할 수 있고; 또한, 스트렙토마이세스에서의 발현 벡터, 예를 들면, 벡터 pIJ4123, pIJ6021, pPM927, pANT849, pANT 850, pANT 851, pANT1200, pANT1201 및 pANT1202, 및 이의 유도체[참조: Kieser et al., 2000]를 언급할 수 있다. 효모 세포에 관해서는, 예를 들어, 벡터 pESC[Stratagene (LaJolla, California, USA) 회사에 의해 시판됨]를 언급할 수 있다. 곤충 세포에서의 발현을 허용해 주는 바쿨로바이러스 발현 시스템에 관해서는, 예를 들어, 벡터 BacPAK6[BD Biosciences Clontech, (Palo Alto, California, USA) 회사에 의해 시판됨]를 언급할 수 있다. 포유류 세포에 관해서는, 예를 들어, CMV(시토메갈로바이러스) 즉발 초기 유전자 프로모터를 포함하는 벡터[예를 들면, Stratagene (LaJolla, California, USA) 회사에 의해 시판된 벡터 pCMV 및 이의 유도체], 또는 공포형성 원숭이 바이러스의 SV40 초기 프로모터를 포함하는 벡터[예를 들면, Stratagene (LaJolla, California, USA) 회사에 의해 시판된 벡터 pSG5]를 언급할 수 있다. 본 발명의 또 다른 국면은 본 단락에서 언급된 하나 이상의 재조합 DNA를 도입시킨 숙주 세포에 관한 것이다.
본 발명의 또 다른 국면은
a) 상기 단락에 기재된 바와 같은 하나 이상의 발현 벡터로 숙주 세포를 형질전환시키는 단계;
b) 상기 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계;
d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계;
e) 경우에 따라, 이로써 생성된 재조합 폴리펩티드를 성상 확인하는 단계
를 포함하는, 폴리펩티드의 생성 방법에 관한 것이다.
이로써 생성된 재조합 폴리펩티드는 당업자에게 공지되어 있고, 예를 들어, 문헌[참조: F. Ausubel et al., (2002)]에 언급된 방법에 따라서, 적당한 일련의 크로마토그래피 칼럼 상으로 통과시킴으로써 정제할 수 있다. 예시하자면, 생성하고자 하는 폴리펩티드에 짧은 폴리히스티딘 서열을 부가하는 것으로 이루어진 "히스티딘-태그" 기술을 언급할 수 있는데, 이는 상기 폴리펩티드가 닉켈 칼럼 상에서 정제될 수 있게 해준다. 이러한 폴리펩티드는 시험관내 합성 기술에 의해 제조할 수도 있다. 이러한 기술의 예를 들면, 상기 폴리펩티드를 "신속한 해독 시스템(RTS)"[Roche Diagnostics France S.A., Meylan, France 회사에 의해 시판됨]을 사용하여 제조할 수 있다.
본 발명의 또 다른 국면은
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
을 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자, 보다 바람직하게는 서열 번호 141의 암호화 서열의 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하는, 하나 이상의 스피라마이신을 생산하는 미생물에 관한 것이다.
이러한 유전자의 서열의 한 예가 서열 번호 111(DNA)에 제시되어 있지만, 이러한 서열은 부분적인데, 이는 상응하는 암호화 서열의 3' 부분을 포함하지 않기 때문이다. 이러한 암호화 서열 부분을 단백질로 해독시킨 것이 서열 번호 112에 제시되어 있다. 당업자는 특히 실시예 24에 제시된 교시를 이용하여 이를 용이하게 완성할 수 있을 것이다. 상기 실시예에는 orf28c 유전자의 클로닝 방법과, orf28c의 발현을 허용해 주는 발현 벡터의 생성 방법이 제시되어 있다. 상기 실시예는 또한, 균주 OSC2에서 orf28c 유전자를 과발현시키면, 이러한 균주에서의 스피라마이신 생산이 향상된다는 사실을 나타낸다. 바람직하게는,
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
을 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자, 보다 바람직하게는 서열 번호 141의 암호화 서열의 유전자, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자
를 과발현하는 미생물이, 스트렙토마이세스 속 세균이고, 보다 더 바람직하게는 스트렙토마이세스 암보시엔스 종 세균이다. 바람직하게는, 상기 유전자의 과발현이, 상기 미생물을 발현 벡터로 형질전환시킴으로써 획득되고, 보다 바람직하게는 이러한 미생물 균주가 2003년 10월 6일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes(CNCM)[National Collection of Cultures and Microorganisms] Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-3101로 기탁된 균주 OSC2/pSPM75(1) 또는 균주 OSC2/pSPM75(2)이다.
본 발명의 또 다른 국면은 전 단락에서 언급된 미생물을 사용하여, 스피라마이신(들)을 생산하는 방법에 관한 것이다. 이러한 방법은 전 단락에서 규정된 미생물을 적합한 배양 배지에서 배양하는 단계; 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및 전 단계에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 생성된 스피라마이신(들)을 분리 및 정제하는 단계로 이루어진다. 상기 미생물의 배양 조건은 당업자에게 널리 공지된 기술에 따라서 결정할 수 있다. 배양 배지는, 예를 들어, 스트렙토마이세스, 특히 스트렙토마이세스 암보파시엔스에 대한 SL11 배지 또는 MP5 배지일 수 있다[참조: Pernodet et al., 1993]. 당업자는 특히, 스트렙토마이세스의 배양에 관해서는 문헌[Kieser et al., (2000)]의 교시를 참조할 수 있다. 이로써 생성된 스피라마이신(들)은 당업자에게 공지된 모든 기술에 의해 회수할 수 있다. 당업자는, 예를 들어, 미국 특허 제3,000,785호에 교시된 기술, 보다 특히 상기 특허에 기재된 스피라마이신 추출 방법을 참조할 수 있다. 우선적으로는, 이러한 방법에 사용된 미생물이 스트렙토마이세스 속 세균이다. 보다 우선적으로는, 상기 미생물이 에스. 암보파시엔스 균주이다.
본 발명의 또 다른 국면은 서열 번호 47의 폴리뉴클레오티드, 또는 유전 암호 축퇴성으로 인해 이로부터 유도된 폴리뉴클레오티드를, 스트렙토마이세스 암보파시엔스에서 상기 폴리뉴클레오티드에 의해 암호화된 단백질의 발현을 허용해주는 프로모터의 제어 하에 위치시킨 발현 벡터에 관한 것이다. 스트렙토마이세스에서 사용될 수 있는 발현 벡터의 예는 상기 제시되어 있다. 우선적으로는, 이러한 발현 벡터가 플라스미드 pSPM524 또는 pSPM525이다.
본 발명의 또 다른 국면은 전 단락에서 규정된 벡터로 형질전환시킨 스트렙토마이세스 암보파시엔스 균주에 관한 것이다.
본 발명의 또 다른 국면은 서열 번호 112의 서열을 포함하는 폴리펩티드에 관한 것이다. 본 발명은 또한,
- 다음 서열의 프라이머 쌍:
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138) 및
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
을 이용하고, 매트릭스로서 코스미드 pSPM36 또는 스트렙토마이세스 암보파시엔스의 총 DNA를 이용하는 폴리머라제 연쇄 반응(PCR)에 의해 수득될 수 있는 유전자의 암호화 서열, 보다 바람직하게는 서열 번호 141의 암호화 서열의 유전자의 암호화 서열, 또는
- 유전 암호 축퇴성으로 인해 이로부터 유도된 유전자의 암호화 서열
로부터 해독된 서열에 상응하는 서열을 포함하는 폴리펩티드에 관한 것이다. 우선적으로는, 이들 폴리펩티드가 스트렙토마이세스 속 세균에 의해 천연 상태로 발현되고, 보다 우선적으로는 이들 폴리펩티드가 스피라마이신 생합성에 관여한다.
본 발명의 또 다른 국면은 스트렙토마이세스 암보파시엔스에서 전 단락에서 규정된 바와 같은 폴리펩티드의 발현을 허용해 주는 발현 벡터에 관한 것이다. 스트렙토마이세스에서 사용될 수 있는 발현 벡터의 예는 상기 제시되어 있다. 우선적으로는, 문제의 발현 벡터가 플라스미드 pSPM75이다.
도 1: 스피라마이신 I, II 및 III의 화학적 구조.
도 2: 해당 영역을 서열 분석하는데 사용된 코스미드.
도 3: 스피라마이신에 대한 생합성 경로에 관여한 유전자 그룹의 조직도.
도 4: 미카로스에 대해 제안된 생합성 경로.
도 5: 미카미노스에 대해 제안된 생합성 경로.
도 6: 포로사민에 대해 제안된 생합성 경로.
도 7: 스피라마이신 분자 및 중간체에 당을 부가하는 우선 순위.
도 8: 에스. 암보파시엔스에서 메톡시말로닐에 대해 제안된 생합성 경로. 이 경로는 스트렙토마이세스 히그로스코피쿠스 변종 아스코마이세티쿠스에서 메톡시말로닐의 생합성과 유사하게 제안되었다[참조: K. Wu et al., 2000].
도 9: 특정 유전자를 불활성화시키기 위한 단계:
A) 이. 콜라이에서는 복제되지만 스트렙토마이세스에서는 복제되지 않는 벡터 내로 표적 유전자를 클로닝하는 단계;
B) 내성 카세트를 (동일한 짧은 서열들 간의 재조합 또는 클로닝에 의해) 상기 표적 유전자 내로 삽입하는 단계;
C) 상기 플라스미드를 스트렙토마이세스 암보파시엔스 내로 도입하고(이. 콜라이와의 접합 또는 형질전환에 의함), 통합된 카세트를 갖는 클론을 선별한 다음, 유전자 대체물을 가지도록 벡터 부분을 상실한 클론을 스크리닝하는 단계;
D) 유전자 대체시킴으로써 표적 유전자를 불활성화시킨 돌연변이체 균주의 염색체 영역을 수득하는 단계.
도 10: 절제 가능한 카세트를 이용하여 표적 유전자를 개입중단시킨 경우에 수행할 수도 있는, 도 9에 기재된 방법에 따라서 유전자를 불활성화시킨 이후의 임의 단계:
E) 상기 돌연변이체 균주 내로, pSAM2의 xis int 유전자를 수반하는 플라스미드 pOSV508를 도입하는 단계(이의 생성물은 상기 카세트를 둘러싸고 있는 attL 서열과 attR 서열 간의 부위-특이적 재조합에 의해 효과적으로 절제될 것이다);
F) 절제 가능한 카세트를 상실하고, 카세트가 내성을 제공하는 항생제에 민감한 클론을 생성하는 단계;
G) 항생제를 함유하지 않는 고형 배지 상에서 성장시키고 포자 형성시킨 후, 플라스미드 pOSV508이 높은 빈도로 상실된다. 따라서, 표적 유전자가 동위상 결실을 함유하는 티오스트렙톤에 대해 민감한 클론을 수득하는 것이 가능하다. 이와 같이 결실된 표적 유전자 서열은 PCR 증폭시키고 PCR 생성물을 서열 분석함으로써 제어할 수 있다.
도 11: 절제 가능한 카세트를 상동 재조합 실험에 사용할 목적으로, 이러한 카세트를 증폭시킴. 짧은 상동 서열을 통하여 상동 재조합시키는 기술이 문헌[참조: Chaveroche et al., 2000]에 기재되어 있다. 올리고뉴클레오티드의 5' 말단에 위치한 39개 또는 40개 데옥시뉴클레오티드는, 불활성화시키고자 하는 유전자의 서열에 상응하는 서열을 포함하고, 가장 3' 부위에 위치한 20개 데옥시뉴클레오티드는 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다.
도 12: 문헌[참조: Chaveroche et al., 2000]에 기재된 기술을 사용하여 표적 유전자를 불활성화시키기 위한 작제물의 생성.
도 13: 플라스미드 pWHM3의 지도. 스트렙토 ori: 스트렙토마이세스 복제 기점.
도 14: 플라스미드 pOSV508의 지도.
도 15: 절제 가능한 카세트 구조의 예. 이는 attRattL 부위[참조: Raynal et al., 1998]에 의해 둘러싸인[이들 간의 재조합 사건은 xisint 유전자의 발현을 통하여 상기 카세트를 절제시킬 수 있을 것이다] Ωhyg 카세트[참조: Blondelet-Rouault et al., 1997]로 이루어진다.
도 16: 플라스미드 pBXL1111의 지도.
도 17: 플라스미드 pBXL1112의 지도.
도 18: 스피라마이신에 대한 미크로코쿠스 루테우스 균주의 민감성에 근거한, 스피라마이신 생성에 대한 미생물학적 시험. 사용된 미크로코쿠스 루테우스 균주는 스피라마이신에 대해서는 천연적으로 민감하지만 콘고시딘(congocidine)에 대해서는 내성인 균주이다. 시험하고자 하는 각종 스트렙토마이세스 균주를, 70ml 의 MP5 배지를 함유하는 500ml용 에를렌마이어 플라스크에서 배양하고, 2.5 x 106개 포자/ml의 초기 농도로 접종하며, 250rpm으로 궤도 진탕시키면서 27℃ 하에 성장시킨다. 배양한지 48, 72 및 96시간 후에, 발효 과실즙(musts) 샘플을 취하고, 원심분리시킨다. 이들 상청액을 멸균용 배양 배지에서 10배 희석시킨 것을 본 시험에 사용한다. 콘고시딘에 대해서는 내성이지만 스피라마이신에는 민감한 미크로코쿠스 루테우스 지시 균주[참조: Gourmelen et al., 1998]를 12 x 12cm 사각형 디쉬에서 배양한다. 왓트만(Whatman) AA 종이 디스크를 각 상청액의 10배 희석물 70ℓ에 침지시키고, 디쉬 표면 상에 놓아둔다. 각종 농도(MP5 중의 2-4-8㎍/ml)의 스피라마이신 용액에 침지시킨 디스크를 표준 범위로서 희석시킨다. 이러한 디쉬를 37℃에서 24 내지 48시간 동안 항온 배양한다. 디쉬가 스피라마이신을 함유하는 경우, 이를 한천 내로 확산시키고 미크로코쿠스 루테우스 지시 균주의 성장을 억제시킨다. 이와 같이 억제시키면, 디스크 주변에 "할로"가 창출되는데, 이러한 할로는 미크로코쿠스 루테우스 균주가 성장하지 않은 영역을 반영한 것이다. 따라서, 상기 할로가 존재하는 것은 스피라마이신의 존재를 지시해주며, 이로써 문제의 에스. 암보파시엔스가 스피라마이신 생산자인지 아닌지를 결정할 수 있다. 표준 범위에 대해 수득된 억제 직경과 비교한 결과, 상기 균주에 의해 생산된 스피라마이신의 양에 관한 지표를 획득할 수 있다.
도 19: 균주 OSC2의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 20: 균주 SPM501의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 21: 균주 SPM502의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 22: 균주 SPM507의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 23: 균주 SPM508의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 24: 균주 SPM509의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램.
도 25: FASTA 프로그램을 사용하여 생성된 에스. 프라디애의 TylB 단백질(서열 번호 87)과, Orf3 단백질(서열 번호 29)의 정렬.
도 26: FASTA 프로그램을 사용하여 생성된 SrmD 단백질(서열 번호 16)과, 에스. 미카로파시엔스(S. mycarofaciens)의 MdmA 단백질(서열 번호 88)의 정렬.
도 27: 절제 가능한 카세트의 절제 후 잔여 부위 서열의 예. 진하게 표시된 것은 문헌[참조: Raynal et al., 1998]에 규정된 바와 같은 최소 att26 부위이다. 33개 뉴클레오티드의 상 1 서열(att1)은 서열 번호 104에 제시되어 있고, 34개 뉴클레오티드의 상 2 서열(att2)은 서열 번호 105에 제시되어 있으며, 35개 뉴클레오티드의 상 3 서열(att3)은 서열 번호 95에 제시되어 있다.
도 28: orf10 유전자의 다이아그램 표시, 사용된 PCR 프라이머의 위치 및 각 쌍의 프라이머를 사용하여 수득된 작제물.
도 29: 카세트 pac-oritT의 작제.
도 30: 코스미드 pWED2의 지도.
도 31: 스피라마이신에 대한 생합성 경로에 관여하는 유전자 그룹의 다이아그램 표시, 및 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA 라이브러리의 코스미드를 분리시키기 위해 사용된 3가지 프로브의 위치(실시예 19 참조).
도 32: 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA 라이브러리로부터 분리된 코스미드의 삽입물의 위치(실시예 19 참조). 신규한 코스미드 DNA 라이브러리.
도 33: 코스미드 pSPM36의 PstI-PstI 단편(플라스미드 pSPM58의 삽입물)의 아클로닝, 코스미드 pSPM36의 StuI-StuI 단편(플라스미드 pSPM72의 삽입물)의 아클로닝, 및 EcoRI-StuI(플라스미드 pSPM73의 삽입물)의 아클로닝.
도 34: 플라스미드 pSPM58의 PstI-PstI 삽입물 및 플라스미드 pSPM73의 EcoRI-StuI 삽입물에서 동정된 개방 판독 프레임의 위치.
도 35: 238nm 및 280nm 하에 생성된 균주 OS49.67의 여과된 배양 배지 상청액에 대한 HPLC 크로마토그램(상류)과, 33.4분 및 44.8분에 용출된 분자의 UV 스펙트럼(하류)의 중첩.
도 36: 플라테놀리드 A 분자와 플라테놀리드 B 분자의 분자 구조.
도 37: 스피라마이신에 대한 생합성 경로에 관여하는 유전자 그룹의 조직도.
도 38: 균주 SPM507에 의해 생성된 생합성 중간체의 분자 구조.
도 39: 스피라마이신을 과생산하는 균주로부터 수득된 유전자형 orf6*::att1Ωhyg+의 에스. 암보파시엔스 균주에 의해 생성된 생합성 중간체의 구조. 카세트 att1Ωhyg+를 orf6* 내로 삽입하면, orf5*의 발현을 방지시키는 극성 효과가 발휘된다.
도 40: 균주 OS49.67에 의해 생산된, 플라테놀리드 A + 미카로스 및 플라테 놀리드 B + 미카로스 분자의 분자 구조.
도 41: 코스미드 pSPM36의 PstI-PstI 단편(플라스미드 pSPM79의 삽입물)의 아클로닝, 플라스미드 pSPM79의 PstI-PstI 삽입물에서 동정된 개방 판독 프레임의 위치결정, 및 서열 번호 140의 위치결정.
본 발명은 다음 실시예를 사용하여 예시되지만, 이로써 제한되지 않는다.
요약하면, 스피로마이신에 대한 생합성 경로의 유전자를 스트렙토마이세스 암보파시엔스의 게놈 DNA 라이브러리로부터 분리시킨다. 이 라이브러리는 스트렙토마이세스 암보파시엔스의 게놈 DNA를 BamHI 제한 효소로 부분 분해시킴으로써 수득한다. 평균 35 내지 45kb의 큰 DNA 단편을 코스미드 pWED15[참조: Wahl et al., 1987]로부터 유도된 코스미드 pWED1[참조: Gourmelen et al., 1998] 내로 클로닝시킨다. 이들 코스미드를, 파아지 입자를 사용하여 이. 콜라이 내로 도입한다. 이로써 수득된 라이브러리를 에스. 프라디애의 tylB 유전자의 일정 부분에 상응하는 프로브(서열 번호 86)와 하이브리드화시킨다[참조: Merson-Davies & Cundliffe, 1994, 젠뱅크 수탁 번호: U08223]. 하이브리드화한 후, 상기 프로브와 하이브리드화한 4개의 코스미드 중에서 1개의 코스미드를 보다 특별히 선별한다. 이어서, pOS49.1로 명명된 코스미드를 SacI로 분해시키고, 상기 프로브와 하이브리드화된 영역을 함유하는 3.3kb 단편을 벡터 pUC19 내로 아클로닝시키고 서열 분석하였다. 4개의 개방 판독 프레임을 동정하면, 이들 중의 하나는 에스. 프라디애의 TylB 단백질(서열 번호 87)과 강력한 서열 유사성을 나타내는 단백질(서열 번호 29)을 암호화한다(도 25 참조). 이러한 유전자는 orf3(서열 번호 28)로 명명되고, 이를 에 스. 암보파시엔스에서 불활성시킨다. orf3 유전자를 불활성화시킨 클론은 더 이상 스피로마이신을 생성하지 않는다는 사실을 입증할 수 있었다. 이는 orf3 유전자, 또는 하류에 위치한 유전자가 스피라마이신 생합성에 관여한다는 것을 보여준다.
이러한 사항을 일단 확인하면, 보다 큰 영역의 코스미드 pOS49.1을 대상으로 하여, 앞서 연구된 SacI 단편의 어느 한쪽을 서열 분석하였다. 이로써, 코스미드 pOS49.1로부터, 7개의 완전한 개방 판독 프레임과 이러한 7개의 완전한 개방 판독 프레임의 어느 한쪽에 위치한 2개의 기타 불완전한 판독 프레임을 포함하는 영역의 서열을 수득할 수 있었다. 데이터베이스에서의 조사를 통하여, 불완전한 개방 판독 프레임 중의 하나가 srmG 유전자 자리("폴리케티드 신타제"(PKS)로 지칭되는 효소를 암호화하는 영역)에 상응한다는 사실을 밝혀낼 수 있었다. 상응하는 유전자를 문헌[참조: S. Burgett et al. in 1996 (US patent 5,945,320)]에 의해 아클로닝시킨다. 더우기, 기타 개방 판독 프레임, 7개의 완전한 ORF[orf1, orf2, orf3, orf4, orf5, orf6 orf7(서열 번호 23, 25, 28, 30, 34, 36 및 40)로 명명됨] 및 orf8로 명명된 8번째 ORF의 출발부는 데이터베이스에서 발견되지 않았다.
연속해서, 스피라마이신 생합성에 관여하는 기타 유전자를 클로닝할 목적으로, 이와 동일한 영역 중의 에스. 암보파시엔스 게놈의 단편을 포함하는 기타 코스미드를 분리하였다. 이를 위해, 3가지 프로브를 사용하여, 콜로니 상에서 일련의 추가 하이브리드화를 수행하였다. 제1 프로브는 pOS49.1로부터 아클로닝된, orf1, orf2 orf3의 출발부를 함유하는 3.7kb DNA 단편에 상응한다. 제2 프로브는 pOS49.1로부터 아클로닝된, orf7의 일정 부분과 orf8의 일정 부분을 함유하는 2kb DNA 단편에 상응한다. 제3 프로브를 또한 사용하였다. 이러한 후자 프로브는 srmD 유전자를 함유하는 1.8kb DNA 단편에 상응한다. srmD 유전자는 스피라마이신 내성을 부여할 수 있는 에스. 암보파시엔스로부터 분리된 유전자이다. 구체적으로 언급하면, 기존의 연구는 에스. 그리세오푸스쿠스(S. griseofuscus) 균주(스피라마이신-민감성 균주)에 스피라마이신 내성을 부여해주는, 에스. 암보파시엔스의 몇 가지 내성 결정기를 클로닝할 수 있게 해주었다[참조: Pernodet et al., 1993 and Pernodet et al., 1999]. 내성 유전자를 분리하기 위해, 에스. 암보파시엔스 균주의 게놈 DNA의 코스미드 라이브러리를 코스미드 pKC505[참조: Richardson MA et al., 1987]에서 생성시켰다. 이러한 코스미드 풀을, 스피라마이신에 본래 민감한 에스. 그리세오푸스쿠스 내로 도입하였다. 이로써, 에스. 그리세오푸스쿠스에 아프라마이신 내성과 스피라마이신 내성을 부여할 수 있는 5개 코스미드를 수득하였다. 이들 5개 코스미드 중에서, pOS44.1로 명명된 코스미드는 이의 삽입물 내에, 스트렙토마이세스 미카로파시엔스의 mdmA 유전자에 의해 암호화되고 상기 생산자 유기체 내의 미데카마이신 내성과 관련된 단백질과 특정의 유사성을 나타내는 단백질을 암호화하는 srmD 유전자를 함유한다[참조: Hara et al., 1990, 젠뱅크 수탁 번호: A60725)(도 26). 스피라마이신 생합성 유전자를 위치시키기 위해 사용된 제3 프로브는 srmD 유전자를 포함하는 대략 1.8kb의 삽입물이다.
이들 3가지 프로브를 사용하여 상기 언급된 게놈 DNA 라이브러리를 하이브리드화하고, 가장 긴 삽입물을 함유하기 쉽고 공통의 밴드는 전혀 갖지 않는 2개의 코스미드(pSPM7 및 pSPM5)를 선택하는 것이 가능하였다. 코스미드 pSPM5는 제1 및 제2 프로브와 하이브리드화하였지만, 제3 프로브와는 하이브리드화하지 않은 반면, 코스미드 pSPM7은 제3 프로브와만 하이브리드화하였다. 이들 2개의 코스미드는 "숏건(shotgun) 서열 분석" 기술을 사용하여 완전히 서열 분석하였다. 이들 2개의 코스미드 pSPM5 및 pSPM7의 삽입물 서열을 어셈블리할 수 있었는데, 이는 이들이 중복되지는 않았지만, 각각의 삽입물이 이의 한쪽 말단에 공지된 서열을 포함하였기 때문이다. 구체적으로 언급하면, 이들 삽입물 각각이 "폴리케티드 신타제"(PKS)로 지칭된 효소를 암호화하는 유전자들 중의 하나의 서열 단편을 포함하였다. 이들 5개 유전자를 문헌[참조: S. Burgett et al. in 1996 (US patent 5,945,320)]에 의해 클로닝하였다(도 2 참조). 이로써, 단일 에스. 암보파시엔스 게놈 DNA 서열을 결정하는 것이 가능하였다. 5' 위치에서, 제1 PKS 유전자 내에 위치한 EcoRI 부위로부터 출발하고 3' 위치에 BamHI 부위 까지 범위의 30 943 뉴클레오티드 서열이 서열 번호 1에 제시되어 있다. 이러한 서열은 PKS 유전자의 상류 영역에 상응한다(도 2 및 3 참조). 제5 PKS 유전자 내에 위치한, 5' 위치에서 PstI로부터 출발하여 3' 위치에서 BstEII 부위 까지 범위의 11 171 뉴클레오티드의 제2 영역이 서열 번호 2에 제시되어 있다. 이러한 영역은 PKS 유전자의 하류 영역이다(하류 및 상류는 모두 동일한 방향으로 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 2 및 3 참조).
다음에는, 스피라마이신 생합성에 관여하는 기타 유전자를 클로닝할 목적으로, 이와 동일한 영역 중의 에스. 암보파시엔스 게놈의 단편을 포함하는 기타 코스미드를 분리하였다(실시예 18 및 19 참조).
실시예 1: 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 ATCC23877의 게놈 DNA 라이브러리의 작제
1.1 스트렙토마이세스 암보파시엔스 균주 ATCC23877의 게놈 DNA 추출
스트렙토마이세스 암보파시엔스 균주 ATCC23877[특히, 기탁 기관(American Type Culture Collection(ATCC)(Manassas, Virginia, USA))으로부터 번호 23877로 입수 가능함]을 YEME(효모 추출물-맥아 추출물)[참조: Kieser, T, et al., 2000]에서 배양하고 이러한 균주의 게놈 DNA를 용해 및 침전 표준 기술에 따라서 추출 및 정제하였다[참조: Kieser T. et al., 2000].
1.2 게놈 DNA 라이브러리의 작제
상기 분리된 바와 같은 스트렙토마이세스 암보파시엔스 균주 ATCC23877의 게놈 DNA를 BamHI 제한 효소로 부분적으로 분해시켜, 크기가 대략 35 내지 45 kb인 DNA 단편을 수득한다. 이들 단편을, BamHI으로 미리 분해시킨 코스미드 pWED1[참조: Gourmelen et al., 1998] 내로 클로닝시켰다. 코스미드 pWED1은 포유류에서 활성인 발현 모듈(module)을 함유하는 4.1 kb HpaI-HpaI 단편을 결실시킴으로써[참조: Gourmelen et al., 1998] 코스미드 pWE15[참조: Wahl, et al., 1987]로부터 유도된 것이다. 이어서, 이러한 연결 혼합물을 시험관내에서, 프로메가(Promega) 회사에 의해 시판되고 있는 "Packagene®람다 DNA 패키징 시스템"을 제조업자의 권고 사항에 따라서 사용하여 람다 파아지 입자 내에서 단백질 막으로 싼다. 수득된 파아지 입자를 사용하여, 공급원[Stratagene(LaJolla, California, USA)]에 의해 시판되고 있는 이. 콜라이의 SURE® 균주를 감염시킨다. 코스미드 pWED1은 앰피실린 내성을 제공해주기 때문에, 상기 클론을 LB 배지 + 앰피실린(50㎍/ml) 상에서 선별하였다.
실시예 2: 스트렙토마이세스 암보파시엔스에서 스피라마이신 생합성에 관여하는 유전자의 분리 및 성상 확인
2.1 스트렙토마이세스 암보파시엔스 ATCC23877의 게놈 라이브러리의 이. 콜라이 클론의 콜로니 하이브리드화
상기 수득된 라이브러리의 대략 2,000개 이. 콜라이 클론을, 콜로니 하이브리드화를 위해 필터 상으로 옮긴다. 이러한 하이브리드화에 사용된 프로브는 스트렙토마이세스 프라디애의 tylB 유전자의 일정 부분을 포함하는 NaeI-NaeI DNA 단편(서열 번호 86)이다. 이러한 단편은 tylB 유전자의 암호화 서열이 2677번에서 부터 3843번 까지의 뉴클레오티드에 상응하는, 다음 문헌에 의해 기재된 DNA 단편의 2663번에서 부터 3702번 까지의 뉴클레오티드에 상응한다[참조: L.A. Merson-Davies & E. Cundliffe (L.A. Merson-Davies & E. Cundliffe, 1994, 젠뱅크 수탁 번호: U08223].
스트렙토마이세스 프라디애의 tylB 유전자의 일정 부분을 수반하는 NaeI-NaeI DNA 단편(서열 번호 86)을, 무작위 프라이밍 기술 (Roche 회사에 의해 시판되 고 있는 키트)을 이용하여 32P로 표지시키고, 이를 프로브로서 사용하여, 필터 상에 옮긴 상기 라이브러리의 2,000개 클론을 하이브리드화하였다. 사용된 막은 공급원[Amersham (Amersham Biosciences, Orsay, France) 회사]에 의해 시판되고 있는 Hybond N 나일론 막이고, 하이브리드화는 문헌[참조: Church & Gilbert (Church & Gilbert, 1984)]에 기재된 완충액 중에서 55℃ 하에 수행한다. 세척을 15분 동안 55℃ 하에 2X SSC에서 수행한 다음, 55℃ 하에 각각 15분 동안 0.5X SSC에서 2회 연속해서 세척한다. 이러한 하이브리드화 및 세척 조건 하에서, 하이브리드화된 2,000개 중에서 4개 클론이 강력한 하이브리드화 시그널을 나타내었다. 이들 4개 클론을 LB 배지 + 앰피실린(50㎍/ml)에서 배양하고 상응하는 4개 코스미드를 표준 알칼리성 용해에 의해 추출시킨다[참조: Sambrook et al., 1989]. 이어서, 이러한 하이브리드화는 실제로, 이들 4개 코스미드의 삽입물 내에 존재하는 DNA 단편에 기인한다는 사실을 확인하였다. 이를 위해, 코스미드를 여러 개의 효소(BamHI, PstI 및 SacI)로 독립적으로 분해시킨다. 분해 생성물을 아가로스 겔 상에서 분리시키고, 나일론 막 상으로 옮긴 다음, 상기와 동일한 조건 하에서 스트렙토마이세스 프라디애의 tylB 유전자의 일정 부분을 포함하는 NaeI-NaeI DNA 단편(상기 참조)와 하이브리드화시킨다. 4개 코스미드를 실증하는 것이 가능하였고, 이들 코스미드 중의 1개가 보다 특별힌 선별되어 pOS49.1로 명명되었다.
2.2 코스미드 pOS49.1의 삽입물의 서열 분석 및 동정된 영역의 관련 여부 확인
코스미드 pOS49.1의 삽입물의 몇 가지 단편을 아클로닝시키고 이들의 서열을 결정하였다. 코스미드 pOS49.1을 SacI 효소로 분해시키고, 이를 상기 언급된 조건 하에 서던 블롯팅한 결과, 3.3 kb 단편이 tylB 프로브와 하이브리드화되는 영역을 함유하고 있는 것으로 나타났다. 이러한 3.3 kb 단편을 0.8% 아가로스 겔로부터 전기용출시킴으로써 분리시킨 다음, 벡터 pUC19(젠뱅크 수탁 번호: M77789) 내로 클로닝시키고 서열 분석하였다. 이로써 수득된 플라스미드는 pOS49.11로 명명되었다. 프레임플롯(FramePlot) 프로그램(참조: J. Ishikawa & K. Hotta, 1999)을 사용하여, 스트렙토마이세스 특유의 코돈 활용을 나타내는 4개의 개방 판독 프레임을 상기 단편에서 동정할 수 있었다(2개는 완전한 개방 판독 프레임이고 2개는 절단된 개방 판독 프레임이다). FASTA 프로그램[참조: W.R. Pearson & D.J Lipman, 1988 and W.R. Pearson, 1990, 특히 INFOBIOGEN resource center, Evry, France로부터 입수 가능함]을 이용한 서열 비교 결과, 이들 4개의 개방 판독 프레임 중의 1개로부터 추론된 단백질이 에스. 프라디애의 TylB 단백질(서열 번호 87; 젠뱅크 수탁 번호: U08223)과 강력한 서열 유사성을 나타낸다는 사실을 밝혀낼 수 있었다(도 25 참조). 이러한 단백질은 Orf3로 명명되었다(서열 번호 29).
상응하는 유전자(orf3 유전자(서열 번호 28))가 에스. 암보파시엔스에서 스피라마이신 생합성에 관여하는지를 시험할 목적으로, Ωhyg 카세트(참조: M-H. Blondelet-Rouault et al., 1997, 젠뱅크 수탁 번호: X99315)를 이용하여 상기 유전자를 개입중단시켰다. 이를 위해, 플라스미드 pOS49.11을 XhoI 효소로 분해시키고, 4개의 개방 판독 프레임(2개는 완전한 개방 판독 프레임이고 2개는 절단된 프 레임이며, 이에는 원형 상태의 orf3가 포함된다)를 공급원[Stratagene (LaJolla, California, USA)]에 의해 시판되고 있는 벡터 pBC SK+의 XhoI 부위 내로 아클로닝시킨다. 이로써 수득된 플라스미드는 pOS49.12로 명명되었다. orf3을 불활성화시킬 목적으로, orf3 내부의 PmlI-BstEII 단편을 후자 플라스미드 내로의 평활-말단 클로닝에 의해 Ωhyg 카세트로 대체시킨다. 이를 위해, 플라스미드 pOS49.12를 PmlI 및 BstEII 효소로 분해시키는데, 이에 대한 독특한 부위는 orf3 유전자의 암호화 서열이다. 상기 벡터에 상응하는 단편의 말단을 클레노우(Klenow) 효소(DNA 폴리머라제 I 큰 단편)로 처리함으로써 이를 평활 말단화한다. Ωhyg 카세트는 플라스미드 pHP45 Ωhyg[참조: Blondelet-Rouault et al., 1997, 젠뱅크 수탁 번호: X99315]를 BamHI 효소로 분해시킴으로써 수득된다. Ωhyg 카세트에 상응하는 단편을 아가로스 겔 상에서 회수하고, 이의 말단을 클레노우 효소로 처리함으로써 이를 평활 말단화한다. 이로써 수득된 2개의 평활 말단 단편(Ωhyg 카세트 및 플라스미드 pOS49.12)을 연결하고, 이러한 연결 생성물을 사용하여 이. 콜라이 세균을 형질전환시킨다. 이로써 수득된 플라스미드는 pOS49.14로 명명되었으며, 이는 Ωhyg 카세트를 이용하여 개입중단시킨 orf3 유전자를 함유하고 있다.
XhoI-XhoI 단편 형태(이의 말단은 클레노우 효소로 처리함으로써 비-점착성으로 만들었다)의, 플라스미드 pOS49.14의 삽입물을 플라스미드 pOJ260[이러한 플라스미드 pOJ260는 이. 콜라이에서는 복제할 수 있지만, 에스. 암보파시엔스에서는 복제할 수 없는 접합 플라스미드(참조: M. Bierman et al., 1992)이고, 상기 플라스미드는 이. 콜라이와 스트렙토마이세스에 아프라마이신 내성을 부여해준다]의 EcoRV 부위 내로 클로닝시킨다. 이로써 수득된 플라스미드(플라스미드 pOJ260 내로 클로닝된 플라스미드 pOS49.14의 삽입물)는 pOS49.16로 명명되었다. 후자를 문헌[참조: Mazodier et al., 1989]에 기재된 바와 같이, 접합된 이. 콜라이 균주 S17-1을 사용하여 접합시킴으로써 에스. 암보파시엔스 균주 ATCC23877 내로 전이시킨다. 이. 콜라이 균주 S17-1은 이. 콜라이 균주 294로부터 유도된 것이다[참조: Simon et al., 1983 and Simon, et al., 1986]. Ωhyg 카세트에 의해 수반된 히그로마이신 내성 마커를 보유하고 있고 벡터 pOJ260에 의해 수반된 아프라마이신 내성 마커를 상실한 피전달접합균주(transconjugant) 클론을 수득하는 것이 가능하였다. 이를 위해, 접합 후, 상기 클론을 대상으로 하여, 이들의 히그로마이신 내성에 대해 선별하였다. 이어서, 히그로마이신-내성 클론을 각각, 히그로마이신(항생제 B) 함유 배지와 아프라마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 히그로마이신에 내성인 유전자(HygR)와 아프라마이신에 민감한 유전자(ApraS)는 원칙적으로, 이중 재조합 사건이 발생하였으므로 Ωhyg 카세트를 이용하여 개입중단시킨 orf3 유전자를 보유하고 있는 것이다. orf3의 야생형 복사물을 상기 개입중단된 복사물로 대체시키는 것은 2회 연속되는 하이브리드화에 의해 확인되었다. 따라서, 수득된 클론의 총 DNA를 각종 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, Ωhyg 카세트에 상응하는 프로브(상기 참조)와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, 4개의 개방 판독 프레임(2개는 완전한 개방 판독 프레임이고 2개는 절단된 프레임이며, 이에는 원형 상태의 orf3가 포함된다)을 함유 하는 플라스미드 pOS49.11의 XhoI-XhoI을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전형을 확인할 수 있다. 이로써 수득된 orf3::Ωhyg 클론들 중의 하나(이의 유전자형은 확인하였다)를 선택하고, 이를 OS49.16으로 명명하였다.
이와 같이 하여 수득된 OS49.16 클론의 스피라마이신 생성 여부는 다음에 기재되는 생성 시험을 이용하여 시험하였다(실시예 15 참조). 따라서, 상기 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 입증할 수 있었는데, 이는 orf3 및/또는 하류에 위치한 유전자, 예를 들면, orf4가 스피라마이신 생합성에 관여한다는 사실을 확인시켜 준다.
이러한 사실이 일단 확인되면, 코스미드 pOS49.1의 보다 큰 영역을 기존에 연구된 SacI 단편의 어느 한쪽 위에서 서열 분석하였다. 따라서, 코스미드 pOS49.1로부터, 7개의 완전한 개방 판독 프레임과 이러한 7개의 개방 판독 프레임의 한쪽에 위치한 2개의 기타 불완전한 개방 판독 프레임을 포함하는 영역의 서열을 수득하는 것이 가능하였다. 데이터베이스 내에서의 조사를 통하여, 불완전한 개방 판독 프레임 중의 하나가 srmG 유전자 자리("폴리케티드 신타제"(PKS)로 지칭되는 효소를 암호화하는 영역)에 상응한다는 사실을 밝혀낼 수 있었다. 상응하는 유전자를 문헌[참조: S. Burgett et al. in 1996 (US patent 5,945,320)]에 의해 아클로닝시킨다. 더우기, 기타 개방 판독 프레임: 7개의 완전한 ORF[orf1, orf2, orf3, orf4, orf5, orf6 orf7(서열 번호 23, 25, 28, 30, 34, 36 및 40)로 명명 됨] 및 orf8로 명명된 8번째 ORF의 출발부(이러한 orf의 완전한 서열은 서열 번호 43에 제시되어 있다)는 데이터베이스에서 발견되지 않았다.
실시예 3: 스트렙토마이세스 암보파시엔스에서 스피라마이신 생합성에 관여하는 기타 유전자의 분리 및 성상 확인
두 번째로, 스피라마이신 생합성에 관여하는 기타 유전자를 클로닝할 목적으로, 이와 동일한 영역 중의 에스. 암보파시엔스 게놈의 단편을 포함하는 기타 코스미드를 분리하였다. 이를 위해, 3가지 프로브를 사용하여, 일련의 추가 콜로니 하이브리드화를 수행하였다:
- 사용된 제1 프로브는 pOS49.1로부터 아클로닝된, orf1, orf2 orf3의 출발부와 PKS 유전자의 단편[PKS에 상응하는 유전자는 문헌(참조: S. Burgett et al. in 1996 (US patent 5,945,320)에 의해 클로닝하였다]를 함유하고, 서열 번호 1의 EcoRI 부위를 한정하는 위치 1의 1,300개 염기쌍 상류에 위치한 BamHI 부위에서 부터 2472번에 위치한(서열 번호 1) PstI 부위까지 범위의 3.7kb BamHI-PstI DNA 단편에 상응한다. 이러한 BamHI-PstI 단편을 pOS49.1로부터 플라스미드 pBC SK+ 내로 아클로닝시켜, 플라스미드 pOS49.28을 수득하였다.
- 사용된 제2 프로브는 pOS49.1로부터 아클로닝된 orf7orf8의 단편을 함유하고, 서열 번호 1의 6693번에 위치한 PstI 부위에서 부터 서열 번호 1의 8714번에 위치한 BamHI 부위까지 범위의 대락 2 kb의 PstI-BamHI DNA 단편에 상응한다. 이러한 PstI-BamHI 단편을 pOS49.1로부터 플라스미드 pBC SK+ 내로 아클로닝시켜, 플라스미드 pOS49.76을 수득하였다.
- 제3 프로브를 또한 사용하였다. 이는 srmD 유전자를 함유하는 1.8kb EcoRI-HindIII DNA 단편에 상응한다. srmD 유전자는 스피라마이신 내성을 부여할 수 있는 에스. 암보파시엔스로부터 분리된 유전자이다. 구체적으로 언급하면, 기존의 연구는 에스. 그리세오푸스쿠스 균주(스피라마이신-민감성 균주)에 스피라마이신 내성을 부여해주는, 에스. 암보파시엔스의 몇 가지 내성 결정기를 클로닝할 수 있게 해주었다[참조: Pernodet et al., 1993 and Pernodet et al., 1999]. 내성 유전자를 분리하기 위해, 에스. 암보파시엔스 균주 ATCC23877의 게놈 DNA의 코스미드 라이브러리를 코스미드 pKC505[참조: M.A. Richardson MA et al., 1987]에서 생성시켰다. 이를 위해, 에스. 암보파시엔스 균주 ATCC23877의 게놈 DNA를 Sau3AI로 부분적으로 분해시켜, 크기가 대략 30 내지 40kb인 단편을 수득한다. 이로써 분해된 게놈 DNA(3㎍)을, BamHI 효소로 미리 분해시킨 1㎍의 pKC505와 연결시켰다[참조: Permodet et al., 1999]. 이어서, 이러한 연결 혼합물을 시험관 내에서 파아지 입자 내에 단백질 막으로 싼다. 수득된 파아지 입자를 사용하여, 이. 콜라이 균주 HB101(특히, American Type Culture Collection(ATCC)(Manassas, Virginia, USA)로부터 번호 33694로 입수 가능함)를 감염시켰다. 대략 20,000개의 아프라마이신-내성 이. 콜라이 클론을 모으고, 이들 클론의 코스미드를 추출하였다. 이러한 코스미드 풀을, 스피라마이신에 본래 민감한 에스. 그리세오푸스쿠스 균주 DSM 10191[참조: K.L. Cox & R.H. Baltz, 1984] 내로 원형질체 형질전환에 의해 도입하였다[참조: R.N. Rao et al., 1987; 상기 균주는 특히, German Collection of Microorganisms and Cell Cultures(Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, DSMZ), (Braunschweig, Germany)로부터 번호 DSM 10191로 입수 가능하다]. 아프라마이신을 함유하는 배지 상에서 상기 형질전환체를 선별하였다. 아프라마이신을 함유하는 배지 상에서 성장하는 클론들 중의 1,300개를 5㎍/ml의 스피라마이신을 함유하는 배지 상으로 옮겼다. 여러 개의 아프라마이신-내성 클론을 또한, 스피라마이신 함유 배지 상에서 성장시키고, 이들 클로니의 코스미드를 추출하여, 이. 콜라이와 에스. 그리세오푸스쿠스를 형질전환시키는데 사용하였다[참조: Pernodet et al., 1999]. 이로써, 에스. 그리세오푸스쿠스에 아프라마이신 내성과 스피라마이신 내성을 동시에 부여할 수 있고 이. 콜라이에 아프라마이신 내성을 부여할 수 있는 5개 코스미드를 수득하였다. 이들 5개 코스미드 중에서, pOS44.1로 명명된 코스미드는 이의 삽입물 내에, 스트렙토마이세스 미카로파시엔스의 mdmA 유전자에 의해 암호화된 단백질(서열 번호 88)과 특정의 유사성을 나타내는 단백질(서열 번호 16)을 암호화하는 유전자(서열 번호 15)를 함유하는 것으로 결정되었으며; 이러한 유전자는 srmD로 명명되었다{FASTA 프로그램[참조: W.R. Pearson & D.J Lipman, 1988 and W.R. Pearson, 1990, 특히 INFOBIOGEN resource center, Evry, France로부터 입수 가능함]을 사용하여 수행된, 도 26에 제시된 정렬 참조}.
플라스미드 pOS44.1 내에 함유된 내성 결정기를 분리하기 위해, 후자를 Sau3AI 제한 효소로 부분적으로 분해시켜 크기가 대략 1.5 내지 3kb인 단편을 수득하고, 이들 단편을 BamHI 효소로 선형화시킨 벡터 pIJ486에 연결하였다[참조: Ward et al., 1986]. 스피라마이신에 본래 내성인, 에스. 그리세오푸스쿠스 균주 DSM 10191[참조: R.N. Rao et al., 1987]에 스피라마이신 내성을 부여할 수 있는 능력을 알아보기 위해 플라스미드를 선별하였다(상기 참조). 이를 위해, 벡터 pIJ486에 연결된 pOS44.1의 Sau3AI 단편에 상응하는 플라스미드 풀(상기 참조)을 균주 DSM 10191 내로 원형질체 형질전환시킴으로써 도입하고, 이러한 형질전환체를 대상으로 하여, 이들의 티오스트렙톤 내성(pIJ486에 의해 수반된 tsr 유전자에 기인함)에 대해 선별하였다. 티오스트렙톤을 함유하는 배지 상에서 성장하는 클론을 스피라마이신 함유 배지 상으로 옮긴다. 몇 가지 티오스트렙톤-내성 클론이 또한, 스피라마이신 함유 배지 상에서 성장하였으며, 이들 콜로니의 플라스미드를 추출하였다. 내성이 부여되고 대략 1.8kb 삽입물을 함유하는 플라스미드를 선별하고, 이를 pOS44.2로 명명하였다. 이러한 1.8kb 삽입물은, 삽입물 한쪽 상의 벡터 내에 존재하는 HindIII 부위와 EcoRI 부위를 통하여 용이하게 절제될 수 있다. 이러한 1.8kb HindIII-EcoRI 삽입물을 서열 분석하고, 이를 함유하는 내성 유전자를 srmD로 명명하였다. 이로써, srmD 유전자를 함유하는 상기 단편을, EcoRI-HindIII로 개방시킨 벡터 pUC19(젠뱅크 수탁 번호: M77789) 내로 용이하게 아클로닝시킬 수 있었으며, 이와 같이 하여 수득된 플라스미드는 pOS44.4로 명명되었다. srmD 유전자를 함유하는, 상기 플라스미드의 1.8kb HindIII-EcoRI 삽입물을 프로브로서 사용하여 스피라마이신 생합성 유전자를 위치시켰다(하기 참조).
플라스미드 pOS44.4를 함유하는 에스케리챠 콜라이(Escherichia Coli) DH5α 균주를 2002년 7월 10일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes [National Collection of Cultures and Microorganisms] (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-2918로 기탁하였다.
상기 수득된(실시예 1 참조) 라이브러리의 대략 2,000개 클론을 통상적인 기술에 따라서[참조: Sambrook et al., 1989] 콜로니 하이브리드화하기 위해 필터 상으로 옮겼다.
상기 언급된 3가지 프로브를 무작위 프라이밍 기술 (Roche에 의해 시판되고 있는 키트)을 이용하여 32P로 표지시키고, 이를 사용하여, 필터 상에 옮긴 상기 라이브러리의 2,000개 클론을 하이브리드화하였다. 하이브리드화는 문헌[참조: Church & Gilbert (Church & Gilbert, 1984)]에 기재된 완충액 중에서 65℃ 하에 수행한다. 세척을 15분 동안 65℃ 하에 2X SSC에서 수행한 다음, 65℃ 하에 각각 15분 동안 0.5X SSC에서 2회 연속해서 세척한다. 이러한 하이브리드화 및 세척 조건 하에서, 하이브리드화된 2,000개 중에서 16개 클론이 적어도 1개의 프로브와 강력한 하이브리드화 시그널을 나타내었다. 그러나, 어떠한 코스미드도 상기 3가지 프로브와 하이브리드화하지 않았다. 상기 16개 코스미드를 추출하고, BamHI 제한 효소로 분해시킨다. 이들 각종 코스미드의 제한 프로필을 서로 비교한 결과, 가장 긴 삽입물 영역을 함유하기 쉽고 공통의 밴드는 전혀 갖지 않는 2개의 코스미드를 선택하게 되었다. 이로써, pSPM5로 명명된 것과 pSPM7로 명명된 2개의 코스미드를 선택하였다. 코스미드 pSPM5는 프로브 orf1 내지 orf4 및 프로브 orf8와 하이브리 드화하였지만, 프로브 srmD와는 하이브리드화하지 않았다. pSPM7은 프로브 srmD와만 하이브리드화하였고, 다른 2가지 프로브와는 하이브리드화하지 않았다.
이들 2개의 코스미드는 "숏건 서열 분석" 기술을 사용하여 완전히 서열 분석하였다. 이들 2개의 코스미드 pSPM7 및 pSPM5의 삽입 서열을 어셈블리할 수 있었는데, 이는 이들이 중복되지는 않았지만, 각각의 삽입물이 이의 한쪽 말단에 공지된 서열을 포함하였기 때문이다. 구체적으로 언급하면, 이들 삽입물 각각이 "폴리케티드 신타제"(PKS)로 지칭된 효소를 암호화하는 유전자들 중의 하나의 서열 단편을 포함하였다. 이들 5개 유전자를 문헌[참조: S. Burgett et al. in 1996 (US patent 5,945,320)]에 의해 클로닝하였다(도 2 참조). 이로써, 단일 에스. 암보파시엔스 게놈 DNA 서열을 결정하는 것이 가능하였다. 5' 위치에서, 제1 PKS 유전자 내에 위치한 EcoRI 부위로부터 출발하고 3' 위치에 BamHI 부위 까지 범위의 30,943개 뉴클레오티드 서열이 서열 번호 1에 제시되어 있다. 이러한 서열은 PKS 유전자의 상류 영역에 상응한다(도 2 및 3 참조). 제5 PKS 유전자 내에 위치한, 5' 위치에서 PstI로부터 출발하여 3' 위치에서 NcoI 부위 까지 범위의 11,171개 뉴클레오티드의 제2 영역이 서열 번호 2에 제시되어 있다. 이러한 제2 영역은 PKS 유전자의 하류 영역이다(하류 및 상류는 모두 동일한 방향으로 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 2 및 3 참조).
실시예 4: 뉴클레오티드 서열 분석, 개방 판독 프레임의 결정, 및 스피라마이신 생합성에 관여하는 유전자의 성상 확인
수득된 서열은 프레임플롯 프로그램[참조: J. Ishikawa & K. Hotta, 1999]을 사용하여 분석하였다. 이로써, 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정하는 것이 가능하였다. 이러한 분석 결과, 상기 영역이 효소 "폴리케티드 신타제"(PKS)를 암호화하는 5개 유전자의 어느 한 쪽에 위치한 35개 ORF를 포함한다는 사실이 결정되었다. 10개 및 25개 ORF가 각각 이들 유전자의 하류 및 상류에서 동정되었다(하류 및 상류는 모두 동일한 방향으로 배향된 5개 PKS 유전자의 배향으로써 규정된다)(도 3 참조). 따라서, 대략 31 kb의 영역을 점유하고 있는 상기 유형의 25개 개방 판독 프레임(서열 번호 1 및 도 37)을 상기 5개 PKS 유전자의 상류에서 동정하였고, 대략 11.1 kb 영역을 점유하고 있는 10개(서열 번호 2 및 도 3)는 PKS 유전자의 하류에서 동정하였다. 상류 영역 유전자는 orf1, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10, orf11c, orf12, orf13c, orf14, orf15c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, orf23c, orf24c orf25c(서열 번호 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 및 84)로 명명되었다. 하류 영역 유전자는 orf1*c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8*, orf9* orf10*(서열 번호 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21)로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(따라서, 암호화 쇄는 이들 유전자에 대해 서열 번호 1 또는 서열 번호 2에 제시된 서열에 상보적인 쇄이다)(도 3 참조).
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치, COGs(Cluster of Orthologous Groups)(이들 3가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990], BEAUTY[참조: K.C. Worley et al., 1995](이들 2가지 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
실시예 5: 유전자 불활성화: 스트렙토마이세스 암보파시엔스의 녹-아웃 균주의 작제 원리
사용된 방법은 유전자 대체를 수행하는 것으로 이루어진다. 개입중단시키고자 하는 표적 유전자를 도 9에 예시된 바와 같이, 항생제(예를 들면, 아프라마이신 또는 히그로마이신)에 대한 내성을 부여해 주는 카세트를 이용하여 개입중단시킨 상기 유전자의 복사물로 대체시킨다. 사용된 카세트는 어느 한 쪽이, 모든 판독 프레임 내의 해독 종결 코돈과 접해있고, 스트렙토마이세스에서 활동성인 전사 종결인자와 접해있다.
상기 카세트를 표적 유전자 내로 삽입하는 것은 이러한 표적 유전자에서의 결실을 수반하거나 수반하지 않을 수 있다. 상기 카세트를 플랭킹하는 영역의 크기는 수 백개 염기쌍에서 부터 수 천개 염기쌍 범위일 수 있다.
상기 카세트를 사용하여 유전자를 불활성화시키는데 요구되는 작제물은 재조합 DNA 작제물을 수득하기 위한 기준 유기체인 이. 콜라이에서 수득하였다. 개입중단된 유전자는 이. 콜라이에서는 복제될 수 있지만, 스트렙토마이세스에서는 복제될 수 없는 플라스미드에서 수득하였다.
이어서, 상기 작제물을 벡터 내로 아클로닝시켜 에스. 암보파시엔스에서 목적하는 유전자를 불활성화 및 형질전환시킬 수 있다. 이를 위해, 다음 2가지 플라스미드를 사용하였다:
- pOJ260[참조: M. Bierman et al., 1992](실시예 2 참조). 이는 이. 콜라이와 스트렙토마이세스에 아프라마이신 내성을 부여해 주고, 히그로마이신 내성을 부여해 주는 카세트를 이용하여 표적 유전자를 개입중단시킨 경우에 사용된다.
- pOSK1205(4726 bp). 이러한 플라스미드는 네오마이신/카나마이신 내성을 암호화하는 서열을 함유하는 AvrII 단편을 히그로마이신 내성을 암호화하는 서열로 대체시켰지만, P SV40 프로모터는 보존하고 있는 플라스미드 pBK-CMV(Stratagene (LaJolla, California, USA)에 의해 시판됨)로부터 유도된 것이다. 이를 위해, 플라스미드 pHP45-Ωhyg[참조: Blondelet-Rouault et al., 1997]를 NotI 및 PflmI 효소로 분해시키고; 말단 모두를 클레노우 효소로 처리함으로써 평활 말단화시킨 후에, 히그로마이신 내성 부여 단편을 벡터 pBK-CMV의 AvrII 부위 내로 아클로닝시킨다. pOSK1205에서는, 히그로마이신 내성을 부여해 주는 카세트가 pSV40 프로모터 보다 앞에 있다. 이러한 플라스미드는 이. 콜라이와 스트렙토마이세스에 히그로마이신 내성을 부여해 주고, 아프라마이신 내성을 부여해 주는 카세트를 이용하여 표적 유전자를 개입중단시킨 경우에 사용된다.
상기 카세트는 표적 유전자 내에 존재하는 제한 부위를 사용하여 클로닝시키거나, 또는 예를 들어, 문헌[참조: M.K. Chaveroche et al., 2000]에 기재된 바와 같은 동일한 짧은 서열들 간을 재조합시킴으로써 표적 유전자 내로 도입하였다.
이어서, 카세트에 의해 개입중단된 유전자를 수반하는 플라스미드를, 예를 들어, 이. 콜라이와 스트렙토마이세스 간을 접합시킴으로써 스트렙토마이세스 암보파시엔스 내로 도입할 수 있다[참조: P. Mazodier et al., 1989]. 이러한 기술은 기본 벡터가 벡터 pOJ260인 경우에 사용된다. 예를 들어, 문헌[참조: Oh & Chater, 1997]에 의해 기재된 바와 같이 재조합 횟수를 증가시키기 위해, DNA을 알칼리 처리함으로써 변성시킨 후[참조: T. Kieser et al., 2000] 원형질체 형질전환시키는 기술인 제2 기술을 사용할 수 있다. 이러한 기술은 기본 벡터가 pOJ260 또는 pOSK1205(하기 참조)인 경우에 사용된다. 이어서, 표적 유전자 내에 존재하는 카세트에 상응하는 항생제로 형질전환체를 선별한다(도 9, 항생제 B 참조). 이로써, 1회 또는 2회 재조합 사건에 의해 통합이 이루어진 클론의 혼합물을 선별한다. 이어서, 이에 대한 내성 유전자가 벡터 내에 존재하는(재조합 카세트 외부) 항생제(참조: 도 9, 항생제 A)에 민감한 클론을 찾아낸다. 이로써, 원칙적으로 2회 재조합 사건으로 인해 야생형 유전자가 카세트에 의해 개입중단된 복사물로 대체된 클론을 선별하는 것이 가능하다. 이들 단계는 도 9에 도식적으로 제시되어 있다.
몇 가지 카세트를 사용하여 표적 유전자를 개입중단시킬 수 있다. 히그로마이신 내성을 부여해 주는 Ωhyg 카세트[참조: Blondelet-Rouault et al., 1997, 젠뱅크 수탁 번호: X99315]를 사용할 수 있다.
실시예 6: orf3 유전자에서 동위상 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf3 유전자를 Ωhyg 카세트(실시예 2.2 참조)로 개입중단시키면, orf3::Ωhyg 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 입증하는 것이 가능한데, 이는 클로닝된 영역의 하나 이상의 유전자가 스피라마이신 생합성에 관여한다는 사실을 확인시켜 준다(실시예 2.2 참조). 이들의 배향 측면에서는, ORF 1 내지 7이 동시 전사되는 것으로 예상되고(도 3 참조) 관찰된 표현형(스피라마이신의 비-생산자)는 orf3과 동시 전사되는 유전자 하나 이상을 불활성화시킴으로써 기인된 것일 수 있다. orf3가 스피라마이신 생합성에 관여한다는 사실을 확인하기 위해, orf3 유전자를 추가로 불활성화시키는데, 후반 불활성화는 동위상으로 수행된다. 이를 위해, orf3 내부의 504개 염기쌍의 DraIII 단편을 결실시킨다. 1번(서열 번호 1)에 위치한 EcoRI 부위에서 부터 5274번(서열 번호 1)에 위치한 SacI 부위 까지의 범위이고 2563번과 3067번에 위치한 2개의 DraIII 부위 사이를 결실시킨(504개 뉴클레오티드가 제거됨), pOS49.1로부터 수득된 DNA 단편을 플라스미드 pOJ260 내로 클로닝시킨다[참조: M. Bierman et al., 1992]. 이로써 수득된 플라스미드는 pOS49.67로 명명되었다.
따라서, pOS49.67의 삽입물은 orf1 유전자, orf2 유전자, 동위상 결실시킨 orf3 유전자, orf4 유전자 및 orf5의 일정 부분을 함유하는 에스. 암보파시엔스의 DNA 단편으로 구성된다. 이러한 삽입물이 아클로닝된 벡터가 pOJ260이므로, 플라스미드 pOS49.67은 아프라마이신 내성을 제공해주고, 이를 원형질체 형질전환에 의해 균주 OS49.16 내로 도입시킨다(실시예 2 참조). 균주 OS49.16은 히그로마이신에 내성이기 때문에, hygR 및 apraR 형질전환체가 수득되었다. 이러한 클론을 비-선별성 배지 상에서 2회 계대접종한 후, 아프라마이신에 민감한 클론과 히그로마이신에 민감한 클론(apraS 및 hygS)를 찾아내었다. 이들 클론 중 몇몇에서는, 상동 서열 간의 재조합 사건으로 인해 실제로, (균주 OS49.16의 게놈 내에 함유된) Ωhyg 카세트로 개입중단된 orf3 복사물이, 해당 벡터 상에 존재하는 동위상 결실이 수반된 orf3 복사물로 대체될 것으로 예상된다. 이러한 재조합으로부터 생성된 클론은 벡터 서열의 제거 후 apraS 및 hygS일 것으로 예상된다. 이로써 수득된 균주의 유전자형은 하이브리드화 또는 PCR에 의해 확인할 수 있으며, (orf3의 단지 1개의 동위상 결실된 복사물이 상기 수득된 클론의 게놈 내에 존재한다는 것을 확인하기 위해) PCR 생성물을 서열 분석하였다. 이로써, 동위상 결실된 orf3 복사물을 1개만 갖는 클론을 수득하였으며, 이들의 유전자형을 확인하였다. 목적하는 특징을 나타내는 클론을 보다 특별히 선별하였으며, 이는 OS49.67로 명명되었다.
균주 OS49.67 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2916로 기탁되었다.
실시예 7: orf8 유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf8 유전자의 불활성화를 수행하기 위해, Ωhyg 카세트를 orf8의 암호화 서열 내로 도입한 작제물을 수득하였다. 이를 위해, 플라스미드 pOS49.88를 우선적으로 작제하였다. 플라스미드 pOS49.88은 pUC19의 PstI-EcoRI 부위 내로 클로닝된, orf7의 말단부, orf8orf9의 출발부를 함유하는 3.7kb 단편(코스미드 pSPM5로부터 수득된 PstI-EcoRI 단편)을 삽입함으로써 플라스미드 pUC19(젠뱅크 수탁 번호: M77789)로부터 유도된 것이다. (클레노우 효소로 처리시킴으로써 평활 말단화된 BamHI 단편 형태의) Ωhyg 카세트를, 클레노우 효소로 처리함으로써 말단 모두를 평활 말단화시킨 후에 orf8에 위치한 pOS49.88의 독특한 SalI 부위 내로 클로닝시킨다.
상기 클로닝이 평활 말단화되었기 때문에, 해당 카세트의 삽입 방향에 따라서 2가지 유형의 플라스미드가 수득되었다: hyg 유전자와 orf8 유전자가 동일한 배향으로 존재하는 pOS49.106; 및 hyg 유전자와 orf8 유전자가 반대 배향으로 존재하는 pOS49.120. 이어서, 플라스미드 pOS49.106의 삽입물을 플라스미드 pOJ260 내로 아클로닝시켜 pOS49.107을 수득한다. 이를 위해, 플라스미드 pOS49.106을 Asp718I 효소로 분해시키고, 클레노우 효소로 처리함으로써 말단을 평활 말단화시키며; 이러한 분해 생성물을 PstI 효소로 재분해시키고, Ωhyg 카세트가 삽입된 orf8 유전자를 함유하는 단편을 벡터 pOJ260(상기 참조) 내로 클로닝시킨다. 이를 위해, 벡 터 pOJ260을 EcoRV 및 PstI 효소로 분해시키고, 연결을 위해 사용한다. 따라서, 이러한 조작으로 특정 배향의 연결을 획득할 수 있는데, 이는 상기 2개 단편 중의 하나를 한쪽에서 평활 말단시키고, 다른 쪽에는 PstI를 평활 말단시키기 때문이다. 이로써 수득된 플라스미드는 pOS49.107로 명명되었다.
플라스미드 pOS49.107을 원형질체 형질전환에 의해 에스. 암보파시엔스 균주 ATCC23877 내로 도입하였다[참조: T. Kieser et al., 2000]. 원형질체 형질전환 후, 상기 클론을 대상으로 하여, 이들의 히그로마이신 내성에 대해 선별하였다. 이어서, 히그로마이신-내성 클론을 각각, 히그로마이신(항생제 B) 함유 배지와 아프라마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 히그로마이신에 내성인 유전자(HygR)와 아프라마이신에 민감한 유전자(ApraS)는 원칙적으로, 이중 유전자교환 사건이 발생하였으므로 Ωhyg 카세트에 의해 개입중단된 orf8 유전자를 함유하고 있는 것이다. orf8의 야생형 복사물을 Ωhyg 카세트에 의해 개입중단된 복사물로 대체시키는 것은 서던 블롯팅에 의해 확인되었다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, Ωhyg 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, 크기가 대략 3.7kb인, orf7의 말단부, orf8orf9의 출발부를 함유하는 플라스미드 pOS49.88의 PstI-EcoRI 삽입물을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
orf8::Ωhyg 클론을 선택하고, 이를 OS49.107로 명명하였다. 균주 OS49.107 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2917 기탁되었다.
실시예 8: orf10 유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
매트릭스로서 에스. 암보파시엔스의 게놈 DNA를 사용하고 다음 프라이머를 이용함으로써 PCR하여, orf10 유전자 내부의 1.5kb DNA 단편을 수득하였다:
Figure 112005018477118-pct00040
이러한 PCR-유도된 DNA 단편을 벡터 pCR2.1[Invitrogen (Carlsbad, California, USA) 회사에 의해 시판됨] 내로 클로닝하였다. 이로써 수득된 플라스미드는 pOS49.32로 명명되었다. (BamHI 단편 형태의) Ωhyg 카세트(상기 참조)를, 클레노우 효소로 처리함으로써 말단 모두를 평활 말단화시킨 후에 orf10 유전자 단편 내부의 독특한 BstEII 부위 내로 클로닝시킨다. 상기 클로닝이 평활 말단화되었기 때문에, 해당 카세트의 삽입 방향에 따라서 2가지 유형의 플라스미드가 수득되었다: hyg 유전자와 orf10 유전자가 동일한 배향으로 존재하는 pOS49.43; 및 hyg 유전자와 orf10 유전자가 반대 배향으로 존재하는 pOS49.44. 플라스미드 pOS49.43 의 삽입물(이의 말단을 클레노우 효소로 처리함으로써 평활 말단화시킨 Asp718I-XbaI 단편 형태)을 플라스미드 pOJ260의 EcoRV 부위 내로 전이시켜, 플라스미드 pOS49.50을 수득할 수 있다. Ωhyg 카세트에 의해 개입중단된 orf10 유전자를 함유하는 플라스미드 pOS49.50을 스트렙토마이세스 암보파시엔스 균주 ATCC23877 내로 도입하였다. 형질전환 후, 상기 클론을 대상으로 하여, 이들의 히그로마이신 내성에 대해 선별하였다. 이어서, 히그로마이신-내성 클론을 각각, 히그로마이신(항생제 B) 함유 배지와 아프라마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 히그로마이신에 내성인 유전자(HygR)와 아프라마이신에 민감한 유전자(ApraS)는 원칙적으로, 이중 유전자교환 사건이 발생하였으며 Ωhyg 카세트에 의해 개입중단된 orf10 유전자를 함유하고 있는 것이다. 이로써, 상기 카세트에 의해 수반된 히그로마이신 내성 마커를 함유하고 있고 벡터 pOJ260에 의해 수반된 아프라마이신 내성 마커를 상실한 클론을 수득하였다. orf10의 야생형 복사물을 orf10::Ωhyg 개입중단된 복사물로 대체시키는 것으로 이루어진 사건은 서던 블롯팅에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, Ωhyg 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, orf10 유전자 내의 1.5kb PCR 생성물을 사용하여 제2 하이브리드화를 수행하였다(상기 참조).
예상된 특징을 나타내는 클론(orf10::Ωhyg )을 보다 특별히 선택하고, 이를 OS49.50으로 명명하였다. 사실상, 2회 하이브리드화를 통하여, Ωhyg 카세트가 상 기 클론의 게놈 내에 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 복사물을 Ωhyg 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에, 예상된 분해 프로필을 사실상 수득할 수 있다는 사실을 확인할 수 있었다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
실시예 9: 유전자 불활성화: "절제 가능한 카세트" 기술에 따라서 녹아웃된 스트렙토마이세스 암보파시엔스 균주의 작제 원리(도 9 및 10 참조)
"절제 가능한 카세트"로 지칭되는 제2 유형의 카세트를 유전자 불활성화에 사용할 수 있다. 이들 카세트는 에스. 암보파시엔스의 게놈 내로 도입된 후 부위-특이적 재조합 사건에 의해 스트렙토마이세스에서 절단될 수 있다는 이점을 지니고 있다. 이러한 목적은 최종 균주 내에, 이러한 균주에 속하지 않는 큰 DNA 서열이나 선별 마커를 잔존시키지 않으면서, 스트렙토마이세스 균주 내의 특정의 유전자를 불활성화시키는 것이다. 절제 후, 대략 30개 정도 염기쌍의 짧은 서열("반흔성(scar)" 부위로 지칭됨) 만이 상기 균주의 게놈 내에 잔존한다(도 10 참조).
이러한 시스템의 사용은 초기에는, 표적 유전자의 야생형 복사물을 (2회 상동 재조합 사건을 통하여: 도 9 참조), 절제 가능한 카세트를 상기 표적 유전자 내로 삽입시킨 작제물로 대체시키는 것으로 이루어진다. 이러한 카세트의 삽입은 표적 유전자의 결실을 수반하게 된다(도 9 참조). 그 다음, 상기 균주의 게놈으로부 터 절제 가능한 카세트를 절제시킨다. 절제 가능한 카세트는 부위-특이적 재조합 시스템을 통하여 기능하고, 결국에는 내성 유전자를 수반하지 않는 스트렙토마이세스 돌연변이체를 획득할 수 있게 해주는 이점을 지니고 있다. 불활성화된 유전자(들)의 하류에 위치한 유전자의 발현에 대한 가능한 극성 효과를 또한 피할 수 있다(도 10 참조).
절제 가능한 카세트의 이용에 관해 당해 분야에 보고되었으며, 이는 포유류 세포, 효소 세포 및 이. 콜라이를 포함한 많은 유기체에서 사용되었다[참조: Bayley et al., 1992; Brunelli and Pall, 1993; Camilli et al., 1994; Dale and Ow, 1991; Russell et al., 1992; Lakso et al., 1992]. 이들 절제 가능한 카세트는 모두, lox 부위 상에서 작용하는 Cre 부위-특이적 레컴비나제(recombinase)를 이용한다. 이러한 재조합 시스템은 P1 박테리오파아지로부터 유래한다.
"절제 가능한 카세트" 유형 시스템을 스트렙토마이세스에서 작제하기 위해, 스트렙토마이세스 암보파시엔스의 이동 유전 요소 pSAM2에 대한 부위-특이적 재조합 시스템을 이용한다[참조: Boccard et al., 1989a and b]. 이러한 시스템 설정은 초기에는, 절제 가능한 카세트가 삽입되는, 개입중단될 유전자를 포함하는 재조합 벡터를 작제하는 것으로 구성된다. 절제 가능한 카세트를 표적 유전자 내로 삽입하는 것은 표적 유전자의 결실을 수반하게 된다. 이는 표적 유전자 내에 존재하는 제한 부위를 사용하여 클로닝시키거나, 또는 예를 들어, 문헌[참조: M.K. Chaveroche et al., 2000]에 기재된 바와 같은 동일한 짧은 서열들 간을 재조합시킴으로써 수행할 수 있다. 절제 가능한 카세트는 예를 들어, Ωhyg 카세트를 사용 하여 작제할 수 있다[참조: Blondelet Rouault et al.,1997]. 이러한 카세트는 pSAM2의 통합된 복사물을 정상적으로 플랭킹하는 attRattL 서열과 접해있다(도 15 참조). attLattR 서열은 pSAM2의 절제를 허용하거나 또는 이들 두 영역 사이에 위치한 모든 DNA 단편의 절제를 허용해 주는 부위-특이적 재조합에 필요한 부위 모두를 함유한다[참조: Sezonov et al., 1997, Raynal et al.,1998]. 이러한 카세트의 작제가 Ωhyg 카세트의 사용으로만 제한되지 않는 것은 명백하며, 기타 내성 카세트를 이러한 카세트 작제에 대한 기본으로서 사용할 수 있다[예를 들면, Ωaac 또는 Ωvph 카세트(참조: Blondelet Rouault et al.,1997)].
상기 작제물을 수득한 후, 재조합 플라스미드를 사용하여 스트렙토마이세스 균주를 형질전환시킨다. 이어서, 표적 유전자 내에 존재하는 카세트에 상응하는 항생제로 형질전환체를 선별한다(참조: 도 9, 항생제 B, 이는, 예를 들어, 절제 가능한 카세트가 Ωhyg 카세트로부터 유도되는 경우에는 히그로마이신으로의 선별을 포함한다). 이로써, 1회 또는 2회 재조합 사건에 의해 통합이 이루어진 클론의 혼합물을 선별한다. 이어서, 이에 대한 내성 유전자가 벡터 내에 존재하는(재조합 카세트 외부) 항생제(참조: 도 9, 항생제 A)에 민감한 클론을 찾아낸다. 이로써, 원칙적으로 2회 재조합 사건으로 인해 야생형 유전자가 카세트에 의해 개입중단된 복사물로 대체된 클론을 선별하는 것이 가능하다. 이들 단계는 도 9에 도식적으로 제시되어 있으며; 이로써 수득된 클론의 유전자형은 서던 블롯팅에 의해 확인하고 목적하는 특징(야생형 유전자를 절제 가능한 카세트에 의해 개입중단된 복사물로 대체시킴)을 나타내는 클론을 선별한다.
그 다음, 상기 선별된 균주를, attR 부위와 attL 부위 간의 부위-특이적 재조합에 필요한 xis int 유전자의 발현을 허용해 주는 플라스미드로 형질전환시킨다. 이러한 재조합으로 인해, 재조합 사건을 통하여 상기 균주의 게놈 내에 절제 가능한 카세트가 잔존하게 된다(도 10 참조)[참조: Raynal et al., 1998]. 스트렙토마이세스에서 비교적 안정한 벡터로부터의 xis int 유전자를 수반하는 벡터[스트렙토마이세스 벡터 pWHM3로부터 유도됨(참조: Vara et al., 1989)]를 선택하는 것이 유리한데, 이로써 선별 압력의 부재 하에 포자형성 몇 주기 후에 후자 벡터를 상실한 균주를 수득하는 것이 가능해진다.
상기 카세트를 절제하기 위해, 예를 들어, 절제 가능한 카세트에 의해 개입중단된 유전자를 함유하는 에스. 암보파시엔스 균주 내로 원형질체 형질전환시킴으로써 도입되는 플라스미드 pOSV508(도 14 참조)를 사용하는 것이 가능하다. 플라스미드 pOSV508는 ptrc 프로모터(참조: E. Amann et al., 1988)의 제어 하에 위치된, pSAM2의 xisint 유전자(참조: F. Boccard et al., 1989b)가 부가된 플라스미드 pWHM3(참조: J. Vara et al.,1989)(도 13 참조)으로부터 유도된 것이다. ptrc 프로모터의 제어 하에 위치된 xisint 유전자를 플라스미드 pOSint3으로부터의 플라스미드 pWHM3 내로 아클로닝시킨다(참조: Raynal et al., 1998)(도 14 참조). pSAM2의 xisint 유전자를 수반하는 플라스미드 pOSV508을 돌연변이체 균주 내로 도입하면, 절제 가능한 카세트를 플랭킹하는 attL 부위와 attR 부위 간의 부위-특이적 재조합에 의해 이러한 절제 가능한 카세트를 효과적으로 절제시켜 줄 것이다(참조: A. Raynal et al., 1998)(도 10). pOSV508에 의해 수반된 tsr 유전 자에 기인하여 이들의 티오스트렙톤 내성에 대해 선별된 형질전환체 중에서, 해당 카세트의 존재가 내성을 부여해 주는 항생제에 대해 민감한 형질전환체를 선택한다(도 10 참조). 이러한 절제는 효과적이고, 형질전환체의 90% 이상이 이러한 유형인 것으로 관찰되었다. 티오스트렙톤이 결여된 고체 배지 상에서의 성장과 포자형성을 1회 이상 수행한 후, 플라스미드 pOSV508을 상실한 클론을 수득한다. 이들 클론은 티오스트렙톤에 대한 이들의 민감성 측면에서 탐지될 수 있다. 결실된 표적 유전자의 서열은 PCR에 의해 확인할 수 있고 이러한 PCR 생성물을 서열 분석함으로써 확인할 수 있다.
최종적으로, 이로써 생성된 균주는 불활성화 유전자(예를 들어, 내부 결실물) 내에, attR 부위와 attL 부위 간의 재조합으로부터 유도된, 최소 attB 부위(참조: Raynal et al., 1998)에 상응하는 "반흔성" att 부위를 수반한다. 잔존하는 최소 attB 부위는 스트렙토마이세스 암보파시엔스, 스트렙토마이세스 프리스티내스피랄리스(Streptomyces pristinaespiralis) 및 스트렙토마이세스 리비단스 균주에 천연적으로 존재하는 것과 유사하다(참조: Sezonov et al., 1997).
불활성화시키고자 하는 유전자를 하류에 위치한 기타 유전자와 동시 전사시킬 수 있다. 오페론에서 하류 유전자의 발현에 대한 극성 효과를 지니고 있는 유전자들 중의 하나가 불활성화되는 것을 피하기 위해서는, 카세트를 절제한 후 동위상 결실을 획득하는 것이 중요하다. 상기 언급된 바와 같은 절제 가능한 카세트 시스템은 이러한 요구 사항을 충족시켜 줄 수 있다. 당업자는 사실상, 3가지 상이한 절제 가능한 카세트를 용이하게 작제할 수 있는데, 이러한 카세트는 절제 후, 판독 프레임이 무엇이든지 간에 중지 코돈을 수반하지 않는 33, 34 또는 35개 뉴클레오티드 서열을 각각 잔존시킨다. 상기 카세트의 삽입과 연관된 결실 크기와 표적 유전자의 서열이 공지된 경우에는, 이들 3가지 절제 가능한 카세트 중에서, 절제시키면 동위상 결실되는 것을 선택하는 것이 가능하다. 부가된 33, 34 또는 35개 뉴클레오티드 중에서, 26개가 최소 attB 부위에 상응한다(도 27 참조).
본 출원의 경우에는, 2가지 절제 가능한 카세트를 사용하였다. 이들 2가지 카세트는 다음과 같다: att1Ωhyg+(서열 번호 91) 및 att3Ωaac-(서열 번호 92); 이들 카세트는 절제 후 각각 33 및 35개 뉴클레오티드를 잔존시킨다. 이들은 각각, Ωhyg 카세트 또는 Ωaac 카세트를 포함하며, + 및 - 부호는 내성 카세트의 배향에 상응한다. 이들 두 카세트를 작제하고 벡터 pBC SK+의 EcoRV 부위 내로 클로닝하였는데, 이의 HindIII 부위는 미리 결실시켰다. 이로써 수득된 플라스미드는 patt1Ωhyg+ 및 patt3Ωaac-로 각각 명명되었다. 절제 가능한 카세트는 플라스미드를 EcoRV로 분해시킴으로써 용이하게 꺼낼 수 있다.
실시예 10: orf2 유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf2 유전자의 불활성화는 절제 가능한 카세트를 사용하여 수행하였다(상기 참조). 사용된 출발 균주는 균주 ATCC23877로부터 유도되는 스트렙토마이세스 암보파시엔스 균주 OSC2이다. 그러나, 균주 OSC2는 이동 유전 요소 pSAM2를 상실하였다는 점에서 균주 ATCC23877와 상이하다(참조: Boccard et al., 1989a and b). 이러한 이동 요소는 균주 ATCC23877의 원형질체 형성(세포벽을 분해시키고 균사체를 단편으로 만드는 리소자임의 작용(참조: Kieser et al., 2000)) 및 상기 균주의원형질체 재생 동안 자발적으로 상실될 수 있다. pSAM2 요소를 상실한 클론을 선별하기 위해, KorSA 전사 억제인자에 의한 pra 유전자의 억제에 근거하여 스크린을 설정하였다(참조: Sezonov et al., 1995 and G. Sezonov et al., 2000). 이를 위해, aph 유전자(카나마이신 내성을 부여해 주고 자신의 프로모터가 결여되어 있음)의 상류에 위치한 pra 유전자의 프로모터를 함유하는 DNA 단편을 불안정한 벡터 pWHM3Hyg 내로 클로닝하는데, 후자는 tsr 유전자를 hyg 유전자(히그로마이신 내성을 부여함)로 대체시킨 플라스미드 pWHM3(참조: Vara et al., 1989)로부터 유도된다. 이로써 수득된 플라스미드는 pOSV510로 명명되었다. 균주 ATCC23877는 원형질체 형성 후에 플라스미드 pOSV510로 형질전환시켰다. Pra 프로모터는 KorSA 억제인자에 의해 억제되는 프로모터이고, 후자를 암호화하는 유전자는 pSAM2 이동 요소 내에 위치해 있다(참조: Sezonov G. et al., 2000). 플라스미드 pOSV510로 형질전환시킨 후, 형질전환된 세균을 대상으로 하여, 이의 카나마이신 내성에 대해 선별하였다(pOSV510에 의해 수반된 aph 유전자에 기인함). pSAM2 통합 요소를 상실한 클론은 KorSA 억제인자를 상실하였으며, Pra 프로모터는 더 이상 억제되지 않으며 aph 카나마이신 내성 유전자의 발현을 허용해 준다. 따라서, 플라스미드 pOSV510로의 형질전환 후 카나마이신으로 선별하게 되면, pSAM2 통합 요소를 상실하고(이에 따라 KorSA를 상실함) 플라스미드 pOSV510을 함유하는 클론을 선별하는 것이 가능해진다. 플라스미드 pOSV510은 불안정하기 때문에, 항생제 없이 포자 형 성을 수회 수행한 후에 분리된 클론을 카나마이신 함유 배지, 히그로마이신 함유 배지 및 항생제 무함유 배지 상에서 계대배양하였다. 카나마이신과 히그로마이신에 민감한 클론은 pOSV510을 상실하였다. pSAM2 요소의 상실은 하이브리드화 및 PCR에 의해 확인하였다. 목적하는 특징을 나타내는 클론을 선별하고 이를 OSC2로 명명하였다.
균주 OSC2 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2908로 기탁되었다.
orf2 유전자의 불활성화는 절제 가능한 카세트 기술을 사용하여 수행하였다(상기 및 도 10 참조). 이를 위해, 1번에 위치한 EcoRI 부위에서 부터 출발하여 4521번(서열 번호 1)에 위치한 BamHI 부위 까지 서열의 4.5kb 삽입물을 코스미드 pSPM5로부터의 플라스미드 pUC19(젠뱅크 수탁 번호: M77789)의 EcoRI 및 BamHI 부위 내로 아클로닝시켰다. 이로써 수득된 플라스미드는 pOS49.99로 명명되었다.
이러한 플라스미드를, 플라스미드 pKOBEG를 이미 함유하고 있는 이. 콜라이 균주 KS272 내로 도입하였다(참조: Chaveroche et al., 2000)(도 12 참조).
이와 병행해서, att3Ωaac- 절제 가능한 카세트(서열 번호 92, 상기 참조)를, 매트릭스로서 플라스미드 pOSK1102[플라스미드 pOSK1102는 att3Ωaac- 카세트를 EcoRV 단편으로서, pGP704Not의 독특한 EcoRV 부위 내로 클로닝시킨 벡터 pGP704Not로부터 유도된 플라스미드이다(참조: Chaveroche et al., 2000 and V.L. Miller & J.J. Mekalanos, 1988)]를 사용하고, 다음 프라이머를 사용하여 PCR함으 로써 증폭시켰다:
Figure 112005018477118-pct00041
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개 데옥시뉴클레오티드는 표적 유전자(본 경우에는 orf2) 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 20개 데옥시뉴클레오티드(진하게 표시됨)는 att3Ωaac- 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다(도 11 참조).
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 pOS49.99를 함유하는 이. 콜라이 균주를 형질전환시킨다(도 12 참조). 이로써, 상기 세균을 전기천공시킴으로써 형질전환시키고, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3Ωaac- 카세트가 표적 유전자(orf2) 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 플라스미드를 추출하고 여러 제한 효소로 분해하였다(참조: Chaveroche et al., 2000). 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 플라스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 플라스미드는 pSPM17로 명명하였다. 이러한 플라스미드는 orf2가 아프라마이신 카세트에 의해 개입중단된 pOS49.99로부 터 유도된 것이다(도 12 참조).
상기 카세트의 삽입은 orf2의 암호화 부분의 211번 뉴클레오티드와 492번 뉴클레오티드 사이의 orf2 결실을 수반한다.
플라스미드 pSPM17을 EcoRI 효소로 분해시킨 다음, 클레노우 효소로 처리함으로써 평활 말단화하고, 이러한 분해 생성물을 XbaI 효소로 분해시키고, 결실된 orf2 유전자를 함유하는 삽입물을 벡터 pOSK1205(상기 참조) 내로 클로닝시켰다. 이를 위해, 벡터 pOSK1205를 BamHI 효소로 분해시키고, 이의 말단을 클레노우 효소로 처리함으로써 평활 말단화한 다음, 이 생성물을 XbaI 효소로 분해시키고, 상기와 같이 pSPM17로부터 수득된 삽입물과의 연결에 사용하였다. 따라서, 이러한 조작으로 특정 배향의 연결을 획득할 수 있는데, 이는 상기 2개 단편 중의 하나를 한쪽에서 평활 말단시키고, 다른 쪽에는 XbaI를 평활 말단시키기 때문이다. 이로써 수득된 플라스미드는 pSPM21로 명명되었는데; 이는 히그로마이신 내성 유전자(벡터 부분)와, 결실된 orf2 유전자를 att3Ωaac- 카세트로 대체시킨 삽입물을 수반한다.
벡터 pSPM21을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 히그로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 유전자(HygS)는 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3Ωaac- 카세트에 의해 개입중단된 orf2 유 전자를 함유하고 있는 것이다. 이들 클론을 선별하고, orf2의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 확인하였다. att3Ωaac- 카세트의 존재는 콜로니 PCR에 의해 확인하였다. 하이브리드화를 또한 수행하였다. 이를 위해, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, 플라스미드 pOS49.99(상기 참조) 삽입물의 EcoRI-BamHI 단편에 상응하는 3kb 프로브와 하이브리드화하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론을 선별하고, 이를 SPM21로 명명하였다. PCR 및 하이브리드화를 이용하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 복사물을 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에, 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf2::att3Ωaac-을 갖는다.
균주 SPM21 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2914로 기탁되었다.
상기 카세트를 절제하기 위해, 균주 SPM21을 원형질체 형질전환에 의해 벡터 pOSV508로 형질전환시켰다(도 14 참조). 플라스미드 pOSV508는 ptrc 프로모터(참조: E. Amann et al., 1988)의 제어 하에 위치된, pSAM2의 xisint 유전자(참 조: F. Boccard et al., 1989b)가 부가된 플라스미드 pWHM3(참조: J. Vara et al.,1989)(도 13 참조)으로부터 유도된 것이다. pSAM2의 xisint 유전자를 수반하는 플라스미드 pOSV508을 상기 균주 SPM21 내로 도입하면, 절제 가능한 카세트를 플랭킹하는 attL 부위와 attR 부위 간의 부위-특이적 재조합에 의해 이러한 절제 가능한 카세트를 효과적으로 절제시켜 줄 것이다(참조: A. Raynal et al., 1998)(도 10). pOSV508에 의해 수반된 tsr 유전자에 기인하여 이들의 티오스트렙톤 내성에 대해 선별된 형질전환체 중에서, 아프라마이신에 대해 민감해진 형질전환체(이에 대한 내성 유전자는 att3Ωaac- 카세트에 의해 수반된다)를 선택하는데; 이러한 절제로 인해, 사실상 상기 내성 유전자가 상실된다(도 10 참조). 플라스미드 pOSV508은 불안정하기 때문에, 항생제 무함유 배지 상에서 2회 연속해서 계대접종한 후, 분리된 클론을 티오스트렙톤 함유 배지 및 티오스트렙톤 무함유 배지 상에서 계대배양하였다. 티오스트렙톤-민감성 클론은 pOSV508을 상실하였다. PCR하고 PCR 생성물을 서열 분석함으로써, 상기 카세트의 절제로 인해 orf2 유전자 내에서 동위상 결실이 실제로 일어났다는 사실을 확인하였고; 이러한 카세트의 절제는 사실상, 특징적인 "반흔성" att3 서열을 잔존시킨다(이는 attL 부위와 attR 부위 간의 재조합 후 기원의 attB 부위와 유사하다):
5'ATCGCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3'(서열 번호 95).
이로써 수득된, 목적하는 유전자형(orf2::att3)을 갖는 균주는 SPM22로 명명되었다.
균주 SPM22 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2915로 기탁되었다.
실시예 11: orf12 유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf12, orf13corf14를 불활성화시키기 위해, 동일한 출발 플라스미드(pSPM504)를 사용하여, 각종 위치에 "절제 가능한 카세트"의 카세트를 도입하였다. 이러한 플라스미드는 orf7에서 부터 orf17까지의 영역에 상응하는 15.1kb 삽입물을 함유한다. 상기 플라스미드를 작제하기 위해, 코스미드 pSPM7(상기 참조)의 분해로부터 유래하는 15.1kb BglII 단편을, BamHI로 분해시킨 플라스미드 pMBL18(참조: Nakano et al., 1995) 내로 클로닝하였다. BamHI 말단과 BglII 말단은 호환성이기 때문에, 연결 후에 플라스미드 pSPM502를 수득한다. 이어서, pSPM502 완전한 삽입물을 (HindIII/NheI 단편 형태로) 플라스미드 pOSK1205(HindIII/NheI로 분해시킴) 내로 아클로닝시켜, 플라스미드 pSPM504를 수득할 수 있다.
이러한 플라스미드를, 플라스미드 pKOBEG를 이미 함유하고 있는 이. 콜라이 균주 KS272 내로 도입하였다(참조: Chaveroche et al., 2000)(도 12 참조).
이와 병행해서, att3Ωaac- 절제 가능한 카세트를, 매트릭스로서 플라스미드 pOSK1102[플라스미드 pOSK1102는 att3Ωaac- 카세트를 EcoRV 단편으로서, pGP704Not의 독특한 EcoRV 부위 내로 클로닝시킨 벡터 pGP704Not로부터 유도된 플라스미드이다(참조: Chaveroche et al., 2000 and V.L. Miller & J.J. Mekalanos, 1988)]를 사용하여 PCR함으로써 증폭시켰으며, 사용된 프라이머는 다음과 같다:
Figure 112005018477118-pct00042
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개(EDR8의 경우에는 39개) 데옥시뉴클레오티드는 표적 유전자(본 경우에는 orf12) 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 20개 데옥시뉴클레오티드(진하게 표시됨)는 att3Ωaac- 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다(도 11 참조).
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 pSPM504(상기 참조)를 함유하는 이. 콜라이 균주 KS272를 형질전환시킨다(도 12 참조; 원칙적으로 플라스미드 pOS49.99는 플라스미드 pSPM504로 대체되어야 하고, 수득된 플라스미드는 더 이상 pSPM17이 아니지만, pSPM507이다). 이로써, 상기 세균을 이러한 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3Ωaac- 카세트가 표적 유전자(orf12) 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 플라스미드를 추출하고 여러 제한 효소로 분해하였다(참조: Chaveroche et al., 2000). 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사 용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 플라스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 플라스미드는 pSPM507로 명명되었다. 이러한 플라스미드는 orf12att3Ωaac- 카세트에 의해 개입중단된 pSPM504로부터 유도된 것이다(도 12 참조). 상기 카세트의 삽입은 orf12 유전자에서의 결실을 수반하는데, 개입중단은 orf12의 30번째 코돈에서 시작한다. orf12의 마지막 46개 코돈은 카세트 다음에 존재한다.
벡터 pSPM507을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 히그로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 유전자(HygS)는 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3Ωaac- 카세트에 의해 개입중단된 orf12 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf12의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3Ωaac- 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, PCR에 의해 수득되고 orf12 유전자의 암호화 서열의 매우 큰 부분에 상응하는 DNA 단편을 사용하여 제2 하이브리드화를 수행 하였다.
당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf12::att3Ωaac-)을 보다 특별히 선별하고, 이를 SPM507로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf12::att3Ωaac-을 갖고 SPM507로 명명되었다. 유전자의 배향이 주어지면(도 3 참조), orf12의 불활성화 효과를 연구하기 위해 카세트를 절제할 필요가 없다. 구체적으로 언급하면, orf13corf12와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도, 특히 플라스미드 pOSV508로의 형질전환에 의해 제거할 수 있는 가능성이 생긴다. 균주 SPM507 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2911로 기탁되었다.
실시예 12: orf13c 유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
att3Ωaac- 절제 가능한 카세트를, 매트릭스로서 플라스미드 pOSK1102(상기 참조)를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시켰다:
Figure 112005018477118-pct00043
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개 데옥시뉴클레오티드는 표적 유전자(본 경우에는 orf13c) 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 20개 데옥시뉴클레오티드(진하게 표시됨)는 att3Ωaac- 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다(도 11 참조).
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 pSPM504(상기 참조)를 함유하는 이. 콜라이 균주 KS272를 형질전환시킨다(도 12 참조; 원칙적으로 플라스미드 pOS49.99는 플라스미드 pSPM504로 대체되어야 하고, 수득된 플라스미드는 더 이상 pSPM17이 아니지만, pSPM508이다). 이로써, 상기 세균을 이러한 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3Ωaac- 카세트가 표적 유전자(orf13c) 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 플라스미드를 추출하고 여러 제한 효소로 분해하였다(참조: Chaveroche et al., 2000). 당업자에게 공지된 모든 방법, 특히 적당한 올리 고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 플라스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 플라스미드를 pSPM508로 명명하였다. 이러한 플라스미드는 orf13c가 아프라마이신 카세트에 의해 개입중단된 pSPM504로부터 유도된 것이다(도 12 참조). 상기 카세트의 삽입은 orf13c 유전자에서의 결실을 수반하는데, 개입중단은 orf13c의 6번째 코돈에서 시작한다. orf13c의 마지막 3개 코돈은 카세트 다음에 존재한다.
벡터 pSPM508을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 히그로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 클론(HygS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3Ωaac- 카세트에 의해 개입중단된 orf13c 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf13c의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3Ωaac- 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, orf13c의 암호화 서열의 상류 및 하류에 대략 100개 염기쌍 정도로 연장된 서열에 상응하는 PCR 생성물을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf13c::att3Ωaac-)을 보다 특별히 선별하고, 이를 SPM508로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf13c::att3Ωaac-을 갖고 SPM508로 명명되었다. 유전자의 배향이 주어지면(도 3 참조), orf13c의 불활성화 효과를 연구하기 위해 카세트를 절제할 필요가 없다. orf14orf13c와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM508 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2912로 기탁되었다.
실시예 13: orf14 유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
att3Ωaac- 절제 가능한 카세트를, 매트릭스로서 플라스미드 pOSK1102(상기 참조)를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시켰다:
Figure 112005018477118-pct00044
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개 데옥시뉴클레오티드는 표적 유전자(본 경우에는 orf14) 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 20개 데옥시뉴클레오티드(진하게 표시됨)는 att3Ωaac- 절제 가능한 카세트의 말단 중의 하나의 서열에 상응한다(도 11 참조).
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 pSPM504(상기 참조)를 함유하는 이. 콜라이 균주 KS272를 형질전환시킨다(도 12 참조; 원칙적으로 플라스미드 pOS49.99는 플라스미드 pSPM504로 대체되어야 하고, 수득된 플라스미드는 더 이상 pSPM17이 아니지만, pSPM509이다). 이로써, 상기 세균을 이러한 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3Ωaac- 카세트가 표적 유전자(orf14) 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 플라스미드를 추출하고 여러 제한 효소로 분해하였다(참조: Chaveroche et al., 2000). 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 플라스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 플라스미드를 pSPM509로 명명하였다. 이러한 플라스미드는 orf14가 아프라마이신 카세트에 의해 개입중단된 pSPM504로부터 유도된 것이다(도 12 참조). 상기 카세트의 삽입은 orf14 유전자에서의 결실을 수반하는데, 개입중단은 orf14의 4번째 코돈에서 시작한다. orf14의 마지막 코돈은 카세트 다음에 존재한다.
벡터 pSPM509를 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 히그로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 클론(HygS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3Ωaac- 카세트에 의해 개입중단된 orf14 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf14의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3Ωaac- 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, orf14의 암호화 서열의 상류 및 하류에 대략 100개 염기쌍 정도로 연장된 서열에 상응하는 PCR 생성물을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf14::att3Ωaac-)을 보다 특별히 선별하고, 이를 SPM509로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf14::att3Ωaac-을 갖고 SPM509로 명명되었다. 유전자의 배향이 주어지면(도 3 참조), orf14의 불활성화 효과를 연구하기 위해 카세트를 절제할 필요가 없다. orf15corf14와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM509 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2913으로 기탁되었다.
실시예 14: orf6* 유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 작제
orf6* 유전자의 불활성화는 절제 가능한 카세트 기술을 사용하여 수행하였다(상기 및 도 10 참조). 이를 위해, 코스미드 pSPM7을 매트릭스로서 사용하고 다음 올리고뉴클레오티드를 사용하여, orf6* 유전자의 일정 단편을 증폭시켰다:
Figure 112005018477118-pct00045
이들 올리고뉴클레오티드의 3' 말단에 위치한 20개 데옥시뉴클레오티드는 orf6* 유전자(서열 번호 13)의 암호화 부분에 위치한 서열에 상응하고, 5' 위치에 가장 근접하게 위치한 6개 데옥시뉴클레오티드는 후속 클로닝을 촉진시켜 주는 PstI 부위의 서열에 상응한다. 증폭된 DNA 단편은 크기가 대략 1.11kb이다. 이러한 PCR 생성물을 벡터 pGEM-T Easy(Promega (Madison, Wisconsin, USA) 회사에 의해 시판됨) 내로 클로닝시켜, pBXL1111로 명명된 플라스믿를 수득할 수 있다(도 16 참조).
이어서, att1Ωhyg+ 절제 가능한 카세트를 orf6* 유전자의 암호화 서열 내로 도입하였다. 이를 위해, 플라스미드 pBXL1111을 SmaI 및 Asp718I 제한 효소로 분해시키고, 분해 생성물을 클레노우 효소로 처리하였다. 이러한 조작으로 인해, orf6* 유전자의 암호화 서열 내에 120bp의 내부 결실을 유발시킬 수 있다(도 15 참조). 또한, 상기 제한 부위 중의 어느 한쪽에 orf6* 서열의 511bp와 485bp가 각각 잔존하는데, 이는 orf6* 유전자의 불활성화를 위한 상동 재조합을 허용해줄 것이 다. att1Ωhyg+ 절제 가능한 카세트는 플라스미드 patt1Ωhyg+(상기 참조)를 EcoRV로 분해시킴으로써 이러한 플라스미드로부터 제조하였다. 이어서, 후자를, 앞서 기재된 바와 같이 하여(SmaI 및 Asp718I 분해에 이어, 클레노우 효소로 처리함) 미리 제조한 벡터 pBXL1111 내로 아클로닝시킨다. 수득된 플라스미드는 pBXL1112로 명명하였다(도 17 참조). 이러한 작제물에서는 orf6* 유전자가 120bp 결실을 포함하고 att1Ωhyg+ 카세트에 의해 개입중단된다.
이어서, 플라스미드 pBXL1112를 PstI 효소(PCR 올리고뉴클레오티드 내에 존재하기 때문에 카세트를 둘러싸고 있는 부위)로 분해시키고, att1Ωhyg+ 카세트에 의해 개입중단된 orf6*의 일정 부분을 포함하는 3.7kb PstI 삽입물을 플라스미드pOJ260(상기 참조)의 PstI 부위 내로 클로닝시켰다. 이로써 수득된 플라스미드는 pBXL1113로 명명되었다.
벡터 pBXL1113을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 히그로마이신 내성에 대해 선별하였다. 이어서, 히그로마이신-내성 클론을 각각, 히그로마이신(항생제 B) 함유 배지와 아프라마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 히그로마이신에 내성인 클론(HygR)과 아프라마이신에 민감한 클론(ApraS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att1Ωhyg+ 카세트에 의해 개입중단된 orf6* 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf6*의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 서던 블롯팅 기술에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, hyg 유전자(PCR에 의해 수득됨)에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, orf6* 유전자를 함유하는, 크기가 대략 1.1kb이고 플라스미드 pBXL1111(상기 및 도 16 참조)로부터 수득된 PstI-PstI 삽입물을 사용하여 제2 하이브리드화를 수행하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf6*::att1Ωhyg+)을 보다 특별히 선별하고, 이를 SPM501로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att1Ωhyg+ 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att1Ωhyg+ 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf6*::att1Ωhyg+을 갖고 SPM501로 명명되었다. 균주 SPM501 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2909로 기탁되었다.
상기 카세트를 절제하기 위해, 균주 SPM501을 원형질체 형질전환에 의해 벡터 pOSV508로 형질전환시켰다(도 14 참조). 플라스미드 pOSV508는 ptrc 프로모터( 참조: E. Amann et al., 1988)의 제어 하에 위치된, pSAM2의 xisint 유전자(참조: F. Boccard et al., 1989b)가 부가된 플라스미드 pWHM3(참조: J. Vara et al.,1989)(도 13 참조)으로부터 유도된 것이다. pSAM2의 xisint 유전자를 수반하는 플라스미드 pOSV508을 상기 균주 SPM501 내로 도입하면, 절제 가능한 카세트를 플랭킹하는 attL 부위와 attR 부위 간의 부위-특이적 재조합에 의해 이러한 절제 가능한 카세트를 효과적으로 절제시켜 줄 것이다(참조: A. Raynal et al., 1998)(도 10). pOSV508에 의해 수반된 tsr 유전자에 기인하여 이들의 티오스트렙톤 내성에 대해 선별된 형질전환체 중에서, 히그로마이신에 대해 민감해진 형질전환체(이에 대한 내성 유전자는 att1Ωhyg+ 카세트에 의해 수반된다)를 선택하는데; 이러한 절제로 인해, 사실상 상기 내성 유전자가 상실된다(도 10 참조). 플라스미드 pOSV508은 불안정하기 때문에, 항생제 무함유 배지 상에서 2회 연속해서 계대접종한 후, 분리된 클론을 티오스트렙톤 함유 배지 및 티오스트렙톤 무함유 배지 상에서 계대배양하였다. 티오스트렙톤-민감성 클론은 pOSV508을 상실하였다. PCR하고 PCR 생성물을 서열 분석함으로써, 상기 카세트의 절제로 인해 orf6* 유전자 내에서 동위상 결실이 실제로 일어났다는 사실을 확인하였다. 개입중단은 158번째 코돈에서 시작하고, 40개 코돈이 결실되며(120bp), 이러한 카세트의 절제는 33bp의 특징적인 "반흔성" att1 서열을 잔존시킨다:
5'ATCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3'(서열 번호 104).
이로써 수득된, 목적하는 유전자형(orf6*::att1)을 갖는 균주는 SPM502로 명명되었다.
균주 SPM502 샘플은 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2910으로 기탁되었다.
실시예 15: orf2, orf3, orf8, orf10, orf12, orf13c, orf14 또는 orf6* 유전자에서 녹아웃을 나타내는 스트렙토마이세스 암보파시엔스 균주의 분석
수득된 각종 균주의 스피라마이신 생산을 시험하기 위해, 미크로코쿠스 루테우스 균주의 민감성에 근거한 미생물학적 시험을 개발하였다(참조: A. Gourmelen et al., 1998). 사용된 미크로코쿠스 루테우스 균주는 스피라마이신에 대해서는 천연적으로 민감한 균주 DSM1790[이러한 균주는 특히, German Collection of Microorganisms and Cell Cultures(Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, DSMZ), (Braunschweig, Germany)로부터 번호 DSM 1790으로 입수 가능하다]로부터 유래된 균주이며; 본 시험에 사용된 균주는 이것이 콘고시딘(congocidine)에 대해서 내성이라는 점에서 균주 DSM 1790과 상이하다. 이러한 균주는 증가 량의 콘고시딘을 함유하는 배지 상에서 선별함으로써 수득된 자연 돌연변이체이다. 상기 균주는 스트렙토마이세스 암보파시엔스가 스피라마이신과 콘고시딘을 둘 다 생산한다는 사실에 기인하여 선별하였다. 미크로코쿠스 루테우스 균주의 민감성에 근거한 미생물학적 시험을 이용하여 수득된 각종 균주의 스피라마이신 생산을 검정하고자 하는 것이 목적이기 때문에, 콘고시딘-내성 균주를 갖는 것이 필요하다.
시험하고자 하는 각종 스트렙토마이세스 균주를, 70ml의 MP5 배지를 함유하는 500ml용 에를렌마이어 플라스크에서 배양한다(참조: Pernodet et al., 1993). 차폐된(baffled) 에를렌마이어를 각종 에스. 암보파시엔스 균주의 2.5 x 106개 포자/ml의 초기 농도로 접종하며, 250rpm으로 궤도 진탕시키면서 27℃ 하에 성장시킨다. 배양한지 48, 72 및 96시간 후에, 상청액 2ml 샘플을 취하고 이를 원심분리시킨다. 이어서, 각종 상청액을 -20℃에서 동결시킨다. 이들 상청액을 멸균용 배양 배지에서 10배 희석시킨 것을 본 시험에 사용한다(도 18 참조).
콘고시딘에 대해서는 내성이지만 스피라마이신에는 민감한 미크로코쿠스 루테우스 지시 균주를 37℃에서 48시간 동안 콘고시딘을 5㎍/ml로 함유하는 2TY 배지(참조: Sambrook et la., 1989)에서 배양하였다. 이러한 배양물의 광밀도(OD)를 측정하고, 이를 희석시켜 광밀도를 4로 조정한다. 상기 예비배양물 0.4ml를, 온도를 미리 약 45℃로 조정한 40ml의 DAM5 배지(Difco Antibiotic Medium 5, Difco 회사에 의해 시판됨)에서 희석시킨다. 이어서, 상기 배지를 12 x 12cm 사각형 디쉬에 따라 붓고, 주위 온도 하에 방치시켜 둔다.
상기 배지가 냉각되어 고형화되면, 직경이 12mm인 왓트만 AA 종이 디스크(참조: A. Gourmelen et al., 1998)를 각 상청액의 10배 희석물 70㎕에 침지시키고, 디쉬 표면 상에 놓아둔다. 각종 농도(MP5 배양 배지 중의 2-4-8㎍/ml)의 스피라마이신 용액에 침지시킨 디스크를 표준 범위로서 사용한다. 이러한 디쉬를 4℃에서 2시간 동안 정치시켜 상기 항생제가 한천 내로 확산되도록 한 다음, 37℃에서 24 내지 48시간 동안 항온 배양한다.
상기 디쉬가 스피라마이신을 함유하는 경우, 이는 한천 내로 확산되어, 미크로코쿠스 루테우스 지시 균주의 성장을 억제시킨다. 이와 같이 억제시키면, 디스크 주변에 "할로"가 창출되는데, 이러한 할로는 미크로코쿠스 루테우스 균주가 성장하지 않은 영역을 반영한 것이다. 따라서, 상기 할로가 존재하는 것은 스피라마이신의 존재를 지시해주며, 이로써 문제의 디스크에 상응하는 에스. 암보파시엔스 균주가 스피라마이신 생산자인지 아닌지를 결정할 수 있다. 표준 범위에 대해 수득된 억제 직경과 비교한 결과, 상기 균주에 의해 생산된 스피라마이신의 양에 관한 지표를 획득할 수 있다.
스피라마이신 생산을 탐지하기 위해, 앞서 실시예에 기재된 각종 균주를 본 시험에 사용하였다. 수득된 결과가 표 38에 함께 분류되었다:
Figure 112005018477118-pct00046
이들 결과는 스피라마이신 생합성에 관여하는 각종 유전자의 기능에 관한 특정 수의 결론을 이끌어낼 수 있게 해준다. 따라서, orf3 유전자는 스피라마이신 생합성에 필수적이다. 구체적으로 언급하면, 상기 유전자를 동위상 불활성화시키면, 더 이상 스피라마이신을 생산하지 않는 균주(OS49.67(실시예 6 참조))가 야기된다. 이러한 동위상 불활성화는, 도입된 카세트가 orf3의 하류에 위치한 유전자의 발현에 영향을 미칠 것이라는 가설을 일축할 수 있게 해준다.
유사하게, orf8orf10 유전자는 스피라마이신 생합성에 필수적인 단백질을 암호화하는데, 이는 균주 OS49.107과 OS49.50는 비-생산자 표현형을 지니기 때문이다. 또한, 이들 후자의 2개 균주에서는, 이러한 비-생산자 표현형에 대해 책임이 있는 상응하는 유전자의 불활성화가 명백한데, 이는 각종 orfs의 배양 측면에서(도 3 참조) 상기 도입된 작제물이 극성 효과를 지닐 수 없기 때문이다.
절제 가능한 카세트를 갖는 균주에 관한 연구는 개입중단된 유전자의 기능에 관한 특정 수의 결론을 이끌어낼 수 있게 해준다. 균주 SPM507은 유전자형: orf12::att3Ωaac-을 갖는다. 유전자의 배향 측면에서(도 3 참조), orf12의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf13corf12와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM507의 표현형은 비-생산자이므로; 이로부터, orf12 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다.
균주 SPM508은 유전자형: orf13c::att3Ωaac-을 갖는다. 유전자의 배향 측면에서(도 3 참조), orf13c의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf14orf13c와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM508의 표현형은 비-생산자이므로; 이로부터, orf13c 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자가 아니라고 결론지을 수 있다.
균주 SPM509는 유전자형: orf14::att3Ωaac-을 갖는다. 유전자의 배향 측면에서(도 3 참조), orf14의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf15corf14와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도 제거할 수 있는 가능성이 생긴다. 균주 SPM509의 표현형은 비-생산자이므로; 이로부터, orf14 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다.
균주 SPM21은 유전자형: orf2::att3Ωaac-을 갖는다. 이러한 균주는 스피라마이신 비-생산자 표현형을 갖는다. 그러나, 유전자 orf1 내지 orf8의 배향(도 3 참조)은 이들 유전자가 동시 전사된다는 사실을 암시한다. 관찰된 표현형은 도입된 카세트가 오페론의 하류에 위치한 유전자의 발현에 대해 극성 효과를 발휘하기 때문일 수 있다. 균주 SPM22는 유전자형 orf2::att3을 가지며, 이는 도입된 카세트의 동위상 절제 후에 수득하였다. 이러한 카세트를 절제하면, 특징적인 "반흔성" 서열(실시예 10 참조) 만이 잔존한다. 균주 SPM22는 비-생산자 표현형을 가지므로; 이로부터, orf2 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다. orf2의 불활성에 기인한 효과 만이 관찰된다.
균주 SPM501은 유전자형: orf6*::att1Ωhyg+을 갖는다. 이러한 균주는 스피라마이신 비-생산자 표현형을 갖는다. 그러나, orf5*orf6* 유전자는 동일한 배향을 갖기 때문에(도 3 참조), 관찰된 표현형은 orf6* 내로 도입된 카세트가 orf5*의 발현에 대해 극성 효과를 발휘하기 때문일 수 있다. 이들 유전자의 배열은 이들이 동시 전사될 수 있다는 것을 암시한다. 이러한 문제에 답하기 위해, 도입된 카세트를 동위상 절제한 후에 균주 SPM502를 수득하였다. 이러한 균주에서는 orf6*의 불활성화 효과 만이 관찰된다. 이 균주는 유전자형 orf6*::att1(실시예 14 참조)을 갖는다. 이러한 카세트를 절제하면, 동위상 "반흔" 서열(실시예 14 참조) 만이 잔존한다. 균주 SPM502는 생산자 표현형을 갖는다(그러나, 이 균주는 스피라마이신 I 만을 생산한다(실시예 16 참조)). 따라서, orf5* 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있는데, 이는 균주 SPM501에서의 이의 간접적인 불활성화로 인해 비-생산자 표현형이 유도되기 때문이다. 다른 한편으론, orf6* 유전자가 에스. 암보파시엔스에서 스피라마이신 I의 생합성에 필수적인 유전자가 아니다(한편으론, 스피라마이신 II 및 III의 생산에 필수적이다)(실시예 16 참조).
실시예 16: 수득된 돌연변이체 균주에서 스피라마이신 I, II 및 III의 생산 검정
시험하고자 하는 각종 균주를 각각, 70ml의 MP5 배지를 함유하는 500ml용 차폐된 에를렌마이어에서 배양한다(참조: Pernodet et al., 1993). 이러한 에를렌마이어를 각종 에스. 암보파시엔스 균주의 2.5 x 106개 포자/ml의 초기 농도로 접종하며, 72시간 동안 250rpm으로 궤도 진탕시키면서 27℃ 하에 성장시킨다. 동일한 클론에 상응하는 배양물을 모으고, 주름진 필터 내로 임의 여과시킨 다음, 7000rpm으로 15분 동안 원심분리시킨다. 이어서, 각종 상청액을 -30℃ 하에 저장하였다.
이온-쌍 형성 고 성능 액체 크로마토그래피(HPLC)함으로써 본 검정을 수행하였다. 배양 배지를 HPLC 분석하여, 3가지 형태의 스피라마이신 농도를 정확하게 결정할 수 있다. 사용된 칼럼(Macherey-Nagel)은 뉴클레오실(Nucleosil) 옥틸 그래프트된 실리카 상으로 채운다. 입자 크기는 5㎛이고 공극 크기는 100Å이다. 칼럼의 내부 직경은 4.6mm이고 길이는 25cm이다. 이동 상은 6.25g/L의 NaClO4 퍼클로레이트를 함유하는 H3PO4 완충액(pH 2.2)과 아세토니트릴의 70/30(v/v) 혼합물이다. 1ml/min으로 고정된 유속을 이용하여 등용매 시스템에서 본 분석을 수행하였다. 칼럼은 23℃에서 열제어한다. 238nm에서 UV 분광측광함으로써 탐지하였다. 샘플을 +10℃ 하에 냉장시키고, 피크 면적으로부터 정량화를 결정한다(외부 교정에 의함). 이들 조건 하에, 스피라마이신 I, II 및 III에 대한 잔류 시간은 각각 17, 21 및 30분인데, 이는 3가지 형태의 스피라마이신을 포함하는 시판용 샘플을 사용하여 확인할 수 있었다.
균주 OSC2는 스피라마이신 생산자 표현형을 갖는다. 이는 절제 가능한 카세트를 갖는 균주를 수득하기 위해 사용된 모 균주이다(실시예 15 참조). 따라서, 이 균주는 3가지 형태의 스피라마이신을 생산하기 위한 양성 대조군으로서 사용되었다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 3가지 형태의 스피라마이신을 생산하는 것은 명백하다(도 19 참조).
절제 가능한 카세트를 갖는 균주에 관한 연구는 개입중단된 유전자의 기능에 관한 특정 수의 결론을 이끌어낼 수 있게 해준다. 균주 SPM507은 유전자형: orf12::att3Ωaac-을 갖는다. 균주 SPM507의 표현형은 비-생산자이므로(실시예 15 참조); 이로부터, orf12 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 더 이상 스피라마이신을 생산하지 않는다(도 22 참조). 이러한 결과는 orf12 유전자가 스피라마이신 생합성에 필수적인 특성을 확인시켜 준다.
균주 SPM508은 유전자형: orf13c::att3Ωaac-을 갖는다. 균주 SPM508은 스피라마이신 생산자 표현형을 가지므로(실시예 15 참조); 이로부터, orf13c 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자가 아니라고 결론지을 수 있다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 스피라마이신 I, II 및 III을 생산한다(도 23 참조). 이러한 결과는 orf13c 유전자가 에스. 암보파시엔스에서 스피라마이신 I, II 및 III의 생합성에 필수적인 유전자가 아니라는 것을 확인시켜 준다.
균주 SPM509는 유전자형: orf14::att3Ωaac-을 갖는다. 균주 SPM509의 표현형은 비-생산자이므로; 이로부터, orf14 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 더 이상 스피라마이신을 생산하지 않는다(도 24 참조). 이러한 결과는 orf14 유전자가 스피라마이신 생합성에 필수적인 특성을 확인시켜 준다.
균주 SPM501은 유전자형: orf6*::att1Ωhyg+을 갖는다. 이러한 균주는 스피라마이신 비-생산자 표현형을 갖는다. 상기 균주는 HPLC에 의해 확인된 바와 같이, 더 이상 스피라마이신을 생산하지 않는다(도 20 참조). 그러나, orf5*orf6* 유전자는 동일한 배향을 갖기 때문에(도 3 참조), 관찰된 표현형은 orf6* 내로 도입된 카세트가 오페론에서 orf5*의 발현에 대해 극성 효과를 발휘하기 때문일 수 있다. 이는 이들 유전자가 동시 전사된는 것을 암시한다. 이러한 문제에 답하기 위해, 도입된 카세트를 절제한 후에 균주 SPM502를 수득하였는데, 이로써 orf6* 유전자의 동위상 결실이 생겼고 orf5*의 발현이 복원되었다. 이 균주는 유전자형 orf6*::att1(실시예 14 및 15 참조)을 갖는다. 이러한 카세트를 절제하면, 동위상 "반흔" att 서열(실시예 14 참조) 만이 잔존한다. 균주 SPM502는 스피라마이신 생산자 표현형을 갖는다. 그러나, HPLC에 의해 입증된 바와 같이, 상기 균주는 스피라마이신 I 만을 생산하고, 스피라마이신 II와 III은 생산하지 못한다(도 21 참조)). 따라서, 이들 결과로부터, orf5* 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라고 결론지을 수 있는데, 이는 균주 SPM501에서의 이의 간접적인 불활성화로 인해 스피라마이신 비-생산자 표현형이 유도되기 때문이다(도 20 참조). 다른 한편으론, orf6* 유전자가 에스. 암보파시엔스에서 스피라마이신 I의 생합성에 필수적인 유전자가 아닌데, 이는 이러한 유전자의 불활성화로 인해 스피로마이신 I 생산자 표현형이 유도되었기 때문이다(도 21 참조). 그러나, orf6*은 스피라마이신 II와 III의 생산에는 필수적이다(실시예 16 참조). 따라서, orf6* 유전자는 위치 3에서 플라테놀리드의 변형에 책임이 있는 아실트랜스퍼라제를 암호화하는 것이 명백하다(도 1 참조).
실시예 17: orf10 의 해독 개시점 결정 및 스피라마이신 생산 향상
17.1 플라스미드 pSPM523, pSPM524 및 pSPM525의 작제:
orf10 유전자를 스트렙토마이세스 암보파시엔스에서 동정하고, 이를 srmR으로 명명하였다(참조: M. Geistlich et al., 1992). orf10 유전자의 불활성화를 수행하였다(실시예 8 참조). 이로써, 생성된 균주가 더 이상 스피라마이신을 생산하지 않는다는 사실을 나타낼 수 있었다(실시예 15 참조). 이는 orf10 유전자가 스피라마이신 생합성에 명백히 관여한다는 것을 확인시켜 준다. 따라서, 이러한 유전자에 의해 암호화된 단백질이 스피라마이신 생합성에 필수적이란 것은 명백하다. 그러나, 서열 분석 결과, 동일한 판독 프레임에 위치한 2개의 ATG 코돈이 orf10의 해독을 위해 사용될 수 있는 것으로 나타났다(도 28 참조). 2개의 가능한 코돈 중의 하나(가장 상류 코돈)이 서열 번호 1에 제시된 서열의 10656번에서 시작하는 반면, 보다 하류에 위치한 기타 가능한 코돈은 10809번(서열 번호 1)에서 시작한다. 스피라마이신 생산에 대한 srmR 의 가능한 발현 효과를 시험하기 전에, 해독 개시점을 먼저 결정하는 것이 중요하다.
해독 개시 부위를 결정할 목적으로, 3가지 형태의 orf10을 포함하는 3가지 작제물을 생성하였다. 이들 형태는 HindIII 제한 부위 또는 BamHI 제한 부위를 포함하는 올리고뉴클레오티드를 사용하여 PCR함으로써 수득하였다.
증폭에 사용된 제1 쌍은 다음 올리고뉴클레오티드에 상응한다:
EDR39:
5'CCCAAGCTTGAGAAGGGAGCGGACATTCATGGCCCGCGCCGAACGC3'(서열 번호 122) (HindIII 부위가 진하게 표시되어 있다)
EDR42:
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'(서열 번호 123) (BamHI 부위가 진하게 표시되어 있다)
프라이머 쌍 EDR39-EDR42는 3' 위치에 가장 근접하게 위치한(서열 번호 1에 제시된 서열에서 10809번 위치) ATG를 포함하는 orf10의 단편을 증폭시켜 준다(도 28 참조). 수득된 단편은 크기가 대략 2kb이고, "짧은 orf10"로 후술될 것이며; 이는 orf10 프로모터를 함유하지 않는다. 이러한 2kb 단편을 벡터 pGEM-T easy 내로 클로닝하여 플라스미드 pSPM520을 수득하였다.
증폭에 사용된 제2 쌍은 다음 올리고뉴클레오티드에 상응한다:
EDR40:
5'CCCAAGCTTGAGAAGGGAGCGGACATTCAATGCTTTGGTAAAGCAC3'(서열 번호 124) (HindIII 부위가 진하게 표시되어 있다)
EDR42:
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'(서열 번호 123) (BamHI 부위가 진하게 표시되어 있다)
프라이머 쌍 EDR40-EDR42는 5' 위치에 가장 근접하게 위치한(서열 번호 1에 제시된 서열에서 10656번 위치) ATG를 포함하는 orf10의 단편을 증폭시켜 준다(도 28 참조). 이러한 2kb 단편("짧은 orf10"로 후술됨)을 벡터 pGEM-T easy 내로 클로닝하여 플라스미드 pSPM521을 수득하였는데; 상기 플라스미드는 orf10 프로모터를 함유하지 않는다.
증폭에 사용된 제3 쌍은 다음 올리고뉴클레오티드에 상응한다:
EDR41:
5'-CCCAAGCTTTCAAGGAACGACGGGGTGGTCAGTCAAGT-3'
(서열 번호 125) (HindIII 부위가 진하게 표시되어 있다)
EDR42:
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'
(서열 번호 123) (BamHI 부위가 진하게 표시되어 있다)
프라이머 쌍 EDR41-EDR42는 2개의 ATG와 자신의 프로모터를 포함하는 orf10 유전자를 증폭시켜 준다(도 28 참조). 이러한 2.8kb 단편("프로(pro) orf10"로 후술됨)을 벡터 pGEM-T easy 내로 클로닝하여 플라스미드 pSPM52를 수득하였다.
"프로 orf10" 단편은 매트릭스로서, 균주 OSC2의 염색체 DNA를 사용하여 수득하였다. "짧은 orf10" 및 "긴 orf10" 단편은 매트릭스로서, 앞서 정제된 "프로 orf10" 단편의 DNA를 사용하여 온전히 수득하였다.
이어서, 플라스미드 pSPM520, pSPM521 및 pSPM522의 HindIII-BamHI 삽입물을, HindIII-BamHI 효소로 예비분해시킨 벡터 pUWL201[프로모터(ermE* promoter)(참조: Bibb et al., 1994)의 세기를 증가시키는 돌연변이를 수반하는 ermE 프로모터(참조: Bibb et al., 1985, 특히 도 2) 영역의 KpnI-BamHI 단편을 도입한(참조: Doumith et al., 2000) 플라스미드 pUWL199(참조: U.F. Wehmeier, 1995)로부터 유도된 플라스미드] 내로 아클로닝시켰다. 이로써, 3가지 플라스미드를 수득하였다: pSPM523(삽입물로서 "짧은 orf10" 형태를 갖는 pUWL201로부터 유도됨), pSPM524(삽입물로서 "긴 orf10" 형태를 갖는 pUWL201로부터 유도됨) 및 pSPM525("프로 orf10" 형태를 갖는 pUWL201로부터 유도됨)(도 28).
17.2 균주 OS49.50을 작제물 pSPM523, pSPM524 및 pSPM525로 형질전환시킴:
균주 OS49.50(orf10 유전자에서 녹아웃을 나타내는 균주, 실시예 8 참조)를, 각각의 플라스미드 pSPM523, pSPM524 및 pSPM525로 원형질체 형질전환(참조: T. Kieser et al., 2000)시킴으로써 독립적으로 형질전환시켰다. 균주 OS49.50를, 삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 음성 대조군을 또한 제조하였다. 원형질체 형질전환 후, 이들 클론을 대상으로 하여, 이들의 티오스트렙톤 내성에 대해 선별하였다. 이들 클론을 각 플라스미드로 형질전환시키는 것은 이들 플라스미드를 추출함으로써 확인하였다. 이로써 4개의 신규한 균주가 수득되었다: 균주 OSC49.50 pUWL201(삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 유도됨); 균주 OSC49.50 pSPM523(플라스미드 pSPM523으로 형질전환시킴으로써 유도됨); 균주 OSC49.50 pSPM524(플라스미드 pSPM524로 형질전환시킴으로써 유도됨); 및 최종적으로 균주 OS49.50 pSPM525(플라스미드 pSPM525로 형질전환시킴으로써 유도됨).
이들 4가지 균주 각각의 스피라마이신 생산을 HPLC로써 시험하였다. 이를 위해, 시험하고자 하는 각종 스트렙토마이세스 균주를, 70ml의 MP5 배지를 함유하는, 차폐기가 장착된 500ml용 에를렌마이어(차폐된 에를렌마이어)에서 배양한다(참조: Pernodet et al., 1993). 상기 균주가 플라스미드 pUWL201 또는 이의 유도체 중의 하나를 함유하는 경우, 5㎍/ml의 티오스트렙톤을 가한다. 차폐된 에를렌마이어를 각종 에스. 암보파시엔스 균주의 2.5 x 106개 포자/ml의 초기 농도로 접종하며, 배양물을 96시간 동안 250rpm으로 궤도 진탕시키면서 27℃ 하에 항온 배양하였다. 이어서, 세포를 원심분리시킴으로써 상기 배지로부터 분리시키고, 상청액을 HPLC함으로써 분석하여(실시예 16 참조), 생산된 스피라마이신의 양을 결정하였다. 표준 샘플과 피크 면적 측정을 통하여, 이들 균주에 의해 생산된 스피라마이신 각각의 양을 결정할 수 있었다. 이러한 분석 결과가 표 39에 제시되어 있으며, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 총 생산량에 상응한다(스피라마이신 I, II 및 III 생산량을 부가함으로써 수득됨).
Figure 112005018477118-pct00047
표 39에 제시된 결과에 의해 밝혀진 바와 같이, 음성 대조군(플라스미드 pUWL201로 형질전환시킨 균주 OS49.50)은 스피라마이신을 생산하지 않는다. 플라스미드 pSPM523("짧은 orf10" 형태 함유)를 균주 OS49.50 내로 도입한 경우에는, 스피라마이신 생산이 전혀 관찰되지 않는다. 한편, 플라스미드 pSPM524("긴 orf10" 형태 함유)와 플라스미드 pSPM525("프로 orf10" 형태 함유)의 존재로 인해, 숙주 균주 OS49.50에서의 스피라마이신 생산이 복원된다. 이로써, 가장 상류의 ATG를 함유하는 orf10 단편 만이 스피라마이신 합성을 복원시킬 수 있다.
이러한 결과를 확인할 목적으로, 플라스미드 pSPM521("긴 orf10" 형태를 함유하는 플라스미드 pGEM-T easy)를 XhoI 제한 효소(이 효소는 2개의 ATG 사이에 위치한, 상기 플라스미드 내의 독특한 부위를 갖는다(도 28 참조))로 분해시킨다. 이어서, 클레노우 효소로 처리함으로써 XhoI 말단을 평활 말단화시킨다. 이어서, 상기 플라스미드를 T4 DNA 리가제 작용에 의해 스스로에 대해 폐쇄 보완하여 플라스미드 pSPM527을 제공한다. 가장 상류의 ATG(서열 번호 1에 제시된 서열에서 10656번 위치)가 실제로 해독 개시 부위로서 사용된 경우에는, 이러한 처리로 인해, XhoI 부위에서 판독 프레임의 이동이 유발되어 활성화 활성을 전혀 나타내지 않는 단백질을 생산하는 효과가 나타날 것이다. 한편, 해독 개시가 가장 하류의 ATG(서열 번호 1에 제시된 서열에서 10809번 위치)에서 일어나는 경우에는, 이러한 처리가 Orf10(전사 개시점의 위치가 제공된 경우)의 발현에 거의 또는 전혀 영향을 미치지 않아야 하고 생성되는 단백질에 대해 전혀 영향을 미치지 말아야 한다.
이어서, pSPM527의 BamHI-HindIII 삽입물을 벡터 pUWL201 내로 아클로닝시켜, 플라스미드 pSPM528을 수득하였다. 이러한 플라스미드를 균주 OS49.50 내로 도입하고, 목적하는 플라스미드를 갖는 클론을 보다 특별히 선별하였다. 이어서, 이로써 생성된 균주의 스피라마이신 생산을 HPLC에 의해 시험하였다(실시예 16 및 상기 참조). 플라스미드 pSPM524(표 39 참조)의 경우에 관찰된 것과는 다르게, 균주 OS49.50 내에 플라스미드 pSPM528이 존재하는 것이 스피라마이신 생산을 재정립하지는 못하였다. 이는 orf10 유전자의 해독 개시 부위가 가장 하류 위치에 위치한 ATG(ATG 1, 도 28 참조)라는 것을 확인시켜 준다.
17.3 에스. 암보파시엔스 균주 OSC2의 스피라마이신 생산 향상
스피라마이신 생산에 대한 orf10 유전자의 과발현 효과를 시험하기 위해, 플라스미드 pSPM523, pSPM524, pSPM525 및 pSPM528을 균주 OSC2 내로 도입하였다. 이를 위해, 균주 OSC2의 원형질체를, 각각의 플라스미드 pSPM523, pSPM524, pSPM525 및 pSPM528로 독립적으로 형질전환시켰다(참조: T. Kieser et al., 2000). 균주 OSC2를, 삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 음성 대조군을 또한 제조하였다. 원형질체 형질전환 후, 이들 클론을 대상으로 하여, 이들의 티오스트렙톤 내성에 대해 선별하였다. 이로써 5개의 신규한 균주가 수득되었다: 균주 OSC2 pUWL201(삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 유도됨); 균주 OSC2 pSPM523(플라스미드 pSPM523으로 형질전환시킴으로써 유도됨); 균주 OSC2 pSPM524(플라스미드 pSPM524로 형질전환시킴으로써 유도됨); 균주 OSC2 pSPM525(플라스미드 pSPM525로 형질전환시킴으로써 유도됨); 및 최종적으로, 균주 OSC2 pSPM528(플라스미드 pSPM525로 형질전환시킴으로써 유도됨). 이어서, 이들 균주의 스피라마이신 생산을 HPLC에 의해 분석하였다(실시예 17.2에서와 동일한 방식으로 수행함). 균주 OSC2의 스피라마이신 생산에 관해 분석은 비교를 위해 동시에 수행하였다. 이러한 분석 결과가 표 40에 제시되어 있으며, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 총 생산량에 상응한다(스피라마이신 I, II 및 III 생산량을 부가함으로써 수득됨).
Figure 112005018477118-pct00048
따라서, 플라스미드 pSPM524가 존재하거나 또는 플라스미드 pSPM525이 존재하는 것이 균주 OSC2의 스피라마이신 생산량을 상당히 증가시키는 것으로 관찰된다. 이는 Orf10의 과발현이 스피라마이신 생산에 긍정적인 효과를 나타낸다는 것을 명백히 입증해준다. 한편, 플라스미드 pSPM528은 스피라마이신 생산에 전혀 영향을 미치지 않는다.
동일한 방식으로, 플라스미드 pSPM525 및 pUWL201을 균주 SPM502 내로 도입하였다(실시예 14 참조). 이로써 2가지 신규한 균주를 수득하였다: 균주 SPM502 pUWL201(삽입물을 갖지 않는 플라스미드 pUWL201로 형질전환시킴으로써 유도됨); 및 균주 SPM502 pSPM525(플라스미드 pSPM525로 형질전환시킴으로써 유도됨).
균주 SPM502 pSPM525(이러한 균주는 플라스미드 pSPM525을 함유한다, 상기 참조) 샘플은 2003년 2월 26일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-2977로 기탁되었다.
균주 SPM502 pUWL201 및 SPM502 pSPM525의 스피라마이신 생산을 HPLC에 의해 분석하였다(실시예 17.2에서와 동일한 방식으로 수행함). 균주 SPM502의 스피라마이신 생산에 관해 분석은 비교를 위해 동시에 수행하였다. 이러한 분석 결과가 표 41에 제시되어 있으며, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 I 생산량에 상응한다. 사실상, 이들 균주는 스피라마이신 II와 III을 전혀 생산하지 않는다.
Figure 112005018477118-pct00049
따라서, 균주 SPM502에서의 orf10 유전자의 과발현이 스피라마이신 I의 생산을 상당히 증가시키는 것으로 관찰되었다.
실시예 18: 코스미드 pWED2에서 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA 라이브러리의 작제
18.1 코스미드 pWED2의 작제
스트렙토마이세스에서 유전자의 불활성화를 촉진시킬 목적으로, (적합한 이. 콜라이 균주로부터 스트렙토마이세스 내로 접합시킴으로써 이의 도입을 허용해 주는) 플라스미드 RK2의 oriT 서열을 수반하고 스트렙토마이세스에서 탐지 가능한 표현형을 부여해 주는 항생제에 대해 내성인 유전자를 또한 수반하는 코스미드를 작제하였다. 스트렙토마이세스 암보파시엔스의 게놈 DNA의 큰 삽입물을 함유하는 상기 코스미드를 유전자 불활성화 실험에 사용할 수 있다.
상기 벡터를 작제하기 위해, pac-oriT 카세트(EcoRV 단편)을, 독특한 HpaI 부위에서 코스미드 pWED15(참조: Wahl et al., 1987)로부터 유도된 코스미드 pWED1(참조: Gourmelen et al., 1998) 내로 도입하였다. pac-oriT 카세트는 PCR함으로써 수득하였다. 이를 위해, 제1 프라이머로서, 프라이머 A[이의 서열은 5'-CCAGTAGATATC CCGCCAACCCGGAGCTGCAC-3'(서열 번호 126)이고, EcoRV 제한 부위가 밑줄쳐져 있으며, 진하게 표시된 20개 뉴클레오티드 서열은 pac 유전자의 프로모터의 상류 영역에 상응한다]를 사용하고, 제2 프라이머로서, 프라이머 B[이의 서열은 5'-GAAAAGATCCGT CATGGGGTCGTGCGCTCCTT-3'(서열 번호 127)인데, 이는 이의 5' 말단에, oriT 서열 출발부에 상응하는 12개 뉴클레오티드 서열(이탤릭체로 표시되어 있음)을 포함하고 pac 유전자의 말단에 상응하는 20개 뉴클레오티드 서열(진하게 표시됨)을 포함한다]를 사용하여 플라스미드 pVF 10.4(참조: Vara et al., 1985; Lacalle et al., 1989)로부터 PCR함으로써, 상기 pac 유전자를 증폭시켰다(참조: 도 29, 1st PCR).
oriT 유전자에 관해서는, 제1 프라이머로서, 프라이머 C[이의 서열은 5'-CACGACCCCATG ACGGATCTTTTCCGCTGCAT-3'(서열 번호 128)인데, 이는 이의 5' 말단에, pac 유전자의 암호화 서열의 하류 서열에 상응하는 12개의 뉴클레오티드 서열(진하게 표시됨)과, oriT 서열 출발부에 상응하는 20개 뉴클레오티드 서열을 포함한다]를 사용하고, 제2 프라이머로서, 프라이머 D[이의 서열은 5'-GAGCCGGATATC ATCGGTCTTGCCTTGCTCGT-3'(서열 번호 129)인데, 이는 EcoRV 제한 부위(한줄로 밑줄쳐져 있음)와 oriT 서열의 말단에 상응하는 20개 뉴클레오티드 서열(이탤릭체로 표시되어 있음)을 포함한다]를 사용하여, 플라스미드 pPM803(참조: P. Mazodier et al., 1989)로부터 PCR함으로써 증폭시켰다(참조: 도 29, 2nd PCR).
프라이머 A와 B를 사용하여 수득된 증폭 생성물과, 프라이머 C와 D를 사용하여 수득된 증폭 생성물은 이들의 말단 중 하나에, 24개 뉴클레오티드 공통 서열을 갖는다. 앞서 수득된 2가지 증폭 생성물을 혼합하고, 프라이머로서 프라이머 A와 D를 사용함으로써 제3의 PCR을 수행하였다(참조: 도 29, 3rd PCR). 이로써, 조합물 pac+oriT에 상응하는 증폭 생성물을 수득할 수 있다. 이어서, 이러한 pac-oriT 단편을 벡터 pGEM-T Easy(Promega (Madison, Wisconsin, USA) 회사에 의해 시판됨) 내로 클로닝시켜, 플라스미드 pGEM-T-pac-oriT를 수득할 수 있다. 이어서, 이러한 플라스미드의 삽입물을 코스미드 pWED1 내로 아클로닝시켰다. 이를 위해, 플라스미드 pGEM-pac-oriTEcoRV 효소로 분해시키고, 조합물 pac+oriT을 함유하는 EcoRV 삽입물을, HpaI 효소로 미리 개방시킨 코스미드 pWED1 내로 삽입하였다. 이로써 수득된 코스미드를 pWED2로 명명하였다(도 30 참조).
상기 코스미드는 스트렙토마이세스에서 유전자의 불활성화를 촉진시킬 수 있다. 구체적으로 언급하면, 이는 적합한 이. 콜라이 균주로부터 스트렙토마이세스 내로 접합시킴으로써 이의 도입을 허용해 주는 oriT 서열을 수반할 뿐만 아니라, 스트렙토마이세스에서 탐지 가능한 표현형을 부여해 주는 항생제에 대해 내성인 유전자를 수반한다. 스트렙토마이세스 암보파시엔스의 게놈 DNA의 큰 삽입물을 함유하는 상기 코스미드를 유전자 불활성화 실험에 사용할 수 있다.
이로써, 표적 유전자를 함유하는 pWED2로부터 유도된 코스미드를, 플라스미드 pKOBEG(참조: Chaveroche et al. 2000)를 함유하는 이. 콜라이 균주 KS272 내로 도입할 수 있고, 특정 카세트를 문헌(참조: Chaveroche et al. 2000)에 기재된 기술에 따라서 표적 유전자 내로 도입할 것이다. 이어서, 이러한 기술에 의해 수득된 코스미드(표적 유전자를 불활성화시킨 코스미드)를 이. 콜라이 균주, 예를 들면, S17.1 균주, 또는 oriT 서열을 함유하는 플라스미드를 접합에 의해 스트렙토마이세스로 전이시켜 줄 수 있는 기타 모든 균주 내로 도입할 수 있다.
이. 콜라이와 스트렙토마이세스 간의 접합 후, 표적 유전자의 야생형 복사물을 개입중단된 복사물로 대체시킬 스트렙토마이세스의 클론을 실시예 2에 기재된 바와 같이 수득할 수 있다.
상기 신규한 코스미드 상에 존재하는, 스트렙토마이세스에서 발현된 내성 유전자는 스트렙토마이세스 알보니거(Streptomyces alboniger)(참조: J. Vara et al., 1985; Lacalle et al., 1989)의 pac 유전자인데, 이는 푸로마이신(puromycin) N-아세틸트랜스퍼라제를 암호화하고 푸로마이신 내성을 제공해준다. 유전자 불활성화 실험에서는, 이중 재조합 사건이 발생한 클론을 찾아낼 것이다. 이들 클론으로부터 플라스미드 pWED2를 제거할 것이므로, 이는 푸로마이신에 대해 다시 민감해질 것이다.
18.2 코스미드 pWED2에서 이. 콜라이에서 스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA 라이브러리의 작제
스트렙토마이세스 암보파시엔스 균주 OSC2의 게놈 DNA를 BamHI 제한 효소로 부분적으로 분해시켜, 크기가 대략 35 내지 45 kb인 DNA 단편을 수득한다. 이어서, 이들 단편을, BamHI으로 미리 분해시킨 코스미드 pWED2 내로 클로닝시킨 다음, 알칼리성 포스파타제로 처리하였다. 이어서, 이러한 연결 혼합물을 시험관내에서, 프로메가(Promega; Madison, Wisconsin, USA) 회사에 의해 시판되고 있는 "Packagene®람다 DNA 패키징 시스템"을 제조업자의 권고 사항에 따라서 사용하여 람다 파아지 입자 내에서 단백질 막으로 싼다. 수득된 파아지 입자를 사용하여, 공급원[Stratagene(LaJolla, California, USA)]에 의해 시판되고 있는 이. 콜라이 SURE® 균주를 감염시킨다. 코스미드 pWED2는 앰피실린 내성을 제공해주기 때문에, 상기 클론을 LB 배지 + 앰피실린(50㎍/ml) 상에서 선별하였다.
실시예 19: 스피라마이신에 대한 생합성 경로 영역을 포괄하는 신규한 라이브러리의 코스미드 분리. 이들 코스미드의 단편의 아클로닝 및 서열 분석
19.1 스트렙토마이세스 암보파시엔스 OSC2의 게놈 라이브러리의 콜로니 상에서의 하이브리드화
orf1* 내지 orf10*, 또는 orf1 내지 orf25c의 일부 또는 전부, 또는 orf25c의 보다 상류 영역을 포괄하는 스트렙토마이세스 암보파시엔스 OSC2(실시예 18 참조)의 신규한 라이브러리의 코스미드를 분리하였다. 이를 위해, 다음 3가지 프로브를 사용하여, 실시예 18에 따라서 수득된 이. 콜라이 콜로니 상에서 연속적인 하이브리드화를 수행하였다(도 31 참조):
- 사용된 제1 프로브는 매트릭스로서, pSPM5를 사용하고 다음 프라이머를 사용하여 PCR함으로써 증폭시킨 대략 0.8kb의 DNA 단편에 상응한다:
ORF23c: 5'-ACGTGCGCGGTGAGTTCGCCGTTGC-3'(서열 번호 130) 및
ORF25c: 5'-CTGAACGACGCCATCGCGGTGGTGC-3'(서열 번호 131).
이로써 수득된 PCR 생성물은 orf23c의 출발부, 이의 원형 상태의 orf24corf25c의 말단의 단편을 함유한다(참조: 도 31, 프로브 I).
- 사용된 제2 프로브는 매트릭스로서, 에스. 암보파시엔스 균주 ATCC23877의 총 DNA를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시킨 대략 0.7kb의 DNA 단편에 상응한다:
ORF1*c: 5'-GACCACCTCGAACCGTCCGGCGTCA-3'(서열 번호 132) 및
ORF2*c: 5'-GGCCCGGTCCAGCGTGCCGAAGC-3'(서열 번호 133).
이로써 수득된 PCR 생성물은 orf1*c의 말단과 orf2*c의 출발부의 단편을 함유한다(참조: 도 31, 프로브 II).
- 사용된 제3 프로브는 orf1, orf2orf3을 함유하고 플라스미드 pOS49.99를 분해시킴으로써 수득된, 대략 3kb의 EcoRI-BamHI 단편에 상응한다(참조: 도 31, 프로브 III).
실시예 18.2에서 수득된 라이브러리의 대략 2,000개 클론을 통상적인 기술에 따라서[참조: Sambrook et al., 1989] 콜로니 하이브리드화하기 위해 필터 상으로 옮겼다.
제1 프로브(참조: 도 31, 프로브 I)를 무작위 프라이밍 기술 (Roche에 의해 시판되고 있는 키트)을 이용하여 32P로 표지시키고, 이를 사용하여, 필터 상으로 옮긴 상기 라이브러리의 2,000개 클론 상에서 하이브리드화를 수행하였다. 하이브리드화는 문헌[참조: Church & Gilbert (Church & Gilbert, 1984)]에 기재된 완충액 중에서 65℃ 하에 수행한다. 65℃ 하에 2X SSC, 0.1% SDS에서 처음에는 10분 동안 수행한 다음, 두 번째는 20분 동안 2회 세척을 수행하고, 30분 동안 지속되는 제3 세척은 65℃ 하에 0.2X SSC, 0.1% SDS에서 수행하였다. 이러한 하이브리드화 및 세척 조건 하에서, 하이브리드화된 2,000개 중에서 20개 클론이 제1 프로브와 강력한 하이브리드화 시그널을 나타내었다. 이들 20개 클론을 LB 배지 + 앰피실린(50㎍/ml)에서 배양하고, 상응하는 20개 코스미드를 알칼리성 분해(참조: Sambrook et al., 1989)함으로써 추출한 다음, BamHI 제한 효소로 분해시켰다. 이어서, 이러한 분해 생성물을 아가로스 겔 상에서 분리시키고, 나일론 막 상으로 옮긴 다음, 상기와 동일한 조건 하에 제1 프로브(상기 참조: PCR 생성물 ORF23c-ORF25c, 프로브 I)와 하이브리드화하였다. 12개 코스미드가, 사용된 프로브와 강력하게 하이브리드화된 BamHI 단편을 함유하였다. 이들 12개 코스미드는 pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44 및 pSPM45로 명명되었다. BamHI로 분해시킨 후의 이들 12개 코스미드의 프로필을 서로 비교하고 또한 코스미드 pSPM5의 프로필과 비교하였다. 또한, orf1-orf25c 영역에서 이미 동정된 각종 유전자에 상응하는 각종 프라이머를 사용하여 PCR 증폭 실험함으로써, 이들 코스미드 몇몇의 삽입물을 서로에 대해 위치 설정할 수 있었으며 또한, 이미 공지된 orf1-orf25c 영역에서의 이들 삽입물의 위치를 결정할 수 있었다(도 32 참조). 코스미드 pSPM36을 보다 특별히 선택하였는데, 이는 이것이 orf25c의 상류에 큰 영역을 함유하기 쉽기 때문이다(도 31 및 32 참조).
이어서, 상기 언급된 바와 동일한 조건을 이용하여, 스트렙토마이세스 암보파시엔스 OSC2의 라이브러리의 2000개 클론을 PCR 생성물: ORF1*c-ORF2*c(참조: 도 31, 프로브 II)에 상응하는 제2 프로브와 하이브리드화하였다. 이러한 하이브리드화로 인해, 이의 삽입물이 orf1*c에서 부터 orf10*c까지의 영역에 위치한 코스미드를 분리하는 것이 가능해졌다. 사용된 하이브리드화 조건 하에서, 하이브리드화된 2,000개 중에서 16개 클론이 상기 제2 프로브와 강력한 하이브리드화 시그널을 나타내었다. 이들 16개 클론을 LB 배지 + 앰피실린(50㎍/ml)에서 배양하고, 상응하는 16개 코스미드를 알칼리성 분해(참조: Sambrook et al., 1989)함으로써 추출한 다음, BamHI 제한 효소로 분해시켰다. BamHI로 분해시킨 후 이들 16개 코스미드의 분해 프로필을 서로 비교하고 또한 코스미드 pSPM7의 분해 프로필과 비교하였다. 프라이머 ORF1*c 및 ORF2*c을 사용한 PCR 증폭 실험으로, orf1*corf2*c 유전자를 명백히 함유하고 있고 이의 프로필이 공통의 밴드 뿐만 아니라 상이한 밴드를 갖고 있는 2개의 코스미드를 선백하는 것이 가능해졌다. 또한, orf1*c 내지 orf10*c 영역에서 이미 동정된 각종 유전자에 상응하는 각종 프라이머를 사용하여 기타 PCR 증폭 실험함으로써, 이들 코스미드의 삽입물을 서로에 대해 위치 설정할 수 있었으며 또한, 이미 공지된 orf1*c 내지 orf10*c 영역에서의 이들 삽입물의 위치를 결정할 수 있었다(도 32 참조). 2개의 코스미드를 보다 특별히 선별하고 이를 pSPM47 및 pSPM48로 명명하였다(도 32 참조).
상기 언급된 바와 동일한 조건을 이용하여, 스트렙토마이세스 암보파시엔스 OSC2의 라이브러리의 2000개 클론을 플라스미드 pOS49.99의 EcoRI-BamHI 단편(참조: 도 31, 프로브 III)에 상응하는 제3 프로브와 또한 하이브리드화하였다. 이러한 하이브리드화로 인해, orf1에서 부터 orf3까지의 영역을 함유하고, PKS 유전자의 큰 부분을 함유하거나 또는 스피라마이신에 대한 생합성 경로의 유전자 orf1 내지 orf25c의 큰 부분을 함유하기 쉬운 코스미드를 분리하는 것이 가능해졌다. 이들 하이브리드화 조건 하에서, 하이브리드화된 2,000개 중에서 35개 클론이 상기 제3 프로브와 강력한 하이브리드화 시그널을 나타내었다. 이들 35개 클론을 LB 배지 + 앰피실린(50㎍/ml)에서 배양하고, 상응하는 35개 코스미드를 알칼리성 분해(참조: Sambrook et al., 1989)함으로써 추출한 다음, BamHI 제한 효소로 분해시켰다. BamHI로 분해시킨 후 이들 35개 코스미드의 프로필을 서로 비교하고 또한 코스미드 pSPM5의 프로필과 비교하였다. 또한, orf1 내지 orf25c 영역에서 이미 동정된 각종 유전자에 상응하는 각종 프라이머를 사용하여 PCR 증폭 실험함으로써, 이들 코스미드가 orf1 내지 orf25c 영역으로부터 유래하는 삽입물을 명백히 함유하고 있다는 것을 확인할 수 있었고, 이들 코스미드의 삽입물을 서로에 대해 위치 설정할 수 있었으며 또한, 이미 공지된 orf1 내지 orf25c 영역에 대해 위치 설정할 수 있었다(도 32 참조). 5개 코스미드를 보다 특별히 선별하고 이들을 pSPM50, pSPM51, pSPM53, pSPM55 및 pSPM56로 명명하였다(도 32 참조).
19.2 코스미드 pSPM36의 삽입물 일부의 아클로닝 및 서열 분석
프라이머 ORF23c 및 ORF25c를 사용하여 PCR함으로써 수득된 대략 0.8kb의 프로브(참조: 상기 및 도 31, 프로브 I)를, PstI 효소로 분해시킨 에스. 암보파시엔스 OSC2의 총 DNA 상에서 서던 블롯팅 실험하는데 또한 사용하였다. 상기 언급된 하이브리드화 조건 하에서, 상기 프로브는 PstI 효소로 분해시킨 에스. 암보파시엔스 OSC2의 총 DNA 상에서 하이브리드화된 경우에 대략 6kb의 단일 PstI 단편을 나타낸다. PstI 부위는 orf23c 영역 내에 존재하지만(참조: 서열 번호 80), 공지된 서열(서열 번호 1 참조)의 말단(BamHI 부위) 까지 존재하는 PstI 부위는 전혀 없다. 이러한 PstI-BamHI 단편은 크기가 대략 1.4kb이다. 따라서, PstI 효소로 분해시킨 에스. 암보파시엔스의 총 DNA 상에서 하이브리드화된 6kb PstI 단편은 orf25c의 상류에 위치한 대략 4.6kb의 영역을 함유한다. 이러한 영역은 기타 유전자(이의 생성물은 스피라마이신 I에 대한 생합성 과정에 관여한다)를 함유하기 쉽다. 분해시킴으로써, 코스미드 pSPM36이 이러한 6kb PstI 단편을 실제로 함유하고 있다는 것을 확인하였다. orf25c의 추가 상류 서열을 결정할 목적으로, 상기 단편을 pSPM36으로부터 분리하였다. 이를 위해, 코스미드 pSPM36을 PstI 제한 효소로 분해시켰다. 크기가 대략 6kb인 PstI-PstI 단편을 0.8% 아가로스 겔로부터 전기용출시킴으로써 분리한 다음, 이를 벡터 pBK-CMV(4512bp)(Stratagene (La Jolla, California, USA)에 의해 시판됨) 내로 클로닝하였다. 이로써 수득된 플라스미드를 pSPM58로 명명하고(도 33 참조), 이의 삽입물 서열을 결정하였다. 이러한 삽입물 서열이 서열 번호 134에 제시되어 있다. 그러나, 모든 서열이 결정된 것은 아니며, 대략 450개 뉴클레오티드 갭이 존재하며, 결정되지 않은 서열의 일부는 상응하는 서열 내에 일련의 "N"로써 표시된다.
19.3 신규한 뉴클레오티드 서열의 분석, 개방 판독 프레임의 결정, 및 스피라마이신 생합성에 관여하는 유전자의 성상 확인
수득된 코스미드 pSPM58의 삽입물 서열은 프레임플롯 프로그램[참조: J. Ishikawa & K. Hotta, 1999]을 사용하여 분석하였다. 이로써, 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정하는 것이 가능하였다. 이러한 분석 결과, 상기 삽입물이 orf25c의 상류에 4개의 신규한 ORF를 포함하고 있다는 것을 결정할 수 있었다(도 34 참조). 이들 유전자는 orf26(서열 번호 107), orf27(서열 번호 109), orf28c(서열 번호 111, 이러한 orf의 서열은 완전히 결정되지 않았는데, 이는 pSPM58의 삽입물 서열 분석시 대략 450개의 뉴클레오티드 갭이 존재하기 때문이며, 이들 450개 뉴클레오티드는 서열 번호 111에서 일련의 "N" 형태로 나타내었다) 및 orf29(후자 orf의 서열은 본 삽입물에서 불완전하다)로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(도 34 참조).
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치(이들 2가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990](이러한 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
19.4 코스미드 pSPM36의 삽입물의 또 다른 일부의 아클로닝 및 서열 분석
프라이머 ORF23c 및 ORF25c를 사용하여 PCR함으로써 수득된 대략 0.8kb의 프로브(참조: 상기 및 도 31, 프로브 I)를, StuI 효소로 분해시킨 균주 OSC2의 총 DNA 상에서 서던 블롯팅 실험하는데 또한 사용하였다. 이러한 프로브에 대해 상기 언급된 하이브리드화 조건 하에서, 상기 프로브는 StuI 효소로 분해시킨 균주 OSC2의 총 DNA 상에서 하이브리드화된 경우에 대략 10kb의 단일 StuI 단편을 나타낸다. orf23cStuI 부위가 존재하고(서열 번호 80 참조), 이러한 부위가 PstI 부위에 대해 상대적으로 위치하는 경우에는, 상기 10kb 단편이 앞서 연구된 PstI 단편(pSPM58의 삽입물) 모두를 포함하고, 아직까지 연구되지 않은 대략 4kb 영역을 획득할 수 있게 해준다(도 33 참조). 분해시킴으로써, 코스미드 pSPM36이 이러한 10kb StuI 단편을 실제로 함유하고 있다는 것을 확인하였다. orf29의 말단 서열과 orf29의 추가 상류의 기타 유전자 서열을 결정할 목적으로, 상기 단편을 pSPM36으로부터 분리하였다. 이를 위해, 코스미드 pSPM36을 StuI 제한 효소로 분해시켰다. 크기가 대략 10kb인 StuI-StuI 단편을 0.8% 아가로스 겔로부터 전기용출시킴으로써 분리한 다음, 이를 벡터 pBK-CMV(4512bp)(Stratagene (La Jolla, California, USA)에 의해 시판됨) 내로 클로닝하였다. 이로써 수득된 플라스미드를 pSPM72로 명명하였다(도 33 참조). 후자를 EcoRI(pSPM58의 삽입물 내의 EcoRI 부위) 및 HindIII(상기 삽입물 말단의 StuI 부위 바로 다음에 위치한, 상기 벡터의 다중 클로닝 부위 중의 HindIII 부위)로 분해시켰다(도 33 참조). 이로써 수득된 EcoRI-HindIII DNA 단편은 플라스미드 pSPM72의 삽입물의 단편에 상응하고(도 33 참조), 이를 EcoRI 및 HindIII로 미리 분해시킨 벡터 pBC-SK+(Stratagene (La Jolla, California, USA)에 의해 시판됨) 내로 아클로닝시켰다. 이로써 수득된 플라스미드를 pSPM73으로 명명하였으며, 이의 삽입물 서열을 결정하였다. 이러한 삽입물 서열이 서열 번호 135에 제시되어 있다.
pSPM58 및 pSPM73의 삽입물 서열의 어셈블리가 서열 번호 106에 제시되어 있다. 이러한 서열은 orf23c(서열 번호 80 참조) 내의 PstI 부위로부터 출발하여 orf32c(도 34 참조) 내의 StuI 부위까지 지속된다. orf28c(서열 번호 111)의 서열은 완성되지 않았기 때문에(실시예 19.3 참조), 대략 450개 뉴클레오티드 영역이 서열 분석되지 않았고, 이들 450개 뉴클레오티드는 서열 번호 106의 서열 내에 일련의 "N" 형태로 표시된다.
19.5 신규한 뉴클레오티드 서열 분석, 개방 판독 프레임의 결정, 및 스피라마이신 생합성에 관여하는 유전자의 성상 확인
수득된 코스미드 pSPM73의 삽입물의 부분 서열은 프레임플롯 프로그램[참조: J. Ishikawa & K. Hotta, 1999]을 사용하여 분석하였다. 이로써, 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정하는 것이 가능하였다. 이러한 분석 결과, 상기 삽입물이 4개 ORF, 즉 1개는 불완전하고 3개는 완전한 ORF를 포함하고 있다는 것을 결정할 수 있었다(도 34 참조). 불완전한 ORF는 orf29의 암호화 서열의 3' 위치에 상응한데, 이로써 플라스미드 pSPM58의 삽입물을 서열 분석하는 동안 수득된 상기 동일한 orf의 부분 서열을 통하여 상기 유전자의 서열을 완성시킬 수 있었다(실시예 19.2 및 19.3 참조). 이와 같이 2개 서열을 조합함으로써, orf29의 완전한 서열을 수득할 수 있었다. 이로써 수득된 4개 유전자는 orf29(서열 번호 113), orf30c(서열 번호 115), orf31(서열 번호 118) 및 orf32c(서열 번호 120)로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(도 34 참조).
이들 개방 판독 프레임으로부터 추론된 단백질 서열(orf29에 대해서는 서열 번호 114, orf30c에 대해서는 서열 번호 116 및 117, orf31에 대해서는 서열 번호 119 및 orf32c에 대해서는 서열 번호 121)을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치(이들 2가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990](이러한 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
19.6 코스미드 pSPM36의 삽입물의 제3 부분의 아클로닝 및 서열 분석
orf32c에 대한 내부 서열에 상응하는 프로브(0.8kb DNA 단편)를, 매트릭스로서 스트렙토마이세스 암보파시엔스 균주의 총 DNA를 사용하고 다음 프라이머를 사용하여 PCR함으로써 수득하였다:
KF36: 5'- TTGCCGTAGCCGAGGACCAGCG-3' (서열 번호 151) 및
KF37: 5'- CACATGGCCCTGGAGGACCCTG-3' (서열 번호 152).
이로써 수득된 PCR 생성물은 orf32c의 내부 서열을 나타낸다. 이러한 프로브는 PstI 효소로 분해시킨, 균주 OSC2의 염색체 DNA와 코스미드 pSPM36의 DNA 상에서 서던 블롯팅 실험하는데 사용하였다. 상기 언급된 바와 동일한 하이브리드화 조건 하에서(실시예 19.1 참조), 이러한 프로브는 PstI 효소로 분해시킨, 균주 OSC2의 총 DNA와 코스미드 pSPM36의 DNA 상에서 하이브리드화되는 경우에 대략 3.4kb 및 2.5kb의 2개의 PstI 단편을 나타낸다. 사용된 프로브 내에 PstI 부위가 존재한다면, 이러한 결과를 설명할 수 있다. 크기가 대략 3.4kb인 제1 DNA 단편은 이의 서열이 이미 전적으로 공지되어 있는 단편이다. 2.5kb 단편의 서열은 700bp 영역에 걸쳐 단지 부분적으로만 공지되어 있다. orf32c의 말단 서열과 이의 상류의 기타 유전자 서열을 결정할 목적으로, 상기 단편을 pSPM36으로부터 분리하였다. 이를 위해, 코스미드 pSPM36을 PstI 제한 효소로 분해시켰다. 크기가 대략 2.5kb인 PstI-PstI 단편을 0.8% 아가로스 겔로부터 정제시킴으로써 분리한 다음, 이를 벡터 pBK-CMV(4518bp)(Stratagene (La Jolla, California, USA)에 의해 시판됨) 내로 클로닝하였다. 이로써 수득된 플라스미드를 pSPM79로 명명하고(도 41 참조), 이의 삽입물 서열을 결정하였다.
orf28c의 서열(서열 번호 111)은 완성되지 않았다(실시예 19.3 참조). 구체적으로 언급하면, 대략 450개 뉴클레오티드 영역을 결정하는 것이 가능하지 않았기 때문에, 이들 450개 뉴클레오티드는 서열 번호 106의 서열 내에 일련의 "N" 형태로 표시된다. 생략된 영역 전체 서열은 이 영역을 재서열 분석함으로써 결정하였다. 따라서, pSPM58 및 pSPM73의 삽입물 서열을 완전히 결정하였다. orf28c의 암호화 부분의 완전한 서열이 서열 번호 141에 제시되어 있고, 이러한 서열로부터 추론되는 단백질이 서열 번호 142에 제시되어 있다. 플라스미드 pSPM79의 삽입물 서열이 서열 번호 161에 제시되어 있다.
pSPM58, pSPM73 및 pSPM79의 삽입물 서열의 어셈블리가 서열 번호 140에 제시되어 있다(도 41 참조). 이러한 서열은 orf23c(서열 번호 80 참조)에서 PstI 부위로부터 출발하여 orf34c(도 41 참조)에서 PstI 부위까지 지속된다.
19.7 신규한 뉴클레오티드 서열 분석, 개방 판독 프레임의 결정, 및 스피라마이신 생합성에 관여하는 유전자의 성상 확인
수득된 코스미드 pSPM79의 삽입물 서열은 프레임플롯 프로그램[참조: Ishikawa J & Hotta K. 1999]을 사용하여 분석하였다. 이로써, 개방 판독 프레임 중에서, 스트렙토마이세스 특유의 코돈 활용을 나타내는 개방 판독 프레임을 동정하는 것이 가능하였다. 이러한 분석 결과, 상기 삽입물이 3개의 ORF, 즉 2개는 불완전한 ORF(orf32corf34c)이고 1개는 완전한 ORF(orf33)를 포함하고 있다는 것을 결정할 수 있었다(도 41 참조).
불완전한 제1 ORF는 orf32c의 암호화 서열의 5' 위치에 상응한다. 이로써 플라스미드 pSPM73의 삽입물을 서열 분석하는 동안 수득된 상기 동일한 orf의 부분 서열을 통하여 상기 유전자의 서열을 완성시킬 수 있었다(실시예 19.2 및 19.3 참조). 이와 같이 2개 서열을 조합함으로써, orf32c(서열 번호 145)의 완전한 서열을 수득할 수 있었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(도 41 참조). 완전한 orf는 orf33(서열 번호 147)로 명명되었다. 제3의 ORF는 orf34c(서열 번호 149)로 명명되었다. 유전자 명칭에 부가된 "c"는 문제의 ORF에 대해, 암호화 서열이 역배향으로 존재한다는 것을 의미한다(도 37 참조). 이러한 orf 생성물과 데이터뱅크 간에 수행된 비교 결과는, 상기 단백질의 C-말단부가 뉴클레오티드 서열로부터 추론된 생성물 내에 존재하지 않으므로, 이러한 orf가 서열 분석된 영역 보다 더 길고 이러한 영역을 벗어나서 지속된다는 사실을 제안하고 있다.
이들 개방 판독 프레임으로부터 추론된 단백질 서열을 다음과 같은 각종 프로그램을 사용하여 각종 데이터베이스에 존재하는 것과 비교하였다: BLAST[참조: Altschul et al., 1990; Altschul et al., 1997), CD-서치(이들 2가지 프로그램은 National Center for Biotechnology Information (NCBI)(Bethesda, Maryland, USA)로부터 특히 입수 가능하다), FASTA [참조: W.R. Pearson & D.J. Lipman, 1988; and W.R. Pearson, 1990](이러한 프로그램은 INFOBIOGEN resource center, Evry, France로부터 특히 입수 가능하다). 이들 비교를 통해, 이들 유전자 생성물의 기능에 관한 가설을 공식화하고, 스피라마이신 생합성에 관여하기 쉬운 것을 동정할 수 있게 되었다.
실시예 20: 스피라마이신 생합성 중간체 생성에 관한 분석
20.1 샘플 제조:
시험하고자 하는 각종 균주를 각각, 70ml의 MP5 배지를 함유하는 7개의 500ml용 차폐된 에를렌마이어에서 배양한다(참조: Pernodet et al., 1993). 이러한 에를렌마이어를 각종 에스. 암보파시엔스 균주의 2.5 x 106개 포자/ml의 농도로 접종하며, 96시간 동안 250rpm으로 궤도 진탕시키면서 27℃ 하에 성장시킨다. 동일한 클론에 상응하는 배양물을 모으고, 주름진 필터 내로 임의 여과시킨 다음, 7000rpm으로 15분 동안 원심분리시킨다.
이어서, 수산화나트륨을 이용하여 과실즙의 pH를 9로 조정하고, 메틸 이소부티릴 케톤(MIBK)을 사용하여 상청액을 추출한다. 이어서, 유기 상(MIBK)을 회수하고 증발시킨다. 이어서, 건조 추출물을 1ml의 아세토니트릴에 흡수시킨 다음, 1/10로 희석(물을 이용하여 100㎕ 대 1ml)시킨 후에, 이를 액체 크로마토그래피/질량 분광법(LC/MS) 분석에 사용하였다.
20.2 LC/MS에 의한 샘플 분석:
시험하고자 하는 균주에 의해 합성된 각종 생성물의 질량을 측정할 목적으로, 상기 샘플을 LC/MS함으로써 분석하였다.
사용된 고 성능 액체 크로마토그래피 칼럼은 크로마실(Kromasil) C8 150* 4.6mmm, 5mmm, 100Å 칼럼이다.
이동 상은 아세토니트릴과 수성 0.05% 트리플루오로아세트산 용액의 혼합물로 이루어진 구배이고, 유속은 1ml/min으로 설정된다. 칼럼 오븐의 온도는 30℃로 유지시킨다.
칼럼 배출구에서의 UV 탐지는 2가지 상이한 파장, 즉 238nm 및 280nm에서 수행하였다.
크로마토그래피 칼럼과 커플링된 질량 분광계는 30 및 70V 하의 원추 전압을 갖는, 단일 사극(Quadripole) 장치[Agilent에 의해 시판됨]이다.
20.3 균주 OS49.67에 의해 생산된 생합성 중간체의 분석
orf3 유전자를 동위상 결실시킴으로써 불활성화시킨 균주 OS49.67은 스피라마이신을 생산하지 않는다(실시예 6 및 15 참조).
샘플을 상기 언급된 방법(단락 20.1 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 참조) LC/MS에 의해 분석하였다. 보다 특히, 크로마토그래피에 의한 분석은 이동 상으로서 20%의 아세토니트릴을 T=O에서 부터 T=5분까지 사용한 다음, T=35분에서 30%로 선형 증가시킨 후, T=50분까지 안정 수준에 달하는 용매 구배로 수행하였다.
이들 조건 하에서, 2가지 생성물이 보다 특별히 관찰되었다: 238nm에서 흡수되는 생성물(잔류 시간 33.4분) 및 280nm에서 흡수되는 생성물(잔류 시간 44.8분)(도 35 참조). 도 35에는 238nm 및 280nm 하에 생성된 HPLC 크로마토그램(상류)과, 33.4분 및 44.8분에 용출된 분자의 UV 스펙트럼(하류)의 중첩이 도시되어 있다.
커플된 질량 분광 분석 조건은 다음과 같다: 스캐닝은 100 내지 1000 Da 범위의 질량을 포괄하는 스캔 모드로 수행한다. 전기증배기 획득량은 1V이다. 전기분무 공급원에 관해서 언급하면, 분무화 기체 압력은 35psig이고, 건조화 기체의 유속은 12.0 ℓ/min이며, 건조화 기체의 온도는 350℃이고 모세관 전압은 +/- 3000V이다. 이들 실험으로, 분리된 두 생성물의 질량을 측정할 수 있었다. 이들 질량은 각각, 먼저 용출된 생성물([M-H2O]+=353 주 생성물)에 대해서는 370g/mol이고 제2 생성물([M-H2O]+=351 주 생성물)에 대해서는 368g/mol이다.
구조를 획득하기 위해, 상기 언급된 생성물을 다음 조건 하에 분리 및 정제하였다: 이동 상은 수성 0.5% 트리플루오로아세트산 용액과 아세토니트릴의 70/30(v/v) 혼합물이다. 크로마토그래피는 고정된 유속 1ml/min을 이용하는 등용매 시스템으로 수행한다. 이들 조건 하에, 상기 2가지 생성물의 잔류 시간은 각각 8분 및 13.3분이다. 또한, 이러한 경우, 제조된 샘플(단락 20.1 참조)은 10㎕을 주입하기 전에는 물에서 희석시키지 않는다.
상기 2가지 생성물을 크로마토그래피 칼럼 배출구에서 회수하고 다음 조건 하에 분리하였다: Oasis HLB 1cc 30mg 카트릿지(Waters)를 1ml의 아세토니트릴에 이어, 1ml의 물/아세토니트릴(20v/80v) 및 1ml의 80/20 물/아세토니트릴로 순차적으로 조건화시킨다. 이어서, 상기 샘플을 도입하고, 카트릿지를 1ml의 물/아세토니트릴(95/5) 및 1ml의 물/중수소화 아세토니트릴(95/5)로 연속해서 세척한 다음, 600㎕의 40/60 물/중수소화 아세토니트릴로 용출시킨다. 이어서, 회수한 용액을 NMR에 의해 직접 분석한다.
이들 두 화합물에 대해 수득된 NMR 스펙트럼은 다음과 같다:
- 용출된 제1 생성물: 플라테놀리드 A: (스펙트럼 9646V)
CD3CN 중의 1H 스펙트럼(화학적 이동, ppm): 0.90 (3H, t, J=6Hz), 0.93 (3H, d, J=5Hz), 1.27 (3H, d, J=5Hz), 1.27 내지 1.40 (3H, m), 1.51 (1H, m), 1.95 (1H, m), 2.12 (1H, m), 2.30 (1H, d, J=12Hz), 2.50 (1H, d, J=11Hz), 2.58 (1H, dd, J=9 및 12 Hz), 2.96 (1H, d, J=7Hz), 3.43 (3H, s), 3.70 (1H, d, J=9Hz), 3.86 (1H, d, J=7Hz), 4.10 (1H, m), 5.08 (1H, m), 5.58 (1H, dt, J=3 및 12Hz), 5.70 (1H, dd, J=8 및 12 Hz), 6.05 (1H, dd, J=9 및 12 Hz), 6.24 (1H, dd, J=9 및 12Hz).
- 용출된 제2 생성물: 플라테놀리드 B: (스펙트럼 9647V)
CD3CN 중의 1H 스펙트럼(화학적 이동, ppm): 0.81 (3H, t, J=6Hz), 0.89 (1H, m), 1.17 (3H, d, J=5Hz), 1.30 (4H, m), 1.47 (2H, m), 1.61 (1H, t, J=10Hz), 2.20 (1H, m), 2.38 (1H, d, J=13Hz), 2.52 (1H, m), 2.58 (1H, m), 2.68 (1H, dd, J=8 및 13Hz), 3.10 (1H, d, J=7Hz), 3.50 (3H, s), 3.61 (1H, d, J=8Hz), 3.82 (1H, d, J=7Hz), 5.09 (1H, m), 6,20 (1H, m), 6.25 (1H, dd, J=9 및 12 Hz), 6.58 (1H, d, J=12 Hz), 7.19 (1H, dd, J=9 및 12Hz).
이들 실험으로써, 이들 2가지 화합물의 구조를 결정할 수 있었다. 용출된 제1 생성물은 플라테놀리드 A이고, 제2 생성물은 플라테놀리드 B이며; 이들 2가지 분자의 추론된 구조가 도 36에 제시되어 있다.
상기 언급된 바와 약간은 상이하지만, 이의 설정 조건은 당업자에게 널리 공지되어 있는 조건 하에서 LC/MS 기술을 NMR과 조합하여 사용하여, 균주 OS49.67이 플라테놀리드 A 및 B 이외에도 이들 2가지 화합물의 유도체를 생산한다는 사실을 결정할 수 있었다. 이들은 플라테놀리드 A + 미카로스와 플라테놀리드 B + 미카로스이다(이들 2가지 화합물의 구조가 도 40에 제시되어 있다). 균주 OS49.67의 과실즙의 분석 결과가 표 42에 제시되어 있다.
Figure 112005018477118-pct00050
20.4 균주 SPM509에 의해 생산된 생합성 중간체의 분석
orf14 유전자를 불활성화시킨 균주 SPM509(arf14::att3Ωaac-)은 스피라마이신을 생산하지 않는다(실시예 13, 15 및 16 참조). 샘플을 상기 언급된 방법(단락 20.1 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 및 20.3 참조) LC/MS에 의해 분석하였다. MP5 배지에서 배양된 균주 SPM509의 배양 상청액에 존재하는 생합성 중간체의 분석 결과, 이러한 균주가 단지 형태 B의 플라테놀리드("플라테놀리드 B", 도 36 참조) 만을 생산하고 형태 A("플라테놀리드 A, 도 36 참조)는 생산하지 않은 것으로 나타났다.
실시예 21: orf3 유전자에서 녹아웃을 나타내는 균주(OS49.67)에서 orf14 유전자의 개입중단
orf14 유전자는 스피라마이신 생합성에 필수적이다(실시예 13, 15 및 16 참조: 상기 유전자가 개입중단된 균주 SPM509는 더 이상 스피라마이신을 생산하지 않는다). MP5 배지에서 배양된 균주 SPM509의 배양 상청액에 존재하는 생합성 중간체의 분석 결과, 이러한 균주가 단지 형태 B의 플라테놀리드 만을 생산하고 형태 A는 생산하지 않은 것으로 나타났다(실시예 20 참조). 이러한 관찰 결과를 설명할 수 있는 가설들 중의 하나는 orf14의 생성물이 효소적 환원 단계를 통하여 형태 B의 플라테놀리드를 형태 A로 전환시키는데 관여한다는 것이다. 이러한 가설을 시험하기 위해, 스피라마이신은 더 이상 생산하지 않지만 형태 A와 B의 플라테놀리드를 생산하는 돌연변이체에서 orf14 유전자를 불활성화시킨다. 이는 orf3 유전자를 동위상 결실에 의해 불활성화시킨(△orf3) 균주 OS49.67(실시예 6 및 20 참조)의 경우에 해당된다. 이러한 균주에서 orf14 유전자를 불활성화시키기 위해, 균주 OS49.67을 원형질체 형질전환시킴으로서 플라스미드 pSPM509를 도입하였다(참조: T. Kieser et al., 2000). orf14 유전자의 불활성화는 균주 OSC2의 경우에 이미 언급되었고(실시예 13 참조), 이와 동일한 과정을 균주 OS49.67에서 orf14 유전자의 불활성화를 위해 사용하였다. 플라스미드 pSPM509로 형질전환시킨 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신 함유 배지와 히그로마이신 함유 배지 상에서 계대배양하였다. 아프라마이신에 내성인 클론(ApraR)과 히그로마이신에 민감한 클론(HygS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 상기 orf14 유전자가 att3Ωaac- 카세트에 의해 개입중단된 orf14의 복사물로 대체된 것이다. 이들 클론을 보다 특별히 선별하고, orf14의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3Ωaac- 카세트에 상응하는 프로브와 하이브리드화시켜, 유전자 대체가 실제로 수행되었는지를 확인하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(△orf3, orf14::att3Ωaac-)을 보다 특별히 선별하고, 이를 SPM510으로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3Ωaac- 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 orf14 유전자를 att3Ωaac- 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다.
실시예 22: orf14 유전자의 개입중단의 기능적 상보성
22.1 플라스미드 pSPM519의 작제:
orf14 유전자를 다음 쌍의 올리고뉴클레오티드를 사용하고, 매트릭스로서 균주 OSC2의 염색체 DNA를 사용하여 PCR함으로써 증폭시켰다: EDR31: 5'CCCAAGCTCTGCGCCCGCGGGCGTGAA 3'(서열 번호 136) 및 EDR37: 5'GCTCTAGAACCGTGTAGCCGCGCCCCGG 3'(서열 번호 137). 올리고뉴클레오티드 EDR31 및 EDR37은 각각 HindIII 및 XbaI 제한 부위(진하게 표시된 서열)를 수반한다. 이로써 수득된 1.2kb 단편을 벡터 pGEM-T easy(Promega (Madison, Wisconsin, USA))에 의해 시판됨) 내로 클로닝시켜, 플라스미드 pSPM515를 수득하였다. 이어서, 이러한 플라스미드를 HindIII 및 XbaI 제한 효소로 분해시켰다. 수득된 1.2kb HindIII/XbaI 삽입물을, 상기와 동일한 효소로 미리 분해시킨 벡터 pUWL201(실시예 17.1 참조)내로 클로닝하였다. 이로써 수득된 플라스미드는 pSPM519로 명명되었다.
22.1 균주 SPM509 및 SPM510을 플라스미드 pSPM519로 형질전환시킴:
플라스미드 pSPM519를 원형질체 형질전환에 의해 균주 SPM509(실시예 13 참조) 및 SPM510(실시예 17 참조) 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 티오스트렙톤 내성에 대해 선별하였다. 이어서, 상기 클론을 티오스트렙톤 함유 배지 상에서 계대배양하였다.
균주 SPM509는 스피라마이신 비-생산자 균주이다(실시예 13, 15 및 16, 및 도 24 참조). 벡터 pSPM519로 형질전환시킨 균주 SPM509(SPM509 pSPM519로 명명된 균주)의 스피라마이신 생산은, 상기 균주를 티오스트렙톤의 존재 하에 MP5 배지에서 배양함으로써 분석하였다. 이어서, 배양 상청액을 HPLC에 의해 분석하였다(실시예 16 및 17 참조). 이러한 분석 결과가 표 43에 제시되어 있고, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 총 생산량에 상응한다(스피라마이신 I, II 및 III 생산량을 부가함으로써 수득됨). 균주 SPM509 내에 벡터 pSPM519가 존재하는 것이 스피라마이신 생산을 복원시키는 것으로 관찰되었다(표 43 참조).
Figure 112005018477118-pct00051
플라스미드 pSPM519로 형질전환시킨 균주 SPM510은 SPM510 pSPM519로 명명되었다.
실시예 23: 에스. 프라디애의 tylB 유전자에 의한 orf3 유전자의 개입중단의 기능적 상보성
23.1 플라스미드 pOS49.52의 작제:
플라스미드 pOS49.52는 에스. 암보파시엔스의 TylB 단백질의 발현을 허용해 주는 플라스미드에 상응한다. 이를 작제하기 위해, 에스. 프라디애의 tylB 유전자의 암호화 서열[참조: Merson-Davies & Cundliffe, 1994, 젠뱅크 수탁 번호: U08223(상기 영역 서열), SFU08223(DNA 서열) 및 AAA21342(단백질 서열)]을 플라스미드 pKC1218(참조: Bierman et al., 1992, Kieser et al., 2000; 상기 플라스미드를 함유하는 이. 콜라이 균주는 특히 ARS (NRRL) Agricultural Research Service Culture Collection) (Peoria, Illinois, USA)로부터 번호 B-14790로 입수 가능하다) 내로 도입하였다. 또한, 상기 암호화 서열을 ermE* 프로모터의 제어 하에 위치시켰다(참조: 상기, 특히 실시예 17.1, Bibb et al., 1985, Bibb et al., 1994).
23.1 균주 OS49.67을 플라스미드 pOS49.52로 형질전환시킴:
orf3 유전자를 동위상 결실에 의해 불활성화시킨 균주 OS49.67은 스피라마이신을 생산하지 않는다(실시예 6 및 15 참조). 플라스미드 pOS49.52를 원형질체 형질전환에 의해 균주 OS49.67 내로 도입하였다(참조: T. Kieser et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 상기 클론을 아프라마이신 함유 배지 상에서 계대배양하였다. 이 클론을 보다 특별히 선별하고 OS49.67 pOS49.52로 명명하였다.
상기 입증된 바와 같이, 균주 OS49.67은 스피라마이신을 생산하지 않는다(실시예 6 및 15 참조). 벡터 pOS49.52로 형질전환시킨 균주 OS49.67의 스피라마이신 생산은 실시예 15에 기재된 기술에 의해 분석하였다. 이로써, 상기 균주가 스피라마이신 생산자 표현형을 지니고 있다는 것을 입증할 수 있었다. 따라서, TylB 단백질은 orf3 유전자의 개입중단의 기능적 상보성을 허용해 준다.
실시예 24: orf28c 유전자의 과발현에 의한 스피라마이신 생산 향상
24.1 플라스미드 pSPM75의 작제:
orf28c 유전자는 HindIII 제한 부위 또는 BamHI 제한 부위를 포함하는 한 쌍의 올리고뉴클레오티드를 사용하여 PCR함으로써 증폭시켰다. 이들 프라이머는 다음 서열을 갖는다:
KF30: 5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3'(서열 번호 138)
[HindIII 제한 부위(진하게 표시됨)를 갖는다]
KF31: 5' GGATCCCGCGACGGACACGACCGCCGCGCA 3'(서열 번호 139)
[BamHI 제한 부위(진하게 표시됨)를 갖는다].
프라이머 KF30 및 KF31은 각각 HindIII 및 BamHI 제한 부위(진하게 표시된 서열)을 수반한다. 프라이머 KF30와 KF31 쌍은 매트릭스로서 플라스미드 pSPM36(상기 참조)을 사용하여, orf28c 유전자를 함유하는 크기가 대략 1.5kb인 DNA 단편을 증폭시킬 수 있게 해준다. 이로써 수득된 1.5kb 단편을 벡터 pGEM-T easy(Promega (Madison, Wisconsin, USA)에 의해 시판됨) 내로 클로닝시켜, 플라스미드 pSPM74를 수득하였다. 이어서, 플라스미드 pSPM74를 HindIII 및 BamHI 제한 효소로 분해시키고, 수득된 대략 1.5kb HindIII/BamHI 삽입물을, 상기와 동일한 효소로 미리 분해시킨 벡터 pUWL201(실시예 17.1 참조) 내로 아클로닝시켰다. 이로써 수득된 플라스미드를 pSPM75로 명명하였는데, 이는 ermE* 프로모터의 제어 하에 위치된 orf28c의 암호화 서열을 모두 함유한다.
24.2 균주 OSC2를 플라스미드 pSPM75로 형질전환시킴:
플라스미드 pSPM75를 원형질체 형질전환에 의해 균주 OSC2 내로 도입하였다(참조: T. Kieser et al., 2000). 원형질체 형질전환 후, 상기 클론을 대상으로 하여, 이들의 티오스트렙톤 내성에 대해 선별하였다. 이어서, 상기 클론을 티오스트렙톤 함유 배지 상에서 계대배양하고, 상기 플라스미드로의 형질전환을 플라스미드 추출에 의해 확인하였다. 2개 클론을 보다 특별히 선별하고, 이를 OSC2/pSPM75(1) 및 OSC2/pSPM75(2)로 명명하였다.
균주 OSC2/pSPM75(2) 샘플은 2003년 10월 6일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 등록 번호 I-3101로 기탁되었다.
스피라마이신 생산에 대한 orf28c 유전자의 과발현 효과를 시험하기 위해, OSC2/pSPM75(1) 및 OSC2/pSPM75(2) 클론의 스피라마이신 생산을 실시예 15에 기재된 기술에 의해 시험하였다. 이와 병행해서, 비교를 위해, 균주 OSC2의 스피라마이신 생산에 관한 분석을 또한 수행하였다. 이로써, 플라스미드 pSPM75의 존재가 균주 OSC2의 스피라마이신 생산을 상당히 증가시킨다는 사실을 관찰할 수 있었다. 이로써, orf28c의 과발현이 스피라마이신 생산 증가를 가져다 주는 것으로 입증되었으며, 이것이 조절인자로서 역할을 한다는 사실을 확인시켜 준다.
OSC2/pSPM75(1) 및 OSC2/pSPM75(2) 클론의 스피라마이신 생산을 또한, HPLC에 의해 분석하였다(실시예 17.2에서와 동일한 방식으로 수행됨). 이와 병행해서, 비교를 위해, 균주 OSC2의 스피라마이신 생산에 관한 분석을 또한 수행하였다. 이러한 분석 결과가 표 44에 제시되어 있고, 데이터는 상청액 리터당 mg으로 표현된다. 이 결과는 스피라마이신 총 생산량에 상응한다(스피라마이신 I, II 및 III 생산량을 부가함으로써 수득됨).
Figure 112005018477118-pct00052
따라서, 플라스미드 pSPM75가 존재하는 것이 균주 OSC2의 스피라마이신 생산량을 상당히 증가시키는 것으로 관찰된다. 이는 orf28c의 과발현이 스피라마이신 생산에 긍정적인 효과를 나타낸다는 것을 명백히 입증해준다.
실시예 25: orf8 유전자에서 불활성화시킨 균주에 의한 스피라마이신 생합성 중간체의 생산 분석
orf8 유전자를 Ωhyg 카세트의 삽입에 의해 불활성화시킨 균주 OS49.107은 스피라마이신을 생산하지 않는다(실시예 7 및 15 참조). orf8 유전자는 몇 가지 아미노트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화하고, orf8 유전자가 포로사민 생합성에 필요한 아민기 전이 반응에 대해 책임이 있는 4-아미노트랜스퍼라제를 암호화한다는 사실을 강력히 제시해준다(도 6 참조). 따라서, 스피라마이신 생합성은 포로시딘 단계에서 차단될 것으로 예상된다(도 7 참조). 따라서, 스피라마이신 비-생산자인 균주 OS49.107은 포로시딘을 생산해야 한다.
균주 OS49.107의 상청액 샘플을 상기 언급된 방법(MIBK 추출을 수반하지 않는 실시예 16 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 및 20.3 참조) LC/MS에 의해 분석하였다. SIM 모드에서는, 포로시딘의 분자 이온에 관한 질량 558을 선별하고 몇 가지 피크를 탐지하였다. 질량 558의 화합물이 존재하는 것은 orf8이 포로사민 합성에 일정 역할을 한다는 가설에 부합된다.
실시예 26: orf12 유전자에서 불활성화시킨 균주에 의한 스피라마이신 생합성 중간체의 생산 분석
orf12 유전자를 불활성화시킨 균주 SPM507은 스피라마이신을 생산하지 않는다(실시예 11 및 15 참조). orf12 유전자는 포로사민 생합성에 필요한 탈수 반응에 대해 책임이 있는 3,4-데하이드라타제를 암호화하는 것으로 여겨진다(도 6 참조). 따라서, 스피라마이신 생합성은 포로시딘 단계에서 차단될 것으로 예상된다(도 7 참조). 따라서, 스피라마이신 비-생산성 균주인 균주 SPM507은 포로시딘을 생산해야 한다.
균주 SPM507의 상청액 샘플을 상기 언급된 방법(MIBK 추출을 수반하지 않는 실시예 16 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 및 20.3 참조) LC/MS에 의해 분석하였다. 이들 조건 하에서, 포로시딘 잔류 시간은 대략 12.9분이다. SIM 모드에서는, 포로시딘의 분자 이온 [M+H]+에 관한 질량 558을 선별하고 특정 피크를 탐지하였다. 질량 558의 화합물이 존재하는 것은 orf12의 생성물이 스피라마이신 생합성에 일정 역할을 한다는 가설을 실증시켜 준다.
그러나, 포로시딘은 비교적 적은 양으로 존재하고, 이들 조건 하에서는 238nm에서 흡수되는 생성물이 보다 특별히 관찰되었다(잔류 시간 17.1분). LC/MS 분석 결과, 상기 화합물의 질량이 744.3g/mol인 것으로 결정되었다([M+H]+=744.3 주 생성물).
구조를 획득하기 위해, 상기 언급된 생성물을 상기 언급된 조건 하에 분리 및 정제하였다(단락 20.1 참조). 이어서, 유기 상(MIBK)을 회수하고 증발시킨다. 건조 추출물을 물에 흡수시키고 헵탄으로 추출한다. 이어서, 수용액을 Oasis HLB 1g 카트릿지(Waters SAS, St-Quentin en-Yvelines, France)에 결합시킴으로써 이를 추출한다. 이 화합물을 30/70 물/아세토니트릴 혼합물로 용출시킴으로써 회수한다. 이어서, 이 용액을 분석용 칼럼 상으로 주사하고(100㎕), 분획을 Oasis HLB 1cc 30mg 카트릿지(Waters) 상에서 회수한다. 사용하기 전에, 이러한 Oasis HLB 1cc 30mg 카트릿지(Waters)를 아세토니트릴에 이어, 물/아세토니트릴 혼합물(20v/80v) 및 80/20 물/아세토니트릴 혼합물로 순차적으로 조건화시킨다.
이어서, Oasis HLB 1cc 30mg 카트릿지(Waters)를 1ml의 물/아세토니트릴(95/5) 및 1ml의 물/중수소화 아세토니트릴(95/5)로 연속해서 세척한 다음, 600㎕의 40/60 물/중수소화 아세토니트릴로 용출시킨다. 이어서, 회수한 용액을 NMR에 의해 직접 분석한다.
상기 화합물에 대해 수득된 NMR 스펙트럼은 다음과 같다(19312V NMR 스펙트럼):
CD3CN/D2O 중의 1H 스펙트럼(화학적 이동, ppm): 0.92 (3H, d, J=6Hz), 1.10 (1H, 분해되지 않은 피크), 1.14 (3H, s), 1.17 (3H, d, J=6Hz), 1.22 (3H, d, J=6Hz), 1.25 (3H, d, J=6Hz), 1.40 (1H, 분해되지 않은 피크), 1.75 (1H, dd, J=12 및 2Hz), 1.81 (1H, 분해되지 않은 피크), 1.90 (1H, d, J=12Hz), 2.05 (1H, 분해되지 않은 피크), 2.12 (3H, s), 2.15 (1H, 분해되지 않은 피크), 2.35 (2H, 분해되지 않은 피크), 2.45 (6H, 넓은 s), 2.53 (1H, 분해되지 않은 피크), 2.64 (1H, dd, J=12 및 9Hz), 2.80 (1H, dd, J=9 및 16Hz), 2.95 (1H, d, J=8Hz), 3.23 (2H, 분해되지 않은 피크), 3.34 (1H, d, J=7Hz), 3.45 (3H, s), 3.49 (1H, 분해되지 않은 피크), 3.93 (1H, dd, J=7 및 3Hz), 4.08 (1H, 분해되지 않은 피크), 4.37 (1H, d, J=6Hz), 4.88 (1H, 분해되지 않은 피크), 5.05 (2H, 분해되지 않은 피크), 5.65 (2H, 분해되지 않은 피크), 6.08 (1H, dd, J=8 및 12Hz), 6.40 (1H, dd, J=12 및 9Hz), 9.60 (1H, s).
이들 실험으로써, 상기 화합물의 구조를 결정할 수 있었으며, 이러한 구조가 도 38에 제시되어 있다.
실시예 27: orf5* 유전자에서 불활성화시킨 균주에 의한 스피라마이신 생합성 중간체의 생산 분석
균주 SPM501은 유전자형 orf6*::att1Ωhyg+을 갖는다. att1Ωhyg+ 카세트를 orf6* 유전자 내로 삽입시킨 극성 효과를 통하여, orf5* 유전자가 스피라마이신 생합성 경로에 필수적이란 사실을 결정할 수 있었다. 구체적으로 언급하면, 상기 절제 가능한 카세트를 orf6* 유전자 내로 삽입시키면, orf5* 유전자의 발현에 대한 극성 효과를 통하여 스피라마이신 생산을 완전히 억제시킨다. 그러나, 상기와 같이 삽입된 카세트를 일단 절단시키면(그리고, 이에 따라 orf6* 유전자 만이 불활성화되는 경우; 실시예 14 및 15 참조), 스피라마이신 I의 생산이 복원된다. 이는 orf5* 유전자가 스피라마이신 생합성에 필수적이란 사실을 입증해주는데, 이는 이를 불활성화시키면, 스피라마이신 생산이 완전히 억제되기 때문이다.
orf5* 유전자는 몇 가지 O-메틸트랜스퍼라제와 비교적 강력한 유사성을 나타내는 단백질을 암호화한다. orf5* 유전자는 플라테놀리드의 생합성에 관여하는 O-메틸트랜스퍼라제인 것으로 여겨진다. 이러한 가설을 입증하기 위해, LC/MS 및 NMR 분석 실험을, 스피라마이신을 과생산하는 균주로부터 수득된 유전자형: orf6*::att1Ωhyg+의 에스. 암보파시엔스 균주 상에서 수행하였다.
상기 균주의 상청액 샘플을 상기 언급된 방법(MIBK 추출을 수반하지 않는 실시예 16 참조)에 따라서 제조하고, 상기 언급된 바와 같이(단락 20.2 및 20.3 참조) LC/MS에 의해 분석하였다. 그러나 사용된 칼럼은 X-Terra 칼럼(Waters SAS, St-Quentin en-Yvelines, France)이고, 분광계의 원추 전압은 380V로 설정되어, 분석된 화합물의 발효를 획득한다. 이들 조건 하에서, 잔류 시간이 대략 13.1분인 생성물이 관찰된다. 상기 화합물의 질량 스펙트럼은 스피라마이신 I과 유사한 외관을 나타내지만, 분자 이온은 829이다. 스피라마이신의 질량과 비교한 14 질량 상의 차이점은 락톤 환(이러한 화합물의 구조는 도 39에 제시되어 있다)의 탄소 번호 4에 의해 생성된 산소 상의 메틸 그룹 부재로써 설명할 수 있다. 829 하의 특정 화합물이 존재하면, orf5*이 스피라마이신 생합성에 있어 일정 역할을 한다는 가설을 실증할 수 있다. 민감한 엠. 루테우스(M. luteus) 균주 상에서 수행된 미생물학적 시험을 이용하여(실시예 15 및 도 18 참조), 균주 orf6*::Ωatthyg+에 의해 생산된 중간체 분자(메틸 그룹이 부재하는 스피라마이신, 이의 구조는 도 39에 제시되어 있다)가 위치 4에 메틸 그룹을 갖는 기원 스피라마이신 보다 훨씬 활성이 덜하다(10 인자 정도)란 사실을 입증해주었다.
실시예 28: 신규한 "절제 가능한 카세트"의 작제:
신규한 절제 가능한 카세트를 작제하였다. 이들 카세트는 실시예 9에서 이미 기재된 바와 같은 절제 가능한 카세트와 매우 유사하다. 전자 카세트와 본 실시예의 신규한 카세트 간의 주요 차이점은 후자 카세트에서는, Ω 인터포손(interposon)의 말단에 상응하는 서열(이러한 서열은 T4 파아지로부터 유래하는 전사 종결인자를 함유한다)이 부재한다는 것이다.
종결인자를 갖지 않는 카세트에서는, 특정 항생제에 대한 내성을 부여해 주는 유전자를, 절제를 허용해 주는 attRattL 서열에 의해 플랭킹시킨다. 이러한 내성 유전자는 아프라마이신 내성을 부여해 주는 아세틸트랜스퍼라제를 암호화하는 aac(3)IV 유전자이다. 이러한 유전자는 Ωaac 카세트(젠뱅크 수탁 번호: X99313, Blondelet-Rouault, M.H. et al., 1997)에 존재하고, 이는 매트릭스로서, 플라스미드 pOSK1102(상기 참조)를 사용하고, 프라이머로서, 5' 위치에 HindIII 제한 부위(진하게 표시됨)(AAGCTT)를 각각 함유하는 올리고뉴클레오티드 KF42 및 KF43를 사용하여 PCR함으로써 증폭시켰다:
KF42: 5'-AAGCTTGTACGGCCCACAGAATGATGTCAC-3'
(서열 번호 153) 및
KF43: 5'-AAGCTTCGACTACCTTGGTGATCTCGCCTT-3'
(서열 번호 154).
이와 같이 하여 수득된 대략 1kb의 PCR 생성물을 이. 콜라이 벡터 pGEMT Easy 내로 클로닝하여, 플라스미드 pSPM83을 생성시킨다.
벡터 pSPM83을 HindIII 제한 효소로 분해시켰다. 이러한 삽입물의 HindIII-HindIII 단편을 0.8% 아가로스 겔로부터 정제함으로써 분리시킨 다음, 가능한 각종 절제 가능한 캇세트를 수반하는 각종 플라스미드의 attL 서열과 attR 서열 사이에 위치한 HindIII 부위 내로 클로닝하여(실시예 9 및 27 참조), Ωacc에 상응하는 HindIII 단편을 aac 유전자 단독에 상응하는 HindIII 단편으로 대체시킨다. 이로써, att1aac, att2aacatt3aac 카세트를 수득할 수 있었다(목적하는 상에 따름; 실시예 9 참조). attL 서열과 attR 서열에 대한 aac 유전자의 배향에 따라서, att1aac+, att1aac-, att2aac+, att2aac-, att3aac+att3aac-를 구별한다(실시예 9에서 적응된 것과 동일한 규정에 따름).
실시예 29: orf28c 유전자에서 녹아웃을 나타내는 에스. 암보파시엔스 균주의 작제
orf28c 유전자는 절제 가능한 카세트 기술을 사용하여 불활성화시켰다. 절제 가능한 카세트 att3aac+(실시예 28 참조)를, 매트릭스로서 플라스미드 pSPM101[플라스미드 pSPM101은 att3aac+ 카세트를 EcoRV 단편으로서, pGP704Not의 독특한 EcoRV 부위 내로 클로닝시킨 벡터 pGP704Not로부터 유도된 플라스미드이다(참조: Chaveroche et al., 2000 and V.L. Miller & J.J. Mekalanos, 1988)]를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시켰다:
KF32:
5' CAACCGCTTGAGCTGCTCCATCAACTGCTGGGCCGAGGT ATCGCGCGCGCTTCGTTCGGGACGAA 3' (서열 번호 155) 및
KF33:
5' TGGGTCCCGCCGCGCGGCACGACTTCGACTCGCTCGTCT ATCTGCCTCTTCGTCCCGAAGCAACT 3' (서열 번호 156).
이들 올리고뉴클레오티드의 5' 말단에 위치한 39개 뉴클레오티드는 orf28c 유전자 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 26개 뉴클레오티드(진하게 표시되고 밑줄쳐져 있음)는 절제 가능한 카세트 att3aac+의 말단 중의 하나의 서열에 상응한다.
이로써 수득된 PCR 생성물을 사용하여, 코스미드 pSPM36을 함유하는 하이퍼-재조합 이. 콜라이 균주 DY330[이러한 균주는 이의 염색체 내로 통합된 람다 파아지의 exo, betgam 유전자를 함유하고, 이들 유전자를 42℃에서 발현시키며, 이를 이. 콜라이 균주 KS272 대신 사용하였다(참조: Chaveroche et al., 2000)]를 형질전환시킨다. 이로써, 상기 세균을 상기 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 이들 클론을 대상으로 하여 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3aac+ 카세트가 orf28c 유전자 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 코스미드를 추출하고 BamHI 제한 효소로 분해하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 코스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 코스미드는 pSPM107로 명명하였다. 이러한 코스미드는 orf28catt3aac+ 카세트에 의해 개입중단된 pSPM36의 유도체이다. 상기 카세트의 삽입은 orf28c에서의 결실을 수반하는데, 개입중단은 orf28c의 28번 코돈에서 시작한다. 카세트 다음에, orf28c의 마지막 137 코돈이 존재한다.
코스미드 pSPM107을 제1 단계에서 이. 콜라이 균주 DH5α 내로 도입한 다음, 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2 내로 도입하였다. 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 푸로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 푸로마이신에 민감한 클론(PuroS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3aac+ 카세트에 의해 개입중단된 orf28c 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf28c의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3aac+ 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내의 예상된 유전자 자리에 상기 카세트가 존재하는지를 확인하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf28c::att3aac+)을 보다 특별히 선별하고, 이를 SPM107로 명명하였다. 따라서, 이 클론은 유전자형: orf28c::att3aac+을 가지며 SPM107로 명명되었다. 유전자의 배향 측면에서(도 3 참조), orf28c의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf29orf28c와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도, 특히 플라스미드 pOSV508로의 형질전환에 의해 제거할 수 있는 가능성이 생긴다.
스피라마이신 생산에 대한 orf28c 유전자의 활동 중지 효과를 시험하기 위해, 균주 SPM107의 스피라마이신 생산을 실시예 15에 기재된 기술에 의해 시험하였다. 이로써, 상기 균주는 스피라마이신 비-생산자 표현형을 가진다는 사실을 입증할 수 있었다. 이는 orf28c 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라는 것을 입증해 준다.
실시예 30: orf31 유전자에서 녹아웃을 나타내는 에스. 암보파시엔스 균주의 작제
orf31 유전자는 절제 가능한 카세트 기술을 사용하여 불활성화시켰다. 절제 가능한 카세트 att3aac+는, 매트릭스로서 플라스미드 pSPM101을 사용하고, 올리고뉴클레오티드 EDR71 및 EDR72를 사용하여 PCR함으로써 증폭시켰다:
EDR71:
5'CGTCATCGACGTGCGGGGAAGACAGAGGTGATACCGATG ATCGCGCGCGCTTCGTTCGGGACGAA 3'(서열 번호 157)
EDR72:
5'GCCAGCACCTCGTCCAGCTGCTCGACGGAACTCACCCCC ATCTGCCTCTTCGTCCCGAAGCAACT 3'(서열 번호 158).
이들 올리고뉴클레오티드의 5' 말단에 위치한 39개 뉴클레오티드는 orf31 유전자 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 26개 뉴클레오티드(진하게 표시되고 밑줄쳐져 있음)는 절제 가능한 카세트 att3aac+의 말단 중의 하나의 서열에 상응한다.
이로써 수득된 PCR 생성물을 사용하여, 문헌(참조: Chaveroche et al., 2000)에 기재된 바와 같은 플라스미드 pKOBEG 및 코스미드 pSPM36을 함유하는 이. 콜라이 균주 KS272를 형질전환시킨다(도 12 참조; 원칙적으로 플라스미드 pOS49.99는 코스미드 pSPM36으로 대체되어야 하고, 수득된 플라스미드는 더 이상 pSPM17이 아니지만, pSPM543이다). 이로써, 상기 세균을 이러한 PCR 생성물로 전기천공시킴으로써 형질전환시키고, 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3aac+ 카세트가 orf31 유전자 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 코스미드를 추출하고 여러 제한 효소로 분해하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 코스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 코스미드는 pSPM543으로 명명하였다. 이러한 코스미드는 orf31att3aac+ 카세트에 의해 개입중단된 pSPM36의 유도체이다(도 12 참조). 상기 카세트의 삽입은 orf31에서의 결실을 수반하는데, 개입중단은 orf31의 36번 코돈에서 시작한다. 카세트 다음에, orf31의 마지막 33 코돈이 존재한다.
코스미드 pSPM543을 원형질체 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2(상기 참조) 내로 도입하였다(참조: Kieser, T et al., 2000). 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 푸로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 푸로마이신에 민감한 클론(PuroS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3aac+ 카세트에 의해 개입중단된 orf31 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf31의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3aac+ 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내의 예상된 유전자 자리에 상기 카세트가 존재하는지를 확인하였다. 프로브로서, PCR에 의해 수득되고 orf31 유전자의 암호화 서열의 매우 큰 부분에 상응하는 DNA 단편을 사용하여 제2 하이브리드화를 수행하였다.
당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf31::att3aac+)을 보다 특별히 선별하고, 이를 SPM543으로 명명하였다. 사실상, 2회 하이브리드화를 통하여, att3aac+ 카세트가 상기 클론의 게놈 내에 실제로 존재한다는 사실과, 이러한 클론의 게놈 내에서 야생형 유전자를 att3aac+ 카세트에 의해 개입중단된 복사물로 대체시키고, 연속해서 이중 재조합 사건을 수행한 경우에 예상된 분해 프로필을 실제로 수득할 수 있다는 사실을 확인할 수 있었다. 따라서, 이러한 클론은 유전자형: orf31::att3aac+을 갖고 SPM543으로 명명되었다. 유전자의 배향이 주어지면(도 3 참조), orf31의 불활성화 효과를 연구하기 위해 카세트를 절제할 필요가 없다. orf32corf31와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도, 특히 플라스미드 pOSV508으로의 형질전환에 의해 제거할 수 있는 가능성이 생긴다.
스피라마이신 생산에 대한 orf31 유전자의 활동 중지 효과를 시험하기 위해, 균주 SPM543의 스피라마이신 생산을 실시예 15에 기재된 기술에 의해 시험하였다. 이로써, 상기 균주는 스피라마이신 비-생산성 표현형을 가진다는 사실을 입증할 수 있었다. 이는 orf31 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자라는 것을 입증해 준다.
실시예 31: orf32c 유전자에서 녹아웃을 나타내는 에스. 암보파시엔스 균주의 작제
orf32c 유전자는 절제 가능한 카세트 기술을 사용하여 불활성화시켰다. 절제 가능한 카세트 att3aac+를, 매트릭스로서 플라스미드 pSPM101를 사용하고, 다음 프라이머를 사용하여 PCR함으로써 증폭시켰다:
KF52:
5' GATCCGCCAGCCTCACGTCACGCCGCGCCGCCTCCCTGAC ATCGCGCGCGCTTCGTTCGGGACGAA 3' (서열 번호 159) 및
KF53:
5' GAGGCGGACGTCGGTACGCGGTGGGAGCCGGAGTTCGACA ATCTGCCTCTTCGTCCCGAAGCAACT 3' (서열 번호 160).
이들 올리고뉴클레오티드의 5' 말단에 위치한 40개 뉴클레오티드는 orf32c 유전자 내의 서열에 상응하는 서열을 포함하고, 3' 위치에 가장 근접하게 위치한 26개 뉴클레오티드(진하게 표시되고 밑줄쳐져 있음)는 절제 가능한 카세트 att3aac+의 말단 중의 하나의 서열에 상응한다.
이로써 수득된 PCR 생성물을 사용하여, 코스미드 pSPM36을 함유하는 하이퍼-재조합 이. 콜라이 균주 DY330(참조: Yu et al., 2000)를 형질전환시킨다. 이로써, 상기 세균을 전기천공시킴으로써 상기 PCR 생성물로 형질전환시키고, 이들 클론을 대상으로 하여 이들의 아프라마이신 내성에 대해 선별하였다. 수득된 분해 프로필이, att3aac+ 카세트가 orf32c 유전자 내로 삽입된 경우, 즉 PCR 생성물의 말단과 표적 유전자의 말단 간에 상동 재조합이 실제로 수행된 경우에 예상된 프로필에 상응하는지를 확인할 목적으로, 상기 수득된 클론의 코스미드를 추출하고 BamHI 제한 효소로 분해하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 상기 작제물을 확인할 수도 있다. 코스미드가 예상 프로필을 갖는 클론을 선별하고, 상응하는 코스미드는 pSPM106으로 명명하였다. 이러한 코스미드는 orf32catt3aac+ 카세트에 의해 개입중단된 pSPM36의 유도체이다. 상기 카세트의 삽입은 orf32c에서의 결실을 수반하는데, 개입중단은 orf32c의 112번 코돈에서 시작한다. 카세트 다음에, orf32c의 마지막 91 코돈이 존재한다.
코스미드 pSPM106을 제1 단계에서 이. 콜라이 균주 DH5α 내로 도입한 다음, 형질전환에 의해 스트렙토마이세스 암보파시엔스 균주 OSC2 내로 도입하였다. 형질전환 후, 상기 클론을 대상으로 하여, 이들의 아프라마이신 내성에 대해 선별하였다. 이어서, 아프라마이신-내성 클론을 각각, 아프라마이신(항생제 B) 함유 배지와 푸로마이신(항생제 A) 함유 배지 상에서 계대배양하였다(도 9 참조). 아프라마이신에 내성인 클론(ApraR)과 푸로마이신에 민감한 클론(PuroS)은 원칙적으로, 이중 유전자교환 사건이 발생하였으며 att3aac+ 카세트에 의해 개입중단된 orf32c 유전자를 함유하고 있는 것이다. 이들 클론을 보다 특별히 선별하고, orf32c의 야생형 복사물을 상기 카세트에 의해 개입중단된 복사물로 대체시키는 것을 하이브리드화에 의해 확인하였다. 따라서, 수득된 클론의 총 DNA를 여러 효소로 분해시키고, 아가로스 겔 상에서 분리시키며, 막 위로 옮긴 다음, att3aac+ 카세트에 상응하는 프로브와 하이브리드화시켜, 수득된 클론의 게놈 DNA 내에 상기 카세트가 존재하는지를 확인하였다. 당업자에게 공지된 모든 방법, 특히 적당한 올리고뉴클레오티드를 사용하여 PCR한 다음 PCR 생성물을 서열 분석하는 방법에 의해 유전자형을 확인할 수 있다.
예상된 특징을 나타내는 클론(orf32c::att3aac+)을 보다 특별히 선별하였다. 따라서, 이 클론은 유전자형: orf32c::att3aac+을 가지며 SPM106으로 명명되었다. 유전자의 배향 측면에서(도 3 참조), orf32c의 불활성화 효과를 연구하기 위해 상기 카세트를 절제할 필요는 없다. orf33orf32c와 반대 방향으로 배향된다는 사실은 이들 유전자가 동시에 전사되지 않는다는 것을 보여준다. 절제 가능한 카세트를 사용하면, 한편으론 선별 마커를 어떠한 순간에도, 특히 플라스미드 pOSV508로의 형질전환에 의해 제거할 수 있는 가능성이 생긴다.
스피라마이신 생산에 대한 orf32c 유전자의 활동 중지 효과를 시험하기 위해, 균주 SPM106의 스피라마이신 생산을 실시예 15에 기재된 기술에 의해 시험하였다. 이로써, 상기 균주는 스피라마이신-생산성 표현형을 가진다는 사실을 입증할 수 있었다. 이는 orf32c 유전자가 에스. 암보파시엔스에서 스피라마이신 생합성에 필수적인 유전자가 아니라는 것을 입증해 준다.
본원에 기재된 작제물 목록
약어 목록: Am: 앰피실린; Hyg: 히그로마이신; Sp: 스피라마이신; Ts: 티오스트렙톤; Cm: 클로람페니콜; Kn: 카나마이신; Apra: 아프라마이신.
Figure 112005018477118-pct00053
Figure 112005018477118-pct00054
Figure 112005018477118-pct00055
Figure 112005018477118-pct00056
Figure 112005018477118-pct00057
Figure 112005018477118-pct00058
Figure 112005018477118-pct00059
Figure 112005018477118-pct00060
Figure 112005018477118-pct00061
생물학적 물질 기탁
다음 유기체들은 부다페스트 조약의 규정에 따라서, 2002년 7월 10일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes(National Collection of Cultures and Microorganisms) (CNCM) Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France]에 기탁되었다.
- 균주 OSC2는 등록 번호 I-2908로 기탁되었다.
- 균주 SPM501은 등록 번호 I-2909로 기탁되었다.
- 균주 SPM502는 등록 번호 I-2910으로 기탁되었다.
- 균주 SPM507은 등록 번호 I-2911로 기탁되었다.
- 균주 SPM508은 등록 번호 I-2912로 기탁되었다.
- 균주 SPM509는 등록 번호 I-2913으로 기탁되었다.
- 균주 SPM21은 등록 번호 I-2914로 기탁되었다.
- 균주 SPM22는 등록 번호 I-2915로 기탁되었다.
- 균주 OS49.67은 등록 번호 I-2916으로 기탁되었다.
- 균주 OS49.107은 등록 번호 I-2917로 기탁되었다.
- 플라스미드 pOS44.4를 함유하는 에스케리챠 콜라이 균주 DH5α는 등록 번호 I-2918로 기탁되었다.
다음 유기체는 부다페스트 조약의 규정에 따라서, 2003년 2월 26일자로 기탁 기관[Collection Nationale de Cultures de Microorganismes(CNCM), 25 rue du Docteur Roux, 75724 Paris Cedex 15, France]에 기탁되었다.
- 균주 SPM502 pSPM525는 등록 번호 I-2977로 기탁되었다.
다음 유기체는 부다페스트 조약의 규정에 따라서, 2003년 10월 6일자로 기탁기관[Collection Nationale de Cultures de Microorganismes(CNCM), Pasteur Institute, 25 rue du Docteur Roux, 75724 Paris Cedex 15, France]에 기탁되었다.
- 균주 OSC2/pSPM75(2)는 등록 번호 I-3101로 기탁되었다.
인용된 모든 공개 공보 및 특허는 본원에 참조문헌으로써 삽입되어 있다.
관계 서적 목록:
Figure 112005018477118-pct00062
Figure 112005018477118-pct00063
Figure 112005018477118-pct00064
Figure 112005018477118-pct00065
Figure 112005018477118-pct00066
Figure 112005018477118-pct00067
Figure 112005018477118-pct00068
Figure 112005018477118-pct00069
Figure 112005018477118-pct00070
Figure 112005018477118-pct00071
<110> Aventis Pharma SA; CNRS <120> Polypeptides involved in spiramycin biosynthesis, nucleotide sequences encoding said polypeptides and uses thereof <130> Spiramycin biosynthesis (2) <150> FR 0212489 <151> 2002-10-08 <150> FR 0302439 <151> 2003-02-27 <150> US 60/493,490 <151> 2003-08-07 <160> 161 <170> KopatentIn 1.71 <210> 1 <211> 30943 <212> DNA <213> Streptomyces ambofaciens <400> 1 gaattcggca attcccgggg cgccgggaaa ccggcacgcc attccgacca cggcaacggc 60 gtcggaccgg tcgtcactgc gggaaatcgc gagttctcca gacacctgca tccctcatat 120 gttcgccgta ccacgccgtg gcttttctgc cttttcttga tcttcccgag cgtacagcgg 180 gcgaactgcc gggcgacagg aacggccggt gaacgacaat caattgtgtc aagttcggag 240 attgtccacc gattctcgtc accggagacg gcgcgggatc atgcgggacc acacggcatc 300 gcaccaggtc cgcagggtcg gcgctccgac gtcccggccg gtcgcgcact ccggtgacct 360 gcacgcggag tcctgggcga gcggagaaga tttcagtacc tcgcggcgcg ggacaaccac 420 ttcgcgacga atatgtcagg tctccccgag cggtccgtgc cgccccgccc tgacccgtcc 480 gcgcccgtcc cgctccgccc cggtcgtcat ctcggccgga atttcagtcg gcagctcatt 540 gtgtcaggtt cgccttgccg acattctccg gagattccta agctctgccg gtaaccggga 600 ccggaaccac cgtgccgcgc gttcggtcca cacaccgctt ttcgaggagt ccgactgatg 660 ggtgaggccg tgacgggacc gatggagctg agcaaggacg cggacgcccg ggggctgctt 720 gagtggttcg cgtacaacag gacgcgtcat ccggtgttct gggacgagac ccgacaggcg 780 tggcaggtct tcggctacga cgactacgtg acggtgtcga acaacccgca gttcttctcc 840 tcggacttca acatggtgat gccgacgccg cccgaactgg agatgatcat cggtccgggc 900 acgatcggcg cgctggaccc gcccgcgcac ggaccgatgc gcaagctggt gagccaggcg 960 ttcacccccc gacggatcgc ccggctggag cccagggtgc gcgcgatcac cgaggagctc 1020 ctggacaagg tggggcagca ggacgtcgtc gacgccgtgg gtgacctgtc ctacgcgctg 1080 ccggtcatcg tgatcgccga actgctgggc atacccgccg gcgaccgtga cctgttccgg 1140 gagtgggtcg acaccctgct gacgaacgag ggcctggagt acccgaacct cccggacaac 1200 ttcaccgaga cgatcgcgcc cgcgctcaag gagatgaccg actacctcct gaagcagatc 1260 cacgccaagc gggacgcgcc cgccgacgac ctggtcagcg ggctggtcca ggcggagcag 1320 gacggccgcc ggctgaccga cgtcgagatc gtcaacatcg tcgcgctgct cctgacggcg 1380 gggcacgtct cctccagcac cctgctcagc aacctgttcc tggtcctgga ggagaacccg 1440 caggcgctgg aggacctgcg ggccgatcgc tccctggtgc ccggcgcgat cgaggagacg 1500 ctgcgctacc gcagcccctt caacaacatc ttccggttcg tcaaggagga caccaccgtc 1560 ctcggtccgc tcatggagaa gggccagatg gtgatcgcct ggagccagtc cgccaaccgg 1620 gacccccggc acttcccgga cccggacacc ttcgacatcc gccgctcgga cggcacccgg 1680 cacatggcct tcgggcacgg catccaccac tgcctgggtg ccgccctcgc ccgcctggag 1740 ggcaaggtca tgctcgaact cctcctggac cgggtccaag gcttccgcat cgaccacgag 1800 cacaccgtgt tctacgaggc cgaccagctc actccgaagt acctgcccgt ccgggtcgac 1860 tggaactgaa cccgagggtc tcgtcccgga gtccagggcc gtcccgagcc ggccctggac 1920 ctcacgaccg cccgataagg agcgccgcca tcgccgagaa cacagccgag ctccctgccc 1980 ggcgggtcgg caggatcaag ccgtgccggc tgatcaggct cgagcagcac atcgacccgc 2040 gcggcagcct ctccgtgatc gagtccggcg tgaccgtgga cttccccgtc cgacgcgtct 2100 actacatgca tggccagacc cagtcctctc ccccgcgcgg cctgcacgcg caccgcaccc 2160 tggaacaact cgtcatcgcc gtccacggcg ccttctccat caccctcgac gacggcttcc 2220 agcacgccac ctaccgtctg gacgaacccg gagccggact ctgcatcggc cccatggtct 2280 ggcgcgtcct gaaggacttc gaccccgaca ccgtggccct ggtcctcgcc tcgcagcact 2340 acgaggagtc cgactactac cgcgactacg acaccttcct gcatgacgca cggagcctca 2400 catgaccatc cccttcctcg acgcgggcgc cggctaccgg gagttgcgag ccgagatcga 2460 cgcggccctg cagcgggtgt ccgcctccgg ccgctatctg ctcgacgcgg aactcgcggc 2520 cttcgaggag gagttcgccg cgtactgcga caacgaccac tgtgtggcgg tgggcagtgg 2580 ctgcgacgcg ctggagctgt ccctgcgggc gctggacatc ggtcccgggg acgaggtggt 2640 ggtgcccgcg cacaccttca tcgggacctg gctggccgtg tccgctaccg gggcacggcc 2700 ggtggccgtc gacccgacgc cggacgggct ctccctcgac ccggcgctgg tggaggcggc 2760 gctcacccct cggaccagag ccctgatgcc ggtgcacctg cacgggcacc cggccgacct 2820 cgacccgcta ctggcgatcg ccggacggca cggcctggcc gtggtcgagg acgccgcgca 2880 ggcccacggc gcccgttacc ggggccgcag gatcggctcg ggccacgtgg tcgcgttcag 2940 cttctacccc ggcaagaacc tcggcgccat gggggacggc ggcgcggtgg tcacgggtga 3000 ctccggtgtg gccgagcgga tccggttgct gcgcaactgc ggctcgcggg agaagtaccg 3060 gcacgaggtg cgctcgaccc actcccggct cgacgagttc caggcggccg tgctgcgggc 3120 caaactgccg cggctcgacg cgtggaacgc ccgccgggcc ggcacggccg aacggtacgg 3180 gcgggccctg ggtccggtac cgcagatcgc cgtcccggtc accgctccct gggccgaccc 3240 ggtgtggcac ctgtacgtga tccgctgcgc ggagcgcgac gagctgcgcc gccggctgga 3300 acgagccggg gtccagaccc tgatccacta ccccgtgccc ccgcaccggt ccccggccta 3360 cgccgacgac ccggccggcg caccggcggg gacccacccg ctcagtgagc gcctggcggc 3420 gcagagcctc agccttcccc tgggaccgca cctcggggag gacgaggccc gcgccgtcgt 3480 ggcggcggtc cgggcggcgt ccgcagggct ggcggcgtac ccgacgccgg acggccagcg 3540 ttttcctcta gtgacggaga aacgatgacc gaggtcatgt cagggcgtcc cggaatgaaa 3600 gggatcatcc tcgcaggcgg cggagggacc cgcctacgcc ccttgaccgg cacgctgtcc 3660 aagcaactgc tgcccgtcta cgacaagccg atgatctact acccgctgtc cgtcctgatg 3720 ctgggcggca tccgcgagat cctcgtcgtc tcctccaccc agcacatcga gctgttccag 3780 cggctgctgg gcgacggctc ccgcctcggc ctcgacatca cctacgccga acaggccgag 3840 cccgagggca tagcgcaggc catcaccatc ggcaccgacc acatcggcga ctcaccggtc 3900 gcgctcatcc tgggcgacaa catcttccac ggccccggct tctcggccgt gctccagggc 3960 agcatccgcc acctcgacgg ctgtgtgctg ttcggctacc cggtcagcga cccgaagcgc 4020 tacggcgtcg gcgagatcga cgaccagggc gtactgctgt ccctggagga gaaaccggcc 4080 cggccccgct ccaacctcgc cgtcaccggc ctctacctct acgacaacga cgtggtcgac 4140 atcgccaaga acatccggcc ctcggcgcgc ggcgaactcg agatcacgga cgtcaacagg 4200 acctacctgg agcagaaacg cgcccggctc atcgaactgg gccacggctt cgcctggctc 4260 gacatgggca cccacgactc cctcctccag ggcggccagt acgtccagct catcgagcag 4320 cgccagggag tgcggatcgc ctgcatcgag gagatcgccc tgcgcatggg cttcatcgac 4380 gccgacaccc tccaccggct cggccgcgaa ctgggcacct ccggatacgg cgcgtacctg 4440 atggaggtgg ccacccgtgc aggcaccgaa tgagacgccg cgccggcccg cccgctccgc 4500 cggccgacgg ccgccggccc ggatcctcgt caccgggggc gccggcttca tcggctcgcg 4560 cttcgtgaac gcgctgctgg acggctccct gccggagttc ggcaaacccg aggtgagggt 4620 gctcgacgcg ctcacctacg cgggcaacct ggccaatctg gccccggtgg gcgactgtcc 4680 ccggctgcgg atcttcccgg gggacatccg cgaccgcggc gcggtcaccc aggcgatggc 4740 gggggtcgac ctggtggtgc acttcgcggc cgagtcgcac gtggaccgct cgatcgacga 4800 cgccgacgcc ttcgtgcgca ccaacgtgct gggcacccag gtcctcctcc aggaggcact 4860 ggccgtacgc cccgggctgt tcgtgcacgt ctcgacggac gaggtgtacg gctccatcga 4920 ggaggggtcc tggcccgagg agcacccgct gaaccccaac tcgccctacg ccgcctcgaa 4980 ggcgtcctcc gacctgctgg cgctggccca ccaccgcacg cacggactgc cggtgtgcgt 5040 cacccgctgc tccaacaact acgggcccta ccagtacccg gagaagatca tcccgctgtt 5100 caccagcagc ctcctcgacg gcgggaccgt cccgctctac ggggacggcg gcaaccggcg 5160 cgactggctg cacgtggacg accactgccg gggcatcgcc ctggtggccc ggggcggccg 5220 gcccggcgag gtctacaaca tcggcggcgg caccgagctg agcaacgtcg agctcacgga 5280 gcgtctgctg aaactgtgcg gagccgactg gtcggcggtg cggcgggtgc ccgaccgcaa 5340 gggccacgac cggcgctact ccgtcgacta caccaagatc gcggacgagc tgggttacgc 5400 gccgcggatc accatcgacg aagggctgga gcggaccgtg cactggtacc gggagaaccg 5460 cgcgtggtgg gcgcccgcga agagggggcg atgacggtga cgaccgcatc cgtggacccg 5520 ctcgacctgt ggctccgccg gtaccagccg tccgcgtcac ccgccgtccg gctggtgtgc 5580 ttcccgcacg cgggcggctc ggcgagttcg ttcctgccgt tcacccggca gctgccggac 5640 cggatcgagg tcgtggccgt ccagtacccc gggcgccagg accgcaggag cgaaccgctg 5700 gtcgacacca tcgagggact ggccgagccc ctggccggcc tgctggaggc gcaggccggc 5760 cccccggtgg tgctgttcgg gcacagcatg ggcgcgctgg tggcctacga ggtcgcccgc 5820 gcgctccagc ggcggggagc ggctccggtg cgcctggtgg tctccgggcg ccgggccccc 5880 gccgtcgacc ggccgatgac cgtgcacctc tacgacgacg accggctggt cgaggaactc 5940 cgcaagctcg acggcaccga cagccaggtg ttcgccgatc cggagctgct ccggctggtg 6000 ctgcccgtga tccgcaacga ctaccgggcc gtggcggcct acgcccaccg cccgggggcg 6060 ccgctggact gccccctcac cgtgttcacc ggcgccgacg accccaccgt gaccgcggcc 6120 gaggcggcgg cctggcacga ggcggcggcg tccgacgtcg agacgcgcac cttccccggt 6180 ggccacttct tcccgtacca gcggaccgcg gaggtgtgcg gggccctggt cgacacgctc 6240 gagccgctgc tgtcggccgg gacgcgcggt gtccggcggg tccgcccggg gtgacgtggg 6300 cacggtcgag tacgccgtcc accggcgtac cgcggaacgg gtgagggtct ccgccgacac 6360 cctggacagc ccggtcaccg cgctggcgga ggtgccccgc tggctggagg aataccaccg 6420 ggcgcaccgc ttccacgtcg agccgatccc cttcgaccgg ctccggcggt ggtccttcga 6480 gccgggcacc ggcgacctgc ggcacgagac gggccgcttc ttctccgtgg aggggctgcg 6540 caccagctcg gacgccgatc cggtcgcccg tgtccagccg atcatcgtgc agcccgaggt 6600 ggggctgctc ggcatcctgg cccgggagtt cgacggggtg ctgcacttcc tgatgcaggc 6660 caaacccgag cccggcaacg tcaacgggct gcagatctcc cccacggtgc aggccacgcg 6720 cagcaacttc gacgaggtgc accacggccg gtccaccccg ttcctcgacc acttcatcca 6780 ccgccccggc cgccgggtcc tgatcgacag catccagtcc gaacagggcg actggttcct 6840 gcacaagcgc aaccgcaaca tggtcgtcga gatcgacacc gacatcgagg ccgacgccgc 6900 gttccgctgg ctgaccctcg ggcagatccg ccggctgatg ctccaggacg acctcgtcaa 6960 catggacacc cgcagtgtgc tggcctgtct gcccaccgcg cacggcacgc ccgacgacgg 7020 tgacgactcc ttcccggcgg cgctgcgccg ctccctctac ggggagaccg cgccgttgca 7080 cgatctgcac gccatcacca gctgcctcac cgacgtccgg gcgctgcggg tgctgcgcca 7140 gcagagcgtg ccgctcgacg acgcccggcg ggacggctgg gagcggaccg ggagcgcgat 7200 ccggcatcgc agcggcaggc atttcgagat catggcggtg gaggtgaccg cggagcgccg 7260 tgaagtggcc tcgtggaccc agccgttgct gcgcccgtgc tcgcagggac tggcggccct 7320 gatcacccgg cggatcaacg gggtgctgca cgccctggtg gcggcgcggt cggaggtcgg 7380 cacgctcaac gtcgccgagt tcggaccgac cgtccagtgc cggcccgacg aggcggacgg 7440 ccagtcgccc ccgtacctgg accgggtgct gacggccgga gccgaccgcg tccgctacga 7500 cgtggtgcag tcggaggagg gcgggcgctt ctaccacgcg cgcaaccgct atctggtggt 7560 cgaggcgggg ccggagctcg acacgggctg cccgcccggc ttctgctggg ctaccttcgg 7620 ccagctcacc gaactgctcg cgcacggcaa ctatctcaac gtcgaactcc gcaccctcat 7680 ggcgtgcgca cacgcctcct actgaatggt cacgaaagct gcaccgcgcg ggagaatcgg 7740 cagcgcgcca ccggccggcc ggcacccgga aggtaaagcg ccgttctccc gcatcggcgc 7800 cctgcgggaa acggcggaac ggccggcccg gaccgcgcgc aattcccggc gggacacggt 7860 gggagcccgc acgaggaacc gctttccccg ccttcggtgc gcccggccgc gggaccaccc 7920 ccgcctcccg gccgggccgc ggaatacgac gggggcggcc gaggacattc ctttcccgcc 7980 tccggaaaag cgcgccccga gggcccccga atgccgggcg ggacggacgg cgactgcgcg 8040 cggacggcgg cccggcgtcg aacgcacctg cccgagtccg gacgagacag cgcgacgcga 8100 gaggcgaaaa tgatcaatct cttccagccc cagatggggg ccgaggaact ggcggcggtg 8160 tccgaggtct tcgacgacca atggctcggt cacggacccc ggaccgcggc gttcgagtcc 8220 gcgttcgccg agcacctcgg ggtcggcccc gagcacgtcg tcttcctcaa ctcgggcacc 8280 gccggcctct tcctggccct ggagtcgctc ggcctgcggc ccggcgacga ggtcgtgctc 8340 ccctcgccca gcttcctcgc cgcggcgaac gccgtacagc tctcgggagc gcgcccggtg 8400 ttctgcgaca ccgacccgcg gacgctgaac cccgccctgg agcacatcga ggcggccgtc 8460 accccgcgca ccagggccgt catcgcgctc cactacggcg gccaccccgg cgacatcgtg 8520 cgcatcgccg agcgctgccg ggagcggggc atcaccctga tcgaggacgc cgcgtgctcc 8580 gtggcctccc gcgtcgacgg ccgaccggtc ggcaccttcg gcgacctcgc catgtggagc 8640 ttcgacgcca tgaaggtcct ggtcaccggc gacggaggga tgatctacgt caaggacccc 8700 ggggcggccg cccggatccg gcgcctcgcc taccacggcc tcacgcggtc cagcggcctg 8760 ggatacgcca gggtctcggc gcgctggtgg gagatggacg tccccgaacc gggccgccgc 8820 gtcatcggga acgacctcac cgcggccatc ggcgcggtcc agttgcgccg gcttcccggc 8880 ttcgtggccc gccgcaggga gatcgtcgcc ctgtacgaca gcgaactgag ctcgctggag 8940 ggcgtgctga caccgcccgc gccacccgcg gggcacgagt ccacgcacta cttctactgg 9000 atccagctgg cccccggcgt ccgggaccgg gtggcacgcg acctgctcac cgacggcatc 9060 tacaccacct tccgctacgc acctctgcac aaggtgcccg cctacggcca caccggaggc 9120 gaactgcccg gcgtggagcg ggcgtccgaa cggaccctgt gcctgcccct gcaccccggc 9180 ctgtcggacg ccgacgtccg caccgtcgtg tcctccctgc gcagagccct gagcgccgcg 9240 gatccggccc ccgcctgacg cgcgcacgcg ccacggcccc tgtcccggcg gtgaccgccg 9300 ggacaggggc cgtggcgcgt cctgcggacg gtccgggcca ccccgccgtc ccgtcggtgc 9360 gtcagcgacg cgtgccgagg aagaagcccg gtgagccctc gcccgtcacg acgtactcga 9420 cgtccaggcc ggccttgcgg tacgcggcct cgtactccgc acgcgagaac agcgtgaggt 9480 agtccacctc gctgcggtgc cggatgccct ccgcggtgtg cgcgatcagg tagtggatct 9540 ccatccgggt ccgcccgccc tcccgggtcg agtgggagac acgggcgacg ccctggtcgc 9600 ccggtgccgt ccgcagggcg tgggtggaga cgtggccgtc caggaaggtg tcggggaagt 9660 accacggttc gacggccagg acaccgtccg cggtcaggtg ccgcgccatg gcggcgacgg 9720 cgtcctccag gtcggccgtg gtctccaggt acccgatcga gctgaacatg cagaccacgg 9780 cgtcgaacgt ctcgccgagg tcgaacgccc gcatgtcacc gcggtggagg gtgacgccgg 9840 ggagccgctc ctcggcgcgg gccgccatcc actcggacag ctccaggccg ctcacgcggt 9900 cgtagagctt ggcgaaggcc tccaggtggg taccggtgcc gcacgcgatg tcgagcaggc 9960 tggccgcgtc cggcgtacgt tcccggatca ggtcggtgac ccgggcggcc tcacccgcgt 10020 agtccttgcg gtcctggtag agcaggtcgt agacctcggc ggcactgtcg ttctcgtaca 10080 tgggaatcct ccgggccgtg aagggggaac cgtgggtctg tcgaagagga gtgcgccgtg 10140 cgctcggggc gggggcggcc tgccgccggc ccctcgcgat gatctccgta cggacaccca 10200 acagttcacg ccgagccggg gtcaaggaac gacggggtgg tcagtcaagt cgggcgctcc 10260 gcccccgggg cggggcgcgc cggcgacgcg cacggattcg gccaaccggt tgctcgttcc 10320 gccggaaatc acggtgtggc ccccgggcca ccgggtagct tatgcctcgt tcaccgcagc 10380 ggttgaagag gcagccttca accccggccc ggcctttatg gaattcattt ccaccgtgcc 10440 gcaacaccca ctgaaggacg gccggatatc ggccatgaag ccccggcctt tcagccaggc 10500 accctctctt gtcgaataga gtatgtcctc cgctgaagcc gccgaagacg gacgaagggg 10560 acgaacggtc acctcggtcg atctagacgg aatccttgaa agcgtaatag cctgtcaatg 10620 ctttggtaaa gcacagggat gggggtgcct gcgggatgag tgacctgggt tctggtgaag 10680 aagggtccga agaagacgag tcggacgacg cactcgcctt cctcgagttc atcgcccggt 10740 cggcaccacg gagcgaatac gaccggctca tggcccgcgc cgaacgctcg ggcgccgacg 10800 aggaccggat gcgccgactg gagcgcttca accggctcgc cctcaccgcg cagtcgatga 10860 tcgagtaccg ccgcgaccgg gaggcggagc tcgcggccct ggtcgacgcc gcgcacgagt 10920 tcgtcgccgc ccggcggggc aaggacctgc tggagtccat cgcccgcaga gcacggctgc 10980 tgctgaagct ggacgtctcc tacgtcggcc tgcacgagga ggaccggccc ggcacggtgg 11040 tgctgagcgc cgacggcaac gcggtcaagg tcgccgagag ctaccggctg ccggccgacg 11100 gcggactggg cgccatggtg cgcacctgcc gcgctccctt ctggaccccg gactacctcg 11160 gggacaacag cttcacgcac gtcgaggccg tcgacgacat cgtccgcgcc gaaggcctgc 11220 gcgcggtcct ggccgtcccg ctgtgcgccg ggggcgaacc gatgggggtc ctctacgtcg 11280 ccgaccgtca ggtgcggcat ctgaccccca acgaggtcac cctgctgtgc tcgctcgccg 11340 atctggccgc ggtggcgatc gagcgcaacc ggctggtcga ggagctccac gacaccatcg 11400 ggcaactgcg ccaggacatc ggcgaggccc gcaccgccct cgcgcgcacc cgcaggtccg 11460 ccgacctcca gtcgcacctg gtcacgcagg tgatggacag gcgcggcgcc gactcgttac 11520 tcgcgacggc cgccgaggcg ctcggcggcg gagccggcct gtgcagcccg ctcgggcgcc 11580 cgctcgccga gtacgggacc ctgcgccccg tcgcccccac ggaactgcgc gcggcgtgcc 11640 gccgggccgc cgagaccggc cggcccacct ccgtggcccc gggggtctgg acggtgcccc 11700 tgcttcccgg gggcaacgcc ggcttcctgc tgaccgacct cggtccggac gcggaccaca 11760 ccgccgtccc cctgctcccg atggtcgccc gcaccctcgc gctgcacctg cgcgtccagc 11820 acgacgactc ccccaaggcg cagagccacc aggagttctt cgacgacctg atcggggcgc 11880 cccgctcacc cacgctcctc agggaacgcg ccctgatgtt ctccctcagc ttccgccgcc 11940 cgcacgtggt gctggtggcg gacggacccc gcgggacctc gccgcggctg gaggcctccg 12000 gcgccgacta cgcgaaggag ctcggcgggc tgtgcagcgt gcgggacggc gccgtcgtcc 12060 tgctgctgcc cggcgacgac cccgtcgccg tggcgcagac cgccgccccg gagctgaccg 12120 accgcgccgg gcaccccgtc accgtggggg tcgcgggccc cgcctcgacc gtcgacggca 12180 tcgccgacgc gcaccgtgag gccgcgaagt gtctggagac cctccgcgcg ctcggcggcg 12240 acggcggcac cgcgtgcgcc tccgacctgg gtttcctcgg catgctcctc gccgaggaga 12300 acgacgtccc cggttacatc aggacgacga tcggccccgt ggtcgactac gacacccacc 12360 gcttcacgga tctggttccc actctgaggg tgtacctgga gtcgggcagg agccccacgc 12420 gtgccgcaga gacactgcgc gtgcacccga acaccgtctc acggcggctg gagcgcatcg 12480 gcgtactgct gggagaggac tggcagtcac cggagcgggt gctggacata caactggccc 12540 tgcggctcta tcaggtgcgc tcggcgctct cctcgcaacc ggcgtccgag acccgggccg 12600 tgctcggatc gctgcgcgag tgacctctcc ggcacgggcg gcgccccgcc cgtcggcgcg 12660 gatcgcgccg acaggcgggc gttgaccacc ggccaccggt cccccgtacg acgaggtccc 12720 gggcccgcgt ggttcagccg gcgctgaact cggcgatgcg cccgtctccc atggtcagcc 12780 gggcgccggt gaaccgggac cgcatccgac ggtcgtgggt gacgaccacg acggcgccgc 12840 ggtagtccgc gagtgcctgc tccaactcct ccaccagcac cggggtgagg tggttggtgg 12900 gctcgtccag cagcagcagg tccatcgggt cgctcaccag ccgggcgatc tcgatccggc 12960 ggcgctgccc gtaggacaga tccttcacgc gtcgccgcag gtcggacggg ctgaacaggc 13020 cgagcgacag cagtttctcc gcgtggtcct ccaggtagcc ctcccggccc tgggcgaagg 13080 cccgcagcac ggtcagtccg ggcgcccagg gcgtctcgtc ctgccgcaga tgaccgaccc 13140 ggcagccgac gcgcaccgag ccgccgtccg gctccagttc cccggacagc acccgcaaca 13200 aggtggactt gcccgcaccg ttgggacctg tgacgagcag ccgttcgccg ggccggatcg 13260 tcagggagtc cacggcgagc cgacccgcga cgcgcacgtc ggtgagttcg gccaccgcct 13320 cctccgcctc cgggcccgcg gtgtcgatgc gggcggcgaa ggacaacggg tcggcgggag 13380 cgtggaccgg gttctcggtc agctgcgcca cgcgttgctt cgcgttgcgg atccgcacca 13440 tcgcgccgtg gtcgcgccct cgcctgcggt aggcgccgtg gccgaacacg gagagggaca 13500 tcttgcgcgg gatgccgtcc atccgcgcca cgttggaggt gatcagcccg cggttgcggt 13560 cgagttcggc acgccactcc tcgtactccc gcagccgccg ctcgcgttcc acggccttgg 13620 ccgtcaggta gccctcgtag ccgttgccgt agcgggtgac gctgccggag tcgacctcca 13680 ggatcgtggt ggtgagccgg tcgaggaaga cccggtcgtg ggtgaccgcg atcaccgtgc 13740 cgcggtggcc ggccaggtgg tcctccagcc attccatcgc ccggtcgtcg aggtcgttgg 13800 tcggttcgtc caggagcagc agctccggcg acgaggcgag ggtcgcggcg agcgcgaggc 13860 gggagcgttc gccaccggag agggttccga gcttgcggtc gcggtccagg ctcggcagtc 13920 cgaggccgtg cagcgcgacc tccacgcgca cgtcggcctc gtagccgcca cgcgcctggt 13980 actgctcgac cagagcggcg tagcgctgga ggccggcgga cagctcgcgc tcggagccgt 14040 tctcgtcgct ctcgcccagc tccgcctcgg cctcgcgcat cgccgcttcg agctcgcgca 14100 ggtcggacag ggccaggtcg acggcgtcct ggacggtggc gtcgaggggc agttccagtg 14160 tctgcgccag gtagccgacg ccgccgggag cgaccacggt gagcgcgccg ttgtcgggct 14220 ccacgcggcc ggcgaggatc ttgagcagcg tggacttgcc ggaaccgttg tcgccgatca 14280 cgccgacctt ctcgcccggc ttgatgctga aaccgacccg gtcgagcacg acacagtcgt 14340 ggtagcgctt cgtgatgtcg tgtagggcgt attgcgcaat cgacacgcgt aagtctcctg 14400 tttccacgat gaggatgagt ggatgcgtga gcgcgctcgc agaaagaacg gaaagcagaa 14460 gggacgccac cactgcggac atggccggtc agggggtgtc acgagcacgc tgctggatgc 14520 ggcaggcgga gtcagctcaa cgccgggcat cctcatctat cacagagatc ccatgcgaag 14580 aactatagcc gtgctacccg gtgccgcgca acggtatgcg tgtcgcaccg gccgacgtga 14640 tgcagtcgga ccgggatgat cgcttgtccg gcggccggat gcctagcctc gggagcaacc 14700 acagcggtct ttcacgagag gggtcgacca tgggcgatct caggaaccgc atcaccgagc 14760 tggtccgcgc gtaccaccgg gaacaggcgc ccgggggctt cgttcccggg acgacgcacg 14820 taccggtctc cggcgcggtg ctgagcgagg aggaccggct ggcgctggtg gagacggcgc 14880 tggagatgcg gatcgcggcc ggcccggcct cccggggctt cgagcggcag ttcgcccggt 14940 acctcgggct ccggaaggcg cacctgacca actccggttc ctccgccaac ctcctcgccc 15000 tcggcgcgct cacctcgccg cagctggagg agagacggct gcgtccgggg gacgaggtcg 15060 tcacggtcgc cgccgggttc cccacgacgg tcaacccgat cttccacaac gggctggtgc 15120 ccgtcttcgt ggacgtcgag ctcggcacgt acaacacgac gcccgagcgc atcgagcggg 15180 ccatcggccc ccggaccagg gcgatcatga tcgcgcacgc cctgggcaac cccttcgagg 15240 ccgaagaggt ggcccgcctc gcggacgagc gggagctgtt cctcatcgag gacaactgcg 15300 acgcggtggg gtcccgctac cggggcaggc tcaccggctc cttcggcgac ctgtcgaccg 15360 tcagcttcta tcccgcgcac cacatcgcga tgggtgaggg gggctgcgtg ctcaccgaca 15420 acctggccct ggcgcggatc gtggaatcac tgcgcgactg ggggcgcgac tgctggtgcg 15480 agccgggtga ggacaaccgc tgcctcaagc ggttcgacca gaagatgggt gacctgccgc 15540 ccgggtacga ccacaagtac atcttctcgc acgtcggtta caacctgaag tcgaccgacc 15600 tgcaggcggc cctcgggctg tcccagctga cccggatcga ggagttcacc gaggccaggc 15660 gcgccaactg gcggcatctg cgcgccgcgt tggacgggct gcccggtctg ctgctgcctc 15720 atgccacacc gggcagcgat ccgagctggt tcgggttcct catcaccgtg gacccggacg 15780 ccgcgtacag cagggcggcc ctggtcgacc acctggaatc gcgccggatc agcacccgcc 15840 gcctgttcgg gggcaacctc gtgcggcacc ccgcctacac cgaccgtcgg taccgggtgt 15900 ccggctccct ggagaacagc gacctgatca ccgaccagac gttctggatc ggggtcttcc 15960 ccggcatcac cccggagatg atcgcctacg tcggcgacac gatccgggag tgcgtgctca 16020 agcactcctg aggggcggcg gtacgggggt gcgcgtggag gggaggaccg gggcggtcct 16080 cctccggggc gtcacggccg cggaagcgtc cgaagctccg aggcgaggtc ggggtggacc 16140 cgcgcggtga gcagggtgcc ctccggcgtg tgctcggtgc tgagcacctc gccctcgtcg 16200 tgcacccgcg ccaccaggct cccctcgtcg taggggatca cgacctccac ctccacctcg 16260 gggtgcggca gcaggcggtc gatcagttcc cgcagctcgt cgatgccccg acccgaacgg 16320 gcggacacga cgatcgcgtc cggctcctgc tccagcagac gggcgaggac gtccgggtcc 16380 gcgacatcgg ccttgttgac gaccacgacc tcggtggact cgccggcgcc cacgtcccgc 16440 agcacctcgc gcaccgaggc cagctgcgcg ccggggtccg ggtgcgaacc gtcgaccacg 16500 tgcagcacca gatgcgcgtc cgcgacctct tcgatcgtgg aacggaacgc ctccaccagg 16560 tggtgcggga ggtggcgtac gaagcccacg gtgtcggcga tggtgtaggg gcgcccgctc 16620 ggcgtcgtcg cccgccgcac ggtcgtgtcc agggtggcga acagggcgtt ctccaccagc 16680 acgccggctc cggtgaggcg gttgagcagc gatgacttgc cggcgttggt gtagccggcg 16740 agggcgaccg acagcacctt gttgcgccgt cgctcctccc ggttcacgtc ccggccggtc 16800 ttcagctgct ccagctcccg gcggagcctg gccatcttgt cgttgatccg ccgccggtcc 16860 gtctcgatct tcgtctcacc gggaccgcgc gtggccatgc caccgccgcc accgccgccc 16920 atctgccggg acagcgactg gccccagccg cgcagccgcg gcagcatgta ctgcatctgc 16980 gccagcgcca cctgcgcctt gccctcccgg gactgggcgt gctgcgcgaa gatgtccagg 17040 atcagggccg tgcggtccac gaccttgacc ccgacgacct cctccaggtg catcagctga 17100 ctggggctca gttccccgtc gcacaccacg gtgtcggcgc cggtctcctc gacgatgtcg 17160 cgcagctgcg acgccttgcc cgagccgatg tacgtcgccg ggtccggctt ctgccggcgc 17220 tgcacgacgc cgtccagcac gagggcgccc gcggtctcgg cgagcgccgc cagctcggcg 17280 agcgaactgt cggcctccgc ggccgttccc gaggtccaga tgccgacgag caccacccgc 17340 tcgagtcgca gctggcggta ctcgacctcg gagacgtcgg tcagttcggt ggagagcccc 17400 gcgacgcggc ggagggaggc ccggtcctcg cggtctaact gatcgccgtc ccattcctcg 17460 gcgtcggcgc cggccatcgt gtcgtccatc agtgcgtcgg ctcgctgcgt gccggcgaag 17520 tcctcgggat gcgtcaaagt acttccaatc tggggggttc gagagcgttc cggggcgggg 17580 cgcgtccggc ctgcggggcc gggcgcgggg ccggggggtc ggggccgacg tgtccgcacc 17640 tcgccgtcgg gggccggtgc cgtggaggtc gctgccggaa ctcacatgcc gtccacccta 17700 gccatgtcgc cggggtgtgc aaggacgtat cggcgatcac ctccccagct gacagagtgt 17760 gcaccgggta ctgcgcccgc gggcgtgaag cgggcgagtg tggatgtcat gcgagtactc 17820 attatcgggg gttcacagtt cgtgggccgg gccttcgccg ccgaggcact ggccgcgggg 17880 caccgggtca ccacgttcaa ccggggtgtc agcggcaccg acctgcccgg cgtcgaggcg 17940 gtcaggggcg accgcgaggt ggccggcgac ctggagcggc tggtgtccgg aaggcactgg 18000 gacgcggtcg tggacacctg cggttacgtg ccccgcacgg tgggggcctc ggccgcggcg 18060 ctgtccgggc acgcggacac ctacctctac gtctccagca tcgcctgcct gcccgactgg 18120 gcgcaggcgg tccgtccggt ggacgacgac tcacctgccc acgactgccc gccggacgcc 18180 ggaccggacc acgccgacgg tgactacggc gtcctgaagg ccggctgcga gcgcgccgtg 18240 gaccggcact tcgcgggccg gaccctgcac ctgcgggccg gtgtcatcct cgggccgcac 18300 gacaccatgc gcatgctcga cgcctggctg tggcgcatgc gcgtcgccga gggggagcac 18360 cgccgggtgc tcgccccggg caaccccgag gtgggcatgc gcctgatcga cgtacgcgat 18420 gtcgccgtct tcggcctcga ctgcctcgcg gacggccgta ccggcgcctt catcgtcaac 18480 ccgccggaga agaacaccac cttcggggag ttgctcacgg agtgcgtcaa ggccaccggt 18540 tcggccgcgg agccggtgtg ggtcgacgag gggttcctcg ccgagcacgg cgtgagtccg 18600 tggacggacc tgccgatgtg ggtgcccgac accgcgcggg acaccctcgt gtgggcggcc 18660 ggagcaccgc gcgcccgggc cgcgggtctg gcctgccggc ccttctccga caccgtgcgg 18720 gacgcctggg aggtcgtccg ggaccggccc gtcccggaac tgccgctcgc ggccggctgc 18780 ggcctgtccc tgagccggga gaaggagctg ctcgccgcct gggacgctcg cggcggtgcg 18840 gcggcgggct gacgcggccc ccgaggagtg cgacgccgtt tcccgctcgc ggggagcggc 18900 gctcgcgtgt ccgccccgcg gcccggcggc gcgtcctgtg tcccggcgcc cggggcgcgg 18960 ctacacggtg aaggtctcgg cgcgggccac gatctcgtcg accagccccg cctggcgcag 19020 cgcggcgtac gactcggcgg agacgtcctc ggcccggatc accgcacggc ggaagaccga 19080 caggatgttc acgaagtgcc ggtccacggg caggacgcgc tcctcccggt ggtcctggcg 19140 ggacagccgc agtacggggt ggtggctgtc cggggtcgtg aagacgtggc tcagggcgag 19200 cgagccggtg ctgccgtgca gctcgtacgc cgagcggtag ccgtgttcca tgccgaaggc 19260 gaggtgggcg gccacgccct ggggggcggc gagcaggacg ctgccggaga ccacgacgcc 19320 ccggcggcgg tcacggcgca gcacggcgcc ggtcaggcgc agttcgggtc cgaggaagtg 19380 cagcgcggcc cgcagcgggt agacgccgtt gtcgagcagt gcgccgccgc cgatgtcggg 19440 tcggtagcgc atgtcgtcgt cggcgcgcgg cgggatggtg aaggcggcgg agaaggtgcg 19500 cagctctccg atggcaccgg cctccaacag ggctttgacg gtggcgtgtt gagagtggtg 19560 gaggaacatg aagttctcca tcagtaccag tccgcgctcc cgggccatgg cgaacaggcg 19620 ggccgcgtcg gcgtggttgg cggcggcggg cttctccacg aggacgtgtt tgcccgcccg 19680 cagcgccgcc gcggcccatt cggcgtgcag catgctgggc accgcgatgt agacggcgtc 19740 cacgtcgggg cgttccagca gggcctcgta gggcgcgacc gcctcgcagt cgaagtgcct 19800 gcccagggcc ttggcccggt ccgcgtcgcg gctgccgacg caggtcagca cggtgccggg 19860 ggtggagagc agggcgggca gggtgcgacg gcccgcgatg tcgccgcagc cgatcgctcc 19920 gaagcgcagc accggggacg cttccggccg cggcgggccg ggtgcggcga acggttcagc 19980 agaagtaccc agggcggtca tggatggttc cgtcaatcgg tccggatggt cacggcacag 20040 cgtggtgaac ggccggcgca cacccacgag tcgcttccgg caatgggcgg ccctgaagct 20100 acccggcggc ccgacgcgac ggcaaggccg atctgacaca gtgccgcgcc gagggaccgt 20160 cggtgccccg cgtacccgct gacctgacac tacgccgacc aatctgtgga cggggcggtg 20220 gccgcccggg ttaggtgagc gcggcgcccg cggtgaccgc gacgccggtc cgaagcggcc 20280 ctcggggcac gccgttggag agaggagacg cgggtgacgg acgcgatcac gaccgagctg 20340 gccgaccgcg aactggggcg cagactgcac cggatacgcg gcgtccactg gtatttcggc 20400 aaccacggtg acccgtacgc cctcatcctg cgcggtcaga ccgacgaccc gtcggtgtac 20460 gaggagcggg tccgcgaggg cgggccgctg ttccgcagcc gtaccgggac ctgggtgacc 20520 gcggacccgg aggtggccgc ggccgtgctg ggcgactcgc gcttcggtgc gctggaccgc 20580 gccggacggc gcccggagga gtacctccag ccgtcgcccg ccacgtacct ggggctggac 20640 cgcgccgcgt acgcgcgtct gcggcgggtg gccgagcccg tgctgggcgc ggacgccgcc 20700 gccgcgtggc gccggctcgg cgaggacgtc gggcgccggc tgctcgccgg ccgcggttcc 20760 ggcctcgacc tgacggcgga cttcgcccgc cggctgccgg cattggtcct ggccgcgtgg 20820 ctcggggtgc cgggcgaacg gtgcgacgag tgggaggagt cgctgcgggc ggcggggccg 20880 ctgctggacg gtctgctgtg tccgcagacg ctggcggcca cccgtgcggc ggactcggcc 20940 gccgaggggc tgcgcgcgct gttggacgag gtggtcgccg cgcgtcccgg cgggtccggc 21000 gagggtgcgg tggcccgcat ggtcggcgcc ggagccgccc ccgacgacgc ggtggccgcc 21060 gccgtgtgcc tggcgctctc ggccgtcgaa ccgacgacga ccctggtgtg cgaagcggtc 21120 cggctgctgc tcgaccgacc cgagtggtgg cggcggttgt gcgactcccc cgctctggcg 21180 ccggccgcgg tccggcacac cctgcggcac gcgcccccgg tgcggctgga gagccgggtg 21240 gcccacgagg acgtgacggt ggcggatcgt ccgctgcccg ccgggagcca cgtggtggtg 21300 ctcgtgggcg cggcacggcg cgcgggcgcc ccggccgcgg agccggcgga cctggcgggc 21360 gcaccggcgg cggagctgcc ggacgacctg tggttcgcgc tgtccgggga gttcgtcggc 21420 cgtgccgccg agaccgcgct gggcgtgctg gccgaggccg ccccgggact gcggcgggac 21480 ggcgacatcg tccggcggcg ccgttccccg gtcctcggca ggtacgcgcg gttccccgtc 21540 gcgtactcct gacgggcccg cggccggcgt cccctcagtc ccccacgacg tttcatgaaa 21600 ggagtgccgt gcgcgtcctg gtgacctcca tcccgcacca cacgcactac taccacctgg 21660 taccgctgat ctgggctctg cgtgcctcgg ggcacgaggt ggtggcggcc ggccagccgt 21720 cgctggtcga cgccatcacc gccagcggca tcccggcgtt cgccctggcc gaggaggagt 21780 cgctggcgca gatcttcgag gaggtcgagg gcgatctcca gccgtatcag cacggcatcg 21840 acgagttcga cttcttcggc accctgaagg acgagctgga ctgggagaag ctgctcgccc 21900 agcaggtgat cctgtccggc ctgtggctgg aaccgctcaa cggcgccacg accctcgaca 21960 gcatcgtcga cttcgcccgg gcctggaagc ccgacctggt gctgtgggag ccgttcacct 22020 atgcggggcc ggtggcggcc cgggcgtgcg gggccgcgca cgcccgcgtc ctgtgggggc 22080 cggacacgat cgggctgctg cggacgaagt tccttcaggc ccaggcgcgt cagcccgagg 22140 agcaccggga cgacccggtc gcggagtgga tgacctgggc cctggcgcgc tacgggtgcg 22200 acttccggga ggaggacgtg ctcggtcagt ggagcgtgga cccgatggcg gagggcgtca 22260 gtctgggcct cgacctgccg accgtcccga tgcgctacac cccgtacaac gggtcggcgg 22320 tgatccccga ctggctgacc gaggaaccga aacggcctcg ggtctgcctg accctggggg 22380 tgtcctcgcg ggagcacagt gaggacgagg tcccggtgca gaggtttatc gaggcgctgg 22440 ccgatctcga catcgagctg gtggcgaccc tggacgacgc ccagcgggac ctgctgccga 22500 ggatcccgga caacacgcgc atcgtcgact tcgtgcccat ggacgcgttg ctgccgacgt 22560 gctcggcgat catcaaccac agcggttcgg gcacgtgcaa caccgccgcg ctgcacgggg 22620 tgccgcagat catcctcggc ggcatcctgg acgccgccgt acggcagcac atgttcgcgc 22680 agaactccgc cgccctcacc ttcgctccgg aggaggtgac cggcgcgtcg ctgaggagcg 22740 cgctggtgcg cctgctcgag gagccgcggt tccgcgacgg cgcgcggcgg ctgaaggagc 22800 ggatgcgggc catgcccagc ccggccggga tcgtgccgac cctggagcgc ctcacggccc 22860 agcaccgccg ggcgtgttga accggcgcgc gggcccgtgc cggcggtgac cgcccgaccc 22920 gactctcgcg tgtgatcgat ctcgtcgact cagccgtgga ccggttcgcc tgtccgcgcc 22980 cgacactgga gtgctgatgc gggccctctt cacgaccgcg ccgctcgcgg gccacctgct 23040 tccgctggtg cccatcgcgt gggccctgcg ggcggccggc cacgaggtac tggtggcgac 23100 ccgggaggac ttcgtgccgg tcgccctgcg gtcggggctg ccgtccgcct cgtgcgggcc 23160 gcccgccgcg gacctggcgg gcgcggccga ggcgggggcg ctcgcgcggc cccgcggagc 23220 ggcggaggct cggggggtcc tgagcggggc gctggcgcgc gtcgcccggg gcagtctggc 23280 gggggtgcgg cggctggcgg acgcctggcg gccggatctg atcgtcagcg aacgggccga 23340 gttcgccggg ccgctggtcg cggcggccct cggggtcccg tgggtccgct accactggtc 23400 ggtctcgtcc ctggaggagt accggcgagc ggccgaggcc gagttcgcgc ccgagctggc 23460 ggcgctcggc ctcgaccggt tcccggaggc ggcgcgcgtg ctcgatccgt ggccggtgtc 23520 gctgcgccgg ccggacgcgg tcgcccacga cggggtccgg cacgtaccgg cccacgggga 23580 cgcccccgtc cccgactggg cgttcacgcg cggtcgcggg ccgcggatct gcgtgacgct 23640 cggcaccatg ctgccccggt acggcgccgc cgggatggcc gacttcctga cggagctggt 23700 ggcggagacc cgcggagggg actgcgaact gctcgtggcg gtcgacgacg acgtcgtcgc 23760 gcggtggccg tcgctgccct ccgcggtgcg gtacgccggc cggctgccgc tggcggaggt 23820 gctgcccgcg tgcgacgcgg tggtgcacca cggcgggcag ggcacgtccc tgaccgcgct 23880 ggccgcgggt cggccgcagg tcgtcatggc gcggctcgac gaccagttcg acaacgcgcg 23940 ggcactggcg gcggcggggg cggccctgct cgtaccgccg tcccgggcca ctcccgcggc 24000 cgtggccgcg gggtgcgccg aagtgctgga gaacgccctg tatgccaagg cggcagccgg 24060 gctcgccgag gagatggcgc tgctgccgtc gccgtcggcg gcggtcggac tcctggaaca 24120 cccggggccc gggccggaca tgccgcggag ttacccgaac gaggatgcgg tgtgacgtga 24180 atctggaagt actcaaccgt tcgaacgatc cgcgcgggcc ggtgatcacg gtggtcggcg 24240 cgtccggctt catcgggtcc gccctggtcg ccgagctggc gcgcatgccg gtgcggctgc 24300 gggcggtggc ccggcgcgag acccccgttc ccgcgggggc acgggccgcc gtcgaggtcc 24360 gccgggcgga cctcgcccgg ccggacgagg tcggggccgc cgtcgagggg gcggacgccg 24420 tcgtgcacct cgccgcccac atcggcggcg cgcggtcgtg gcgcgcggcc gacgagcggt 24480 cgctgcgggt gaacgtcggt ctgctgcgcg acgtggccga cgcgttccgg gaccgctcgg 24540 ggcccgcccc ggccgtggtc ctggccagta ccctccaggc cggcgtcgag ctgtcccggc 24600 agggcccgta cgcccggcag aagtcggcgg ccgaggaggt cctgctgcgg gccgcctccg 24660 aggaggtggt ccgcggcgtc gtgctgcggc tgccgaccgt ctacgggcgc agcccgctga 24720 ccgggtggac gggccgcggg gtggtcgcgt cggtggcacg gcaggccgtc tcgggcgagc 24780 cggtcacgat gtggcacgac ggcacggtcg ggcgcgatct gctccacgtg gaggacgcgg 24840 cccgcgcctt cgcggcggcg ctcggtcacg tggagcggct ggacggcggc acgtggtccg 24900 tcggtacggg ccggctggag cccttgggag aggtgttctc ggccctcgcc gggctggtgg 24960 ccgagcggac ggggaggccc cccgtaccgg tggtctccac ggagccgccc gaccatgccg 25020 aggcgggcga cttcgagagc gcggtctgtg acccctccgc gttccgcgcg gtgaccgggt 25080 ggtctcccct cgttccgttg cgggcggggc tcggcgccgt ggtggagacg atggtggccg 25140 acggagcgag gggtgggatc cgaacgtgag cacggaccgg gagcaggccg cgcacacgcg 25200 gctcggtcgc agcgcgaccc tggtgagccg gctctggctg ggcaccgtga acttcagcgg 25260 ccgggtcgag gacggtgacg cgatgcagct gatggaggcg gcggtcgacc gcggcatcaa 25320 ctgcatcgac accgcggaca tctacggctg gcggatccac aagggccaca ccgaggaact 25380 ggtgggccgg tggctggcca agagcgccgc gcggcgggag gacgtcctgc tggccaccaa 25440 ggtcggcggg gacatgagcg aacggctcaa cgacggcggc ctgtcggcgc ggcacatcgt 25500 cacggcctgc gagcagtcgc tgcggcgcct gggcgtggac cacatcgacc tgtaccagat 25560 gcaccgcgtc gaccacgccg cgccgtggga cgagatctgg caggcgatgg accgtctggt 25620 ggcgagcggc aaggtgacct acgtggggtc gtcgaacttc gccggctgga acgtcgccgc 25680 cgcgcaggac gcggcccggc ggcgccagtc cctcggtctg gtgtccgagc agtgcctgta 25740 caacctggcg gtgcgccacg ccgagctgga actgctgccg gccgcccagg cgtacggact 25800 gggcgtgttc gcctggtcgc cgctgcacgg cgggctgctc agcggggtgc tgcgcaagct 25860 cgcggcgggc gtcgcggtga agtcggcaca ggggcgggcc cagctgctgc tgcccgagct 25920 gcgcgcgacg atcgaggcgt acgaggggtt ctgcggccgg atcggcgcgg atccggccga 25980 ggtcggtctg gcctgggtgc tgtcccggcc ggggatcagc ggcgcggtga tcggtccgcg 26040 cacggtggac cagctggact cggcgctgcg gtccctggac ctggtcctcg gggaggccga 26100 actggccgag ctggacgcca tcttcccgcc cctgggcaag ggcggccggg cgccggacgc 26160 gtggatcagc tgaagggggt gcatcggccg acgtcacgcc ggccgatgcc gccggtcaca 26220 cgacgtcgag cgcgggcagc gggaagacca gtcggccgcc gccgtcgagg aactcccgct 26280 cccgttcgac gaacccgtcc cggtagatcc agggcaggac cagcaactgg tccggcttct 26340 gcgccttcgc gtcctcctcg gacacgatgg ggatgcccgt cccgggggtg aaacgccccg 26400 ccttctcctc gctcacctcg ccgatgcacg gcaggtcccg ttcggtgatc ccgcagtact 26460 ggaggatgac gttgcccttg gtggaggcgc cgtacccgag ggtcagcagg ccctcttggc 26520 gggagcggtc caggaagccg cgcagggcgt cccgctggtc ggcgacgcgg cgggcgaagg 26580 cctcgaacgg tgccatgccg tccagtcccg cggcggcctc ggcggcccgg atgcgggcca 26640 ggcccgcctc gtccctcggg tgccgggaac cggtcctggc gagcgtgacg cacaggctgc 26700 cgccgtacac ctcggtgagc tcggcccgga tgacggtgag gccgacgcgt tccgccatcc 26760 actcgatctg gcgcagcgcg tagtactcca ggtgctcgtg gcagacgatg tcgtacgcgt 26820 cggcttcgag catggcgggc aggtagctct gctccatcat ccagacgccg tcctcggcga 26880 ggacgtcgcg gacgtcgctc atgaagcgca gcgggtccgg caggtcgtag aacatcgcga 26940 tggaggtgac ggccttcgcc cgccgcgccc cgaagcggtt ctcgaaggtc gcgcgggtga 27000 agtagtccac gaccaactcg gcgttcggcg ggtacaggtc gcggaacttg ccgccggtcg 27060 ggtcgatgcc gaccagtcgc gggccgtcgg cggggtagcc cttgaggagc gtggcgtcgt 27120 tgctgccgat gtcgaggacc aggtcgtccg ggccgaggtc caccagccgg cggacggcgg 27180 cgaccttgcc atgcaggtgg tcgaccatga agggccggat gcccgagcgg tagccgtagc 27240 cctcgccgta catgaggtcc gggtcggggg tgtggcgcag ttgcacgagg ccgcatccgg 27300 ccggggaaca cgcgacgagt tccagcggga ccgacggcac gacctcgtcg cggtcggccg 27360 ggaacacccc ggtgagcgcc tgttcgccca ggtcgagtac ggagagcagc tccttgttgc 27420 cgcagacgcg gcacgcggtg gcaatcatgg ggtcctttcg ggatcctggc cggggcgccg 27480 ccggcccgtg gccaggtcgg gagcttccag acggagggtg tcgggggcgg gccgggggga 27540 cggcaccagg tgcaggcggc cgatcgcgcc ggtggcggcg gaggcgtcct ggcacgggca 27600 gggatcgtcg gtgaatccgg cgaagcggta ggccacttcc atcatccggt tgcgttcggt 27660 ggcccggaag tcggctccga ggtgcacccc ggcccggtgc gcctggtccg tcagccagcg 27720 caggatcacc gtgccggccc ccagcgacac cacccggcac gaggtggcca gcagcttgat 27780 ccgccaggcc tcggggccgc gccgcagcag cacgacgccg accgcgccgt agggaccgaa 27840 gcgatcggtg acggtggtga ccagcacctc gtggtcgggg tcgtcgatga gggcgcgcag 27900 ctcgtcctcg gagtagtgca ctccggtggc gttcatctgg ctggtgcgca gggtcagttc 27960 ctcgacccgc gacagctcca ggggcgtggc gcggctgatc cgcatccgga tgtccagcga 28020 gcgcaggaag tccgcgtcgg gtccggtgaa gtcggaccgc tcggcgtccc ggcggaagga 28080 cgcctggtac atggagcggc ggcgggtcga gtcgacggtg acggtgcccg ggctgaactc 28140 cgggaggccg gtcagccggg tcgcctgctc ggcggcgtag gtgcggacct ccggcagttc 28200 gtgggtgacc tcggcccgtt cgaagggctg gtcgtcgatg aaggcgaggg tgctcggcgc 28260 gaagttcagc cggtcggcga tctcgcggac cgacttcgac ttcgggcccc agccgatcct 28320 cgggagcacg aagtactcgg cgacgccgag ctgttcgagc ttcgcccagg cgtgatcgtg 28380 gtcgttcttg ctggccaccg cctgcaggat gccgcgcgcg tccagctcgg tgatggtccg 28440 caggacgtcc ggggcgagcc ggacctcgtc ctcctcgagg agggtgccct gccagagggt 28500 gttgtccagg tcccagacca ggcatttgac caacggctcg gcggcgttgt cccggtgcac 28560 gtcgttccct tctctcgata cggcggttgc gaccgcgact cctcgacagg gcgtacgcgg 28620 cccgcggccg gcggggacac gggccggttc acccggccgc ggacatcacg tgccgggcca 28680 ggaccagttc gcagatctcg ttgctgccct cgatgatctc catgagcttg gcgtcgcggt 28740 gcgcccgtgc gacgacgtgt ccctcccgcg ccccggccga cgccagcacc tgcacggccc 28800 gttcggcccc gcgtgcggcg ccggtggccg cgacgtgctt ggccaggacg gcggcgacca 28860 ccatgtcggg gctgccctcg tcccactggg cgctggcgtg ctcgcacgcc cgggcggcgt 28920 gctgttcggc gacgaacagt tcggcgaggt gccgggcgac gagctggtgg tccgagagcc 28980 gcgtgccgaa ctgctcccgt ccgccggcgt gacgtgcggc ggcggccagg caggcgcgca 29040 ggatgcccag ggagccccag gccaccgaca tccggccgta gctcagcgcg gtggtgacca 29100 gcagggcggg ggtgcggtcg tggccctgga gcagggcgtc tgccggcagc cggaccccgt 29160 ccaggtggat gtcggcgtgt ccggccgcgc ggcagccgtg cgcgtcggtg atgcgctcga 29220 cgcgtacgcc gggggccgag gcgggcacca cgacggcgcc cgcgccctgc tccgtgcggc 29280 cgaagaccac cagcaggtcc gcgtacgcgg cgttggtcgc ccacaccttg acgccgtcga 29340 cgacgacttc gtcgccgtcg gaggtgatgc gggtgcgcag ggcggacagg tcgctgccgg 29400 cgccggcctc ggtgaacgcc acggcggcca gttcgccgcc ggtcaaccgg ggcaccaggg 29460 aggcctgctg gtccgctccg gcgagccggc gcagcgtcca ggcggccatg ccctgcgagg 29520 tcatgacgct ccgcaacgag ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc 29580 gccggctggt ccagccgagg ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc 29640 gggagccgag gtcgtgcagc aggccgaggg gcagctcgcc cgtccggtcc cactcggccg 29700 cccggtcgcc gaccagcgcg gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg 29760 tgtcagccac ctgcgtgccc ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg 29820 accatcgcgt cgacggtgcg gaagttgtcg agcatcaggt cggcgccgct gatgacgatg 29880 ccgtaggtct tctccaggtg cacgacgagc tgcatggcga acagcgagga catcccgccg 29940 acggcgaaca ggtcctggtc gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg 30000 agcagttccc cggcgacctc gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg 30060 gacgtcgtgg tcatcgcgtg gcctcctggt agtcgtagaa tccccggccg ctcttgcggc 30120 cgagcaggcc ctggcggacc ttgtccagca gcagctcgct cgggcggagc gccggatcgc 30180 cggtccgttc gtgcatcacc cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg 30240 ccgtggccag gggtccggtg cggtggccga tgcagtcgcg catcagcgcg tccacggtct 30300 ccggggtggc ccggccctcg tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca 30360 ggcggctggt cacgaagccg gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg 30420 acagcaggtc ccgggtggcc cgggcggccg cctctccgct gcgcggtccg aggaccacct 30480 cgaccgtggg gatcacgtac gcggggttca tgaagtgcac gccgacgagg tcctcggggc 30540 gggggacggc gtcggccagc tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg 30600 tccccgggcg cgccacggac gccaggtccg ccagcacctc ggccttccgc tcggggtcct 30660 cggtgacggc ctcgatcacg gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg 30720 tcagctcccc gggcgggcgg tcgtggggca gcgcgcccat cagccgggcc gtccgcagat 30780 gcagcgcgac cgcgtcgggg gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga 30840 ccgggtgccc gtgtccgacg gcgagtgccg cgatggccgt gcccatgacg cccgcgccga 30900 gcacgacgag cggagaattt tccttggaat cgggcacgga tcc 30943 <210> 2 <211> 11171 <212> DNA <213> Streptomyces ambofaciens <400> 2 ctgcaggcgc gcgggctgct cgggcaggag gcgcccgccg agagcctcga cgcgatgatc 60 gacgactact gcgcgcagat ccgcgaggtc cagcccgagg gcccgtaccg gctgctcggc 120 tggtccatgg gcgggctgct cgcgcaccgg gtcgccaccc gcctccagcg ggcggggcag 180 cgcgtcgacc tgctcgcgat cgtcgacgcc tatccgcccg cctcggtgcg ggccgactgg 240 gacgcggcgg agatggtggc gcggatcggt gaggaactgg gcttcgacgt ggaccgggtc 300 ggccccggcc aggaggaggc gctgctcgcg gatctgcggg cgaaggggca tcccctgggg 360 catctgccgg gcggtgacat cggcgcggcg gtccgcgtgt acgtcaacag ctcgcgcctg 420 acgaggaacc tgcggcccga ggcgttcgac ggggacgtcc tcttcttcgc ctccgggacc 480 tcgttcgccg aggacgacca ggttcacgac gtcgccgcct ggcggccgta cgtcaccggg 540 cagatcaccg agcacgtgat cgaccacctc cacgaggacc tcttgatcga accggccgcg 600 gtcacggcca tctccgacgt gctcgtcggg catctgcccg cggacgacac accccgcgcg 660 tccggcgcac cccgcgcacc tcgcgcatcc cgatgaggaa ggaaacatca tgagcaaccc 720 gttcgaggac acggaagcca cctacgtcgt gctggtcaac gacgaggggc agcactcgct 780 gtggccgtcg ttcgcggagg tcccggcggg ctggtccgtc gtggtgccgg agacggaccg 840 gcagtcgtgc ctggactaca tcaacgagaa ctggaccgac atgcgcccca agagcctcgt 900 cgaggcgatg gcgacggccg ggcaggacgc cccttgagcc aggacgccat gatccgggcg 960 gtcggcgtcc gcaagagctt gcggcgacgt ccacgccctc gacggcgtgg acatcgaggt 1020 cgaacggggc cgggtgctcg ggctgctggg tcacaacggg gccggcaaga cgaccttggt 1080 gaacatcctt gccacggtct ccccggcgtc cgcgggcacg gtgaccgtcg ccggtttcga 1140 cgtcgcgacg cagggcgccg agatccgcgc gcgcatcggg gtgaccggcc agttcgcgtc 1200 ggtggacgag tacctgagcg gattccgcaa cctcgtcctg atcggccgcc tcctcggggc 1260 gggacggcgt gaggcggcgg cccgggccac cgagctcctg gagctgttcg agctgaccgg 1320 ggcggcccac cagccctccc gcacctactc gggcgggatg cgccgacggc tcgacctcgc 1380 cgccagcctg gtcggccggc cggacgtgct gttcctcgac gagccgacga ccgggctgga 1440 cccggcgacc cggatcgccc tgtgggagac ggtggagaag ctggtggcgg gcggcacgac 1500 cgtcctgctg accacccagt acctggacga ggcggaccgg ctggccgact ggatcaccgt 1560 cctgtcgaag ggccgggtgg tggcctcgga caccaccgac cggctcaagg ccgacctggg 1620 ccaccggtcg gtgcgggtgg tccttccgcc cgccgccgac ctgacggccg ccgccgccgc 1680 gctcaccgcc ggcgggttcc gtccgcggtc cgacgccggg gagcacgcgc tgaccacgcc 1740 cgtggacacc tcggccggta tcgcgggcgt catccgcgcg ctggacaccg tcggaacgca 1800 ggccgtcgag ctgaccgtca aggagccgtc cctggacgac gtctacctgg cgctcaccca 1860 tccctcaccc gccgccgacg cggcctgatc cccaggagtt ccgttggcca tccaggagcg 1920 cgccgtgaag gaggtggcgg tcgacaccgg taccccggcc ggccccgtgt ggcgtggtgc 1980 cggcctcggc acccagctgt gggtactgac cgcgcggcag atccgttcca tgtacggcga 2040 ccgccgcctg gcgctgttca gcctgatgca accggtgatc atgctgttgc tgctgagcga 2100 gatcttcggc agcatggccg acccggacga cttcccgcag ggcgtgcgct acatcgacta 2160 cgtggtgccc gcgctgctgg tcaccaccgg catcggctcg gcccagggcg cgggggtggg 2220 cctggtcagg gacatggaca acgggatggt ggcgcgcttc cgcgtcctgc cggcccggct 2280 gttcctggtg ctggtcgccc ggtcgctggc cgatctggtc cgtgtgttca ccgagttggt 2340 cgtcctcgtg gccgtcggtg tgatcctgct gggcttccgt ccggccgggg gtttgtgggg 2400 cacgtccgcc gccctgttgc tcaccctgtt cgtcatctgg tcgctgatct gggggttcat 2460 cgccctcgcg gcgtggctgc gcagcgtgga ggtgatgtcc agcctcgcgg ttctggtgat 2520 gttcccgctc atgttcgcct ccagtgcgtt cgtcccgctg gacgccctcc cggagtggct 2580 gcgctcggtg gcgcacctca accccgtgac gtacgcggtc gacagcgccc gccgcctggc 2640 gctggactgg gacccggggt ggagcgtgcc cggcgcgctg ctgaccagca ccgcgctcat 2700 ggcggtgggg atgtacgtcg ccgggcgttc cttcaagagg cccccgaacg aatgattccg 2760 gcgaacgggt ccgtcgcctg cccctccggg ctcgcccggg ggaggcgggc gcggtctcag 2820 cggtcggccg tccgcccgta ggcgcggaag agtgcggtcc actccgggac cgtgaggtcc 2880 ttgacccggt cggccggcct cacgcccgcc ccgcgcacga actgggcgtg tccgcggcgc 2940 agcaccttcc gcgcggcgtc gcccaccgtc atctggccgg tgtcgaagac ccgttggacg 3000 aaccgctggt aggcggcctt ctcacgccag ggcacggacg gcctgcggtg cggggcgacc 3060 atcagggtct gggtgtccgc gcgcggtacg ggggtgaagt cctggcgtga gaaggccagg 3120 ccccggtcga acgagtacca cggctcccac tgggcgttga agaggtttcc gccccaggct 3180 ccggtccgct ttcccacgta ctcccgctgc aacaggaaca cgccctgccg catgcgcgcc 3240 ggacccatgt cgaggcagcg cctcagcatt ctggtgccgg tgacgaaggg aagattcccg 3300 atgagtctga ccggctgccc gggcagttgc agggtcagga aatcctcgtt caccaccgtg 3360 acgtccggca gcgattcggc ggccagccgc cgagcccagc ggggatctat ttccaccgcg 3420 agtaaaggcg tcccgggtga ggcgagcact ttggtcaccc gccctgatcc cgcgcctatt 3480 tcgacggtca tcaggtcatt cggagaatcg ggcggaatgg tgtccgaacc gtccagctga 3540 gcggagaaac gacaggccgc ggcggctgta cgaaagaagt tctgacccca ttctctccgc 3600 gcggtgctgc gtgaatcagc gggtgcggag acggattgcg gtggcagtgg ggatttcaat 3660 gtcacctcgg cgacattacc aagtcttgac ccaacggtcc atcaaccacc ggtatacccc 3720 atgcaattca gccaccgtcc ggcccgatcc cgacgttcgg ccgcgggcct ttcgggcccg 3780 accggtgacc agcgcgcgaa ccggagttcc cggcgatatt tccggctcct ggcgactcgc 3840 cacagtctcg tcgggggcgg ccggcgccat gactccgacg ggggcgattc ccggccgact 3900 tcgtcaggtc cggagggtcc cccgggcggc gcgggccgat ggccgctgac tgtgtcatct 3960 gcgggttgtc ggccgaacac accgcgcccc aggatgactc agccgttcct gcggtcgtcc 4020 cgaccccggt cccacccccg aaaagaggag cgagaatcca gtgctccagc gcgtcgatct 4080 gtcgtcactc accggcctcc gctggtatgc ggcgctgacg gtattcgcct gtcacatcgc 4140 ccagcagggc ttcttcgccg accagcaggt gggcagcgca ctgctgcaca tcaccccgct 4200 cggttccatg gcggtctcga tcttcttcat actgagtgga ttcgtcctcg cctggtcggc 4260 ccgcgacgag gactccgtgc cgactttctg gcggcgccgc atcgcgaaga tctatccgct 4320 gcatctcgcg acgttcggca tcgcggctct catcattttc tccctgtcgg agccggtact 4380 tcccggcggt tccgtatggg acgggctggt gcccaatgtt ctgctcgtgc agtcctggct 4440 tcccgacgcg accctcacgg ccagtttcaa cacgcccagc tggtcgctct cctgtgagat 4500 cgccttctat ctgtcgttcc cgctgtggta ccggctggtg cgcaggattc ccgcacggcg 4560 gctgtggtgg tgcgccgcgg ggatcgccgt ggccgtgacg tgtgtgcccc tgctggcggg 4620 cctgctcccg gcgagcgagg aggtggcccc cgggatgtcg ctcaacgagg tctggttcgc 4680 gtactggctt ccgccggtgc gcatgctgga gttcgtcctc ggcatcgtga tggcgctgat 4740 cctgcgcgcg gggatctgga agggccccgg tccggcggtc tgcacggcgc tcctcgccgc 4800 gagttacggc ctcacccaga tggtgccccc gatcttcacc ctcgtcgcct gctccgtcgt 4860 accggccgcg ctgctgatca cggcgctggc cgacgccgac gtgcacggcc ggcgcacggg 4920 gctgcgttcg gcgacgctgg tgcggctggg ccagtggtcc ttcgccttct acctggtcca 4980 cttcctgatc atccgctacg gacaccggct gatgggcggc gatctgggct acgagcggca 5040 gtggagcacc ccggccgcga tcgcgctgtc cctggggatg ctgggggtgg cggtcctggc 5100 cggcggtctg ctgcacaccg tcgtcgaaca gccctgcatg cgcctgttcg gcagccgcag 5160 gtccgcctcc cgtccgaagc ccggcgccac cgcggctccc cggaactcac ccgcggccga 5220 cgcggccggc gtgcccctgc tcccgggcgt acccgggccc gcgcacaccc ccgcagcgac 5280 gaacgaaccc accccgagag gatgatgagc gtggcagacc agacggctct cagccccgcg 5340 ctgctggagt acgcccggag cgtcgcgctg cgggacgacg gcctgctgcg cgaactgcac 5400 gaggtgaccg ccgggctccc cggcggccgg gccatgcaga tcatgcccga ggaggcgcag 5460 ttcctcgccc tgctgatccg gctcgtcggt gcccggcggg tgctggagat cggcaccttc 5520 acggggtaca gcacgctgtg catggcgcgg gcactgcccg ccgacggcac cgtcgtcacc 5580 tgcgacatca gcgacaggtg gcccggcgtc ggcgcaccgt actggcgccg ggccggggtg 5640 gagtcccgga tcgacctgcg cgtcggcgac gccgtccgga ccctcgccga gctccgcgag 5700 cacgaggggg acggctcgtt cgacctggtc ttcgtcgacg ccgacaagac cgggtacccg 5760 cactactacg agcaggcgct ggccctggta cgccccggcg gactggtggc ggtcgacaac 5820 accctgttct tcggccgggt ggccgacccg gccgtcgagg acgccgacac cgtcgccgtg 5880 cgcgcgctca acgagctgct gcgcgacgac gaacgcgtgg acatcgccct gctgacggtc 5940 gccgacggga tcactctggc ccgccggcgg gagtgagtcc gcacggggtg cggagcacct 6000 ggtgccgtca ccggcccgca cacgtccgcc gccgacctgc ccgggcaggt cgccgagctg 6060 ctgccctggc gtggccggcc ctcgtcgagg gccgcgcggt cagcggaacc ggttgatcgc 6120 gtcgatgtgc cgcgcccgct tctcctcgtc gcgcacgccc agcccctccg tgggcgccag 6180 gcagagcacg ccgaccttgc cctggtgctg gttgccgtgc acgtcgtgca cggcaaccgc 6240 cgtgtcggcc agcgggtagg tgcgcgagag ggtggggtgg atcctcccct tggcgacgag 6300 ccggttcgcc tcccacgcct cgcggtagtt ggcgaagtgg gtgccgacga tacgcttgag 6360 gtgcatccag aggtagcggt tgtcgaactc gtggcggaag cccgaggtgg aggcgcaggt 6420 gacgatcgtg ccgcccctgc gggtgacgta gacggacgcc ccgaaggtct cccggccggg 6480 gtgctcgaag acgatgtcga cgtcctcgcc cccggtgacc tcgcggatgc gcttgccgaa 6540 gcgcttccac tcccgcgggt cctgggtgtc ctcgtcgctc cagaagcggt agtcctcggc 6600 ggagcggtcg atgatggcct ccgcgcccat ggcccggcac acctcggcct tgcgcgcgct 6660 ggagaccacg cagacggggt gggccccgcc ggcgagggcc agctgggtgg cgtacgagcc 6720 caggccgccg ctggcgcccc agatcagcac gttgtcgccc tgcttcatgc cggcgccgtt 6780 gcgggagacc agctggcggt aggcggtgga gttgaccaga ccgggcgcgg cggcctcctc 6840 ccaggtcaga tgggccgcct tgggcatcag ctggttggac ttgacgaggg ccacctcggc 6900 caggcccccg aagttggtct cgaagcccca gatgcgctgg gccgggtcga gcatggtgtc 6960 gtcgtgcccg tcggggctct ccagctccac cgacagacag tgcgcgacga cctcgtcacc 7020 gggtttccag acgttcacgc cgggtcccgt gcgcagcacc acgccggaca ggtcggaacc 7080 gaggatgtgg tacggcaggt cgtggcgcgc ggccagcggc gaggtgcgcc cgtagcgctc 7140 caggaagccg aacgtcggga ggggctcgaa gatggaggac cagaccgtgt tgtagttgac 7200 ggagctggcc atcaccgcga ccagcgcctc cccgggcccc acttcgggca gcggcacctc 7260 gtcgacgtgc agggacttgc gcgggtcctt gtccgcgctc ggcatcccgc ggaacatgtc 7320 ggtgtcctct ttgcggacgg tcacggcgcg gaaggactcg ggcaggggca gcgccgcgat 7380 gtcctcgggg gtgcggtccg cggcggtgat cgcggcgagc agcgcgctct gcgcatggct 7440 ttcgggcatg gaacggtctc cgatcgctcg tgtcgtcagg tggcccggtg cagggcggtg 7500 aggcgctcca gggtggggat gatcccggcg ggcgtggggt cggcgagcat ctcctcgctc 7560 agccgccgcg cgcccgccct gatcgcgggg tcgtgcacgg ccgtgtgcac cgcgtcggcc 7620 agaccgcgcg ccgtgagcgt cgccgcgggc aggtcgaacc cggcggacag gcgctggagt 7680 tgctgcgcct tgagcggcgc gtcccacagg gagggcagca ggatctgcgg cactccgtgg 7740 cgcagggcgg tggaccaggt gcccgctccg ccgtggtgga tgatcgcggc gcagctcggc 7800 agcagcgcgt cgagcggtac gaagtccacg ggcacgacgt tgtcggggag ggtgcccagg 7860 cggtcgagct gggaggtgtc cagggtggcc accacctcga tgtccagccg gccgagcgcc 7920 tccagcagtt cggagtagga gaccgcgtcg cggccgtagg tctcgcgggc ggacacgccg 7980 agggtgaggc agacgcgggg gcggtcgggc ttcttgccga gccagggttc gatcacggag 8040 cgcccgttgt agggcacgta gcacatgggc accgtggtct ggcccaggtc gaggcgggtg 8100 ctgcgcgggc ccgggtcgat cacccagtgg ccgagcacgt cgcgttcgtc gaaggcgagc 8160 ccgtaccggt ccagcgtcca gccgagccat tcggcgatgg ggtcctcgcg cagttcctcc 8220 ggcatcccgt cgagggcggc gaggaagcgc aggcgggagc gtccgatggc gtcggggccc 8280 cacaggatgc gcgcgtgggc ggcaccgcag gcgcgggccg cgaccggccc cgcgtaggtc 8340 cagggttccc acacgaccag gtcgggccgc cagccacggg cgaagtcgac gatctcgtcc 8400 atcgtggcgg cgccgttgaa cggggcgaag cacagggcgg ccatcatgct ctgctggccg 8460 agcaggtact cccaggtggt ctcctcctcg ctctccacct caccgaactc gaagccccgc 8520 tggtagggga cgaggtcgct gcccatctcg gcgagcagct ccgcggccgg tcggtcgtcg 8580 cccaccggta cggcggtcag gccggtggag gtgatgacgt cggtgaggga gggcgggctc 8640 gccacccgta cctcgtgccc ggcggcgcgc agcgcccagg cgaggggcac cagactgtag 8700 tagtgggtgt tgtgggcgag ggatgtcagc aggacgcgca cagcggctcc ggtctgggag 8760 ggggcgtacg gacggcgggg tcatcccggg tggacccgga ggcgggcgca ggcgcccagg 8820 accggtgacc gcggccgggt caggggcggt ccctcggccc gcaggccggg caggcggccg 8880 gccgtgacct ggaccgcggt ggtggcggcc aggcggatca gcgggagggc gagcgccagg 8940 tgcggtccgt cggcgccccc gagcggctcc ggcccgggga tctcccgtcc ggcggcggcc 9000 agcaccacga cgtgctcgtc ggcggtgatc cggcggccgc cgagttcgag gccggtgtgc 9060 gcgacccggt tctccagccg ggccgggggg cgctcgcgca gcacctggtc gacggcgttc 9120 gccgcggccg gcgtccggcg ggccctctcc cactcccccg gccggccgag cagccggtgg 9180 accgtgtgcg cgacggcggt gacgacgggt tcgggtgcgc cgaccgcgag gagcagcgcg 9240 atgcgctcga cgtcgccggg ggcgacgccg tcgtgcagga ggagggcgag cacgtcgtcg 9300 ggccggggct cggcgttccc gaggccccgg gacttctccg cgacgagctc ggggaccagg 9360 tcggccagtg tgcggacggc gtcggcggac tcccgggcca cggtcagcag ttgcggggcc 9420 atccgggcgt cgagctgggg gccgcaggcg gcgagtgccc gcgcggcggt ggcgcggtcg 9480 cggcccggca ctccgaggag cctgagcatc agctcgacgg cgtagggccg ggcgacctcg 9540 ccgacaaggt cgaacccggc gtcaccggtg ggcagcaggc ggccgagcac tctgcgggcg 9600 gtggtgcgcg ccgcgcaggg cgcctgggcc ggggcgtacc ggctgagcac cggggcggcc 9660 agcgcccgca ggcgtacgag ctccgcgcgt tcgtggtggg ggaacgcctc ggcgaggggc 9720 agcagttcct cgtccgggcg gcgtccggcc cggtccagcg tgccgaagcg cgggtcggcc 9780 aggacggccg ccgccacctc ggggtccgcg gtcacccagg cgtccagctg ttcgctgcgg 9840 aaccacggtc cgcgggcccg gatctcccgt tcgaacggct cggggtcggc gacggcgcgc 9900 aggatcagcg cgtacgggtc gccctggttg ccggcgcacc agtgtgcggc ccgggtcagc 9960 tggagccgac ggccgagcgc acggacgccc gtgctcgtgt ccgcgctcgt gctcgtgctc 10020 gcgggggccg tttccgtggc aagggtgggc atggctgccc tgcctttctt ctcgggtcga 10080 tgggggcgct cgcacgatcg ggggacccgg gtgtgccggg tgggtcgggg caacccgcct 10140 ccgggccgcg gcggtccgcg tcggcaccgg gtcagcggcg ggtgccgatg aacagcccgc 10200 gaccggacgg gccgccttcc tggtagacca cgtcgcagcc ggcgcgctcg aaggccgcct 10260 cgtagtcggc gcgcgggaac agggtgatgg tgtggtcctc ggtcaggtga cggacgccgc 10320 cgggtccggc gaggaggtag tgcacctcga tgcgggtggc gttcccctcc cgtacggagt 10380 gcgagacccg gcagacggtg cgctcgcccg cctccgtgat gctggcgccg acgtaaccgg 10440 gggtgaagga ctcggggaac caccagggtt cgacgacgat gacgccggac ggttcgaggt 10500 ggtcggtgaa ggcccgcagc gtgctgtcga gttcgtcggt ggtccgcagg tggcctatgg 10560 agctgaacat gcaggtcacc gcgtcgaacc ggcgtcccag ggagaacgag cgcatgtccc 10620 cttggtggaa ggtgacaccg gggttccggc cggtcgcgag ggccagcatg tcggcggaga 10680 gttccaggcc ctcgacgtgg tcgaagaggc cgtccaggtg gtgcaggtgc tggccggtgc 10740 cgcaggccac gtcgagcagg gtccgggcgc ccggccggtg gacgcgcacg agtgcggcga 10800 tctcctcggc ctcctgccgg tagtccttcc ccttcccctc gtggaccagg tcgtagacgg 10860 ccgcgatgtc gtcggcgtac atcagtgttt ccctccggtg agcggggcgg gaccgggctg 10920 gtgcgggagg ctgtccagcc attcgtgcac cagggacgcg gtgtgccggg cgtgttcggt 10980 gagcatggtg aagtggttgc cgggcacgtc ggcgacggtc cgtgcgaacg ggacctggga 11040 ccgccagtcg ccccgcgccc cgcccgcggg cggccacgcg cacaggggtt cggacgcccg 11100 ggccagcagg acgggggctt cgagggcggt gagccgggtt ccgagcacca gccgctgata 11160 gccggccatg g 11171 <210> 3 <211> 711 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(711) <400> 3 atg tac gcc gac gac atc gcg gcc gtc tac gac ctg gtc cac gag ggg 48 Met Tyr Ala Asp Asp Ile Ala Ala Val Tyr Asp Leu Val His Glu Gly 1 5 10 15 aag ggg aag gac tac cgg cag gag gcc gag gag atc gcc gca ctc gtg 96 Lys Gly Lys Asp Tyr Arg Gln Glu Ala Glu Glu Ile Ala Ala Leu Val 20 25 30 cgc gtc cac cgg ccg ggc gcc cgg acc ctg ctc gac gtg gcc tgc ggc 144 Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cys Gly 35 40 45 acc ggc cag cac ctg cac cac ctg gac ggc ctc ttc gac cac gtc gag 192 Thr Gly Gln His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu 50 55 60 ggc ctg gaa ctc tcc gcc gac atg ctg gcc ctc gcg acc ggc cgg aac 240 Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn 65 70 75 80 ccc ggt gtc acc ttc cac caa ggg gac atg cgc tcg ttc tcc ctg gga 288 Pro Gly Val Thr Phe His Gln Gly Asp Met Arg Ser Phe Ser Leu Gly 85 90 95 cgc cgg ttc gac gcg gtg acc tgc atg ttc agc tcc ata ggc cac ctg 336 Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser Ile Gly His Leu 100 105 110 cgg acc acc gac gaa ctc gac agc acg ctg cgg gcc ttc acc gac cac 384 Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His 115 120 125 ctc gaa ccg tcc ggc gtc atc gtc gtc gaa ccc tgg tgg ttc ccc gag 432 Leu Glu Pro Ser Gly Val Ile Val Val Glu Pro Trp Trp Phe Pro Glu 130 135 140 tcc ttc acc ccc ggt tac gtc ggc gcc agc atc acg gag gcg ggc gag 480 Ser Phe Thr Pro Gly Tyr Val Gly Ala Ser Ile Thr Glu Ala Gly Glu 145 150 155 160 cgc acc gtc tgc cgg gtc tcg cac tcc gta cgg gag ggg aac gcc acc 528 Arg Thr Val Cys Arg Val Ser His Ser Val Arg Glu Gly Asn Ala Thr 165 170 175 cgc atc gag gtg cac tac ctc ctc gcc gga ccc ggc ggc gtc cgt cac 576 Arg Ile Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His 180 185 190 ctg acc gag gac cac acc atc acc ctg ttc ccg cgc gcc gac tac gag 624 Leu Thr Glu Asp His Thr Ile Thr Leu Phe Pro Arg Ala Asp Tyr Glu 195 200 205 gcg gcc ttc gag cgc gcc ggc tgc gac gtg gtc tac cag gaa ggc ggc 672 Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gln Glu Gly Gly 210 215 220 ccg tcc ggt cgc ggg ctg ttc atc ggc acc cgc cgc tga 711 Pro Ser Gly Arg Gly Leu Phe Ile Gly Thr Arg Arg 225 230 235 <210> 4 <211> 236 <212> PRT <213> Streptomyces ambofaciens <400> 4 Met Tyr Ala Asp Asp Ile Ala Ala Val Tyr Asp Leu Val His Glu Gly 1 5 10 15 Lys Gly Lys Asp Tyr Arg Gln Glu Ala Glu Glu Ile Ala Ala Leu Val 20 25 30 Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cys Gly 35 40 45 Thr Gly Gln His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu 50 55 60 Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn 65 70 75 80 Pro Gly Val Thr Phe His Gln Gly Asp Met Arg Ser Phe Ser Leu Gly 85 90 95 Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser Ile Gly His Leu 100 105 110 Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His 115 120 125 Leu Glu Pro Ser Gly Val Ile Val Val Glu Pro Trp Trp Phe Pro Glu 130 135 140 Ser Phe Thr Pro Gly Tyr Val Gly Ala Ser Ile Thr Glu Ala Gly Glu 145 150 155 160 Arg Thr Val Cys Arg Val Ser His Ser Val Arg Glu Gly Asn Ala Thr 165 170 175 Arg Ile Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His 180 185 190 Leu Thr Glu Asp His Thr Ile Thr Leu Phe Pro Arg Ala Asp Tyr Glu 195 200 205 Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gln Glu Gly Gly 210 215 220 Pro Ser Gly Arg Gly Leu Phe Ile Gly Thr Arg Arg 225 230 235 <210> 5 <211> 1272 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1272) <400> 5 atg ccc acc ctt gcc acg gaa acg gcc ccc gcg agc acg agc acg agc 48 Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser 1 5 10 15 gcg gac acg agc acg ggc gtc cgt gcg ctc ggc cgt cgg ctc cag ctg 96 Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gln Leu 20 25 30 acc cgg gcc gca cac tgg tgc gcc ggc aac cag ggc gac ccg tac gcg 144 Thr Arg Ala Ala His Trp Cys Ala Gly Asn Gln Gly Asp Pro Tyr Ala 35 40 45 ctg atc ctg cgc gcc gtc gcc gac ccc gag ccg ttc gaa cgg gag atc 192 Leu Ile Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu Ile 50 55 60 cgg gcc cgc gga ccg tgg ttc cgc agc gaa cag ctg gac gcc tgg gtg 240 Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gln Leu Asp Ala Trp Val 65 70 75 80 acc gcg gac ccc gag gtg gcg gcg gcc gtc ctg gcc gac ccg cgc ttc 288 Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe 85 90 95 ggc acg ctg gac cgg gcc gga cgc cgc ccg gac gag gaa ctg ctg ccc 336 Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro 100 105 110 ctc gcc gag gcg ttc ccc cac cac gaa cgc gcg gag ctc gta cgc ctg 384 Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu 115 120 125 cgg gcg ctg gcc gcc ccg gtg ctc agc cgg tac gcc ccg gcc cag gcg 432 Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gln Ala 130 135 140 ccc tgc gcg gcg cgc acc acc gcc cgc aga gtg ctc ggc cgc ctg ctg 480 Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu 145 150 155 160 ccc acc ggt gac gcc ggg ttc gac ctt gtc ggc gag gtc gcc cgg ccc 528 Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro 165 170 175 tac gcc gtc gag ctg atg ctc agg ctc ctc gga gtg ccg ggc cgc gac 576 Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp 180 185 190 cgc gcc acc gcc gcg cgg gca ctc gcc gcc tgc ggc ccc cag ctc gac 624 Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gln Leu Asp 195 200 205 gcc cgg atg gcc ccg caa ctg ctg acc gtg gcc cgg gag tcc gcc gac 672 Ala Arg Met Ala Pro Gln Leu Leu Thr Val Ala Arg Glu Ser Ala Asp 210 215 220 gcc gtc cgc aca ctg gcc gac ctg gtc ccc gag ctc gtc gcg gag aag 720 Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys 225 230 235 240 tcc cgg ggc ctc ggg aac gcc gag ccc cgg ccc gac gac gtg ctc gcc 768 Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala 245 250 255 ctc ctc ctg cac gac ggc gtc gcc ccc ggc gac gtc gag cgc atc gcg 816 Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg Ile Ala 260 265 270 ctg ctc ctc gcg gtc ggc gca ccc gaa ccc gtc gtc acc gcc gtc gcg 864 Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala 275 280 285 cac acg gtc cac cgg ctg ctc ggc cgg ccg ggg gag tgg gag agg gcc 912 His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala 290 295 300 cgc cgg acg ccg gcc gcg gcg aac gcc gtc gac cag gtg ctg cgc gag 960 Arg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gln Val Leu Arg Glu 305 310 315 320 cgc ccc ccg gcc cgg ctg gag aac cgg gtc gcg cac acc ggc ctc gaa 1008 Arg Pro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu 325 330 335 ctc ggc ggc cgc cgg atc acc gcc gac gag cac gtc gtg gtg ctg gcc 1056 Leu Gly Gly Arg Arg Ile Thr Ala Asp Glu His Val Val Val Leu Ala 340 345 350 gcc gcc gga cgg gag atc ccc ggg ccg gag ccg ctc ggg ggc gcc gac 1104 Ala Ala Gly Arg Glu Ile Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp 355 360 365 gga ccg cac ctg gcg ctc gcc ctc ccg ctg atc cgc ctg gcc gcc acc 1152 Gly Pro His Leu Ala Leu Ala Leu Pro Leu Ile Arg Leu Ala Ala Thr 370 375 380 acc gcg gtc cag gtc acg gcc ggc cgc ctg ccc ggc ctg cgg gcc gag 1200 Thr Ala Val Gln Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu 385 390 395 400 gga ccg ccc ctg acc cgg ccg cgg tca ccg gtc ctg ggc gcc tgc gcc 1248 Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala 405 410 415 cgc ctc cgg gtc cac ccg gga tga 1272 Arg Leu Arg Val His Pro Gly 420 <210> 6 <211> 423 <212> PRT <213> Streptomyces ambofaciens <400> 6 Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser 1 5 10 15 Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gln Leu 20 25 30 Thr Arg Ala Ala His Trp Cys Ala Gly Asn Gln Gly Asp Pro Tyr Ala 35 40 45 Leu Ile Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu Ile 50 55 60 Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gln Leu Asp Ala Trp Val 65 70 75 80 Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe 85 90 95 Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro 100 105 110 Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu 115 120 125 Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gln Ala 130 135 140 Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu 145 150 155 160 Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro 165 170 175 Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp 180 185 190 Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gln Leu Asp 195 200 205 Ala Arg Met Ala Pro Gln Leu Leu Thr Val Ala Arg Glu Ser Ala Asp 210 215 220 Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys 225 230 235 240 Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala 245 250 255 Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg Ile Ala 260 265 270 Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala 275 280 285 His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala 290 295 300 Arg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gln Val Leu Arg Glu 305 310 315 320 Arg Pro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu 325 330 335 Leu Gly Gly Arg Arg Ile Thr Ala Asp Glu His Val Val Val Leu Ala 340 345 350 Ala Ala Gly Arg Glu Ile Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp 355 360 365 Gly Pro His Leu Ala Leu Ala Leu Pro Leu Ile Arg Leu Ala Ala Thr 370 375 380 Thr Ala Val Gln Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu 385 390 395 400 Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala 405 410 415 Arg Leu Arg Val His Pro Gly 420 <210> 7 <211> 1266 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1266) <400> 7 gtg cgc gtc ctg ctg aca tcc ctc gcc cac aac acc cac tac tac agt 48 Val Arg Val Leu Leu Thr Ser Leu Ala His Asn Thr His Tyr Tyr Ser 1 5 10 15 ctg gtg ccc ctc gcc tgg gcg ctg cgc gcc gcc ggg cac gag gta cgg 96 Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg 20 25 30 gtg gcg agc ccg ccc tcc ctc acc gac gtc atc acc tcc acc ggc ctg 144 Val Ala Ser Pro Pro Ser Leu Thr Asp Val Ile Thr Ser Thr Gly Leu 35 40 45 acc gcc gta ccg gtg ggc gac gac cga ccg gcc gcg gag ctg ctc gcc 192 Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala 50 55 60 gag atg ggc agc gac ctc gtc ccc tac cag cgg ggc ttc gag ttc ggt 240 Glu Met Gly Ser Asp Leu Val Pro Tyr Gln Arg Gly Phe Glu Phe Gly 65 70 75 80 gag gtg gag agc gag gag gag acc acc tgg gag tac ctg ctc ggc cag 288 Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gln 85 90 95 cag agc atg atg gcc gcc ctg tgc ttc gcc ccg ttc aac ggc gcc gcc 336 Gln Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala 100 105 110 acg atg gac gag atc gtc gac ttc gcc cgt ggc tgg cgg ccc gac ctg 384 Thr Met Asp Glu Ile Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu 115 120 125 gtc gtg tgg gaa ccc tgg acc tac gcg ggg ccg gtc gcg gcc cgc gcc 432 Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala 130 135 140 tgc ggt gcc gcc cac gcg cgc atc ctg tgg ggc ccc gac gcc atc gga 480 Cys Gly Ala Ala His Ala Arg Ile Leu Trp Gly Pro Asp Ala Ile Gly 145 150 155 160 cgc tcc cgc ctg cgc ttc ctc gcc gcc ctc gac ggg atg ccg gag gaa 528 Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu 165 170 175 ctg cgc gag gac ccc atc gcc gaa tgg ctc ggc tgg acg ctg gac cgg 576 Leu Arg Glu Asp Pro Ile Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg 180 185 190 tac ggg ctc gcc ttc gac gaa cgc gac gtg ctc ggc cac tgg gtg atc 624 Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val Ile 195 200 205 gac ccg ggc ccg cgc agc acc cgc ctc gac ctg ggc cag acc acg gtg 672 Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gln Thr Thr Val 210 215 220 ccc atg tgc tac gtg ccc tac aac ggg cgc tcc gtg atc gaa ccc tgg 720 Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val Ile Glu Pro Trp 225 230 235 240 ctc ggc aag aag ccc gac cgc ccc cgc gtc tgc ctc acc ctc ggc gtg 768 Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val 245 250 255 tcc gcc cgc gag acc tac ggc cgc gac gcg gtc tcc tac tcc gaa ctg 816 Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu 260 265 270 ctg gag gcg ctc ggc cgg ctg gac atc gag gtg gtg gcc acc ctg gac 864 Leu Glu Ala Leu Gly Arg Leu Asp Ile Glu Val Val Ala Thr Leu Asp 275 280 285 acc tcc cag ctc gac cgc ctg ggc acc ctc ccc gac aac gtc gtg ccc 912 Thr Ser Gln Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro 290 295 300 gtg gac ttc gta ccg ctc gac gcg ctg ctg ccg agc tgc gcc gcg atc 960 Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala Ile 305 310 315 320 atc cac cac ggc gga gcg ggc acc tgg tcc acc gcc ctg cgc cac gga 1008 Ile His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly 325 330 335 gtg ccg cag atc ctg ctg ccc tcc ctg tgg gac gcg ccg ctc aag gcg 1056 Val Pro Gln Ile Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala 340 345 350 cag caa ctc cag cgc ctg tcc gcc ggg ttc gac ctg ccc gcg gcg acg 1104 Gln Gln Leu Gln Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr 355 360 365 ctc acg gcg cgc ggt ctg gcc gac gcg gtg cac acg gcc gtg cac gac 1152 Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp 370 375 380 ccc gcg atc agg gcg ggc gcg cgg cgg ctg agc gag gag atg ctc gcc 1200 Pro Ala Ile Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala 385 390 395 400 gac ccc acg ccc gcc ggg atc atc ccc acc ctg gag cgc ctc acc gcc 1248 Asp Pro Thr Pro Ala Gly Ile Ile Pro Thr Leu Glu Arg Leu Thr Ala 405 410 415 ctg cac cgg gcc acc tga 1266 Leu His Arg Ala Thr 420 <210> 8 <211> 421 <212> PRT <213> Streptomyces ambofaciens <400> 8 Val Arg Val Leu Leu Thr Ser Leu Ala His Asn Thr His Tyr Tyr Ser 1 5 10 15 Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg 20 25 30 Val Ala Ser Pro Pro Ser Leu Thr Asp Val Ile Thr Ser Thr Gly Leu 35 40 45 Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala 50 55 60 Glu Met Gly Ser Asp Leu Val Pro Tyr Gln Arg Gly Phe Glu Phe Gly 65 70 75 80 Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gln 85 90 95 Gln Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala 100 105 110 Thr Met Asp Glu Ile Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu 115 120 125 Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala 130 135 140 Cys Gly Ala Ala His Ala Arg Ile Leu Trp Gly Pro Asp Ala Ile Gly 145 150 155 160 Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu 165 170 175 Leu Arg Glu Asp Pro Ile Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg 180 185 190 Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val Ile 195 200 205 Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gln Thr Thr Val 210 215 220 Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val Ile Glu Pro Trp 225 230 235 240 Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val 245 250 255 Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu 260 265 270 Leu Glu Ala Leu Gly Arg Leu Asp Ile Glu Val Val Ala Thr Leu Asp 275 280 285 Thr Ser Gln Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro 290 295 300 Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala Ile 305 310 315 320 Ile His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly 325 330 335 Val Pro Gln Ile Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala 340 345 350 Gln Gln Leu Gln Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr 355 360 365 Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp 370 375 380 Pro Ala Ile Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala 385 390 395 400 Asp Pro Thr Pro Ala Gly Ile Ile Pro Thr Leu Glu Arg Leu Thr Ala 405 410 415 Leu His Arg Ala Thr 420 <210> 9 <211> 1350 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1350) <400> 9 atg ccc gaa agc cat gcg cag agc gcg ctg ctc gcc gcg atc acc gcc 48 Met Pro Glu Ser His Ala Gln Ser Ala Leu Leu Ala Ala Ile Thr Ala 1 5 10 15 gcg gac cgc acc ccc gag gac atc gcg gcg ctg ccc ctg ccc gag tcc 96 Ala Asp Arg Thr Pro Glu Asp Ile Ala Ala Leu Pro Leu Pro Glu Ser 20 25 30 ttc cgc gcc gtg acc gtc cgc aaa gag gac acc gac atg ttc cgc ggg 144 Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly 35 40 45 atg ccg agc gcg gac aag gac ccg cgc aag tcc ctg cac gtc gac gag 192 Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu 50 55 60 gtg ccg ctg ccc gaa gtg ggg ccc ggg gag gcg ctg gtc gcg gtg atg 240 Val Pro Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met 65 70 75 80 gcc agc tcc gtc aac tac aac acg gtc tgg tcc tcc atc ttc gag ccc 288 Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser Ile Phe Glu Pro 85 90 95 ctc ccg acg ttc ggc ttc ctg gag cgc tac ggg cgc acc tcg ccg ctg 336 Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu 100 105 110 gcc gcg cgc cac gac ctg ccg tac cac atc ctc ggt tcc gac ctg tcc 384 Ala Ala Arg His Asp Leu Pro Tyr His Ile Leu Gly Ser Asp Leu Ser 115 120 125 ggc gtg gtg ctg cgc acg gga ccc ggc gtg aac gtc tgg aaa ccc ggt 432 Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly 130 135 140 gac gag gtc gtc gcg cac tgt ctg tcg gtg gag ctg gag agc ccc gac 480 Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp 145 150 155 160 ggg cac gac gac acc atg ctc gac ccg gcc cag cgc atc tgg ggc ttc 528 Gly His Asp Asp Thr Met Leu Asp Pro Ala Gln Arg Ile Trp Gly Phe 165 170 175 gag acc aac ttc ggg ggc ctg gcc gag gtg gcc ctc gtc aag tcc aac 576 Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn 180 185 190 cag ctg atg ccc aag gcg gcc cat ctg acc tgg gag gag gcc gcc gcg 624 Gln Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala 195 200 205 ccc ggt ctg gtc aac tcc acc gcc tac cgc cag ctg gtc tcc cgc aac 672 Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gln Leu Val Ser Arg Asn 210 215 220 ggc gcc ggc atg aag cag ggc gac aac gtg ctg atc tgg ggc gcc agc 720 Gly Ala Gly Met Lys Gln Gly Asp Asn Val Leu Ile Trp Gly Ala Ser 225 230 235 240 ggc ggc ctg ggc tcg tac gcc acc cag ctg gcc ctc gcc ggc ggg gcc 768 Gly Gly Leu Gly Ser Tyr Ala Thr Gln Leu Ala Leu Ala Gly Gly Ala 245 250 255 cac ccc gtc tgc gtg gtc tcc agc gcg cgc aag gcc gag gtg tgc cgg 816 His Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg 260 265 270 gcc atg ggc gcg gag gcc atc atc gac cgc tcc gcc gag gac tac cgc 864 Ala Met Gly Ala Glu Ala Ile Ile Asp Arg Ser Ala Glu Asp Tyr Arg 275 280 285 ttc tgg agc gac gag gac acc cag gac ccg cgg gag tgg aag cgc ttc 912 Phe Trp Ser Asp Glu Asp Thr Gln Asp Pro Arg Glu Trp Lys Arg Phe 290 295 300 ggc aag cgc atc cgc gag gtc acc ggg ggc gag gac gtc gac atc gtc 960 Gly Lys Arg Ile Arg Glu Val Thr Gly Gly Glu Asp Val Asp Ile Val 305 310 315 320 ttc gag cac ccc ggc cgg gag acc ttc ggg gcg tcc gtc tac gtc acc 1008 Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr 325 330 335 cgc agg ggc ggc acg atc gtc acc tgc gcc tcc acc tcg ggc ttc cgc 1056 Arg Arg Gly Gly Thr Ile Val Thr Cys Ala Ser Thr Ser Gly Phe Arg 340 345 350 cac gag ttc gac aac cgc tac ctc tgg atg cac ctc aag cgt atc gtc 1104 His Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg Ile Val 355 360 365 ggc acc cac ttc gcc aac tac cgc gag gcg tgg gag gcg aac cgg ctc 1152 Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu 370 375 380 gtc gcc aag ggg agg atc cac ccc acc ctc tcg cgc acc tac ccg ctg 1200 Val Ala Lys Gly Arg Ile His Pro Thr Leu Ser Arg Thr Tyr Pro Leu 385 390 395 400 gcc gac acg gcg gtt gcc gtg cac gac gtg cac ggc aac cag cac cag 1248 Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gln His Gln 405 410 415 ggc aag gtc ggc gtg ctc tgc ctg gcg ccc acg gag ggg ctg ggc gtg 1296 Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val 420 425 430 cgc gac gag gag aag cgg gcg cgg cac atc gac gcg atc aac cgg ttc 1344 Arg Asp Glu Glu Lys Arg Ala Arg His Ile Asp Ala Ile Asn Arg Phe 435 440 445 cgc tga 1350 Arg 450 <210> 10 <211> 449 <212> PRT <213> Streptomyces ambofaciens <400> 10 Met Pro Glu Ser His Ala Gln Ser Ala Leu Leu Ala Ala Ile Thr Ala 1 5 10 15 Ala Asp Arg Thr Pro Glu Asp Ile Ala Ala Leu Pro Leu Pro Glu Ser 20 25 30 Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly 35 40 45 Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu 50 55 60 Val Pro Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met 65 70 75 80 Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser Ile Phe Glu Pro 85 90 95 Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu 100 105 110 Ala Ala Arg His Asp Leu Pro Tyr His Ile Leu Gly Ser Asp Leu Ser 115 120 125 Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly 130 135 140 Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp 145 150 155 160 Gly His Asp Asp Thr Met Leu Asp Pro Ala Gln Arg Ile Trp Gly Phe 165 170 175 Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn 180 185 190 Gln Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala 195 200 205 Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gln Leu Val Ser Arg Asn 210 215 220 Gly Ala Gly Met Lys Gln Gly Asp Asn Val Leu Ile Trp Gly Ala Ser 225 230 235 240 Gly Gly Leu Gly Ser Tyr Ala Thr Gln Leu Ala Leu Ala Gly Gly Ala 245 250 255 His Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg 260 265 270 Ala Met Gly Ala Glu Ala Ile Ile Asp Arg Ser Ala Glu Asp Tyr Arg 275 280 285 Phe Trp Ser Asp Glu Asp Thr Gln Asp Pro Arg Glu Trp Lys Arg Phe 290 295 300 Gly Lys Arg Ile Arg Glu Val Thr Gly Gly Glu Asp Val Asp Ile Val 305 310 315 320 Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr 325 330 335 Arg Arg Gly Gly Thr Ile Val Thr Cys Ala Ser Thr Ser Gly Phe Arg 340 345 350 His Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg Ile Val 355 360 365 Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu 370 375 380 Val Ala Lys Gly Arg Ile His Pro Thr Leu Ser Arg Thr Tyr Pro Leu 385 390 395 400 Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gln His Gln 405 410 415 Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val 420 425 430 Arg Asp Glu Glu Lys Arg Ala Arg His Ile Asp Ala Ile Asn Arg Phe 435 440 445 Arg <210> 11 <211> 675 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(675) <400> 11 atg atg agc gtg gca gac cag acg gct ctc agc ccc gcg ctg ctg gag 48 Met Met Ser Val Ala Asp Gln Thr Ala Leu Ser Pro Ala Leu Leu Glu 1 5 10 15 tac gcc cgg agc gtc gcg ctg cgg gac gac ggc ctg ctg cgc gaa ctg 96 Tyr Ala Arg Ser Val Ala Leu Arg Asp Asp Gly Leu Leu Arg Glu Leu 20 25 30 cac gag gtg acc gcc ggg ctc ccc ggc ggc cgg gcc atg cag atc atg 144 His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gln Ile Met 35 40 45 ccc gag gag gcg cag ttc ctc gcc ctg ctg atc cgg ctc gtc ggt gcc 192 Pro Glu Glu Ala Gln Phe Leu Ala Leu Leu Ile Arg Leu Val Gly Ala 50 55 60 cgg cgg gtg ctg gag atc ggc acc ttc acg ggg tac agc acg ctg tgc 240 Arg Arg Val Leu Glu Ile Gly Thr Phe Thr Gly Tyr Ser Thr Leu Cys 65 70 75 80 atg gcg cgg gca ctg ccc gcc gac ggc acc gtc gtc acc tgc gac atc 288 Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp Ile 85 90 95 agc gac agg tgg ccc ggc gtc ggc gca ccg tac tgg cgc cgg gcc ggg 336 Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly 100 105 110 gtg gag tcc cgg atc gac ctg cgc gtc ggc gac gcc gtc cgg acc ctc 384 Val Glu Ser Arg Ile Asp Leu Arg Val Gly Asp Ala Val Arg Thr Leu 115 120 125 gcc gag ctc cgc gag cac gag ggg gac ggc tcg ttc gac ctg gtc ttc 432 Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe 130 135 140 gtc gac gcc gac aag acc ggg tac ccg cac tac tac gag cag gcg ctg 480 Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gln Ala Leu 145 150 155 160 gcc ctg gta cgc ccc ggc gga ctg gtg gcg gtc gac aac acc ctg ttc 528 Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe 165 170 175 ttc ggc cgg gtg gcc gac ccg gcc gtc gag gac gcc gac acc gtc gcc 576 Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala 180 185 190 gtg cgc gcg ctc aac gag ctg ctg cgc gac gac gaa cgc gtg gac atc 624 Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp Ile 195 200 205 gcc ctg ctg acg gtc gcc gac ggg atc act ctg gcc cgc cgg cgg gag 672 Ala Leu Leu Thr Val Ala Asp Gly Ile Thr Leu Ala Arg Arg Arg Glu 210 215 220 tga 675 225 <210> 12 <211> 224 <212> PRT <213> Streptomyces ambofaciens <400> 12 Met Met Ser Val Ala Asp Gln Thr Ala Leu Ser Pro Ala Leu Leu Glu 1 5 10 15 Tyr Ala Arg Ser Val Ala Leu Arg Asp Asp Gly Leu Leu Arg Glu Leu 20 25 30 His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gln Ile Met 35 40 45 Pro Glu Glu Ala Gln Phe Leu Ala Leu Leu Ile Arg Leu Val Gly Ala 50 55 60 Arg Arg Val Leu Glu Ile Gly Thr Phe Thr Gly Tyr Ser Thr Leu Cys 65 70 75 80 Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp Ile 85 90 95 Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly 100 105 110 Val Glu Ser Arg Ile Asp Leu Arg Val Gly Asp Ala Val Arg Thr Leu 115 120 125 Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe 130 135 140 Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gln Ala Leu 145 150 155 160 Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe 165 170 175 Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala 180 185 190 Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp Ile 195 200 205 Ala Leu Leu Thr Val Ala Asp Gly Ile Thr Leu Ala Arg Arg Arg Glu 210 215 220 <210> 13 <211> 1245 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1245) <400> 13 gtg ctc cag cgc gtc gat ctg tcg tca ctc acc ggc ctc cgc tgg tat 48 Val Leu Gln Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr 1 5 10 15 gcg gcg ctg acg gta ttc gcc tgt cac atc gcc cag cag ggc ttc ttc 96 Ala Ala Leu Thr Val Phe Ala Cys His Ile Ala Gln Gln Gly Phe Phe 20 25 30 gcc gac cag cag gtg ggc agc gca ctg ctg cac atc acc ccg ctc ggt 144 Ala Asp Gln Gln Val Gly Ser Ala Leu Leu His Ile Thr Pro Leu Gly 35 40 45 tcc atg gcg gtc tcg atc ttc ttc ata ctg agt gga ttc gtc ctc gcc 192 Ser Met Ala Val Ser Ile Phe Phe Ile Leu Ser Gly Phe Val Leu Ala 50 55 60 tgg tcg gcc cgc gac gag gac tcc gtg ccg act ttc tgg cgg cgc cgc 240 Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg 65 70 75 80 atc gcg aag atc tat ccg ctg cat ctc gcg acg ttc ggc atc gcg gct 288 Ile Ala Lys Ile Tyr Pro Leu His Leu Ala Thr Phe Gly Ile Ala Ala 85 90 95 ctc atc att ttc tcc ctg tcg gag ccg gta ctt ccc ggc ggt tcc gta 336 Leu Ile Ile Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val 100 105 110 tgg gac ggg ctg gtg ccc aat gtt ctg ctc gtg cag tcc tgg ctt ccc 384 Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gln Ser Trp Leu Pro 115 120 125 gac gcg acc ctc acg gcc agt ttc aac acg ccc agc tgg tcg ctc tcc 432 Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser 130 135 140 tgt gag atc gcc ttc tat ctg tcg ttc ccg ctg tgg tac cgg ctg gtg 480 Cys Glu Ile Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val 145 150 155 160 cgc agg att ccc gca cgg cgg ctg tgg tgg tgc gcc gcg ggg atc gcc 528 Arg Arg Ile Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly Ile Ala 165 170 175 gtg gcc gtg acg tgt gtg ccc ctg ctg gcg ggc ctg ctc ccg gcg agc 576 Val Ala Val Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser 180 185 190 gag gag gtg gcc ccc ggg atg tcg ctc aac gag gtc tgg ttc gcg tac 624 Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr 195 200 205 tgg ctt ccg ccg gtg cgc atg ctg gag ttc gtc ctc ggc atc gtg atg 672 Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly Ile Val Met 210 215 220 gcg ctg atc ctg cgc gcg ggg atc tgg aag ggc ccc ggt ccg gcg gtc 720 Ala Leu Ile Leu Arg Ala Gly Ile Trp Lys Gly Pro Gly Pro Ala Val 225 230 235 240 tgc acg gcg ctc ctc gcc gcg agt tac ggc ctc acc cag atg gtg ccc 768 Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gln Met Val Pro 245 250 255 ccg atc ttc acc ctc gtc gcc tgc tcc gtc gta ccg gcc gcg ctg ctg 816 Pro Ile Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu 260 265 270 atc acg gcg ctg gcc gac gcc gac gtg cac ggc cgg cgc acg ggg ctg 864 Ile Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu 275 280 285 cgt tcg gcg acg ctg gtg cgg ctg ggc cag tgg tcc ttc gcc ttc tac 912 Arg Ser Ala Thr Leu Val Arg Leu Gly Gln Trp Ser Phe Ala Phe Tyr 290 295 300 ctg gtc cac ttc ctg atc atc cgc tac gga cac cgg ctg atg ggc ggc 960 Leu Val His Phe Leu Ile Ile Arg Tyr Gly His Arg Leu Met Gly Gly 305 310 315 320 gat ctg ggc tac gag cgg cag tgg agc acc ccg gcc gcg atc gcg ctg 1008 Asp Leu Gly Tyr Glu Arg Gln Trp Ser Thr Pro Ala Ala Ile Ala Leu 325 330 335 tcc ctg ggg atg ctg ggg gtg gcg gtc ctg gcc ggc ggt ctg ctg cac 1056 Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His 340 345 350 acc gtc gtc gaa cag ccc tgc atg cgc ctg ttc ggc agc cgc agg tcc 1104 Thr Val Val Glu Gln Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser 355 360 365 gcc tcc cgt ccg aag ccc ggc gcc acc gcg gct ccc cgg aac tca ccc 1152 Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro 370 375 380 gcg gcc gac gcg gcc ggc gtg ccc ctg ctc ccg ggc gta ccc ggg ccc 1200 Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro 385 390 395 400 gcg cac acc ccc gca gcg acg aac gaa ccc acc ccg aga gga tga 1245 Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly 405 410 415 <210> 14 <211> 414 <212> PRT <213> Streptomyces ambofaciens <400> 14 Val Leu Gln Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr 1 5 10 15 Ala Ala Leu Thr Val Phe Ala Cys His Ile Ala Gln Gln Gly Phe Phe 20 25 30 Ala Asp Gln Gln Val Gly Ser Ala Leu Leu His Ile Thr Pro Leu Gly 35 40 45 Ser Met Ala Val Ser Ile Phe Phe Ile Leu Ser Gly Phe Val Leu Ala 50 55 60 Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg 65 70 75 80 Ile Ala Lys Ile Tyr Pro Leu His Leu Ala Thr Phe Gly Ile Ala Ala 85 90 95 Leu Ile Ile Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val 100 105 110 Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gln Ser Trp Leu Pro 115 120 125 Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser 130 135 140 Cys Glu Ile Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val 145 150 155 160 Arg Arg Ile Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly Ile Ala 165 170 175 Val Ala Val Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser 180 185 190 Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr 195 200 205 Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly Ile Val Met 210 215 220 Ala Leu Ile Leu Arg Ala Gly Ile Trp Lys Gly Pro Gly Pro Ala Val 225 230 235 240 Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gln Met Val Pro 245 250 255 Pro Ile Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu 260 265 270 Ile Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu 275 280 285 Arg Ser Ala Thr Leu Val Arg Leu Gly Gln Trp Ser Phe Ala Phe Tyr 290 295 300 Leu Val His Phe Leu Ile Ile Arg Tyr Gly His Arg Leu Met Gly Gly 305 310 315 320 Asp Leu Gly Tyr Glu Arg Gln Trp Ser Thr Pro Ala Ala Ile Ala Leu 325 330 335 Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His 340 345 350 Thr Val Val Glu Gln Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser 355 360 365 Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro 370 375 380 Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro 385 390 395 400 Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly 405 410 <210> 15 <211> 849 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(849) <400> 15 gtg aca ttg aaa tcc cca ctg cca ccg caa tcc gtc tcc gca ccc gct 48 Val Thr Leu Lys Ser Pro Leu Pro Pro Gln Ser Val Ser Ala Pro Ala 1 5 10 15 gat tca cgc agc acc gcg cgg aga gaa tgg ggt cag aac ttc ttt cgt 96 Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gln Asn Phe Phe Arg 20 25 30 aca gcc gcc gcg gcc tgt cgt ttc tcc gct cag ctg gac ggt tcg gac 144 Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gln Leu Asp Gly Ser Asp 35 40 45 acc att ccg ccc gat tct ccg aat gac ctg atg acc gtc gaa ata ggc 192 Thr Ile Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu Ile Gly 50 55 60 gcg gga tca ggg cgg gtg acc aaa gtg ctc gcc tca ccc ggg acg cct 240 Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro 65 70 75 80 tta ctc gcg gtg gaa ata gat ccc cgc tgg gct cgg cgg ctg gcc gcc 288 Leu Leu Ala Val Glu Ile Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala 85 90 95 gaa tcg ctg ccg gac gtc acg gtg gtg aac gag gat ttc ctg acc ctg 336 Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu 100 105 110 caa ctg ccc ggg cag ccg gtc aga ctc atc ggg aat ctt ccc ttc gtc 384 Gln Leu Pro Gly Gln Pro Val Arg Leu Ile Gly Asn Leu Pro Phe Val 115 120 125 acc ggc acc aga atg ctg agg cgc tgc ctc gac atg ggt ccg gcg cgc 432 Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg 130 135 140 atg cgg cag ggc gtg ttc ctg ttg cag cgg gag tac gtg gga aag cgg 480 Met Arg Gln Gly Val Phe Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg 145 150 155 160 acc gga gcc tgg ggc gga aac ctc ttc aac gcc cag tgg gag ccg tgg 528 Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp 165 170 175 tac tcg ttc gac cgg ggc ctg gcc ttc tca cgc cag gac ttc acc ccc 576 Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gln Asp Phe Thr Pro 180 185 190 gta ccg cgc gcg gac acc cag acc ctg atg gtc gcc ccg cac cgc agg 624 Val Pro Arg Ala Asp Thr Gln Thr Leu Met Val Ala Pro His Arg Arg 195 200 205 ccg tcc gtg ccc tgg cgt gag aag gcc gcc tac cag cgg ttc gtc caa 672 Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gln Arg Phe Val Gln 210 215 220 cgg gtc ttc gac acc ggc cag atg acg gtg ggc gac gcc gcg cgg aag 720 Arg Val Phe Asp Thr Gly Gln Met Thr Val Gly Asp Ala Ala Arg Lys 225 230 235 240 gtg ctg cgc cgc gga cac gcc cag ttc gtg cgc ggg gcg ggc gtg agg 768 Val Leu Arg Arg Gly His Ala Gln Phe Val Arg Gly Ala Gly Val Arg 245 250 255 ccg gcc gac cgg gtc aag gac ctc acg gtc ccg gag tgg acc gca ctc 816 Pro Ala Asp Arg Val Lys Asp Leu Thr Val Pro Glu Trp Thr Ala Leu 260 265 270 ttc cgc gcc tac ggg cgg acg gcc gac cgc tga 849 Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg 275 280 <210> 16 <211> 282 <212> PRT <213> Streptomyces ambofaciens <400> 16 Val Thr Leu Lys Ser Pro Leu Pro Pro Gln Ser Val Ser Ala Pro Ala 1 5 10 15 Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gln Asn Phe Phe Arg 20 25 30 Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gln Leu Asp Gly Ser Asp 35 40 45 Thr Ile Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu Ile Gly 50 55 60 Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro 65 70 75 80 Leu Leu Ala Val Glu Ile Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala 85 90 95 Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu 100 105 110 Gln Leu Pro Gly Gln Pro Val Arg Leu Ile Gly Asn Leu Pro Phe Val 115 120 125 Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg 130 135 140 Met Arg Gln Gly Val Phe Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg 145 150 155 160 Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp 165 170 175 Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gln Asp Phe Thr Pro 180 185 190 Val Pro Arg Ala Asp Thr Gln Thr Leu Met Val Ala Pro His Arg Arg 195 200 205 Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gln Arg Phe Val Gln 210 215 220 Arg Val Phe Asp Thr Gly Gln Met Thr Val Gly Asp Ala Ala Arg Lys 225 230 235 240 Val Leu Arg Arg Gly His Ala Gln Phe Val Arg Gly Ala Gly Val Arg 245 250 255 Pro Ala Asp Arg Val Lys Asp Leu Thr Val Pro Glu Trp Thr Ala Leu 260 265 270 Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg 275 280 <210> 17 <211> 831 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(831) <400> 17 gtg aag gag gtg gcg gtc gac acc ggt acc ccg gcc ggc ccc gtg tgg 48 Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp 1 5 10 15 cgt ggt gcc ggc ctc ggc acc cag ctg tgg gta ctg acc gcg cgg cag 96 Arg Gly Ala Gly Leu Gly Thr Gln Leu Trp Val Leu Thr Ala Arg Gln 20 25 30 atc cgt tcc atg tac ggc gac cgc cgc ctg gcg ctg ttc agc ctg atg 144 Ile Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met 35 40 45 caa ccg gtg atc atg ctg ttg ctg ctg agc gag atc ttc ggc agc atg 192 Gln Pro Val Ile Met Leu Leu Leu Leu Ser Glu Ile Phe Gly Ser Met 50 55 60 gcc gac ccg gac gac ttc ccg cag ggc gtg cgc tac atc gac tac gtg 240 Ala Asp Pro Asp Asp Phe Pro Gln Gly Val Arg Tyr Ile Asp Tyr Val 65 70 75 80 gtg ccc gcg ctg ctg gtc acc acc ggc atc ggc tcg gcc cag ggc gcg 288 Val Pro Ala Leu Leu Val Thr Thr Gly Ile Gly Ser Ala Gln Gly Ala 85 90 95 ggg gtg ggc ctg gtc agg gac atg gac aac ggg atg gtg gcg cgc ttc 336 Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe 100 105 110 cgc gtc ctg ccg gcc cgg ctg ttc ctg gtg ctg gtc gcc cgg tcg ctg 384 Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu 115 120 125 gcc gat ctg gtc cgt gtg ttc acc gag ttg gtc gtc ctc gtg gcc gtc 432 Ala Asp Leu Val Arg Val Phe Thr Glu Leu Val Val Leu Val Ala Val 130 135 140 ggt gtg atc ctg ctg ggc ttc cgt ccg gcc ggg ggt ttg tgg ggc acg 480 Gly Val Ile Leu Leu Gly Phe Arg Pro Ala Gly Gly Leu Trp Gly Thr 145 150 155 160 tcc gcc gcc ctg ttg ctc acc ctg ttc gtc atc tgg tcg ctg atc tgg 528 Ser Ala Ala Leu Leu Leu Thr Leu Phe Val Ile Trp Ser Leu Ile Trp 165 170 175 ggg ttc atc gcc ctc gcg gcg tgg ctg cgc agc gtg gag gtg atg tcc 576 Gly Phe Ile Ala Leu Ala Ala Trp Leu Arg Ser Val Glu Val Met Ser 180 185 190 agc ctc gcg gtt ctg gtg atg ttc ccg ctc atg ttc gcc tcc agt gcg 624 Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala 195 200 205 ttc gtc ccg ctg gac gcc ctc ccg gag tgg ctg cgc tcg gtg gcg cac 672 Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala His 210 215 220 ctc aac ccc gtg acg tac gcg gtc gac agc gcc cgc cgc ctg gcg ctg 720 Leu Asn Pro Val Thr Tyr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu 225 230 235 240 gac tgg gac ccg ggg tgg agc gtg ccc ggc gcg ctg ctg acc agc acc 768 Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr 245 250 255 gcg ctc atg gcg gtg ggg atg tac gtc gcc ggg cgt tcc ttc aag agg 816 Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg 260 265 270 ccc ccg aac gaa tga 831 Pro Pro Asn Glu 275 <210> 18 <211> 276 <212> PRT <213> Streptomyces ambofaciens <400> 18 Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp 1 5 10 15 Arg Gly Ala Gly Leu Gly Thr Gln Leu Trp Val Leu Thr Ala Arg Gln 20 25 30 Ile Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met 35 40 45 Gln Pro Val Ile Met Leu Leu Leu Leu Ser Glu Ile Phe Gly Ser Met 50 55 60 Ala Asp Pro Asp Asp Phe Pro Gln Gly Val Arg Tyr Ile Asp Tyr Val 65 70 75 80 Val Pro Ala Leu Leu Val Thr Thr Gly Ile Gly Ser Ala Gln Gly Ala 85 90 95 Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe 100 105 110 Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu 115 120 125 Ala Asp Leu Val Arg Val Phe Thr Glu Leu Val Val Leu Val Ala Val 130 135 140 Gly Val Ile Leu Leu Gly Phe Arg Pro Ala Gly Gly Leu Trp Gly Thr 145 150 155 160 Ser Ala Ala Leu Leu Leu Thr Leu Phe Val Ile Trp Ser Leu Ile Trp 165 170 175 Gly Phe Ile Ala Leu Ala Ala Trp Leu Arg Ser Val Glu Val Met Ser 180 185 190 Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala 195 200 205 Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala His 210 215 220 Leu Asn Pro Val Thr Tyr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu 225 230 235 240 Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr 245 250 255 Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg 260 265 270 Pro Pro Asn Glu 275 <210> 19 <211> 882 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(882) <400> 19 gtg gac atc gag gtc gaa cgg ggc cgg gtg ctc ggg ctg ctg ggt cac 48 Val Asp Ile Glu Val Glu Arg Gly Arg Val Leu Gly Leu Leu Gly His 1 5 10 15 aac ggg gcc ggc aag acg acc ttg gtg aac atc ctt gcc acg gtc tcc 96 Asn Gly Ala Gly Lys Thr Thr Leu Val Asn Ile Leu Ala Thr Val Ser 20 25 30 ccg gcg tcc gcg ggc acg gtg acc gtc gcc ggt ttc gac gtc gcg acg 144 Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr 35 40 45 cag ggc gcc gag atc cgc gcg cgc atc ggg gtg acc ggc cag ttc gcg 192 Gln Gly Ala Glu Ile Arg Ala Arg Ile Gly Val Thr Gly Gln Phe Ala 50 55 60 tcg gtg gac gag tac ctg agc gga ttc cgc aac ctc gtc ctg atc ggc 240 Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu Ile Gly 65 70 75 80 cgc ctc ctc ggg gcg gga cgg cgt gag gcg gcg gcc cgg gcc acc gag 288 Arg Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu 85 90 95 ctc ctg gag ctg ttc gag ctg acc ggg gcg gcc cac cag ccc tcc cgc 336 Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gln Pro Ser Arg 100 105 110 acc tac tcg ggc ggg atg cgc cga cgg ctc gac ctc gcc gcc agc ctg 384 Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu 115 120 125 gtc ggc cgg ccg gac gtg ctg ttc ctc gac gag ccg acg acc ggg ctg 432 Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu 130 135 140 gac ccg gcg acc cgg atc gcc ctg tgg gag acg gtg gag aag ctg gtg 480 Asp Pro Ala Thr Arg Ile Ala Leu Trp Glu Thr Val Glu Lys Leu Val 145 150 155 160 gcg ggc ggc acg acc gtc ctg ctg acc acc cag tac ctg gac gag gcg 528 Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gln Tyr Leu Asp Glu Ala 165 170 175 gac cgg ctg gcc gac tgg atc acc gtc ctg tcg aag ggc cgg gtg gtg 576 Asp Arg Leu Ala Asp Trp Ile Thr Val Leu Ser Lys Gly Arg Val Val 180 185 190 gcc tcg gac acc acc gac cgg ctc aag gcc gac ctg ggc cac cgg tcg 624 Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser 195 200 205 gtg cgg gtg gtc ctt ccg ccc gcc gcc gac ctg acg gcc gcc gcc gcc 672 Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala 210 215 220 gcg ctc acc gcc ggc ggg ttc cgt ccg cgg tcc gac gcc ggg gag cac 720 Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His 225 230 235 240 gcg ctg acc acg ccc gtg gac acc tcg gcc ggt atc gcg ggc gtc atc 768 Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly Ile Ala Gly Val Ile 245 250 255 cgc gcg ctg gac acc gtc gga acg cag gcc gtc gag ctg acc gtc aag 816 Arg Ala Leu Asp Thr Val Gly Thr Gln Ala Val Glu Leu Thr Val Lys 260 265 270 gag ccg tcc ctg gac gac gtc tac ctg gcg ctc acc cat ccc tca ccc 864 Glu Pro Ser Leu Asp Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro 275 280 285 gcc gcc gac gcg gcc tga 882 Ala Ala Asp Ala Ala 290 <210> 20 <211> 293 <212> PRT <213> Streptomyces ambofaciens <400> 20 Val Asp Ile Glu Val Glu Arg Gly Arg Val Leu Gly Leu Leu Gly His 1 5 10 15 Asn Gly Ala Gly Lys Thr Thr Leu Val Asn Ile Leu Ala Thr Val Ser 20 25 30 Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr 35 40 45 Gln Gly Ala Glu Ile Arg Ala Arg Ile Gly Val Thr Gly Gln Phe Ala 50 55 60 Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu Ile Gly 65 70 75 80 Arg Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu 85 90 95 Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gln Pro Ser Arg 100 105 110 Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu 115 120 125 Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu 130 135 140 Asp Pro Ala Thr Arg Ile Ala Leu Trp Glu Thr Val Glu Lys Leu Val 145 150 155 160 Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gln Tyr Leu Asp Glu Ala 165 170 175 Asp Arg Leu Ala Asp Trp Ile Thr Val Leu Ser Lys Gly Arg Val Val 180 185 190 Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser 195 200 205 Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala 210 215 220 Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His 225 230 235 240 Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly Ile Ala Gly Val Ile 245 250 255 Arg Ala Leu Asp Thr Val Gly Thr Gln Ala Val Glu Leu Thr Val Lys 260 265 270 Glu Pro Ser Leu Asp Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro 275 280 285 Ala Ala Asp Ala Ala 290 <210> 21 <211> 228 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(228) <400> 21 atg agc aac ccg ttc gag gac acg gaa gcc acc tac gtc gtg ctg gtc 48 Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val 1 5 10 15 aac gac gag ggg cag cac tcg ctg tgg ccg tcg ttc gcg gag gtc ccg 96 Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro 20 25 30 gcg ggc tgg tcc gtc gtg gtg ccg gag acg gac cgg cag tcg tgc ctg 144 Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gln Ser Cys Leu 35 40 45 gac tac atc aac gag aac tgg acc gac atg cgc ccc aag agc ctc gtc 192 Asp Tyr Ile Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val 50 55 60 gag gcg atg gcg acg gcc ggg cag gac gcc cct tga 228 Glu Ala Met Ala Thr Ala Gly Gln Asp Ala Pro 65 70 75 <210> 22 <211> 75 <212> PRT <213> Streptomyces ambofaciens <400> 22 Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val 1 5 10 15 Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro 20 25 30 Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gln Ser Cys Leu 35 40 45 Asp Tyr Ile Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val 50 55 60 Glu Ala Met Ala Thr Ala Gly Gln Asp Ala Pro 65 70 75 <210> 23 <211> 1212 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1212) <400> 23 atg ggt gag gcc gtg acg gga ccg atg gag ctg agc aag gac gcg gac 48 Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp 1 5 10 15 gcc cgg ggg ctg ctt gag tgg ttc gcg tac aac agg acg cgt cat ccg 96 Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro 20 25 30 gtg ttc tgg gac gag acc cga cag gcg tgg cag gtc ttc ggc tac gac 144 Val Phe Trp Asp Glu Thr Arg Gln Ala Trp Gln Val Phe Gly Tyr Asp 35 40 45 gac tac gtg acg gtg tcg aac aac ccg cag ttc ttc tcc tcg gac ttc 192 Asp Tyr Val Thr Val Ser Asn Asn Pro Gln Phe Phe Ser Ser Asp Phe 50 55 60 aac atg gtg atg ccg acg ccg ccc gaa ctg gag atg atc atc ggt ccg 240 Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met Ile Ile Gly Pro 65 70 75 80 ggc acg atc ggc gcg ctg gac ccg ccc gcg cac gga ccg atg cgc aag 288 Gly Thr Ile Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arg Lys 85 90 95 ctg gtg agc cag gcg ttc acc ccc cga cgg atc gcc cgg ctg gag ccc 336 Leu Val Ser Gln Ala Phe Thr Pro Arg Arg Ile Ala Arg Leu Glu Pro 100 105 110 agg gtg cgc gcg atc acc gag gag ctc ctg gac aag gtg ggg cag cag 384 Arg Val Arg Ala Ile Thr Glu Glu Leu Leu Asp Lys Val Gly Gln Gln 115 120 125 gac gtc gtc gac gcc gtg ggt gac ctg tcc tac gcg ctg ccg gtc atc 432 Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val Ile 130 135 140 gtg atc gcc gaa ctg ctg ggc ata ccc gcc ggc gac cgt gac ctg ttc 480 Val Ile Ala Glu Leu Leu Gly Ile Pro Ala Gly Asp Arg Asp Leu Phe 145 150 155 160 cgg gag tgg gtc gac acc ctg ctg acg aac gag ggc ctg gag tac ccg 528 Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro 165 170 175 aac ctc ccg gac aac ttc acc gag acg atc gcg ccc gcg ctc aag gag 576 Asn Leu Pro Asp Asn Phe Thr Glu Thr Ile Ala Pro Ala Leu Lys Glu 180 185 190 atg acc gac tac ctc ctg aag cag atc cac gcc aag cgg gac gcg ccc 624 Met Thr Asp Tyr Leu Leu Lys Gln Ile His Ala Lys Arg Asp Ala Pro 195 200 205 gcc gac gac ctg gtc agc ggg ctg gtc cag gcg gag cag gac ggc cgc 672 Ala Asp Asp Leu Val Ser Gly Leu Val Gln Ala Glu Gln Asp Gly Arg 210 215 220 cgg ctg acc gac gtc gag atc gtc aac atc gtc gcg ctg ctc ctg acg 720 Arg Leu Thr Asp Val Glu Ile Val Asn Ile Val Ala Leu Leu Leu Thr 225 230 235 240 gcg ggg cac gtc tcc tcc agc acc ctg ctc agc aac ctg ttc ctg gtc 768 Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val 245 250 255 ctg gag gag aac ccg cag gcg ctg gag gac ctg cgg gcc gat cgc tcc 816 Leu Glu Glu Asn Pro Gln Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser 260 265 270 ctg gtg ccc ggc gcg atc gag gag acg ctg cgc tac cgc agc ccc ttc 864 Leu Val Pro Gly Ala Ile Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe 275 280 285 aac aac atc ttc cgg ttc gtc aag gag gac acc acc gtc ctc ggt ccg 912 Asn Asn Ile Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro 290 295 300 ctc atg gag aag ggc cag atg gtg atc gcc tgg agc cag tcc gcc aac 960 Leu Met Glu Lys Gly Gln Met Val Ile Ala Trp Ser Gln Ser Ala Asn 305 310 315 320 cgg gac ccc cgg cac ttc ccg gac ccg gac acc ttc gac atc cgc cgc 1008 Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp Ile Arg Arg 325 330 335 tcg gac ggc acc cgg cac atg gcc ttc ggg cac ggc atc cac cac tgc 1056 Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly Ile His His Cys 340 345 350 ctg ggt gcc gcc ctc gcc cgc ctg gag ggc aag gtc atg ctc gaa ctc 1104 Leu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu Leu 355 360 365 ctc ctg gac cgg gtc caa ggc ttc cgc atc gac cac gag cac acc gtg 1152 Leu Leu Asp Arg Val Gln Gly Phe Arg Ile Asp His Glu His Thr Val 370 375 380 ttc tac gag gcc gac cag ctc act ccg aag tac ctg ccc gtc cgg gtc 1200 Phe Tyr Glu Ala Asp Gln Leu Thr Pro Lys Tyr Leu Pro Val Arg Val 385 390 395 400 gac tgg aac tga 1212 Asp Trp Asn <210> 24 <211> 403 <212> PRT <213> Streptomyces ambofaciens <400> 24 Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp 1 5 10 15 Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro 20 25 30 Val Phe Trp Asp Glu Thr Arg Gln Ala Trp Gln Val Phe Gly Tyr Asp 35 40 45 Asp Tyr Val Thr Val Ser Asn Asn Pro Gln Phe Phe Ser Ser Asp Phe 50 55 60 Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met Ile Ile Gly Pro 65 70 75 80 Gly Thr Ile Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arg Lys 85 90 95 Leu Val Ser Gln Ala Phe Thr Pro Arg Arg Ile Ala Arg Leu Glu Pro 100 105 110 Arg Val Arg Ala Ile Thr Glu Glu Leu Leu Asp Lys Val Gly Gln Gln 115 120 125 Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val Ile 130 135 140 Val Ile Ala Glu Leu Leu Gly Ile Pro Ala Gly Asp Arg Asp Leu Phe 145 150 155 160 Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro 165 170 175 Asn Leu Pro Asp Asn Phe Thr Glu Thr Ile Ala Pro Ala Leu Lys Glu 180 185 190 Met Thr Asp Tyr Leu Leu Lys Gln Ile His Ala Lys Arg Asp Ala Pro 195 200 205 Ala Asp Asp Leu Val Ser Gly Leu Val Gln Ala Glu Gln Asp Gly Arg 210 215 220 Arg Leu Thr Asp Val Glu Ile Val Asn Ile Val Ala Leu Leu Leu Thr 225 230 235 240 Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val 245 250 255 Leu Glu Glu Asn Pro Gln Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser 260 265 270 Leu Val Pro Gly Ala Ile Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe 275 280 285 Asn Asn Ile Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro 290 295 300 Leu Met Glu Lys Gly Gln Met Val Ile Ala Trp Ser Gln Ser Ala Asn 305 310 315 320 Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp Ile Arg Arg 325 330 335 Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly Ile His His Cys 340 345 350 Leu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu Leu 355 360 365 Leu Leu Asp Arg Val Gln Gly Phe Arg Ile Asp His Glu His Thr Val 370 375 380 Phe Tyr Glu Ala Asp Gln Leu Thr Pro Lys Tyr Leu Pro Val Arg Val 385 390 395 400 Asp Trp Asn <210> 25 <211> 540 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(540) <220> <221> CDS <222> (190)..(540) <400> 25 ctg aac ccg agg gtc tcg tcc cgg agt cca ggg ccg tcc cga gcc ggc 48 Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly 1 5 10 15 cct gga cct cac gac cgc ccg ata agg agc gcc gcc atc gcc gag aac 96 Pro Gly Pro His Asp Arg Pro Ile Arg Ser Ala Ala Ile Ala Glu Asn 20 25 30 aca gcc gag ctc cct gcc cgg cgg gtc ggc agg atc aag ccg tgc cgg 144 Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg Ile Lys Pro Cys Arg 35 40 45 ctg atc agg ctc gag cag cac atc gac ccg cgc ggc agc ctc tcc gtg 192 Leu Ile Arg Leu Glu Gln His Ile Asp Pro Arg Gly Ser Leu Ser Val 50 55 60 atc gag tcc ggc gtg acc gtg gac ttc ccc gtc cga cgc gtc tac tac 240 Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr 65 70 75 80 atg cat ggc cag acc cag tcc tct ccc ccg cgc ggc ctg cac gcg cac 288 Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala His 85 90 95 cgc acc ctg gaa caa ctc gtc atc gcc gtc cac ggc gcc ttc tcc atc 336 Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser Ile 100 105 110 acc ctc gac gac ggc ttc cag cac gcc acc tac cgt ctg gac gaa ccc 384 Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu Pro 115 120 125 gga gcc gga ctc tgc atc ggc ccc atg gtc tgg cgc gtc ctg aag gac 432 Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys Asp 130 135 140 ttc gac ccc gac acc gtg gcc ctg gtc ctc gcc tcg cag cac tac gag 480 Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr Glu 145 150 155 160 gag tcc gac tac tac cgc gac tac gac acc ttc ctg cat gac gca cgg 528 Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala Arg 165 170 175 agc ctc aca tga 540 Ser Leu Thr 180 <210> 26 <211> 179 <212> PRT <213> Streptomyces ambofaciens <400> 26 Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly 1 5 10 15 Pro Gly Pro His Asp Arg Pro Ile Arg Ser Ala Ala Ile Ala Glu Asn 20 25 30 Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg Ile Lys Pro Cys Arg 35 40 45 Leu Ile Arg Leu Glu Gln His Ile Asp Pro Arg Gly Ser Leu Ser Val 50 55 60 Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr 65 70 75 80 Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala His 85 90 95 Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser Ile 100 105 110 Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu Pro 115 120 125 Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys Asp 130 135 140 Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr Glu 145 150 155 160 Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala Arg 165 170 175 Ser Leu Thr <210> 27 <211> 116 <212> PRT <213> Streptomyces ambofaciens <400> 27 Val Ile Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr 1 5 10 15 Tyr Met His Gly Gln Thr Gln Ser Ser Pro Pro Arg Gly Leu His Ala 20 25 30 His Arg Thr Leu Glu Gln Leu Val Ile Ala Val His Gly Ala Phe Ser 35 40 45 Ile Thr Leu Asp Asp Gly Phe Gln His Ala Thr Tyr Arg Leu Asp Glu 50 55 60 Pro Gly Ala Gly Leu Cys Ile Gly Pro Met Val Trp Arg Val Leu Lys 65 70 75 80 Asp Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gln His Tyr 85 90 95 Glu Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala 100 105 110 Arg Ser Leu Thr 115 <210> 28 <211> 1167 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1167) <400> 28 atg acc atc ccc ttc ctc gac gcg ggc gcc ggc tac cgg gag ttg cga 48 Met Thr Ile Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg 1 5 10 15 gcc gag atc gac gcg gcc ctg cag cgg gtg tcc gcc tcc ggc cgc tat 96 Ala Glu Ile Asp Ala Ala Leu Gln Arg Val Ser Ala Ser Gly Arg Tyr 20 25 30 ctg ctc gac gcg gaa ctc gcg gcc ttc gag gag gag ttc gcc gcg tac 144 Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr 35 40 45 tgc gac aac gac cac tgt gtg gcg gtg ggc agt ggc tgc gac gcg ctg 192 Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu 50 55 60 gag ctg tcc ctg cgg gcg ctg gac atc ggt ccc ggg gac gag gtg gtg 240 Glu Leu Ser Leu Arg Ala Leu Asp Ile Gly Pro Gly Asp Glu Val Val 65 70 75 80 gtg ccc gcg cac acc ttc atc ggg acc tgg ctg gcc gtg tcc gct acc 288 Val Pro Ala His Thr Phe Ile Gly Thr Trp Leu Ala Val Ser Ala Thr 85 90 95 ggg gca cgg ccg gtg gcc gtc gac ccg acg ccg gac ggg ctc tcc ctc 336 Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu 100 105 110 gac ccg gcg ctg gtg gag gcg gcg ctc acc cct cgg acc aga gcc ctg 384 Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu 115 120 125 atg ccg gtg cac ctg cac ggg cac ccg gcc gac ctc gac ccg cta ctg 432 Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu 130 135 140 gcg atc gcc gga cgg cac ggc ctg gcc gtg gtc gag gac gcc gcg cag 480 Ala Ile Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gln 145 150 155 160 gcc cac ggc gcc cgt tac cgg ggc cgc agg atc ggc tcg ggc cac gtg 528 Ala His Gly Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Val 165 170 175 gtc gcg ttc agc ttc tac ccc ggc aag aac ctc ggc gcc atg ggg gac 576 Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp 180 185 190 ggc ggc gcg gtg gtc acg ggt gac tcc ggt gtg gcc gag cgg atc cgg 624 Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg Ile Arg 195 200 205 ttg ctg cgc aac tgc ggc tcg cgg gag aag tac cgg cac gag gtg cgc 672 Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Val Arg 210 215 220 tcg acc cac tcc cgg ctc gac gag ttc cag gcg gcc gtg ctg cgg gcc 720 Ser Thr His Ser Arg Leu Asp Glu Phe Gln Ala Ala Val Leu Arg Ala 225 230 235 240 aaa ctg ccg cgg ctc gac gcg tgg aac gcc cgc cgg gcc ggc acg gcc 768 Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala 245 250 255 gaa cgg tac ggg cgg gcc ctg ggt ccg gta ccg cag atc gcc gtc ccg 816 Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gln Ile Ala Val Pro 260 265 270 gtc acc gct ccc tgg gcc gac ccg gtg tgg cac ctg tac gtg atc cgc 864 Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val Ile Arg 275 280 285 tgc gcg gag cgc gac gag ctg cgc cgc cgg ctg gaa cga gcc ggg gtc 912 Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val 290 295 300 cag acc ctg atc cac tac ccc gtg ccc ccg cac cgg tcc ccg gcc tac 960 Gln Thr Leu Ile His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr 305 310 315 320 gcc gac gac ccg gcc ggc gca ccg gcg ggg acc cac ccg ctc agt gag 1008 Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu 325 330 335 cgc ctg gcg gcg cag agc ctc agc ctt ccc ctg gga ccg cac ctc ggg 1056 Arg Leu Ala Ala Gln Ser Leu Ser Leu Pro Leu Gly Pro His Leu Gly 340 345 350 gag gac gag gcc cgc gcc gtc gtg gcg gcg gtc cgg gcg gcg tcc gca 1104 Glu Asp Glu Ala Arg Ala Val Val Ala Ala Val Arg Ala Ala Ser Ala 355 360 365 ggg ctg gcg gcg tac ccg acg ccg gac ggc cag cgt ttt cct cta gtg 1152 Gly Leu Ala Ala Tyr Pro Thr Pro Asp Gly Gln Arg Phe Pro Leu Val 370 375 380 acg gag aaa cga tga 1167 Thr Glu Lys Arg 385 <210> 29 <211> 388 <212> PRT <213> Streptomyces ambofaciens <400> 29 Met Thr Ile Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg 1 5 10 15 Ala Glu Ile Asp Ala Ala Leu Gln Arg Val Ser Ala Ser Gly Arg Tyr 20 25 30 Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr 35 40 45 Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu 50 55 60 Glu Leu Ser Leu Arg Ala Leu Asp Ile Gly Pro Gly Asp Glu Val Val 65 70 75 80 Val Pro Ala His Thr Phe Ile Gly Thr Trp Leu Ala Val Ser Ala Thr 85 90 95 Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu 100 105 110 Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu 115 120 125 Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu 130 135 140 Ala Ile Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gln 145 150 155 160 Ala His Gly Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Val 165 170 175 Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp 180 185 190 Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg Ile Arg 195 200 205 Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Val Arg 210 215 220 Ser Thr His Ser Arg Leu Asp Glu Phe Gln Ala Ala Val Leu Arg Ala 225 230 235 240 Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala 245 250 255 Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gln Ile Ala Val Pro 260 265 270 Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val Ile Arg 275 280 285 Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val 290 295 300 Gln Thr Leu Ile His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr 305 310 315 320 Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu 325 330 335 Arg Leu Ala Ala Gln Ser Leu Ser Leu Pro Leu Gly Pro His Leu Gly 340 345 350 Glu Asp Glu Ala Arg Ala Val Val Ala Ala Val Arg Ala Ala Ser Ala 355 360 365 Gly Leu Ala Ala Tyr Pro Thr Pro Asp Gly Gln Arg Phe Pro Leu Val 370 375 380 Thr Glu Lys Arg 385 <210> 30 <211> 909 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(909) <220> <221> CDS <222> (10)..(909) <220> <221> CDS <222> (28)..(909) <400> 30 atg acc gag gtc atg tca ggg cgt ccc gga atg aaa ggg atc atc ctc 48 Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu 1 5 10 15 gca ggc ggc gga ggg acc cgc cta cgc ccc ttg acc ggc acg ctg tcc 96 Ala Gly Gly Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser 20 25 30 aag caa ctg ctg ccc gtc tac gac aag ccg atg atc tac tac ccg ctg 144 Lys Gln Leu Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu 35 40 45 tcc gtc ctg atg ctg ggc ggc atc cgc gag atc ctc gtc gtc tcc tcc 192 Ser Val Leu Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser 50 55 60 acc cag cac atc gag ctg ttc cag cgg ctg ctg ggc gac ggc tcc cgc 240 Thr Gln His Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp Gly Ser Arg 65 70 75 80 ctc ggc ctc gac atc acc tac gcc gaa cag gcc gag ccc gag ggc ata 288 Leu Gly Leu Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile 85 90 95 gcg cag gcc atc acc atc ggc acc gac cac atc ggc gac tca ccg gtc 336 Ala Gln Ala Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val 100 105 110 gcg ctc atc ctg ggc gac aac atc ttc cac ggc ccc ggc ttc tcg gcc 384 Ala Leu Ile Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala 115 120 125 gtg ctc cag ggc agc atc cgc cac ctc gac ggc tgt gtg ctg ttc ggc 432 Val Leu Gln Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly 130 135 140 tac ccg gtc agc gac ccg aag cgc tac ggc gtc ggc gag atc gac gac 480 Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp 145 150 155 160 cag ggc gta ctg ctg tcc ctg gag gag aaa ccg gcc cgg ccc cgc tcc 528 Gln Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser 165 170 175 aac ctc gcc gtc acc ggc ctc tac ctc tac gac aac gac gtg gtc gac 576 Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp 180 185 190 atc gcc aag aac atc cgg ccc tcg gcg cgc ggc gaa ctc gag atc acg 624 Ile Ala Lys Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr 195 200 205 gac gtc aac agg acc tac ctg gag cag aaa cgc gcc cgg ctc atc gaa 672 Asp Val Asn Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu 210 215 220 ctg ggc cac ggc ttc gcc tgg ctc gac atg ggc acc cac gac tcc ctc 720 Leu Gly His Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu 225 230 235 240 ctc cag ggc ggc cag tac gtc cag ctc atc gag cag cgc cag gga gtg 768 Leu Gln Gly Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val 245 250 255 cgg atc gcc tgc atc gag gag atc gcc ctg cgc atg ggc ttc atc gac 816 Arg Ile Ala Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp 260 265 270 gcc gac acc ctc cac cgg ctc ggc cgc gaa ctg ggc acc tcc gga tac 864 Ala Asp Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr 275 280 285 ggc gcg tac ctg atg gag gtg gcc acc cgt gca ggc acc gaa tga 909 Gly Ala Tyr Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu 290 295 300 <210> 31 <211> 302 <212> PRT <213> Streptomyces ambofaciens <400> 31 Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu 1 5 10 15 Ala Gly Gly Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser 20 25 30 Lys Gln Leu Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu 35 40 45 Ser Val Leu Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser 50 55 60 Thr Gln His Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp Gly Ser Arg 65 70 75 80 Leu Gly Leu Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile 85 90 95 Ala Gln Ala Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val 100 105 110 Ala Leu Ile Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala 115 120 125 Val Leu Gln Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly 130 135 140 Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp 145 150 155 160 Gln Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser 165 170 175 Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp 180 185 190 Ile Ala Lys Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr 195 200 205 Asp Val Asn Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu 210 215 220 Leu Gly His Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu 225 230 235 240 Leu Gln Gly Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val 245 250 255 Arg Ile Ala Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp 260 265 270 Ala Asp Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr 275 280 285 Gly Ala Tyr Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu 290 295 300 <210> 32 <211> 299 <212> PRT <213> Streptomyces ambofaciens <400> 32 Val Met Ser Gly Arg Pro Gly Met Lys Gly Ile Ile Leu Ala Gly Gly 1 5 10 15 Gly Gly Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser Lys Gln Leu 20 25 30 Leu Pro Val Tyr Asp Lys Pro Met Ile Tyr Tyr Pro Leu Ser Val Leu 35 40 45 Met Leu Gly Gly Ile Arg Glu Ile Leu Val Val Ser Ser Thr Gln His 50 55 60 Ile Glu Leu Phe Gln Arg Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu 65 70 75 80 Asp Ile Thr Tyr Ala Glu Gln Ala Glu Pro Glu Gly Ile Ala Gln Ala 85 90 95 Ile Thr Ile Gly Thr Asp His Ile Gly Asp Ser Pro Val Ala Leu Ile 100 105 110 Leu Gly Asp Asn Ile Phe His Gly Pro Gly Phe Ser Ala Val Leu Gln 115 120 125 Gly Ser Ile Arg His Leu Asp Gly Cys Val Leu Phe Gly Tyr Pro Val 130 135 140 Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu Ile Asp Asp Gln Gly Val 145 150 155 160 Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala 165 170 175 Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp Ile Ala Lys 180 185 190 Asn Ile Arg Pro Ser Ala Arg Gly Glu Leu Glu Ile Thr Asp Val Asn 195 200 205 Arg Thr Tyr Leu Glu Gln Lys Arg Ala Arg Leu Ile Glu Leu Gly His 210 215 220 Gly Phe Ala Trp Leu Asp Met Gly Thr His Asp Ser Leu Leu Gln Gly 225 230 235 240 Gly Gln Tyr Val Gln Leu Ile Glu Gln Arg Gln Gly Val Arg Ile Ala 245 250 255 Cys Ile Glu Glu Ile Ala Leu Arg Met Gly Phe Ile Asp Ala Asp Thr 260 265 270 Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr Gly Ala Tyr 275 280 285 Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu 290 295 <210> 33 <211> 293 <212> PRT <213> Streptomyces ambofaciens <400> 33 Gly Met Lys Gly Ile Ile Leu Ala Gly Gly Gly Gly Thr Arg Leu Arg 1 5 10 15 Pro Leu Thr Gly Thr Leu Ser Lys Gln Leu Leu Pro Val Tyr Asp Lys 20 25 30 Pro Met Ile Tyr Tyr Pro Leu Ser Val Leu Met Leu Gly Gly Ile Arg 35 40 45 Glu Ile Leu Val Val Ser Ser Thr Gln His Ile Glu Leu Phe Gln Arg 50 55 60 Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu Asp Ile Thr Tyr Ala Glu 65 70 75 80 Gln Ala Glu Pro Glu Gly Ile Ala Gln Ala Ile Thr Ile Gly Thr Asp 85 90 95 His Ile Gly Asp Ser Pro Val Ala Leu Ile Leu Gly Asp Asn Ile Phe 100 105 110 His Gly Pro Gly Phe Ser Ala Val Leu Gln Gly Ser Ile Arg His Leu 115 120 125 Asp Gly Cys Val Leu Phe Gly Tyr Pro Val Ser Asp Pro Lys Arg Tyr 130 135 140 Gly Val Gly Glu Ile Asp Asp Gln Gly Val Leu Leu Ser Leu Glu Glu 145 150 155 160 Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala Val Thr Gly Leu Tyr Leu 165 170 175 Tyr Asp Asn Asp Val Val Asp Ile Ala Lys Asn Ile Arg Pro Ser Ala 180 185 190 Arg Gly Glu Leu Glu Ile Thr Asp Val Asn Arg Thr Tyr Leu Glu Gln 195 200 205 Lys Arg Ala Arg Leu Ile Glu Leu Gly His Gly Phe Ala Trp Leu Asp 210 215 220 Met Gly Thr His Asp Ser Leu Leu Gln Gly Gly Gln Tyr Val Gln Leu 225 230 235 240 Ile Glu Gln Arg Gln Gly Val Arg Ile Ala Cys Ile Glu Glu Ile Ala 245 250 255 Leu Arg Met Gly Phe Ile Asp Ala Asp Thr Leu His Arg Leu Gly Arg 260 265 270 Glu Leu Gly Thr Ser Gly Tyr Gly Ala Tyr Leu Met Glu Val Ala Thr 275 280 285 Arg Ala Gly Thr Glu 290 <210> 34 <211> 1038 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1038) <400> 34 gtg cag gca ccg aat gag acg ccg cgc cgg ccc gcc cgc tcc gcc ggc 48 Val Gln Ala Pro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly 1 5 10 15 cga cgg ccg ccg gcc cgg atc ctc gtc acc ggg ggc gcc ggc ttc atc 96 Arg Arg Pro Pro Ala Arg Ile Leu Val Thr Gly Gly Ala Gly Phe Ile 20 25 30 ggc tcg cgc ttc gtg aac gcg ctg ctg gac ggc tcc ctg ccg gag ttc 144 Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe 35 40 45 ggc aaa ccc gag gtg agg gtg ctc gac gcg ctc acc tac gcg ggc aac 192 Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn 50 55 60 ctg gcc aat ctg gcc ccg gtg ggc gac tgt ccc cgg ctg cgg atc ttc 240 Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg Ile Phe 65 70 75 80 ccg ggg gac atc cgc gac cgc ggc gcg gtc acc cag gcg atg gcg ggg 288 Pro Gly Asp Ile Arg Asp Arg Gly Ala Val Thr Gln Ala Met Ala Gly 85 90 95 gtc gac ctg gtg gtg cac ttc gcg gcc gag tcg cac gtg gac cgc tcg 336 Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser 100 105 110 atc gac gac gcc gac gcc ttc gtg cgc acc aac gtg ctg ggc acc cag 384 Ile Asp Asp Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gln 115 120 125 gtc ctc ctc cag gag gca ctg gcc gta cgc ccc ggg ctg ttc gtg cac 432 Val Leu Leu Gln Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val His 130 135 140 gtc tcg acg gac gag gtg tac ggc tcc atc gag gag ggg tcc tgg ccc 480 Val Ser Thr Asp Glu Val Tyr Gly Ser Ile Glu Glu Gly Ser Trp Pro 145 150 155 160 gag gag cac ccg ctg aac ccc aac tcg ccc tac gcc gcc tcg aag gcg 528 Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala 165 170 175 tcc tcc gac ctg ctg gcg ctg gcc cac cac cgc acg cac gga ctg ccg 576 Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro 180 185 190 gtg tgc gtc acc cgc tgc tcc aac aac tac ggg ccc tac cag tac ccg 624 Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gln Tyr Pro 195 200 205 gag aag atc atc ccg ctg ttc acc agc agc ctc ctc gac ggc ggg acc 672 Glu Lys Ile Ile Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr 210 215 220 gtc ccg ctc tac ggg gac ggc ggc aac cgg cgc gac tgg ctg cac gtg 720 Val Pro Leu Tyr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val 225 230 235 240 gac gac cac tgc cgg ggc atc gcc ctg gtg gcc cgg ggc ggc cgg ccc 768 Asp Asp His Cys Arg Gly Ile Ala Leu Val Ala Arg Gly Gly Arg Pro 245 250 255 ggc gag gtc tac aac atc ggc ggc ggc acc gag ctg agc aac gtc gag 816 Gly Glu Val Tyr Asn Ile Gly Gly Gly Thr Glu Leu Ser Asn Val Glu 260 265 270 ctc acg gag cgt ctg ctg aaa ctg tgc gga gcc gac tgg tcg gcg gtg 864 Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val 275 280 285 cgg cgg gtg ccc gac cgc aag ggc cac gac cgg cgc tac tcc gtc gac 912 Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp 290 295 300 tac acc aag atc gcg gac gag ctg ggt tac gcg ccg cgg atc acc atc 960 Tyr Thr Lys Ile Ala Asp Glu Leu Gly Tyr Ala Pro Arg Ile Thr Ile 305 310 315 320 gac gaa ggg ctg gag cgg acc gtg cac tgg tac cgg gag aac cgc gcg 1008 Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala 325 330 335 tgg tgg gcg ccc gcg aag agg ggg cga tga 1038 Trp Trp Ala Pro Ala Lys Arg Gly Arg 340 345 <210> 35 <211> 345 <212> PRT <213> Streptomyces ambofaciens <400> 35 Val Gln Ala Pro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly 1 5 10 15 Arg Arg Pro Pro Ala Arg Ile Leu Val Thr Gly Gly Ala Gly Phe Ile 20 25 30 Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe 35 40 45 Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn 50 55 60 Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg Ile Phe 65 70 75 80 Pro Gly Asp Ile Arg Asp Arg Gly Ala Val Thr Gln Ala Met Ala Gly 85 90 95 Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser 100 105 110 Ile Asp Asp Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gln 115 120 125 Val Leu Leu Gln Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val His 130 135 140 Val Ser Thr Asp Glu Val Tyr Gly Ser Ile Glu Glu Gly Ser Trp Pro 145 150 155 160 Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala 165 170 175 Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro 180 185 190 Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gln Tyr Pro 195 200 205 Glu Lys Ile Ile Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr 210 215 220 Val Pro Leu Tyr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val 225 230 235 240 Asp Asp His Cys Arg Gly Ile Ala Leu Val Ala Arg Gly Gly Arg Pro 245 250 255 Gly Glu Val Tyr Asn Ile Gly Gly Gly Thr Glu Leu Ser Asn Val Glu 260 265 270 Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val 275 280 285 Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp 290 295 300 Tyr Thr Lys Ile Ala Asp Glu Leu Gly Tyr Ala Pro Arg Ile Thr Ile 305 310 315 320 Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala 325 330 335 Trp Trp Ala Pro Ala Lys Arg Gly Arg 340 345 <210> 36 <211> 804 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(804) <220> <221> CDS <222> (7)..(804) <220> <221> CDS <222> (22)..(804) <400> 36 atg acg gtg acg acc gca tcc gtg gac ccg ctc gac ctg tgg ctc cgc 48 Met Thr Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg 1 5 10 15 cgg tac cag ccg tcc gcg tca ccc gcc gtc cgg ctg gtg tgc ttc ccg 96 Arg Tyr Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro 20 25 30 cac gcg ggc ggc tcg gcg agt tcg ttc ctg ccg ttc acc cgg cag ctg 144 His Ala Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu 35 40 45 ccg gac cgg atc gag gtc gtg gcc gtc cag tac ccc ggg cgc cag gac 192 Pro Asp Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp 50 55 60 cgc agg agc gaa ccg ctg gtc gac acc atc gag gga ctg gcc gag ccc 240 Arg Arg Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro 65 70 75 80 ctg gcc ggc ctg ctg gag gcg cag gcc ggc ccc ccg gtg gtg ctg ttc 288 Leu Ala Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe 85 90 95 ggg cac agc atg ggc gcg ctg gtg gcc tac gag gtc gcc cgc gcg ctc 336 Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu 100 105 110 cag cgg cgg gga gcg gct ccg gtg cgc ctg gtg gtc tcc ggg cgc cgg 384 Gln Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg 115 120 125 gcc ccc gcc gtc gac cgg ccg atg acc gtg cac ctc tac gac gac gac 432 Ala Pro Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp 130 135 140 cgg ctg gtc gag gaa ctc cgc aag ctc gac ggc acc gac agc cag gtg 480 Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val 145 150 155 160 ttc gcc gat ccg gag ctg ctc cgg ctg gtg ctg ccc gtg atc cgc aac 528 Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn 165 170 175 gac tac cgg gcc gtg gcg gcc tac gcc cac cgc ccg ggg gcg ccg ctg 576 Asp Tyr Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu 180 185 190 gac tgc ccc ctc acc gtg ttc acc ggc gcc gac gac ccc acc gtg acc 624 Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr 195 200 205 gcg gcc gag gcg gcg gcc tgg cac gag gcg gcg gcg tcc gac gtc gag 672 Ala Ala Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu 210 215 220 acg cgc acc ttc ccc ggt ggc cac ttc ttc ccg tac cag cgg acc gcg 720 Thr Arg Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala 225 230 235 240 gag gtg tgc ggg gcc ctg gtc gac acg ctc gag ccg ctg ctg tcg gcc 768 Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala 245 250 255 ggg acg cgc ggt gtc cgg cgg gtc cgc ccg ggg tga 804 Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly 260 265 <210> 37 <211> 267 <212> PRT <213> Streptomyces ambofaciens <400> 37 Met Thr Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg 1 5 10 15 Arg Tyr Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro 20 25 30 His Ala Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu 35 40 45 Pro Asp Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp 50 55 60 Arg Arg Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro 65 70 75 80 Leu Ala Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe 85 90 95 Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu 100 105 110 Gln Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg 115 120 125 Ala Pro Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp 130 135 140 Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val 145 150 155 160 Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn 165 170 175 Asp Tyr Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu 180 185 190 Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr 195 200 205 Ala Ala Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu 210 215 220 Thr Arg Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala 225 230 235 240 Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala 245 250 255 Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly 260 265 <210> 38 <211> 265 <212> PRT <213> Streptomyces ambofaciens <400> 38 Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr 1 5 10 15 Gln Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro His Ala 20 25 30 Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gln Leu Pro Asp 35 40 45 Arg Ile Glu Val Val Ala Val Gln Tyr Pro Gly Arg Gln Asp Arg Arg 50 55 60 Ser Glu Pro Leu Val Asp Thr Ile Glu Gly Leu Ala Glu Pro Leu Ala 65 70 75 80 Gly Leu Leu Glu Ala Gln Ala Gly Pro Pro Val Val Leu Phe Gly His 85 90 95 Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu Gln Arg 100 105 110 Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro 115 120 125 Ala Val Asp Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp Arg Leu 130 135 140 Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gln Val Phe Ala 145 150 155 160 Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val Ile Arg Asn Asp Tyr 165 170 175 Arg Ala Val Ala Ala Tyr Ala His Arg Pro Gly Ala Pro Leu Asp Cys 180 185 190 Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala 195 200 205 Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg 210 215 220 Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gln Arg Thr Ala Glu Val 225 230 235 240 Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr 245 250 255 Arg Gly Val Arg Arg Val Arg Pro Gly 260 265 <210> 39 <211> 260 <212> PRT <213> Streptomyces ambofaciens <400> 39 Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr Gln Pro Ser Ala Ser 1 5 10 15 Pro Ala Val Arg Leu Val Cys Phe Pro His Ala Gly Gly Ser Ala Ser 20 25 30 Ser Phe Leu Pro Phe Thr Arg Gln Leu Pro Asp Arg Ile Glu Val Val 35 40 45 Ala Val Gln Tyr Pro Gly Arg Gln Asp Arg Arg Ser Glu Pro Leu Val 50 55 60 Asp Thr Ile Glu Gly Leu Ala Glu Pro Leu Ala Gly Leu Leu Glu Ala 65 70 75 80 Gln Ala Gly Pro Pro Val Val Leu Phe Gly His Ser Met Gly Ala Leu 85 90 95 Val Ala Tyr Glu Val Ala Arg Ala Leu Gln Arg Arg Gly Ala Ala Pro 100 105 110 Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro Ala Val Asp Arg Pro 115 120 125 Met Thr Val His Leu Tyr Asp Asp Asp Arg Leu Val Glu Glu Leu Arg 130 135 140 Lys Leu Asp Gly Thr Asp Ser Gln Val Phe Ala Asp Pro Glu Leu Leu 145 150 155 160 Arg Leu Val Leu Pro Val Ile Arg Asn Asp Tyr Arg Ala Val Ala Ala 165 170 175 Tyr Ala His Arg Pro Gly Ala Pro Leu Asp Cys Pro Leu Thr Val Phe 180 185 190 Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala Glu Ala Ala Ala Trp 195 200 205 His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg Thr Phe Pro Gly Gly 210 215 220 His Phe Phe Pro Tyr Gln Arg Thr Ala Glu Val Cys Gly Ala Leu Val 225 230 235 240 Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr Arg Gly Val Arg Arg 245 250 255 Val Arg Pro Gly 260 <210> 40 <211> 1410 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1410) <220> <221> CDS <222> (46)..(1410) <400> 40 gtg ggc acg gtc gag tac gcc gtc cac cgg cgt acc gcg gaa cgg gtg 48 Val Gly Thr Val Glu Tyr Ala Val His Arg Arg Thr Ala Glu Arg Val 1 5 10 15 agg gtc tcc gcc gac acc ctg gac agc ccg gtc acc gcg ctg gcg gag 96 Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala Glu 20 25 30 gtg ccc cgc tgg ctg gag gaa tac cac cgg gcg cac cgc ttc cac gtc 144 Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His Val 35 40 45 gag ccg atc ccc ttc gac cgg ctc cgg cgg tgg tcc ttc gag ccg ggc 192 Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly 50 55 60 acc ggc gac ctg cgg cac gag acg ggc cgc ttc ttc tcc gtg gag ggg 240 Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly 65 70 75 80 ctg cgc acc agc tcg gac gcc gat ccg gtc gcc cgt gtc cag ccg atc 288 Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro Ile 85 90 95 atc gtg cag ccc gag gtg ggg ctg ctc ggc atc ctg gcc cgg gag ttc 336 Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu Phe 100 105 110 gac ggg gtg ctg cac ttc ctg atg cag gcc aaa ccc gag ccc ggc aac 384 Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly Asn 115 120 125 gtc aac ggg ctg cag atc tcc ccc acg gtg cag gcc acg cgc agc aac 432 Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser Asn 130 135 140 ttc gac gag gtg cac cac ggc cgg tcc acc ccg ttc ctc gac cac ttc 480 Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe 145 150 155 160 atc cac cgc ccc ggc cgc cgg gtc ctg atc gac agc atc cag tcc gaa 528 Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser Glu 165 170 175 cag ggc gac tgg ttc ctg cac aag cgc aac cgc aac atg gtc gtc gag 576 Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu 180 185 190 atc gac acc gac atc gag gcc gac gcc gcg ttc cgc tgg ctg acc ctc 624 Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu 195 200 205 ggg cag atc cgc cgg ctg atg ctc cag gac gac ctc gtc aac atg gac 672 Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met Asp 210 215 220 acc cgc agt gtg ctg gcc tgt ctg ccc acc gcg cac ggc acg ccc gac 720 Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp 225 230 235 240 gac ggt gac gac tcc ttc ccg gcg gcg ctg cgc cgc tcc ctc tac ggg 768 Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly 245 250 255 gag acc gcg ccg ttg cac gat ctg cac gcc atc acc agc tgc ctc acc 816 Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu Thr 260 265 270 gac gtc cgg gcg ctg cgg gtg ctg cgc cag cag agc gtg ccg ctc gac 864 Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu Asp 275 280 285 gac gcc cgg cgg gac ggc tgg gag cgg acc ggg agc gcg atc cgg cat 912 Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg His 290 295 300 cgc agc ggc agg cat ttc gag atc atg gcg gtg gag gtg acc gcg gag 960 Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala Glu 305 310 315 320 cgc cgt gaa gtg gcc tcg tgg acc cag ccg ttg ctg cgc ccg tgc tcg 1008 Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys Ser 325 330 335 cag gga ctg gcg gcc ctg atc acc cgg cgg atc aac ggg gtg ctg cac 1056 Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu His 340 345 350 gcc ctg gtg gcg gcg cgg tcg gag gtc ggc acg ctc aac gtc gcc gag 1104 Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu 355 360 365 ttc gga ccg acc gtc cag tgc cgg ccc gac gag gcg gac ggc cag tcg 1152 Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln Ser 370 375 380 ccc ccg tac ctg gac cgg gtg ctg acg gcc gga gcc gac cgc gtc cgc 1200 Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg 385 390 395 400 tac gac gtg gtg cag tcg gag gag ggc ggg cgc ttc tac cac gcg cgc 1248 Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg 405 410 415 aac cgc tat ctg gtg gtc gag gcg ggg ccg gag ctc gac acg ggc tgc 1296 Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys 420 425 430 ccg ccc ggc ttc tgc tgg gct acc ttc ggc cag ctc acc gaa ctg ctc 1344 Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu Leu 435 440 445 gcg cac ggc aac tat ctc aac gtc gaa ctc cgc acc ctc atg gcg tgc 1392 Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys 450 455 460 gca cac gcc tcc tac tga 1410 Ala His Ala Ser Tyr 465 470 <210> 41 <211> 469 <212> PRT <213> Streptomyces ambofaciens <400> 41 Val Gly Thr Val Glu Tyr Ala Val His Arg Arg Thr Ala Glu Arg Val 1 5 10 15 Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala Glu 20 25 30 Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His Val 35 40 45 Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly 50 55 60 Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly 65 70 75 80 Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro Ile 85 90 95 Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu Phe 100 105 110 Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly Asn 115 120 125 Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser Asn 130 135 140 Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe 145 150 155 160 Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser Glu 165 170 175 Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu 180 185 190 Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu 195 200 205 Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met Asp 210 215 220 Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp 225 230 235 240 Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly 245 250 255 Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu Thr 260 265 270 Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu Asp 275 280 285 Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg His 290 295 300 Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala Glu 305 310 315 320 Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys Ser 325 330 335 Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu His 340 345 350 Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu 355 360 365 Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln Ser 370 375 380 Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg 385 390 395 400 Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg 405 410 415 Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys 420 425 430 Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu Leu 435 440 445 Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys 450 455 460 Ala His Ala Ser Tyr 465 <210> 42 <211> 454 <212> PRT <213> Streptomyces ambofaciens <400> 42 Val Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala 1 5 10 15 Glu Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala His Arg Phe His 20 25 30 Val Glu Pro Ile Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro 35 40 45 Gly Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu 50 55 60 Gly Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gln Pro 65 70 75 80 Ile Ile Val Gln Pro Glu Val Gly Leu Leu Gly Ile Leu Ala Arg Glu 85 90 95 Phe Asp Gly Val Leu His Phe Leu Met Gln Ala Lys Pro Glu Pro Gly 100 105 110 Asn Val Asn Gly Leu Gln Ile Ser Pro Thr Val Gln Ala Thr Arg Ser 115 120 125 Asn Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His 130 135 140 Phe Ile His Arg Pro Gly Arg Arg Val Leu Ile Asp Ser Ile Gln Ser 145 150 155 160 Glu Gln Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Val 165 170 175 Glu Ile Asp Thr Asp Ile Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr 180 185 190 Leu Gly Gln Ile Arg Arg Leu Met Leu Gln Asp Asp Leu Val Asn Met 195 200 205 Asp Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro 210 215 220 Asp Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr 225 230 235 240 Gly Glu Thr Ala Pro Leu His Asp Leu His Ala Ile Thr Ser Cys Leu 245 250 255 Thr Asp Val Arg Ala Leu Arg Val Leu Arg Gln Gln Ser Val Pro Leu 260 265 270 Asp Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala Ile Arg 275 280 285 His Arg Ser Gly Arg His Phe Glu Ile Met Ala Val Glu Val Thr Ala 290 295 300 Glu Arg Arg Glu Val Ala Ser Trp Thr Gln Pro Leu Leu Arg Pro Cys 305 310 315 320 Ser Gln Gly Leu Ala Ala Leu Ile Thr Arg Arg Ile Asn Gly Val Leu 325 330 335 His Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala 340 345 350 Glu Phe Gly Pro Thr Val Gln Cys Arg Pro Asp Glu Ala Asp Gly Gln 355 360 365 Ser Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val 370 375 380 Arg Tyr Asp Val Val Gln Ser Glu Glu Gly Gly Arg Phe Tyr His Ala 385 390 395 400 Arg Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly 405 410 415 Cys Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gln Leu Thr Glu Leu 420 425 430 Leu Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala 435 440 445 Cys Ala His Ala Ser Tyr 450 <210> 43 <211> 1248 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1248) <400> 43 atg ccg ggc ggg acg gac ggc gac tgc gcg cgg acg gcg gcc cgg cgt 48 Met Pro Gly Gly Thr Asp Gly Asp Cys Ala Arg Thr Ala Ala Arg Arg 1 5 10 15 cga acg cac ctg ccc gag tcc gga cga gac agc gcg acg cga gag gcg 96 Arg Thr His Leu Pro Glu Ser Gly Arg Asp Ser Ala Thr Arg Glu Ala 20 25 30 aaa atg atc aat ctc ttc cag ccc cag atg ggg gcc gag gaa ctg gcg 144 Lys Met Ile Asn Leu Phe Gln Pro Gln Met Gly Ala Glu Glu Leu Ala 35 40 45 gcg gtg tcc gag gtc ttc gac gac caa tgg ctc ggt cac gga ccc cgg 192 Ala Val Ser Glu Val Phe Asp Asp Gln Trp Leu Gly His Gly Pro Arg 50 55 60 acc gcg gcg ttc gag tcc gcg ttc gcc gag cac ctc ggg gtc ggc ccc 240 Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro 65 70 75 80 gag cac gtc gtc ttc ctc aac tcg ggc acc gcc ggc ctc ttc ctg gcc 288 Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala 85 90 95 ctg gag tcg ctc ggc ctg cgg ccc ggc gac gag gtc gtg ctc ccc tcg 336 Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser 100 105 110 ccc agc ttc ctc gcc gcg gcg aac gcc gta cag ctc tcg gga gcg cgc 384 Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gln Leu Ser Gly Ala Arg 115 120 125 ccg gtg ttc tgc gac acc gac ccg cgg acg ctg aac ccc gcc ctg gag 432 Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu 130 135 140 cac atc gag gcg gcc gtc acc ccg cgc acc agg gcc gtc atc gcg ctc 480 His Ile Glu Ala Ala Val Thr Pro Arg Thr Arg Ala Val Ile Ala Leu 145 150 155 160 cac tac ggc ggc cac ccc ggc gac atc gtg cgc atc gcc gag cgc tgc 528 His Tyr Gly Gly His Pro Gly Asp Ile Val Arg Ile Ala Glu Arg Cys 165 170 175 cgg gag cgg ggc atc acc ctg atc gag gac gcc gcg tgc tcc gtg gcc 576 Arg Glu Arg Gly Ile Thr Leu Ile Glu Asp Ala Ala Cys Ser Val Ala 180 185 190 tcc cgc gtc gac ggc cga ccg gtc ggc acc ttc ggc gac ctc gcc atg 624 Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met 195 200 205 tgg agc ttc gac gcc atg aag gtc ctg gtc acc ggc gac gga ggg atg 672 Trp Ser Phe Asp Ala Met Lys Val Leu Val Thr Gly Asp Gly Gly Met 210 215 220 atc tac gtc aag gac ccc ggg gcg gcc gcc cgg atc cgg cgc ctc gcc 720 Ile Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg Ile Arg Arg Leu Ala 225 230 235 240 tac cac ggc ctc acg cgg tcc agc ggc ctg gga tac gcc agg gtc tcg 768 Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser 245 250 255 gcg cgc tgg tgg gag atg gac gtc ccc gaa ccg ggc cgc cgc gtc atc 816 Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val Ile 260 265 270 ggg aac gac ctc acc gcg gcc atc ggc gcg gtc cag ttg cgc cgg ctt 864 Gly Asn Asp Leu Thr Ala Ala Ile Gly Ala Val Gln Leu Arg Arg Leu 275 280 285 ccc ggc ttc gtg gcc cgc cgc agg gag atc gtc gcc ctg tac gac agc 912 Pro Gly Phe Val Ala Arg Arg Arg Glu Ile Val Ala Leu Tyr Asp Ser 290 295 300 gaa ctg agc tcg ctg gag ggc gtg ctg aca ccg ccc gcg cca ccc gcg 960 Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala 305 310 315 320 ggg cac gag tcc acg cac tac ttc tac tgg atc cag ctg gcc ccc ggc 1008 Gly His Glu Ser Thr His Tyr Phe Tyr Trp Ile Gln Leu Ala Pro Gly 325 330 335 gtc cgg gac cgg gtg gca cgc gac ctg ctc acc gac ggc atc tac acc 1056 Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly Ile Tyr Thr 340 345 350 acc ttc cgc tac gca cct ctg cac aag gtg ccc gcc tac ggc cac acc 1104 Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr 355 360 365 gga ggc gaa ctg ccc ggc gtg gag cgg gcg tcc gaa cgg acc ctg tgc 1152 Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys 370 375 380 ctg ccc ctg cac ccc ggc ctg tcg gac gcc gac gtc cgc acc gtc gtg 1200 Leu Pro Leu His Pro Gly Leu Ser Asp Ala Asp Val Arg Thr Val Val 385 390 395 400 tcc tcc ctg cgc aga gcc ctg agc gcc gcg gat ccg gcc ccc gcc tga 1248 Ser Ser Leu Arg Arg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala 405 410 415 <210> 44 <211> 415 <212> PRT <213> Streptomyces ambofaciens <400> 44 Met Pro Gly Gly Thr Asp Gly Asp Cys Ala Arg Thr Ala Ala Arg Arg 1 5 10 15 Arg Thr His Leu Pro Glu Ser Gly Arg Asp Ser Ala Thr Arg Glu Ala 20 25 30 Lys Met Ile Asn Leu Phe Gln Pro Gln Met Gly Ala Glu Glu Leu Ala 35 40 45 Ala Val Ser Glu Val Phe Asp Asp Gln Trp Leu Gly His Gly Pro Arg 50 55 60 Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro 65 70 75 80 Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala 85 90 95 Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser 100 105 110 Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gln Leu Ser Gly Ala Arg 115 120 125 Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu 130 135 140 His Ile Glu Ala Ala Val Thr Pro Arg Thr Arg Ala Val Ile Ala Leu 145 150 155 160 His Tyr Gly Gly His Pro Gly Asp Ile Val Arg Ile Ala Glu Arg Cys 165 170 175 Arg Glu Arg Gly Ile Thr Leu Ile Glu Asp Ala Ala Cys Ser Val Ala 180 185 190 Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met 195 200 205 Trp Ser Phe Asp Ala Met Lys Val Leu Val Thr Gly Asp Gly Gly Met 210 215 220 Ile Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg Ile Arg Arg Leu Ala 225 230 235 240 Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser 245 250 255 Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val Ile 260 265 270 Gly Asn Asp Leu Thr Ala Ala Ile Gly Ala Val Gln Leu Arg Arg Leu 275 280 285 Pro Gly Phe Val Ala Arg Arg Arg Glu Ile Val Ala Leu Tyr Asp Ser 290 295 300 Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala 305 310 315 320 Gly His Glu Ser Thr His Tyr Phe Tyr Trp Ile Gln Leu Ala Pro Gly 325 330 335 Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly Ile Tyr Thr 340 345 350 Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr 355 360 365 Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys 370 375 380 Leu Pro Leu His Pro Gly Leu Ser Asp Ala Asp Val Arg Thr Val Val 385 390 395 400 Ser Ser Leu Arg Arg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala 405 410 415 <210> 45 <211> 720 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(720) <400> 45 atg tac gag aac gac agt gcc gcc gag gtc tac gac ctg ctc tac cag 48 Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gln 1 5 10 15 gac cgc aag gac tac gcg ggt gag gcc gcc cgg gtc acc gac ctg atc 96 Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu Ile 20 25 30 cgg gaa cgt acg ccg gac gcg gcc agc ctg ctc gac atc gcg tgc ggc 144 Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp Ile Ala Cys Gly 35 40 45 acc ggt acc cac ctg gag gcc ttc gcc aag ctc tac gac cgc gtg agc 192 Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser 50 55 60 ggc ctg gag ctg tcc gag tgg atg gcg gcc cgc gcc gag gag cgg ctc 240 Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu 65 70 75 80 ccc ggc gtc acc ctc cac cgc ggt gac atg cgg gcg ttc gac ctc ggc 288 Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly 85 90 95 gag acg ttc gac gcc gtg gtc tgc atg ttc agc tcg atc ggg tac ctg 336 Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser Ile Gly Tyr Leu 100 105 110 gag acc acg gcc gac ctg gag gac gcc gtc gcc gcc atg gcg cgg cac 384 Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His 115 120 125 ctg acc gcg gac ggt gtc ctg gcc gtc gaa ccg tgg tac ttc ccc gac 432 Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp 130 135 140 acc ttc ctg gac ggc cac gtc tcc acc cac gcc ctg cgg acg gca ccg 480 Thr Phe Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro 145 150 155 160 ggc gac cag ggc gtc gcc cgt gtc tcc cac tcg acc cgg gag ggc ggg 528 Gly Asp Gln Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Gly Gly 165 170 175 cgg acc cgg atg gag atc cac tac ctg atc gcg cac acc gcg gag ggc 576 Arg Thr Arg Met Glu Ile His Tyr Leu Ile Ala His Thr Ala Glu Gly 180 185 190 atc cgg cac cgc agc gag gtg gac tac ctc acg ctg ttc tcg cgt gcg 624 Ile Arg His Arg Ser Glu Val Asp Tyr Leu Thr Leu Phe Ser Arg Ala 195 200 205 gag tac gag gcc gcg tac cgc aag gcc ggc ctg gac gtc gag tac gtc 672 Glu Tyr Glu Ala Ala Tyr Arg Lys Ala Gly Leu Asp Val Glu Tyr Val 210 215 220 gtg acg ggc gag ggc tca ccg ggc ttc ttc ctc ggc acg cgt cgc tga 720 Val Thr Gly Glu Gly Ser Pro Gly Phe Phe Leu Gly Thr Arg Arg 225 230 235 240 <210> 46 <211> 239 <212> PRT <213> Streptomyces ambofaciens <400> 46 Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gln 1 5 10 15 Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu Ile 20 25 30 Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp Ile Ala Cys Gly 35 40 45 Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser 50 55 60 Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu 65 70 75 80 Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly 85 90 95 Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser Ile Gly Tyr Leu 100 105 110 Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His 115 120 125 Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp 130 135 140 Thr Phe Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro 145 150 155 160 Gly Asp Gln Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Gly Gly 165 170 175 Arg Thr Arg Met Glu Ile His Tyr Leu Ile Ala His Thr Ala Glu Gly 180 185 190 Ile Arg His Arg Ser Glu Val Asp Tyr Leu Thr Leu Phe Ser Arg Ala 195 200 205 Glu Tyr Glu Ala Ala Tyr Arg Lys Ala Gly Leu Asp Val Glu Tyr Val 210 215 220 Val Thr Gly Glu Gly Ser Pro Gly Phe Phe Leu Gly Thr Arg Arg 225 230 235 <210> 47 <211> 1968 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1968) <400> 47 atg agt gac ctg ggt tct ggt gaa gaa ggg tcc gaa gaa gac gag tcg 48 Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser 1 5 10 15 gac gac gca ctc gcc ttc ctc gag ttc atc gcc cgg tcg gca cca cgg 96 Asp Asp Ala Leu Ala Phe Leu Glu Phe Ile Ala Arg Ser Ala Pro Arg 20 25 30 agc gaa tac gac cgg ctc atg gcc cgc gcc gaa cgc tcg ggc gcc gac 144 Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp 35 40 45 gag gac cgg atg cgc cga ctg gag cgc ttc aac cgg ctc gcc ctc acc 192 Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr 50 55 60 gcg cag tcg atg atc gag tac cgc cgc gac cgg gag gcg gag ctc gcg 240 Ala Gln Ser Met Ile Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala 65 70 75 80 gcc ctg gtc gac gcc gcg cac gag ttc gtc gcc gcc cgg cgg ggc aag 288 Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys 85 90 95 gac ctg ctg gag tcc atc gcc cgc aga gca cgg ctg ctg ctg aag ctg 336 Asp Leu Leu Glu Ser Ile Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu 100 105 110 gac gtc tcc tac gtc ggc ctg cac gag gag gac cgg ccc ggc acg gtg 384 Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val 115 120 125 gtg ctg agc gcc gac ggc aac gcg gtc aag gtc gcc gag agc tac cgg 432 Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg 130 135 140 ctg ccg gcc gac ggc gga ctg ggc gcc atg gtg cgc acc tgc cgc gct 480 Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala 145 150 155 160 ccc ttc tgg acc ccg gac tac ctc ggg gac aac agc ttc acg cac gtc 528 Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr His Val 165 170 175 gag gcc gtc gac gac atc gtc cgc gcc gaa ggc ctg cgc gcg gtc ctg 576 Glu Ala Val Asp Asp Ile Val Arg Ala Glu Gly Leu Arg Ala Val Leu 180 185 190 gcc gtc ccg ctg tgc gcc ggg ggc gaa ccg atg ggg gtc ctc tac gtc 624 Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val 195 200 205 gcc gac cgt cag gtg cgg cat ctg acc ccc aac gag gtc acc ctg ctg 672 Ala Asp Arg Gln Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu 210 215 220 tgc tcg ctc gcc gat ctg gcc gcg gtg gcg atc gag cgc aac cgg ctg 720 Cys Ser Leu Ala Asp Leu Ala Ala Val Ala Ile Glu Arg Asn Arg Leu 225 230 235 240 gtc gag gag ctc cac gac acc atc ggg caa ctg cgc cag gac atc ggc 768 Val Glu Glu Leu His Asp Thr Ile Gly Gln Leu Arg Gln Asp Ile Gly 245 250 255 gag gcc cgc acc gcc ctc gcg cgc acc cgc agg tcc gcc gac ctc cag 816 Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gln 260 265 270 tcg cac ctg gtc acg cag gtg atg gac agg cgc ggc gcc gac tcg tta 864 Ser His Leu Val Thr Gln Val Met Asp Arg Arg Gly Ala Asp Ser Leu 275 280 285 ctc gcg acg gcc gcc gag gcg ctc ggc ggc gga gcc ggc ctg tgc agc 912 Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser 290 295 300 ccg ctc ggg cgc ccg ctc gcc gag tac ggg acc ctg cgc ccc gtc gcc 960 Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala 305 310 315 320 ccc acg gaa ctg cgc gcg gcg tgc cgc cgg gcc gcc gag acc ggc cgg 1008 Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg 325 330 335 ccc acc tcc gtg gcc ccg ggg gtc tgg acg gtg ccc ctg ctt ccc ggg 1056 Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly 340 345 350 ggc aac gcc ggc ttc ctg ctg acc gac ctc ggt ccg gac gcg gac cac 1104 Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His 355 360 365 acc gcc gtc ccc ctg ctc ccg atg gtc gcc cgc acc ctc gcg ctg cac 1152 Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His 370 375 380 ctg cgc gtc cag cac gac gac tcc ccc aag gcg cag agc cac cag gag 1200 Leu Arg Val Gln His Asp Asp Ser Pro Lys Ala Gln Ser His Gln Glu 385 390 395 400 ttc ttc gac gac ctg atc ggg gcg ccc cgc tca ccc acg ctc ctc agg 1248 Phe Phe Asp Asp Leu Ile Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg 405 410 415 gaa cgc gcc ctg atg ttc tcc ctc agc ttc cgc cgc ccg cac gtg gtg 1296 Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val 420 425 430 ctg gtg gcg gac gga ccc cgc ggg acc tcg ccg cgg ctg gag gcc tcc 1344 Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser 435 440 445 ggc gcc gac tac gcg aag gag ctc ggc ggg ctg tgc agc gtg cgg gac 1392 Gly Ala Asp Tyr Ala Lys Glu Leu Gly Gly Leu Cys Ser Val Arg Asp 450 455 460 ggc gcc gtc gtc ctg ctg ctg ccc ggc gac gac ccc gtc gcc gtg gcg 1440 Gly Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala 465 470 475 480 cag acc gcc gcc ccg gag ctg acc gac cgc gcc ggg cac ccc gtc acc 1488 Gln Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr 485 490 495 gtg ggg gtc gcg ggc ccc gcc tcg acc gtc gac ggc atc gcc gac gcg 1536 Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly Ile Ala Asp Ala 500 505 510 cac cgt gag gcc gcg aag tgt ctg gag acc ctc cgc gcg ctc ggc ggc 1584 His Arg Glu Ala Ala Lys Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly 515 520 525 gac ggc ggc acc gcg tgc gcc tcc gac ctg ggt ttc ctc ggc atg ctc 1632 Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu 530 535 540 ctc gcc gag gag aac gac gtc ccc ggt tac atc agg acg acg atc ggc 1680 Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr Ile Arg Thr Thr Ile Gly 545 550 555 560 ccc gtg gtc gac tac gac acc cac cgc ttc acg gat ctg gtt ccc act 1728 Pro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr 565 570 575 ctg agg gtg tac ctg gag tcg ggc agg agc ccc acg cgt gcc gca gag 1776 Leu Arg Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu 580 585 590 aca ctg cgc gtg cac ccg aac acc gtc tca cgg cgg ctg gag cgc atc 1824 Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg Ile 595 600 605 ggc gta ctg ctg gga gag gac tgg cag tca ccg gag cgg gtg ctg gac 1872 Gly Val Leu Leu Gly Glu Asp Trp Gln Ser Pro Glu Arg Val Leu Asp 610 615 620 ata caa ctg gcc ctg cgg ctc tat cag gtg cgc tcg gcg ctc tcc tcg 1920 Ile Gln Leu Ala Leu Arg Leu Tyr Gln Val Arg Ser Ala Leu Ser Ser 625 630 635 640 caa ccg gcg tcc gag acc cgg gcc gtg ctc gga tcg ctg cgc gag tga 1968 Gln Pro Ala Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu 645 650 655 <210> 48 <211> 655 <212> PRT <213> Streptomyces ambofaciens <400> 48 Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser 1 5 10 15 Asp Asp Ala Leu Ala Phe Leu Glu Phe Ile Ala Arg Ser Ala Pro Arg 20 25 30 Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp 35 40 45 Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr 50 55 60 Ala Gln Ser Met Ile Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala 65 70 75 80 Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys 85 90 95 Asp Leu Leu Glu Ser Ile Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu 100 105 110 Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val 115 120 125 Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg 130 135 140 Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala 145 150 155 160 Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr His Val 165 170 175 Glu Ala Val Asp Asp Ile Val Arg Ala Glu Gly Leu Arg Ala Val Leu 180 185 190 Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val 195 200 205 Ala Asp Arg Gln Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu 210 215 220 Cys Ser Leu Ala Asp Leu Ala Ala Val Ala Ile Glu Arg Asn Arg Leu 225 230 235 240 Val Glu Glu Leu His Asp Thr Ile Gly Gln Leu Arg Gln Asp Ile Gly 245 250 255 Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gln 260 265 270 Ser His Leu Val Thr Gln Val Met Asp Arg Arg Gly Ala Asp Ser Leu 275 280 285 Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser 290 295 300 Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala 305 310 315 320 Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg 325 330 335 Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly 340 345 350 Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His 355 360 365 Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His 370 375 380 Leu Arg Val Gln His Asp Asp Ser Pro Lys Ala Gln Ser His Gln Glu 385 390 395 400 Phe Phe Asp Asp Leu Ile Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg 405 410 415 Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val 420 425 430 Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser 435 440 445 Gly Ala Asp Tyr Ala Lys Glu Leu Gly Gly Leu Cys Ser Val Arg Asp 450 455 460 Gly Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala 465 470 475 480 Gln Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr 485 490 495 Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly Ile Ala Asp Ala 500 505 510 His Arg Glu Ala Ala Lys Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly 515 520 525 Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu 530 535 540 Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr Ile Arg Thr Thr Ile Gly 545 550 555 560 Pro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr 565 570 575 Leu Arg Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu 580 585 590 Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg Ile 595 600 605 Gly Val Leu Leu Gly Glu Asp Trp Gln Ser Pro Glu Arg Val Leu Asp 610 615 620 Ile Gln Leu Ala Leu Arg Leu Tyr Gln Val Arg Ser Ala Leu Ser Ser 625 630 635 640 Gln Pro Ala Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu 645 650 655 <210> 49 <211> 1749 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1749) <220> <221> CDS <222> (76)..(1749) <220> <221> CDS <222> (97)..(1749) <400> 49 atg tcc gca gtg gtg gcg tcc ctt ctg ctt tcc gtt ctt tct gcg agc 48 Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser 1 5 10 15 gcg ctc acg cat cca ctc atc ctc atc gtg gaa aca gga gac tta cgc 96 Ala Leu Thr His Pro Leu Ile Leu Ile Val Glu Thr Gly Asp Leu Arg 20 25 30 gtg tcg att gcg caa tac gcc cta cac gac atc acg aag cgc tac cac 144 Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His 35 40 45 gac tgt gtc gtg ctc gac cgg gtc ggt ttc agc atc aag ccg ggc gag 192 Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu 50 55 60 aag gtc ggc gtg atc ggc gac aac ggt tcc ggc aag tcc acg ctg ctc 240 Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 65 70 75 80 aag atc ctc gcc ggc cgc gtg gag ccc gac aac ggc gcg ctc acc gtg 288 Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 85 90 95 gtc gct ccc ggc ggc gtc ggc tac ctg gcg cag aca ctg gaa ctg ccc 336 Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro 100 105 110 ctc gac gcc acc gtc cag gac gcc gtc gac ctg gcc ctg tcc gac ctg 384 Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 115 120 125 cgc gag ctc gaa gcg gcg atg cgc gag gcc gag gcg gag ctg ggc gag 432 Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 130 135 140 agc gac gag aac ggc tcc gag cgc gag ctg tcc gcc ggc ctc cag cgc 480 Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg 145 150 155 160 tac gcc gct ctg gtc gag cag tac cag gcg cgt ggc ggc tac gag gcc 528 Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala 165 170 175 gac gtg cgc gtg gag gtc gcg ctg cac ggc ctc gga ctg ccg agc ctg 576 Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 180 185 190 gac cgc gac cgc aag ctc gga acc ctc tcc ggt ggc gaa cgc tcc cgc 624 Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 195 200 205 ctc gcg ctc gcc gcg acc ctc gcc tcg tcg ccg gag ctg ctg ctc ctg 672 Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 210 215 220 gac gaa ccg acc aac gac ctc gac gac cgg gcg atg gaa tgg ctg gag 720 Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 225 230 235 240 gac cac ctg gcc ggc cac cgc ggc acg gtg atc gcg gtc acc cac gac 768 Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp 245 250 255 cgg gtc ttc ctc gac cgg ctc acc acc acg atc ctg gag gtc gac tcc 816 Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser 260 265 270 ggc agc gtc acc cgc tac ggc aac ggc tac gag ggc tac ctg acg gcc 864 Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 275 280 285 aag gcc gtg gaa cgc gag cgg cgg ctg cgg gag tac gag gag tgg cgt 912 Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 290 295 300 gcc gaa ctc gac cgc aac cgc ggg ctg atc acc tcc aac gtg gcg cgg 960 Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg 305 310 315 320 atg gac ggc atc ccg cgc aag atg tcc ctc tcc gtg ttc ggc cac ggc 1008 Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 325 330 335 gcc tac cgc agg cga ggg cgc gac cac ggc gcg atg gtg cgg atc cgc 1056 Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg 340 345 350 aac gcg aag caa cgc gtg gcg cag ctg acc gag aac ccg gtc cac gct 1104 Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala 355 360 365 ccc gcc gac ccg ttg tcc ttc gcc gcc cgc atc gac acc gcg ggc ccg 1152 Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro 370 375 380 gag gcg gag gag gcg gtg gcc gaa ctc acc gac gtg cgc gtc gcg ggt 1200 Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 385 390 395 400 cgg ctc gcc gtg gac tcc ctg acg atc cgg ccc ggc gaa cgg ctg ctc 1248 Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu 405 410 415 gtc aca ggt ccc aac ggt gcg ggc aag tcc acc ttg ttg cgg gtg ctg 1296 Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu 420 425 430 tcc ggg gaa ctg gag ccg gac ggc ggc tcg gtg cgc gtc ggc tgc cgg 1344 Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg 435 440 445 gtc ggt cat ctg cgg cag gac gag acg ccc tgg gcg ccc gga ctg acc 1392 Val Gly His Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr 450 455 460 gtg ctg cgg gcc ttc gcc cag ggc cgg gag ggc tac ctg gag gac cac 1440 Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His 465 470 475 480 gcg gag aaa ctg ctg tcg ctc ggc ctg ttc agc ccg tcc gac ctg cgg 1488 Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg 485 490 495 cga cgc gtg aag gat ctg tcc tac ggg cag cgc cgc cgg atc gag atc 1536 Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile 500 505 510 gcc cgg ctg gtg agc gac ccg atg gac ctg ctg ctg ctg gac gag ccc 1584 Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro 515 520 525 acc aac cac ctc acc ccg gtg ctg gtg gag gag ttg gag cag gca ctc 1632 Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu 530 535 540 gcg gac tac cgc ggc gcc gtc gtg gtc gtc acc cac gac cgt cgg atg 1680 Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met 545 550 555 560 cgg tcc cgg ttc acc ggc gcc cgg ctg acc atg gga gac ggg cgc atc 1728 Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile 565 570 575 gcc gag ttc agc gcc ggc tga 1749 Ala Glu Phe Ser Ala Gly 580 <210> 50 <211> 582 <212> PRT <213> Streptomyces ambofaciens <400> 50 Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser 1 5 10 15 Ala Leu Thr His Pro Leu Ile Leu Ile Val Glu Thr Gly Asp Leu Arg 20 25 30 Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His 35 40 45 Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu 50 55 60 Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 65 70 75 80 Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 85 90 95 Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro 100 105 110 Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 115 120 125 Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 130 135 140 Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg 145 150 155 160 Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala 165 170 175 Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 180 185 190 Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 195 200 205 Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 210 215 220 Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 225 230 235 240 Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp 245 250 255 Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser 260 265 270 Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 275 280 285 Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 290 295 300 Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg 305 310 315 320 Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 325 330 335 Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg 340 345 350 Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala 355 360 365 Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro 370 375 380 Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 385 390 395 400 Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu 405 410 415 Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu 420 425 430 Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg 435 440 445 Val Gly His Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr 450 455 460 Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His 465 470 475 480 Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg 485 490 495 Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile 500 505 510 Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro 515 520 525 Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu 530 535 540 Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met 545 550 555 560 Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile 565 570 575 Ala Glu Phe Ser Ala Gly 580 <210> 51 <211> 557 <212> PRT <213> Streptomyces ambofaciens <400> 51 Val Glu Thr Gly Asp Leu Arg Val Ser Ile Ala Gln Tyr Ala Leu His 1 5 10 15 Asp Ile Thr Lys Arg Tyr His Asp Cys Val Val Leu Asp Arg Val Gly 20 25 30 Phe Ser Ile Lys Pro Gly Glu Lys Val Gly Val Ile Gly Asp Asn Gly 35 40 45 Ser Gly Lys Ser Thr Leu Leu Lys Ile Leu Ala Gly Arg Val Glu Pro 50 55 60 Asp Asn Gly Ala Leu Thr Val Val Ala Pro Gly Gly Val Gly Tyr Leu 65 70 75 80 Ala Gln Thr Leu Glu Leu Pro Leu Asp Ala Thr Val Gln Asp Ala Val 85 90 95 Asp Leu Ala Leu Ser Asp Leu Arg Glu Leu Glu Ala Ala Met Arg Glu 100 105 110 Ala Glu Ala Glu Leu Gly Glu Ser Asp Glu Asn Gly Ser Glu Arg Glu 115 120 125 Leu Ser Ala Gly Leu Gln Arg Tyr Ala Ala Leu Val Glu Gln Tyr Gln 130 135 140 Ala Arg Gly Gly Tyr Glu Ala Asp Val Arg Val Glu Val Ala Leu His 145 150 155 160 Gly Leu Gly Leu Pro Ser Leu Asp Arg Asp Arg Lys Leu Gly Thr Leu 165 170 175 Ser Gly Gly Glu Arg Ser Arg Leu Ala Leu Ala Ala Thr Leu Ala Ser 180 185 190 Ser Pro Glu Leu Leu Leu Leu Asp Glu Pro Thr Asn Asp Leu Asp Asp 195 200 205 Arg Ala Met Glu Trp Leu Glu Asp His Leu Ala Gly His Arg Gly Thr 210 215 220 Val Ile Ala Val Thr His Asp Arg Val Phe Leu Asp Arg Leu Thr Thr 225 230 235 240 Thr Ile Leu Glu Val Asp Ser Gly Ser Val Thr Arg Tyr Gly Asn Gly 245 250 255 Tyr Glu Gly Tyr Leu Thr Ala Lys Ala Val Glu Arg Glu Arg Arg Leu 260 265 270 Arg Glu Tyr Glu Glu Trp Arg Ala Glu Leu Asp Arg Asn Arg Gly Leu 275 280 285 Ile Thr Ser Asn Val Ala Arg Met Asp Gly Ile Pro Arg Lys Met Ser 290 295 300 Leu Ser Val Phe Gly His Gly Ala Tyr Arg Arg Arg Gly Arg Asp His 305 310 315 320 Gly Ala Met Val Arg Ile Arg Asn Ala Lys Gln Arg Val Ala Gln Leu 325 330 335 Thr Glu Asn Pro Val His Ala Pro Ala Asp Pro Leu Ser Phe Ala Ala 340 345 350 Arg Ile Asp Thr Ala Gly Pro Glu Ala Glu Glu Ala Val Ala Glu Leu 355 360 365 Thr Asp Val Arg Val Ala Gly Arg Leu Ala Val Asp Ser Leu Thr Ile 370 375 380 Arg Pro Gly Glu Arg Leu Leu Val Thr Gly Pro Asn Gly Ala Gly Lys 385 390 395 400 Ser Thr Leu Leu Arg Val Leu Ser Gly Glu Leu Glu Pro Asp Gly Gly 405 410 415 Ser Val Arg Val Gly Cys Arg Val Gly His Leu Arg Gln Asp Glu Thr 420 425 430 Pro Trp Ala Pro Gly Leu Thr Val Leu Arg Ala Phe Ala Gln Gly Arg 435 440 445 Glu Gly Tyr Leu Glu Asp His Ala Glu Lys Leu Leu Ser Leu Gly Leu 450 455 460 Phe Ser Pro Ser Asp Leu Arg Arg Arg Val Lys Asp Leu Ser Tyr Gly 465 470 475 480 Gln Arg Arg Arg Ile Glu Ile Ala Arg Leu Val Ser Asp Pro Met Asp 485 490 495 Leu Leu Leu Leu Asp Glu Pro Thr Asn His Leu Thr Pro Val Leu Val 500 505 510 Glu Glu Leu Glu Gln Ala Leu Ala Asp Tyr Arg Gly Ala Val Val Val 515 520 525 Val Thr His Asp Arg Arg Met Arg Ser Arg Phe Thr Gly Ala Arg Leu 530 535 540 Thr Met Gly Asp Gly Arg Ile Ala Glu Phe Ser Ala Gly 545 550 555 <210> 52 <211> 550 <212> PRT <213> Streptomyces ambofaciens <400> 52 Val Ser Ile Ala Gln Tyr Ala Leu His Asp Ile Thr Lys Arg Tyr His 1 5 10 15 Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser Ile Lys Pro Gly Glu 20 25 30 Lys Val Gly Val Ile Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 35 40 45 Lys Ile Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 50 55 60 Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gln Thr Leu Glu Leu Pro 65 70 75 80 Leu Asp Ala Thr Val Gln Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 85 90 95 Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 100 105 110 Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gln Arg 115 120 125 Tyr Ala Ala Leu Val Glu Gln Tyr Gln Ala Arg Gly Gly Tyr Glu Ala 130 135 140 Asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 145 150 155 160 Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 165 170 175 Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 180 185 190 Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 195 200 205 Asp His Leu Ala Gly His Arg Gly Thr Val Ile Ala Val Thr His Asp 210 215 220 Arg Val Phe Leu Asp Arg Leu Thr Thr Thr Ile Leu Glu Val Asp Ser 225 230 235 240 Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 245 250 255 Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 260 265 270 Ala Glu Leu Asp Arg Asn Arg Gly Leu Ile Thr Ser Asn Val Ala Arg 275 280 285 Met Asp Gly Ile Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 290 295 300 Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg Ile Arg 305 310 315 320 Asn Ala Lys Gln Arg Val Ala Gln Leu Thr Glu Asn Pro Val His Ala 325 330 335 Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg Ile Asp Thr Ala Gly Pro 340 345 350 Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 355 360 365 Arg Leu Ala Val Asp Ser Leu Thr Ile Arg Pro Gly Glu Arg Leu Leu 370 375 380 Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu 385 390 395 400 Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg 405 410 415 Val Gly His Leu Arg Gln Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr 420 425 430 Val Leu Arg Ala Phe Ala Gln Gly Arg Glu Gly Tyr Leu Glu Asp His 435 440 445 Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg 450 455 460 Arg Arg Val Lys Asp Leu Ser Tyr Gly Gln Arg Arg Arg Ile Glu Ile 465 470 475 480 Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro 485 490 495 Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gln Ala Leu 500 505 510 Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met 515 520 525 Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg Ile 530 535 540 Ala Glu Phe Ser Ala Gly 545 550 <210> 53 <211> 1431 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1431) <220> <221> CDS <222> (16)..(1431) <220> <221> CDS <222> (37)..(1431) <220> <221> CDS <222> (40)..(1431) <220> <221> CDS <222> (79)..(1431) <220> <221> CDS <222> (130)..(1431) <400> 53 gtg ccg cgc aac ggt atg cgt gtc gca ccg gcc gac gtg atg cag tcg 48 Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gln Ser 1 5 10 15 gac cgg gat gat cgc ttg tcc ggc ggc cgg atg cct agc ctc ggg agc 96 Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser 20 25 30 aac cac agc ggt ctt tca cga gag ggg tcg acc atg ggc gat ctc agg 144 Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg 35 40 45 aac cgc atc acc gag ctg gtc cgc gcg tac cac cgg gaa cag gcg ccc 192 Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro 50 55 60 ggg ggc ttc gtt ccc ggg acg acg cac gta ccg gtc tcc ggc gcg gtg 240 Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val 65 70 75 80 ctg agc gag gag gac cgg ctg gcg ctg gtg gag acg gcg ctg gag atg 288 Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met 85 90 95 cgg atc gcg gcc ggc ccg gcc tcc cgg ggc ttc gag cgg cag ttc gcc 336 Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala 100 105 110 cgg tac ctc ggg ctc cgg aag gcg cac ctg acc aac tcc ggt tcc tcc 384 Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser 115 120 125 gcc aac ctc ctc gcc ctc ggc gcg ctc acc tcg ccg cag ctg gag gag 432 Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu 130 135 140 aga cgg ctg cgt ccg ggg gac gag gtc gtc acg gtc gcc gcc ggg ttc 480 Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe 145 150 155 160 ccc acg acg gtc aac ccg atc ttc cac aac ggg ctg gtg ccc gtc ttc 528 Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val Pro Val Phe 165 170 175 gtg gac gtc gag ctc ggc acg tac aac acg acg ccc gag cgc atc gag 576 Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu 180 185 190 cgg gcc atc ggc ccc cgg acc agg gcg atc atg atc gcg cac gcc ctg 624 Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu 195 200 205 ggc aac ccc ttc gag gcc gaa gag gtg gcc cgc ctc gcg gac gag cgg 672 Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg 210 215 220 gag ctg ttc ctc atc gag gac aac tgc gac gcg gtg ggg tcc cgc tac 720 Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr 225 230 235 240 cgg ggc agg ctc acc ggc tcc ttc ggc gac ctg tcg acc gtc agc ttc 768 Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe 245 250 255 tat ccc gcg cac cac atc gcg atg ggt gag ggg ggc tgc gtg ctc acc 816 Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr 260 265 270 gac aac ctg gcc ctg gcg cgg atc gtg gaa tca ctg cgc gac tgg ggg 864 Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly 275 280 285 cgc gac tgc tgg tgc gag ccg ggt gag gac aac cgc tgc ctc aag cgg 912 Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg 290 295 300 ttc gac cag aag atg ggt gac ctg ccg ccc ggg tac gac cac aag tac 960 Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr 305 310 315 320 atc ttc tcg cac gtc ggt tac aac ctg aag tcg acc gac ctg cag gcg 1008 Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala 325 330 335 gcc ctc ggg ctg tcc cag ctg acc cgg atc gag gag ttc acc gag gcc 1056 Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala 340 345 350 agg cgc gcc aac tgg cgg cat ctg cgc gcc gcg ttg gac ggg ctg ccc 1104 Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro 355 360 365 ggt ctg ctg ctg cct cat gcc aca ccg ggc agc gat ccg agc tgg ttc 1152 Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe 370 375 380 ggg ttc ctc atc acc gtg gac ccg gac gcc gcg tac agc agg gcg gcc 1200 Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala 385 390 395 400 ctg gtc gac cac ctg gaa tcg cgc cgg atc agc acc cgc cgc ctg ttc 1248 Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe 405 410 415 ggg ggc aac ctc gtg cgg cac ccc gcc tac acc gac cgt cgg tac cgg 1296 Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg 420 425 430 gtg tcc ggc tcc ctg gag aac agc gac ctg atc acc gac cag acg ttc 1344 Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe 435 440 445 tgg atc ggg gtc ttc ccc ggc atc acc ccg gag atg atc gcc tac gtc 1392 Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val 450 455 460 ggc gac acg atc cgg gag ttc gtg ctc aag cac tcc tga 1431 Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser 465 470 475 <210> 54 <211> 476 <212> PRT <213> Streptomyces ambofaciens <400> 54 Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gln Ser 1 5 10 15 Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser 20 25 30 Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg 35 40 45 Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro 50 55 60 Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val 65 70 75 80 Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met 85 90 95 Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala 100 105 110 Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser 115 120 125 Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu 130 135 140 Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe 145 150 155 160 Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val Pro Val Phe 165 170 175 Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu 180 185 190 Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu 195 200 205 Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg 210 215 220 Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr 225 230 235 240 Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe 245 250 255 Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr 260 265 270 Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly 275 280 285 Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg 290 295 300 Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr 305 310 315 320 Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala 325 330 335 Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala 340 345 350 Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro 355 360 365 Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe 370 375 380 Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala 385 390 395 400 Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe 405 410 415 Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg 420 425 430 Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe 435 440 445 Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val 450 455 460 Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser 465 470 475 <210> 55 <211> 471 <212> PRT <213> Streptomyces ambofaciens <400> 55 Met Arg Val Ala Pro Ala Asp Val Met Gln Ser Asp Arg Asp Asp Arg 1 5 10 15 Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser Asn His Ser Gly Leu 20 25 30 Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg Asn Arg Ile Thr Glu 35 40 45 Leu Val Arg Ala Tyr His Arg Glu Gln Ala Pro Gly Gly Phe Val Pro 50 55 60 Gly Thr Thr His Val Pro Val Ser Gly Ala Val Leu Ser Glu Glu Asp 65 70 75 80 Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met Arg Ile Ala Ala Gly 85 90 95 Pro Ala Ser Arg Gly Phe Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu 100 105 110 Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala 115 120 125 Leu Gly Ala Leu Thr Ser Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro 130 135 140 Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn 145 150 155 160 Pro Ile Phe His Asn Gly Leu Val Pro Val Phe Val Asp Val Glu Leu 165 170 175 Gly Thr Tyr Asn Thr Thr Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro 180 185 190 Arg Thr Arg Ala Ile Met Ile Ala His Ala Leu Gly Asn Pro Phe Glu 195 200 205 Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile 210 215 220 Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr 225 230 235 240 Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe Tyr Pro Ala His His 245 250 255 Ile Ala Met Gly Glu Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu 260 265 270 Ala Arg Ile Val Glu Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys 275 280 285 Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg Phe Asp Gln Lys Met 290 295 300 Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr Ile Phe Ser His Val 305 310 315 320 Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser 325 330 335 Gln Leu Thr Arg Ile Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp 340 345 350 Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro 355 360 365 His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr 370 375 380 Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu 385 390 395 400 Glu Ser Arg Arg Ile Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val 405 410 415 Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu 420 425 430 Glu Asn Ser Asp Leu Ile Thr Asp Gln Thr Phe Trp Ile Gly Val Phe 435 440 445 Pro Gly Ile Thr Pro Glu Met Ile Ala Tyr Val Gly Asp Thr Ile Arg 450 455 460 Glu Phe Val Leu Lys His Ser 465 470 <210> 56 <211> 464 <212> PRT <213> Streptomyces ambofaciens <400> 56 Val Met Gln Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro 1 5 10 15 Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met 20 25 30 Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg 35 40 45 Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val 50 55 60 Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr 65 70 75 80 Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu 85 90 95 Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn 100 105 110 Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro 115 120 125 Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val 130 135 140 Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu 145 150 155 160 Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro 165 170 175 Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile 180 185 190 Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu 195 200 205 Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val 210 215 220 Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser 225 230 235 240 Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly 245 250 255 Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu 260 265 270 Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg 275 280 285 Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr 290 295 300 Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr 305 310 315 320 Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu 325 330 335 Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu 340 345 350 Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp 355 360 365 Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr 370 375 380 Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr 385 390 395 400 Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp 405 410 415 Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr 420 425 430 Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met 435 440 445 Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser 450 455 460 <210> 57 <211> 463 <212> PRT <213> Streptomyces ambofaciens <400> 57 Met Gln Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser 1 5 10 15 Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly 20 25 30 Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His Arg Glu 35 40 45 Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser 50 55 60 Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala 65 70 75 80 Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg 85 90 95 Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser 100 105 110 Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gln 115 120 125 Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala 130 135 140 Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly Leu Val 145 150 155 160 Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu 165 170 175 Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met Ile Ala 180 185 190 His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala 195 200 205 Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala Val Gly 210 215 220 Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr 225 230 235 240 Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly Gly Cys 245 250 255 Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser Leu Arg 260 265 270 Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys 275 280 285 Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp 290 295 300 His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp 305 310 315 320 Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu Glu Phe 325 330 335 Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp 340 345 350 Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro 355 360 365 Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala Tyr Ser 370 375 380 Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser Thr Arg 385 390 395 400 Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg 405 410 415 Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile Thr Asp 420 425 430 Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu Met Ile 435 440 445 Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His Ser 450 455 460 <210> 58 <211> 450 <212> PRT <213> Streptomyces ambofaciens <400> 58 Met Pro Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser 1 5 10 15 Thr Met Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr 20 25 30 His Arg Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val 35 40 45 Pro Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val 50 55 60 Glu Thr Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly 65 70 75 80 Phe Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu 85 90 95 Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr 100 105 110 Ser Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val 115 120 125 Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn 130 135 140 Gly Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr 145 150 155 160 Thr Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile 165 170 175 Met Ile Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala 180 185 190 Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp 195 200 205 Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp 210 215 220 Leu Ser Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu 225 230 235 240 Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu 245 250 255 Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp 260 265 270 Asn Arg Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro 275 280 285 Gly Tyr Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys 290 295 300 Ser Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile 305 310 315 320 Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala 325 330 335 Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly 340 345 350 Ser Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala 355 360 365 Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile 370 375 380 Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr 385 390 395 400 Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu 405 410 415 Ile Thr Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro 420 425 430 Glu Met Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys 435 440 445 His Ser 450 <210> 59 <211> 433 <212> PRT <213> Streptomyces ambofaciens <400> 59 Met Gly Asp Leu Arg Asn Arg Ile Thr Glu Leu Val Arg Ala Tyr His 1 5 10 15 Arg Glu Gln Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro 20 25 30 Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu 35 40 45 Thr Ala Leu Glu Met Arg Ile Ala Ala Gly Pro Ala Ser Arg Gly Phe 50 55 60 Glu Arg Gln Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr 65 70 75 80 Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser 85 90 95 Pro Gln Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr 100 105 110 Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro Ile Phe His Asn Gly 115 120 125 Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr 130 135 140 Pro Glu Arg Ile Glu Arg Ala Ile Gly Pro Arg Thr Arg Ala Ile Met 145 150 155 160 Ile Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg 165 170 175 Leu Ala Asp Glu Arg Glu Leu Phe Leu Ile Glu Asp Asn Cys Asp Ala 180 185 190 Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu 195 200 205 Ser Thr Val Ser Phe Tyr Pro Ala His His Ile Ala Met Gly Glu Gly 210 215 220 Gly Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg Ile Val Glu Ser 225 230 235 240 Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn 245 250 255 Arg Cys Leu Lys Arg Phe Asp Gln Lys Met Gly Asp Leu Pro Pro Gly 260 265 270 Tyr Asp His Lys Tyr Ile Phe Ser His Val Gly Tyr Asn Leu Lys Ser 275 280 285 Thr Asp Leu Gln Ala Ala Leu Gly Leu Ser Gln Leu Thr Arg Ile Glu 290 295 300 Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala 305 310 315 320 Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser 325 330 335 Asp Pro Ser Trp Phe Gly Phe Leu Ile Thr Val Asp Pro Asp Ala Ala 340 345 350 Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg Ile Ser 355 360 365 Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr 370 375 380 Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu Ile 385 390 395 400 Thr Asp Gln Thr Phe Trp Ile Gly Val Phe Pro Gly Ile Thr Pro Glu 405 410 415 Met Ile Ala Tyr Val Gly Asp Thr Ile Arg Glu Phe Val Leu Lys His 420 425 430 Ser <210> 60 <211> 1398 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1398) <400> 60 atg gac gac acg atg gcc ggc gcc gac gcc gag gaa tgg gac ggc gat 48 Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp 1 5 10 15 cag tta gac cgc gag gac cgg gcc tcc ctc cgc cgc gtc gcg ggg ctc 96 Gln Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu 20 25 30 tcc acc gaa ctg acc gac gtc tcc gag gtc gag tac cgc cag ctg cga 144 Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gln Leu Arg 35 40 45 ctc gag cgg gtg gtg ctc gtc ggc atc tgg acc tcg gga acg gcc gcg 192 Leu Glu Arg Val Val Leu Val Gly Ile Trp Thr Ser Gly Thr Ala Ala 50 55 60 gag gcc gac agt tcg ctc gcc gag ctg gcg gcg ctc gcc gag acc gcg 240 Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala 65 70 75 80 ggc gcc ctc gtg ctg gac ggc gtc gtg cag cgc cgg cag aag ccg gac 288 Gly Ala Leu Val Leu Asp Gly Val Val Gln Arg Arg Gln Lys Pro Asp 85 90 95 ccg gcg acg tac atc ggc tcg ggc aag gcg tcg cag ctg cgc gac atc 336 Pro Ala Thr Tyr Ile Gly Ser Gly Lys Ala Ser Gln Leu Arg Asp Ile 100 105 110 gtc gag gag acc ggc gcc gac acc gtg gtg tgc gac ggg gaa ctg agc 384 Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser 115 120 125 ccc agt cag ctg atg cac ctg gag gag gtc gtc ggg gtc aag gtc gtg 432 Pro Ser Gln Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val 130 135 140 gac cgc acg gcc ctg atc ctg gac atc ttc gcg cag cac gcc cag tcc 480 Asp Arg Thr Ala Leu Ile Leu Asp Ile Phe Ala Gln His Ala Gln Ser 145 150 155 160 cgg gag ggc aag gcg cag gtg gcg ctg gcg cag atg cag tac atg ctg 528 Arg Glu Gly Lys Ala Gln Val Ala Leu Ala Gln Met Gln Tyr Met Leu 165 170 175 ccg cgg ctg cgc ggc tgg ggc cag tcg ctg tcc cgg cag atg ggc ggc 576 Pro Arg Leu Arg Gly Trp Gly Gln Ser Leu Ser Arg Gln Met Gly Gly 180 185 190 ggt ggc ggc ggt ggc atg gcc acg cgc ggt ccc ggt gag acg aag atc 624 Gly Gly Gly Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys Ile 195 200 205 gag acg gac cgg cgg cgg atc aac gac aag atg gcc agg ctc cgc cgg 672 Glu Thr Asp Arg Arg Arg Ile Asn Asp Lys Met Ala Arg Leu Arg Arg 210 215 220 gag ctg gag cag ctg aag acc ggc cgg gac gtg aac cgg gag gag cga 720 Glu Leu Glu Gln Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg 225 230 235 240 cgg cgc aac aag gtg ctg tcg gtc gcc ctc gcc ggc tac acc aac gcc 768 Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala 245 250 255 ggc aag tca tcg ctg ctc aac cgc ctc acc gga gcc ggc gtg ctg gtg 816 Gly Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val 260 265 270 gag aac gcc ctg ttc gcc acc ctg gac acg acc gtg cgg cgg gcg acg 864 Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr 275 280 285 acg ccg agc ggg cgc ccc tac acc atc gcc gac acc gtg ggc ttc gta 912 Thr Pro Ser Gly Arg Pro Tyr Thr Ile Ala Asp Thr Val Gly Phe Val 290 295 300 cgc cac ctc ccg cac cac ctg gtg gag gcg ttc cgt tcc acg atc gaa 960 Arg His Leu Pro His His Leu Val Glu Ala Phe Arg Ser Thr Ile Glu 305 310 315 320 gag gtc gcg gac gcg cat ctg gtg ctg cac gtg gtc gac ggt tcg cac 1008 Glu Val Ala Asp Ala His Leu Val Leu His Val Val Asp Gly Ser His 325 330 335 ccg gac ccc ggc gcg cag ctg gcc tcg gtg cgc gag gtg ctg cgg gac 1056 Pro Asp Pro Gly Ala Gln Leu Ala Ser Val Arg Glu Val Leu Arg Asp 340 345 350 gtg ggc gcc ggc gag tcc acc gag gtc gtg gtc gtc aac aag gcc gat 1104 Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp 355 360 365 gtc gcg gac ccg gac gtc ctc gcc cgt ctg ctg gag cag gag ccg gac 1152 Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gln Glu Pro Asp 370 375 380 gcg atc gtc gtg tcc gcc cgt tcg ggt cgg ggc atc gac gag ctg cgg 1200 Ala Ile Val Val Ser Ala Arg Ser Gly Arg Gly Ile Asp Glu Leu Arg 385 390 395 400 gaa ctg atc gac cgc ctg ctg ccg cac ccc gag gtg gag gtg gag gtc 1248 Glu Leu Ile Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val 405 410 415 gtg atc ccc tac gac gag ggg agc ctg gtg gcg cgg gtg cac gac gag 1296 Val Ile Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu 420 425 430 ggc gag gtg ctc agc acc gag cac acg ccg gag ggc acc ctg ctc acc 1344 Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr 435 440 445 gcg cgg gtc cac ccc gac ctc gcc tcg gag ctt cgg acg ctt ccg cgg 1392 Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg 450 455 460 ccg tga 1398 Pro 465 <210> 61 <211> 465 <212> PRT <213> Streptomyces ambofaciens <400> 61 Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp 1 5 10 15 Gln Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu 20 25 30 Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gln Leu Arg 35 40 45 Leu Glu Arg Val Val Leu Val Gly Ile Trp Thr Ser Gly Thr Ala Ala 50 55 60 Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala 65 70 75 80 Gly Ala Leu Val Leu Asp Gly Val Val Gln Arg Arg Gln Lys Pro Asp 85 90 95 Pro Ala Thr Tyr Ile Gly Ser Gly Lys Ala Ser Gln Leu Arg Asp Ile 100 105 110 Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser 115 120 125 Pro Ser Gln Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val 130 135 140 Asp Arg Thr Ala Leu Ile Leu Asp Ile Phe Ala Gln His Ala Gln Ser 145 150 155 160 Arg Glu Gly Lys Ala Gln Val Ala Leu Ala Gln Met Gln Tyr Met Leu 165 170 175 Pro Arg Leu Arg Gly Trp Gly Gln Ser Leu Ser Arg Gln Met Gly Gly 180 185 190 Gly Gly Gly Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys Ile 195 200 205 Glu Thr Asp Arg Arg Arg Ile Asn Asp Lys Met Ala Arg Leu Arg Arg 210 215 220 Glu Leu Glu Gln Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg 225 230 235 240 Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala 245 250 255 Gly Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val 260 265 270 Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr 275 280 285 Thr Pro Ser Gly Arg Pro Tyr Thr Ile Ala Asp Thr Val Gly Phe Val 290 295 300 Arg His Leu Pro His His Leu Val Glu Ala Phe Arg Ser Thr Ile Glu 305 310 315 320 Glu Val Ala Asp Ala His Leu Val Leu His Val Val Asp Gly Ser His 325 330 335 Pro Asp Pro Gly Ala Gln Leu Ala Ser Val Arg Glu Val Leu Arg Asp 340 345 350 Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp 355 360 365 Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gln Glu Pro Asp 370 375 380 Ala Ile Val Val Ser Ala Arg Ser Gly Arg Gly Ile Asp Glu Leu Arg 385 390 395 400 Glu Leu Ile Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val 405 410 415 Val Ile Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu 420 425 430 Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr 435 440 445 Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg 450 455 460 Pro 465 <210> 62 <211> 1044 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1044) <400> 62 atg cga gta ctc att atc ggg ggt tca cag ttc gtg ggc cgg gcc ttc 48 Met Arg Val Leu Ile Ile Gly Gly Ser Gln Phe Val Gly Arg Ala Phe 1 5 10 15 gcc gcc gag gca ctg gcc gcg ggg cac cgg gtc acc acg ttc aac cgg 96 Ala Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg 20 25 30 ggt gtc agc ggc acc gac ctg ccc ggc gtc gag gcg gtc agg ggc gac 144 Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp 35 40 45 cgc gag gtg gcc ggc gac ctg gag cgg ctg gtg tcc gga agg cac tgg 192 Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp 50 55 60 gac gcg gtc gtg gac acc tgc ggt tac gtg ccc cgc acg gtg ggg gcc 240 Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala 65 70 75 80 tcg gcc gcg gcg ctg tcc ggg cac gcg gac acc tac ctc tac gtc tcc 288 Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser 85 90 95 agc atc gcc tgc ctg ccc gac tgg gcg cag gcg gtc cgt ccg gtg gac 336 Ser Ile Ala Cys Leu Pro Asp Trp Ala Gln Ala Val Arg Pro Val Asp 100 105 110 gac gac tca cct gcc cac gac tgc ccg ccg gac gcc gga ccg gac cac 384 Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His 115 120 125 gcc gac ggt gac tac ggc gtc ctg aag gcc ggc tgc gag cgc gcc gtg 432 Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val 130 135 140 gac cgg cac ttc gcg ggc cgg acc ctg cac ctg cgg gcc ggt gtc atc 480 Asp Arg His Phe Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val Ile 145 150 155 160 ctc ggg ccg cac gac acc atg cgc atg ctc gac gcc tgg ctg tgg cgc 528 Leu Gly Pro His Asp Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg 165 170 175 atg cgc gtc gcc gag ggg gag cac cgc cgg gtg ctc gcc ccg ggc aac 576 Met Arg Val Ala Glu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn 180 185 190 ccc gag gtg ggc atg cgc ctg atc gac gta cgc gat gtc gcc gtc ttc 624 Pro Glu Val Gly Met Arg Leu Ile Asp Val Arg Asp Val Ala Val Phe 195 200 205 ggc ctc gac tgc ctc gcg gac ggc cgt acc ggc gcc ttc atc gtc aac 672 Gly Leu Asp Cys Leu Ala Asp Gly Arg Thr Gly Ala Phe Ile Val Asn 210 215 220 ccg ccg gag aag aac acc acc ttc ggg gag ttg ctc acg gag tgc gtc 720 Pro Pro Glu Lys Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val 225 230 235 240 aag gcc acc ggt tcg gcc gcg gag ccg gtg tgg gtc gac gag ggg ttc 768 Lys Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe 245 250 255 ctc gcc gag cac ggc gtg agt ccg tgg acg gac ctg ccg atg tgg gtg 816 Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val 260 265 270 ccc gac acc gcg cgg gac acc ctc gtg tgg gcg gcc gga gca ccg cgc 864 Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg 275 280 285 gcc cgg gcc gcg ggt ctg gcc tgc cgg ccc ttc tcc gac acc gtg cgg 912 Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg 290 295 300 gac gcc tgg gag gtc gtc cgg gac cgg ccc gtc ccg gaa ctg ccg ctc 960 Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu 305 310 315 320 gcg gcc ggc tgc ggc ctg tcc ctg agc cgg gag aag gag ctg ctc gcc 1008 Ala Ala Gly Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala 325 330 335 gcc tgg gac gct cgc ggc ggt gcg gcg gcg ggc tga 1044 Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly 340 345 <210> 63 <211> 347 <212> PRT <213> Streptomyces ambofaciens <400> 63 Met Arg Val Leu Ile Ile Gly Gly Ser Gln Phe Val Gly Arg Ala Phe 1 5 10 15 Ala Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg 20 25 30 Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp 35 40 45 Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp 50 55 60 Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala 65 70 75 80 Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser 85 90 95 Ser Ile Ala Cys Leu Pro Asp Trp Ala Gln Ala Val Arg Pro Val Asp 100 105 110 Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His 115 120 125 Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val 130 135 140 Asp Arg His Phe Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val Ile 145 150 155 160 Leu Gly Pro His Asp Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg 165 170 175 Met Arg Val Ala Glu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn 180 185 190 Pro Glu Val Gly Met Arg Leu Ile Asp Val Arg Asp Val Ala Val Phe 195 200 205 Gly Leu Asp Cys Leu Ala Asp Gly Arg Thr Gly Ala Phe Ile Val Asn 210 215 220 Pro Pro Glu Lys Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val 225 230 235 240 Lys Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe 245 250 255 Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val 260 265 270 Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg 275 280 285 Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg 290 295 300 Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu 305 310 315 320 Ala Ala Gly Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala 325 330 335 Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly 340 345 <210> 64 <211> 1041 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1041) <400> 64 atg acc gcc ctg ggt act tct gct gaa ccg ttc gcc gca ccc ggc ccg 48 Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro 1 5 10 15 ccg cgg ccg gaa gcg tcc ccg gtg ctg cgc ttc gga gcg atc ggc tgc 96 Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala Ile Gly Cys 20 25 30 ggc gac atc gcg ggc cgt cgc acc ctg ccc gcc ctg ctc tcc acc ccc 144 Gly Asp Ile Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro 35 40 45 ggc acc gtg ctg acc tgc gtc ggc agc cgc gac gcg gac cgg gcc aag 192 Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys 50 55 60 gcc ctg ggc agg cac ttc gac tgc gag gcg gtc gcg ccc tac gag gcc 240 Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala 65 70 75 80 ctg ctg gaa cgc ccc gac gtg gac gcc gtc tac atc gcg gtg ccc agc 288 Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr Ile Ala Val Pro Ser 85 90 95 atg ctg cac gcc gaa tgg gcc gcg gcg gcg ctg cgg gcg ggc aaa cac 336 Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His 100 105 110 gtc ctc gtg gag aag ccc gcc gcc gcc aac cac gcc gac gcg gcc cgc 384 Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg 115 120 125 ctg ttc gcc atg gcc cgg gag cgc gga ctg gta ctg atg gag aac ttc 432 Leu Phe Ala Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe 130 135 140 atg ttc ctc cac cac tct caa cac gcc acc gtc aaa gcc ctg ttg gag 480 Met Phe Leu His His Ser Gln His Ala Thr Val Lys Ala Leu Leu Glu 145 150 155 160 gcc ggt gcc atc gga gag ctg cgc acc ttc tcc gcc gcc ttc acc atc 528 Ala Gly Ala Ile Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr Ile 165 170 175 ccg ccg cgc gcc gac gac gac atg cgc tac cga ccc gac atc ggc ggc 576 Pro Pro Arg Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp Ile Gly Gly 180 185 190 ggc gca ctg ctc gac aac ggc gtc tac ccg ctg cgg gcc gcg ctg cac 624 Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His 195 200 205 ttc ctc gga ccc gaa ctg cgc ctg acc ggc gcc gtg ctg cgc cgt gac 672 Phe Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp 210 215 220 cgc cgc cgg ggc gtc gtg gtc tcc ggc agc gtc ctg ctc gcc gcc ccc 720 Arg Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro 225 230 235 240 cag ggc gtg gcc gcc cac ctc gcc ttc ggc atg gaa cac ggc tac cgc 768 Gln Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg 245 250 255 tcg gcg tac gag ctg cac ggc agc acc ggc tcg ctc gcc ctg agc cac 816 Ser Ala Tyr Glu Leu His Gly Ser Thr Gly Ser Leu Ala Leu Ser His 260 265 270 gtc ttc acg acc ccg gac agc cac cac ccc gta ctg cgg ctg tcc cgc 864 Val Phe Thr Thr Pro Asp Ser His His Pro Val Leu Arg Leu Ser Arg 275 280 285 cag gac cac cgg gag gag cgc gtc ctg ccc gtg gac cgg cac ttc gtg 912 Gln Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val 290 295 300 aac atc ctg tcg gtc ttc cgc cgt gcg gtg atc cgg gcc gag gac gtc 960 Asn Ile Leu Ser Val Phe Arg Arg Ala Val Ile Arg Ala Glu Asp Val 305 310 315 320 tcc gcc gag tcg tac gcc gcg ctg cgc cag gcg ggg ctg gtc gac gag 1008 Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gln Ala Gly Leu Val Asp Glu 325 330 335 atc gtg gcc cgc gcc gag acc ttc acc gtg tag 1041 Ile Val Ala Arg Ala Glu Thr Phe Thr Val 340 345 <210> 65 <211> 346 <212> PRT <213> Streptomyces ambofaciens <400> 65 Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro 1 5 10 15 Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala Ile Gly Cys 20 25 30 Gly Asp Ile Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro 35 40 45 Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys 50 55 60 Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala 65 70 75 80 Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr Ile Ala Val Pro Ser 85 90 95 Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His 100 105 110 Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg 115 120 125 Leu Phe Ala Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe 130 135 140 Met Phe Leu His His Ser Gln His Ala Thr Val Lys Ala Leu Leu Glu 145 150 155 160 Ala Gly Ala Ile Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr Ile 165 170 175 Pro Pro Arg Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp Ile Gly Gly 180 185 190 Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His 195 200 205 Phe Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp 210 215 220 Arg Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro 225 230 235 240 Gln Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg 245 250 255 Ser Ala Tyr Glu Leu His Gly Ser Thr Gly Ser Leu Ala Leu Ser His 260 265 270 Val Phe Thr Thr Pro Asp Ser His His Pro Val Leu Arg Leu Ser Arg 275 280 285 Gln Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val 290 295 300 Asn Ile Leu Ser Val Phe Arg Arg Ala Val Ile Arg Ala Glu Asp Val 305 310 315 320 Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gln Ala Gly Leu Val Asp Glu 325 330 335 Ile Val Ala Arg Ala Glu Thr Phe Thr Val 340 345 <210> 66 <211> 1239 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1239) <400> 66 gtg acg gac gcg atc acg acc gag ctg gcc gac cgc gaa ctg ggg cgc 48 Val Thr Asp Ala Ile Thr Thr Glu Leu Ala Asp Arg Glu Leu Gly Arg 1 5 10 15 aga ctg cac cgg ata cgc ggc gtc cac tgg tat ttc ggc aac cac ggt 96 Arg Leu His Arg Ile Arg Gly Val His Trp Tyr Phe Gly Asn His Gly 20 25 30 gac ccg tac gcc ctc atc ctg cgc ggt cag acc gac gac ccg tcg gtg 144 Asp Pro Tyr Ala Leu Ile Leu Arg Gly Gln Thr Asp Asp Pro Ser Val 35 40 45 tac gag gag cgg gtc cgc gag ggc ggg ccg ctg ttc cgc agc cgt acc 192 Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr 50 55 60 ggg acc tgg gtg acc gcg gac ccg gag gtg gcc gcg gcc gtg ctg ggc 240 Gly Thr Trp Val Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Gly 65 70 75 80 gac tcg cgc ttc ggt gcg ctg gac cgc gcc gga cgg cgc ccg gag gag 288 Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu 85 90 95 tac ctc cag ccg tcg ccc gcc acg tac ctg ggg ctg gac cgc gcc gcg 336 Tyr Leu Gln Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala 100 105 110 tac gcg cgt ctg cgg cgg gtg gcc gag ccc gtg ctg ggc gcg gac gcc 384 Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala 115 120 125 gcc gcc gcg tgg cgc cgg ctc ggc gag gac gtc ggg cgc cgg ctg ctc 432 Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu 130 135 140 gcc ggc cgc ggt tcc ggc ctc gac ctg acg gcg gac ttc gcc cgc cgg 480 Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg 145 150 155 160 ctg ccg gca ttg gtc ctg gcc gcg tgg ctc ggg gtg ccg ggc gaa cgg 528 Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg 165 170 175 tgc gac gag tgg gag gag tcg ctg cgg gcg gcg ggg ccg ctg ctg gac 576 Cys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp 180 185 190 ggt ctg ctg tgt ccg cag acg ctg gcg gcc acc cgt gcg gcg gac tcg 624 Gly Leu Leu Cys Pro Gln Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser 195 200 205 gcc gcc gag ggg ctg cgc gcg ctg ttg gac gag gtg gtc gcc gcg cgt 672 Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg 210 215 220 ccc ggc ggg tcc ggc gag ggt gcg gtg gcc cgc atg gtc ggc gcc gga 720 Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly 225 230 235 240 gcc gcc ccc gac gac gcg gtg gcc gcc gcc gtg tgc ctg gcg ctc tcg 768 Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser 245 250 255 gcc gtc gaa ccg acg acg acc ctg gtg tgc gaa gcg gtc cgg ctg ctg 816 Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu 260 265 270 ctc gac cga ccc gag tgg tgg cgg cgg ttg tgc gac tcc ccc gct ctg 864 Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu 275 280 285 gcg ccg gcc gcg gtc cgg cac acc ctg cgg cac gcg ccc ccg gtg cgg 912 Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro Val Arg 290 295 300 ctg gag agc cgg gtg gcc cac gag gac gtg acg gtg gcg gat cgt ccg 960 Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro 305 310 315 320 ctg ccc gcc ggg agc cac gtg gtg gtg ctc gtg ggc gcg gca cgg cgc 1008 Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg 325 330 335 gcg ggc gcc ccg gcc gcg gag ccg gcg gac ctg gcg ggc gca ccg gcg 1056 Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala 340 345 350 gcg gag ctg ccg gac gac ctg tgg ttc gcg ctg tcc ggg gag ttc gtc 1104 Ala Glu Leu Pro Asp Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val 355 360 365 ggc cgt gcc gcc gag acc gcg ctg ggc gtg ctg gcc gag gcc gcc ccg 1152 Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro 370 375 380 gga ctg cgg cgg gac ggc gac atc gtc cgg cgg cgc cgt tcc ccg gtc 1200 Gly Leu Arg Arg Asp Gly Asp Ile Val Arg Arg Arg Arg Ser Pro Val 385 390 395 400 ctc ggc agg tac gcg cgg ttc ccc gtc gcg tac tcc tga 1239 Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser 405 410 <210> 67 <211> 412 <212> PRT <213> Streptomyces ambofaciens <400> 67 Val Thr Asp Ala Ile Thr Thr Glu Leu Ala Asp Arg Glu Leu Gly Arg 1 5 10 15 Arg Leu His Arg Ile Arg Gly Val His Trp Tyr Phe Gly Asn His Gly 20 25 30 Asp Pro Tyr Ala Leu Ile Leu Arg Gly Gln Thr Asp Asp Pro Ser Val 35 40 45 Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr 50 55 60 Gly Thr Trp Val Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Gly 65 70 75 80 Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu 85 90 95 Tyr Leu Gln Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala 100 105 110 Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala 115 120 125 Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu 130 135 140 Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg 145 150 155 160 Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg 165 170 175 Cys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp 180 185 190 Gly Leu Leu Cys Pro Gln Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser 195 200 205 Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg 210 215 220 Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly 225 230 235 240 Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser 245 250 255 Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu 260 265 270 Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu 275 280 285 Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro Val Arg 290 295 300 Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro 305 310 315 320 Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg 325 330 335 Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala 340 345 350 Ala Glu Leu Pro Asp Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val 355 360 365 Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro 370 375 380 Gly Leu Arg Arg Asp Gly Asp Ile Val Arg Arg Arg Arg Ser Pro Val 385 390 395 400 Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser 405 410 <210> 68 <211> 1272 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1272) <400> 68 gtg cgc gtc ctg gtg acc tcc atc ccg cac cac acg cac tac tac cac 48 Val Arg Val Leu Val Thr Ser Ile Pro His His Thr His Tyr Tyr His 1 5 10 15 ctg gta ccg ctg atc tgg gct ctg cgt gcc tcg ggg cac gag gtg gtg 96 Leu Val Pro Leu Ile Trp Ala Leu Arg Ala Ser Gly His Glu Val Val 20 25 30 gcg gcc ggc cag ccg tcg ctg gtc gac gcc atc acc gcc agc ggc atc 144 Ala Ala Gly Gln Pro Ser Leu Val Asp Ala Ile Thr Ala Ser Gly Ile 35 40 45 ccg gcg ttc gcc ctg gcc gag gag gag tcg ctg gcg cag atc ttc gag 192 Pro Ala Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gln Ile Phe Glu 50 55 60 gag gtc gag ggc gat ctc cag ccg tat cag cac ggc atc gac gag ttc 240 Glu Val Glu Gly Asp Leu Gln Pro Tyr Gln His Gly Ile Asp Glu Phe 65 70 75 80 gac ttc ttc ggc acc ctg aag gac gag ctg gac tgg gag aag ctg ctc 288 Asp Phe Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu 85 90 95 gcc cag cag gtg atc ctg tcc ggc ctg tgg ctg gaa ccg ctc aac ggc 336 Ala Gln Gln Val Ile Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly 100 105 110 gcc acg acc ctc gac agc atc gtc gac ttc gcc cgg gcc tgg aag ccc 384 Ala Thr Thr Leu Asp Ser Ile Val Asp Phe Ala Arg Ala Trp Lys Pro 115 120 125 gac ctg gtg ctg tgg gag ccg ttc acc tat gcg ggg ccg gtg gcg gcc 432 Asp Leu Val Leu Trp Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala 130 135 140 cgg gcg tgc ggg gcc gcg cac gcc cgc gtc ctg tgg ggg ccg gac acg 480 Arg Ala Cys Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr 145 150 155 160 atc ggg ctg ctg cgg acg aag ttc ctt cag gcc cag gcg cgt cag ccc 528 Ile Gly Leu Leu Arg Thr Lys Phe Leu Gln Ala Gln Ala Arg Gln Pro 165 170 175 gag gag cac cgg gac gac ccg gtc gcg gag tgg atg acc tgg gcc ctg 576 Glu Glu His Arg Asp Asp Pro Val Ala Glu Trp Met Thr Trp Ala Leu 180 185 190 gcg cgc tac ggg tgc gac ttc cgg gag gag gac gtg ctc ggt cag tgg 624 Ala Arg Tyr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu Gly Gln Trp 195 200 205 agc gtg gac ccg atg gcg gag ggc gtc agt ctg ggc ctc gac ctg ccg 672 Ser Val Asp Pro Met Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro 210 215 220 acc gtc ccg atg cgc tac acc ccg tac aac ggg tcg gcg gtg atc ccc 720 Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val Ile Pro 225 230 235 240 gac tgg ctg acc gag gaa ccg aaa cgg cct cgg gtc tgc ctg acc ctg 768 Asp Trp Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu 245 250 255 ggg gtg tcc tcg cgg gag cac agt gag gac gag gtc ccg gtg cag agg 816 Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gln Arg 260 265 270 ttt atc gag gcg ctg gcc gat ctc gac atc gag ctg gtg gcg acc ctg 864 Phe Ile Glu Ala Leu Ala Asp Leu Asp Ile Glu Leu Val Ala Thr Leu 275 280 285 gac gac gcc cag cgg gac ctg ctg ccg agg atc ccg gac aac acg cgc 912 Asp Asp Ala Gln Arg Asp Leu Leu Pro Arg Ile Pro Asp Asn Thr Arg 290 295 300 atc gtc gac ttc gtg ccc atg gac gcg ttg ctg ccg acg tgc tcg gcg 960 Ile Val Asp Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala 305 310 315 320 atc atc aac cac agc ggt tcg ggc acg tgc aac acc gcc gcg ctg cac 1008 Ile Ile Asn His Ser Gly Ser Gly Thr Cys Asn Thr Ala Ala Leu His 325 330 335 ggg gtg ccg cag atc atc ctc ggc ggc atc ctg gac gcc gcc gta cgg 1056 Gly Val Pro Gln Ile Ile Leu Gly Gly Ile Leu Asp Ala Ala Val Arg 340 345 350 cag cac atg ttc gcg cag aac tcc gcc gcc ctc acc ttc gct ccg gag 1104 Gln His Met Phe Ala Gln Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu 355 360 365 gag gtg acc ggc gcg tcg ctg agg agc gcg ctg gtg cgc ctg ctc gag 1152 Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu 370 375 380 gag ccg cgg ttc cgc gac ggc gcg cgg cgg ctg aag gag cgg atg cgg 1200 Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg 385 390 395 400 gcc atg ccc agc ccg gcc ggg atc gtg ccg acc ctg gag cgc ctc acg 1248 Ala Met Pro Ser Pro Ala Gly Ile Val Pro Thr Leu Glu Arg Leu Thr 405 410 415 gcc cag cac cgc cgg gcg tgt tga 1272 Ala Gln His Arg Arg Ala Cys 420 <210> 69 <211> 423 <212> PRT <213> Streptomyces ambofaciens <400> 69 Val Arg Val Leu Val Thr Ser Ile Pro His His Thr His Tyr Tyr His 1 5 10 15 Leu Val Pro Leu Ile Trp Ala Leu Arg Ala Ser Gly His Glu Val Val 20 25 30 Ala Ala Gly Gln Pro Ser Leu Val Asp Ala Ile Thr Ala Ser Gly Ile 35 40 45 Pro Ala Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gln Ile Phe Glu 50 55 60 Glu Val Glu Gly Asp Leu Gln Pro Tyr Gln His Gly Ile Asp Glu Phe 65 70 75 80 Asp Phe Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu 85 90 95 Ala Gln Gln Val Ile Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly 100 105 110 Ala Thr Thr Leu Asp Ser Ile Val Asp Phe Ala Arg Ala Trp Lys Pro 115 120 125 Asp Leu Val Leu Trp Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala 130 135 140 Arg Ala Cys Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr 145 150 155 160 Ile Gly Leu Leu Arg Thr Lys Phe Leu Gln Ala Gln Ala Arg Gln Pro 165 170 175 Glu Glu His Arg Asp Asp Pro Val Ala Glu Trp Met Thr Trp Ala Leu 180 185 190 Ala Arg Tyr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu Gly Gln Trp 195 200 205 Ser Val Asp Pro Met Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro 210 215 220 Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val Ile Pro 225 230 235 240 Asp Trp Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu 245 250 255 Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gln Arg 260 265 270 Phe Ile Glu Ala Leu Ala Asp Leu Asp Ile Glu Leu Val Ala Thr Leu 275 280 285 Asp Asp Ala Gln Arg Asp Leu Leu Pro Arg Ile Pro Asp Asn Thr Arg 290 295 300 Ile Val Asp Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala 305 310 315 320 Ile Ile Asn His Ser Gly Ser Gly Thr Cys Asn Thr Ala Ala Leu His 325 330 335 Gly Val Pro Gln Ile Ile Leu Gly Gly Ile Leu Asp Ala Ala Val Arg 340 345 350 Gln His Met Phe Ala Gln Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu 355 360 365 Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu 370 375 380 Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg 385 390 395 400 Ala Met Pro Ser Pro Ala Gly Ile Val Pro Thr Leu Glu Arg Leu Thr 405 410 415 Ala Gln His Arg Arg Ala Cys 420 <210> 70 <211> 1179 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1179) <400> 70 atg cgg gcc ctc ttc acg acc gcg ccg ctc gcg ggc cac ctg ctt ccg 48 Met Arg Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro 1 5 10 15 ctg gtg ccc atc gcg tgg gcc ctg cgg gcg gcc ggc cac gag gta ctg 96 Leu Val Pro Ile Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu 20 25 30 gtg gcg acc cgg gag gac ttc gtg ccg gtc gcc ctg cgg tcg ggg ctg 144 Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu 35 40 45 ccg tcc gcc tcg tgc ggg ccg ccc gcc gcg gac ctg gcg ggc gcg gcc 192 Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala 50 55 60 gag gcg ggg gcg ctc gcg cgg ccc cgc gga gcg gcg gag gct cgg ggg 240 Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly 65 70 75 80 gtc ctg agc ggg gcg ctg gcg cgc gtc gcc cgg ggc agt ctg gcg ggg 288 Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly 85 90 95 gtg cgg cgg ctg gcg gac gcc tgg cgg ccg gat ctg atc gtc agc gaa 336 Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu Ile Val Ser Glu 100 105 110 cgg gcc gag ttc gcc ggg ccg ctg gtc gcg gcg gcc ctc ggg gtc ccg 384 Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro 115 120 125 tgg gtc cgc tac cac tgg tcg gtc tcg tcc ctg gag gag tac cgg cga 432 Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg 130 135 140 gcg gcc gag gcc gag ttc gcg ccc gag ctg gcg gcg ctc ggc ctc gac 480 Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp 145 150 155 160 cgg ttc ccg gag gcg gcg cgc gtg ctc gat ccg tgg ccg gtg tcg ctg 528 Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu 165 170 175 cgc cgg ccg gac gcg gtc gcc cac gac ggg gtc cgg cac gta ccg gcc 576 Arg Arg Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala 180 185 190 cac ggg gac gcc ccc gtc ccc gac tgg gcg ttc acg cgc ggt cgc ggg 624 His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly 195 200 205 ccg cgg atc tgc gtg acg ctc ggc acc atg ctg ccc cgg tac ggc gcc 672 Pro Arg Ile Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala 210 215 220 gcc ggg atg gcc gac ttc ctg acg gag ctg gtg gcg gag acc cgc gga 720 Ala Gly Met Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly 225 230 235 240 ggg gac tgc gaa ctg ctc gtg gcg gtc gac gac gac gtc gtc gcg cgg 768 Gly Asp Cys Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg 245 250 255 tgg ccg tcg ctg ccc tcc gcg gtg cgg tac gcc ggc cgg ctg ccg ctg 816 Trp Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu 260 265 270 gcg gag gtg ctg ccc gcg tgc gac gcg gtg gtg cac cac ggc ggg cag 864 Ala Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gln 275 280 285 ggc acg tcc ctg acc gcg ctg gcc gcg ggt cgg ccg cag gtc gtc atg 912 Gly Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gln Val Val Met 290 295 300 gcg cgg ctc gac gac cag ttc gac aac gcg cgg gca ctg gcg gcg gcg 960 Ala Arg Leu Asp Asp Gln Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala 305 310 315 320 ggg gcg gcc ctg ctc gta ccg ccg tcc cgg gcc act ccc gcg gcc gtg 1008 Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val 325 330 335 gcc gcg ggg tgc gcc gaa gtg ctg gag aac gcc ctg tat gcc aag gcg 1056 Ala Ala Gly Cys Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala 340 345 350 gca gcc ggg ctc gcc gag gag atg gcg ctg ctg ccg tcg ccg tcg gcg 1104 Ala Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala 355 360 365 gcg gtc gga ctc ctg gaa cac ccg ggg ccc ggg ccg gac atg ccg cgg 1152 Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg 370 375 380 agt tac ccg aac gag gat gcg gtg tga 1179 Ser Tyr Pro Asn Glu Asp Ala Val 385 390 <210> 71 <211> 392 <212> PRT <213> Streptomyces ambofaciens <400> 71 Met Arg Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro 1 5 10 15 Leu Val Pro Ile Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu 20 25 30 Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu 35 40 45 Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala 50 55 60 Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly 65 70 75 80 Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly 85 90 95 Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu Ile Val Ser Glu 100 105 110 Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro 115 120 125 Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg 130 135 140 Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp 145 150 155 160 Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu 165 170 175 Arg Arg Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala 180 185 190 His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly 195 200 205 Pro Arg Ile Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala 210 215 220 Ala Gly Met Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly 225 230 235 240 Gly Asp Cys Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg 245 250 255 Trp Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu 260 265 270 Ala Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gln 275 280 285 Gly Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gln Val Val Met 290 295 300 Ala Arg Leu Asp Asp Gln Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala 305 310 315 320 Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val 325 330 335 Ala Ala Gly Cys Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala 340 345 350 Ala Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala 355 360 365 Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg 370 375 380 Ser Tyr Pro Asn Glu Asp Ala Val 385 390 <210> 72 <211> 993 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(993) <400> 72 gtg aat ctg gaa gta ctc aac cgt tcg aac gat ccg cgc ggg ccg gtg 48 Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val 1 5 10 15 atc acg gtg gtc ggc gcg tcc ggc ttc atc ggg tcc gcc ctg gtc gcc 96 Ile Thr Val Val Gly Ala Ser Gly Phe Ile Gly Ser Ala Leu Val Ala 20 25 30 gag ctg gcg cgc atg ccg gtg cgg ctg cgg gcg gtg gcc cgg cgc gag 144 Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu 35 40 45 acc ccc gtt ccc gcg ggg gca cgg gcc gcc gtc gag gtc cgc cgg gcg 192 Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg Ala 50 55 60 gac ctc gcc cgg ccg gac gag gtc ggg gcc gcc gtc gag ggg gcg gac 240 Asp Leu Ala Arg Pro Asp Glu Val Gly Ala Ala Val Glu Gly Ala Asp 65 70 75 80 gcc gtc gtg cac ctc gcc gcc cac atc ggc ggc gcg cgg tcg tgg cgc 288 Ala Val Val His Leu Ala Ala His Ile Gly Gly Ala Arg Ser Trp Arg 85 90 95 gcg gcc gac gag cgg tcg ctg cgg gtg aac gtc ggt ctg ctg cgc gac 336 Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp 100 105 110 gtg gcc gac gcg ttc cgg gac cgc tcg ggg ccc gcc ccg gcc gtg gtc 384 Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val 115 120 125 ctg gcc agt acc ctc cag gcc ggc gtc gag ctg tcc cgg cag ggc ccg 432 Leu Ala Ser Thr Leu Gln Ala Gly Val Glu Leu Ser Arg Gln Gly Pro 130 135 140 tac gcc cgg cag aag tcg gcg gcc gag gag gtc ctg ctg cgg gcc gcc 480 Tyr Ala Arg Gln Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala 145 150 155 160 tcc gag gag gtg gtc cgc ggc gtc gtg ctg cgg ctg ccg acc gtc tac 528 Ser Glu Glu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr 165 170 175 ggg cgc agc ccg ctg acc ggg tgg acg ggc cgc ggg gtg gtc gcg tcg 576 Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser 180 185 190 gtg gca cgg cag gcc gtc tcg ggc gag ccg gtc acg atg tgg cac gac 624 Val Ala Arg Gln Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp 195 200 205 ggc acg gtc ggg cgc gat ctg ctc cac gtg gag gac gcg gcc cgc gcc 672 Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala 210 215 220 ttc gcg gcg gcg ctc ggt cac gtg gag cgg ctg gac ggc ggc acg tgg 720 Phe Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp 225 230 235 240 tcc gtc ggt acg ggc cgg ctg gag ccc ttg gga gag gtg ttc tcg gcc 768 Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala 245 250 255 ctc gcc ggg ctg gtg gcc gag cgg acg ggg agg ccc ccc gta ccg gtg 816 Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val 260 265 270 gtc tcc acg gag ccg ccc gac cat gcc gag gcg ggc gac ttc gag agc 864 Val Ser Thr Glu Pro Pro Asp His Ala Glu Ala Gly Asp Phe Glu Ser 275 280 285 gcg gtc tgt gac ccc tcc gcg ttc cgc gcg gtg acc ggg tgg tct ccc 912 Ala Val Cys Asp Pro Ser Ala Phe Arg Ala Val Thr Gly Trp Ser Pro 290 295 300 ctc gtt ccg ttg cgg gcg ggg ctc ggc gcc gtg gtg gag acg atg gtg 960 Leu Val Pro Leu Arg Ala Gly Leu Gly Ala Val Val Glu Thr Met Val 305 310 315 320 gcc gac gga gcg agg ggt ggg atc cga acg tga 993 Ala Asp Gly Ala Arg Gly Gly Ile Arg Thr 325 330 <210> 73 <211> 330 <212> PRT <213> Streptomyces ambofaciens <400> 73 Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val 1 5 10 15 Ile Thr Val Val Gly Ala Ser Gly Phe Ile Gly Ser Ala Leu Val Ala 20 25 30 Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu 35 40 45 Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg Ala 50 55 60 Asp Leu Ala Arg Pro Asp Glu Val Gly Ala Ala Val Glu Gly Ala Asp 65 70 75 80 Ala Val Val His Leu Ala Ala His Ile Gly Gly Ala Arg Ser Trp Arg 85 90 95 Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp 100 105 110 Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val 115 120 125 Leu Ala Ser Thr Leu Gln Ala Gly Val Glu Leu Ser Arg Gln Gly Pro 130 135 140 Tyr Ala Arg Gln Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala 145 150 155 160 Ser Glu Glu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr 165 170 175 Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser 180 185 190 Val Ala Arg Gln Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp 195 200 205 Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala 210 215 220 Phe Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp 225 230 235 240 Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala 245 250 255 Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val 260 265 270 Val Ser Thr Glu Pro Pro Asp His Ala Glu Ala Gly Asp Phe Glu Ser 275 280 285 Ala Val Cys Asp Pro Ser Ala Phe Arg Ala Val Thr Gly Trp Ser Pro 290 295 300 Leu Val Pro Leu Arg Ala Gly Leu Gly Ala Val Val Glu Thr Met Val 305 310 315 320 Ala Asp Gly Ala Arg Gly Gly Ile Arg Thr 325 330 <210> 74 <211> 1008 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1008) <400> 74 gtg agc acg gac cgg gag cag gcc gcg cac acg cgg ctc ggt cgc agc 48 Val Ser Thr Asp Arg Glu Gln Ala Ala His Thr Arg Leu Gly Arg Ser 1 5 10 15 gcg acc ctg gtg agc cgg ctc tgg ctg ggc acc gtg aac ttc agc ggc 96 Ala Thr Leu Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly 20 25 30 cgg gtc gag gac ggt gac gcg atg cag ctg atg gag gcg gcg gtc gac 144 Arg Val Glu Asp Gly Asp Ala Met Gln Leu Met Glu Ala Ala Val Asp 35 40 45 cgc ggc atc aac tgc atc gac acc gcg gac atc tac ggc tgg cgg atc 192 Arg Gly Ile Asn Cys Ile Asp Thr Ala Asp Ile Tyr Gly Trp Arg Ile 50 55 60 cac aag ggc cac acc gag gaa ctg gtg ggc cgg tgg ctg gcc aag agc 240 His Lys Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser 65 70 75 80 gcc gcg cgg cgg gag gac gtc ctg ctg gcc acc aag gtc ggc ggg gac 288 Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp 85 90 95 atg agc gaa cgg ctc aac gac ggc ggc ctg tcg gcg cgg cac atc gtc 336 Met Ser Glu Arg Leu Asn Asp Gly Gly Leu Ser Ala Arg His Ile Val 100 105 110 acg gcc tgc gag cag tcg ctg cgg cgc ctg ggc gtg gac cac atc gac 384 Thr Ala Cys Glu Gln Ser Leu Arg Arg Leu Gly Val Asp His Ile Asp 115 120 125 ctg tac cag atg cac cgc gtc gac cac gcc gcg ccg tgg gac gag atc 432 Leu Tyr Gln Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu Ile 130 135 140 tgg cag gcg atg gac cgt ctg gtg gcg agc ggc aag gtg acc tac gtg 480 Trp Gln Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Thr Tyr Val 145 150 155 160 ggg tcg tcg aac ttc gcc ggc tgg aac gtc gcc gcc gcg cag gac gcg 528 Gly Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Ala Ala Gln Asp Ala 165 170 175 gcc cgg cgg cgc cag tcc ctc ggt ctg gtg tcc gag cag tgc ctg tac 576 Ala Arg Arg Arg Gln Ser Leu Gly Leu Val Ser Glu Gln Cys Leu Tyr 180 185 190 aac ctg gcg gtg cgc cac gcc gag ctg gaa ctg ctg ccg gcc gcc cag 624 Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gln 195 200 205 gcg tac gga ctg ggc gtg ttc gcc tgg tcg ccg ctg cac ggc ggg ctg 672 Ala Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu 210 215 220 ctc agc ggg gtg ctg cgc aag ctc gcg gcg ggc gtc gcg gtg aag tcg 720 Leu Ser Gly Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser 225 230 235 240 gca cag ggg cgg gcc cag ctg ctg ctg ccc gag ctg cgc gcg acg atc 768 Ala Gln Gly Arg Ala Gln Leu Leu Leu Pro Glu Leu Arg Ala Thr Ile 245 250 255 gag gcg tac gag ggg ttc tgc ggc cgg atc ggc gcg gat ccg gcc gag 816 Glu Ala Tyr Glu Gly Phe Cys Gly Arg Ile Gly Ala Asp Pro Ala Glu 260 265 270 gtc ggt ctg gcc tgg gtg ctg tcc cgg ccg ggg atc agc ggc gcg gtg 864 Val Gly Leu Ala Trp Val Leu Ser Arg Pro Gly Ile Ser Gly Ala Val 275 280 285 atc ggt ccg cgc acg gtg gac cag ctg gac tcg gcg ctg cgg tcc ctg 912 Ile Gly Pro Arg Thr Val Asp Gln Leu Asp Ser Ala Leu Arg Ser Leu 290 295 300 gac ctg gtc ctc ggg gag gcc gaa ctg gcc gag ctg gac gcc atc ttc 960 Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala Ile Phe 305 310 315 320 ccg ccc ctg ggc aag ggc ggc cgg gcg ccg gac gcg tgg atc agc tga 1008 Pro Pro Leu Gly Lys Gly Gly Arg Ala Pro Asp Ala Trp Ile Ser 325 330 335 <210> 75 <211> 335 <212> PRT <213> Streptomyces ambofaciens <400> 75 Val Ser Thr Asp Arg Glu Gln Ala Ala His Thr Arg Leu Gly Arg Ser 1 5 10 15 Ala Thr Leu Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly 20 25 30 Arg Val Glu Asp Gly Asp Ala Met Gln Leu Met Glu Ala Ala Val Asp 35 40 45 Arg Gly Ile Asn Cys Ile Asp Thr Ala Asp Ile Tyr Gly Trp Arg Ile 50 55 60 His Lys Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser 65 70 75 80 Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp 85 90 95 Met Ser Glu Arg Leu Asn Asp Gly Gly Leu Ser Ala Arg His Ile Val 100 105 110 Thr Ala Cys Glu Gln Ser Leu Arg Arg Leu Gly Val Asp His Ile Asp 115 120 125 Leu Tyr Gln Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu Ile 130 135 140 Trp Gln Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Thr Tyr Val 145 150 155 160 Gly Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Ala Ala Gln Asp Ala 165 170 175 Ala Arg Arg Arg Gln Ser Leu Gly Leu Val Ser Glu Gln Cys Leu Tyr 180 185 190 Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gln 195 200 205 Ala Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu 210 215 220 Leu Ser Gly Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser 225 230 235 240 Ala Gln Gly Arg Ala Gln Leu Leu Leu Pro Glu Leu Arg Ala Thr Ile 245 250 255 Glu Ala Tyr Glu Gly Phe Cys Gly Arg Ile Gly Ala Asp Pro Ala Glu 260 265 270 Val Gly Leu Ala Trp Val Leu Ser Arg Pro Gly Ile Ser Gly Ala Val 275 280 285 Ile Gly Pro Arg Thr Val Asp Gln Leu Asp Ser Ala Leu Arg Ser Leu 290 295 300 Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala Ile Phe 305 310 315 320 Pro Pro Leu Gly Lys Gly Gly Arg Ala Pro Asp Ala Trp Ile Ser 325 330 335 <210> 76 <211> 1233 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1233) <400> 76 atg att gcc acc gcg tgc cgc gtc tgc ggc aac aag gag ctg ctc tcc 48 Met Ile Ala Thr Ala Cys Arg Val Cys Gly Asn Lys Glu Leu Leu Ser 1 5 10 15 gta ctc gac ctg ggc gaa cag gcg ctc acc ggg gtg ttc ccg gcc gac 96 Val Leu Asp Leu Gly Glu Gln Ala Leu Thr Gly Val Phe Pro Ala Asp 20 25 30 cgc gac gag gtc gtg ccg tcg gtc ccg ctg gaa ctc gtc gcg tgt tcc 144 Arg Asp Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser 35 40 45 ccg gcc gga tgc ggc ctc gtg caa ctg cgc cac acc ccc gac ccg gac 192 Pro Ala Gly Cys Gly Leu Val Gln Leu Arg His Thr Pro Asp Pro Asp 50 55 60 ctc atg tac ggc gag ggc tac ggc tac cgc tcg ggc atc cgg ccc ttc 240 Leu Met Tyr Gly Glu Gly Tyr Gly Tyr Arg Ser Gly Ile Arg Pro Phe 65 70 75 80 atg gtc gac cac ctg cat ggc aag gtc gcc gcc gtc cgc cgg ctg gtg 288 Met Val Asp His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val 85 90 95 gac ctc ggc ccg gac gac ctg gtc ctc gac atc ggc agc aac gac gcc 336 Asp Leu Gly Pro Asp Asp Leu Val Leu Asp Ile Gly Ser Asn Asp Ala 100 105 110 acg ctc ctc aag ggc tac ccc gcc gac ggc ccg cga ctg gtc ggc atc 384 Thr Leu Leu Lys Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly Ile 115 120 125 gac ccg acc ggc ggc aag ttc cgc gac ctg tac ccg ccg aac gcc gag 432 Asp Pro Thr Gly Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu 130 135 140 ttg gtc gtg gac tac ttc acc cgc gcg acc ttc gag aac cgc ttc ggg 480 Leu Val Val Asp Tyr Phe Thr Arg Ala Thr Phe Glu Asn Arg Phe Gly 145 150 155 160 gcg cgg cgg gcg aag gcc gtc acc tcc atc gcg atg ttc tac gac ctg 528 Ala Arg Arg Ala Lys Ala Val Thr Ser Ile Ala Met Phe Tyr Asp Leu 165 170 175 ccg gac ccg ctg cgc ttc atg agc gac gtc cgc gac gtc ctc gcc gag 576 Pro Asp Pro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu 180 185 190 gac ggc gtc tgg atg atg gag cag agc tac ctg ccc gcc atg ctc gaa 624 Asp Gly Val Trp Met Met Glu Gln Ser Tyr Leu Pro Ala Met Leu Glu 195 200 205 gcc gac gcg tac gac atc gtc tgc cac gag cac ctg gag tac tac gcg 672 Ala Asp Ala Tyr Asp Ile Val Cys His Glu His Leu Glu Tyr Tyr Ala 210 215 220 ctg cgc cag atc gag tgg atg gcg gaa cgc gtc ggc ctc acc gtc atc 720 Leu Arg Gln Ile Glu Trp Met Ala Glu Arg Val Gly Leu Thr Val Ile 225 230 235 240 cgg gcc gag ctc acc gag gtg tac ggc ggc agc ctg tgc gtc acg ctc 768 Arg Ala Glu Leu Thr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr Leu 245 250 255 gcc agg acc ggt tcc cgg cac ccg agg gac gag gcg ggc ctg gcc cgc 816 Ala Arg Thr Gly Ser Arg His Pro Arg Asp Glu Ala Gly Leu Ala Arg 260 265 270 atc cgg gcc gcc gag gcc gcc gcg gga ctg gac ggc atg gca ccg ttc 864 Ile Arg Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro Phe 275 280 285 gag gcc ttc gcc cgc cgc gtc gcc gac cag cgg gac gcc ctg cgc ggc 912 Glu Ala Phe Ala Arg Arg Val Ala Asp Gln Arg Asp Ala Leu Arg Gly 290 295 300 ttc ctg gac cgc tcc cgc caa gag ggc ctg ctg acc ctc ggg tac ggc 960 Phe Leu Asp Arg Ser Arg Gln Glu Gly Leu Leu Thr Leu Gly Tyr Gly 305 310 315 320 gcc tcc acc aag ggc aac gtc atc ctc cag tac tgc ggg atc acc gaa 1008 Ala Ser Thr Lys Gly Asn Val Ile Leu Gln Tyr Cys Gly Ile Thr Glu 325 330 335 cgg gac ctg ccg tgc atc ggc gag gtg agc gag gag aag gcg ggg cgt 1056 Arg Asp Leu Pro Cys Ile Gly Glu Val Ser Glu Glu Lys Ala Gly Arg 340 345 350 ttc acc ccc ggg acg ggc atc ccc atc gtg tcc gag gag gac gcg aag 1104 Phe Thr Pro Gly Thr Gly Ile Pro Ile Val Ser Glu Glu Asp Ala Lys 355 360 365 gcg cag aag ccg gac cag ttg ctg gtc ctg ccc tgg atc tac cgg gac 1152 Ala Gln Lys Pro Asp Gln Leu Leu Val Leu Pro Trp Ile Tyr Arg Asp 370 375 380 ggg ttc gtc gaa cgg gag cgg gag ttc ctc gac ggc ggc ggc cga ctg 1200 Gly Phe Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu 385 390 395 400 gtc ttc ccg ctg ccc gcg ctc gac gtc gtg tga 1233 Val Phe Pro Leu Pro Ala Leu Asp Val Val 405 410 <210> 77 <211> 410 <212> PRT <213> Streptomyces ambofaciens <400> 77 Met Ile Ala Thr Ala Cys Arg Val Cys Gly Asn Lys Glu Leu Leu Ser 1 5 10 15 Val Leu Asp Leu Gly Glu Gln Ala Leu Thr Gly Val Phe Pro Ala Asp 20 25 30 Arg Asp Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser 35 40 45 Pro Ala Gly Cys Gly Leu Val Gln Leu Arg His Thr Pro Asp Pro Asp 50 55 60 Leu Met Tyr Gly Glu Gly Tyr Gly Tyr Arg Ser Gly Ile Arg Pro Phe 65 70 75 80 Met Val Asp His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val 85 90 95 Asp Leu Gly Pro Asp Asp Leu Val Leu Asp Ile Gly Ser Asn Asp Ala 100 105 110 Thr Leu Leu Lys Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly Ile 115 120 125 Asp Pro Thr Gly Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu 130 135 140 Leu Val Val Asp Tyr Phe Thr Arg Ala Thr Phe Glu Asn Arg Phe Gly 145 150 155 160 Ala Arg Arg Ala Lys Ala Val Thr Ser Ile Ala Met Phe Tyr Asp Leu 165 170 175 Pro Asp Pro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu 180 185 190 Asp Gly Val Trp Met Met Glu Gln Ser Tyr Leu Pro Ala Met Leu Glu 195 200 205 Ala Asp Ala Tyr Asp Ile Val Cys His Glu His Leu Glu Tyr Tyr Ala 210 215 220 Leu Arg Gln Ile Glu Trp Met Ala Glu Arg Val Gly Leu Thr Val Ile 225 230 235 240 Arg Ala Glu Leu Thr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr Leu 245 250 255 Ala Arg Thr Gly Ser Arg His Pro Arg Asp Glu Ala Gly Leu Ala Arg 260 265 270 Ile Arg Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro Phe 275 280 285 Glu Ala Phe Ala Arg Arg Val Ala Asp Gln Arg Asp Ala Leu Arg Gly 290 295 300 Phe Leu Asp Arg Ser Arg Gln Glu Gly Leu Leu Thr Leu Gly Tyr Gly 305 310 315 320 Ala Ser Thr Lys Gly Asn Val Ile Leu Gln Tyr Cys Gly Ile Thr Glu 325 330 335 Arg Asp Leu Pro Cys Ile Gly Glu Val Ser Glu Glu Lys Ala Gly Arg 340 345 350 Phe Thr Pro Gly Thr Gly Ile Pro Ile Val Ser Glu Glu Asp Ala Lys 355 360 365 Ala Gln Lys Pro Asp Gln Leu Leu Val Leu Pro Trp Ile Tyr Arg Asp 370 375 380 Gly Phe Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu 385 390 395 400 Val Phe Pro Leu Pro Ala Leu Asp Val Val 405 410 <210> 78 <211> 1116 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1116) <400> 78 gtg cac cgg gac aac gcc gcc gag ccg ttg gtc aaa tgc ctg gtc tgg 48 Val His Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp 1 5 10 15 gac ctg gac aac acc ctc tgg cag ggc acc ctc ctc gag gag gac gag 96 Asp Leu Asp Asn Thr Leu Trp Gln Gly Thr Leu Leu Glu Glu Asp Glu 20 25 30 gtc cgg ctc gcc ccg gac gtc ctg cgg acc atc acc gag ctg gac gcg 144 Val Arg Leu Ala Pro Asp Val Leu Arg Thr Ile Thr Glu Leu Asp Ala 35 40 45 cgc ggc atc ctg cag gcg gtg gcc agc aag aac gac cac gat cac gcc 192 Arg Gly Ile Leu Gln Ala Val Ala Ser Lys Asn Asp His Asp His Ala 50 55 60 tgg gcg aag ctc gaa cag ctc ggc gtc gcc gag tac ttc gtg ctc ccg 240 Trp Ala Lys Leu Glu Gln Leu Gly Val Ala Glu Tyr Phe Val Leu Pro 65 70 75 80 agg atc ggc tgg ggc ccg aag tcg aag tcg gtc cgc gag atc gcc gac 288 Arg Ile Gly Trp Gly Pro Lys Ser Lys Ser Val Arg Glu Ile Ala Asp 85 90 95 cgg ctg aac ttc gcg ccg agc acc ctc gcc ttc atc gac gac cag ccc 336 Arg Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe Ile Asp Asp Gln Pro 100 105 110 ttc gaa cgg gcc gag gtc acc cac gaa ctg ccg gag gtc cgc acc tac 384 Phe Glu Arg Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr 115 120 125 gcc gcc gag cag gcg acc cgg ctg acc ggc ctc ccg gag ttc agc ccg 432 Ala Ala Glu Gln Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro 130 135 140 ggc acc gtc acc gtc gac tcg acc cgc cgc cgc tcc atg tac cag gcg 480 Gly Thr Val Thr Val Asp Ser Thr Arg Arg Arg Ser Met Tyr Gln Ala 145 150 155 160 tcc ttc cgc cgg gac gcc gag cgg tcc gac ttc acc gga ccc gac gcg 528 Ser Phe Arg Arg Asp Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala 165 170 175 gac ttc ctg cgc tcg ctg gac atc cgg atg cgg atc agc cgc gcc acg 576 Asp Phe Leu Arg Ser Leu Asp Ile Arg Met Arg Ile Ser Arg Ala Thr 180 185 190 ccc ctg gag ctg tcg cgg gtc gag gaa ctg acc ctg cgc acc agc cag 624 Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gln 195 200 205 atg aac gcc acc gga gtg cac tac tcc gag gac gag ctg cgc gcc ctc 672 Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu 210 215 220 atc gac gac ccc gac cac gag gtg ctg gtc acc acc gtc acc gat cgc 720 Ile Asp Asp Pro Asp His Glu Val Leu Val Thr Thr Val Thr Asp Arg 225 230 235 240 ttc ggt ccc tac ggc gcg gtc ggc gtc gtg ctg ctg cgg cgc ggc ccc 768 Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro 245 250 255 gag gcc tgg cgg atc aag ctg ctg gcc acc tcg tgc cgg gtg gtg tcg 816 Glu Ala Trp Arg Ile Lys Leu Leu Ala Thr Ser Cys Arg Val Val Ser 260 265 270 ctg ggg gcc ggc acg gtg atc ctg cgc tgg ctg acg gac cag gcg cac 864 Leu Gly Ala Gly Thr Val Ile Leu Arg Trp Leu Thr Asp Gln Ala His 275 280 285 cgg gcc ggg gtg cac ctc gga gcc gac ttc cgg gcc acc gaa cgc aac 912 Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn 290 295 300 cgg atg atg gaa gtg gcc tac cgc ttc gcc gga ttc acc gac gat ccc 960 Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro 305 310 315 320 tgc ccg tgc cag gac gcc tcc gcc gcc acc ggc gcg atc ggc cgc ctg 1008 Cys Pro Cys Gln Asp Ala Ser Ala Ala Thr Gly Ala Ile Gly Arg Leu 325 330 335 cac ctg gtg ccg tcc ccc cgg ccc gcc ccc gac acc ctc cgt ctg gaa 1056 His Leu Val Pro Ser Pro Arg Pro Ala Pro Asp Thr Leu Arg Leu Glu 340 345 350 gct ccc gac ctg gcc acg ggc cgg cgg cgc ccc ggc cag gat ccc gaa 1104 Ala Pro Asp Leu Ala Thr Gly Arg Arg Arg Pro Gly Gln Asp Pro Glu 355 360 365 agg acc cca tga 1116 Arg Thr Pro 370 <210> 79 <211> 371 <212> PRT <213> Streptomyces ambofaciens <400> 79 Val His Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp 1 5 10 15 Asp Leu Asp Asn Thr Leu Trp Gln Gly Thr Leu Leu Glu Glu Asp Glu 20 25 30 Val Arg Leu Ala Pro Asp Val Leu Arg Thr Ile Thr Glu Leu Asp Ala 35 40 45 Arg Gly Ile Leu Gln Ala Val Ala Ser Lys Asn Asp His Asp His Ala 50 55 60 Trp Ala Lys Leu Glu Gln Leu Gly Val Ala Glu Tyr Phe Val Leu Pro 65 70 75 80 Arg Ile Gly Trp Gly Pro Lys Ser Lys Ser Val Arg Glu Ile Ala Asp 85 90 95 Arg Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe Ile Asp Asp Gln Pro 100 105 110 Phe Glu Arg Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr 115 120 125 Ala Ala Glu Gln Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro 130 135 140 Gly Thr Val Thr Val Asp Ser Thr Arg Arg Arg Ser Met Tyr Gln Ala 145 150 155 160 Ser Phe Arg Arg Asp Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala 165 170 175 Asp Phe Leu Arg Ser Leu Asp Ile Arg Met Arg Ile Ser Arg Ala Thr 180 185 190 Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gln 195 200 205 Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu 210 215 220 Ile Asp Asp Pro Asp His Glu Val Leu Val Thr Thr Val Thr Asp Arg 225 230 235 240 Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro 245 250 255 Glu Ala Trp Arg Ile Lys Leu Leu Ala Thr Ser Cys Arg Val Val Ser 260 265 270 Leu Gly Ala Gly Thr Val Ile Leu Arg Trp Leu Thr Asp Gln Ala His 275 280 285 Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn 290 295 300 Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro 305 310 315 320 Cys Pro Cys Gln Asp Ala Ser Ala Ala Thr Gly Ala Ile Gly Arg Leu 325 330 335 His Leu Val Pro Ser Pro Arg Pro Ala Pro Asp Thr Leu Arg Leu Glu 340 345 350 Ala Pro Asp Leu Ala Thr Gly Arg Arg Arg Pro Gly Gln Asp Pro Glu 355 360 365 Arg Thr Pro 370 <210> 80 <211> 1122 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1122) <400> 80 gtg gct gac acc tcc cac gcc gac ggc acc gag gcc gag gag ctg ttc 48 Val Ala Asp Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe 1 5 10 15 acc gcg ctg gtc ggc gac cgg gcg gcc gag tgg gac cgg acg ggc gag 96 Thr Ala Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu 20 25 30 ctg ccc ctc ggc ctg ctg cac gac ctc ggc tcc cgg ggc ctg ctg tgc 144 Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys 35 40 45 gca cag gcg ccc gcg gtc cac ggc ggc ctc ggc tgg acc agc cgg cgc 192 Ala Gln Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg 50 55 60 aac ggc gaa ctc acc gcg cac gtc ggc gcc ctc tgc agc tcg ttg cgg 240 Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg 65 70 75 80 agc gtc atg acc tcg cag ggc atg gcc gcc tgg acg ctg cgc cgg ctc 288 Ser Val Met Thr Ser Gln Gly Met Ala Ala Trp Thr Leu Arg Arg Leu 85 90 95 gcc gga gcg gac cag cag gcc tcc ctg gtg ccc cgg ttg acc ggc ggc 336 Ala Gly Ala Asp Gln Gln Ala Ser Leu Val Pro Arg Leu Thr Gly Gly 100 105 110 gaa ctg gcc gcc gtg gcg ttc acc gag gcc ggc gcc ggc agc gac ctg 384 Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu 115 120 125 tcc gcc ctg cgc acc cgc atc acc tcc gac ggc gac gaa gtc gtc gtc 432 Ser Ala Leu Arg Thr Arg Ile Thr Ser Asp Gly Asp Glu Val Val Val 130 135 140 gac ggc gtc aag gtg tgg gcg acc aac gcc gcg tac gcg gac ctg ctg 480 Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu 145 150 155 160 gtg gtc ttc ggc cgc acg gag cag ggc gcg ggc gcc gtc gtg gtg ccc 528 Val Val Phe Gly Arg Thr Glu Gln Gly Ala Gly Ala Val Val Val Pro 165 170 175 gcc tcg gcc ccc ggc gta cgc gtc gag cgc atc acc gac gcg cac ggc 576 Ala Ser Ala Pro Gly Val Arg Val Glu Arg Ile Thr Asp Ala His Gly 180 185 190 tgc cgc gcg gcc gga cac gcc gac atc cac ctg gac ggg gtc cgg ctg 624 Cys Arg Ala Ala Gly His Ala Asp Ile His Leu Asp Gly Val Arg Leu 195 200 205 ccg gca gac gcc ctg ctc cag ggc cac gac cgc acc ccc gcc ctg ctg 672 Pro Ala Asp Ala Leu Leu Gln Gly His Asp Arg Thr Pro Ala Leu Leu 210 215 220 gtc acc acc gcg ctg agc tac ggc cgg atg tcg gtg gcc tgg ggc tcc 720 Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser 225 230 235 240 ctg ggc atc ctg cgc gcc tgc ctg gcc gcc gcc gca cgt cac gcc ggc 768 Leu Gly Ile Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly 245 250 255 gga cgg gag cag ttc ggc acg cgg ctc tcg gac cac cag ctc gtc gcc 816 Gly Arg Glu Gln Phe Gly Thr Arg Leu Ser Asp His Gln Leu Val Ala 260 265 270 cgg cac ctc gcc gaa ctg ttc gtc gcc gaa cag cac gcc gcc cgg gcg 864 Arg His Leu Ala Glu Leu Phe Val Ala Glu Gln His Ala Ala Arg Ala 275 280 285 tgc gag cac gcc agc gcc cag tgg gac gag ggc agc ccc gac atg gtg 912 Cys Glu His Ala Ser Ala Gln Trp Asp Glu Gly Ser Pro Asp Met Val 290 295 300 gtc gcc gcc gtc ctg gcc aag cac gtc gcg gcc acc ggc gcc gca cgc 960 Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg 305 310 315 320 ggg gcc gaa cgg gcc gtg cag gtg ctg gcg tcg gcc ggg gcg cgg gag 1008 Gly Ala Glu Arg Ala Val Gln Val Leu Ala Ser Ala Gly Ala Arg Glu 325 330 335 gga cac gtc gtc gca cgg gcg cac cgc gac gcc aag ctc atg gag atc 1056 Gly His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu Ile 340 345 350 atc gag ggc agc aac gag atc tgc gaa ctg gtc ctg gcc cgg cac gtg 1104 Ile Glu Gly Ser Asn Glu Ile Cys Glu Leu Val Leu Ala Arg His Val 355 360 365 atg tcc gcg gcc ggg tga 1122 Met Ser Ala Ala Gly 370 <210> 81 <211> 373 <212> PRT <213> Streptomyces ambofaciens <400> 81 Val Ala Asp Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe 1 5 10 15 Thr Ala Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu 20 25 30 Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys 35 40 45 Ala Gln Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg 50 55 60 Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg 65 70 75 80 Ser Val Met Thr Ser Gln Gly Met Ala Ala Trp Thr Leu Arg Arg Leu 85 90 95 Ala Gly Ala Asp Gln Gln Ala Ser Leu Val Pro Arg Leu Thr Gly Gly 100 105 110 Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu 115 120 125 Ser Ala Leu Arg Thr Arg Ile Thr Ser Asp Gly Asp Glu Val Val Val 130 135 140 Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu 145 150 155 160 Val Val Phe Gly Arg Thr Glu Gln Gly Ala Gly Ala Val Val Val Pro 165 170 175 Ala Ser Ala Pro Gly Val Arg Val Glu Arg Ile Thr Asp Ala His Gly 180 185 190 Cys Arg Ala Ala Gly His Ala Asp Ile His Leu Asp Gly Val Arg Leu 195 200 205 Pro Ala Asp Ala Leu Leu Gln Gly His Asp Arg Thr Pro Ala Leu Leu 210 215 220 Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser 225 230 235 240 Leu Gly Ile Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly 245 250 255 Gly Arg Glu Gln Phe Gly Thr Arg Leu Ser Asp His Gln Leu Val Ala 260 265 270 Arg His Leu Ala Glu Leu Phe Val Ala Glu Gln His Ala Ala Arg Ala 275 280 285 Cys Glu His Ala Ser Ala Gln Trp Asp Glu Gly Ser Pro Asp Met Val 290 295 300 Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg 305 310 315 320 Gly Ala Glu Arg Ala Val Gln Val Leu Ala Ser Ala Gly Ala Arg Glu 325 330 335 Gly His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu Ile 340 345 350 Ile Glu Gly Ser Asn Glu Ile Cys Glu Leu Val Leu Ala Arg His Val 355 360 365 Met Ser Ala Ala Gly 370 <210> 82 <211> 312 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(312) <400> 82 atg acc acg acg tcc ggt cgg ccc gac ccc acc ggc acg acc ccc acc 48 Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr 1 5 10 15 gcc gac gag gtc gcc ggg gaa ctg ctc ggg ttc ctc gag gac cgc acc 96 Ala Asp Glu Val Ala Gly Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr 20 25 30 aag acc acc tgg gag cgc gac cag gac ctg ttc gcc gtc ggc ggg atg 144 Lys Thr Thr Trp Glu Arg Asp Gln Asp Leu Phe Ala Val Gly Gly Met 35 40 45 tcc tcg ctg ttc gcc atg cag ctc gtc gtg cac ctg gag aag acc tac 192 Ser Ser Leu Phe Ala Met Gln Leu Val Val His Leu Glu Lys Thr Tyr 50 55 60 ggc atc gtc atc agc ggc gcc gac ctg atg ctc gac aac ttc cgc acc 240 Gly Ile Val Ile Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr 65 70 75 80 gtc gac gcg atg gtc cgg ctg gtc gga cgg ctg gcc gcg ccc ggc gag 288 Val Asp Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu 85 90 95 gcg acc ggg cac gca ggt ggc tga 312 Ala Thr Gly His Ala Gly Gly 100 <210> 83 <211> 103 <212> PRT <213> Streptomyces ambofaciens <400> 83 Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr 1 5 10 15 Ala Asp Glu Val Ala Gly Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr 20 25 30 Lys Thr Thr Trp Glu Arg Asp Gln Asp Leu Phe Ala Val Gly Gly Met 35 40 45 Ser Ser Leu Phe Ala Met Gln Leu Val Val His Leu Glu Lys Thr Tyr 50 55 60 Gly Ile Val Ile Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr 65 70 75 80 Val Asp Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu 85 90 95 Ala Thr Gly His Ala Gly Gly 100 <210> 84 <211> 867 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(867) <400> 84 gtg ccc gat tcc aag gaa aat tct ccg ctc gtc gtg ctc ggc gcg ggc 48 Val Pro Asp Ser Lys Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly 1 5 10 15 gtc atg ggc acg gcc atc gcg gca ctc gcc gtc gga cac ggg cac ccg 96 Val Met Gly Thr Ala Ile Ala Ala Leu Ala Val Gly His Gly His Pro 20 25 30 gtc aca ctg gtc gac acc tcc gcc ggg gcg cgc gcg gcc gcc ccc gac 144 Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp 35 40 45 gcg gtc gcg ctg cat ctg cgg acg gcc cgg ctg atg ggc gcg ctg ccc 192 Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro 50 55 60 cac gac cgc ccg ccc ggg gag ctg acc gtc gag gag gcg ccg gcc gcc 240 His Asp Arg Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala 65 70 75 80 gtc gcc acc gcg acc gcc gtg atc gag gcc gtc acc gag gac ccc gag 288 Val Ala Thr Ala Thr Ala Val Ile Glu Ala Val Thr Glu Asp Pro Glu 85 90 95 cgg aag gcc gag gtg ctg gcg gac ctg gcg tcc gtg gcg cgc ccg ggg 336 Arg Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val Ala Arg Pro Gly 100 105 110 acg ctg ctc gtc agc aac acc tcg ggc gtc ccc atc gac gag ctg gcc 384 Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro Ile Asp Glu Leu Ala 115 120 125 gac gcc gtc ccc cgc ccc gag gac ctc gtc ggc gtg cac ttc atg aac 432 Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn 130 135 140 ccc gcg tac gtg atc ccc acg gtc gag gtg gtc ctc gga ccg cgc agc 480 Pro Ala Tyr Val Ile Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser 145 150 155 160 gga gag gcg gcc gcc cgg gcc acc cgg gac ctg ctg tcc ggc ctg ggc 528 Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly 165 170 175 cgc cgg ggc atc gtc gtc ggc gac ggc gcc ggc ttc gtg acc agc cgc 576 Arg Arg Gly Ile Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg 180 185 190 ctg ctg cac cgg atg ctg aac gac gcc atc gcg gtg gtg cac gag ggc 624 Leu Leu His Arg Met Leu Asn Asp Ala Ile Ala Val Val His Glu Gly 195 200 205 cgg gcc acc ccg gag acc gtg gac gcg ctg atg cgc gac tgc atc ggc 672 Arg Ala Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys Ile Gly 210 215 220 cac cgc acc gga ccc ctg gcc acg gcc gac ctg atc gga ctg gac aac 720 His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu Ile Gly Leu Asp Asn 225 230 235 240 ctg gcc gac tcg ctg cgg gtg atg cac gaa cgg acc ggc gat ccg gcg 768 Leu Ala Asp Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala 245 250 255 ctc cgc ccg agc gag ctg ctg ctg gac aag gtc cgc cag ggc ctg ctc 816 Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gln Gly Leu Leu 260 265 270 ggc cgc aag agc ggc cgg gga ttc tac gac tac cag gag gcc acg cga 864 Gly Arg Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Gln Glu Ala Thr Arg 275 280 285 tga 867 <210> 85 <211> 288 <212> PRT <213> Streptomyces ambofaciens <400> 85 Val Pro Asp Ser Lys Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly 1 5 10 15 Val Met Gly Thr Ala Ile Ala Ala Leu Ala Val Gly His Gly His Pro 20 25 30 Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp 35 40 45 Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro 50 55 60 His Asp Arg Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala 65 70 75 80 Val Ala Thr Ala Thr Ala Val Ile Glu Ala Val Thr Glu Asp Pro Glu 85 90 95 Arg Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val Ala Arg Pro Gly 100 105 110 Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro Ile Asp Glu Leu Ala 115 120 125 Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn 130 135 140 Pro Ala Tyr Val Ile Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser 145 150 155 160 Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly 165 170 175 Arg Arg Gly Ile Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg 180 185 190 Leu Leu His Arg Met Leu Asn Asp Ala Ile Ala Val Val His Glu Gly 195 200 205 Arg Ala Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys Ile Gly 210 215 220 His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu Ile Gly Leu Asp Asn 225 230 235 240 Leu Ala Asp Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala 245 250 255 Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gln Gly Leu Leu 260 265 270 Gly Arg Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Gln Glu Ala Thr Arg 275 280 285 <210> 86 <211> 1040 <212> DNA <213> Streptomyces fradiae <400> 86 ggcaggagcc acccgtgaca gggctgccgc ggcccgccgt ccgggtgccg ttccacgatc 60 tgcgggacgt gcacgcggcc acgggggtgg agtcggagat cggcggcgcg ctgctgcgcg 120 tcgccgcgcg cgggcgctat ctgctgggtg ccgaactcgc cgcgttcgag gagcggttcg 180 ccgagtactg cggcaacgcc cactgtgtcg ccgtgggcag cgggctcgac gacgctcgtc 240 tggcgctgtg ggcgctcggg gtgggcgagg gcgacgaggt gatcgtgccc tcgcacacgt 300 tcatcgcgtc ctggctcgcg gtgtcggcga cgggtgccac cccggtgccg gtcgagcccg 360 gtgatcccgg cgagccgggg cccggggcgt tcctgctcga cccggaccgg ctggaggccg 420 cgctgacccc gcggaccagg gccgtgatgc ccgtgcatct ctacgggcac ccggtggatc 480 tggacccggt cggggcgttc gcggagccgc acgggctggc cgtcgtggag gacgcggcgc 540 aggccacggc ccgttaccgc gggaggcgga tcggcagcgg ccaccgcacg gcgttcagct 600 tctacccggg gaagaacctg ggcgcgctcg gcgacggcgg tgccgtggtc acctcggacc 660 cggaactcgc ggaccggctg cggctgttgc gcaactacgg cgcccgggag aagtaccggc 720 acgaggagcg gggcaccaac tcccgcctgg acgagctgca ggcggccgtg ctgtcggtca 780 agctgccgta cctggacgcc tggaacaccc gccgccggga gatcgccgcc cgctacggcg 840 aggcgctggc cggtctgccg ggcgtcaccg tgccggaggg ccgcgtggcg gagccggtct 900 ggcatcagta cgtgctgcgc agcccgtacc gcgaccggtt gcggcggcgg ctggccgagg 960 cgggggtgga gaccctggtc cactatccgg tggccgtgca cgcgtcgggc gcgtacgcgg 1020 gcgcggggcc gtgtcccgcc 1040 <210> 87 <211> 388 <212> PRT <213> Streptomyces fradiae <400> 87 Met Thr Gly Leu Pro Arg Pro Ala Val Arg Val Pro Phe His Asp Leu 1 5 10 15 Arg Asp Val His Ala Ala Thr Gly Val Glu Ser Glu Ile Gly Gly Ala 20 25 30 Leu Leu Arg Val Ala Ala Arg Gly Arg Tyr Leu Leu Gly Ala Glu Leu 35 40 45 Ala Ala Phe Glu Glu Arg Phe Ala Glu Tyr Cys Gly Asn Ala His Cys 50 55 60 Val Ala Val Gly Ser Gly Leu Asp Asp Ala Arg Leu Ala Leu Trp Ala 65 70 75 80 Leu Gly Val Gly Glu Gly Asp Glu Val Ile Val Pro Ser His Thr Phe 85 90 95 Ile Ala Ser Trp Leu Ala Val Ser Ala Thr Gly Ala Thr Pro Val Pro 100 105 110 Val Glu Pro Gly Asp Pro Gly Glu Pro Gly Pro Gly Ala Phe Leu Leu 115 120 125 Asp Pro Asp Arg Leu Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Val 130 135 140 Met Pro Val His Leu Tyr Gly His Pro Val Asp Leu Asp Pro Val Gly 145 150 155 160 Ala Phe Ala Glu Pro His Gly Leu Ala Val Val Glu Asp Ala Ala Gln 165 170 175 Ala Thr Ala Arg Tyr Arg Gly Arg Arg Ile Gly Ser Gly His Arg Thr 180 185 190 Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Leu Gly Asp Gly 195 200 205 Gly Ala Val Val Thr Ser Asp Pro Glu Leu Ala Asp Arg Leu Arg Leu 210 215 220 Leu Arg Asn Tyr Gly Ala Arg Glu Lys Tyr Arg His Glu Glu Arg Gly 225 230 235 240 Thr Asn Ser Arg Leu Asp Glu Leu Gln Ala Ala Val Leu Ser Val Lys 245 250 255 Leu Pro Tyr Leu Asp Ala Trp Asn Thr Arg Arg Arg Glu Ile Ala Ala 260 265 270 Arg Tyr Gly Glu Ala Leu Ala Gly Leu Pro Gly Val Thr Val Pro Glu 275 280 285 Gly Arg Val Ala Glu Pro Val Trp His Gln Tyr Val Leu Arg Ser Pro 290 295 300 Tyr Arg Asp Arg Leu Arg Arg Arg Leu Ala Glu Ala Gly Val Glu Thr 305 310 315 320 Leu Val His Tyr Pro Val Ala Val His Ala Ser Gly Ala Tyr Ala Gly 325 330 335 Ala Gly Pro Cys Pro Ala Gly Gly Leu Pro Arg Ala Glu Arg Leu Ala 340 345 350 Gly Glu Val Leu Ser Leu Pro Ile Gly Pro His Leu Pro Asp Glu Ala 355 360 365 Val Glu Val Val Ile Ala Ala Val Gln Ser Ala Ala Leu Asp Ser Trp 370 375 380 Glu Glu Gly Pro 385 <210> 88 <211> 271 <212> PRT <213> Streptomyces mycarofaciens <400> 88 Met Ser Pro Ile Ser Ala Ser Ala Pro Ala Ala Ser Arg Ser Thr Ala 1 5 10 15 Arg Arg Glu Leu Gly Gln Asn Phe Phe Arg Ser Ala Ala Ala Ala Cys 20 25 30 Arg Phe Ser Asp Gln Leu Asp Ala Phe Cys Ala Asp Leu Pro Gly Ser 35 40 45 Leu Ala Asp Val Leu Thr Val Glu Ile Gly Ala Gly Ser Gly Arg Val 50 55 60 Thr Lys Ala Leu Ala Ser Ala Gly Arg Ser Leu Leu Ala Val Glu Ile 65 70 75 80 Asp Ala Tyr Trp Ala Arg Arg Leu Thr Ala Glu Ser Leu Pro Asp Val 85 90 95 Thr Val Val Asn Glu Asp Phe Leu Asn Leu Gln Leu Pro Arg Gln Pro 100 105 110 Ile Arg Leu Ile Gly Asn Leu Pro Phe Val Ser Gly Thr Lys Ile Leu 115 120 125 Arg Arg Cys Leu Glu Leu Gly Pro Asn Arg Met Cys Gln Ala Val Phe 130 135 140 Leu Leu Gln Arg Glu Tyr Val Gly Lys Arg Thr Gly Ala Trp Gly Gly 145 150 155 160 Asn Leu Phe Asn Ala Gln Trp Glu Pro Trp Tyr Thr Phe Glu Gly Gly 165 170 175 Leu Ala Phe Ser Arg Asn Glu Phe Ser Pro Val Pro Arg Ala Asp Thr 180 185 190 Gln Thr Leu Val Val Met Pro Arg Arg Arg Pro Ser Val Pro Trp Arg 195 200 205 Glu Arg Thr Asp Tyr Gln Arg Phe Thr Gln Gln Ile Phe Asp Thr Gly 210 215 220 Gln Met Thr Ile Gly Glu Ala Ala Arg Lys Val Leu Arg Arg Gly His 225 230 235 240 Ala Gln Phe Val Arg Ser Ala Gly Val Arg Pro Ala Asp Arg Val Lys 245 250 255 Asp Leu Thr Val Arg Asp Trp Ala Ala Leu Phe Arg Ala Asn Pro 260 265 270 <210> 89 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide SRMR1 <400> 89 ctgccagtcc tctcccagca gtacg 25 <210> 90 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide SRMR2 <400> 90 tgaagctgga cgtctcctac gtcgg 25 <210> 91 <211> 2755 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Cassette excisable <400> 91 gatatctacc tcttcgtccc gaagcaactt gggtgggcgc tcgaccttgg gccagtgtgc 60 ttctcacctg cggcgccagt ccatgggtgc tcgcggttgt ccgccgctgt gcgctggcgt 120 tgtcacgcag ttagacactc accttcccac gggcggtgtc gtagggctcg gctaagttgc 180 ccgcatgact gacagggatc cctcgagaag ctttatgctt gtaaaccgtt ttgtgaaaaa 240 atttttaaaa taaaaaaggg gacctctagg gtccccaatt aattagtaat ataatctatt 300 aaaggtcatt caaaaggtca tccaccggat caattcccct gctcgcgcag gctgggtgcc 360 aagctctcgg gtaacatcaa ggcccgatcc ttggagccct tgccctcccg cacgatgatc 420 gtgccgtgat cgaaatccag atccttgacc cgcagttgca aaccctcact gatccgtaat 480 gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 540 ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 600 gccaagctgc ggtggcgtac accgtcgcct cggtcggccc gtagagattg gcgatcccga 660 ccgcagcacc accgagaacg tccccgacgt ggccgaccag cccgtcatcg tcaacgcctg 720 accgcggtgc ggacaggccg tgtcgcgacc ggccgtgcgg aattaagccg gcccgtaccc 780 tgtgaataga ggtccgctgt gacacaagaa tccctgttac ttctcgaccg tattgattcg 840 gatgattcct acgcgagcct gcggaacgac caggaattct gggagccgct ggcccgccga 900 gccctggagg agctcgggct gccggtgccg ccggtgctgc gggtgcccgg cgagagcacc 960 aaccccgtac tggtcggcga gcccgacccg gtgatcaagc tgttcggcga gcactggtgc 1020 ggtccggaga gcctcgcgtc ggagtcggag gcgtacgcgg tcctggcgga cgccccggtg 1080 ccggtgcccc gcctcctcgg ccgcggcgag ctgcggcccg gcaccggagc ctggccgtgg 1140 ccctacctgg tgatgagccg gatgaccggc accacctggc ggtccgcgat ggacggcacg 1200 accgaccgga acgcgctgct cgccctggcc cgcgaactcg gccgggtgct cggccggctg 1260 cacagggtgc cgctgaccgg gaacaccgtg ctcacccccc attccgaggt cttcccggaa 1320 ctgctgcggg aacgccgcgc ggcgaccgtc gaggaccacc gcgggtgggg ctacctctcg 1380 ccccggctgc tggaccgcct ggaggactgg ctgccggacg tggacacgct gctggccggc 1440 cgcgaacccc ggttcgtcca cggcgacctg cacgggacca acatcttcgt ggacctggcc 1500 gcgaccgagg tcaccgggat cgtcgacttc accgacgtct atgcgggaga ctcccgctac 1560 agcctggtgc aactgcatct caacgccttc cggggcgacc gcgagatcct ggccgcgctg 1620 ctcgacgggg cgcagtggaa gcggaccgag gacttcgccc gcgaactgct cgccttcacc 1680 ttcctgcacg acttcgaggt gttcgaggag accccgctgg atctctccgg cttcaccgat 1740 ccggaggaac tggcgcagtt cctctggggg ccgccggaca ccgcccccgg cgcctgacgc 1800 cccgggccgc ccggcgccgc ccccggcccc cggcggccgc ccggagcccc gcccgcgctc 1860 gggagccccg ggcccgcgcc gaagcccgct gctgcgagcc cggagcgggc cggccgacgg 1920 cggtgcgggc ccggcggcgg acgctcagca gcggcgggcg tgaaaggccc tggcatcctc 1980 gatcatctcc tccagggtgg tcggccgagc ttccatccca gctcggcaag gatcgatccg 2040 cgcagatcag ttggaagaat ttgtccacta cgtgaaaggc gagatcacca aggtagtcgg 2100 caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc ttaactcaag 2160 cgttagatgc actaagcaca taattgctca cagccaaact atcaggtcaa gtctgctttt 2220 attattttta agcgtgcata ataagcccta cacaaattgg gagatatatc atgaaaggct 2280 ggctttttct tgttatcgca atagttggcg aagtaatcgc aacatccgca ttaaaatcta 2340 gcgagggctt tactaagctg atccggtgga tgaccttttg aatgaccttt aatagattat 2400 attactaatt aattggggac cctagaggtc ccctttttta ttttaaaaat tttttcacaa 2460 aacggtttac aagcataaag cttgttaaca gatctcccgg ctcgtcggac actccggtac 2520 ggccgtgact gaggaggtct accggaagca gatccggccc gtcatccaga ccggcgctgt 2580 ggtcatggac ggcatcttca agcggggtcc ggcgcgatag tcacgcagat agacacgcac 2640 agaaaacagg tgaggcagac cgtaacgtta cggtctgcct cacctggtgt ttctctgtcg 2700 gggtggcggg atttgaaccc acgacctctt cgtcccgaac gaagcgcgcg atatc 2755 <210> 92 <211> 2208 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Cassette excisable <400> 92 gatatcgcgc gcgcttcgtt cgggacgaag aggtcgtggg ttcaaatccc gccaccccga 60 cagagaaaca ccaggtgagg cagaccgtaa cgttacggtc tgcctcacct gttttctgtg 120 cgtgtctatc tgcgtgacta tcgcgccgga ccccgcttga agatgccgtc catgaccaca 180 gcgccggtct ggatgacggg ccggatctgc ttccggtaga cctcctcagt cacggccgta 240 ccggagtgtc cgacgagccg ggagatctgt taacaagctt tatgcttgta aaccgttttg 300 tgaaaaaatt tttaaaataa aaaaggggac ctctagggtc cccaattaat tagtaatata 360 atctattaaa ggtcattcaa aaggtcatcc accggatcaa ttcccctgct cgcgcaggct 420 gggtgccaag ctctcgggta acatcaaggc ccgatccttg gagcccttgc cctcccgcac 480 gatgatcgtg ccgtgatcga aatccagatc cttgacccgc agttgcaaac cctcactgat 540 ccggctcacg gtaactgatg ccgtatttgc agtaccagcg tacggcccac agaatgatgt 600 cacgctgaaa atgccggcct ttgaatgggt tcatgtgcag ctccatcagc aaaaggggat 660 gataagttta tcaccaccga ctatttgcaa cagtgccgtt gatcgtgcta tgatcgactg 720 atgtcatcag cggtggagtg caatgtcgtg caatacgaat ggcgaaaagc cgagctcatc 780 ggtcagcttc tcaaccttgg ggttaccccc ggcggtgtgc tgctggtcca cagctccttc 840 cgtagcgtcc ggcccctcga agatgggcca cttggactga tcgaggccct gcgtgctgcg 900 ctgggtccgg gagggacgct cgtcatgccc tcgtggtcag gtctggacga cgagccgttc 960 gatcctgcca cgtcgcccgt tacaccggac cttggagttg tctctgacac attctggcgc 1020 ctgccaaatg taaagcgcag cgcccatcca tttgcctttg cggcagcggg gccacaggca 1080 gagcagatca tctctgatcc attgcccctg ccacctcact cgcctgcaag cccggtcgcc 1140 cgtgtccatg aactcgatgg gcaggtactt ctcctcggcg tgggacacga tgccaacacg 1200 acgctgcatc ttgccgagtt gatggcaaag gttccctatg gggtgccgag acactgcacc 1260 attcttcagg atggcaagtt ggtacgcgtc gattatctcg agaatgacca ctgctgtgag 1320 cgctttgcct tggcggacag gtggctcaag gagaagagcc ttcagaagga aggtccagtc 1380 ggtcatgcct ttgctcggtt gatccgctcc cgcgacattg tggcgacagc cctgggtcaa 1440 ctgggccgag atccgttgat cttcctgcat ccgccagagg gcgggatgcg aagaatgcga 1500 tgccgctcgc cagtcgattg gctgagctca tgagcggaga acgagatgac gttggagggg 1560 caaggtcgcg ctgattgctg gggcaacacg tgaaaggcga gatcaccaag gtagtcggca 1620 aataatgtct aacaattcgt tcaagccgac gccgcttcgc ggcgcggctt aactcaagcg 1680 ttagatgcac taagcacata attgctcaca gccaaactat caggtcaagt ctgcttttat 1740 tatttttaag cgtgcataat aagccctaca caaattggga gatatatcat gaaaggctgg 1800 ctttttcttg ttatcgcaat agttggcgaa gtaatcgcaa catccgcatt aaaatctagc 1860 gagggcttta ctaagctgat ccggtggatg accttttgaa tgacctttaa tagattatat 1920 tactaattaa ttggggaccc tagaggtccc cttttttatt ttaaaaattt tttcacaaaa 1980 cggtttacaa gcataaagct tctcgaggga tccctgtcag tcatgcgggc aacttagccg 2040 agccctacga caccgcccgt gggaaggtga gtgtctaact gcgtgacaac gccagcgcac 2100 agcggcggac aaccgcgagc acccatggac tggcgccgca ggtgagaagc acactggccc 2160 aaggtcgagc gcccacccaa gttgcttcgg gacgaagagg cagatatc 2208 <210> 93 <211> 60 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide ORF2A <400> 93 cccgcgcggc agcctctccg tgatcgagtc cggcgtgacc atcgcgcgcg cttcgttcgg 60 <210> 94 <211> 60 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide ORF2B <400> 94 gctccgtgcg tcatgcagga aggtgtcgta gtcgcggtag atctgcctct tcgtcccgaa 60 <210> 95 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Cicatrice att3 <400> 95 atcgcgcgcg cttcgttcgg gacgaagagg tagat 35 <210> 96 <211> 59 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR8 <400> 96 cgggatgatc gcttgtccgg cggccggatg cctagcctca tcgcgcgcgc ttcgttcgg 59 <210> 97 <211> 60 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR9 <400> 97 cccgatccag aacgtctggt cggtgatcag gtcgctgttc atctgcctct tcgtcccgaa 60 <210> 98 <211> 60 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR3 <400> 98 accggggcgg tcctcccctc cggggcgtca cggccgcgga atctgcctct tcgtcccgaa 60 <210> 99 <211> 60 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR4 <400> 99 cacgcagcga gccgacgcac tgatggacga cacgatggcc atcgcgcgcg cttcgttcgg 60 <210> 100 <211> 60 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR5 <400> 100 gggcgtgaag cgggcgagtg tggatgtcat gcgagtactc atcgcgcgcg cttcgttcgg 60 <210> 101 <211> 60 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR6 <400> 101 cgggaaacgg cgtcgcactc ctcgggggcc gcgtcagccc atctgcctct tcgtcccgaa 60 <210> 102 <211> 26 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide C9583 <400> 102 ctgcaggtgc tccagcgcgt cgatct 26 <210> 103 <211> 26 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide C9584 <400> 103 ctgcagacgg aggcggacct gcggct 26 <210> 104 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Cicatrice att1 <400> 104 atcgcgcgct tcgttcggga cgaagaggta gat 33 <210> 105 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Cicatrice att2 <400> 105 atcggcgcgc ttcgttcggg acgaagaggt agat 34 <210> 106 <211> 10325 <212> DNA <213> Streptomyces ambofaciens <400> 106 ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60 ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc 120 aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180 gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240 ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 300 gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360 cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 420 gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480 gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540 gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600 ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc 660 cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 720 cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780 tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg 840 gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 900 cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960 gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 1020 tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 1080 gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140 gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200 tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 1260 gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320 gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380 tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440 tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500 gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560 tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620 ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680 ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740 tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800 tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860 acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920 tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980 acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2040 tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100 cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160 tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220 cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280 accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340 acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400 acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460 tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520 acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580 tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2640 cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700 actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 2760 cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2820 cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2880 acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2940 gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000 gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3060 tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120 caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180 gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240 gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300 atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360 gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420 gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480 tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540 ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600 ccgtggacgg agcgcgtccn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc cgccacaccc 4080 cccagcagcg tcagcgtccg cctcgggacc acacccggca ggacgacggg gtgcggggcg 4140 acgaggctga gggagccccg caactccacg gggcggctca accgcttgag ctgctccatc 4200 aactgctggg ccgaggtggt ccccgtgtgg tggtccaccg ggccgcggcc gctcgccgag 4260 gccagccgga ggttcccgcc cacccgcacc atgaagggca ggcccgcgag accgagccct 4320 cgcaccagtc gtggcagcac ggccgcgcgt gcgtccatca ccacggggcg ggccaaggag 4380 cggttggcct gagcggcttc ggccaccagg cggacgatgt tctcctcctc accgggtgcg 4440 ccggggtgcc ggggtgtgcc ctccccgctc cggccgccgc ccagcgtcag gcgccagctg 4500 accggggcgg ccgtcgtgcc cgaggccagc cacagcccgt gactctgctg gcagctcacc 4560 acccggccca ggtcggagac gaagcgccgg ctcaccccga cggagcgcac ccccgccttg 4620 gagaccacca tcggccagat cacccaggcg tcgggggtca gcctgtcgtc cacgtagcgg 4680 gccagcgcgg cccgcacctc gccccagtcc caggtcgacc cggcgacgaa gtggtgcagg 4740 ctctgttccg ccgcgccctc tccgacgaag gcggcgaggt tccgggcggt cttgcgtccc 4800 tgtgccgtga gcagcccgcg tatgtactgc tcacctcttc tgcgctggtc cgcccggcgg 4860 agcgaaccga gtaactccgc acatgcgtcg gagacgagcg agtcgaagtc gtgccgcgcg 4920 gcgggaccca cggggggcgc cgcgccggcg ggtcgaagcg tgcgtaaggt cataggagtc 4980 ctcgtggggg cctcgtcatc actgcgagtg gactgcgacc agcatcgcca attcacccgt 5040 tgctccccag gtacaccggg cacactcgtt ccgcttcgct cccccggcgg cacggcccgc 5100 gtgtggagca ctccccgctc tccggacggt gggggggaag cccaccgcac gcgcgccggt 5160 agcggtgccg gggccccaca acccctcacc gacggggtcc gttcgaccac atgccgtgat 5220 gatgccttcg ccgcacggcc tccttgaatg acggaccgtc agaaagacgt cactccgcgc 5280 gcgcccgctc ccgccccgac cccgcccggc cgccgtcccg cccccgcgac cctgtgggcc 5340 gacgccctct tgacggaccc ggaatcccgg gccgcgggac gggacggcga ggaactcgat 5400 gccgcaaagg ttccgcgtcc tcaccggcac ctccgagatc cagcgcaacg gcatcgccaa 5460 gctcctggct ttccaccact gagccgcacc ccctggcgag cagatccggg acaagacgcc 5520 accttcgcga cagtgtttag gaaaagttaa gtaaagaatt ccgcgagcgg attgccaggg 5580 agaacaaccc attgacgcgc accggtgcag cggccacatt gacggcacct gtcaagttca 5640 cccccaggag cttggaatcc catgcaggca attcggcatc acgtcatgct cgtcatggcc 5700 ttcgtgaccg tcgccacgac tttccttctc tggccgtcga cgcaatccgc gcaagcgttt 5760 cccccgaccc cgaagcagac ggtactgaac cacctccgcg ccatttccgg gaatcacatc 5820 gtctccggac agcacaacaa ggagcccgcc tccgccccgg gccagtacac ccagcaggtc 5880 aaggacgtca ccgggcagta ccccggcctg tggggcggtg acctgatgtt cgccgcggcg 5940 gacgtggccg gccgccagcg cgtcgtcgac caggccagga ccgagtgggc gaacggatcg 6000 ctggtctcgc tcacctggca cgtctgcccg ccgaccggcg gcagcacctg tgcgttcgag 6060 ggcggcgtca agtccacgct gacgaacgcg cagttctcgc aggtcctcac ggagggcagt 6120 gccctgaaca gcgcatggaa gcggcgcctg gacgaggtcg tcccgtacct gcagcagctg 6180 gagaacgcgg gcgtccccgt cctcttccgg ccgctgcacg agatgaacga atcctggaac 6240 tggtggggaa accggcccgg agcgaacggc agcgcacgcc tctaccagat cacccgcgat 6300 cacctcgccg ggacgaaagg gctggacaat ctgatctggg tctggaacgt ccaggacaat 6360 ccggcgggaa actggaacag ctactatccg ggagatcagt acgtggacgt cgtttcgctg 6420 gacgtctggt acaagagcca cccgagttcc gccgactacc agcagatgcg gagcatcgcg 6480 ggaacaaaac ccatggccct cgcggagctg ggcaaaatgc cgaccgccgc gctgctggac 6540 agccagacgc ggtggacatg gttcatgatg tggtccgagc atctgcgcgg gaacaattcc 6600 aacgccgaaa tacagacggc gtatttccac ccccgtgtac tgaaccaggg ggaggtcgca 6660 ctgccctgac gctcggcgct gcccggctct ctcacgcgcg ttctgacagg acgtcgcgga 6720 gagtgcgggg caagcggccg gtgagctggg cgcagtcgtc gcggacccga tcccagcgct 6780 gttcgcgtac cgaggcgaac agggaggaga aggcgtagag ccaccaggga tccaggccgg 6840 tcgccgctgt ttcggcagag tacgtgtcgg ccgggatgtc cacgtaggcg accggtgtcc 6900 gccacacctc cgccgccgtg gaggcgatgc ctgccaggtc cgtcgactcg ggtcccgtga 6960 tgtcgtggtg acggccggtc ggcccgccca ccgcgagggc ggcgagggcg cgggccacgt 7020 cgtcgcgcgc caccagggac acccggccat cggctgccgg cagcctcagc agcccggtcg 7080 agcgcgcctg ggtgagccag cctaggaaga actcgatgta cagcgaggcc ctggcgaacg 7140 agcacggcac gccggaggcg agcagcagat cctcggtgag ccggttgacg acggcgtagc 7200 agaacgggga ggccgagtcg gcgtcgacgc tgctcagtgc cgcgacatgg ccgacgcgct 7260 cggccaccac ggcggcgacg acgttgcggt ggtgcagcag cacccgtgcg tcgggcccgt 7320 cgctggagac gaggaccaga gtgtccacgc ccttcagcgc cgcacgcaga gcgggcgggt 7380 cggcgtagtc ggcgacggcg cactccaccc ccggcggtag tgcctcggca ggcagcttcc 7440 gcctggtcat cgccacgacg tccacgtcgg cccggtccgc gagcagctgc accacccgcc 7500 tgcccagact gcccgccgcc cctgtcaccg cgatacgcat cgtcgccccc gtcgccttgt 7560 cgtcggtcgt accaccgtag ggggccaacc gcgaccaggg cttggaacga gccggcccgc 7620 cagggcacag acgcgcgatc ggtccggttt tcccgtgctc ttttggaccg ggacgccgga 7680 ccgcttcctt tctacggtgg agccgttccc gcccgagccc gcacgtcatc gacgtgcggg 7740 gaagacagag gtgataccga tgctccgacg ccgtctcgga gggccgtcag gccccctcgt 7800 cagtgccctg tgcctgggcg cgatgccctt cggcaccacc gtcgacgaga agacgtcctt 7860 cgccatcctc gaccggttcg tcgaggccgg cggcagtctc gtcgacaccg ccgacaacta 7920 cgcgttctgg gctcccggcg ggaccgggga cgagagcgag aacaccgtcg ggcgctggct 7980 ggcgagccgc cgccgccgcg acgaggtggt gatctccacc aaggtgggtg cccgccccac 8040 cgtccccggc agcggcctgg agaccgccga agggctgtcg gctcccgtca tacggaaggc 8100 cgcggaggac agcctgcgac gcctgggcac cgatcgcatc gatctgtact ggacccacat 8160 cgaggaccgg accgtccctc tggaggagac gctcggagct ctcgacgagc tggtcggcgg 8220 cggcaaggtg gcggtgctgg gctgctccaa ccacgcgggc tggcgcatcg aacgggcccg 8280 cgcgctcgcc cggaccaacg gctggacggc gtacacctgc gtccagcagc gctactccta 8340 ccttcagccg cgcttcgacg tcggactgcc ggagagcgga cacgtccacg cgacctccga 8400 actcctcgac cacgtacgca gcgagcccga cctgacgctg ctggcctact cgtccctgct 8460 ctcgggcgcg tacacccggc cggacaagac cctgtccgcc gcctacgacc acccgggcac 8520 cgggcagcgg ctgaccgtgc tgcgggaggt ggccgccgag ctcggtgcca ccgccaacca 8580 ggtggtgctg tcctggttgc tcggaggtga tccgccggtg atcccgatcg tgggggtgag 8640 ttccgtcgag cagctggacg aggtgctggc cgccgtcgag ctggagctgc cccgggagac 8700 gagggcacgg ctggacctcg ccgggcgggg ctgacgggcc acacaccgcc cctcgcccgg 8760 gacgggctga ccggccgcac accgtccctc agccgggacg ggctgacggc cacacacccg 8820 cccctcagcc cggctgggct gggctgacgg ccacacaccc gctcctcagc ccggctgggc 8880 tgggctgacg gccacacacc cgcccctcag cccggctggg ctgggctgac ggccacacgc 8940 cgtccctcgc ccgggtcggg ctgaccagcc acacgccgtc cctcagtcgg cccgctcccc 9000 ggcccgcccg gcgtcgacgt gccgccggtc gtggcgccgg gccgcgtcga tggcctgtgc 9060 caggcgccgc acggctccgg gcacggcgtg gtccgccaga ttgccgtagc cgaggaccag 9120 cgcggggccg gcggcggcca cggcccgcgc cccgccggag tcgccggccc gggccgtcgg 9180 gtggtgctcg gcccgcgcca tccggtaggc gtcgagatcc gccagcctca cgtcacgccg 9240 cgccgcctcc ctgacgacgg tgggcgccga gcagtccgtc agggacagca gcaggtggaa 9300 gccggccgcc gcaccggaca cctggaaccc cggcagcgac gccgcgagtt ctcccatgag 9360 gtgatcgcgg cgccgtttgt agcgcagccg tgccgcccgc aggtaccggt cgtaggaccc 9420 gcgggccagg aaccgggcga acgcctcctg gtcgatgacg ggcggtggta cgcccccgac 9480 gtgctccgcg cccagggcct cggtccagcg cggcggggtc accgcccagc cgatccgcag 9540 ggccggcgag agcgtcttgc tgaccgaccc cagcagcgcg acgtgctccg gtgccatgcc 9600 ctgcagggcg cccacggggt ggcggtcgta tcggaactcg gcgtcgtagt cgtcctccag 9660 caccaggccg tcgacctcgc gggcccaggc gaccagctcg ccgcgacggg ccggggcgag 9720 gaccacaccg gtcgggaact ggtgggcggg agcgacgatc accgaccgga cctgaggcgc 9780 gcgccgcagc aggtcgaccc gcaggccgtc gccgtccacg ggaaccggga cgggcaccag 9840 cccctccgcc ccgaccgtgg cgctcagccg cgaccagcca gggtcctcca gggccatgtg 9900 ggtgtggccc tcggtccgca ggacccggca cagcctgcgc accgcgtcca gcgtgcccgc 9960 gcagacgacg agctgccggg cttccagcga cgcgccgcgt ccccgcacga ggtaggccgc 10020 gagccgctgc cggagccggg cgagaccggc cggatcgggg tagccgagct cgccccaggt 10080 cagtgcgccg gtggcctccc gcaccgcgtc cgcccaccgt ccgcggggaa aggcccgcag 10140 gtcgggtatg ccgggcagca tgtcgaactc cggctcccac cgcgtaccga cgtccgcctc 10200 gggcgtcacc ggagcgggga cggcctgcgc cctgacccgg gtggccgagc cgctgcgcgc 10260 ctccaggtac ccctccgcga cgagctgcgc gtagggggga tcctctagag tcgacctgca 10320 ggcct 10325 <210> 107 <211> 1218 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1218) <400> 107 atg gct cat atc gca ttc ttc atc ctt ccg gtt gcc ggg cat gtg aat 48 Met Ala His Ile Ala Phe Phe Ile Leu Pro Val Ala Gly His Val Asn 1 5 10 15 ccg acc ctg gga gtc gcc gag gaa ctg gtc gcg cgc ggc cac cgg gtg 96 Pro Thr Leu Gly Val Ala Glu Glu Leu Val Ala Arg Gly His Arg Val 20 25 30 acg ttc gcg ctg tcc gag gac ctc gcc gag cgg gcc cgg ctg atc ggc 144 Thr Phe Ala Leu Ser Glu Asp Leu Ala Glu Arg Ala Arg Leu Ile Gly 35 40 45 gcc gag gtg gtc acc tat ccg gtg gac agg caa cgg ttc ctg gac cag 192 Ala Glu Val Val Thr Tyr Pro Val Asp Arg Gln Arg Phe Leu Asp Gln 50 55 60 atg gtg ccg cgg cag gac gcg gac gag tac acg gac gag gac gag ttc 240 Met Val Pro Arg Gln Asp Ala Asp Glu Tyr Thr Asp Glu Asp Glu Phe 65 70 75 80 gtc cgg gtc ctg gag tgg ctg ctg gac atg acg gtg cag acc atg gaa 288 Val Arg Val Leu Glu Trp Leu Leu Asp Met Thr Val Gln Thr Met Glu 85 90 95 ccg ctg gag agg cac ttc gcc ggg gac cgg ccc gac gtc gtc gtc aac 336 Pro Leu Glu Arg His Phe Ala Gly Asp Arg Pro Asp Val Val Val Asn 100 105 110 gat ccg tcg tcg ctg tgg acg gga cgg ctg ctg gcg gac cgg tgg ggc 384 Asp Pro Ser Ser Leu Trp Thr Gly Arg Leu Leu Ala Asp Arg Trp Gly 115 120 125 atc ccg gtc atc cgc agc act ccg acc tat gcc gcc aac gaa cac tgg 432 Ile Pro Val Ile Arg Ser Thr Pro Thr Tyr Ala Ala Asn Glu His Trp 130 135 140 tcg ctg cat ccg ccg gtc gac tcg gcc gag ccg ccg gac gac ccc gag 480 Ser Leu His Pro Pro Val Asp Ser Ala Glu Pro Pro Asp Asp Pro Glu 145 150 155 160 ctg cac aag ctg ctc gcg cgg atc gag cgg ctg ctg gag gag cag ggc 528 Leu His Lys Leu Leu Ala Arg Ile Glu Arg Leu Leu Glu Glu Gln Gly 165 170 175 gtc gag cac gac ctg gcc ggc ttc acc ggg gtc ctg cac ggc ggt ccg 576 Val Glu His Asp Leu Ala Gly Phe Thr Gly Val Leu His Gly Gly Pro 180 185 190 gcc ctg ctg tac atg ccc cgc tcg ttc cag tac gcg ggc gag acc ttc 624 Ala Leu Leu Tyr Met Pro Arg Ser Phe Gln Tyr Ala Gly Glu Thr Phe 195 200 205 gac gca cag cac cac ttc gtc ggc ccc tgc ccg ccc cgc acc gcg ttc 672 Asp Ala Gln His His Phe Val Gly Pro Cys Pro Pro Arg Thr Ala Phe 210 215 220 cac ggc gag tgg agg ccg ggg gac gac gac ggc cgg ccc ctg gtg ctg 720 His Gly Glu Trp Arg Pro Gly Asp Asp Asp Gly Arg Pro Leu Val Leu 225 230 235 240 gtg agt ctc gga acc ctg tac aac gac cgg ccg gac ttc ttc cgc acc 768 Val Ser Leu Gly Thr Leu Tyr Asn Asp Arg Pro Asp Phe Phe Arg Thr 245 250 255 tgc ctg gag gcg ttc ggc gac gag ccc tgg aac gtg ctt ctg gtg ctg 816 Cys Leu Glu Ala Phe Gly Asp Glu Pro Trp Asn Val Leu Leu Val Leu 260 265 270 ggc ggc ggg gtg ccc gcg gcc gac ctg ggc ccg ctt ccc ggc aat gtc 864 Gly Gly Gly Val Pro Ala Ala Asp Leu Gly Pro Leu Pro Gly Asn Val 275 280 285 cgg gtg acc gac ttc gtg tcg ctg cgc gac gtc ctg ccg cac acg gcg 912 Arg Val Thr Asp Phe Val Ser Leu Arg Asp Val Leu Pro His Thr Ala 290 295 300 gtg gtg gtg aac cac ggt ggg atg agc acc gcc atg gag gtg ttc tcg 960 Val Val Val Asn His Gly Gly Met Ser Thr Ala Met Glu Val Phe Ser 305 310 315 320 cac ggt gtg ccg gtg gtg gcg atc ccg gtg atg ccg gag ccc cgg gcc 1008 His Gly Val Pro Val Val Ala Ile Pro Val Met Pro Glu Pro Arg Ala 325 330 335 acc gcg cgg cgg atc gtc gaa ctg ggc ctg ggc gac cag ctg ctg aac 1056 Thr Ala Arg Arg Ile Val Glu Leu Gly Leu Gly Asp Gln Leu Leu Asn 340 345 350 tcg gag ctg acg gcc gag tcc ctg cgt gcc acg gta cgg cgg gtg ctg 1104 Ser Glu Leu Thr Ala Glu Ser Leu Arg Ala Thr Val Arg Arg Val Leu 355 360 365 gcg gac tcc gcg atc ccg ggg aac atg cgc ggg ttc cgg gag cag atc 1152 Ala Asp Ser Ala Ile Pro Gly Asn Met Arg Gly Phe Arg Glu Gln Ile 370 375 380 agg gcg gcc ggc ggg gcg ccc gcg gcg gcc gac gcg atc gag gga ctg 1200 Arg Ala Ala Gly Gly Ala Pro Ala Ala Ala Asp Ala Ile Glu Gly Leu 385 390 395 400 ctg ccc cgg gtg ggc tga 1218 Leu Pro Arg Val Gly 405 <210> 108 <211> 405 <212> PRT <213> Streptomyces ambofaciens <400> 108 Met Ala His Ile Ala Phe Phe Ile Leu Pro Val Ala Gly His Val Asn 1 5 10 15 Pro Thr Leu Gly Val Ala Glu Glu Leu Val Ala Arg Gly His Arg Val 20 25 30 Thr Phe Ala Leu Ser Glu Asp Leu Ala Glu Arg Ala Arg Leu Ile Gly 35 40 45 Ala Glu Val Val Thr Tyr Pro Val Asp Arg Gln Arg Phe Leu Asp Gln 50 55 60 Met Val Pro Arg Gln Asp Ala Asp Glu Tyr Thr Asp Glu Asp Glu Phe 65 70 75 80 Val Arg Val Leu Glu Trp Leu Leu Asp Met Thr Val Gln Thr Met Glu 85 90 95 Pro Leu Glu Arg His Phe Ala Gly Asp Arg Pro Asp Val Val Val Asn 100 105 110 Asp Pro Ser Ser Leu Trp Thr Gly Arg Leu Leu Ala Asp Arg Trp Gly 115 120 125 Ile Pro Val Ile Arg Ser Thr Pro Thr Tyr Ala Ala Asn Glu His Trp 130 135 140 Ser Leu His Pro Pro Val Asp Ser Ala Glu Pro Pro Asp Asp Pro Glu 145 150 155 160 Leu His Lys Leu Leu Ala Arg Ile Glu Arg Leu Leu Glu Glu Gln Gly 165 170 175 Val Glu His Asp Leu Ala Gly Phe Thr Gly Val Leu His Gly Gly Pro 180 185 190 Ala Leu Leu Tyr Met Pro Arg Ser Phe Gln Tyr Ala Gly Glu Thr Phe 195 200 205 Asp Ala Gln His His Phe Val Gly Pro Cys Pro Pro Arg Thr Ala Phe 210 215 220 His Gly Glu Trp Arg Pro Gly Asp Asp Asp Gly Arg Pro Leu Val Leu 225 230 235 240 Val Ser Leu Gly Thr Leu Tyr Asn Asp Arg Pro Asp Phe Phe Arg Thr 245 250 255 Cys Leu Glu Ala Phe Gly Asp Glu Pro Trp Asn Val Leu Leu Val Leu 260 265 270 Gly Gly Gly Val Pro Ala Ala Asp Leu Gly Pro Leu Pro Gly Asn Val 275 280 285 Arg Val Thr Asp Phe Val Ser Leu Arg Asp Val Leu Pro His Thr Ala 290 295 300 Val Val Val Asn His Gly Gly Met Ser Thr Ala Met Glu Val Phe Ser 305 310 315 320 His Gly Val Pro Val Val Ala Ile Pro Val Met Pro Glu Pro Arg Ala 325 330 335 Thr Ala Arg Arg Ile Val Glu Leu Gly Leu Gly Asp Gln Leu Leu Asn 340 345 350 Ser Glu Leu Thr Ala Glu Ser Leu Arg Ala Thr Val Arg Arg Val Leu 355 360 365 Ala Asp Ser Ala Ile Pro Gly Asn Met Arg Gly Phe Arg Glu Gln Ile 370 375 380 Arg Ala Ala Gly Gly Ala Pro Ala Ala Ala Asp Ala Ile Glu Gly Leu 385 390 395 400 Leu Pro Arg Val Gly 405 <210> 109 <211> 621 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(621) <400> 109 atg ctc atc acc gaa aca gca gtg ccc gac gtg ttc cgc atc gat ccg 48 Met Leu Ile Thr Glu Thr Ala Val Pro Asp Val Phe Arg Ile Asp Pro 1 5 10 15 gaa ccg ctg ccg gac cac cgg ggc cgg ttc tac gaa gcg gtg cgc cgc 96 Glu Pro Leu Pro Asp His Arg Gly Arg Phe Tyr Glu Ala Val Arg Arg 20 25 30 ggg ccg ctg gag gcc gcc gtc ggg cac tcg gtc gag gtc cgg cag gtc 144 Gly Pro Leu Glu Ala Ala Val Gly His Ser Val Glu Val Arg Gln Val 35 40 45 cac tgc acc gtc tcc ggg cgc aac gta ctg cgc ggc ctg cac gcc acc 192 His Cys Thr Val Ser Gly Arg Asn Val Leu Arg Gly Leu His Ala Thr 50 55 60 acc ctg ccg ccg ggc cag gcc aag atc ctc acc tgt gtg cgg ggt gcg 240 Thr Leu Pro Pro Gly Gln Ala Lys Ile Leu Thr Cys Val Arg Gly Ala 65 70 75 80 gcg ctg act atg gtg gtc gac atg agg gtc ggg tca ccg ggc ttc gga 288 Ala Leu Thr Met Val Val Asp Met Arg Val Gly Ser Pro Gly Phe Gly 85 90 95 cgg tac gag gcg gtg cgg cag gat gcc ccg tcg ggc acc gcg ctc tac 336 Arg Tyr Glu Ala Val Arg Gln Asp Ala Pro Ser Gly Thr Ala Leu Tyr 100 105 110 ctg ccg gac ggc atc ggc ctg ggc tac gtg gcc ctc gcg gac gac aca 384 Leu Pro Asp Gly Ile Gly Leu Gly Tyr Val Ala Leu Ala Asp Asp Thr 115 120 125 tgc atg aac tac ctg tgc acc gag gag tac gtc ccg ggc atg gtc atc 432 Cys Met Asn Tyr Leu Cys Thr Glu Glu Tyr Val Pro Gly Met Val Ile 130 135 140 gac gtg gac gcc ctg gac ccc gaa ctc ggc ctg ccg tgg gga ctg acc 480 Asp Val Asp Ala Leu Asp Pro Glu Leu Gly Leu Pro Trp Gly Leu Thr 145 150 155 160 ggg gat ccc gtc cgc tcc gcc cgg gac gcg gcg gcg ccg tcc ctg cgg 528 Gly Asp Pro Val Arg Ser Ala Arg Asp Ala Ala Ala Pro Ser Leu Arg 165 170 175 gcg gcc gcg gcg gcg gga att ctg ccc acg tac gag gac tgc tta cgg 576 Ala Ala Ala Ala Ala Gly Ile Leu Pro Thr Tyr Glu Asp Cys Leu Arg 180 185 190 gtg cgc acg tcc gtg ccc gcc cct ccc gac cgg act cgg ctc tga 621 Val Arg Thr Ser Val Pro Ala Pro Pro Asp Arg Thr Arg Leu 195 200 205 <210> 110 <211> 206 <212> PRT <213> Streptomyces ambofaciens <400> 110 Met Leu Ile Thr Glu Thr Ala Val Pro Asp Val Phe Arg Ile Asp Pro 1 5 10 15 Glu Pro Leu Pro Asp His Arg Gly Arg Phe Tyr Glu Ala Val Arg Arg 20 25 30 Gly Pro Leu Glu Ala Ala Val Gly His Ser Val Glu Val Arg Gln Val 35 40 45 His Cys Thr Val Ser Gly Arg Asn Val Leu Arg Gly Leu His Ala Thr 50 55 60 Thr Leu Pro Pro Gly Gln Ala Lys Ile Leu Thr Cys Val Arg Gly Ala 65 70 75 80 Ala Leu Thr Met Val Val Asp Met Arg Val Gly Ser Pro Gly Phe Gly 85 90 95 Arg Tyr Glu Ala Val Arg Gln Asp Ala Pro Ser Gly Thr Ala Leu Tyr 100 105 110 Leu Pro Asp Gly Ile Gly Leu Gly Tyr Val Ala Leu Ala Asp Asp Thr 115 120 125 Cys Met Asn Tyr Leu Cys Thr Glu Glu Tyr Val Pro Gly Met Val Ile 130 135 140 Asp Val Asp Ala Leu Asp Pro Glu Leu Gly Leu Pro Trp Gly Leu Thr 145 150 155 160 Gly Asp Pro Val Arg Ser Ala Arg Asp Ala Ala Ala Pro Ser Leu Arg 165 170 175 Ala Ala Ala Ala Ala Gly Ile Leu Pro Thr Tyr Glu Asp Cys Leu Arg 180 185 190 Val Arg Thr Ser Val Pro Ala Pro Pro Asp Arg Thr Arg Leu 195 200 205 <210> 111 <211> 960 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(903) <400> 111 atg acc tta cgc acg ctt cga ccc gcc ggc gcg gcg ccc ccc gtg ggt 48 Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly 1 5 10 15 ccc gcc gcg cgg cac gac ttc gac tcg ctc gtc tcc gac gca tgt gcg 96 Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala 20 25 30 gag tta ctc ggt tcg ctc cgc cgg gcg gac cag cgc aga aga ggt gag 144 Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu 35 40 45 cag tac ata cgc ggg ctg ctc acg gca cag gga cgc aag acc gcc cgg 192 Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg 50 55 60 aac ctc gcc gcc ttc gtc gga gag ggc gcg gcg gaa cag agc ctg cac 240 Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His 65 70 75 80 cac ttc gtc gcc ggg tcg acc tgg gac tgg ggc gag gtg cgg gcc gcg 288 His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala 85 90 95 ctg gcc cgc tac gtg gac gac agg ctg acc ccc gac gcc tgg gtg atc 336 Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile 100 105 110 tgg ccg atg gtg gtc tcc aag gcg ggg gtg cgc tcc gtc ggg gtg agc 384 Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser 115 120 125 cgg cgc ttc gtc tcc gac ctg ggc cgg gtg gtg agc tgc cag cag agt 432 Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser 130 135 140 cac ggg ctg tgg ctg gcc tcg ggc acg acg gcc gcc ccg gtc agc tgg 480 His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp 145 150 155 160 cgc ctg acg ctg ggc ggc ggc cgg agc ggg gag ggc aca ccc cgg cac 528 Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His 165 170 175 ccc ggc gca ccc ggt gag gag gag aac atc gtc cgc ctg gtg gcc gaa 576 Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu 180 185 190 gcc gct cag gcc aac cgc tcc ttg gcc cgc ccc gtg gtg atg gac gca 624 Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala 195 200 205 cgc gcg gcc gtg ctg cca cga ctg gtg cga ggg ctc ggt ctc gcg ggc 672 Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly 210 215 220 ctg ccc ttc atg gtg cgg gtg ggc ggg aac ctc cgg ctg gcc tcg gcg 720 Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala 225 230 235 240 agc ggc cgc ggc ccg gtg gac cac cac acg ggg acc acc tcg gcc cag 768 Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln 245 250 255 cag ttg atg gag cag ctc aag cgg ttg agc cgc ccc gtg gag ttg cgg 816 Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg 260 265 270 ggc tcc ctc agc ctc gtc gcc ccg cac ccc gtc gtc ctg ccg ggt gtg 864 Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val 275 280 285 gtc ccg agg cgg acg ctg acg ctg ctg ggg ggt gtg gcg gnnnnnnnnn 913 Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Gly Val Ala 290 295 300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnn 960 <210> 112 <211> 301 <212> PRT <213> Streptomyces ambofaciens <400> 112 Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly 1 5 10 15 Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala 20 25 30 Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu 35 40 45 Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg 50 55 60 Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His 65 70 75 80 His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala 85 90 95 Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile 100 105 110 Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser 115 120 125 Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser 130 135 140 His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp 145 150 155 160 Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His 165 170 175 Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu 180 185 190 Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala 195 200 205 Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly 210 215 220 Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala 225 230 235 240 Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln 245 250 255 Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg 260 265 270 Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val 275 280 285 Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Gly Val Ala 290 295 300 <210> 113 <211> 1008 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1008) <400> 113 atg cag gca att cgg cat cac gtc atg ctc gtc atg gcc ttc gtg acc 48 Met Gln Ala Ile Arg His His Val Met Leu Val Met Ala Phe Val Thr 1 5 10 15 gtc gcc acg act ttc ctt ctc tgg ccg tcg acg caa tcc gcg caa gcg 96 Val Ala Thr Thr Phe Leu Leu Trp Pro Ser Thr Gln Ser Ala Gln Ala 20 25 30 ttt ccc ccg acc ccg aag cag acg gta ctg aac cac ctc cgc gcc att 144 Phe Pro Pro Thr Pro Lys Gln Thr Val Leu Asn His Leu Arg Ala Ile 35 40 45 tcc ggg aat cac atc gtc tcc gga cag cac aac aag gag ccc gcc tcc 192 Ser Gly Asn His Ile Val Ser Gly Gln His Asn Lys Glu Pro Ala Ser 50 55 60 gcc ccg ggc cag tac acc cag cag gtc aag gac gtc acc ggg cag tac 240 Ala Pro Gly Gln Tyr Thr Gln Gln Val Lys Asp Val Thr Gly Gln Tyr 65 70 75 80 ccc ggc ctg tgg ggc ggt gac ctg atg ttc gcc gcg gcg gac gtg gcc 288 Pro Gly Leu Trp Gly Gly Asp Leu Met Phe Ala Ala Ala Asp Val Ala 85 90 95 ggc cgc cag cgc gtc gtc gac cag gcc agg acc gag tgg gcg aac gga 336 Gly Arg Gln Arg Val Val Asp Gln Ala Arg Thr Glu Trp Ala Asn Gly 100 105 110 tcg ctg gtc tcg ctc acc tgg cac gtc tgc ccg ccg acc ggc ggc agc 384 Ser Leu Val Ser Leu Thr Trp His Val Cys Pro Pro Thr Gly Gly Ser 115 120 125 acc tgt gcg ttc gag ggc ggc gtc aag tcc acg ctg acg aac gcg cag 432 Thr Cys Ala Phe Glu Gly Gly Val Lys Ser Thr Leu Thr Asn Ala Gln 130 135 140 ttc tcg cag gtc ctc acg gag ggc agt gcc ctg aac agc gca tgg aag 480 Phe Ser Gln Val Leu Thr Glu Gly Ser Ala Leu Asn Ser Ala Trp Lys 145 150 155 160 cgg cgc ctg gac gag gtc gtc ccg tac ctg cag cag ctg gag aac gcg 528 Arg Arg Leu Asp Glu Val Val Pro Tyr Leu Gln Gln Leu Glu Asn Ala 165 170 175 ggc gtc ccc gtc ctc ttc cgg ccg ctg cac gag atg aac gaa tcc tgg 576 Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met Asn Glu Ser Trp 180 185 190 aac tgg tgg gga aac cgg ccc gga gcg aac ggc agc gca cgc ctc tac 624 Asn Trp Trp Gly Asn Arg Pro Gly Ala Asn Gly Ser Ala Arg Leu Tyr 195 200 205 cag atc acc cgc gat cac ctc gcc ggg acg aaa ggg ctg gac aat ctg 672 Gln Ile Thr Arg Asp His Leu Ala Gly Thr Lys Gly Leu Asp Asn Leu 210 215 220 atc tgg gtc tgg aac gtc cag gac aat ccg gcg gga aac tgg aac agc 720 Ile Trp Val Trp Asn Val Gln Asp Asn Pro Ala Gly Asn Trp Asn Ser 225 230 235 240 tac tat ccg gga gat cag tac gtg gac gtc gtt tcg ctg gac gtc tgg 768 Tyr Tyr Pro Gly Asp Gln Tyr Val Asp Val Val Ser Leu Asp Val Trp 245 250 255 tac aag agc cac ccg agt tcc gcc gac tac cag cag atg cgg agc atc 816 Tyr Lys Ser His Pro Ser Ser Ala Asp Tyr Gln Gln Met Arg Ser Ile 260 265 270 gcg gga aca aaa ccc atg gcc ctc gcg gag ctg ggc aaa atg ccg acc 864 Ala Gly Thr Lys Pro Met Ala Leu Ala Glu Leu Gly Lys Met Pro Thr 275 280 285 gcc gcg ctg ctg gac agc cag acg cgg tgg aca tgg ttc atg atg tgg 912 Ala Ala Leu Leu Asp Ser Gln Thr Arg Trp Thr Trp Phe Met Met Trp 290 295 300 tcc gag cat ctg cgc ggg aac aat tcc aac gcc gaa ata cag acg gcg 960 Ser Glu His Leu Arg Gly Asn Asn Ser Asn Ala Glu Ile Gln Thr Ala 305 310 315 320 tat ttc cac ccc cgt gta ctg aac cag ggg gag gtc gca ctg ccc tga 1008 Tyr Phe His Pro Arg Val Leu Asn Gln Gly Glu Val Ala Leu Pro 325 330 335 <210> 114 <211> 335 <212> PRT <213> Streptomyces ambofaciens <400> 114 Met Gln Ala Ile Arg His His Val Met Leu Val Met Ala Phe Val Thr 1 5 10 15 Val Ala Thr Thr Phe Leu Leu Trp Pro Ser Thr Gln Ser Ala Gln Ala 20 25 30 Phe Pro Pro Thr Pro Lys Gln Thr Val Leu Asn His Leu Arg Ala Ile 35 40 45 Ser Gly Asn His Ile Val Ser Gly Gln His Asn Lys Glu Pro Ala Ser 50 55 60 Ala Pro Gly Gln Tyr Thr Gln Gln Val Lys Asp Val Thr Gly Gln Tyr 65 70 75 80 Pro Gly Leu Trp Gly Gly Asp Leu Met Phe Ala Ala Ala Asp Val Ala 85 90 95 Gly Arg Gln Arg Val Val Asp Gln Ala Arg Thr Glu Trp Ala Asn Gly 100 105 110 Ser Leu Val Ser Leu Thr Trp His Val Cys Pro Pro Thr Gly Gly Ser 115 120 125 Thr Cys Ala Phe Glu Gly Gly Val Lys Ser Thr Leu Thr Asn Ala Gln 130 135 140 Phe Ser Gln Val Leu Thr Glu Gly Ser Ala Leu Asn Ser Ala Trp Lys 145 150 155 160 Arg Arg Leu Asp Glu Val Val Pro Tyr Leu Gln Gln Leu Glu Asn Ala 165 170 175 Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met Asn Glu Ser Trp 180 185 190 Asn Trp Trp Gly Asn Arg Pro Gly Ala Asn Gly Ser Ala Arg Leu Tyr 195 200 205 Gln Ile Thr Arg Asp His Leu Ala Gly Thr Lys Gly Leu Asp Asn Leu 210 215 220 Ile Trp Val Trp Asn Val Gln Asp Asn Pro Ala Gly Asn Trp Asn Ser 225 230 235 240 Tyr Tyr Pro Gly Asp Gln Tyr Val Asp Val Val Ser Leu Asp Val Trp 245 250 255 Tyr Lys Ser His Pro Ser Ser Ala Asp Tyr Gln Gln Met Arg Ser Ile 260 265 270 Ala Gly Thr Lys Pro Met Ala Leu Ala Glu Leu Gly Lys Met Pro Thr 275 280 285 Ala Ala Leu Leu Asp Ser Gln Thr Arg Trp Thr Trp Phe Met Met Trp 290 295 300 Ser Glu His Leu Arg Gly Asn Asn Ser Asn Ala Glu Ile Gln Thr Ala 305 310 315 320 Tyr Phe His Pro Arg Val Leu Asn Gln Gly Glu Val Ala Leu Pro 325 330 335 <210> 115 <211> 1038 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1038) <220> <221> CDS <222> (190)..(1038) <400> 115 atg acg tgc ggg ctc ggg cgg gaa cgg ctc cac cgt aga aag gaa gcg 48 Met Thr Cys Gly Leu Gly Arg Glu Arg Leu His Arg Arg Lys Glu Ala 1 5 10 15 gtc cgg cgt ccc ggt cca aaa gag cac ggg aaa acc gga ccg atc gcg 96 Val Arg Arg Pro Gly Pro Lys Glu His Gly Lys Thr Gly Pro Ile Ala 20 25 30 cgt ctg tgc cct ggc ggg ccg gct cgt tcc aag ccc tgg tcg cgg ttg 144 Arg Leu Cys Pro Gly Gly Pro Ala Arg Ser Lys Pro Trp Ser Arg Leu 35 40 45 gcc ccc tac ggt ggt acg acc gac gac aag gcg acg ggg gcg acg atg 192 Ala Pro Tyr Gly Gly Thr Thr Asp Asp Lys Ala Thr Gly Ala Thr Met 50 55 60 cgt atc gcg gtg aca ggg gcg gcg ggc agt ctg ggc agg cgg gtg gtg 240 Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val Val 65 70 75 80 cag ctg ctc gcg gac cgg gcc gac gtg gac gtc gtg gcg atg acc agg 288 Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr Arg 85 90 95 cgg aag ctg cct gcc gag gca cta ccg ccg ggg gtg gag tgc gcc gtc 336 Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala Val 100 105 110 gcc gac tac gcc gac ccg ccc gct ctg cgt gcg gcg ctg aag ggc gtg 384 Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly Val 115 120 125 gac act ctg gtc ctc gtc tcc agc gac ggg ccc gac gca cgg gtg ctg 432 Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val Leu 130 135 140 ctg cac cac cgc aac gtc gtc gcc gcc gtg gtg gcc gag cgc gtc ggc 480 Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val Gly 145 150 155 160 cat gtc gcg gca ctg agc agc gtc gac gcc gac tcg gcc tcc ccg ttc 528 His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro Phe 165 170 175 tgc tac gcc gtc gtc aac cgg ctc acc gag gat ctg ctg ctc gcc tcc 576 Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala Ser 180 185 190 ggc gtg ccg tgc tcg ttc gcc agg gcc tcg ctg tac atc gag ttc ttc 624 Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe Phe 195 200 205 cta ggc tgg ctc acc cag gcg cgc tcg acc ggg ctg ctg agg ctg ccg 672 Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu Pro 210 215 220 gca gcc gat ggc cgg gtg tcc ctg gtg gcg cgc gac gac gtg gcc cgc 720 Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala Arg 225 230 235 240 gcc ctc gcc gcc ctc gcg gtg ggc ggg ccg acc ggc cgt cac cac gac 768 Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His Asp 245 250 255 atc acg gga ccc gag tcg acg gac ctg gca ggc atc gcc tcc acg gcg 816 Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr Ala 260 265 270 gcg gag gtg tgg cgg aca ccg gtc gcc tac gtg gac atc ccg gcc gac 864 Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala Asp 275 280 285 acg tac tct gcc gaa aca gcg gcg acc ggc ctg gat ccc tgg tgg ctc 912 Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp Leu 290 295 300 tac gcc ttc tcc tcc ctg ttc gcc tcg gta cgc gaa cag cgc tgg gat 960 Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp Asp 305 310 315 320 cgg gtc cgc gac gac tgc gcc cag ctc acc ggc cgc ttg ccc cgc act 1008 Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg Thr 325 330 335 ctc cgc gac gtc ctg tca gaa cgc gcg tga 1038 Leu Arg Asp Val Leu Ser Glu Arg Ala 340 345 <210> 116 <211> 345 <212> PRT <213> Streptomyces ambofaciens <400> 116 Met Thr Cys Gly Leu Gly Arg Glu Arg Leu His Arg Arg Lys Glu Ala 1 5 10 15 Val Arg Arg Pro Gly Pro Lys Glu His Gly Lys Thr Gly Pro Ile Ala 20 25 30 Arg Leu Cys Pro Gly Gly Pro Ala Arg Ser Lys Pro Trp Ser Arg Leu 35 40 45 Ala Pro Tyr Gly Gly Thr Thr Asp Asp Lys Ala Thr Gly Ala Thr Met 50 55 60 Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val Val 65 70 75 80 Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr Arg 85 90 95 Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala Val 100 105 110 Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly Val 115 120 125 Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val Leu 130 135 140 Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val Gly 145 150 155 160 His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro Phe 165 170 175 Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala Ser 180 185 190 Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe Phe 195 200 205 Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu Pro 210 215 220 Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala Arg 225 230 235 240 Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His Asp 245 250 255 Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr Ala 260 265 270 Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala Asp 275 280 285 Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp Leu 290 295 300 Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp Asp 305 310 315 320 Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg Thr 325 330 335 Leu Arg Asp Val Leu Ser Glu Arg Ala 340 345 <210> 117 <211> 282 <212> PRT <213> Streptomyces ambofaciens <400> 117 Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val 1 5 10 15 Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr 20 25 30 Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala 35 40 45 Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly 50 55 60 Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val 65 70 75 80 Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val 85 90 95 Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro 100 105 110 Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala 115 120 125 Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe 130 135 140 Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu 145 150 155 160 Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala 165 170 175 Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His 180 185 190 Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr 195 200 205 Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala 210 215 220 Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp 225 230 235 240 Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp 245 250 255 Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg 260 265 270 Thr Leu Arg Asp Val Leu Ser Glu Arg Ala 275 280 <210> 118 <211> 975 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(975) <400> 118 atg ctc cga cgc cgt ctc gga ggg ccg tca ggc ccc ctc gtc agt gcc 48 Met Leu Arg Arg Arg Leu Gly Gly Pro Ser Gly Pro Leu Val Ser Ala 1 5 10 15 ctg tgc ctg ggc gcg atg ccc ttc ggc acc acc gtc gac gag aag acg 96 Leu Cys Leu Gly Ala Met Pro Phe Gly Thr Thr Val Asp Glu Lys Thr 20 25 30 tcc ttc gcc atc ctc gac cgg ttc gtc gag gcc ggc ggc agt ctc gtc 144 Ser Phe Ala Ile Leu Asp Arg Phe Val Glu Ala Gly Gly Ser Leu Val 35 40 45 gac acc gcc gac aac tac gcg ttc tgg gct ccc ggc ggg acc ggg gac 192 Asp Thr Ala Asp Asn Tyr Ala Phe Trp Ala Pro Gly Gly Thr Gly Asp 50 55 60 gag agc gag aac acc gtc ggg cgc tgg ctg gcg agc cgc cgc cgc cgc 240 Glu Ser Glu Asn Thr Val Gly Arg Trp Leu Ala Ser Arg Arg Arg Arg 65 70 75 80 gac gag gtg gtg atc tcc acc aag gtg ggt gcc cgc ccc acc gtc ccc 288 Asp Glu Val Val Ile Ser Thr Lys Val Gly Ala Arg Pro Thr Val Pro 85 90 95 ggc agc ggc ctg gag acc gcc gaa ggg ctg tcg gct ccc gtc ata cgg 336 Gly Ser Gly Leu Glu Thr Ala Glu Gly Leu Ser Ala Pro Val Ile Arg 100 105 110 aag gcc gcg gag gac agc ctg cga cgc ctg ggc acc gat cgc atc gat 384 Lys Ala Ala Glu Asp Ser Leu Arg Arg Leu Gly Thr Asp Arg Ile Asp 115 120 125 ctg tac tgg acc cac atc gag gac cgg acc gtc cct ctg gag gag acg 432 Leu Tyr Trp Thr His Ile Glu Asp Arg Thr Val Pro Leu Glu Glu Thr 130 135 140 ctc gga gct ctc gac gag ctg gtc ggc ggc ggc aag gtg gcg gtg ctg 480 Leu Gly Ala Leu Asp Glu Leu Val Gly Gly Gly Lys Val Ala Val Leu 145 150 155 160 ggc tgc tcc aac cac gcg ggc tgg cgc atc gaa cgg gcc cgc gcg ctc 528 Gly Cys Ser Asn His Ala Gly Trp Arg Ile Glu Arg Ala Arg Ala Leu 165 170 175 gcc cgg acc aac ggc tgg acg gcg tac acc tgc gtc cag cag cgc tac 576 Ala Arg Thr Asn Gly Trp Thr Ala Tyr Thr Cys Val Gln Gln Arg Tyr 180 185 190 tcc tac ctt cag ccg cgc ttc gac gtc gga ctg ccg gag agc gga cac 624 Ser Tyr Leu Gln Pro Arg Phe Asp Val Gly Leu Pro Glu Ser Gly His 195 200 205 gtc cac gcg acc tcc gaa ctc ctc gac cac gta cgc agc gag ccc gac 672 Val His Ala Thr Ser Glu Leu Leu Asp His Val Arg Ser Glu Pro Asp 210 215 220 ctg acg ctg ctg gcc tac tcg tcc ctg ctc tcg ggc gcg tac acc cgg 720 Leu Thr Leu Leu Ala Tyr Ser Ser Leu Leu Ser Gly Ala Tyr Thr Arg 225 230 235 240 ccg gac aag acc ctg tcc gcc gcc tac gac cac ccg ggc acc ggg cag 768 Pro Asp Lys Thr Leu Ser Ala Ala Tyr Asp His Pro Gly Thr Gly Gln 245 250 255 cgg ctg acc gtg ctg cgg gag gtg gcc gcc gag ctc ggt gcc acc gcc 816 Arg Leu Thr Val Leu Arg Glu Val Ala Ala Glu Leu Gly Ala Thr Ala 260 265 270 aac cag gtg gtg ctg tcc tgg ttg ctc gga ggt gat ccg ccg gtg atc 864 Asn Gln Val Val Leu Ser Trp Leu Leu Gly Gly Asp Pro Pro Val Ile 275 280 285 ccg atc gtg ggg gtg agt tcc gtc gag cag ctg gac gag gtg ctg gcc 912 Pro Ile Val Gly Val Ser Ser Val Glu Gln Leu Asp Glu Val Leu Ala 290 295 300 gcc gtc gag ctg gag ctg ccc cgg gag acg agg gca cgg ctg gac ctc 960 Ala Val Glu Leu Glu Leu Pro Arg Glu Thr Arg Ala Arg Leu Asp Leu 305 310 315 320 gcc ggg cgg ggc tga 975 Ala Gly Arg Gly 325 <210> 119 <211> 324 <212> PRT <213> Streptomyces ambofaciens <400> 119 Met Leu Arg Arg Arg Leu Gly Gly Pro Ser Gly Pro Leu Val Ser Ala 1 5 10 15 Leu Cys Leu Gly Ala Met Pro Phe Gly Thr Thr Val Asp Glu Lys Thr 20 25 30 Ser Phe Ala Ile Leu Asp Arg Phe Val Glu Ala Gly Gly Ser Leu Val 35 40 45 Asp Thr Ala Asp Asn Tyr Ala Phe Trp Ala Pro Gly Gly Thr Gly Asp 50 55 60 Glu Ser Glu Asn Thr Val Gly Arg Trp Leu Ala Ser Arg Arg Arg Arg 65 70 75 80 Asp Glu Val Val Ile Ser Thr Lys Val Gly Ala Arg Pro Thr Val Pro 85 90 95 Gly Ser Gly Leu Glu Thr Ala Glu Gly Leu Ser Ala Pro Val Ile Arg 100 105 110 Lys Ala Ala Glu Asp Ser Leu Arg Arg Leu Gly Thr Asp Arg Ile Asp 115 120 125 Leu Tyr Trp Thr His Ile Glu Asp Arg Thr Val Pro Leu Glu Glu Thr 130 135 140 Leu Gly Ala Leu Asp Glu Leu Val Gly Gly Gly Lys Val Ala Val Leu 145 150 155 160 Gly Cys Ser Asn His Ala Gly Trp Arg Ile Glu Arg Ala Arg Ala Leu 165 170 175 Ala Arg Thr Asn Gly Trp Thr Ala Tyr Thr Cys Val Gln Gln Arg Tyr 180 185 190 Ser Tyr Leu Gln Pro Arg Phe Asp Val Gly Leu Pro Glu Ser Gly His 195 200 205 Val His Ala Thr Ser Glu Leu Leu Asp His Val Arg Ser Glu Pro Asp 210 215 220 Leu Thr Leu Leu Ala Tyr Ser Ser Leu Leu Ser Gly Ala Tyr Thr Arg 225 230 235 240 Pro Asp Lys Thr Leu Ser Ala Ala Tyr Asp His Pro Gly Thr Gly Gln 245 250 255 Arg Leu Thr Val Leu Arg Glu Val Ala Ala Glu Leu Gly Ala Thr Ala 260 265 270 Asn Gln Val Val Leu Ser Trp Leu Leu Gly Gly Asp Pro Pro Val Ile 275 280 285 Pro Ile Val Gly Val Ser Ser Val Glu Gln Leu Asp Glu Val Leu Ala 290 295 300 Ala Val Glu Leu Glu Leu Pro Arg Glu Thr Arg Ala Arg Leu Asp Leu 305 310 315 320 Ala Gly Arg Gly <210> 120 <211> 1227 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1227) <400> 120 gtg acg ccc gag gcg gac gtc ggt acg cgg tgg gag ccg gag ttc gac 48 Val Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp 1 5 10 15 atg ctg ccc ggc ata ccc gac ctg cgg gcc ttt ccc cgc gga cgg tgg 96 Met Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp 20 25 30 gcg gac gcg gtg cgg gag gcc acc ggc gca ctg acc tgg ggc gag ctc 144 Ala Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu 35 40 45 ggc tac ccc gat ccg gcc ggt ctc gcc cgg ctc cgg cag cgg ctc gcg 192 Gly Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala 50 55 60 gcc tac ctc gtg cgg gga cgc ggc gcg tcg ctg gaa gcc cgg cag ctc 240 Ala Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu 65 70 75 80 gtc gtc tgc gcg ggc acg ctg gac gcg gtg cgc agg ctg tgc cgg gtc 288 Val Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val 85 90 95 ctg cgg acc gag ggc cac acc cac atg gcc ctg gag gac cct ggc tgg 336 Leu Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp 100 105 110 tcg cgg ctg agc gcc acg gtc ggg gcg gag ggg ctg gtg ccc gtc ccg 384 Ser Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro 115 120 125 gtt ccc gtg gac ggc gac ggc ctg cgg gtc gac ctg ctg cgg cgc gcg 432 Val Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala 130 135 140 cct cag gtc cgg tcg gtg atc gtc gct ccc gcc cac cag ttc ccg acc 480 Pro Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr 145 150 155 160 ggt gtg gtc ctc gcc ccg gcc cgt cgc ggc gag ctg gtc gcc tgg gcc 528 Gly Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala 165 170 175 cgc gag gtc gac ggc ctg gtg ctg gag gac gac tac gac gcc gag ttc 576 Arg Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe 180 185 190 cga tac gac cgc cac ccc gtg ggc gcc ctg cag ggc atg gca ccg gag 624 Arg Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu 195 200 205 cac gtc gcg ctg ctg ggg tcg gtc agc aag acg ctc tcg ccg gcc ctg 672 His Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu 210 215 220 cgg atc ggc tgg gcg gtg acc ccg ccg cgc tgg acc gag gcc ctg ggc 720 Arg Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly 225 230 235 240 gcg gag cac gtc ggg ggc gta cca ccg ccc gtc atc gac cag gag gcg 768 Ala Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala 245 250 255 ttc gcc cgg ttc ctg gcc cgc ggg tcc tac gac cgg tac ctg cgg gcg 816 Phe Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala 260 265 270 gca cgg ctg cgc tac aaa cgg cgc cgc gat cac ctc atg gga gaa ctc 864 Ala Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu 275 280 285 gcg gcg tcg ctg ccg ggg ttc cag gtg tcc ggt gcg gcg gcc ggc ttc 912 Ala Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe 290 295 300 cac ctg ctg ctg tcc ctg acg gac tgc tcg gcg ccc acc gtc gtc agg 960 His Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg 305 310 315 320 gag gcg gcg cgg cgt gac gtg agg ctg gcg gat ctc gac gcc tac cgg 1008 Glu Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg 325 330 335 atg gcg cgg gcc gag cac cac ccg acg gcc cgg gcc ggc gac tcc ggc 1056 Met Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly 340 345 350 ggg gcg cgg gcc gtg gcc gcc gcc ggc ccc gcg ctg gtc ctc ggc tac 1104 Gly Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr 355 360 365 ggc aat ctg gcg gac cac gcc gtg ccc gga gcc gtg cgg cgc ctg gca 1152 Gly Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala 370 375 380 cag gcc atc gac gcg gcc cgg cgc cac gac cgg cgg cac gtc gac gcc 1200 Gln Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala 385 390 395 400 ggg cgg gcc ggg gag cgg gcc gac tga 1227 Gly Arg Ala Gly Glu Arg Ala Asp 405 <210> 121 <211> 408 <212> PRT <213> Streptomyces ambofaciens <400> 121 Val Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp 1 5 10 15 Met Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp 20 25 30 Ala Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu 35 40 45 Gly Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala 50 55 60 Ala Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu 65 70 75 80 Val Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val 85 90 95 Leu Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp 100 105 110 Ser Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro 115 120 125 Val Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala 130 135 140 Pro Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr 145 150 155 160 Gly Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala 165 170 175 Arg Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe 180 185 190 Arg Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu 195 200 205 His Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu 210 215 220 Arg Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly 225 230 235 240 Ala Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala 245 250 255 Phe Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala 260 265 270 Ala Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu 275 280 285 Ala Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe 290 295 300 His Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg 305 310 315 320 Glu Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg 325 330 335 Met Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly 340 345 350 Gly Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr 355 360 365 Gly Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala 370 375 380 Gln Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala 385 390 395 400 Gly Arg Ala Gly Glu Arg Ala Asp 405 <210> 122 <211> 46 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR39 <400> 122 cccaagcttg agaagggagc ggacattcat ggcccgcgcc gaacgc 46 <210> 123 <211> 46 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR42 <400> 123 cgggatccgg ctgaccatgg gagacgggcg catcgccgag ttcagc 46 <210> 124 <211> 46 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR40 <400> 124 cccaagcttg agaagggagc ggacattcaa tgctttggta aagcac 46 <210> 125 <211> 38 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR41 <400> 125 cccaagcttt caaggaacga cggggtggtc agtcaagt 38 <210> 126 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide A <400> 126 ccagtagata tcccgccaac ccggagctgc ac 32 <210> 127 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide B <400> 127 gaaaagatcc gtcatggggt cgtgcgctcc tt 32 <210> 128 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide C <400> 128 cacgacccca tgacggatct tttccgctgc at 32 <210> 129 <211> 32 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide D <400> 129 gagccggata tcatcggtct tgccttgctc gt 32 <210> 130 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide ORF23c <400> 130 acgtgcgcgg tgagttcgcc gttgc 25 <210> 131 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide ORF25c <400> 131 ctgaacgacg ccatcgcggt ggtgc 25 <210> 132 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide ORF1*c <400> 132 gaccacctcg aaccgtccgg cgtca 25 <210> 133 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide ORF2*c <400> 133 ggcccggtcc agcgtgccga agc 23 <210> 134 <211> 6174 <212> DNA <213> Streptomyces ambofaciens <400> 134 ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60 ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc 120 aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180 gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240 ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 300 gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360 cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 420 gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480 gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540 gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600 ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc 660 cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 720 cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780 tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg 840 gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 900 cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960 gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 1020 tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 1080 gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140 gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200 tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 1260 gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320 gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380 tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440 tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500 gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560 tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620 ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680 ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740 tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800 tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860 acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920 tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980 acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2040 tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100 cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160 tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220 cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280 accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340 acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400 acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460 tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520 acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580 tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2640 cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700 actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 2760 cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2820 cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2880 acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2940 gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000 gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3060 tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120 caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180 gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240 gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300 atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360 gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420 gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480 tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540 ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600 ccgtggacgg agcgcgtccn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnc cgccacaccc 4080 cccagcagcg tcagcgtccg cctcgggacc acacccggca ggacgacggg gtgcggggcg 4140 acgaggctga gggagccccg caactccacg gggcggctca accgcttgag ctgctccatc 4200 aactgctggg ccgaggtggt ccccgtgtgg tggtccaccg ggccgcggcc gctcgccgag 4260 gccagccgga ggttcccgcc cacccgcacc atgaagggca ggcccgcgag accgagccct 4320 cgcaccagtc gtggcagcac ggccgcgcgt gcgtccatca ccacggggcg ggccaaggag 4380 cggttggcct gagcggcttc ggccaccagg cggacgatgt tctcctcctc accgggtgcg 4440 ccggggtgcc ggggtgtgcc ctccccgctc cggccgccgc ccagcgtcag gcgccagctg 4500 accggggcgg ccgtcgtgcc cgaggccagc cacagcccgt gactctgctg gcagctcacc 4560 acccggccca ggtcggagac gaagcgccgg ctcaccccga cggagcgcac ccccgccttg 4620 gagaccacca tcggccagat cacccaggcg tcgggggtca gcctgtcgtc cacgtagcgg 4680 gccagcgcgg cccgcacctc gccccagtcc caggtcgacc cggcgacgaa gtggtgcagg 4740 ctctgttccg ccgcgccctc tccgacgaag gcggcgaggt tccgggcggt cttgcgtccc 4800 tgtgccgtga gcagcccgcg tatgtactgc tcacctcttc tgcgctggtc cgcccggcgg 4860 agcgaaccga gtaactccgc acatgcgtcg gagacgagcg agtcgaagtc gtgccgcgcg 4920 gcgggaccca cggggggcgc cgcgccggcg ggtcgaagcg tgcgtaaggt cataggagtc 4980 ctcgtggggg cctcgtcatc actgcgagtg gactgcgacc agcatcgcca attcacccgt 5040 tgctccccag gtacaccggg cacactcgtt ccgcttcgct cccccggcgg cacggcccgc 5100 gtgtggagca ctccccgctc tccggacggt gggggggaag cccaccgcac gcgcgccggt 5160 agcggtgccg gggccccaca acccctcacc gacggggtcc gttcgaccac atgccgtgat 5220 gatgccttcg ccgcacggcc tccttgaatg acggaccgtc agaaagacgt cactccgcgc 5280 gcgcccgctc ccgccccgac cccgcccggc cgccgtcccg cccccgcgac cctgtgggcc 5340 gacgccctct tgacggaccc ggaatcccgg gccgcgggac gggacggcga ggaactcgat 5400 gccgcaaagg ttccgcgtcc tcaccggcac ctccgagatc cagcgcaacg gcatcgccaa 5460 gctcctggct ttccaccact gagccgcacc ccctggcgag cagatccggg acaagacgcc 5520 accttcgcga cagtgtttag gaaaagttaa gtaaagaatt ccgcgagcgg attgccaggg 5580 agaacaaccc attgacgcgc accggtgcag cggccacatt gacggcacct gtcaagttca 5640 cccccaggag cttggaatcc catgcaggca attcggcatc acgtcatgct cgtcatggcc 5700 ttcgtgaccg tcgccacgac tttccttctc tggccgtcga cgcaatccgc gcaagcgttt 5760 cccccgaccc cgaagcagac ggtactgaac cacctccgcg ccatttccgg gaatcacatc 5820 gtctccggac agcacaacaa ggagcccgcc tccgccccgg gccagtacac ccagcaggtc 5880 aaggacgtca ccgggcagta ccccggcctg tggggcggtg acctgatgtt cgccgcggcg 5940 gacgtggccg gccgccagcg cgtcgtcgac caggccagga ccgagtgggc gaacggatcg 6000 ctggtctcgc tcacctggca cgtctgcccg ccgaccggcg gcagcacctg tgcgttcgag 6060 ggcggcgtca agtccacgct gacgaacgcg cagttctcgc aggtcctcac ggagggcagt 6120 gccctgaaca gcgcatggaa gcggcgcctg gacgaggtcg tcccgtacct gcag 6174 <210> 135 <211> 4770 <212> DNA <213> Streptomyces ambofaciens <400> 135 gaattccgcg agcggattgc cagggagaac aacccattga cgcgcaccgg tgcagcggcc 60 acattgacgg cacctgtcaa gttcaccccc aggagcttgg aatcccatgc aggcaattcg 120 gcatcacgtc atgctcgtca tggccttcgt gaccgtcgcc acgactttcc ttctctggcc 180 gtcgacgcaa tccgcgcaag cgtttccccc gaccccgaag cagacggtac tgaaccacct 240 ccgcgccatt tccgggaatc acatcgtctc cggacagcac aacaaggagc ccgcctccgc 300 cccgggccag tacacccagc aggtcaagga cgtcaccggg cagtaccccg gcctgtgggg 360 cggtgacctg atgttcgccg cggcggacgt ggccggccgc cagcgcgtcg tcgaccaggc 420 caggaccgag tgggcgaacg gatcgctggt ctcgctcacc tggcacgtct gcccgccgac 480 cggcggcagc acctgtgcgt tcgagggcgg cgtcaagtcc acgctgacga acgcgcagtt 540 ctcgcaggtc ctcacggagg gcagtgccct gaacagcgca tggaagcggc gcctggacga 600 ggtcgtcccg tacctgcagc agctggagaa cgcgggcgtc cccgtcctct tccggccgct 660 gcacgagatg aacgaatcct ggaactggtg gggaaaccgg cccggagcga acggcagcgc 720 acgcctctac cagatcaccc gcgatcacct cgccgggacg aaagggctgg acaatctgat 780 ctgggtctgg aacgtccagg acaatccggc gggaaactgg aacagctact atccgggaga 840 tcagtacgtg gacgtcgttt cgctggacgt ctggtacaag agccacccga gttccgccga 900 ctaccagcag atgcggagca tcgcgggaac aaaacccatg gccctcgcgg agctgggcaa 960 aatgccgacc gccgcgctgc tggacagcca gacgcggtgg acatggttca tgatgtggtc 1020 cgagcatctg cgcgggaaca attccaacgc cgaaatacag acggcgtatt tccacccccg 1080 tgtactgaac cagggggagg tcgcactgcc ctgacgctcg gcgctgcccg gctctctcac 1140 gcgcgttctg acaggacgtc gcggagagtg cggggcaagc ggccggtgag ctgggcgcag 1200 tcgtcgcgga cccgatccca gcgctgttcg cgtaccgagg cgaacaggga ggagaaggcg 1260 tagagccacc agggatccag gccggtcgcc gctgtttcgg cagagtacgt gtcggccggg 1320 atgtccacgt aggcgaccgg tgtccgccac acctccgccg ccgtggaggc gatgcctgcc 1380 aggtccgtcg actcgggtcc cgtgatgtcg tggtgacggc cggtcggccc gcccaccgcg 1440 agggcggcga gggcgcgggc cacgtcgtcg cgcgccacca gggacacccg gccatcggct 1500 gccggcagcc tcagcagccc ggtcgagcgc gcctgggtga gccagcctag gaagaactcg 1560 atgtacagcg aggccctggc gaacgagcac ggcacgccgg aggcgagcag cagatcctcg 1620 gtgagccggt tgacgacggc gtagcagaac ggggaggccg agtcggcgtc gacgctgctc 1680 agtgccgcga catggccgac gcgctcggcc accacggcgg cgacgacgtt gcggtggtgc 1740 agcagcaccc gtgcgtcggg cccgtcgctg gagacgagga ccagagtgtc cacgcccttc 1800 agcgccgcac gcagagcggg cgggtcggcg tagtcggcga cggcgcactc cacccccggc 1860 ggtagtgcct cggcaggcag cttccgcctg gtcatcgcca cgacgtccac gtcggcccgg 1920 tccgcgagca gctgcaccac ccgcctgccc agactgcccg ccgcccctgt caccgcgata 1980 cgcatcgtcg cccccgtcgc cttgtcgtcg gtcgtaccac cgtagggggc caaccgcgac 2040 cagggcttgg aacgagccgg cccgccaggg cacagacgcg cgatcggtcc ggttttcccg 2100 tgctcttttg gaccgggacg ccggaccgct tcctttctac ggtggagccg ttcccgcccg 2160 agcccgcacg tcatcgacgt gcggggaaga cagaggtgat accgatgctc cgacgccgtc 2220 tcggagggcc gtcaggcccc ctcgtcagtg ccctgtgcct gggcgcgatg cccttcggca 2280 ccaccgtcga cgagaagacg tccttcgcca tcctcgaccg gttcgtcgag gccggcggca 2340 gtctcgtcga caccgccgac aactacgcgt tctgggctcc cggcgggacc ggggacgaga 2400 gcgagaacac cgtcgggcgc tggctggcga gccgccgccg ccgcgacgag gtggtgatct 2460 ccaccaaggt gggtgcccgc cccaccgtcc ccggcagcgg cctggagacc gccgaagggc 2520 tgtcggctcc cgtcatacgg aaggccgcgg aggacagcct gcgacgcctg ggcaccgatc 2580 gcatcgatct gtactggacc cacatcgagg accggaccgt ccctctggag gagacgctcg 2640 gagctctcga cgagctggtc ggcggcggca aggtggcggt gctgggctgc tccaaccacg 2700 cgggctggcg catcgaacgg gcccgcgcgc tcgcccggac caacggctgg acggcgtaca 2760 cctgcgtcca gcagcgctac tcctaccttc agccgcgctt cgacgtcgga ctgccggaga 2820 gcggacacgt ccacgcgacc tccgaactcc tcgaccacgt acgcagcgag cccgacctga 2880 cgctgctggc ctactcgtcc ctgctctcgg gcgcgtacac ccggccggac aagaccctgt 2940 ccgccgccta cgaccacccg ggcaccgggc agcggctgac cgtgctgcgg gaggtggccg 3000 ccgagctcgg tgccaccgcc aaccaggtgg tgctgtcctg gttgctcgga ggtgatccgc 3060 cggtgatccc gatcgtgggg gtgagttccg tcgagcagct ggacgaggtg ctggccgccg 3120 tcgagctgga gctgccccgg gagacgaggg cacggctgga cctcgccggg cggggctgac 3180 gggccacaca ccgcccctcg cccgggacgg gctgaccggc cgcacaccgt ccctcagccg 3240 ggacgggctg acggccacac acccgcccct cagcccggct gggctgggct gacggccaca 3300 cacccgctcc tcagcccggc tgggctgggc tgacggccac acacccgccc ctcagcccgg 3360 ctgggctggg ctgacggcca cacgccgtcc ctcgcccggg tcgggctgac cagccacacg 3420 ccgtccctca gtcggcccgc tccccggccc gcccggcgtc gacgtgccgc cggtcgtggc 3480 gccgggccgc gtcgatggcc tgtgccaggc gccgcacggc tccgggcacg gcgtggtccg 3540 ccagattgcc gtagccgagg accagcgcgg ggccggcggc ggccacggcc cgcgccccgc 3600 cggagtcgcc ggcccgggcc gtcgggtggt gctcggcccg cgccatccgg taggcgtcga 3660 gatccgccag cctcacgtca cgccgcgccg cctccctgac gacggtgggc gccgagcagt 3720 ccgtcaggga cagcagcagg tggaagccgg ccgccgcacc ggacacctgg aaccccggca 3780 gcgacgccgc gagttctccc atgaggtgat cgcggcgccg tttgtagcgc agccgtgccg 3840 cccgcaggta ccggtcgtag gacccgcggg ccaggaaccg ggcgaacgcc tcctggtcga 3900 tgacgggcgg tggtacgccc ccgacgtgct ccgcgcccag ggcctcggtc cagcgcggcg 3960 gggtcaccgc ccagccgatc cgcagggccg gcgagagcgt cttgctgacc gaccccagca 4020 gcgcgacgtg ctccggtgcc atgccctgca gggcgcccac ggggtggcgg tcgtatcgga 4080 actcggcgtc gtagtcgtcc tccagcacca ggccgtcgac ctcgcgggcc caggcgacca 4140 gctcgccgcg acgggccggg gcgaggacca caccggtcgg gaactggtgg gcgggagcga 4200 cgatcaccga ccggacctga ggcgcgcgcc gcagcaggtc gacccgcagg ccgtcgccgt 4260 ccacgggaac cgggacgggc accagcccct ccgccccgac cgtggcgctc agccgcgacc 4320 agccagggtc ctccagggcc atgtgggtgt ggccctcggt ccgcaggacc cggcacagcc 4380 tgcgcaccgc gtccagcgtg cccgcgcaga cgacgagctg ccgggcttcc agcgacgcgc 4440 cgcgtccccg cacgaggtag gccgcgagcc gctgccggag ccgggcgaga ccggccggat 4500 cggggtagcc gagctcgccc caggtcagtg cgccggtggc ctcccgcacc gcgtccgccc 4560 accgtccgcg gggaaaggcc cgcaggtcgg gtatgccggg cagcatgtcg aactccggct 4620 cccaccgcgt accgacgtcc gcctcgggcg tcaccggagc ggggacggcc tgcgccctga 4680 cccgggtggc cgagccgctg cgcgcctcca ggtacccctc cgcgacgagc tgcgcgtagg 4740 ggggatcctc tagagtcgac ctgcaggcct 4770 <210> 136 <211> 28 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR31 <400> 136 cccaagcttc tgcgcccgcg ggcgtgaa 28 <210> 137 <211> 28 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR37 <400> 137 gctctagaac cgtgtagccg cgccccgg 28 <210> 138 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF30 <400> 138 aagcttgtgt gcccggtgta cctggggagc 30 <210> 139 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF31 <400> 139 ggatcccgcg acggacacga ccgccgcgca 30 <210> 140 <211> 12134 <212> DNA <213> Streptomyces ambofaciens <400> 140 ctgcagaggg cgccgacgtg cgcggtgagt tcgccgttgc gccggctggt ccagccgagg 60 ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc gggagccgag gtcgtgcagc 120 aggccgaggg gcagctcgcc cgtccggtcc cactcggccg cccggtcgcc gaccagcgcg 180 gtgaacagct cctcggcctc ggtgccgtcg gcgtgggagg tgtcagccac ctgcgtgccc 240 ggtcgcctcg ccgggcgcgg ccagccgtcc gaccagccgg accatcgcgt cgacggtgcg 300 gaagttgtcg agcatcaggt cggcgccgct gatgacgatg ccgtaggtct tctccaggtg 360 cacgacgagc tgcatggcga acagcgagga catcccgccg acggcgaaca ggtcctggtc 420 gcgctcccag gtggtcttgg tgcggtcctc gaggaacccg agcagttccc cggcgacctc 480 gtcggcggtg ggggtcgtgc cggtggggtc gggccgaccg gacgtcgtgg tcatcgcgtg 540 gcctcctggt agtcgtagaa tccccggccg ctcttgcggc cgagcaggcc ctggcggacc 600 ttgtccagca gcagctcgct cgggcggagc gccggatcgc cggtccgttc gtgcatcacc 660 cgcagcgagt cggccaggtt gtccagtccg atcaggtcgg ccgtggccag gggtccggtg 720 cggtggccga tgcagtcgcg catcagcgcg tccacggtct ccggggtggc ccggccctcg 780 tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca ggcggctggt cacgaagccg 840 gcgccgtcgc cgacgacgat gccccggcgg cccaggccgg acagcaggtc ccgggtggcc 900 cgggcggccg cctctccgct gcgcggtccg aggaccacct cgaccgtggg gatcacgtac 960 gcggggttca tgaagtgcac gccgacgagg tcctcggggc gggggacggc gtcggccagc 1020 tcgtcgatgg ggacgcccga ggtgttgctg acgagcagcg tccccgggcg cgccacggac 1080 gccaggtccg ccagcacctc ggccttccgc tcggggtcct cggtgacggc ctcgatcacg 1140 gcggtcgcgg tggcgacggc ggccggcgcc tcctcgacgg tcagctcccc gggcgggcgg 1200 tcgtggggca gcgcgcccat cagccgggcc gtccgcagat gcagcgcgac cgcgtcgggg 1260 gcggccgcgc gcgccccggc ggaggtgtcg accagtgtga ccgggtgccc gtgtccgacg 1320 gcgagtgccg cgatggccgt gcccatgacg cccgcgccga gcacgacgag cggagaattt 1380 tccttggaat cgggcacgga tcctccagaa tcccgggggc ggcggctgtg cgaaatgctg 1440 tcccgaatcg cttccgcgct ccatcacccg ggcgtgactt tgtcacctag caagcggtgg 1500 gaggccgggc ggaggctatg tcatctcggc cttgtccgct tacgagttcc gtccttaaag 1560 tgcgcccggc gaacgcacgg cggaattgac tcgccgtccg tcaaggaccc gcggttcgaa 1620 ggacctcgac gcatgaaggg tttcacatgg ctcatatcgc attcttcatc cttccggttg 1680 ccgggcatgt gaatccgacc ctgggagtcg ccgaggaact ggtcgcgcgc ggccaccggg 1740 tgacgttcgc gctgtccgag gacctcgccg agcgggcccg gctgatcggc gccgaggtgg 1800 tcacctatcc ggtggacagg caacggttcc tggaccagat ggtgccgcgg caggacgcgg 1860 acgagtacac ggacgaggac gagttcgtcc gggtcctgga gtggctgctg gacatgacgg 1920 tgcagaccat ggaaccgctg gagaggcact tcgccgggga ccggcccgac gtcgtcgtca 1980 acgatccgtc gtcgctgtgg acgggacggc tgctggcgga ccggtggggc atcccggtca 2040 tccgcagcac tccgacctat gccgccaacg aacactggtc gctgcatccg ccggtcgact 2100 cggccgagcc gccggacgac cccgagctgc acaagctgct cgcgcggatc gagcggctgc 2160 tggaggagca gggcgtcgag cacgacctgg ccggcttcac cggggtcctg cacggcggtc 2220 cggccctgct gtacatgccc cgctcgttcc agtacgcggg cgagaccttc gacgcacagc 2280 accacttcgt cggcccctgc ccgccccgca ccgcgttcca cggcgagtgg aggccggggg 2340 acgacgacgg ccggcccctg gtgctggtga gtctcggaac cctgtacaac gaccggccgg 2400 acttcttccg cacctgcctg gaggcgttcg gcgacgagcc ctggaacgtg cttctggtgc 2460 tgggcggcgg ggtgcccgcg gccgacctgg gcccgcttcc cggcaatgtc cgggtgaccg 2520 acttcgtgtc gctgcgcgac gtcctgccgc acacggcggt ggtggtgaac cacggtggga 2580 tgagcaccgc catggaggtg ttctcgcacg gtgtgccggt ggtggcgatc ccggtgatgc 2640 cggagccccg ggccaccgcg cggcggatcg tcgaactggg cctgggcgac cagctgctga 2700 actcggagct gacggccgag tccctgcgtg ccacggtacg gcgggtgctg gcggactccg 2760 cgatcccggg gaacatgcgc gggttccggg agcagatcag ggcggccggc ggggcgcccg 2820 cggcggccga cgcgatcgag ggactgctgc cccgggtggg ctgagacgtc cgcgcccgac 2880 acgcgttcac cttccgaacg gcgggatcgc cccatgctca tcaccgaaac agcagtgccc 2940 gacgtgttcc gcatcgatcc ggaaccgctg ccggaccacc ggggccggtt ctacgaagcg 3000 gtgcgccgcg ggccgctgga ggccgccgtc gggcactcgg tcgaggtccg gcaggtccac 3060 tgcaccgtct ccgggcgcaa cgtactgcgc ggcctgcacg ccaccaccct gccgccgggc 3120 caggccaaga tcctcacctg tgtgcggggt gcggcgctga ctatggtggt cgacatgagg 3180 gtcgggtcac cgggcttcgg acggtacgag gcggtgcggc aggatgcccc gtcgggcacc 3240 gcgctctacc tgccggacgg catcggcctg ggctacgtgg ccctcgcgga cgacacatgc 3300 atgaactacc tgtgcaccga ggagtacgtc ccgggcatgg tcatcgacgt ggacgccctg 3360 gaccccgaac tcggcctgcc gtggggactg accggggatc ccgtccgctc cgcccgggac 3420 gcggcggcgc cgtccctgcg ggcggccgcg gcggcgggaa ttctgcccac gtacgaggac 3480 tgcttacggg tgcgcacgtc cgtgcccgcc cctcccgacc ggactcggct ctgacgcgac 3540 ggacacgacc gccgcgcatc cgacgcgaat ccgacgcgaa tccgaactcg atttcccgaa 3600 ccgtggacgg agcgcgccga ggagcggaaa ggtctgccgc agaaacaggc tgcggccctt 3660 tctttccgct ttttccggta ccgggacggc cgttccgatg aaagcgaacg tccgcatgcg 3720 acggccgtcc ctcccgtacg ctcctccccc gtcgcggccg gccgggcggg cgggccggcc 3780 gaccgcgacg gggcggggcg gggtcacacc gccgtcgccc caccgaggtc gccgcgcgcg 3840 gagggctgcg ccagccgcag cgtgtgggcg atggacgcca gggtcacgtg ccggtgccag 3900 ccctggaacg accgtccttc gaagtcgcgc atgcccacgc ccacgctcac ccggtcgaag 3960 tcggcgtcga cctgttcggt gagcatcgcc agccgcagca gggcgccgcg gtcccaggac 4020 gtgaggtcgg tcagccacag gtcggcgggg cgccggcggt tgccccgcca cacccccagc 4080 agcgtcagcg tccgcctcgg gaccacaccc ggcaggacga cggggtgcgg ggcgacgagg 4140 ctgagggagc cccgcaactc cacggggcgg ctcaaccgct tgagctgctc catcaactgc 4200 tgggccgagg tggtccccgt gtggtggtcc accgggccgc ggccgctcgc cgaggccagc 4260 cggaggttcc cgcccacccg caccatgaag ggcaggcccg cgagaccgag ccctcgcacc 4320 agtcgtggca gcacggccgc gcgtgcgtcc atcaccacgg ggcgggccaa ggagcggttg 4380 gcctgagcgg cttcggccac caggcggacg atgttctcct cctcaccggg tgcgccgggg 4440 tgccggggtg tgccctcccc gctccggccg ccgcccagcg tcaggcgcca gctgaccggg 4500 gcggccgtcg tgcccgaggc cagccacagc ccgtgactct gctggcagct caccacccgg 4560 cccaggtcgg agacgaagcg ccggctcacc ccgacggagc gcacccccgc cttggagacc 4620 accatcggcc agatcaccca ggcgtcgggg gtcagcctgt cgtccacgta gcgggccagc 4680 gcggcccgca cctcgcccca gtcccaggtc gacccggcga cgaagtggtg caggctctgt 4740 tccgccgcgc cctctccgac gaaggcggcg aggttccggg cggtcttgcg tccctgtgcc 4800 gtgagcagcc cgcgtatgta ctgctcacct cttctgcgct ggtccgcccg gcggagcgaa 4860 ccgagtaact ccgcacatgc gtcggagacg agcgagtcga agtcgtgccg cgcggcggga 4920 cccacggggg gcgccgcgcc ggcgggtcga agcgtgcgta aggtcatagg agtcctcgtg 4980 ggggcctcgt catcactgcg agtggactgc gaccagcatc gccaattcac ccgttgctcc 5040 ccaggtacac cgggcacact cgttccgctt cgctcccccg gcggcacggc ccgcgtgtgg 5100 agcactcccc gctctccgga cggtgggggg gaagcccacc gcacgcgcgc cggtagcggt 5160 gccggggccc cacaacccct caccgacggg gtccgttcga ccacatgccg tgatgatgcc 5220 ttcgccgcac ggcctccttg aatgacggac cgtcagaaag acgtcactcc gcgcgcgccc 5280 gctcccgccc cgaccccgcc cggccgccgt cccgcccccg cgaccctgtg ggccgacgcc 5340 ctcttgacgg acccggaatc ccgggccgcg ggacgggacg gcgaggaact cgatgccgca 5400 aaggttccgc gtcctcaccg gcacctccga gatccagcgc aacggcatcg ccaagctcct 5460 ggctttccac cactgagccg caccccctgg cgagcagatc cgggacaaga cgccaccttc 5520 gcgacagtgt ttaggaaaag ttaagtaaag aattccgcga gcggattgcc agggagaaca 5580 acccattgac gcgcaccggt gcagcggcca cattgacggc acctgtcaag ttcaccccca 5640 ggagcttgga atcccatgca ggcaattcgg catcacgtca tgctcgtcat ggccttcgtg 5700 accgtcgcca cgactttcct tctctggccg tcgacgcaat ccgcgcaagc gtttcccccg 5760 accccgaagc agacggtact gaaccacctc cgcgccattt ccgggaatca catcgtctcc 5820 ggacagcaca acaaggagcc cgcctccgcc ccgggccagt acacccagca ggtcaaggac 5880 gtcaccgggc agtaccccgg cctgtggggc ggtgacctga tgttcgccgc ggcggacgtg 5940 gccggccgcc agcgcgtcgt cgaccaggcc aggaccgagt gggcgaacgg atcgctggtc 6000 tcgctcacct ggcacgtctg cccgccgacc ggcggcagca cctgtgcgtt cgagggcggc 6060 gtcaagtcca cgctgacgaa cgcgcagttc tcgcaggtcc tcacggaggg cagtgccctg 6120 aacagcgcat ggaagcggcg cctggacgag gtcgtcccgt acctgcagca gctggagaac 6180 gcgggcgtcc ccgtcctctt ccggccgctg cacgagatga acgaatcctg gaactggtgg 6240 ggaaaccggc ccggagcgaa cggcagcgca cgcctctacc agatcacccg cgatcacctc 6300 gccgggacga aagggctgga caatctgatc tgggtctgga acgtccagga caatccggcg 6360 ggaaactgga acagctacta tccgggagat cagtacgtgg acgtcgtttc gctggacgtc 6420 tggtacaaga gccacccgag ttccgccgac taccagcaga tgcggagcat cgcgggaaca 6480 aaacccatgg ccctcgcgga gctgggcaaa atgccgaccg ccgcgctgct ggacagccag 6540 acgcggtgga catggttcat gatgtggtcc gagcatctgc gcgggaacaa ttccaacgcc 6600 gaaatacaga cggcgtattt ccacccccgt gtactgaacc agggggaggt cgcactgccc 6660 tgacgctcgg cgctgcccgg ctctctcacg cgcgttctga caggacgtcg cggagagtgc 6720 ggggcaagcg gccggtgagc tgggcgcagt cgtcgcggac ccgatcccag cgctgttcgc 6780 gtaccgaggc gaacagggag gagaaggcgt agagccacca gggatccagg ccggtcgccg 6840 ctgtttcggc agagtacgtg tcggccggga tgtccacgta ggcgaccggt gtccgccaca 6900 cctccgccgc cgtggaggcg atgcctgcca ggtccgtcga ctcgggtccc gtgatgtcgt 6960 ggtgacggcc ggtcggcccg cccaccgcga gggcggcgag ggcgcgggcc acgtcgtcgc 7020 gcgccaccag ggacacccgg ccatcggctg ccggcagcct cagcagcccg gtcgagcgcg 7080 cctgggtgag ccagcctagg aagaactcga tgtacagcga ggccctggcg aacgagcacg 7140 gcacgccgga ggcgagcagc agatcctcgg tgagccggtt gacgacggcg tagcagaacg 7200 gggaggccga gtcggcgtcg acgctgctca gtgccgcgac atggccgacg cgctcggcca 7260 ccacggcggc gacgacgttg cggtggtgca gcagcacccg tgcgtcgggc ccgtcgctgg 7320 agacgaggac cagagtgtcc acgcccttca gcgccgcacg cagagcgggc gggtcggcgt 7380 agtcggcgac ggcgcactcc acccccggcg gtagtgcctc ggcaggcagc ttccgcctgg 7440 tcatcgccac gacgtccacg tcggcccggt ccgcgagcag ctgcaccacc cgcctgccca 7500 gactgcccgc cgcccctgtc accgcgatac gcatcgtcgc ccccgtcgcc ttgtcgtcgg 7560 tcgtaccacc gtagggggcc aaccgcgacc agggcttgga acgagccggc ccgccagggc 7620 acagacgcgc gatcggtccg gttttcccgt gctcttttgg accgggacgc cggaccgctt 7680 cctttctacg gtggagccgt tcccgcccga gcccgcacgt catcgacgtg cggggaagac 7740 agaggtgata ccgatgctcc gacgccgtct cggagggccg tcaggccccc tcgtcagtgc 7800 cctgtgcctg ggcgcgatgc ccttcggcac caccgtcgac gagaagacgt ccttcgccat 7860 cctcgaccgg ttcgtcgagg ccggcggcag tctcgtcgac accgccgaca actacgcgtt 7920 ctgggctccc ggcgggaccg gggacgagag cgagaacacc gtcgggcgct ggctggcgag 7980 ccgccgccgc cgcgacgagg tggtgatctc caccaaggtg ggtgcccgcc ccaccgtccc 8040 cggcagcggc ctggagaccg ccgaagggct gtcggctccc gtcatacgga aggccgcgga 8100 ggacagcctg cgacgcctgg gcaccgatcg catcgatctg tactggaccc acatcgagga 8160 ccggaccgtc cctctggagg agacgctcgg agctctcgac gagctggtcg gcggcggcaa 8220 ggtggcggtg ctgggctgct ccaaccacgc gggctggcgc atcgaacggg cccgcgcgct 8280 cgcccggacc aacggctgga cggcgtacac ctgcgtccag cagcgctact cctaccttca 8340 gccgcgcttc gacgtcggac tgccggagag cggacacgtc cacgcgacct ccgaactcct 8400 cgaccacgta cgcagcgagc ccgacctgac gctgctggcc tactcgtccc tgctctcggg 8460 cgcgtacacc cggccggaca agaccctgtc cgccgcctac gaccacccgg gcaccgggca 8520 gcggctgacc gtgctgcggg aggtggccgc cgagctcggt gccaccgcca accaggtggt 8580 gctgtcctgg ttgctcggag gtgatccgcc ggtgatcccg atcgtggggg tgagttccgt 8640 cgagcagctg gacgaggtgc tggccgccgt cgagctggag ctgccccggg agacgagggc 8700 acggctggac ctcgccgggc ggggctgacg ggccacacac cgcccctcgc ccgggacggg 8760 ctgaccggcc gcacaccgtc cctcagccgg gacgggctga cggccacaca cccgcccctc 8820 agcccggctg ggctgggctg acggccacac acccgctcct cagcccggct gggctgggct 8880 gacggccaca cacccgcccc tcagcccggc tgggctgggc tgacggccac acgccgtccc 8940 tcgcccgggt cgggctgacc agccacacgc cgtccctcag tcggcccgct ccccggcccg 9000 cccggcgtcg acgtgccgcc ggtcgtggcg ccgggccgcg tcgatggcct gtgccaggcg 9060 ccgcacggct ccgggcacgg cgtggtccgc cagattgccg tagccgagga ccagcgcggg 9120 gccggcggcg gccacggccc gcgccccgcc ggagtcgccg gcccgggccg tcgggtggtg 9180 ctcggcccgc gccatccggt aggcgtcgag atccgccagc ctcacgtcac gccgcgccgc 9240 ctccctgacg acggtgggcg ccgagcagtc cgtcagggac agcagcaggt ggaagccggc 9300 cgccgcaccg gacacctgga accccggcag cgacgccgcg agttctccca tgaggtgatc 9360 gcggcgccgt ttgtagcgca gccgtgccgc ccgcaggtac cggtcgtagg acccgcgggc 9420 caggaaccgg gcgaacgcct cctggtcgat gacgggcggt ggtacgcccc cgacgtgctc 9480 cgcgcccagg gcctcggtcc agcgcggcgg ggtcaccgcc cagccgatcc gcagggccgg 9540 cgagagcgtc ttgctgaccg accccagcag cgcgacgtgc tccggtgcca tgccctgcag 9600 ggcgcccacg gggtggcggt cgtatcggaa ctcggcgtcg tagtcgtcct ccagcaccag 9660 gccgtcgacc tcgcgggccc aggcgaccag ctcgccgcga cgggccgggg cgaggaccac 9720 accggtcggg aactggtggg cgggagcgac gatcaccgac cggacctgag gcgcgcgccg 9780 cagcaggtcg acccgcaggc cgtcgccgtc cacgggaacc gggacgggca ccagcccctc 9840 cgccccgacc gtggcgctca gccgcgacca gccagggtcc tccagggcca tgtgggtgtg 9900 gccctcggtc cgcaggaccc ggcacagcct gcgcaccgcg tccagcgtgc ccgcgcagac 9960 gacgagctgc cgggcttcca gcgacgcgcc gcgtccccgc acgaggtagg ccgcgagccg 10020 ctgccggagc cgggcgagac cggccggatc ggggtagccg agctcgcccc aggtcagtgc 10080 gccggtggcc tcccgcaccg cgtccgccca ccgtccgcgg ggaaaggccc gcaggtcggg 10140 tatgccgggc agcatgtcga actccggctc ccaccgcgta ccgacgtccg cctcgggcgt 10200 caccggagcg gggacggcct gcgccctgac ccgggtggcc gagccgctgc gcgcctccag 10260 gtacccctcc gcgacgagct gcgcgtaggc ctccgtcacc acccaccgcg agcagcccag 10320 gtccgccgcc agcgccctgc tcggcggcag cgcgctgccg gaggcgatcc gcccaccggt 10380 caccgccgcc cgcagggcac ggctcagccg gacgtgcagc gggccgtccg ccggcccgcc 10440 cagttcgaga aaggttcccc atgccgggtc ggtccggtcg tcgcccacgg cagccgatgc 10500 tacccaccgc cccgcgacgg ccgggcggcg gcgtccacgg gcccggtgca cactggatgg 10560 cgtggcggag acggaccggc atctcgacca gcggctggag caggccatca tggacctgct 10620 ggagcgacgg gcggccactg cctcgatctg tccgtccgac gccgcgcgtc gggtccacga 10680 gggtgacgac gagggctggc gagccctgct ggaacccgcg cgccgagcgg cctggcgtct 10740 ggtggggtcc ggcgaggtcg aggtgaccca ggccggccgg cccgtcacgc aggccgaggc 10800 ccgcgggccc gtccgcattc gtcgggcggg ttcctgacgg ctcgatccga aggcggaact 10860 cccgtgcccc ggcggcacgg gagctcgacg ccgggaggtc agcgccgcag ggtgagcaca 10920 cccggccgcc acggcagctg gtcgtagggg ccgcccgcgg tgggtgactt gccctggtag 10980 aggaaccgca ggttgcaggg gtcgacggtc atggtctggt cggggttgtc gcggaccagg 11040 tcaccgtggc tgatgtcgtt ggtccaggtg gccccgctgt tggccttgcc cgcgaagggg 11100 ttgctctcgc tcgcggcctg cggggtccac gagccgctca ggctggaggc cgtgaaggaa 11160 cggaagtagc gtccgttcgc gcccatcgcc tcgacgatca tcaggtactg gttctggccc 11220 tgaaccttgt agacctgcac gccctcgaac aggttggcct tcgtgtcgct catgatcgtc 11280 gtgtacgacg agccgaagct gcccgggaag ttcccgatcg gcatgctcgc ccggtagatc 11340 ttgccgttgt caccggcgaa gaacaggtac atgttctgtc cgtcggcgat cagggtctgg 11400 tcgatcgggc cggtgtcgga tcctgagatg ctcccggtga acaacggctg cggagccgac 11460 cagccgttgg ggttggccgg gtcgctggac gtgcggtaga cgaagggcca cgcgccccac 11520 tggtacgcca gcacccagac gttcttgggc gcgaagtaga acagggtggg cgccaccgcc 11580 gcctgactca tcccggtctg gccggccgac gccatgtccg accagttcgt gaaggggctg 11640 aacatcatcg agccgtagga cgaccccgac acgttcgacg cgtagaccag gtgcttgccg 11700 ttgtgggtca cggtggtgaa gtccttgacc gccgcccacc cgttcgccgg ctgcgccagc 11760 acacccgtcg acgaccaccg gtacgccgac ggaagggcac acgccccgtc cgtcgggggc 11820 gtcccggtca ggccggacca cttctgcccg ctgccaccga cgcacgtccc gatctgcacc 11880 gccgtgccgt tggccgtacc ggcgcccgcg gcctccaggc acagcccgga ctccacgccg 11940 acgaccgtgc cgtcggagtt cacccgccac tgctggttcg caccgccgga acagctccag 12000 atctgcaccc gcgtcccggg tgtggtggcg tgacccggaa cgtccaggca cttgttgccg 12060 tacacggtca gccgacggtc gtccgtcaac gtccactgct gattgctccc gccccagcag 12120 tcgtatatct gcag 12134 <210> 141 <211> 1164 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1164) <400> 141 atg acc tta cgc acg ctt cga ccc gcc ggc gcg gcg ccc ccc gtg ggt 48 Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly 1 5 10 15 ccc gcc gcg cgg cac gac ttc gac tcg ctc gtc tcc gac gca tgt gcg 96 Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala 20 25 30 gag tta ctc ggt tcg ctc cgc cgg gcg gac cag cgc aga aga ggt gag 144 Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu 35 40 45 cag tac ata cgc ggg ctg ctc acg gca cag gga cgc aag acc gcc cgg 192 Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg 50 55 60 aac ctc gcc gcc ttc gtc gga gag ggc gcg gcg gaa cag agc ctg cac 240 Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His 65 70 75 80 cac ttc gtc gcc ggg tcg acc tgg gac tgg ggc gag gtg cgg gcc gcg 288 His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala 85 90 95 ctg gcc cgc tac gtg gac gac agg ctg acc ccc gac gcc tgg gtg atc 336 Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile 100 105 110 tgg ccg atg gtg gtc tcc aag gcg ggg gtg cgc tcc gtc ggg gtg agc 384 Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser 115 120 125 cgg cgc ttc gtc tcc gac ctg ggc cgg gtg gtg agc tgc cag cag agt 432 Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser 130 135 140 cac ggg ctg tgg ctg gcc tcg ggc acg acg gcc gcc ccg gtc agc tgg 480 His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp 145 150 155 160 cgc ctg acg ctg ggc ggc ggc cgg agc ggg gag ggc aca ccc cgg cac 528 Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His 165 170 175 ccc ggc gca ccc ggt gag gag gag aac atc gtc cgc ctg gtg gcc gaa 576 Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu 180 185 190 gcc gct cag gcc aac cgc tcc ttg gcc cgc ccc gtg gtg atg gac gca 624 Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala 195 200 205 cgc gcg gcc gtg ctg cca cga ctg gtg cga ggg ctc ggt ctc gcg ggc 672 Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly 210 215 220 ctg ccc ttc atg gtg cgg gtg ggc ggg aac ctc cgg ctg gcc tcg gcg 720 Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala 225 230 235 240 agc ggc cgc ggc ccg gtg gac cac cac acg ggg acc acc tcg gcc cag 768 Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln 245 250 255 cag ttg atg gag cag ctc aag cgg ttg agc cgc ccc gtg gag ttg cgg 816 Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg 260 265 270 ggc tcc ctc agc ctc gtc gcc ccg cac ccc gtc gtc ctg ccg ggt gtg 864 Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val 275 280 285 gtc ccg agg cgg acg ctg acg ctg ctg ggg gtg tgg cgg ggc aac cgc 912 Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Val Trp Arg Gly Asn Arg 290 295 300 cgg cgc ccc gcc gac ctg tgg ctg acc gac ctc acg tcc tgg gac cgc 960 Arg Arg Pro Ala Asp Leu Trp Leu Thr Asp Leu Thr Ser Trp Asp Arg 305 310 315 320 ggc gcc ctg ctg cgg ctg gcg atg ctc acc gaa cag gtc gac gcc gac 1008 Gly Ala Leu Leu Arg Leu Ala Met Leu Thr Glu Gln Val Asp Ala Asp 325 330 335 ttc gac cgg gtg agc gtg ggc gtg ggc atg cgc gac ttc gaa gga cgg 1056 Phe Asp Arg Val Ser Val Gly Val Gly Met Arg Asp Phe Glu Gly Arg 340 345 350 tcg ttc cag ggc tgg cac cgg cac gtg acc ctg gcg tcc atc gcc cac 1104 Ser Phe Gln Gly Trp His Arg His Val Thr Leu Ala Ser Ile Ala His 355 360 365 acg ctg cgg ctg gcg cag ccc tcc gcg cgc ggc gac ctc ggt ggg gcg 1152 Thr Leu Arg Leu Ala Gln Pro Ser Ala Arg Gly Asp Leu Gly Gly Ala 370 375 380 acg gcg gtg tga 1164 Thr Ala Val 385 <210> 142 <211> 387 <212> PRT <213> Streptomyces ambofaciens <400> 142 Met Thr Leu Arg Thr Leu Arg Pro Ala Gly Ala Ala Pro Pro Val Gly 1 5 10 15 Pro Ala Ala Arg His Asp Phe Asp Ser Leu Val Ser Asp Ala Cys Ala 20 25 30 Glu Leu Leu Gly Ser Leu Arg Arg Ala Asp Gln Arg Arg Arg Gly Glu 35 40 45 Gln Tyr Ile Arg Gly Leu Leu Thr Ala Gln Gly Arg Lys Thr Ala Arg 50 55 60 Asn Leu Ala Ala Phe Val Gly Glu Gly Ala Ala Glu Gln Ser Leu His 65 70 75 80 His Phe Val Ala Gly Ser Thr Trp Asp Trp Gly Glu Val Arg Ala Ala 85 90 95 Leu Ala Arg Tyr Val Asp Asp Arg Leu Thr Pro Asp Ala Trp Val Ile 100 105 110 Trp Pro Met Val Val Ser Lys Ala Gly Val Arg Ser Val Gly Val Ser 115 120 125 Arg Arg Phe Val Ser Asp Leu Gly Arg Val Val Ser Cys Gln Gln Ser 130 135 140 His Gly Leu Trp Leu Ala Ser Gly Thr Thr Ala Ala Pro Val Ser Trp 145 150 155 160 Arg Leu Thr Leu Gly Gly Gly Arg Ser Gly Glu Gly Thr Pro Arg His 165 170 175 Pro Gly Ala Pro Gly Glu Glu Glu Asn Ile Val Arg Leu Val Ala Glu 180 185 190 Ala Ala Gln Ala Asn Arg Ser Leu Ala Arg Pro Val Val Met Asp Ala 195 200 205 Arg Ala Ala Val Leu Pro Arg Leu Val Arg Gly Leu Gly Leu Ala Gly 210 215 220 Leu Pro Phe Met Val Arg Val Gly Gly Asn Leu Arg Leu Ala Ser Ala 225 230 235 240 Ser Gly Arg Gly Pro Val Asp His His Thr Gly Thr Thr Ser Ala Gln 245 250 255 Gln Leu Met Glu Gln Leu Lys Arg Leu Ser Arg Pro Val Glu Leu Arg 260 265 270 Gly Ser Leu Ser Leu Val Ala Pro His Pro Val Val Leu Pro Gly Val 275 280 285 Val Pro Arg Arg Thr Leu Thr Leu Leu Gly Val Trp Arg Gly Asn Arg 290 295 300 Arg Arg Pro Ala Asp Leu Trp Leu Thr Asp Leu Thr Ser Trp Asp Arg 305 310 315 320 Gly Ala Leu Leu Arg Leu Ala Met Leu Thr Glu Gln Val Asp Ala Asp 325 330 335 Phe Asp Arg Val Ser Val Gly Val Gly Met Arg Asp Phe Glu Gly Arg 340 345 350 Ser Phe Gln Gly Trp His Arg His Val Thr Leu Ala Ser Ile Ala His 355 360 365 Thr Leu Arg Leu Ala Gln Pro Ser Ala Arg Gly Asp Leu Gly Gly Ala 370 375 380 Thr Ala Val 385 <210> 143 <211> 849 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(849) <400> 143 atg cgt atc gcg gtg aca ggg gcg gcg ggc agt ctg ggc agg cgg gtg 48 Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val 1 5 10 15 gtg cag ctg ctc gcg gac cgg gcc gac gtg gac gtc gtg gcg atg acc 96 Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr 20 25 30 agg cgg aag ctg cct gcc gag gca cta ccg ccg ggg gtg gag tgc gcc 144 Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala 35 40 45 gtc gcc gac tac gcc gac ccg ccc gct ctg cgt gcg gcg ctg aag ggc 192 Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly 50 55 60 gtg gac act ctg gtc ctc gtc tcc agc gac ggg ccc gac gca cgg gtg 240 Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val 65 70 75 80 ctg ctg cac cac cgc aac gtc gtc gcc gcc gtg gtg gcc gag cgc gtc 288 Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val 85 90 95 ggc cat gtc gcg gca ctg agc agc gtc gac gcc gac tcg gcc tcc ccg 336 Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro 100 105 110 ttc tgc tac gcc gtc gtc aac cgg ctc acc gag gat ctg ctg ctc gcc 384 Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala 115 120 125 tcc ggc gtg ccg tgc tcg ttc gcc agg gcc tcg ctg tac atc gag ttc 432 Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe 130 135 140 ttc cta ggc tgg ctc acc cag gcg cgc tcg acc ggg ctg ctg agg ctg 480 Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu 145 150 155 160 ccg gca gcc gat ggc cgg gtg tcc ctg gtg gcg cgc gac gac gtg gcc 528 Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala 165 170 175 cgc gcc ctc gcc gcc ctc gcg gtg ggc ggg ccg acc ggc cgt cac cac 576 Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His 180 185 190 gac atc acg gga ccc gag tcg acg gac ctg gca ggc atc gcc tcc acg 624 Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr 195 200 205 gcg gcg gag gtg tgg cgg aca ccg gtc gcc tac gtg gac atc ccg gcc 672 Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala 210 215 220 gac acg tac tct gcc gaa aca gcg gcg acc ggc ctg gat ccc tgg tgg 720 Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp 225 230 235 240 ctc tac gcc ttc tcc tcc ctg ttc gcc tcg gta cgc gaa cag cgc tgg 768 Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp 245 250 255 gat cgg gtc cgc gac gac tgc gcc cag ctc acc ggc cgc ttg ccc cgc 816 Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg 260 265 270 act ctc cgc gac gtc ctg tca gaa cgc gcg tga 849 Thr Leu Arg Asp Val Leu Ser Glu Arg Ala 275 280 <210> 144 <211> 282 <212> PRT <213> Streptomyces ambofaciens <400> 144 Met Arg Ile Ala Val Thr Gly Ala Ala Gly Ser Leu Gly Arg Arg Val 1 5 10 15 Val Gln Leu Leu Ala Asp Arg Ala Asp Val Asp Val Val Ala Met Thr 20 25 30 Arg Arg Lys Leu Pro Ala Glu Ala Leu Pro Pro Gly Val Glu Cys Ala 35 40 45 Val Ala Asp Tyr Ala Asp Pro Pro Ala Leu Arg Ala Ala Leu Lys Gly 50 55 60 Val Asp Thr Leu Val Leu Val Ser Ser Asp Gly Pro Asp Ala Arg Val 65 70 75 80 Leu Leu His His Arg Asn Val Val Ala Ala Val Val Ala Glu Arg Val 85 90 95 Gly His Val Ala Ala Leu Ser Ser Val Asp Ala Asp Ser Ala Ser Pro 100 105 110 Phe Cys Tyr Ala Val Val Asn Arg Leu Thr Glu Asp Leu Leu Leu Ala 115 120 125 Ser Gly Val Pro Cys Ser Phe Ala Arg Ala Ser Leu Tyr Ile Glu Phe 130 135 140 Phe Leu Gly Trp Leu Thr Gln Ala Arg Ser Thr Gly Leu Leu Arg Leu 145 150 155 160 Pro Ala Ala Asp Gly Arg Val Ser Leu Val Ala Arg Asp Asp Val Ala 165 170 175 Arg Ala Leu Ala Ala Leu Ala Val Gly Gly Pro Thr Gly Arg His His 180 185 190 Asp Ile Thr Gly Pro Glu Ser Thr Asp Leu Ala Gly Ile Ala Ser Thr 195 200 205 Ala Ala Glu Val Trp Arg Thr Pro Val Ala Tyr Val Asp Ile Pro Ala 210 215 220 Asp Thr Tyr Ser Ala Glu Thr Ala Ala Thr Gly Leu Asp Pro Trp Trp 225 230 235 240 Leu Tyr Ala Phe Ser Ser Leu Phe Ala Ser Val Arg Glu Gln Arg Trp 245 250 255 Asp Arg Val Arg Asp Asp Cys Ala Gln Leu Thr Gly Arg Leu Pro Arg 260 265 270 Thr Leu Arg Asp Val Leu Ser Glu Arg Ala 275 280 <210> 145 <211> 1512 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1512) <400> 145 gtg ggc gac gac cgg acc gac ccg gca tgg gga acc ttt ctc gaa ctg 48 Val Gly Asp Asp Arg Thr Asp Pro Ala Trp Gly Thr Phe Leu Glu Leu 1 5 10 15 ggc ggg ccg gcg gac ggc ccg ctg cac gtc cgg ctg agc cgt gcc ctg 96 Gly Gly Pro Ala Asp Gly Pro Leu His Val Arg Leu Ser Arg Ala Leu 20 25 30 cgg gcg gcg gtg acc ggt ggg cgg atc gcc tcc ggc agc gcg ctg ccg 144 Arg Ala Ala Val Thr Gly Gly Arg Ile Ala Ser Gly Ser Ala Leu Pro 35 40 45 ccg agc agg gcg ctg gcg gcg gac ctg ggc tgc tcg cgg tgg gtg gtg 192 Pro Ser Arg Ala Leu Ala Ala Asp Leu Gly Cys Ser Arg Trp Val Val 50 55 60 acg gag gcc tac gcg cag ctc gtc gcg gag ggg tac ctg gag gcg cgc 240 Thr Glu Ala Tyr Ala Gln Leu Val Ala Glu Gly Tyr Leu Glu Ala Arg 65 70 75 80 agc ggc tcg gcc acc cgg gtc agg gcg cag gcc gtc ccc gct ccg gtg 288 Ser Gly Ser Ala Thr Arg Val Arg Ala Gln Ala Val Pro Ala Pro Val 85 90 95 acg ccc gag gcg gac gtc ggt acg cgg tgg gag ccg gag ttc gac atg 336 Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp Met 100 105 110 ctg ccc ggc ata ccc gac ctg cgg gcc ttt ccc cgc gga cgg tgg gcg 384 Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp Ala 115 120 125 gac gcg gtg cgg gag gcc acc ggc gca ctg acc tgg ggc gag ctc ggc 432 Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu Gly 130 135 140 tac ccc gat ccg gcc ggt ctc gcc cgg ctc cgg cag cgg ctc gcg gcc 480 Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala Ala 145 150 155 160 tac ctc gtg cgg gga cgc ggc gcg tcg ctg gaa gcc cgg cag ctc gtc 528 Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu Val 165 170 175 gtc tgc gcg ggc acg ctg gac gcg gtg cgc agg ctg tgc cgg gtc ctg 576 Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val Leu 180 185 190 cgg acc gag ggc cac acc cac atg gcc ctg gag gac cct ggc tgg tcg 624 Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp Ser 195 200 205 cgg ctg agc gcc acg gtc ggg gcg gag ggg ctg gtg ccc gtc ccg gtt 672 Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro Val 210 215 220 ccc gtg gac ggc gac ggc ctg cgg gtc gac ctg ctg cgg cgc gcg cct 720 Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala Pro 225 230 235 240 cag gtc cgg tcg gtg atc gtc gct ccc gcc cac cag ttc ccg acc ggt 768 Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr Gly 245 250 255 gtg gtc ctc gcc ccg gcc cgt cgc ggc gag ctg gtc gcc tgg gcc cgc 816 Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala Arg 260 265 270 gag gtc gac ggc ctg gtg ctg gag gac gac tac gac gcc gag ttc cga 864 Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe Arg 275 280 285 tac gac cgc cac ccc gtg ggc gcc ctg cag ggc atg gca ccg gag cac 912 Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu His 290 295 300 gtc gcg ctg ctg ggg tcg gtc agc aag acg ctc tcg ccg gcc ctg cgg 960 Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu Arg 305 310 315 320 atc ggc tgg gcg gtg acc ccg ccg cgc tgg acc gag gcc ctg ggc gcg 1008 Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly Ala 325 330 335 gag cac gtc ggg ggc gta cca ccg ccc gtc atc gac cag gag gcg ttc 1056 Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala Phe 340 345 350 gcc cgg ttc ctg gcc cgc ggg tcc tac gac cgg tac ctg cgg gcg gca 1104 Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala Ala 355 360 365 cgg ctg cgc tac aaa cgg cgc cgc gat cac ctc atg gga gaa ctc gcg 1152 Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu Ala 370 375 380 gcg tcg ctg ccg ggg ttc cag gtg tcc ggt gcg gcg gcc ggc ttc cac 1200 Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe His 385 390 395 400 ctg ctg ctg tcc ctg acg gac tgc tcg gcg ccc acc gtc gtc agg gag 1248 Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg Glu 405 410 415 gcg gcg cgg cgt gac gtg agg ctg gcg gat ctc gac gcc tac cgg atg 1296 Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg Met 420 425 430 gcg cgg gcc gag cac cac ccg acg gcc cgg gcc ggc gac tcc ggc ggg 1344 Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly Gly 435 440 445 gcg cgg gcc gtg gcc gcc gcc ggc ccc gcg ctg gtc ctc ggc tac ggc 1392 Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr Gly 450 455 460 aat ctg gcg gac cac gcc gtg ccc gga gcc gtg cgg cgc ctg gca cag 1440 Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala Gln 465 470 475 480 gcc atc gac gcg gcc cgg cgc cac gac cgg cgg cac gtc gac gcc ggg 1488 Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala Gly 485 490 495 cgg gcc ggg gag cgg gcc gac tga 1512 Arg Ala Gly Glu Arg Ala Asp 500 <210> 146 <211> 503 <212> PRT <213> Streptomyces ambofaciens <400> 146 Val Gly Asp Asp Arg Thr Asp Pro Ala Trp Gly Thr Phe Leu Glu Leu 1 5 10 15 Gly Gly Pro Ala Asp Gly Pro Leu His Val Arg Leu Ser Arg Ala Leu 20 25 30 Arg Ala Ala Val Thr Gly Gly Arg Ile Ala Ser Gly Ser Ala Leu Pro 35 40 45 Pro Ser Arg Ala Leu Ala Ala Asp Leu Gly Cys Ser Arg Trp Val Val 50 55 60 Thr Glu Ala Tyr Ala Gln Leu Val Ala Glu Gly Tyr Leu Glu Ala Arg 65 70 75 80 Ser Gly Ser Ala Thr Arg Val Arg Ala Gln Ala Val Pro Ala Pro Val 85 90 95 Thr Pro Glu Ala Asp Val Gly Thr Arg Trp Glu Pro Glu Phe Asp Met 100 105 110 Leu Pro Gly Ile Pro Asp Leu Arg Ala Phe Pro Arg Gly Arg Trp Ala 115 120 125 Asp Ala Val Arg Glu Ala Thr Gly Ala Leu Thr Trp Gly Glu Leu Gly 130 135 140 Tyr Pro Asp Pro Ala Gly Leu Ala Arg Leu Arg Gln Arg Leu Ala Ala 145 150 155 160 Tyr Leu Val Arg Gly Arg Gly Ala Ser Leu Glu Ala Arg Gln Leu Val 165 170 175 Val Cys Ala Gly Thr Leu Asp Ala Val Arg Arg Leu Cys Arg Val Leu 180 185 190 Arg Thr Glu Gly His Thr His Met Ala Leu Glu Asp Pro Gly Trp Ser 195 200 205 Arg Leu Ser Ala Thr Val Gly Ala Glu Gly Leu Val Pro Val Pro Val 210 215 220 Pro Val Asp Gly Asp Gly Leu Arg Val Asp Leu Leu Arg Arg Ala Pro 225 230 235 240 Gln Val Arg Ser Val Ile Val Ala Pro Ala His Gln Phe Pro Thr Gly 245 250 255 Val Val Leu Ala Pro Ala Arg Arg Gly Glu Leu Val Ala Trp Ala Arg 260 265 270 Glu Val Asp Gly Leu Val Leu Glu Asp Asp Tyr Asp Ala Glu Phe Arg 275 280 285 Tyr Asp Arg His Pro Val Gly Ala Leu Gln Gly Met Ala Pro Glu His 290 295 300 Val Ala Leu Leu Gly Ser Val Ser Lys Thr Leu Ser Pro Ala Leu Arg 305 310 315 320 Ile Gly Trp Ala Val Thr Pro Pro Arg Trp Thr Glu Ala Leu Gly Ala 325 330 335 Glu His Val Gly Gly Val Pro Pro Pro Val Ile Asp Gln Glu Ala Phe 340 345 350 Ala Arg Phe Leu Ala Arg Gly Ser Tyr Asp Arg Tyr Leu Arg Ala Ala 355 360 365 Arg Leu Arg Tyr Lys Arg Arg Arg Asp His Leu Met Gly Glu Leu Ala 370 375 380 Ala Ser Leu Pro Gly Phe Gln Val Ser Gly Ala Ala Ala Gly Phe His 385 390 395 400 Leu Leu Leu Ser Leu Thr Asp Cys Ser Ala Pro Thr Val Val Arg Glu 405 410 415 Ala Ala Arg Arg Asp Val Arg Leu Ala Asp Leu Asp Ala Tyr Arg Met 420 425 430 Ala Arg Ala Glu His His Pro Thr Ala Arg Ala Gly Asp Ser Gly Gly 435 440 445 Ala Arg Ala Val Ala Ala Ala Gly Pro Ala Leu Val Leu Gly Tyr Gly 450 455 460 Asn Leu Ala Asp His Ala Val Pro Gly Ala Val Arg Arg Leu Ala Gln 465 470 475 480 Ala Ile Asp Ala Ala Arg Arg His Asp Arg Arg His Val Asp Ala Gly 485 490 495 Arg Ala Gly Glu Arg Ala Asp 500 <210> 147 <211> 276 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(276) <400> 147 gtg gcg gag acg gac cgg cat ctc gac cag cgg ctg gag cag gcc atc 48 Val Ala Glu Thr Asp Arg His Leu Asp Gln Arg Leu Glu Gln Ala Ile 1 5 10 15 atg gac ctg ctg gag cga cgg gcg gcc act gcc tcg atc tgt ccg tcc 96 Met Asp Leu Leu Glu Arg Arg Ala Ala Thr Ala Ser Ile Cys Pro Ser 20 25 30 gac gcc gcg cgt cgg gtc cac gag ggt gac gac gag ggc tgg cga gcc 144 Asp Ala Ala Arg Arg Val His Glu Gly Asp Asp Glu Gly Trp Arg Ala 35 40 45 ctg ctg gaa ccc gcg cgc cga gcg gcc tgg cgt ctg gtg ggg tcc ggc 192 Leu Leu Glu Pro Ala Arg Arg Ala Ala Trp Arg Leu Val Gly Ser Gly 50 55 60 gag gtc gag gtg acc cag gcc ggc cgg ccc gtc acg cag gcc gag gcc 240 Glu Val Glu Val Thr Gln Ala Gly Arg Pro Val Thr Gln Ala Glu Ala 65 70 75 80 cgc ggg ccc gtc cgc att cgt cgg gcg ggt tcc tga 276 Arg Gly Pro Val Arg Ile Arg Arg Ala Gly Ser 85 90 <210> 148 <211> 91 <212> PRT <213> Streptomyces ambofaciens <400> 148 Val Ala Glu Thr Asp Arg His Leu Asp Gln Arg Leu Glu Gln Ala Ile 1 5 10 15 Met Asp Leu Leu Glu Arg Arg Ala Ala Thr Ala Ser Ile Cys Pro Ser 20 25 30 Asp Ala Ala Arg Arg Val His Glu Gly Asp Asp Glu Gly Trp Arg Ala 35 40 45 Leu Leu Glu Pro Ala Arg Arg Ala Ala Trp Arg Leu Val Gly Ser Gly 50 55 60 Glu Val Glu Val Thr Gln Ala Gly Arg Pro Val Thr Gln Ala Glu Ala 65 70 75 80 Arg Gly Pro Val Arg Ile Arg Arg Ala Gly Ser 85 90 <210> 149 <211> 1236 <212> DNA <213> Streptomyces ambofaciens <220> <221> CDS <222> (1)..(1236) <400> 149 ctg cag ata tac gac tgc tgg ggc ggg agc aat cag cag tgg acg ttg 48 Leu Gln Ile Tyr Asp Cys Trp Gly Gly Ser Asn Gln Gln Trp Thr Leu 1 5 10 15 acg gac gac cgt cgg ctg acc gtg tac ggc aac aag tgc ctg gac gtt 96 Thr Asp Asp Arg Arg Leu Thr Val Tyr Gly Asn Lys Cys Leu Asp Val 20 25 30 ccg ggt cac gcc acc aca ccc ggg acg cgg gtg cag atc tgg agc tgt 144 Pro Gly His Ala Thr Thr Pro Gly Thr Arg Val Gln Ile Trp Ser Cys 35 40 45 tcc ggc ggt gcg aac cag cag tgg cgg gtg aac tcc gac ggc acg gtc 192 Ser Gly Gly Ala Asn Gln Gln Trp Arg Val Asn Ser Asp Gly Thr Val 50 55 60 gtc ggc gtg gag tcc ggg ctg tgc ctg gag gcc gcg ggc gcc ggt acg 240 Val Gly Val Glu Ser Gly Leu Cys Leu Glu Ala Ala Gly Ala Gly Thr 65 70 75 80 gcc aac ggc acg gcg gtg cag atc ggg acg tgc gtc ggt ggc agc ggg 288 Ala Asn Gly Thr Ala Val Gln Ile Gly Thr Cys Val Gly Gly Ser Gly 85 90 95 cag aag tgg tcc ggc ctg acc ggg acg ccc ccg acg gac ggg gcg tgt 336 Gln Lys Trp Ser Gly Leu Thr Gly Thr Pro Pro Thr Asp Gly Ala Cys 100 105 110 gcc ctt ccg tcg gcg tac cgg tgg tcg tcg acg ggt gtg ctg gcg cag 384 Ala Leu Pro Ser Ala Tyr Arg Trp Ser Ser Thr Gly Val Leu Ala Gln 115 120 125 ccg gcg aac ggg tgg gcg gcg gtc aag gac ttc acc acc gtg acc cac 432 Pro Ala Asn Gly Trp Ala Ala Val Lys Asp Phe Thr Thr Val Thr His 130 135 140 aac ggc aag cac ctg gtc tac gcg tcg aac gtg tcg ggg tcg tcc tac 480 Asn Gly Lys His Leu Val Tyr Ala Ser Asn Val Ser Gly Ser Ser Tyr 145 150 155 160 ggc tcg atg atg ttc agc ccc ttc acg aac tgg tcg gac atg gcg tcg 528 Gly Ser Met Met Phe Ser Pro Phe Thr Asn Trp Ser Asp Met Ala Ser 165 170 175 gcc ggc cag acc ggg atg agt cag gcg gcg gtg gcg ccc acc ctg ttc 576 Ala Gly Gln Thr Gly Met Ser Gln Ala Ala Val Ala Pro Thr Leu Phe 180 185 190 tac ttc gcg ccc aag aac gtc tgg gtg ctg gcg tac cag tgg ggc gcg 624 Tyr Phe Ala Pro Lys Asn Val Trp Val Leu Ala Tyr Gln Trp Gly Ala 195 200 205 tgg ccc ttc gtc tac cgc acg tcc agc gac ccg gcc aac ccc aac ggc 672 Trp Pro Phe Val Tyr Arg Thr Ser Ser Asp Pro Ala Asn Pro Asn Gly 210 215 220 tgg tcg gct ccg cag ccg ttg ttc acc ggg agc atc tca gga tcc gac 720 Trp Ser Ala Pro Gln Pro Leu Phe Thr Gly Ser Ile Ser Gly Ser Asp 225 230 235 240 acc ggc ccg atc gac cag acc ctg atc gcc gac gga cag aac atg tac 768 Thr Gly Pro Ile Asp Gln Thr Leu Ile Ala Asp Gly Gln Asn Met Tyr 245 250 255 ctg ttc ttc gcc ggt gac aac ggc aag atc tac cgg gcg agc atg ccg 816 Leu Phe Phe Ala Gly Asp Asn Gly Lys Ile Tyr Arg Ala Ser Met Pro 260 265 270 atc ggg aac ttc ccg ggc agc ttc ggc tcg tcg tac acg acg atc atg 864 Ile Gly Asn Phe Pro Gly Ser Phe Gly Ser Ser Tyr Thr Thr Ile Met 275 280 285 agc gac acg aag gcc aac ctg ttc gag ggc gtg cag gtc tac aag gtt 912 Ser Asp Thr Lys Ala Asn Leu Phe Glu Gly Val Gln Val Tyr Lys Val 290 295 300 cag ggc cag aac cag tac ctg atg atc gtc gag gcg atg ggc gcg aac 960 Gln Gly Gln Asn Gln Tyr Leu Met Ile Val Glu Ala Met Gly Ala Asn 305 310 315 320 gga cgc tac ttc cgt tcc ttc acg gcc tcc agc ctg agc ggc tcg tgg 1008 Gly Arg Tyr Phe Arg Ser Phe Thr Ala Ser Ser Leu Ser Gly Ser Trp 325 330 335 acc ccg cag gcc gcg agc gag agc aac ccc ttc gcg ggc aag gcc aac 1056 Thr Pro Gln Ala Ala Ser Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn 340 345 350 agc ggg gcc acc tgg acc aac gac atc agc cac ggt gac ctg gtc cgc 1104 Ser Gly Ala Thr Trp Thr Asn Asp Ile Ser His Gly Asp Leu Val Arg 355 360 365 gac aac ccc gac cag acc atg acc gtc gac ccc tgc aac ctg cgg ttc 1152 Asp Asn Pro Asp Gln Thr Met Thr Val Asp Pro Cys Asn Leu Arg Phe 370 375 380 ctc tac cag ggc aag tca ccc acc gcg ggc ggc ccc tac gac cag ctg 1200 Leu Tyr Gln Gly Lys Ser Pro Thr Ala Gly Gly Pro Tyr Asp Gln Leu 385 390 395 400 ccg tgg cgg ccg ggt gtg ctc acc ctg cgg cgc tga 1236 Pro Trp Arg Pro Gly Val Leu Thr Leu Arg Arg 405 410 <210> 150 <211> 411 <212> PRT <213> Streptomyces ambofaciens <400> 150 Leu Gln Ile Tyr Asp Cys Trp Gly Gly Ser Asn Gln Gln Trp Thr Leu 1 5 10 15 Thr Asp Asp Arg Arg Leu Thr Val Tyr Gly Asn Lys Cys Leu Asp Val 20 25 30 Pro Gly His Ala Thr Thr Pro Gly Thr Arg Val Gln Ile Trp Ser Cys 35 40 45 Ser Gly Gly Ala Asn Gln Gln Trp Arg Val Asn Ser Asp Gly Thr Val 50 55 60 Val Gly Val Glu Ser Gly Leu Cys Leu Glu Ala Ala Gly Ala Gly Thr 65 70 75 80 Ala Asn Gly Thr Ala Val Gln Ile Gly Thr Cys Val Gly Gly Ser Gly 85 90 95 Gln Lys Trp Ser Gly Leu Thr Gly Thr Pro Pro Thr Asp Gly Ala Cys 100 105 110 Ala Leu Pro Ser Ala Tyr Arg Trp Ser Ser Thr Gly Val Leu Ala Gln 115 120 125 Pro Ala Asn Gly Trp Ala Ala Val Lys Asp Phe Thr Thr Val Thr His 130 135 140 Asn Gly Lys His Leu Val Tyr Ala Ser Asn Val Ser Gly Ser Ser Tyr 145 150 155 160 Gly Ser Met Met Phe Ser Pro Phe Thr Asn Trp Ser Asp Met Ala Ser 165 170 175 Ala Gly Gln Thr Gly Met Ser Gln Ala Ala Val Ala Pro Thr Leu Phe 180 185 190 Tyr Phe Ala Pro Lys Asn Val Trp Val Leu Ala Tyr Gln Trp Gly Ala 195 200 205 Trp Pro Phe Val Tyr Arg Thr Ser Ser Asp Pro Ala Asn Pro Asn Gly 210 215 220 Trp Ser Ala Pro Gln Pro Leu Phe Thr Gly Ser Ile Ser Gly Ser Asp 225 230 235 240 Thr Gly Pro Ile Asp Gln Thr Leu Ile Ala Asp Gly Gln Asn Met Tyr 245 250 255 Leu Phe Phe Ala Gly Asp Asn Gly Lys Ile Tyr Arg Ala Ser Met Pro 260 265 270 Ile Gly Asn Phe Pro Gly Ser Phe Gly Ser Ser Tyr Thr Thr Ile Met 275 280 285 Ser Asp Thr Lys Ala Asn Leu Phe Glu Gly Val Gln Val Tyr Lys Val 290 295 300 Gln Gly Gln Asn Gln Tyr Leu Met Ile Val Glu Ala Met Gly Ala Asn 305 310 315 320 Gly Arg Tyr Phe Arg Ser Phe Thr Ala Ser Ser Leu Ser Gly Ser Trp 325 330 335 Thr Pro Gln Ala Ala Ser Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn 340 345 350 Ser Gly Ala Thr Trp Thr Asn Asp Ile Ser His Gly Asp Leu Val Arg 355 360 365 Asp Asn Pro Asp Gln Thr Met Thr Val Asp Pro Cys Asn Leu Arg Phe 370 375 380 Leu Tyr Gln Gly Lys Ser Pro Thr Ala Gly Gly Pro Tyr Asp Gln Leu 385 390 395 400 Pro Trp Arg Pro Gly Val Leu Thr Leu Arg Arg 405 410 <210> 151 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF36 <400> 151 ttgccgtagc cgaggaccag cg 22 <210> 152 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF37 <400> 152 cacatggccc tggaggaccc tg 22 <210> 153 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF42 <400> 153 aagcttgtac ggcccacaga atgatgtcac 30 <210> 154 <211> 30 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF43 <400> 154 aagcttcgac taccttggtg atctcgcctt 30 <210> 155 <211> 65 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF32 <400> 155 caaccgcttg agctgctcca tcaactgctg ggccgaggta tcgcgcgcgc ttcgttcggg 60 acgaa 65 <210> 156 <211> 65 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF33 <400> 156 tgggtcccgc cgcgcggcac gacttcgact cgctcgtcta tctgcctctt cgtcccgaag 60 caact 65 <210> 157 <211> 65 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR71 <400> 157 cgtcatcgac gtgcggggaa gacagaggtg ataccgatga tcgcgcgcgc ttcgttcggg 60 acgaa 65 <210> 158 <211> 65 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide EDR72 <400> 158 gccagcacct cgtccagctg ctcgacggaa ctcaccccca tctgcctctt cgtcccgaag 60 caact 65 <210> 159 <211> 66 <212> DNA <213> Artificial sequence <220> <223> Artificial sequence description: Oligonucleotide KF52 <400> 159 gatccgccag cctcacgtca cgccgcgccg cctccctgac atcgcgcgcg cttcgttcgg 60 gacgaa 66 <210> 160 <211> 66 <212> DNA <213> Artificial sequnce <220> <223> Artificial sequence description: Oligonucleotide KF53 <400> 160 gaggcggacg tcggtacgcg gtgggagccg gagttcgaca atctgcctct tcgtcccgaa 60 gcaact 66 <210> 161 <211> 2540 <212> DNA <213> Streptomyces ambofaciens <400> 161 ctgcagggcg cccacggggt ggcggtcgta tcggaactcg gcgtcgtagt cgtcctccag 60 caccaggccg tcgacctcgc gggcccaggc gaccagctcg ccgcgacggg ccggggcgag 120 gaccacaccg gtcgggaact ggtgggcggg agcgacgatc accgaccgga cctgaggcgc 180 gcgccgcagc aggtcgaccc gcaggccgtc gccgtccacg ggaaccggga cgggcaccag 240 cccctccgcc ccgaccgtgg cgctcagccg cgaccagcca gggtcctcca gggccatgtg 300 ggtgtggccc tcggtccgca ggacccggca cagcctgcgc accgcgtcca gcgtgcccgc 360 gcagacgacg agctgccggg cttccagcga cgcgccgcgt ccccgcacga ggtaggccgc 420 gagccgctgc cggagccggg cgagaccggc cggatcgggg tagccgagct cgccccaggt 480 cagtgcgccg gtggcctccc gcaccgcgtc cgcccaccgt ccgcggggaa aggcccgcag 540 gtcgggtatg ccgggcagca tgtcgaactc cggctcccac cgcgtaccga cgtccgcctc 600 gggcgtcacc ggagcgggga cggcctgcgc cctgacccgg gtggccgagc cgctgcgcgc 660 ctccaggtac ccctccgcga cgagctgcgc gtaggcctcc gtcaccaccc accgcgagca 720 gcccaggtcc gccgccagcg ccctgctcgg cggcagcgcg ctgccggagg cgatccgccc 780 accggtcacc gccgcccgca gggcacggct cagccggacg tgcagcgggc cgtccgccgg 840 cccgcccagt tcgagaaagg ttccccatgc cgggtcggtc cggtcgtcgc ccacggcagc 900 cgatgctacc caccgccccg cgacggccgg gcggcggcgt ccacgggccc ggtgcacact 960 ggatggcgtg gcggagacgg accggcatct cgaccagcgg ctggagcagg ccatcatgga 1020 cctgctggag cgacgggcgg ccactgcctc gatctgtccg tccgacgccg cgcgtcgggt 1080 ccacgagggt gacgacgagg gctggcgagc cctgctggaa cccgcgcgcc gagcggcctg 1140 gcgtctggtg gggtccggcg aggtcgaggt gacccaggcc ggccggcccg tcacgcaggc 1200 cgaggcccgc gggcccgtcc gcattcgtcg ggcgggttcc tgacggctcg atccgaaggc 1260 ggaactcccg tgccccggcg gcacgggagc tcgacgccgg gaggtcagcg ccgcagggtg 1320 agcacacccg gccgccacgg cagctggtcg taggggccgc ccgcggtggg tgacttgccc 1380 tggtagagga accgcaggtt gcaggggtcg acggtcatgg tctggtcggg gttgtcgcgg 1440 accaggtcac cgtggctgat gtcgttggtc caggtggccc cgctgttggc cttgcccgcg 1500 aaggggttgc tctcgctcgc ggcctgcggg gtccacgagc cgctcaggct ggaggccgtg 1560 aaggaacgga agtagcgtcc gttcgcgccc atcgcctcga cgatcatcag gtactggttc 1620 tggccctgaa ccttgtagac ctgcacgccc tcgaacaggt tggccttcgt gtcgctcatg 1680 atcgtcgtgt acgacgagcc gaagctgccc gggaagttcc cgatcggcat gctcgcccgg 1740 tagatcttgc cgttgtcacc ggcgaagaac aggtacatgt tctgtccgtc ggcgatcagg 1800 gtctggtcga tcgggccggt gtcggatcct gagatgctcc cggtgaacaa cggctgcgga 1860 gccgaccagc cgttggggtt ggccgggtcg ctggacgtgc ggtagacgaa gggccacgcg 1920 ccccactggt acgccagcac ccagacgttc ttgggcgcga agtagaacag ggtgggcgcc 1980 accgccgcct gactcatccc ggtctggccg gccgacgcca tgtccgacca gttcgtgaag 2040 gggctgaaca tcatcgagcc gtaggacgac cccgacacgt tcgacgcgta gaccaggtgc 2100 ttgccgttgt gggtcacggt ggtgaagtcc ttgaccgccg cccacccgtt cgccggctgc 2160 gccagcacac ccgtcgacga ccaccggtac gccgacggaa gggcacacgc cccgtccgtc 2220 gggggcgtcc cggtcaggcc ggaccacttc tgcccgctgc caccgacgca cgtcccgatc 2280 tgcaccgccg tgccgttggc cgtaccggcg cccgcggcct ccaggcacag cccggactcc 2340 acgccgacga ccgtgccgtc ggagttcacc cgccactgct ggttcgcacc gccggaacag 2400 ctccagatct gcacccgcgt cccgggtgtg gtggcgtgac ccggaacgtc caggcacttg 2460 ttgccgtaca cggtcagccg acggtcgtcc gtcaacgtcc actgctgatt gctcccgccc 2520 cagcagtcgt atatctgcag 2540

Claims (93)

  1. 폴리뉴클레오티드의 서열이
    (a) 서열 번호 111 또는 141의 서열 중의 하나, 또는
    (b) 유전 암호 축퇴성으로 인해 서열 (a)로부터 수득되는 서열들 중의 하나인, 스피라마이신 생합성에 관여하는 폴리펩티드를 암호화하는 폴리뉴클레오티드.
  2. 삭제
  3. 제1항에 있어서, 스트렙토마이세스(Streptomyces) 속 세균으로부터 분리되는 폴리뉴클레오티드.
  4. 제1항에 청구된 바와 같은 폴리뉴클레오티드의 발현으로부터 생성된 폴리펩티드.
  5. 제1항에 청구된 바와 같은 하나 이상의 폴리뉴클레오티드를 포함하는 재조합 DNA.
  6. 제5항에 있어서, 박테리오파아지, 플라스미드, 파아지미드, 통합(integrative) 벡터, 포스미드, 코스미드, 셔틀 벡터, BAC 및 PAC 중에서 선택되는 벡터 내에 포함되어 있는 재조합 DNA.
  7. 제6항에 있어서, pSPM36, pSPM58, pSPM74, pSPM75, 및 pSPM107 중에서 선택되는 재조합 DNA.
  8. 제4항에 청구된 바와 같은 폴리펩티드를 암호화하는 하나 이상의 핵산 서열을 포함하는 발현 벡터.
  9. 적합한 발현 벡터와, 제4항에 청구된 바와 같은 하나 이상의 폴리펩티드의 발현을 허용하는 숙주 세포를 포함하는 조합물.
  10. 제9항에 있어서, 이. 콜라이(E. coli) 세균에서의 발현 시스템, 곤충 세포에서의 발현을 허용하는 바쿨로바이러스 발현 시스템, 효모 세포에서의 발현을 허용하는 발현 시스템, 및 포유류 세포에서의 발현을 허용하는 발현 시스템 중에서 선택되는 조합물.
  11. 제1항, 제5항, 제6항, 제7항 및 제8항 중의 어느 한 항에 청구된 바와 같은 하나 이상의 폴리뉴클레오티드, 하나 이상의 재조합 DNA 또는 하나 이상의 발현 벡터가 도입된 숙주 세포.
  12. a) 제4항에 청구된 바와 같은 폴리펩티드를 암호화하는 하나 이상의 핵산을 적합한 벡터 내로 삽입하는 단계;
    b) 단계 a)의 벡터로 미리 형질전환 또는 형질감염시킨 숙주 세포를 적합한 배양 배지에서 배양하는 단계;
    c) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및
    d) 단계 c)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 폴리펩티드를 분리 및 정제하는 단계를 포함하는, 제4항에 청구된 바와 같은 폴리펩티드의 생성 방법.
  13. 하나 이상의 매크롤리드를 생산하는 미생물에서, 상기 매크롤리드의 생합성에 관여하는 하나 이상의 단백질의 기능을 제1항에 청구된 바와 같은 서열을 포함하는 하나 이상의 유전자에서 수행되는 돌연변이 유발에 의해 불활성화시킴으로써 수득되는, 하나 이상의 매크롤리드에 대한 생합성 경로의 특정 단계에서 차단된 미생물.
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 제13항에 있어서, 돌연변이 유발이 서열 번호 111 또는 141의 서열 중 하나 이상을 포함하는 하나 이상의 유전자에서 수행되는 미생물.
  20. a) 제13항에 청구된 바와 같은 미생물을 적합한 배양 배지에서 배양하는 단계;
    b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및
    c) 단계 b)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 매크롤리드 생합성 중간체를 분리 및 정제하는 단계를 포함하는, 상기 매크롤리드 생합성 중간체의 제조 방법.
  21. 생합성 중간체를 제20항의 방법에 따라서 제조하고, 이로써 제조된 중간체를 변형시키는, 매크롤리드로부터 유도된 분자의 제조 방법.
  22. 제21항에 있어서, 중간체를 기질로서 사용함으로써 이러한 중간체를 변형시킬 수 있는 단백질을 암호화하는 하나 이상의 유전자를 상기 미생물 내로 도입하는 제조 방법.
  23. 제21항에 있어서, 매크롤리드가 스피라마이신인 제조 방법.
  24. 제21항에 있어서, 사용된 미생물이 에스. 암보파시엔스의 균주인 제조 방법.
  25. 제1항에 청구된 바와 같은 서열을 포함하는 하나 이상의 유전자에서 유전자 변형을 지니고 있거나, 제1항에 청구된 바와 같은 서열을 포함하는 하나 이상의 유전자를 과발현하거나, 제1항에 청구된 바와 같은 서열을 포함하는 하나 이상의 유전자에서 유전자 변형을 지니고 있고 제1항에 청구된 바와 같은 서열을 포함하는 하나 이상의 유전자를 과발현하는, 매크롤리드-생산 돌연변이체 미생물.
  26. 제25항에 있어서, 고려 중인 유전자의 과발현이, 매크롤리드-생산 미생물을 제5항 또는 제8항에 청구된 바와 같은 재조합 DNA 작제물로 형질전환시켜 상기 유전자의 과발현을 허용함으로써 획득되는, 돌연변이체 미생물.
  27. 제25항에 있어서, 유전자 변형이, 서열 번호 111 또는 141 중 하나 이상의 서열 또는 유전 암호 축퇴성으로 인해 이로부터 수득되는 서열 중의 하나를 포함하는 하나 이상의 유전자에서 수행되는, 돌연변이체 미생물.
  28. 제25항에 있어서, 서열 번호 111 또는 141 중 하나 이상의 서열 또는 유전 암호 축퇴성으로 인해 이로부터 수득되는 서열 중의 하나를 포함하는 하나 이상의 유전자를 과발현하는 돌연변이체 미생물.
  29. 제25항에 있어서, 스트렙토마이세스 속 세균인 돌연변이체 미생물.
  30. 제25항에 있어서, 매크롤리드가 스피라마이신인 돌연변이체 미생물.
  31. 제25항에 있어서, 에스. 암보파시엔스 균주인 돌연변이체 미생물.
  32. a) 제25항에 청구된 바와 같은 미생물을 적합한 배양 배지에서 배양하는 단계;
    b) 이와 같이 조건화된 배양 배지 또는 세포 추출물을 회수하는 단계; 및
    c) 단계 b)에서 수득된 세포 추출물로부터 또는 상기 배양 배지로부터 생성된 매크롤리드(들)를 분리 및 정제하는 단계를 포함하는, 매크롤리드의 생성 방법.
  33. 제1항에 청구된 바와 같은 폴리뉴클레오티드 중의 하나에 상보적인 폴리뉴클레오티드.
  34. 2003년 10월 6일자로 기탁 기관{Collection Nationale de Cultures de Microorganismes(CNCM)[National Collection of Cultures and Microorganisms] Pasteur Institute, 25, rue du Docteur Roux 75724 Paris Cedex 15, France}에 등록 번호 I-3101로 기탁된 균주 OSC2/pSPM75(1) 또는 균주 OSC2/pSPM75(2)인, 스트렙토마이세스 암보파시엔스 균주.
  35. 서열 번호 112 또는 서열 번호 142의 서열로 이루어진 폴리펩티드.
  36. 서열 번호 142의 서열로 이루어진 폴리펩티드.
  37. 스트렙토마이세스 암보파시엔스에서 제35항 또는 제36항에 청구된 바와 같은 폴리펩티드의 발현을 허용하는 발현 벡터.
  38. 제37항에 있어서, 플라스미드 pSPM75인 발현 벡터.
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
  79. 삭제
  80. 삭제
  81. 삭제
  82. 삭제
  83. 삭제
  84. 삭제
  85. 삭제
  86. 삭제
  87. 삭제
  88. 삭제
  89. 삭제
  90. 삭제
  91. 삭제
  92. 삭제
  93. 삭제
KR1020057006111A 2002-10-08 2003-10-08 스피라마이신의 생합성에 관여하는 폴리펩티드, 이들폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도 KR101110175B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
FR0212489A FR2845394A1 (fr) 2002-10-08 2002-10-08 Polypeptides impliques dans la biosynthese des spiramycines, sequences nucleotidiques codant ces polypeptides et leurs applications
FR0212489 2002-10-08
FR0302439A FR2851773A1 (fr) 2003-02-27 2003-02-27 Polypeptides impliques dans la biosynthese des spiramycines, sequences nucleotidiques codant ces polypeptides et leurs applications
FR0302439 2003-02-27
US49349003P 2003-08-07 2003-08-07
US60/493,490 2003-08-07
PCT/FR2003/002962 WO2004033689A2 (fr) 2002-10-08 2003-10-08 Polypeptides impliques dans la biosynthese des spiramycines, sequences nucleotidiques codant ces polypeptides et leurs applications.

Publications (2)

Publication Number Publication Date
KR20050084843A KR20050084843A (ko) 2005-08-29
KR101110175B1 true KR101110175B1 (ko) 2012-07-18

Family

ID=32096598

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057006111A KR101110175B1 (ko) 2002-10-08 2003-10-08 스피라마이신의 생합성에 관여하는 폴리펩티드, 이들폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도

Country Status (10)

Country Link
EP (1) EP1551975A2 (ko)
JP (1) JP5042497B2 (ko)
KR (1) KR101110175B1 (ko)
AU (1) AU2003300479B2 (ko)
BR (1) BRPI0314543B8 (ko)
CA (1) CA2501445C (ko)
IL (1) IL167854A (ko)
MX (1) MXPA05002852A (ko)
NO (1) NO335995B1 (ko)
WO (1) WO2004033689A2 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111349595A (zh) * 2018-12-20 2020-06-30 沈阳福洋医药科技有限公司 一种螺旋霉素产生菌、可利霉素产生菌、构建方法、应用及提高产物产量的方法
WO2024074637A1 (en) * 2022-10-07 2024-04-11 Syngenta Crop Protection Ag Means and methods for controlling pathogens and pests in plants

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5098837A (en) 1988-06-07 1992-03-24 Eli Lilly And Company Macrolide biosynthetic genes for use in streptomyces and other organisms
US5240849A (en) 1988-05-24 1993-08-31 Sanraku Incorporated Dna coding for enzyme capable of acylating the 4"-position of macrolide antibiotic
US5322937A (en) 1990-06-01 1994-06-21 Mercian Corporation Genes encoding a 3-acylation enzyme for macrolide antibiotics

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5068189A (en) * 1988-05-13 1991-11-26 Eli Lilly And Company Recombinant dna vectors encoding a 4"-o-isovaleryl acylase derived from a carbomycin biosynthetic gene, designated care, for use in streptomyces and other organisms
US5514544A (en) * 1991-07-26 1996-05-07 Eli Lilly And Company Activator gene for macrolide biosynthesis
JPH0638750A (ja) * 1991-08-09 1994-02-15 Meiji Seika Kaisha Ltd マクロライド抗生物質の3位アシル化酵素およびそれをコードする遺伝子
JPH06121677A (ja) * 1992-01-23 1994-05-06 Mercian Corp マクロライド抗生物質のアシル化酵素遺伝子の高発現方法
CA2197524A1 (en) * 1996-02-22 1997-08-22 Bradley Stuart Dehoff Polyketide synthase genes
CA2197160C (en) * 1996-02-22 2007-05-01 Stanley Gene Burgett Platenolide synthase gene
WO1999005283A2 (fr) * 1997-07-25 1999-02-04 Hoechst Marion Roussel Genes de biosynthese et de transfert des 6-desoxyhexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
ATE321139T1 (de) * 2001-07-26 2006-04-15 Ecopia Biosciences Inc Gene und proteine zur rosaramicin biosynthese

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5240849A (en) 1988-05-24 1993-08-31 Sanraku Incorporated Dna coding for enzyme capable of acylating the 4"-position of macrolide antibiotic
US5098837A (en) 1988-06-07 1992-03-24 Eli Lilly And Company Macrolide biosynthetic genes for use in streptomyces and other organisms
US5322937A (en) 1990-06-01 1994-06-21 Mercian Corporation Genes encoding a 3-acylation enzyme for macrolide antibiotics

Also Published As

Publication number Publication date
CA2501445A1 (fr) 2004-04-22
AU2003300479A1 (en) 2004-05-04
WO2004033689A2 (fr) 2004-04-22
NO335995B1 (no) 2015-04-13
KR20050084843A (ko) 2005-08-29
BR0314543A (pt) 2005-08-09
MXPA05002852A (es) 2005-10-05
EP1551975A2 (fr) 2005-07-13
BRPI0314543B8 (pt) 2021-05-25
IL167854A (en) 2011-06-30
AU2003300479B2 (en) 2009-12-10
JP2006501863A (ja) 2006-01-19
JP5042497B2 (ja) 2012-10-03
BRPI0314543B1 (pt) 2016-06-14
CA2501445C (fr) 2016-01-26
WO2004033689A3 (fr) 2004-08-26
NO20052160L (no) 2005-06-02

Similar Documents

Publication Publication Date Title
KR100588436B1 (ko) 스피노신 살충제 제조용 생합성 유전자
AU758421B2 (en) Recombinant oleandolide polyketide synthase
WO1999005283A2 (fr) Genes de biosynthese et de transfert des 6-desoxyhexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
JP2004337169A (ja) 抗生物質の生合成のためのストレプトマイセス・シアネオグリセウス亜種ノンシアノジーナスからの遺伝子クローニングおよびその使用法
KR101110175B1 (ko) 스피라마이신의 생합성에 관여하는 폴리펩티드, 이들폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도
JP7086984B2 (ja) Streptomyces fungicidicusの遺伝子組換え株におけるエンデュラシジンの産生を増強するための組成物及び方法
DK1905833T3 (en) Polypeptides involved in the biosynthesis of spiramyciner, nucleotide sequences encoding these polypeptides, and uses thereof
US20040219645A1 (en) Polyketides and their synthesis
EP1905833B1 (fr) Polypeptides impliqués dans la biosynthèse des spiramycines, séquences nucléotidiques codant ces polypeptides et leurs applications
CN101302528A (zh) 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用
US7105491B2 (en) Biosynthesis of enediyne compounds by manipulation of C-1027 gene pathway
US7109019B2 (en) Gene cluster for production of the enediyne antitumor antibiotic C-1027
KR20080032641A (ko) 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산
FR2786200A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
FR2851773A1 (fr) Polypeptides impliques dans la biosynthese des spiramycines, sequences nucleotidiques codant ces polypeptides et leurs applications
FR2766496A1 (fr) Genes de biosynthese et de transfert des 6-desoxyhexoses chez saccharopolyspora erythraea et leur utilisation
FR2786201A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
FR2786189A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
MXPA00008811A (es) Genes biosinteticos para la produccion del insecticida de espinosina

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150106

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151217

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161220

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171219

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181226

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20191217

Year of fee payment: 9