KR20150035751A - Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 - Google Patents

Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 Download PDF

Info

Publication number
KR20150035751A
KR20150035751A KR1020147036291A KR20147036291A KR20150035751A KR 20150035751 A KR20150035751 A KR 20150035751A KR 1020147036291 A KR1020147036291 A KR 1020147036291A KR 20147036291 A KR20147036291 A KR 20147036291A KR 20150035751 A KR20150035751 A KR 20150035751A
Authority
KR
South Korea
Prior art keywords
ala
leu
gly
val
arg
Prior art date
Application number
KR1020147036291A
Other languages
English (en)
Other versions
KR102159415B1 (ko
Inventor
코에이 코바야시
나오미 스미다
코지 야나이
Original Assignee
메이지 세이카 파루마 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메이지 세이카 파루마 가부시키가이샤 filed Critical 메이지 세이카 파루마 가부시키가이샤
Publication of KR20150035751A publication Critical patent/KR20150035751A/ko
Application granted granted Critical
Publication of KR102159415B1 publication Critical patent/KR102159415B1/ko

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N43/00Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds
    • A01N43/34Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one nitrogen atom as the only ring hetero atom
    • A01N43/40Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one nitrogen atom as the only ring hetero atom six-membered rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/16Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
    • C12P17/165Heterorings having nitrogen atoms as the only ring heteroatoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Environmental Sciences (AREA)
  • Dentistry (AREA)
  • Pest Control & Pesticides (AREA)
  • Agronomy & Crop Science (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

낮은 비용으로 UK-2를 대량 생산할 수 있는 제조 방법을 제공하기 위하여, UK-2 생합성 유전자 클러스터로 예상되는 부위를 식별하기 위해 UK-2를 생산하는 스트렙토베르티실룸 sp. 3-7의 유전체 DNA가 분석되었다. 더욱이, 콜로니 혼성화에 의하여, 상기 부위의 DNA가 성공적으로 분리되었다. 게다가, 상기 DNA는 상기 부위에 존재하는 유전자가 차단된 종(strain)을 준비하는 데에 사용되었다. 상기 종은 UK-2를 생산하지 않는 것으로 밝혀졌다. 상기 유전체 부위는 UK-2 생합성 유전자 클러스터인 것으로 확인되었다. 게다가, 스트렙토베르티실룸 sp. 3-7은 분리된 UK-2 생합성 유전자 클러스터가 삽입된 벡터의 도입에 의하여 형질전환되었다. 또한 상기 형질전환체에 의한 UK-2 생산성은 부모 종(strain)과 비교하여 10 배 내지 60 배 향상된 것으로 나타났다. 더욱이, 이들 형질전환체들 각각의 세포당 UK-2 생합성 유전자 클러스터의 2 복제가 존재하는 것으로 밝혀졌다.

Description

UK-2 생합성 유전자 및 그것을 사용한 UK-2 생산성을 향상시키기 위한 방법{UK-2 BIOSYNTHETIC GENES AND METHOD FOR IMPROVING UK-2 PRODUCTIVITY USING THE SAME}
본원은 도열병 방제제 등에 유용한 화합물인 UK-2의 생합성에 필요한 유전자(이하 "UK-2 생합성 유전자"라 칭함) 및 UK-2 생산성을 향상시키기 위한 방법에 관한 것이다. 보다 구체적으로, 본원은 UK-2 생합성 유전자, UK-2 생합성 유전자가 삽입되어 있는 벡터, 벡터가 도입되어 있는 형질전환체, UK-2 생합성 유전자의 존재를 탐지함으로써 UK-2 생산성을 판단하기 위한 방법, UK-2 생합성 유전자의 존재가 상기 방법에 의해 탐지되는 박테리아, 그 유전체 내에 삽입된 UK-2 생합성 유전자를 포함하는 박테리아, UK-2 생합성 유전자 중 하나 또는 둘 또는 그 이상의 복제가 각 세포에 존재하는 박테리아, 및 이들 박테리아 등을 활용함으로써 UK-2 및 UK-2A 유도체를 생산하기 위한 방법에 관한 것이다.
UK-2는 방선균에 의해 2차 대사 산물로서 생산되는 화합물이고, 곰팡이 및 효모를 포함하는 각종 균류에 대하여 안티마이신과 유사한 강한 항진균 작용을 나타낸다. 또한, 배양 세포에 대해서 낮은 세포 독성을 갖기 때문에 UK-2는 도열병 방제제, 농원예용 살진균제, 및 의학 항매제에 유용하다는 것이 밝혀졌다(특허문헌 1, 2). 게다가, 그 측쇄의 구조적 차이에 기초해서 4개의 유사체, UK-2A 내지 D가 자연적으로 존재한다는 것이 드러났다(비특허문헌 1).
UK-2는 방선균(스트렙토베르티실룸 속(genus)에 속하는 박테리아 등)을 배양한 다음, 그것으로부터 UK-2를 수집하여 생산된다. 그러나, 일반적으로 자연에서 분리된 미생물에 의해 생산되는 UK-2(모든 UK-2 인자)의 양은 매우 소량이다. 따라서, 산업적으로 저비용에서 목적물(UK-2)을 사용하기 위해서 생산성을 향상시켜야 한다.
목적물을 생산하는 미생물을 배양하기 위한 방법에 대한 조사, 배지 성분에 대한 조사, 전구체를 첨가하여 발효 조건의 향상, 및 자외선 조사 또는 화학적 돌연변이 유발 변이원을 활용하는 박테리아 균주의 향상을 통해 목적물의 생산성을 개선시킨다. 또한, 이들 방법 외에도, 생산성은 최근에 유전자 재조합을 활용하여 개선되어 왔다.
유전자 재조합에 의해 생산성을 개선시키기 위한 일반적인 방법은 목적물의 생합성에 필요한 유전자 발현의 개선을 포함하는 것이다. 예를 들면, 이 방법이 아고노미세탈레스 내에 PF-1022의 생산성을 향상시킨다고 특허문헌 3에 개시되어 있다.
그러나, 이 방법을 활용할 경우, 목적물의 생합성에 필요한 유전자 또는 공지의 기술을 사용하여 합성된 유전자를 분리시키고, 목적물(미생물을 생산)을 생산하여 미생물용 형질전환법을 확립하는 것이 본질이다. UK-2 생합성 유전자가 아직 밝혀지지 않았기 때문에 UK-2 생합성 유전자를 사용한 형질전환이 행해질 수 없다. 생산성은 유전자 재조합에 의해 향상될 수 없다.
일본 특허출원 공개 평07-233165 국제공개 제WO1999/11127호 국제공개 제WO2001/018179호
Ueki M. 등, Journal of antibiotics, 1996년 7월 25일, 49권, 7호, 639~643페이지 Namwat W. 등, Journal of Bacteriology, 2002년 9월, 184권, 17호, 4811~4818페이지
본원은 종래 기술에서 상술한 문제의 관점으로 이루어져 왔다. 본원의 목적은 유전자의 도입에 따라 UK-2 생합성에 필요한 유전자를 분리시킴으로써 얻어지는 높은 UK-2 생산성을 갖는 형질전환체를 제공하는 것이다. 게다가, 또 다른 목적은 형질전환체를 사용하여 저비용에서 다량의 UK-2를 생산하는 것이다. 그리고 추가 목적은 유전자의 존재를 탐지함으로써 UK-2 생산성을 판단하기 위한 방법을 제공하는 것이다.
UK-2는 특유의 히드록시피콜린산 골격을 갖는다. 한편, 버지니아마이신이라 불리는 화합물도 히드록시피콜린산 골격을 갖는다. 또한, 그것은 VisA(L-라이신 2-아미노트랜스페라아제) 및 VisB(3-히드록시피콜린산 AMP 리가아제)가 버지니아마이신의 생합성에 관여하는 것으로 드러났다(비특허문헌 2).
따라서, 상기 목적들을 달성하기 위해서, 본 발명자들은 UK-2를 생산하는 스트렙토베르티실룸 sp. 3-7의 유전체 DNA 라이브러리를 먼저 제조하고, 종합적으로 균주의 유전체 DNA의 염기 서열을 판단했다. 이어서, 유전체 DNA에 의해 인코딩된 추측상 단백질의 아미노산 서열과 VisA 및 VisB의 아미노산 서열 간의 상동성 분석을 수행함으로써 생성물과 이들 2개의 아미노산 서열이 높은 상동성을 갖는 유전자가 연속해서 위치되어 있는 유전체 부위를 알아냈다. 또한, 그것은 비리보솜 펩티드 합성 효소(NRPS)와 상동성을 갖는 단백질을 인코딩하는 유전자 및 폴리케티드 합성 효소(PKS)와 상동성을 갖는 단백질을 인코딩하는 유전자가 부위 근처에 위치하고 있다는 것을 알아냈다.
이들 효소는 UK-2 골격을 형성하는데 필요하다고 생각된다. 또한, 방선균의 2차 대사 산물 유전자는 클러스터를 형성한다. 따라서, 유전체 영역은 UK-2 생합성 유전자 클러스터가 될 것으로 기대된다.
이어서, UK-2의 생합성에 필요한 효소를 인코딩할 것으로 기대되는 유전자의 염기 서열의 얻어진 정보에 기초해서 프로브가 제조된다. 프로브를 사용한 콜로니 혼성화에 의해, UK-2 생합성 유전자 클러스터 내에 존재할 것으로 기대되는 DNAs(즉, 유전체 영역 내에 포함되는 DNAs)를 성공적으로 상술한 유전체 DNA 라이브러리로부터 분리했다. 게다가, DNAs는 유전체 영역 내에 존재하는 유전자가 파괴된 스트렙토베르티실룸 sp. 3-7을 제조하는데 사용된다. 상기 균주는 UK-2를 생산하지 않는 것으로 밝혀졌다. 상기 유전체 영역은 UK-2 생합성 유전자 클러스터인 것이 확인되었다. 또한, 스트렙토베르티실룸 sp. 3-7은 분리된 UK-2 생합성 유전자 클러스터가 삽입된 벡터를 도입하여 형질전환된다. 형질전환체에 의한 UK-2 생산성이 친주의 것과 비교해서 약 10~60배 또는 그 이상 향상된다는 것을 알아냈다. 또한, 그것은 UK-2 생합성 유전자 클러스터의 2개의 복제가 각각 이들 형질전환체의 각 세포에 존재하는 것을 확인했다.
구체적으로, 본원은 UK-2 생합성 유전자, UK-2 생합성 유전자가 삽입되어 있는 벡터, 벡터가 도입되어 있는 형질전환체, 및 형질전환체를 활용하여 UK-2 등을 생산하기 위한 방법에 관한 것이다. 보다 구체적으로, 본원은 하기의 것을 제공한다.
<1> 하기 (a) 내지 (q)로 이루어지는 군으로부터 선택되는 적어도 하나의 핵산으로서, UK-2 생합성을 유도하고 UK-2의 생산성을 향상시키는, 분리된 핵산:
(a) SEQ ID NO: 3의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 3의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 3의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 2의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(b) SEQ ID NO: 5의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 5의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 5의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 4의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(c) SEQ ID NO: 7의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 7의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 7의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 6의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(d) SEQ ID NO: 9의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 9의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 9의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 8의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(e) SEQ ID NO: 11의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 11의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 11의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 10의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(f) SEQ ID NO: 13의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 13의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 13의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 12의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(g) SEQ ID NO: 15의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 15의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 15의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 14의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(h) SEQ ID NO: 17의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 17의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 17의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 16의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(i) SEQ ID NO: 19의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 19의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 19의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 18의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(j) SEQ ID NO: 21의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 21의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 21의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 20의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(k) SEQ ID NO: 23의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 23의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 23의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 22의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(l) SEQ ID NO: 25의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 25의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 25의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 24의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(m) SEQ ID NO: 27의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 27의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 27의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 26의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(n) SEQ ID NO: 29의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 29의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 29의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 28의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(o) SEQ ID NO: 31의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 31의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 31의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 30의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(p) SEQ ID NO: 33의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 33의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 33의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 32의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산; 및
(q) SEQ ID NO: 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 35의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 34의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산.
<2> <1>에 있어서, (a) 내지 (q)의 핵산을 모두 포함하는, 핵산.
<3> <2>에 있어서, SEQ ID NO: 1의 염기 서열을 포함하는, 핵산.
<4> <1> 내지 <3> 중 어느 하나에 따른 핵산이 삽입된, UK-2 생합성을 유도하고 UK-2 생산성을 향상시키기 위한 벡터.
<5> 시험 박테리아 내에서 <1> 내지 <3> 중 어느 하나에 따른 핵산의 염기 서열 또는 상기 서열에 상보적인 염기 서열을 포함하는 핵산의 존재를 탐지하는 것을 포함하는, UK-2 생산성을 판단하는 방법.
<6> <5>에 있어서, 핵산의 존재를 탐지하는 방법은 PCR 방법인 것인, 방법.
<7> <5>에 있어서, PCR 방법은 SEQ ID NO: 45의 염기 서열을 포함하는 프라이머 및 SEQ ID NO: 46의 염기 서열을 포함하는 프라이머를 사용하여 핵산이 증폭되는 방법인 것인, 방법.
<8> UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아로서, <1> 내지 <3> 중 어느 하나에 따른 핵산의 염기 서열 또는 상기 서열과 상보적인 염기 서열을 포함하는 핵산의 존재가 <5> 내지 <7> 중 어느 하나에 따른 방법에 의해 탐지되는, 박테리아.
<9> <4>에 따른 벡터의 도입에 의해 UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아.
<10> <1> 내지 <3> 중 어느 하나에 따른 핵산이 유전체 내에 삽입된, UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아.
<11> <1> 내지 <3> 중 어느 하나에 따른 핵산의 염기 서열을 포함하는 핵산의 하나 또는 둘 또는 그 이상의 복제가 각 세포에 존재하는 박테리아.
<12> <8> 내지 <11> 중 어느 하나에 따른 박테리아로서, 스트렙토베르티실룸(Streptoverticillium), 스트렙토마이세스(Streptomyces), 대장균(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 효모(yeasts), 곰팡이(filamentous fungi) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 중 어느 하나인 것인, 박테리아.
<13> UK-2의 생산 방법으로서:
<8> 내지 <12> 중 어느 하나에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2를 수집하는 것을 포함하는, 방법.
<14> UK-2 유도체의 생산 방법으로서:
<8> 내지 <12> 중 어느 하나에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2를 수집하고; 그리고
수집된 UK-2로부터 하기 식(1) 중 어느 하나로 표시되는 UK-2유도체를 합성하는 것을 포함하는 방법
[화학식 1]
Figure pct00001
(1)
[식(1)에서,
R은 2-메틸프로파노일기, 트랜스-2-메틸-2-부타노일기, 3-메틸부타노일기 및 2-메틸부타노일기 중 어느 하나를 나타냄.
R1은 C1 -6 알킬기, 벤질기, C1 -10 알킬카르보닐기(C1 -10 알킬카보닐기는 카르복실기, 벤질옥시카르보닐기, C1 -4 알킬옥시카르보닐기 및 벤질옥시카르보닐아미노기 중 어느 하나로 치환될 수 있음), 벤조일기, C1 -4 알킬옥시카르보닐기, (C1 -4)알킬옥시카르보닐(C1-4)알킬기, 니트로기로 치환가능한 벤질옥시카르보닐(C1-4)알킬기, C1 -6 알킬술포닐, 디(C1-6)알킬포스포릴기, 디페닐포르포리기 및 하기 식(2)으로 표시되는 치환기 중 어느 하나를 나타내고;
[화학식 2]
Figure pct00002
(2)
(식(2)에서,
Q는 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
M은 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
T는 O, OC(O), OC(O)O, S, SC(O), SC(O)O 및 하기 식(3)으로 표시되는 치환기로 이루어지는 군으로부터 선택됨;
[화학식 3]
Figure pct00003
(3)
G는 H, C1 -6 알킬기, C1 -6 알콕시 C1 -6 알킬기, C2 -6 알케닐기, C2 -6 알키닐기, C3-6 시클로알킬기, 아릴기 및 헤테로아릴기로 이루어지는 군으로부터 선택됨.
G 및 M은 임의적으로 옥소기를 가지는 이소벤조퓨란 고리를 형성할 수 있음.
M 및 Q는 3-8원 카르보시클릭 시스템을 형성할 수 있음.].
<15> UK-2A 유도체의 제조 방법으로서:
<8> 내지 <12> 중 어느 하나에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2A를 수집하고; 그리고
수집된 UK-2A로부터 하기 식(4) 내지 (7) 중 어느 하나로 표시되는 UK-2A 유도체를 합성하는 것을 포함하는, 방법.
[화학식 4]
Figure pct00004
(4)
[화학식 5]
(5)
[화학식 6]
Figure pct00006
(6)
[화학식 7]
Figure pct00007
(7)
여기서 사용되는 용어 "아실"은 R이 탄화수소기를 나타내는 카르복시산 R-COOH로부터 OH를 제거함으로써 제공된 RCO-잔기를 의미한다.
여기서 사용되는 용어 "아릴"은 페닐 또는 나프틸을 의미한다. 여기서 사용되는 용어 "헤테로아릴"은 하나 이상의 헤테로원자를 함유하는 5 또는 6원 방향족 고리를 의미하고, 그러한 헤테로원자들은 O, N 및 S로 이루어지는 군으로부터 선택되며, 방향족 고리의 나머지 원자들은 탄소 원자이다.
적절한 예시들은, 이에 제한되는 것은 아니지만, 피리딘, 피리다진, 피리미딘, 피라진, 피롤, 피라졸, 이미다졸, 퓨란, 티오펜, 옥사졸, 이속사졸, 티아졸, 이소티아졸, 퀴놀린, 퀴녹솔린 및 티아디아졸을 포함한다.
본원은 UK-2 생합성 유전자를 박테리아와 같은 숙주 세포 내로 도입함으로써 높은 UK-2 생산성을 가지는 형질전환체(transformant)를 제공할 수 있게 한다. 더욱이, 형질전환체를 이용하여 UK-2를 저비용으로 대량생산하는 것이 가능하다.
게다가, 유전자의 존재를 탐지함으로써 UK-2 생산성을 측정하는 방법을 제공할 수 있다.
<UK-2 생합성 유전자>
본원은 UK-2 생합성 유전자를 제공한다. 아래의 실시예에 기재될 것처럼, 본원의 발명자들은 신규한 UK-2 생합성 유전자들을 분리하였으며, 스트렙토베르티실룸 sp. 3-7의 유전체 DNA의 17 개의 유전자가 표 2에 나타나 있다.
따라서, 본원의 UK-2 생합성 유전자의 일 구현예는 "UK-2 생합성을 유도하고 UK-2의 생산성을 향상시키는 분리된 핵산으로서, 상기 핵산은 SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33 또는 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산" 이고, 전형적으로 "UK-2 생합성을 유도하고 UK-2의 생산성을 향상시키는 분리된 핵산으로서, 상기 핵산은 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34의 염기 서열을 포함하는 핵산"이다.
본원에서 "UK-2 생산성의 향상" 이라는 어구 및 관련 어구들은 박테리아 등이 자연적으로 가지고 있는 UK-2의 생산성의 향상만을 뜻하는 것이 아니라, 자연적으로 UK-2 생산 능력을 가지고 있지 않은 박테리아 등이 UK-2 생산 능력을 취득하는 것 또한 의미한다.
본원에서, 용어 "분리" 및 관련 용어들은 핵산이 원래 존재하던 조건과 상이한 조건 하에 존재하도록 하는 인위적인 처리를 의미한다. 본원의 UK-2 생합성 유전자는 분리될 수 있으며, 예를 들어, 먼저 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34의 염기 서열의 정보를 기반으로 적절한 프라이머를 합성하고, 그리고 스트렙토베르티실룸 sp. 3-7의 유전체 DNA를 주형으로 상기 프라이머를 이용하여 PCR을 수행하는 것에 의할 수 있다. 양자택일적으로, 아래의 실시예에 기재될 것처럼, 본원의 UK-2 생합성 유전자는 스트렙토베르티실룸 sp. 3-7의 유전체 DNA 라이브러리 또는 cDNA 라이브러리로부터, PCR로부터 수득된 증폭 산물을 프로브로 이용하여 콜로니 혼성화를 수행함으로써 또한 분리될 수 있다. 뿐만 아니라, 본원의 UK-2 생합성 유전자는 염기 서열 정보를 기반으로 한 전합성(total chemical synthesis)에 의해 또한 준비될 수 있다.
본원에서, "UK-2"는 하기 식(8)으로 표시되는 화합물이다:
[화학식 8]
Figure pct00008
(8)
여기에서 R은 직쇄형 또는 분지형의 포화 지방족 아실기 또는 직쇄형 또는 분지형의 불포화 지방족 아실기를 나타낸다. 바람직하게는, "UK-2"는 R이 이소부티릴기(2-메틸프로파노일기)인 화합물(UK-2A), R이 티글로일기(트랜스-2-메틸-2-부테노일기)인 화합물(UK-2B), R이 이소발레릴기(3-메틸부타노일기)인 화합물(UK-2C) 그리고 R이 2-메틸부타노일기인 화합물(UK-2D)이다.
더욱이, 본원에서, "UK-2 생합성 유전자"는 UK-2 생합성을 유도할 수 있는 활성을 가지는 단백질을 인코딩하는 유전자이다. "UK-2 생합성을 유도할 수 있는 활성"은, 예를 들어, 아래의 실시예 9에 기재된 방법에 의해 측정될 수 있다. 구체적으로, 시험 단백질을 인코딩하는 핵산이 숙주 세포(예를 들어, 스트렙토베르티실룸 sp. 3-7) 내로 도입될 벡터 등에 삽입된 후에, 숙주 세포에서 생산된 UK-2의 양이 숙주 세포 내에서 강제로 발현되는 시험 단백질에 의해 측정된다. 시험 단백질이 발현되지 않는 숙주 세포에서보다 생산량이 큰 경우, 시험 단백질은 UK-2 생합성을 유도할 수 있는 활성을 가지는 것으로 평가할 수 있다.
당업계에서, UK-2 생합성 유전자의 염기 서열의 정보를 얻을 수 있는 경우, 비록 단백질의 아미노산 서열이 염기서열로부터 인코딩되는 것과 상이하다고 하여도, 당업자는 염기 서열을 수정하여 UK-2 생합성에 관여하는 단백질을 인코딩하는 핵산을 수득할 수 있다. 한편, 자연에서도, 인코딩되는 단백질의 아미노산 서열은 염기 서열의 돌연변이에 의해 돌연변이될 수 있다. 따라서, 본원의 UK-2 생합성 유전자의 또다른 구현예는 "하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33 또는 35 의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산인 분리된 핵산"이다. 여기서, "하나 이상의"는 UK-2 생합성을 유도하는 활성을 여전히 가지는, 변형 후의 UK-2 생합성에 관련된 단백질 내에서 변경된 아미노산의 개수를 뜻한다. 개수는 일반적으로 1 내지 50이고, 바람직하게는 1 내지 40이고, 더욱 바람직하게는 1 내지 수 개 (예를 들어, 1 내지 20, 1 내지 10, 1 내지 8, 및 1 내지 4) 이다.
당업자는 UK-2 생합성 유전자의 염기 서열의 정보에 기초한 자리지정 돌연변이와 같은 공지의 방법에 의하여 그러한 변이를 인코딩하는 핵산을 제조할 수 있다.
더욱이, 당업계에서, UK-2 생합성 유전자의 염기 서열의 정보를 얻을 수 있는 경우, 당업자는 혼성화 기술 또는 PCR 기술을 이용하여 스트렙토베르티실룸 sp. 3-7 외의 다른 종 및 다른 박테리아들로부터 UK-2 생합성 유도 활성을 가지는 단백질을 인코딩하는 핵산(상동유전자)를 수득할 수 있다. 따라서, 본원의 UK-2 생합성 유전자의 또다른 구현예는 "SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산인 분리된 핵산"이다.
그러한 상동유전자를 분리하기 위해서, 보통 엄격한 조건 하에서 혼성화 반응을 수행한다. "엄격한 조건"은 혼성화 후 낮은 염 농도를 가지는 용액 내에서 높은 온도로 막 세척 공정이 수행되는 것이다. "엄격한 조건"은, 예를 들어, 2xSSC 농도(1xSSC : 15 mM 시트르산 삼나트륨, 150 mM 염화나트륨)의 0.5% SDS 용액에서 60℃에서 20 분 동안 세척하는 조건을 포함한다. 추가적으로, 예를 들어, 혼성화는 알려진 ECL Direct DNA/RNA Labeling and Detection System (Amersham Pharmacia Biotech Inc. 제조)에 첨부된 지시서에 기재된 방법에 따라 수행될 수 있다.
더욱이, 그러한 방법에 의해 수득된 상동유전자에 의해 인코딩되는 단백질은 일반적으로 SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33 또는 35의 아미노산 서열과 높은 상동성을 가진다. 따라서, 본원의 UK-2 생합성 유전자의 또다른 구현예는 "SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33 또는 35의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산인 분리된 핵산"이다.
서열의 상동성은, 예를 들어, NCBI의 BLASTX (아미노산 수준) 프로그램을 이용하여 결정될 수 있다.
아래의 실시예들에서 기재될 것처럼, 본원의 UK-2 생합성 유전자는 높은 UK-2 생산성을 가지는 형질변환체의 제조에 사용될 수 있으며, 또한 UK-2 생합성 유전자 클러스터의 스크리닝에 효과적으로 사용될 수도 있다.
그러한 형질전환체를 제조하고 UK-2 생합성 유전자 클러스터를 스크리닝하는 데에 있어서, 상기 기술한 조합된 UK-2 생합성 유전자들의 용도는 바람직하게는 UK-2 생합성 유전자들 각각의 용도이다. 조합된 UK-2 생합성 유전자들의 개수는, UK-2 생합성이 조합에 의해서 유도될 수 있는 한 특별히 한정되지 않는다. 예를 들어, 개수는 2 이상이고, 바람직하게는 5 이상이고, 더욱 바람직하게는 10 이상이고, 더더욱 바람직하게는 15 이상이다. 조합된 UK-2 생합성 유전자의 개수는 가장 바람직하게는 17인데, 그 이유는 형질전환체에서의 UK-2 생산성이 현저하게 향상될 수 있기 때문이다.
조합된 UK-2 생합성 유전자는 단일 핵산 또는 분리된 핵산들로서 존재할 수 있다.
본원은 17 UK-2 생합성 유전자들을 포함하는 단일 핵산(UK-2 생합성 유전자 클러스터)인 "SEQ ID NO: 1의 염기 서열을 포함하는 핵산"을 제공한다. SEQ ID NO: 1의 염기 서열을 포함하는 핵산 내 상기 유전자들의 열린 번역틀(ORFs)의 위치는 나중에 기술되는 표 1에 나타나 있다.
나중에 실시예에서 기술되는 바와 같이, "SEQ ID NO: 1의 염기 서열을 포함하는 핵산"은 먼저 UK-2 생합성 유전자 등의 염기 서열의 정보를 기반으로 한 적절한 프라이머를 합성하고, 그리고 독립적으로 제조된 스트렙토베르티실룸 sp. 3-7의 코스미드 유전체 DNA를 주형으로 상기 프라이머를 이용하여 PCR을 수행하고, 이어서 수득된 증폭 산물을 프로브로 이용하여 콜로니 혼성화를 수행하는 것에 의해서 분리될 수 있다.
<벡터>
본원은, 본원의 UK-2 생합성 유전자가 삽입된 벡터를 제공한다. 본원의 벡터는 자가복제 벡터, 즉, 예를 들어, 염색체외 요소(extrachromosomal element)로서 존재하며, 염색체의 복제로부터 독립적으로 복제하는, 플라스미드를 기반으로 구성될 수 있다. 양자택일적으로, 본원의 벡터는 박테리아와 같은 숙주 세포 내에 도입되고 그 유전체 내에 편입된 후 숙주세포의 염색체와 함께 복제될 수 있다. 본원의 벡터의 구성 절차 및 방법은, 유전자 조작 분야에서 일반적으로 사용되는 절차 및 방법을 사용할 수 있다.
당업자는 도입되는 숙주 세포의 종류에 따라 공지의 벡터들 중 본원의 적절한 벡터를 선택할 수 있다. 공지의 벡터들의 예는 코스미드 벡터(SuperCos 1 코스미드 벡터 등), 파지 벡터, pUC 기반 플라스미드 (pCR2.1-TOPO 플리스미드 벡터 등), pBluescript 기반 플라스미드 및 pBR322 플라스미드를 포함한다.
본원의 UK-2 생합성 유전자에 의해 인코딩되는 단백질을 숙주 세포 내에서 발현시키기 위해, 본원의 "벡터"는 바람직하게는, 상기 유전자 외에도, 발현을 조절하기 위한 DNA 서열, 형질전환된 숙주세포를 선별하기 위한 마커 유전자 등을 포함한다.
"발현을 조절하기 위한 DNA 서열"의 예는 프로모터, 인핸서, 및 종결자를 포함한다. 예는 또한 박테리아에 이소프로필-β-D-티오갈락토피라노시드(IPTG)를 첨가함으로써 하류에 존재하는 유전자의 발현을 유도할 수 있는 락토오즈 오페론을 포함한다. 본원의 벡터는, 예를 들어, 본원의 UK-2 생합성 유전자의 상류 또는 하류에 프로모터 및 종결자를 각각 작동가능하게 삽입함으로써 구성될 수 있다.
"마커 유전자"는 형질변환된 숙주 세포(형질변환체)를 선별하는 방법에 따라 적절하게 선택될 수 있다. 예를 들어, 약물 저항을 인코딩하는 유전자 또는 영양 요구성(auxotrophy)을 보완하는 유전자가 사용될 수 있다. 박테리아가 숙주 세포로 사용되는 경우, 마커 유전자의 예는 앰피실린 저항성 유전자, 카나마이신 저항성 유전자, 및 테트라사이클린 저항성 유전자를 포함한다. 특히, 방사균(actinobacterium)의 경우, 예는 아프라마이신 저항성 유전자, 티오스트렙톤 저항성 유전자, 히그로마이신 저항성 유전자, 카나마이신 저항성 유전자, 스트렙토마이신 저항성 유전자, 비오마이신 저항성 유전자 등을 포함한다. 효모의 경우, 예는 트립토판 생합성 유전자(TRP1), 우라실 생합성 유전자(URA3), 류신 생합성 유전자(LEU2) 등을 포함한다. 곰팡이(mold)의 경우, 예는 히그로마이신 저항성 유전자, 비알라포스 저항성 유전자, 블레오마이신 저항성 유전자, 아우레오바시딘 저항성 유전자 등을 포함한다. 식물의 경우, 예는 카나마이신 저항성 유전자, 비알라포스 저항성 유전자 등을 포함한다.
<형질변환체 등>
본원은, 본원의 벡터가 도입된 형질변환체를 제공한다 (예를 들어, 본원의 벡터의 도입에 의해 UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아).
더욱이, 본원은, 본원의 UK-2 생합성 유전자가 그의 유전체 내에 삽입되어 UK-2 생합성이 유도되고 UK-2 생산성이 향상된 형질전환체를 제공한다.
본원의 벡터가 도입됨으로써 형질전환되는 숙주세포 또는 본원의 UK-2 생합성 유전자의 유전체의 숙주세포는 특별히 제한되지 않는다. 그 예는 방사균(actinobacteria), 대장균(Escherichia coli ), 바실러스 서브틸리스, 효모, 곰팡이(filamentous fungi), 코리노박테리움 글루타미쿰, 식물 세포, 곤충 세포 및 동물 세포를 포함한다. UK-2 생산성의 관점에서, 방사균이 바람직하고, 스트렙토베르티실룸 속(genus)에 속하는 박테리아와 스트렙토마이세스 속에 속하는 박테리아가 더욱 바람직하고, 스트렙토베르티실룸 속에 속하는 박테리아가 더더욱 바람직하며, 스트렙토베르티실룸 sp. 3-7이 특히 바람직하다.
본원의 벡터를 숙주 세포 내로 도입하는 방법은 특별히 제한되지 않는다. 시험 하에서 숙주세포의 종류에 따라 접합전달법(conjugal transfer), 파지도입(phage transduction), 칼슘이온법, 리튬이온법, 전기천공법, PEG법, 아그로박테리움법, 및 입자총(particle gun) 방법과 같은 공지의 형질전환 방법들로부터 당업자에 의해 적절하게 선택 및 이용될 수 있다. 더욱이, "마커 유전자"를 포함하는 벡터가 숙주세포 내로 도입되는 경우, 본원의 형질전환체는 약물 저항성 유전자에 따른 항생제가 첨가된 배지 또는 영양 요구성 보완 유전자에 따른 영양분이 결핍된 배지에서 배양함으로써 효과적으로 제조될 수 있다.
게다가, 본원은 발효 조건(fermentation conditions), 돌연변이 유발 등의 향상 조건에 의하여 UK-2의 생합성이 유도되고 UK-2의 생산성이 향상되는 박테리아를 제공한다. 더욱이, 아래의 실시예에서 기술되는 것처럼, 본원의 UK-2 생합성 유전자를 적어도 2 개 포함하면 UK-2 생합성이 유도되고 UK-2 생산성이 상당히 향상된다는 것이 밝혀졌다. 따라서, 본원은 또한 본원의 UK-2 생합성 유전자 하나 또는 둘 또는 그 이상의 복제가 각 세포에 존재하는 박테리아를 제공한다. UK-2의 생산성의 측면에서, 그러한 박테리아는 바람직하게는 방사균, 더욱 바람직하게는 스트렙토베르티실룸 속에 속하는 박테리아 및 스트렙토마이세스 속에 속하는 박테리아, 그리고 더더욱 바람직하게는 스트렙토베르티실룸 속에 속하는 박테리아이다. 추가적으로, UK-2의 생산성의 측면에서, 본원의 UK-2 생합성 유전자의 세포당 복제의 수는 바람직하게는 2 개 이상이다. 본원의 UK-2 생합성 유전자의 세포당 복제의 개수는, 예를 들어, 아래의 실시예에서 기술되는 PCR 방법에 의해 확인될 수 있다.
<UK-2 생산성을 판단하기 위한 방법>
본 발명자들은 UK-2 생합성에 필요한 유전자를 분리하고 확인함으로써, 유전자의 존재를 탐지하여 UK-2 생산성을 판단하는 것이 가능해졌다. 따라서, 본원은 시험 박테리아 내에서, 본원의 UK-2 생합성 유전자의 염기 서열 또는 그 서열에 상보적인 염기 서열을 포함하는 핵산의 존재를 탐지하는 것을 포함하여 UK-2 생산성을 판단하기 위한 방법을 제공하는 것이다.
본원의 방법에 있어서, "시험 박테리아"는 특별히 제한되지 않는다. 그 예로는 방선균(스트렙토베르티실룸 속에 속하는 박테리아, 스트렙토마이세스 속에 속하는 박테리아 등), 대장균, 바실러스 서브틸리스, 효모, 곰팡이, 및 코리네박테리움 글루타미쿰을 포함한다.
본원의 UK-2 생산성을 판단하기 위한 방법에 있어서, 탐지되는 본원의 UK-2 생합성 유전자의 염기 서열, 즉 본원의 핵산의 염기 서열은 상술한 (a)~(q)로 이루어지는 군으로부터 선택된 적어도 하나의 핵산의 염기 서열이다.
핵산 등은 핵산 등을 포함하는 유전체 DNA 또는 유전체 DNA로부터 전사 산물을 직접 표적화하여 탐지될 수 있다. 대안적으로, 핵산 등은 전사 산물(본원의 UK-2 생합성 유전자에 의해 인코딩된 단백질)로부터 변형 산물을 간접 표적화하여 탐지할 수도 있다. 또한, 핵산 등의 탐지는 공지된 방법 중 어느 하나를 채용할 수 있다. 유전체 DNA를 표적하는 경우에 있어서, 예를 들면 현장 혼성화(ISH)법, 유전체 PCR법, 직접 시퀀싱법, 서던 블롯팅법, 및 유전체 마이크로어레이를 사용한 분석법을 채용할 수 있다. 전사 산물을 표적화하는 경우에 있어서, 예를 들면 PCR법, 직접 시퀀싱법, 노던 블롯팅법, 도트 플롯법, 및 cDNA 마이크로어레이를 사용한 분석법을 채용할 수 있다. 변역 산물을 표적화하는 경우에 있어서, 공지된 방법의 예로는 본원의 UK-2 생합성 유전자에 의해 인코딩된 단백질에 대한 항체를 사용한 면역학적 방법을 포함한다(웨스턴 블롯팅법, ELISA법, 유동세포계수법, 면역 조직화학적 염색, 이미징 세포계수, 방사면역판단법, 면역 침강법, 항체 어레이를 사용한 분석법 등). 이들 방법 중에서도, PCR법이 바람직할 수 있고, 핵산이 SEQ ID NO: 45의 염기 서열을 포함하는 프라이머 및 SEQ ID NO: 46의 염기 서열을 포함하는 프라이머를 사용해서 증폭되는 PCR법이 보다 바람직할 수 있다.
부가적으로, 본원의 방법에 있어서, UK-2 생산성의 보다 정확한 판단을 달성하는 관점에서 이것은 하나의 핵산의 존재를 탐지하는 것보다 상술한 다수의 핵산(본원의 UK-2 생합성 유전자)의 존재를 탐지하는 것이 바람직하다. 탐지되는 핵산의 수는, 예를 들면 2개 또는 그 이상, 바람직하게는 5개 또는 그 이상, 보다 바람직하게는 10개 또는 그 이상, 및 더욱 바람직하게는 15개 또는 그 이상이다. 17개 핵산 모두를 탐지하는 것이 특히 바람직할 수 있고, 17개 핵산(SEQ ID NO: 1의 염기 서열을 포함하는 핵산) 모두를 포함하는 단일 핵산을 탐지하는 것이 가장 바람직할 수 있다. 또한, 핵산의 전체 길이 외에도, 일반적인 사례에서는 핵산의 존재 탐지를 위해 그의 일부가 표적화된다. 따라서, 본원의 방법에 있어서, 핵산 등의 탐지는 핵산 등의 일부의 탐지일 수 있다. 당업자는 탐지법에 따라 본원의 방법에 의해 탐지되는 핵산의 일부의 길이를 적절하게 선택할 수 있다.
이어서, 시험 박테리아 내에서 핵산의 존재가 이러한 방법에 의해 탐지될 수 있다면, 시험 박테리아는 UK-2 생산성을 갖는다고 판단된다. 부가적으로, 본원의 방법은 UK-2를 생산하는 것을 허용하는 조건에서 핵산의 존재를 탐지할 수 있는 시험 박테리아를 배양하는 것을 추가 포함할 수 있다.
또한, 본원은 UK-2 생합성이 유도되고 UK-2 생산성이 향상되며, 본원의 핵산의 염기 서열 또는 그 서열에 상보적인 염기 서열을 포함하는 핵산의 존재가 본원의 UK-2 생산성을 판단하기 위한 방법에 의해 탐지되는 박테리아를 제공하는 것이다. UK-2 생산성의 관점에서, 이러한 박테리아는 방선균인 것이 바람직하고, 스트렙토베르티실룸 속에 속하는 박테리아 및 스트렙토마이세스 속에 속하는 박테리아가 보다 바람직하며, 스트렙토베르티실룸 속에 속하는 박테리아가 더욱 바람직하다.
단, 여기 사용된 바와 같이, 본원의 UK-2 생합성 유전자를 갖는 상술한 박테리아 등, 즉 UK-2 생합성이 유도되고 UK-2 생산성이 향상되며, 핵산의 존재가 본원의 UK-2 생산성을 판단하기 위한 방법에 의해 탐지되는 박테리아, 본원의 벡터를 도입함으로써 UK-2 생합성이 유도되고 UK-2 생산성이 향상되는 형질전환체, UK-2 생합성이 유도되고 UK-2 생산성이 향상되고, 본원의 UK-2 생합성 유전자가 그 유전체 내에 삽입되는 형질전환체, 본원의 UK-2 생합성 유전자의 1개 또는 2개 또는 그 이상의 복제가 각 세포에 존재하는 박테리아, 및 발효 조건, 돌연변이 유발 등에 향상에 의해 UK-2 생합성이 유도되고 UK-2 생산성이 향상되는 박테리아가 "본원의 박테리아 등"이라 이하에서 총칭된다.
<UK-2를 생산하기 위한 방법>
본원은 UK-2를 생산하기 위한 방법을 제공하는 것이고, 상기 방법은:
본원의 박테리아 등을 배양하고, 박테리아 등의 배양으로부터 UK-2를 수집하는 단계를 포함한다.
박테리아 등은 종래 방법에 의해서 적절하게 배지, 배양 조건 등을 선택함으로써 배양될 수 있다. 배지로서, 일반적으로 사용되는 성분을 사용할 수 있다. 예를 들면, 탄소원으로서는 글루코오스, 수크로오스, 셀룰로오스, 물엿, 덱스트린, 전분, 글리세롤, 당밀, 동식물유 등을 사용할 수 있다. 게다가, 질소원으로서는 콩가루, 밀배아, 파마미디아, 옥수수 침지액, 면실박, 브로스, 펩톤, 폴리펩톤, 백아 추출물, 효모 추출물, 황산 암모늄, 질산 나트륨, 우레아 등을 사용할 수 있다. 이외에도, 필요에 따라 나트륨, 칼륨, 칼슘, 마그네슘, 코발트, 염소, 인산, 황산 및 기타 이온을 생산할 수 있는 무기염을 부가하는 것이 효과적이고; 무기염의 예로는 염화 칼륨, 탄산 칼슘, 인산수소2칼륨, 황산 마그네슘, 인산 칼륨, 황산 아연, 황산 망간, 및 황산 구리를 포함한다. 부가적으로, 필요에 따라 티아민(염산 티아민 등)과 같은 각종 비타민, 글루탐산(글루타민산 나트륨 등) 및 아스파라긴(DL-아스파라긴 등)과 같은 아미노산, 뉴클레오티드와 같은 미량 영양소, 및 항생제와 같은 선택적 약물을 부가할 수도 있다. 또한, 박테리아의 성장 및 UK-2 생산을 촉진시키기 위한 유기 물질과 무기 물질을 적절하게 부가할 수 있다. 배지의 pH는 특히 제한되지 않고, 배양되는 박테리아 등의 타입에 따라 조정될 수 있다. 예를 들면, pH는 대략 6~8이다.
당업자는 배양되는 박테리아 등의 타입, 사용되는 배지의 타입 등에 따라 배양 조건을 적절하게 선택하고 설정할 수 있다. 예를 들면, 배양법은 호기성 조건 하에 진탕 배양법, 통기와 교반 배양법 및 호기성 침수 배양법과 같은 공지의 배양법으로부터 선택될 수 있다. 통기와 교반 배양법이 바람직하다. 적절한 배양 온도는 15℃~40℃이다. 다수의 경우에 있어서, 배양 온도는 26℃~37℃쯤으로 설정된다. 게다가, 배양 기간은 UK-2의 최대 축적이 달성될 경우 2일~25일이 바람직하다.
본원에 있어서, "배양"은 본원의 박테리아 등을 배양함으로써 얻어지는 배지, 급증된 박테리아 등, 박테리아 등의 분비물 및 대사 산물 등을 나타낸다. 배양은 이들의 희석 및 농축도 포함한다.
배양에 있어서, UK-2는 박테리아 등 및 배지 모두에 축적된다. 따라서, 배양의 배지로부터 UK-2를 수집하기 위한 방법의 예로는 자유롭게 물과 혼합하지 않고, UK-2를 효과적으로 추출할 수 있는 에틸 아세테이트, 클로로폼, 및 디클로로메탄과 같은 유기 용제를 사용한 추출법이다. 한편, 배양의 박테리아 등으로부터, 예를 들면 UK-2는 여과 또는 원심 분리와 같은 수단에 의해 얻어지는 박테리아 등에 아세톤과 같은 유기 용제로 추출하여 수집될 수 있다. 또한, 배양의 박테리아 등을 글라스 비즈 등을 사용하여 파괴한 후, UK-2는 배지로부터 상술한 추출과 같은 동일한 방식으로 추출하여 수집될 수 있다.
게다가, 배양으로 UK-2를 수집할 경우, 이렇게 제조된 유기 용제와 같은 추출 분획에 용제 전이 용해, 순상 및 역상 크로마토그래피, 겔 여과 크로마토그래피, 및 결정화와 같은 공지의 정제 기술을 조합해서 실시함으로써 UK-2가 분리되고 정제될 수 있다.
<UK-2 유도체를 생산하기 위한 방법>
상술한 바와 같이, 본원은 저비용으로 UK-2의 대량 생산을 가능하게 한다. 따라서, 저비용으로 UK-2 유도체의 대량 생산이 그 재료로서 본원의 생산법으로 얻어지는 UK-2를 사용해서 가능해진다.
따라서, 본원은 UK-2 유도체를 생산하기 위한 방법을 제공할 수 있다. 상기 방법은:
본원의 박테리아 등을 배양하고, UK-2(UK-2A, UK-2B, UK-2C 또는 UK-2D)를 박테리아 등의 배양으로부터 수집하는 단계; 및
수집된 UK-2로부터 하기 식(1) 중 어느 하나로 나타내어지는 UK-2 유도체를 합성하는 단계를 포함한다.
[화학식 9]
Figure pct00009
[식(1)에서,
R은 2-메틸프로파노일기, 트랜스-2-메틸-2-부타노일기, 3-메틸부타노일기 및 2-메틸부타노일기 중 어느 하나를 나타냄.
R1은 C1 -6 알킬기, 벤질기, C1 -10 알킬카르보닐기(C1 -10 알킬카르보닐기는 카르복실기, 벤질옥시카르보닐기, C1 -4 알킬옥시카르보닐기 및 벤질옥시카르보닐아미노기 중 어느 하나로 치환될 수 있음), 벤조일기, C1 -4 알킬옥시카르보닐기, (C1 -4)알킬옥시카르보닐(C1-4)알킬기, 니트로기로 치환 가능한 벤질옥시카르보닐(C1-4)알킬기, C1-6 알킬술포닐, 디(C1-6)알킬포스포릴기, 디페닐포스포리기 및 하기 식(2)으로 표시되는 치환기 중 어느 하나를 나타내고;
[화학식 10]
Figure pct00010
(식(2)에서,
Q는 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
M은 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
T는 O, OC(O), OC(O)O, S, SC(O), SC(O)O 및 하기 식(3)으로 표시되는 치환기로 이루어지는 군으로부터 선택됨;
[화학식 11]
Figure pct00011
G는 H, C1 -6 알킬기, C1 -6 알콕시 C1 -6 알킬기, C2 -6 알케닐기, C2 -6 알키닐기, C3-6 시클로알킬기, 아릴기 및 헤테로아릴기로 이루어지는 군으로부터 선택됨.
G 및 M은 임의적으로 옥소기를 가지는 이소벤조퓨란 고리를 형성할 수 있음.
M 및 Q는 3-8원 카르보시클릭 시스템을 형성할 수 있음.].
식(2)으로 표시되는 치환기에 있어서, 알킬기, 알키닐기, 알케닐기, 시클로알킬기, 아릴기 및 헤테로아릴기는 하기 치환기로 이루어지는 군으로부터 선택되는 적어도 하나의 치환기로 치환될 수 있고;
C1 -6 알킬기, C2 -6 알케닐기, C2 -6 알키닐기, C3 -6 시클로알킬기, C5 -6 시클로알케닐기, 아릴기, 헤테로아릴기, 할로겐 원자, 니트로기, 히드록시기, 시아노기, C1 -6 알콕시기, C2 -6 알케녹시기, C3 -6 시클로알콕시기, 아릴옥시기, 헤테로아릴옥시기, 아실옥시기, C1 -6 알킬아실옥시기, C3 -6 시클로알킬아실옥시기, 아릴아실옥시기, 헤테로아릴아실옥시기, C1 -6 알킬옥시아실기, C3 -6 시클로알킬옥시아실기, 아릴옥시아실기, 헤테로아릴옥시아실기, C1 -6 알킬아실기, C3 -6 시클로알킬아실기, 아릴아실기, 헤테로아릴아실기, C1 -6 알킬아실아미노기, C3 -6 시클로알킬아실아미노기, 아릴아실아미노기, 헤테로아릴아실아미노기, C1 -6 알킬아미노아실기, C3 -6 시클로알킬아미노아실기, 아릴아미노아실기, 헤테로아릴아미노아실기, C1 -6 알킬티오기, C3 -6 시클로알킬티오기, 아릴티오기, 헤테로아릴티오기 C1 -6 알킬술포닐기, C3 -6 시클로알킬술포닐기, 아릴술포닐기, 헤테로아릴술포닐기, C1 -6 알킬술피닐기, C3 -6 시클로아릴술피닐기, 아릴술피닐기, 헤테로아릴술피닐기 및 -C(NORX)RY 여기서 RY 및 RX는 독립적으로 H, C1 -6 알킬기, C2 -6 알케닐기, C3 -6 시클로알킬기, 아릴기 및 헤테로아릴기 중 어느 하나이고 이것들 중 치환기를 포함하는 임의의 알킬 또는 시클로알킬은 하나 또는 그 이상의 할로겐으로 치환될 수 있다.
단, 치환기는 하기 치환기로 이루어지는 군으로부터 선택되는 적어도 하나의 치환기로도 치환될 수 있고;
C1 -6 알킬기, C2 -6 알케닐기, C2 -6 알키닐기, C3 -6 시클로알킬기, C5 -6 시클로알케닐기, 아릴기, 헤테로아릴기, 할로겐 원자, 니트로기, 히드록시기, 시아노기, C1 -6 알콕시기, C2 -6 알케녹시기, C3 -6 시클로알콕시기, 아릴옥시기, 헤테로아릴옥시기, 아실옥시기, C1 -6 알킬아실옥시기, C3 -6 시클로알킬아실옥시기, 아릴아실옥시기, 헤테로아릴아실옥시기, C1 -6 알킬옥시아실기, C3 -6 시클로알킬옥시아실기, 아릴옥시아실기, 헤테로아릴옥시아실기, C1 -6 알킬아실기, C3 -6 시클로알킬아실기, 아릴아실기, 헤테로아릴아실기, C1 -6 알킬아실아미노기, C3 -6 시클로알킬아실아미노기, 아릴아실아미노기, 헤테로아릴아실아미노기, C1 -6 알킬아미노아실기, C3 -6 시클로알킬아미노아실기, 아릴아미노아실기, 헤테로아릴아미노아실기, C1 -6 알킬티오기, C3 -6 시클로알킬티오기, 아릴티오기, 헤테로아릴티오기 C1 -6 알킬술포닐기, C3 -6 시클로알킬술포닐기, 아릴술포닐기, 헤테로아릴술포닐기, C1 -6 알킬술피닐기, C3 -6 시클로알킬술피닐기, 아릴술피닐기, 헤테로아릴술피닐기 및 -C(NORX)RY 여기서 RY 및 RX는 독립적으로 H, C1 -6 알킬기, C2 -6 알케닐기, C3 -6 시클로알킬기, 아릴기 및 헤테로아릴기 중 어느 하나이고 이것들 중 치환기를 포함하는 임의의 알킬 또는 시클로알킬은 하나 또는 그 이상의 할로겐으로 치환될 수 있다.
또한, 본원은 UK-2 유도체를 생산하기 위한 방법도 제공될 수 있고, 상기 방법은:
본원의 박테리아 등을 배양하고, 그리고 박테리아 등의 배양으로부터 UK-2를 수집하는 단계; 및
수집된 UK-2로부터 하기 식(4)~(7) 중 어느 하나로 표시되는 UK-2 유도체를 합성하는 단계를 포함한다.
[화학식 12]
Figure pct00012
[화학식 13]
Figure pct00013
[화학식 14]
Figure pct00014
[화학식 15]
Figure pct00015
배양으로부터 UK-2A, UK-2B, UK-2C 또는 UK-2D 수집할 때, UK-2A, UK-2B, UK-2C 또는 UK-2D는, 예를 들면 유기 용제와 같은 추출 분획을 용제 전이 용해, 순상 및 역상 크로마토그래피, 겔 여과 크로마토그래피, 및 결정화와 같은 공지된 정제 기술을 조합하여 실시함으로써 상술한 바와 같이 분리되고 정제될 수 있다. 보다 구체적으로, 유기 용제와 같은 추출 분획은 감압 하에 농축된다. 생성물을 클로로폼에 옮겨서 용해시키고, 클로로폼/메탄올을 사용해서 순차적으로 용출시키는 실리카겔 크로마토그래피로 실시했다. 따라서, 약 3:1의 비율로 UK-2A 및 UK-2D를 포함하고, UK-2B 및 UK-2C의 미량을 포함하는 분획을 얻을 수 있다. 추가로, 분획은 C-18 칼럼을 사용해서 역상 고속 액체 크로마토그래피(HPLC)에 의해 처리됨으로써, UK-2A, UK-2B, UK-2C 또는 UK-2D가 분리될 수 있다(특허문헌 1 참조).
이어서, 식(1) 및 (4)~(7) 중 어느 하나로 표시되는 UK-2A, UK-2B, UK-2C 또는 UK-2D의 유도체는 UK-2A, UK-2B, UK-2C 또는 UK-2D를 사용하여 합성됨으로써, 예를 들면 국제공개 2003/035617호 또는 국제공개 1999/40081호에 기재된 합성 방법에 의해 그 물질로서 수집될 수 있다.
[실시예]
이하, 본원은 실시예에 기초해서 보다 구체적으로 기재될 것이다. 그러나, 본원은 이하 실시예에 제한되는 것은 아니다.
단, 본 실시예에 기재된 미생물은 다음과 같이 기탁된다. 스트렙토베르티실룸 sp. 3-7은 헤이세이 23(2011) 11월 9일자로 수탁 번호 FERM BP-11437 하에 일본 산업기술총합연구소 특허생물기탁센터(일본 우편번호 305-8566 이바라키 츠쿠바 히가시 1-1-1 센트럴 6)에 기탁되었다. 부수적으로, 일본 산업기술총합연구소 특허생물기탁센터(구 명칭: IPOD)에 의한 특허 미생물의 기탁은 2012년 4월 자로 제품평가기술기반기구(우편번호 292-0818 시바 키사라즈시 2-5-8 카즈사카마타리 #122 NITE)에 의해 계승되었다.
(실시예 1)
<유전체 DNA 라이브러리의 제조>
UK-2 생합성에 필요한 유전자를 분리하기 위해서, 우선 UK-2를 생산할 수 있는 스트렙토베르티실룸 sp. 3-7의 유전체 DNA 라이브러리가 후술하는 방법에 의해 제조되었다.
스트렙토베르티실룸 sp. 3-7은 개질된 YEME(0.3% Difco 효모 추출물, 0.5% Difco 백토 펩톤, 0.3% Oxoid 맥아 추출물, 3.0% 수크로오스, 1.0% 글루코오스, 5 m㏖/L MgCl2·6H2O) 50 ㎖에 접종되고 18시간 동안 30℃에서 220 rpm으로 진탕 배양하였다. 배양이 완료된 후, 박테리아 세포를 10분 동안 7500 rpm에서 원심 분리하여 수집하였다. 이렇게 얻어진 박테리아 세포로부터, 유전체 DNA는 염석법을 채용하여 제조하였다["Practical Streptomyces Genetics," The John Innes Foundation, (UK), Norwich, 2000 참조].
얻어진 유전체 DNA는 제한 효소 MboI로 부분적으로 절단된 다음, 알칼리성 인산가수분해효소로 처리해서 DNA 말단을 탈인산화시켰다. 이 DNA 단편을, 제한 효소 XbaI로 절단하기 전에 알칼리성 인산가수분해효소 처리하여 탈인산화시키고 추가로 제한 효소 BamHI로 절단한 상업적으로 이용 가능한 코스미드 벡터 SuperCos1(Stratagene Corporation 제조)에 라이게이션시켰다. 따라서, 재조합형 코스미드 벡터가 제조되었다. 이 재조합 코스미드 벡터는 Epicentre Biotechnologies에 의해 제조된 MAXPLAX Lambda Packaging Extracts를 사용하여 인 비트로 패키징을 실시했다. 코스미드 유전체 DNA 라이브러리를 제조하기 위해 대장균 XLI-Blue MRA가 함께 감염되었다.
(실시예 2)
<UK-2 생합성 유전자의 평가>
실시예 1에 기재된 방법에 의해 제조된 유전체 DNA에 기초해서, Roche GS FLX 티타늄 시퀀서용 메이트 페어 라이브러리의 구축을 Genaris, Inc.에 위탁했다. 이어서, 이 시퀀서는 서열을 결정하는데 사용되었다. 이와 별개로, 유전체 DNA에 기초해서 이 시퀀서용 단편 라이브러리가 구성되었다. 이어서, 이 시퀀서는 서열을 결정하는데 사용되었다. 메이트 페어 라이브러리로부터 얻어진 시퀀스 및 단편 라이브러리로부터 얻어진 시퀀스는 함께 조립되어서 콘틱 시퀀스 및 스카폴드 시퀀스를 얻었다.
UK-2는 특유의 3-히드록시피콜린산 골격을 갖는다. 한편, 버지니아마이신도 히드록시피콜린산 골격을 갖는다. 버지니아마이신 생합성에 관여되는 2개의 유전자(visA, visB)가 개시되어 왔다(비특허문헌 2 참조). 따라서, 상동성 분석은 이들 2개의 유전자에 의해 인코딩된 단백질의 아미노산 서열과 UK-2 생성 박테리아의 유전체으로부터 얻어지는 제안되는 아미노산 서열 사이에서 수행되어서 히드록시피콜린산 골격 형성에 관여되는 유전자의 존재를 검사했다. 표 1 및 2는 얻어진 결과를 나타낸다.
Figure pct00016
Figure pct00017
검사 결과, VisA 및 VisB와 높은 상동성을 갖는 유전자가 연속하여 위치되는 자리는 스크렙토베르티실룸 sp. 3-7로부터 유래된 유전체 상의 단일 자리라는 것을 알아냈다(표 1 참조). 또한, UK-2 골격을 형성하는데 필요하다고 생각되는 비리보솜 펩티드 합성 효소(NRPS) 및 폴리케티드 합성 효소(PKS)와 관련된 유전자가 이들 유전자 근처에 위치하였다(표 2 참조). 방선균의 2차 대사 산물의 유전자가 클러스터를 형성하기 때문에 유전자 주위 영역은 UK-2 생합성 유전자 클러스터가 된다고 예상되었다. 또한, UK-2 생합성 유전자 클러스터에 위치된 유전자(ORFs)와 다음과 같이 각각의 유전자에 의해 인코딩되는 단백질들의 예상되는 기능 간에 다음과 같은 정령이 존재한다.
ORF1은 잠재적으로 생합성 유전자 클러스터의 조절에 관여하는 유전자이다. ORF5, ORF6, ORF7, 및 ORF16은 3-히드록시피콜린산 골격의 생합성에 관여하는 유전자이다. ORF2, ORF3, 및 ORF17은 벤질말론산 골격의 생합성에 관여하는 유전자이다. ORF13은 피콜린산 골격, 세린, 및 젖산의 생합성에 관여하는 유전자이다. ORF11 및 ORF12는 벤질말론산의 생합성과 피콜린산, 세린, 및 젖산의 신진대사에 관여하는 유전자이다. ORF8은 폴리케티드 합성 효소(PKS)의 황화에스테르 결합의 절단과 피콜린산, 세린, 젖산, 및 벤질말론산의 신진대사에 관여하는 유전자이다.
(실시예 3)
<유전체 DNA 라이브러리의 스크리닝>
UK-2 생합성 유전자의 상류에 위치된 ORF5 시퀀스의 부분은 실시예 1에 제조된 유전체 DNA 라이브러리의 스크리닝을 위한 프로브로서 사용되었고, 후술한 바와 같이 PCR에 의해 제조되었다.
PCR은 프라이머로서 실시예 1에 기재된 유전체 DNA 및 visA'-F: 5'-GGGGCAGCCTGCTCGGCGAG-3(SEQ ID NO: 36) 및 visA'-R: 5'-GGTGAGCTCCCCGATCAGGG-3(SEQ ID NO : 37)의 올리고 DNAs를 사용하여 수행되었다. PCR은 DNA 폴리메라아제로서 LA Tag DNA 폴리메라아제(Takara Bio Inc. 제조) 및 PERKIN ELMER GeneAmp PCR System 9700을 사용하여 수행되었다. 유전체 DNA의 0.5 ㎕(0.5 ㎍과 상응하는 양), 효소를 수반하는 2배 농축 반응을 위한 버퍼 25 ㎕, DMSO 용액 2.5 ㎕, 2.5-mM dNTP 용액 5 ㎕, 농도가 100 pmol/㎕로 조정된 각각의 프라이머 0.25 ㎕, 효소 0.3 ㎕, 및 멸균수 16.2 ㎕를 첨가하여 반응액의 양을 50 ㎕로 조정했다. 반응을 다음과 같이 행했다: 10분 동안 95℃에서 전처리; 30초 동안 95℃, 30초 동안 55℃, 및 2분 동안 72℃로 각각 이루어지는 30주기로 인큐베이션; 5분 동안 72℃에서 추가 인큐베이션했다. 반응이 완료된 후, 반응액의 일부를 아가로오스겔 상에 전기 영동시켰다. 결과적으로, DNA 단편의 약 1.3 kbp가 특별히 증폭된다는 것을 확인했다. 이어서, 나머지 반응액을 핵산 정제용 혼합 용액(페놀:클로로폼:이소아밀 알콜=25:24:1, V/V)으로 추출한 다음, 에탄올 침전물로 추출을 실시했다. 침전물을 멸균수에 다시 용해하고, 아가로오스겔 상에서 전기 영동시켰다. 밴드의 약 1.3 kbp가 종래 방법에 의해서 절단되고, DNA 단편이 수집되었다.
콜로니 혼성화법은 프로브로서 DNA 단편 및 ECL Direct DNA/RNA 라벨링과 탐지 시스템(Amersham Pharmacia Biotech Inc. 제조)을 사용하여 수행되었고, 약 5000 콜로니가 스크리닝되었다. 다수의 양성 클론이 얻어졌다. 플라스미드 pUK2-B44는 클론 중 하나로부터 분리되었다.
또한, UK-2 생합성 유전자의 하류에 위치되는 ORF13의 일부가 프로브로서 사용되었고, 후술하는 바와 같이 PCR에 의해 제조되었다.
PCR은 주형으로서 실시예 1에 기재된 유전체 DNA 및 프라이머로서 caiC-F: 5'-GCGCTCGTACGCCTCGCTGAT-3'(SEQ ID NO: 38) 및 caiC-R: 5'-CGGGCTCGGTGGTGAGCAGG-3'(SEQ ID NO: 39)의 올리고 DNAs를 사용하여 수행되었다. PCR은 DNA 폴리메라아제로서 LA Tag DNA 폴리메라아제(Takara Bio Inc. 제조) 및 PERKIN ELMER GeneAmp PCR System 9700을 사용하여 수행되었다. 유전체 DNA의 0.5 ㎕(0.5 ㎍과 상응하는 양), 효소를 수반하는 2배 농축 반응을 위한 버퍼 25 ㎕, DMSO 용액 2.5 ㎕, 2.5-mM dNTP 용액 5 ㎕, 농도가 100 pmol/㎕로 조정된 각각의 프라이머 0.25 ㎕, 효소 0.3 ㎕, 및 멸균수 16.2 ㎕를 첨가하여 반응액의 양을 50 ㎕로 조정했다. 반응을 다음과 같이 행했다: 10분 동안 95℃에서 전처리; 30초 동안 95℃, 30초 동안 59℃, 및 2분 및 20초 동안 72℃로 각각 이루어지는 30주기로 인큐베이션했다. 결과적으로, DNA 단편의 약 2.3 kbp가 특별히 증폭된다는 것을 확인했다. 이어서, 나머지 반응액을 상술한 핵산 정제용 혼합 용액으로 추출한 다음, 에탄올 침전물로 추출을 실시했다. 침전물을 멸균수에 다시 용해하고, 아가로오스겔 상에서 전기 영동시켰다. 밴드의 약 2.3 kbp가 종래 방법에 의해서 절단되고, DNA 단편이 수집되었다.
콜로니 혼성화법은 프로브로서 DNA 단편 및 ECL Direct DNA/RNA 라벨링과 탐지 시스템(Amersham Pharmacia Biotech Inc. 제조)을 사용하여 수행되었고, 약 5000 콜로니가 스크리닝되었다. 다수의 양성 클론이 얻어졌다. 플라스미드 pUK2-B4는 클론 중 하나로부터 분리되었다.
(실시예 4)
<생합성 유전자 클러스터를 포함하는 플라스미드 pUK2-3의 구축>
예상되는 생합성 클러스터의 상류 영역 1~21531과 하류 영역 16211~34641을 각각 포함하는 이렇게 얻어진 플라스미드 pUK2-B44 및 pUK2-E4를 사용해서 전체 생합성 클러스터 영역을 포함하는 플라스미드를 구축했다. 우선, 플라스미드 모두는 제한 효소 ClaI 및 PspXI로 절단된 다음, 아가로오스겔 상에 전기 영동되고, 밴드의 약 28 kbp와 약 19 kbp가 각각 종래 방법에 의해서 절단되어 DNA 단편이 수집되었다. DNA 단편은 DNA 라이게이션 키트<Mighty Mix>(Takara Bio Inc. 제조)를 사용하여 라이게이션되어서 pUK2-16을 제조했다.
이어서, [Gust, B. 등, "Proceedings of the National Academy of Sciences of the United States of America," (US), 2003, 100권, 1541-1546페이지]에 기재된 전용(redirect) 기술을 사용해서, 플라스미드 pUK2-16이 방선균에 접합 전달 가능한 벡터로서 사용되었다. 우선, 플라스미드 pUK2-16은 전기 영동에 의한 대장균 BW25113/pIJ790 균주에 도입되어서 대장균 BW25113/pIJ790/pUK2-16 균주를 얻었다. 이 균주를 각각 25 ㎍/㎖, 50 ㎍/㎖ 및 50 ㎍/㎖의 농도로 클로람페니콜, 카나마이신 및 앰피실린을 함유하는 LB 액체 배지 100 ㎖(1% 백토 트립톤, 0.5% 효모 추출물, 0.5% 염화 나트륨)에 접종하고, 밤새 30℃에서 배양했다. 이어서, 배양액의 100 ㎕를 각각 25 ㎍/㎖, 50 ㎍/㎖, 50 ㎍/㎖ 및 10 mM의 농도로 클로람페니콜, 카나마이신, 앰피실린 및 L-아라비노스를 함유하는 65 ㎖ 시험관에서 제조된 SOB 배지 10 ㎖(2% 백토 트립톤, 0.5% 효모 추출물, 0.05% 염화 나트륨, 0.0186% 염화 칼륨)에 접종했다. 얻어진 배양을 4시간 동안 30℃에서 진탕 배양했다. 박테리아 세포를 모든 배양 용액으로부터 수집하고, 빙냉한 10% 글리세린 용액으로 2회 세정하고, 전기 영동용 세포로서 10% 글리세린 용액 100 ㎕에 재현탁했다. 한편, oriT, attP, Int φC31을 함유하는 SspI 단편 5.2 kb 및 pMJCOS1(John Innes Centre(Norwich))로부터 유래된 아프라마이신 저항성 유전자를 정제했다. 이렇게 제조된 DNA 단편(약 100 ng) 및 세포의 50 ㎕를 미리 빙냉한 2 ㎜의 갭을 가진 큐벳에 옮기고, 전기 영동(BM Equipment Co., Ltd.에서 제조된 Electro Cell Manipulator 600을 사용)을 실시했다. 처리 후에, 냉각된 LB 액체 배지 1 ㎖를 생성물에 부가하고, 이것을 배양하기 위해 1시간 동안 37℃에서 정치했다. 이것을 앰피실린 및 아프라마이신을 함유하는 LB 한천 배지에 적용한 다음, 밤새 37℃에서 배양했다. 성장 균주를 앰피실린 및 아프라마이신을 함유하는 LB 액체 배지 내에서 배양하고, 플라스미드 pUK2-3을 분리했다. 이 pUK2-3은 방선균에 접합 전달할 수 있는 플라스미드이고, 이것은 oriT, attP, Int φC31 및 벡터 일부에 아프라마이신 저항성 유전자를 갖고 전체 영역은 UK-2 생합성 클러스터가 될 것으로 기대된다.
(실시예 5)
<생합성 유전자 결핍 벡터의 구축>
스트렙토베르티실룸 sp. 3-7의 유전체 DNA로부터 ORF12 및 ORF13의 일부에 해당하는 약 7.5 kbp의 유전자가 결핍된, 유전자 파괴된 균주를 후술하는 방법에 의해 제조했다.
PCR은 주형으로서 실시예 1에 기재된 유전체 DNA 및 프라이머로서 caiC-F: 5'-GCGCTCGTACGCCTCGCTGAT-3'(SEQ ID NO: 38)과 41c29-R: 5'-GTCCGTGGCGCCGCCGGATT-3'(SEQ ID NO: 40)의 올리고 DNAs를 사용하여 수행되었다. PCR은 DNA 폴리메라아제로서 LA Taq DNA 폴리메라아제(Takara Bio Inc. 제조) 및 PERKIN ELMER GeneAmp PCR System 9700을 사용하여 행해진다. 유전체 DNA의 0.5 ㎕(0.5 ㎍과 상응하는 양), 효소를 수반하는 2배 농축 반응을 위한 버퍼 25 ㎕, DMSO 용액 2.5 ㎕, 2.5-mM dNTP 용액 5 ㎕, 농도가 100 pmol/㎕로 조정된 각각의 프라이머 0.25 ㎕, 효소 0.3 ㎕, 및 멸균수 16.2 ㎕를 첨가하여 반응액의 양을 50 ㎕로 조정했다. 반응을 다음과 같이 행했다: 10분 동안 95℃에서 전처리; 30초 동안 95℃, 5초 동안 60℃, 및 7분 동안 72℃로 각각 이루어지는 30주기로 인큐베이션했다. 반응이 완료된 후에, 반응액의 일부를 아가로오스겔 상에서 전기 영동시켰다. 결과적으로, DNA 단편의 약 7.5 kbp가 특별히 증폭된다는 것을 확인했다. DNA 단편을 이것에 부착된 프로토콜에 따라 TOPO TA 클로닝 키트(Invitrogen Corporation 제조)를 사용하여 pCR2.1-TOPO 플라스미드 벡터에 삽입했다. 그렇게 함으로써, 플라스미드 TOPO-41c29를 얻었다.
이어서, 아프라마이신 저항성 유전자를 플라스미드 TOPO-41c29의 삽입된 단편에 삽입해서 다음과 같이 플라스미드 TOPO-
Figure pct00018
41c29-Am을 제조했다.
플라스미드 pIJ733[Gust, B. 등, "Proceedings of the National Academy of Sciences of the United Stated of America," (US), 2003, 100권, 1541-1546페이지]를 HindIII 및 EcoRI로 이중 절단시킨 다음, 아가로오스 겔 상에서 전기 영동시켰다. 이어서, DNA 단편을 종래 방법에 의해 절단하고 수집했다. 따라서, 목적 아프라마이신 저항성 유전자를 포함하는 DNA 단편의 약 1.3 kb를 얻었다. PCR은 주형으로서 이 단편 및 41c30-apraF: 5'-GTCACCGTCCCCGCCTACGGCGACGGCGTCGTCCTGGTGATTCCGGGGATCCGTCGACC-3'(SEQ ID NO: 41)과 41c30-apraR: 5'-GGTCGCGGGCGAAGGCGTAGCCGGGCAGGTCGGGCAGGATGTAGGCTGGAGCTGCTTC-3'(SEQ ID NO: 42)의 2가지 타입의 합성 프라이머를 사용하여 수행되었다. PCR은 DNA 폴리메라아제로서 LA Taq DNA 폴리메라아제(Takara Bio Inc. 제조) 및 PERKIN ELMER GeneAmp PCR 시스템 9700을 사용하여 행해진다.
유전체 DNA의 0.5 ㎕(0.5 ㎍과 상응하는 양), 효소를 수반하는 2배 농축 반응을 위한 버퍼 25 ㎕, DMSO 용액 2.5 ㎕, 2.5-mM dNTP 용액 5 ㎕, 농도가 100 pmol/㎕로 조정된 각각의 프라이머 0.25 ㎕, 효소 0.3 ㎕, 및 멸균수 16.2 ㎕를 부가하여 반응액의 양을 50 ㎕로 조정했다. 반응을 다음과 같이 행했다: 2분 동안 94℃에서 전처리; 45초 동안 94℃, 45초 동안 50℃, 및 1분과 30초 동안 72℃로 각각 이루어지는 10주기로 인큐베이션하고; 이어서, 45초 동안 94℃, 45초 동안 55℃, 및 1분과 30초 동안 72℃로 각각 이루어지는 15주기로 인큐베이션하고; 5분 동안 72℃에서 추가 반응을 수행했다. 반응이 완료된 후에, 반응액의 일부를 아가로오스 겔 상에서 전기 영동시켰다. 결과적으로, DNA 단편의 약 1.4 kbp가 특별히 증폭된다는 것을 확인했다.
이어서, TOPO-
Figure pct00019
41c29를 대장균 BW25113/pIJ790[Gust, B. 등, "Proceedings of the National Academy of Sciences of the United States of America," (US), 2003, 100권, 1541-1546페이지]에 도입해서 대장균 BW25113/pIJ790/TOPO-
Figure pct00020
41c29 균주를 얻었다. 이 균주를 각각 25 ㎍/㎖, 25 ㎍/㎖ 및 50 ㎍/㎖의 농축으로 클로람페니콜, 카나마이신 및 앰피실린을 함유하는 LB 액체 배지 100 ㎖에 접종하고, 밤새 30℃에서 배양했다. 이어서, SOB 배지 10 ㎖를 각각 25 ㎍/㎖, 25 ㎍/㎖, 50 ㎍/㎖, 및 10 mM의 농축에서 클로람페니콜, 카나마이신, 앰피실린, 및 L-아라비노오스로 보충된 65 ㎖ 시험관에 공급했다. 이것에, 밤새 배양된 대장균 BW25113/pIJ790/TOPO-
Figure pct00021
41c29 균주의 배양액 100 ㎕를 옮기고, 4시간 동안 30℃에서 진탕 배양했다. 모든 배양액을 5분 동안 4℃에서 3000 rpm으로 원심 분리한 다음, 빙랭한 10% 글리세린 용액 10 ㎖에 현탁되어 있는 박테리아 세포를 수집했다. 이 작업을 반복한 후에, 얻어진 박테리아 세포를 냉각된 10% 글리세린 용액 100 ㎕에 재현탁했다. 이어서, 박테리아 세포 현탁액 50 ㎕를 Eppendorf 튜브에 수집하고, 그것에 pIJ773으로부터 유래된 상술한 아프라마이신 저항성 유전자를 함유하는 DNA 단편의 약 1.4 kb의 용액 5 ㎕를 첨가했다. 혼합물을 이미 빙랭한 2 ㎜의 갭을 가진 전기 영동 큐벳(BM6200: BM Equipment Co., Ltd. 제조)에 옮겼다. 전기 영동은 12.5 kV, 25 ㎌, 및 128 Ω의 조건 하에서 Electro Cell Manipulator 600(BM Equipment Co., Ltd. 제조)을 사용하여 행했다. 처리 후에, 이미 빙랭한 LB 액체 배지 1 ㎖를 박테리아 세포에 첨가한 다음, 배양하기 위해서 1시간 동안 37℃에서 정치했다. 이것을 50 ㎍/㎖에서 각각 앰피실린 및 아프라마이신으로 보충된 LB 한천 배지에 적용했다. 생성물을 밤새 37℃에서 배양해서 앰피실린 및 아프라마이신 모두에 대한 내성을 갖는 균주를 얻었다. 이 균주를 50 ㎍/㎖에서 각각 앰피실린 및 아프라마이신으로 보충된 LB 액체 배지 내에서 배양했다. 따라서, 플라스미드 TOPO-
Figure pct00022
41c29Am을 분리했다.
(실시예 6)
<생합성 유전자 결핍 균주의 생성>
플라스미드 TOPO-
Figure pct00023
41c29를 종래 방법에 의해 대장균 ET12567/pUZ8002 균주["Practical 스트렙토마이시스 Genetics," The John Innes Foundation, (UK), Norwich, 2000]에 도입해서 대장균 ET12567/pUZ8002/TOPO-
Figure pct00024
41c29를 얻었다.
스트렙토베르티실룸을 다음과 같이 대장균 ET12567/pUZ8002/TOPO-
Figure pct00025
41c29에 공역했다. 우선, 스트렙토베르티실룸 균주를 65 ㎖ 시험관에서 제조된 액체 배지(S#1)[Ueki, M 등, "The Journal of Antibiotics," (Japan), 1996, 49권, 639-643페이지]에 접종하고, 24시간 동안 30℃에서 배양했다. 생성물을 MS 한천 배지(2% 콩가루, 2% 만니톨, 2% 한천)에 적용하고, 2일 동안 30℃에서 배양했다. 배양 후에, 균사체를 20% 글리세롤 3 ㎖로 스크레이핑함으로써 수집해서 숙주 균사체 용액을 제조했다.
박테리아 세포를 5분 동안 3000 rpm에서 원심 분리하여 수집한 후에, 박테리아 세포를 20% 글리세린 용액 3 ㎖에 현탁했다. 한편, 대장균 ET12567/pUZ8002/TOPO-
Figure pct00026
41c29-Am를 50 ㎍/㎖의 농도에서 각각 앰피실린 및 아프라마이신으로 보충된 LB 액체 배지에 18시간 동안 37℃에서 배양했다. 이어서, 배양액 1 ㎖를 LB 액체 배지(50 ㎍/㎖의 농도에서 각각 앰피실린 및 아프라마이신을 함유) 100 ㎖에 옮기고, 4시간 동안 37℃에서 배양했다. 연속해서, 배양액 50 ㎖를 5분 동안 3000 rpm에서 원심 분리해서 박테리아 세포를 수집했다. 박테리아 세포를 LB 액체 배지 20 ㎖에 현탁했다. 이 작업을 2회 반복한 후에, 박테리아 세포를 LB 액체 배지 2 ㎖에서 현탁했다.
이어서, 스트렙토베르티실룸 세포 현탁액 10 ㎕와 대장균 ET12567/pUZ8002/코스미드203-7의 박테리아 세포 현탁액 100 ㎕를 1.5 ㎖ 관에서 함께 조합하고, 원심 분리해서 박테리아 세포를 수집했다. 20% 글리세린 용액 100 ㎕에서 현탁한 후에, 이것을 20 ㎖ 부피를 갖고 10 mM MgCl2를 함유하는 MS 한천 배지에 적용했다. 18시간 동안 30℃에서 배양한 후에, 아프라마이신 400 ㎍과 날리딕스산 1500 ㎍을 함유하는 멸균수 1 ㎖를 그것에 대해 함침했다. 5일 동안 30℃에서 배양된 후에, 한천 배지에서 성장한 스트렙토베르티실룸 클로니를 순수 배양을 실시하고 아프라마이신 250 ㎍/㎖과 카나마이신 250 ㎍/㎖로 보충된 1/2 MS 한천 배지(한천: 2%, 만니톨: 1%, 콩가루: 1%, 10 mM MgCl2)에서 2일 동안 30℃에서 배양했다. 클로니는 임의의 플레이트에서 성장하고 여러 과정: S#1 배지에 접종한 다음, 24시간 동안 30℃에서 배양하고, 개질된 YEME 배지(65 ㎖ 시험관 내에서 10 ㎖)에 접종한 다음, 1일 동안 30℃에서 진탕 배양하고, 또다른 신선한 개질된 YEME 배지(250 ㎖ 삼각 플라스크 내에서 50 ㎖)에 얻어진 배양물 1 ㎖를 추가 접종하여 계대 배양했다. 이 작업을 5번 반복한 후에, 얻어진 배양물을 이러한 방식으로 희석해서 적정 수의 살아있는 박테리아 세포를 얻었다. 이 배양액을 아프라마이신 250 ㎍/㎖를 함유하는 1/2 MS 한천 배지에 적용하고, 4일 동안 30℃에서 배양했다. 이렇게 성장한 클로니를 아프라마이신 250 ㎍/㎖과 카나마이신 250 ㎍/㎖로 보충된 1/2 MS 한천 배지에서 자기 복제했다. 카나마이신 함유 배지에서 성장하지 않지만 아프라마이신 함유 배지에서 성장하는 2개의 카나마이신-민감성 균주(D1 균주, D2 균주)를 선택했다.
얻어진 2개의 균주의 유전체 DNAs를 제조하고, PCR 반응을 41c30F4: 5'-CGTGACCGAGGTGGCGCG-3'(SEQ ID NO: 43)과 41c30RR2: 5'-GTCGTCGGATGCGCCGTGCG-3'(SEQ ID NO: 44)의 프라이머의 조합을 사용하여 수행했다. 증폭된 DNA 단편의 약 0.5 kbp가 얻어지지 않기 때문에 고안한 대로 2개의 균주는 균주를 파쇄한 것으로 확인되었다.
(실시예 7)
<생합성 유전자 결핍 균주의 배양, 및 배양액에서 UK-2A의 정량화>
파쇄된 균주, D1 균주와 D2 균주를 250 ㎖ 삼각 플라스크 내에서 제조된 S#1 배지[Ueki, M, 등, "The Journal of Antibiotics," (Japan), 1996, 49권, 639-643페이지] 50 ㎖에 각각 접종하고, 24시간 동안 30℃에서 진탕 배양했다. 이어서, 배양액 1 ㎖를 생성 배지에 접종하고, 4일 동안 30℃에서 진탕 배양했다. 이어서, 아세톤 4 ㎖를 얻어진 배양액 1 ㎖에 첨가함으로써 여과되는 UK-2A를 추출해서 추출액을 얻었다. 이것에 대해서, 5 ㎕로 HPLC 분석을 실시했다. HPLC 분석에 있어서, HPLC 시스템 LC-2010C(Shimadzu Corporation 제조)를 분석에 사용했다. 분석 조건으로서, 칼럼은 Inertsil ODS-3 4.6×250 ㎜이고, 이동상은 아세토니트릴:물:인산=60:40:0.1이며, 유동 속도는 1.1 ㎖/분이고, 칼럼 온도는 40℃이며, UV 파장은 340 ㎚이다. 얻어진 패턴을 UK-2A 표준 시료의 것과 비교했다. UK-2A로부터 유래된 피크를 확인했다. 그것의 영역에 기초해서, UK-2A를 정량화했다.
동시에, 배양액에서 UK-2A의 동일한 배양과 정량화를 형질전환체의 친주인 스트렙토베르티실룸 sp. 3-7에 대해서도 행했다. 결과적으로, D1과 D2 균주에 의한 UK-2A 생산성은 0 ㎍/㎖이었다.
(실시예 8)
<생합성 유전자 클러스터 도입된 형질전환체의 생성>
구축된 pUK2-3을 방선균에 일반적으로 사용되는 방법["Practical Streptomyces Genetics," The John Innes Foundation, (UK), Norwich, 2000, 311-338페이지]에 따라 스트렙토베르티실룸 sp. 3-7에 도입했다. 우선, 플라스미드 pUK2-3을 종래 방법에 의한 전기천공법에 의해 대장균 ET12567/pUZ8002 균주 내에 도입했다. 이 균주를 25 ㎍/㎖, 50 ㎍/㎖ 및 50 ㎍/㎖의 농도에서 각각 클로람페니콜, 카나마이신 및 아프라마이신으로 보충된 LB 액체 배지 내에 18시간 동안 37℃에서 배양했다. 이어서, 배양액을 LB 액체 배지(25 ㎍/㎖, 50 ㎍/㎖ 및 50 ㎍/㎖의 농도에서 각각 클로람페니콜, 카나마이신 및 아프라마이신을 함유) 100 ㎖에 옮기고, 4시간 동안 37℃에서 배양했다. 연속해서, 배양액 50 ㎖를 5분 동안 3000 rpm에서 원심 분리해서 박테리아 세포를 수집했다. 박테리아 세포를 LB 박테리아 배지 50 ㎖에 현탁했다. 이 작업을 2회 반복한 후에, 박테리아 세포를 LB 액체 배지 100 ㎕에 현탁했다.
한편, 스트렙토베르티실룸 sp. 3-7을 MS 한천 배지에 적용하고, 2일 동안 30℃에서 배양했다. 배양 후에, 균사체를 20% 글리세롤 1 ㎖로 스크레이퍼해서 숙주 균사체 용액을 제조했다.
이어서, 상술한 바와 같이 제조된 플라스미드 pUK2-3을 포함하는 숙주 균사체 용액 500 ㎕ 및 대장균 용액 500 ㎕를 함께 혼합하고, 박테리아 세포를 수집했다. 이어서, 박테리아 세포를 10 m㏖/L로 최종 농도를 주기 위한 이러한 방식으로 10 mM MgCl2를 첨가하여 희석시킨 MS 한천 배지에 적용했다.20시간 동안 30℃에서 배양한 후에, 아프라마이신 6 ㎎과 날리딕스산 0.5 ㎎을 함유하는 멸균수 0.5 ㎖를 그것에 대해 함침했다. 5일 동안 30℃에서 추가 배양한 후에, 형질전환체를 아프라마이신 내성 균주로서 얻었다.
(실시예 9)
<유전자 도입된 형질전환체의 배양, 및 배양액에서 UK-2A의 정량화>
유전자 도입된 형질전환체를 실시예 7에 기재된 방법에 의해 배양했다. 결과적으로, 표 3에 나타낸 바와 같이, 유전자 도입된 형질전환체의 UK-2A 생산성이 친주의 것과 비교해서 58~77배 향상되었다.
Figure pct00027
(실시예 10)
<유전자 도입된 형질전환체의 배양, 및 배양액에서 UK-2A, UK-2B, 및 UK-2C와 UK-2D의 합의 정량화>
유전자가 도입된 형질전환체를 실시예 7에 기재된 방법에 의해 배양했다. 구체적으로, 아세톤 4 ㎖를 얻어진 배양액 1 ㎖에 첨가함으로써 여과되는 UK-2A, UK-2B, UK-2C 및 UK-2D를 추출해서 추출액을 얻었다. 이것에 대해서, 5 ㎕로 HPLC 분석을 실시했다. HPLC 분석에 있어서, HPLC 용액 시스템(Shimadzu Corporation 제조)을 분석용으로 사용했다. 분석 조건으로서, 칼럼은 Inertsil ODS-3 4.6×150 ㎜이고; 이동상은 약 800 ㎖의 물로 아인산 이수소나트륨 이수화물 7.8 g을 용해하고, 인산을 사용하여 생성물의 pH를 4.0으로 조정하며, 이것에 물을 첨가해서 인산 수용액 1000 ㎖를 제조하고, 인산 수용액 350 ㎖에 액체 크로마토그래피용 아세토니트릴 650 ㎖를 첨가함으로써 얻어지는 용액이며; 유동 속도는 1.0 ㎖/분이고; 칼럼 온도는 40℃이며; UV 파장은 230 ㎚였다. 얻어진 패턴을 UK-2A, UK-2B, UK-2C 및 UK-2D 표준 시료의 것과 비교했다. UK-2A, UK-2B, UK-2C 및 UK-2D로부터 유래된 각각의 피크를 확인했다. 그것의 영역에 기초해서, UK-2A의 양, UK-2B의 양, 및 UK-2C와 UK-2D의 합계를 판단했다.
결과적으로, 표 4에 나타낸 바와 같이, 유전자가 도입된 형질전환체의 UK-2A, UK-2B, 및 UK-2C와 UK-2D의 합계의 생산성을 각각 친주의 것과 비교해서 37~57배, 10~11배, 및 12~13배 향상시켰다.
Figure pct00028
(실시예 11)
<형질전환체의 UK-2 생합성 유전자 클러스터의 복제수의 정량화>
실시예 9에서 향상된 UK-2 생산성을 갖는 것으로 확인된 형질전환체 2 균주와, 숙주 세포였던 스트렙토베르티실룸 sp. 3-7의 유전체 DNA가 실시예 1에 기술된 방법에 의하여 준비되었다. PCR 반응을 주형으로서 유전체 DNAs 및 그것에 부착된 프로토콜에 따라 StepOnePlus Real-Time PCR 시스템(Applied BioSystems Inc. 제조)을 사용하여 행했다. 이렇게 얻어진 증폭된 단편을 정량화했다. 표 5는 얻어진 결과를 나타낸다.
단, PCR 반응에서 하기 프라이머 세트가 설계 및 합성되었고, 도입된 UK-2 생합성 유전자 클러스터 내의 영역을 증폭시키기 위해 사용되었다.
UK-2 F2 (RT): 5'-GCACCTTCATGTCCGGGTTG-3'(SEQ ID NO: 45)
UK-2 R2 (RT): 5'-ATCGCCGCGTACACCATGAC-3'(SEQ ID NO: 46).
또한, 하기 프라이머가 설계 및 합성되었고, UK-2 생합성 유전자 클러스터 이외의 영역을 증폭시키기 위해 내부 제어로서 사용되었다.
cont F1 (RT): 5'-CGAAGGTCCGGTTGATGGTG-3'(SEQ ID NO: 47)
Cont R1 (RT): 5'-ATCGCTGCGACACCCTGGAG-3'(SEQ ID NO: 48)
Figure pct00029
표 5에 나타낸 바와 같이, 형질전환체의 UK-2 생합성 유전자 클러스터의 복제수가 친주 sp. 3-7의 것에 2배인 것으로 드러났다.
[산업상 이용 가능성]
상술한 바와 같이, 본원은 UK-2 생합성 유전자 또는 UK-2 생합성 유전자 클러스터의 도입에 의해 높은 UK-2 생산성을 갖는 형질전환체를 제공하는 것을 가능하게 한다.
따라서, 본원의 형질전환체를 사용함으로써 저비용으로 UK-2의 대량 생산이 가능해진다. 따라서, 본원은 도열병 방제제, 농원예용 살진균제, 및 의약 항매제를 생성하는데 유용하다.
[기탁된 생물학적 재료에 대한 참조]
[수탁 번호]
1. (1) 확인용 표시: 스트렙토베르티실룸 sp. 3-7
(2) 수탁 번호: FERM BP-11437
(3) 기탁일: 2011년 11월 9일
(4) 기탁 기관: 국제특허생물기탁센터, 일본 산업기술총합연구소
(5) 국제특허생물기탁센터, 일본 산업기술총합연구소(구 명칭: IPOD)에 의한 특허 미생물의 기탁은 제품평가기술기반기구(NITE)로 2012년 4월에 계승되었다.
[서열 목록 전체 텍스트]
SEQ ID NOs: 36~48
<223> 인위적으로 합성된 프라이머 서열
국제특허생물기탁센터 IPODFERMBP-11437 20111109 일본 산업기술총합연구소 NITEFERMBP-11437 20111109
SEQUENCE LISTING <110> Meiji Seika Pharma Co., Ltd. <120> UK-2 BIOSYNTHETIC GENE AND METHOD FOR IMPROVING UK-2 PRODUCTIVITY USING THE SAME <130> IBPF13-515WO <150> JP2012/153986 <151> 2012-07-09 <160> 48 <170> PatentIn version 3.1 <210> 1 <211> 31318 <212> DNA <213> Streptoverticillium <400> 1 atgagttcct tggcgacccc cacccccact ctcgagggcc tcctcacgac accggcggcg 60 cagcacgccg aagcacaccc cccgctccac cggccgggct cggccacggc ctgcctcgac 120 cggggcctgg tcctccggca ggcggacgag gagttcttcc gccggttcgg cggctcggcc 180 ccgcgcctcg tcggccggtc cttcaccgag ctggtgcacc ccggctgccg ggagcccctg 240 ctgcggcagt tcgccgggct caccgagggc cggcgcgacc ggttcggcac cgaggtcatc 300 gcggtgggcc cggacggcac cccgttccgg accgacctga cggcgctggc ggtacgcggc 360 ggaacccccg acatctcggc cgtctggctg acgctggcgg cggccggcga gaccgcgcag 420 cccgccgccg cgacgccccg caagaagatc ctcagcgaga tcgacgcccg catcctcgaa 480 ggcatcgcgg ccggtgtctc caccgtcccc ctggccgcac gcctgtatct gagccggcag 540 ggggtcgagt accacgtgaa gagcctgttc cggcagctcc gcgtgcccaa ccgggccgcg 600 ctcgtctccc gcgcctactc catgggcctg ctcaaggtgg ggacctggcc gcccaaggtg 660 gcgccggact tcgtcaagtg agcccggacc gcggggtgat gacgtgtcgc ggcgcggggt 720 ccgcgtgcag ccgggcgacc agcggcgcgc gggcggccag cacccggcgc tggttgacgt 780 agcccttgtc ggtgatctcg cccgcgtcca ggtcgggcgg gtccgcgagc accagcagcc 840 gctggacccg ggacgcggac ccggcgcccc ggttgagtcg ctccagtgcc gcgccgaggt 900 gggcggccag cgcgtcggag tacagcaccc cgccgtccgc ggccggccgc cggccgagca 960 gccgctcggc ctcggccggg tcgagccacg ccagcgcgca gaccgcgtcc cggtgctccc 1020 cggtgatcac cgcgtcggag aggaccggcg cggccgaaag cagcgcgccg cgcacggctt 1080 cgacgtgcac gaacgtaccg gtggacagct tgaagtcctc ggtcagccgg ccccggaaca 1140 ccagccccgc gcccgcgtcg ccggggtcgg cgaacgcgac ggcgtctccc ggccggtagt 1200 agccctcctc gtcgaaggcg cgcgcgtcga ggtccgggcg gccgaggtag ccgggcgtca 1260 cgtgcgggcc gcgcacccgg acctcgtagc cgtcaccctc cgccggtacg agcttcagct 1320 ccacccccgg cagcggcacg ccgatgcacc gcgggtcggt gaacgggaag tgcgcgctgg 1380 tggacgccgg cgaggtctcg gtggcgcccc acgagcccgt caccggcacg tcccgcccgg 1440 tcacttcgcg gcccagcgcc cggagccgtt cgcgcagggc cggggccagc gccgccgccg 1500 cgttgaagac gagccgcagc cgggcgaaga accgctccgc cagctcccgg tcgcgctcca 1560 gggcggggac gagccgcgcg tacccggccg ggacgttgaa cgccagggtc ggggagacct 1620 cgcgcaggtt ggccagggtg cgcccgaaca gctccggggt cgggcggccg tcgtcgaggt 1680 acagagtgcc gccgttggcc agcaccaggt tcacgttgtg gttgccgccg aaggtgtggc 1740 tccacggcag ccagtccagc agcaccggcc gctccccggc caggaacggc cacacctgcc 1800 gcatcatccg ctggttggca cagagcatgc cgtgcgtggt gacgacgccc ttcggcgctc 1860 ccgtcgagcc cgacgtgaag aggaccttcg cgaccgtcgc gctcgtgacg cccgcacggg 1920 ccgcctcgaa cgcgcggccc ggcaccgtac gcagcagggc gtccagcgag tgctccgccg 1980 gcccgccccg cgccgccacg acgatggctc caccgcccgc cgcggccagc gcgggaccga 2040 acggcccggc gtcctcggcg tacaccgcgc ccggccgcag cagttccgcg atcgcccgga 2100 tccgcgcgtg gtcccggctc agcagggagt aggcgacgct gaccggcgcc accgggatcc 2160 cggcgctcag cgcgccgagc gtcatcagca ggtgcccggt ggagttgccg gacaggacca 2220 tcagcggccg ccgcgccgac agcccgcggt cgagcagcgc ctgcccgacc gcctccgccg 2280 ccgccagcac ctcgccgtac gtgcggtgcc cccaccggcc gtcggccccg cgctcggcga 2340 ccagcgggcg gtcgggcccg gcctgggccc aggtgcggag atggtcggtc acggaggcgg 2400 gatacacccc cagcggctgc gccgacgaga ggagcacggt cccgtccggc cggtcccgcc 2460 ggacggtccg ggcgggcgcg aacagcggtg acgaggtctc cccggcggtg gtcccaccgg 2520 cggcggagtg cggggcggtg cgcgtggtcg ggtgcggcat cggggttccc tcccggtctc 2580 gcggggctgt cagacgtgcc gctcgaccgc gcggcggagc tcgcccgcgc gcagcagggc 2640 ggcgacggtc tcgatgtcgg cgtccagcgg ccggtcggcg gagaggaacg gcgagtaccc 2700 gcggacgagc gtgtgcgcgg cccgggtcgc gctccccagc cgcccgaccc cggtgaggtc 2760 cgcggcctgg cacagggcga gcaggtggat ggcggtgacc tggctcgtca gccggaccac 2820 cgtgtgcgcg tgccgcgcgg cgatggtgcc catgctcacc ttgtcctggt tgtgcgcctc 2880 ggtcgaacgg gagaacgagc tcacgggcat cgtcaggtgc agcgcctcgg cggtcagcgc 2940 ggacgcggcg atctgcgcgc ccttgaaccc gtggtgcagc cctgcctccg ggtcgtcggg 3000 accgaccggg acgaccaggt tcggggtgag gccgatgctg aacttgtcgt ccaccaggat 3060 cgccagctgg cggtcgagca ggtcggcgac cccggccacg gcggcggaga ccgcctgcgc 3120 cgcctgggcg acgtgcccgc cgtagaagtt gccgctgtag tggacggtgt cggtggccgc 3180 ctcgaagagc gggttgtcgt tcgaggagtt gatctcggtg gtcagccagt cctcggccca 3240 gccgagcgtg tcccgcagca cgccgacgac gtgcggcgcg caccggatcg agtacgggtc 3300 ctggatgcgg cgctccagct cgacgtaccg gcgctcctcg ctcgaaccgg ggcccacgag 3360 atcggtgtcg gcgaccacgg cgggggagtc gcccagcatc cggtggacgt tcgcggcgct 3420 cgcgagctgg ccggggtgcg gcttgtgctc gtgcgggaac gcggtgaact ggtcgcggct 3480 gctgcgccgg acctccgtcg acagcacggt gcacagctcg gccgcccacg ccagctcggc 3540 cgcctcggcg accgccaggg cggcgtaggc ggccatgaag gacgtcccgt tgacgagcgc 3600 cagcccctcc ttggcccgga gcgtgacggg cgcgaggccg caggcccgga tggcctcgcc 3660 cgcgtcgagc gcccggccct ggctgcgcag ggtgccctcg ccggtgagcg cggcggcgag 3720 gtagccgagc ggcgcgaggt cgccgctggc gccgaccgaa ccgcgctccg gtatctgcgg 3780 cagcaggtcc ttctccagca gtgacaggat cagctccacc ggcgccgtgc ggatgccgga 3840 gttgccccgc gcggcactgt tggcgcggat cagcatggtg gcgcggacga cctcgtcggg 3900 tgccatgtcc ccggtgccga cccgcaggaa gcggagcagg ttccgttgca gcgccccggc 3960 cttgtcggcg ctgacctggc ggccgctgct gtcgccgaag ccggtcgtca ccccgtagat 4020 cgggatgccg gaggcgacga tccgctccgt ggcctcccgc gacgccgtca tgcgctcggc 4080 cgcggccgcc gcgagggcga ttctctgctt gcccggctgg gtcgcgaccc gccgcacggc 4140 ccgcagcgag aggctgtggc cgtccagctc gatggtggtg tcgtcggtgg gcgaggccat 4200 gtcggtcccc ttcggtcggt gggcgatggg cggtgggcga tcgaccgcgt gcgccgctcc 4260 ttgccgggcg gcccgcggac gccggtccgc ggtcgcggag ccgtgggtgt gcgcgccggc 4320 ggtacgggag aggggcccgt cgccgccggc gggatgggtg ggcgtggggg cgttgctcag 4380 ccgggcgttc cgccgatgcc ccactggtcg cgggggatgc cctggagcgt cacccacgtc 4440 acgtcgcggc actcggggcc gagggcgcgg accgccgcct cggtgagctc cccgatcagg 4500 gcgcggcggg tctcgggcgt gaggcggtct tcgtagaggc tgacctggat caggggcacg 4560 agggttcctt ctctcgtcgg gcgggtgctt cccggccact cagcgcggcg gccaggttgg 4620 cgccgagggt ctcgacctgg cgatcggtca tggcggggtg gcagggcagg ttgaggtgct 4680 cgccgaacca caggcgttcg gcgaccgggc actcgccctc gccgtgcccg cgcagccgcc 4740 actcgggcag caggtgcacc gggtggtagc gcaactgggc gggggtaccg gagcgttgca 4800 gggcgtccag cacgcggtcg cggcgtccgt cgccggggac gagcgcggtg tagaggtggt 4860 acgggtgcac cgcgtcgggc gcggcggtca gcggccggac gtcgaagcgg cggcacaccg 4920 cgtcgagttc cgcggcgatc gcccgccggc gggcgacgaa ctccggcagc cgttccagct 4980 gcaccaggcc caccgcgcag gcggcctcgg agagcgcggc gttggtcccg ctgccccgca 5040 gccccgtgca gtcctcccgg taggcgtagt cggcgtacgc catccacggc agcgccgcgg 5100 ggggccggcg gtgcgcggac gaggtgaagg tgccgtccac cgcgttcgac cggatccggt 5160 cgatcctgcg ggccagttcg ggcgacgggg tgcacaccat gccgccctcg ccgagggtgg 5220 tgatgttctt ggacgcctgg aagctgaagc aggacaggtc gccgagcgcg ccggggcggc 5280 ggccccggta ctcggcgccg atcgcgtgcg cgcagtcctc caccacgagg gcgccgtgcg 5340 cgtgcgcgat ggcggtgatc cggtccatgt cggcggggtt gccgccgtag tggacgagga 5400 tgacggcctt cgtgcgctcg ttgacgagag tctccagcgc gtccgggtcc atgttgaggc 5460 tgcccggctc cacgtcgcag aatcgcaccg ttgcctcggt cgcgagcagc ggctgcgcgg 5520 tggcgtggta cgtctgcggc gtcacgacga cctcgtcccc ggcccgcagg tcgagcagcc 5580 ggatcgcgat ctccagcgcg accgtcccgc tggtgaccgt cagggcgtgc gcggcgccga 5640 cgtgccgggc gaaggcccgc tcgaactcct cgcgcaccgg gcccatcgac aggggcgcgt 5700 ccgcgcgcag cacctcggcc acggcccgca cctccgcctc gccgagcagg ctgccccggt 5760 gcgggtggac gtcgccggcg cggtccgccg tcgcccggct cacgagcggg caccggccgg 5820 ctcggggtcg gacccggcgg cgtccgggcc cggcggcgcg tcgaggccga ggtcggccac 5880 gaggcgcttc ttgtcgacct tgccgaggcc gctcttgggg aacgcctcga cgcacacgac 5940 ccggtcgggg aacttgtagg acgccagccc gcggtcgcgc aggtagcggc gcagctcgcc 6000 cagggtcggg ggcgtgccga ccgggatgat cacggcgcag gtgcgctcgc cgaggacggc 6060 gtcggccatc ggcaccacgg cggcctggtc gatccgctcg tggccggtga ggtggccctc 6120 cagctcgggg gcggacacct tgtcgccgcc gcggacgatg acgtccttcg cgcggcccat 6180 caccacgacg ccgccgtcgt cggtgatccg caccaggtcg ccggtgcggt agaagccgtc 6240 cggggtgaac gccccggcgt tgtgctcctc ggcccggtag tagccgcgca gggtgtacgg 6300 gccccgggtg agcagctcgc ccgtcccgcc ggccgccacc tcgtcgcccg ccgcgtccac 6360 cacccgcagt tcgtcgtggg gggagatggg ccggccctgg gtggtgagga cggtctcggg 6420 cgcgtcctcg cggcgcgtga ggcacagcag gccctcggac atcccgaaca cctgctggag 6480 acgggccgtc agcgccggtc cgacctcctc ggcgagcgac cggtgcacca ccgcgctgcc 6540 gacctgcacc agctccagcg tcgccagctc ctcccggcgc ccgtcggcgg cggcgatcca 6600 ggagtgcgcg atcgtcggca cgaccgacgt cgtggtgacc ccgtgccggg cgatgagcgg 6660 gaagcacacc tgggggtcgg gcacggtgct cagcacgacg gcgcccccgt tggcgaacac 6720 cccgaccaca cccgggcagc cccacgtgaa gttgaaggcg atcggcaggg tggcgaggta 6780 gcgggtgtcc tcggagtact cgcagatccc ggcggcggta cgggcctggt acaggtagtc 6840 gtcgtgcgtc cgcgggatga gcttcggcag cgccgtggtg ccgccggaca gcaggaagaa 6900 ggccacgtcc gacgcgtcgg gaccggtcgc gccggccggg tccaggggcg tctccgcctc 6960 gggaagcggc gcgaactccc cggggtcgcc gaccacgaac acgtgccgga gcgacgcgtg 7020 ccgctcgcgc agggaccggg ccagcccgcg gtggtcgaac cccaggaacc ggtcgagggt 7080 cacgtaggcg ctcgccccgg tcaggccgca gatgtggtcc agctccgcca tgcggtggtt 7140 gggcagcgtg aagaccggca gcacaccgat gcggaagaag gcgaacgaca ccgccacgtg 7200 ctcggcgacg ttgggcagtt ggagcacggc ccggtcgccc gcccgcaggc cggcggccga 7260 gaacccggcg gccaggcggt cggcccaccg gtcgagggcg gcgtaggtga aggaccgctc 7320 cccgtcgatc agagccacgt tgtccggggt gcgcgcggcc tgggaacgca gcagctcgcc 7380 caggggctca ccggcccagg tgccgtcggc ccggtagcgc tccgcggtct cggccggcca 7440 ggggacgaaa ccatcgagtc catcgagtcc atcgagaaga ggcatggcag gggctcacct 7500 tcgttctgtg acggctggca tcggagaacg gtctatcaac ggagctctga ggaattcctt 7560 agtcctgccg cggctagcct cacgtcccgg tcgggccggt cgggccggac gcaccggaca 7620 gaggggagca cccgtcatga ccgtcgacga ggcttcggcg cacgagggcc gcctgccggc 7680 cttcgaggtg ttcgaccagg gcttcaagac cgatccgtac ccgtggtacc gcaagctgcg 7740 cgaggcggcg ccgatccacc gggtacggat gaccctgggc gcggacgtgt ggctggtgac 7800 cggctacgag ctggcgaaga ccgtgctcgc ggacggccgg ttctccaaga tgaccgtcaa 7860 cgccgagcgc gcgtggcgct ccctggagct catcccggac gaccccgacg ccctggtcaa 7920 ccggatgctg ctgatgagcg atccgcccga ccacgagcgc ctccgccgcc tggtgtcccg 7980 ggcgttcacg gcgcgctcga tggaggcgat gcggccccgc atcgccgagg tcgccgacga 8040 actcgtcgca cggttcgccg gccggggccg cgtcgacctc atccgcgagt tcgcgttccc 8100 gctgcccgcc atgatcatct gcgatctgct cggcgtcccc gccgaacacc gcacccggtt 8160 cgaggagtac ctgcggctgc tctgcctggc cgaacccgag gacgtccacc ggatgcccgc 8220 cgtcttcgcc gaactcacgg cggaactcgc cgagttggtc gagcgcaagc gggccgagcc 8280 cgacgggcac ctgctctccg cgctggtcgg gatccgggac ggcagcgacc ggctcaccga 8340 cgacgaactg gtctccatgg ccttccagct catgtacggc gcccaggaca ccaccgtcaa 8400 cctcatcggc aacggcatgc tcgccctgct ggacaacccc gccgccatgg ccgaactgcg 8460 ggagaacccg gagctcatcc cgggcgccgt cgaggagatc ctccgcttcg acccgccggt 8520 ggagaccgcc accccgcggt acgccctgga accgctcgac gtcggcggga tgcgcgtgga 8580 gaagggcggg gtcgtgctcg tctccctcgc gagcgcctcc cgcgaccccg ggcagttcga 8640 ggaccccgac gtcttcgaca tccaccgcga ggtgcgcgga cagctcgcgt tcgggcacgg 8700 gctgcactac tgcctcgggg ccgtgatggc ccgcgtgaag ggcgaggtcg ccctgcgggc 8760 cctgctgtgc ggcctggacg acctgcgccc ggacgaggac gccgaaccgc tcgcgcgcca 8820 cgccgggttc atcatgcgcg ggctgaaggc gctccccgtc cgcttcaccc cgcgcgccgc 8880 gtgaaccgga cgcgcccgcc ccgcaccgcc tcgggaccct gggtgccgca ccggcccggc 8940 accgccccgg gaccggtgac gctgttctgc ttcccctacg ggggaggcgg cagccgcgcc 9000 tacgccgaac tgctggaacc gctgcccccc tgggtggccg ccgtgaccgc gcggctgccc 9060 ggccgcgaga gcgcgcggcg gcagcccgtc ctcaccgacg tcggcgccat ggccgacctg 9120 ctcctccccg gcgtcctcga agcggccgac cgcccgttcg tcttctacgg ccactcgctc 9180 ggcgcgcgcg tcgcctacga gacggcccac cgcctcgcgg acaccggccg gccgctgccc 9240 gccgcgctct gcgtctccgg ggcgcccgcc ccggccctcg gcgtccacac cccgtgccac 9300 gaccagcccc gcgcggaatt cctccgcacc ctgcgggcga tgggcggcgt cgccccggag 9360 gtgctcgccg acgaggagct gtgcgactac gtcctgccgg tcatccgcgc cgacatgcgg 9420 gccgccgaga cataccggcc accgcgccgg accccgctgc gcacaccgat cagggcgctc 9480 gccggacggg acgacccccg ggtgccggtg gagcacgtgc ggcggtggtc ggacgaggcc 9540 ggtggggagt tccgctgcac ggtcttcgag ggaggccact tcttcttccg tgaccacccg 9600 tcggaggtcg ccgcggtgtt ggacggcctg ctgcgggaag tcgccggggg ataggggccc 9660 ggcccgggcg tcagggccgc agcagtccgc ccacccacca gtcgtgcggt acgccgtcgt 9720 tggcgatgcc gcgcttgcgc agtgtcccct cgacggtgaa gccgagtctc tcggcgacgg 9780 cacgcgagcc ggcgttcccg accatggccc accactcgat gcggtgcacg tcgagcgtgg 9840 cccatcccca gtcgcacagg gctcgggcgg cctccaccga atacccgtga ccgcgctgct 9900 ccttgaccgc ccagtagccg agctcccaga cgccgcggct gacgcgggtc aggcagtacg 9960 agccggccag ggcgccggtg tcctcgcgga acgcgccgaa ggtgtagtcc tcgtccgcgg 10020 cccactgggc gggcagcttc tcgccgacga gcttctccgc gtccgcacgc aggtacggca 10080 ccggcaccgg ggtgtagagc tggatgtcct cgtcctggca ggcctcgtac accgcatcca 10140 cgtcggcagg cgtgaaggcc cgcagcacca ggcggtcggt ccgaagggtc accgggtcca 10200 tcgcggcagt atgaccgccg acgacaagcg gcggccagtg gatttccgac cggccgccgc 10260 tccgggccgg gcactgccct cccgtctgga gcccttcccg cctagagtcc gagccggacg 10320 ccccccgacg cctcgatgcg ctgcccggtg acccagcggc cgcccggtcc cgccaggtag 10380 gcgacgacgt cggcgacctc gccgggcgta ccgacccggt ggagtgcggt ggtggcggcc 10440 atggcctcgc gctgggcggg caccttcatg tccgggttga tgtcggtgtc ggtgtacccc 10500 ggggcgaccg cgttgacggt gatgccgcgc ggccccagct ccagggcgag gtcgacggtg 10560 aaggtctcca gcgccgcctt ggtcatggtg tacgcggcga tcaccggcat cgccacccgg 10620 gtcgcggcgg tggtgacgtt gacgatccgg cccccgtcgc gcagccgcgg cagcgcgccc 10680 tgcaccagga agaacggggc cttggcgttg accgcgaaca gccggtccca gtcggcctct 10740 tcgaggtccc gtacgccacg cgggacggtg atcccggcgt tgttcacgag gatgtccacc 10800 ggcgcgggac ccgagccgcc gcggacggcg gcgacgccct cgtcgtaacc gcgccacagc 10860 tcgtcgaggg cgccgagctc gccgaactcc gcgcggacgg ggaaggccga cccgccggct 10920 tcgcggatct cccgcaccgt cgaccgcgcg gcttcgtcgt cccgtccgta gtggacggcg 10980 accagcgcgc cctccgcggc gaggcggacg gcgacggcac ggccgatgcc gcggccggcc 11040 ccggtcacca gggcgatgcg gtcggtcgga tctgacatgg gttcctccgg gagggggtgg 11100 tggtcggatc aggcaagggg tcagacggac agcgcggcac gcgccccggc gtccgcgacc 11160 cgctccagcg tcgccagcgt ccgcgcccgc acccgctcga tctgggcggg cggggagcag 11220 acgggggtgt acgggatctc cagcgagaac gcgccgtcca cggtgctgac acaggcgaag 11280 agcggaccct gcccgaaccc ggggccgtag tcctcgcgtc cggccgtcag ccgggtgtcg 11340 cgcagccgca gcccgggcgg ggacaccggg ccggcgatcc ggcccatgtt cgacacgatc 11400 acggtggtgg ccagcagctc cgggtggtcg acgaggcggg cgagcagagc ggtctccacg 11460 gcccagccgt cgccggccag ggcgccgcgc agcccctcgg tgacccggcg cgccagcgga 11520 cccacgtgct ccgggccctc gcccggcgcg acgtccacca cgtccgggaa ccccgagacc 11580 agcggcagca tcacgccggc cgccgccggg ggctcgaccc gggagcgcag gtccacgggc 11640 gagaagcagc cgagggcggc ggtaccggaa ccgccgagct cctcccgtat cgccaggagc 11700 agcgccgcgg cggtcacgcc gtgcaccgag gtgcccaacc tccgtgcgcc cgccgcgagt 11760 tcgccggtcc tgtcggcgga cagggcgacg cggacgttgt gcaccggctg ccgcccggcc 11820 ggcggcgcac cgtccccgcc cgcctccacg tacggcaact gcgccggcgg acggtcgcgc 11880 gcctgttcca ggcgctcggc gagcagcgcc gcgacggcgt ccccggacac ggccggcagc 11940 cgctccgaca ccggggccgg ccacgcggtc gccgccgggc gggccggttc gccggccagc 12000 accgcggcgt agtgccgcca gagttccgtg tggagggtga gggcgctggt gccgtcggtc 12060 accacgtggt ccacgacgag ccccacgacc gtgtccgagc cccgcgcggc cgtcgacagc 12120 cgcgcgaccg ggccgccgac gggcaagggg gacgtggcga tctccgtcat cacgtccttc 12180 tcgggcgccg gttcggccag gcccgggcgg ccggccgccc ccagccgttc gagggcgaaa 12240 ccgccgccgt gcgacacgat ccggctgtcc gccgtcggat gcgcgtcgag cgtccgcgac 12300 caggccgcgg acagcacgtc gaggtcgagg tcgccctcga cctcgacggt gaccaccgcc 12360 cggctgcggt cgccgacgtg cagctcctca agtgggcaga ggggacggag ggagtcgggc 12420 atcggttgtg ctcctcgggt cgttcgggcg ggcccgccat cgggggaggg cccgccggaa 12480 gtgcgcggtg tcgcgcgtca gccggtggct gccgcgtagt ggctcagggg gatcgacggg 12540 gaacggccac ggcgccggag caccggaccg ggccgacggc cgggcgcccg gccggggccc 12600 gccgaagtgg cgggcgcgtg atgacgccgc cggggtccgc tgggggccgg accggccgtc 12660 gggccgttct cgccgtccgg acccggccgg agcggcgggc gccgtgccgg tgccgcctcg 12720 ggcgccgggg cgtcgcgggg ccggccggtt gccggtccgt ggcgccgccg gattccgcct 12780 cgtgcggggg gctgcccatg ggggccgggc cggtcatccg gccgccacct ccgcccgttc 12840 ccctccgccg gcccccgcga gacgcgcctc gaccgccttc gcaatcacct cgatcgggcc 12900 ggcgtcggtc agggcgtagt gggagcaggc gagaggaacc tcctcgaagg tgccggtggt 12960 gaacgggcgc caggacgcgg cccggtcggc gatcccgccc gcgacctccg gttcgtcgtc 13020 ggcgacttcg gtggccgaga cgaagaggat gtcggcgcgc agccgttccg gaaccagatc 13080 gggggcgatc cgcagattgt tgcggaccac cttcgccacg gtgatcgcct cctcacgcgt 13140 gagcgtgccc ggcaccgcct cggggtcccg gcgggaggag tcgagcagcg cgagcgacgc 13200 gtcgaccgtg gccggcgcgg gcatggtcaa gccggccagc cgcaggacga gggcggcggc 13260 ctgcgcctcg accgcctcgc cctccagcgc cgccgcgtcc ggctgcggcg tgtcgagcat 13320 ggtcagcagc gcgacctcct cgccggccgc ctccagggcg gcggccaggc ggtgggcgac 13380 ggcgccgccg aacgaccagc ccagcaggtg gtacgggccg tggggctgga cggcccggat 13440 ccgttccagg ccgtcccgga tcacgtcctc ggcgcgcccg gcggcgggaa gggcgccgtc 13500 caggccaagg gcctggaggc cgtacaccgg gcggcgcggg tcgaggtgcg gcagcagccc 13560 cgtgtagcgc caggcgacgc cgctgaccgg gtgcacgcag aacagcggcg gcagatcccc 13620 cgcggcccgc atcggcagca tgggggcgaa cgcctcctgc ccgacggccc cgccgcgccc 13680 ggcgcggtcg agcagtccgg cgatcgtcgg cgtggcgagc agggccgcgg ccggcacgtc 13740 gagcacgccc gcggtgcgca ggcgcccgcc gagcagcacg gcgcgcatcg aatcgccgcc 13800 gaggtcgaag aagttgtcgt cgagcccgat gccgtcgaca ccgagcacgg cctcccactc 13860 ggccgccacg gcccgctccg cgtcggtgcc cggcggcacg tgcggcacgg ccagcggcgg 13920 acgcgggacg cggcgcgagg cgcggtcgcc ggcgcggtcg tcggatgcgc cgtgcggggc 13980 cgtggtcgcc cgggcgccgg gggcgtcgat ccagtgccgg tcgcgggcga aggcgtagcc 14040 gggcaggtcg ggcagggacc gccggggcag tcgggtgccc tcctccgacg cgtcgccggg 14100 cgggacgatg tccacctcgg ccccggcggt ccacaggtgc gcgagcgcct ccgcccgcac 14160 ccggccgtcg ggcccggtcg cccgcgcgtg gcgcatcacc gggacggtga cgggctccgg 14220 gccgccgtcg tcgacggccg cggccagccg cgacaggacg tcccccgggc cgatctcgac 14280 gaggaccggg cccgcgcccc cggcggaggc ggcgcgcagc gtccgcaccc cgtcggcgaa 14340 gcggaccgtg ccgcgcgtgt gcgccaccca gtgctccacc gaggtggcct gctcggcggt 14400 gacccacgtg ccggtgacgt tggtgatgta cgggacgcgc ggctcgcgca ggtcgacgcc 14460 gcggaaggcg gcggccaggt cgtccaggac cgggtcgagc atcgaggagt gggcggcggc 14520 gggcagccgc agccgccggt gggtgacgcc gtcggcgacg agccgctcga ccagcgcgtc 14580 gacggcctcc accggtccgc ccaccgtgca cgaggacggc gagttgaccg ccgccaggga 14640 caacccaccg tccaggagcg ggaggacgtc ccgctcgggc agcgccacgc cgaccgccgc 14700 cccgcccgcc gagatcatca gccggacgcg ggtgaccagc agcggcagca tctcctccag 14760 ggtcatcacc cccgcgaggc acgccgccac gtactcgccc agggagtgcc ccatcagcgc 14820 gccgggccgg accccggaag ccgccagcga ggcggccaag gcgtactcga ccaccgcgag 14880 cgcgcacatc gactccacgc tgaagtggtc ggcccgctcg tggagcgtga cgcggatgtc 14940 gtggtccagg accggctgaa ggatggcggc gcaccggtcg acggcctcgc ggtaggcggg 15000 gtcgtcgcgg tacagctccg cgcccatccc cacgtactgg gtgccaccgc cgggcagcag 15060 gaagaccacc tccggcgcac tctccgcccc ggccgccggg accgtcgcgg cggccagcgc 15120 ccgcgctgcg tccgccgcgg tcgccgccgc gaccgcgcgc cggtggggcc ccgggcgccg 15180 ggcgcgcagg gcgcgcgcca cctcggtcac ggacagttcc gggttgtcct ccaagtggcg 15240 cccgaggcgg ctcagttggc cggcgagtcc gtcgcgggtg cgtgccgaca ccggcagtac 15300 ggtccagccg ggcgcctctt ccgccggccc gatgggtacc ggcaggcgcg gtgcctcctc 15360 caggacgacg tgggcgttgg tgcccccgac cccgaaggcg ctcaccgcgg cgcgcagcgg 15420 gccgtcggcc gtccacggct ccagcgccgt cgagacgcgg aacgggccgc tcgcgaagtc 15480 gatgaggggg ttcggggcgt cgtggtgcac cgtgggcggc acggcccggt gctcgagcgc 15540 gaggacggtc ttgatgatgc cggcgatccc ggccgccgcg ccgaggtggc cgatgttgcc 15600 cttgaccgag ccgagcgcgc agtacccccg ccggtcggtg gactcccgga acgcctcggt 15660 gagggccgcg acctcgatcg ggtcgccgag gcgcgtggcg gtcccgtggg cctcgacgta 15720 cgtcaccgag ccggcgtcga cgccggccgc cacctgggcg gccacgatga cctccgcctg 15780 cccggccggg ctcggggccg agaaaccgac cttgcgccgg ccgtcgttgt tgatcgcgga 15840 accccggatg acggcccgga tccggtcgcc gtccgccagc gcgtcggaca gccggcgcag 15900 gacgaggacg ccggccccgt cgccgttgaa cgtgcccgcc gcgtccgcgg cgaacggccg 15960 gcacgccccg tcgggggaga gcgggccgtc gggcacgtgg cggtacccga gcatcgcctg 16020 cggatccacc gacaccgcgc cgaccacggc gatgtcgcac gcgtacgcgg ccagcgcctc 16080 gctggcggtg tgcacggcga cgagcgcggt cgagcaggcc gtgttcatcg agacgctcgg 16140 gcccgtcagc tccaggtcgt acgacagccg agtggcgagc gtgccaaggg agttggcggt 16200 ggccgcgtgg atcagaccca cggaggcggg ctcgccggcg tgccgcgggt gcacgttgta 16260 ggagtagtag cggctgtcgc cggcgcccgc gtagaccccg acgacgcggt cgccgtggcc 16320 gtccgcgtac cccgcgtcct ccagcgcgtg gtaggcggtc tccaggagca cccgctgctg 16380 cgggtcgatg agttcggcct cggccgggcc gtagccgaag aacgcggcgt cgaagcggtc 16440 ggcgtcgggc agcaccgccg ccacgcggac cagggacggg tcctccaggt ccgccggatc 16500 gcccccggcg gccaggaact cctcctccgt cacctcccgg acgccctgcc ggccctcgct 16560 cagcagcgcc cagaactcct ccagcgtgtt cgcgcccggg aaccggccgg ccatcccgac 16620 gacggccagc ggctccgtcg ccatgtcctc attcagcatg cgatgcctcc tcttggccct 16680 gctggcctgg ctggtcctgc tgacccttcc ggcccttcgg gcccttcccg ttccgctggg 16740 cgcgcgccgc gagccggcgg cgggcctgct cgcgggtggc gccgagggcg ctcccggccg 16800 ctgcggagcc gccgtcctcc tcgccgccgg cctcccggcc gtcgcccggc gccgtgatgt 16860 cccgccggcc cgccaagtgc ccggcgagcg accgcgcgtt gggatgggcg aacaggtcga 16920 ccaccgtcag cgcgccgccc agggcctcgt tcagctcggc ctgggcccgc accagcagca 16980 gcgaatgccc gcccaggtcg aagaagttgt ccccggaccc cacccgctcg cggcccagca 17040 cccgccgcca gacggcgagg acggtctcct ccagcacgcg gacgcggtcg ccgccggccg 17100 cgccggaagc cgcgctcccc tcggcggcgg acgccgccga ggacgcggcc cggacgaccg 17160 cgccgtgccc ggcgacgccg ccgcaggcgc gcgccgcggc ggccacggcc gcctcgtgca 17220 gcccgccgat gtcggcgccc tcctccaact ccacccgggc ggcgagccga tggcgcggcc 17280 gggcgggcgc gtccaccagc cgccggacgc cgtccgccgt ccggtccgcg ccgatgagta 17340 ccaccggctc gtcgaggccg cgggcgaggt cgaacgagcg cagggccgac tccacgtcga 17400 gtgcccggta gccgcgcgtc tccccgaggg ccgccagctc gtcgccctcg ctcatccccg 17460 tgtcccgcca gctgctccac gccagcgact gggcgtccag cccccgcgcc cgctgacgga 17520 cggccagcgc gtcgaggaag gcgcacgccg ccgcgtaagg ggcgccgaac gcggccccga 17580 aggtgccgtt gaccgaggag aaggagacga acgaccggac cgggtgccgg gccgcgagcc 17640 ggtccaggac gcacgccccg ccgatcttgg ccgcggtcgc cgcgcgccag gccgccgggt 17700 cgaggtcggc cgccgcccgc cgttcgatcg tcccggcgag gtggaggatc ccggtcagcg 17760 gggccgacca ggcgtccgtc gcggcggcca cggccgcgtc cagcgccgcc tcgtcggtga 17820 cgtcggcggc cgcgtagcgg acctccccga gctcgcgcag ccgccgcagc accgccgcgg 17880 cgcgggcgcg agcgtcatcc gcggccgggt ccccggccgg cagcggggtg cggccgacca 17940 ggagcagccg taccccgggc tcggtggtga gcaggtgctc ggcgaggtgg gccgcgacgc 18000 cgcccagccc gcccgtcacc aggacgacgc cgtcgccgta ggcggggacg gtgaccgact 18060 cgggcaccgg tacaggggcc agccggcgca ccaggcgccc gccgtcccgc cggcacacct 18120 cggcgtcggc cggagcgacc gcgagttccg cggcgatcag cgccgccacg tcgtccggct 18180 ccccgtcgcc cggcacggcc agcgtgcccg cggacaggcc gggacgctcg tcccgcagcg 18240 agggcaggag cccggcgagg gtcgcgtgcg gcaggtcccc gccggtgacg caccgcaggt 18300 cgacggcgtg gcccgcgtgg tcgggggcgg ccagcgcccg ggccagggcc aggaccgagg 18360 cggcgccgga ccgctgggcg tcgagcaccc cgccggcgtc caggtcgcgg ccggacggct 18420 ccagcggccc gaggtgcacg acgcgctccg gacggcggtc gtcggccgcc agccggtcga 18480 gcagcgccgc gaagtcggac gcctcgtcgg ggcggaccgt gtaccgggcc gcgtcccgcc 18540 gcccgaagcc cgtaccggcc accgctgtcg tggcgcgtcc gccctcccgg cgcaccaggg 18600 cggcgagccg ctcggcgacc cccgcacccc gcggccccgc cgccacgatc agcacggacg 18660 tgccggccgg gggagcggtg gccgggcgcg tcaccggcga ccagacggga cgcaggaacc 18720 agtgcggaac cgtcgccgcc gtcccgagca gcacctcggc ggcgcgcgcc accgcgtcga 18780 actcaccggc ctcgaaccgc ttgcgcagct gcgtccgctg gatcttgccg atctcggtct 18840 tcgggatcac cgccgtctcg acgggcagca cgtgcgcggg cgccacgccg acctcgcggg 18900 ccaccttgcc ccggatcgcc cgcagcgcgg ccgccgcggc ctccccggag tcgtgcccgg 18960 gggccaggtg cacgaacagc gcgagctggt cggtggcggc cgaggcgtcc gtacggaccg 19020 cgaccgccgc ggtgaacgag cgcaccacca ccggcagttc ctcgacgcac gcctctatct 19080 cgtgactgaa gtggttgacg ccgttgacga tgatgacgtc cttggcgcgc ccggtgatgt 19140 acagctcgcc gtcgcgcagg aacgccaggt cgccggtgtc gaaccagccg tcggcggtga 19200 acgcctcggc gttggccgcc gcgttgtcgt ggtagcccga cgtcaccgag gcgccgcgga 19260 cctggaagcg gccgacctcg ccctccggca gcagccgcag ctcctcgtcg accacgcgca 19320 tcgcgaaccc ggggtacggc cgcccgcagc tgacgaaggt ctcgtcgccg ccgggcggcg 19380 gctgcgggtc gaggaccgtg tccgtgacca cggagcacgt ctcggacatg ccccagccgg 19440 ggtgcatcac gtcggacggc agcccgtgcg gcgccagggc ctgcaggaac cggcggttgg 19500 tcgcgccgac gacgacctcg cccgcgttca tgatcagccg tacgggggag aggtcccact 19560 cccggccggc gagccggccg gcctgctcgg cgacgaggcc gaaggcgaag ttcggcgccc 19620 acgtgacgct gacgcgccac cggtccgcca gctcccacca gcgcagcggg tcctccagca 19680 cccagcccgt cggggcgtgc acctgccggg cgccgaggta gacgtcgcgc aggtggaaca 19740 tcaccacacc ggtgacgtgg tcgagcggga tccagttcag cgagacgtcg tgctcggtca 19800 gggagttggc cgccgccgcg gcgacggccc ggctcagcac gttgccgtgc gtcagccgca 19860 ccgccttcgg aagtcccgtg ctgccggagg tgagcagcat gagcagcagg tcgtcggggc 19920 gtgcctgatg ccagtcgcgg tccggggcgg ccgcgcgcag ggcgtccacg gtcacgatgc 19980 gggggtccgg ccactcccgg cgggccgcga gctccgccag gccgtcggca cggtccgcgg 20040 aggtgacgac gaccggccgg cccagcatgc gccagacgcc gtcgagcttg ttcacggccg 20100 ccgagtcggt ggcgtacgtg ggcggcacgg tgagcgggac gacggtgacc ccggcggcga 20160 tcgcgcccca gagcgcggcc acgaagtcct cggtgtcgtc gcactgcagg accacctggt 20220 cgccggcgcg caggcccagg gcccgcagcc cgcccaggac ccgctcggcc tcctcgatca 20280 gcgaggcgta cgagcgccgg ctctcggtgc cgtccgcgcg cacgtgcacg atctcggcgt 20340 ggtcgccgcc cgccgcggcg cggcgcaggg cctcgggcca gccgccgacc tccgccgggg 20400 gcagcggcgg gccctcggag agcgacagcg cgcggtccgc ttggtgaacg gcggccggtc 20460 cggcggtggc cgccacggta cgcgggcggg tcgccggccg gagcgcctcc agcccctcgg 20520 ggacgtcctc gcgcccgacc gccgccgccc gtacgccggt cacggccgcg agagcggcgc 20580 gccagccgtc ggcggcggtg tcgtcgacga ccggcagccg gtgcagcgcg gccacgtcga 20640 ggtcgccggc ggcggtgcgc gggaggacgg tcacggccgt cacccggggt gccccgtcgc 20700 cgccttcgtc cgcgaggagc cggcgcgcgt cgtcgtccgc gcccggtcgc gcggggacga 20760 cccagacgac cggaccgccg tcggagggcc gggtgaccgc gacgtccgcg acggcggaca 20820 gggagcgcac acggctctcc agcgccgcgt cgtcggacac cgcctcgggt gcggcgtccc 20880 gcccggcgag caggccgtcc gggacgaggt cgccgaggcg cgcccccggg gcggccgcgg 20940 cccgggcgag gacggtgacc aggccctcgg cgagcaggcg cgcggtgctc gggtcgaaca 21000 ggtcgcgggc gaactcgacg tgacaggtca gaccgccggg cgccgagccg tcgtccccga 21060 cgtgctcggt gatgtcgaag aacaggtcga acttcgcggt acccgtcgcg ctgggccgca 21120 gcggcaccgg cgggccgccc agcgacaccg ccgcggcggc gttgttctgc agcgccagca 21180 tcaccgtgaa cagcggatga cgccccggca cgcgcggcgg gttgaccagc tccaccacct 21240 gctcgaacgg caggtcctcg tgcgcccagg cggcccggtc ggcctcctgg acgcgagcca 21300 gcaactcggc gacggccggc gagccggagg tgtcggtgcg cagcacgacg gtgttggtca 21360 ccagccccac cacgtcgtcg agcgcctggt cgtgccgccc ggcgaccggg gtgccgatcg 21420 ccagatccgt accggcgccg aggccggtga gcagggcggc gacgcccgcg tgcagcaccg 21480 tgaacaggct gacgccgtgc gcccgcgcca gctcccgcag ggccgcgtgg gccaccggac 21540 cgacggccag gtcgacggcg ccgccccggc cggtcggccg ggcgggccgc ggccggtcga 21600 acggcagcgc ggtctcctcc ggcagccccc gcagcgcggc gctccagaac tcctcgtcgc 21660 gccgggcggc ggcgccggcc gggtcgagcc ggtcgcgctg ccagagcacg tagtcggcga 21720 actgcaccgg gagcggcgcg agttcgggag cccggccggc ggcgcgcgcc gcgtacgccg 21780 cggtgaggtc ctcggccagc ggccgcagcg accagccgtc ggcgaccagg tggtgcagta 21840 gcaggacgag cgtgcgctcg ccgtccgccg gtccgtacag gccggcccgc aggcccggct 21900 cccgggtgat gtccagccgg cgtcgggcgg cggcctcgac gtgcgccccg atctcctcgg 21960 cggggcagtc gacgacgtgc agcggcacgg ccgccggttc ccggacctcc tggtacggca 22020 cgccggcctc ggccgggaag accgtgcgca ggctctcgtg gcgggcggcg acgtcgccca 22080 gcgcggcggc gagcgcgtcg gcgtccacgc ggttcggcag ggggagcacc agcgggatgt 22140 tgtacgtcgg cccgtcgtcg agccggtcca ggaaccacag gccccgctgg gccggggaca 22200 gcagcaggcg ctcgggccgg ccggccgggc gcaagggggt gcgcgcgggc ggtgcggtgg 22260 tcagccgggc ggcgaggccc gccgcgcagc gggcggcgaa cacgtcggcc acgccgatct 22320 cgacaccgaa ccgggcgcgg atcatcgtgg cggcgcgtgc ggcggtcagc gaatggccgc 22380 cggcggtgaa gaagtcgtcg tccggcccga tccgttcgat ccccagcacc tcggcgagga 22440 tctcggtgag cgcccgctcc tcggggccgt cgggctcccg cgcggcggcc gtgggctccg 22500 gcggctccgg gagcgcgtcc cggtcgagct tgccgttggc ggtggtgggg agctcggcga 22560 gggggacgac ggccgtgggg accatgtgct cgggcagccg ggcggcgagg tggtcgtgcc 22620 agcgccgggc gcgggcctcg aagccgtctt ccccgtcctt ctccgccggg gcggggacga 22680 cccaggcgac gagccggggc ccgcccgcgc ggtcgtcacg ggtgccgacc accgccgcgg 22740 cgacctccgg gtgctcggtc agcacggcct cgatctcgcc cagctcgacc cggaagcccc 22800 ggatcttgac ctggtggtcc aggcgtccga ggaactccag cgcgccggag ggcagccgcc 22860 gtaccaggtc gccggtgcgg tagcgccggc ccgccgccgg gtcctccggg aagcgctcgg 22920 cggtgaggtc cggccgcccg aggtagccga cggcgagctg gtcgcccgcg atgtacagct 22980 cgccgggctc gccgggcggt accggtgccc cccaggggtc gagcacgtcc agccgggtgt 23040 tccagacggc gcggccgatc ggcaccgtgg cgcccggcgc gccgtcgcgc agcggccacc 23100 agctcacgtc gatcgcggcc tcggtcgggc cgtagaggtt gaagacctcc gcgccggtga 23160 cctcctcggc ccgccgcgcc gcctcggtcg gcagggcctc gccgctgcac aggatccgcc 23220 gcagcgcgcg aggccgggcg gcggccggct cgccgagata ggcgacgagc atcgacggga 23280 cgaagtgggc ggtcgtgatg cccgcctcgt cgatcgccgc ggcgacccgc gccgggtcgc 23340 gctgcgcgcc gggggccggc aggaccagcg tcgccccgct gatcaagggc cagaagaact 23400 cccagacgga gacgtcgaac gcgcagctgg tcttctgcag cacccggtcg cccgggccca 23460 ggccgaaccg gtcctgggtc cacaacagcc ggttgacgac ggcccggtgg gcgacggcga 23520 cgcccttggg gcggccggtc gagcccgagg tgtggatgac gtaggccagg tcgtcggggc 23580 cgggaccggc cggggccgcg cccgtgccgt cggcccgcag ggcgaggacg tcgacgacgt 23640 tcagctccgc cggcagcgcg acgggcgcgg gtccggcggt gaggaccgcg acgggccgga 23700 cgtcctccag gacggcggcg agccgggccg gcgggtggtc gaggtccagc ggcgcgtagg 23760 ccgcgccggt ccgcagcacc gccagcaggc tcacgaccag ggccgtcgaa cgcggctggg 23820 cgaccgcgac gatcgtcccc ggacccgcgc cgagcccggc gaggccacgg gccagccggt 23880 ccacccgctc gccgagttca cggtaggtga gctccggcga gccgtcggcg ggcaccagcg 23940 ctacggcgtc cggcgtccgc gcgatctgct cggcgacgag ccggtccagg gtggtgacgg 24000 gtaccgggtg ggcggtgtcg gcgtcggcgg ccagtgtgcg gtgctcggcc tcgtcgagca 24060 ggtcgactcc ggcgagcgtg gtctcggggt cggcggtcac cgcgtccaac aggcgtatga 24120 aacggcgcag ttcgctgtcg gaccaggcgg ggtcgtcggg ggcgtcgtcc acctggagtg 24180 cgcggacgcg gtcctcgccg aggaccgccg tcacggcggg gccggtcgcg ggagccgcgg 24240 agacgaggtg cagcgccgcg tcgcggtccg gtgtcccggc ccaccgtgcg acggtcacgg 24300 acgggccgga tacgcgcccg tccgccgtcg cgcggtggcc gcgcccgtcc tggaccgcgg 24360 cgacggtctc cgcgagcgtc gtggtgcccg tgaggtccag cggcagcggg acgggggtgc 24420 catcggcggc cgggacgtac agctcgaccg cgccgctccc acggcggcga gcggtgaaca 24480 tcgcgacggc ggctgccacg aaatcccgta tccctacccc gagttcgcgg gatccttcca 24540 tcatccggcg gccgagcgcg gccgggaccg cgatctcgcg gtgccgggag ccggagccgg 24600 cgggccggga atcggccgcg acgtccgcga cgtccgcgac gtccgcgagg ccgtccggcg 24660 ccccggcgag cgcggcgacg cgccgggcca gggccggcgc ggcgcgctcg tcggactcgg 24720 gaccgcccgt acgccggaac cacaggtggt gctccggtcc gagcgcgagc accgcgtggc 24780 cgcaggccgt cgcggccggg cgcgccagct cggcccgcat ccaggccagg gccgcgccgg 24840 ccgggtcgct ctcaccggag agatcgacga attcggccgg cccgcatggc gcgccctcgc 24900 cgtccgccga cgtgtccgcc gacccgcccg ccggtccgga cgccgcttcc cccatcggcc 24960 cgtccaccgg cccgtccacc agcccgtacg ccgcatcgcg caccgcgcgg acgcccgccg 25020 cgcggaggcc ctcgcggtcg accggccccc ggaggtccag gtagtggccg gtgtcgtaga 25080 tcggccccac cgctcccagg tcgtcgacgg ccgtgtcggg gccggcctcg gcgagcgcgc 25140 ccagcaggcg cccgagcccg cggccgtgcg ccagcgccgt cggcgcgtcg taccggaggg 25200 cgttggcctc gacctccagg gtggtcagct cgccgtcctc ggcgaggtcc acgacgaacg 25260 cgatgtcgtc gacgggcccg ggggagaggt ccacgaccgg gaggcgccgg cccaggagcc 25320 cgatcgtggt gtcgtaactc ttgatgttga cctgggcggt ggtgaactcg gactcgtcgg 25380 tgacgcgccc gaggtcccgg cggatgtcct cgacgcggta ccgcccgtgg cggcgcagct 25440 cccgcatcgc cttccgcagc cgggcgacca gcgtgccgac cgtgtcgccg tccgcgaccc 25500 gtacccgcag cggcagcacg ttgacggtgg tcgagggcag gcgcgcggcc gcgccgcccc 25560 gcagggccag cggcagggcg aggacgacgt cggcggcacc ggtcacccgg tgctggtaga 25620 cggcggtggc ggcgatcgcc aggtccgcgg tcgtggccga gaggctctcg gcgagccggg 25680 cgaggccggc cggatcgggc agcacgtcga cgcgcgcctt cagcggcgcg ccgcgcgccg 25740 gctccggagg cgtgccggac aggcttaccg ggggcgggag ttcggcgagt gcgtccagcc 25800 agtaggcgcg gtcccgcggc atccggtcgc ccgcccggta cccggcctcc tcgtccaggt 25860 acgccccgag gccgccgaag gcgggctcac ccggtgaccc gcccgtgcgc agcgcttcgt 25920 ggatctcctc gatccgccgc aggaccagcg agaacccgta gccgtcgagg agcatgtggt 25980 ggcagcggtg gaaccacagg gccccgccct gccaccggaa caggacctcc cgcgccaacg 26040 gccgccccac aggcggctgt tcgaggtcgg cgcgcatccg cgccagggcg acggcctccg 26100 ggtcgggccg cccggagagg tcgacgacct ccacgcgggg tgccgtgccg gtcccgcgct 26160 ggacggggac gtcgccgtcc gcgcccacct cgaccgcgag cccccacacc tcgccgaggg 26220 cccgctcgac cgcgcgcgcg aaccgctccg ggtcgacctc ggcgggcagc cgcacgtact 26280 ggcctgtggt gaagaccggg ttggaggtgt cacgctgctg ggcgaaccag atcccggcct 26340 gcggggcggt cagcggacac gagtcggcag cacggtcggg catggatgca ccttccacgt 26400 cgttgcggtg tgatcttcca cgtcgttggg gggagttcga gccggcgccg ggtgtgacgg 26460 caccagacga gtcggcaccg ggcgggacgg cccggcccgg gagcgcgtca gcccgccgcc 26520 gcggctccgg tccgcgagtc ccgcacgatc tcccaccact cctcgggggt cggccgttcg 26580 aggaagtcgg ccaggggcgc ggtcaccccg gccgcgcgcc accgcccgat cagccgggtg 26640 agcgtcaccg agtcgagacc gagctcgaac aggttgtcgt ccgggaggag ttcctcgtcc 26700 tccatgccgg ccgtcgcggt cagggtcgtc agcagcgcgt cgaacgtctc ggggacgtcg 26760 atggtgtggg gcttcatgcg cgccacgcta atgacgcgga tctagggatt tcctcagatg 26820 tggtccgccg cggccggccg gccgggcgcg gcgaacggca ggggagcggg ccccgcggca 26880 cccagcacga tgtcggcgag gaggtccccg acggcggcgg cgtgcttgaa tccgtagccg 26940 ttgcaccccc cggccagcac gacccggggg tcggccgggg aggcgccgag cacgaactgc 27000 ccgtcggcgg tcgtcgtgat cccgcagtgc aggatccgcg acggtacgcg ccccaccccg 27060 gggacggcgg tggcgagcac ctcgccgagc cgctcccagg gcctgctcgg gacggcggga 27120 gcgccgagtt cgggatcgta cgggtccggg tccgccccct gctcgatgcc gagcttgacg 27180 tgcccggggt cgccgtcgcc ctggccccag atgacggtgt ccgcgtcgat ctcccgcatg 27240 aacaccggga acagctcgcg gcggaacagc gccgggtcgc cgctcggcgg gaaccacgtc 27300 atcggcaggt ggacggagcg gacgcccagg ccgggggcga agtccggcag ccagcacccg 27360 ggcgtgagga cgacccggcc ggcgaccagg tcgcgcccgg cggtgcggac ccgtacgccg 27420 ccgccctccg gctcgacgcc gagcacctcg gtgccgcgga gcacggtggc cccgccgcgc 27480 tccgccagct cgaccgcggc gcggaccgag tcctcggccc gcaggacgcc cgccgagggc 27540 tcccacacgc ccacgtgtcc ttcggggatg ccggcgtgcc ccgggaagcg ggccgagacc 27600 tcggccggtt cgaggacctc gaccgcgacg ccgtgcgcct cggccgaggc gatggtgccg 27660 ccggccagcc ggccgtcgcg cgggccgatg agcaggcccc cggtgttctc gaagagccgg 27720 cggcccgtgc ccgcctccag ctcgcgccac agctccagcg aacgccgggc caccggcacg 27780 agggcctcgt tctccaggca ggtctcgcgg aacatgcggt gaccgccgtg cgaggacccg 27840 cgggcgtgcg cgatgtcgaa ccgctcgacc cccaccgccc ggacaccgcg ggcggcgagc 27900 cgccacagcg tcatggcccc ccagatcccc aggccgacca ccaccacgtc ggggcgggcg 27960 gggtcgtgcg accggtcgac ggacatcttc gctacctcct gggaaccaag cgggaattga 28020 ctgagagtca gggcgagaac tgaccgaacg tcaggcagcc gcgaaccgcg gcgcgatctc 28080 ggcggcgaac tcggcgaccg cccaccgcgc ctgctccagt ggcgtcacgc cgttgttcat 28140 gtgcaggctg acggtcacgt cgccgcccac ccgctcgcgc acccgctcca gctgctcggt 28200 gatgtcgccg gtggtgccga tcagcacctt gtcctgctcc cacgacttgc gcaggtcgga 28260 ggaggcgacc ttgtcggcga gcttctcgta ccccgggtac tgcgcggtcg cggcgccctg 28320 ccagctcttg acggcgccgc tcatcttgtc caggtagttg gactccgccg cctcggccgc 28380 ccgccaggcg ctgtcgcggt cccggtccag gtagcagctg tacttgacct ggatgcgcgg 28440 cgcgcggtcc gggtggtggg cggcgaaggc ctcgcggtag gccgcgagca tctccgcgaa 28500 ctgctcaccg ctggtgatgg tcggcacgat ctgcaggttg tgcccctcgc ggccggcggc 28560 ggcgcaggac tcggcgctgg acgccgaggc gacgaacagc ggaggatgcg gcgtctggtg 28620 cgggcgcggg gtgagcgtca ccgacccgaa gcggtggaac tcgccctcga agaccacgtc 28680 cgtcccggtc cagagcgcga cgaaggcccg cagcgcctcg gtgaagcgcg cccggctctc 28740 ctccatcgac acctcgaacg ccgtgaactc gtgcggcagg aaggcccgtc cgacgccgac 28800 gtcgacccgg ccgccgctca gctggtccag catcgccagc cgcccggcca gcttgagcgg 28860 gtggtcgaag gcggggatga ccgcgccggt ggtgatgcgc agccgctcgg tacgcgcggc 28920 gatggccgag agcaggacca ccgggtcggg gctgtacccc ccgtagggcc cgaggtggtg 28980 ctcgaccacc tggacgtgct cgtagcccag ccggtcggcg tcgacggcga gggccaggca 29040 gtcgtcgaag tagtcgtgcg gcgccttgtc ccgctcgtcg agcgcgggga agaaggtcag 29100 accgaaatcc atgggctccc caagggtgag aagtgaggtg ggtcggagcc ggagcctagg 29160 cggggaggac tggggagatc cctagacatc cgttggtaga caagggccgt cggcgggagt 29220 cggactcccg ccgtccttgc cgaccttcga aaggacccca gcgtgtcgaa tcggatgagc 29280 agcgaagtac ccgagatcag ggtcagcgac gagcgggtca accgcacgct caccgcggtc 29340 aacgcccggg cggccgagca cgaccggtcg ctattcgagc aggtgcgcga ctcgctggcg 29400 gtcgcggtgc cgccggaggc gggcacgctg atgtaccagc tcgtgcgcgc cacccgggcc 29460 gccaaggtgg tggagctggg gatgtcgctc ggcgtctcca cggtctacct cgccgccgcc 29520 gtgcgcgaca acgggggcga ggggcgggtc tacacgaccg agatcgacga ggcgaagatc 29580 aagcagggcc gcgccaccct ggccgacgcc ggcgtcgccg acctcgtcga ggtgctggag 29640 ggcgacgcgc tccagaccct ggactcggtg cccgacggcg tccagttcgt cctgctcgac 29700 ggctggaacg agagctacct gcgggtgatg aagatcctgg agcccaagct cgcgccgggc 29760 gccctcgtgc tcgccgacga cgtcaacctc ttcggcgagg gctgcgtgga cttcctggag 29820 tacgtccgcg accccgcgaa cggctacctg tccgtcaact tcccgatggg cgagggcctg 29880 gagctcagca tgcgcgtggg ctgagcgccc gcgggtaccg ggcgtgcggc ccgtccgcac 29940 gcccggccag gaaccgacag gaaccgaaag gaagaccatg acggaactgc gtgacgcggt 30000 gctgcgtggc gcgtcccccg aggaactgct gcgcgccccc ctcccggcca cctaccgggc 30060 cgcccacctg cgcgccgagg acgtcggcat gttcgacggc acggacggcg accgcgacgt 30120 gcgcaagtcg gtggccgtgg gccaggtgcc gctgcccgag atcgcgcccg acgaggtcct 30180 gatcgcggtc atggccgccg cggtcaacta caactccgtg tggtcggcga cgttcctgcc 30240 gatgccgacc ttccgcttcc tcgagaagta cgcccgccag ggcggctggg cagcacgcca 30300 cgaccagccc taccacgtga tcggctccga ctgctcgggc gtcgtcgtgc gcgtcggctc 30360 cggcgtgcgc cggtggcggg tcggcgacca cgtggtgatc cacccggtgc acgtggacga 30420 ccagggcgcc gccacccacg acgacgccat gatggacgac cagcagcgcg cctgggggta 30480 cgagaccaac ttcggcgcct tcggcgagta cgccgtcgcc cgcgccagcc aactggtcgc 30540 caagcccggc cacttgacgt gggaggagtc ggcggcgaac acgctgtgca ccaccacgtc 30600 gtaccgcatg ctcgtcgggg cgcacggcgc ccggatgaag cagggggacg tggtcctggt 30660 ctggggcgcg gcgggcggcc tggggacgta cgccgtgcag ttggtcaaga acggcggcgg 30720 tatccccgtc gccgtcgtca gctcgcccgc gaaggcggag gcggtccgcc ggctgggctg 30780 cgagcacgtc atcgaccgca ccgaactcgg gctcaccggc gacccctcgg gcgacttcga 30840 cgccgtgcgg gagatcggca agcggctggg cgcccgcatc cgcgaactcg ccggccgcga 30900 ccccgacatc gtcttcgagc acaccggccg ggccaccttc gccctctcgg tgttcgtcgt 30960 ccgccgcggc ggcaccgtcg tcacctgcgg atccagctcg ggctaccggc acctgtacga 31020 caaccggtac ctgtggatga agctgaacac cgtcatcggc agccacggcg gaaacctgca 31080 ggaagccacc gagagcaccc gcctgatcgc ctccggcgcg atcgttccgg cgctctccga 31140 ggtccacccc ttcgaggacg tggccgaggc gatgcggcgg gtccagctca acgagcacgt 31200 cggcaaggtc gtcgtcctgt gccaggcccc caccgccggc ctgggcgtga ccgacccgga 31260 gctgcgggaa cggctggggg aggagcggac ggcacccctg ctgcgggact ccgcctga 31318 <210> 2 <211> 681 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(681) <223> <400> 2 atg agt tcc ttg gcg acc ccc acc ccc act ctc gag ggc ctc ctc acg 48 Met Ser Ser Leu Ala Thr Pro Thr Pro Thr Leu Glu Gly Leu Leu Thr 1 5 10 15 aca ccg gcg gcg cag cac gcc gaa gca cac ccc ccg ctc cac cgg ccg 96 Thr Pro Ala Ala Gln His Ala Glu Ala His Pro Pro Leu His Arg Pro 20 25 30 ggc tcg gcc acg gcc tgc ctc gac cgg ggc ctg gtc ctc cgg cag gcg 144 Gly Ser Ala Thr Ala Cys Leu Asp Arg Gly Leu Val Leu Arg Gln Ala 35 40 45 gac gag gag ttc ttc cgc cgg ttc ggc ggc tcg gcc ccg cgc ctc gtc 192 Asp Glu Glu Phe Phe Arg Arg Phe Gly Gly Ser Ala Pro Arg Leu Val 50 55 60 ggc cgg tcc ttc acc gag ctg gtg cac ccc ggc tgc cgg gag ccc ctg 240 Gly Arg Ser Phe Thr Glu Leu Val His Pro Gly Cys Arg Glu Pro Leu 65 70 75 80 ctg cgg cag ttc gcc ggg ctc acc gag ggc cgg cgc gac cgg ttc ggc 288 Leu Arg Gln Phe Ala Gly Leu Thr Glu Gly Arg Arg Asp Arg Phe Gly 85 90 95 acc gag gtc atc gcg gtg ggc ccg gac ggc acc ccg ttc cgg acc gac 336 Thr Glu Val Ile Ala Val Gly Pro Asp Gly Thr Pro Phe Arg Thr Asp 100 105 110 ctg acg gcg ctg gcg gta cgc ggc gga acc ccc gac atc tcg gcc gtc 384 Leu Thr Ala Leu Ala Val Arg Gly Gly Thr Pro Asp Ile Ser Ala Val 115 120 125 tgg ctg acg ctg gcg gcg gcc ggc gag acc gcg cag ccc gcc gcc gcg 432 Trp Leu Thr Leu Ala Ala Ala Gly Glu Thr Ala Gln Pro Ala Ala Ala 130 135 140 acg ccc cgc aag aag atc ctc agc gag atc gac gcc cgc atc ctc gaa 480 Thr Pro Arg Lys Lys Ile Leu Ser Glu Ile Asp Ala Arg Ile Leu Glu 145 150 155 160 ggc atc gcg gcc ggt gtc tcc acc gtc ccc ctg gcc gca cgc ctg tat 528 Gly Ile Ala Ala Gly Val Ser Thr Val Pro Leu Ala Ala Arg Leu Tyr 165 170 175 ctg agc cgg cag ggg gtc gag tac cac gtg aag agc ctg ttc cgg cag 576 Leu Ser Arg Gln Gly Val Glu Tyr His Val Lys Ser Leu Phe Arg Gln 180 185 190 ctc cgc gtg ccc aac cgg gcc gcg ctc gtc tcc cgc gcc tac tcc atg 624 Leu Arg Val Pro Asn Arg Ala Ala Leu Val Ser Arg Ala Tyr Ser Met 195 200 205 ggc ctg ctc aag gtg ggg acc tgg ccg ccc aag gtg gcg ccg gac ttc 672 Gly Leu Leu Lys Val Gly Thr Trp Pro Pro Lys Val Ala Pro Asp Phe 210 215 220 gtc aag tga 681 Val Lys 225 <210> 3 <211> 226 <212> PRT <213> Streptoverticillium <400> 3 Met Ser Ser Leu Ala Thr Pro Thr Pro Thr Leu Glu Gly Leu Leu Thr 1 5 10 15 Thr Pro Ala Ala Gln His Ala Glu Ala His Pro Pro Leu His Arg Pro 20 25 30 Gly Ser Ala Thr Ala Cys Leu Asp Arg Gly Leu Val Leu Arg Gln Ala 35 40 45 Asp Glu Glu Phe Phe Arg Arg Phe Gly Gly Ser Ala Pro Arg Leu Val 50 55 60 Gly Arg Ser Phe Thr Glu Leu Val His Pro Gly Cys Arg Glu Pro Leu 65 70 75 80 Leu Arg Gln Phe Ala Gly Leu Thr Glu Gly Arg Arg Asp Arg Phe Gly 85 90 95 Thr Glu Val Ile Ala Val Gly Pro Asp Gly Thr Pro Phe Arg Thr Asp 100 105 110 Leu Thr Ala Leu Ala Val Arg Gly Gly Thr Pro Asp Ile Ser Ala Val 115 120 125 Trp Leu Thr Leu Ala Ala Ala Gly Glu Thr Ala Gln Pro Ala Ala Ala 130 135 140 Thr Pro Arg Lys Lys Ile Leu Ser Glu Ile Asp Ala Arg Ile Leu Glu 145 150 155 160 Gly Ile Ala Ala Gly Val Ser Thr Val Pro Leu Ala Ala Arg Leu Tyr 165 170 175 Leu Ser Arg Gln Gly Val Glu Tyr His Val Lys Ser Leu Phe Arg Gln 180 185 190 Leu Arg Val Pro Asn Arg Ala Ala Leu Val Ser Arg Ala Tyr Ser Met 195 200 205 Gly Leu Leu Lys Val Gly Thr Trp Pro Pro Lys Val Ala Pro Asp Phe 210 215 220 Val Lys 225 <210> 4 <211> 1887 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1887) <223> <400> 4 atg ccg cac ccg acc acg cgc acc gcc ccg cac tcc gcc gcc ggt ggg 48 Met Pro His Pro Thr Thr Arg Thr Ala Pro His Ser Ala Ala Gly Gly 1 5 10 15 acc acc gcc ggg gag acc tcg tca ccg ctg ttc gcg ccc gcc cgg acc 96 Thr Thr Ala Gly Glu Thr Ser Ser Pro Leu Phe Ala Pro Ala Arg Thr 20 25 30 gtc cgg cgg gac cgg ccg gac ggg acc gtg ctc ctc tcg tcg gcg cag 144 Val Arg Arg Asp Arg Pro Asp Gly Thr Val Leu Leu Ser Ser Ala Gln 35 40 45 ccg ctg ggg gtg tat ccc gcc tcc gtg acc gac cat ctc cgc acc tgg 192 Pro Leu Gly Val Tyr Pro Ala Ser Val Thr Asp His Leu Arg Thr Trp 50 55 60 gcc cag gcc ggg ccc gac cgc ccg ctg gtc gcc gag cgc ggg gcc gac 240 Ala Gln Ala Gly Pro Asp Arg Pro Leu Val Ala Glu Arg Gly Ala Asp 65 70 75 80 ggc cgg tgg ggg cac cgc acg tac ggc gag gtg ctg gcg gcg gcg gag 288 Gly Arg Trp Gly His Arg Thr Tyr Gly Glu Val Leu Ala Ala Ala Glu 85 90 95 gcg gtc ggg cag gcg ctg ctc gac cgc ggg ctg tcg gcg cgg cgg ccg 336 Ala Val Gly Gln Ala Leu Leu Asp Arg Gly Leu Ser Ala Arg Arg Pro 100 105 110 ctg atg gtc ctg tcc ggc aac tcc acc ggg cac ctg ctg atg acg ctc 384 Leu Met Val Leu Ser Gly Asn Ser Thr Gly His Leu Leu Met Thr Leu 115 120 125 ggc gcg ctg agc gcc ggg atc ccg gtg gcg ccg gtc agc gtc gcc tac 432 Gly Ala Leu Ser Ala Gly Ile Pro Val Ala Pro Val Ser Val Ala Tyr 130 135 140 tcc ctg ctg agc cgg gac cac gcg cgg atc cgg gcg atc gcg gaa ctg 480 Ser Leu Leu Ser Arg Asp His Ala Arg Ile Arg Ala Ile Ala Glu Leu 145 150 155 160 ctg cgg ccg ggc gcg gtg tac gcc gag gac gcc ggg ccg ttc ggt ccc 528 Leu Arg Pro Gly Ala Val Tyr Ala Glu Asp Ala Gly Pro Phe Gly Pro 165 170 175 gcg ctg gcc gcg gcg ggc ggt gga gcc atc gtc gtg gcg gcg cgg ggc 576 Ala Leu Ala Ala Ala Gly Gly Gly Ala Ile Val Val Ala Ala Arg Gly 180 185 190 ggg ccg gcg gag cac tcg ctg gac gcc ctg ctg cgt acg gtg ccg ggc 624 Gly Pro Ala Glu His Ser Leu Asp Ala Leu Leu Arg Thr Val Pro Gly 195 200 205 cgc gcg ttc gag gcg gcc cgt gcg ggc gtc acg agc gcg acg gtc gcg 672 Arg Ala Phe Glu Ala Ala Arg Ala Gly Val Thr Ser Ala Thr Val Ala 210 215 220 aag gtc ctc ttc acg tcg ggc tcg acg gga gcg ccg aag ggc gtc gtc 720 Lys Val Leu Phe Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Val 225 230 235 240 acc acg cac ggc atg ctc tgt gcc aac cag cgg atg atg cgg cag gtg 768 Thr Thr His Gly Met Leu Cys Ala Asn Gln Arg Met Met Arg Gln Val 245 250 255 tgg ccg ttc ctg gcc ggg gag cgg ccg gtg ctg ctg gac tgg ctg ccg 816 Trp Pro Phe Leu Ala Gly Glu Arg Pro Val Leu Leu Asp Trp Leu Pro 260 265 270 tgg agc cac acc ttc ggc ggc aac cac aac gtg aac ctg gtg ctg gcc 864 Trp Ser His Thr Phe Gly Gly Asn His Asn Val Asn Leu Val Leu Ala 275 280 285 aac ggc ggc act ctg tac ctc gac gac ggc cgc ccg acc ccg gag ctg 912 Asn Gly Gly Thr Leu Tyr Leu Asp Asp Gly Arg Pro Thr Pro Glu Leu 290 295 300 ttc ggg cgc acc ctg gcc aac ctg cgc gag gtc tcc ccg acc ctg gcg 960 Phe Gly Arg Thr Leu Ala Asn Leu Arg Glu Val Ser Pro Thr Leu Ala 305 310 315 320 ttc aac gtc ccg gcc ggg tac gcg cgg ctc gtc ccc gcc ctg gag cgc 1008 Phe Asn Val Pro Ala Gly Tyr Ala Arg Leu Val Pro Ala Leu Glu Arg 325 330 335 gac cgg gag ctg gcg gag cgg ttc ttc gcc cgg ctg cgg ctc gtc ttc 1056 Asp Arg Glu Leu Ala Glu Arg Phe Phe Ala Arg Leu Arg Leu Val Phe 340 345 350 aac gcg gcg gcg gcg ctg gcc ccg gcc ctg cgc gaa cgg ctc cgg gcg 1104 Asn Ala Ala Ala Ala Leu Ala Pro Ala Leu Arg Glu Arg Leu Arg Ala 355 360 365 ctg ggc cgc gaa gtg acc ggg cgg gac gtg ccg gtg acg ggc tcg tgg 1152 Leu Gly Arg Glu Val Thr Gly Arg Asp Val Pro Val Thr Gly Ser Trp 370 375 380 ggc gcc acc gag acc tcg ccg gcg tcc acc agc gcg cac ttc ccg ttc 1200 Gly Ala Thr Glu Thr Ser Pro Ala Ser Thr Ser Ala His Phe Pro Phe 385 390 395 400 acc gac ccg cgg tgc atc ggc gtg ccg ctg ccg ggg gtg gag ctg aag 1248 Thr Asp Pro Arg Cys Ile Gly Val Pro Leu Pro Gly Val Glu Leu Lys 405 410 415 ctc gta ccg gcg gag ggt gac ggc tac gag gtc cgg gtg cgc ggc ccg 1296 Leu Val Pro Ala Glu Gly Asp Gly Tyr Glu Val Arg Val Arg Gly Pro 420 425 430 cac gtg acg ccc ggc tac ctc ggc cgc ccg gac ctc gac gcg cgc gcc 1344 His Val Thr Pro Gly Tyr Leu Gly Arg Pro Asp Leu Asp Ala Arg Ala 435 440 445 ttc gac gag gag ggc tac tac cgg ccg gga gac gcc gtc gcg ttc gcc 1392 Phe Asp Glu Glu Gly Tyr Tyr Arg Pro Gly Asp Ala Val Ala Phe Ala 450 455 460 gac ccc ggc gac gcg ggc gcg ggg ctg gtg ttc cgg ggc cgg ctg acc 1440 Asp Pro Gly Asp Ala Gly Ala Gly Leu Val Phe Arg Gly Arg Leu Thr 465 470 475 480 gag gac ttc aag ctg tcc acc ggt acg ttc gtg cac gtc gaa gcc gtg 1488 Glu Asp Phe Lys Leu Ser Thr Gly Thr Phe Val His Val Glu Ala Val 485 490 495 cgc ggc gcg ctg ctt tcg gcc gcg ccg gtc ctc tcc gac gcg gtg atc 1536 Arg Gly Ala Leu Leu Ser Ala Ala Pro Val Leu Ser Asp Ala Val Ile 500 505 510 acc ggg gag cac cgg gac gcg gtc tgc gcg ctg gcg tgg ctc gac ccg 1584 Thr Gly Glu His Arg Asp Ala Val Cys Ala Leu Ala Trp Leu Asp Pro 515 520 525 gcc gag gcc gag cgg ctg ctc ggc cgg cgg ccg gcc gcg gac ggc ggg 1632 Ala Glu Ala Glu Arg Leu Leu Gly Arg Arg Pro Ala Ala Asp Gly Gly 530 535 540 gtg ctg tac tcc gac gcg ctg gcc gcc cac ctc ggc gcg gca ctg gag 1680 Val Leu Tyr Ser Asp Ala Leu Ala Ala His Leu Gly Ala Ala Leu Glu 545 550 555 560 cga ctc aac cgg ggc gcc ggg tcc gcg tcc cgg gtc cag cgg ctg ctg 1728 Arg Leu Asn Arg Gly Ala Gly Ser Ala Ser Arg Val Gln Arg Leu Leu 565 570 575 gtg ctc gcg gac ccg ccc gac ctg gac gcg ggc gag atc acc gac aag 1776 Val Leu Ala Asp Pro Pro Asp Leu Asp Ala Gly Glu Ile Thr Asp Lys 580 585 590 ggc tac gtc aac cag cgc cgg gtg ctg gcc gcc cgc gcg ccg ctg gtc 1824 Gly Tyr Val Asn Gln Arg Arg Val Leu Ala Ala Arg Ala Pro Leu Val 595 600 605 gcc cgg ctg cac gcg gac ccc gcg ccg cga cac gtc atc acc ccg cgg 1872 Ala Arg Leu His Ala Asp Pro Ala Pro Arg His Val Ile Thr Pro Arg 610 615 620 tcc ggg ctc act tga 1887 Ser Gly Leu Thr 625 <210> 5 <211> 628 <212> PRT <213> Streptoverticillium <400> 5 Met Pro His Pro Thr Thr Arg Thr Ala Pro His Ser Ala Ala Gly Gly 1 5 10 15 Thr Thr Ala Gly Glu Thr Ser Ser Pro Leu Phe Ala Pro Ala Arg Thr 20 25 30 Val Arg Arg Asp Arg Pro Asp Gly Thr Val Leu Leu Ser Ser Ala Gln 35 40 45 Pro Leu Gly Val Tyr Pro Ala Ser Val Thr Asp His Leu Arg Thr Trp 50 55 60 Ala Gln Ala Gly Pro Asp Arg Pro Leu Val Ala Glu Arg Gly Ala Asp 65 70 75 80 Gly Arg Trp Gly His Arg Thr Tyr Gly Glu Val Leu Ala Ala Ala Glu 85 90 95 Ala Val Gly Gln Ala Leu Leu Asp Arg Gly Leu Ser Ala Arg Arg Pro 100 105 110 Leu Met Val Leu Ser Gly Asn Ser Thr Gly His Leu Leu Met Thr Leu 115 120 125 Gly Ala Leu Ser Ala Gly Ile Pro Val Ala Pro Val Ser Val Ala Tyr 130 135 140 Ser Leu Leu Ser Arg Asp His Ala Arg Ile Arg Ala Ile Ala Glu Leu 145 150 155 160 Leu Arg Pro Gly Ala Val Tyr Ala Glu Asp Ala Gly Pro Phe Gly Pro 165 170 175 Ala Leu Ala Ala Ala Gly Gly Gly Ala Ile Val Val Ala Ala Arg Gly 180 185 190 Gly Pro Ala Glu His Ser Leu Asp Ala Leu Leu Arg Thr Val Pro Gly 195 200 205 Arg Ala Phe Glu Ala Ala Arg Ala Gly Val Thr Ser Ala Thr Val Ala 210 215 220 Lys Val Leu Phe Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Val 225 230 235 240 Thr Thr His Gly Met Leu Cys Ala Asn Gln Arg Met Met Arg Gln Val 245 250 255 Trp Pro Phe Leu Ala Gly Glu Arg Pro Val Leu Leu Asp Trp Leu Pro 260 265 270 Trp Ser His Thr Phe Gly Gly Asn His Asn Val Asn Leu Val Leu Ala 275 280 285 Asn Gly Gly Thr Leu Tyr Leu Asp Asp Gly Arg Pro Thr Pro Glu Leu 290 295 300 Phe Gly Arg Thr Leu Ala Asn Leu Arg Glu Val Ser Pro Thr Leu Ala 305 310 315 320 Phe Asn Val Pro Ala Gly Tyr Ala Arg Leu Val Pro Ala Leu Glu Arg 325 330 335 Asp Arg Glu Leu Ala Glu Arg Phe Phe Ala Arg Leu Arg Leu Val Phe 340 345 350 Asn Ala Ala Ala Ala Leu Ala Pro Ala Leu Arg Glu Arg Leu Arg Ala 355 360 365 Leu Gly Arg Glu Val Thr Gly Arg Asp Val Pro Val Thr Gly Ser Trp 370 375 380 Gly Ala Thr Glu Thr Ser Pro Ala Ser Thr Ser Ala His Phe Pro Phe 385 390 395 400 Thr Asp Pro Arg Cys Ile Gly Val Pro Leu Pro Gly Val Glu Leu Lys 405 410 415 Leu Val Pro Ala Glu Gly Asp Gly Tyr Glu Val Arg Val Arg Gly Pro 420 425 430 His Val Thr Pro Gly Tyr Leu Gly Arg Pro Asp Leu Asp Ala Arg Ala 435 440 445 Phe Asp Glu Glu Gly Tyr Tyr Arg Pro Gly Asp Ala Val Ala Phe Ala 450 455 460 Asp Pro Gly Asp Ala Gly Ala Gly Leu Val Phe Arg Gly Arg Leu Thr 465 470 475 480 Glu Asp Phe Lys Leu Ser Thr Gly Thr Phe Val His Val Glu Ala Val 485 490 495 Arg Gly Ala Leu Leu Ser Ala Ala Pro Val Leu Ser Asp Ala Val Ile 500 505 510 Thr Gly Glu His Arg Asp Ala Val Cys Ala Leu Ala Trp Leu Asp Pro 515 520 525 Ala Glu Ala Glu Arg Leu Leu Gly Arg Arg Pro Ala Ala Asp Gly Gly 530 535 540 Val Leu Tyr Ser Asp Ala Leu Ala Ala His Leu Gly Ala Ala Leu Glu 545 550 555 560 Arg Leu Asn Arg Gly Ala Gly Ser Ala Ser Arg Val Gln Arg Leu Leu 565 570 575 Val Leu Ala Asp Pro Pro Asp Leu Asp Ala Gly Glu Ile Thr Asp Lys 580 585 590 Gly Tyr Val Asn Gln Arg Arg Val Leu Ala Ala Arg Ala Pro Leu Val 595 600 605 Ala Arg Leu His Ala Asp Pro Ala Pro Arg His Val Ile Thr Pro Arg 610 615 620 Ser Gly Leu Thr 625 <210> 6 <211> 1611 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1611) <223> <400> 6 atg gcc tcg ccc acc gac gac acc acc atc gag ctg gac ggc cac agc 48 Met Ala Ser Pro Thr Asp Asp Thr Thr Ile Glu Leu Asp Gly His Ser 1 5 10 15 ctc tcg ctg cgg gcc gtg cgg cgg gtc gcg acc cag ccg ggc aag cag 96 Leu Ser Leu Arg Ala Val Arg Arg Val Ala Thr Gln Pro Gly Lys Gln 20 25 30 aga atc gcc ctc gcg gcg gcc gcg gcc gag cgc atg acg gcg tcg cgg 144 Arg Ile Ala Leu Ala Ala Ala Ala Ala Glu Arg Met Thr Ala Ser Arg 35 40 45 gag gcc acg gag cgg atc gtc gcc tcc ggc atc ccg atc tac ggg gtg 192 Glu Ala Thr Glu Arg Ile Val Ala Ser Gly Ile Pro Ile Tyr Gly Val 50 55 60 acg acc ggc ttc ggc gac agc agc ggc cgc cag gtc agc gcc gac aag 240 Thr Thr Gly Phe Gly Asp Ser Ser Gly Arg Gln Val Ser Ala Asp Lys 65 70 75 80 gcc ggg gcg ctg caa cgg aac ctg ctc cgc ttc ctg cgg gtc ggc acc 288 Ala Gly Ala Leu Gln Arg Asn Leu Leu Arg Phe Leu Arg Val Gly Thr 85 90 95 ggg gac atg gca ccc gac gag gtc gtc cgc gcc acc atg ctg atc cgc 336 Gly Asp Met Ala Pro Asp Glu Val Val Arg Ala Thr Met Leu Ile Arg 100 105 110 gcc aac agt gcc gcg cgg ggc aac tcc ggc atc cgc acg gcg ccg gtg 384 Ala Asn Ser Ala Ala Arg Gly Asn Ser Gly Ile Arg Thr Ala Pro Val 115 120 125 gag ctg atc ctg tca ctg ctg gag aag gac ctg ctg ccg cag ata ccg 432 Glu Leu Ile Leu Ser Leu Leu Glu Lys Asp Leu Leu Pro Gln Ile Pro 130 135 140 gag cgc ggt tcg gtc ggc gcc agc ggc gac ctc gcg ccg ctc ggc tac 480 Glu Arg Gly Ser Val Gly Ala Ser Gly Asp Leu Ala Pro Leu Gly Tyr 145 150 155 160 ctc gcc gcc gcg ctc acc ggc gag ggc acc ctg cgc agc cag ggc cgg 528 Leu Ala Ala Ala Leu Thr Gly Glu Gly Thr Leu Arg Ser Gln Gly Arg 165 170 175 gcg ctc gac gcg ggc gag gcc atc cgg gcc tgc ggc ctc gcg ccc gtc 576 Ala Leu Asp Ala Gly Glu Ala Ile Arg Ala Cys Gly Leu Ala Pro Val 180 185 190 acg ctc cgg gcc aag gag ggg ctg gcg ctc gtc aac ggg acg tcc ttc 624 Thr Leu Arg Ala Lys Glu Gly Leu Ala Leu Val Asn Gly Thr Ser Phe 195 200 205 atg gcc gcc tac gcc gcc ctg gcg gtc gcc gag gcg gcc gag ctg gcg 672 Met Ala Ala Tyr Ala Ala Leu Ala Val Ala Glu Ala Ala Glu Leu Ala 210 215 220 tgg gcg gcc gag ctg tgc acc gtg ctg tcg acg gag gtc cgg cgc agc 720 Trp Ala Ala Glu Leu Cys Thr Val Leu Ser Thr Glu Val Arg Arg Ser 225 230 235 240 agc cgc gac cag ttc acc gcg ttc ccg cac gag cac aag ccg cac ccc 768 Ser Arg Asp Gln Phe Thr Ala Phe Pro His Glu His Lys Pro His Pro 245 250 255 ggc cag ctc gcg agc gcc gcg aac gtc cac cgg atg ctg ggc gac tcc 816 Gly Gln Leu Ala Ser Ala Ala Asn Val His Arg Met Leu Gly Asp Ser 260 265 270 ccc gcc gtg gtc gcc gac acc gat ctc gtg ggc ccc ggt tcg agc gag 864 Pro Ala Val Val Ala Asp Thr Asp Leu Val Gly Pro Gly Ser Ser Glu 275 280 285 gag cgc cgg tac gtc gag ctg gag cgc cgc atc cag gac ccg tac tcg 912 Glu Arg Arg Tyr Val Glu Leu Glu Arg Arg Ile Gln Asp Pro Tyr Ser 290 295 300 atc cgg tgc gcg ccg cac gtc gtc ggc gtg ctg cgg gac acg ctc ggc 960 Ile Arg Cys Ala Pro His Val Val Gly Val Leu Arg Asp Thr Leu Gly 305 310 315 320 tgg gcc gag gac tgg ctg acc acc gag atc aac tcc tcg aac gac aac 1008 Trp Ala Glu Asp Trp Leu Thr Thr Glu Ile Asn Ser Ser Asn Asp Asn 325 330 335 ccg ctc ttc gag gcg gcc acc gac acc gtc cac tac agc ggc aac ttc 1056 Pro Leu Phe Glu Ala Ala Thr Asp Thr Val His Tyr Ser Gly Asn Phe 340 345 350 tac ggc ggg cac gtc gcc cag gcg gcg cag gcg gtc tcc gcc gcc gtg 1104 Tyr Gly Gly His Val Ala Gln Ala Ala Gln Ala Val Ser Ala Ala Val 355 360 365 gcc ggg gtc gcc gac ctg ctc gac cgc cag ctg gcg atc ctg gtg gac 1152 Ala Gly Val Ala Asp Leu Leu Asp Arg Gln Leu Ala Ile Leu Val Asp 370 375 380 gac aag ttc agc atc ggc ctc acc ccg aac ctg gtc gtc ccg gtc ggt 1200 Asp Lys Phe Ser Ile Gly Leu Thr Pro Asn Leu Val Val Pro Val Gly 385 390 395 400 ccc gac gac ccg gag gca ggg ctg cac cac ggg ttc aag ggc gcg cag 1248 Pro Asp Asp Pro Glu Ala Gly Leu His His Gly Phe Lys Gly Ala Gln 405 410 415 atc gcc gcg tcc gcg ctg acc gcc gag gcg ctg cac ctg acg atg ccc 1296 Ile Ala Ala Ser Ala Leu Thr Ala Glu Ala Leu His Leu Thr Met Pro 420 425 430 gtg agc tcg ttc tcc cgt tcg acc gag gcg cac aac cag gac aag gtg 1344 Val Ser Ser Phe Ser Arg Ser Thr Glu Ala His Asn Gln Asp Lys Val 435 440 445 agc atg ggc acc atc gcc gcg cgg cac gcg cac acg gtg gtc cgg ctg 1392 Ser Met Gly Thr Ile Ala Ala Arg His Ala His Thr Val Val Arg Leu 450 455 460 acg agc cag gtc acc gcc atc cac ctg ctc gcc ctg tgc cag gcc gcg 1440 Thr Ser Gln Val Thr Ala Ile His Leu Leu Ala Leu Cys Gln Ala Ala 465 470 475 480 gac ctc acc ggg gtc ggg cgg ctg ggg agc gcg acc cgg gcc gcg cac 1488 Asp Leu Thr Gly Val Gly Arg Leu Gly Ser Ala Thr Arg Ala Ala His 485 490 495 acg ctc gtc cgc ggg tac tcg ccg ttc ctc tcc gcc gac cgg ccg ctg 1536 Thr Leu Val Arg Gly Tyr Ser Pro Phe Leu Ser Ala Asp Arg Pro Leu 500 505 510 gac gcc gac atc gag acc gtc gcc gcc ctg ctg cgc gcg ggc gag ctc 1584 Asp Ala Asp Ile Glu Thr Val Ala Ala Leu Leu Arg Ala Gly Glu Leu 515 520 525 cgc cgc gcg gtc gag cgg cac gtc tga 1611 Arg Arg Ala Val Glu Arg His Val 530 535 <210> 7 <211> 536 <212> PRT <213> Streptoverticillium <400> 7 Met Ala Ser Pro Thr Asp Asp Thr Thr Ile Glu Leu Asp Gly His Ser 1 5 10 15 Leu Ser Leu Arg Ala Val Arg Arg Val Ala Thr Gln Pro Gly Lys Gln 20 25 30 Arg Ile Ala Leu Ala Ala Ala Ala Ala Glu Arg Met Thr Ala Ser Arg 35 40 45 Glu Ala Thr Glu Arg Ile Val Ala Ser Gly Ile Pro Ile Tyr Gly Val 50 55 60 Thr Thr Gly Phe Gly Asp Ser Ser Gly Arg Gln Val Ser Ala Asp Lys 65 70 75 80 Ala Gly Ala Leu Gln Arg Asn Leu Leu Arg Phe Leu Arg Val Gly Thr 85 90 95 Gly Asp Met Ala Pro Asp Glu Val Val Arg Ala Thr Met Leu Ile Arg 100 105 110 Ala Asn Ser Ala Ala Arg Gly Asn Ser Gly Ile Arg Thr Ala Pro Val 115 120 125 Glu Leu Ile Leu Ser Leu Leu Glu Lys Asp Leu Leu Pro Gln Ile Pro 130 135 140 Glu Arg Gly Ser Val Gly Ala Ser Gly Asp Leu Ala Pro Leu Gly Tyr 145 150 155 160 Leu Ala Ala Ala Leu Thr Gly Glu Gly Thr Leu Arg Ser Gln Gly Arg 165 170 175 Ala Leu Asp Ala Gly Glu Ala Ile Arg Ala Cys Gly Leu Ala Pro Val 180 185 190 Thr Leu Arg Ala Lys Glu Gly Leu Ala Leu Val Asn Gly Thr Ser Phe 195 200 205 Met Ala Ala Tyr Ala Ala Leu Ala Val Ala Glu Ala Ala Glu Leu Ala 210 215 220 Trp Ala Ala Glu Leu Cys Thr Val Leu Ser Thr Glu Val Arg Arg Ser 225 230 235 240 Ser Arg Asp Gln Phe Thr Ala Phe Pro His Glu His Lys Pro His Pro 245 250 255 Gly Gln Leu Ala Ser Ala Ala Asn Val His Arg Met Leu Gly Asp Ser 260 265 270 Pro Ala Val Val Ala Asp Thr Asp Leu Val Gly Pro Gly Ser Ser Glu 275 280 285 Glu Arg Arg Tyr Val Glu Leu Glu Arg Arg Ile Gln Asp Pro Tyr Ser 290 295 300 Ile Arg Cys Ala Pro His Val Val Gly Val Leu Arg Asp Thr Leu Gly 305 310 315 320 Trp Ala Glu Asp Trp Leu Thr Thr Glu Ile Asn Ser Ser Asn Asp Asn 325 330 335 Pro Leu Phe Glu Ala Ala Thr Asp Thr Val His Tyr Ser Gly Asn Phe 340 345 350 Tyr Gly Gly His Val Ala Gln Ala Ala Gln Ala Val Ser Ala Ala Val 355 360 365 Ala Gly Val Ala Asp Leu Leu Asp Arg Gln Leu Ala Ile Leu Val Asp 370 375 380 Asp Lys Phe Ser Ile Gly Leu Thr Pro Asn Leu Val Val Pro Val Gly 385 390 395 400 Pro Asp Asp Pro Glu Ala Gly Leu His His Gly Phe Lys Gly Ala Gln 405 410 415 Ile Ala Ala Ser Ala Leu Thr Ala Glu Ala Leu His Leu Thr Met Pro 420 425 430 Val Ser Ser Phe Ser Arg Ser Thr Glu Ala His Asn Gln Asp Lys Val 435 440 445 Ser Met Gly Thr Ile Ala Ala Arg His Ala His Thr Val Val Arg Leu 450 455 460 Thr Ser Gln Val Thr Ala Ile His Leu Leu Ala Leu Cys Gln Ala Ala 465 470 475 480 Asp Leu Thr Gly Val Gly Arg Leu Gly Ser Ala Thr Arg Ala Ala His 485 490 495 Thr Leu Val Arg Gly Tyr Ser Pro Phe Leu Ser Ala Asp Arg Pro Leu 500 505 510 Asp Ala Asp Ile Glu Thr Val Ala Ala Leu Leu Arg Ala Gly Glu Leu 515 520 525 Arg Arg Ala Val Glu Arg His Val 530 535 <210> 8 <211> 183 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(183) <223> <400> 8 gtg ccc ctg atc cag gtc agc ctc tac gaa gac cgc ctc acg ccc gag 48 Val Pro Leu Ile Gln Val Ser Leu Tyr Glu Asp Arg Leu Thr Pro Glu 1 5 10 15 acc cgc cgc gcc ctg atc ggg gag ctc acc gag gcg gcg gtc cgc gcc 96 Thr Arg Arg Ala Leu Ile Gly Glu Leu Thr Glu Ala Ala Val Arg Ala 20 25 30 ctc ggc ccc gag tgc cgc gac gtg acg tgg gtg acg ctc cag ggc atc 144 Leu Gly Pro Glu Cys Arg Asp Val Thr Trp Val Thr Leu Gln Gly Ile 35 40 45 ccc cgc gac cag tgg ggc atc ggc gga acg ccc ggc tga 183 Pro Arg Asp Gln Trp Gly Ile Gly Gly Thr Pro Gly 50 55 60 <210> 9 <211> 60 <212> PRT <213> Streptoverticillium <400> 9 Val Pro Leu Ile Gln Val Ser Leu Tyr Glu Asp Arg Leu Thr Pro Glu 1 5 10 15 Thr Arg Arg Ala Leu Ile Gly Glu Leu Thr Glu Ala Ala Val Arg Ala 20 25 30 Leu Gly Pro Glu Cys Arg Asp Val Thr Trp Val Thr Leu Gln Gly Ile 35 40 45 Pro Arg Asp Gln Trp Gly Ile Gly Gly Thr Pro Gly 50 55 60 <210> 10 <211> 1137 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1137) <223> <400> 10 atg ggc ccg gtg cgc gag gag ttc gag cgg gcc ttc gcc cgg cac gtc 48 Met Gly Pro Val Arg Glu Glu Phe Glu Arg Ala Phe Ala Arg His Val 1 5 10 15 ggc gcc gcg cac gcc ctg acg gtc acc agc ggg acg gtc gcg ctg gag 96 Gly Ala Ala His Ala Leu Thr Val Thr Ser Gly Thr Val Ala Leu Glu 20 25 30 atc gcg atc cgg ctg ctc gac ctg cgg gcc ggg gac gag gtc gtc gtg 144 Ile Ala Ile Arg Leu Leu Asp Leu Arg Ala Gly Asp Glu Val Val Val 35 40 45 acg ccg cag acg tac cac gcc acc gcg cag ccg ctg ctc gcg acc gag 192 Thr Pro Gln Thr Tyr His Ala Thr Ala Gln Pro Leu Leu Ala Thr Glu 50 55 60 gca acg gtg cga ttc tgc gac gtg gag ccg ggc agc ctc aac atg gac 240 Ala Thr Val Arg Phe Cys Asp Val Glu Pro Gly Ser Leu Asn Met Asp 65 70 75 80 ccg gac gcg ctg gag act ctc gtc aac gag cgc acg aag gcc gtc atc 288 Pro Asp Ala Leu Glu Thr Leu Val Asn Glu Arg Thr Lys Ala Val Ile 85 90 95 ctc gtc cac tac ggc ggc aac ccc gcc gac atg gac cgg atc acc gcc 336 Leu Val His Tyr Gly Gly Asn Pro Ala Asp Met Asp Arg Ile Thr Ala 100 105 110 atc gcg cac gcg cac ggc gcc ctc gtg gtg gag gac tgc gcg cac gcg 384 Ile Ala His Ala His Gly Ala Leu Val Val Glu Asp Cys Ala His Ala 115 120 125 atc ggc gcc gag tac cgg ggc cgc cgc ccc ggc gcg ctc ggc gac ctg 432 Ile Gly Ala Glu Tyr Arg Gly Arg Arg Pro Gly Ala Leu Gly Asp Leu 130 135 140 tcc tgc ttc agc ttc cag gcg tcc aag aac atc acc acc ctc ggc gag 480 Ser Cys Phe Ser Phe Gln Ala Ser Lys Asn Ile Thr Thr Leu Gly Glu 145 150 155 160 ggc ggc atg gtg tgc acc ccg tcg ccc gaa ctg gcc cgc agg atc gac 528 Gly Gly Met Val Cys Thr Pro Ser Pro Glu Leu Ala Arg Arg Ile Asp 165 170 175 cgg atc cgg tcg aac gcg gtg gac ggc acc ttc acc tcg tcc gcg cac 576 Arg Ile Arg Ser Asn Ala Val Asp Gly Thr Phe Thr Ser Ser Ala His 180 185 190 cgc cgg ccc ccc gcg gcg ctg ccg tgg atg gcg tac gcc gac tac gcc 624 Arg Arg Pro Pro Ala Ala Leu Pro Trp Met Ala Tyr Ala Asp Tyr Ala 195 200 205 tac cgg gag gac tgc acg ggg ctg cgg ggc agc ggg acc aac gcc gcg 672 Tyr Arg Glu Asp Cys Thr Gly Leu Arg Gly Ser Gly Thr Asn Ala Ala 210 215 220 ctc tcc gag gcc gcc tgc gcg gtg ggc ctg gtg cag ctg gaa cgg ctg 720 Leu Ser Glu Ala Ala Cys Ala Val Gly Leu Val Gln Leu Glu Arg Leu 225 230 235 240 ccg gag ttc gtc gcc cgc cgg cgg gcg atc gcc gcg gaa ctc gac gcg 768 Pro Glu Phe Val Ala Arg Arg Arg Ala Ile Ala Ala Glu Leu Asp Ala 245 250 255 gtg tgc cgc cgc ttc gac gtc cgg ccg ctg acc gcc gcg ccc gac gcg 816 Val Cys Arg Arg Phe Asp Val Arg Pro Leu Thr Ala Ala Pro Asp Ala 260 265 270 gtg cac ccg tac cac ctc tac acc gcg ctc gtc ccc ggc gac gga cgc 864 Val His Pro Tyr His Leu Tyr Thr Ala Leu Val Pro Gly Asp Gly Arg 275 280 285 cgc gac cgc gtg ctg gac gcc ctg caa cgc tcc ggt acc ccc gcc cag 912 Arg Asp Arg Val Leu Asp Ala Leu Gln Arg Ser Gly Thr Pro Ala Gln 290 295 300 ttg cgc tac cac ccg gtg cac ctg ctg ccc gag tgg cgg ctg cgc ggg 960 Leu Arg Tyr His Pro Val His Leu Leu Pro Glu Trp Arg Leu Arg Gly 305 310 315 320 cac ggc gag ggc gag tgc ccg gtc gcc gaa cgc ctg tgg ttc ggc gag 1008 His Gly Glu Gly Glu Cys Pro Val Ala Glu Arg Leu Trp Phe Gly Glu 325 330 335 cac ctc aac ctg ccc tgc cac ccc gcc atg acc gat cgc cag gtc gag 1056 His Leu Asn Leu Pro Cys His Pro Ala Met Thr Asp Arg Gln Val Glu 340 345 350 acc ctc ggc gcc aac ctg gcc gcc gcg ctg agt ggc cgg gaa gca ccc 1104 Thr Leu Gly Ala Asn Leu Ala Ala Ala Leu Ser Gly Arg Glu Ala Pro 355 360 365 gcc cga cga gag aag gaa ccc tcg tgc ccc tga 1137 Ala Arg Arg Glu Lys Glu Pro Ser Cys Pro 370 375 <210> 11 <211> 378 <212> PRT <213> Streptoverticillium <400> 11 Met Gly Pro Val Arg Glu Glu Phe Glu Arg Ala Phe Ala Arg His Val 1 5 10 15 Gly Ala Ala His Ala Leu Thr Val Thr Ser Gly Thr Val Ala Leu Glu 20 25 30 Ile Ala Ile Arg Leu Leu Asp Leu Arg Ala Gly Asp Glu Val Val Val 35 40 45 Thr Pro Gln Thr Tyr His Ala Thr Ala Gln Pro Leu Leu Ala Thr Glu 50 55 60 Ala Thr Val Arg Phe Cys Asp Val Glu Pro Gly Ser Leu Asn Met Asp 65 70 75 80 Pro Asp Ala Leu Glu Thr Leu Val Asn Glu Arg Thr Lys Ala Val Ile 85 90 95 Leu Val His Tyr Gly Gly Asn Pro Ala Asp Met Asp Arg Ile Thr Ala 100 105 110 Ile Ala His Ala His Gly Ala Leu Val Val Glu Asp Cys Ala His Ala 115 120 125 Ile Gly Ala Glu Tyr Arg Gly Arg Arg Pro Gly Ala Leu Gly Asp Leu 130 135 140 Ser Cys Phe Ser Phe Gln Ala Ser Lys Asn Ile Thr Thr Leu Gly Glu 145 150 155 160 Gly Gly Met Val Cys Thr Pro Ser Pro Glu Leu Ala Arg Arg Ile Asp 165 170 175 Arg Ile Arg Ser Asn Ala Val Asp Gly Thr Phe Thr Ser Ser Ala His 180 185 190 Arg Arg Pro Pro Ala Ala Leu Pro Trp Met Ala Tyr Ala Asp Tyr Ala 195 200 205 Tyr Arg Glu Asp Cys Thr Gly Leu Arg Gly Ser Gly Thr Asn Ala Ala 210 215 220 Leu Ser Glu Ala Ala Cys Ala Val Gly Leu Val Gln Leu Glu Arg Leu 225 230 235 240 Pro Glu Phe Val Ala Arg Arg Arg Ala Ile Ala Ala Glu Leu Asp Ala 245 250 255 Val Cys Arg Arg Phe Asp Val Arg Pro Leu Thr Ala Ala Pro Asp Ala 260 265 270 Val His Pro Tyr His Leu Tyr Thr Ala Leu Val Pro Gly Asp Gly Arg 275 280 285 Arg Asp Arg Val Leu Asp Ala Leu Gln Arg Ser Gly Thr Pro Ala Gln 290 295 300 Leu Arg Tyr His Pro Val His Leu Leu Pro Glu Trp Arg Leu Arg Gly 305 310 315 320 His Gly Glu Gly Glu Cys Pro Val Ala Glu Arg Leu Trp Phe Gly Glu 325 330 335 His Leu Asn Leu Pro Cys His Pro Ala Met Thr Asp Arg Gln Val Glu 340 345 350 Thr Leu Gly Ala Asn Leu Ala Ala Ala Leu Ser Gly Arg Glu Ala Pro 355 360 365 Ala Arg Arg Glu Lys Glu Pro Ser Cys Pro 370 375 <210> 12 <211> 1686 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1686) <223> <400> 12 atg cct ctt ctc gat gga ctc gat gga ctc gat ggt ttc gtc ccc tgg 48 Met Pro Leu Leu Asp Gly Leu Asp Gly Leu Asp Gly Phe Val Pro Trp 1 5 10 15 ccg gcc gag acc gcg gag cgc tac cgg gcc gac ggc acc tgg gcc ggt 96 Pro Ala Glu Thr Ala Glu Arg Tyr Arg Ala Asp Gly Thr Trp Ala Gly 20 25 30 gag ccc ctg ggc gag ctg ctg cgt tcc cag gcc gcg cgc acc ccg gac 144 Glu Pro Leu Gly Glu Leu Leu Arg Ser Gln Ala Ala Arg Thr Pro Asp 35 40 45 aac gtg gct ctg atc gac ggg gag cgg tcc ttc acc tac gcc gcc ctc 192 Asn Val Ala Leu Ile Asp Gly Glu Arg Ser Phe Thr Tyr Ala Ala Leu 50 55 60 gac cgg tgg gcc gac cgc ctg gcc gcc ggg ttc tcg gcc gcc ggc ctg 240 Asp Arg Trp Ala Asp Arg Leu Ala Ala Gly Phe Ser Ala Ala Gly Leu 65 70 75 80 cgg gcg ggc gac cgg gcc gtg ctc caa ctg ccc aac gtc gcc gag cac 288 Arg Ala Gly Asp Arg Ala Val Leu Gln Leu Pro Asn Val Ala Glu His 85 90 95 gtg gcg gtg tcg ttc gcc ttc ttc cgc atc ggt gtg ctg ccg gtc ttc 336 Val Ala Val Ser Phe Ala Phe Phe Arg Ile Gly Val Leu Pro Val Phe 100 105 110 acg ctg ccc aac cac cgc atg gcg gag ctg gac cac atc tgc ggc ctg 384 Thr Leu Pro Asn His Arg Met Ala Glu Leu Asp His Ile Cys Gly Leu 115 120 125 acc ggg gcg agc gcc tac gtg acc ctc gac cgg ttc ctg ggg ttc gac 432 Thr Gly Ala Ser Ala Tyr Val Thr Leu Asp Arg Phe Leu Gly Phe Asp 130 135 140 cac cgc ggg ctg gcc cgg tcc ctg cgc gag cgg cac gcg tcg ctc cgg 480 His Arg Gly Leu Ala Arg Ser Leu Arg Glu Arg His Ala Ser Leu Arg 145 150 155 160 cac gtg ttc gtg gtc ggc gac ccc ggg gag ttc gcg ccg ctt ccc gag 528 His Val Phe Val Val Gly Asp Pro Gly Glu Phe Ala Pro Leu Pro Glu 165 170 175 gcg gag acg ccc ctg gac ccg gcc ggc gcg acc ggt ccc gac gcg tcg 576 Ala Glu Thr Pro Leu Asp Pro Ala Gly Ala Thr Gly Pro Asp Ala Ser 180 185 190 gac gtg gcc ttc ttc ctg ctg tcc ggc ggc acc acg gcg ctg ccg aag 624 Asp Val Ala Phe Phe Leu Leu Ser Gly Gly Thr Thr Ala Leu Pro Lys 195 200 205 ctc atc ccg cgg acg cac gac gac tac ctg tac cag gcc cgt acc gcc 672 Leu Ile Pro Arg Thr His Asp Asp Tyr Leu Tyr Gln Ala Arg Thr Ala 210 215 220 gcc ggg atc tgc gag tac tcc gag gac acc cgc tac ctc gcc acc ctg 720 Ala Gly Ile Cys Glu Tyr Ser Glu Asp Thr Arg Tyr Leu Ala Thr Leu 225 230 235 240 ccg atc gcc ttc aac ttc acg tgg ggc tgc ccg ggt gtg gtc ggg gtg 768 Pro Ile Ala Phe Asn Phe Thr Trp Gly Cys Pro Gly Val Val Gly Val 245 250 255 ttc gcc aac ggg ggc gcc gtc gtg ctg agc acc gtg ccc gac ccc cag 816 Phe Ala Asn Gly Gly Ala Val Val Leu Ser Thr Val Pro Asp Pro Gln 260 265 270 gtg tgc ttc ccg ctc atc gcc cgg cac ggg gtc acc acg acg tcg gtc 864 Val Cys Phe Pro Leu Ile Ala Arg His Gly Val Thr Thr Thr Ser Val 275 280 285 gtg ccg acg atc gcg cac tcc tgg atc gcc gcc gcc gac ggg cgc cgg 912 Val Pro Thr Ile Ala His Ser Trp Ile Ala Ala Ala Asp Gly Arg Arg 290 295 300 gag gag ctg gcg acg ctg gag ctg gtg cag gtc ggc agc gcg gtg gtg 960 Glu Glu Leu Ala Thr Leu Glu Leu Val Gln Val Gly Ser Ala Val Val 305 310 315 320 cac cgg tcg ctc gcc gag gag gtc gga ccg gcg ctg acg gcc cgt ctc 1008 His Arg Ser Leu Ala Glu Glu Val Gly Pro Ala Leu Thr Ala Arg Leu 325 330 335 cag cag gtg ttc ggg atg tcc gag ggc ctg ctg tgc ctc acg cgc cgc 1056 Gln Gln Val Phe Gly Met Ser Glu Gly Leu Leu Cys Leu Thr Arg Arg 340 345 350 gag gac gcg ccc gag acc gtc ctc acc acc cag ggc cgg ccc atc tcc 1104 Glu Asp Ala Pro Glu Thr Val Leu Thr Thr Gln Gly Arg Pro Ile Ser 355 360 365 ccc cac gac gaa ctg cgg gtg gtg gac gcg gcg ggc gac gag gtg gcg 1152 Pro His Asp Glu Leu Arg Val Val Asp Ala Ala Gly Asp Glu Val Ala 370 375 380 gcc ggc ggg acg ggc gag ctg ctc acc cgg ggc ccg tac acc ctg cgc 1200 Ala Gly Gly Thr Gly Glu Leu Leu Thr Arg Gly Pro Tyr Thr Leu Arg 385 390 395 400 ggc tac tac cgg gcc gag gag cac aac gcc ggg gcg ttc acc ccg gac 1248 Gly Tyr Tyr Arg Ala Glu Glu His Asn Ala Gly Ala Phe Thr Pro Asp 405 410 415 ggc ttc tac cgc acc ggc gac ctg gtg cgg atc acc gac gac ggc ggc 1296 Gly Phe Tyr Arg Thr Gly Asp Leu Val Arg Ile Thr Asp Asp Gly Gly 420 425 430 gtc gtg gtg atg ggc cgc gcg aag gac gtc atc gtc cgc ggc ggc gac 1344 Val Val Val Met Gly Arg Ala Lys Asp Val Ile Val Arg Gly Gly Asp 435 440 445 aag gtg tcc gcc ccc gag ctg gag ggc cac ctc acc ggc cac gag cgg 1392 Lys Val Ser Ala Pro Glu Leu Glu Gly His Leu Thr Gly His Glu Arg 450 455 460 atc gac cag gcc gcc gtg gtg ccg atg gcc gac gcc gtc ctc ggc gag 1440 Ile Asp Gln Ala Ala Val Val Pro Met Ala Asp Ala Val Leu Gly Glu 465 470 475 480 cgc acc tgc gcc gtg atc atc ccg gtc ggc acg ccc ccg acc ctg ggc 1488 Arg Thr Cys Ala Val Ile Ile Pro Val Gly Thr Pro Pro Thr Leu Gly 485 490 495 gag ctg cgc cgc tac ctg cgc gac cgc ggg ctg gcg tcc tac aag ttc 1536 Glu Leu Arg Arg Tyr Leu Arg Asp Arg Gly Leu Ala Ser Tyr Lys Phe 500 505 510 ccc gac cgg gtc gtg tgc gtc gag gcg ttc ccc aag agc ggc ctc ggc 1584 Pro Asp Arg Val Val Cys Val Glu Ala Phe Pro Lys Ser Gly Leu Gly 515 520 525 aag gtc gac aag aag cgc ctc gtg gcc gac ctc ggc ctc gac gcg ccg 1632 Lys Val Asp Lys Lys Arg Leu Val Ala Asp Leu Gly Leu Asp Ala Pro 530 535 540 ccg ggc ccg gac gcc gcc ggg tcc gac ccc gag ccg gcc ggt gcc cgc 1680 Pro Gly Pro Asp Ala Ala Gly Ser Asp Pro Glu Pro Ala Gly Ala Arg 545 550 555 560 tcg tga 1686 Ser <210> 13 <211> 561 <212> PRT <213> Streptoverticillium <400> 13 Met Pro Leu Leu Asp Gly Leu Asp Gly Leu Asp Gly Phe Val Pro Trp 1 5 10 15 Pro Ala Glu Thr Ala Glu Arg Tyr Arg Ala Asp Gly Thr Trp Ala Gly 20 25 30 Glu Pro Leu Gly Glu Leu Leu Arg Ser Gln Ala Ala Arg Thr Pro Asp 35 40 45 Asn Val Ala Leu Ile Asp Gly Glu Arg Ser Phe Thr Tyr Ala Ala Leu 50 55 60 Asp Arg Trp Ala Asp Arg Leu Ala Ala Gly Phe Ser Ala Ala Gly Leu 65 70 75 80 Arg Ala Gly Asp Arg Ala Val Leu Gln Leu Pro Asn Val Ala Glu His 85 90 95 Val Ala Val Ser Phe Ala Phe Phe Arg Ile Gly Val Leu Pro Val Phe 100 105 110 Thr Leu Pro Asn His Arg Met Ala Glu Leu Asp His Ile Cys Gly Leu 115 120 125 Thr Gly Ala Ser Ala Tyr Val Thr Leu Asp Arg Phe Leu Gly Phe Asp 130 135 140 His Arg Gly Leu Ala Arg Ser Leu Arg Glu Arg His Ala Ser Leu Arg 145 150 155 160 His Val Phe Val Val Gly Asp Pro Gly Glu Phe Ala Pro Leu Pro Glu 165 170 175 Ala Glu Thr Pro Leu Asp Pro Ala Gly Ala Thr Gly Pro Asp Ala Ser 180 185 190 Asp Val Ala Phe Phe Leu Leu Ser Gly Gly Thr Thr Ala Leu Pro Lys 195 200 205 Leu Ile Pro Arg Thr His Asp Asp Tyr Leu Tyr Gln Ala Arg Thr Ala 210 215 220 Ala Gly Ile Cys Glu Tyr Ser Glu Asp Thr Arg Tyr Leu Ala Thr Leu 225 230 235 240 Pro Ile Ala Phe Asn Phe Thr Trp Gly Cys Pro Gly Val Val Gly Val 245 250 255 Phe Ala Asn Gly Gly Ala Val Val Leu Ser Thr Val Pro Asp Pro Gln 260 265 270 Val Cys Phe Pro Leu Ile Ala Arg His Gly Val Thr Thr Thr Ser Val 275 280 285 Val Pro Thr Ile Ala His Ser Trp Ile Ala Ala Ala Asp Gly Arg Arg 290 295 300 Glu Glu Leu Ala Thr Leu Glu Leu Val Gln Val Gly Ser Ala Val Val 305 310 315 320 His Arg Ser Leu Ala Glu Glu Val Gly Pro Ala Leu Thr Ala Arg Leu 325 330 335 Gln Gln Val Phe Gly Met Ser Glu Gly Leu Leu Cys Leu Thr Arg Arg 340 345 350 Glu Asp Ala Pro Glu Thr Val Leu Thr Thr Gln Gly Arg Pro Ile Ser 355 360 365 Pro His Asp Glu Leu Arg Val Val Asp Ala Ala Gly Asp Glu Val Ala 370 375 380 Ala Gly Gly Thr Gly Glu Leu Leu Thr Arg Gly Pro Tyr Thr Leu Arg 385 390 395 400 Gly Tyr Tyr Arg Ala Glu Glu His Asn Ala Gly Ala Phe Thr Pro Asp 405 410 415 Gly Phe Tyr Arg Thr Gly Asp Leu Val Arg Ile Thr Asp Asp Gly Gly 420 425 430 Val Val Val Met Gly Arg Ala Lys Asp Val Ile Val Arg Gly Gly Asp 435 440 445 Lys Val Ser Ala Pro Glu Leu Glu Gly His Leu Thr Gly His Glu Arg 450 455 460 Ile Asp Gln Ala Ala Val Val Pro Met Ala Asp Ala Val Leu Gly Glu 465 470 475 480 Arg Thr Cys Ala Val Ile Ile Pro Val Gly Thr Pro Pro Thr Leu Gly 485 490 495 Glu Leu Arg Arg Tyr Leu Arg Asp Arg Gly Leu Ala Ser Tyr Lys Phe 500 505 510 Pro Asp Arg Val Val Cys Val Glu Ala Phe Pro Lys Ser Gly Leu Gly 515 520 525 Lys Val Asp Lys Lys Arg Leu Val Ala Asp Leu Gly Leu Asp Ala Pro 530 535 540 Pro Gly Pro Asp Ala Ala Gly Ser Asp Pro Glu Pro Ala Gly Ala Arg 545 550 555 560 Ser <210> 14 <211> 1248 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1248) <223> <400> 14 atg acc gtc gac gag gct tcg gcg cac gag ggc cgc ctg ccg gcc ttc 48 Met Thr Val Asp Glu Ala Ser Ala His Glu Gly Arg Leu Pro Ala Phe 1 5 10 15 gag gtg ttc gac cag ggc ttc aag acc gat ccg tac ccg tgg tac cgc 96 Glu Val Phe Asp Gln Gly Phe Lys Thr Asp Pro Tyr Pro Trp Tyr Arg 20 25 30 aag ctg cgc gag gcg gcg ccg atc cac cgg gta cgg atg acc ctg ggc 144 Lys Leu Arg Glu Ala Ala Pro Ile His Arg Val Arg Met Thr Leu Gly 35 40 45 gcg gac gtg tgg ctg gtg acc ggc tac gag ctg gcg aag acc gtg ctc 192 Ala Asp Val Trp Leu Val Thr Gly Tyr Glu Leu Ala Lys Thr Val Leu 50 55 60 gcg gac ggc cgg ttc tcc aag atg acc gtc aac gcc gag cgc gcg tgg 240 Ala Asp Gly Arg Phe Ser Lys Met Thr Val Asn Ala Glu Arg Ala Trp 65 70 75 80 cgc tcc ctg gag ctc atc ccg gac gac ccc gac gcc ctg gtc aac cgg 288 Arg Ser Leu Glu Leu Ile Pro Asp Asp Pro Asp Ala Leu Val Asn Arg 85 90 95 atg ctg ctg atg agc gat ccg ccc gac cac gag cgc ctc cgc cgc ctg 336 Met Leu Leu Met Ser Asp Pro Pro Asp His Glu Arg Leu Arg Arg Leu 100 105 110 gtg tcc cgg gcg ttc acg gcg cgc tcg atg gag gcg atg cgg ccc cgc 384 Val Ser Arg Ala Phe Thr Ala Arg Ser Met Glu Ala Met Arg Pro Arg 115 120 125 atc gcc gag gtc gcc gac gaa ctc gtc gca cgg ttc gcc ggc cgg ggc 432 Ile Ala Glu Val Ala Asp Glu Leu Val Ala Arg Phe Ala Gly Arg Gly 130 135 140 cgc gtc gac ctc atc cgc gag ttc gcg ttc ccg ctg ccc gcc atg atc 480 Arg Val Asp Leu Ile Arg Glu Phe Ala Phe Pro Leu Pro Ala Met Ile 145 150 155 160 atc tgc gat ctg ctc ggc gtc ccc gcc gaa cac cgc acc cgg ttc gag 528 Ile Cys Asp Leu Leu Gly Val Pro Ala Glu His Arg Thr Arg Phe Glu 165 170 175 gag tac ctg cgg ctg ctc tgc ctg gcc gaa ccc gag gac gtc cac cgg 576 Glu Tyr Leu Arg Leu Leu Cys Leu Ala Glu Pro Glu Asp Val His Arg 180 185 190 atg ccc gcc gtc ttc gcc gaa ctc acg gcg gaa ctc gcc gag ttg gtc 624 Met Pro Ala Val Phe Ala Glu Leu Thr Ala Glu Leu Ala Glu Leu Val 195 200 205 gag cgc aag cgg gcc gag ccc gac ggg cac ctg ctc tcc gcg ctg gtc 672 Glu Arg Lys Arg Ala Glu Pro Asp Gly His Leu Leu Ser Ala Leu Val 210 215 220 ggg atc cgg gac ggc agc gac cgg ctc acc gac gac gaa ctg gtc tcc 720 Gly Ile Arg Asp Gly Ser Asp Arg Leu Thr Asp Asp Glu Leu Val Ser 225 230 235 240 atg gcc ttc cag ctc atg tac ggc gcc cag gac acc acc gtc aac ctc 768 Met Ala Phe Gln Leu Met Tyr Gly Ala Gln Asp Thr Thr Val Asn Leu 245 250 255 atc ggc aac ggc atg ctc gcc ctg ctg gac aac ccc gcc gcc atg gcc 816 Ile Gly Asn Gly Met Leu Ala Leu Leu Asp Asn Pro Ala Ala Met Ala 260 265 270 gaa ctg cgg gag aac ccg gag ctc atc ccg ggc gcc gtc gag gag atc 864 Glu Leu Arg Glu Asn Pro Glu Leu Ile Pro Gly Ala Val Glu Glu Ile 275 280 285 ctc cgc ttc gac ccg ccg gtg gag acc gcc acc ccg cgg tac gcc ctg 912 Leu Arg Phe Asp Pro Pro Val Glu Thr Ala Thr Pro Arg Tyr Ala Leu 290 295 300 gaa ccg ctc gac gtc ggc ggg atg cgc gtg gag aag ggc ggg gtc gtg 960 Glu Pro Leu Asp Val Gly Gly Met Arg Val Glu Lys Gly Gly Val Val 305 310 315 320 ctc gtc tcc ctc gcg agc gcc tcc cgc gac ccc ggg cag ttc gag gac 1008 Leu Val Ser Leu Ala Ser Ala Ser Arg Asp Pro Gly Gln Phe Glu Asp 325 330 335 ccc gac gtc ttc gac atc cac cgc gag gtg cgc gga cag ctc gcg ttc 1056 Pro Asp Val Phe Asp Ile His Arg Glu Val Arg Gly Gln Leu Ala Phe 340 345 350 ggg cac ggg ctg cac tac tgc ctc ggg gcc gtg atg gcc cgc gtg aag 1104 Gly His Gly Leu His Tyr Cys Leu Gly Ala Val Met Ala Arg Val Lys 355 360 365 ggc gag gtc gcc ctg cgg gcc ctg ctg tgc ggc ctg gac gac ctg cgc 1152 Gly Glu Val Ala Leu Arg Ala Leu Leu Cys Gly Leu Asp Asp Leu Arg 370 375 380 ccg gac gag gac gcc gaa ccg ctc gcg cgc cac gcc ggg ttc atc atg 1200 Pro Asp Glu Asp Ala Glu Pro Leu Ala Arg His Ala Gly Phe Ile Met 385 390 395 400 cgc ggg ctg aag gcg ctc ccc gtc cgc ttc acc ccg cgc gcc gcg tga 1248 Arg Gly Leu Lys Ala Leu Pro Val Arg Phe Thr Pro Arg Ala Ala 405 410 415 <210> 15 <211> 415 <212> PRT <213> Streptoverticillium <400> 15 Met Thr Val Asp Glu Ala Ser Ala His Glu Gly Arg Leu Pro Ala Phe 1 5 10 15 Glu Val Phe Asp Gln Gly Phe Lys Thr Asp Pro Tyr Pro Trp Tyr Arg 20 25 30 Lys Leu Arg Glu Ala Ala Pro Ile His Arg Val Arg Met Thr Leu Gly 35 40 45 Ala Asp Val Trp Leu Val Thr Gly Tyr Glu Leu Ala Lys Thr Val Leu 50 55 60 Ala Asp Gly Arg Phe Ser Lys Met Thr Val Asn Ala Glu Arg Ala Trp 65 70 75 80 Arg Ser Leu Glu Leu Ile Pro Asp Asp Pro Asp Ala Leu Val Asn Arg 85 90 95 Met Leu Leu Met Ser Asp Pro Pro Asp His Glu Arg Leu Arg Arg Leu 100 105 110 Val Ser Arg Ala Phe Thr Ala Arg Ser Met Glu Ala Met Arg Pro Arg 115 120 125 Ile Ala Glu Val Ala Asp Glu Leu Val Ala Arg Phe Ala Gly Arg Gly 130 135 140 Arg Val Asp Leu Ile Arg Glu Phe Ala Phe Pro Leu Pro Ala Met Ile 145 150 155 160 Ile Cys Asp Leu Leu Gly Val Pro Ala Glu His Arg Thr Arg Phe Glu 165 170 175 Glu Tyr Leu Arg Leu Leu Cys Leu Ala Glu Pro Glu Asp Val His Arg 180 185 190 Met Pro Ala Val Phe Ala Glu Leu Thr Ala Glu Leu Ala Glu Leu Val 195 200 205 Glu Arg Lys Arg Ala Glu Pro Asp Gly His Leu Leu Ser Ala Leu Val 210 215 220 Gly Ile Arg Asp Gly Ser Asp Arg Leu Thr Asp Asp Glu Leu Val Ser 225 230 235 240 Met Ala Phe Gln Leu Met Tyr Gly Ala Gln Asp Thr Thr Val Asn Leu 245 250 255 Ile Gly Asn Gly Met Leu Ala Leu Leu Asp Asn Pro Ala Ala Met Ala 260 265 270 Glu Leu Arg Glu Asn Pro Glu Leu Ile Pro Gly Ala Val Glu Glu Ile 275 280 285 Leu Arg Phe Asp Pro Pro Val Glu Thr Ala Thr Pro Arg Tyr Ala Leu 290 295 300 Glu Pro Leu Asp Val Gly Gly Met Arg Val Glu Lys Gly Gly Val Val 305 310 315 320 Leu Val Ser Leu Ala Ser Ala Ser Arg Asp Pro Gly Gln Phe Glu Asp 325 330 335 Pro Asp Val Phe Asp Ile His Arg Glu Val Arg Gly Gln Leu Ala Phe 340 345 350 Gly His Gly Leu His Tyr Cys Leu Gly Ala Val Met Ala Arg Val Lys 355 360 365 Gly Glu Val Ala Leu Arg Ala Leu Leu Cys Gly Leu Asp Asp Leu Arg 370 375 380 Pro Asp Glu Asp Ala Glu Pro Leu Ala Arg His Ala Gly Phe Ile Met 385 390 395 400 Arg Gly Leu Lys Ala Leu Pro Val Arg Phe Thr Pro Arg Ala Ala 405 410 415 <210> 16 <211> 546 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(546) <223> <400> 16 atg gcc gac ctg ctc ctc ccc ggc gtc ctc gaa gcg gcc gac cgc ccg 48 Met Ala Asp Leu Leu Leu Pro Gly Val Leu Glu Ala Ala Asp Arg Pro 1 5 10 15 ttc gtc ttc tac ggc cac tcg ctc ggc gcg cgc gtc gcc tac gag acg 96 Phe Val Phe Tyr Gly His Ser Leu Gly Ala Arg Val Ala Tyr Glu Thr 20 25 30 gcc cac cgc ctc gcg gac acc ggc cgg ccg ctg ccc gcc gcg ctc tgc 144 Ala His Arg Leu Ala Asp Thr Gly Arg Pro Leu Pro Ala Ala Leu Cys 35 40 45 gtc tcc ggg gcg ccc gcc ccg gcc ctc ggc gtc cac acc ccg tgc cac 192 Val Ser Gly Ala Pro Ala Pro Ala Leu Gly Val His Thr Pro Cys His 50 55 60 gac cag ccc cgc gcg gaa ttc ctc cgc acc ctg cgg gcg atg ggc ggc 240 Asp Gln Pro Arg Ala Glu Phe Leu Arg Thr Leu Arg Ala Met Gly Gly 65 70 75 80 gtc gcc ccg gag gtg ctc gcc gac gag gag ctg tgc gac tac gtc ctg 288 Val Ala Pro Glu Val Leu Ala Asp Glu Glu Leu Cys Asp Tyr Val Leu 85 90 95 ccg gtc atc cgc gcc gac atg cgg gcc gcc gag aca tac cgg cca ccg 336 Pro Val Ile Arg Ala Asp Met Arg Ala Ala Glu Thr Tyr Arg Pro Pro 100 105 110 cgc cgg acc ccg ctg cgc aca ccg atc agg gcg ctc gcc gga cgg gac 384 Arg Arg Thr Pro Leu Arg Thr Pro Ile Arg Ala Leu Ala Gly Arg Asp 115 120 125 gac ccc cgg gtg ccg gtg gag cac gtg cgg cgg tgg tcg gac gag gcc 432 Asp Pro Arg Val Pro Val Glu His Val Arg Arg Trp Ser Asp Glu Ala 130 135 140 ggt ggg gag ttc cgc tgc acg gtc ttc gag gga ggc cac ttc ttc ttc 480 Gly Gly Glu Phe Arg Cys Thr Val Phe Glu Gly Gly His Phe Phe Phe 145 150 155 160 cgt gac cac ccg tcg gag gtc gcc gcg gtg ttg gac ggc ctg ctg cgg 528 Arg Asp His Pro Ser Glu Val Ala Ala Val Leu Asp Gly Leu Leu Arg 165 170 175 gaa gtc gcc ggg gga tag 546 Glu Val Ala Gly Gly 180 <210> 17 <211> 181 <212> PRT <213> Streptoverticillium <400> 17 Met Ala Asp Leu Leu Leu Pro Gly Val Leu Glu Ala Ala Asp Arg Pro 1 5 10 15 Phe Val Phe Tyr Gly His Ser Leu Gly Ala Arg Val Ala Tyr Glu Thr 20 25 30 Ala His Arg Leu Ala Asp Thr Gly Arg Pro Leu Pro Ala Ala Leu Cys 35 40 45 Val Ser Gly Ala Pro Ala Pro Ala Leu Gly Val His Thr Pro Cys His 50 55 60 Asp Gln Pro Arg Ala Glu Phe Leu Arg Thr Leu Arg Ala Met Gly Gly 65 70 75 80 Val Ala Pro Glu Val Leu Ala Asp Glu Glu Leu Cys Asp Tyr Val Leu 85 90 95 Pro Val Ile Arg Ala Asp Met Arg Ala Ala Glu Thr Tyr Arg Pro Pro 100 105 110 Arg Arg Thr Pro Leu Arg Thr Pro Ile Arg Ala Leu Ala Gly Arg Asp 115 120 125 Asp Pro Arg Val Pro Val Glu His Val Arg Arg Trp Ser Asp Glu Ala 130 135 140 Gly Gly Glu Phe Arg Cys Thr Val Phe Glu Gly Gly His Phe Phe Phe 145 150 155 160 Arg Asp His Pro Ser Glu Val Ala Ala Val Leu Asp Gly Leu Leu Arg 165 170 175 Glu Val Ala Gly Gly 180 <210> 18 <211> 531 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(531) <223> <400> 18 atg gac ccg gtg acc ctt cgg acc gac cgc ctg gtg ctg cgg gcc ttc 48 Met Asp Pro Val Thr Leu Arg Thr Asp Arg Leu Val Leu Arg Ala Phe 1 5 10 15 acg cct gcc gac gtg gat gcg gtg tac gag gcc tgc cag gac gag gac 96 Thr Pro Ala Asp Val Asp Ala Val Tyr Glu Ala Cys Gln Asp Glu Asp 20 25 30 atc cag ctc tac acc ccg gtg ccg gtg ccg tac ctg cgt gcg gac gcg 144 Ile Gln Leu Tyr Thr Pro Val Pro Val Pro Tyr Leu Arg Ala Asp Ala 35 40 45 gag aag ctc gtc ggc gag aag ctg ccc gcc cag tgg gcc gcg gac gag 192 Glu Lys Leu Val Gly Glu Lys Leu Pro Ala Gln Trp Ala Ala Asp Glu 50 55 60 gac tac acc ttc ggc gcg ttc cgc gag gac acc ggc gcc ctg gcc ggc 240 Asp Tyr Thr Phe Gly Ala Phe Arg Glu Asp Thr Gly Ala Leu Ala Gly 65 70 75 80 tcg tac tgc ctg acc cgc gtc agc cgc ggc gtc tgg gag ctc ggc tac 288 Ser Tyr Cys Leu Thr Arg Val Ser Arg Gly Val Trp Glu Leu Gly Tyr 85 90 95 tgg gcg gtc aag gag cag cgc ggt cac ggg tat tcg gtg gag gcc gcc 336 Trp Ala Val Lys Glu Gln Arg Gly His Gly Tyr Ser Val Glu Ala Ala 100 105 110 cga gcc ctg tgc gac tgg gga tgg gcc acg ctc gac gtg cac cgc atc 384 Arg Ala Leu Cys Asp Trp Gly Trp Ala Thr Leu Asp Val His Arg Ile 115 120 125 gag tgg tgg gcc atg gtc ggg aac gcc ggc tcg cgt gcc gtc gcc gag 432 Glu Trp Trp Ala Met Val Gly Asn Ala Gly Ser Arg Ala Val Ala Glu 130 135 140 aga ctc ggc ttc acc gtc gag ggg aca ctg cgc aag cgc ggc atc gcc 480 Arg Leu Gly Phe Thr Val Glu Gly Thr Leu Arg Lys Arg Gly Ile Ala 145 150 155 160 aac gac ggc gta ccg cac gac tgg tgg gtg ggc gga ctg ctg cgg ccc 528 Asn Asp Gly Val Pro His Asp Trp Trp Val Gly Gly Leu Leu Arg Pro 165 170 175 tga 531 <210> 19 <211> 176 <212> PRT <213> Streptoverticillium <400> 19 Met Asp Pro Val Thr Leu Arg Thr Asp Arg Leu Val Leu Arg Ala Phe 1 5 10 15 Thr Pro Ala Asp Val Asp Ala Val Tyr Glu Ala Cys Gln Asp Glu Asp 20 25 30 Ile Gln Leu Tyr Thr Pro Val Pro Val Pro Tyr Leu Arg Ala Asp Ala 35 40 45 Glu Lys Leu Val Gly Glu Lys Leu Pro Ala Gln Trp Ala Ala Asp Glu 50 55 60 Asp Tyr Thr Phe Gly Ala Phe Arg Glu Asp Thr Gly Ala Leu Ala Gly 65 70 75 80 Ser Tyr Cys Leu Thr Arg Val Ser Arg Gly Val Trp Glu Leu Gly Tyr 85 90 95 Trp Ala Val Lys Glu Gln Arg Gly His Gly Tyr Ser Val Glu Ala Ala 100 105 110 Arg Ala Leu Cys Asp Trp Gly Trp Ala Thr Leu Asp Val His Arg Ile 115 120 125 Glu Trp Trp Ala Met Val Gly Asn Ala Gly Ser Arg Ala Val Ala Glu 130 135 140 Arg Leu Gly Phe Thr Val Glu Gly Thr Leu Arg Lys Arg Gly Ile Ala 145 150 155 160 Asn Asp Gly Val Pro His Asp Trp Trp Val Gly Gly Leu Leu Arg Pro 165 170 175 <210> 20 <211> 777 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(777) <223> <400> 20 atg tca gat ccg acc gac cgc atc gcc ctg gtg acc ggg gcc ggc cgc 48 Met Ser Asp Pro Thr Asp Arg Ile Ala Leu Val Thr Gly Ala Gly Arg 1 5 10 15 ggc atc ggc cgt gcc gtc gcc gtc cgc ctc gcc gcg gag ggc gcg ctg 96 Gly Ile Gly Arg Ala Val Ala Val Arg Leu Ala Ala Glu Gly Ala Leu 20 25 30 gtc gcc gtc cac tac gga cgg gac gac gaa gcc gcg cgg tcg acg gtg 144 Val Ala Val His Tyr Gly Arg Asp Asp Glu Ala Ala Arg Ser Thr Val 35 40 45 cgg gag atc cgc gaa gcc ggc ggg tcg gcc ttc ccc gtc cgc gcg gag 192 Arg Glu Ile Arg Glu Ala Gly Gly Ser Ala Phe Pro Val Arg Ala Glu 50 55 60 ttc ggc gag ctc ggc gcc ctc gac gag ctg tgg cgc ggt tac gac gag 240 Phe Gly Glu Leu Gly Ala Leu Asp Glu Leu Trp Arg Gly Tyr Asp Glu 65 70 75 80 ggc gtc gcc gcc gtc cgc ggc ggc tcg ggt ccc gcg ccg gtg gac atc 288 Gly Val Ala Ala Val Arg Gly Gly Ser Gly Pro Ala Pro Val Asp Ile 85 90 95 ctc gtg aac aac gcc ggg atc acc gtc ccg cgt ggc gta cgg gac ctc 336 Leu Val Asn Asn Ala Gly Ile Thr Val Pro Arg Gly Val Arg Asp Leu 100 105 110 gaa gag gcc gac tgg gac cgg ctg ttc gcg gtc aac gcc aag gcc ccg 384 Glu Glu Ala Asp Trp Asp Arg Leu Phe Ala Val Asn Ala Lys Ala Pro 115 120 125 ttc ttc ctg gtg cag ggc gcg ctg ccg cgg ctg cgc gac ggg ggc cgg 432 Phe Phe Leu Val Gln Gly Ala Leu Pro Arg Leu Arg Asp Gly Gly Arg 130 135 140 atc gtc aac gtc acc acc gcc gcg acc cgg gtg gcg atg ccg gtg atc 480 Ile Val Asn Val Thr Thr Ala Ala Thr Arg Val Ala Met Pro Val Ile 145 150 155 160 gcc gcg tac acc atg acc aag gcg gcg ctg gag acc ttc acc gtc gac 528 Ala Ala Tyr Thr Met Thr Lys Ala Ala Leu Glu Thr Phe Thr Val Asp 165 170 175 ctc gcc ctg gag ctg ggg ccg cgc ggc atc acc gtc aac gcg gtc gcc 576 Leu Ala Leu Glu Leu Gly Pro Arg Gly Ile Thr Val Asn Ala Val Ala 180 185 190 ccg ggg tac acc gac acc gac atc aac ccg gac atg aag gtg ccc gcc 624 Pro Gly Tyr Thr Asp Thr Asp Ile Asn Pro Asp Met Lys Val Pro Ala 195 200 205 cag cgc gag gcc atg gcc gcc acc acc gca ctc cac cgg gtc ggt acg 672 Gln Arg Glu Ala Met Ala Ala Thr Thr Ala Leu His Arg Val Gly Thr 210 215 220 ccc ggc gag gtc gcc gac gtc gtc gcc tac ctg gcg gga ccg ggc ggc 720 Pro Gly Glu Val Ala Asp Val Val Ala Tyr Leu Ala Gly Pro Gly Gly 225 230 235 240 cgc tgg gtc acc ggg cag cgc atc gag gcg tcg ggg ggc gtc cgg ctc 768 Arg Trp Val Thr Gly Gln Arg Ile Glu Ala Ser Gly Gly Val Arg Leu 245 250 255 gga ctc tag 777 Gly Leu <210> 21 <211> 258 <212> PRT <213> Streptoverticillium <400> 21 Met Ser Asp Pro Thr Asp Arg Ile Ala Leu Val Thr Gly Ala Gly Arg 1 5 10 15 Gly Ile Gly Arg Ala Val Ala Val Arg Leu Ala Ala Glu Gly Ala Leu 20 25 30 Val Ala Val His Tyr Gly Arg Asp Asp Glu Ala Ala Arg Ser Thr Val 35 40 45 Arg Glu Ile Arg Glu Ala Gly Gly Ser Ala Phe Pro Val Arg Ala Glu 50 55 60 Phe Gly Glu Leu Gly Ala Leu Asp Glu Leu Trp Arg Gly Tyr Asp Glu 65 70 75 80 Gly Val Ala Ala Val Arg Gly Gly Ser Gly Pro Ala Pro Val Asp Ile 85 90 95 Leu Val Asn Asn Ala Gly Ile Thr Val Pro Arg Gly Val Arg Asp Leu 100 105 110 Glu Glu Ala Asp Trp Asp Arg Leu Phe Ala Val Asn Ala Lys Ala Pro 115 120 125 Phe Phe Leu Val Gln Gly Ala Leu Pro Arg Leu Arg Asp Gly Gly Arg 130 135 140 Ile Val Asn Val Thr Thr Ala Ala Thr Arg Val Ala Met Pro Val Ile 145 150 155 160 Ala Ala Tyr Thr Met Thr Lys Ala Ala Leu Glu Thr Phe Thr Val Asp 165 170 175 Leu Ala Leu Glu Leu Gly Pro Arg Gly Ile Thr Val Asn Ala Val Ala 180 185 190 Pro Gly Tyr Thr Asp Thr Asp Ile Asn Pro Asp Met Lys Val Pro Ala 195 200 205 Gln Arg Glu Ala Met Ala Ala Thr Thr Ala Leu His Arg Val Gly Thr 210 215 220 Pro Gly Glu Val Ala Asp Val Val Ala Tyr Leu Ala Gly Pro Gly Gly 225 230 235 240 Arg Trp Val Thr Gly Gln Arg Ile Glu Ala Ser Gly Gly Val Arg Leu 245 250 255 Gly Leu <210> 22 <211> 1302 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1302) <223> <400> 22 atg ccc gac tcc ctc cgt ccc ctc tgc cca ctt gag gag ctg cac gtc 48 Met Pro Asp Ser Leu Arg Pro Leu Cys Pro Leu Glu Glu Leu His Val 1 5 10 15 ggc gac cgc agc cgg gcg gtg gtc acc gtc gag gtc gag ggc gac ctc 96 Gly Asp Arg Ser Arg Ala Val Val Thr Val Glu Val Glu Gly Asp Leu 20 25 30 gac ctc gac gtg ctg tcc gcg gcc tgg tcg cgg acg ctc gac gcg cat 144 Asp Leu Asp Val Leu Ser Ala Ala Trp Ser Arg Thr Leu Asp Ala His 35 40 45 ccg acg gcg gac agc cgg atc gtg tcg cac ggc ggc ggt ttc gcc ctc 192 Pro Thr Ala Asp Ser Arg Ile Val Ser His Gly Gly Gly Phe Ala Leu 50 55 60 gaa cgg ctg ggg gcg gcc ggc cgc ccg ggc ctg gcc gaa ccg gcg ccc 240 Glu Arg Leu Gly Ala Ala Gly Arg Pro Gly Leu Ala Glu Pro Ala Pro 65 70 75 80 gag aag gac gtg atg acg gag atc gcc acg tcc ccc ttg ccc gtc ggc 288 Glu Lys Asp Val Met Thr Glu Ile Ala Thr Ser Pro Leu Pro Val Gly 85 90 95 ggc ccg gtc gcg cgg ctg tcg acg gcc gcg cgg ggc tcg gac acg gtc 336 Gly Pro Val Ala Arg Leu Ser Thr Ala Ala Arg Gly Ser Asp Thr Val 100 105 110 gtg ggg ctc gtc gtg gac cac gtg gtg acc gac ggc acc agc gcc ctc 384 Val Gly Leu Val Val Asp His Val Val Thr Asp Gly Thr Ser Ala Leu 115 120 125 acc ctc cac acg gaa ctc tgg cgg cac tac gcc gcg gtg ctg gcc ggc 432 Thr Leu His Thr Glu Leu Trp Arg His Tyr Ala Ala Val Leu Ala Gly 130 135 140 gaa ccg gcc cgc ccg gcg gcg acc gcg tgg ccg gcc ccg gtg tcg gag 480 Glu Pro Ala Arg Pro Ala Ala Thr Ala Trp Pro Ala Pro Val Ser Glu 145 150 155 160 cgg ctg ccg gcc gtg tcc ggg gac gcc gtc gcg gcg ctg ctc gcc gag 528 Arg Leu Pro Ala Val Ser Gly Asp Ala Val Ala Ala Leu Leu Ala Glu 165 170 175 cgc ctg gaa cag gcg cgc gac cgt ccg ccg gcg cag ttg ccg tac gtg 576 Arg Leu Glu Gln Ala Arg Asp Arg Pro Pro Ala Gln Leu Pro Tyr Val 180 185 190 gag gcg ggc ggg gac ggt gcg ccg ccg gcc ggg cgg cag ccg gtg cac 624 Glu Ala Gly Gly Asp Gly Ala Pro Pro Ala Gly Arg Gln Pro Val His 195 200 205 aac gtc cgc gtc gcc ctg tcc gcc gac agg acc ggc gaa ctc gcg gcg 672 Asn Val Arg Val Ala Leu Ser Ala Asp Arg Thr Gly Glu Leu Ala Ala 210 215 220 ggc gca cgg agg ttg ggc acc tcg gtg cac ggc gtg acc gcc gcg gcg 720 Gly Ala Arg Arg Leu Gly Thr Ser Val His Gly Val Thr Ala Ala Ala 225 230 235 240 ctg ctc ctg gcg ata cgg gag gag ctc ggc ggt tcc ggt acc gcc gcc 768 Leu Leu Leu Ala Ile Arg Glu Glu Leu Gly Gly Ser Gly Thr Ala Ala 245 250 255 ctc ggc tgc ttc tcg ccc gtg gac ctg cgc tcc cgg gtc gag ccc ccg 816 Leu Gly Cys Phe Ser Pro Val Asp Leu Arg Ser Arg Val Glu Pro Pro 260 265 270 gcg gcg gcc ggc gtg atg ctg ccg ctg gtc tcg ggg ttc ccg gac gtg 864 Ala Ala Ala Gly Val Met Leu Pro Leu Val Ser Gly Phe Pro Asp Val 275 280 285 gtg gac gtc gcg ccg ggc gag ggc ccg gag cac gtg ggt ccg ctg gcg 912 Val Asp Val Ala Pro Gly Glu Gly Pro Glu His Val Gly Pro Leu Ala 290 295 300 cgc cgg gtc acc gag ggg ctg cgc ggc gcc ctg gcc ggc gac ggc tgg 960 Arg Arg Val Thr Glu Gly Leu Arg Gly Ala Leu Ala Gly Asp Gly Trp 305 310 315 320 gcc gtg gag acc gct ctg ctc gcc cgc ctc gtc gac cac ccg gag ctg 1008 Ala Val Glu Thr Ala Leu Leu Ala Arg Leu Val Asp His Pro Glu Leu 325 330 335 ctg gcc acc acc gtg atc gtg tcg aac atg ggc cgg atc gcc ggc ccg 1056 Leu Ala Thr Thr Val Ile Val Ser Asn Met Gly Arg Ile Ala Gly Pro 340 345 350 gtg tcc ccg ccc ggg ctg cgg ctg cgc gac acc cgg ctg acg gcc gga 1104 Val Ser Pro Pro Gly Leu Arg Leu Arg Asp Thr Arg Leu Thr Ala Gly 355 360 365 cgc gag gac tac ggc ccc ggg ttc ggg cag ggt ccg ctc ttc gcc tgt 1152 Arg Glu Asp Tyr Gly Pro Gly Phe Gly Gln Gly Pro Leu Phe Ala Cys 370 375 380 gtc agc acc gtg gac ggc gcg ttc tcg ctg gag atc ccg tac acc ccc 1200 Val Ser Thr Val Asp Gly Ala Phe Ser Leu Glu Ile Pro Tyr Thr Pro 385 390 395 400 gtc tgc tcc ccg ccc gcc cag atc gag cgg gtg cgg gcg cgg acg ctg 1248 Val Cys Ser Pro Pro Ala Gln Ile Glu Arg Val Arg Ala Arg Thr Leu 405 410 415 gcg acg ctg gag cgg gtc gcg gac gcc ggg gcg cgt gcc gcg ctg tcc 1296 Ala Thr Leu Glu Arg Val Ala Asp Ala Gly Ala Arg Ala Ala Leu Ser 420 425 430 gtc tga 1302 Val <210> 23 <211> 433 <212> PRT <213> Streptoverticillium <400> 23 Met Pro Asp Ser Leu Arg Pro Leu Cys Pro Leu Glu Glu Leu His Val 1 5 10 15 Gly Asp Arg Ser Arg Ala Val Val Thr Val Glu Val Glu Gly Asp Leu 20 25 30 Asp Leu Asp Val Leu Ser Ala Ala Trp Ser Arg Thr Leu Asp Ala His 35 40 45 Pro Thr Ala Asp Ser Arg Ile Val Ser His Gly Gly Gly Phe Ala Leu 50 55 60 Glu Arg Leu Gly Ala Ala Gly Arg Pro Gly Leu Ala Glu Pro Ala Pro 65 70 75 80 Glu Lys Asp Val Met Thr Glu Ile Ala Thr Ser Pro Leu Pro Val Gly 85 90 95 Gly Pro Val Ala Arg Leu Ser Thr Ala Ala Arg Gly Ser Asp Thr Val 100 105 110 Val Gly Leu Val Val Asp His Val Val Thr Asp Gly Thr Ser Ala Leu 115 120 125 Thr Leu His Thr Glu Leu Trp Arg His Tyr Ala Ala Val Leu Ala Gly 130 135 140 Glu Pro Ala Arg Pro Ala Ala Thr Ala Trp Pro Ala Pro Val Ser Glu 145 150 155 160 Arg Leu Pro Ala Val Ser Gly Asp Ala Val Ala Ala Leu Leu Ala Glu 165 170 175 Arg Leu Glu Gln Ala Arg Asp Arg Pro Pro Ala Gln Leu Pro Tyr Val 180 185 190 Glu Ala Gly Gly Asp Gly Ala Pro Pro Ala Gly Arg Gln Pro Val His 195 200 205 Asn Val Arg Val Ala Leu Ser Ala Asp Arg Thr Gly Glu Leu Ala Ala 210 215 220 Gly Ala Arg Arg Leu Gly Thr Ser Val His Gly Val Thr Ala Ala Ala 225 230 235 240 Leu Leu Leu Ala Ile Arg Glu Glu Leu Gly Gly Ser Gly Thr Ala Ala 245 250 255 Leu Gly Cys Phe Ser Pro Val Asp Leu Arg Ser Arg Val Glu Pro Pro 260 265 270 Ala Ala Ala Gly Val Met Leu Pro Leu Val Ser Gly Phe Pro Asp Val 275 280 285 Val Asp Val Ala Pro Gly Glu Gly Pro Glu His Val Gly Pro Leu Ala 290 295 300 Arg Arg Val Thr Glu Gly Leu Arg Gly Ala Leu Ala Gly Asp Gly Trp 305 310 315 320 Ala Val Glu Thr Ala Leu Leu Ala Arg Leu Val Asp His Pro Glu Leu 325 330 335 Leu Ala Thr Thr Val Ile Val Ser Asn Met Gly Arg Ile Ala Gly Pro 340 345 350 Val Ser Pro Pro Gly Leu Arg Leu Arg Asp Thr Arg Leu Thr Ala Gly 355 360 365 Arg Glu Asp Tyr Gly Pro Gly Phe Gly Gln Gly Pro Leu Phe Ala Cys 370 375 380 Val Ser Thr Val Asp Gly Ala Phe Ser Leu Glu Ile Pro Tyr Thr Pro 385 390 395 400 Val Cys Ser Pro Pro Ala Gln Ile Glu Arg Val Arg Ala Arg Thr Leu 405 410 415 Ala Thr Leu Glu Arg Val Ala Asp Ala Gly Ala Arg Ala Ala Leu Ser 420 425 430 Val <210> 24 <211> 3831 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(3831) <223> <400> 24 atg gcg acg gag ccg ctg gcc gtc gtc ggg atg gcc ggc cgg ttc ccg 48 Met Ala Thr Glu Pro Leu Ala Val Val Gly Met Ala Gly Arg Phe Pro 1 5 10 15 ggc gcg aac acg ctg gag gag ttc tgg gcg ctg ctg agc gag ggc cgg 96 Gly Ala Asn Thr Leu Glu Glu Phe Trp Ala Leu Leu Ser Glu Gly Arg 20 25 30 cag ggc gtc cgg gag gtg acg gag gag gag ttc ctg gcc gcc ggg ggc 144 Gln Gly Val Arg Glu Val Thr Glu Glu Glu Phe Leu Ala Ala Gly Gly 35 40 45 gat ccg gcg gac ctg gag gac ccg tcc ctg gtc cgc gtg gcg gcg gtg 192 Asp Pro Ala Asp Leu Glu Asp Pro Ser Leu Val Arg Val Ala Ala Val 50 55 60 ctg ccc gac gcc gac cgc ttc gac gcc gcg ttc ttc ggc tac ggc ccg 240 Leu Pro Asp Ala Asp Arg Phe Asp Ala Ala Phe Phe Gly Tyr Gly Pro 65 70 75 80 gcc gag gcc gaa ctc atc gac ccg cag cag cgg gtg ctc ctg gag acc 288 Ala Glu Ala Glu Leu Ile Asp Pro Gln Gln Arg Val Leu Leu Glu Thr 85 90 95 gcc tac cac gcg ctg gag gac gcg ggg tac gcg gac ggc cac ggc gac 336 Ala Tyr His Ala Leu Glu Asp Ala Gly Tyr Ala Asp Gly His Gly Asp 100 105 110 cgc gtc gtc ggg gtc tac gcg ggc gcc ggc gac agc cgc tac tac tcc 384 Arg Val Val Gly Val Tyr Ala Gly Ala Gly Asp Ser Arg Tyr Tyr Ser 115 120 125 tac aac gtg cac ccg cgg cac gcc ggc gag ccc gcc tcc gtg ggt ctg 432 Tyr Asn Val His Pro Arg His Ala Gly Glu Pro Ala Ser Val Gly Leu 130 135 140 atc cac gcg gcc acc gcc aac tcc ctt ggc acg ctc gcc act cgg ctg 480 Ile His Ala Ala Thr Ala Asn Ser Leu Gly Thr Leu Ala Thr Arg Leu 145 150 155 160 tcg tac gac ctg gag ctg acg ggc ccg agc gtc tcg atg aac acg gcc 528 Ser Tyr Asp Leu Glu Leu Thr Gly Pro Ser Val Ser Met Asn Thr Ala 165 170 175 tgc tcg acc gcg ctc gtc gcc gtg cac acc gcc agc gag gcg ctg gcc 576 Cys Ser Thr Ala Leu Val Ala Val His Thr Ala Ser Glu Ala Leu Ala 180 185 190 gcg tac gcg tgc gac atc gcc gtg gtc ggc gcg gtg tcg gtg gat ccg 624 Ala Tyr Ala Cys Asp Ile Ala Val Val Gly Ala Val Ser Val Asp Pro 195 200 205 cag gcg atg ctc ggg tac cgc cac gtg ccc gac ggc ccg ctc tcc ccc 672 Gln Ala Met Leu Gly Tyr Arg His Val Pro Asp Gly Pro Leu Ser Pro 210 215 220 gac ggg gcg tgc cgg ccg ttc gcc gcg gac gcg gcg ggc acg ttc aac 720 Asp Gly Ala Cys Arg Pro Phe Ala Ala Asp Ala Ala Gly Thr Phe Asn 225 230 235 240 ggc gac ggg gcc ggc gtc ctc gtc ctg cgc cgg ctg tcc gac gcg ctg 768 Gly Asp Gly Ala Gly Val Leu Val Leu Arg Arg Leu Ser Asp Ala Leu 245 250 255 gcg gac ggc gac cgg atc cgg gcc gtc atc cgg ggt tcc gcg atc aac 816 Ala Asp Gly Asp Arg Ile Arg Ala Val Ile Arg Gly Ser Ala Ile Asn 260 265 270 aac gac ggc cgg cgc aag gtc ggt ttc tcg gcc ccg agc ccg gcc ggg 864 Asn Asp Gly Arg Arg Lys Val Gly Phe Ser Ala Pro Ser Pro Ala Gly 275 280 285 cag gcg gag gtc atc gtg gcc gcc cag gtg gcg gcc ggc gtc gac gcc 912 Gln Ala Glu Val Ile Val Ala Ala Gln Val Ala Ala Gly Val Asp Ala 290 295 300 ggc tcg gtg acg tac gtc gag gcc cac ggg acc gcc acg cgc ctc ggc 960 Gly Ser Val Thr Tyr Val Glu Ala His Gly Thr Ala Thr Arg Leu Gly 305 310 315 320 gac ccg atc gag gtc gcg gcc ctc acc gag gcg ttc cgg gag tcc acc 1008 Asp Pro Ile Glu Val Ala Ala Leu Thr Glu Ala Phe Arg Glu Ser Thr 325 330 335 gac cgg cgg ggg tac tgc gcg ctc ggc tcg gtc aag ggc aac atc ggc 1056 Asp Arg Arg Gly Tyr Cys Ala Leu Gly Ser Val Lys Gly Asn Ile Gly 340 345 350 cac ctc ggc gcg gcg gcc ggg atc gcc ggc atc atc aag acc gtc ctc 1104 His Leu Gly Ala Ala Ala Gly Ile Ala Gly Ile Ile Lys Thr Val Leu 355 360 365 gcg ctc gag cac cgg gcc gtg ccg ccc acg gtg cac cac gac gcc ccg 1152 Ala Leu Glu His Arg Ala Val Pro Pro Thr Val His His Asp Ala Pro 370 375 380 aac ccc ctc atc gac ttc gcg agc ggc ccg ttc cgc gtc tcg acg gcg 1200 Asn Pro Leu Ile Asp Phe Ala Ser Gly Pro Phe Arg Val Ser Thr Ala 385 390 395 400 ctg gag ccg tgg acg gcc gac ggc ccg ctg cgc gcc gcg gtg agc gcc 1248 Leu Glu Pro Trp Thr Ala Asp Gly Pro Leu Arg Ala Ala Val Ser Ala 405 410 415 ttc ggg gtc ggg ggc acc aac gcc cac gtc gtc ctg gag gag gca ccg 1296 Phe Gly Val Gly Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro 420 425 430 cgc ctg ccg gta ccc atc ggg ccg gcg gaa gag gcg ccc ggc tgg acc 1344 Arg Leu Pro Val Pro Ile Gly Pro Ala Glu Glu Ala Pro Gly Trp Thr 435 440 445 gta ctg ccg gtg tcg gca cgc acc cgc gac gga ctc gcc ggc caa ctg 1392 Val Leu Pro Val Ser Ala Arg Thr Arg Asp Gly Leu Ala Gly Gln Leu 450 455 460 agc cgc ctc ggg cgc cac ttg gag gac aac ccg gaa ctg tcc gtg acc 1440 Ser Arg Leu Gly Arg His Leu Glu Asp Asn Pro Glu Leu Ser Val Thr 465 470 475 480 gag gtg gcg cgc gcc ctg cgc gcc cgg cgc ccg ggg ccc cac cgg cgc 1488 Glu Val Ala Arg Ala Leu Arg Ala Arg Arg Pro Gly Pro His Arg Arg 485 490 495 gcg gtc gcg gcg gcg acc gcg gcg gac gca gcg cgg gcg ctg gcc gcc 1536 Ala Val Ala Ala Ala Thr Ala Ala Asp Ala Ala Arg Ala Leu Ala Ala 500 505 510 gcg acg gtc ccg gcg gcc ggg gcg gag agt gcg ccg gag gtg gtc ttc 1584 Ala Thr Val Pro Ala Ala Gly Ala Glu Ser Ala Pro Glu Val Val Phe 515 520 525 ctg ctg ccc ggc ggt ggc acc cag tac gtg ggg atg ggc gcg gag ctg 1632 Leu Leu Pro Gly Gly Gly Thr Gln Tyr Val Gly Met Gly Ala Glu Leu 530 535 540 tac cgc gac gac ccc gcc tac cgc gag gcc gtc gac cgg tgc gcc gcc 1680 Tyr Arg Asp Asp Pro Ala Tyr Arg Glu Ala Val Asp Arg Cys Ala Ala 545 550 555 560 atc ctt cag ccg gtc ctg gac cac gac atc cgc gtc acg ctc cac gag 1728 Ile Leu Gln Pro Val Leu Asp His Asp Ile Arg Val Thr Leu His Glu 565 570 575 cgg gcc gac cac ttc agc gtg gag tcg atg tgc gcg ctc gcg gtg gtc 1776 Arg Ala Asp His Phe Ser Val Glu Ser Met Cys Ala Leu Ala Val Val 580 585 590 gag tac gcc ttg gcc gcc tcg ctg gcg gct tcc ggg gtc cgg ccc ggc 1824 Glu Tyr Ala Leu Ala Ala Ser Leu Ala Ala Ser Gly Val Arg Pro Gly 595 600 605 gcg ctg atg ggg cac tcc ctg ggc gag tac gtg gcg gcg tgc ctc gcg 1872 Ala Leu Met Gly His Ser Leu Gly Glu Tyr Val Ala Ala Cys Leu Ala 610 615 620 ggg gtg atg acc ctg gag gag atg ctg ccg ctg ctg gtc acc cgc gtc 1920 Gly Val Met Thr Leu Glu Glu Met Leu Pro Leu Leu Val Thr Arg Val 625 630 635 640 cgg ctg atg atc tcg gcg ggc ggg gcg gcg gtc ggc gtg gcg ctg ccc 1968 Arg Leu Met Ile Ser Ala Gly Gly Ala Ala Val Gly Val Ala Leu Pro 645 650 655 gag cgg gac gtc ctc ccg ctc ctg gac ggt ggg ttg tcc ctg gcg gcg 2016 Glu Arg Asp Val Leu Pro Leu Leu Asp Gly Gly Leu Ser Leu Ala Ala 660 665 670 gtc aac tcg ccg tcc tcg tgc acg gtg ggc gga ccg gtg gag gcc gtc 2064 Val Asn Ser Pro Ser Ser Cys Thr Val Gly Gly Pro Val Glu Ala Val 675 680 685 gac gcg ctg gtc gag cgg ctc gtc gcc gac ggc gtc acc cac cgg cgg 2112 Asp Ala Leu Val Glu Arg Leu Val Ala Asp Gly Val Thr His Arg Arg 690 695 700 ctg cgg ctg ccc gcc gcc gcc cac tcc tcg atg ctc gac ccg gtc ctg 2160 Leu Arg Leu Pro Ala Ala Ala His Ser Ser Met Leu Asp Pro Val Leu 705 710 715 720 gac gac ctg gcc gcc gcc ttc cgc ggc gtc gac ctg cgc gag ccg cgc 2208 Asp Asp Leu Ala Ala Ala Phe Arg Gly Val Asp Leu Arg Glu Pro Arg 725 730 735 gtc ccg tac atc acc aac gtc acc ggc acg tgg gtc acc gcc gag cag 2256 Val Pro Tyr Ile Thr Asn Val Thr Gly Thr Trp Val Thr Ala Glu Gln 740 745 750 gcc acc tcg gtg gag cac tgg gtg gcg cac acg cgc ggc acg gtc cgc 2304 Ala Thr Ser Val Glu His Trp Val Ala His Thr Arg Gly Thr Val Arg 755 760 765 ttc gcc gac ggg gtg cgg acg ctg cgc gcc gcc tcc gcc ggg ggc gcg 2352 Phe Ala Asp Gly Val Arg Thr Leu Arg Ala Ala Ser Ala Gly Gly Ala 770 775 780 ggc ccg gtc ctc gtc gag atc ggc ccg ggg gac gtc ctg tcg cgg ctg 2400 Gly Pro Val Leu Val Glu Ile Gly Pro Gly Asp Val Leu Ser Arg Leu 785 790 795 800 gcc gcg gcc gtc gac gac ggc ggc ccg gag ccc gtc acc gtc ccg gtg 2448 Ala Ala Ala Val Asp Asp Gly Gly Pro Glu Pro Val Thr Val Pro Val 805 810 815 atg cgc cac gcg cgg gcg acc ggg ccc gac ggc cgg gtg cgg gcg gag 2496 Met Arg His Ala Arg Ala Thr Gly Pro Asp Gly Arg Val Arg Ala Glu 820 825 830 gcg ctc gcg cac ctg tgg acc gcc ggg gcc gag gtg gac atc gtc ccg 2544 Ala Leu Ala His Leu Trp Thr Ala Gly Ala Glu Val Asp Ile Val Pro 835 840 845 ccc ggc gac gcg tcg gag gag ggc acc cga ctg ccc cgg cgg tcc ctg 2592 Pro Gly Asp Ala Ser Glu Glu Gly Thr Arg Leu Pro Arg Arg Ser Leu 850 855 860 ccc gac ctg ccc ggc tac gcc ttc gcc cgc gac cgg cac tgg atc gac 2640 Pro Asp Leu Pro Gly Tyr Ala Phe Ala Arg Asp Arg His Trp Ile Asp 865 870 875 880 gcc ccc ggc gcc cgg gcg acc acg gcc ccg cac ggc gca tcc gac gac 2688 Ala Pro Gly Ala Arg Ala Thr Thr Ala Pro His Gly Ala Ser Asp Asp 885 890 895 cgc gcc ggc gac cgc gcc tcg cgc cgc gtc ccg cgt ccg ccg ctg gcc 2736 Arg Ala Gly Asp Arg Ala Ser Arg Arg Val Pro Arg Pro Pro Leu Ala 900 905 910 gtg ccg cac gtg ccg ccg ggc acc gac gcg gag cgg gcc gtg gcg gcc 2784 Val Pro His Val Pro Pro Gly Thr Asp Ala Glu Arg Ala Val Ala Ala 915 920 925 gag tgg gag gcc gtg ctc ggt gtc gac ggc atc ggg ctc gac gac aac 2832 Glu Trp Glu Ala Val Leu Gly Val Asp Gly Ile Gly Leu Asp Asp Asn 930 935 940 ttc ttc gac ctc ggc ggc gat tcg atg cgc gcc gtg ctg ctc ggc ggg 2880 Phe Phe Asp Leu Gly Gly Asp Ser Met Arg Ala Val Leu Leu Gly Gly 945 950 955 960 cgc ctg cgc acc gcg ggc gtg ctc gac gtg ccg gcc gcg gcc ctg ctc 2928 Arg Leu Arg Thr Ala Gly Val Leu Asp Val Pro Ala Ala Ala Leu Leu 965 970 975 gcc acg ccg acg atc gcc gga ctg ctc gac cgc gcc ggg cgc ggc ggg 2976 Ala Thr Pro Thr Ile Ala Gly Leu Leu Asp Arg Ala Gly Arg Gly Gly 980 985 990 gcc gtc ggg cag gag gcg ttc gcc ccc atg ctg ccg atg cgg gcc gcg 3024 Ala Val Gly Gln Glu Ala Phe Ala Pro Met Leu Pro Met Arg Ala Ala 995 1000 1005 ggg gat ctg ccg ccg ctg ttc tgc gtg cac ccg gtc agc ggc gtc 3069 Gly Asp Leu Pro Pro Leu Phe Cys Val His Pro Val Ser Gly Val 1010 1015 1020 gcc tgg cgc tac acg ggg ctg ctg ccg cac ctc gac ccg cgc cgc 3114 Ala Trp Arg Tyr Thr Gly Leu Leu Pro His Leu Asp Pro Arg Arg 1025 1030 1035 ccg gtg tac ggc ctc cag gcc ctt ggc ctg gac ggc gcc ctt ccc 3159 Pro Val Tyr Gly Leu Gln Ala Leu Gly Leu Asp Gly Ala Leu Pro 1040 1045 1050 gcc gcc ggg cgc gcc gag gac gtg atc cgg gac ggc ctg gaa cgg 3204 Ala Ala Gly Arg Ala Glu Asp Val Ile Arg Asp Gly Leu Glu Arg 1055 1060 1065 atc cgg gcc gtc cag ccc cac ggc ccg tac cac ctg ctg ggc tgg 3249 Ile Arg Ala Val Gln Pro His Gly Pro Tyr His Leu Leu Gly Trp 1070 1075 1080 tcg ttc ggc ggc gcc gtc gcc cac cgc ctg gcc gcc gcc ctg gag 3294 Ser Phe Gly Gly Ala Val Ala His Arg Leu Ala Ala Ala Leu Glu 1085 1090 1095 gcg gcc ggc gag gag gtc gcg ctg ctg acc atg ctc gac acg ccg 3339 Ala Ala Gly Glu Glu Val Ala Leu Leu Thr Met Leu Asp Thr Pro 1100 1105 1110 cag ccg gac gcg gcg gcg ctg gag ggc gag gcg gtc gag gcg cag 3384 Gln Pro Asp Ala Ala Ala Leu Glu Gly Glu Ala Val Glu Ala Gln 1115 1120 1125 gcc gcc gcc ctc gtc ctg cgg ctg gcc ggc ttg acc atg ccc gcg 3429 Ala Ala Ala Leu Val Leu Arg Leu Ala Gly Leu Thr Met Pro Ala 1130 1135 1140 ccg gcc acg gtc gac gcg tcg ctc gcg ctg ctc gac tcc tcc cgc 3474 Pro Ala Thr Val Asp Ala Ser Leu Ala Leu Leu Asp Ser Ser Arg 1145 1150 1155 cgg gac ccc gag gcg gtg ccg ggc acg ctc acg cgt gag gag gcg 3519 Arg Asp Pro Glu Ala Val Pro Gly Thr Leu Thr Arg Glu Glu Ala 1160 1165 1170 atc acc gtg gcg aag gtg gtc cgc aac aat ctg cgg atc gcc ccc 3564 Ile Thr Val Ala Lys Val Val Arg Asn Asn Leu Arg Ile Ala Pro 1175 1180 1185 gat ctg gtt ccg gaa cgg ctg cgc gcc gac atc ctc ttc gtc tcg 3609 Asp Leu Val Pro Glu Arg Leu Arg Ala Asp Ile Leu Phe Val Ser 1190 1195 1200 gcc acc gaa gtc gcc gac gac gaa ccg gag gtc gcg ggc ggg atc 3654 Ala Thr Glu Val Ala Asp Asp Glu Pro Glu Val Ala Gly Gly Ile 1205 1210 1215 gcc gac cgg gcc gcg tcc tgg cgc ccg ttc acc acc ggc acc ttc 3699 Ala Asp Arg Ala Ala Ser Trp Arg Pro Phe Thr Thr Gly Thr Phe 1220 1225 1230 gag gag gtt cct ctc gcc tgc tcc cac tac gcc ctg acc gac gcc 3744 Glu Glu Val Pro Leu Ala Cys Ser His Tyr Ala Leu Thr Asp Ala 1235 1240 1245 ggc ccg atc gag gtg att gcg aag gcg gtc gag gcg cgt ctc gcg 3789 Gly Pro Ile Glu Val Ile Ala Lys Ala Val Glu Ala Arg Leu Ala 1250 1255 1260 ggg gcc ggc gga ggg gaa cgg gcg gag gtg gcg gcc gga tga 3831 Gly Ala Gly Gly Gly Glu Arg Ala Glu Val Ala Ala Gly 1265 1270 1275 <210> 25 <211> 1276 <212> PRT <213> Streptoverticillium <400> 25 Met Ala Thr Glu Pro Leu Ala Val Val Gly Met Ala Gly Arg Phe Pro 1 5 10 15 Gly Ala Asn Thr Leu Glu Glu Phe Trp Ala Leu Leu Ser Glu Gly Arg 20 25 30 Gln Gly Val Arg Glu Val Thr Glu Glu Glu Phe Leu Ala Ala Gly Gly 35 40 45 Asp Pro Ala Asp Leu Glu Asp Pro Ser Leu Val Arg Val Ala Ala Val 50 55 60 Leu Pro Asp Ala Asp Arg Phe Asp Ala Ala Phe Phe Gly Tyr Gly Pro 65 70 75 80 Ala Glu Ala Glu Leu Ile Asp Pro Gln Gln Arg Val Leu Leu Glu Thr 85 90 95 Ala Tyr His Ala Leu Glu Asp Ala Gly Tyr Ala Asp Gly His Gly Asp 100 105 110 Arg Val Val Gly Val Tyr Ala Gly Ala Gly Asp Ser Arg Tyr Tyr Ser 115 120 125 Tyr Asn Val His Pro Arg His Ala Gly Glu Pro Ala Ser Val Gly Leu 130 135 140 Ile His Ala Ala Thr Ala Asn Ser Leu Gly Thr Leu Ala Thr Arg Leu 145 150 155 160 Ser Tyr Asp Leu Glu Leu Thr Gly Pro Ser Val Ser Met Asn Thr Ala 165 170 175 Cys Ser Thr Ala Leu Val Ala Val His Thr Ala Ser Glu Ala Leu Ala 180 185 190 Ala Tyr Ala Cys Asp Ile Ala Val Val Gly Ala Val Ser Val Asp Pro 195 200 205 Gln Ala Met Leu Gly Tyr Arg His Val Pro Asp Gly Pro Leu Ser Pro 210 215 220 Asp Gly Ala Cys Arg Pro Phe Ala Ala Asp Ala Ala Gly Thr Phe Asn 225 230 235 240 Gly Asp Gly Ala Gly Val Leu Val Leu Arg Arg Leu Ser Asp Ala Leu 245 250 255 Ala Asp Gly Asp Arg Ile Arg Ala Val Ile Arg Gly Ser Ala Ile Asn 260 265 270 Asn Asp Gly Arg Arg Lys Val Gly Phe Ser Ala Pro Ser Pro Ala Gly 275 280 285 Gln Ala Glu Val Ile Val Ala Ala Gln Val Ala Ala Gly Val Asp Ala 290 295 300 Gly Ser Val Thr Tyr Val Glu Ala His Gly Thr Ala Thr Arg Leu Gly 305 310 315 320 Asp Pro Ile Glu Val Ala Ala Leu Thr Glu Ala Phe Arg Glu Ser Thr 325 330 335 Asp Arg Arg Gly Tyr Cys Ala Leu Gly Ser Val Lys Gly Asn Ile Gly 340 345 350 His Leu Gly Ala Ala Ala Gly Ile Ala Gly Ile Ile Lys Thr Val Leu 355 360 365 Ala Leu Glu His Arg Ala Val Pro Pro Thr Val His His Asp Ala Pro 370 375 380 Asn Pro Leu Ile Asp Phe Ala Ser Gly Pro Phe Arg Val Ser Thr Ala 385 390 395 400 Leu Glu Pro Trp Thr Ala Asp Gly Pro Leu Arg Ala Ala Val Ser Ala 405 410 415 Phe Gly Val Gly Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro 420 425 430 Arg Leu Pro Val Pro Ile Gly Pro Ala Glu Glu Ala Pro Gly Trp Thr 435 440 445 Val Leu Pro Val Ser Ala Arg Thr Arg Asp Gly Leu Ala Gly Gln Leu 450 455 460 Ser Arg Leu Gly Arg His Leu Glu Asp Asn Pro Glu Leu Ser Val Thr 465 470 475 480 Glu Val Ala Arg Ala Leu Arg Ala Arg Arg Pro Gly Pro His Arg Arg 485 490 495 Ala Val Ala Ala Ala Thr Ala Ala Asp Ala Ala Arg Ala Leu Ala Ala 500 505 510 Ala Thr Val Pro Ala Ala Gly Ala Glu Ser Ala Pro Glu Val Val Phe 515 520 525 Leu Leu Pro Gly Gly Gly Thr Gln Tyr Val Gly Met Gly Ala Glu Leu 530 535 540 Tyr Arg Asp Asp Pro Ala Tyr Arg Glu Ala Val Asp Arg Cys Ala Ala 545 550 555 560 Ile Leu Gln Pro Val Leu Asp His Asp Ile Arg Val Thr Leu His Glu 565 570 575 Arg Ala Asp His Phe Ser Val Glu Ser Met Cys Ala Leu Ala Val Val 580 585 590 Glu Tyr Ala Leu Ala Ala Ser Leu Ala Ala Ser Gly Val Arg Pro Gly 595 600 605 Ala Leu Met Gly His Ser Leu Gly Glu Tyr Val Ala Ala Cys Leu Ala 610 615 620 Gly Val Met Thr Leu Glu Glu Met Leu Pro Leu Leu Val Thr Arg Val 625 630 635 640 Arg Leu Met Ile Ser Ala Gly Gly Ala Ala Val Gly Val Ala Leu Pro 645 650 655 Glu Arg Asp Val Leu Pro Leu Leu Asp Gly Gly Leu Ser Leu Ala Ala 660 665 670 Val Asn Ser Pro Ser Ser Cys Thr Val Gly Gly Pro Val Glu Ala Val 675 680 685 Asp Ala Leu Val Glu Arg Leu Val Ala Asp Gly Val Thr His Arg Arg 690 695 700 Leu Arg Leu Pro Ala Ala Ala His Ser Ser Met Leu Asp Pro Val Leu 705 710 715 720 Asp Asp Leu Ala Ala Ala Phe Arg Gly Val Asp Leu Arg Glu Pro Arg 725 730 735 Val Pro Tyr Ile Thr Asn Val Thr Gly Thr Trp Val Thr Ala Glu Gln 740 745 750 Ala Thr Ser Val Glu His Trp Val Ala His Thr Arg Gly Thr Val Arg 755 760 765 Phe Ala Asp Gly Val Arg Thr Leu Arg Ala Ala Ser Ala Gly Gly Ala 770 775 780 Gly Pro Val Leu Val Glu Ile Gly Pro Gly Asp Val Leu Ser Arg Leu 785 790 795 800 Ala Ala Ala Val Asp Asp Gly Gly Pro Glu Pro Val Thr Val Pro Val 805 810 815 Met Arg His Ala Arg Ala Thr Gly Pro Asp Gly Arg Val Arg Ala Glu 820 825 830 Ala Leu Ala His Leu Trp Thr Ala Gly Ala Glu Val Asp Ile Val Pro 835 840 845 Pro Gly Asp Ala Ser Glu Glu Gly Thr Arg Leu Pro Arg Arg Ser Leu 850 855 860 Pro Asp Leu Pro Gly Tyr Ala Phe Ala Arg Asp Arg His Trp Ile Asp 865 870 875 880 Ala Pro Gly Ala Arg Ala Thr Thr Ala Pro His Gly Ala Ser Asp Asp 885 890 895 Arg Ala Gly Asp Arg Ala Ser Arg Arg Val Pro Arg Pro Pro Leu Ala 900 905 910 Val Pro His Val Pro Pro Gly Thr Asp Ala Glu Arg Ala Val Ala Ala 915 920 925 Glu Trp Glu Ala Val Leu Gly Val Asp Gly Ile Gly Leu Asp Asp Asn 930 935 940 Phe Phe Asp Leu Gly Gly Asp Ser Met Arg Ala Val Leu Leu Gly Gly 945 950 955 960 Arg Leu Arg Thr Ala Gly Val Leu Asp Val Pro Ala Ala Ala Leu Leu 965 970 975 Ala Thr Pro Thr Ile Ala Gly Leu Leu Asp Arg Ala Gly Arg Gly Gly 980 985 990 Ala Val Gly Gln Glu Ala Phe Ala Pro Met Leu Pro Met Arg Ala Ala 995 1000 1005 Gly Asp Leu Pro Pro Leu Phe Cys Val His Pro Val Ser Gly Val 1010 1015 1020 Ala Trp Arg Tyr Thr Gly Leu Leu Pro His Leu Asp Pro Arg Arg 1025 1030 1035 Pro Val Tyr Gly Leu Gln Ala Leu Gly Leu Asp Gly Ala Leu Pro 1040 1045 1050 Ala Ala Gly Arg Ala Glu Asp Val Ile Arg Asp Gly Leu Glu Arg 1055 1060 1065 Ile Arg Ala Val Gln Pro His Gly Pro Tyr His Leu Leu Gly Trp 1070 1075 1080 Ser Phe Gly Gly Ala Val Ala His Arg Leu Ala Ala Ala Leu Glu 1085 1090 1095 Ala Ala Gly Glu Glu Val Ala Leu Leu Thr Met Leu Asp Thr Pro 1100 1105 1110 Gln Pro Asp Ala Ala Ala Leu Glu Gly Glu Ala Val Glu Ala Gln 1115 1120 1125 Ala Ala Ala Leu Val Leu Arg Leu Ala Gly Leu Thr Met Pro Ala 1130 1135 1140 Pro Ala Thr Val Asp Ala Ser Leu Ala Leu Leu Asp Ser Ser Arg 1145 1150 1155 Arg Asp Pro Glu Ala Val Pro Gly Thr Leu Thr Arg Glu Glu Ala 1160 1165 1170 Ile Thr Val Ala Lys Val Val Arg Asn Asn Leu Arg Ile Ala Pro 1175 1180 1185 Asp Leu Val Pro Glu Arg Leu Arg Ala Asp Ile Leu Phe Val Ser 1190 1195 1200 Ala Thr Glu Val Ala Asp Asp Glu Pro Glu Val Ala Gly Gly Ile 1205 1210 1215 Ala Asp Arg Ala Ala Ser Trp Arg Pro Phe Thr Thr Gly Thr Phe 1220 1225 1230 Glu Glu Val Pro Leu Ala Cys Ser His Tyr Ala Leu Thr Asp Ala 1235 1240 1245 Gly Pro Ile Glu Val Ile Ala Lys Ala Val Glu Ala Arg Leu Ala 1250 1255 1260 Gly Ala Gly Gly Gly Glu Arg Ala Glu Val Ala Ala Gly 1265 1270 1275 <210> 26 <211> 9735 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(9735) <223> <400> 26 atg ccc gac cgt gct gcc gac tcg tgt ccg ctg acc gcc ccg cag gcc 48 Met Pro Asp Arg Ala Ala Asp Ser Cys Pro Leu Thr Ala Pro Gln Ala 1 5 10 15 ggg atc tgg ttc gcc cag cag cgt gac acc tcc aac ccg gtc ttc acc 96 Gly Ile Trp Phe Ala Gln Gln Arg Asp Thr Ser Asn Pro Val Phe Thr 20 25 30 aca ggc cag tac gtg cgg ctg ccc gcc gag gtc gac ccg gag cgg ttc 144 Thr Gly Gln Tyr Val Arg Leu Pro Ala Glu Val Asp Pro Glu Arg Phe 35 40 45 gcg cgc gcg gtc gag cgg gcc ctc ggc gag gtg tgg ggg ctc gcg gtc 192 Ala Arg Ala Val Glu Arg Ala Leu Gly Glu Val Trp Gly Leu Ala Val 50 55 60 gag gtg ggc gcg gac ggc gac gtc ccc gtc cag cgc ggg acc ggc acg 240 Glu Val Gly Ala Asp Gly Asp Val Pro Val Gln Arg Gly Thr Gly Thr 65 70 75 80 gca ccc cgc gtg gag gtc gtc gac ctc tcc ggg cgg ccc gac ccg gag 288 Ala Pro Arg Val Glu Val Val Asp Leu Ser Gly Arg Pro Asp Pro Glu 85 90 95 gcc gtc gcc ctg gcg cgg atg cgc gcc gac ctc gaa cag ccg cct gtg 336 Ala Val Ala Leu Ala Arg Met Arg Ala Asp Leu Glu Gln Pro Pro Val 100 105 110 ggg cgg ccg ttg gcg cgg gag gtc ctg ttc cgg tgg cag ggc ggg gcc 384 Gly Arg Pro Leu Ala Arg Glu Val Leu Phe Arg Trp Gln Gly Gly Ala 115 120 125 ctg tgg ttc cac cgc tgc cac cac atg ctc ctc gac ggc tac ggg ttc 432 Leu Trp Phe His Arg Cys His His Met Leu Leu Asp Gly Tyr Gly Phe 130 135 140 tcg ctg gtc ctg cgg cgg atc gag gag atc cac gaa gcg ctg cgc acg 480 Ser Leu Val Leu Arg Arg Ile Glu Glu Ile His Glu Ala Leu Arg Thr 145 150 155 160 ggc ggg tca ccg ggt gag ccc gcc ttc ggc ggc ctc ggg gcg tac ctg 528 Gly Gly Ser Pro Gly Glu Pro Ala Phe Gly Gly Leu Gly Ala Tyr Leu 165 170 175 gac gag gag gcc ggg tac cgg gcg ggc gac cgg atg ccg cgg gac cgc 576 Asp Glu Glu Ala Gly Tyr Arg Ala Gly Asp Arg Met Pro Arg Asp Arg 180 185 190 gcc tac tgg ctg gac gca ctc gcc gaa ctc ccg ccc ccg gta agc ctg 624 Ala Tyr Trp Leu Asp Ala Leu Ala Glu Leu Pro Pro Pro Val Ser Leu 195 200 205 tcc ggc acg cct ccg gag ccg gcg cgc ggc gcg ccg ctg aag gcg cgc 672 Ser Gly Thr Pro Pro Glu Pro Ala Arg Gly Ala Pro Leu Lys Ala Arg 210 215 220 gtc gac gtg ctg ccc gat ccg gcc ggc ctc gcc cgg ctc gcc gag agc 720 Val Asp Val Leu Pro Asp Pro Ala Gly Leu Ala Arg Leu Ala Glu Ser 225 230 235 240 ctc tcg gcc acg acc gcg gac ctg gcg atc gcc gcc acc gcc gtc tac 768 Leu Ser Ala Thr Thr Ala Asp Leu Ala Ile Ala Ala Thr Ala Val Tyr 245 250 255 cag cac cgg gtg acc ggt gcc gcc gac gtc gtc ctc gcc ctg ccg ctg 816 Gln His Arg Val Thr Gly Ala Ala Asp Val Val Leu Ala Leu Pro Leu 260 265 270 gcc ctg cgg ggc ggc gcg gcc gcg cgc ctg ccc tcg acc acc gtc aac 864 Ala Leu Arg Gly Gly Ala Ala Ala Arg Leu Pro Ser Thr Thr Val Asn 275 280 285 gtg ctg ccg ctg cgg gta cgg gtc gcg gac ggc gac acg gtc ggc acg 912 Val Leu Pro Leu Arg Val Arg Val Ala Asp Gly Asp Thr Val Gly Thr 290 295 300 ctg gtc gcc cgg ctg cgg aag gcg atg cgg gag ctg cgc cgc cac ggg 960 Leu Val Ala Arg Leu Arg Lys Ala Met Arg Glu Leu Arg Arg His Gly 305 310 315 320 cgg tac cgc gtc gag gac atc cgc cgg gac ctc ggg cgc gtc acc gac 1008 Arg Tyr Arg Val Glu Asp Ile Arg Arg Asp Leu Gly Arg Val Thr Asp 325 330 335 gag tcc gag ttc acc acc gcc cag gtc aac atc aag agt tac gac acc 1056 Glu Ser Glu Phe Thr Thr Ala Gln Val Asn Ile Lys Ser Tyr Asp Thr 340 345 350 acg atc ggg ctc ctg ggc cgg cgc ctc ccg gtc gtg gac ctc tcc ccc 1104 Thr Ile Gly Leu Leu Gly Arg Arg Leu Pro Val Val Asp Leu Ser Pro 355 360 365 ggg ccc gtc gac gac atc gcg ttc gtc gtg gac ctc gcc gag gac ggc 1152 Gly Pro Val Asp Asp Ile Ala Phe Val Val Asp Leu Ala Glu Asp Gly 370 375 380 gag ctg acc acc ctg gag gtc gag gcc aac gcc ctc cgg tac gac gcg 1200 Glu Leu Thr Thr Leu Glu Val Glu Ala Asn Ala Leu Arg Tyr Asp Ala 385 390 395 400 ccg acg gcg ctg gcg cac ggc cgc ggg ctc ggg cgc ctg ctg ggc gcg 1248 Pro Thr Ala Leu Ala His Gly Arg Gly Leu Gly Arg Leu Leu Gly Ala 405 410 415 ctc gcc gag gcc ggc ccc gac acg gcc gtc gac gac ctg gga gcg gtg 1296 Leu Ala Glu Ala Gly Pro Asp Thr Ala Val Asp Asp Leu Gly Ala Val 420 425 430 ggg ccg atc tac gac acc ggc cac tac ctg gac ctc cgg ggg ccg gtc 1344 Gly Pro Ile Tyr Asp Thr Gly His Tyr Leu Asp Leu Arg Gly Pro Val 435 440 445 gac cgc gag ggc ctc cgc gcg gcg ggc gtc cgc gcg gtg cgc gat gcg 1392 Asp Arg Glu Gly Leu Arg Ala Ala Gly Val Arg Ala Val Arg Asp Ala 450 455 460 gcg tac ggg ctg gtg gac ggg ccg gtg gac ggg ccg atg ggg gaa gcg 1440 Ala Tyr Gly Leu Val Asp Gly Pro Val Asp Gly Pro Met Gly Glu Ala 465 470 475 480 gcg tcc gga ccg gcg ggc ggg tcg gcg gac acg tcg gcg gac ggc gag 1488 Ala Ser Gly Pro Ala Gly Gly Ser Ala Asp Thr Ser Ala Asp Gly Glu 485 490 495 ggc gcg cca tgc ggg ccg gcc gaa ttc gtc gat ctc tcc ggt gag agc 1536 Gly Ala Pro Cys Gly Pro Ala Glu Phe Val Asp Leu Ser Gly Glu Ser 500 505 510 gac ccg gcc ggc gcg gcc ctg gcc tgg atg cgg gcc gag ctg gcg cgc 1584 Asp Pro Ala Gly Ala Ala Leu Ala Trp Met Arg Ala Glu Leu Ala Arg 515 520 525 ccg gcc gcg acg gcc tgc ggc cac gcg gtg ctc gcg ctc gga ccg gag 1632 Pro Ala Ala Thr Ala Cys Gly His Ala Val Leu Ala Leu Gly Pro Glu 530 535 540 cac cac ctg tgg ttc cgg cgt acg ggc ggt ccc gag tcc gac gag cgc 1680 His His Leu Trp Phe Arg Arg Thr Gly Gly Pro Glu Ser Asp Glu Arg 545 550 555 560 gcc gcg ccg gcc ctg gcc cgg cgc gtc gcc gcg ctc gcc ggg gcg ccg 1728 Ala Ala Pro Ala Leu Ala Arg Arg Val Ala Ala Leu Ala Gly Ala Pro 565 570 575 gac ggc ctc gcg gac gtc gcg gac gtc gcg gac gtc gcg gcc gat tcc 1776 Asp Gly Leu Ala Asp Val Ala Asp Val Ala Asp Val Ala Ala Asp Ser 580 585 590 cgg ccc gcc ggc tcc ggc tcc cgg cac cgc gag atc gcg gtc ccg gcc 1824 Arg Pro Ala Gly Ser Gly Ser Arg His Arg Glu Ile Ala Val Pro Ala 595 600 605 gcg ctc ggc cgc cgg atg atg gaa gga tcc cgc gaa ctc ggg gta ggg 1872 Ala Leu Gly Arg Arg Met Met Glu Gly Ser Arg Glu Leu Gly Val Gly 610 615 620 ata cgg gat ttc gtg gca gcc gcc gtc gcg atg ttc acc gct cgc cgc 1920 Ile Arg Asp Phe Val Ala Ala Ala Val Ala Met Phe Thr Ala Arg Arg 625 630 635 640 cgt ggg agc ggc gcg gtc gag ctg tac gtc ccg gcc gcc gat ggc acc 1968 Arg Gly Ser Gly Ala Val Glu Leu Tyr Val Pro Ala Ala Asp Gly Thr 645 650 655 ccc gtc ccg ctg ccg ctg gac ctc acg ggc acc acg acg ctc gcg gag 2016 Pro Val Pro Leu Pro Leu Asp Leu Thr Gly Thr Thr Thr Leu Ala Glu 660 665 670 acc gtc gcc gcg gtc cag gac ggg cgc ggc cac cgc gcg acg gcg gac 2064 Thr Val Ala Ala Val Gln Asp Gly Arg Gly His Arg Ala Thr Ala Asp 675 680 685 ggg cgc gta tcc ggc ccg tcc gtg acc gtc gca cgg tgg gcc ggg aca 2112 Gly Arg Val Ser Gly Pro Ser Val Thr Val Ala Arg Trp Ala Gly Thr 690 695 700 ccg gac cgc gac gcg gcg ctg cac ctc gtc tcc gcg gct ccc gcg acc 2160 Pro Asp Arg Asp Ala Ala Leu His Leu Val Ser Ala Ala Pro Ala Thr 705 710 715 720 ggc ccc gcc gtg acg gcg gtc ctc ggc gag gac cgc gtc cgc gca ctc 2208 Gly Pro Ala Val Thr Ala Val Leu Gly Glu Asp Arg Val Arg Ala Leu 725 730 735 cag gtg gac gac gcc ccc gac gac ccc gcc tgg tcc gac agc gaa ctg 2256 Gln Val Asp Asp Ala Pro Asp Asp Pro Ala Trp Ser Asp Ser Glu Leu 740 745 750 cgc cgt ttc ata cgc ctg ttg gac gcg gtg acc gcc gac ccc gag acc 2304 Arg Arg Phe Ile Arg Leu Leu Asp Ala Val Thr Ala Asp Pro Glu Thr 755 760 765 acg ctc gcc gga gtc gac ctg ctc gac gag gcc gag cac cgc aca ctg 2352 Thr Leu Ala Gly Val Asp Leu Leu Asp Glu Ala Glu His Arg Thr Leu 770 775 780 gcc gcc gac gcc gac acc gcc cac ccg gta ccc gtc acc acc ctg gac 2400 Ala Ala Asp Ala Asp Thr Ala His Pro Val Pro Val Thr Thr Leu Asp 785 790 795 800 cgg ctc gtc gcc gag cag atc gcg cgg acg ccg gac gcc gta gcg ctg 2448 Arg Leu Val Ala Glu Gln Ile Ala Arg Thr Pro Asp Ala Val Ala Leu 805 810 815 gtg ccc gcc gac ggc tcg ccg gag ctc acc tac cgt gaa ctc ggc gag 2496 Val Pro Ala Asp Gly Ser Pro Glu Leu Thr Tyr Arg Glu Leu Gly Glu 820 825 830 cgg gtg gac cgg ctg gcc cgt ggc ctc gcc ggg ctc ggc gcg ggt ccg 2544 Arg Val Asp Arg Leu Ala Arg Gly Leu Ala Gly Leu Gly Ala Gly Pro 835 840 845 ggg acg atc gtc gcg gtc gcc cag ccg cgt tcg acg gcc ctg gtc gtg 2592 Gly Thr Ile Val Ala Val Ala Gln Pro Arg Ser Thr Ala Leu Val Val 850 855 860 agc ctg ctg gcg gtg ctg cgg acc ggc gcg gcc tac gcg ccg ctg gac 2640 Ser Leu Leu Ala Val Leu Arg Thr Gly Ala Ala Tyr Ala Pro Leu Asp 865 870 875 880 ctc gac cac ccg ccg gcc cgg ctc gcc gcc gtc ctg gag gac gtc cgg 2688 Leu Asp His Pro Pro Ala Arg Leu Ala Ala Val Leu Glu Asp Val Arg 885 890 895 ccc gtc gcg gtc ctc acc gcc gga ccc gcg ccc gtc gcg ctg ccg gcg 2736 Pro Val Ala Val Leu Thr Ala Gly Pro Ala Pro Val Ala Leu Pro Ala 900 905 910 gag ctg aac gtc gtc gac gtc ctc gcc ctg cgg gcc gac ggc acg ggc 2784 Glu Leu Asn Val Val Asp Val Leu Ala Leu Arg Ala Asp Gly Thr Gly 915 920 925 gcg gcc ccg gcc ggt ccc ggc ccc gac gac ctg gcc tac gtc atc cac 2832 Ala Ala Pro Ala Gly Pro Gly Pro Asp Asp Leu Ala Tyr Val Ile His 930 935 940 acc tcg ggc tcg acc ggc cgc ccc aag ggc gtc gcc gtc gcc cac cgg 2880 Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Ala Val Ala His Arg 945 950 955 960 gcc gtc gtc aac cgg ctg ttg tgg acc cag gac cgg ttc ggc ctg ggc 2928 Ala Val Val Asn Arg Leu Leu Trp Thr Gln Asp Arg Phe Gly Leu Gly 965 970 975 ccg ggc gac cgg gtg ctg cag aag acc agc tgc gcg ttc gac gtc tcc 2976 Pro Gly Asp Arg Val Leu Gln Lys Thr Ser Cys Ala Phe Asp Val Ser 980 985 990 gtc tgg gag ttc ttc tgg ccc ttg atc agc ggg gcg acg ctg gtc ctg 3024 Val Trp Glu Phe Phe Trp Pro Leu Ile Ser Gly Ala Thr Leu Val Leu 995 1000 1005 ccg gcc ccc ggc gcg cag cgc gac ccg gcg cgg gtc gcc gcg gcg 3069 Pro Ala Pro Gly Ala Gln Arg Asp Pro Ala Arg Val Ala Ala Ala 1010 1015 1020 atc gac gag gcg ggc atc acg acc gcc cac ttc gtc ccg tcg atg 3114 Ile Asp Glu Ala Gly Ile Thr Thr Ala His Phe Val Pro Ser Met 1025 1030 1035 ctc gtc gcc tat ctc ggc gag ccg gcc gcc gcc cgg cct cgc gcg 3159 Leu Val Ala Tyr Leu Gly Glu Pro Ala Ala Ala Arg Pro Arg Ala 1040 1045 1050 ctg cgg cgg atc ctg tgc agc ggc gag gcc ctg ccg acc gag gcg 3204 Leu Arg Arg Ile Leu Cys Ser Gly Glu Ala Leu Pro Thr Glu Ala 1055 1060 1065 gcg cgg cgg gcc gag gag gtc acc ggc gcg gag gtc ttc aac ctc 3249 Ala Arg Arg Ala Glu Glu Val Thr Gly Ala Glu Val Phe Asn Leu 1070 1075 1080 tac ggc ccg acc gag gcc gcg atc gac gtg agc tgg tgg ccg ctg 3294 Tyr Gly Pro Thr Glu Ala Ala Ile Asp Val Ser Trp Trp Pro Leu 1085 1090 1095 cgc gac ggc gcg ccg ggc gcc acg gtg ccg atc ggc cgc gcc gtc 3339 Arg Asp Gly Ala Pro Gly Ala Thr Val Pro Ile Gly Arg Ala Val 1100 1105 1110 tgg aac acc cgg ctg gac gtg ctc gac ccc tgg ggg gca ccg gta 3384 Trp Asn Thr Arg Leu Asp Val Leu Asp Pro Trp Gly Ala Pro Val 1115 1120 1125 ccg ccc ggc gag ccc ggc gag ctg tac atc gcg ggc gac cag ctc 3429 Pro Pro Gly Glu Pro Gly Glu Leu Tyr Ile Ala Gly Asp Gln Leu 1130 1135 1140 gcc gtc ggc tac ctc ggg cgg ccg gac ctc acc gcc gag cgc ttc 3474 Ala Val Gly Tyr Leu Gly Arg Pro Asp Leu Thr Ala Glu Arg Phe 1145 1150 1155 ccg gag gac ccg gcg gcg ggc cgg cgc tac cgc acc ggc gac ctg 3519 Pro Glu Asp Pro Ala Ala Gly Arg Arg Tyr Arg Thr Gly Asp Leu 1160 1165 1170 gta cgg cgg ctg ccc tcc ggc gcg ctg gag ttc ctc gga cgc ctg 3564 Val Arg Arg Leu Pro Ser Gly Ala Leu Glu Phe Leu Gly Arg Leu 1175 1180 1185 gac cac cag gtc aag atc cgg ggc ttc cgg gtc gag ctg ggc gag 3609 Asp His Gln Val Lys Ile Arg Gly Phe Arg Val Glu Leu Gly Glu 1190 1195 1200 atc gag gcc gtg ctg acc gag cac ccg gag gtc gcc gcg gcg gtg 3654 Ile Glu Ala Val Leu Thr Glu His Pro Glu Val Ala Ala Ala Val 1205 1210 1215 gtc ggc acc cgt gac gac cgc gcg ggc ggg ccc cgg ctc gtc gcc 3699 Val Gly Thr Arg Asp Asp Arg Ala Gly Gly Pro Arg Leu Val Ala 1220 1225 1230 tgg gtc gtc ccc gcc ccg gcg gag aag gac ggg gaa gac ggc ttc 3744 Trp Val Val Pro Ala Pro Ala Glu Lys Asp Gly Glu Asp Gly Phe 1235 1240 1245 gag gcc cgc gcc cgg cgc tgg cac gac cac ctc gcc gcc cgg ctg 3789 Glu Ala Arg Ala Arg Arg Trp His Asp His Leu Ala Ala Arg Leu 1250 1255 1260 ccc gag cac atg gtc ccc acg gcc gtc gtc ccc ctc gcc gag ctc 3834 Pro Glu His Met Val Pro Thr Ala Val Val Pro Leu Ala Glu Leu 1265 1270 1275 ccc acc acc gcc aac ggc aag ctc gac cgg gac gcg ctc ccg gag 3879 Pro Thr Thr Ala Asn Gly Lys Leu Asp Arg Asp Ala Leu Pro Glu 1280 1285 1290 ccg ccg gag ccc acg gcc gcc gcg cgg gag ccc gac ggc ccc gag 3924 Pro Pro Glu Pro Thr Ala Ala Ala Arg Glu Pro Asp Gly Pro Glu 1295 1300 1305 gag cgg gcg ctc acc gag atc ctc gcc gag gtg ctg ggg atc gaa 3969 Glu Arg Ala Leu Thr Glu Ile Leu Ala Glu Val Leu Gly Ile Glu 1310 1315 1320 cgg atc ggg ccg gac gac gac ttc ttc acc gcc ggc ggc cat tcg 4014 Arg Ile Gly Pro Asp Asp Asp Phe Phe Thr Ala Gly Gly His Ser 1325 1330 1335 ctg acc gcc gca cgc gcc gcc acg atg atc cgc gcc cgg ttc ggt 4059 Leu Thr Ala Ala Arg Ala Ala Thr Met Ile Arg Ala Arg Phe Gly 1340 1345 1350 gtc gag atc ggc gtg gcc gac gtg ttc gcc gcc cgc tgc gcg gcg 4104 Val Glu Ile Gly Val Ala Asp Val Phe Ala Ala Arg Cys Ala Ala 1355 1360 1365 ggc ctc gcc gcc cgg ctg acc acc gca ccg ccc gcg cgc acc ccc 4149 Gly Leu Ala Ala Arg Leu Thr Thr Ala Pro Pro Ala Arg Thr Pro 1370 1375 1380 ttg cgc ccg gcc ggc cgg ccc gag cgc ctg ctg ctg tcc ccg gcc 4194 Leu Arg Pro Ala Gly Arg Pro Glu Arg Leu Leu Leu Ser Pro Ala 1385 1390 1395 cag cgg ggc ctg tgg ttc ctg gac cgg ctc gac gac ggg ccg acg 4239 Gln Arg Gly Leu Trp Phe Leu Asp Arg Leu Asp Asp Gly Pro Thr 1400 1405 1410 tac aac atc ccg ctg gtg ctc ccc ctg ccg aac cgc gtg gac gcc 4284 Tyr Asn Ile Pro Leu Val Leu Pro Leu Pro Asn Arg Val Asp Ala 1415 1420 1425 gac gcg ctc gcc gcc gcg ctg ggc gac gtc gcc gcc cgc cac gag 4329 Asp Ala Leu Ala Ala Ala Leu Gly Asp Val Ala Ala Arg His Glu 1430 1435 1440 agc ctg cgc acg gtc ttc ccg gcc gag gcc ggc gtg ccg tac cag 4374 Ser Leu Arg Thr Val Phe Pro Ala Glu Ala Gly Val Pro Tyr Gln 1445 1450 1455 gag gtc cgg gaa ccg gcg gcc gtg ccg ctg cac gtc gtc gac tgc 4419 Glu Val Arg Glu Pro Ala Ala Val Pro Leu His Val Val Asp Cys 1460 1465 1470 ccc gcc gag gag atc ggg gcg cac gtc gag gcc gcc gcc cga cgc 4464 Pro Ala Glu Glu Ile Gly Ala His Val Glu Ala Ala Ala Arg Arg 1475 1480 1485 cgg ctg gac atc acc cgg gag ccg ggc ctg cgg gcc ggc ctg tac 4509 Arg Leu Asp Ile Thr Arg Glu Pro Gly Leu Arg Ala Gly Leu Tyr 1490 1495 1500 gga ccg gcg gac ggc gag cgc acg ctc gtc ctg cta ctg cac cac 4554 Gly Pro Ala Asp Gly Glu Arg Thr Leu Val Leu Leu Leu His His 1505 1510 1515 ctg gtc gcc gac ggc tgg tcg ctg cgg ccg ctg gcc gag gac ctc 4599 Leu Val Ala Asp Gly Trp Ser Leu Arg Pro Leu Ala Glu Asp Leu 1520 1525 1530 acc gcg gcg tac gcg gcg cgc gcc gcc ggc cgg gct ccc gaa ctc 4644 Thr Ala Ala Tyr Ala Ala Arg Ala Ala Gly Arg Ala Pro Glu Leu 1535 1540 1545 gcg ccg ctc ccg gtg cag ttc gcc gac tac gtg ctc tgg cag cgc 4689 Ala Pro Leu Pro Val Gln Phe Ala Asp Tyr Val Leu Trp Gln Arg 1550 1555 1560 gac cgg ctc gac ccg gcc ggc gcc gcc gcc cgg cgc gac gag gag 4734 Asp Arg Leu Asp Pro Ala Gly Ala Ala Ala Arg Arg Asp Glu Glu 1565 1570 1575 ttc tgg agc gcc gcg ctg cgg ggg ctg ccg gag gag acc gcg ctg 4779 Phe Trp Ser Ala Ala Leu Arg Gly Leu Pro Glu Glu Thr Ala Leu 1580 1585 1590 ccg ttc gac cgg ccg cgg ccc gcc cgg ccg acc ggc cgg ggc ggc 4824 Pro Phe Asp Arg Pro Arg Pro Ala Arg Pro Thr Gly Arg Gly Gly 1595 1600 1605 gcc gtc gac ctg gcc gtc ggt ccg gtg gcc cac gcg gcc ctg cgg 4869 Ala Val Asp Leu Ala Val Gly Pro Val Ala His Ala Ala Leu Arg 1610 1615 1620 gag ctg gcg cgg gcg cac ggc gtc agc ctg ttc acg gtg ctg cac 4914 Glu Leu Ala Arg Ala His Gly Val Ser Leu Phe Thr Val Leu His 1625 1630 1635 gcg ggc gtc gcc gcc ctg ctc acc ggc ctc ggc gcc ggt acg gat 4959 Ala Gly Val Ala Ala Leu Leu Thr Gly Leu Gly Ala Gly Thr Asp 1640 1645 1650 ctg gcg atc ggc acc ccg gtc gcc ggg cgg cac gac cag gcg ctc 5004 Leu Ala Ile Gly Thr Pro Val Ala Gly Arg His Asp Gln Ala Leu 1655 1660 1665 gac gac gtg gtg ggg ctg gtg acc aac acc gtc gtg ctg cgc acc 5049 Asp Asp Val Val Gly Leu Val Thr Asn Thr Val Val Leu Arg Thr 1670 1675 1680 gac acc tcc ggc tcg ccg gcc gtc gcc gag ttg ctg gct cgc gtc 5094 Asp Thr Ser Gly Ser Pro Ala Val Ala Glu Leu Leu Ala Arg Val 1685 1690 1695 cag gag gcc gac cgg gcc gcc tgg gcg cac gag gac ctg ccg ttc 5139 Gln Glu Ala Asp Arg Ala Ala Trp Ala His Glu Asp Leu Pro Phe 1700 1705 1710 gag cag gtg gtg gag ctg gtc aac ccg ccg cgc gtg ccg ggg cgt 5184 Glu Gln Val Val Glu Leu Val Asn Pro Pro Arg Val Pro Gly Arg 1715 1720 1725 cat ccg ctg ttc acg gtg atg ctg gcg ctg cag aac aac gcc gcc 5229 His Pro Leu Phe Thr Val Met Leu Ala Leu Gln Asn Asn Ala Ala 1730 1735 1740 gcg gcg gtg tcg ctg ggc ggc ccg ccg gtg ccg ctg cgg ccc agc 5274 Ala Ala Val Ser Leu Gly Gly Pro Pro Val Pro Leu Arg Pro Ser 1745 1750 1755 gcg acg ggt acc gcg aag ttc gac ctg ttc ttc gac atc acc gag 5319 Ala Thr Gly Thr Ala Lys Phe Asp Leu Phe Phe Asp Ile Thr Glu 1760 1765 1770 cac gtc ggg gac gac ggc tcg gcg ccc ggc ggt ctg acc tgt cac 5364 His Val Gly Asp Asp Gly Ser Ala Pro Gly Gly Leu Thr Cys His 1775 1780 1785 gtc gag ttc gcc cgc gac ctg ttc gac ccg agc acc gcg cgc ctg 5409 Val Glu Phe Ala Arg Asp Leu Phe Asp Pro Ser Thr Ala Arg Leu 1790 1795 1800 ctc gcc gag ggc ctg gtc acc gtc ctc gcc cgg gcc gcg gcc gcc 5454 Leu Ala Glu Gly Leu Val Thr Val Leu Ala Arg Ala Ala Ala Ala 1805 1810 1815 ccg ggg gcg cgc ctc ggc gac ctc gtc ccg gac ggc ctg ctc gcc 5499 Pro Gly Ala Arg Leu Gly Asp Leu Val Pro Asp Gly Leu Leu Ala 1820 1825 1830 ggg cgg gac gcc gca ccc gag gcg gtg tcc gac gac gcg gcg ctg 5544 Gly Arg Asp Ala Ala Pro Glu Ala Val Ser Asp Asp Ala Ala Leu 1835 1840 1845 gag agc cgt gtg cgc tcc ctg tcc gcc gtc gcg gac gtc gcg gtc 5589 Glu Ser Arg Val Arg Ser Leu Ser Ala Val Ala Asp Val Ala Val 1850 1855 1860 acc cgg ccc tcc gac ggc ggt ccg gtc gtc tgg gtc gtc ccc gcg 5634 Thr Arg Pro Ser Asp Gly Gly Pro Val Val Trp Val Val Pro Ala 1865 1870 1875 cga ccg ggc gcg gac gac gac gcg cgc cgg ctc ctc gcg gac gaa 5679 Arg Pro Gly Ala Asp Asp Asp Ala Arg Arg Leu Leu Ala Asp Glu 1880 1885 1890 ggc ggc gac ggg gca ccc cgg gtg acg gcc gtg acc gtc ctc ccg 5724 Gly Gly Asp Gly Ala Pro Arg Val Thr Ala Val Thr Val Leu Pro 1895 1900 1905 cgc acc gcc gcc ggc gac ctc gac gtg gcc gcg ctg cac cgg ctg 5769 Arg Thr Ala Ala Gly Asp Leu Asp Val Ala Ala Leu His Arg Leu 1910 1915 1920 ccg gtc gtc gac gac acc gcc gcc gac ggc tgg cgc gcc gct ctc 5814 Pro Val Val Asp Asp Thr Ala Ala Asp Gly Trp Arg Ala Ala Leu 1925 1930 1935 gcg gcc gtg acc ggc gta cgg gcg gcg gcg gtc ggg cgc gag gac 5859 Ala Ala Val Thr Gly Val Arg Ala Ala Ala Val Gly Arg Glu Asp 1940 1945 1950 gtc ccc gag ggg ctg gag gcg ctc cgg ccg gcg acc cgc ccg cgt 5904 Val Pro Glu Gly Leu Glu Ala Leu Arg Pro Ala Thr Arg Pro Arg 1955 1960 1965 acc gtg gcg gcc acc gcc gga ccg gcc gcc gtt cac caa gcg gac 5949 Thr Val Ala Ala Thr Ala Gly Pro Ala Ala Val His Gln Ala Asp 1970 1975 1980 cgc gcg ctg tcg ctc tcc gag ggc ccg ccg ctg ccc ccg gcg gag 5994 Arg Ala Leu Ser Leu Ser Glu Gly Pro Pro Leu Pro Pro Ala Glu 1985 1990 1995 gtc ggc ggc tgg ccc gag gcc ctg cgc cgc gcc gcg gcg ggc ggc 6039 Val Gly Gly Trp Pro Glu Ala Leu Arg Arg Ala Ala Ala Gly Gly 2000 2005 2010 gac cac gcc gag atc gtg cac gtg cgc gcg gac ggc acc gag agc 6084 Asp His Ala Glu Ile Val His Val Arg Ala Asp Gly Thr Glu Ser 2015 2020 2025 cgg cgc tcg tac gcc tcg ctg atc gag gag gcc gag cgg gtc ctg 6129 Arg Arg Ser Tyr Ala Ser Leu Ile Glu Glu Ala Glu Arg Val Leu 2030 2035 2040 ggc ggg ctg cgg gcc ctg ggc ctg cgc gcc ggc gac cag gtg gtc 6174 Gly Gly Leu Arg Ala Leu Gly Leu Arg Ala Gly Asp Gln Val Val 2045 2050 2055 ctg cag tgc gac gac acc gag gac ttc gtg gcc gcg ctc tgg ggc 6219 Leu Gln Cys Asp Asp Thr Glu Asp Phe Val Ala Ala Leu Trp Gly 2060 2065 2070 gcg atc gcc gcc ggg gtc acc gtc gtc ccg ctc acc gtg ccg ccc 6264 Ala Ile Ala Ala Gly Val Thr Val Val Pro Leu Thr Val Pro Pro 2075 2080 2085 acg tac gcc acc gac tcg gcg gcc gtg aac aag ctc gac ggc gtc 6309 Thr Tyr Ala Thr Asp Ser Ala Ala Val Asn Lys Leu Asp Gly Val 2090 2095 2100 tgg cgc atg ctg ggc cgg ccg gtc gtc gtc acc tcc gcg gac cgt 6354 Trp Arg Met Leu Gly Arg Pro Val Val Val Thr Ser Ala Asp Arg 2105 2110 2115 gcc gac ggc ctg gcg gag ctc gcg gcc cgc cgg gag tgg ccg gac 6399 Ala Asp Gly Leu Ala Glu Leu Ala Ala Arg Arg Glu Trp Pro Asp 2120 2125 2130 ccc cgc atc gtg acc gtg gac gcc ctg cgc gcg gcc gcc ccg gac 6444 Pro Arg Ile Val Thr Val Asp Ala Leu Arg Ala Ala Ala Pro Asp 2135 2140 2145 cgc gac tgg cat cag gca cgc ccc gac gac ctg ctg ctc atg ctg 6489 Arg Asp Trp His Gln Ala Arg Pro Asp Asp Leu Leu Leu Met Leu 2150 2155 2160 ctc acc tcc ggc agc acg gga ctt ccg aag gcg gtg cgg ctg acg 6534 Leu Thr Ser Gly Ser Thr Gly Leu Pro Lys Ala Val Arg Leu Thr 2165 2170 2175 cac ggc aac gtg ctg agc cgg gcc gtc gcc gcg gcg gcg gcc aac 6579 His Gly Asn Val Leu Ser Arg Ala Val Ala Ala Ala Ala Ala Asn 2180 2185 2190 tcc ctg acc gag cac gac gtc tcg ctg aac tgg atc ccg ctc gac 6624 Ser Leu Thr Glu His Asp Val Ser Leu Asn Trp Ile Pro Leu Asp 2195 2200 2205 cac gtc acc ggt gtg gtg atg ttc cac ctg cgc gac gtc tac ctc 6669 His Val Thr Gly Val Val Met Phe His Leu Arg Asp Val Tyr Leu 2210 2215 2220 ggc gcc cgg cag gtg cac gcc ccg acg ggc tgg gtg ctg gag gac 6714 Gly Ala Arg Gln Val His Ala Pro Thr Gly Trp Val Leu Glu Asp 2225 2230 2235 ccg ctg cgc tgg tgg gag ctg gcg gac cgg tgg cgc gtc agc gtc 6759 Pro Leu Arg Trp Trp Glu Leu Ala Asp Arg Trp Arg Val Ser Val 2240 2245 2250 acg tgg gcg ccg aac ttc gcc ttc ggc ctc gtc gcc gag cag gcc 6804 Thr Trp Ala Pro Asn Phe Ala Phe Gly Leu Val Ala Glu Gln Ala 2255 2260 2265 ggc cgg ctc gcc ggc cgg gag tgg gac ctc tcc ccc gta cgg ctg 6849 Gly Arg Leu Ala Gly Arg Glu Trp Asp Leu Ser Pro Val Arg Leu 2270 2275 2280 atc atg aac gcg ggc gag gtc gtc gtc ggc gcg acc aac cgc cgg 6894 Ile Met Asn Ala Gly Glu Val Val Val Gly Ala Thr Asn Arg Arg 2285 2290 2295 ttc ctg cag gcc ctg gcg ccg cac ggg ctg ccg tcc gac gtg atg 6939 Phe Leu Gln Ala Leu Ala Pro His Gly Leu Pro Ser Asp Val Met 2300 2305 2310 cac ccc ggc tgg ggc atg tcc gag acg tgc tcc gtg gtc acg gac 6984 His Pro Gly Trp Gly Met Ser Glu Thr Cys Ser Val Val Thr Asp 2315 2320 2325 acg gtc ctc gac ccg cag ccg ccg ccc ggc ggc gac gag acc ttc 7029 Thr Val Leu Asp Pro Gln Pro Pro Pro Gly Gly Asp Glu Thr Phe 2330 2335 2340 gtc agc tgc ggg cgg ccg tac ccc ggg ttc gcg atg cgc gtg gtc 7074 Val Ser Cys Gly Arg Pro Tyr Pro Gly Phe Ala Met Arg Val Val 2345 2350 2355 gac gag gag ctg cgg ctg ctg ccg gag ggc gag gtc ggc cgc ttc 7119 Asp Glu Glu Leu Arg Leu Leu Pro Glu Gly Glu Val Gly Arg Phe 2360 2365 2370 cag gtc cgc ggc gcc tcg gtg acg tcg ggc tac cac gac aac gcg 7164 Gln Val Arg Gly Ala Ser Val Thr Ser Gly Tyr His Asp Asn Ala 2375 2380 2385 gcg gcc aac gcc gag gcg ttc acc gcc gac ggc tgg ttc gac acc 7209 Ala Ala Asn Ala Glu Ala Phe Thr Ala Asp Gly Trp Phe Asp Thr 2390 2395 2400 ggc gac ctg gcg ttc ctg cgc gac ggc gag ctg tac atc acc ggg 7254 Gly Asp Leu Ala Phe Leu Arg Asp Gly Glu Leu Tyr Ile Thr Gly 2405 2410 2415 cgc gcc aag gac gtc atc atc gtc aac ggc gtc aac cac ttc agt 7299 Arg Ala Lys Asp Val Ile Ile Val Asn Gly Val Asn His Phe Ser 2420 2425 2430 cac gag ata gag gcg tgc gtc gag gaa ctg ccg gtg gtg gtg cgc 7344 His Glu Ile Glu Ala Cys Val Glu Glu Leu Pro Val Val Val Arg 2435 2440 2445 tcg ttc acc gcg gcg gtc gcg gtc cgt acg gac gcc tcg gcc gcc 7389 Ser Phe Thr Ala Ala Val Ala Val Arg Thr Asp Ala Ser Ala Ala 2450 2455 2460 acc gac cag ctc gcg ctg ttc gtg cac ctg gcc ccc ggg cac gac 7434 Thr Asp Gln Leu Ala Leu Phe Val His Leu Ala Pro Gly His Asp 2465 2470 2475 tcc ggg gag gcc gcg gcg gcc gcg ctg cgg gcg atc cgg ggc aag 7479 Ser Gly Glu Ala Ala Ala Ala Ala Leu Arg Ala Ile Arg Gly Lys 2480 2485 2490 gtg gcc cgc gag gtc ggc gtg gcg ccc gcg cac gtg ctg ccc gtc 7524 Val Ala Arg Glu Val Gly Val Ala Pro Ala His Val Leu Pro Val 2495 2500 2505 gag acg gcg gtg atc ccg aag acc gag atc ggc aag atc cag cgg 7569 Glu Thr Ala Val Ile Pro Lys Thr Glu Ile Gly Lys Ile Gln Arg 2510 2515 2520 acg cag ctg cgc aag cgg ttc gag gcc ggt gag ttc gac gcg gtg 7614 Thr Gln Leu Arg Lys Arg Phe Glu Ala Gly Glu Phe Asp Ala Val 2525 2530 2535 gcg cgc gcc gcc gag gtg ctg ctc ggg acg gcg gcg acg gtt ccg 7659 Ala Arg Ala Ala Glu Val Leu Leu Gly Thr Ala Ala Thr Val Pro 2540 2545 2550 cac tgg ttc ctg cgt ccc gtc tgg tcg ccg gtg acg cgc ccg gcc 7704 His Trp Phe Leu Arg Pro Val Trp Ser Pro Val Thr Arg Pro Ala 2555 2560 2565 acc gct ccc ccg gcc ggc acg tcc gtg ctg atc gtg gcg gcg ggg 7749 Thr Ala Pro Pro Ala Gly Thr Ser Val Leu Ile Val Ala Ala Gly 2570 2575 2580 ccg cgg ggt gcg ggg gtc gcc gag cgg ctc gcc gcc ctg gtg cgc 7794 Pro Arg Gly Ala Gly Val Ala Glu Arg Leu Ala Ala Leu Val Arg 2585 2590 2595 cgg gag ggc gga cgc gcc acg aca gcg gtg gcc ggt acg ggc ttc 7839 Arg Glu Gly Gly Arg Ala Thr Thr Ala Val Ala Gly Thr Gly Phe 2600 2605 2610 ggg cgg cgg gac gcg gcc cgg tac acg gtc cgc ccc gac gag gcg 7884 Gly Arg Arg Asp Ala Ala Arg Tyr Thr Val Arg Pro Asp Glu Ala 2615 2620 2625 tcc gac ttc gcg gcg ctg ctc gac cgg ctg gcg gcc gac gac cgc 7929 Ser Asp Phe Ala Ala Leu Leu Asp Arg Leu Ala Ala Asp Asp Arg 2630 2635 2640 cgt ccg gag cgc gtc gtg cac ctc ggg ccg ctg gag ccg tcc ggc 7974 Arg Pro Glu Arg Val Val His Leu Gly Pro Leu Glu Pro Ser Gly 2645 2650 2655 cgc gac ctg gac gcc ggc ggg gtg ctc gac gcc cag cgg tcc ggc 8019 Arg Asp Leu Asp Ala Gly Gly Val Leu Asp Ala Gln Arg Ser Gly 2660 2665 2670 gcc gcc tcg gtc ctg gcc ctg gcc cgg gcg ctg gcc gcc ccc gac 8064 Ala Ala Ser Val Leu Ala Leu Ala Arg Ala Leu Ala Ala Pro Asp 2675 2680 2685 cac gcg ggc cac gcc gtc gac ctg cgg tgc gtc acc ggc ggg gac 8109 His Ala Gly His Ala Val Asp Leu Arg Cys Val Thr Gly Gly Asp 2690 2695 2700 ctg ccg cac gcg acc ctc gcc ggg ctc ctg ccc tcg ctg cgg gac 8154 Leu Pro His Ala Thr Leu Ala Gly Leu Leu Pro Ser Leu Arg Asp 2705 2710 2715 gag cgt ccc ggc ctg tcc gcg ggc acg ctg gcc gtg ccg ggc gac 8199 Glu Arg Pro Gly Leu Ser Ala Gly Thr Leu Ala Val Pro Gly Asp 2720 2725 2730 ggg gag ccg gac gac gtg gcg gcg ctg atc gcc gcg gaa ctc gcg 8244 Gly Glu Pro Asp Asp Val Ala Ala Leu Ile Ala Ala Glu Leu Ala 2735 2740 2745 gtc gct ccg gcc gac gcc gag gtg tgc cgg cgg gac ggc ggg cgc 8289 Val Ala Pro Ala Asp Ala Glu Val Cys Arg Arg Asp Gly Gly Arg 2750 2755 2760 ctg gtg cgc cgg ctg gcc cct gta ccg gtg ccc gag tcg gtc acc 8334 Leu Val Arg Arg Leu Ala Pro Val Pro Val Pro Glu Ser Val Thr 2765 2770 2775 gtc ccc gcc tac ggc gac ggc gtc gtc ctg gtg acg ggc ggg ctg 8379 Val Pro Ala Tyr Gly Asp Gly Val Val Leu Val Thr Gly Gly Leu 2780 2785 2790 ggc ggc gtc gcg gcc cac ctc gcc gag cac ctg ctc acc acc gag 8424 Gly Gly Val Ala Ala His Leu Ala Glu His Leu Leu Thr Thr Glu 2795 2800 2805 ccc ggg gta cgg ctg ctc ctg gtc ggc cgc acc ccg ctg ccg gcc 8469 Pro Gly Val Arg Leu Leu Leu Val Gly Arg Thr Pro Leu Pro Ala 2810 2815 2820 ggg gac ccg gcc gcg gat gac gct cgc gcc cgc gcc gcg gcg gtg 8514 Gly Asp Pro Ala Ala Asp Asp Ala Arg Ala Arg Ala Ala Ala Val 2825 2830 2835 ctg cgg cgg ctg cgc gag ctc ggg gag gtc cgc tac gcg gcc gcc 8559 Leu Arg Arg Leu Arg Glu Leu Gly Glu Val Arg Tyr Ala Ala Ala 2840 2845 2850 gac gtc acc gac gag gcg gcg ctg gac gcg gcc gtg gcc gcc gcg 8604 Asp Val Thr Asp Glu Ala Ala Leu Asp Ala Ala Val Ala Ala Ala 2855 2860 2865 acg gac gcc tgg tcg gcc ccg ctg acc ggg atc ctc cac ctc gcc 8649 Thr Asp Ala Trp Ser Ala Pro Leu Thr Gly Ile Leu His Leu Ala 2870 2875 2880 ggg acg atc gaa cgg cgg gcg gcg gcc gac ctc gac ccg gcg gcc 8694 Gly Thr Ile Glu Arg Arg Ala Ala Ala Asp Leu Asp Pro Ala Ala 2885 2890 2895 tgg cgc gcg gcg acc gcg gcc aag atc ggc ggg gcg tgc gtc ctg 8739 Trp Arg Ala Ala Thr Ala Ala Lys Ile Gly Gly Ala Cys Val Leu 2900 2905 2910 gac cgg ctc gcg gcc cgg cac ccg gtc cgg tcg ttc gtc tcc ttc 8784 Asp Arg Leu Ala Ala Arg His Pro Val Arg Ser Phe Val Ser Phe 2915 2920 2925 tcc tcg gtc aac ggc acc ttc ggg gcc gcg ttc ggc gcc cct tac 8829 Ser Ser Val Asn Gly Thr Phe Gly Ala Ala Phe Gly Ala Pro Tyr 2930 2935 2940 gcg gcg gcg tgc gcc ttc ctc gac gcg ctg gcc gtc cgt cag cgg 8874 Ala Ala Ala Cys Ala Phe Leu Asp Ala Leu Ala Val Arg Gln Arg 2945 2950 2955 gcg cgg ggg ctg gac gcc cag tcg ctg gcg tgg agc agc tgg cgg 8919 Ala Arg Gly Leu Asp Ala Gln Ser Leu Ala Trp Ser Ser Trp Arg 2960 2965 2970 gac acg ggg atg agc gag ggc gac gag ctg gcg gcc ctc ggg gag 8964 Asp Thr Gly Met Ser Glu Gly Asp Glu Leu Ala Ala Leu Gly Glu 2975 2980 2985 acg cgc ggc tac cgg gca ctc gac gtg gag tcg gcc ctg cgc tcg 9009 Thr Arg Gly Tyr Arg Ala Leu Asp Val Glu Ser Ala Leu Arg Ser 2990 2995 3000 ttc gac ctc gcc cgc ggc ctc gac gag ccg gtg gta ctc atc ggc 9054 Phe Asp Leu Ala Arg Gly Leu Asp Glu Pro Val Val Leu Ile Gly 3005 3010 3015 gcg gac cgg acg gcg gac ggc gtc cgg cgg ctg gtg gac gcg ccc 9099 Ala Asp Arg Thr Ala Asp Gly Val Arg Arg Leu Val Asp Ala Pro 3020 3025 3030 gcc cgg ccg cgc cat cgg ctc gcc gcc cgg gtg gag ttg gag gag 9144 Ala Arg Pro Arg His Arg Leu Ala Ala Arg Val Glu Leu Glu Glu 3035 3040 3045 ggc gcc gac atc ggc ggg ctg cac gag gcg gcc gtg gcc gcc gcg 9189 Gly Ala Asp Ile Gly Gly Leu His Glu Ala Ala Val Ala Ala Ala 3050 3055 3060 gcg cgc gcc tgc ggc ggc gtc gcc ggg cac ggc gcg gtc gtc cgg 9234 Ala Arg Ala Cys Gly Gly Val Ala Gly His Gly Ala Val Val Arg 3065 3070 3075 gcc gcg tcc tcg gcg gcg tcc gcc gcc gag ggg agc gcg gct tcc 9279 Ala Ala Ser Ser Ala Ala Ser Ala Ala Glu Gly Ser Ala Ala Ser 3080 3085 3090 ggc gcg gcc ggc ggc gac cgc gtc cgc gtg ctg gag gag acc gtc 9324 Gly Ala Ala Gly Gly Asp Arg Val Arg Val Leu Glu Glu Thr Val 3095 3100 3105 ctc gcc gtc tgg cgg cgg gtg ctg ggc cgc gag cgg gtg ggg tcc 9369 Leu Ala Val Trp Arg Arg Val Leu Gly Arg Glu Arg Val Gly Ser 3110 3115 3120 ggg gac aac ttc ttc gac ctg ggc ggg cat tcg ctg ctg ctg gtg 9414 Gly Asp Asn Phe Phe Asp Leu Gly Gly His Ser Leu Leu Leu Val 3125 3130 3135 cgg gcc cag gcc gag ctg aac gag gcc ctg ggc ggc gcg ctg acg 9459 Arg Ala Gln Ala Glu Leu Asn Glu Ala Leu Gly Gly Ala Leu Thr 3140 3145 3150 gtg gtc gac ctg ttc gcc cat ccc aac gcg cgg tcg ctc gcc ggg 9504 Val Val Asp Leu Phe Ala His Pro Asn Ala Arg Ser Leu Ala Gly 3155 3160 3165 cac ttg gcg ggc cgg cgg gac atc acg gcg ccg ggc gac ggc cgg 9549 His Leu Ala Gly Arg Arg Asp Ile Thr Ala Pro Gly Asp Gly Arg 3170 3175 3180 gag gcc ggc ggc gag gag gac ggc ggc tcc gca gcg gcc ggg agc 9594 Glu Ala Gly Gly Glu Glu Asp Gly Gly Ser Ala Ala Ala Gly Ser 3185 3190 3195 gcc ctc ggc gcc acc cgc gag cag gcc cgc cgc cgg ctc gcg gcg 9639 Ala Leu Gly Ala Thr Arg Glu Gln Ala Arg Arg Arg Leu Ala Ala 3200 3205 3210 cgc gcc cag cgg aac ggg aag ggc ccg aag ggc cgg aag ggt cag 9684 Arg Ala Gln Arg Asn Gly Lys Gly Pro Lys Gly Arg Lys Gly Gln 3215 3220 3225 cag gac cag cca ggc cag cag ggc caa gag gag gca tcg cat gct 9729 Gln Asp Gln Pro Gly Gln Gln Gly Gln Glu Glu Ala Ser His Ala 3230 3235 3240 gaa tga 9735 Glu <210> 27 <211> 3244 <212> PRT <213> Streptoverticillium <400> 27 Met Pro Asp Arg Ala Ala Asp Ser Cys Pro Leu Thr Ala Pro Gln Ala 1 5 10 15 Gly Ile Trp Phe Ala Gln Gln Arg Asp Thr Ser Asn Pro Val Phe Thr 20 25 30 Thr Gly Gln Tyr Val Arg Leu Pro Ala Glu Val Asp Pro Glu Arg Phe 35 40 45 Ala Arg Ala Val Glu Arg Ala Leu Gly Glu Val Trp Gly Leu Ala Val 50 55 60 Glu Val Gly Ala Asp Gly Asp Val Pro Val Gln Arg Gly Thr Gly Thr 65 70 75 80 Ala Pro Arg Val Glu Val Val Asp Leu Ser Gly Arg Pro Asp Pro Glu 85 90 95 Ala Val Ala Leu Ala Arg Met Arg Ala Asp Leu Glu Gln Pro Pro Val 100 105 110 Gly Arg Pro Leu Ala Arg Glu Val Leu Phe Arg Trp Gln Gly Gly Ala 115 120 125 Leu Trp Phe His Arg Cys His His Met Leu Leu Asp Gly Tyr Gly Phe 130 135 140 Ser Leu Val Leu Arg Arg Ile Glu Glu Ile His Glu Ala Leu Arg Thr 145 150 155 160 Gly Gly Ser Pro Gly Glu Pro Ala Phe Gly Gly Leu Gly Ala Tyr Leu 165 170 175 Asp Glu Glu Ala Gly Tyr Arg Ala Gly Asp Arg Met Pro Arg Asp Arg 180 185 190 Ala Tyr Trp Leu Asp Ala Leu Ala Glu Leu Pro Pro Pro Val Ser Leu 195 200 205 Ser Gly Thr Pro Pro Glu Pro Ala Arg Gly Ala Pro Leu Lys Ala Arg 210 215 220 Val Asp Val Leu Pro Asp Pro Ala Gly Leu Ala Arg Leu Ala Glu Ser 225 230 235 240 Leu Ser Ala Thr Thr Ala Asp Leu Ala Ile Ala Ala Thr Ala Val Tyr 245 250 255 Gln His Arg Val Thr Gly Ala Ala Asp Val Val Leu Ala Leu Pro Leu 260 265 270 Ala Leu Arg Gly Gly Ala Ala Ala Arg Leu Pro Ser Thr Thr Val Asn 275 280 285 Val Leu Pro Leu Arg Val Arg Val Ala Asp Gly Asp Thr Val Gly Thr 290 295 300 Leu Val Ala Arg Leu Arg Lys Ala Met Arg Glu Leu Arg Arg His Gly 305 310 315 320 Arg Tyr Arg Val Glu Asp Ile Arg Arg Asp Leu Gly Arg Val Thr Asp 325 330 335 Glu Ser Glu Phe Thr Thr Ala Gln Val Asn Ile Lys Ser Tyr Asp Thr 340 345 350 Thr Ile Gly Leu Leu Gly Arg Arg Leu Pro Val Val Asp Leu Ser Pro 355 360 365 Gly Pro Val Asp Asp Ile Ala Phe Val Val Asp Leu Ala Glu Asp Gly 370 375 380 Glu Leu Thr Thr Leu Glu Val Glu Ala Asn Ala Leu Arg Tyr Asp Ala 385 390 395 400 Pro Thr Ala Leu Ala His Gly Arg Gly Leu Gly Arg Leu Leu Gly Ala 405 410 415 Leu Ala Glu Ala Gly Pro Asp Thr Ala Val Asp Asp Leu Gly Ala Val 420 425 430 Gly Pro Ile Tyr Asp Thr Gly His Tyr Leu Asp Leu Arg Gly Pro Val 435 440 445 Asp Arg Glu Gly Leu Arg Ala Ala Gly Val Arg Ala Val Arg Asp Ala 450 455 460 Ala Tyr Gly Leu Val Asp Gly Pro Val Asp Gly Pro Met Gly Glu Ala 465 470 475 480 Ala Ser Gly Pro Ala Gly Gly Ser Ala Asp Thr Ser Ala Asp Gly Glu 485 490 495 Gly Ala Pro Cys Gly Pro Ala Glu Phe Val Asp Leu Ser Gly Glu Ser 500 505 510 Asp Pro Ala Gly Ala Ala Leu Ala Trp Met Arg Ala Glu Leu Ala Arg 515 520 525 Pro Ala Ala Thr Ala Cys Gly His Ala Val Leu Ala Leu Gly Pro Glu 530 535 540 His His Leu Trp Phe Arg Arg Thr Gly Gly Pro Glu Ser Asp Glu Arg 545 550 555 560 Ala Ala Pro Ala Leu Ala Arg Arg Val Ala Ala Leu Ala Gly Ala Pro 565 570 575 Asp Gly Leu Ala Asp Val Ala Asp Val Ala Asp Val Ala Ala Asp Ser 580 585 590 Arg Pro Ala Gly Ser Gly Ser Arg His Arg Glu Ile Ala Val Pro Ala 595 600 605 Ala Leu Gly Arg Arg Met Met Glu Gly Ser Arg Glu Leu Gly Val Gly 610 615 620 Ile Arg Asp Phe Val Ala Ala Ala Val Ala Met Phe Thr Ala Arg Arg 625 630 635 640 Arg Gly Ser Gly Ala Val Glu Leu Tyr Val Pro Ala Ala Asp Gly Thr 645 650 655 Pro Val Pro Leu Pro Leu Asp Leu Thr Gly Thr Thr Thr Leu Ala Glu 660 665 670 Thr Val Ala Ala Val Gln Asp Gly Arg Gly His Arg Ala Thr Ala Asp 675 680 685 Gly Arg Val Ser Gly Pro Ser Val Thr Val Ala Arg Trp Ala Gly Thr 690 695 700 Pro Asp Arg Asp Ala Ala Leu His Leu Val Ser Ala Ala Pro Ala Thr 705 710 715 720 Gly Pro Ala Val Thr Ala Val Leu Gly Glu Asp Arg Val Arg Ala Leu 725 730 735 Gln Val Asp Asp Ala Pro Asp Asp Pro Ala Trp Ser Asp Ser Glu Leu 740 745 750 Arg Arg Phe Ile Arg Leu Leu Asp Ala Val Thr Ala Asp Pro Glu Thr 755 760 765 Thr Leu Ala Gly Val Asp Leu Leu Asp Glu Ala Glu His Arg Thr Leu 770 775 780 Ala Ala Asp Ala Asp Thr Ala His Pro Val Pro Val Thr Thr Leu Asp 785 790 795 800 Arg Leu Val Ala Glu Gln Ile Ala Arg Thr Pro Asp Ala Val Ala Leu 805 810 815 Val Pro Ala Asp Gly Ser Pro Glu Leu Thr Tyr Arg Glu Leu Gly Glu 820 825 830 Arg Val Asp Arg Leu Ala Arg Gly Leu Ala Gly Leu Gly Ala Gly Pro 835 840 845 Gly Thr Ile Val Ala Val Ala Gln Pro Arg Ser Thr Ala Leu Val Val 850 855 860 Ser Leu Leu Ala Val Leu Arg Thr Gly Ala Ala Tyr Ala Pro Leu Asp 865 870 875 880 Leu Asp His Pro Pro Ala Arg Leu Ala Ala Val Leu Glu Asp Val Arg 885 890 895 Pro Val Ala Val Leu Thr Ala Gly Pro Ala Pro Val Ala Leu Pro Ala 900 905 910 Glu Leu Asn Val Val Asp Val Leu Ala Leu Arg Ala Asp Gly Thr Gly 915 920 925 Ala Ala Pro Ala Gly Pro Gly Pro Asp Asp Leu Ala Tyr Val Ile His 930 935 940 Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Ala Val Ala His Arg 945 950 955 960 Ala Val Val Asn Arg Leu Leu Trp Thr Gln Asp Arg Phe Gly Leu Gly 965 970 975 Pro Gly Asp Arg Val Leu Gln Lys Thr Ser Cys Ala Phe Asp Val Ser 980 985 990 Val Trp Glu Phe Phe Trp Pro Leu Ile Ser Gly Ala Thr Leu Val Leu 995 1000 1005 Pro Ala Pro Gly Ala Gln Arg Asp Pro Ala Arg Val Ala Ala Ala 1010 1015 1020 Ile Asp Glu Ala Gly Ile Thr Thr Ala His Phe Val Pro Ser Met 1025 1030 1035 Leu Val Ala Tyr Leu Gly Glu Pro Ala Ala Ala Arg Pro Arg Ala 1040 1045 1050 Leu Arg Arg Ile Leu Cys Ser Gly Glu Ala Leu Pro Thr Glu Ala 1055 1060 1065 Ala Arg Arg Ala Glu Glu Val Thr Gly Ala Glu Val Phe Asn Leu 1070 1075 1080 Tyr Gly Pro Thr Glu Ala Ala Ile Asp Val Ser Trp Trp Pro Leu 1085 1090 1095 Arg Asp Gly Ala Pro Gly Ala Thr Val Pro Ile Gly Arg Ala Val 1100 1105 1110 Trp Asn Thr Arg Leu Asp Val Leu Asp Pro Trp Gly Ala Pro Val 1115 1120 1125 Pro Pro Gly Glu Pro Gly Glu Leu Tyr Ile Ala Gly Asp Gln Leu 1130 1135 1140 Ala Val Gly Tyr Leu Gly Arg Pro Asp Leu Thr Ala Glu Arg Phe 1145 1150 1155 Pro Glu Asp Pro Ala Ala Gly Arg Arg Tyr Arg Thr Gly Asp Leu 1160 1165 1170 Val Arg Arg Leu Pro Ser Gly Ala Leu Glu Phe Leu Gly Arg Leu 1175 1180 1185 Asp His Gln Val Lys Ile Arg Gly Phe Arg Val Glu Leu Gly Glu 1190 1195 1200 Ile Glu Ala Val Leu Thr Glu His Pro Glu Val Ala Ala Ala Val 1205 1210 1215 Val Gly Thr Arg Asp Asp Arg Ala Gly Gly Pro Arg Leu Val Ala 1220 1225 1230 Trp Val Val Pro Ala Pro Ala Glu Lys Asp Gly Glu Asp Gly Phe 1235 1240 1245 Glu Ala Arg Ala Arg Arg Trp His Asp His Leu Ala Ala Arg Leu 1250 1255 1260 Pro Glu His Met Val Pro Thr Ala Val Val Pro Leu Ala Glu Leu 1265 1270 1275 Pro Thr Thr Ala Asn Gly Lys Leu Asp Arg Asp Ala Leu Pro Glu 1280 1285 1290 Pro Pro Glu Pro Thr Ala Ala Ala Arg Glu Pro Asp Gly Pro Glu 1295 1300 1305 Glu Arg Ala Leu Thr Glu Ile Leu Ala Glu Val Leu Gly Ile Glu 1310 1315 1320 Arg Ile Gly Pro Asp Asp Asp Phe Phe Thr Ala Gly Gly His Ser 1325 1330 1335 Leu Thr Ala Ala Arg Ala Ala Thr Met Ile Arg Ala Arg Phe Gly 1340 1345 1350 Val Glu Ile Gly Val Ala Asp Val Phe Ala Ala Arg Cys Ala Ala 1355 1360 1365 Gly Leu Ala Ala Arg Leu Thr Thr Ala Pro Pro Ala Arg Thr Pro 1370 1375 1380 Leu Arg Pro Ala Gly Arg Pro Glu Arg Leu Leu Leu Ser Pro Ala 1385 1390 1395 Gln Arg Gly Leu Trp Phe Leu Asp Arg Leu Asp Asp Gly Pro Thr 1400 1405 1410 Tyr Asn Ile Pro Leu Val Leu Pro Leu Pro Asn Arg Val Asp Ala 1415 1420 1425 Asp Ala Leu Ala Ala Ala Leu Gly Asp Val Ala Ala Arg His Glu 1430 1435 1440 Ser Leu Arg Thr Val Phe Pro Ala Glu Ala Gly Val Pro Tyr Gln 1445 1450 1455 Glu Val Arg Glu Pro Ala Ala Val Pro Leu His Val Val Asp Cys 1460 1465 1470 Pro Ala Glu Glu Ile Gly Ala His Val Glu Ala Ala Ala Arg Arg 1475 1480 1485 Arg Leu Asp Ile Thr Arg Glu Pro Gly Leu Arg Ala Gly Leu Tyr 1490 1495 1500 Gly Pro Ala Asp Gly Glu Arg Thr Leu Val Leu Leu Leu His His 1505 1510 1515 Leu Val Ala Asp Gly Trp Ser Leu Arg Pro Leu Ala Glu Asp Leu 1520 1525 1530 Thr Ala Ala Tyr Ala Ala Arg Ala Ala Gly Arg Ala Pro Glu Leu 1535 1540 1545 Ala Pro Leu Pro Val Gln Phe Ala Asp Tyr Val Leu Trp Gln Arg 1550 1555 1560 Asp Arg Leu Asp Pro Ala Gly Ala Ala Ala Arg Arg Asp Glu Glu 1565 1570 1575 Phe Trp Ser Ala Ala Leu Arg Gly Leu Pro Glu Glu Thr Ala Leu 1580 1585 1590 Pro Phe Asp Arg Pro Arg Pro Ala Arg Pro Thr Gly Arg Gly Gly 1595 1600 1605 Ala Val Asp Leu Ala Val Gly Pro Val Ala His Ala Ala Leu Arg 1610 1615 1620 Glu Leu Ala Arg Ala His Gly Val Ser Leu Phe Thr Val Leu His 1625 1630 1635 Ala Gly Val Ala Ala Leu Leu Thr Gly Leu Gly Ala Gly Thr Asp 1640 1645 1650 Leu Ala Ile Gly Thr Pro Val Ala Gly Arg His Asp Gln Ala Leu 1655 1660 1665 Asp Asp Val Val Gly Leu Val Thr Asn Thr Val Val Leu Arg Thr 1670 1675 1680 Asp Thr Ser Gly Ser Pro Ala Val Ala Glu Leu Leu Ala Arg Val 1685 1690 1695 Gln Glu Ala Asp Arg Ala Ala Trp Ala His Glu Asp Leu Pro Phe 1700 1705 1710 Glu Gln Val Val Glu Leu Val Asn Pro Pro Arg Val Pro Gly Arg 1715 1720 1725 His Pro Leu Phe Thr Val Met Leu Ala Leu Gln Asn Asn Ala Ala 1730 1735 1740 Ala Ala Val Ser Leu Gly Gly Pro Pro Val Pro Leu Arg Pro Ser 1745 1750 1755 Ala Thr Gly Thr Ala Lys Phe Asp Leu Phe Phe Asp Ile Thr Glu 1760 1765 1770 His Val Gly Asp Asp Gly Ser Ala Pro Gly Gly Leu Thr Cys His 1775 1780 1785 Val Glu Phe Ala Arg Asp Leu Phe Asp Pro Ser Thr Ala Arg Leu 1790 1795 1800 Leu Ala Glu Gly Leu Val Thr Val Leu Ala Arg Ala Ala Ala Ala 1805 1810 1815 Pro Gly Ala Arg Leu Gly Asp Leu Val Pro Asp Gly Leu Leu Ala 1820 1825 1830 Gly Arg Asp Ala Ala Pro Glu Ala Val Ser Asp Asp Ala Ala Leu 1835 1840 1845 Glu Ser Arg Val Arg Ser Leu Ser Ala Val Ala Asp Val Ala Val 1850 1855 1860 Thr Arg Pro Ser Asp Gly Gly Pro Val Val Trp Val Val Pro Ala 1865 1870 1875 Arg Pro Gly Ala Asp Asp Asp Ala Arg Arg Leu Leu Ala Asp Glu 1880 1885 1890 Gly Gly Asp Gly Ala Pro Arg Val Thr Ala Val Thr Val Leu Pro 1895 1900 1905 Arg Thr Ala Ala Gly Asp Leu Asp Val Ala Ala Leu His Arg Leu 1910 1915 1920 Pro Val Val Asp Asp Thr Ala Ala Asp Gly Trp Arg Ala Ala Leu 1925 1930 1935 Ala Ala Val Thr Gly Val Arg Ala Ala Ala Val Gly Arg Glu Asp 1940 1945 1950 Val Pro Glu Gly Leu Glu Ala Leu Arg Pro Ala Thr Arg Pro Arg 1955 1960 1965 Thr Val Ala Ala Thr Ala Gly Pro Ala Ala Val His Gln Ala Asp 1970 1975 1980 Arg Ala Leu Ser Leu Ser Glu Gly Pro Pro Leu Pro Pro Ala Glu 1985 1990 1995 Val Gly Gly Trp Pro Glu Ala Leu Arg Arg Ala Ala Ala Gly Gly 2000 2005 2010 Asp His Ala Glu Ile Val His Val Arg Ala Asp Gly Thr Glu Ser 2015 2020 2025 Arg Arg Ser Tyr Ala Ser Leu Ile Glu Glu Ala Glu Arg Val Leu 2030 2035 2040 Gly Gly Leu Arg Ala Leu Gly Leu Arg Ala Gly Asp Gln Val Val 2045 2050 2055 Leu Gln Cys Asp Asp Thr Glu Asp Phe Val Ala Ala Leu Trp Gly 2060 2065 2070 Ala Ile Ala Ala Gly Val Thr Val Val Pro Leu Thr Val Pro Pro 2075 2080 2085 Thr Tyr Ala Thr Asp Ser Ala Ala Val Asn Lys Leu Asp Gly Val 2090 2095 2100 Trp Arg Met Leu Gly Arg Pro Val Val Val Thr Ser Ala Asp Arg 2105 2110 2115 Ala Asp Gly Leu Ala Glu Leu Ala Ala Arg Arg Glu Trp Pro Asp 2120 2125 2130 Pro Arg Ile Val Thr Val Asp Ala Leu Arg Ala Ala Ala Pro Asp 2135 2140 2145 Arg Asp Trp His Gln Ala Arg Pro Asp Asp Leu Leu Leu Met Leu 2150 2155 2160 Leu Thr Ser Gly Ser Thr Gly Leu Pro Lys Ala Val Arg Leu Thr 2165 2170 2175 His Gly Asn Val Leu Ser Arg Ala Val Ala Ala Ala Ala Ala Asn 2180 2185 2190 Ser Leu Thr Glu His Asp Val Ser Leu Asn Trp Ile Pro Leu Asp 2195 2200 2205 His Val Thr Gly Val Val Met Phe His Leu Arg Asp Val Tyr Leu 2210 2215 2220 Gly Ala Arg Gln Val His Ala Pro Thr Gly Trp Val Leu Glu Asp 2225 2230 2235 Pro Leu Arg Trp Trp Glu Leu Ala Asp Arg Trp Arg Val Ser Val 2240 2245 2250 Thr Trp Ala Pro Asn Phe Ala Phe Gly Leu Val Ala Glu Gln Ala 2255 2260 2265 Gly Arg Leu Ala Gly Arg Glu Trp Asp Leu Ser Pro Val Arg Leu 2270 2275 2280 Ile Met Asn Ala Gly Glu Val Val Val Gly Ala Thr Asn Arg Arg 2285 2290 2295 Phe Leu Gln Ala Leu Ala Pro His Gly Leu Pro Ser Asp Val Met 2300 2305 2310 His Pro Gly Trp Gly Met Ser Glu Thr Cys Ser Val Val Thr Asp 2315 2320 2325 Thr Val Leu Asp Pro Gln Pro Pro Pro Gly Gly Asp Glu Thr Phe 2330 2335 2340 Val Ser Cys Gly Arg Pro Tyr Pro Gly Phe Ala Met Arg Val Val 2345 2350 2355 Asp Glu Glu Leu Arg Leu Leu Pro Glu Gly Glu Val Gly Arg Phe 2360 2365 2370 Gln Val Arg Gly Ala Ser Val Thr Ser Gly Tyr His Asp Asn Ala 2375 2380 2385 Ala Ala Asn Ala Glu Ala Phe Thr Ala Asp Gly Trp Phe Asp Thr 2390 2395 2400 Gly Asp Leu Ala Phe Leu Arg Asp Gly Glu Leu Tyr Ile Thr Gly 2405 2410 2415 Arg Ala Lys Asp Val Ile Ile Val Asn Gly Val Asn His Phe Ser 2420 2425 2430 His Glu Ile Glu Ala Cys Val Glu Glu Leu Pro Val Val Val Arg 2435 2440 2445 Ser Phe Thr Ala Ala Val Ala Val Arg Thr Asp Ala Ser Ala Ala 2450 2455 2460 Thr Asp Gln Leu Ala Leu Phe Val His Leu Ala Pro Gly His Asp 2465 2470 2475 Ser Gly Glu Ala Ala Ala Ala Ala Leu Arg Ala Ile Arg Gly Lys 2480 2485 2490 Val Ala Arg Glu Val Gly Val Ala Pro Ala His Val Leu Pro Val 2495 2500 2505 Glu Thr Ala Val Ile Pro Lys Thr Glu Ile Gly Lys Ile Gln Arg 2510 2515 2520 Thr Gln Leu Arg Lys Arg Phe Glu Ala Gly Glu Phe Asp Ala Val 2525 2530 2535 Ala Arg Ala Ala Glu Val Leu Leu Gly Thr Ala Ala Thr Val Pro 2540 2545 2550 His Trp Phe Leu Arg Pro Val Trp Ser Pro Val Thr Arg Pro Ala 2555 2560 2565 Thr Ala Pro Pro Ala Gly Thr Ser Val Leu Ile Val Ala Ala Gly 2570 2575 2580 Pro Arg Gly Ala Gly Val Ala Glu Arg Leu Ala Ala Leu Val Arg 2585 2590 2595 Arg Glu Gly Gly Arg Ala Thr Thr Ala Val Ala Gly Thr Gly Phe 2600 2605 2610 Gly Arg Arg Asp Ala Ala Arg Tyr Thr Val Arg Pro Asp Glu Ala 2615 2620 2625 Ser Asp Phe Ala Ala Leu Leu Asp Arg Leu Ala Ala Asp Asp Arg 2630 2635 2640 Arg Pro Glu Arg Val Val His Leu Gly Pro Leu Glu Pro Ser Gly 2645 2650 2655 Arg Asp Leu Asp Ala Gly Gly Val Leu Asp Ala Gln Arg Ser Gly 2660 2665 2670 Ala Ala Ser Val Leu Ala Leu Ala Arg Ala Leu Ala Ala Pro Asp 2675 2680 2685 His Ala Gly His Ala Val Asp Leu Arg Cys Val Thr Gly Gly Asp 2690 2695 2700 Leu Pro His Ala Thr Leu Ala Gly Leu Leu Pro Ser Leu Arg Asp 2705 2710 2715 Glu Arg Pro Gly Leu Ser Ala Gly Thr Leu Ala Val Pro Gly Asp 2720 2725 2730 Gly Glu Pro Asp Asp Val Ala Ala Leu Ile Ala Ala Glu Leu Ala 2735 2740 2745 Val Ala Pro Ala Asp Ala Glu Val Cys Arg Arg Asp Gly Gly Arg 2750 2755 2760 Leu Val Arg Arg Leu Ala Pro Val Pro Val Pro Glu Ser Val Thr 2765 2770 2775 Val Pro Ala Tyr Gly Asp Gly Val Val Leu Val Thr Gly Gly Leu 2780 2785 2790 Gly Gly Val Ala Ala His Leu Ala Glu His Leu Leu Thr Thr Glu 2795 2800 2805 Pro Gly Val Arg Leu Leu Leu Val Gly Arg Thr Pro Leu Pro Ala 2810 2815 2820 Gly Asp Pro Ala Ala Asp Asp Ala Arg Ala Arg Ala Ala Ala Val 2825 2830 2835 Leu Arg Arg Leu Arg Glu Leu Gly Glu Val Arg Tyr Ala Ala Ala 2840 2845 2850 Asp Val Thr Asp Glu Ala Ala Leu Asp Ala Ala Val Ala Ala Ala 2855 2860 2865 Thr Asp Ala Trp Ser Ala Pro Leu Thr Gly Ile Leu His Leu Ala 2870 2875 2880 Gly Thr Ile Glu Arg Arg Ala Ala Ala Asp Leu Asp Pro Ala Ala 2885 2890 2895 Trp Arg Ala Ala Thr Ala Ala Lys Ile Gly Gly Ala Cys Val Leu 2900 2905 2910 Asp Arg Leu Ala Ala Arg His Pro Val Arg Ser Phe Val Ser Phe 2915 2920 2925 Ser Ser Val Asn Gly Thr Phe Gly Ala Ala Phe Gly Ala Pro Tyr 2930 2935 2940 Ala Ala Ala Cys Ala Phe Leu Asp Ala Leu Ala Val Arg Gln Arg 2945 2950 2955 Ala Arg Gly Leu Asp Ala Gln Ser Leu Ala Trp Ser Ser Trp Arg 2960 2965 2970 Asp Thr Gly Met Ser Glu Gly Asp Glu Leu Ala Ala Leu Gly Glu 2975 2980 2985 Thr Arg Gly Tyr Arg Ala Leu Asp Val Glu Ser Ala Leu Arg Ser 2990 2995 3000 Phe Asp Leu Ala Arg Gly Leu Asp Glu Pro Val Val Leu Ile Gly 3005 3010 3015 Ala Asp Arg Thr Ala Asp Gly Val Arg Arg Leu Val Asp Ala Pro 3020 3025 3030 Ala Arg Pro Arg His Arg Leu Ala Ala Arg Val Glu Leu Glu Glu 3035 3040 3045 Gly Ala Asp Ile Gly Gly Leu His Glu Ala Ala Val Ala Ala Ala 3050 3055 3060 Ala Arg Ala Cys Gly Gly Val Ala Gly His Gly Ala Val Val Arg 3065 3070 3075 Ala Ala Ser Ser Ala Ala Ser Ala Ala Glu Gly Ser Ala Ala Ser 3080 3085 3090 Gly Ala Ala Gly Gly Asp Arg Val Arg Val Leu Glu Glu Thr Val 3095 3100 3105 Leu Ala Val Trp Arg Arg Val Leu Gly Arg Glu Arg Val Gly Ser 3110 3115 3120 Gly Asp Asn Phe Phe Asp Leu Gly Gly His Ser Leu Leu Leu Val 3125 3130 3135 Arg Ala Gln Ala Glu Leu Asn Glu Ala Leu Gly Gly Ala Leu Thr 3140 3145 3150 Val Val Asp Leu Phe Ala His Pro Asn Ala Arg Ser Leu Ala Gly 3155 3160 3165 His Leu Ala Gly Arg Arg Asp Ile Thr Ala Pro Gly Asp Gly Arg 3170 3175 3180 Glu Ala Gly Gly Glu Glu Asp Gly Gly Ser Ala Ala Ala Gly Ser 3185 3190 3195 Ala Leu Gly Ala Thr Arg Glu Gln Ala Arg Arg Arg Leu Ala Ala 3200 3205 3210 Arg Ala Gln Arg Asn Gly Lys Gly Pro Lys Gly Arg Lys Gly Gln 3215 3220 3225 Gln Asp Gln Pro Gly Gln Gln Gly Gln Glu Glu Ala Ser His Ala 3230 3235 3240 Glu <210> 28 <211> 1173 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1173) <223> <400> 28 atg tcc gtc gac cgg tcg cac gac ccc gcc cgc ccc gac gtg gtg gtg 48 Met Ser Val Asp Arg Ser His Asp Pro Ala Arg Pro Asp Val Val Val 1 5 10 15 gtc ggc ctg ggg atc tgg ggg gcc atg acg ctg tgg cgg ctc gcc gcc 96 Val Gly Leu Gly Ile Trp Gly Ala Met Thr Leu Trp Arg Leu Ala Ala 20 25 30 cgc ggt gtc cgg gcg gtg ggg gtc gag cgg ttc gac atc gcg cac gcc 144 Arg Gly Val Arg Ala Val Gly Val Glu Arg Phe Asp Ile Ala His Ala 35 40 45 cgc ggg tcc tcg cac ggc ggt cac cgc atg ttc cgc gag acc tgc ctg 192 Arg Gly Ser Ser His Gly Gly His Arg Met Phe Arg Glu Thr Cys Leu 50 55 60 gag aac gag gcc ctc gtg ccg gtg gcc cgg cgt tcg ctg gag ctg tgg 240 Glu Asn Glu Ala Leu Val Pro Val Ala Arg Arg Ser Leu Glu Leu Trp 65 70 75 80 cgc gag ctg gag gcg ggc acg ggc cgc cgg ctc ttc gag aac acc ggg 288 Arg Glu Leu Glu Ala Gly Thr Gly Arg Arg Leu Phe Glu Asn Thr Gly 85 90 95 ggc ctg ctc atc ggc ccg cgc gac ggc cgg ctg gcc ggc ggc acc atc 336 Gly Leu Leu Ile Gly Pro Arg Asp Gly Arg Leu Ala Gly Gly Thr Ile 100 105 110 gcc tcg gcc gag gcg cac ggc gtc gcg gtc gag gtc ctc gaa ccg gcc 384 Ala Ser Ala Glu Ala His Gly Val Ala Val Glu Val Leu Glu Pro Ala 115 120 125 gag gtc tcg gcc cgc ttc ccg ggg cac gcc ggc atc ccc gaa gga cac 432 Glu Val Ser Ala Arg Phe Pro Gly His Ala Gly Ile Pro Glu Gly His 130 135 140 gtg ggc gtg tgg gag ccc tcg gcg ggc gtc ctg cgg gcc gag gac tcg 480 Val Gly Val Trp Glu Pro Ser Ala Gly Val Leu Arg Ala Glu Asp Ser 145 150 155 160 gtc cgc gcc gcg gtc gag ctg gcg gag cgc ggc ggg gcc acc gtg ctc 528 Val Arg Ala Ala Val Glu Leu Ala Glu Arg Gly Gly Ala Thr Val Leu 165 170 175 cgc ggc acc gag gtg ctc ggc gtc gag ccg gag ggc ggc ggc gta cgg 576 Arg Gly Thr Glu Val Leu Gly Val Glu Pro Glu Gly Gly Gly Val Arg 180 185 190 gtc cgc acc gcc ggg cgc gac ctg gtc gcc ggc cgg gtc gtc ctc acg 624 Val Arg Thr Ala Gly Arg Asp Leu Val Ala Gly Arg Val Val Leu Thr 195 200 205 ccc ggg tgc tgg ctg ccg gac ttc gcc ccc ggc ctg ggc gtc cgc tcc 672 Pro Gly Cys Trp Leu Pro Asp Phe Ala Pro Gly Leu Gly Val Arg Ser 210 215 220 gtc cac ctg ccg atg acg tgg ttc ccg ccg agc ggc gac ccg gcg ctg 720 Val His Leu Pro Met Thr Trp Phe Pro Pro Ser Gly Asp Pro Ala Leu 225 230 235 240 ttc cgc cgc gag ctg ttc ccg gtg ttc atg cgg gag atc gac gcg gac 768 Phe Arg Arg Glu Leu Phe Pro Val Phe Met Arg Glu Ile Asp Ala Asp 245 250 255 acc gtc atc tgg ggc cag ggc gac ggc gac ccc ggg cac gtc aag ctc 816 Thr Val Ile Trp Gly Gln Gly Asp Gly Asp Pro Gly His Val Lys Leu 260 265 270 ggc atc gag cag ggg gcg gac ccg gac ccg tac gat ccc gaa ctc ggc 864 Gly Ile Glu Gln Gly Ala Asp Pro Asp Pro Tyr Asp Pro Glu Leu Gly 275 280 285 gct ccc gcc gtc ccg agc agg ccc tgg gag cgg ctc ggc gag gtg ctc 912 Ala Pro Ala Val Pro Ser Arg Pro Trp Glu Arg Leu Gly Glu Val Leu 290 295 300 gcc acc gcc gtc ccc ggg gtg ggg cgc gta ccg tcg cgg atc ctg cac 960 Ala Thr Ala Val Pro Gly Val Gly Arg Val Pro Ser Arg Ile Leu His 305 310 315 320 tgc ggg atc acg acg acc gcc gac ggg cag ttc gtg ctc ggc gcc tcc 1008 Cys Gly Ile Thr Thr Thr Ala Asp Gly Gln Phe Val Leu Gly Ala Ser 325 330 335 ccg gcc gac ccc cgg gtc gtg ctg gcc ggg ggg tgc aac ggc tac gga 1056 Pro Ala Asp Pro Arg Val Val Leu Ala Gly Gly Cys Asn Gly Tyr Gly 340 345 350 ttc aag cac gcc gcc gcc gtc ggg gac ctc ctc gcc gac atc gtg ctg 1104 Phe Lys His Ala Ala Ala Val Gly Asp Leu Leu Ala Asp Ile Val Leu 355 360 365 ggt gcc gcg ggg ccc gct ccc ctg ccg ttc gcc gcg ccc ggc cgg ccg 1152 Gly Ala Ala Gly Pro Ala Pro Leu Pro Phe Ala Ala Pro Gly Arg Pro 370 375 380 gcc gcg gcg gac cac atc tga 1173 Ala Ala Ala Asp His Ile 385 390 <210> 29 <211> 390 <212> PRT <213> Streptoverticillium <400> 29 Met Ser Val Asp Arg Ser His Asp Pro Ala Arg Pro Asp Val Val Val 1 5 10 15 Val Gly Leu Gly Ile Trp Gly Ala Met Thr Leu Trp Arg Leu Ala Ala 20 25 30 Arg Gly Val Arg Ala Val Gly Val Glu Arg Phe Asp Ile Ala His Ala 35 40 45 Arg Gly Ser Ser His Gly Gly His Arg Met Phe Arg Glu Thr Cys Leu 50 55 60 Glu Asn Glu Ala Leu Val Pro Val Ala Arg Arg Ser Leu Glu Leu Trp 65 70 75 80 Arg Glu Leu Glu Ala Gly Thr Gly Arg Arg Leu Phe Glu Asn Thr Gly 85 90 95 Gly Leu Leu Ile Gly Pro Arg Asp Gly Arg Leu Ala Gly Gly Thr Ile 100 105 110 Ala Ser Ala Glu Ala His Gly Val Ala Val Glu Val Leu Glu Pro Ala 115 120 125 Glu Val Ser Ala Arg Phe Pro Gly His Ala Gly Ile Pro Glu Gly His 130 135 140 Val Gly Val Trp Glu Pro Ser Ala Gly Val Leu Arg Ala Glu Asp Ser 145 150 155 160 Val Arg Ala Ala Val Glu Leu Ala Glu Arg Gly Gly Ala Thr Val Leu 165 170 175 Arg Gly Thr Glu Val Leu Gly Val Glu Pro Glu Gly Gly Gly Val Arg 180 185 190 Val Arg Thr Ala Gly Arg Asp Leu Val Ala Gly Arg Val Val Leu Thr 195 200 205 Pro Gly Cys Trp Leu Pro Asp Phe Ala Pro Gly Leu Gly Val Arg Ser 210 215 220 Val His Leu Pro Met Thr Trp Phe Pro Pro Ser Gly Asp Pro Ala Leu 225 230 235 240 Phe Arg Arg Glu Leu Phe Pro Val Phe Met Arg Glu Ile Asp Ala Asp 245 250 255 Thr Val Ile Trp Gly Gln Gly Asp Gly Asp Pro Gly His Val Lys Leu 260 265 270 Gly Ile Glu Gln Gly Ala Asp Pro Asp Pro Tyr Asp Pro Glu Leu Gly 275 280 285 Ala Pro Ala Val Pro Ser Arg Pro Trp Glu Arg Leu Gly Glu Val Leu 290 295 300 Ala Thr Ala Val Pro Gly Val Gly Arg Val Pro Ser Arg Ile Leu His 305 310 315 320 Cys Gly Ile Thr Thr Thr Ala Asp Gly Gln Phe Val Leu Gly Ala Ser 325 330 335 Pro Ala Asp Pro Arg Val Val Leu Ala Gly Gly Cys Asn Gly Tyr Gly 340 345 350 Phe Lys His Ala Ala Ala Val Gly Asp Leu Leu Ala Asp Ile Val Leu 355 360 365 Gly Ala Ala Gly Pro Ala Pro Leu Pro Phe Ala Ala Pro Gly Arg Pro 370 375 380 Ala Ala Ala Asp His Ile 385 390 <210> 30 <211> 1062 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1062) <223> <400> 30 atg gat ttc ggt ctg acc ttc ttc ccc gcg ctc gac gag cgg gac aag 48 Met Asp Phe Gly Leu Thr Phe Phe Pro Ala Leu Asp Glu Arg Asp Lys 1 5 10 15 gcg ccg cac gac tac ttc gac gac tgc ctg gcc ctc gcc gtc gac gcc 96 Ala Pro His Asp Tyr Phe Asp Asp Cys Leu Ala Leu Ala Val Asp Ala 20 25 30 gac cgg ctg ggc tac gag cac gtc cag gtg gtc gag cac cac ctc ggg 144 Asp Arg Leu Gly Tyr Glu His Val Gln Val Val Glu His His Leu Gly 35 40 45 ccc tac ggg ggg tac agc ccc gac ccg gtg gtc ctg ctc tcg gcc atc 192 Pro Tyr Gly Gly Tyr Ser Pro Asp Pro Val Val Leu Leu Ser Ala Ile 50 55 60 gcc gcg cgt acc gag cgg ctg cgc atc acc acc ggc gcg gtc atc ccc 240 Ala Ala Arg Thr Glu Arg Leu Arg Ile Thr Thr Gly Ala Val Ile Pro 65 70 75 80 gcc ttc gac cac ccg ctc aag ctg gcc ggg cgg ctg gcg atg ctg gac 288 Ala Phe Asp His Pro Leu Lys Leu Ala Gly Arg Leu Ala Met Leu Asp 85 90 95 cag ctg agc ggc ggc cgg gtc gac gtc ggc gtc gga cgg gcc ttc ctg 336 Gln Leu Ser Gly Gly Arg Val Asp Val Gly Val Gly Arg Ala Phe Leu 100 105 110 ccg cac gag ttc acg gcg ttc gag gtg tcg atg gag gag agc cgg gcg 384 Pro His Glu Phe Thr Ala Phe Glu Val Ser Met Glu Glu Ser Arg Ala 115 120 125 cgc ttc acc gag gcg ctg cgg gcc ttc gtc gcg ctc tgg acc ggg acg 432 Arg Phe Thr Glu Ala Leu Arg Ala Phe Val Ala Leu Trp Thr Gly Thr 130 135 140 gac gtg gtc ttc gag ggc gag ttc cac cgc ttc ggg tcg gtg acg ctc 480 Asp Val Val Phe Glu Gly Glu Phe His Arg Phe Gly Ser Val Thr Leu 145 150 155 160 acc ccg cgc ccg cac cag acg ccg cat cct ccg ctg ttc gtc gcc tcg 528 Thr Pro Arg Pro His Gln Thr Pro His Pro Pro Leu Phe Val Ala Ser 165 170 175 gcg tcc agc gcc gag tcc tgc gcc gcc gcc ggc cgc gag ggg cac aac 576 Ala Ser Ser Ala Glu Ser Cys Ala Ala Ala Gly Arg Glu Gly His Asn 180 185 190 ctg cag atc gtg ccg acc atc acc agc ggt gag cag ttc gcg gag atg 624 Leu Gln Ile Val Pro Thr Ile Thr Ser Gly Glu Gln Phe Ala Glu Met 195 200 205 ctc gcg gcc tac cgc gag gcc ttc gcc gcc cac cac ccg gac cgc gcg 672 Leu Ala Ala Tyr Arg Glu Ala Phe Ala Ala His His Pro Asp Arg Ala 210 215 220 ccg cgc atc cag gtc aag tac agc tgc tac ctg gac cgg gac cgc gac 720 Pro Arg Ile Gln Val Lys Tyr Ser Cys Tyr Leu Asp Arg Asp Arg Asp 225 230 235 240 agc gcc tgg cgg gcg gcc gag gcg gcg gag tcc aac tac ctg gac aag 768 Ser Ala Trp Arg Ala Ala Glu Ala Ala Glu Ser Asn Tyr Leu Asp Lys 245 250 255 atg agc ggc gcc gtc aag agc tgg cag ggc gcc gcg acc gcg cag tac 816 Met Ser Gly Ala Val Lys Ser Trp Gln Gly Ala Ala Thr Ala Gln Tyr 260 265 270 ccg ggg tac gag aag ctc gcc gac aag gtc gcc tcc tcc gac ctg cgc 864 Pro Gly Tyr Glu Lys Leu Ala Asp Lys Val Ala Ser Ser Asp Leu Arg 275 280 285 aag tcg tgg gag cag gac aag gtg ctg atc ggc acc acc ggc gac atc 912 Lys Ser Trp Glu Gln Asp Lys Val Leu Ile Gly Thr Thr Gly Asp Ile 290 295 300 acc gag cag ctg gag cgg gtg cgc gag cgg gtg ggc ggc gac gtg acc 960 Thr Glu Gln Leu Glu Arg Val Arg Glu Arg Val Gly Gly Asp Val Thr 305 310 315 320 gtc agc ctg cac atg aac aac ggc gtg acg cca ctg gag cag gcg cgg 1008 Val Ser Leu His Met Asn Asn Gly Val Thr Pro Leu Glu Gln Ala Arg 325 330 335 tgg gcg gtc gcc gag ttc gcc gcc gag atc gcg ccg cgg ttc gcg gct 1056 Trp Ala Val Ala Glu Phe Ala Ala Glu Ile Ala Pro Arg Phe Ala Ala 340 345 350 gcc tga 1062 Ala <210> 31 <211> 353 <212> PRT <213> Streptoverticillium <400> 31 Met Asp Phe Gly Leu Thr Phe Phe Pro Ala Leu Asp Glu Arg Asp Lys 1 5 10 15 Ala Pro His Asp Tyr Phe Asp Asp Cys Leu Ala Leu Ala Val Asp Ala 20 25 30 Asp Arg Leu Gly Tyr Glu His Val Gln Val Val Glu His His Leu Gly 35 40 45 Pro Tyr Gly Gly Tyr Ser Pro Asp Pro Val Val Leu Leu Ser Ala Ile 50 55 60 Ala Ala Arg Thr Glu Arg Leu Arg Ile Thr Thr Gly Ala Val Ile Pro 65 70 75 80 Ala Phe Asp His Pro Leu Lys Leu Ala Gly Arg Leu Ala Met Leu Asp 85 90 95 Gln Leu Ser Gly Gly Arg Val Asp Val Gly Val Gly Arg Ala Phe Leu 100 105 110 Pro His Glu Phe Thr Ala Phe Glu Val Ser Met Glu Glu Ser Arg Ala 115 120 125 Arg Phe Thr Glu Ala Leu Arg Ala Phe Val Ala Leu Trp Thr Gly Thr 130 135 140 Asp Val Val Phe Glu Gly Glu Phe His Arg Phe Gly Ser Val Thr Leu 145 150 155 160 Thr Pro Arg Pro His Gln Thr Pro His Pro Pro Leu Phe Val Ala Ser 165 170 175 Ala Ser Ser Ala Glu Ser Cys Ala Ala Ala Gly Arg Glu Gly His Asn 180 185 190 Leu Gln Ile Val Pro Thr Ile Thr Ser Gly Glu Gln Phe Ala Glu Met 195 200 205 Leu Ala Ala Tyr Arg Glu Ala Phe Ala Ala His His Pro Asp Arg Ala 210 215 220 Pro Arg Ile Gln Val Lys Tyr Ser Cys Tyr Leu Asp Arg Asp Arg Asp 225 230 235 240 Ser Ala Trp Arg Ala Ala Glu Ala Ala Glu Ser Asn Tyr Leu Asp Lys 245 250 255 Met Ser Gly Ala Val Lys Ser Trp Gln Gly Ala Ala Thr Ala Gln Tyr 260 265 270 Pro Gly Tyr Glu Lys Leu Ala Asp Lys Val Ala Ser Ser Asp Leu Arg 275 280 285 Lys Ser Trp Glu Gln Asp Lys Val Leu Ile Gly Thr Thr Gly Asp Ile 290 295 300 Thr Glu Gln Leu Glu Arg Val Arg Glu Arg Val Gly Gly Asp Val Thr 305 310 315 320 Val Ser Leu His Met Asn Asn Gly Val Thr Pro Leu Glu Gln Ala Arg 325 330 335 Trp Ala Val Ala Glu Phe Ala Ala Glu Ile Ala Pro Arg Phe Ala Ala 340 345 350 Ala <210> 32 <211> 630 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(630) <223> <400> 32 atg agc agc gaa gta ccc gag atc agg gtc agc gac gag cgg gtc aac 48 Met Ser Ser Glu Val Pro Glu Ile Arg Val Ser Asp Glu Arg Val Asn 1 5 10 15 cgc acg ctc acc gcg gtc aac gcc cgg gcg gcc gag cac gac cgg tcg 96 Arg Thr Leu Thr Ala Val Asn Ala Arg Ala Ala Glu His Asp Arg Ser 20 25 30 cta ttc gag cag gtg cgc gac tcg ctg gcg gtc gcg gtg ccg ccg gag 144 Leu Phe Glu Gln Val Arg Asp Ser Leu Ala Val Ala Val Pro Pro Glu 35 40 45 gcg ggc acg ctg atg tac cag ctc gtg cgc gcc acc cgg gcc gcc aag 192 Ala Gly Thr Leu Met Tyr Gln Leu Val Arg Ala Thr Arg Ala Ala Lys 50 55 60 gtg gtg gag ctg ggg atg tcg ctc ggc gtc tcc acg gtc tac ctc gcc 240 Val Val Glu Leu Gly Met Ser Leu Gly Val Ser Thr Val Tyr Leu Ala 65 70 75 80 gcc gcc gtg cgc gac aac ggg ggc gag ggg cgg gtc tac acg acc gag 288 Ala Ala Val Arg Asp Asn Gly Gly Glu Gly Arg Val Tyr Thr Thr Glu 85 90 95 atc gac gag gcg aag atc aag cag ggc cgc gcc acc ctg gcc gac gcc 336 Ile Asp Glu Ala Lys Ile Lys Gln Gly Arg Ala Thr Leu Ala Asp Ala 100 105 110 ggc gtc gcc gac ctc gtc gag gtg ctg gag ggc gac gcg ctc cag acc 384 Gly Val Ala Asp Leu Val Glu Val Leu Glu Gly Asp Ala Leu Gln Thr 115 120 125 ctg gac tcg gtg ccc gac ggc gtc cag ttc gtc ctg ctc gac ggc tgg 432 Leu Asp Ser Val Pro Asp Gly Val Gln Phe Val Leu Leu Asp Gly Trp 130 135 140 aac gag agc tac ctg cgg gtg atg aag atc ctg gag ccc aag ctc gcg 480 Asn Glu Ser Tyr Leu Arg Val Met Lys Ile Leu Glu Pro Lys Leu Ala 145 150 155 160 ccg ggc gcc ctc gtg ctc gcc gac gac gtc aac ctc ttc ggc gag ggc 528 Pro Gly Ala Leu Val Leu Ala Asp Asp Val Asn Leu Phe Gly Glu Gly 165 170 175 tgc gtg gac ttc ctg gag tac gtc cgc gac ccc gcg aac ggc tac ctg 576 Cys Val Asp Phe Leu Glu Tyr Val Arg Asp Pro Ala Asn Gly Tyr Leu 180 185 190 tcc gtc aac ttc ccg atg ggc gag ggc ctg gag ctc agc atg cgc gtg 624 Ser Val Asn Phe Pro Met Gly Glu Gly Leu Glu Leu Ser Met Arg Val 195 200 205 ggc tga 630 Gly <210> 33 <211> 209 <212> PRT <213> Streptoverticillium <400> 33 Met Ser Ser Glu Val Pro Glu Ile Arg Val Ser Asp Glu Arg Val Asn 1 5 10 15 Arg Thr Leu Thr Ala Val Asn Ala Arg Ala Ala Glu His Asp Arg Ser 20 25 30 Leu Phe Glu Gln Val Arg Asp Ser Leu Ala Val Ala Val Pro Pro Glu 35 40 45 Ala Gly Thr Leu Met Tyr Gln Leu Val Arg Ala Thr Arg Ala Ala Lys 50 55 60 Val Val Glu Leu Gly Met Ser Leu Gly Val Ser Thr Val Tyr Leu Ala 65 70 75 80 Ala Ala Val Arg Asp Asn Gly Gly Glu Gly Arg Val Tyr Thr Thr Glu 85 90 95 Ile Asp Glu Ala Lys Ile Lys Gln Gly Arg Ala Thr Leu Ala Asp Ala 100 105 110 Gly Val Ala Asp Leu Val Glu Val Leu Glu Gly Asp Ala Leu Gln Thr 115 120 125 Leu Asp Ser Val Pro Asp Gly Val Gln Phe Val Leu Leu Asp Gly Trp 130 135 140 Asn Glu Ser Tyr Leu Arg Val Met Lys Ile Leu Glu Pro Lys Leu Ala 145 150 155 160 Pro Gly Ala Leu Val Leu Ala Asp Asp Val Asn Leu Phe Gly Glu Gly 165 170 175 Cys Val Asp Phe Leu Glu Tyr Val Arg Asp Pro Ala Asn Gly Tyr Leu 180 185 190 Ser Val Asn Phe Pro Met Gly Glu Gly Leu Glu Leu Ser Met Arg Val 195 200 205 Gly <210> 34 <211> 1341 <212> DNA <213> Streptoverticillium <220> <221> CDS <222> (1)..(1341) <223> <400> 34 atg acg gaa ctg cgt gac gcg gtg ctg cgt ggc gcg tcc ccc gag gaa 48 Met Thr Glu Leu Arg Asp Ala Val Leu Arg Gly Ala Ser Pro Glu Glu 1 5 10 15 ctg ctg cgc gcc ccc ctc ccg gcc acc tac cgg gcc gcc cac ctg cgc 96 Leu Leu Arg Ala Pro Leu Pro Ala Thr Tyr Arg Ala Ala His Leu Arg 20 25 30 gcc gag gac gtc ggc atg ttc gac ggc acg gac ggc gac cgc gac gtg 144 Ala Glu Asp Val Gly Met Phe Asp Gly Thr Asp Gly Asp Arg Asp Val 35 40 45 cgc aag tcg gtg gcc gtg ggc cag gtg ccg ctg ccc gag atc gcg ccc 192 Arg Lys Ser Val Ala Val Gly Gln Val Pro Leu Pro Glu Ile Ala Pro 50 55 60 gac gag gtc ctg atc gcg gtc atg gcc gcc gcg gtc aac tac aac tcc 240 Asp Glu Val Leu Ile Ala Val Met Ala Ala Ala Val Asn Tyr Asn Ser 65 70 75 80 gtg tgg tcg gcg acg ttc ctg ccg atg ccg acc ttc cgc ttc ctc gag 288 Val Trp Ser Ala Thr Phe Leu Pro Met Pro Thr Phe Arg Phe Leu Glu 85 90 95 aag tac gcc cgc cag ggc ggc tgg gca gca cgc cac gac cag ccc tac 336 Lys Tyr Ala Arg Gln Gly Gly Trp Ala Ala Arg His Asp Gln Pro Tyr 100 105 110 cac gtg atc ggc tcc gac tgc tcg ggc gtc gtc gtg cgc gtc ggc tcc 384 His Val Ile Gly Ser Asp Cys Ser Gly Val Val Val Arg Val Gly Ser 115 120 125 ggc gtg cgc cgg tgg cgg gtc ggc gac cac gtg gtg atc cac ccg gtg 432 Gly Val Arg Arg Trp Arg Val Gly Asp His Val Val Ile His Pro Val 130 135 140 cac gtg gac gac cag ggc gcc gcc acc cac gac gac gcc atg atg gac 480 His Val Asp Asp Gln Gly Ala Ala Thr His Asp Asp Ala Met Met Asp 145 150 155 160 gac cag cag cgc gcc tgg ggg tac gag acc aac ttc ggc gcc ttc ggc 528 Asp Gln Gln Arg Ala Trp Gly Tyr Glu Thr Asn Phe Gly Ala Phe Gly 165 170 175 gag tac gcc gtc gcc cgc gcc agc caa ctg gtc gcc aag ccc ggc cac 576 Glu Tyr Ala Val Ala Arg Ala Ser Gln Leu Val Ala Lys Pro Gly His 180 185 190 ttg acg tgg gag gag tcg gcg gcg aac acg ctg tgc acc acc acg tcg 624 Leu Thr Trp Glu Glu Ser Ala Ala Asn Thr Leu Cys Thr Thr Thr Ser 195 200 205 tac cgc atg ctc gtc ggg gcg cac ggc gcc cgg atg aag cag ggg gac 672 Tyr Arg Met Leu Val Gly Ala His Gly Ala Arg Met Lys Gln Gly Asp 210 215 220 gtg gtc ctg gtc tgg ggc gcg gcg ggc ggc ctg ggg acg tac gcc gtg 720 Val Val Leu Val Trp Gly Ala Ala Gly Gly Leu Gly Thr Tyr Ala Val 225 230 235 240 cag ttg gtc aag aac ggc ggc ggt atc ccc gtc gcc gtc gtc agc tcg 768 Gln Leu Val Lys Asn Gly Gly Gly Ile Pro Val Ala Val Val Ser Ser 245 250 255 ccc gcg aag gcg gag gcg gtc cgc cgg ctg ggc tgc gag cac gtc atc 816 Pro Ala Lys Ala Glu Ala Val Arg Arg Leu Gly Cys Glu His Val Ile 260 265 270 gac cgc acc gaa ctc ggg ctc acc ggc gac ccc tcg ggc gac ttc gac 864 Asp Arg Thr Glu Leu Gly Leu Thr Gly Asp Pro Ser Gly Asp Phe Asp 275 280 285 gcc gtg cgg gag atc ggc aag cgg ctg ggc gcc cgc atc cgc gaa ctc 912 Ala Val Arg Glu Ile Gly Lys Arg Leu Gly Ala Arg Ile Arg Glu Leu 290 295 300 gcc ggc cgc gac ccc gac atc gtc ttc gag cac acc ggc cgg gcc acc 960 Ala Gly Arg Asp Pro Asp Ile Val Phe Glu His Thr Gly Arg Ala Thr 305 310 315 320 ttc gcc ctc tcg gtg ttc gtc gtc cgc cgc ggc ggc acc gtc gtc acc 1008 Phe Ala Leu Ser Val Phe Val Val Arg Arg Gly Gly Thr Val Val Thr 325 330 335 tgc gga tcc agc tcg ggc tac cgg cac ctg tac gac aac cgg tac ctg 1056 Cys Gly Ser Ser Ser Gly Tyr Arg His Leu Tyr Asp Asn Arg Tyr Leu 340 345 350 tgg atg aag ctg aac acc gtc atc ggc agc cac ggc gga aac ctg cag 1104 Trp Met Lys Leu Asn Thr Val Ile Gly Ser His Gly Gly Asn Leu Gln 355 360 365 gaa gcc acc gag agc acc cgc ctg atc gcc tcc ggc gcg atc gtt ccg 1152 Glu Ala Thr Glu Ser Thr Arg Leu Ile Ala Ser Gly Ala Ile Val Pro 370 375 380 gcg ctc tcc gag gtc cac ccc ttc gag gac gtg gcc gag gcg atg cgg 1200 Ala Leu Ser Glu Val His Pro Phe Glu Asp Val Ala Glu Ala Met Arg 385 390 395 400 cgg gtc cag ctc aac gag cac gtc ggc aag gtc gtc gtc ctg tgc cag 1248 Arg Val Gln Leu Asn Glu His Val Gly Lys Val Val Val Leu Cys Gln 405 410 415 gcc ccc acc gcc ggc ctg ggc gtg acc gac ccg gag ctg cgg gaa cgg 1296 Ala Pro Thr Ala Gly Leu Gly Val Thr Asp Pro Glu Leu Arg Glu Arg 420 425 430 ctg ggg gag gag cgg acg gca ccc ctg ctg cgg gac tcc gcc tga 1341 Leu Gly Glu Glu Arg Thr Ala Pro Leu Leu Arg Asp Ser Ala 435 440 445 <210> 35 <211> 446 <212> PRT <213> Streptoverticillium <400> 35 Met Thr Glu Leu Arg Asp Ala Val Leu Arg Gly Ala Ser Pro Glu Glu 1 5 10 15 Leu Leu Arg Ala Pro Leu Pro Ala Thr Tyr Arg Ala Ala His Leu Arg 20 25 30 Ala Glu Asp Val Gly Met Phe Asp Gly Thr Asp Gly Asp Arg Asp Val 35 40 45 Arg Lys Ser Val Ala Val Gly Gln Val Pro Leu Pro Glu Ile Ala Pro 50 55 60 Asp Glu Val Leu Ile Ala Val Met Ala Ala Ala Val Asn Tyr Asn Ser 65 70 75 80 Val Trp Ser Ala Thr Phe Leu Pro Met Pro Thr Phe Arg Phe Leu Glu 85 90 95 Lys Tyr Ala Arg Gln Gly Gly Trp Ala Ala Arg His Asp Gln Pro Tyr 100 105 110 His Val Ile Gly Ser Asp Cys Ser Gly Val Val Val Arg Val Gly Ser 115 120 125 Gly Val Arg Arg Trp Arg Val Gly Asp His Val Val Ile His Pro Val 130 135 140 His Val Asp Asp Gln Gly Ala Ala Thr His Asp Asp Ala Met Met Asp 145 150 155 160 Asp Gln Gln Arg Ala Trp Gly Tyr Glu Thr Asn Phe Gly Ala Phe Gly 165 170 175 Glu Tyr Ala Val Ala Arg Ala Ser Gln Leu Val Ala Lys Pro Gly His 180 185 190 Leu Thr Trp Glu Glu Ser Ala Ala Asn Thr Leu Cys Thr Thr Thr Ser 195 200 205 Tyr Arg Met Leu Val Gly Ala His Gly Ala Arg Met Lys Gln Gly Asp 210 215 220 Val Val Leu Val Trp Gly Ala Ala Gly Gly Leu Gly Thr Tyr Ala Val 225 230 235 240 Gln Leu Val Lys Asn Gly Gly Gly Ile Pro Val Ala Val Val Ser Ser 245 250 255 Pro Ala Lys Ala Glu Ala Val Arg Arg Leu Gly Cys Glu His Val Ile 260 265 270 Asp Arg Thr Glu Leu Gly Leu Thr Gly Asp Pro Ser Gly Asp Phe Asp 275 280 285 Ala Val Arg Glu Ile Gly Lys Arg Leu Gly Ala Arg Ile Arg Glu Leu 290 295 300 Ala Gly Arg Asp Pro Asp Ile Val Phe Glu His Thr Gly Arg Ala Thr 305 310 315 320 Phe Ala Leu Ser Val Phe Val Val Arg Arg Gly Gly Thr Val Val Thr 325 330 335 Cys Gly Ser Ser Ser Gly Tyr Arg His Leu Tyr Asp Asn Arg Tyr Leu 340 345 350 Trp Met Lys Leu Asn Thr Val Ile Gly Ser His Gly Gly Asn Leu Gln 355 360 365 Glu Ala Thr Glu Ser Thr Arg Leu Ile Ala Ser Gly Ala Ile Val Pro 370 375 380 Ala Leu Ser Glu Val His Pro Phe Glu Asp Val Ala Glu Ala Met Arg 385 390 395 400 Arg Val Gln Leu Asn Glu His Val Gly Lys Val Val Val Leu Cys Gln 405 410 415 Ala Pro Thr Ala Gly Leu Gly Val Thr Asp Pro Glu Leu Arg Glu Arg 420 425 430 Leu Gly Glu Glu Arg Thr Ala Pro Leu Leu Arg Asp Ser Ala 435 440 445 <210> 36 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 36 ggggcagcct gctcggcgag 20 <210> 37 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 37 ggtgagctcc ccgatcaggg 20 <210> 38 <211> 21 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 38 gcgctcgtac gcctcgctga t 21 <210> 39 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 39 cgggctcggt ggtgagcagg 20 <210> 40 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 40 gtccgtggcg ccgccggatt 20 <210> 41 <211> 59 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 41 gtcaccgtcc ccgcctacgg cgacggcgtc gtcctggtga ttccggggat ccgtcgacc 59 <210> 42 <211> 58 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 42 ggtcgcgggc gaaggcgtag ccgggcaggt cgggcaggat gtaggctgga gctgcttc 58 <210> 43 <211> 18 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 43 cgtgaccgag gtggcgcg 18 <210> 44 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 44 gtcgtcggat gcgccgtgcg 20 <210> 45 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 45 gcaccttcat gtccgggttg 20 <210> 46 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 46 atcgccgcgt acaccatgac 20 <210> 47 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 47 cgaaggtccg gttgatggtg 20 <210> 48 <211> 20 <212> DNA <213> Artificial <220> <223> Artificially synthesized primer sequence <400> 48 atcgctgcga caccctggag 20

Claims (15)

  1. 하기 (a) 내지 (q)로 이루어지는 군으로부터 선택되는 적어도 하나의 핵산으로서, UK-2 생합성을 유도하고 UK-2의 생산성을 향상시키는, 분리된 핵산:
    (a) SEQ ID NO: 3의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 3의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 3의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 2의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (b) SEQ ID NO: 5의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 5의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 5의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 4의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (c) SEQ ID NO: 7의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 7의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 7의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 6의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (d) SEQ ID NO: 9의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 9의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 9의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 8의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (e) SEQ ID NO: 11의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 11의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 11의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 10의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (f) SEQ ID NO: 13의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 13의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 13의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 12의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (g) SEQ ID NO: 15의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 15의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 15의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 14의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (h) SEQ ID NO: 17의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 17의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 17의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 16의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (i) SEQ ID NO: 19의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 19의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 19의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 18의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (j) SEQ ID NO: 21의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 21의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 21의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 20의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (k) SEQ ID NO: 23의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 23의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 23의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 22의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (l) SEQ ID NO: 25의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 25의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 25의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 24의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (m) SEQ ID NO: 27의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 27의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 27의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 26의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (n) SEQ ID NO: 29의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 29의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 29의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 28의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (o) SEQ ID NO: 31의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 31의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 31의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 30의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
    (p) SEQ ID NO: 33의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 33의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 33의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 32의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산; 및
    (q) SEQ ID NO: 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 35의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 34의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산.
  2. 제 1 항에 있어서, (a) 내지 (q)의 핵산을 모두 포함하는, 핵산.
  3. 제 2 항에 있어서, SEQ ID NO: 1의 염기 서열을 포함하는, 핵산.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산이 삽입된, UK-2 생합성을 유도하고 UK-2 생산성을 향상시키기 위한 벡터.
  5. 시험 박테리아 내에서 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산의 염기 서열 또는 상기 서열에 상보적인 염기 서열을 포함하는 핵산의 존재를 탐지하는 것을 포함하는, UK-2 생산성을 판단하는 방법.
  6. 제 5 항에 있어서, 핵산의 존재를 탐지하는 방법은 PCR 방법인 것인, 방법.
  7. 제 6 항에 있어서, PCR 방법은 SEQ ID NO: 45의 염기 서열을 포함하는 프라이머 및 SEQ ID NO: 46의 염기 서열을 포함하는 프라이머를 사용하여 핵산이 증폭되는 방법인 것인, 방법.
  8. UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아로서, 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산의 염기 서열 또는 상기 서열과 상보적인 염기 서열을 포함하는 핵산의 존재가 제 5 항에 따른 방법에 의해 탐지되는, 박테리아.
  9. 제 4 항에 따른 벡터의 도입에 의해 UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아.
  10. 제 1 항에 따른 핵산이 유전체 내에 삽입된, UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아.
  11. 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산의 염기 서열을 포함하는 핵산의 하나 또는 둘 또는 그 이상의 복제가 각 세포에 존재하는 박테리아.
  12. 제 8 항 내지 제 11 항 중 어느 한 항에 따른 박테리아로서, 스트렙토베르티실룸(Streptoverticillium), 스트렙토마이세스(Streptomyces), 대장균(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 효모(yeasts), 곰팡이(filamentous fungi) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 중 어느 하나인 것인, 박테리아.
  13. UK-2의 생산 방법으로서:
    제 8 항 내지 제 12 항 중 어느 한 항에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2를 수집하는 것을 포함하는, 방법.
  14. UK-2 유도체의 생산 방법으로서:
    제 8 항 내지 제 12 항 중 어느 한 항에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2를 수집하고; 그리고
    수집된 UK-2로부터 하기 식(1) 중 어느 하나로 표시되는 UK-2유도체를 합성하는 것을 포함하는 방법
    [화학식 1]
    Figure pct00030
    (1)
    [식(1)에서,
    R은 2-메틸프로파노일기, 트랜스-2-메틸-2-부타노일기, 3-메틸부타노일기 및 2-메틸부타노일기 중 어느 하나를 나타냄.
    R1은 C1-6 알킬기, 벤질기, C1-10 알킬카르보닐기(C1-10 알킬카보닐기는 카르복실기, 벤질옥시카르보닐기, C1-4 알킬옥시카르보닐기 및 벤질옥시카르보닐아미노기 중 어느 하나로 치환될 수 있음), 벤조일기, C1-4 알킬옥시카르보닐기, (C1-4)알킬옥시카르보닐(C1-4)알킬기, 니트로기로 치환가능한 벤질옥시카르보닐(C1-4)알킬기, C1-6 알킬술포닐, 디(C1-6)알킬포스포릴기, 디페닐포르포리기 및 하기 식(2)으로 표시되는 치환기 중 어느 하나를 나타내고;
    [화학식 2]
    Figure pct00031
    (2)
    (식(2)에서,
    Q는 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
    M은 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
    T는 O, OC(O), OC(O)O, S, SC(O), SC(O)O 및 하기 식(3)으로 표시되는 치환기로 이루어지는 군으로부터 선택됨;
    [화학식 3]
    Figure pct00032
    (3)
    G는 H, C1-6 알킬기, C1-6 알콕시 C1-6 알킬기, C2-6 알케닐기, C2-6 알키닐기, C3-6 시클로알킬기, 아릴기 및 헤테로아릴기로 이루어지는 군으로부터 선택됨.
    G 및 M은 임의적으로 옥소기를 가지는 이소벤조퓨란 고리를 형성할 수 있음.
    M 및 Q는 3-8원 카르보시클릭 시스템을 형성할 수 있음.].
  15. UK-2A 유도체의 제조 방법으로서:
    제 8 항에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2A를 수집하고; 그리고
    수집된 UK-2A로부터 하기 식(4) 내지 (7) 중 어느 하나로 표시되는 UK-2A 유도체를 합성하는 것을 포함하는, 방법.
    [화학식 4]
    Figure pct00033
    (4)
    [화학식 5]
    Figure pct00034
    (5)
    [화학식 6]
    Figure pct00035
    (6)
    [화학식 7]
    Figure pct00036
    (7)
KR1020147036291A 2012-07-09 2013-07-08 Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 KR102159415B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012153986 2012-07-09
JPJP-P-2012-153986 2012-07-09
PCT/JP2013/069081 WO2014010714A1 (en) 2012-07-09 2013-07-08 Uk-2 biosynthetic genes and method for improving uk-2 productivity using the same

Publications (2)

Publication Number Publication Date
KR20150035751A true KR20150035751A (ko) 2015-04-07
KR102159415B1 KR102159415B1 (ko) 2020-09-23

Family

ID=48874462

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147036291A KR102159415B1 (ko) 2012-07-09 2013-07-08 Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법

Country Status (28)

Country Link
US (2) US9365879B2 (ko)
EP (1) EP2731435B1 (ko)
JP (1) JP6263133B2 (ko)
KR (1) KR102159415B1 (ko)
CN (1) CN104427870B (ko)
AU (1) AU2013287626B2 (ko)
BR (1) BR112015000282B1 (ko)
CA (1) CA2878644C (ko)
CR (1) CR20150052A (ko)
CY (1) CY1118197T1 (ko)
DK (1) DK2731435T3 (ko)
EA (1) EA028269B1 (ko)
EC (1) ECSP15001894A (ko)
ES (1) ES2592405T3 (ko)
GT (1) GT201400294A (ko)
IL (1) IL236532B (ko)
IN (1) IN2014KN03120A (ko)
MA (1) MA37790B1 (ko)
MX (1) MX358867B (ko)
NZ (1) NZ703756A (ko)
PE (1) PE20150753A1 (ko)
PH (1) PH12015500004B1 (ko)
PT (1) PT2731435T (ko)
TN (1) TN2014000538A1 (ko)
TW (1) TWI601822B (ko)
UA (1) UA116989C2 (ko)
WO (1) WO2014010714A1 (ko)
ZA (1) ZA201500470B (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017205387A1 (en) * 2016-05-23 2017-11-30 Northwestern University Systems and methods for untargeted metabolomic screening
CN115261291B (zh) * 2021-04-29 2023-10-20 上海医药工业研究院 一种生产uk 2a的基因工程菌及其制备方法和应用
CN114717208B (zh) * 2022-05-18 2024-07-09 上海交通大学 一种酰基CoA合成酶及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07233165A (ja) 1994-02-24 1995-09-05 Suntory Ltd 新規抗真菌化合物
WO1999011127A1 (fr) 1997-08-29 1999-03-11 Meiji Seika Kaisha, Ltd. Agent de lutte contre la piriculariose du riz et agent de lutte contre la tavelure du ble
WO2001018179A1 (fr) 1999-09-07 2001-03-15 Meiji Seika Kaisha, Ltd. Synthases de depsipeptides cycliques, genes correspondants et systeme de production de masse de ces depsipeptides cycliques
WO2003035617A2 (en) * 2001-10-23 2003-05-01 Dow Agrosciences Llc Patent Department Derivatives of uk-2a

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ506249A (en) 1998-02-06 2003-04-29 Meiji Seika Kaisha Antifungal compounds and process for producing the same from UK-2

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07233165A (ja) 1994-02-24 1995-09-05 Suntory Ltd 新規抗真菌化合物
WO1999011127A1 (fr) 1997-08-29 1999-03-11 Meiji Seika Kaisha, Ltd. Agent de lutte contre la piriculariose du riz et agent de lutte contre la tavelure du ble
WO2001018179A1 (fr) 1999-09-07 2001-03-15 Meiji Seika Kaisha, Ltd. Synthases de depsipeptides cycliques, genes correspondants et systeme de production de masse de ces depsipeptides cycliques
WO2003035617A2 (en) * 2001-10-23 2003-05-01 Dow Agrosciences Llc Patent Department Derivatives of uk-2a
US20040192924A1 (en) * 2001-10-23 2004-09-30 Meyer Kevin Gerald Derivatives of uk-2a
JP2005507921A (ja) * 2001-10-23 2005-03-24 ダウ アグロサイエンシィズ エルエルシー Uk−2aの誘導体
JP4560638B2 (ja) * 2001-10-23 2010-10-13 ダウ アグロサイエンシィズ エルエルシー Uk−2aの誘導体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Namwat W. 등, Journal of Bacteriology, 2002년 9월, 184권, 17호, 4811~4818페이지
Ueki M. 등, Journal of antibiotics, 1996년 7월 25일, 49권, 7호, 639~643페이지

Also Published As

Publication number Publication date
AU2013287626A1 (en) 2015-02-05
MA37790A1 (fr) 2017-07-31
IN2014KN03120A (ko) 2015-05-08
DK2731435T3 (en) 2016-09-05
TW201416442A (zh) 2014-05-01
CA2878644A1 (en) 2014-01-16
MX358867B (es) 2018-09-06
US9771606B2 (en) 2017-09-26
MX2014015928A (es) 2015-03-03
PH12015500004A1 (en) 2015-03-02
UA116989C2 (uk) 2018-06-11
EA201590170A1 (ru) 2015-05-29
ECSP15001894A (es) 2018-07-31
PT2731435T (pt) 2016-08-08
US9365879B2 (en) 2016-06-14
AU2013287626B2 (en) 2016-10-20
CN104427870B (zh) 2017-03-08
CR20150052A (es) 2015-08-17
ZA201500470B (en) 2016-04-28
US20140011203A1 (en) 2014-01-09
JP2015523053A (ja) 2015-08-13
EA028269B1 (ru) 2017-10-31
EP2731435A1 (en) 2014-05-21
MA37790B1 (fr) 2019-04-30
TN2014000538A1 (en) 2016-03-30
CN104427870A (zh) 2015-03-18
EP2731435B1 (en) 2016-06-29
WO2014010714A1 (en) 2014-01-16
CA2878644C (en) 2023-10-03
IL236532B (en) 2020-05-31
KR102159415B1 (ko) 2020-09-23
CY1118197T1 (el) 2017-06-28
NZ703756A (en) 2017-11-24
ES2592405T3 (es) 2016-11-30
PH12015500004B1 (en) 2015-03-02
US20160244793A1 (en) 2016-08-25
GT201400294A (es) 2017-08-24
IL236532A0 (en) 2015-02-26
JP6263133B2 (ja) 2018-01-17
PE20150753A1 (es) 2015-05-17
BR112015000282A2 (ko) 2017-08-15
BR112015000282B1 (pt) 2022-04-19
TWI601822B (zh) 2017-10-11

Similar Documents

Publication Publication Date Title
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
CN107868789B (zh) 可利霉素生物合成基因簇
KR102159415B1 (ko) Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
WO1998007868A1 (en) Rifamycin biosynthesis gene cluster
CN110305881B (zh) 一种聚酮类化合物neoenterocins的生物合成基因簇及其应用
CN102517309A (zh) 一种手霉素类抗生素生物合成基因簇
KR102017788B1 (ko) 밀베마이신 d를 생산하는 재조합 미생물 및 밀베마이신 d 생산 방법
CN107164394B (zh) 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用
US6210935B1 (en) Staurosporin biosynthesis gene clusters
US20030113874A1 (en) Genes and proteins for the biosynthesis of rosaramicin
KR20130097538A (ko) 해양 미생물 하헬라 제주엔시스의 제주엔올라이드 생합성 유전자 클러스터
US7105491B2 (en) Biosynthesis of enediyne compounds by manipulation of C-1027 gene pathway
CN107541523B (zh) 曲张链丝菌素生物合成基因簇及其应用
KR101610970B1 (ko) 갈보놀라이드 생합성에 관여하는 유전자
EP1925668A2 (en) Genes involved in the biosynthesis of thiocoraline and heterologous production of same
JP2004173537A (ja) カナマイシン生合成遺伝子
US20040132055A1 (en) Recombinant chalcomycin polyketide synthase and modifying genes
OA17159A (en) UK-2 biosynthetic genes and method for improving UK-2 productivity using the same
KR20110049740A (ko) 타크롤리무스 생산 균주 및 이로부터 얻어진 타크롤리무스 생합성 유전자
KR20140021082A (ko) 스트렙토마이세스 아시디스카비스 에이티씨씨 49003 유래의 이차대사산물 생산 조절 유전자 및 그를 이용한 항생물질의 제조방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant