KR20150035751A - Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 - Google Patents
Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 Download PDFInfo
- Publication number
- KR20150035751A KR20150035751A KR1020147036291A KR20147036291A KR20150035751A KR 20150035751 A KR20150035751 A KR 20150035751A KR 1020147036291 A KR1020147036291 A KR 1020147036291A KR 20147036291 A KR20147036291 A KR 20147036291A KR 20150035751 A KR20150035751 A KR 20150035751A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- gly
- val
- arg
- Prior art date
Links
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N43/00—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds
- A01N43/34—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one nitrogen atom as the only ring hetero atom
- A01N43/40—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one nitrogen atom as the only ring hetero atom six-membered rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/36—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/76—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/16—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
- C12P17/165—Heterorings having nitrogen atoms as the only ring heteroatoms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Environmental Sciences (AREA)
- Dentistry (AREA)
- Pest Control & Pesticides (AREA)
- Agronomy & Crop Science (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
낮은 비용으로 UK-2를 대량 생산할 수 있는 제조 방법을 제공하기 위하여, UK-2 생합성 유전자 클러스터로 예상되는 부위를 식별하기 위해 UK-2를 생산하는 스트렙토베르티실룸 sp. 3-7의 유전체 DNA가 분석되었다. 더욱이, 콜로니 혼성화에 의하여, 상기 부위의 DNA가 성공적으로 분리되었다. 게다가, 상기 DNA는 상기 부위에 존재하는 유전자가 차단된 종(strain)을 준비하는 데에 사용되었다. 상기 종은 UK-2를 생산하지 않는 것으로 밝혀졌다. 상기 유전체 부위는 UK-2 생합성 유전자 클러스터인 것으로 확인되었다. 게다가, 스트렙토베르티실룸 sp. 3-7은 분리된 UK-2 생합성 유전자 클러스터가 삽입된 벡터의 도입에 의하여 형질전환되었다. 또한 상기 형질전환체에 의한 UK-2 생산성은 부모 종(strain)과 비교하여 10 배 내지 60 배 향상된 것으로 나타났다. 더욱이, 이들 형질전환체들 각각의 세포당 UK-2 생합성 유전자 클러스터의 2 복제가 존재하는 것으로 밝혀졌다.
Description
본원은 도열병 방제제 등에 유용한 화합물인 UK-2의 생합성에 필요한 유전자(이하 "UK-2 생합성 유전자"라 칭함) 및 UK-2 생산성을 향상시키기 위한 방법에 관한 것이다. 보다 구체적으로, 본원은 UK-2 생합성 유전자, UK-2 생합성 유전자가 삽입되어 있는 벡터, 벡터가 도입되어 있는 형질전환체, UK-2 생합성 유전자의 존재를 탐지함으로써 UK-2 생산성을 판단하기 위한 방법, UK-2 생합성 유전자의 존재가 상기 방법에 의해 탐지되는 박테리아, 그 유전체 내에 삽입된 UK-2 생합성 유전자를 포함하는 박테리아, UK-2 생합성 유전자 중 하나 또는 둘 또는 그 이상의 복제가 각 세포에 존재하는 박테리아, 및 이들 박테리아 등을 활용함으로써 UK-2 및 UK-2A 유도체를 생산하기 위한 방법에 관한 것이다.
UK-2는 방선균에 의해 2차 대사 산물로서 생산되는 화합물이고, 곰팡이 및 효모를 포함하는 각종 균류에 대하여 안티마이신과 유사한 강한 항진균 작용을 나타낸다. 또한, 배양 세포에 대해서 낮은 세포 독성을 갖기 때문에 UK-2는 도열병 방제제, 농원예용 살진균제, 및 의학 항매제에 유용하다는 것이 밝혀졌다(특허문헌 1, 2). 게다가, 그 측쇄의 구조적 차이에 기초해서 4개의 유사체, UK-2A 내지 D가 자연적으로 존재한다는 것이 드러났다(비특허문헌 1).
UK-2는 방선균(스트렙토베르티실룸 속(genus)에 속하는 박테리아 등)을 배양한 다음, 그것으로부터 UK-2를 수집하여 생산된다. 그러나, 일반적으로 자연에서 분리된 미생물에 의해 생산되는 UK-2(모든 UK-2 인자)의 양은 매우 소량이다. 따라서, 산업적으로 저비용에서 목적물(UK-2)을 사용하기 위해서 생산성을 향상시켜야 한다.
목적물을 생산하는 미생물을 배양하기 위한 방법에 대한 조사, 배지 성분에 대한 조사, 전구체를 첨가하여 발효 조건의 향상, 및 자외선 조사 또는 화학적 돌연변이 유발 변이원을 활용하는 박테리아 균주의 향상을 통해 목적물의 생산성을 개선시킨다. 또한, 이들 방법 외에도, 생산성은 최근에 유전자 재조합을 활용하여 개선되어 왔다.
유전자 재조합에 의해 생산성을 개선시키기 위한 일반적인 방법은 목적물의 생합성에 필요한 유전자 발현의 개선을 포함하는 것이다. 예를 들면, 이 방법이 아고노미세탈레스 내에 PF-1022의 생산성을 향상시킨다고 특허문헌 3에 개시되어 있다.
그러나, 이 방법을 활용할 경우, 목적물의 생합성에 필요한 유전자 또는 공지의 기술을 사용하여 합성된 유전자를 분리시키고, 목적물(미생물을 생산)을 생산하여 미생물용 형질전환법을 확립하는 것이 본질이다. UK-2 생합성 유전자가 아직 밝혀지지 않았기 때문에 UK-2 생합성 유전자를 사용한 형질전환이 행해질 수 없다. 생산성은 유전자 재조합에 의해 향상될 수 없다.
Ueki M. 등, Journal of antibiotics, 1996년 7월 25일, 49권, 7호, 639~643페이지
Namwat W. 등, Journal of Bacteriology, 2002년 9월, 184권, 17호, 4811~4818페이지
본원은 종래 기술에서 상술한 문제의 관점으로 이루어져 왔다. 본원의 목적은 유전자의 도입에 따라 UK-2 생합성에 필요한 유전자를 분리시킴으로써 얻어지는 높은 UK-2 생산성을 갖는 형질전환체를 제공하는 것이다. 게다가, 또 다른 목적은 형질전환체를 사용하여 저비용에서 다량의 UK-2를 생산하는 것이다. 그리고 추가 목적은 유전자의 존재를 탐지함으로써 UK-2 생산성을 판단하기 위한 방법을 제공하는 것이다.
UK-2는 특유의 히드록시피콜린산 골격을 갖는다. 한편, 버지니아마이신이라 불리는 화합물도 히드록시피콜린산 골격을 갖는다. 또한, 그것은 VisA(L-라이신 2-아미노트랜스페라아제) 및 VisB(3-히드록시피콜린산 AMP 리가아제)가 버지니아마이신의 생합성에 관여하는 것으로 드러났다(비특허문헌 2).
따라서, 상기 목적들을 달성하기 위해서, 본 발명자들은 UK-2를 생산하는 스트렙토베르티실룸 sp. 3-7의 유전체 DNA 라이브러리를 먼저 제조하고, 종합적으로 균주의 유전체 DNA의 염기 서열을 판단했다. 이어서, 유전체 DNA에 의해 인코딩된 추측상 단백질의 아미노산 서열과 VisA 및 VisB의 아미노산 서열 간의 상동성 분석을 수행함으로써 생성물과 이들 2개의 아미노산 서열이 높은 상동성을 갖는 유전자가 연속해서 위치되어 있는 유전체 부위를 알아냈다. 또한, 그것은 비리보솜 펩티드 합성 효소(NRPS)와 상동성을 갖는 단백질을 인코딩하는 유전자 및 폴리케티드 합성 효소(PKS)와 상동성을 갖는 단백질을 인코딩하는 유전자가 부위 근처에 위치하고 있다는 것을 알아냈다.
이들 효소는 UK-2 골격을 형성하는데 필요하다고 생각된다. 또한, 방선균의 2차 대사 산물 유전자는 클러스터를 형성한다. 따라서, 유전체 영역은 UK-2 생합성 유전자 클러스터가 될 것으로 기대된다.
이어서, UK-2의 생합성에 필요한 효소를 인코딩할 것으로 기대되는 유전자의 염기 서열의 얻어진 정보에 기초해서 프로브가 제조된다. 프로브를 사용한 콜로니 혼성화에 의해, UK-2 생합성 유전자 클러스터 내에 존재할 것으로 기대되는 DNAs(즉, 유전체 영역 내에 포함되는 DNAs)를 성공적으로 상술한 유전체 DNA 라이브러리로부터 분리했다. 게다가, DNAs는 유전체 영역 내에 존재하는 유전자가 파괴된 스트렙토베르티실룸 sp. 3-7을 제조하는데 사용된다. 상기 균주는 UK-2를 생산하지 않는 것으로 밝혀졌다. 상기 유전체 영역은 UK-2 생합성 유전자 클러스터인 것이 확인되었다. 또한, 스트렙토베르티실룸 sp. 3-7은 분리된 UK-2 생합성 유전자 클러스터가 삽입된 벡터를 도입하여 형질전환된다. 형질전환체에 의한 UK-2 생산성이 친주의 것과 비교해서 약 10~60배 또는 그 이상 향상된다는 것을 알아냈다. 또한, 그것은 UK-2 생합성 유전자 클러스터의 2개의 복제가 각각 이들 형질전환체의 각 세포에 존재하는 것을 확인했다.
구체적으로, 본원은 UK-2 생합성 유전자, UK-2 생합성 유전자가 삽입되어 있는 벡터, 벡터가 도입되어 있는 형질전환체, 및 형질전환체를 활용하여 UK-2 등을 생산하기 위한 방법에 관한 것이다. 보다 구체적으로, 본원은 하기의 것을 제공한다.
<1> 하기 (a) 내지 (q)로 이루어지는 군으로부터 선택되는 적어도 하나의 핵산으로서, UK-2 생합성을 유도하고 UK-2의 생산성을 향상시키는, 분리된 핵산:
(a) SEQ ID NO: 3의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 3의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 3의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 2의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(b) SEQ ID NO: 5의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 5의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 5의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 4의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(c) SEQ ID NO: 7의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 7의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 7의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 6의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(d) SEQ ID NO: 9의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 9의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 9의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 8의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(e) SEQ ID NO: 11의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 11의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 11의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 10의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(f) SEQ ID NO: 13의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 13의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 13의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 12의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(g) SEQ ID NO: 15의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 15의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 15의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 14의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(h) SEQ ID NO: 17의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 17의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 17의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 16의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(i) SEQ ID NO: 19의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 19의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 19의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 18의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(j) SEQ ID NO: 21의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 21의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 21의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 20의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(k) SEQ ID NO: 23의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 23의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 23의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 22의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(l) SEQ ID NO: 25의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 25의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 25의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 24의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(m) SEQ ID NO: 27의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 27의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 27의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 26의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(n) SEQ ID NO: 29의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 29의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 29의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 28의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(o) SEQ ID NO: 31의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 31의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 31의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 30의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(p) SEQ ID NO: 33의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 33의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 33의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 32의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산; 및
(q) SEQ ID NO: 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 35의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 34의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산.
<2> <1>에 있어서, (a) 내지 (q)의 핵산을 모두 포함하는, 핵산.
<3> <2>에 있어서, SEQ ID NO: 1의 염기 서열을 포함하는, 핵산.
<4> <1> 내지 <3> 중 어느 하나에 따른 핵산이 삽입된, UK-2 생합성을 유도하고 UK-2 생산성을 향상시키기 위한 벡터.
<5> 시험 박테리아 내에서 <1> 내지 <3> 중 어느 하나에 따른 핵산의 염기 서열 또는 상기 서열에 상보적인 염기 서열을 포함하는 핵산의 존재를 탐지하는 것을 포함하는, UK-2 생산성을 판단하는 방법.
<6> <5>에 있어서, 핵산의 존재를 탐지하는 방법은 PCR 방법인 것인, 방법.
<7> <5>에 있어서, PCR 방법은 SEQ ID NO: 45의 염기 서열을 포함하는 프라이머 및 SEQ ID NO: 46의 염기 서열을 포함하는 프라이머를 사용하여 핵산이 증폭되는 방법인 것인, 방법.
<8> UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아로서, <1> 내지 <3> 중 어느 하나에 따른 핵산의 염기 서열 또는 상기 서열과 상보적인 염기 서열을 포함하는 핵산의 존재가 <5> 내지 <7> 중 어느 하나에 따른 방법에 의해 탐지되는, 박테리아.
<9> <4>에 따른 벡터의 도입에 의해 UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아.
<10> <1> 내지 <3> 중 어느 하나에 따른 핵산이 유전체 내에 삽입된, UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아.
<11> <1> 내지 <3> 중 어느 하나에 따른 핵산의 염기 서열을 포함하는 핵산의 하나 또는 둘 또는 그 이상의 복제가 각 세포에 존재하는 박테리아.
<12> <8> 내지 <11> 중 어느 하나에 따른 박테리아로서, 스트렙토베르티실룸(Streptoverticillium), 스트렙토마이세스(Streptomyces), 대장균(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 효모(yeasts), 곰팡이(filamentous fungi) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 중 어느 하나인 것인, 박테리아.
<13> UK-2의 생산 방법으로서:
<8> 내지 <12> 중 어느 하나에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2를 수집하는 것을 포함하는, 방법.
<14> UK-2 유도체의 생산 방법으로서:
<8> 내지 <12> 중 어느 하나에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2를 수집하고; 그리고
수집된 UK-2로부터 하기 식(1) 중 어느 하나로 표시되는 UK-2유도체를 합성하는 것을 포함하는 방법
[화학식 1]
[식(1)에서,
R은 2-메틸프로파노일기, 트랜스-2-메틸-2-부타노일기, 3-메틸부타노일기 및 2-메틸부타노일기 중 어느 하나를 나타냄.
R1은 C1 -6 알킬기, 벤질기, C1 -10 알킬카르보닐기(C1 -10 알킬카보닐기는 카르복실기, 벤질옥시카르보닐기, C1 -4 알킬옥시카르보닐기 및 벤질옥시카르보닐아미노기 중 어느 하나로 치환될 수 있음), 벤조일기, C1 -4 알킬옥시카르보닐기, (C1 -4)알킬옥시카르보닐(C1-4)알킬기, 니트로기로 치환가능한 벤질옥시카르보닐(C1-4)알킬기, C1 -6 알킬술포닐, 디(C1-6)알킬포스포릴기, 디페닐포르포리기 및 하기 식(2)으로 표시되는 치환기 중 어느 하나를 나타내고;
[화학식 2]
(식(2)에서,
Q는 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
M은 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
T는 O, OC(O), OC(O)O, S, SC(O), SC(O)O 및 하기 식(3)으로 표시되는 치환기로 이루어지는 군으로부터 선택됨;
[화학식 3]
G는 H, C1 -6 알킬기, C1 -6 알콕시 C1 -6 알킬기, C2 -6 알케닐기, C2 -6 알키닐기, C3-6 시클로알킬기, 아릴기 및 헤테로아릴기로 이루어지는 군으로부터 선택됨.
G 및 M은 임의적으로 옥소기를 가지는 이소벤조퓨란 고리를 형성할 수 있음.
M 및 Q는 3-8원 카르보시클릭 시스템을 형성할 수 있음.].
<15> UK-2A 유도체의 제조 방법으로서:
<8> 내지 <12> 중 어느 하나에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2A를 수집하고; 그리고
수집된 UK-2A로부터 하기 식(4) 내지 (7) 중 어느 하나로 표시되는 UK-2A 유도체를 합성하는 것을 포함하는, 방법.
[화학식 4]
[화학식 5]
(5)
[화학식 6]
[화학식 7]
여기서 사용되는 용어 "아실"은 R이 탄화수소기를 나타내는 카르복시산 R-COOH로부터 OH를 제거함으로써 제공된 RCO-잔기를 의미한다.
여기서 사용되는 용어 "아릴"은 페닐 또는 나프틸을 의미한다. 여기서 사용되는 용어 "헤테로아릴"은 하나 이상의 헤테로원자를 함유하는 5 또는 6원 방향족 고리를 의미하고, 그러한 헤테로원자들은 O, N 및 S로 이루어지는 군으로부터 선택되며, 방향족 고리의 나머지 원자들은 탄소 원자이다.
적절한 예시들은, 이에 제한되는 것은 아니지만, 피리딘, 피리다진, 피리미딘, 피라진, 피롤, 피라졸, 이미다졸, 퓨란, 티오펜, 옥사졸, 이속사졸, 티아졸, 이소티아졸, 퀴놀린, 퀴녹솔린 및 티아디아졸을 포함한다.
본원은 UK-2 생합성 유전자를 박테리아와 같은 숙주 세포 내로 도입함으로써 높은 UK-2 생산성을 가지는 형질전환체(transformant)를 제공할 수 있게 한다. 더욱이, 형질전환체를 이용하여 UK-2를 저비용으로 대량생산하는 것이 가능하다.
게다가, 유전자의 존재를 탐지함으로써 UK-2 생산성을 측정하는 방법을 제공할 수 있다.
<UK-2 생합성 유전자>
본원은 UK-2 생합성 유전자를 제공한다. 아래의 실시예에 기재될 것처럼, 본원의 발명자들은 신규한 UK-2 생합성 유전자들을 분리하였으며, 스트렙토베르티실룸 sp. 3-7의 유전체 DNA의 17 개의 유전자가 표 2에 나타나 있다.
따라서, 본원의 UK-2 생합성 유전자의 일 구현예는 "UK-2 생합성을 유도하고 UK-2의 생산성을 향상시키는 분리된 핵산으로서, 상기 핵산은 SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33 또는 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산" 이고, 전형적으로 "UK-2 생합성을 유도하고 UK-2의 생산성을 향상시키는 분리된 핵산으로서, 상기 핵산은 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34의 염기 서열을 포함하는 핵산"이다.
본원에서 "UK-2 생산성의 향상" 이라는 어구 및 관련 어구들은 박테리아 등이 자연적으로 가지고 있는 UK-2의 생산성의 향상만을 뜻하는 것이 아니라, 자연적으로 UK-2 생산 능력을 가지고 있지 않은 박테리아 등이 UK-2 생산 능력을 취득하는 것 또한 의미한다.
본원에서, 용어 "분리" 및 관련 용어들은 핵산이 원래 존재하던 조건과 상이한 조건 하에 존재하도록 하는 인위적인 처리를 의미한다. 본원의 UK-2 생합성 유전자는 분리될 수 있으며, 예를 들어, 먼저 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34의 염기 서열의 정보를 기반으로 적절한 프라이머를 합성하고, 그리고 스트렙토베르티실룸 sp. 3-7의 유전체 DNA를 주형으로 상기 프라이머를 이용하여 PCR을 수행하는 것에 의할 수 있다. 양자택일적으로, 아래의 실시예에 기재될 것처럼, 본원의 UK-2 생합성 유전자는 스트렙토베르티실룸 sp. 3-7의 유전체 DNA 라이브러리 또는 cDNA 라이브러리로부터, PCR로부터 수득된 증폭 산물을 프로브로 이용하여 콜로니 혼성화를 수행함으로써 또한 분리될 수 있다. 뿐만 아니라, 본원의 UK-2 생합성 유전자는 염기 서열 정보를 기반으로 한 전합성(total chemical synthesis)에 의해 또한 준비될 수 있다.
본원에서, "UK-2"는 하기 식(8)으로 표시되는 화합물이다:
[화학식 8]
여기에서 R은 직쇄형 또는 분지형의 포화 지방족 아실기 또는 직쇄형 또는 분지형의 불포화 지방족 아실기를 나타낸다. 바람직하게는, "UK-2"는 R이 이소부티릴기(2-메틸프로파노일기)인 화합물(UK-2A), R이 티글로일기(트랜스-2-메틸-2-부테노일기)인 화합물(UK-2B), R이 이소발레릴기(3-메틸부타노일기)인 화합물(UK-2C) 그리고 R이 2-메틸부타노일기인 화합물(UK-2D)이다.
더욱이, 본원에서, "UK-2 생합성 유전자"는 UK-2 생합성을 유도할 수 있는 활성을 가지는 단백질을 인코딩하는 유전자이다. "UK-2 생합성을 유도할 수 있는 활성"은, 예를 들어, 아래의 실시예 9에 기재된 방법에 의해 측정될 수 있다. 구체적으로, 시험 단백질을 인코딩하는 핵산이 숙주 세포(예를 들어, 스트렙토베르티실룸 sp. 3-7) 내로 도입될 벡터 등에 삽입된 후에, 숙주 세포에서 생산된 UK-2의 양이 숙주 세포 내에서 강제로 발현되는 시험 단백질에 의해 측정된다. 시험 단백질이 발현되지 않는 숙주 세포에서보다 생산량이 큰 경우, 시험 단백질은 UK-2 생합성을 유도할 수 있는 활성을 가지는 것으로 평가할 수 있다.
당업계에서, UK-2 생합성 유전자의 염기 서열의 정보를 얻을 수 있는 경우, 비록 단백질의 아미노산 서열이 염기서열로부터 인코딩되는 것과 상이하다고 하여도, 당업자는 염기 서열을 수정하여 UK-2 생합성에 관여하는 단백질을 인코딩하는 핵산을 수득할 수 있다. 한편, 자연에서도, 인코딩되는 단백질의 아미노산 서열은 염기 서열의 돌연변이에 의해 돌연변이될 수 있다. 따라서, 본원의 UK-2 생합성 유전자의 또다른 구현예는 "하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33 또는 35 의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산인 분리된 핵산"이다. 여기서, "하나 이상의"는 UK-2 생합성을 유도하는 활성을 여전히 가지는, 변형 후의 UK-2 생합성에 관련된 단백질 내에서 변경된 아미노산의 개수를 뜻한다. 개수는 일반적으로 1 내지 50이고, 바람직하게는 1 내지 40이고, 더욱 바람직하게는 1 내지 수 개 (예를 들어, 1 내지 20, 1 내지 10, 1 내지 8, 및 1 내지 4) 이다.
당업자는 UK-2 생합성 유전자의 염기 서열의 정보에 기초한 자리지정 돌연변이와 같은 공지의 방법에 의하여 그러한 변이를 인코딩하는 핵산을 제조할 수 있다.
더욱이, 당업계에서, UK-2 생합성 유전자의 염기 서열의 정보를 얻을 수 있는 경우, 당업자는 혼성화 기술 또는 PCR 기술을 이용하여 스트렙토베르티실룸 sp. 3-7 외의 다른 종 및 다른 박테리아들로부터 UK-2 생합성 유도 활성을 가지는 단백질을 인코딩하는 핵산(상동유전자)를 수득할 수 있다. 따라서, 본원의 UK-2 생합성 유전자의 또다른 구현예는 "SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32 또는 34의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산인 분리된 핵산"이다.
그러한 상동유전자를 분리하기 위해서, 보통 엄격한 조건 하에서 혼성화 반응을 수행한다. "엄격한 조건"은 혼성화 후 낮은 염 농도를 가지는 용액 내에서 높은 온도로 막 세척 공정이 수행되는 것이다. "엄격한 조건"은, 예를 들어, 2xSSC 농도(1xSSC : 15 mM 시트르산 삼나트륨, 150 mM 염화나트륨)의 0.5% SDS 용액에서 60℃에서 20 분 동안 세척하는 조건을 포함한다. 추가적으로, 예를 들어, 혼성화는 알려진 ECL Direct DNA/RNA Labeling and Detection System (Amersham Pharmacia Biotech Inc. 제조)에 첨부된 지시서에 기재된 방법에 따라 수행될 수 있다.
더욱이, 그러한 방법에 의해 수득된 상동유전자에 의해 인코딩되는 단백질은 일반적으로 SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33 또는 35의 아미노산 서열과 높은 상동성을 가진다. 따라서, 본원의 UK-2 생합성 유전자의 또다른 구현예는 "SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33 또는 35의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산인 분리된 핵산"이다.
서열의 상동성은, 예를 들어, NCBI의 BLASTX (아미노산 수준) 프로그램을 이용하여 결정될 수 있다.
아래의 실시예들에서 기재될 것처럼, 본원의 UK-2 생합성 유전자는 높은 UK-2 생산성을 가지는 형질변환체의 제조에 사용될 수 있으며, 또한 UK-2 생합성 유전자 클러스터의 스크리닝에 효과적으로 사용될 수도 있다.
그러한 형질전환체를 제조하고 UK-2 생합성 유전자 클러스터를 스크리닝하는 데에 있어서, 상기 기술한 조합된 UK-2 생합성 유전자들의 용도는 바람직하게는 UK-2 생합성 유전자들 각각의 용도이다. 조합된 UK-2 생합성 유전자들의 개수는, UK-2 생합성이 조합에 의해서 유도될 수 있는 한 특별히 한정되지 않는다. 예를 들어, 개수는 2 이상이고, 바람직하게는 5 이상이고, 더욱 바람직하게는 10 이상이고, 더더욱 바람직하게는 15 이상이다. 조합된 UK-2 생합성 유전자의 개수는 가장 바람직하게는 17인데, 그 이유는 형질전환체에서의 UK-2 생산성이 현저하게 향상될 수 있기 때문이다.
조합된 UK-2 생합성 유전자는 단일 핵산 또는 분리된 핵산들로서 존재할 수 있다.
본원은 17 UK-2 생합성 유전자들을 포함하는 단일 핵산(UK-2 생합성 유전자 클러스터)인 "SEQ ID NO: 1의 염기 서열을 포함하는 핵산"을 제공한다. SEQ ID NO: 1의 염기 서열을 포함하는 핵산 내 상기 유전자들의 열린 번역틀(ORFs)의 위치는 나중에 기술되는 표 1에 나타나 있다.
나중에 실시예에서 기술되는 바와 같이, "SEQ ID NO: 1의 염기 서열을 포함하는 핵산"은 먼저 UK-2 생합성 유전자 등의 염기 서열의 정보를 기반으로 한 적절한 프라이머를 합성하고, 그리고 독립적으로 제조된 스트렙토베르티실룸 sp. 3-7의 코스미드 유전체 DNA를 주형으로 상기 프라이머를 이용하여 PCR을 수행하고, 이어서 수득된 증폭 산물을 프로브로 이용하여 콜로니 혼성화를 수행하는 것에 의해서 분리될 수 있다.
<벡터>
본원은, 본원의 UK-2 생합성 유전자가 삽입된 벡터를 제공한다. 본원의 벡터는 자가복제 벡터, 즉, 예를 들어, 염색체외 요소(extrachromosomal element)로서 존재하며, 염색체의 복제로부터 독립적으로 복제하는, 플라스미드를 기반으로 구성될 수 있다. 양자택일적으로, 본원의 벡터는 박테리아와 같은 숙주 세포 내에 도입되고 그 유전체 내에 편입된 후 숙주세포의 염색체와 함께 복제될 수 있다. 본원의 벡터의 구성 절차 및 방법은, 유전자 조작 분야에서 일반적으로 사용되는 절차 및 방법을 사용할 수 있다.
당업자는 도입되는 숙주 세포의 종류에 따라 공지의 벡터들 중 본원의 적절한 벡터를 선택할 수 있다. 공지의 벡터들의 예는 코스미드 벡터(SuperCos 1 코스미드 벡터 등), 파지 벡터, pUC 기반 플라스미드 (pCR2.1-TOPO 플리스미드 벡터 등), pBluescript 기반 플라스미드 및 pBR322 플라스미드를 포함한다.
본원의 UK-2 생합성 유전자에 의해 인코딩되는 단백질을 숙주 세포 내에서 발현시키기 위해, 본원의 "벡터"는 바람직하게는, 상기 유전자 외에도, 발현을 조절하기 위한 DNA 서열, 형질전환된 숙주세포를 선별하기 위한 마커 유전자 등을 포함한다.
"발현을 조절하기 위한 DNA 서열"의 예는 프로모터, 인핸서, 및 종결자를 포함한다. 예는 또한 박테리아에 이소프로필-β-D-티오갈락토피라노시드(IPTG)를 첨가함으로써 하류에 존재하는 유전자의 발현을 유도할 수 있는 락토오즈 오페론을 포함한다. 본원의 벡터는, 예를 들어, 본원의 UK-2 생합성 유전자의 상류 또는 하류에 프로모터 및 종결자를 각각 작동가능하게 삽입함으로써 구성될 수 있다.
"마커 유전자"는 형질변환된 숙주 세포(형질변환체)를 선별하는 방법에 따라 적절하게 선택될 수 있다. 예를 들어, 약물 저항을 인코딩하는 유전자 또는 영양 요구성(auxotrophy)을 보완하는 유전자가 사용될 수 있다. 박테리아가 숙주 세포로 사용되는 경우, 마커 유전자의 예는 앰피실린 저항성 유전자, 카나마이신 저항성 유전자, 및 테트라사이클린 저항성 유전자를 포함한다. 특히, 방사균(actinobacterium)의 경우, 예는 아프라마이신 저항성 유전자, 티오스트렙톤 저항성 유전자, 히그로마이신 저항성 유전자, 카나마이신 저항성 유전자, 스트렙토마이신 저항성 유전자, 비오마이신 저항성 유전자 등을 포함한다. 효모의 경우, 예는 트립토판 생합성 유전자(TRP1), 우라실 생합성 유전자(URA3), 류신 생합성 유전자(LEU2) 등을 포함한다. 곰팡이(mold)의 경우, 예는 히그로마이신 저항성 유전자, 비알라포스 저항성 유전자, 블레오마이신 저항성 유전자, 아우레오바시딘 저항성 유전자 등을 포함한다. 식물의 경우, 예는 카나마이신 저항성 유전자, 비알라포스 저항성 유전자 등을 포함한다.
<형질변환체 등>
본원은, 본원의 벡터가 도입된 형질변환체를 제공한다 (예를 들어, 본원의 벡터의 도입에 의해 UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아).
더욱이, 본원은, 본원의 UK-2 생합성 유전자가 그의 유전체 내에 삽입되어 UK-2 생합성이 유도되고 UK-2 생산성이 향상된 형질전환체를 제공한다.
본원의 벡터가 도입됨으로써 형질전환되는 숙주세포 또는 본원의 UK-2 생합성 유전자의 유전체의 숙주세포는 특별히 제한되지 않는다. 그 예는 방사균(actinobacteria), 대장균(Escherichia coli ), 바실러스 서브틸리스, 효모, 곰팡이(filamentous fungi), 코리노박테리움 글루타미쿰, 식물 세포, 곤충 세포 및 동물 세포를 포함한다. UK-2 생산성의 관점에서, 방사균이 바람직하고, 스트렙토베르티실룸 속(genus)에 속하는 박테리아와 스트렙토마이세스 속에 속하는 박테리아가 더욱 바람직하고, 스트렙토베르티실룸 속에 속하는 박테리아가 더더욱 바람직하며, 스트렙토베르티실룸 sp. 3-7이 특히 바람직하다.
본원의 벡터를 숙주 세포 내로 도입하는 방법은 특별히 제한되지 않는다. 시험 하에서 숙주세포의 종류에 따라 접합전달법(conjugal transfer), 파지도입(phage transduction), 칼슘이온법, 리튬이온법, 전기천공법, PEG법, 아그로박테리움법, 및 입자총(particle gun) 방법과 같은 공지의 형질전환 방법들로부터 당업자에 의해 적절하게 선택 및 이용될 수 있다. 더욱이, "마커 유전자"를 포함하는 벡터가 숙주세포 내로 도입되는 경우, 본원의 형질전환체는 약물 저항성 유전자에 따른 항생제가 첨가된 배지 또는 영양 요구성 보완 유전자에 따른 영양분이 결핍된 배지에서 배양함으로써 효과적으로 제조될 수 있다.
게다가, 본원은 발효 조건(fermentation conditions), 돌연변이 유발 등의 향상 조건에 의하여 UK-2의 생합성이 유도되고 UK-2의 생산성이 향상되는 박테리아를 제공한다. 더욱이, 아래의 실시예에서 기술되는 것처럼, 본원의 UK-2 생합성 유전자를 적어도 2 개 포함하면 UK-2 생합성이 유도되고 UK-2 생산성이 상당히 향상된다는 것이 밝혀졌다. 따라서, 본원은 또한 본원의 UK-2 생합성 유전자 하나 또는 둘 또는 그 이상의 복제가 각 세포에 존재하는 박테리아를 제공한다. UK-2의 생산성의 측면에서, 그러한 박테리아는 바람직하게는 방사균, 더욱 바람직하게는 스트렙토베르티실룸 속에 속하는 박테리아 및 스트렙토마이세스 속에 속하는 박테리아, 그리고 더더욱 바람직하게는 스트렙토베르티실룸 속에 속하는 박테리아이다. 추가적으로, UK-2의 생산성의 측면에서, 본원의 UK-2 생합성 유전자의 세포당 복제의 수는 바람직하게는 2 개 이상이다. 본원의 UK-2 생합성 유전자의 세포당 복제의 개수는, 예를 들어, 아래의 실시예에서 기술되는 PCR 방법에 의해 확인될 수 있다.
<UK-2 생산성을 판단하기 위한 방법>
본 발명자들은 UK-2 생합성에 필요한 유전자를 분리하고 확인함으로써, 유전자의 존재를 탐지하여 UK-2 생산성을 판단하는 것이 가능해졌다. 따라서, 본원은 시험 박테리아 내에서, 본원의 UK-2 생합성 유전자의 염기 서열 또는 그 서열에 상보적인 염기 서열을 포함하는 핵산의 존재를 탐지하는 것을 포함하여 UK-2 생산성을 판단하기 위한 방법을 제공하는 것이다.
본원의 방법에 있어서, "시험 박테리아"는 특별히 제한되지 않는다. 그 예로는 방선균(스트렙토베르티실룸 속에 속하는 박테리아, 스트렙토마이세스 속에 속하는 박테리아 등), 대장균, 바실러스 서브틸리스, 효모, 곰팡이, 및 코리네박테리움 글루타미쿰을 포함한다.
본원의 UK-2 생산성을 판단하기 위한 방법에 있어서, 탐지되는 본원의 UK-2 생합성 유전자의 염기 서열, 즉 본원의 핵산의 염기 서열은 상술한 (a)~(q)로 이루어지는 군으로부터 선택된 적어도 하나의 핵산의 염기 서열이다.
핵산 등은 핵산 등을 포함하는 유전체 DNA 또는 유전체 DNA로부터 전사 산물을 직접 표적화하여 탐지될 수 있다. 대안적으로, 핵산 등은 전사 산물(본원의 UK-2 생합성 유전자에 의해 인코딩된 단백질)로부터 변형 산물을 간접 표적화하여 탐지할 수도 있다. 또한, 핵산 등의 탐지는 공지된 방법 중 어느 하나를 채용할 수 있다. 유전체 DNA를 표적하는 경우에 있어서, 예를 들면 현장 혼성화(ISH)법, 유전체 PCR법, 직접 시퀀싱법, 서던 블롯팅법, 및 유전체 마이크로어레이를 사용한 분석법을 채용할 수 있다. 전사 산물을 표적화하는 경우에 있어서, 예를 들면 PCR법, 직접 시퀀싱법, 노던 블롯팅법, 도트 플롯법, 및 cDNA 마이크로어레이를 사용한 분석법을 채용할 수 있다. 변역 산물을 표적화하는 경우에 있어서, 공지된 방법의 예로는 본원의 UK-2 생합성 유전자에 의해 인코딩된 단백질에 대한 항체를 사용한 면역학적 방법을 포함한다(웨스턴 블롯팅법, ELISA법, 유동세포계수법, 면역 조직화학적 염색, 이미징 세포계수, 방사면역판단법, 면역 침강법, 항체 어레이를 사용한 분석법 등). 이들 방법 중에서도, PCR법이 바람직할 수 있고, 핵산이 SEQ ID NO: 45의 염기 서열을 포함하는 프라이머 및 SEQ ID NO: 46의 염기 서열을 포함하는 프라이머를 사용해서 증폭되는 PCR법이 보다 바람직할 수 있다.
부가적으로, 본원의 방법에 있어서, UK-2 생산성의 보다 정확한 판단을 달성하는 관점에서 이것은 하나의 핵산의 존재를 탐지하는 것보다 상술한 다수의 핵산(본원의 UK-2 생합성 유전자)의 존재를 탐지하는 것이 바람직하다. 탐지되는 핵산의 수는, 예를 들면 2개 또는 그 이상, 바람직하게는 5개 또는 그 이상, 보다 바람직하게는 10개 또는 그 이상, 및 더욱 바람직하게는 15개 또는 그 이상이다. 17개 핵산 모두를 탐지하는 것이 특히 바람직할 수 있고, 17개 핵산(SEQ ID NO: 1의 염기 서열을 포함하는 핵산) 모두를 포함하는 단일 핵산을 탐지하는 것이 가장 바람직할 수 있다. 또한, 핵산의 전체 길이 외에도, 일반적인 사례에서는 핵산의 존재 탐지를 위해 그의 일부가 표적화된다. 따라서, 본원의 방법에 있어서, 핵산 등의 탐지는 핵산 등의 일부의 탐지일 수 있다. 당업자는 탐지법에 따라 본원의 방법에 의해 탐지되는 핵산의 일부의 길이를 적절하게 선택할 수 있다.
이어서, 시험 박테리아 내에서 핵산의 존재가 이러한 방법에 의해 탐지될 수 있다면, 시험 박테리아는 UK-2 생산성을 갖는다고 판단된다. 부가적으로, 본원의 방법은 UK-2를 생산하는 것을 허용하는 조건에서 핵산의 존재를 탐지할 수 있는 시험 박테리아를 배양하는 것을 추가 포함할 수 있다.
또한, 본원은 UK-2 생합성이 유도되고 UK-2 생산성이 향상되며, 본원의 핵산의 염기 서열 또는 그 서열에 상보적인 염기 서열을 포함하는 핵산의 존재가 본원의 UK-2 생산성을 판단하기 위한 방법에 의해 탐지되는 박테리아를 제공하는 것이다. UK-2 생산성의 관점에서, 이러한 박테리아는 방선균인 것이 바람직하고, 스트렙토베르티실룸 속에 속하는 박테리아 및 스트렙토마이세스 속에 속하는 박테리아가 보다 바람직하며, 스트렙토베르티실룸 속에 속하는 박테리아가 더욱 바람직하다.
단, 여기 사용된 바와 같이, 본원의 UK-2 생합성 유전자를 갖는 상술한 박테리아 등, 즉 UK-2 생합성이 유도되고 UK-2 생산성이 향상되며, 핵산의 존재가 본원의 UK-2 생산성을 판단하기 위한 방법에 의해 탐지되는 박테리아, 본원의 벡터를 도입함으로써 UK-2 생합성이 유도되고 UK-2 생산성이 향상되는 형질전환체, UK-2 생합성이 유도되고 UK-2 생산성이 향상되고, 본원의 UK-2 생합성 유전자가 그 유전체 내에 삽입되는 형질전환체, 본원의 UK-2 생합성 유전자의 1개 또는 2개 또는 그 이상의 복제가 각 세포에 존재하는 박테리아, 및 발효 조건, 돌연변이 유발 등에 향상에 의해 UK-2 생합성이 유도되고 UK-2 생산성이 향상되는 박테리아가 "본원의 박테리아 등"이라 이하에서 총칭된다.
<UK-2를 생산하기 위한 방법>
본원은 UK-2를 생산하기 위한 방법을 제공하는 것이고, 상기 방법은:
본원의 박테리아 등을 배양하고, 박테리아 등의 배양으로부터 UK-2를 수집하는 단계를 포함한다.
박테리아 등은 종래 방법에 의해서 적절하게 배지, 배양 조건 등을 선택함으로써 배양될 수 있다. 배지로서, 일반적으로 사용되는 성분을 사용할 수 있다. 예를 들면, 탄소원으로서는 글루코오스, 수크로오스, 셀룰로오스, 물엿, 덱스트린, 전분, 글리세롤, 당밀, 동식물유 등을 사용할 수 있다. 게다가, 질소원으로서는 콩가루, 밀배아, 파마미디아, 옥수수 침지액, 면실박, 브로스, 펩톤, 폴리펩톤, 백아 추출물, 효모 추출물, 황산 암모늄, 질산 나트륨, 우레아 등을 사용할 수 있다. 이외에도, 필요에 따라 나트륨, 칼륨, 칼슘, 마그네슘, 코발트, 염소, 인산, 황산 및 기타 이온을 생산할 수 있는 무기염을 부가하는 것이 효과적이고; 무기염의 예로는 염화 칼륨, 탄산 칼슘, 인산수소2칼륨, 황산 마그네슘, 인산 칼륨, 황산 아연, 황산 망간, 및 황산 구리를 포함한다. 부가적으로, 필요에 따라 티아민(염산 티아민 등)과 같은 각종 비타민, 글루탐산(글루타민산 나트륨 등) 및 아스파라긴(DL-아스파라긴 등)과 같은 아미노산, 뉴클레오티드와 같은 미량 영양소, 및 항생제와 같은 선택적 약물을 부가할 수도 있다. 또한, 박테리아의 성장 및 UK-2 생산을 촉진시키기 위한 유기 물질과 무기 물질을 적절하게 부가할 수 있다. 배지의 pH는 특히 제한되지 않고, 배양되는 박테리아 등의 타입에 따라 조정될 수 있다. 예를 들면, pH는 대략 6~8이다.
당업자는 배양되는 박테리아 등의 타입, 사용되는 배지의 타입 등에 따라 배양 조건을 적절하게 선택하고 설정할 수 있다. 예를 들면, 배양법은 호기성 조건 하에 진탕 배양법, 통기와 교반 배양법 및 호기성 침수 배양법과 같은 공지의 배양법으로부터 선택될 수 있다. 통기와 교반 배양법이 바람직하다. 적절한 배양 온도는 15℃~40℃이다. 다수의 경우에 있어서, 배양 온도는 26℃~37℃쯤으로 설정된다. 게다가, 배양 기간은 UK-2의 최대 축적이 달성될 경우 2일~25일이 바람직하다.
본원에 있어서, "배양"은 본원의 박테리아 등을 배양함으로써 얻어지는 배지, 급증된 박테리아 등, 박테리아 등의 분비물 및 대사 산물 등을 나타낸다. 배양은 이들의 희석 및 농축도 포함한다.
배양에 있어서, UK-2는 박테리아 등 및 배지 모두에 축적된다. 따라서, 배양의 배지로부터 UK-2를 수집하기 위한 방법의 예로는 자유롭게 물과 혼합하지 않고, UK-2를 효과적으로 추출할 수 있는 에틸 아세테이트, 클로로폼, 및 디클로로메탄과 같은 유기 용제를 사용한 추출법이다. 한편, 배양의 박테리아 등으로부터, 예를 들면 UK-2는 여과 또는 원심 분리와 같은 수단에 의해 얻어지는 박테리아 등에 아세톤과 같은 유기 용제로 추출하여 수집될 수 있다. 또한, 배양의 박테리아 등을 글라스 비즈 등을 사용하여 파괴한 후, UK-2는 배지로부터 상술한 추출과 같은 동일한 방식으로 추출하여 수집될 수 있다.
게다가, 배양으로 UK-2를 수집할 경우, 이렇게 제조된 유기 용제와 같은 추출 분획에 용제 전이 용해, 순상 및 역상 크로마토그래피, 겔 여과 크로마토그래피, 및 결정화와 같은 공지의 정제 기술을 조합해서 실시함으로써 UK-2가 분리되고 정제될 수 있다.
<UK-2 유도체를 생산하기 위한 방법>
상술한 바와 같이, 본원은 저비용으로 UK-2의 대량 생산을 가능하게 한다. 따라서, 저비용으로 UK-2 유도체의 대량 생산이 그 재료로서 본원의 생산법으로 얻어지는 UK-2를 사용해서 가능해진다.
따라서, 본원은 UK-2 유도체를 생산하기 위한 방법을 제공할 수 있다. 상기 방법은:
본원의 박테리아 등을 배양하고, UK-2(UK-2A, UK-2B, UK-2C 또는 UK-2D)를 박테리아 등의 배양으로부터 수집하는 단계; 및
수집된 UK-2로부터 하기 식(1) 중 어느 하나로 나타내어지는 UK-2 유도체를 합성하는 단계를 포함한다.
[화학식 9]
[식(1)에서,
R은 2-메틸프로파노일기, 트랜스-2-메틸-2-부타노일기, 3-메틸부타노일기 및 2-메틸부타노일기 중 어느 하나를 나타냄.
R1은 C1 -6 알킬기, 벤질기, C1 -10 알킬카르보닐기(C1 -10 알킬카르보닐기는 카르복실기, 벤질옥시카르보닐기, C1 -4 알킬옥시카르보닐기 및 벤질옥시카르보닐아미노기 중 어느 하나로 치환될 수 있음), 벤조일기, C1 -4 알킬옥시카르보닐기, (C1 -4)알킬옥시카르보닐(C1-4)알킬기, 니트로기로 치환 가능한 벤질옥시카르보닐(C1-4)알킬기, C1-6 알킬술포닐, 디(C1-6)알킬포스포릴기, 디페닐포스포리기 및 하기 식(2)으로 표시되는 치환기 중 어느 하나를 나타내고;
[화학식 10]
(식(2)에서,
Q는 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
M은 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
T는 O, OC(O), OC(O)O, S, SC(O), SC(O)O 및 하기 식(3)으로 표시되는 치환기로 이루어지는 군으로부터 선택됨;
[화학식 11]
G는 H, C1 -6 알킬기, C1 -6 알콕시 C1 -6 알킬기, C2 -6 알케닐기, C2 -6 알키닐기, C3-6 시클로알킬기, 아릴기 및 헤테로아릴기로 이루어지는 군으로부터 선택됨.
G 및 M은 임의적으로 옥소기를 가지는 이소벤조퓨란 고리를 형성할 수 있음.
M 및 Q는 3-8원 카르보시클릭 시스템을 형성할 수 있음.].
식(2)으로 표시되는 치환기에 있어서, 알킬기, 알키닐기, 알케닐기, 시클로알킬기, 아릴기 및 헤테로아릴기는 하기 치환기로 이루어지는 군으로부터 선택되는 적어도 하나의 치환기로 치환될 수 있고;
C1 -6 알킬기, C2 -6 알케닐기, C2 -6 알키닐기, C3 -6 시클로알킬기, C5 -6 시클로알케닐기, 아릴기, 헤테로아릴기, 할로겐 원자, 니트로기, 히드록시기, 시아노기, C1 -6 알콕시기, C2 -6 알케녹시기, C3 -6 시클로알콕시기, 아릴옥시기, 헤테로아릴옥시기, 아실옥시기, C1 -6 알킬아실옥시기, C3 -6 시클로알킬아실옥시기, 아릴아실옥시기, 헤테로아릴아실옥시기, C1 -6 알킬옥시아실기, C3 -6 시클로알킬옥시아실기, 아릴옥시아실기, 헤테로아릴옥시아실기, C1 -6 알킬아실기, C3 -6 시클로알킬아실기, 아릴아실기, 헤테로아릴아실기, C1 -6 알킬아실아미노기, C3 -6 시클로알킬아실아미노기, 아릴아실아미노기, 헤테로아릴아실아미노기, C1 -6 알킬아미노아실기, C3 -6 시클로알킬아미노아실기, 아릴아미노아실기, 헤테로아릴아미노아실기, C1 -6 알킬티오기, C3 -6 시클로알킬티오기, 아릴티오기, 헤테로아릴티오기 C1 -6 알킬술포닐기, C3 -6 시클로알킬술포닐기, 아릴술포닐기, 헤테로아릴술포닐기, C1 -6 알킬술피닐기, C3 -6 시클로아릴술피닐기, 아릴술피닐기, 헤테로아릴술피닐기 및 -C(NORX)RY 여기서 RY 및 RX는 독립적으로 H, C1 -6 알킬기, C2 -6 알케닐기, C3 -6 시클로알킬기, 아릴기 및 헤테로아릴기 중 어느 하나이고 이것들 중 치환기를 포함하는 임의의 알킬 또는 시클로알킬은 하나 또는 그 이상의 할로겐으로 치환될 수 있다.
단, 치환기는 하기 치환기로 이루어지는 군으로부터 선택되는 적어도 하나의 치환기로도 치환될 수 있고;
C1 -6 알킬기, C2 -6 알케닐기, C2 -6 알키닐기, C3 -6 시클로알킬기, C5 -6 시클로알케닐기, 아릴기, 헤테로아릴기, 할로겐 원자, 니트로기, 히드록시기, 시아노기, C1 -6 알콕시기, C2 -6 알케녹시기, C3 -6 시클로알콕시기, 아릴옥시기, 헤테로아릴옥시기, 아실옥시기, C1 -6 알킬아실옥시기, C3 -6 시클로알킬아실옥시기, 아릴아실옥시기, 헤테로아릴아실옥시기, C1 -6 알킬옥시아실기, C3 -6 시클로알킬옥시아실기, 아릴옥시아실기, 헤테로아릴옥시아실기, C1 -6 알킬아실기, C3 -6 시클로알킬아실기, 아릴아실기, 헤테로아릴아실기, C1 -6 알킬아실아미노기, C3 -6 시클로알킬아실아미노기, 아릴아실아미노기, 헤테로아릴아실아미노기, C1 -6 알킬아미노아실기, C3 -6 시클로알킬아미노아실기, 아릴아미노아실기, 헤테로아릴아미노아실기, C1 -6 알킬티오기, C3 -6 시클로알킬티오기, 아릴티오기, 헤테로아릴티오기 C1 -6 알킬술포닐기, C3 -6 시클로알킬술포닐기, 아릴술포닐기, 헤테로아릴술포닐기, C1 -6 알킬술피닐기, C3 -6 시클로알킬술피닐기, 아릴술피닐기, 헤테로아릴술피닐기 및 -C(NORX)RY 여기서 RY 및 RX는 독립적으로 H, C1 -6 알킬기, C2 -6 알케닐기, C3 -6 시클로알킬기, 아릴기 및 헤테로아릴기 중 어느 하나이고 이것들 중 치환기를 포함하는 임의의 알킬 또는 시클로알킬은 하나 또는 그 이상의 할로겐으로 치환될 수 있다.
또한, 본원은 UK-2 유도체를 생산하기 위한 방법도 제공될 수 있고, 상기 방법은:
본원의 박테리아 등을 배양하고, 그리고 박테리아 등의 배양으로부터 UK-2를 수집하는 단계; 및
수집된 UK-2로부터 하기 식(4)~(7) 중 어느 하나로 표시되는 UK-2 유도체를 합성하는 단계를 포함한다.
[화학식 12]
[화학식 13]
[화학식 14]
[화학식 15]
배양으로부터 UK-2A, UK-2B, UK-2C 또는 UK-2D 수집할 때, UK-2A, UK-2B, UK-2C 또는 UK-2D는, 예를 들면 유기 용제와 같은 추출 분획을 용제 전이 용해, 순상 및 역상 크로마토그래피, 겔 여과 크로마토그래피, 및 결정화와 같은 공지된 정제 기술을 조합하여 실시함으로써 상술한 바와 같이 분리되고 정제될 수 있다. 보다 구체적으로, 유기 용제와 같은 추출 분획은 감압 하에 농축된다. 생성물을 클로로폼에 옮겨서 용해시키고, 클로로폼/메탄올을 사용해서 순차적으로 용출시키는 실리카겔 크로마토그래피로 실시했다. 따라서, 약 3:1의 비율로 UK-2A 및 UK-2D를 포함하고, UK-2B 및 UK-2C의 미량을 포함하는 분획을 얻을 수 있다. 추가로, 분획은 C-18 칼럼을 사용해서 역상 고속 액체 크로마토그래피(HPLC)에 의해 처리됨으로써, UK-2A, UK-2B, UK-2C 또는 UK-2D가 분리될 수 있다(특허문헌 1 참조).
이어서, 식(1) 및 (4)~(7) 중 어느 하나로 표시되는 UK-2A, UK-2B, UK-2C 또는 UK-2D의 유도체는 UK-2A, UK-2B, UK-2C 또는 UK-2D를 사용하여 합성됨으로써, 예를 들면 국제공개 2003/035617호 또는 국제공개 1999/40081호에 기재된 합성 방법에 의해 그 물질로서 수집될 수 있다.
[실시예]
이하, 본원은 실시예에 기초해서 보다 구체적으로 기재될 것이다. 그러나, 본원은 이하 실시예에 제한되는 것은 아니다.
단, 본 실시예에 기재된 미생물은 다음과 같이 기탁된다. 스트렙토베르티실룸 sp. 3-7은 헤이세이 23(2011) 11월 9일자로 수탁 번호 FERM BP-11437 하에 일본 산업기술총합연구소 특허생물기탁센터(일본 우편번호 305-8566 이바라키 츠쿠바 히가시 1-1-1 센트럴 6)에 기탁되었다. 부수적으로, 일본 산업기술총합연구소 특허생물기탁센터(구 명칭: IPOD)에 의한 특허 미생물의 기탁은 2012년 4월 자로 제품평가기술기반기구(우편번호 292-0818 시바 키사라즈시 2-5-8 카즈사카마타리 #122 NITE)에 의해 계승되었다.
(실시예 1)
<유전체 DNA 라이브러리의 제조>
UK-2 생합성에 필요한 유전자를 분리하기 위해서, 우선 UK-2를 생산할 수 있는 스트렙토베르티실룸 sp. 3-7의 유전체 DNA 라이브러리가 후술하는 방법에 의해 제조되었다.
스트렙토베르티실룸 sp. 3-7은 개질된 YEME(0.3% Difco 효모 추출물, 0.5% Difco 백토 펩톤, 0.3% Oxoid 맥아 추출물, 3.0% 수크로오스, 1.0% 글루코오스, 5 m㏖/L MgCl2·6H2O) 50 ㎖에 접종되고 18시간 동안 30℃에서 220 rpm으로 진탕 배양하였다. 배양이 완료된 후, 박테리아 세포를 10분 동안 7500 rpm에서 원심 분리하여 수집하였다. 이렇게 얻어진 박테리아 세포로부터, 유전체 DNA는 염석법을 채용하여 제조하였다["Practical Streptomyces Genetics," The John Innes Foundation, (UK), Norwich, 2000 참조].
얻어진 유전체 DNA는 제한 효소 MboI로 부분적으로 절단된 다음, 알칼리성 인산가수분해효소로 처리해서 DNA 말단을 탈인산화시켰다. 이 DNA 단편을, 제한 효소 XbaI로 절단하기 전에 알칼리성 인산가수분해효소 처리하여 탈인산화시키고 추가로 제한 효소 BamHI로 절단한 상업적으로 이용 가능한 코스미드 벡터 SuperCos1(Stratagene Corporation 제조)에 라이게이션시켰다. 따라서, 재조합형 코스미드 벡터가 제조되었다. 이 재조합 코스미드 벡터는 Epicentre Biotechnologies에 의해 제조된 MAXPLAX Lambda Packaging Extracts를 사용하여 인 비트로 패키징을 실시했다. 코스미드 유전체 DNA 라이브러리를 제조하기 위해 대장균 XLI-Blue MRA가 함께 감염되었다.
(실시예 2)
<UK-2 생합성 유전자의 평가>
실시예 1에 기재된 방법에 의해 제조된 유전체 DNA에 기초해서, Roche GS FLX 티타늄 시퀀서용 메이트 페어 라이브러리의 구축을 Genaris, Inc.에 위탁했다. 이어서, 이 시퀀서는 서열을 결정하는데 사용되었다. 이와 별개로, 유전체 DNA에 기초해서 이 시퀀서용 단편 라이브러리가 구성되었다. 이어서, 이 시퀀서는 서열을 결정하는데 사용되었다. 메이트 페어 라이브러리로부터 얻어진 시퀀스 및 단편 라이브러리로부터 얻어진 시퀀스는 함께 조립되어서 콘틱 시퀀스 및 스카폴드 시퀀스를 얻었다.
UK-2는 특유의 3-히드록시피콜린산 골격을 갖는다. 한편, 버지니아마이신도 히드록시피콜린산 골격을 갖는다. 버지니아마이신 생합성에 관여되는 2개의 유전자(visA, visB)가 개시되어 왔다(비특허문헌 2 참조). 따라서, 상동성 분석은 이들 2개의 유전자에 의해 인코딩된 단백질의 아미노산 서열과 UK-2 생성 박테리아의 유전체으로부터 얻어지는 제안되는 아미노산 서열 사이에서 수행되어서 히드록시피콜린산 골격 형성에 관여되는 유전자의 존재를 검사했다. 표 1 및 2는 얻어진 결과를 나타낸다.
검사 결과, VisA 및 VisB와 높은 상동성을 갖는 유전자가 연속하여 위치되는 자리는 스크렙토베르티실룸 sp. 3-7로부터 유래된 유전체 상의 단일 자리라는 것을 알아냈다(표 1 참조). 또한, UK-2 골격을 형성하는데 필요하다고 생각되는 비리보솜 펩티드 합성 효소(NRPS) 및 폴리케티드 합성 효소(PKS)와 관련된 유전자가 이들 유전자 근처에 위치하였다(표 2 참조). 방선균의 2차 대사 산물의 유전자가 클러스터를 형성하기 때문에 유전자 주위 영역은 UK-2 생합성 유전자 클러스터가 된다고 예상되었다. 또한, UK-2 생합성 유전자 클러스터에 위치된 유전자(ORFs)와 다음과 같이 각각의 유전자에 의해 인코딩되는 단백질들의 예상되는 기능 간에 다음과 같은 정령이 존재한다.
ORF1은 잠재적으로 생합성 유전자 클러스터의 조절에 관여하는 유전자이다. ORF5, ORF6, ORF7, 및 ORF16은 3-히드록시피콜린산 골격의 생합성에 관여하는 유전자이다. ORF2, ORF3, 및 ORF17은 벤질말론산 골격의 생합성에 관여하는 유전자이다. ORF13은 피콜린산 골격, 세린, 및 젖산의 생합성에 관여하는 유전자이다. ORF11 및 ORF12는 벤질말론산의 생합성과 피콜린산, 세린, 및 젖산의 신진대사에 관여하는 유전자이다. ORF8은 폴리케티드 합성 효소(PKS)의 황화에스테르 결합의 절단과 피콜린산, 세린, 젖산, 및 벤질말론산의 신진대사에 관여하는 유전자이다.
(실시예 3)
<유전체 DNA 라이브러리의 스크리닝>
UK-2 생합성 유전자의 상류에 위치된 ORF5 시퀀스의 부분은 실시예 1에 제조된 유전체 DNA 라이브러리의 스크리닝을 위한 프로브로서 사용되었고, 후술한 바와 같이 PCR에 의해 제조되었다.
PCR은 프라이머로서 실시예 1에 기재된 유전체 DNA 및 visA'-F: 5'-GGGGCAGCCTGCTCGGCGAG-3(SEQ ID NO: 36) 및 visA'-R: 5'-GGTGAGCTCCCCGATCAGGG-3(SEQ ID NO : 37)의 올리고 DNAs를 사용하여 수행되었다. PCR은 DNA 폴리메라아제로서 LA Tag DNA 폴리메라아제(Takara Bio Inc. 제조) 및 PERKIN ELMER GeneAmp PCR System 9700을 사용하여 수행되었다. 유전체 DNA의 0.5 ㎕(0.5 ㎍과 상응하는 양), 효소를 수반하는 2배 농축 반응을 위한 버퍼 25 ㎕, DMSO 용액 2.5 ㎕, 2.5-mM dNTP 용액 5 ㎕, 농도가 100 pmol/㎕로 조정된 각각의 프라이머 0.25 ㎕, 효소 0.3 ㎕, 및 멸균수 16.2 ㎕를 첨가하여 반응액의 양을 50 ㎕로 조정했다. 반응을 다음과 같이 행했다: 10분 동안 95℃에서 전처리; 30초 동안 95℃, 30초 동안 55℃, 및 2분 동안 72℃로 각각 이루어지는 30주기로 인큐베이션; 5분 동안 72℃에서 추가 인큐베이션했다. 반응이 완료된 후, 반응액의 일부를 아가로오스겔 상에 전기 영동시켰다. 결과적으로, DNA 단편의 약 1.3 kbp가 특별히 증폭된다는 것을 확인했다. 이어서, 나머지 반응액을 핵산 정제용 혼합 용액(페놀:클로로폼:이소아밀 알콜=25:24:1, V/V)으로 추출한 다음, 에탄올 침전물로 추출을 실시했다. 침전물을 멸균수에 다시 용해하고, 아가로오스겔 상에서 전기 영동시켰다. 밴드의 약 1.3 kbp가 종래 방법에 의해서 절단되고, DNA 단편이 수집되었다.
콜로니 혼성화법은 프로브로서 DNA 단편 및 ECL Direct DNA/RNA 라벨링과 탐지 시스템(Amersham Pharmacia Biotech Inc. 제조)을 사용하여 수행되었고, 약 5000 콜로니가 스크리닝되었다. 다수의 양성 클론이 얻어졌다. 플라스미드 pUK2-B44는 클론 중 하나로부터 분리되었다.
또한, UK-2 생합성 유전자의 하류에 위치되는 ORF13의 일부가 프로브로서 사용되었고, 후술하는 바와 같이 PCR에 의해 제조되었다.
PCR은 주형으로서 실시예 1에 기재된 유전체 DNA 및 프라이머로서 caiC-F: 5'-GCGCTCGTACGCCTCGCTGAT-3'(SEQ ID NO: 38) 및 caiC-R: 5'-CGGGCTCGGTGGTGAGCAGG-3'(SEQ ID NO: 39)의 올리고 DNAs를 사용하여 수행되었다. PCR은 DNA 폴리메라아제로서 LA Tag DNA 폴리메라아제(Takara Bio Inc. 제조) 및 PERKIN ELMER GeneAmp PCR System 9700을 사용하여 수행되었다. 유전체 DNA의 0.5 ㎕(0.5 ㎍과 상응하는 양), 효소를 수반하는 2배 농축 반응을 위한 버퍼 25 ㎕, DMSO 용액 2.5 ㎕, 2.5-mM dNTP 용액 5 ㎕, 농도가 100 pmol/㎕로 조정된 각각의 프라이머 0.25 ㎕, 효소 0.3 ㎕, 및 멸균수 16.2 ㎕를 첨가하여 반응액의 양을 50 ㎕로 조정했다. 반응을 다음과 같이 행했다: 10분 동안 95℃에서 전처리; 30초 동안 95℃, 30초 동안 59℃, 및 2분 및 20초 동안 72℃로 각각 이루어지는 30주기로 인큐베이션했다. 결과적으로, DNA 단편의 약 2.3 kbp가 특별히 증폭된다는 것을 확인했다. 이어서, 나머지 반응액을 상술한 핵산 정제용 혼합 용액으로 추출한 다음, 에탄올 침전물로 추출을 실시했다. 침전물을 멸균수에 다시 용해하고, 아가로오스겔 상에서 전기 영동시켰다. 밴드의 약 2.3 kbp가 종래 방법에 의해서 절단되고, DNA 단편이 수집되었다.
콜로니 혼성화법은 프로브로서 DNA 단편 및 ECL Direct DNA/RNA 라벨링과 탐지 시스템(Amersham Pharmacia Biotech Inc. 제조)을 사용하여 수행되었고, 약 5000 콜로니가 스크리닝되었다. 다수의 양성 클론이 얻어졌다. 플라스미드 pUK2-B4는 클론 중 하나로부터 분리되었다.
(실시예 4)
<생합성 유전자 클러스터를 포함하는 플라스미드 pUK2-3의 구축>
예상되는 생합성 클러스터의 상류 영역 1~21531과 하류 영역 16211~34641을 각각 포함하는 이렇게 얻어진 플라스미드 pUK2-B44 및 pUK2-E4를 사용해서 전체 생합성 클러스터 영역을 포함하는 플라스미드를 구축했다. 우선, 플라스미드 모두는 제한 효소 ClaI 및 PspXI로 절단된 다음, 아가로오스겔 상에 전기 영동되고, 밴드의 약 28 kbp와 약 19 kbp가 각각 종래 방법에 의해서 절단되어 DNA 단편이 수집되었다. DNA 단편은 DNA 라이게이션 키트<Mighty Mix>(Takara Bio Inc. 제조)를 사용하여 라이게이션되어서 pUK2-16을 제조했다.
이어서, [Gust, B. 등, "Proceedings of the National Academy of Sciences of the United States of America," (US), 2003, 100권, 1541-1546페이지]에 기재된 전용(redirect) 기술을 사용해서, 플라스미드 pUK2-16이 방선균에 접합 전달 가능한 벡터로서 사용되었다. 우선, 플라스미드 pUK2-16은 전기 영동에 의한 대장균 BW25113/pIJ790 균주에 도입되어서 대장균 BW25113/pIJ790/pUK2-16 균주를 얻었다. 이 균주를 각각 25 ㎍/㎖, 50 ㎍/㎖ 및 50 ㎍/㎖의 농도로 클로람페니콜, 카나마이신 및 앰피실린을 함유하는 LB 액체 배지 100 ㎖(1% 백토 트립톤, 0.5% 효모 추출물, 0.5% 염화 나트륨)에 접종하고, 밤새 30℃에서 배양했다. 이어서, 배양액의 100 ㎕를 각각 25 ㎍/㎖, 50 ㎍/㎖, 50 ㎍/㎖ 및 10 mM의 농도로 클로람페니콜, 카나마이신, 앰피실린 및 L-아라비노스를 함유하는 65 ㎖ 시험관에서 제조된 SOB 배지 10 ㎖(2% 백토 트립톤, 0.5% 효모 추출물, 0.05% 염화 나트륨, 0.0186% 염화 칼륨)에 접종했다. 얻어진 배양을 4시간 동안 30℃에서 진탕 배양했다. 박테리아 세포를 모든 배양 용액으로부터 수집하고, 빙냉한 10% 글리세린 용액으로 2회 세정하고, 전기 영동용 세포로서 10% 글리세린 용액 100 ㎕에 재현탁했다. 한편, oriT, attP, Int φC31을 함유하는 SspI 단편 5.2 kb 및 pMJCOS1(John Innes Centre(Norwich))로부터 유래된 아프라마이신 저항성 유전자를 정제했다. 이렇게 제조된 DNA 단편(약 100 ng) 및 세포의 50 ㎕를 미리 빙냉한 2 ㎜의 갭을 가진 큐벳에 옮기고, 전기 영동(BM Equipment Co., Ltd.에서 제조된 Electro Cell Manipulator 600을 사용)을 실시했다. 처리 후에, 냉각된 LB 액체 배지 1 ㎖를 생성물에 부가하고, 이것을 배양하기 위해 1시간 동안 37℃에서 정치했다. 이것을 앰피실린 및 아프라마이신을 함유하는 LB 한천 배지에 적용한 다음, 밤새 37℃에서 배양했다. 성장 균주를 앰피실린 및 아프라마이신을 함유하는 LB 액체 배지 내에서 배양하고, 플라스미드 pUK2-3을 분리했다. 이 pUK2-3은 방선균에 접합 전달할 수 있는 플라스미드이고, 이것은 oriT, attP, Int φC31 및 벡터 일부에 아프라마이신 저항성 유전자를 갖고 전체 영역은 UK-2 생합성 클러스터가 될 것으로 기대된다.
(실시예 5)
<생합성 유전자 결핍 벡터의 구축>
스트렙토베르티실룸 sp. 3-7의 유전체 DNA로부터 ORF12 및 ORF13의 일부에 해당하는 약 7.5 kbp의 유전자가 결핍된, 유전자 파괴된 균주를 후술하는 방법에 의해 제조했다.
PCR은 주형으로서 실시예 1에 기재된 유전체 DNA 및 프라이머로서 caiC-F: 5'-GCGCTCGTACGCCTCGCTGAT-3'(SEQ ID NO: 38)과 41c29-R: 5'-GTCCGTGGCGCCGCCGGATT-3'(SEQ ID NO: 40)의 올리고 DNAs를 사용하여 수행되었다. PCR은 DNA 폴리메라아제로서 LA Taq DNA 폴리메라아제(Takara Bio Inc. 제조) 및 PERKIN ELMER GeneAmp PCR System 9700을 사용하여 행해진다. 유전체 DNA의 0.5 ㎕(0.5 ㎍과 상응하는 양), 효소를 수반하는 2배 농축 반응을 위한 버퍼 25 ㎕, DMSO 용액 2.5 ㎕, 2.5-mM dNTP 용액 5 ㎕, 농도가 100 pmol/㎕로 조정된 각각의 프라이머 0.25 ㎕, 효소 0.3 ㎕, 및 멸균수 16.2 ㎕를 첨가하여 반응액의 양을 50 ㎕로 조정했다. 반응을 다음과 같이 행했다: 10분 동안 95℃에서 전처리; 30초 동안 95℃, 5초 동안 60℃, 및 7분 동안 72℃로 각각 이루어지는 30주기로 인큐베이션했다. 반응이 완료된 후에, 반응액의 일부를 아가로오스겔 상에서 전기 영동시켰다. 결과적으로, DNA 단편의 약 7.5 kbp가 특별히 증폭된다는 것을 확인했다. DNA 단편을 이것에 부착된 프로토콜에 따라 TOPO TA 클로닝 키트(Invitrogen Corporation 제조)를 사용하여 pCR2.1-TOPO 플라스미드 벡터에 삽입했다. 그렇게 함으로써, 플라스미드 TOPO-41c29를 얻었다.
플라스미드 pIJ733[Gust, B. 등, "Proceedings of the National Academy of Sciences of the United Stated of America," (US), 2003, 100권, 1541-1546페이지]를 HindIII 및 EcoRI로 이중 절단시킨 다음, 아가로오스 겔 상에서 전기 영동시켰다. 이어서, DNA 단편을 종래 방법에 의해 절단하고 수집했다. 따라서, 목적 아프라마이신 저항성 유전자를 포함하는 DNA 단편의 약 1.3 kb를 얻었다. PCR은 주형으로서 이 단편 및 41c30-apraF: 5'-GTCACCGTCCCCGCCTACGGCGACGGCGTCGTCCTGGTGATTCCGGGGATCCGTCGACC-3'(SEQ ID NO: 41)과 41c30-apraR: 5'-GGTCGCGGGCGAAGGCGTAGCCGGGCAGGTCGGGCAGGATGTAGGCTGGAGCTGCTTC-3'(SEQ ID NO: 42)의 2가지 타입의 합성 프라이머를 사용하여 수행되었다. PCR은 DNA 폴리메라아제로서 LA Taq DNA 폴리메라아제(Takara Bio Inc. 제조) 및 PERKIN ELMER GeneAmp PCR 시스템 9700을 사용하여 행해진다.
유전체 DNA의 0.5 ㎕(0.5 ㎍과 상응하는 양), 효소를 수반하는 2배 농축 반응을 위한 버퍼 25 ㎕, DMSO 용액 2.5 ㎕, 2.5-mM dNTP 용액 5 ㎕, 농도가 100 pmol/㎕로 조정된 각각의 프라이머 0.25 ㎕, 효소 0.3 ㎕, 및 멸균수 16.2 ㎕를 부가하여 반응액의 양을 50 ㎕로 조정했다. 반응을 다음과 같이 행했다: 2분 동안 94℃에서 전처리; 45초 동안 94℃, 45초 동안 50℃, 및 1분과 30초 동안 72℃로 각각 이루어지는 10주기로 인큐베이션하고; 이어서, 45초 동안 94℃, 45초 동안 55℃, 및 1분과 30초 동안 72℃로 각각 이루어지는 15주기로 인큐베이션하고; 5분 동안 72℃에서 추가 반응을 수행했다. 반응이 완료된 후에, 반응액의 일부를 아가로오스 겔 상에서 전기 영동시켰다. 결과적으로, DNA 단편의 약 1.4 kbp가 특별히 증폭된다는 것을 확인했다.
이어서, TOPO-41c29를 대장균 BW25113/pIJ790[Gust, B. 등, "Proceedings of the National Academy of Sciences of the United States of America," (US), 2003, 100권, 1541-1546페이지]에 도입해서 대장균 BW25113/pIJ790/TOPO-41c29 균주를 얻었다. 이 균주를 각각 25 ㎍/㎖, 25 ㎍/㎖ 및 50 ㎍/㎖의 농축으로 클로람페니콜, 카나마이신 및 앰피실린을 함유하는 LB 액체 배지 100 ㎖에 접종하고, 밤새 30℃에서 배양했다. 이어서, SOB 배지 10 ㎖를 각각 25 ㎍/㎖, 25 ㎍/㎖, 50 ㎍/㎖, 및 10 mM의 농축에서 클로람페니콜, 카나마이신, 앰피실린, 및 L-아라비노오스로 보충된 65 ㎖ 시험관에 공급했다. 이것에, 밤새 배양된 대장균 BW25113/pIJ790/TOPO-41c29 균주의 배양액 100 ㎕를 옮기고, 4시간 동안 30℃에서 진탕 배양했다. 모든 배양액을 5분 동안 4℃에서 3000 rpm으로 원심 분리한 다음, 빙랭한 10% 글리세린 용액 10 ㎖에 현탁되어 있는 박테리아 세포를 수집했다. 이 작업을 반복한 후에, 얻어진 박테리아 세포를 냉각된 10% 글리세린 용액 100 ㎕에 재현탁했다. 이어서, 박테리아 세포 현탁액 50 ㎕를 Eppendorf 튜브에 수집하고, 그것에 pIJ773으로부터 유래된 상술한 아프라마이신 저항성 유전자를 함유하는 DNA 단편의 약 1.4 kb의 용액 5 ㎕를 첨가했다. 혼합물을 이미 빙랭한 2 ㎜의 갭을 가진 전기 영동 큐벳(BM6200: BM Equipment Co., Ltd. 제조)에 옮겼다. 전기 영동은 12.5 kV, 25 ㎌, 및 128 Ω의 조건 하에서 Electro Cell Manipulator 600(BM Equipment Co., Ltd. 제조)을 사용하여 행했다. 처리 후에, 이미 빙랭한 LB 액체 배지 1 ㎖를 박테리아 세포에 첨가한 다음, 배양하기 위해서 1시간 동안 37℃에서 정치했다. 이것을 50 ㎍/㎖에서 각각 앰피실린 및 아프라마이신으로 보충된 LB 한천 배지에 적용했다. 생성물을 밤새 37℃에서 배양해서 앰피실린 및 아프라마이신 모두에 대한 내성을 갖는 균주를 얻었다. 이 균주를 50 ㎍/㎖에서 각각 앰피실린 및 아프라마이신으로 보충된 LB 액체 배지 내에서 배양했다. 따라서, 플라스미드 TOPO-41c29Am을 분리했다.
(실시예 6)
<생합성 유전자 결핍 균주의 생성>
플라스미드 TOPO-41c29를 종래 방법에 의해 대장균 ET12567/pUZ8002 균주["Practical 스트렙토마이시스 Genetics," The John Innes Foundation, (UK), Norwich, 2000]에 도입해서 대장균 ET12567/pUZ8002/TOPO-41c29를 얻었다.
스트렙토베르티실룸을 다음과 같이 대장균 ET12567/pUZ8002/TOPO-41c29에 공역했다. 우선, 스트렙토베르티실룸 균주를 65 ㎖ 시험관에서 제조된 액체 배지(S#1)[Ueki, M 등, "The Journal of Antibiotics," (Japan), 1996, 49권, 639-643페이지]에 접종하고, 24시간 동안 30℃에서 배양했다. 생성물을 MS 한천 배지(2% 콩가루, 2% 만니톨, 2% 한천)에 적용하고, 2일 동안 30℃에서 배양했다. 배양 후에, 균사체를 20% 글리세롤 3 ㎖로 스크레이핑함으로써 수집해서 숙주 균사체 용액을 제조했다.
박테리아 세포를 5분 동안 3000 rpm에서 원심 분리하여 수집한 후에, 박테리아 세포를 20% 글리세린 용액 3 ㎖에 현탁했다. 한편, 대장균 ET12567/pUZ8002/TOPO-41c29-Am를 50 ㎍/㎖의 농도에서 각각 앰피실린 및 아프라마이신으로 보충된 LB 액체 배지에 18시간 동안 37℃에서 배양했다. 이어서, 배양액 1 ㎖를 LB 액체 배지(50 ㎍/㎖의 농도에서 각각 앰피실린 및 아프라마이신을 함유) 100 ㎖에 옮기고, 4시간 동안 37℃에서 배양했다. 연속해서, 배양액 50 ㎖를 5분 동안 3000 rpm에서 원심 분리해서 박테리아 세포를 수집했다. 박테리아 세포를 LB 액체 배지 20 ㎖에 현탁했다. 이 작업을 2회 반복한 후에, 박테리아 세포를 LB 액체 배지 2 ㎖에서 현탁했다.
이어서, 스트렙토베르티실룸 세포 현탁액 10 ㎕와 대장균 ET12567/pUZ8002/코스미드203-7의 박테리아 세포 현탁액 100 ㎕를 1.5 ㎖ 관에서 함께 조합하고, 원심 분리해서 박테리아 세포를 수집했다. 20% 글리세린 용액 100 ㎕에서 현탁한 후에, 이것을 20 ㎖ 부피를 갖고 10 mM MgCl2를 함유하는 MS 한천 배지에 적용했다. 18시간 동안 30℃에서 배양한 후에, 아프라마이신 400 ㎍과 날리딕스산 1500 ㎍을 함유하는 멸균수 1 ㎖를 그것에 대해 함침했다. 5일 동안 30℃에서 배양된 후에, 한천 배지에서 성장한 스트렙토베르티실룸 클로니를 순수 배양을 실시하고 아프라마이신 250 ㎍/㎖과 카나마이신 250 ㎍/㎖로 보충된 1/2 MS 한천 배지(한천: 2%, 만니톨: 1%, 콩가루: 1%, 10 mM MgCl2)에서 2일 동안 30℃에서 배양했다. 클로니는 임의의 플레이트에서 성장하고 여러 과정: S#1 배지에 접종한 다음, 24시간 동안 30℃에서 배양하고, 개질된 YEME 배지(65 ㎖ 시험관 내에서 10 ㎖)에 접종한 다음, 1일 동안 30℃에서 진탕 배양하고, 또다른 신선한 개질된 YEME 배지(250 ㎖ 삼각 플라스크 내에서 50 ㎖)에 얻어진 배양물 1 ㎖를 추가 접종하여 계대 배양했다. 이 작업을 5번 반복한 후에, 얻어진 배양물을 이러한 방식으로 희석해서 적정 수의 살아있는 박테리아 세포를 얻었다. 이 배양액을 아프라마이신 250 ㎍/㎖를 함유하는 1/2 MS 한천 배지에 적용하고, 4일 동안 30℃에서 배양했다. 이렇게 성장한 클로니를 아프라마이신 250 ㎍/㎖과 카나마이신 250 ㎍/㎖로 보충된 1/2 MS 한천 배지에서 자기 복제했다. 카나마이신 함유 배지에서 성장하지 않지만 아프라마이신 함유 배지에서 성장하는 2개의 카나마이신-민감성 균주(D1 균주, D2 균주)를 선택했다.
얻어진 2개의 균주의 유전체 DNAs를 제조하고, PCR 반응을 41c30F4: 5'-CGTGACCGAGGTGGCGCG-3'(SEQ ID NO: 43)과 41c30RR2: 5'-GTCGTCGGATGCGCCGTGCG-3'(SEQ ID NO: 44)의 프라이머의 조합을 사용하여 수행했다. 증폭된 DNA 단편의 약 0.5 kbp가 얻어지지 않기 때문에 고안한 대로 2개의 균주는 균주를 파쇄한 것으로 확인되었다.
(실시예 7)
<생합성 유전자 결핍 균주의 배양, 및 배양액에서 UK-2A의 정량화>
파쇄된 균주, D1 균주와 D2 균주를 250 ㎖ 삼각 플라스크 내에서 제조된 S#1 배지[Ueki, M, 등, "The Journal of Antibiotics," (Japan), 1996, 49권, 639-643페이지] 50 ㎖에 각각 접종하고, 24시간 동안 30℃에서 진탕 배양했다. 이어서, 배양액 1 ㎖를 생성 배지에 접종하고, 4일 동안 30℃에서 진탕 배양했다. 이어서, 아세톤 4 ㎖를 얻어진 배양액 1 ㎖에 첨가함으로써 여과되는 UK-2A를 추출해서 추출액을 얻었다. 이것에 대해서, 5 ㎕로 HPLC 분석을 실시했다. HPLC 분석에 있어서, HPLC 시스템 LC-2010C(Shimadzu Corporation 제조)를 분석에 사용했다. 분석 조건으로서, 칼럼은 Inertsil ODS-3 4.6×250 ㎜이고, 이동상은 아세토니트릴:물:인산=60:40:0.1이며, 유동 속도는 1.1 ㎖/분이고, 칼럼 온도는 40℃이며, UV 파장은 340 ㎚이다. 얻어진 패턴을 UK-2A 표준 시료의 것과 비교했다. UK-2A로부터 유래된 피크를 확인했다. 그것의 영역에 기초해서, UK-2A를 정량화했다.
동시에, 배양액에서 UK-2A의 동일한 배양과 정량화를 형질전환체의 친주인 스트렙토베르티실룸 sp. 3-7에 대해서도 행했다. 결과적으로, D1과 D2 균주에 의한 UK-2A 생산성은 0 ㎍/㎖이었다.
(실시예 8)
<생합성 유전자 클러스터 도입된 형질전환체의 생성>
구축된 pUK2-3을 방선균에 일반적으로 사용되는 방법["Practical Streptomyces Genetics," The John Innes Foundation, (UK), Norwich, 2000, 311-338페이지]에 따라 스트렙토베르티실룸 sp. 3-7에 도입했다. 우선, 플라스미드 pUK2-3을 종래 방법에 의한 전기천공법에 의해 대장균 ET12567/pUZ8002 균주 내에 도입했다. 이 균주를 25 ㎍/㎖, 50 ㎍/㎖ 및 50 ㎍/㎖의 농도에서 각각 클로람페니콜, 카나마이신 및 아프라마이신으로 보충된 LB 액체 배지 내에 18시간 동안 37℃에서 배양했다. 이어서, 배양액을 LB 액체 배지(25 ㎍/㎖, 50 ㎍/㎖ 및 50 ㎍/㎖의 농도에서 각각 클로람페니콜, 카나마이신 및 아프라마이신을 함유) 100 ㎖에 옮기고, 4시간 동안 37℃에서 배양했다. 연속해서, 배양액 50 ㎖를 5분 동안 3000 rpm에서 원심 분리해서 박테리아 세포를 수집했다. 박테리아 세포를 LB 박테리아 배지 50 ㎖에 현탁했다. 이 작업을 2회 반복한 후에, 박테리아 세포를 LB 액체 배지 100 ㎕에 현탁했다.
한편, 스트렙토베르티실룸 sp. 3-7을 MS 한천 배지에 적용하고, 2일 동안 30℃에서 배양했다. 배양 후에, 균사체를 20% 글리세롤 1 ㎖로 스크레이퍼해서 숙주 균사체 용액을 제조했다.
이어서, 상술한 바와 같이 제조된 플라스미드 pUK2-3을 포함하는 숙주 균사체 용액 500 ㎕ 및 대장균 용액 500 ㎕를 함께 혼합하고, 박테리아 세포를 수집했다. 이어서, 박테리아 세포를 10 m㏖/L로 최종 농도를 주기 위한 이러한 방식으로 10 mM MgCl2를 첨가하여 희석시킨 MS 한천 배지에 적용했다.20시간 동안 30℃에서 배양한 후에, 아프라마이신 6 ㎎과 날리딕스산 0.5 ㎎을 함유하는 멸균수 0.5 ㎖를 그것에 대해 함침했다. 5일 동안 30℃에서 추가 배양한 후에, 형질전환체를 아프라마이신 내성 균주로서 얻었다.
(실시예 9)
<유전자 도입된 형질전환체의 배양, 및 배양액에서 UK-2A의 정량화>
유전자 도입된 형질전환체를 실시예 7에 기재된 방법에 의해 배양했다. 결과적으로, 표 3에 나타낸 바와 같이, 유전자 도입된 형질전환체의 UK-2A 생산성이 친주의 것과 비교해서 58~77배 향상되었다.
(실시예 10)
<유전자 도입된 형질전환체의 배양, 및 배양액에서 UK-2A, UK-2B, 및 UK-2C와 UK-2D의 합의 정량화>
유전자가 도입된 형질전환체를 실시예 7에 기재된 방법에 의해 배양했다. 구체적으로, 아세톤 4 ㎖를 얻어진 배양액 1 ㎖에 첨가함으로써 여과되는 UK-2A, UK-2B, UK-2C 및 UK-2D를 추출해서 추출액을 얻었다. 이것에 대해서, 5 ㎕로 HPLC 분석을 실시했다. HPLC 분석에 있어서, HPLC 용액 시스템(Shimadzu Corporation 제조)을 분석용으로 사용했다. 분석 조건으로서, 칼럼은 Inertsil ODS-3 4.6×150 ㎜이고; 이동상은 약 800 ㎖의 물로 아인산 이수소나트륨 이수화물 7.8 g을 용해하고, 인산을 사용하여 생성물의 pH를 4.0으로 조정하며, 이것에 물을 첨가해서 인산 수용액 1000 ㎖를 제조하고, 인산 수용액 350 ㎖에 액체 크로마토그래피용 아세토니트릴 650 ㎖를 첨가함으로써 얻어지는 용액이며; 유동 속도는 1.0 ㎖/분이고; 칼럼 온도는 40℃이며; UV 파장은 230 ㎚였다. 얻어진 패턴을 UK-2A, UK-2B, UK-2C 및 UK-2D 표준 시료의 것과 비교했다. UK-2A, UK-2B, UK-2C 및 UK-2D로부터 유래된 각각의 피크를 확인했다. 그것의 영역에 기초해서, UK-2A의 양, UK-2B의 양, 및 UK-2C와 UK-2D의 합계를 판단했다.
결과적으로, 표 4에 나타낸 바와 같이, 유전자가 도입된 형질전환체의 UK-2A, UK-2B, 및 UK-2C와 UK-2D의 합계의 생산성을 각각 친주의 것과 비교해서 37~57배, 10~11배, 및 12~13배 향상시켰다.
(실시예 11)
<형질전환체의 UK-2 생합성 유전자 클러스터의 복제수의 정량화>
실시예 9에서 향상된 UK-2 생산성을 갖는 것으로 확인된 형질전환체 2 균주와, 숙주 세포였던 스트렙토베르티실룸 sp. 3-7의 유전체 DNA가 실시예 1에 기술된 방법에 의하여 준비되었다. PCR 반응을 주형으로서 유전체 DNAs 및 그것에 부착된 프로토콜에 따라 StepOnePlus Real-Time PCR 시스템(Applied BioSystems Inc. 제조)을 사용하여 행했다. 이렇게 얻어진 증폭된 단편을 정량화했다. 표 5는 얻어진 결과를 나타낸다.
단, PCR 반응에서 하기 프라이머 세트가 설계 및 합성되었고, 도입된 UK-2 생합성 유전자 클러스터 내의 영역을 증폭시키기 위해 사용되었다.
UK-2 F2 (RT): 5'-GCACCTTCATGTCCGGGTTG-3'(SEQ ID NO: 45)
UK-2 R2 (RT): 5'-ATCGCCGCGTACACCATGAC-3'(SEQ ID NO: 46).
또한, 하기 프라이머가 설계 및 합성되었고, UK-2 생합성 유전자 클러스터 이외의 영역을 증폭시키기 위해 내부 제어로서 사용되었다.
cont F1 (RT): 5'-CGAAGGTCCGGTTGATGGTG-3'(SEQ ID NO: 47)
Cont R1 (RT): 5'-ATCGCTGCGACACCCTGGAG-3'(SEQ ID NO: 48)
표 5에 나타낸 바와 같이, 형질전환체의 UK-2 생합성 유전자 클러스터의 복제수가 친주 sp. 3-7의 것에 2배인 것으로 드러났다.
[산업상 이용 가능성]
상술한 바와 같이, 본원은 UK-2 생합성 유전자 또는 UK-2 생합성 유전자 클러스터의 도입에 의해 높은 UK-2 생산성을 갖는 형질전환체를 제공하는 것을 가능하게 한다.
따라서, 본원의 형질전환체를 사용함으로써 저비용으로 UK-2의 대량 생산이 가능해진다. 따라서, 본원은 도열병 방제제, 농원예용 살진균제, 및 의약 항매제를 생성하는데 유용하다.
[기탁된 생물학적 재료에 대한 참조]
[수탁 번호]
1. (1) 확인용 표시: 스트렙토베르티실룸 sp. 3-7
(2) 수탁 번호: FERM BP-11437
(3) 기탁일: 2011년 11월 9일
(4) 기탁 기관: 국제특허생물기탁센터, 일본 산업기술총합연구소
(5) 국제특허생물기탁센터, 일본 산업기술총합연구소(구 명칭: IPOD)에 의한 특허 미생물의 기탁은 제품평가기술기반기구(NITE)로 2012년 4월에 계승되었다.
[서열 목록 전체 텍스트]
SEQ ID NOs: 36~48
<223> 인위적으로 합성된 프라이머 서열
SEQUENCE LISTING
<110> Meiji Seika Pharma Co., Ltd.
<120> UK-2 BIOSYNTHETIC GENE AND METHOD FOR IMPROVING UK-2 PRODUCTIVITY USING THE SAME
<130> IBPF13-515WO
<150> JP2012/153986
<151> 2012-07-09
<160> 48
<170> PatentIn version 3.1
<210> 1
<211> 31318
<212> DNA
<213> Streptoverticillium
<400> 1
atgagttcct tggcgacccc cacccccact ctcgagggcc tcctcacgac accggcggcg 60
cagcacgccg aagcacaccc cccgctccac cggccgggct cggccacggc ctgcctcgac 120
cggggcctgg tcctccggca ggcggacgag gagttcttcc gccggttcgg cggctcggcc 180
ccgcgcctcg tcggccggtc cttcaccgag ctggtgcacc ccggctgccg ggagcccctg 240
ctgcggcagt tcgccgggct caccgagggc cggcgcgacc ggttcggcac cgaggtcatc 300
gcggtgggcc cggacggcac cccgttccgg accgacctga cggcgctggc ggtacgcggc 360
ggaacccccg acatctcggc cgtctggctg acgctggcgg cggccggcga gaccgcgcag 420
cccgccgccg cgacgccccg caagaagatc ctcagcgaga tcgacgcccg catcctcgaa 480
ggcatcgcgg ccggtgtctc caccgtcccc ctggccgcac gcctgtatct gagccggcag 540
ggggtcgagt accacgtgaa gagcctgttc cggcagctcc gcgtgcccaa ccgggccgcg 600
ctcgtctccc gcgcctactc catgggcctg ctcaaggtgg ggacctggcc gcccaaggtg 660
gcgccggact tcgtcaagtg agcccggacc gcggggtgat gacgtgtcgc ggcgcggggt 720
ccgcgtgcag ccgggcgacc agcggcgcgc gggcggccag cacccggcgc tggttgacgt 780
agcccttgtc ggtgatctcg cccgcgtcca ggtcgggcgg gtccgcgagc accagcagcc 840
gctggacccg ggacgcggac ccggcgcccc ggttgagtcg ctccagtgcc gcgccgaggt 900
gggcggccag cgcgtcggag tacagcaccc cgccgtccgc ggccggccgc cggccgagca 960
gccgctcggc ctcggccggg tcgagccacg ccagcgcgca gaccgcgtcc cggtgctccc 1020
cggtgatcac cgcgtcggag aggaccggcg cggccgaaag cagcgcgccg cgcacggctt 1080
cgacgtgcac gaacgtaccg gtggacagct tgaagtcctc ggtcagccgg ccccggaaca 1140
ccagccccgc gcccgcgtcg ccggggtcgg cgaacgcgac ggcgtctccc ggccggtagt 1200
agccctcctc gtcgaaggcg cgcgcgtcga ggtccgggcg gccgaggtag ccgggcgtca 1260
cgtgcgggcc gcgcacccgg acctcgtagc cgtcaccctc cgccggtacg agcttcagct 1320
ccacccccgg cagcggcacg ccgatgcacc gcgggtcggt gaacgggaag tgcgcgctgg 1380
tggacgccgg cgaggtctcg gtggcgcccc acgagcccgt caccggcacg tcccgcccgg 1440
tcacttcgcg gcccagcgcc cggagccgtt cgcgcagggc cggggccagc gccgccgccg 1500
cgttgaagac gagccgcagc cgggcgaaga accgctccgc cagctcccgg tcgcgctcca 1560
gggcggggac gagccgcgcg tacccggccg ggacgttgaa cgccagggtc ggggagacct 1620
cgcgcaggtt ggccagggtg cgcccgaaca gctccggggt cgggcggccg tcgtcgaggt 1680
acagagtgcc gccgttggcc agcaccaggt tcacgttgtg gttgccgccg aaggtgtggc 1740
tccacggcag ccagtccagc agcaccggcc gctccccggc caggaacggc cacacctgcc 1800
gcatcatccg ctggttggca cagagcatgc cgtgcgtggt gacgacgccc ttcggcgctc 1860
ccgtcgagcc cgacgtgaag aggaccttcg cgaccgtcgc gctcgtgacg cccgcacggg 1920
ccgcctcgaa cgcgcggccc ggcaccgtac gcagcagggc gtccagcgag tgctccgccg 1980
gcccgccccg cgccgccacg acgatggctc caccgcccgc cgcggccagc gcgggaccga 2040
acggcccggc gtcctcggcg tacaccgcgc ccggccgcag cagttccgcg atcgcccgga 2100
tccgcgcgtg gtcccggctc agcagggagt aggcgacgct gaccggcgcc accgggatcc 2160
cggcgctcag cgcgccgagc gtcatcagca ggtgcccggt ggagttgccg gacaggacca 2220
tcagcggccg ccgcgccgac agcccgcggt cgagcagcgc ctgcccgacc gcctccgccg 2280
ccgccagcac ctcgccgtac gtgcggtgcc cccaccggcc gtcggccccg cgctcggcga 2340
ccagcgggcg gtcgggcccg gcctgggccc aggtgcggag atggtcggtc acggaggcgg 2400
gatacacccc cagcggctgc gccgacgaga ggagcacggt cccgtccggc cggtcccgcc 2460
ggacggtccg ggcgggcgcg aacagcggtg acgaggtctc cccggcggtg gtcccaccgg 2520
cggcggagtg cggggcggtg cgcgtggtcg ggtgcggcat cggggttccc tcccggtctc 2580
gcggggctgt cagacgtgcc gctcgaccgc gcggcggagc tcgcccgcgc gcagcagggc 2640
ggcgacggtc tcgatgtcgg cgtccagcgg ccggtcggcg gagaggaacg gcgagtaccc 2700
gcggacgagc gtgtgcgcgg cccgggtcgc gctccccagc cgcccgaccc cggtgaggtc 2760
cgcggcctgg cacagggcga gcaggtggat ggcggtgacc tggctcgtca gccggaccac 2820
cgtgtgcgcg tgccgcgcgg cgatggtgcc catgctcacc ttgtcctggt tgtgcgcctc 2880
ggtcgaacgg gagaacgagc tcacgggcat cgtcaggtgc agcgcctcgg cggtcagcgc 2940
ggacgcggcg atctgcgcgc ccttgaaccc gtggtgcagc cctgcctccg ggtcgtcggg 3000
accgaccggg acgaccaggt tcggggtgag gccgatgctg aacttgtcgt ccaccaggat 3060
cgccagctgg cggtcgagca ggtcggcgac cccggccacg gcggcggaga ccgcctgcgc 3120
cgcctgggcg acgtgcccgc cgtagaagtt gccgctgtag tggacggtgt cggtggccgc 3180
ctcgaagagc gggttgtcgt tcgaggagtt gatctcggtg gtcagccagt cctcggccca 3240
gccgagcgtg tcccgcagca cgccgacgac gtgcggcgcg caccggatcg agtacgggtc 3300
ctggatgcgg cgctccagct cgacgtaccg gcgctcctcg ctcgaaccgg ggcccacgag 3360
atcggtgtcg gcgaccacgg cgggggagtc gcccagcatc cggtggacgt tcgcggcgct 3420
cgcgagctgg ccggggtgcg gcttgtgctc gtgcgggaac gcggtgaact ggtcgcggct 3480
gctgcgccgg acctccgtcg acagcacggt gcacagctcg gccgcccacg ccagctcggc 3540
cgcctcggcg accgccaggg cggcgtaggc ggccatgaag gacgtcccgt tgacgagcgc 3600
cagcccctcc ttggcccgga gcgtgacggg cgcgaggccg caggcccgga tggcctcgcc 3660
cgcgtcgagc gcccggccct ggctgcgcag ggtgccctcg ccggtgagcg cggcggcgag 3720
gtagccgagc ggcgcgaggt cgccgctggc gccgaccgaa ccgcgctccg gtatctgcgg 3780
cagcaggtcc ttctccagca gtgacaggat cagctccacc ggcgccgtgc ggatgccgga 3840
gttgccccgc gcggcactgt tggcgcggat cagcatggtg gcgcggacga cctcgtcggg 3900
tgccatgtcc ccggtgccga cccgcaggaa gcggagcagg ttccgttgca gcgccccggc 3960
cttgtcggcg ctgacctggc ggccgctgct gtcgccgaag ccggtcgtca ccccgtagat 4020
cgggatgccg gaggcgacga tccgctccgt ggcctcccgc gacgccgtca tgcgctcggc 4080
cgcggccgcc gcgagggcga ttctctgctt gcccggctgg gtcgcgaccc gccgcacggc 4140
ccgcagcgag aggctgtggc cgtccagctc gatggtggtg tcgtcggtgg gcgaggccat 4200
gtcggtcccc ttcggtcggt gggcgatggg cggtgggcga tcgaccgcgt gcgccgctcc 4260
ttgccgggcg gcccgcggac gccggtccgc ggtcgcggag ccgtgggtgt gcgcgccggc 4320
ggtacgggag aggggcccgt cgccgccggc gggatgggtg ggcgtggggg cgttgctcag 4380
ccgggcgttc cgccgatgcc ccactggtcg cgggggatgc cctggagcgt cacccacgtc 4440
acgtcgcggc actcggggcc gagggcgcgg accgccgcct cggtgagctc cccgatcagg 4500
gcgcggcggg tctcgggcgt gaggcggtct tcgtagaggc tgacctggat caggggcacg 4560
agggttcctt ctctcgtcgg gcgggtgctt cccggccact cagcgcggcg gccaggttgg 4620
cgccgagggt ctcgacctgg cgatcggtca tggcggggtg gcagggcagg ttgaggtgct 4680
cgccgaacca caggcgttcg gcgaccgggc actcgccctc gccgtgcccg cgcagccgcc 4740
actcgggcag caggtgcacc gggtggtagc gcaactgggc gggggtaccg gagcgttgca 4800
gggcgtccag cacgcggtcg cggcgtccgt cgccggggac gagcgcggtg tagaggtggt 4860
acgggtgcac cgcgtcgggc gcggcggtca gcggccggac gtcgaagcgg cggcacaccg 4920
cgtcgagttc cgcggcgatc gcccgccggc gggcgacgaa ctccggcagc cgttccagct 4980
gcaccaggcc caccgcgcag gcggcctcgg agagcgcggc gttggtcccg ctgccccgca 5040
gccccgtgca gtcctcccgg taggcgtagt cggcgtacgc catccacggc agcgccgcgg 5100
ggggccggcg gtgcgcggac gaggtgaagg tgccgtccac cgcgttcgac cggatccggt 5160
cgatcctgcg ggccagttcg ggcgacgggg tgcacaccat gccgccctcg ccgagggtgg 5220
tgatgttctt ggacgcctgg aagctgaagc aggacaggtc gccgagcgcg ccggggcggc 5280
ggccccggta ctcggcgccg atcgcgtgcg cgcagtcctc caccacgagg gcgccgtgcg 5340
cgtgcgcgat ggcggtgatc cggtccatgt cggcggggtt gccgccgtag tggacgagga 5400
tgacggcctt cgtgcgctcg ttgacgagag tctccagcgc gtccgggtcc atgttgaggc 5460
tgcccggctc cacgtcgcag aatcgcaccg ttgcctcggt cgcgagcagc ggctgcgcgg 5520
tggcgtggta cgtctgcggc gtcacgacga cctcgtcccc ggcccgcagg tcgagcagcc 5580
ggatcgcgat ctccagcgcg accgtcccgc tggtgaccgt cagggcgtgc gcggcgccga 5640
cgtgccgggc gaaggcccgc tcgaactcct cgcgcaccgg gcccatcgac aggggcgcgt 5700
ccgcgcgcag cacctcggcc acggcccgca cctccgcctc gccgagcagg ctgccccggt 5760
gcgggtggac gtcgccggcg cggtccgccg tcgcccggct cacgagcggg caccggccgg 5820
ctcggggtcg gacccggcgg cgtccgggcc cggcggcgcg tcgaggccga ggtcggccac 5880
gaggcgcttc ttgtcgacct tgccgaggcc gctcttgggg aacgcctcga cgcacacgac 5940
ccggtcgggg aacttgtagg acgccagccc gcggtcgcgc aggtagcggc gcagctcgcc 6000
cagggtcggg ggcgtgccga ccgggatgat cacggcgcag gtgcgctcgc cgaggacggc 6060
gtcggccatc ggcaccacgg cggcctggtc gatccgctcg tggccggtga ggtggccctc 6120
cagctcgggg gcggacacct tgtcgccgcc gcggacgatg acgtccttcg cgcggcccat 6180
caccacgacg ccgccgtcgt cggtgatccg caccaggtcg ccggtgcggt agaagccgtc 6240
cggggtgaac gccccggcgt tgtgctcctc ggcccggtag tagccgcgca gggtgtacgg 6300
gccccgggtg agcagctcgc ccgtcccgcc ggccgccacc tcgtcgcccg ccgcgtccac 6360
cacccgcagt tcgtcgtggg gggagatggg ccggccctgg gtggtgagga cggtctcggg 6420
cgcgtcctcg cggcgcgtga ggcacagcag gccctcggac atcccgaaca cctgctggag 6480
acgggccgtc agcgccggtc cgacctcctc ggcgagcgac cggtgcacca ccgcgctgcc 6540
gacctgcacc agctccagcg tcgccagctc ctcccggcgc ccgtcggcgg cggcgatcca 6600
ggagtgcgcg atcgtcggca cgaccgacgt cgtggtgacc ccgtgccggg cgatgagcgg 6660
gaagcacacc tgggggtcgg gcacggtgct cagcacgacg gcgcccccgt tggcgaacac 6720
cccgaccaca cccgggcagc cccacgtgaa gttgaaggcg atcggcaggg tggcgaggta 6780
gcgggtgtcc tcggagtact cgcagatccc ggcggcggta cgggcctggt acaggtagtc 6840
gtcgtgcgtc cgcgggatga gcttcggcag cgccgtggtg ccgccggaca gcaggaagaa 6900
ggccacgtcc gacgcgtcgg gaccggtcgc gccggccggg tccaggggcg tctccgcctc 6960
gggaagcggc gcgaactccc cggggtcgcc gaccacgaac acgtgccgga gcgacgcgtg 7020
ccgctcgcgc agggaccggg ccagcccgcg gtggtcgaac cccaggaacc ggtcgagggt 7080
cacgtaggcg ctcgccccgg tcaggccgca gatgtggtcc agctccgcca tgcggtggtt 7140
gggcagcgtg aagaccggca gcacaccgat gcggaagaag gcgaacgaca ccgccacgtg 7200
ctcggcgacg ttgggcagtt ggagcacggc ccggtcgccc gcccgcaggc cggcggccga 7260
gaacccggcg gccaggcggt cggcccaccg gtcgagggcg gcgtaggtga aggaccgctc 7320
cccgtcgatc agagccacgt tgtccggggt gcgcgcggcc tgggaacgca gcagctcgcc 7380
caggggctca ccggcccagg tgccgtcggc ccggtagcgc tccgcggtct cggccggcca 7440
ggggacgaaa ccatcgagtc catcgagtcc atcgagaaga ggcatggcag gggctcacct 7500
tcgttctgtg acggctggca tcggagaacg gtctatcaac ggagctctga ggaattcctt 7560
agtcctgccg cggctagcct cacgtcccgg tcgggccggt cgggccggac gcaccggaca 7620
gaggggagca cccgtcatga ccgtcgacga ggcttcggcg cacgagggcc gcctgccggc 7680
cttcgaggtg ttcgaccagg gcttcaagac cgatccgtac ccgtggtacc gcaagctgcg 7740
cgaggcggcg ccgatccacc gggtacggat gaccctgggc gcggacgtgt ggctggtgac 7800
cggctacgag ctggcgaaga ccgtgctcgc ggacggccgg ttctccaaga tgaccgtcaa 7860
cgccgagcgc gcgtggcgct ccctggagct catcccggac gaccccgacg ccctggtcaa 7920
ccggatgctg ctgatgagcg atccgcccga ccacgagcgc ctccgccgcc tggtgtcccg 7980
ggcgttcacg gcgcgctcga tggaggcgat gcggccccgc atcgccgagg tcgccgacga 8040
actcgtcgca cggttcgccg gccggggccg cgtcgacctc atccgcgagt tcgcgttccc 8100
gctgcccgcc atgatcatct gcgatctgct cggcgtcccc gccgaacacc gcacccggtt 8160
cgaggagtac ctgcggctgc tctgcctggc cgaacccgag gacgtccacc ggatgcccgc 8220
cgtcttcgcc gaactcacgg cggaactcgc cgagttggtc gagcgcaagc gggccgagcc 8280
cgacgggcac ctgctctccg cgctggtcgg gatccgggac ggcagcgacc ggctcaccga 8340
cgacgaactg gtctccatgg ccttccagct catgtacggc gcccaggaca ccaccgtcaa 8400
cctcatcggc aacggcatgc tcgccctgct ggacaacccc gccgccatgg ccgaactgcg 8460
ggagaacccg gagctcatcc cgggcgccgt cgaggagatc ctccgcttcg acccgccggt 8520
ggagaccgcc accccgcggt acgccctgga accgctcgac gtcggcggga tgcgcgtgga 8580
gaagggcggg gtcgtgctcg tctccctcgc gagcgcctcc cgcgaccccg ggcagttcga 8640
ggaccccgac gtcttcgaca tccaccgcga ggtgcgcgga cagctcgcgt tcgggcacgg 8700
gctgcactac tgcctcgggg ccgtgatggc ccgcgtgaag ggcgaggtcg ccctgcgggc 8760
cctgctgtgc ggcctggacg acctgcgccc ggacgaggac gccgaaccgc tcgcgcgcca 8820
cgccgggttc atcatgcgcg ggctgaaggc gctccccgtc cgcttcaccc cgcgcgccgc 8880
gtgaaccgga cgcgcccgcc ccgcaccgcc tcgggaccct gggtgccgca ccggcccggc 8940
accgccccgg gaccggtgac gctgttctgc ttcccctacg ggggaggcgg cagccgcgcc 9000
tacgccgaac tgctggaacc gctgcccccc tgggtggccg ccgtgaccgc gcggctgccc 9060
ggccgcgaga gcgcgcggcg gcagcccgtc ctcaccgacg tcggcgccat ggccgacctg 9120
ctcctccccg gcgtcctcga agcggccgac cgcccgttcg tcttctacgg ccactcgctc 9180
ggcgcgcgcg tcgcctacga gacggcccac cgcctcgcgg acaccggccg gccgctgccc 9240
gccgcgctct gcgtctccgg ggcgcccgcc ccggccctcg gcgtccacac cccgtgccac 9300
gaccagcccc gcgcggaatt cctccgcacc ctgcgggcga tgggcggcgt cgccccggag 9360
gtgctcgccg acgaggagct gtgcgactac gtcctgccgg tcatccgcgc cgacatgcgg 9420
gccgccgaga cataccggcc accgcgccgg accccgctgc gcacaccgat cagggcgctc 9480
gccggacggg acgacccccg ggtgccggtg gagcacgtgc ggcggtggtc ggacgaggcc 9540
ggtggggagt tccgctgcac ggtcttcgag ggaggccact tcttcttccg tgaccacccg 9600
tcggaggtcg ccgcggtgtt ggacggcctg ctgcgggaag tcgccggggg ataggggccc 9660
ggcccgggcg tcagggccgc agcagtccgc ccacccacca gtcgtgcggt acgccgtcgt 9720
tggcgatgcc gcgcttgcgc agtgtcccct cgacggtgaa gccgagtctc tcggcgacgg 9780
cacgcgagcc ggcgttcccg accatggccc accactcgat gcggtgcacg tcgagcgtgg 9840
cccatcccca gtcgcacagg gctcgggcgg cctccaccga atacccgtga ccgcgctgct 9900
ccttgaccgc ccagtagccg agctcccaga cgccgcggct gacgcgggtc aggcagtacg 9960
agccggccag ggcgccggtg tcctcgcgga acgcgccgaa ggtgtagtcc tcgtccgcgg 10020
cccactgggc gggcagcttc tcgccgacga gcttctccgc gtccgcacgc aggtacggca 10080
ccggcaccgg ggtgtagagc tggatgtcct cgtcctggca ggcctcgtac accgcatcca 10140
cgtcggcagg cgtgaaggcc cgcagcacca ggcggtcggt ccgaagggtc accgggtcca 10200
tcgcggcagt atgaccgccg acgacaagcg gcggccagtg gatttccgac cggccgccgc 10260
tccgggccgg gcactgccct cccgtctgga gcccttcccg cctagagtcc gagccggacg 10320
ccccccgacg cctcgatgcg ctgcccggtg acccagcggc cgcccggtcc cgccaggtag 10380
gcgacgacgt cggcgacctc gccgggcgta ccgacccggt ggagtgcggt ggtggcggcc 10440
atggcctcgc gctgggcggg caccttcatg tccgggttga tgtcggtgtc ggtgtacccc 10500
ggggcgaccg cgttgacggt gatgccgcgc ggccccagct ccagggcgag gtcgacggtg 10560
aaggtctcca gcgccgcctt ggtcatggtg tacgcggcga tcaccggcat cgccacccgg 10620
gtcgcggcgg tggtgacgtt gacgatccgg cccccgtcgc gcagccgcgg cagcgcgccc 10680
tgcaccagga agaacggggc cttggcgttg accgcgaaca gccggtccca gtcggcctct 10740
tcgaggtccc gtacgccacg cgggacggtg atcccggcgt tgttcacgag gatgtccacc 10800
ggcgcgggac ccgagccgcc gcggacggcg gcgacgccct cgtcgtaacc gcgccacagc 10860
tcgtcgaggg cgccgagctc gccgaactcc gcgcggacgg ggaaggccga cccgccggct 10920
tcgcggatct cccgcaccgt cgaccgcgcg gcttcgtcgt cccgtccgta gtggacggcg 10980
accagcgcgc cctccgcggc gaggcggacg gcgacggcac ggccgatgcc gcggccggcc 11040
ccggtcacca gggcgatgcg gtcggtcgga tctgacatgg gttcctccgg gagggggtgg 11100
tggtcggatc aggcaagggg tcagacggac agcgcggcac gcgccccggc gtccgcgacc 11160
cgctccagcg tcgccagcgt ccgcgcccgc acccgctcga tctgggcggg cggggagcag 11220
acgggggtgt acgggatctc cagcgagaac gcgccgtcca cggtgctgac acaggcgaag 11280
agcggaccct gcccgaaccc ggggccgtag tcctcgcgtc cggccgtcag ccgggtgtcg 11340
cgcagccgca gcccgggcgg ggacaccggg ccggcgatcc ggcccatgtt cgacacgatc 11400
acggtggtgg ccagcagctc cgggtggtcg acgaggcggg cgagcagagc ggtctccacg 11460
gcccagccgt cgccggccag ggcgccgcgc agcccctcgg tgacccggcg cgccagcgga 11520
cccacgtgct ccgggccctc gcccggcgcg acgtccacca cgtccgggaa ccccgagacc 11580
agcggcagca tcacgccggc cgccgccggg ggctcgaccc gggagcgcag gtccacgggc 11640
gagaagcagc cgagggcggc ggtaccggaa ccgccgagct cctcccgtat cgccaggagc 11700
agcgccgcgg cggtcacgcc gtgcaccgag gtgcccaacc tccgtgcgcc cgccgcgagt 11760
tcgccggtcc tgtcggcgga cagggcgacg cggacgttgt gcaccggctg ccgcccggcc 11820
ggcggcgcac cgtccccgcc cgcctccacg tacggcaact gcgccggcgg acggtcgcgc 11880
gcctgttcca ggcgctcggc gagcagcgcc gcgacggcgt ccccggacac ggccggcagc 11940
cgctccgaca ccggggccgg ccacgcggtc gccgccgggc gggccggttc gccggccagc 12000
accgcggcgt agtgccgcca gagttccgtg tggagggtga gggcgctggt gccgtcggtc 12060
accacgtggt ccacgacgag ccccacgacc gtgtccgagc cccgcgcggc cgtcgacagc 12120
cgcgcgaccg ggccgccgac gggcaagggg gacgtggcga tctccgtcat cacgtccttc 12180
tcgggcgccg gttcggccag gcccgggcgg ccggccgccc ccagccgttc gagggcgaaa 12240
ccgccgccgt gcgacacgat ccggctgtcc gccgtcggat gcgcgtcgag cgtccgcgac 12300
caggccgcgg acagcacgtc gaggtcgagg tcgccctcga cctcgacggt gaccaccgcc 12360
cggctgcggt cgccgacgtg cagctcctca agtgggcaga ggggacggag ggagtcgggc 12420
atcggttgtg ctcctcgggt cgttcgggcg ggcccgccat cgggggaggg cccgccggaa 12480
gtgcgcggtg tcgcgcgtca gccggtggct gccgcgtagt ggctcagggg gatcgacggg 12540
gaacggccac ggcgccggag caccggaccg ggccgacggc cgggcgcccg gccggggccc 12600
gccgaagtgg cgggcgcgtg atgacgccgc cggggtccgc tgggggccgg accggccgtc 12660
gggccgttct cgccgtccgg acccggccgg agcggcgggc gccgtgccgg tgccgcctcg 12720
ggcgccgggg cgtcgcgggg ccggccggtt gccggtccgt ggcgccgccg gattccgcct 12780
cgtgcggggg gctgcccatg ggggccgggc cggtcatccg gccgccacct ccgcccgttc 12840
ccctccgccg gcccccgcga gacgcgcctc gaccgccttc gcaatcacct cgatcgggcc 12900
ggcgtcggtc agggcgtagt gggagcaggc gagaggaacc tcctcgaagg tgccggtggt 12960
gaacgggcgc caggacgcgg cccggtcggc gatcccgccc gcgacctccg gttcgtcgtc 13020
ggcgacttcg gtggccgaga cgaagaggat gtcggcgcgc agccgttccg gaaccagatc 13080
gggggcgatc cgcagattgt tgcggaccac cttcgccacg gtgatcgcct cctcacgcgt 13140
gagcgtgccc ggcaccgcct cggggtcccg gcgggaggag tcgagcagcg cgagcgacgc 13200
gtcgaccgtg gccggcgcgg gcatggtcaa gccggccagc cgcaggacga gggcggcggc 13260
ctgcgcctcg accgcctcgc cctccagcgc cgccgcgtcc ggctgcggcg tgtcgagcat 13320
ggtcagcagc gcgacctcct cgccggccgc ctccagggcg gcggccaggc ggtgggcgac 13380
ggcgccgccg aacgaccagc ccagcaggtg gtacgggccg tggggctgga cggcccggat 13440
ccgttccagg ccgtcccgga tcacgtcctc ggcgcgcccg gcggcgggaa gggcgccgtc 13500
caggccaagg gcctggaggc cgtacaccgg gcggcgcggg tcgaggtgcg gcagcagccc 13560
cgtgtagcgc caggcgacgc cgctgaccgg gtgcacgcag aacagcggcg gcagatcccc 13620
cgcggcccgc atcggcagca tgggggcgaa cgcctcctgc ccgacggccc cgccgcgccc 13680
ggcgcggtcg agcagtccgg cgatcgtcgg cgtggcgagc agggccgcgg ccggcacgtc 13740
gagcacgccc gcggtgcgca ggcgcccgcc gagcagcacg gcgcgcatcg aatcgccgcc 13800
gaggtcgaag aagttgtcgt cgagcccgat gccgtcgaca ccgagcacgg cctcccactc 13860
ggccgccacg gcccgctccg cgtcggtgcc cggcggcacg tgcggcacgg ccagcggcgg 13920
acgcgggacg cggcgcgagg cgcggtcgcc ggcgcggtcg tcggatgcgc cgtgcggggc 13980
cgtggtcgcc cgggcgccgg gggcgtcgat ccagtgccgg tcgcgggcga aggcgtagcc 14040
gggcaggtcg ggcagggacc gccggggcag tcgggtgccc tcctccgacg cgtcgccggg 14100
cgggacgatg tccacctcgg ccccggcggt ccacaggtgc gcgagcgcct ccgcccgcac 14160
ccggccgtcg ggcccggtcg cccgcgcgtg gcgcatcacc gggacggtga cgggctccgg 14220
gccgccgtcg tcgacggccg cggccagccg cgacaggacg tcccccgggc cgatctcgac 14280
gaggaccggg cccgcgcccc cggcggaggc ggcgcgcagc gtccgcaccc cgtcggcgaa 14340
gcggaccgtg ccgcgcgtgt gcgccaccca gtgctccacc gaggtggcct gctcggcggt 14400
gacccacgtg ccggtgacgt tggtgatgta cgggacgcgc ggctcgcgca ggtcgacgcc 14460
gcggaaggcg gcggccaggt cgtccaggac cgggtcgagc atcgaggagt gggcggcggc 14520
gggcagccgc agccgccggt gggtgacgcc gtcggcgacg agccgctcga ccagcgcgtc 14580
gacggcctcc accggtccgc ccaccgtgca cgaggacggc gagttgaccg ccgccaggga 14640
caacccaccg tccaggagcg ggaggacgtc ccgctcgggc agcgccacgc cgaccgccgc 14700
cccgcccgcc gagatcatca gccggacgcg ggtgaccagc agcggcagca tctcctccag 14760
ggtcatcacc cccgcgaggc acgccgccac gtactcgccc agggagtgcc ccatcagcgc 14820
gccgggccgg accccggaag ccgccagcga ggcggccaag gcgtactcga ccaccgcgag 14880
cgcgcacatc gactccacgc tgaagtggtc ggcccgctcg tggagcgtga cgcggatgtc 14940
gtggtccagg accggctgaa ggatggcggc gcaccggtcg acggcctcgc ggtaggcggg 15000
gtcgtcgcgg tacagctccg cgcccatccc cacgtactgg gtgccaccgc cgggcagcag 15060
gaagaccacc tccggcgcac tctccgcccc ggccgccggg accgtcgcgg cggccagcgc 15120
ccgcgctgcg tccgccgcgg tcgccgccgc gaccgcgcgc cggtggggcc ccgggcgccg 15180
ggcgcgcagg gcgcgcgcca cctcggtcac ggacagttcc gggttgtcct ccaagtggcg 15240
cccgaggcgg ctcagttggc cggcgagtcc gtcgcgggtg cgtgccgaca ccggcagtac 15300
ggtccagccg ggcgcctctt ccgccggccc gatgggtacc ggcaggcgcg gtgcctcctc 15360
caggacgacg tgggcgttgg tgcccccgac cccgaaggcg ctcaccgcgg cgcgcagcgg 15420
gccgtcggcc gtccacggct ccagcgccgt cgagacgcgg aacgggccgc tcgcgaagtc 15480
gatgaggggg ttcggggcgt cgtggtgcac cgtgggcggc acggcccggt gctcgagcgc 15540
gaggacggtc ttgatgatgc cggcgatccc ggccgccgcg ccgaggtggc cgatgttgcc 15600
cttgaccgag ccgagcgcgc agtacccccg ccggtcggtg gactcccgga acgcctcggt 15660
gagggccgcg acctcgatcg ggtcgccgag gcgcgtggcg gtcccgtggg cctcgacgta 15720
cgtcaccgag ccggcgtcga cgccggccgc cacctgggcg gccacgatga cctccgcctg 15780
cccggccggg ctcggggccg agaaaccgac cttgcgccgg ccgtcgttgt tgatcgcgga 15840
accccggatg acggcccgga tccggtcgcc gtccgccagc gcgtcggaca gccggcgcag 15900
gacgaggacg ccggccccgt cgccgttgaa cgtgcccgcc gcgtccgcgg cgaacggccg 15960
gcacgccccg tcgggggaga gcgggccgtc gggcacgtgg cggtacccga gcatcgcctg 16020
cggatccacc gacaccgcgc cgaccacggc gatgtcgcac gcgtacgcgg ccagcgcctc 16080
gctggcggtg tgcacggcga cgagcgcggt cgagcaggcc gtgttcatcg agacgctcgg 16140
gcccgtcagc tccaggtcgt acgacagccg agtggcgagc gtgccaaggg agttggcggt 16200
ggccgcgtgg atcagaccca cggaggcggg ctcgccggcg tgccgcgggt gcacgttgta 16260
ggagtagtag cggctgtcgc cggcgcccgc gtagaccccg acgacgcggt cgccgtggcc 16320
gtccgcgtac cccgcgtcct ccagcgcgtg gtaggcggtc tccaggagca cccgctgctg 16380
cgggtcgatg agttcggcct cggccgggcc gtagccgaag aacgcggcgt cgaagcggtc 16440
ggcgtcgggc agcaccgccg ccacgcggac cagggacggg tcctccaggt ccgccggatc 16500
gcccccggcg gccaggaact cctcctccgt cacctcccgg acgccctgcc ggccctcgct 16560
cagcagcgcc cagaactcct ccagcgtgtt cgcgcccggg aaccggccgg ccatcccgac 16620
gacggccagc ggctccgtcg ccatgtcctc attcagcatg cgatgcctcc tcttggccct 16680
gctggcctgg ctggtcctgc tgacccttcc ggcccttcgg gcccttcccg ttccgctggg 16740
cgcgcgccgc gagccggcgg cgggcctgct cgcgggtggc gccgagggcg ctcccggccg 16800
ctgcggagcc gccgtcctcc tcgccgccgg cctcccggcc gtcgcccggc gccgtgatgt 16860
cccgccggcc cgccaagtgc ccggcgagcg accgcgcgtt gggatgggcg aacaggtcga 16920
ccaccgtcag cgcgccgccc agggcctcgt tcagctcggc ctgggcccgc accagcagca 16980
gcgaatgccc gcccaggtcg aagaagttgt ccccggaccc cacccgctcg cggcccagca 17040
cccgccgcca gacggcgagg acggtctcct ccagcacgcg gacgcggtcg ccgccggccg 17100
cgccggaagc cgcgctcccc tcggcggcgg acgccgccga ggacgcggcc cggacgaccg 17160
cgccgtgccc ggcgacgccg ccgcaggcgc gcgccgcggc ggccacggcc gcctcgtgca 17220
gcccgccgat gtcggcgccc tcctccaact ccacccgggc ggcgagccga tggcgcggcc 17280
gggcgggcgc gtccaccagc cgccggacgc cgtccgccgt ccggtccgcg ccgatgagta 17340
ccaccggctc gtcgaggccg cgggcgaggt cgaacgagcg cagggccgac tccacgtcga 17400
gtgcccggta gccgcgcgtc tccccgaggg ccgccagctc gtcgccctcg ctcatccccg 17460
tgtcccgcca gctgctccac gccagcgact gggcgtccag cccccgcgcc cgctgacgga 17520
cggccagcgc gtcgaggaag gcgcacgccg ccgcgtaagg ggcgccgaac gcggccccga 17580
aggtgccgtt gaccgaggag aaggagacga acgaccggac cgggtgccgg gccgcgagcc 17640
ggtccaggac gcacgccccg ccgatcttgg ccgcggtcgc cgcgcgccag gccgccgggt 17700
cgaggtcggc cgccgcccgc cgttcgatcg tcccggcgag gtggaggatc ccggtcagcg 17760
gggccgacca ggcgtccgtc gcggcggcca cggccgcgtc cagcgccgcc tcgtcggtga 17820
cgtcggcggc cgcgtagcgg acctccccga gctcgcgcag ccgccgcagc accgccgcgg 17880
cgcgggcgcg agcgtcatcc gcggccgggt ccccggccgg cagcggggtg cggccgacca 17940
ggagcagccg taccccgggc tcggtggtga gcaggtgctc ggcgaggtgg gccgcgacgc 18000
cgcccagccc gcccgtcacc aggacgacgc cgtcgccgta ggcggggacg gtgaccgact 18060
cgggcaccgg tacaggggcc agccggcgca ccaggcgccc gccgtcccgc cggcacacct 18120
cggcgtcggc cggagcgacc gcgagttccg cggcgatcag cgccgccacg tcgtccggct 18180
ccccgtcgcc cggcacggcc agcgtgcccg cggacaggcc gggacgctcg tcccgcagcg 18240
agggcaggag cccggcgagg gtcgcgtgcg gcaggtcccc gccggtgacg caccgcaggt 18300
cgacggcgtg gcccgcgtgg tcgggggcgg ccagcgcccg ggccagggcc aggaccgagg 18360
cggcgccgga ccgctgggcg tcgagcaccc cgccggcgtc caggtcgcgg ccggacggct 18420
ccagcggccc gaggtgcacg acgcgctccg gacggcggtc gtcggccgcc agccggtcga 18480
gcagcgccgc gaagtcggac gcctcgtcgg ggcggaccgt gtaccgggcc gcgtcccgcc 18540
gcccgaagcc cgtaccggcc accgctgtcg tggcgcgtcc gccctcccgg cgcaccaggg 18600
cggcgagccg ctcggcgacc cccgcacccc gcggccccgc cgccacgatc agcacggacg 18660
tgccggccgg gggagcggtg gccgggcgcg tcaccggcga ccagacggga cgcaggaacc 18720
agtgcggaac cgtcgccgcc gtcccgagca gcacctcggc ggcgcgcgcc accgcgtcga 18780
actcaccggc ctcgaaccgc ttgcgcagct gcgtccgctg gatcttgccg atctcggtct 18840
tcgggatcac cgccgtctcg acgggcagca cgtgcgcggg cgccacgccg acctcgcggg 18900
ccaccttgcc ccggatcgcc cgcagcgcgg ccgccgcggc ctccccggag tcgtgcccgg 18960
gggccaggtg cacgaacagc gcgagctggt cggtggcggc cgaggcgtcc gtacggaccg 19020
cgaccgccgc ggtgaacgag cgcaccacca ccggcagttc ctcgacgcac gcctctatct 19080
cgtgactgaa gtggttgacg ccgttgacga tgatgacgtc cttggcgcgc ccggtgatgt 19140
acagctcgcc gtcgcgcagg aacgccaggt cgccggtgtc gaaccagccg tcggcggtga 19200
acgcctcggc gttggccgcc gcgttgtcgt ggtagcccga cgtcaccgag gcgccgcgga 19260
cctggaagcg gccgacctcg ccctccggca gcagccgcag ctcctcgtcg accacgcgca 19320
tcgcgaaccc ggggtacggc cgcccgcagc tgacgaaggt ctcgtcgccg ccgggcggcg 19380
gctgcgggtc gaggaccgtg tccgtgacca cggagcacgt ctcggacatg ccccagccgg 19440
ggtgcatcac gtcggacggc agcccgtgcg gcgccagggc ctgcaggaac cggcggttgg 19500
tcgcgccgac gacgacctcg cccgcgttca tgatcagccg tacgggggag aggtcccact 19560
cccggccggc gagccggccg gcctgctcgg cgacgaggcc gaaggcgaag ttcggcgccc 19620
acgtgacgct gacgcgccac cggtccgcca gctcccacca gcgcagcggg tcctccagca 19680
cccagcccgt cggggcgtgc acctgccggg cgccgaggta gacgtcgcgc aggtggaaca 19740
tcaccacacc ggtgacgtgg tcgagcggga tccagttcag cgagacgtcg tgctcggtca 19800
gggagttggc cgccgccgcg gcgacggccc ggctcagcac gttgccgtgc gtcagccgca 19860
ccgccttcgg aagtcccgtg ctgccggagg tgagcagcat gagcagcagg tcgtcggggc 19920
gtgcctgatg ccagtcgcgg tccggggcgg ccgcgcgcag ggcgtccacg gtcacgatgc 19980
gggggtccgg ccactcccgg cgggccgcga gctccgccag gccgtcggca cggtccgcgg 20040
aggtgacgac gaccggccgg cccagcatgc gccagacgcc gtcgagcttg ttcacggccg 20100
ccgagtcggt ggcgtacgtg ggcggcacgg tgagcgggac gacggtgacc ccggcggcga 20160
tcgcgcccca gagcgcggcc acgaagtcct cggtgtcgtc gcactgcagg accacctggt 20220
cgccggcgcg caggcccagg gcccgcagcc cgcccaggac ccgctcggcc tcctcgatca 20280
gcgaggcgta cgagcgccgg ctctcggtgc cgtccgcgcg cacgtgcacg atctcggcgt 20340
ggtcgccgcc cgccgcggcg cggcgcaggg cctcgggcca gccgccgacc tccgccgggg 20400
gcagcggcgg gccctcggag agcgacagcg cgcggtccgc ttggtgaacg gcggccggtc 20460
cggcggtggc cgccacggta cgcgggcggg tcgccggccg gagcgcctcc agcccctcgg 20520
ggacgtcctc gcgcccgacc gccgccgccc gtacgccggt cacggccgcg agagcggcgc 20580
gccagccgtc ggcggcggtg tcgtcgacga ccggcagccg gtgcagcgcg gccacgtcga 20640
ggtcgccggc ggcggtgcgc gggaggacgg tcacggccgt cacccggggt gccccgtcgc 20700
cgccttcgtc cgcgaggagc cggcgcgcgt cgtcgtccgc gcccggtcgc gcggggacga 20760
cccagacgac cggaccgccg tcggagggcc gggtgaccgc gacgtccgcg acggcggaca 20820
gggagcgcac acggctctcc agcgccgcgt cgtcggacac cgcctcgggt gcggcgtccc 20880
gcccggcgag caggccgtcc gggacgaggt cgccgaggcg cgcccccggg gcggccgcgg 20940
cccgggcgag gacggtgacc aggccctcgg cgagcaggcg cgcggtgctc gggtcgaaca 21000
ggtcgcgggc gaactcgacg tgacaggtca gaccgccggg cgccgagccg tcgtccccga 21060
cgtgctcggt gatgtcgaag aacaggtcga acttcgcggt acccgtcgcg ctgggccgca 21120
gcggcaccgg cgggccgccc agcgacaccg ccgcggcggc gttgttctgc agcgccagca 21180
tcaccgtgaa cagcggatga cgccccggca cgcgcggcgg gttgaccagc tccaccacct 21240
gctcgaacgg caggtcctcg tgcgcccagg cggcccggtc ggcctcctgg acgcgagcca 21300
gcaactcggc gacggccggc gagccggagg tgtcggtgcg cagcacgacg gtgttggtca 21360
ccagccccac cacgtcgtcg agcgcctggt cgtgccgccc ggcgaccggg gtgccgatcg 21420
ccagatccgt accggcgccg aggccggtga gcagggcggc gacgcccgcg tgcagcaccg 21480
tgaacaggct gacgccgtgc gcccgcgcca gctcccgcag ggccgcgtgg gccaccggac 21540
cgacggccag gtcgacggcg ccgccccggc cggtcggccg ggcgggccgc ggccggtcga 21600
acggcagcgc ggtctcctcc ggcagccccc gcagcgcggc gctccagaac tcctcgtcgc 21660
gccgggcggc ggcgccggcc gggtcgagcc ggtcgcgctg ccagagcacg tagtcggcga 21720
actgcaccgg gagcggcgcg agttcgggag cccggccggc ggcgcgcgcc gcgtacgccg 21780
cggtgaggtc ctcggccagc ggccgcagcg accagccgtc ggcgaccagg tggtgcagta 21840
gcaggacgag cgtgcgctcg ccgtccgccg gtccgtacag gccggcccgc aggcccggct 21900
cccgggtgat gtccagccgg cgtcgggcgg cggcctcgac gtgcgccccg atctcctcgg 21960
cggggcagtc gacgacgtgc agcggcacgg ccgccggttc ccggacctcc tggtacggca 22020
cgccggcctc ggccgggaag accgtgcgca ggctctcgtg gcgggcggcg acgtcgccca 22080
gcgcggcggc gagcgcgtcg gcgtccacgc ggttcggcag ggggagcacc agcgggatgt 22140
tgtacgtcgg cccgtcgtcg agccggtcca ggaaccacag gccccgctgg gccggggaca 22200
gcagcaggcg ctcgggccgg ccggccgggc gcaagggggt gcgcgcgggc ggtgcggtgg 22260
tcagccgggc ggcgaggccc gccgcgcagc gggcggcgaa cacgtcggcc acgccgatct 22320
cgacaccgaa ccgggcgcgg atcatcgtgg cggcgcgtgc ggcggtcagc gaatggccgc 22380
cggcggtgaa gaagtcgtcg tccggcccga tccgttcgat ccccagcacc tcggcgagga 22440
tctcggtgag cgcccgctcc tcggggccgt cgggctcccg cgcggcggcc gtgggctccg 22500
gcggctccgg gagcgcgtcc cggtcgagct tgccgttggc ggtggtgggg agctcggcga 22560
gggggacgac ggccgtgggg accatgtgct cgggcagccg ggcggcgagg tggtcgtgcc 22620
agcgccgggc gcgggcctcg aagccgtctt ccccgtcctt ctccgccggg gcggggacga 22680
cccaggcgac gagccggggc ccgcccgcgc ggtcgtcacg ggtgccgacc accgccgcgg 22740
cgacctccgg gtgctcggtc agcacggcct cgatctcgcc cagctcgacc cggaagcccc 22800
ggatcttgac ctggtggtcc aggcgtccga ggaactccag cgcgccggag ggcagccgcc 22860
gtaccaggtc gccggtgcgg tagcgccggc ccgccgccgg gtcctccggg aagcgctcgg 22920
cggtgaggtc cggccgcccg aggtagccga cggcgagctg gtcgcccgcg atgtacagct 22980
cgccgggctc gccgggcggt accggtgccc cccaggggtc gagcacgtcc agccgggtgt 23040
tccagacggc gcggccgatc ggcaccgtgg cgcccggcgc gccgtcgcgc agcggccacc 23100
agctcacgtc gatcgcggcc tcggtcgggc cgtagaggtt gaagacctcc gcgccggtga 23160
cctcctcggc ccgccgcgcc gcctcggtcg gcagggcctc gccgctgcac aggatccgcc 23220
gcagcgcgcg aggccgggcg gcggccggct cgccgagata ggcgacgagc atcgacggga 23280
cgaagtgggc ggtcgtgatg cccgcctcgt cgatcgccgc ggcgacccgc gccgggtcgc 23340
gctgcgcgcc gggggccggc aggaccagcg tcgccccgct gatcaagggc cagaagaact 23400
cccagacgga gacgtcgaac gcgcagctgg tcttctgcag cacccggtcg cccgggccca 23460
ggccgaaccg gtcctgggtc cacaacagcc ggttgacgac ggcccggtgg gcgacggcga 23520
cgcccttggg gcggccggtc gagcccgagg tgtggatgac gtaggccagg tcgtcggggc 23580
cgggaccggc cggggccgcg cccgtgccgt cggcccgcag ggcgaggacg tcgacgacgt 23640
tcagctccgc cggcagcgcg acgggcgcgg gtccggcggt gaggaccgcg acgggccgga 23700
cgtcctccag gacggcggcg agccgggccg gcgggtggtc gaggtccagc ggcgcgtagg 23760
ccgcgccggt ccgcagcacc gccagcaggc tcacgaccag ggccgtcgaa cgcggctggg 23820
cgaccgcgac gatcgtcccc ggacccgcgc cgagcccggc gaggccacgg gccagccggt 23880
ccacccgctc gccgagttca cggtaggtga gctccggcga gccgtcggcg ggcaccagcg 23940
ctacggcgtc cggcgtccgc gcgatctgct cggcgacgag ccggtccagg gtggtgacgg 24000
gtaccgggtg ggcggtgtcg gcgtcggcgg ccagtgtgcg gtgctcggcc tcgtcgagca 24060
ggtcgactcc ggcgagcgtg gtctcggggt cggcggtcac cgcgtccaac aggcgtatga 24120
aacggcgcag ttcgctgtcg gaccaggcgg ggtcgtcggg ggcgtcgtcc acctggagtg 24180
cgcggacgcg gtcctcgccg aggaccgccg tcacggcggg gccggtcgcg ggagccgcgg 24240
agacgaggtg cagcgccgcg tcgcggtccg gtgtcccggc ccaccgtgcg acggtcacgg 24300
acgggccgga tacgcgcccg tccgccgtcg cgcggtggcc gcgcccgtcc tggaccgcgg 24360
cgacggtctc cgcgagcgtc gtggtgcccg tgaggtccag cggcagcggg acgggggtgc 24420
catcggcggc cgggacgtac agctcgaccg cgccgctccc acggcggcga gcggtgaaca 24480
tcgcgacggc ggctgccacg aaatcccgta tccctacccc gagttcgcgg gatccttcca 24540
tcatccggcg gccgagcgcg gccgggaccg cgatctcgcg gtgccgggag ccggagccgg 24600
cgggccggga atcggccgcg acgtccgcga cgtccgcgac gtccgcgagg ccgtccggcg 24660
ccccggcgag cgcggcgacg cgccgggcca gggccggcgc ggcgcgctcg tcggactcgg 24720
gaccgcccgt acgccggaac cacaggtggt gctccggtcc gagcgcgagc accgcgtggc 24780
cgcaggccgt cgcggccggg cgcgccagct cggcccgcat ccaggccagg gccgcgccgg 24840
ccgggtcgct ctcaccggag agatcgacga attcggccgg cccgcatggc gcgccctcgc 24900
cgtccgccga cgtgtccgcc gacccgcccg ccggtccgga cgccgcttcc cccatcggcc 24960
cgtccaccgg cccgtccacc agcccgtacg ccgcatcgcg caccgcgcgg acgcccgccg 25020
cgcggaggcc ctcgcggtcg accggccccc ggaggtccag gtagtggccg gtgtcgtaga 25080
tcggccccac cgctcccagg tcgtcgacgg ccgtgtcggg gccggcctcg gcgagcgcgc 25140
ccagcaggcg cccgagcccg cggccgtgcg ccagcgccgt cggcgcgtcg taccggaggg 25200
cgttggcctc gacctccagg gtggtcagct cgccgtcctc ggcgaggtcc acgacgaacg 25260
cgatgtcgtc gacgggcccg ggggagaggt ccacgaccgg gaggcgccgg cccaggagcc 25320
cgatcgtggt gtcgtaactc ttgatgttga cctgggcggt ggtgaactcg gactcgtcgg 25380
tgacgcgccc gaggtcccgg cggatgtcct cgacgcggta ccgcccgtgg cggcgcagct 25440
cccgcatcgc cttccgcagc cgggcgacca gcgtgccgac cgtgtcgccg tccgcgaccc 25500
gtacccgcag cggcagcacg ttgacggtgg tcgagggcag gcgcgcggcc gcgccgcccc 25560
gcagggccag cggcagggcg aggacgacgt cggcggcacc ggtcacccgg tgctggtaga 25620
cggcggtggc ggcgatcgcc aggtccgcgg tcgtggccga gaggctctcg gcgagccggg 25680
cgaggccggc cggatcgggc agcacgtcga cgcgcgcctt cagcggcgcg ccgcgcgccg 25740
gctccggagg cgtgccggac aggcttaccg ggggcgggag ttcggcgagt gcgtccagcc 25800
agtaggcgcg gtcccgcggc atccggtcgc ccgcccggta cccggcctcc tcgtccaggt 25860
acgccccgag gccgccgaag gcgggctcac ccggtgaccc gcccgtgcgc agcgcttcgt 25920
ggatctcctc gatccgccgc aggaccagcg agaacccgta gccgtcgagg agcatgtggt 25980
ggcagcggtg gaaccacagg gccccgccct gccaccggaa caggacctcc cgcgccaacg 26040
gccgccccac aggcggctgt tcgaggtcgg cgcgcatccg cgccagggcg acggcctccg 26100
ggtcgggccg cccggagagg tcgacgacct ccacgcgggg tgccgtgccg gtcccgcgct 26160
ggacggggac gtcgccgtcc gcgcccacct cgaccgcgag cccccacacc tcgccgaggg 26220
cccgctcgac cgcgcgcgcg aaccgctccg ggtcgacctc ggcgggcagc cgcacgtact 26280
ggcctgtggt gaagaccggg ttggaggtgt cacgctgctg ggcgaaccag atcccggcct 26340
gcggggcggt cagcggacac gagtcggcag cacggtcggg catggatgca ccttccacgt 26400
cgttgcggtg tgatcttcca cgtcgttggg gggagttcga gccggcgccg ggtgtgacgg 26460
caccagacga gtcggcaccg ggcgggacgg cccggcccgg gagcgcgtca gcccgccgcc 26520
gcggctccgg tccgcgagtc ccgcacgatc tcccaccact cctcgggggt cggccgttcg 26580
aggaagtcgg ccaggggcgc ggtcaccccg gccgcgcgcc accgcccgat cagccgggtg 26640
agcgtcaccg agtcgagacc gagctcgaac aggttgtcgt ccgggaggag ttcctcgtcc 26700
tccatgccgg ccgtcgcggt cagggtcgtc agcagcgcgt cgaacgtctc ggggacgtcg 26760
atggtgtggg gcttcatgcg cgccacgcta atgacgcgga tctagggatt tcctcagatg 26820
tggtccgccg cggccggccg gccgggcgcg gcgaacggca ggggagcggg ccccgcggca 26880
cccagcacga tgtcggcgag gaggtccccg acggcggcgg cgtgcttgaa tccgtagccg 26940
ttgcaccccc cggccagcac gacccggggg tcggccgggg aggcgccgag cacgaactgc 27000
ccgtcggcgg tcgtcgtgat cccgcagtgc aggatccgcg acggtacgcg ccccaccccg 27060
gggacggcgg tggcgagcac ctcgccgagc cgctcccagg gcctgctcgg gacggcggga 27120
gcgccgagtt cgggatcgta cgggtccggg tccgccccct gctcgatgcc gagcttgacg 27180
tgcccggggt cgccgtcgcc ctggccccag atgacggtgt ccgcgtcgat ctcccgcatg 27240
aacaccggga acagctcgcg gcggaacagc gccgggtcgc cgctcggcgg gaaccacgtc 27300
atcggcaggt ggacggagcg gacgcccagg ccgggggcga agtccggcag ccagcacccg 27360
ggcgtgagga cgacccggcc ggcgaccagg tcgcgcccgg cggtgcggac ccgtacgccg 27420
ccgccctccg gctcgacgcc gagcacctcg gtgccgcgga gcacggtggc cccgccgcgc 27480
tccgccagct cgaccgcggc gcggaccgag tcctcggccc gcaggacgcc cgccgagggc 27540
tcccacacgc ccacgtgtcc ttcggggatg ccggcgtgcc ccgggaagcg ggccgagacc 27600
tcggccggtt cgaggacctc gaccgcgacg ccgtgcgcct cggccgaggc gatggtgccg 27660
ccggccagcc ggccgtcgcg cgggccgatg agcaggcccc cggtgttctc gaagagccgg 27720
cggcccgtgc ccgcctccag ctcgcgccac agctccagcg aacgccgggc caccggcacg 27780
agggcctcgt tctccaggca ggtctcgcgg aacatgcggt gaccgccgtg cgaggacccg 27840
cgggcgtgcg cgatgtcgaa ccgctcgacc cccaccgccc ggacaccgcg ggcggcgagc 27900
cgccacagcg tcatggcccc ccagatcccc aggccgacca ccaccacgtc ggggcgggcg 27960
gggtcgtgcg accggtcgac ggacatcttc gctacctcct gggaaccaag cgggaattga 28020
ctgagagtca gggcgagaac tgaccgaacg tcaggcagcc gcgaaccgcg gcgcgatctc 28080
ggcggcgaac tcggcgaccg cccaccgcgc ctgctccagt ggcgtcacgc cgttgttcat 28140
gtgcaggctg acggtcacgt cgccgcccac ccgctcgcgc acccgctcca gctgctcggt 28200
gatgtcgccg gtggtgccga tcagcacctt gtcctgctcc cacgacttgc gcaggtcgga 28260
ggaggcgacc ttgtcggcga gcttctcgta ccccgggtac tgcgcggtcg cggcgccctg 28320
ccagctcttg acggcgccgc tcatcttgtc caggtagttg gactccgccg cctcggccgc 28380
ccgccaggcg ctgtcgcggt cccggtccag gtagcagctg tacttgacct ggatgcgcgg 28440
cgcgcggtcc gggtggtggg cggcgaaggc ctcgcggtag gccgcgagca tctccgcgaa 28500
ctgctcaccg ctggtgatgg tcggcacgat ctgcaggttg tgcccctcgc ggccggcggc 28560
ggcgcaggac tcggcgctgg acgccgaggc gacgaacagc ggaggatgcg gcgtctggtg 28620
cgggcgcggg gtgagcgtca ccgacccgaa gcggtggaac tcgccctcga agaccacgtc 28680
cgtcccggtc cagagcgcga cgaaggcccg cagcgcctcg gtgaagcgcg cccggctctc 28740
ctccatcgac acctcgaacg ccgtgaactc gtgcggcagg aaggcccgtc cgacgccgac 28800
gtcgacccgg ccgccgctca gctggtccag catcgccagc cgcccggcca gcttgagcgg 28860
gtggtcgaag gcggggatga ccgcgccggt ggtgatgcgc agccgctcgg tacgcgcggc 28920
gatggccgag agcaggacca ccgggtcggg gctgtacccc ccgtagggcc cgaggtggtg 28980
ctcgaccacc tggacgtgct cgtagcccag ccggtcggcg tcgacggcga gggccaggca 29040
gtcgtcgaag tagtcgtgcg gcgccttgtc ccgctcgtcg agcgcgggga agaaggtcag 29100
accgaaatcc atgggctccc caagggtgag aagtgaggtg ggtcggagcc ggagcctagg 29160
cggggaggac tggggagatc cctagacatc cgttggtaga caagggccgt cggcgggagt 29220
cggactcccg ccgtccttgc cgaccttcga aaggacccca gcgtgtcgaa tcggatgagc 29280
agcgaagtac ccgagatcag ggtcagcgac gagcgggtca accgcacgct caccgcggtc 29340
aacgcccggg cggccgagca cgaccggtcg ctattcgagc aggtgcgcga ctcgctggcg 29400
gtcgcggtgc cgccggaggc gggcacgctg atgtaccagc tcgtgcgcgc cacccgggcc 29460
gccaaggtgg tggagctggg gatgtcgctc ggcgtctcca cggtctacct cgccgccgcc 29520
gtgcgcgaca acgggggcga ggggcgggtc tacacgaccg agatcgacga ggcgaagatc 29580
aagcagggcc gcgccaccct ggccgacgcc ggcgtcgccg acctcgtcga ggtgctggag 29640
ggcgacgcgc tccagaccct ggactcggtg cccgacggcg tccagttcgt cctgctcgac 29700
ggctggaacg agagctacct gcgggtgatg aagatcctgg agcccaagct cgcgccgggc 29760
gccctcgtgc tcgccgacga cgtcaacctc ttcggcgagg gctgcgtgga cttcctggag 29820
tacgtccgcg accccgcgaa cggctacctg tccgtcaact tcccgatggg cgagggcctg 29880
gagctcagca tgcgcgtggg ctgagcgccc gcgggtaccg ggcgtgcggc ccgtccgcac 29940
gcccggccag gaaccgacag gaaccgaaag gaagaccatg acggaactgc gtgacgcggt 30000
gctgcgtggc gcgtcccccg aggaactgct gcgcgccccc ctcccggcca cctaccgggc 30060
cgcccacctg cgcgccgagg acgtcggcat gttcgacggc acggacggcg accgcgacgt 30120
gcgcaagtcg gtggccgtgg gccaggtgcc gctgcccgag atcgcgcccg acgaggtcct 30180
gatcgcggtc atggccgccg cggtcaacta caactccgtg tggtcggcga cgttcctgcc 30240
gatgccgacc ttccgcttcc tcgagaagta cgcccgccag ggcggctggg cagcacgcca 30300
cgaccagccc taccacgtga tcggctccga ctgctcgggc gtcgtcgtgc gcgtcggctc 30360
cggcgtgcgc cggtggcggg tcggcgacca cgtggtgatc cacccggtgc acgtggacga 30420
ccagggcgcc gccacccacg acgacgccat gatggacgac cagcagcgcg cctgggggta 30480
cgagaccaac ttcggcgcct tcggcgagta cgccgtcgcc cgcgccagcc aactggtcgc 30540
caagcccggc cacttgacgt gggaggagtc ggcggcgaac acgctgtgca ccaccacgtc 30600
gtaccgcatg ctcgtcgggg cgcacggcgc ccggatgaag cagggggacg tggtcctggt 30660
ctggggcgcg gcgggcggcc tggggacgta cgccgtgcag ttggtcaaga acggcggcgg 30720
tatccccgtc gccgtcgtca gctcgcccgc gaaggcggag gcggtccgcc ggctgggctg 30780
cgagcacgtc atcgaccgca ccgaactcgg gctcaccggc gacccctcgg gcgacttcga 30840
cgccgtgcgg gagatcggca agcggctggg cgcccgcatc cgcgaactcg ccggccgcga 30900
ccccgacatc gtcttcgagc acaccggccg ggccaccttc gccctctcgg tgttcgtcgt 30960
ccgccgcggc ggcaccgtcg tcacctgcgg atccagctcg ggctaccggc acctgtacga 31020
caaccggtac ctgtggatga agctgaacac cgtcatcggc agccacggcg gaaacctgca 31080
ggaagccacc gagagcaccc gcctgatcgc ctccggcgcg atcgttccgg cgctctccga 31140
ggtccacccc ttcgaggacg tggccgaggc gatgcggcgg gtccagctca acgagcacgt 31200
cggcaaggtc gtcgtcctgt gccaggcccc caccgccggc ctgggcgtga ccgacccgga 31260
gctgcgggaa cggctggggg aggagcggac ggcacccctg ctgcgggact ccgcctga 31318
<210> 2
<211> 681
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(681)
<223>
<400> 2
atg agt tcc ttg gcg acc ccc acc ccc act ctc gag ggc ctc ctc acg 48
Met Ser Ser Leu Ala Thr Pro Thr Pro Thr Leu Glu Gly Leu Leu Thr
1 5 10 15
aca ccg gcg gcg cag cac gcc gaa gca cac ccc ccg ctc cac cgg ccg 96
Thr Pro Ala Ala Gln His Ala Glu Ala His Pro Pro Leu His Arg Pro
20 25 30
ggc tcg gcc acg gcc tgc ctc gac cgg ggc ctg gtc ctc cgg cag gcg 144
Gly Ser Ala Thr Ala Cys Leu Asp Arg Gly Leu Val Leu Arg Gln Ala
35 40 45
gac gag gag ttc ttc cgc cgg ttc ggc ggc tcg gcc ccg cgc ctc gtc 192
Asp Glu Glu Phe Phe Arg Arg Phe Gly Gly Ser Ala Pro Arg Leu Val
50 55 60
ggc cgg tcc ttc acc gag ctg gtg cac ccc ggc tgc cgg gag ccc ctg 240
Gly Arg Ser Phe Thr Glu Leu Val His Pro Gly Cys Arg Glu Pro Leu
65 70 75 80
ctg cgg cag ttc gcc ggg ctc acc gag ggc cgg cgc gac cgg ttc ggc 288
Leu Arg Gln Phe Ala Gly Leu Thr Glu Gly Arg Arg Asp Arg Phe Gly
85 90 95
acc gag gtc atc gcg gtg ggc ccg gac ggc acc ccg ttc cgg acc gac 336
Thr Glu Val Ile Ala Val Gly Pro Asp Gly Thr Pro Phe Arg Thr Asp
100 105 110
ctg acg gcg ctg gcg gta cgc ggc gga acc ccc gac atc tcg gcc gtc 384
Leu Thr Ala Leu Ala Val Arg Gly Gly Thr Pro Asp Ile Ser Ala Val
115 120 125
tgg ctg acg ctg gcg gcg gcc ggc gag acc gcg cag ccc gcc gcc gcg 432
Trp Leu Thr Leu Ala Ala Ala Gly Glu Thr Ala Gln Pro Ala Ala Ala
130 135 140
acg ccc cgc aag aag atc ctc agc gag atc gac gcc cgc atc ctc gaa 480
Thr Pro Arg Lys Lys Ile Leu Ser Glu Ile Asp Ala Arg Ile Leu Glu
145 150 155 160
ggc atc gcg gcc ggt gtc tcc acc gtc ccc ctg gcc gca cgc ctg tat 528
Gly Ile Ala Ala Gly Val Ser Thr Val Pro Leu Ala Ala Arg Leu Tyr
165 170 175
ctg agc cgg cag ggg gtc gag tac cac gtg aag agc ctg ttc cgg cag 576
Leu Ser Arg Gln Gly Val Glu Tyr His Val Lys Ser Leu Phe Arg Gln
180 185 190
ctc cgc gtg ccc aac cgg gcc gcg ctc gtc tcc cgc gcc tac tcc atg 624
Leu Arg Val Pro Asn Arg Ala Ala Leu Val Ser Arg Ala Tyr Ser Met
195 200 205
ggc ctg ctc aag gtg ggg acc tgg ccg ccc aag gtg gcg ccg gac ttc 672
Gly Leu Leu Lys Val Gly Thr Trp Pro Pro Lys Val Ala Pro Asp Phe
210 215 220
gtc aag tga 681
Val Lys
225
<210> 3
<211> 226
<212> PRT
<213> Streptoverticillium
<400> 3
Met Ser Ser Leu Ala Thr Pro Thr Pro Thr Leu Glu Gly Leu Leu Thr
1 5 10 15
Thr Pro Ala Ala Gln His Ala Glu Ala His Pro Pro Leu His Arg Pro
20 25 30
Gly Ser Ala Thr Ala Cys Leu Asp Arg Gly Leu Val Leu Arg Gln Ala
35 40 45
Asp Glu Glu Phe Phe Arg Arg Phe Gly Gly Ser Ala Pro Arg Leu Val
50 55 60
Gly Arg Ser Phe Thr Glu Leu Val His Pro Gly Cys Arg Glu Pro Leu
65 70 75 80
Leu Arg Gln Phe Ala Gly Leu Thr Glu Gly Arg Arg Asp Arg Phe Gly
85 90 95
Thr Glu Val Ile Ala Val Gly Pro Asp Gly Thr Pro Phe Arg Thr Asp
100 105 110
Leu Thr Ala Leu Ala Val Arg Gly Gly Thr Pro Asp Ile Ser Ala Val
115 120 125
Trp Leu Thr Leu Ala Ala Ala Gly Glu Thr Ala Gln Pro Ala Ala Ala
130 135 140
Thr Pro Arg Lys Lys Ile Leu Ser Glu Ile Asp Ala Arg Ile Leu Glu
145 150 155 160
Gly Ile Ala Ala Gly Val Ser Thr Val Pro Leu Ala Ala Arg Leu Tyr
165 170 175
Leu Ser Arg Gln Gly Val Glu Tyr His Val Lys Ser Leu Phe Arg Gln
180 185 190
Leu Arg Val Pro Asn Arg Ala Ala Leu Val Ser Arg Ala Tyr Ser Met
195 200 205
Gly Leu Leu Lys Val Gly Thr Trp Pro Pro Lys Val Ala Pro Asp Phe
210 215 220
Val Lys
225
<210> 4
<211> 1887
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1887)
<223>
<400> 4
atg ccg cac ccg acc acg cgc acc gcc ccg cac tcc gcc gcc ggt ggg 48
Met Pro His Pro Thr Thr Arg Thr Ala Pro His Ser Ala Ala Gly Gly
1 5 10 15
acc acc gcc ggg gag acc tcg tca ccg ctg ttc gcg ccc gcc cgg acc 96
Thr Thr Ala Gly Glu Thr Ser Ser Pro Leu Phe Ala Pro Ala Arg Thr
20 25 30
gtc cgg cgg gac cgg ccg gac ggg acc gtg ctc ctc tcg tcg gcg cag 144
Val Arg Arg Asp Arg Pro Asp Gly Thr Val Leu Leu Ser Ser Ala Gln
35 40 45
ccg ctg ggg gtg tat ccc gcc tcc gtg acc gac cat ctc cgc acc tgg 192
Pro Leu Gly Val Tyr Pro Ala Ser Val Thr Asp His Leu Arg Thr Trp
50 55 60
gcc cag gcc ggg ccc gac cgc ccg ctg gtc gcc gag cgc ggg gcc gac 240
Ala Gln Ala Gly Pro Asp Arg Pro Leu Val Ala Glu Arg Gly Ala Asp
65 70 75 80
ggc cgg tgg ggg cac cgc acg tac ggc gag gtg ctg gcg gcg gcg gag 288
Gly Arg Trp Gly His Arg Thr Tyr Gly Glu Val Leu Ala Ala Ala Glu
85 90 95
gcg gtc ggg cag gcg ctg ctc gac cgc ggg ctg tcg gcg cgg cgg ccg 336
Ala Val Gly Gln Ala Leu Leu Asp Arg Gly Leu Ser Ala Arg Arg Pro
100 105 110
ctg atg gtc ctg tcc ggc aac tcc acc ggg cac ctg ctg atg acg ctc 384
Leu Met Val Leu Ser Gly Asn Ser Thr Gly His Leu Leu Met Thr Leu
115 120 125
ggc gcg ctg agc gcc ggg atc ccg gtg gcg ccg gtc agc gtc gcc tac 432
Gly Ala Leu Ser Ala Gly Ile Pro Val Ala Pro Val Ser Val Ala Tyr
130 135 140
tcc ctg ctg agc cgg gac cac gcg cgg atc cgg gcg atc gcg gaa ctg 480
Ser Leu Leu Ser Arg Asp His Ala Arg Ile Arg Ala Ile Ala Glu Leu
145 150 155 160
ctg cgg ccg ggc gcg gtg tac gcc gag gac gcc ggg ccg ttc ggt ccc 528
Leu Arg Pro Gly Ala Val Tyr Ala Glu Asp Ala Gly Pro Phe Gly Pro
165 170 175
gcg ctg gcc gcg gcg ggc ggt gga gcc atc gtc gtg gcg gcg cgg ggc 576
Ala Leu Ala Ala Ala Gly Gly Gly Ala Ile Val Val Ala Ala Arg Gly
180 185 190
ggg ccg gcg gag cac tcg ctg gac gcc ctg ctg cgt acg gtg ccg ggc 624
Gly Pro Ala Glu His Ser Leu Asp Ala Leu Leu Arg Thr Val Pro Gly
195 200 205
cgc gcg ttc gag gcg gcc cgt gcg ggc gtc acg agc gcg acg gtc gcg 672
Arg Ala Phe Glu Ala Ala Arg Ala Gly Val Thr Ser Ala Thr Val Ala
210 215 220
aag gtc ctc ttc acg tcg ggc tcg acg gga gcg ccg aag ggc gtc gtc 720
Lys Val Leu Phe Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Val
225 230 235 240
acc acg cac ggc atg ctc tgt gcc aac cag cgg atg atg cgg cag gtg 768
Thr Thr His Gly Met Leu Cys Ala Asn Gln Arg Met Met Arg Gln Val
245 250 255
tgg ccg ttc ctg gcc ggg gag cgg ccg gtg ctg ctg gac tgg ctg ccg 816
Trp Pro Phe Leu Ala Gly Glu Arg Pro Val Leu Leu Asp Trp Leu Pro
260 265 270
tgg agc cac acc ttc ggc ggc aac cac aac gtg aac ctg gtg ctg gcc 864
Trp Ser His Thr Phe Gly Gly Asn His Asn Val Asn Leu Val Leu Ala
275 280 285
aac ggc ggc act ctg tac ctc gac gac ggc cgc ccg acc ccg gag ctg 912
Asn Gly Gly Thr Leu Tyr Leu Asp Asp Gly Arg Pro Thr Pro Glu Leu
290 295 300
ttc ggg cgc acc ctg gcc aac ctg cgc gag gtc tcc ccg acc ctg gcg 960
Phe Gly Arg Thr Leu Ala Asn Leu Arg Glu Val Ser Pro Thr Leu Ala
305 310 315 320
ttc aac gtc ccg gcc ggg tac gcg cgg ctc gtc ccc gcc ctg gag cgc 1008
Phe Asn Val Pro Ala Gly Tyr Ala Arg Leu Val Pro Ala Leu Glu Arg
325 330 335
gac cgg gag ctg gcg gag cgg ttc ttc gcc cgg ctg cgg ctc gtc ttc 1056
Asp Arg Glu Leu Ala Glu Arg Phe Phe Ala Arg Leu Arg Leu Val Phe
340 345 350
aac gcg gcg gcg gcg ctg gcc ccg gcc ctg cgc gaa cgg ctc cgg gcg 1104
Asn Ala Ala Ala Ala Leu Ala Pro Ala Leu Arg Glu Arg Leu Arg Ala
355 360 365
ctg ggc cgc gaa gtg acc ggg cgg gac gtg ccg gtg acg ggc tcg tgg 1152
Leu Gly Arg Glu Val Thr Gly Arg Asp Val Pro Val Thr Gly Ser Trp
370 375 380
ggc gcc acc gag acc tcg ccg gcg tcc acc agc gcg cac ttc ccg ttc 1200
Gly Ala Thr Glu Thr Ser Pro Ala Ser Thr Ser Ala His Phe Pro Phe
385 390 395 400
acc gac ccg cgg tgc atc ggc gtg ccg ctg ccg ggg gtg gag ctg aag 1248
Thr Asp Pro Arg Cys Ile Gly Val Pro Leu Pro Gly Val Glu Leu Lys
405 410 415
ctc gta ccg gcg gag ggt gac ggc tac gag gtc cgg gtg cgc ggc ccg 1296
Leu Val Pro Ala Glu Gly Asp Gly Tyr Glu Val Arg Val Arg Gly Pro
420 425 430
cac gtg acg ccc ggc tac ctc ggc cgc ccg gac ctc gac gcg cgc gcc 1344
His Val Thr Pro Gly Tyr Leu Gly Arg Pro Asp Leu Asp Ala Arg Ala
435 440 445
ttc gac gag gag ggc tac tac cgg ccg gga gac gcc gtc gcg ttc gcc 1392
Phe Asp Glu Glu Gly Tyr Tyr Arg Pro Gly Asp Ala Val Ala Phe Ala
450 455 460
gac ccc ggc gac gcg ggc gcg ggg ctg gtg ttc cgg ggc cgg ctg acc 1440
Asp Pro Gly Asp Ala Gly Ala Gly Leu Val Phe Arg Gly Arg Leu Thr
465 470 475 480
gag gac ttc aag ctg tcc acc ggt acg ttc gtg cac gtc gaa gcc gtg 1488
Glu Asp Phe Lys Leu Ser Thr Gly Thr Phe Val His Val Glu Ala Val
485 490 495
cgc ggc gcg ctg ctt tcg gcc gcg ccg gtc ctc tcc gac gcg gtg atc 1536
Arg Gly Ala Leu Leu Ser Ala Ala Pro Val Leu Ser Asp Ala Val Ile
500 505 510
acc ggg gag cac cgg gac gcg gtc tgc gcg ctg gcg tgg ctc gac ccg 1584
Thr Gly Glu His Arg Asp Ala Val Cys Ala Leu Ala Trp Leu Asp Pro
515 520 525
gcc gag gcc gag cgg ctg ctc ggc cgg cgg ccg gcc gcg gac ggc ggg 1632
Ala Glu Ala Glu Arg Leu Leu Gly Arg Arg Pro Ala Ala Asp Gly Gly
530 535 540
gtg ctg tac tcc gac gcg ctg gcc gcc cac ctc ggc gcg gca ctg gag 1680
Val Leu Tyr Ser Asp Ala Leu Ala Ala His Leu Gly Ala Ala Leu Glu
545 550 555 560
cga ctc aac cgg ggc gcc ggg tcc gcg tcc cgg gtc cag cgg ctg ctg 1728
Arg Leu Asn Arg Gly Ala Gly Ser Ala Ser Arg Val Gln Arg Leu Leu
565 570 575
gtg ctc gcg gac ccg ccc gac ctg gac gcg ggc gag atc acc gac aag 1776
Val Leu Ala Asp Pro Pro Asp Leu Asp Ala Gly Glu Ile Thr Asp Lys
580 585 590
ggc tac gtc aac cag cgc cgg gtg ctg gcc gcc cgc gcg ccg ctg gtc 1824
Gly Tyr Val Asn Gln Arg Arg Val Leu Ala Ala Arg Ala Pro Leu Val
595 600 605
gcc cgg ctg cac gcg gac ccc gcg ccg cga cac gtc atc acc ccg cgg 1872
Ala Arg Leu His Ala Asp Pro Ala Pro Arg His Val Ile Thr Pro Arg
610 615 620
tcc ggg ctc act tga 1887
Ser Gly Leu Thr
625
<210> 5
<211> 628
<212> PRT
<213> Streptoverticillium
<400> 5
Met Pro His Pro Thr Thr Arg Thr Ala Pro His Ser Ala Ala Gly Gly
1 5 10 15
Thr Thr Ala Gly Glu Thr Ser Ser Pro Leu Phe Ala Pro Ala Arg Thr
20 25 30
Val Arg Arg Asp Arg Pro Asp Gly Thr Val Leu Leu Ser Ser Ala Gln
35 40 45
Pro Leu Gly Val Tyr Pro Ala Ser Val Thr Asp His Leu Arg Thr Trp
50 55 60
Ala Gln Ala Gly Pro Asp Arg Pro Leu Val Ala Glu Arg Gly Ala Asp
65 70 75 80
Gly Arg Trp Gly His Arg Thr Tyr Gly Glu Val Leu Ala Ala Ala Glu
85 90 95
Ala Val Gly Gln Ala Leu Leu Asp Arg Gly Leu Ser Ala Arg Arg Pro
100 105 110
Leu Met Val Leu Ser Gly Asn Ser Thr Gly His Leu Leu Met Thr Leu
115 120 125
Gly Ala Leu Ser Ala Gly Ile Pro Val Ala Pro Val Ser Val Ala Tyr
130 135 140
Ser Leu Leu Ser Arg Asp His Ala Arg Ile Arg Ala Ile Ala Glu Leu
145 150 155 160
Leu Arg Pro Gly Ala Val Tyr Ala Glu Asp Ala Gly Pro Phe Gly Pro
165 170 175
Ala Leu Ala Ala Ala Gly Gly Gly Ala Ile Val Val Ala Ala Arg Gly
180 185 190
Gly Pro Ala Glu His Ser Leu Asp Ala Leu Leu Arg Thr Val Pro Gly
195 200 205
Arg Ala Phe Glu Ala Ala Arg Ala Gly Val Thr Ser Ala Thr Val Ala
210 215 220
Lys Val Leu Phe Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Val Val
225 230 235 240
Thr Thr His Gly Met Leu Cys Ala Asn Gln Arg Met Met Arg Gln Val
245 250 255
Trp Pro Phe Leu Ala Gly Glu Arg Pro Val Leu Leu Asp Trp Leu Pro
260 265 270
Trp Ser His Thr Phe Gly Gly Asn His Asn Val Asn Leu Val Leu Ala
275 280 285
Asn Gly Gly Thr Leu Tyr Leu Asp Asp Gly Arg Pro Thr Pro Glu Leu
290 295 300
Phe Gly Arg Thr Leu Ala Asn Leu Arg Glu Val Ser Pro Thr Leu Ala
305 310 315 320
Phe Asn Val Pro Ala Gly Tyr Ala Arg Leu Val Pro Ala Leu Glu Arg
325 330 335
Asp Arg Glu Leu Ala Glu Arg Phe Phe Ala Arg Leu Arg Leu Val Phe
340 345 350
Asn Ala Ala Ala Ala Leu Ala Pro Ala Leu Arg Glu Arg Leu Arg Ala
355 360 365
Leu Gly Arg Glu Val Thr Gly Arg Asp Val Pro Val Thr Gly Ser Trp
370 375 380
Gly Ala Thr Glu Thr Ser Pro Ala Ser Thr Ser Ala His Phe Pro Phe
385 390 395 400
Thr Asp Pro Arg Cys Ile Gly Val Pro Leu Pro Gly Val Glu Leu Lys
405 410 415
Leu Val Pro Ala Glu Gly Asp Gly Tyr Glu Val Arg Val Arg Gly Pro
420 425 430
His Val Thr Pro Gly Tyr Leu Gly Arg Pro Asp Leu Asp Ala Arg Ala
435 440 445
Phe Asp Glu Glu Gly Tyr Tyr Arg Pro Gly Asp Ala Val Ala Phe Ala
450 455 460
Asp Pro Gly Asp Ala Gly Ala Gly Leu Val Phe Arg Gly Arg Leu Thr
465 470 475 480
Glu Asp Phe Lys Leu Ser Thr Gly Thr Phe Val His Val Glu Ala Val
485 490 495
Arg Gly Ala Leu Leu Ser Ala Ala Pro Val Leu Ser Asp Ala Val Ile
500 505 510
Thr Gly Glu His Arg Asp Ala Val Cys Ala Leu Ala Trp Leu Asp Pro
515 520 525
Ala Glu Ala Glu Arg Leu Leu Gly Arg Arg Pro Ala Ala Asp Gly Gly
530 535 540
Val Leu Tyr Ser Asp Ala Leu Ala Ala His Leu Gly Ala Ala Leu Glu
545 550 555 560
Arg Leu Asn Arg Gly Ala Gly Ser Ala Ser Arg Val Gln Arg Leu Leu
565 570 575
Val Leu Ala Asp Pro Pro Asp Leu Asp Ala Gly Glu Ile Thr Asp Lys
580 585 590
Gly Tyr Val Asn Gln Arg Arg Val Leu Ala Ala Arg Ala Pro Leu Val
595 600 605
Ala Arg Leu His Ala Asp Pro Ala Pro Arg His Val Ile Thr Pro Arg
610 615 620
Ser Gly Leu Thr
625
<210> 6
<211> 1611
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1611)
<223>
<400> 6
atg gcc tcg ccc acc gac gac acc acc atc gag ctg gac ggc cac agc 48
Met Ala Ser Pro Thr Asp Asp Thr Thr Ile Glu Leu Asp Gly His Ser
1 5 10 15
ctc tcg ctg cgg gcc gtg cgg cgg gtc gcg acc cag ccg ggc aag cag 96
Leu Ser Leu Arg Ala Val Arg Arg Val Ala Thr Gln Pro Gly Lys Gln
20 25 30
aga atc gcc ctc gcg gcg gcc gcg gcc gag cgc atg acg gcg tcg cgg 144
Arg Ile Ala Leu Ala Ala Ala Ala Ala Glu Arg Met Thr Ala Ser Arg
35 40 45
gag gcc acg gag cgg atc gtc gcc tcc ggc atc ccg atc tac ggg gtg 192
Glu Ala Thr Glu Arg Ile Val Ala Ser Gly Ile Pro Ile Tyr Gly Val
50 55 60
acg acc ggc ttc ggc gac agc agc ggc cgc cag gtc agc gcc gac aag 240
Thr Thr Gly Phe Gly Asp Ser Ser Gly Arg Gln Val Ser Ala Asp Lys
65 70 75 80
gcc ggg gcg ctg caa cgg aac ctg ctc cgc ttc ctg cgg gtc ggc acc 288
Ala Gly Ala Leu Gln Arg Asn Leu Leu Arg Phe Leu Arg Val Gly Thr
85 90 95
ggg gac atg gca ccc gac gag gtc gtc cgc gcc acc atg ctg atc cgc 336
Gly Asp Met Ala Pro Asp Glu Val Val Arg Ala Thr Met Leu Ile Arg
100 105 110
gcc aac agt gcc gcg cgg ggc aac tcc ggc atc cgc acg gcg ccg gtg 384
Ala Asn Ser Ala Ala Arg Gly Asn Ser Gly Ile Arg Thr Ala Pro Val
115 120 125
gag ctg atc ctg tca ctg ctg gag aag gac ctg ctg ccg cag ata ccg 432
Glu Leu Ile Leu Ser Leu Leu Glu Lys Asp Leu Leu Pro Gln Ile Pro
130 135 140
gag cgc ggt tcg gtc ggc gcc agc ggc gac ctc gcg ccg ctc ggc tac 480
Glu Arg Gly Ser Val Gly Ala Ser Gly Asp Leu Ala Pro Leu Gly Tyr
145 150 155 160
ctc gcc gcc gcg ctc acc ggc gag ggc acc ctg cgc agc cag ggc cgg 528
Leu Ala Ala Ala Leu Thr Gly Glu Gly Thr Leu Arg Ser Gln Gly Arg
165 170 175
gcg ctc gac gcg ggc gag gcc atc cgg gcc tgc ggc ctc gcg ccc gtc 576
Ala Leu Asp Ala Gly Glu Ala Ile Arg Ala Cys Gly Leu Ala Pro Val
180 185 190
acg ctc cgg gcc aag gag ggg ctg gcg ctc gtc aac ggg acg tcc ttc 624
Thr Leu Arg Ala Lys Glu Gly Leu Ala Leu Val Asn Gly Thr Ser Phe
195 200 205
atg gcc gcc tac gcc gcc ctg gcg gtc gcc gag gcg gcc gag ctg gcg 672
Met Ala Ala Tyr Ala Ala Leu Ala Val Ala Glu Ala Ala Glu Leu Ala
210 215 220
tgg gcg gcc gag ctg tgc acc gtg ctg tcg acg gag gtc cgg cgc agc 720
Trp Ala Ala Glu Leu Cys Thr Val Leu Ser Thr Glu Val Arg Arg Ser
225 230 235 240
agc cgc gac cag ttc acc gcg ttc ccg cac gag cac aag ccg cac ccc 768
Ser Arg Asp Gln Phe Thr Ala Phe Pro His Glu His Lys Pro His Pro
245 250 255
ggc cag ctc gcg agc gcc gcg aac gtc cac cgg atg ctg ggc gac tcc 816
Gly Gln Leu Ala Ser Ala Ala Asn Val His Arg Met Leu Gly Asp Ser
260 265 270
ccc gcc gtg gtc gcc gac acc gat ctc gtg ggc ccc ggt tcg agc gag 864
Pro Ala Val Val Ala Asp Thr Asp Leu Val Gly Pro Gly Ser Ser Glu
275 280 285
gag cgc cgg tac gtc gag ctg gag cgc cgc atc cag gac ccg tac tcg 912
Glu Arg Arg Tyr Val Glu Leu Glu Arg Arg Ile Gln Asp Pro Tyr Ser
290 295 300
atc cgg tgc gcg ccg cac gtc gtc ggc gtg ctg cgg gac acg ctc ggc 960
Ile Arg Cys Ala Pro His Val Val Gly Val Leu Arg Asp Thr Leu Gly
305 310 315 320
tgg gcc gag gac tgg ctg acc acc gag atc aac tcc tcg aac gac aac 1008
Trp Ala Glu Asp Trp Leu Thr Thr Glu Ile Asn Ser Ser Asn Asp Asn
325 330 335
ccg ctc ttc gag gcg gcc acc gac acc gtc cac tac agc ggc aac ttc 1056
Pro Leu Phe Glu Ala Ala Thr Asp Thr Val His Tyr Ser Gly Asn Phe
340 345 350
tac ggc ggg cac gtc gcc cag gcg gcg cag gcg gtc tcc gcc gcc gtg 1104
Tyr Gly Gly His Val Ala Gln Ala Ala Gln Ala Val Ser Ala Ala Val
355 360 365
gcc ggg gtc gcc gac ctg ctc gac cgc cag ctg gcg atc ctg gtg gac 1152
Ala Gly Val Ala Asp Leu Leu Asp Arg Gln Leu Ala Ile Leu Val Asp
370 375 380
gac aag ttc agc atc ggc ctc acc ccg aac ctg gtc gtc ccg gtc ggt 1200
Asp Lys Phe Ser Ile Gly Leu Thr Pro Asn Leu Val Val Pro Val Gly
385 390 395 400
ccc gac gac ccg gag gca ggg ctg cac cac ggg ttc aag ggc gcg cag 1248
Pro Asp Asp Pro Glu Ala Gly Leu His His Gly Phe Lys Gly Ala Gln
405 410 415
atc gcc gcg tcc gcg ctg acc gcc gag gcg ctg cac ctg acg atg ccc 1296
Ile Ala Ala Ser Ala Leu Thr Ala Glu Ala Leu His Leu Thr Met Pro
420 425 430
gtg agc tcg ttc tcc cgt tcg acc gag gcg cac aac cag gac aag gtg 1344
Val Ser Ser Phe Ser Arg Ser Thr Glu Ala His Asn Gln Asp Lys Val
435 440 445
agc atg ggc acc atc gcc gcg cgg cac gcg cac acg gtg gtc cgg ctg 1392
Ser Met Gly Thr Ile Ala Ala Arg His Ala His Thr Val Val Arg Leu
450 455 460
acg agc cag gtc acc gcc atc cac ctg ctc gcc ctg tgc cag gcc gcg 1440
Thr Ser Gln Val Thr Ala Ile His Leu Leu Ala Leu Cys Gln Ala Ala
465 470 475 480
gac ctc acc ggg gtc ggg cgg ctg ggg agc gcg acc cgg gcc gcg cac 1488
Asp Leu Thr Gly Val Gly Arg Leu Gly Ser Ala Thr Arg Ala Ala His
485 490 495
acg ctc gtc cgc ggg tac tcg ccg ttc ctc tcc gcc gac cgg ccg ctg 1536
Thr Leu Val Arg Gly Tyr Ser Pro Phe Leu Ser Ala Asp Arg Pro Leu
500 505 510
gac gcc gac atc gag acc gtc gcc gcc ctg ctg cgc gcg ggc gag ctc 1584
Asp Ala Asp Ile Glu Thr Val Ala Ala Leu Leu Arg Ala Gly Glu Leu
515 520 525
cgc cgc gcg gtc gag cgg cac gtc tga 1611
Arg Arg Ala Val Glu Arg His Val
530 535
<210> 7
<211> 536
<212> PRT
<213> Streptoverticillium
<400> 7
Met Ala Ser Pro Thr Asp Asp Thr Thr Ile Glu Leu Asp Gly His Ser
1 5 10 15
Leu Ser Leu Arg Ala Val Arg Arg Val Ala Thr Gln Pro Gly Lys Gln
20 25 30
Arg Ile Ala Leu Ala Ala Ala Ala Ala Glu Arg Met Thr Ala Ser Arg
35 40 45
Glu Ala Thr Glu Arg Ile Val Ala Ser Gly Ile Pro Ile Tyr Gly Val
50 55 60
Thr Thr Gly Phe Gly Asp Ser Ser Gly Arg Gln Val Ser Ala Asp Lys
65 70 75 80
Ala Gly Ala Leu Gln Arg Asn Leu Leu Arg Phe Leu Arg Val Gly Thr
85 90 95
Gly Asp Met Ala Pro Asp Glu Val Val Arg Ala Thr Met Leu Ile Arg
100 105 110
Ala Asn Ser Ala Ala Arg Gly Asn Ser Gly Ile Arg Thr Ala Pro Val
115 120 125
Glu Leu Ile Leu Ser Leu Leu Glu Lys Asp Leu Leu Pro Gln Ile Pro
130 135 140
Glu Arg Gly Ser Val Gly Ala Ser Gly Asp Leu Ala Pro Leu Gly Tyr
145 150 155 160
Leu Ala Ala Ala Leu Thr Gly Glu Gly Thr Leu Arg Ser Gln Gly Arg
165 170 175
Ala Leu Asp Ala Gly Glu Ala Ile Arg Ala Cys Gly Leu Ala Pro Val
180 185 190
Thr Leu Arg Ala Lys Glu Gly Leu Ala Leu Val Asn Gly Thr Ser Phe
195 200 205
Met Ala Ala Tyr Ala Ala Leu Ala Val Ala Glu Ala Ala Glu Leu Ala
210 215 220
Trp Ala Ala Glu Leu Cys Thr Val Leu Ser Thr Glu Val Arg Arg Ser
225 230 235 240
Ser Arg Asp Gln Phe Thr Ala Phe Pro His Glu His Lys Pro His Pro
245 250 255
Gly Gln Leu Ala Ser Ala Ala Asn Val His Arg Met Leu Gly Asp Ser
260 265 270
Pro Ala Val Val Ala Asp Thr Asp Leu Val Gly Pro Gly Ser Ser Glu
275 280 285
Glu Arg Arg Tyr Val Glu Leu Glu Arg Arg Ile Gln Asp Pro Tyr Ser
290 295 300
Ile Arg Cys Ala Pro His Val Val Gly Val Leu Arg Asp Thr Leu Gly
305 310 315 320
Trp Ala Glu Asp Trp Leu Thr Thr Glu Ile Asn Ser Ser Asn Asp Asn
325 330 335
Pro Leu Phe Glu Ala Ala Thr Asp Thr Val His Tyr Ser Gly Asn Phe
340 345 350
Tyr Gly Gly His Val Ala Gln Ala Ala Gln Ala Val Ser Ala Ala Val
355 360 365
Ala Gly Val Ala Asp Leu Leu Asp Arg Gln Leu Ala Ile Leu Val Asp
370 375 380
Asp Lys Phe Ser Ile Gly Leu Thr Pro Asn Leu Val Val Pro Val Gly
385 390 395 400
Pro Asp Asp Pro Glu Ala Gly Leu His His Gly Phe Lys Gly Ala Gln
405 410 415
Ile Ala Ala Ser Ala Leu Thr Ala Glu Ala Leu His Leu Thr Met Pro
420 425 430
Val Ser Ser Phe Ser Arg Ser Thr Glu Ala His Asn Gln Asp Lys Val
435 440 445
Ser Met Gly Thr Ile Ala Ala Arg His Ala His Thr Val Val Arg Leu
450 455 460
Thr Ser Gln Val Thr Ala Ile His Leu Leu Ala Leu Cys Gln Ala Ala
465 470 475 480
Asp Leu Thr Gly Val Gly Arg Leu Gly Ser Ala Thr Arg Ala Ala His
485 490 495
Thr Leu Val Arg Gly Tyr Ser Pro Phe Leu Ser Ala Asp Arg Pro Leu
500 505 510
Asp Ala Asp Ile Glu Thr Val Ala Ala Leu Leu Arg Ala Gly Glu Leu
515 520 525
Arg Arg Ala Val Glu Arg His Val
530 535
<210> 8
<211> 183
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(183)
<223>
<400> 8
gtg ccc ctg atc cag gtc agc ctc tac gaa gac cgc ctc acg ccc gag 48
Val Pro Leu Ile Gln Val Ser Leu Tyr Glu Asp Arg Leu Thr Pro Glu
1 5 10 15
acc cgc cgc gcc ctg atc ggg gag ctc acc gag gcg gcg gtc cgc gcc 96
Thr Arg Arg Ala Leu Ile Gly Glu Leu Thr Glu Ala Ala Val Arg Ala
20 25 30
ctc ggc ccc gag tgc cgc gac gtg acg tgg gtg acg ctc cag ggc atc 144
Leu Gly Pro Glu Cys Arg Asp Val Thr Trp Val Thr Leu Gln Gly Ile
35 40 45
ccc cgc gac cag tgg ggc atc ggc gga acg ccc ggc tga 183
Pro Arg Asp Gln Trp Gly Ile Gly Gly Thr Pro Gly
50 55 60
<210> 9
<211> 60
<212> PRT
<213> Streptoverticillium
<400> 9
Val Pro Leu Ile Gln Val Ser Leu Tyr Glu Asp Arg Leu Thr Pro Glu
1 5 10 15
Thr Arg Arg Ala Leu Ile Gly Glu Leu Thr Glu Ala Ala Val Arg Ala
20 25 30
Leu Gly Pro Glu Cys Arg Asp Val Thr Trp Val Thr Leu Gln Gly Ile
35 40 45
Pro Arg Asp Gln Trp Gly Ile Gly Gly Thr Pro Gly
50 55 60
<210> 10
<211> 1137
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1137)
<223>
<400> 10
atg ggc ccg gtg cgc gag gag ttc gag cgg gcc ttc gcc cgg cac gtc 48
Met Gly Pro Val Arg Glu Glu Phe Glu Arg Ala Phe Ala Arg His Val
1 5 10 15
ggc gcc gcg cac gcc ctg acg gtc acc agc ggg acg gtc gcg ctg gag 96
Gly Ala Ala His Ala Leu Thr Val Thr Ser Gly Thr Val Ala Leu Glu
20 25 30
atc gcg atc cgg ctg ctc gac ctg cgg gcc ggg gac gag gtc gtc gtg 144
Ile Ala Ile Arg Leu Leu Asp Leu Arg Ala Gly Asp Glu Val Val Val
35 40 45
acg ccg cag acg tac cac gcc acc gcg cag ccg ctg ctc gcg acc gag 192
Thr Pro Gln Thr Tyr His Ala Thr Ala Gln Pro Leu Leu Ala Thr Glu
50 55 60
gca acg gtg cga ttc tgc gac gtg gag ccg ggc agc ctc aac atg gac 240
Ala Thr Val Arg Phe Cys Asp Val Glu Pro Gly Ser Leu Asn Met Asp
65 70 75 80
ccg gac gcg ctg gag act ctc gtc aac gag cgc acg aag gcc gtc atc 288
Pro Asp Ala Leu Glu Thr Leu Val Asn Glu Arg Thr Lys Ala Val Ile
85 90 95
ctc gtc cac tac ggc ggc aac ccc gcc gac atg gac cgg atc acc gcc 336
Leu Val His Tyr Gly Gly Asn Pro Ala Asp Met Asp Arg Ile Thr Ala
100 105 110
atc gcg cac gcg cac ggc gcc ctc gtg gtg gag gac tgc gcg cac gcg 384
Ile Ala His Ala His Gly Ala Leu Val Val Glu Asp Cys Ala His Ala
115 120 125
atc ggc gcc gag tac cgg ggc cgc cgc ccc ggc gcg ctc ggc gac ctg 432
Ile Gly Ala Glu Tyr Arg Gly Arg Arg Pro Gly Ala Leu Gly Asp Leu
130 135 140
tcc tgc ttc agc ttc cag gcg tcc aag aac atc acc acc ctc ggc gag 480
Ser Cys Phe Ser Phe Gln Ala Ser Lys Asn Ile Thr Thr Leu Gly Glu
145 150 155 160
ggc ggc atg gtg tgc acc ccg tcg ccc gaa ctg gcc cgc agg atc gac 528
Gly Gly Met Val Cys Thr Pro Ser Pro Glu Leu Ala Arg Arg Ile Asp
165 170 175
cgg atc cgg tcg aac gcg gtg gac ggc acc ttc acc tcg tcc gcg cac 576
Arg Ile Arg Ser Asn Ala Val Asp Gly Thr Phe Thr Ser Ser Ala His
180 185 190
cgc cgg ccc ccc gcg gcg ctg ccg tgg atg gcg tac gcc gac tac gcc 624
Arg Arg Pro Pro Ala Ala Leu Pro Trp Met Ala Tyr Ala Asp Tyr Ala
195 200 205
tac cgg gag gac tgc acg ggg ctg cgg ggc agc ggg acc aac gcc gcg 672
Tyr Arg Glu Asp Cys Thr Gly Leu Arg Gly Ser Gly Thr Asn Ala Ala
210 215 220
ctc tcc gag gcc gcc tgc gcg gtg ggc ctg gtg cag ctg gaa cgg ctg 720
Leu Ser Glu Ala Ala Cys Ala Val Gly Leu Val Gln Leu Glu Arg Leu
225 230 235 240
ccg gag ttc gtc gcc cgc cgg cgg gcg atc gcc gcg gaa ctc gac gcg 768
Pro Glu Phe Val Ala Arg Arg Arg Ala Ile Ala Ala Glu Leu Asp Ala
245 250 255
gtg tgc cgc cgc ttc gac gtc cgg ccg ctg acc gcc gcg ccc gac gcg 816
Val Cys Arg Arg Phe Asp Val Arg Pro Leu Thr Ala Ala Pro Asp Ala
260 265 270
gtg cac ccg tac cac ctc tac acc gcg ctc gtc ccc ggc gac gga cgc 864
Val His Pro Tyr His Leu Tyr Thr Ala Leu Val Pro Gly Asp Gly Arg
275 280 285
cgc gac cgc gtg ctg gac gcc ctg caa cgc tcc ggt acc ccc gcc cag 912
Arg Asp Arg Val Leu Asp Ala Leu Gln Arg Ser Gly Thr Pro Ala Gln
290 295 300
ttg cgc tac cac ccg gtg cac ctg ctg ccc gag tgg cgg ctg cgc ggg 960
Leu Arg Tyr His Pro Val His Leu Leu Pro Glu Trp Arg Leu Arg Gly
305 310 315 320
cac ggc gag ggc gag tgc ccg gtc gcc gaa cgc ctg tgg ttc ggc gag 1008
His Gly Glu Gly Glu Cys Pro Val Ala Glu Arg Leu Trp Phe Gly Glu
325 330 335
cac ctc aac ctg ccc tgc cac ccc gcc atg acc gat cgc cag gtc gag 1056
His Leu Asn Leu Pro Cys His Pro Ala Met Thr Asp Arg Gln Val Glu
340 345 350
acc ctc ggc gcc aac ctg gcc gcc gcg ctg agt ggc cgg gaa gca ccc 1104
Thr Leu Gly Ala Asn Leu Ala Ala Ala Leu Ser Gly Arg Glu Ala Pro
355 360 365
gcc cga cga gag aag gaa ccc tcg tgc ccc tga 1137
Ala Arg Arg Glu Lys Glu Pro Ser Cys Pro
370 375
<210> 11
<211> 378
<212> PRT
<213> Streptoverticillium
<400> 11
Met Gly Pro Val Arg Glu Glu Phe Glu Arg Ala Phe Ala Arg His Val
1 5 10 15
Gly Ala Ala His Ala Leu Thr Val Thr Ser Gly Thr Val Ala Leu Glu
20 25 30
Ile Ala Ile Arg Leu Leu Asp Leu Arg Ala Gly Asp Glu Val Val Val
35 40 45
Thr Pro Gln Thr Tyr His Ala Thr Ala Gln Pro Leu Leu Ala Thr Glu
50 55 60
Ala Thr Val Arg Phe Cys Asp Val Glu Pro Gly Ser Leu Asn Met Asp
65 70 75 80
Pro Asp Ala Leu Glu Thr Leu Val Asn Glu Arg Thr Lys Ala Val Ile
85 90 95
Leu Val His Tyr Gly Gly Asn Pro Ala Asp Met Asp Arg Ile Thr Ala
100 105 110
Ile Ala His Ala His Gly Ala Leu Val Val Glu Asp Cys Ala His Ala
115 120 125
Ile Gly Ala Glu Tyr Arg Gly Arg Arg Pro Gly Ala Leu Gly Asp Leu
130 135 140
Ser Cys Phe Ser Phe Gln Ala Ser Lys Asn Ile Thr Thr Leu Gly Glu
145 150 155 160
Gly Gly Met Val Cys Thr Pro Ser Pro Glu Leu Ala Arg Arg Ile Asp
165 170 175
Arg Ile Arg Ser Asn Ala Val Asp Gly Thr Phe Thr Ser Ser Ala His
180 185 190
Arg Arg Pro Pro Ala Ala Leu Pro Trp Met Ala Tyr Ala Asp Tyr Ala
195 200 205
Tyr Arg Glu Asp Cys Thr Gly Leu Arg Gly Ser Gly Thr Asn Ala Ala
210 215 220
Leu Ser Glu Ala Ala Cys Ala Val Gly Leu Val Gln Leu Glu Arg Leu
225 230 235 240
Pro Glu Phe Val Ala Arg Arg Arg Ala Ile Ala Ala Glu Leu Asp Ala
245 250 255
Val Cys Arg Arg Phe Asp Val Arg Pro Leu Thr Ala Ala Pro Asp Ala
260 265 270
Val His Pro Tyr His Leu Tyr Thr Ala Leu Val Pro Gly Asp Gly Arg
275 280 285
Arg Asp Arg Val Leu Asp Ala Leu Gln Arg Ser Gly Thr Pro Ala Gln
290 295 300
Leu Arg Tyr His Pro Val His Leu Leu Pro Glu Trp Arg Leu Arg Gly
305 310 315 320
His Gly Glu Gly Glu Cys Pro Val Ala Glu Arg Leu Trp Phe Gly Glu
325 330 335
His Leu Asn Leu Pro Cys His Pro Ala Met Thr Asp Arg Gln Val Glu
340 345 350
Thr Leu Gly Ala Asn Leu Ala Ala Ala Leu Ser Gly Arg Glu Ala Pro
355 360 365
Ala Arg Arg Glu Lys Glu Pro Ser Cys Pro
370 375
<210> 12
<211> 1686
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1686)
<223>
<400> 12
atg cct ctt ctc gat gga ctc gat gga ctc gat ggt ttc gtc ccc tgg 48
Met Pro Leu Leu Asp Gly Leu Asp Gly Leu Asp Gly Phe Val Pro Trp
1 5 10 15
ccg gcc gag acc gcg gag cgc tac cgg gcc gac ggc acc tgg gcc ggt 96
Pro Ala Glu Thr Ala Glu Arg Tyr Arg Ala Asp Gly Thr Trp Ala Gly
20 25 30
gag ccc ctg ggc gag ctg ctg cgt tcc cag gcc gcg cgc acc ccg gac 144
Glu Pro Leu Gly Glu Leu Leu Arg Ser Gln Ala Ala Arg Thr Pro Asp
35 40 45
aac gtg gct ctg atc gac ggg gag cgg tcc ttc acc tac gcc gcc ctc 192
Asn Val Ala Leu Ile Asp Gly Glu Arg Ser Phe Thr Tyr Ala Ala Leu
50 55 60
gac cgg tgg gcc gac cgc ctg gcc gcc ggg ttc tcg gcc gcc ggc ctg 240
Asp Arg Trp Ala Asp Arg Leu Ala Ala Gly Phe Ser Ala Ala Gly Leu
65 70 75 80
cgg gcg ggc gac cgg gcc gtg ctc caa ctg ccc aac gtc gcc gag cac 288
Arg Ala Gly Asp Arg Ala Val Leu Gln Leu Pro Asn Val Ala Glu His
85 90 95
gtg gcg gtg tcg ttc gcc ttc ttc cgc atc ggt gtg ctg ccg gtc ttc 336
Val Ala Val Ser Phe Ala Phe Phe Arg Ile Gly Val Leu Pro Val Phe
100 105 110
acg ctg ccc aac cac cgc atg gcg gag ctg gac cac atc tgc ggc ctg 384
Thr Leu Pro Asn His Arg Met Ala Glu Leu Asp His Ile Cys Gly Leu
115 120 125
acc ggg gcg agc gcc tac gtg acc ctc gac cgg ttc ctg ggg ttc gac 432
Thr Gly Ala Ser Ala Tyr Val Thr Leu Asp Arg Phe Leu Gly Phe Asp
130 135 140
cac cgc ggg ctg gcc cgg tcc ctg cgc gag cgg cac gcg tcg ctc cgg 480
His Arg Gly Leu Ala Arg Ser Leu Arg Glu Arg His Ala Ser Leu Arg
145 150 155 160
cac gtg ttc gtg gtc ggc gac ccc ggg gag ttc gcg ccg ctt ccc gag 528
His Val Phe Val Val Gly Asp Pro Gly Glu Phe Ala Pro Leu Pro Glu
165 170 175
gcg gag acg ccc ctg gac ccg gcc ggc gcg acc ggt ccc gac gcg tcg 576
Ala Glu Thr Pro Leu Asp Pro Ala Gly Ala Thr Gly Pro Asp Ala Ser
180 185 190
gac gtg gcc ttc ttc ctg ctg tcc ggc ggc acc acg gcg ctg ccg aag 624
Asp Val Ala Phe Phe Leu Leu Ser Gly Gly Thr Thr Ala Leu Pro Lys
195 200 205
ctc atc ccg cgg acg cac gac gac tac ctg tac cag gcc cgt acc gcc 672
Leu Ile Pro Arg Thr His Asp Asp Tyr Leu Tyr Gln Ala Arg Thr Ala
210 215 220
gcc ggg atc tgc gag tac tcc gag gac acc cgc tac ctc gcc acc ctg 720
Ala Gly Ile Cys Glu Tyr Ser Glu Asp Thr Arg Tyr Leu Ala Thr Leu
225 230 235 240
ccg atc gcc ttc aac ttc acg tgg ggc tgc ccg ggt gtg gtc ggg gtg 768
Pro Ile Ala Phe Asn Phe Thr Trp Gly Cys Pro Gly Val Val Gly Val
245 250 255
ttc gcc aac ggg ggc gcc gtc gtg ctg agc acc gtg ccc gac ccc cag 816
Phe Ala Asn Gly Gly Ala Val Val Leu Ser Thr Val Pro Asp Pro Gln
260 265 270
gtg tgc ttc ccg ctc atc gcc cgg cac ggg gtc acc acg acg tcg gtc 864
Val Cys Phe Pro Leu Ile Ala Arg His Gly Val Thr Thr Thr Ser Val
275 280 285
gtg ccg acg atc gcg cac tcc tgg atc gcc gcc gcc gac ggg cgc cgg 912
Val Pro Thr Ile Ala His Ser Trp Ile Ala Ala Ala Asp Gly Arg Arg
290 295 300
gag gag ctg gcg acg ctg gag ctg gtg cag gtc ggc agc gcg gtg gtg 960
Glu Glu Leu Ala Thr Leu Glu Leu Val Gln Val Gly Ser Ala Val Val
305 310 315 320
cac cgg tcg ctc gcc gag gag gtc gga ccg gcg ctg acg gcc cgt ctc 1008
His Arg Ser Leu Ala Glu Glu Val Gly Pro Ala Leu Thr Ala Arg Leu
325 330 335
cag cag gtg ttc ggg atg tcc gag ggc ctg ctg tgc ctc acg cgc cgc 1056
Gln Gln Val Phe Gly Met Ser Glu Gly Leu Leu Cys Leu Thr Arg Arg
340 345 350
gag gac gcg ccc gag acc gtc ctc acc acc cag ggc cgg ccc atc tcc 1104
Glu Asp Ala Pro Glu Thr Val Leu Thr Thr Gln Gly Arg Pro Ile Ser
355 360 365
ccc cac gac gaa ctg cgg gtg gtg gac gcg gcg ggc gac gag gtg gcg 1152
Pro His Asp Glu Leu Arg Val Val Asp Ala Ala Gly Asp Glu Val Ala
370 375 380
gcc ggc ggg acg ggc gag ctg ctc acc cgg ggc ccg tac acc ctg cgc 1200
Ala Gly Gly Thr Gly Glu Leu Leu Thr Arg Gly Pro Tyr Thr Leu Arg
385 390 395 400
ggc tac tac cgg gcc gag gag cac aac gcc ggg gcg ttc acc ccg gac 1248
Gly Tyr Tyr Arg Ala Glu Glu His Asn Ala Gly Ala Phe Thr Pro Asp
405 410 415
ggc ttc tac cgc acc ggc gac ctg gtg cgg atc acc gac gac ggc ggc 1296
Gly Phe Tyr Arg Thr Gly Asp Leu Val Arg Ile Thr Asp Asp Gly Gly
420 425 430
gtc gtg gtg atg ggc cgc gcg aag gac gtc atc gtc cgc ggc ggc gac 1344
Val Val Val Met Gly Arg Ala Lys Asp Val Ile Val Arg Gly Gly Asp
435 440 445
aag gtg tcc gcc ccc gag ctg gag ggc cac ctc acc ggc cac gag cgg 1392
Lys Val Ser Ala Pro Glu Leu Glu Gly His Leu Thr Gly His Glu Arg
450 455 460
atc gac cag gcc gcc gtg gtg ccg atg gcc gac gcc gtc ctc ggc gag 1440
Ile Asp Gln Ala Ala Val Val Pro Met Ala Asp Ala Val Leu Gly Glu
465 470 475 480
cgc acc tgc gcc gtg atc atc ccg gtc ggc acg ccc ccg acc ctg ggc 1488
Arg Thr Cys Ala Val Ile Ile Pro Val Gly Thr Pro Pro Thr Leu Gly
485 490 495
gag ctg cgc cgc tac ctg cgc gac cgc ggg ctg gcg tcc tac aag ttc 1536
Glu Leu Arg Arg Tyr Leu Arg Asp Arg Gly Leu Ala Ser Tyr Lys Phe
500 505 510
ccc gac cgg gtc gtg tgc gtc gag gcg ttc ccc aag agc ggc ctc ggc 1584
Pro Asp Arg Val Val Cys Val Glu Ala Phe Pro Lys Ser Gly Leu Gly
515 520 525
aag gtc gac aag aag cgc ctc gtg gcc gac ctc ggc ctc gac gcg ccg 1632
Lys Val Asp Lys Lys Arg Leu Val Ala Asp Leu Gly Leu Asp Ala Pro
530 535 540
ccg ggc ccg gac gcc gcc ggg tcc gac ccc gag ccg gcc ggt gcc cgc 1680
Pro Gly Pro Asp Ala Ala Gly Ser Asp Pro Glu Pro Ala Gly Ala Arg
545 550 555 560
tcg tga 1686
Ser
<210> 13
<211> 561
<212> PRT
<213> Streptoverticillium
<400> 13
Met Pro Leu Leu Asp Gly Leu Asp Gly Leu Asp Gly Phe Val Pro Trp
1 5 10 15
Pro Ala Glu Thr Ala Glu Arg Tyr Arg Ala Asp Gly Thr Trp Ala Gly
20 25 30
Glu Pro Leu Gly Glu Leu Leu Arg Ser Gln Ala Ala Arg Thr Pro Asp
35 40 45
Asn Val Ala Leu Ile Asp Gly Glu Arg Ser Phe Thr Tyr Ala Ala Leu
50 55 60
Asp Arg Trp Ala Asp Arg Leu Ala Ala Gly Phe Ser Ala Ala Gly Leu
65 70 75 80
Arg Ala Gly Asp Arg Ala Val Leu Gln Leu Pro Asn Val Ala Glu His
85 90 95
Val Ala Val Ser Phe Ala Phe Phe Arg Ile Gly Val Leu Pro Val Phe
100 105 110
Thr Leu Pro Asn His Arg Met Ala Glu Leu Asp His Ile Cys Gly Leu
115 120 125
Thr Gly Ala Ser Ala Tyr Val Thr Leu Asp Arg Phe Leu Gly Phe Asp
130 135 140
His Arg Gly Leu Ala Arg Ser Leu Arg Glu Arg His Ala Ser Leu Arg
145 150 155 160
His Val Phe Val Val Gly Asp Pro Gly Glu Phe Ala Pro Leu Pro Glu
165 170 175
Ala Glu Thr Pro Leu Asp Pro Ala Gly Ala Thr Gly Pro Asp Ala Ser
180 185 190
Asp Val Ala Phe Phe Leu Leu Ser Gly Gly Thr Thr Ala Leu Pro Lys
195 200 205
Leu Ile Pro Arg Thr His Asp Asp Tyr Leu Tyr Gln Ala Arg Thr Ala
210 215 220
Ala Gly Ile Cys Glu Tyr Ser Glu Asp Thr Arg Tyr Leu Ala Thr Leu
225 230 235 240
Pro Ile Ala Phe Asn Phe Thr Trp Gly Cys Pro Gly Val Val Gly Val
245 250 255
Phe Ala Asn Gly Gly Ala Val Val Leu Ser Thr Val Pro Asp Pro Gln
260 265 270
Val Cys Phe Pro Leu Ile Ala Arg His Gly Val Thr Thr Thr Ser Val
275 280 285
Val Pro Thr Ile Ala His Ser Trp Ile Ala Ala Ala Asp Gly Arg Arg
290 295 300
Glu Glu Leu Ala Thr Leu Glu Leu Val Gln Val Gly Ser Ala Val Val
305 310 315 320
His Arg Ser Leu Ala Glu Glu Val Gly Pro Ala Leu Thr Ala Arg Leu
325 330 335
Gln Gln Val Phe Gly Met Ser Glu Gly Leu Leu Cys Leu Thr Arg Arg
340 345 350
Glu Asp Ala Pro Glu Thr Val Leu Thr Thr Gln Gly Arg Pro Ile Ser
355 360 365
Pro His Asp Glu Leu Arg Val Val Asp Ala Ala Gly Asp Glu Val Ala
370 375 380
Ala Gly Gly Thr Gly Glu Leu Leu Thr Arg Gly Pro Tyr Thr Leu Arg
385 390 395 400
Gly Tyr Tyr Arg Ala Glu Glu His Asn Ala Gly Ala Phe Thr Pro Asp
405 410 415
Gly Phe Tyr Arg Thr Gly Asp Leu Val Arg Ile Thr Asp Asp Gly Gly
420 425 430
Val Val Val Met Gly Arg Ala Lys Asp Val Ile Val Arg Gly Gly Asp
435 440 445
Lys Val Ser Ala Pro Glu Leu Glu Gly His Leu Thr Gly His Glu Arg
450 455 460
Ile Asp Gln Ala Ala Val Val Pro Met Ala Asp Ala Val Leu Gly Glu
465 470 475 480
Arg Thr Cys Ala Val Ile Ile Pro Val Gly Thr Pro Pro Thr Leu Gly
485 490 495
Glu Leu Arg Arg Tyr Leu Arg Asp Arg Gly Leu Ala Ser Tyr Lys Phe
500 505 510
Pro Asp Arg Val Val Cys Val Glu Ala Phe Pro Lys Ser Gly Leu Gly
515 520 525
Lys Val Asp Lys Lys Arg Leu Val Ala Asp Leu Gly Leu Asp Ala Pro
530 535 540
Pro Gly Pro Asp Ala Ala Gly Ser Asp Pro Glu Pro Ala Gly Ala Arg
545 550 555 560
Ser
<210> 14
<211> 1248
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1248)
<223>
<400> 14
atg acc gtc gac gag gct tcg gcg cac gag ggc cgc ctg ccg gcc ttc 48
Met Thr Val Asp Glu Ala Ser Ala His Glu Gly Arg Leu Pro Ala Phe
1 5 10 15
gag gtg ttc gac cag ggc ttc aag acc gat ccg tac ccg tgg tac cgc 96
Glu Val Phe Asp Gln Gly Phe Lys Thr Asp Pro Tyr Pro Trp Tyr Arg
20 25 30
aag ctg cgc gag gcg gcg ccg atc cac cgg gta cgg atg acc ctg ggc 144
Lys Leu Arg Glu Ala Ala Pro Ile His Arg Val Arg Met Thr Leu Gly
35 40 45
gcg gac gtg tgg ctg gtg acc ggc tac gag ctg gcg aag acc gtg ctc 192
Ala Asp Val Trp Leu Val Thr Gly Tyr Glu Leu Ala Lys Thr Val Leu
50 55 60
gcg gac ggc cgg ttc tcc aag atg acc gtc aac gcc gag cgc gcg tgg 240
Ala Asp Gly Arg Phe Ser Lys Met Thr Val Asn Ala Glu Arg Ala Trp
65 70 75 80
cgc tcc ctg gag ctc atc ccg gac gac ccc gac gcc ctg gtc aac cgg 288
Arg Ser Leu Glu Leu Ile Pro Asp Asp Pro Asp Ala Leu Val Asn Arg
85 90 95
atg ctg ctg atg agc gat ccg ccc gac cac gag cgc ctc cgc cgc ctg 336
Met Leu Leu Met Ser Asp Pro Pro Asp His Glu Arg Leu Arg Arg Leu
100 105 110
gtg tcc cgg gcg ttc acg gcg cgc tcg atg gag gcg atg cgg ccc cgc 384
Val Ser Arg Ala Phe Thr Ala Arg Ser Met Glu Ala Met Arg Pro Arg
115 120 125
atc gcc gag gtc gcc gac gaa ctc gtc gca cgg ttc gcc ggc cgg ggc 432
Ile Ala Glu Val Ala Asp Glu Leu Val Ala Arg Phe Ala Gly Arg Gly
130 135 140
cgc gtc gac ctc atc cgc gag ttc gcg ttc ccg ctg ccc gcc atg atc 480
Arg Val Asp Leu Ile Arg Glu Phe Ala Phe Pro Leu Pro Ala Met Ile
145 150 155 160
atc tgc gat ctg ctc ggc gtc ccc gcc gaa cac cgc acc cgg ttc gag 528
Ile Cys Asp Leu Leu Gly Val Pro Ala Glu His Arg Thr Arg Phe Glu
165 170 175
gag tac ctg cgg ctg ctc tgc ctg gcc gaa ccc gag gac gtc cac cgg 576
Glu Tyr Leu Arg Leu Leu Cys Leu Ala Glu Pro Glu Asp Val His Arg
180 185 190
atg ccc gcc gtc ttc gcc gaa ctc acg gcg gaa ctc gcc gag ttg gtc 624
Met Pro Ala Val Phe Ala Glu Leu Thr Ala Glu Leu Ala Glu Leu Val
195 200 205
gag cgc aag cgg gcc gag ccc gac ggg cac ctg ctc tcc gcg ctg gtc 672
Glu Arg Lys Arg Ala Glu Pro Asp Gly His Leu Leu Ser Ala Leu Val
210 215 220
ggg atc cgg gac ggc agc gac cgg ctc acc gac gac gaa ctg gtc tcc 720
Gly Ile Arg Asp Gly Ser Asp Arg Leu Thr Asp Asp Glu Leu Val Ser
225 230 235 240
atg gcc ttc cag ctc atg tac ggc gcc cag gac acc acc gtc aac ctc 768
Met Ala Phe Gln Leu Met Tyr Gly Ala Gln Asp Thr Thr Val Asn Leu
245 250 255
atc ggc aac ggc atg ctc gcc ctg ctg gac aac ccc gcc gcc atg gcc 816
Ile Gly Asn Gly Met Leu Ala Leu Leu Asp Asn Pro Ala Ala Met Ala
260 265 270
gaa ctg cgg gag aac ccg gag ctc atc ccg ggc gcc gtc gag gag atc 864
Glu Leu Arg Glu Asn Pro Glu Leu Ile Pro Gly Ala Val Glu Glu Ile
275 280 285
ctc cgc ttc gac ccg ccg gtg gag acc gcc acc ccg cgg tac gcc ctg 912
Leu Arg Phe Asp Pro Pro Val Glu Thr Ala Thr Pro Arg Tyr Ala Leu
290 295 300
gaa ccg ctc gac gtc ggc ggg atg cgc gtg gag aag ggc ggg gtc gtg 960
Glu Pro Leu Asp Val Gly Gly Met Arg Val Glu Lys Gly Gly Val Val
305 310 315 320
ctc gtc tcc ctc gcg agc gcc tcc cgc gac ccc ggg cag ttc gag gac 1008
Leu Val Ser Leu Ala Ser Ala Ser Arg Asp Pro Gly Gln Phe Glu Asp
325 330 335
ccc gac gtc ttc gac atc cac cgc gag gtg cgc gga cag ctc gcg ttc 1056
Pro Asp Val Phe Asp Ile His Arg Glu Val Arg Gly Gln Leu Ala Phe
340 345 350
ggg cac ggg ctg cac tac tgc ctc ggg gcc gtg atg gcc cgc gtg aag 1104
Gly His Gly Leu His Tyr Cys Leu Gly Ala Val Met Ala Arg Val Lys
355 360 365
ggc gag gtc gcc ctg cgg gcc ctg ctg tgc ggc ctg gac gac ctg cgc 1152
Gly Glu Val Ala Leu Arg Ala Leu Leu Cys Gly Leu Asp Asp Leu Arg
370 375 380
ccg gac gag gac gcc gaa ccg ctc gcg cgc cac gcc ggg ttc atc atg 1200
Pro Asp Glu Asp Ala Glu Pro Leu Ala Arg His Ala Gly Phe Ile Met
385 390 395 400
cgc ggg ctg aag gcg ctc ccc gtc cgc ttc acc ccg cgc gcc gcg tga 1248
Arg Gly Leu Lys Ala Leu Pro Val Arg Phe Thr Pro Arg Ala Ala
405 410 415
<210> 15
<211> 415
<212> PRT
<213> Streptoverticillium
<400> 15
Met Thr Val Asp Glu Ala Ser Ala His Glu Gly Arg Leu Pro Ala Phe
1 5 10 15
Glu Val Phe Asp Gln Gly Phe Lys Thr Asp Pro Tyr Pro Trp Tyr Arg
20 25 30
Lys Leu Arg Glu Ala Ala Pro Ile His Arg Val Arg Met Thr Leu Gly
35 40 45
Ala Asp Val Trp Leu Val Thr Gly Tyr Glu Leu Ala Lys Thr Val Leu
50 55 60
Ala Asp Gly Arg Phe Ser Lys Met Thr Val Asn Ala Glu Arg Ala Trp
65 70 75 80
Arg Ser Leu Glu Leu Ile Pro Asp Asp Pro Asp Ala Leu Val Asn Arg
85 90 95
Met Leu Leu Met Ser Asp Pro Pro Asp His Glu Arg Leu Arg Arg Leu
100 105 110
Val Ser Arg Ala Phe Thr Ala Arg Ser Met Glu Ala Met Arg Pro Arg
115 120 125
Ile Ala Glu Val Ala Asp Glu Leu Val Ala Arg Phe Ala Gly Arg Gly
130 135 140
Arg Val Asp Leu Ile Arg Glu Phe Ala Phe Pro Leu Pro Ala Met Ile
145 150 155 160
Ile Cys Asp Leu Leu Gly Val Pro Ala Glu His Arg Thr Arg Phe Glu
165 170 175
Glu Tyr Leu Arg Leu Leu Cys Leu Ala Glu Pro Glu Asp Val His Arg
180 185 190
Met Pro Ala Val Phe Ala Glu Leu Thr Ala Glu Leu Ala Glu Leu Val
195 200 205
Glu Arg Lys Arg Ala Glu Pro Asp Gly His Leu Leu Ser Ala Leu Val
210 215 220
Gly Ile Arg Asp Gly Ser Asp Arg Leu Thr Asp Asp Glu Leu Val Ser
225 230 235 240
Met Ala Phe Gln Leu Met Tyr Gly Ala Gln Asp Thr Thr Val Asn Leu
245 250 255
Ile Gly Asn Gly Met Leu Ala Leu Leu Asp Asn Pro Ala Ala Met Ala
260 265 270
Glu Leu Arg Glu Asn Pro Glu Leu Ile Pro Gly Ala Val Glu Glu Ile
275 280 285
Leu Arg Phe Asp Pro Pro Val Glu Thr Ala Thr Pro Arg Tyr Ala Leu
290 295 300
Glu Pro Leu Asp Val Gly Gly Met Arg Val Glu Lys Gly Gly Val Val
305 310 315 320
Leu Val Ser Leu Ala Ser Ala Ser Arg Asp Pro Gly Gln Phe Glu Asp
325 330 335
Pro Asp Val Phe Asp Ile His Arg Glu Val Arg Gly Gln Leu Ala Phe
340 345 350
Gly His Gly Leu His Tyr Cys Leu Gly Ala Val Met Ala Arg Val Lys
355 360 365
Gly Glu Val Ala Leu Arg Ala Leu Leu Cys Gly Leu Asp Asp Leu Arg
370 375 380
Pro Asp Glu Asp Ala Glu Pro Leu Ala Arg His Ala Gly Phe Ile Met
385 390 395 400
Arg Gly Leu Lys Ala Leu Pro Val Arg Phe Thr Pro Arg Ala Ala
405 410 415
<210> 16
<211> 546
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(546)
<223>
<400> 16
atg gcc gac ctg ctc ctc ccc ggc gtc ctc gaa gcg gcc gac cgc ccg 48
Met Ala Asp Leu Leu Leu Pro Gly Val Leu Glu Ala Ala Asp Arg Pro
1 5 10 15
ttc gtc ttc tac ggc cac tcg ctc ggc gcg cgc gtc gcc tac gag acg 96
Phe Val Phe Tyr Gly His Ser Leu Gly Ala Arg Val Ala Tyr Glu Thr
20 25 30
gcc cac cgc ctc gcg gac acc ggc cgg ccg ctg ccc gcc gcg ctc tgc 144
Ala His Arg Leu Ala Asp Thr Gly Arg Pro Leu Pro Ala Ala Leu Cys
35 40 45
gtc tcc ggg gcg ccc gcc ccg gcc ctc ggc gtc cac acc ccg tgc cac 192
Val Ser Gly Ala Pro Ala Pro Ala Leu Gly Val His Thr Pro Cys His
50 55 60
gac cag ccc cgc gcg gaa ttc ctc cgc acc ctg cgg gcg atg ggc ggc 240
Asp Gln Pro Arg Ala Glu Phe Leu Arg Thr Leu Arg Ala Met Gly Gly
65 70 75 80
gtc gcc ccg gag gtg ctc gcc gac gag gag ctg tgc gac tac gtc ctg 288
Val Ala Pro Glu Val Leu Ala Asp Glu Glu Leu Cys Asp Tyr Val Leu
85 90 95
ccg gtc atc cgc gcc gac atg cgg gcc gcc gag aca tac cgg cca ccg 336
Pro Val Ile Arg Ala Asp Met Arg Ala Ala Glu Thr Tyr Arg Pro Pro
100 105 110
cgc cgg acc ccg ctg cgc aca ccg atc agg gcg ctc gcc gga cgg gac 384
Arg Arg Thr Pro Leu Arg Thr Pro Ile Arg Ala Leu Ala Gly Arg Asp
115 120 125
gac ccc cgg gtg ccg gtg gag cac gtg cgg cgg tgg tcg gac gag gcc 432
Asp Pro Arg Val Pro Val Glu His Val Arg Arg Trp Ser Asp Glu Ala
130 135 140
ggt ggg gag ttc cgc tgc acg gtc ttc gag gga ggc cac ttc ttc ttc 480
Gly Gly Glu Phe Arg Cys Thr Val Phe Glu Gly Gly His Phe Phe Phe
145 150 155 160
cgt gac cac ccg tcg gag gtc gcc gcg gtg ttg gac ggc ctg ctg cgg 528
Arg Asp His Pro Ser Glu Val Ala Ala Val Leu Asp Gly Leu Leu Arg
165 170 175
gaa gtc gcc ggg gga tag 546
Glu Val Ala Gly Gly
180
<210> 17
<211> 181
<212> PRT
<213> Streptoverticillium
<400> 17
Met Ala Asp Leu Leu Leu Pro Gly Val Leu Glu Ala Ala Asp Arg Pro
1 5 10 15
Phe Val Phe Tyr Gly His Ser Leu Gly Ala Arg Val Ala Tyr Glu Thr
20 25 30
Ala His Arg Leu Ala Asp Thr Gly Arg Pro Leu Pro Ala Ala Leu Cys
35 40 45
Val Ser Gly Ala Pro Ala Pro Ala Leu Gly Val His Thr Pro Cys His
50 55 60
Asp Gln Pro Arg Ala Glu Phe Leu Arg Thr Leu Arg Ala Met Gly Gly
65 70 75 80
Val Ala Pro Glu Val Leu Ala Asp Glu Glu Leu Cys Asp Tyr Val Leu
85 90 95
Pro Val Ile Arg Ala Asp Met Arg Ala Ala Glu Thr Tyr Arg Pro Pro
100 105 110
Arg Arg Thr Pro Leu Arg Thr Pro Ile Arg Ala Leu Ala Gly Arg Asp
115 120 125
Asp Pro Arg Val Pro Val Glu His Val Arg Arg Trp Ser Asp Glu Ala
130 135 140
Gly Gly Glu Phe Arg Cys Thr Val Phe Glu Gly Gly His Phe Phe Phe
145 150 155 160
Arg Asp His Pro Ser Glu Val Ala Ala Val Leu Asp Gly Leu Leu Arg
165 170 175
Glu Val Ala Gly Gly
180
<210> 18
<211> 531
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(531)
<223>
<400> 18
atg gac ccg gtg acc ctt cgg acc gac cgc ctg gtg ctg cgg gcc ttc 48
Met Asp Pro Val Thr Leu Arg Thr Asp Arg Leu Val Leu Arg Ala Phe
1 5 10 15
acg cct gcc gac gtg gat gcg gtg tac gag gcc tgc cag gac gag gac 96
Thr Pro Ala Asp Val Asp Ala Val Tyr Glu Ala Cys Gln Asp Glu Asp
20 25 30
atc cag ctc tac acc ccg gtg ccg gtg ccg tac ctg cgt gcg gac gcg 144
Ile Gln Leu Tyr Thr Pro Val Pro Val Pro Tyr Leu Arg Ala Asp Ala
35 40 45
gag aag ctc gtc ggc gag aag ctg ccc gcc cag tgg gcc gcg gac gag 192
Glu Lys Leu Val Gly Glu Lys Leu Pro Ala Gln Trp Ala Ala Asp Glu
50 55 60
gac tac acc ttc ggc gcg ttc cgc gag gac acc ggc gcc ctg gcc ggc 240
Asp Tyr Thr Phe Gly Ala Phe Arg Glu Asp Thr Gly Ala Leu Ala Gly
65 70 75 80
tcg tac tgc ctg acc cgc gtc agc cgc ggc gtc tgg gag ctc ggc tac 288
Ser Tyr Cys Leu Thr Arg Val Ser Arg Gly Val Trp Glu Leu Gly Tyr
85 90 95
tgg gcg gtc aag gag cag cgc ggt cac ggg tat tcg gtg gag gcc gcc 336
Trp Ala Val Lys Glu Gln Arg Gly His Gly Tyr Ser Val Glu Ala Ala
100 105 110
cga gcc ctg tgc gac tgg gga tgg gcc acg ctc gac gtg cac cgc atc 384
Arg Ala Leu Cys Asp Trp Gly Trp Ala Thr Leu Asp Val His Arg Ile
115 120 125
gag tgg tgg gcc atg gtc ggg aac gcc ggc tcg cgt gcc gtc gcc gag 432
Glu Trp Trp Ala Met Val Gly Asn Ala Gly Ser Arg Ala Val Ala Glu
130 135 140
aga ctc ggc ttc acc gtc gag ggg aca ctg cgc aag cgc ggc atc gcc 480
Arg Leu Gly Phe Thr Val Glu Gly Thr Leu Arg Lys Arg Gly Ile Ala
145 150 155 160
aac gac ggc gta ccg cac gac tgg tgg gtg ggc gga ctg ctg cgg ccc 528
Asn Asp Gly Val Pro His Asp Trp Trp Val Gly Gly Leu Leu Arg Pro
165 170 175
tga 531
<210> 19
<211> 176
<212> PRT
<213> Streptoverticillium
<400> 19
Met Asp Pro Val Thr Leu Arg Thr Asp Arg Leu Val Leu Arg Ala Phe
1 5 10 15
Thr Pro Ala Asp Val Asp Ala Val Tyr Glu Ala Cys Gln Asp Glu Asp
20 25 30
Ile Gln Leu Tyr Thr Pro Val Pro Val Pro Tyr Leu Arg Ala Asp Ala
35 40 45
Glu Lys Leu Val Gly Glu Lys Leu Pro Ala Gln Trp Ala Ala Asp Glu
50 55 60
Asp Tyr Thr Phe Gly Ala Phe Arg Glu Asp Thr Gly Ala Leu Ala Gly
65 70 75 80
Ser Tyr Cys Leu Thr Arg Val Ser Arg Gly Val Trp Glu Leu Gly Tyr
85 90 95
Trp Ala Val Lys Glu Gln Arg Gly His Gly Tyr Ser Val Glu Ala Ala
100 105 110
Arg Ala Leu Cys Asp Trp Gly Trp Ala Thr Leu Asp Val His Arg Ile
115 120 125
Glu Trp Trp Ala Met Val Gly Asn Ala Gly Ser Arg Ala Val Ala Glu
130 135 140
Arg Leu Gly Phe Thr Val Glu Gly Thr Leu Arg Lys Arg Gly Ile Ala
145 150 155 160
Asn Asp Gly Val Pro His Asp Trp Trp Val Gly Gly Leu Leu Arg Pro
165 170 175
<210> 20
<211> 777
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(777)
<223>
<400> 20
atg tca gat ccg acc gac cgc atc gcc ctg gtg acc ggg gcc ggc cgc 48
Met Ser Asp Pro Thr Asp Arg Ile Ala Leu Val Thr Gly Ala Gly Arg
1 5 10 15
ggc atc ggc cgt gcc gtc gcc gtc cgc ctc gcc gcg gag ggc gcg ctg 96
Gly Ile Gly Arg Ala Val Ala Val Arg Leu Ala Ala Glu Gly Ala Leu
20 25 30
gtc gcc gtc cac tac gga cgg gac gac gaa gcc gcg cgg tcg acg gtg 144
Val Ala Val His Tyr Gly Arg Asp Asp Glu Ala Ala Arg Ser Thr Val
35 40 45
cgg gag atc cgc gaa gcc ggc ggg tcg gcc ttc ccc gtc cgc gcg gag 192
Arg Glu Ile Arg Glu Ala Gly Gly Ser Ala Phe Pro Val Arg Ala Glu
50 55 60
ttc ggc gag ctc ggc gcc ctc gac gag ctg tgg cgc ggt tac gac gag 240
Phe Gly Glu Leu Gly Ala Leu Asp Glu Leu Trp Arg Gly Tyr Asp Glu
65 70 75 80
ggc gtc gcc gcc gtc cgc ggc ggc tcg ggt ccc gcg ccg gtg gac atc 288
Gly Val Ala Ala Val Arg Gly Gly Ser Gly Pro Ala Pro Val Asp Ile
85 90 95
ctc gtg aac aac gcc ggg atc acc gtc ccg cgt ggc gta cgg gac ctc 336
Leu Val Asn Asn Ala Gly Ile Thr Val Pro Arg Gly Val Arg Asp Leu
100 105 110
gaa gag gcc gac tgg gac cgg ctg ttc gcg gtc aac gcc aag gcc ccg 384
Glu Glu Ala Asp Trp Asp Arg Leu Phe Ala Val Asn Ala Lys Ala Pro
115 120 125
ttc ttc ctg gtg cag ggc gcg ctg ccg cgg ctg cgc gac ggg ggc cgg 432
Phe Phe Leu Val Gln Gly Ala Leu Pro Arg Leu Arg Asp Gly Gly Arg
130 135 140
atc gtc aac gtc acc acc gcc gcg acc cgg gtg gcg atg ccg gtg atc 480
Ile Val Asn Val Thr Thr Ala Ala Thr Arg Val Ala Met Pro Val Ile
145 150 155 160
gcc gcg tac acc atg acc aag gcg gcg ctg gag acc ttc acc gtc gac 528
Ala Ala Tyr Thr Met Thr Lys Ala Ala Leu Glu Thr Phe Thr Val Asp
165 170 175
ctc gcc ctg gag ctg ggg ccg cgc ggc atc acc gtc aac gcg gtc gcc 576
Leu Ala Leu Glu Leu Gly Pro Arg Gly Ile Thr Val Asn Ala Val Ala
180 185 190
ccg ggg tac acc gac acc gac atc aac ccg gac atg aag gtg ccc gcc 624
Pro Gly Tyr Thr Asp Thr Asp Ile Asn Pro Asp Met Lys Val Pro Ala
195 200 205
cag cgc gag gcc atg gcc gcc acc acc gca ctc cac cgg gtc ggt acg 672
Gln Arg Glu Ala Met Ala Ala Thr Thr Ala Leu His Arg Val Gly Thr
210 215 220
ccc ggc gag gtc gcc gac gtc gtc gcc tac ctg gcg gga ccg ggc ggc 720
Pro Gly Glu Val Ala Asp Val Val Ala Tyr Leu Ala Gly Pro Gly Gly
225 230 235 240
cgc tgg gtc acc ggg cag cgc atc gag gcg tcg ggg ggc gtc cgg ctc 768
Arg Trp Val Thr Gly Gln Arg Ile Glu Ala Ser Gly Gly Val Arg Leu
245 250 255
gga ctc tag 777
Gly Leu
<210> 21
<211> 258
<212> PRT
<213> Streptoverticillium
<400> 21
Met Ser Asp Pro Thr Asp Arg Ile Ala Leu Val Thr Gly Ala Gly Arg
1 5 10 15
Gly Ile Gly Arg Ala Val Ala Val Arg Leu Ala Ala Glu Gly Ala Leu
20 25 30
Val Ala Val His Tyr Gly Arg Asp Asp Glu Ala Ala Arg Ser Thr Val
35 40 45
Arg Glu Ile Arg Glu Ala Gly Gly Ser Ala Phe Pro Val Arg Ala Glu
50 55 60
Phe Gly Glu Leu Gly Ala Leu Asp Glu Leu Trp Arg Gly Tyr Asp Glu
65 70 75 80
Gly Val Ala Ala Val Arg Gly Gly Ser Gly Pro Ala Pro Val Asp Ile
85 90 95
Leu Val Asn Asn Ala Gly Ile Thr Val Pro Arg Gly Val Arg Asp Leu
100 105 110
Glu Glu Ala Asp Trp Asp Arg Leu Phe Ala Val Asn Ala Lys Ala Pro
115 120 125
Phe Phe Leu Val Gln Gly Ala Leu Pro Arg Leu Arg Asp Gly Gly Arg
130 135 140
Ile Val Asn Val Thr Thr Ala Ala Thr Arg Val Ala Met Pro Val Ile
145 150 155 160
Ala Ala Tyr Thr Met Thr Lys Ala Ala Leu Glu Thr Phe Thr Val Asp
165 170 175
Leu Ala Leu Glu Leu Gly Pro Arg Gly Ile Thr Val Asn Ala Val Ala
180 185 190
Pro Gly Tyr Thr Asp Thr Asp Ile Asn Pro Asp Met Lys Val Pro Ala
195 200 205
Gln Arg Glu Ala Met Ala Ala Thr Thr Ala Leu His Arg Val Gly Thr
210 215 220
Pro Gly Glu Val Ala Asp Val Val Ala Tyr Leu Ala Gly Pro Gly Gly
225 230 235 240
Arg Trp Val Thr Gly Gln Arg Ile Glu Ala Ser Gly Gly Val Arg Leu
245 250 255
Gly Leu
<210> 22
<211> 1302
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1302)
<223>
<400> 22
atg ccc gac tcc ctc cgt ccc ctc tgc cca ctt gag gag ctg cac gtc 48
Met Pro Asp Ser Leu Arg Pro Leu Cys Pro Leu Glu Glu Leu His Val
1 5 10 15
ggc gac cgc agc cgg gcg gtg gtc acc gtc gag gtc gag ggc gac ctc 96
Gly Asp Arg Ser Arg Ala Val Val Thr Val Glu Val Glu Gly Asp Leu
20 25 30
gac ctc gac gtg ctg tcc gcg gcc tgg tcg cgg acg ctc gac gcg cat 144
Asp Leu Asp Val Leu Ser Ala Ala Trp Ser Arg Thr Leu Asp Ala His
35 40 45
ccg acg gcg gac agc cgg atc gtg tcg cac ggc ggc ggt ttc gcc ctc 192
Pro Thr Ala Asp Ser Arg Ile Val Ser His Gly Gly Gly Phe Ala Leu
50 55 60
gaa cgg ctg ggg gcg gcc ggc cgc ccg ggc ctg gcc gaa ccg gcg ccc 240
Glu Arg Leu Gly Ala Ala Gly Arg Pro Gly Leu Ala Glu Pro Ala Pro
65 70 75 80
gag aag gac gtg atg acg gag atc gcc acg tcc ccc ttg ccc gtc ggc 288
Glu Lys Asp Val Met Thr Glu Ile Ala Thr Ser Pro Leu Pro Val Gly
85 90 95
ggc ccg gtc gcg cgg ctg tcg acg gcc gcg cgg ggc tcg gac acg gtc 336
Gly Pro Val Ala Arg Leu Ser Thr Ala Ala Arg Gly Ser Asp Thr Val
100 105 110
gtg ggg ctc gtc gtg gac cac gtg gtg acc gac ggc acc agc gcc ctc 384
Val Gly Leu Val Val Asp His Val Val Thr Asp Gly Thr Ser Ala Leu
115 120 125
acc ctc cac acg gaa ctc tgg cgg cac tac gcc gcg gtg ctg gcc ggc 432
Thr Leu His Thr Glu Leu Trp Arg His Tyr Ala Ala Val Leu Ala Gly
130 135 140
gaa ccg gcc cgc ccg gcg gcg acc gcg tgg ccg gcc ccg gtg tcg gag 480
Glu Pro Ala Arg Pro Ala Ala Thr Ala Trp Pro Ala Pro Val Ser Glu
145 150 155 160
cgg ctg ccg gcc gtg tcc ggg gac gcc gtc gcg gcg ctg ctc gcc gag 528
Arg Leu Pro Ala Val Ser Gly Asp Ala Val Ala Ala Leu Leu Ala Glu
165 170 175
cgc ctg gaa cag gcg cgc gac cgt ccg ccg gcg cag ttg ccg tac gtg 576
Arg Leu Glu Gln Ala Arg Asp Arg Pro Pro Ala Gln Leu Pro Tyr Val
180 185 190
gag gcg ggc ggg gac ggt gcg ccg ccg gcc ggg cgg cag ccg gtg cac 624
Glu Ala Gly Gly Asp Gly Ala Pro Pro Ala Gly Arg Gln Pro Val His
195 200 205
aac gtc cgc gtc gcc ctg tcc gcc gac agg acc ggc gaa ctc gcg gcg 672
Asn Val Arg Val Ala Leu Ser Ala Asp Arg Thr Gly Glu Leu Ala Ala
210 215 220
ggc gca cgg agg ttg ggc acc tcg gtg cac ggc gtg acc gcc gcg gcg 720
Gly Ala Arg Arg Leu Gly Thr Ser Val His Gly Val Thr Ala Ala Ala
225 230 235 240
ctg ctc ctg gcg ata cgg gag gag ctc ggc ggt tcc ggt acc gcc gcc 768
Leu Leu Leu Ala Ile Arg Glu Glu Leu Gly Gly Ser Gly Thr Ala Ala
245 250 255
ctc ggc tgc ttc tcg ccc gtg gac ctg cgc tcc cgg gtc gag ccc ccg 816
Leu Gly Cys Phe Ser Pro Val Asp Leu Arg Ser Arg Val Glu Pro Pro
260 265 270
gcg gcg gcc ggc gtg atg ctg ccg ctg gtc tcg ggg ttc ccg gac gtg 864
Ala Ala Ala Gly Val Met Leu Pro Leu Val Ser Gly Phe Pro Asp Val
275 280 285
gtg gac gtc gcg ccg ggc gag ggc ccg gag cac gtg ggt ccg ctg gcg 912
Val Asp Val Ala Pro Gly Glu Gly Pro Glu His Val Gly Pro Leu Ala
290 295 300
cgc cgg gtc acc gag ggg ctg cgc ggc gcc ctg gcc ggc gac ggc tgg 960
Arg Arg Val Thr Glu Gly Leu Arg Gly Ala Leu Ala Gly Asp Gly Trp
305 310 315 320
gcc gtg gag acc gct ctg ctc gcc cgc ctc gtc gac cac ccg gag ctg 1008
Ala Val Glu Thr Ala Leu Leu Ala Arg Leu Val Asp His Pro Glu Leu
325 330 335
ctg gcc acc acc gtg atc gtg tcg aac atg ggc cgg atc gcc ggc ccg 1056
Leu Ala Thr Thr Val Ile Val Ser Asn Met Gly Arg Ile Ala Gly Pro
340 345 350
gtg tcc ccg ccc ggg ctg cgg ctg cgc gac acc cgg ctg acg gcc gga 1104
Val Ser Pro Pro Gly Leu Arg Leu Arg Asp Thr Arg Leu Thr Ala Gly
355 360 365
cgc gag gac tac ggc ccc ggg ttc ggg cag ggt ccg ctc ttc gcc tgt 1152
Arg Glu Asp Tyr Gly Pro Gly Phe Gly Gln Gly Pro Leu Phe Ala Cys
370 375 380
gtc agc acc gtg gac ggc gcg ttc tcg ctg gag atc ccg tac acc ccc 1200
Val Ser Thr Val Asp Gly Ala Phe Ser Leu Glu Ile Pro Tyr Thr Pro
385 390 395 400
gtc tgc tcc ccg ccc gcc cag atc gag cgg gtg cgg gcg cgg acg ctg 1248
Val Cys Ser Pro Pro Ala Gln Ile Glu Arg Val Arg Ala Arg Thr Leu
405 410 415
gcg acg ctg gag cgg gtc gcg gac gcc ggg gcg cgt gcc gcg ctg tcc 1296
Ala Thr Leu Glu Arg Val Ala Asp Ala Gly Ala Arg Ala Ala Leu Ser
420 425 430
gtc tga 1302
Val
<210> 23
<211> 433
<212> PRT
<213> Streptoverticillium
<400> 23
Met Pro Asp Ser Leu Arg Pro Leu Cys Pro Leu Glu Glu Leu His Val
1 5 10 15
Gly Asp Arg Ser Arg Ala Val Val Thr Val Glu Val Glu Gly Asp Leu
20 25 30
Asp Leu Asp Val Leu Ser Ala Ala Trp Ser Arg Thr Leu Asp Ala His
35 40 45
Pro Thr Ala Asp Ser Arg Ile Val Ser His Gly Gly Gly Phe Ala Leu
50 55 60
Glu Arg Leu Gly Ala Ala Gly Arg Pro Gly Leu Ala Glu Pro Ala Pro
65 70 75 80
Glu Lys Asp Val Met Thr Glu Ile Ala Thr Ser Pro Leu Pro Val Gly
85 90 95
Gly Pro Val Ala Arg Leu Ser Thr Ala Ala Arg Gly Ser Asp Thr Val
100 105 110
Val Gly Leu Val Val Asp His Val Val Thr Asp Gly Thr Ser Ala Leu
115 120 125
Thr Leu His Thr Glu Leu Trp Arg His Tyr Ala Ala Val Leu Ala Gly
130 135 140
Glu Pro Ala Arg Pro Ala Ala Thr Ala Trp Pro Ala Pro Val Ser Glu
145 150 155 160
Arg Leu Pro Ala Val Ser Gly Asp Ala Val Ala Ala Leu Leu Ala Glu
165 170 175
Arg Leu Glu Gln Ala Arg Asp Arg Pro Pro Ala Gln Leu Pro Tyr Val
180 185 190
Glu Ala Gly Gly Asp Gly Ala Pro Pro Ala Gly Arg Gln Pro Val His
195 200 205
Asn Val Arg Val Ala Leu Ser Ala Asp Arg Thr Gly Glu Leu Ala Ala
210 215 220
Gly Ala Arg Arg Leu Gly Thr Ser Val His Gly Val Thr Ala Ala Ala
225 230 235 240
Leu Leu Leu Ala Ile Arg Glu Glu Leu Gly Gly Ser Gly Thr Ala Ala
245 250 255
Leu Gly Cys Phe Ser Pro Val Asp Leu Arg Ser Arg Val Glu Pro Pro
260 265 270
Ala Ala Ala Gly Val Met Leu Pro Leu Val Ser Gly Phe Pro Asp Val
275 280 285
Val Asp Val Ala Pro Gly Glu Gly Pro Glu His Val Gly Pro Leu Ala
290 295 300
Arg Arg Val Thr Glu Gly Leu Arg Gly Ala Leu Ala Gly Asp Gly Trp
305 310 315 320
Ala Val Glu Thr Ala Leu Leu Ala Arg Leu Val Asp His Pro Glu Leu
325 330 335
Leu Ala Thr Thr Val Ile Val Ser Asn Met Gly Arg Ile Ala Gly Pro
340 345 350
Val Ser Pro Pro Gly Leu Arg Leu Arg Asp Thr Arg Leu Thr Ala Gly
355 360 365
Arg Glu Asp Tyr Gly Pro Gly Phe Gly Gln Gly Pro Leu Phe Ala Cys
370 375 380
Val Ser Thr Val Asp Gly Ala Phe Ser Leu Glu Ile Pro Tyr Thr Pro
385 390 395 400
Val Cys Ser Pro Pro Ala Gln Ile Glu Arg Val Arg Ala Arg Thr Leu
405 410 415
Ala Thr Leu Glu Arg Val Ala Asp Ala Gly Ala Arg Ala Ala Leu Ser
420 425 430
Val
<210> 24
<211> 3831
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(3831)
<223>
<400> 24
atg gcg acg gag ccg ctg gcc gtc gtc ggg atg gcc ggc cgg ttc ccg 48
Met Ala Thr Glu Pro Leu Ala Val Val Gly Met Ala Gly Arg Phe Pro
1 5 10 15
ggc gcg aac acg ctg gag gag ttc tgg gcg ctg ctg agc gag ggc cgg 96
Gly Ala Asn Thr Leu Glu Glu Phe Trp Ala Leu Leu Ser Glu Gly Arg
20 25 30
cag ggc gtc cgg gag gtg acg gag gag gag ttc ctg gcc gcc ggg ggc 144
Gln Gly Val Arg Glu Val Thr Glu Glu Glu Phe Leu Ala Ala Gly Gly
35 40 45
gat ccg gcg gac ctg gag gac ccg tcc ctg gtc cgc gtg gcg gcg gtg 192
Asp Pro Ala Asp Leu Glu Asp Pro Ser Leu Val Arg Val Ala Ala Val
50 55 60
ctg ccc gac gcc gac cgc ttc gac gcc gcg ttc ttc ggc tac ggc ccg 240
Leu Pro Asp Ala Asp Arg Phe Asp Ala Ala Phe Phe Gly Tyr Gly Pro
65 70 75 80
gcc gag gcc gaa ctc atc gac ccg cag cag cgg gtg ctc ctg gag acc 288
Ala Glu Ala Glu Leu Ile Asp Pro Gln Gln Arg Val Leu Leu Glu Thr
85 90 95
gcc tac cac gcg ctg gag gac gcg ggg tac gcg gac ggc cac ggc gac 336
Ala Tyr His Ala Leu Glu Asp Ala Gly Tyr Ala Asp Gly His Gly Asp
100 105 110
cgc gtc gtc ggg gtc tac gcg ggc gcc ggc gac agc cgc tac tac tcc 384
Arg Val Val Gly Val Tyr Ala Gly Ala Gly Asp Ser Arg Tyr Tyr Ser
115 120 125
tac aac gtg cac ccg cgg cac gcc ggc gag ccc gcc tcc gtg ggt ctg 432
Tyr Asn Val His Pro Arg His Ala Gly Glu Pro Ala Ser Val Gly Leu
130 135 140
atc cac gcg gcc acc gcc aac tcc ctt ggc acg ctc gcc act cgg ctg 480
Ile His Ala Ala Thr Ala Asn Ser Leu Gly Thr Leu Ala Thr Arg Leu
145 150 155 160
tcg tac gac ctg gag ctg acg ggc ccg agc gtc tcg atg aac acg gcc 528
Ser Tyr Asp Leu Glu Leu Thr Gly Pro Ser Val Ser Met Asn Thr Ala
165 170 175
tgc tcg acc gcg ctc gtc gcc gtg cac acc gcc agc gag gcg ctg gcc 576
Cys Ser Thr Ala Leu Val Ala Val His Thr Ala Ser Glu Ala Leu Ala
180 185 190
gcg tac gcg tgc gac atc gcc gtg gtc ggc gcg gtg tcg gtg gat ccg 624
Ala Tyr Ala Cys Asp Ile Ala Val Val Gly Ala Val Ser Val Asp Pro
195 200 205
cag gcg atg ctc ggg tac cgc cac gtg ccc gac ggc ccg ctc tcc ccc 672
Gln Ala Met Leu Gly Tyr Arg His Val Pro Asp Gly Pro Leu Ser Pro
210 215 220
gac ggg gcg tgc cgg ccg ttc gcc gcg gac gcg gcg ggc acg ttc aac 720
Asp Gly Ala Cys Arg Pro Phe Ala Ala Asp Ala Ala Gly Thr Phe Asn
225 230 235 240
ggc gac ggg gcc ggc gtc ctc gtc ctg cgc cgg ctg tcc gac gcg ctg 768
Gly Asp Gly Ala Gly Val Leu Val Leu Arg Arg Leu Ser Asp Ala Leu
245 250 255
gcg gac ggc gac cgg atc cgg gcc gtc atc cgg ggt tcc gcg atc aac 816
Ala Asp Gly Asp Arg Ile Arg Ala Val Ile Arg Gly Ser Ala Ile Asn
260 265 270
aac gac ggc cgg cgc aag gtc ggt ttc tcg gcc ccg agc ccg gcc ggg 864
Asn Asp Gly Arg Arg Lys Val Gly Phe Ser Ala Pro Ser Pro Ala Gly
275 280 285
cag gcg gag gtc atc gtg gcc gcc cag gtg gcg gcc ggc gtc gac gcc 912
Gln Ala Glu Val Ile Val Ala Ala Gln Val Ala Ala Gly Val Asp Ala
290 295 300
ggc tcg gtg acg tac gtc gag gcc cac ggg acc gcc acg cgc ctc ggc 960
Gly Ser Val Thr Tyr Val Glu Ala His Gly Thr Ala Thr Arg Leu Gly
305 310 315 320
gac ccg atc gag gtc gcg gcc ctc acc gag gcg ttc cgg gag tcc acc 1008
Asp Pro Ile Glu Val Ala Ala Leu Thr Glu Ala Phe Arg Glu Ser Thr
325 330 335
gac cgg cgg ggg tac tgc gcg ctc ggc tcg gtc aag ggc aac atc ggc 1056
Asp Arg Arg Gly Tyr Cys Ala Leu Gly Ser Val Lys Gly Asn Ile Gly
340 345 350
cac ctc ggc gcg gcg gcc ggg atc gcc ggc atc atc aag acc gtc ctc 1104
His Leu Gly Ala Ala Ala Gly Ile Ala Gly Ile Ile Lys Thr Val Leu
355 360 365
gcg ctc gag cac cgg gcc gtg ccg ccc acg gtg cac cac gac gcc ccg 1152
Ala Leu Glu His Arg Ala Val Pro Pro Thr Val His His Asp Ala Pro
370 375 380
aac ccc ctc atc gac ttc gcg agc ggc ccg ttc cgc gtc tcg acg gcg 1200
Asn Pro Leu Ile Asp Phe Ala Ser Gly Pro Phe Arg Val Ser Thr Ala
385 390 395 400
ctg gag ccg tgg acg gcc gac ggc ccg ctg cgc gcc gcg gtg agc gcc 1248
Leu Glu Pro Trp Thr Ala Asp Gly Pro Leu Arg Ala Ala Val Ser Ala
405 410 415
ttc ggg gtc ggg ggc acc aac gcc cac gtc gtc ctg gag gag gca ccg 1296
Phe Gly Val Gly Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro
420 425 430
cgc ctg ccg gta ccc atc ggg ccg gcg gaa gag gcg ccc ggc tgg acc 1344
Arg Leu Pro Val Pro Ile Gly Pro Ala Glu Glu Ala Pro Gly Trp Thr
435 440 445
gta ctg ccg gtg tcg gca cgc acc cgc gac gga ctc gcc ggc caa ctg 1392
Val Leu Pro Val Ser Ala Arg Thr Arg Asp Gly Leu Ala Gly Gln Leu
450 455 460
agc cgc ctc ggg cgc cac ttg gag gac aac ccg gaa ctg tcc gtg acc 1440
Ser Arg Leu Gly Arg His Leu Glu Asp Asn Pro Glu Leu Ser Val Thr
465 470 475 480
gag gtg gcg cgc gcc ctg cgc gcc cgg cgc ccg ggg ccc cac cgg cgc 1488
Glu Val Ala Arg Ala Leu Arg Ala Arg Arg Pro Gly Pro His Arg Arg
485 490 495
gcg gtc gcg gcg gcg acc gcg gcg gac gca gcg cgg gcg ctg gcc gcc 1536
Ala Val Ala Ala Ala Thr Ala Ala Asp Ala Ala Arg Ala Leu Ala Ala
500 505 510
gcg acg gtc ccg gcg gcc ggg gcg gag agt gcg ccg gag gtg gtc ttc 1584
Ala Thr Val Pro Ala Ala Gly Ala Glu Ser Ala Pro Glu Val Val Phe
515 520 525
ctg ctg ccc ggc ggt ggc acc cag tac gtg ggg atg ggc gcg gag ctg 1632
Leu Leu Pro Gly Gly Gly Thr Gln Tyr Val Gly Met Gly Ala Glu Leu
530 535 540
tac cgc gac gac ccc gcc tac cgc gag gcc gtc gac cgg tgc gcc gcc 1680
Tyr Arg Asp Asp Pro Ala Tyr Arg Glu Ala Val Asp Arg Cys Ala Ala
545 550 555 560
atc ctt cag ccg gtc ctg gac cac gac atc cgc gtc acg ctc cac gag 1728
Ile Leu Gln Pro Val Leu Asp His Asp Ile Arg Val Thr Leu His Glu
565 570 575
cgg gcc gac cac ttc agc gtg gag tcg atg tgc gcg ctc gcg gtg gtc 1776
Arg Ala Asp His Phe Ser Val Glu Ser Met Cys Ala Leu Ala Val Val
580 585 590
gag tac gcc ttg gcc gcc tcg ctg gcg gct tcc ggg gtc cgg ccc ggc 1824
Glu Tyr Ala Leu Ala Ala Ser Leu Ala Ala Ser Gly Val Arg Pro Gly
595 600 605
gcg ctg atg ggg cac tcc ctg ggc gag tac gtg gcg gcg tgc ctc gcg 1872
Ala Leu Met Gly His Ser Leu Gly Glu Tyr Val Ala Ala Cys Leu Ala
610 615 620
ggg gtg atg acc ctg gag gag atg ctg ccg ctg ctg gtc acc cgc gtc 1920
Gly Val Met Thr Leu Glu Glu Met Leu Pro Leu Leu Val Thr Arg Val
625 630 635 640
cgg ctg atg atc tcg gcg ggc ggg gcg gcg gtc ggc gtg gcg ctg ccc 1968
Arg Leu Met Ile Ser Ala Gly Gly Ala Ala Val Gly Val Ala Leu Pro
645 650 655
gag cgg gac gtc ctc ccg ctc ctg gac ggt ggg ttg tcc ctg gcg gcg 2016
Glu Arg Asp Val Leu Pro Leu Leu Asp Gly Gly Leu Ser Leu Ala Ala
660 665 670
gtc aac tcg ccg tcc tcg tgc acg gtg ggc gga ccg gtg gag gcc gtc 2064
Val Asn Ser Pro Ser Ser Cys Thr Val Gly Gly Pro Val Glu Ala Val
675 680 685
gac gcg ctg gtc gag cgg ctc gtc gcc gac ggc gtc acc cac cgg cgg 2112
Asp Ala Leu Val Glu Arg Leu Val Ala Asp Gly Val Thr His Arg Arg
690 695 700
ctg cgg ctg ccc gcc gcc gcc cac tcc tcg atg ctc gac ccg gtc ctg 2160
Leu Arg Leu Pro Ala Ala Ala His Ser Ser Met Leu Asp Pro Val Leu
705 710 715 720
gac gac ctg gcc gcc gcc ttc cgc ggc gtc gac ctg cgc gag ccg cgc 2208
Asp Asp Leu Ala Ala Ala Phe Arg Gly Val Asp Leu Arg Glu Pro Arg
725 730 735
gtc ccg tac atc acc aac gtc acc ggc acg tgg gtc acc gcc gag cag 2256
Val Pro Tyr Ile Thr Asn Val Thr Gly Thr Trp Val Thr Ala Glu Gln
740 745 750
gcc acc tcg gtg gag cac tgg gtg gcg cac acg cgc ggc acg gtc cgc 2304
Ala Thr Ser Val Glu His Trp Val Ala His Thr Arg Gly Thr Val Arg
755 760 765
ttc gcc gac ggg gtg cgg acg ctg cgc gcc gcc tcc gcc ggg ggc gcg 2352
Phe Ala Asp Gly Val Arg Thr Leu Arg Ala Ala Ser Ala Gly Gly Ala
770 775 780
ggc ccg gtc ctc gtc gag atc ggc ccg ggg gac gtc ctg tcg cgg ctg 2400
Gly Pro Val Leu Val Glu Ile Gly Pro Gly Asp Val Leu Ser Arg Leu
785 790 795 800
gcc gcg gcc gtc gac gac ggc ggc ccg gag ccc gtc acc gtc ccg gtg 2448
Ala Ala Ala Val Asp Asp Gly Gly Pro Glu Pro Val Thr Val Pro Val
805 810 815
atg cgc cac gcg cgg gcg acc ggg ccc gac ggc cgg gtg cgg gcg gag 2496
Met Arg His Ala Arg Ala Thr Gly Pro Asp Gly Arg Val Arg Ala Glu
820 825 830
gcg ctc gcg cac ctg tgg acc gcc ggg gcc gag gtg gac atc gtc ccg 2544
Ala Leu Ala His Leu Trp Thr Ala Gly Ala Glu Val Asp Ile Val Pro
835 840 845
ccc ggc gac gcg tcg gag gag ggc acc cga ctg ccc cgg cgg tcc ctg 2592
Pro Gly Asp Ala Ser Glu Glu Gly Thr Arg Leu Pro Arg Arg Ser Leu
850 855 860
ccc gac ctg ccc ggc tac gcc ttc gcc cgc gac cgg cac tgg atc gac 2640
Pro Asp Leu Pro Gly Tyr Ala Phe Ala Arg Asp Arg His Trp Ile Asp
865 870 875 880
gcc ccc ggc gcc cgg gcg acc acg gcc ccg cac ggc gca tcc gac gac 2688
Ala Pro Gly Ala Arg Ala Thr Thr Ala Pro His Gly Ala Ser Asp Asp
885 890 895
cgc gcc ggc gac cgc gcc tcg cgc cgc gtc ccg cgt ccg ccg ctg gcc 2736
Arg Ala Gly Asp Arg Ala Ser Arg Arg Val Pro Arg Pro Pro Leu Ala
900 905 910
gtg ccg cac gtg ccg ccg ggc acc gac gcg gag cgg gcc gtg gcg gcc 2784
Val Pro His Val Pro Pro Gly Thr Asp Ala Glu Arg Ala Val Ala Ala
915 920 925
gag tgg gag gcc gtg ctc ggt gtc gac ggc atc ggg ctc gac gac aac 2832
Glu Trp Glu Ala Val Leu Gly Val Asp Gly Ile Gly Leu Asp Asp Asn
930 935 940
ttc ttc gac ctc ggc ggc gat tcg atg cgc gcc gtg ctg ctc ggc ggg 2880
Phe Phe Asp Leu Gly Gly Asp Ser Met Arg Ala Val Leu Leu Gly Gly
945 950 955 960
cgc ctg cgc acc gcg ggc gtg ctc gac gtg ccg gcc gcg gcc ctg ctc 2928
Arg Leu Arg Thr Ala Gly Val Leu Asp Val Pro Ala Ala Ala Leu Leu
965 970 975
gcc acg ccg acg atc gcc gga ctg ctc gac cgc gcc ggg cgc ggc ggg 2976
Ala Thr Pro Thr Ile Ala Gly Leu Leu Asp Arg Ala Gly Arg Gly Gly
980 985 990
gcc gtc ggg cag gag gcg ttc gcc ccc atg ctg ccg atg cgg gcc gcg 3024
Ala Val Gly Gln Glu Ala Phe Ala Pro Met Leu Pro Met Arg Ala Ala
995 1000 1005
ggg gat ctg ccg ccg ctg ttc tgc gtg cac ccg gtc agc ggc gtc 3069
Gly Asp Leu Pro Pro Leu Phe Cys Val His Pro Val Ser Gly Val
1010 1015 1020
gcc tgg cgc tac acg ggg ctg ctg ccg cac ctc gac ccg cgc cgc 3114
Ala Trp Arg Tyr Thr Gly Leu Leu Pro His Leu Asp Pro Arg Arg
1025 1030 1035
ccg gtg tac ggc ctc cag gcc ctt ggc ctg gac ggc gcc ctt ccc 3159
Pro Val Tyr Gly Leu Gln Ala Leu Gly Leu Asp Gly Ala Leu Pro
1040 1045 1050
gcc gcc ggg cgc gcc gag gac gtg atc cgg gac ggc ctg gaa cgg 3204
Ala Ala Gly Arg Ala Glu Asp Val Ile Arg Asp Gly Leu Glu Arg
1055 1060 1065
atc cgg gcc gtc cag ccc cac ggc ccg tac cac ctg ctg ggc tgg 3249
Ile Arg Ala Val Gln Pro His Gly Pro Tyr His Leu Leu Gly Trp
1070 1075 1080
tcg ttc ggc ggc gcc gtc gcc cac cgc ctg gcc gcc gcc ctg gag 3294
Ser Phe Gly Gly Ala Val Ala His Arg Leu Ala Ala Ala Leu Glu
1085 1090 1095
gcg gcc ggc gag gag gtc gcg ctg ctg acc atg ctc gac acg ccg 3339
Ala Ala Gly Glu Glu Val Ala Leu Leu Thr Met Leu Asp Thr Pro
1100 1105 1110
cag ccg gac gcg gcg gcg ctg gag ggc gag gcg gtc gag gcg cag 3384
Gln Pro Asp Ala Ala Ala Leu Glu Gly Glu Ala Val Glu Ala Gln
1115 1120 1125
gcc gcc gcc ctc gtc ctg cgg ctg gcc ggc ttg acc atg ccc gcg 3429
Ala Ala Ala Leu Val Leu Arg Leu Ala Gly Leu Thr Met Pro Ala
1130 1135 1140
ccg gcc acg gtc gac gcg tcg ctc gcg ctg ctc gac tcc tcc cgc 3474
Pro Ala Thr Val Asp Ala Ser Leu Ala Leu Leu Asp Ser Ser Arg
1145 1150 1155
cgg gac ccc gag gcg gtg ccg ggc acg ctc acg cgt gag gag gcg 3519
Arg Asp Pro Glu Ala Val Pro Gly Thr Leu Thr Arg Glu Glu Ala
1160 1165 1170
atc acc gtg gcg aag gtg gtc cgc aac aat ctg cgg atc gcc ccc 3564
Ile Thr Val Ala Lys Val Val Arg Asn Asn Leu Arg Ile Ala Pro
1175 1180 1185
gat ctg gtt ccg gaa cgg ctg cgc gcc gac atc ctc ttc gtc tcg 3609
Asp Leu Val Pro Glu Arg Leu Arg Ala Asp Ile Leu Phe Val Ser
1190 1195 1200
gcc acc gaa gtc gcc gac gac gaa ccg gag gtc gcg ggc ggg atc 3654
Ala Thr Glu Val Ala Asp Asp Glu Pro Glu Val Ala Gly Gly Ile
1205 1210 1215
gcc gac cgg gcc gcg tcc tgg cgc ccg ttc acc acc ggc acc ttc 3699
Ala Asp Arg Ala Ala Ser Trp Arg Pro Phe Thr Thr Gly Thr Phe
1220 1225 1230
gag gag gtt cct ctc gcc tgc tcc cac tac gcc ctg acc gac gcc 3744
Glu Glu Val Pro Leu Ala Cys Ser His Tyr Ala Leu Thr Asp Ala
1235 1240 1245
ggc ccg atc gag gtg att gcg aag gcg gtc gag gcg cgt ctc gcg 3789
Gly Pro Ile Glu Val Ile Ala Lys Ala Val Glu Ala Arg Leu Ala
1250 1255 1260
ggg gcc ggc gga ggg gaa cgg gcg gag gtg gcg gcc gga tga 3831
Gly Ala Gly Gly Gly Glu Arg Ala Glu Val Ala Ala Gly
1265 1270 1275
<210> 25
<211> 1276
<212> PRT
<213> Streptoverticillium
<400> 25
Met Ala Thr Glu Pro Leu Ala Val Val Gly Met Ala Gly Arg Phe Pro
1 5 10 15
Gly Ala Asn Thr Leu Glu Glu Phe Trp Ala Leu Leu Ser Glu Gly Arg
20 25 30
Gln Gly Val Arg Glu Val Thr Glu Glu Glu Phe Leu Ala Ala Gly Gly
35 40 45
Asp Pro Ala Asp Leu Glu Asp Pro Ser Leu Val Arg Val Ala Ala Val
50 55 60
Leu Pro Asp Ala Asp Arg Phe Asp Ala Ala Phe Phe Gly Tyr Gly Pro
65 70 75 80
Ala Glu Ala Glu Leu Ile Asp Pro Gln Gln Arg Val Leu Leu Glu Thr
85 90 95
Ala Tyr His Ala Leu Glu Asp Ala Gly Tyr Ala Asp Gly His Gly Asp
100 105 110
Arg Val Val Gly Val Tyr Ala Gly Ala Gly Asp Ser Arg Tyr Tyr Ser
115 120 125
Tyr Asn Val His Pro Arg His Ala Gly Glu Pro Ala Ser Val Gly Leu
130 135 140
Ile His Ala Ala Thr Ala Asn Ser Leu Gly Thr Leu Ala Thr Arg Leu
145 150 155 160
Ser Tyr Asp Leu Glu Leu Thr Gly Pro Ser Val Ser Met Asn Thr Ala
165 170 175
Cys Ser Thr Ala Leu Val Ala Val His Thr Ala Ser Glu Ala Leu Ala
180 185 190
Ala Tyr Ala Cys Asp Ile Ala Val Val Gly Ala Val Ser Val Asp Pro
195 200 205
Gln Ala Met Leu Gly Tyr Arg His Val Pro Asp Gly Pro Leu Ser Pro
210 215 220
Asp Gly Ala Cys Arg Pro Phe Ala Ala Asp Ala Ala Gly Thr Phe Asn
225 230 235 240
Gly Asp Gly Ala Gly Val Leu Val Leu Arg Arg Leu Ser Asp Ala Leu
245 250 255
Ala Asp Gly Asp Arg Ile Arg Ala Val Ile Arg Gly Ser Ala Ile Asn
260 265 270
Asn Asp Gly Arg Arg Lys Val Gly Phe Ser Ala Pro Ser Pro Ala Gly
275 280 285
Gln Ala Glu Val Ile Val Ala Ala Gln Val Ala Ala Gly Val Asp Ala
290 295 300
Gly Ser Val Thr Tyr Val Glu Ala His Gly Thr Ala Thr Arg Leu Gly
305 310 315 320
Asp Pro Ile Glu Val Ala Ala Leu Thr Glu Ala Phe Arg Glu Ser Thr
325 330 335
Asp Arg Arg Gly Tyr Cys Ala Leu Gly Ser Val Lys Gly Asn Ile Gly
340 345 350
His Leu Gly Ala Ala Ala Gly Ile Ala Gly Ile Ile Lys Thr Val Leu
355 360 365
Ala Leu Glu His Arg Ala Val Pro Pro Thr Val His His Asp Ala Pro
370 375 380
Asn Pro Leu Ile Asp Phe Ala Ser Gly Pro Phe Arg Val Ser Thr Ala
385 390 395 400
Leu Glu Pro Trp Thr Ala Asp Gly Pro Leu Arg Ala Ala Val Ser Ala
405 410 415
Phe Gly Val Gly Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro
420 425 430
Arg Leu Pro Val Pro Ile Gly Pro Ala Glu Glu Ala Pro Gly Trp Thr
435 440 445
Val Leu Pro Val Ser Ala Arg Thr Arg Asp Gly Leu Ala Gly Gln Leu
450 455 460
Ser Arg Leu Gly Arg His Leu Glu Asp Asn Pro Glu Leu Ser Val Thr
465 470 475 480
Glu Val Ala Arg Ala Leu Arg Ala Arg Arg Pro Gly Pro His Arg Arg
485 490 495
Ala Val Ala Ala Ala Thr Ala Ala Asp Ala Ala Arg Ala Leu Ala Ala
500 505 510
Ala Thr Val Pro Ala Ala Gly Ala Glu Ser Ala Pro Glu Val Val Phe
515 520 525
Leu Leu Pro Gly Gly Gly Thr Gln Tyr Val Gly Met Gly Ala Glu Leu
530 535 540
Tyr Arg Asp Asp Pro Ala Tyr Arg Glu Ala Val Asp Arg Cys Ala Ala
545 550 555 560
Ile Leu Gln Pro Val Leu Asp His Asp Ile Arg Val Thr Leu His Glu
565 570 575
Arg Ala Asp His Phe Ser Val Glu Ser Met Cys Ala Leu Ala Val Val
580 585 590
Glu Tyr Ala Leu Ala Ala Ser Leu Ala Ala Ser Gly Val Arg Pro Gly
595 600 605
Ala Leu Met Gly His Ser Leu Gly Glu Tyr Val Ala Ala Cys Leu Ala
610 615 620
Gly Val Met Thr Leu Glu Glu Met Leu Pro Leu Leu Val Thr Arg Val
625 630 635 640
Arg Leu Met Ile Ser Ala Gly Gly Ala Ala Val Gly Val Ala Leu Pro
645 650 655
Glu Arg Asp Val Leu Pro Leu Leu Asp Gly Gly Leu Ser Leu Ala Ala
660 665 670
Val Asn Ser Pro Ser Ser Cys Thr Val Gly Gly Pro Val Glu Ala Val
675 680 685
Asp Ala Leu Val Glu Arg Leu Val Ala Asp Gly Val Thr His Arg Arg
690 695 700
Leu Arg Leu Pro Ala Ala Ala His Ser Ser Met Leu Asp Pro Val Leu
705 710 715 720
Asp Asp Leu Ala Ala Ala Phe Arg Gly Val Asp Leu Arg Glu Pro Arg
725 730 735
Val Pro Tyr Ile Thr Asn Val Thr Gly Thr Trp Val Thr Ala Glu Gln
740 745 750
Ala Thr Ser Val Glu His Trp Val Ala His Thr Arg Gly Thr Val Arg
755 760 765
Phe Ala Asp Gly Val Arg Thr Leu Arg Ala Ala Ser Ala Gly Gly Ala
770 775 780
Gly Pro Val Leu Val Glu Ile Gly Pro Gly Asp Val Leu Ser Arg Leu
785 790 795 800
Ala Ala Ala Val Asp Asp Gly Gly Pro Glu Pro Val Thr Val Pro Val
805 810 815
Met Arg His Ala Arg Ala Thr Gly Pro Asp Gly Arg Val Arg Ala Glu
820 825 830
Ala Leu Ala His Leu Trp Thr Ala Gly Ala Glu Val Asp Ile Val Pro
835 840 845
Pro Gly Asp Ala Ser Glu Glu Gly Thr Arg Leu Pro Arg Arg Ser Leu
850 855 860
Pro Asp Leu Pro Gly Tyr Ala Phe Ala Arg Asp Arg His Trp Ile Asp
865 870 875 880
Ala Pro Gly Ala Arg Ala Thr Thr Ala Pro His Gly Ala Ser Asp Asp
885 890 895
Arg Ala Gly Asp Arg Ala Ser Arg Arg Val Pro Arg Pro Pro Leu Ala
900 905 910
Val Pro His Val Pro Pro Gly Thr Asp Ala Glu Arg Ala Val Ala Ala
915 920 925
Glu Trp Glu Ala Val Leu Gly Val Asp Gly Ile Gly Leu Asp Asp Asn
930 935 940
Phe Phe Asp Leu Gly Gly Asp Ser Met Arg Ala Val Leu Leu Gly Gly
945 950 955 960
Arg Leu Arg Thr Ala Gly Val Leu Asp Val Pro Ala Ala Ala Leu Leu
965 970 975
Ala Thr Pro Thr Ile Ala Gly Leu Leu Asp Arg Ala Gly Arg Gly Gly
980 985 990
Ala Val Gly Gln Glu Ala Phe Ala Pro Met Leu Pro Met Arg Ala Ala
995 1000 1005
Gly Asp Leu Pro Pro Leu Phe Cys Val His Pro Val Ser Gly Val
1010 1015 1020
Ala Trp Arg Tyr Thr Gly Leu Leu Pro His Leu Asp Pro Arg Arg
1025 1030 1035
Pro Val Tyr Gly Leu Gln Ala Leu Gly Leu Asp Gly Ala Leu Pro
1040 1045 1050
Ala Ala Gly Arg Ala Glu Asp Val Ile Arg Asp Gly Leu Glu Arg
1055 1060 1065
Ile Arg Ala Val Gln Pro His Gly Pro Tyr His Leu Leu Gly Trp
1070 1075 1080
Ser Phe Gly Gly Ala Val Ala His Arg Leu Ala Ala Ala Leu Glu
1085 1090 1095
Ala Ala Gly Glu Glu Val Ala Leu Leu Thr Met Leu Asp Thr Pro
1100 1105 1110
Gln Pro Asp Ala Ala Ala Leu Glu Gly Glu Ala Val Glu Ala Gln
1115 1120 1125
Ala Ala Ala Leu Val Leu Arg Leu Ala Gly Leu Thr Met Pro Ala
1130 1135 1140
Pro Ala Thr Val Asp Ala Ser Leu Ala Leu Leu Asp Ser Ser Arg
1145 1150 1155
Arg Asp Pro Glu Ala Val Pro Gly Thr Leu Thr Arg Glu Glu Ala
1160 1165 1170
Ile Thr Val Ala Lys Val Val Arg Asn Asn Leu Arg Ile Ala Pro
1175 1180 1185
Asp Leu Val Pro Glu Arg Leu Arg Ala Asp Ile Leu Phe Val Ser
1190 1195 1200
Ala Thr Glu Val Ala Asp Asp Glu Pro Glu Val Ala Gly Gly Ile
1205 1210 1215
Ala Asp Arg Ala Ala Ser Trp Arg Pro Phe Thr Thr Gly Thr Phe
1220 1225 1230
Glu Glu Val Pro Leu Ala Cys Ser His Tyr Ala Leu Thr Asp Ala
1235 1240 1245
Gly Pro Ile Glu Val Ile Ala Lys Ala Val Glu Ala Arg Leu Ala
1250 1255 1260
Gly Ala Gly Gly Gly Glu Arg Ala Glu Val Ala Ala Gly
1265 1270 1275
<210> 26
<211> 9735
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(9735)
<223>
<400> 26
atg ccc gac cgt gct gcc gac tcg tgt ccg ctg acc gcc ccg cag gcc 48
Met Pro Asp Arg Ala Ala Asp Ser Cys Pro Leu Thr Ala Pro Gln Ala
1 5 10 15
ggg atc tgg ttc gcc cag cag cgt gac acc tcc aac ccg gtc ttc acc 96
Gly Ile Trp Phe Ala Gln Gln Arg Asp Thr Ser Asn Pro Val Phe Thr
20 25 30
aca ggc cag tac gtg cgg ctg ccc gcc gag gtc gac ccg gag cgg ttc 144
Thr Gly Gln Tyr Val Arg Leu Pro Ala Glu Val Asp Pro Glu Arg Phe
35 40 45
gcg cgc gcg gtc gag cgg gcc ctc ggc gag gtg tgg ggg ctc gcg gtc 192
Ala Arg Ala Val Glu Arg Ala Leu Gly Glu Val Trp Gly Leu Ala Val
50 55 60
gag gtg ggc gcg gac ggc gac gtc ccc gtc cag cgc ggg acc ggc acg 240
Glu Val Gly Ala Asp Gly Asp Val Pro Val Gln Arg Gly Thr Gly Thr
65 70 75 80
gca ccc cgc gtg gag gtc gtc gac ctc tcc ggg cgg ccc gac ccg gag 288
Ala Pro Arg Val Glu Val Val Asp Leu Ser Gly Arg Pro Asp Pro Glu
85 90 95
gcc gtc gcc ctg gcg cgg atg cgc gcc gac ctc gaa cag ccg cct gtg 336
Ala Val Ala Leu Ala Arg Met Arg Ala Asp Leu Glu Gln Pro Pro Val
100 105 110
ggg cgg ccg ttg gcg cgg gag gtc ctg ttc cgg tgg cag ggc ggg gcc 384
Gly Arg Pro Leu Ala Arg Glu Val Leu Phe Arg Trp Gln Gly Gly Ala
115 120 125
ctg tgg ttc cac cgc tgc cac cac atg ctc ctc gac ggc tac ggg ttc 432
Leu Trp Phe His Arg Cys His His Met Leu Leu Asp Gly Tyr Gly Phe
130 135 140
tcg ctg gtc ctg cgg cgg atc gag gag atc cac gaa gcg ctg cgc acg 480
Ser Leu Val Leu Arg Arg Ile Glu Glu Ile His Glu Ala Leu Arg Thr
145 150 155 160
ggc ggg tca ccg ggt gag ccc gcc ttc ggc ggc ctc ggg gcg tac ctg 528
Gly Gly Ser Pro Gly Glu Pro Ala Phe Gly Gly Leu Gly Ala Tyr Leu
165 170 175
gac gag gag gcc ggg tac cgg gcg ggc gac cgg atg ccg cgg gac cgc 576
Asp Glu Glu Ala Gly Tyr Arg Ala Gly Asp Arg Met Pro Arg Asp Arg
180 185 190
gcc tac tgg ctg gac gca ctc gcc gaa ctc ccg ccc ccg gta agc ctg 624
Ala Tyr Trp Leu Asp Ala Leu Ala Glu Leu Pro Pro Pro Val Ser Leu
195 200 205
tcc ggc acg cct ccg gag ccg gcg cgc ggc gcg ccg ctg aag gcg cgc 672
Ser Gly Thr Pro Pro Glu Pro Ala Arg Gly Ala Pro Leu Lys Ala Arg
210 215 220
gtc gac gtg ctg ccc gat ccg gcc ggc ctc gcc cgg ctc gcc gag agc 720
Val Asp Val Leu Pro Asp Pro Ala Gly Leu Ala Arg Leu Ala Glu Ser
225 230 235 240
ctc tcg gcc acg acc gcg gac ctg gcg atc gcc gcc acc gcc gtc tac 768
Leu Ser Ala Thr Thr Ala Asp Leu Ala Ile Ala Ala Thr Ala Val Tyr
245 250 255
cag cac cgg gtg acc ggt gcc gcc gac gtc gtc ctc gcc ctg ccg ctg 816
Gln His Arg Val Thr Gly Ala Ala Asp Val Val Leu Ala Leu Pro Leu
260 265 270
gcc ctg cgg ggc ggc gcg gcc gcg cgc ctg ccc tcg acc acc gtc aac 864
Ala Leu Arg Gly Gly Ala Ala Ala Arg Leu Pro Ser Thr Thr Val Asn
275 280 285
gtg ctg ccg ctg cgg gta cgg gtc gcg gac ggc gac acg gtc ggc acg 912
Val Leu Pro Leu Arg Val Arg Val Ala Asp Gly Asp Thr Val Gly Thr
290 295 300
ctg gtc gcc cgg ctg cgg aag gcg atg cgg gag ctg cgc cgc cac ggg 960
Leu Val Ala Arg Leu Arg Lys Ala Met Arg Glu Leu Arg Arg His Gly
305 310 315 320
cgg tac cgc gtc gag gac atc cgc cgg gac ctc ggg cgc gtc acc gac 1008
Arg Tyr Arg Val Glu Asp Ile Arg Arg Asp Leu Gly Arg Val Thr Asp
325 330 335
gag tcc gag ttc acc acc gcc cag gtc aac atc aag agt tac gac acc 1056
Glu Ser Glu Phe Thr Thr Ala Gln Val Asn Ile Lys Ser Tyr Asp Thr
340 345 350
acg atc ggg ctc ctg ggc cgg cgc ctc ccg gtc gtg gac ctc tcc ccc 1104
Thr Ile Gly Leu Leu Gly Arg Arg Leu Pro Val Val Asp Leu Ser Pro
355 360 365
ggg ccc gtc gac gac atc gcg ttc gtc gtg gac ctc gcc gag gac ggc 1152
Gly Pro Val Asp Asp Ile Ala Phe Val Val Asp Leu Ala Glu Asp Gly
370 375 380
gag ctg acc acc ctg gag gtc gag gcc aac gcc ctc cgg tac gac gcg 1200
Glu Leu Thr Thr Leu Glu Val Glu Ala Asn Ala Leu Arg Tyr Asp Ala
385 390 395 400
ccg acg gcg ctg gcg cac ggc cgc ggg ctc ggg cgc ctg ctg ggc gcg 1248
Pro Thr Ala Leu Ala His Gly Arg Gly Leu Gly Arg Leu Leu Gly Ala
405 410 415
ctc gcc gag gcc ggc ccc gac acg gcc gtc gac gac ctg gga gcg gtg 1296
Leu Ala Glu Ala Gly Pro Asp Thr Ala Val Asp Asp Leu Gly Ala Val
420 425 430
ggg ccg atc tac gac acc ggc cac tac ctg gac ctc cgg ggg ccg gtc 1344
Gly Pro Ile Tyr Asp Thr Gly His Tyr Leu Asp Leu Arg Gly Pro Val
435 440 445
gac cgc gag ggc ctc cgc gcg gcg ggc gtc cgc gcg gtg cgc gat gcg 1392
Asp Arg Glu Gly Leu Arg Ala Ala Gly Val Arg Ala Val Arg Asp Ala
450 455 460
gcg tac ggg ctg gtg gac ggg ccg gtg gac ggg ccg atg ggg gaa gcg 1440
Ala Tyr Gly Leu Val Asp Gly Pro Val Asp Gly Pro Met Gly Glu Ala
465 470 475 480
gcg tcc gga ccg gcg ggc ggg tcg gcg gac acg tcg gcg gac ggc gag 1488
Ala Ser Gly Pro Ala Gly Gly Ser Ala Asp Thr Ser Ala Asp Gly Glu
485 490 495
ggc gcg cca tgc ggg ccg gcc gaa ttc gtc gat ctc tcc ggt gag agc 1536
Gly Ala Pro Cys Gly Pro Ala Glu Phe Val Asp Leu Ser Gly Glu Ser
500 505 510
gac ccg gcc ggc gcg gcc ctg gcc tgg atg cgg gcc gag ctg gcg cgc 1584
Asp Pro Ala Gly Ala Ala Leu Ala Trp Met Arg Ala Glu Leu Ala Arg
515 520 525
ccg gcc gcg acg gcc tgc ggc cac gcg gtg ctc gcg ctc gga ccg gag 1632
Pro Ala Ala Thr Ala Cys Gly His Ala Val Leu Ala Leu Gly Pro Glu
530 535 540
cac cac ctg tgg ttc cgg cgt acg ggc ggt ccc gag tcc gac gag cgc 1680
His His Leu Trp Phe Arg Arg Thr Gly Gly Pro Glu Ser Asp Glu Arg
545 550 555 560
gcc gcg ccg gcc ctg gcc cgg cgc gtc gcc gcg ctc gcc ggg gcg ccg 1728
Ala Ala Pro Ala Leu Ala Arg Arg Val Ala Ala Leu Ala Gly Ala Pro
565 570 575
gac ggc ctc gcg gac gtc gcg gac gtc gcg gac gtc gcg gcc gat tcc 1776
Asp Gly Leu Ala Asp Val Ala Asp Val Ala Asp Val Ala Ala Asp Ser
580 585 590
cgg ccc gcc ggc tcc ggc tcc cgg cac cgc gag atc gcg gtc ccg gcc 1824
Arg Pro Ala Gly Ser Gly Ser Arg His Arg Glu Ile Ala Val Pro Ala
595 600 605
gcg ctc ggc cgc cgg atg atg gaa gga tcc cgc gaa ctc ggg gta ggg 1872
Ala Leu Gly Arg Arg Met Met Glu Gly Ser Arg Glu Leu Gly Val Gly
610 615 620
ata cgg gat ttc gtg gca gcc gcc gtc gcg atg ttc acc gct cgc cgc 1920
Ile Arg Asp Phe Val Ala Ala Ala Val Ala Met Phe Thr Ala Arg Arg
625 630 635 640
cgt ggg agc ggc gcg gtc gag ctg tac gtc ccg gcc gcc gat ggc acc 1968
Arg Gly Ser Gly Ala Val Glu Leu Tyr Val Pro Ala Ala Asp Gly Thr
645 650 655
ccc gtc ccg ctg ccg ctg gac ctc acg ggc acc acg acg ctc gcg gag 2016
Pro Val Pro Leu Pro Leu Asp Leu Thr Gly Thr Thr Thr Leu Ala Glu
660 665 670
acc gtc gcc gcg gtc cag gac ggg cgc ggc cac cgc gcg acg gcg gac 2064
Thr Val Ala Ala Val Gln Asp Gly Arg Gly His Arg Ala Thr Ala Asp
675 680 685
ggg cgc gta tcc ggc ccg tcc gtg acc gtc gca cgg tgg gcc ggg aca 2112
Gly Arg Val Ser Gly Pro Ser Val Thr Val Ala Arg Trp Ala Gly Thr
690 695 700
ccg gac cgc gac gcg gcg ctg cac ctc gtc tcc gcg gct ccc gcg acc 2160
Pro Asp Arg Asp Ala Ala Leu His Leu Val Ser Ala Ala Pro Ala Thr
705 710 715 720
ggc ccc gcc gtg acg gcg gtc ctc ggc gag gac cgc gtc cgc gca ctc 2208
Gly Pro Ala Val Thr Ala Val Leu Gly Glu Asp Arg Val Arg Ala Leu
725 730 735
cag gtg gac gac gcc ccc gac gac ccc gcc tgg tcc gac agc gaa ctg 2256
Gln Val Asp Asp Ala Pro Asp Asp Pro Ala Trp Ser Asp Ser Glu Leu
740 745 750
cgc cgt ttc ata cgc ctg ttg gac gcg gtg acc gcc gac ccc gag acc 2304
Arg Arg Phe Ile Arg Leu Leu Asp Ala Val Thr Ala Asp Pro Glu Thr
755 760 765
acg ctc gcc gga gtc gac ctg ctc gac gag gcc gag cac cgc aca ctg 2352
Thr Leu Ala Gly Val Asp Leu Leu Asp Glu Ala Glu His Arg Thr Leu
770 775 780
gcc gcc gac gcc gac acc gcc cac ccg gta ccc gtc acc acc ctg gac 2400
Ala Ala Asp Ala Asp Thr Ala His Pro Val Pro Val Thr Thr Leu Asp
785 790 795 800
cgg ctc gtc gcc gag cag atc gcg cgg acg ccg gac gcc gta gcg ctg 2448
Arg Leu Val Ala Glu Gln Ile Ala Arg Thr Pro Asp Ala Val Ala Leu
805 810 815
gtg ccc gcc gac ggc tcg ccg gag ctc acc tac cgt gaa ctc ggc gag 2496
Val Pro Ala Asp Gly Ser Pro Glu Leu Thr Tyr Arg Glu Leu Gly Glu
820 825 830
cgg gtg gac cgg ctg gcc cgt ggc ctc gcc ggg ctc ggc gcg ggt ccg 2544
Arg Val Asp Arg Leu Ala Arg Gly Leu Ala Gly Leu Gly Ala Gly Pro
835 840 845
ggg acg atc gtc gcg gtc gcc cag ccg cgt tcg acg gcc ctg gtc gtg 2592
Gly Thr Ile Val Ala Val Ala Gln Pro Arg Ser Thr Ala Leu Val Val
850 855 860
agc ctg ctg gcg gtg ctg cgg acc ggc gcg gcc tac gcg ccg ctg gac 2640
Ser Leu Leu Ala Val Leu Arg Thr Gly Ala Ala Tyr Ala Pro Leu Asp
865 870 875 880
ctc gac cac ccg ccg gcc cgg ctc gcc gcc gtc ctg gag gac gtc cgg 2688
Leu Asp His Pro Pro Ala Arg Leu Ala Ala Val Leu Glu Asp Val Arg
885 890 895
ccc gtc gcg gtc ctc acc gcc gga ccc gcg ccc gtc gcg ctg ccg gcg 2736
Pro Val Ala Val Leu Thr Ala Gly Pro Ala Pro Val Ala Leu Pro Ala
900 905 910
gag ctg aac gtc gtc gac gtc ctc gcc ctg cgg gcc gac ggc acg ggc 2784
Glu Leu Asn Val Val Asp Val Leu Ala Leu Arg Ala Asp Gly Thr Gly
915 920 925
gcg gcc ccg gcc ggt ccc ggc ccc gac gac ctg gcc tac gtc atc cac 2832
Ala Ala Pro Ala Gly Pro Gly Pro Asp Asp Leu Ala Tyr Val Ile His
930 935 940
acc tcg ggc tcg acc ggc cgc ccc aag ggc gtc gcc gtc gcc cac cgg 2880
Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Ala Val Ala His Arg
945 950 955 960
gcc gtc gtc aac cgg ctg ttg tgg acc cag gac cgg ttc ggc ctg ggc 2928
Ala Val Val Asn Arg Leu Leu Trp Thr Gln Asp Arg Phe Gly Leu Gly
965 970 975
ccg ggc gac cgg gtg ctg cag aag acc agc tgc gcg ttc gac gtc tcc 2976
Pro Gly Asp Arg Val Leu Gln Lys Thr Ser Cys Ala Phe Asp Val Ser
980 985 990
gtc tgg gag ttc ttc tgg ccc ttg atc agc ggg gcg acg ctg gtc ctg 3024
Val Trp Glu Phe Phe Trp Pro Leu Ile Ser Gly Ala Thr Leu Val Leu
995 1000 1005
ccg gcc ccc ggc gcg cag cgc gac ccg gcg cgg gtc gcc gcg gcg 3069
Pro Ala Pro Gly Ala Gln Arg Asp Pro Ala Arg Val Ala Ala Ala
1010 1015 1020
atc gac gag gcg ggc atc acg acc gcc cac ttc gtc ccg tcg atg 3114
Ile Asp Glu Ala Gly Ile Thr Thr Ala His Phe Val Pro Ser Met
1025 1030 1035
ctc gtc gcc tat ctc ggc gag ccg gcc gcc gcc cgg cct cgc gcg 3159
Leu Val Ala Tyr Leu Gly Glu Pro Ala Ala Ala Arg Pro Arg Ala
1040 1045 1050
ctg cgg cgg atc ctg tgc agc ggc gag gcc ctg ccg acc gag gcg 3204
Leu Arg Arg Ile Leu Cys Ser Gly Glu Ala Leu Pro Thr Glu Ala
1055 1060 1065
gcg cgg cgg gcc gag gag gtc acc ggc gcg gag gtc ttc aac ctc 3249
Ala Arg Arg Ala Glu Glu Val Thr Gly Ala Glu Val Phe Asn Leu
1070 1075 1080
tac ggc ccg acc gag gcc gcg atc gac gtg agc tgg tgg ccg ctg 3294
Tyr Gly Pro Thr Glu Ala Ala Ile Asp Val Ser Trp Trp Pro Leu
1085 1090 1095
cgc gac ggc gcg ccg ggc gcc acg gtg ccg atc ggc cgc gcc gtc 3339
Arg Asp Gly Ala Pro Gly Ala Thr Val Pro Ile Gly Arg Ala Val
1100 1105 1110
tgg aac acc cgg ctg gac gtg ctc gac ccc tgg ggg gca ccg gta 3384
Trp Asn Thr Arg Leu Asp Val Leu Asp Pro Trp Gly Ala Pro Val
1115 1120 1125
ccg ccc ggc gag ccc ggc gag ctg tac atc gcg ggc gac cag ctc 3429
Pro Pro Gly Glu Pro Gly Glu Leu Tyr Ile Ala Gly Asp Gln Leu
1130 1135 1140
gcc gtc ggc tac ctc ggg cgg ccg gac ctc acc gcc gag cgc ttc 3474
Ala Val Gly Tyr Leu Gly Arg Pro Asp Leu Thr Ala Glu Arg Phe
1145 1150 1155
ccg gag gac ccg gcg gcg ggc cgg cgc tac cgc acc ggc gac ctg 3519
Pro Glu Asp Pro Ala Ala Gly Arg Arg Tyr Arg Thr Gly Asp Leu
1160 1165 1170
gta cgg cgg ctg ccc tcc ggc gcg ctg gag ttc ctc gga cgc ctg 3564
Val Arg Arg Leu Pro Ser Gly Ala Leu Glu Phe Leu Gly Arg Leu
1175 1180 1185
gac cac cag gtc aag atc cgg ggc ttc cgg gtc gag ctg ggc gag 3609
Asp His Gln Val Lys Ile Arg Gly Phe Arg Val Glu Leu Gly Glu
1190 1195 1200
atc gag gcc gtg ctg acc gag cac ccg gag gtc gcc gcg gcg gtg 3654
Ile Glu Ala Val Leu Thr Glu His Pro Glu Val Ala Ala Ala Val
1205 1210 1215
gtc ggc acc cgt gac gac cgc gcg ggc ggg ccc cgg ctc gtc gcc 3699
Val Gly Thr Arg Asp Asp Arg Ala Gly Gly Pro Arg Leu Val Ala
1220 1225 1230
tgg gtc gtc ccc gcc ccg gcg gag aag gac ggg gaa gac ggc ttc 3744
Trp Val Val Pro Ala Pro Ala Glu Lys Asp Gly Glu Asp Gly Phe
1235 1240 1245
gag gcc cgc gcc cgg cgc tgg cac gac cac ctc gcc gcc cgg ctg 3789
Glu Ala Arg Ala Arg Arg Trp His Asp His Leu Ala Ala Arg Leu
1250 1255 1260
ccc gag cac atg gtc ccc acg gcc gtc gtc ccc ctc gcc gag ctc 3834
Pro Glu His Met Val Pro Thr Ala Val Val Pro Leu Ala Glu Leu
1265 1270 1275
ccc acc acc gcc aac ggc aag ctc gac cgg gac gcg ctc ccg gag 3879
Pro Thr Thr Ala Asn Gly Lys Leu Asp Arg Asp Ala Leu Pro Glu
1280 1285 1290
ccg ccg gag ccc acg gcc gcc gcg cgg gag ccc gac ggc ccc gag 3924
Pro Pro Glu Pro Thr Ala Ala Ala Arg Glu Pro Asp Gly Pro Glu
1295 1300 1305
gag cgg gcg ctc acc gag atc ctc gcc gag gtg ctg ggg atc gaa 3969
Glu Arg Ala Leu Thr Glu Ile Leu Ala Glu Val Leu Gly Ile Glu
1310 1315 1320
cgg atc ggg ccg gac gac gac ttc ttc acc gcc ggc ggc cat tcg 4014
Arg Ile Gly Pro Asp Asp Asp Phe Phe Thr Ala Gly Gly His Ser
1325 1330 1335
ctg acc gcc gca cgc gcc gcc acg atg atc cgc gcc cgg ttc ggt 4059
Leu Thr Ala Ala Arg Ala Ala Thr Met Ile Arg Ala Arg Phe Gly
1340 1345 1350
gtc gag atc ggc gtg gcc gac gtg ttc gcc gcc cgc tgc gcg gcg 4104
Val Glu Ile Gly Val Ala Asp Val Phe Ala Ala Arg Cys Ala Ala
1355 1360 1365
ggc ctc gcc gcc cgg ctg acc acc gca ccg ccc gcg cgc acc ccc 4149
Gly Leu Ala Ala Arg Leu Thr Thr Ala Pro Pro Ala Arg Thr Pro
1370 1375 1380
ttg cgc ccg gcc ggc cgg ccc gag cgc ctg ctg ctg tcc ccg gcc 4194
Leu Arg Pro Ala Gly Arg Pro Glu Arg Leu Leu Leu Ser Pro Ala
1385 1390 1395
cag cgg ggc ctg tgg ttc ctg gac cgg ctc gac gac ggg ccg acg 4239
Gln Arg Gly Leu Trp Phe Leu Asp Arg Leu Asp Asp Gly Pro Thr
1400 1405 1410
tac aac atc ccg ctg gtg ctc ccc ctg ccg aac cgc gtg gac gcc 4284
Tyr Asn Ile Pro Leu Val Leu Pro Leu Pro Asn Arg Val Asp Ala
1415 1420 1425
gac gcg ctc gcc gcc gcg ctg ggc gac gtc gcc gcc cgc cac gag 4329
Asp Ala Leu Ala Ala Ala Leu Gly Asp Val Ala Ala Arg His Glu
1430 1435 1440
agc ctg cgc acg gtc ttc ccg gcc gag gcc ggc gtg ccg tac cag 4374
Ser Leu Arg Thr Val Phe Pro Ala Glu Ala Gly Val Pro Tyr Gln
1445 1450 1455
gag gtc cgg gaa ccg gcg gcc gtg ccg ctg cac gtc gtc gac tgc 4419
Glu Val Arg Glu Pro Ala Ala Val Pro Leu His Val Val Asp Cys
1460 1465 1470
ccc gcc gag gag atc ggg gcg cac gtc gag gcc gcc gcc cga cgc 4464
Pro Ala Glu Glu Ile Gly Ala His Val Glu Ala Ala Ala Arg Arg
1475 1480 1485
cgg ctg gac atc acc cgg gag ccg ggc ctg cgg gcc ggc ctg tac 4509
Arg Leu Asp Ile Thr Arg Glu Pro Gly Leu Arg Ala Gly Leu Tyr
1490 1495 1500
gga ccg gcg gac ggc gag cgc acg ctc gtc ctg cta ctg cac cac 4554
Gly Pro Ala Asp Gly Glu Arg Thr Leu Val Leu Leu Leu His His
1505 1510 1515
ctg gtc gcc gac ggc tgg tcg ctg cgg ccg ctg gcc gag gac ctc 4599
Leu Val Ala Asp Gly Trp Ser Leu Arg Pro Leu Ala Glu Asp Leu
1520 1525 1530
acc gcg gcg tac gcg gcg cgc gcc gcc ggc cgg gct ccc gaa ctc 4644
Thr Ala Ala Tyr Ala Ala Arg Ala Ala Gly Arg Ala Pro Glu Leu
1535 1540 1545
gcg ccg ctc ccg gtg cag ttc gcc gac tac gtg ctc tgg cag cgc 4689
Ala Pro Leu Pro Val Gln Phe Ala Asp Tyr Val Leu Trp Gln Arg
1550 1555 1560
gac cgg ctc gac ccg gcc ggc gcc gcc gcc cgg cgc gac gag gag 4734
Asp Arg Leu Asp Pro Ala Gly Ala Ala Ala Arg Arg Asp Glu Glu
1565 1570 1575
ttc tgg agc gcc gcg ctg cgg ggg ctg ccg gag gag acc gcg ctg 4779
Phe Trp Ser Ala Ala Leu Arg Gly Leu Pro Glu Glu Thr Ala Leu
1580 1585 1590
ccg ttc gac cgg ccg cgg ccc gcc cgg ccg acc ggc cgg ggc ggc 4824
Pro Phe Asp Arg Pro Arg Pro Ala Arg Pro Thr Gly Arg Gly Gly
1595 1600 1605
gcc gtc gac ctg gcc gtc ggt ccg gtg gcc cac gcg gcc ctg cgg 4869
Ala Val Asp Leu Ala Val Gly Pro Val Ala His Ala Ala Leu Arg
1610 1615 1620
gag ctg gcg cgg gcg cac ggc gtc agc ctg ttc acg gtg ctg cac 4914
Glu Leu Ala Arg Ala His Gly Val Ser Leu Phe Thr Val Leu His
1625 1630 1635
gcg ggc gtc gcc gcc ctg ctc acc ggc ctc ggc gcc ggt acg gat 4959
Ala Gly Val Ala Ala Leu Leu Thr Gly Leu Gly Ala Gly Thr Asp
1640 1645 1650
ctg gcg atc ggc acc ccg gtc gcc ggg cgg cac gac cag gcg ctc 5004
Leu Ala Ile Gly Thr Pro Val Ala Gly Arg His Asp Gln Ala Leu
1655 1660 1665
gac gac gtg gtg ggg ctg gtg acc aac acc gtc gtg ctg cgc acc 5049
Asp Asp Val Val Gly Leu Val Thr Asn Thr Val Val Leu Arg Thr
1670 1675 1680
gac acc tcc ggc tcg ccg gcc gtc gcc gag ttg ctg gct cgc gtc 5094
Asp Thr Ser Gly Ser Pro Ala Val Ala Glu Leu Leu Ala Arg Val
1685 1690 1695
cag gag gcc gac cgg gcc gcc tgg gcg cac gag gac ctg ccg ttc 5139
Gln Glu Ala Asp Arg Ala Ala Trp Ala His Glu Asp Leu Pro Phe
1700 1705 1710
gag cag gtg gtg gag ctg gtc aac ccg ccg cgc gtg ccg ggg cgt 5184
Glu Gln Val Val Glu Leu Val Asn Pro Pro Arg Val Pro Gly Arg
1715 1720 1725
cat ccg ctg ttc acg gtg atg ctg gcg ctg cag aac aac gcc gcc 5229
His Pro Leu Phe Thr Val Met Leu Ala Leu Gln Asn Asn Ala Ala
1730 1735 1740
gcg gcg gtg tcg ctg ggc ggc ccg ccg gtg ccg ctg cgg ccc agc 5274
Ala Ala Val Ser Leu Gly Gly Pro Pro Val Pro Leu Arg Pro Ser
1745 1750 1755
gcg acg ggt acc gcg aag ttc gac ctg ttc ttc gac atc acc gag 5319
Ala Thr Gly Thr Ala Lys Phe Asp Leu Phe Phe Asp Ile Thr Glu
1760 1765 1770
cac gtc ggg gac gac ggc tcg gcg ccc ggc ggt ctg acc tgt cac 5364
His Val Gly Asp Asp Gly Ser Ala Pro Gly Gly Leu Thr Cys His
1775 1780 1785
gtc gag ttc gcc cgc gac ctg ttc gac ccg agc acc gcg cgc ctg 5409
Val Glu Phe Ala Arg Asp Leu Phe Asp Pro Ser Thr Ala Arg Leu
1790 1795 1800
ctc gcc gag ggc ctg gtc acc gtc ctc gcc cgg gcc gcg gcc gcc 5454
Leu Ala Glu Gly Leu Val Thr Val Leu Ala Arg Ala Ala Ala Ala
1805 1810 1815
ccg ggg gcg cgc ctc ggc gac ctc gtc ccg gac ggc ctg ctc gcc 5499
Pro Gly Ala Arg Leu Gly Asp Leu Val Pro Asp Gly Leu Leu Ala
1820 1825 1830
ggg cgg gac gcc gca ccc gag gcg gtg tcc gac gac gcg gcg ctg 5544
Gly Arg Asp Ala Ala Pro Glu Ala Val Ser Asp Asp Ala Ala Leu
1835 1840 1845
gag agc cgt gtg cgc tcc ctg tcc gcc gtc gcg gac gtc gcg gtc 5589
Glu Ser Arg Val Arg Ser Leu Ser Ala Val Ala Asp Val Ala Val
1850 1855 1860
acc cgg ccc tcc gac ggc ggt ccg gtc gtc tgg gtc gtc ccc gcg 5634
Thr Arg Pro Ser Asp Gly Gly Pro Val Val Trp Val Val Pro Ala
1865 1870 1875
cga ccg ggc gcg gac gac gac gcg cgc cgg ctc ctc gcg gac gaa 5679
Arg Pro Gly Ala Asp Asp Asp Ala Arg Arg Leu Leu Ala Asp Glu
1880 1885 1890
ggc ggc gac ggg gca ccc cgg gtg acg gcc gtg acc gtc ctc ccg 5724
Gly Gly Asp Gly Ala Pro Arg Val Thr Ala Val Thr Val Leu Pro
1895 1900 1905
cgc acc gcc gcc ggc gac ctc gac gtg gcc gcg ctg cac cgg ctg 5769
Arg Thr Ala Ala Gly Asp Leu Asp Val Ala Ala Leu His Arg Leu
1910 1915 1920
ccg gtc gtc gac gac acc gcc gcc gac ggc tgg cgc gcc gct ctc 5814
Pro Val Val Asp Asp Thr Ala Ala Asp Gly Trp Arg Ala Ala Leu
1925 1930 1935
gcg gcc gtg acc ggc gta cgg gcg gcg gcg gtc ggg cgc gag gac 5859
Ala Ala Val Thr Gly Val Arg Ala Ala Ala Val Gly Arg Glu Asp
1940 1945 1950
gtc ccc gag ggg ctg gag gcg ctc cgg ccg gcg acc cgc ccg cgt 5904
Val Pro Glu Gly Leu Glu Ala Leu Arg Pro Ala Thr Arg Pro Arg
1955 1960 1965
acc gtg gcg gcc acc gcc gga ccg gcc gcc gtt cac caa gcg gac 5949
Thr Val Ala Ala Thr Ala Gly Pro Ala Ala Val His Gln Ala Asp
1970 1975 1980
cgc gcg ctg tcg ctc tcc gag ggc ccg ccg ctg ccc ccg gcg gag 5994
Arg Ala Leu Ser Leu Ser Glu Gly Pro Pro Leu Pro Pro Ala Glu
1985 1990 1995
gtc ggc ggc tgg ccc gag gcc ctg cgc cgc gcc gcg gcg ggc ggc 6039
Val Gly Gly Trp Pro Glu Ala Leu Arg Arg Ala Ala Ala Gly Gly
2000 2005 2010
gac cac gcc gag atc gtg cac gtg cgc gcg gac ggc acc gag agc 6084
Asp His Ala Glu Ile Val His Val Arg Ala Asp Gly Thr Glu Ser
2015 2020 2025
cgg cgc tcg tac gcc tcg ctg atc gag gag gcc gag cgg gtc ctg 6129
Arg Arg Ser Tyr Ala Ser Leu Ile Glu Glu Ala Glu Arg Val Leu
2030 2035 2040
ggc ggg ctg cgg gcc ctg ggc ctg cgc gcc ggc gac cag gtg gtc 6174
Gly Gly Leu Arg Ala Leu Gly Leu Arg Ala Gly Asp Gln Val Val
2045 2050 2055
ctg cag tgc gac gac acc gag gac ttc gtg gcc gcg ctc tgg ggc 6219
Leu Gln Cys Asp Asp Thr Glu Asp Phe Val Ala Ala Leu Trp Gly
2060 2065 2070
gcg atc gcc gcc ggg gtc acc gtc gtc ccg ctc acc gtg ccg ccc 6264
Ala Ile Ala Ala Gly Val Thr Val Val Pro Leu Thr Val Pro Pro
2075 2080 2085
acg tac gcc acc gac tcg gcg gcc gtg aac aag ctc gac ggc gtc 6309
Thr Tyr Ala Thr Asp Ser Ala Ala Val Asn Lys Leu Asp Gly Val
2090 2095 2100
tgg cgc atg ctg ggc cgg ccg gtc gtc gtc acc tcc gcg gac cgt 6354
Trp Arg Met Leu Gly Arg Pro Val Val Val Thr Ser Ala Asp Arg
2105 2110 2115
gcc gac ggc ctg gcg gag ctc gcg gcc cgc cgg gag tgg ccg gac 6399
Ala Asp Gly Leu Ala Glu Leu Ala Ala Arg Arg Glu Trp Pro Asp
2120 2125 2130
ccc cgc atc gtg acc gtg gac gcc ctg cgc gcg gcc gcc ccg gac 6444
Pro Arg Ile Val Thr Val Asp Ala Leu Arg Ala Ala Ala Pro Asp
2135 2140 2145
cgc gac tgg cat cag gca cgc ccc gac gac ctg ctg ctc atg ctg 6489
Arg Asp Trp His Gln Ala Arg Pro Asp Asp Leu Leu Leu Met Leu
2150 2155 2160
ctc acc tcc ggc agc acg gga ctt ccg aag gcg gtg cgg ctg acg 6534
Leu Thr Ser Gly Ser Thr Gly Leu Pro Lys Ala Val Arg Leu Thr
2165 2170 2175
cac ggc aac gtg ctg agc cgg gcc gtc gcc gcg gcg gcg gcc aac 6579
His Gly Asn Val Leu Ser Arg Ala Val Ala Ala Ala Ala Ala Asn
2180 2185 2190
tcc ctg acc gag cac gac gtc tcg ctg aac tgg atc ccg ctc gac 6624
Ser Leu Thr Glu His Asp Val Ser Leu Asn Trp Ile Pro Leu Asp
2195 2200 2205
cac gtc acc ggt gtg gtg atg ttc cac ctg cgc gac gtc tac ctc 6669
His Val Thr Gly Val Val Met Phe His Leu Arg Asp Val Tyr Leu
2210 2215 2220
ggc gcc cgg cag gtg cac gcc ccg acg ggc tgg gtg ctg gag gac 6714
Gly Ala Arg Gln Val His Ala Pro Thr Gly Trp Val Leu Glu Asp
2225 2230 2235
ccg ctg cgc tgg tgg gag ctg gcg gac cgg tgg cgc gtc agc gtc 6759
Pro Leu Arg Trp Trp Glu Leu Ala Asp Arg Trp Arg Val Ser Val
2240 2245 2250
acg tgg gcg ccg aac ttc gcc ttc ggc ctc gtc gcc gag cag gcc 6804
Thr Trp Ala Pro Asn Phe Ala Phe Gly Leu Val Ala Glu Gln Ala
2255 2260 2265
ggc cgg ctc gcc ggc cgg gag tgg gac ctc tcc ccc gta cgg ctg 6849
Gly Arg Leu Ala Gly Arg Glu Trp Asp Leu Ser Pro Val Arg Leu
2270 2275 2280
atc atg aac gcg ggc gag gtc gtc gtc ggc gcg acc aac cgc cgg 6894
Ile Met Asn Ala Gly Glu Val Val Val Gly Ala Thr Asn Arg Arg
2285 2290 2295
ttc ctg cag gcc ctg gcg ccg cac ggg ctg ccg tcc gac gtg atg 6939
Phe Leu Gln Ala Leu Ala Pro His Gly Leu Pro Ser Asp Val Met
2300 2305 2310
cac ccc ggc tgg ggc atg tcc gag acg tgc tcc gtg gtc acg gac 6984
His Pro Gly Trp Gly Met Ser Glu Thr Cys Ser Val Val Thr Asp
2315 2320 2325
acg gtc ctc gac ccg cag ccg ccg ccc ggc ggc gac gag acc ttc 7029
Thr Val Leu Asp Pro Gln Pro Pro Pro Gly Gly Asp Glu Thr Phe
2330 2335 2340
gtc agc tgc ggg cgg ccg tac ccc ggg ttc gcg atg cgc gtg gtc 7074
Val Ser Cys Gly Arg Pro Tyr Pro Gly Phe Ala Met Arg Val Val
2345 2350 2355
gac gag gag ctg cgg ctg ctg ccg gag ggc gag gtc ggc cgc ttc 7119
Asp Glu Glu Leu Arg Leu Leu Pro Glu Gly Glu Val Gly Arg Phe
2360 2365 2370
cag gtc cgc ggc gcc tcg gtg acg tcg ggc tac cac gac aac gcg 7164
Gln Val Arg Gly Ala Ser Val Thr Ser Gly Tyr His Asp Asn Ala
2375 2380 2385
gcg gcc aac gcc gag gcg ttc acc gcc gac ggc tgg ttc gac acc 7209
Ala Ala Asn Ala Glu Ala Phe Thr Ala Asp Gly Trp Phe Asp Thr
2390 2395 2400
ggc gac ctg gcg ttc ctg cgc gac ggc gag ctg tac atc acc ggg 7254
Gly Asp Leu Ala Phe Leu Arg Asp Gly Glu Leu Tyr Ile Thr Gly
2405 2410 2415
cgc gcc aag gac gtc atc atc gtc aac ggc gtc aac cac ttc agt 7299
Arg Ala Lys Asp Val Ile Ile Val Asn Gly Val Asn His Phe Ser
2420 2425 2430
cac gag ata gag gcg tgc gtc gag gaa ctg ccg gtg gtg gtg cgc 7344
His Glu Ile Glu Ala Cys Val Glu Glu Leu Pro Val Val Val Arg
2435 2440 2445
tcg ttc acc gcg gcg gtc gcg gtc cgt acg gac gcc tcg gcc gcc 7389
Ser Phe Thr Ala Ala Val Ala Val Arg Thr Asp Ala Ser Ala Ala
2450 2455 2460
acc gac cag ctc gcg ctg ttc gtg cac ctg gcc ccc ggg cac gac 7434
Thr Asp Gln Leu Ala Leu Phe Val His Leu Ala Pro Gly His Asp
2465 2470 2475
tcc ggg gag gcc gcg gcg gcc gcg ctg cgg gcg atc cgg ggc aag 7479
Ser Gly Glu Ala Ala Ala Ala Ala Leu Arg Ala Ile Arg Gly Lys
2480 2485 2490
gtg gcc cgc gag gtc ggc gtg gcg ccc gcg cac gtg ctg ccc gtc 7524
Val Ala Arg Glu Val Gly Val Ala Pro Ala His Val Leu Pro Val
2495 2500 2505
gag acg gcg gtg atc ccg aag acc gag atc ggc aag atc cag cgg 7569
Glu Thr Ala Val Ile Pro Lys Thr Glu Ile Gly Lys Ile Gln Arg
2510 2515 2520
acg cag ctg cgc aag cgg ttc gag gcc ggt gag ttc gac gcg gtg 7614
Thr Gln Leu Arg Lys Arg Phe Glu Ala Gly Glu Phe Asp Ala Val
2525 2530 2535
gcg cgc gcc gcc gag gtg ctg ctc ggg acg gcg gcg acg gtt ccg 7659
Ala Arg Ala Ala Glu Val Leu Leu Gly Thr Ala Ala Thr Val Pro
2540 2545 2550
cac tgg ttc ctg cgt ccc gtc tgg tcg ccg gtg acg cgc ccg gcc 7704
His Trp Phe Leu Arg Pro Val Trp Ser Pro Val Thr Arg Pro Ala
2555 2560 2565
acc gct ccc ccg gcc ggc acg tcc gtg ctg atc gtg gcg gcg ggg 7749
Thr Ala Pro Pro Ala Gly Thr Ser Val Leu Ile Val Ala Ala Gly
2570 2575 2580
ccg cgg ggt gcg ggg gtc gcc gag cgg ctc gcc gcc ctg gtg cgc 7794
Pro Arg Gly Ala Gly Val Ala Glu Arg Leu Ala Ala Leu Val Arg
2585 2590 2595
cgg gag ggc gga cgc gcc acg aca gcg gtg gcc ggt acg ggc ttc 7839
Arg Glu Gly Gly Arg Ala Thr Thr Ala Val Ala Gly Thr Gly Phe
2600 2605 2610
ggg cgg cgg gac gcg gcc cgg tac acg gtc cgc ccc gac gag gcg 7884
Gly Arg Arg Asp Ala Ala Arg Tyr Thr Val Arg Pro Asp Glu Ala
2615 2620 2625
tcc gac ttc gcg gcg ctg ctc gac cgg ctg gcg gcc gac gac cgc 7929
Ser Asp Phe Ala Ala Leu Leu Asp Arg Leu Ala Ala Asp Asp Arg
2630 2635 2640
cgt ccg gag cgc gtc gtg cac ctc ggg ccg ctg gag ccg tcc ggc 7974
Arg Pro Glu Arg Val Val His Leu Gly Pro Leu Glu Pro Ser Gly
2645 2650 2655
cgc gac ctg gac gcc ggc ggg gtg ctc gac gcc cag cgg tcc ggc 8019
Arg Asp Leu Asp Ala Gly Gly Val Leu Asp Ala Gln Arg Ser Gly
2660 2665 2670
gcc gcc tcg gtc ctg gcc ctg gcc cgg gcg ctg gcc gcc ccc gac 8064
Ala Ala Ser Val Leu Ala Leu Ala Arg Ala Leu Ala Ala Pro Asp
2675 2680 2685
cac gcg ggc cac gcc gtc gac ctg cgg tgc gtc acc ggc ggg gac 8109
His Ala Gly His Ala Val Asp Leu Arg Cys Val Thr Gly Gly Asp
2690 2695 2700
ctg ccg cac gcg acc ctc gcc ggg ctc ctg ccc tcg ctg cgg gac 8154
Leu Pro His Ala Thr Leu Ala Gly Leu Leu Pro Ser Leu Arg Asp
2705 2710 2715
gag cgt ccc ggc ctg tcc gcg ggc acg ctg gcc gtg ccg ggc gac 8199
Glu Arg Pro Gly Leu Ser Ala Gly Thr Leu Ala Val Pro Gly Asp
2720 2725 2730
ggg gag ccg gac gac gtg gcg gcg ctg atc gcc gcg gaa ctc gcg 8244
Gly Glu Pro Asp Asp Val Ala Ala Leu Ile Ala Ala Glu Leu Ala
2735 2740 2745
gtc gct ccg gcc gac gcc gag gtg tgc cgg cgg gac ggc ggg cgc 8289
Val Ala Pro Ala Asp Ala Glu Val Cys Arg Arg Asp Gly Gly Arg
2750 2755 2760
ctg gtg cgc cgg ctg gcc cct gta ccg gtg ccc gag tcg gtc acc 8334
Leu Val Arg Arg Leu Ala Pro Val Pro Val Pro Glu Ser Val Thr
2765 2770 2775
gtc ccc gcc tac ggc gac ggc gtc gtc ctg gtg acg ggc ggg ctg 8379
Val Pro Ala Tyr Gly Asp Gly Val Val Leu Val Thr Gly Gly Leu
2780 2785 2790
ggc ggc gtc gcg gcc cac ctc gcc gag cac ctg ctc acc acc gag 8424
Gly Gly Val Ala Ala His Leu Ala Glu His Leu Leu Thr Thr Glu
2795 2800 2805
ccc ggg gta cgg ctg ctc ctg gtc ggc cgc acc ccg ctg ccg gcc 8469
Pro Gly Val Arg Leu Leu Leu Val Gly Arg Thr Pro Leu Pro Ala
2810 2815 2820
ggg gac ccg gcc gcg gat gac gct cgc gcc cgc gcc gcg gcg gtg 8514
Gly Asp Pro Ala Ala Asp Asp Ala Arg Ala Arg Ala Ala Ala Val
2825 2830 2835
ctg cgg cgg ctg cgc gag ctc ggg gag gtc cgc tac gcg gcc gcc 8559
Leu Arg Arg Leu Arg Glu Leu Gly Glu Val Arg Tyr Ala Ala Ala
2840 2845 2850
gac gtc acc gac gag gcg gcg ctg gac gcg gcc gtg gcc gcc gcg 8604
Asp Val Thr Asp Glu Ala Ala Leu Asp Ala Ala Val Ala Ala Ala
2855 2860 2865
acg gac gcc tgg tcg gcc ccg ctg acc ggg atc ctc cac ctc gcc 8649
Thr Asp Ala Trp Ser Ala Pro Leu Thr Gly Ile Leu His Leu Ala
2870 2875 2880
ggg acg atc gaa cgg cgg gcg gcg gcc gac ctc gac ccg gcg gcc 8694
Gly Thr Ile Glu Arg Arg Ala Ala Ala Asp Leu Asp Pro Ala Ala
2885 2890 2895
tgg cgc gcg gcg acc gcg gcc aag atc ggc ggg gcg tgc gtc ctg 8739
Trp Arg Ala Ala Thr Ala Ala Lys Ile Gly Gly Ala Cys Val Leu
2900 2905 2910
gac cgg ctc gcg gcc cgg cac ccg gtc cgg tcg ttc gtc tcc ttc 8784
Asp Arg Leu Ala Ala Arg His Pro Val Arg Ser Phe Val Ser Phe
2915 2920 2925
tcc tcg gtc aac ggc acc ttc ggg gcc gcg ttc ggc gcc cct tac 8829
Ser Ser Val Asn Gly Thr Phe Gly Ala Ala Phe Gly Ala Pro Tyr
2930 2935 2940
gcg gcg gcg tgc gcc ttc ctc gac gcg ctg gcc gtc cgt cag cgg 8874
Ala Ala Ala Cys Ala Phe Leu Asp Ala Leu Ala Val Arg Gln Arg
2945 2950 2955
gcg cgg ggg ctg gac gcc cag tcg ctg gcg tgg agc agc tgg cgg 8919
Ala Arg Gly Leu Asp Ala Gln Ser Leu Ala Trp Ser Ser Trp Arg
2960 2965 2970
gac acg ggg atg agc gag ggc gac gag ctg gcg gcc ctc ggg gag 8964
Asp Thr Gly Met Ser Glu Gly Asp Glu Leu Ala Ala Leu Gly Glu
2975 2980 2985
acg cgc ggc tac cgg gca ctc gac gtg gag tcg gcc ctg cgc tcg 9009
Thr Arg Gly Tyr Arg Ala Leu Asp Val Glu Ser Ala Leu Arg Ser
2990 2995 3000
ttc gac ctc gcc cgc ggc ctc gac gag ccg gtg gta ctc atc ggc 9054
Phe Asp Leu Ala Arg Gly Leu Asp Glu Pro Val Val Leu Ile Gly
3005 3010 3015
gcg gac cgg acg gcg gac ggc gtc cgg cgg ctg gtg gac gcg ccc 9099
Ala Asp Arg Thr Ala Asp Gly Val Arg Arg Leu Val Asp Ala Pro
3020 3025 3030
gcc cgg ccg cgc cat cgg ctc gcc gcc cgg gtg gag ttg gag gag 9144
Ala Arg Pro Arg His Arg Leu Ala Ala Arg Val Glu Leu Glu Glu
3035 3040 3045
ggc gcc gac atc ggc ggg ctg cac gag gcg gcc gtg gcc gcc gcg 9189
Gly Ala Asp Ile Gly Gly Leu His Glu Ala Ala Val Ala Ala Ala
3050 3055 3060
gcg cgc gcc tgc ggc ggc gtc gcc ggg cac ggc gcg gtc gtc cgg 9234
Ala Arg Ala Cys Gly Gly Val Ala Gly His Gly Ala Val Val Arg
3065 3070 3075
gcc gcg tcc tcg gcg gcg tcc gcc gcc gag ggg agc gcg gct tcc 9279
Ala Ala Ser Ser Ala Ala Ser Ala Ala Glu Gly Ser Ala Ala Ser
3080 3085 3090
ggc gcg gcc ggc ggc gac cgc gtc cgc gtg ctg gag gag acc gtc 9324
Gly Ala Ala Gly Gly Asp Arg Val Arg Val Leu Glu Glu Thr Val
3095 3100 3105
ctc gcc gtc tgg cgg cgg gtg ctg ggc cgc gag cgg gtg ggg tcc 9369
Leu Ala Val Trp Arg Arg Val Leu Gly Arg Glu Arg Val Gly Ser
3110 3115 3120
ggg gac aac ttc ttc gac ctg ggc ggg cat tcg ctg ctg ctg gtg 9414
Gly Asp Asn Phe Phe Asp Leu Gly Gly His Ser Leu Leu Leu Val
3125 3130 3135
cgg gcc cag gcc gag ctg aac gag gcc ctg ggc ggc gcg ctg acg 9459
Arg Ala Gln Ala Glu Leu Asn Glu Ala Leu Gly Gly Ala Leu Thr
3140 3145 3150
gtg gtc gac ctg ttc gcc cat ccc aac gcg cgg tcg ctc gcc ggg 9504
Val Val Asp Leu Phe Ala His Pro Asn Ala Arg Ser Leu Ala Gly
3155 3160 3165
cac ttg gcg ggc cgg cgg gac atc acg gcg ccg ggc gac ggc cgg 9549
His Leu Ala Gly Arg Arg Asp Ile Thr Ala Pro Gly Asp Gly Arg
3170 3175 3180
gag gcc ggc ggc gag gag gac ggc ggc tcc gca gcg gcc ggg agc 9594
Glu Ala Gly Gly Glu Glu Asp Gly Gly Ser Ala Ala Ala Gly Ser
3185 3190 3195
gcc ctc ggc gcc acc cgc gag cag gcc cgc cgc cgg ctc gcg gcg 9639
Ala Leu Gly Ala Thr Arg Glu Gln Ala Arg Arg Arg Leu Ala Ala
3200 3205 3210
cgc gcc cag cgg aac ggg aag ggc ccg aag ggc cgg aag ggt cag 9684
Arg Ala Gln Arg Asn Gly Lys Gly Pro Lys Gly Arg Lys Gly Gln
3215 3220 3225
cag gac cag cca ggc cag cag ggc caa gag gag gca tcg cat gct 9729
Gln Asp Gln Pro Gly Gln Gln Gly Gln Glu Glu Ala Ser His Ala
3230 3235 3240
gaa tga 9735
Glu
<210> 27
<211> 3244
<212> PRT
<213> Streptoverticillium
<400> 27
Met Pro Asp Arg Ala Ala Asp Ser Cys Pro Leu Thr Ala Pro Gln Ala
1 5 10 15
Gly Ile Trp Phe Ala Gln Gln Arg Asp Thr Ser Asn Pro Val Phe Thr
20 25 30
Thr Gly Gln Tyr Val Arg Leu Pro Ala Glu Val Asp Pro Glu Arg Phe
35 40 45
Ala Arg Ala Val Glu Arg Ala Leu Gly Glu Val Trp Gly Leu Ala Val
50 55 60
Glu Val Gly Ala Asp Gly Asp Val Pro Val Gln Arg Gly Thr Gly Thr
65 70 75 80
Ala Pro Arg Val Glu Val Val Asp Leu Ser Gly Arg Pro Asp Pro Glu
85 90 95
Ala Val Ala Leu Ala Arg Met Arg Ala Asp Leu Glu Gln Pro Pro Val
100 105 110
Gly Arg Pro Leu Ala Arg Glu Val Leu Phe Arg Trp Gln Gly Gly Ala
115 120 125
Leu Trp Phe His Arg Cys His His Met Leu Leu Asp Gly Tyr Gly Phe
130 135 140
Ser Leu Val Leu Arg Arg Ile Glu Glu Ile His Glu Ala Leu Arg Thr
145 150 155 160
Gly Gly Ser Pro Gly Glu Pro Ala Phe Gly Gly Leu Gly Ala Tyr Leu
165 170 175
Asp Glu Glu Ala Gly Tyr Arg Ala Gly Asp Arg Met Pro Arg Asp Arg
180 185 190
Ala Tyr Trp Leu Asp Ala Leu Ala Glu Leu Pro Pro Pro Val Ser Leu
195 200 205
Ser Gly Thr Pro Pro Glu Pro Ala Arg Gly Ala Pro Leu Lys Ala Arg
210 215 220
Val Asp Val Leu Pro Asp Pro Ala Gly Leu Ala Arg Leu Ala Glu Ser
225 230 235 240
Leu Ser Ala Thr Thr Ala Asp Leu Ala Ile Ala Ala Thr Ala Val Tyr
245 250 255
Gln His Arg Val Thr Gly Ala Ala Asp Val Val Leu Ala Leu Pro Leu
260 265 270
Ala Leu Arg Gly Gly Ala Ala Ala Arg Leu Pro Ser Thr Thr Val Asn
275 280 285
Val Leu Pro Leu Arg Val Arg Val Ala Asp Gly Asp Thr Val Gly Thr
290 295 300
Leu Val Ala Arg Leu Arg Lys Ala Met Arg Glu Leu Arg Arg His Gly
305 310 315 320
Arg Tyr Arg Val Glu Asp Ile Arg Arg Asp Leu Gly Arg Val Thr Asp
325 330 335
Glu Ser Glu Phe Thr Thr Ala Gln Val Asn Ile Lys Ser Tyr Asp Thr
340 345 350
Thr Ile Gly Leu Leu Gly Arg Arg Leu Pro Val Val Asp Leu Ser Pro
355 360 365
Gly Pro Val Asp Asp Ile Ala Phe Val Val Asp Leu Ala Glu Asp Gly
370 375 380
Glu Leu Thr Thr Leu Glu Val Glu Ala Asn Ala Leu Arg Tyr Asp Ala
385 390 395 400
Pro Thr Ala Leu Ala His Gly Arg Gly Leu Gly Arg Leu Leu Gly Ala
405 410 415
Leu Ala Glu Ala Gly Pro Asp Thr Ala Val Asp Asp Leu Gly Ala Val
420 425 430
Gly Pro Ile Tyr Asp Thr Gly His Tyr Leu Asp Leu Arg Gly Pro Val
435 440 445
Asp Arg Glu Gly Leu Arg Ala Ala Gly Val Arg Ala Val Arg Asp Ala
450 455 460
Ala Tyr Gly Leu Val Asp Gly Pro Val Asp Gly Pro Met Gly Glu Ala
465 470 475 480
Ala Ser Gly Pro Ala Gly Gly Ser Ala Asp Thr Ser Ala Asp Gly Glu
485 490 495
Gly Ala Pro Cys Gly Pro Ala Glu Phe Val Asp Leu Ser Gly Glu Ser
500 505 510
Asp Pro Ala Gly Ala Ala Leu Ala Trp Met Arg Ala Glu Leu Ala Arg
515 520 525
Pro Ala Ala Thr Ala Cys Gly His Ala Val Leu Ala Leu Gly Pro Glu
530 535 540
His His Leu Trp Phe Arg Arg Thr Gly Gly Pro Glu Ser Asp Glu Arg
545 550 555 560
Ala Ala Pro Ala Leu Ala Arg Arg Val Ala Ala Leu Ala Gly Ala Pro
565 570 575
Asp Gly Leu Ala Asp Val Ala Asp Val Ala Asp Val Ala Ala Asp Ser
580 585 590
Arg Pro Ala Gly Ser Gly Ser Arg His Arg Glu Ile Ala Val Pro Ala
595 600 605
Ala Leu Gly Arg Arg Met Met Glu Gly Ser Arg Glu Leu Gly Val Gly
610 615 620
Ile Arg Asp Phe Val Ala Ala Ala Val Ala Met Phe Thr Ala Arg Arg
625 630 635 640
Arg Gly Ser Gly Ala Val Glu Leu Tyr Val Pro Ala Ala Asp Gly Thr
645 650 655
Pro Val Pro Leu Pro Leu Asp Leu Thr Gly Thr Thr Thr Leu Ala Glu
660 665 670
Thr Val Ala Ala Val Gln Asp Gly Arg Gly His Arg Ala Thr Ala Asp
675 680 685
Gly Arg Val Ser Gly Pro Ser Val Thr Val Ala Arg Trp Ala Gly Thr
690 695 700
Pro Asp Arg Asp Ala Ala Leu His Leu Val Ser Ala Ala Pro Ala Thr
705 710 715 720
Gly Pro Ala Val Thr Ala Val Leu Gly Glu Asp Arg Val Arg Ala Leu
725 730 735
Gln Val Asp Asp Ala Pro Asp Asp Pro Ala Trp Ser Asp Ser Glu Leu
740 745 750
Arg Arg Phe Ile Arg Leu Leu Asp Ala Val Thr Ala Asp Pro Glu Thr
755 760 765
Thr Leu Ala Gly Val Asp Leu Leu Asp Glu Ala Glu His Arg Thr Leu
770 775 780
Ala Ala Asp Ala Asp Thr Ala His Pro Val Pro Val Thr Thr Leu Asp
785 790 795 800
Arg Leu Val Ala Glu Gln Ile Ala Arg Thr Pro Asp Ala Val Ala Leu
805 810 815
Val Pro Ala Asp Gly Ser Pro Glu Leu Thr Tyr Arg Glu Leu Gly Glu
820 825 830
Arg Val Asp Arg Leu Ala Arg Gly Leu Ala Gly Leu Gly Ala Gly Pro
835 840 845
Gly Thr Ile Val Ala Val Ala Gln Pro Arg Ser Thr Ala Leu Val Val
850 855 860
Ser Leu Leu Ala Val Leu Arg Thr Gly Ala Ala Tyr Ala Pro Leu Asp
865 870 875 880
Leu Asp His Pro Pro Ala Arg Leu Ala Ala Val Leu Glu Asp Val Arg
885 890 895
Pro Val Ala Val Leu Thr Ala Gly Pro Ala Pro Val Ala Leu Pro Ala
900 905 910
Glu Leu Asn Val Val Asp Val Leu Ala Leu Arg Ala Asp Gly Thr Gly
915 920 925
Ala Ala Pro Ala Gly Pro Gly Pro Asp Asp Leu Ala Tyr Val Ile His
930 935 940
Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly Val Ala Val Ala His Arg
945 950 955 960
Ala Val Val Asn Arg Leu Leu Trp Thr Gln Asp Arg Phe Gly Leu Gly
965 970 975
Pro Gly Asp Arg Val Leu Gln Lys Thr Ser Cys Ala Phe Asp Val Ser
980 985 990
Val Trp Glu Phe Phe Trp Pro Leu Ile Ser Gly Ala Thr Leu Val Leu
995 1000 1005
Pro Ala Pro Gly Ala Gln Arg Asp Pro Ala Arg Val Ala Ala Ala
1010 1015 1020
Ile Asp Glu Ala Gly Ile Thr Thr Ala His Phe Val Pro Ser Met
1025 1030 1035
Leu Val Ala Tyr Leu Gly Glu Pro Ala Ala Ala Arg Pro Arg Ala
1040 1045 1050
Leu Arg Arg Ile Leu Cys Ser Gly Glu Ala Leu Pro Thr Glu Ala
1055 1060 1065
Ala Arg Arg Ala Glu Glu Val Thr Gly Ala Glu Val Phe Asn Leu
1070 1075 1080
Tyr Gly Pro Thr Glu Ala Ala Ile Asp Val Ser Trp Trp Pro Leu
1085 1090 1095
Arg Asp Gly Ala Pro Gly Ala Thr Val Pro Ile Gly Arg Ala Val
1100 1105 1110
Trp Asn Thr Arg Leu Asp Val Leu Asp Pro Trp Gly Ala Pro Val
1115 1120 1125
Pro Pro Gly Glu Pro Gly Glu Leu Tyr Ile Ala Gly Asp Gln Leu
1130 1135 1140
Ala Val Gly Tyr Leu Gly Arg Pro Asp Leu Thr Ala Glu Arg Phe
1145 1150 1155
Pro Glu Asp Pro Ala Ala Gly Arg Arg Tyr Arg Thr Gly Asp Leu
1160 1165 1170
Val Arg Arg Leu Pro Ser Gly Ala Leu Glu Phe Leu Gly Arg Leu
1175 1180 1185
Asp His Gln Val Lys Ile Arg Gly Phe Arg Val Glu Leu Gly Glu
1190 1195 1200
Ile Glu Ala Val Leu Thr Glu His Pro Glu Val Ala Ala Ala Val
1205 1210 1215
Val Gly Thr Arg Asp Asp Arg Ala Gly Gly Pro Arg Leu Val Ala
1220 1225 1230
Trp Val Val Pro Ala Pro Ala Glu Lys Asp Gly Glu Asp Gly Phe
1235 1240 1245
Glu Ala Arg Ala Arg Arg Trp His Asp His Leu Ala Ala Arg Leu
1250 1255 1260
Pro Glu His Met Val Pro Thr Ala Val Val Pro Leu Ala Glu Leu
1265 1270 1275
Pro Thr Thr Ala Asn Gly Lys Leu Asp Arg Asp Ala Leu Pro Glu
1280 1285 1290
Pro Pro Glu Pro Thr Ala Ala Ala Arg Glu Pro Asp Gly Pro Glu
1295 1300 1305
Glu Arg Ala Leu Thr Glu Ile Leu Ala Glu Val Leu Gly Ile Glu
1310 1315 1320
Arg Ile Gly Pro Asp Asp Asp Phe Phe Thr Ala Gly Gly His Ser
1325 1330 1335
Leu Thr Ala Ala Arg Ala Ala Thr Met Ile Arg Ala Arg Phe Gly
1340 1345 1350
Val Glu Ile Gly Val Ala Asp Val Phe Ala Ala Arg Cys Ala Ala
1355 1360 1365
Gly Leu Ala Ala Arg Leu Thr Thr Ala Pro Pro Ala Arg Thr Pro
1370 1375 1380
Leu Arg Pro Ala Gly Arg Pro Glu Arg Leu Leu Leu Ser Pro Ala
1385 1390 1395
Gln Arg Gly Leu Trp Phe Leu Asp Arg Leu Asp Asp Gly Pro Thr
1400 1405 1410
Tyr Asn Ile Pro Leu Val Leu Pro Leu Pro Asn Arg Val Asp Ala
1415 1420 1425
Asp Ala Leu Ala Ala Ala Leu Gly Asp Val Ala Ala Arg His Glu
1430 1435 1440
Ser Leu Arg Thr Val Phe Pro Ala Glu Ala Gly Val Pro Tyr Gln
1445 1450 1455
Glu Val Arg Glu Pro Ala Ala Val Pro Leu His Val Val Asp Cys
1460 1465 1470
Pro Ala Glu Glu Ile Gly Ala His Val Glu Ala Ala Ala Arg Arg
1475 1480 1485
Arg Leu Asp Ile Thr Arg Glu Pro Gly Leu Arg Ala Gly Leu Tyr
1490 1495 1500
Gly Pro Ala Asp Gly Glu Arg Thr Leu Val Leu Leu Leu His His
1505 1510 1515
Leu Val Ala Asp Gly Trp Ser Leu Arg Pro Leu Ala Glu Asp Leu
1520 1525 1530
Thr Ala Ala Tyr Ala Ala Arg Ala Ala Gly Arg Ala Pro Glu Leu
1535 1540 1545
Ala Pro Leu Pro Val Gln Phe Ala Asp Tyr Val Leu Trp Gln Arg
1550 1555 1560
Asp Arg Leu Asp Pro Ala Gly Ala Ala Ala Arg Arg Asp Glu Glu
1565 1570 1575
Phe Trp Ser Ala Ala Leu Arg Gly Leu Pro Glu Glu Thr Ala Leu
1580 1585 1590
Pro Phe Asp Arg Pro Arg Pro Ala Arg Pro Thr Gly Arg Gly Gly
1595 1600 1605
Ala Val Asp Leu Ala Val Gly Pro Val Ala His Ala Ala Leu Arg
1610 1615 1620
Glu Leu Ala Arg Ala His Gly Val Ser Leu Phe Thr Val Leu His
1625 1630 1635
Ala Gly Val Ala Ala Leu Leu Thr Gly Leu Gly Ala Gly Thr Asp
1640 1645 1650
Leu Ala Ile Gly Thr Pro Val Ala Gly Arg His Asp Gln Ala Leu
1655 1660 1665
Asp Asp Val Val Gly Leu Val Thr Asn Thr Val Val Leu Arg Thr
1670 1675 1680
Asp Thr Ser Gly Ser Pro Ala Val Ala Glu Leu Leu Ala Arg Val
1685 1690 1695
Gln Glu Ala Asp Arg Ala Ala Trp Ala His Glu Asp Leu Pro Phe
1700 1705 1710
Glu Gln Val Val Glu Leu Val Asn Pro Pro Arg Val Pro Gly Arg
1715 1720 1725
His Pro Leu Phe Thr Val Met Leu Ala Leu Gln Asn Asn Ala Ala
1730 1735 1740
Ala Ala Val Ser Leu Gly Gly Pro Pro Val Pro Leu Arg Pro Ser
1745 1750 1755
Ala Thr Gly Thr Ala Lys Phe Asp Leu Phe Phe Asp Ile Thr Glu
1760 1765 1770
His Val Gly Asp Asp Gly Ser Ala Pro Gly Gly Leu Thr Cys His
1775 1780 1785
Val Glu Phe Ala Arg Asp Leu Phe Asp Pro Ser Thr Ala Arg Leu
1790 1795 1800
Leu Ala Glu Gly Leu Val Thr Val Leu Ala Arg Ala Ala Ala Ala
1805 1810 1815
Pro Gly Ala Arg Leu Gly Asp Leu Val Pro Asp Gly Leu Leu Ala
1820 1825 1830
Gly Arg Asp Ala Ala Pro Glu Ala Val Ser Asp Asp Ala Ala Leu
1835 1840 1845
Glu Ser Arg Val Arg Ser Leu Ser Ala Val Ala Asp Val Ala Val
1850 1855 1860
Thr Arg Pro Ser Asp Gly Gly Pro Val Val Trp Val Val Pro Ala
1865 1870 1875
Arg Pro Gly Ala Asp Asp Asp Ala Arg Arg Leu Leu Ala Asp Glu
1880 1885 1890
Gly Gly Asp Gly Ala Pro Arg Val Thr Ala Val Thr Val Leu Pro
1895 1900 1905
Arg Thr Ala Ala Gly Asp Leu Asp Val Ala Ala Leu His Arg Leu
1910 1915 1920
Pro Val Val Asp Asp Thr Ala Ala Asp Gly Trp Arg Ala Ala Leu
1925 1930 1935
Ala Ala Val Thr Gly Val Arg Ala Ala Ala Val Gly Arg Glu Asp
1940 1945 1950
Val Pro Glu Gly Leu Glu Ala Leu Arg Pro Ala Thr Arg Pro Arg
1955 1960 1965
Thr Val Ala Ala Thr Ala Gly Pro Ala Ala Val His Gln Ala Asp
1970 1975 1980
Arg Ala Leu Ser Leu Ser Glu Gly Pro Pro Leu Pro Pro Ala Glu
1985 1990 1995
Val Gly Gly Trp Pro Glu Ala Leu Arg Arg Ala Ala Ala Gly Gly
2000 2005 2010
Asp His Ala Glu Ile Val His Val Arg Ala Asp Gly Thr Glu Ser
2015 2020 2025
Arg Arg Ser Tyr Ala Ser Leu Ile Glu Glu Ala Glu Arg Val Leu
2030 2035 2040
Gly Gly Leu Arg Ala Leu Gly Leu Arg Ala Gly Asp Gln Val Val
2045 2050 2055
Leu Gln Cys Asp Asp Thr Glu Asp Phe Val Ala Ala Leu Trp Gly
2060 2065 2070
Ala Ile Ala Ala Gly Val Thr Val Val Pro Leu Thr Val Pro Pro
2075 2080 2085
Thr Tyr Ala Thr Asp Ser Ala Ala Val Asn Lys Leu Asp Gly Val
2090 2095 2100
Trp Arg Met Leu Gly Arg Pro Val Val Val Thr Ser Ala Asp Arg
2105 2110 2115
Ala Asp Gly Leu Ala Glu Leu Ala Ala Arg Arg Glu Trp Pro Asp
2120 2125 2130
Pro Arg Ile Val Thr Val Asp Ala Leu Arg Ala Ala Ala Pro Asp
2135 2140 2145
Arg Asp Trp His Gln Ala Arg Pro Asp Asp Leu Leu Leu Met Leu
2150 2155 2160
Leu Thr Ser Gly Ser Thr Gly Leu Pro Lys Ala Val Arg Leu Thr
2165 2170 2175
His Gly Asn Val Leu Ser Arg Ala Val Ala Ala Ala Ala Ala Asn
2180 2185 2190
Ser Leu Thr Glu His Asp Val Ser Leu Asn Trp Ile Pro Leu Asp
2195 2200 2205
His Val Thr Gly Val Val Met Phe His Leu Arg Asp Val Tyr Leu
2210 2215 2220
Gly Ala Arg Gln Val His Ala Pro Thr Gly Trp Val Leu Glu Asp
2225 2230 2235
Pro Leu Arg Trp Trp Glu Leu Ala Asp Arg Trp Arg Val Ser Val
2240 2245 2250
Thr Trp Ala Pro Asn Phe Ala Phe Gly Leu Val Ala Glu Gln Ala
2255 2260 2265
Gly Arg Leu Ala Gly Arg Glu Trp Asp Leu Ser Pro Val Arg Leu
2270 2275 2280
Ile Met Asn Ala Gly Glu Val Val Val Gly Ala Thr Asn Arg Arg
2285 2290 2295
Phe Leu Gln Ala Leu Ala Pro His Gly Leu Pro Ser Asp Val Met
2300 2305 2310
His Pro Gly Trp Gly Met Ser Glu Thr Cys Ser Val Val Thr Asp
2315 2320 2325
Thr Val Leu Asp Pro Gln Pro Pro Pro Gly Gly Asp Glu Thr Phe
2330 2335 2340
Val Ser Cys Gly Arg Pro Tyr Pro Gly Phe Ala Met Arg Val Val
2345 2350 2355
Asp Glu Glu Leu Arg Leu Leu Pro Glu Gly Glu Val Gly Arg Phe
2360 2365 2370
Gln Val Arg Gly Ala Ser Val Thr Ser Gly Tyr His Asp Asn Ala
2375 2380 2385
Ala Ala Asn Ala Glu Ala Phe Thr Ala Asp Gly Trp Phe Asp Thr
2390 2395 2400
Gly Asp Leu Ala Phe Leu Arg Asp Gly Glu Leu Tyr Ile Thr Gly
2405 2410 2415
Arg Ala Lys Asp Val Ile Ile Val Asn Gly Val Asn His Phe Ser
2420 2425 2430
His Glu Ile Glu Ala Cys Val Glu Glu Leu Pro Val Val Val Arg
2435 2440 2445
Ser Phe Thr Ala Ala Val Ala Val Arg Thr Asp Ala Ser Ala Ala
2450 2455 2460
Thr Asp Gln Leu Ala Leu Phe Val His Leu Ala Pro Gly His Asp
2465 2470 2475
Ser Gly Glu Ala Ala Ala Ala Ala Leu Arg Ala Ile Arg Gly Lys
2480 2485 2490
Val Ala Arg Glu Val Gly Val Ala Pro Ala His Val Leu Pro Val
2495 2500 2505
Glu Thr Ala Val Ile Pro Lys Thr Glu Ile Gly Lys Ile Gln Arg
2510 2515 2520
Thr Gln Leu Arg Lys Arg Phe Glu Ala Gly Glu Phe Asp Ala Val
2525 2530 2535
Ala Arg Ala Ala Glu Val Leu Leu Gly Thr Ala Ala Thr Val Pro
2540 2545 2550
His Trp Phe Leu Arg Pro Val Trp Ser Pro Val Thr Arg Pro Ala
2555 2560 2565
Thr Ala Pro Pro Ala Gly Thr Ser Val Leu Ile Val Ala Ala Gly
2570 2575 2580
Pro Arg Gly Ala Gly Val Ala Glu Arg Leu Ala Ala Leu Val Arg
2585 2590 2595
Arg Glu Gly Gly Arg Ala Thr Thr Ala Val Ala Gly Thr Gly Phe
2600 2605 2610
Gly Arg Arg Asp Ala Ala Arg Tyr Thr Val Arg Pro Asp Glu Ala
2615 2620 2625
Ser Asp Phe Ala Ala Leu Leu Asp Arg Leu Ala Ala Asp Asp Arg
2630 2635 2640
Arg Pro Glu Arg Val Val His Leu Gly Pro Leu Glu Pro Ser Gly
2645 2650 2655
Arg Asp Leu Asp Ala Gly Gly Val Leu Asp Ala Gln Arg Ser Gly
2660 2665 2670
Ala Ala Ser Val Leu Ala Leu Ala Arg Ala Leu Ala Ala Pro Asp
2675 2680 2685
His Ala Gly His Ala Val Asp Leu Arg Cys Val Thr Gly Gly Asp
2690 2695 2700
Leu Pro His Ala Thr Leu Ala Gly Leu Leu Pro Ser Leu Arg Asp
2705 2710 2715
Glu Arg Pro Gly Leu Ser Ala Gly Thr Leu Ala Val Pro Gly Asp
2720 2725 2730
Gly Glu Pro Asp Asp Val Ala Ala Leu Ile Ala Ala Glu Leu Ala
2735 2740 2745
Val Ala Pro Ala Asp Ala Glu Val Cys Arg Arg Asp Gly Gly Arg
2750 2755 2760
Leu Val Arg Arg Leu Ala Pro Val Pro Val Pro Glu Ser Val Thr
2765 2770 2775
Val Pro Ala Tyr Gly Asp Gly Val Val Leu Val Thr Gly Gly Leu
2780 2785 2790
Gly Gly Val Ala Ala His Leu Ala Glu His Leu Leu Thr Thr Glu
2795 2800 2805
Pro Gly Val Arg Leu Leu Leu Val Gly Arg Thr Pro Leu Pro Ala
2810 2815 2820
Gly Asp Pro Ala Ala Asp Asp Ala Arg Ala Arg Ala Ala Ala Val
2825 2830 2835
Leu Arg Arg Leu Arg Glu Leu Gly Glu Val Arg Tyr Ala Ala Ala
2840 2845 2850
Asp Val Thr Asp Glu Ala Ala Leu Asp Ala Ala Val Ala Ala Ala
2855 2860 2865
Thr Asp Ala Trp Ser Ala Pro Leu Thr Gly Ile Leu His Leu Ala
2870 2875 2880
Gly Thr Ile Glu Arg Arg Ala Ala Ala Asp Leu Asp Pro Ala Ala
2885 2890 2895
Trp Arg Ala Ala Thr Ala Ala Lys Ile Gly Gly Ala Cys Val Leu
2900 2905 2910
Asp Arg Leu Ala Ala Arg His Pro Val Arg Ser Phe Val Ser Phe
2915 2920 2925
Ser Ser Val Asn Gly Thr Phe Gly Ala Ala Phe Gly Ala Pro Tyr
2930 2935 2940
Ala Ala Ala Cys Ala Phe Leu Asp Ala Leu Ala Val Arg Gln Arg
2945 2950 2955
Ala Arg Gly Leu Asp Ala Gln Ser Leu Ala Trp Ser Ser Trp Arg
2960 2965 2970
Asp Thr Gly Met Ser Glu Gly Asp Glu Leu Ala Ala Leu Gly Glu
2975 2980 2985
Thr Arg Gly Tyr Arg Ala Leu Asp Val Glu Ser Ala Leu Arg Ser
2990 2995 3000
Phe Asp Leu Ala Arg Gly Leu Asp Glu Pro Val Val Leu Ile Gly
3005 3010 3015
Ala Asp Arg Thr Ala Asp Gly Val Arg Arg Leu Val Asp Ala Pro
3020 3025 3030
Ala Arg Pro Arg His Arg Leu Ala Ala Arg Val Glu Leu Glu Glu
3035 3040 3045
Gly Ala Asp Ile Gly Gly Leu His Glu Ala Ala Val Ala Ala Ala
3050 3055 3060
Ala Arg Ala Cys Gly Gly Val Ala Gly His Gly Ala Val Val Arg
3065 3070 3075
Ala Ala Ser Ser Ala Ala Ser Ala Ala Glu Gly Ser Ala Ala Ser
3080 3085 3090
Gly Ala Ala Gly Gly Asp Arg Val Arg Val Leu Glu Glu Thr Val
3095 3100 3105
Leu Ala Val Trp Arg Arg Val Leu Gly Arg Glu Arg Val Gly Ser
3110 3115 3120
Gly Asp Asn Phe Phe Asp Leu Gly Gly His Ser Leu Leu Leu Val
3125 3130 3135
Arg Ala Gln Ala Glu Leu Asn Glu Ala Leu Gly Gly Ala Leu Thr
3140 3145 3150
Val Val Asp Leu Phe Ala His Pro Asn Ala Arg Ser Leu Ala Gly
3155 3160 3165
His Leu Ala Gly Arg Arg Asp Ile Thr Ala Pro Gly Asp Gly Arg
3170 3175 3180
Glu Ala Gly Gly Glu Glu Asp Gly Gly Ser Ala Ala Ala Gly Ser
3185 3190 3195
Ala Leu Gly Ala Thr Arg Glu Gln Ala Arg Arg Arg Leu Ala Ala
3200 3205 3210
Arg Ala Gln Arg Asn Gly Lys Gly Pro Lys Gly Arg Lys Gly Gln
3215 3220 3225
Gln Asp Gln Pro Gly Gln Gln Gly Gln Glu Glu Ala Ser His Ala
3230 3235 3240
Glu
<210> 28
<211> 1173
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1173)
<223>
<400> 28
atg tcc gtc gac cgg tcg cac gac ccc gcc cgc ccc gac gtg gtg gtg 48
Met Ser Val Asp Arg Ser His Asp Pro Ala Arg Pro Asp Val Val Val
1 5 10 15
gtc ggc ctg ggg atc tgg ggg gcc atg acg ctg tgg cgg ctc gcc gcc 96
Val Gly Leu Gly Ile Trp Gly Ala Met Thr Leu Trp Arg Leu Ala Ala
20 25 30
cgc ggt gtc cgg gcg gtg ggg gtc gag cgg ttc gac atc gcg cac gcc 144
Arg Gly Val Arg Ala Val Gly Val Glu Arg Phe Asp Ile Ala His Ala
35 40 45
cgc ggg tcc tcg cac ggc ggt cac cgc atg ttc cgc gag acc tgc ctg 192
Arg Gly Ser Ser His Gly Gly His Arg Met Phe Arg Glu Thr Cys Leu
50 55 60
gag aac gag gcc ctc gtg ccg gtg gcc cgg cgt tcg ctg gag ctg tgg 240
Glu Asn Glu Ala Leu Val Pro Val Ala Arg Arg Ser Leu Glu Leu Trp
65 70 75 80
cgc gag ctg gag gcg ggc acg ggc cgc cgg ctc ttc gag aac acc ggg 288
Arg Glu Leu Glu Ala Gly Thr Gly Arg Arg Leu Phe Glu Asn Thr Gly
85 90 95
ggc ctg ctc atc ggc ccg cgc gac ggc cgg ctg gcc ggc ggc acc atc 336
Gly Leu Leu Ile Gly Pro Arg Asp Gly Arg Leu Ala Gly Gly Thr Ile
100 105 110
gcc tcg gcc gag gcg cac ggc gtc gcg gtc gag gtc ctc gaa ccg gcc 384
Ala Ser Ala Glu Ala His Gly Val Ala Val Glu Val Leu Glu Pro Ala
115 120 125
gag gtc tcg gcc cgc ttc ccg ggg cac gcc ggc atc ccc gaa gga cac 432
Glu Val Ser Ala Arg Phe Pro Gly His Ala Gly Ile Pro Glu Gly His
130 135 140
gtg ggc gtg tgg gag ccc tcg gcg ggc gtc ctg cgg gcc gag gac tcg 480
Val Gly Val Trp Glu Pro Ser Ala Gly Val Leu Arg Ala Glu Asp Ser
145 150 155 160
gtc cgc gcc gcg gtc gag ctg gcg gag cgc ggc ggg gcc acc gtg ctc 528
Val Arg Ala Ala Val Glu Leu Ala Glu Arg Gly Gly Ala Thr Val Leu
165 170 175
cgc ggc acc gag gtg ctc ggc gtc gag ccg gag ggc ggc ggc gta cgg 576
Arg Gly Thr Glu Val Leu Gly Val Glu Pro Glu Gly Gly Gly Val Arg
180 185 190
gtc cgc acc gcc ggg cgc gac ctg gtc gcc ggc cgg gtc gtc ctc acg 624
Val Arg Thr Ala Gly Arg Asp Leu Val Ala Gly Arg Val Val Leu Thr
195 200 205
ccc ggg tgc tgg ctg ccg gac ttc gcc ccc ggc ctg ggc gtc cgc tcc 672
Pro Gly Cys Trp Leu Pro Asp Phe Ala Pro Gly Leu Gly Val Arg Ser
210 215 220
gtc cac ctg ccg atg acg tgg ttc ccg ccg agc ggc gac ccg gcg ctg 720
Val His Leu Pro Met Thr Trp Phe Pro Pro Ser Gly Asp Pro Ala Leu
225 230 235 240
ttc cgc cgc gag ctg ttc ccg gtg ttc atg cgg gag atc gac gcg gac 768
Phe Arg Arg Glu Leu Phe Pro Val Phe Met Arg Glu Ile Asp Ala Asp
245 250 255
acc gtc atc tgg ggc cag ggc gac ggc gac ccc ggg cac gtc aag ctc 816
Thr Val Ile Trp Gly Gln Gly Asp Gly Asp Pro Gly His Val Lys Leu
260 265 270
ggc atc gag cag ggg gcg gac ccg gac ccg tac gat ccc gaa ctc ggc 864
Gly Ile Glu Gln Gly Ala Asp Pro Asp Pro Tyr Asp Pro Glu Leu Gly
275 280 285
gct ccc gcc gtc ccg agc agg ccc tgg gag cgg ctc ggc gag gtg ctc 912
Ala Pro Ala Val Pro Ser Arg Pro Trp Glu Arg Leu Gly Glu Val Leu
290 295 300
gcc acc gcc gtc ccc ggg gtg ggg cgc gta ccg tcg cgg atc ctg cac 960
Ala Thr Ala Val Pro Gly Val Gly Arg Val Pro Ser Arg Ile Leu His
305 310 315 320
tgc ggg atc acg acg acc gcc gac ggg cag ttc gtg ctc ggc gcc tcc 1008
Cys Gly Ile Thr Thr Thr Ala Asp Gly Gln Phe Val Leu Gly Ala Ser
325 330 335
ccg gcc gac ccc cgg gtc gtg ctg gcc ggg ggg tgc aac ggc tac gga 1056
Pro Ala Asp Pro Arg Val Val Leu Ala Gly Gly Cys Asn Gly Tyr Gly
340 345 350
ttc aag cac gcc gcc gcc gtc ggg gac ctc ctc gcc gac atc gtg ctg 1104
Phe Lys His Ala Ala Ala Val Gly Asp Leu Leu Ala Asp Ile Val Leu
355 360 365
ggt gcc gcg ggg ccc gct ccc ctg ccg ttc gcc gcg ccc ggc cgg ccg 1152
Gly Ala Ala Gly Pro Ala Pro Leu Pro Phe Ala Ala Pro Gly Arg Pro
370 375 380
gcc gcg gcg gac cac atc tga 1173
Ala Ala Ala Asp His Ile
385 390
<210> 29
<211> 390
<212> PRT
<213> Streptoverticillium
<400> 29
Met Ser Val Asp Arg Ser His Asp Pro Ala Arg Pro Asp Val Val Val
1 5 10 15
Val Gly Leu Gly Ile Trp Gly Ala Met Thr Leu Trp Arg Leu Ala Ala
20 25 30
Arg Gly Val Arg Ala Val Gly Val Glu Arg Phe Asp Ile Ala His Ala
35 40 45
Arg Gly Ser Ser His Gly Gly His Arg Met Phe Arg Glu Thr Cys Leu
50 55 60
Glu Asn Glu Ala Leu Val Pro Val Ala Arg Arg Ser Leu Glu Leu Trp
65 70 75 80
Arg Glu Leu Glu Ala Gly Thr Gly Arg Arg Leu Phe Glu Asn Thr Gly
85 90 95
Gly Leu Leu Ile Gly Pro Arg Asp Gly Arg Leu Ala Gly Gly Thr Ile
100 105 110
Ala Ser Ala Glu Ala His Gly Val Ala Val Glu Val Leu Glu Pro Ala
115 120 125
Glu Val Ser Ala Arg Phe Pro Gly His Ala Gly Ile Pro Glu Gly His
130 135 140
Val Gly Val Trp Glu Pro Ser Ala Gly Val Leu Arg Ala Glu Asp Ser
145 150 155 160
Val Arg Ala Ala Val Glu Leu Ala Glu Arg Gly Gly Ala Thr Val Leu
165 170 175
Arg Gly Thr Glu Val Leu Gly Val Glu Pro Glu Gly Gly Gly Val Arg
180 185 190
Val Arg Thr Ala Gly Arg Asp Leu Val Ala Gly Arg Val Val Leu Thr
195 200 205
Pro Gly Cys Trp Leu Pro Asp Phe Ala Pro Gly Leu Gly Val Arg Ser
210 215 220
Val His Leu Pro Met Thr Trp Phe Pro Pro Ser Gly Asp Pro Ala Leu
225 230 235 240
Phe Arg Arg Glu Leu Phe Pro Val Phe Met Arg Glu Ile Asp Ala Asp
245 250 255
Thr Val Ile Trp Gly Gln Gly Asp Gly Asp Pro Gly His Val Lys Leu
260 265 270
Gly Ile Glu Gln Gly Ala Asp Pro Asp Pro Tyr Asp Pro Glu Leu Gly
275 280 285
Ala Pro Ala Val Pro Ser Arg Pro Trp Glu Arg Leu Gly Glu Val Leu
290 295 300
Ala Thr Ala Val Pro Gly Val Gly Arg Val Pro Ser Arg Ile Leu His
305 310 315 320
Cys Gly Ile Thr Thr Thr Ala Asp Gly Gln Phe Val Leu Gly Ala Ser
325 330 335
Pro Ala Asp Pro Arg Val Val Leu Ala Gly Gly Cys Asn Gly Tyr Gly
340 345 350
Phe Lys His Ala Ala Ala Val Gly Asp Leu Leu Ala Asp Ile Val Leu
355 360 365
Gly Ala Ala Gly Pro Ala Pro Leu Pro Phe Ala Ala Pro Gly Arg Pro
370 375 380
Ala Ala Ala Asp His Ile
385 390
<210> 30
<211> 1062
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1062)
<223>
<400> 30
atg gat ttc ggt ctg acc ttc ttc ccc gcg ctc gac gag cgg gac aag 48
Met Asp Phe Gly Leu Thr Phe Phe Pro Ala Leu Asp Glu Arg Asp Lys
1 5 10 15
gcg ccg cac gac tac ttc gac gac tgc ctg gcc ctc gcc gtc gac gcc 96
Ala Pro His Asp Tyr Phe Asp Asp Cys Leu Ala Leu Ala Val Asp Ala
20 25 30
gac cgg ctg ggc tac gag cac gtc cag gtg gtc gag cac cac ctc ggg 144
Asp Arg Leu Gly Tyr Glu His Val Gln Val Val Glu His His Leu Gly
35 40 45
ccc tac ggg ggg tac agc ccc gac ccg gtg gtc ctg ctc tcg gcc atc 192
Pro Tyr Gly Gly Tyr Ser Pro Asp Pro Val Val Leu Leu Ser Ala Ile
50 55 60
gcc gcg cgt acc gag cgg ctg cgc atc acc acc ggc gcg gtc atc ccc 240
Ala Ala Arg Thr Glu Arg Leu Arg Ile Thr Thr Gly Ala Val Ile Pro
65 70 75 80
gcc ttc gac cac ccg ctc aag ctg gcc ggg cgg ctg gcg atg ctg gac 288
Ala Phe Asp His Pro Leu Lys Leu Ala Gly Arg Leu Ala Met Leu Asp
85 90 95
cag ctg agc ggc ggc cgg gtc gac gtc ggc gtc gga cgg gcc ttc ctg 336
Gln Leu Ser Gly Gly Arg Val Asp Val Gly Val Gly Arg Ala Phe Leu
100 105 110
ccg cac gag ttc acg gcg ttc gag gtg tcg atg gag gag agc cgg gcg 384
Pro His Glu Phe Thr Ala Phe Glu Val Ser Met Glu Glu Ser Arg Ala
115 120 125
cgc ttc acc gag gcg ctg cgg gcc ttc gtc gcg ctc tgg acc ggg acg 432
Arg Phe Thr Glu Ala Leu Arg Ala Phe Val Ala Leu Trp Thr Gly Thr
130 135 140
gac gtg gtc ttc gag ggc gag ttc cac cgc ttc ggg tcg gtg acg ctc 480
Asp Val Val Phe Glu Gly Glu Phe His Arg Phe Gly Ser Val Thr Leu
145 150 155 160
acc ccg cgc ccg cac cag acg ccg cat cct ccg ctg ttc gtc gcc tcg 528
Thr Pro Arg Pro His Gln Thr Pro His Pro Pro Leu Phe Val Ala Ser
165 170 175
gcg tcc agc gcc gag tcc tgc gcc gcc gcc ggc cgc gag ggg cac aac 576
Ala Ser Ser Ala Glu Ser Cys Ala Ala Ala Gly Arg Glu Gly His Asn
180 185 190
ctg cag atc gtg ccg acc atc acc agc ggt gag cag ttc gcg gag atg 624
Leu Gln Ile Val Pro Thr Ile Thr Ser Gly Glu Gln Phe Ala Glu Met
195 200 205
ctc gcg gcc tac cgc gag gcc ttc gcc gcc cac cac ccg gac cgc gcg 672
Leu Ala Ala Tyr Arg Glu Ala Phe Ala Ala His His Pro Asp Arg Ala
210 215 220
ccg cgc atc cag gtc aag tac agc tgc tac ctg gac cgg gac cgc gac 720
Pro Arg Ile Gln Val Lys Tyr Ser Cys Tyr Leu Asp Arg Asp Arg Asp
225 230 235 240
agc gcc tgg cgg gcg gcc gag gcg gcg gag tcc aac tac ctg gac aag 768
Ser Ala Trp Arg Ala Ala Glu Ala Ala Glu Ser Asn Tyr Leu Asp Lys
245 250 255
atg agc ggc gcc gtc aag agc tgg cag ggc gcc gcg acc gcg cag tac 816
Met Ser Gly Ala Val Lys Ser Trp Gln Gly Ala Ala Thr Ala Gln Tyr
260 265 270
ccg ggg tac gag aag ctc gcc gac aag gtc gcc tcc tcc gac ctg cgc 864
Pro Gly Tyr Glu Lys Leu Ala Asp Lys Val Ala Ser Ser Asp Leu Arg
275 280 285
aag tcg tgg gag cag gac aag gtg ctg atc ggc acc acc ggc gac atc 912
Lys Ser Trp Glu Gln Asp Lys Val Leu Ile Gly Thr Thr Gly Asp Ile
290 295 300
acc gag cag ctg gag cgg gtg cgc gag cgg gtg ggc ggc gac gtg acc 960
Thr Glu Gln Leu Glu Arg Val Arg Glu Arg Val Gly Gly Asp Val Thr
305 310 315 320
gtc agc ctg cac atg aac aac ggc gtg acg cca ctg gag cag gcg cgg 1008
Val Ser Leu His Met Asn Asn Gly Val Thr Pro Leu Glu Gln Ala Arg
325 330 335
tgg gcg gtc gcc gag ttc gcc gcc gag atc gcg ccg cgg ttc gcg gct 1056
Trp Ala Val Ala Glu Phe Ala Ala Glu Ile Ala Pro Arg Phe Ala Ala
340 345 350
gcc tga 1062
Ala
<210> 31
<211> 353
<212> PRT
<213> Streptoverticillium
<400> 31
Met Asp Phe Gly Leu Thr Phe Phe Pro Ala Leu Asp Glu Arg Asp Lys
1 5 10 15
Ala Pro His Asp Tyr Phe Asp Asp Cys Leu Ala Leu Ala Val Asp Ala
20 25 30
Asp Arg Leu Gly Tyr Glu His Val Gln Val Val Glu His His Leu Gly
35 40 45
Pro Tyr Gly Gly Tyr Ser Pro Asp Pro Val Val Leu Leu Ser Ala Ile
50 55 60
Ala Ala Arg Thr Glu Arg Leu Arg Ile Thr Thr Gly Ala Val Ile Pro
65 70 75 80
Ala Phe Asp His Pro Leu Lys Leu Ala Gly Arg Leu Ala Met Leu Asp
85 90 95
Gln Leu Ser Gly Gly Arg Val Asp Val Gly Val Gly Arg Ala Phe Leu
100 105 110
Pro His Glu Phe Thr Ala Phe Glu Val Ser Met Glu Glu Ser Arg Ala
115 120 125
Arg Phe Thr Glu Ala Leu Arg Ala Phe Val Ala Leu Trp Thr Gly Thr
130 135 140
Asp Val Val Phe Glu Gly Glu Phe His Arg Phe Gly Ser Val Thr Leu
145 150 155 160
Thr Pro Arg Pro His Gln Thr Pro His Pro Pro Leu Phe Val Ala Ser
165 170 175
Ala Ser Ser Ala Glu Ser Cys Ala Ala Ala Gly Arg Glu Gly His Asn
180 185 190
Leu Gln Ile Val Pro Thr Ile Thr Ser Gly Glu Gln Phe Ala Glu Met
195 200 205
Leu Ala Ala Tyr Arg Glu Ala Phe Ala Ala His His Pro Asp Arg Ala
210 215 220
Pro Arg Ile Gln Val Lys Tyr Ser Cys Tyr Leu Asp Arg Asp Arg Asp
225 230 235 240
Ser Ala Trp Arg Ala Ala Glu Ala Ala Glu Ser Asn Tyr Leu Asp Lys
245 250 255
Met Ser Gly Ala Val Lys Ser Trp Gln Gly Ala Ala Thr Ala Gln Tyr
260 265 270
Pro Gly Tyr Glu Lys Leu Ala Asp Lys Val Ala Ser Ser Asp Leu Arg
275 280 285
Lys Ser Trp Glu Gln Asp Lys Val Leu Ile Gly Thr Thr Gly Asp Ile
290 295 300
Thr Glu Gln Leu Glu Arg Val Arg Glu Arg Val Gly Gly Asp Val Thr
305 310 315 320
Val Ser Leu His Met Asn Asn Gly Val Thr Pro Leu Glu Gln Ala Arg
325 330 335
Trp Ala Val Ala Glu Phe Ala Ala Glu Ile Ala Pro Arg Phe Ala Ala
340 345 350
Ala
<210> 32
<211> 630
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(630)
<223>
<400> 32
atg agc agc gaa gta ccc gag atc agg gtc agc gac gag cgg gtc aac 48
Met Ser Ser Glu Val Pro Glu Ile Arg Val Ser Asp Glu Arg Val Asn
1 5 10 15
cgc acg ctc acc gcg gtc aac gcc cgg gcg gcc gag cac gac cgg tcg 96
Arg Thr Leu Thr Ala Val Asn Ala Arg Ala Ala Glu His Asp Arg Ser
20 25 30
cta ttc gag cag gtg cgc gac tcg ctg gcg gtc gcg gtg ccg ccg gag 144
Leu Phe Glu Gln Val Arg Asp Ser Leu Ala Val Ala Val Pro Pro Glu
35 40 45
gcg ggc acg ctg atg tac cag ctc gtg cgc gcc acc cgg gcc gcc aag 192
Ala Gly Thr Leu Met Tyr Gln Leu Val Arg Ala Thr Arg Ala Ala Lys
50 55 60
gtg gtg gag ctg ggg atg tcg ctc ggc gtc tcc acg gtc tac ctc gcc 240
Val Val Glu Leu Gly Met Ser Leu Gly Val Ser Thr Val Tyr Leu Ala
65 70 75 80
gcc gcc gtg cgc gac aac ggg ggc gag ggg cgg gtc tac acg acc gag 288
Ala Ala Val Arg Asp Asn Gly Gly Glu Gly Arg Val Tyr Thr Thr Glu
85 90 95
atc gac gag gcg aag atc aag cag ggc cgc gcc acc ctg gcc gac gcc 336
Ile Asp Glu Ala Lys Ile Lys Gln Gly Arg Ala Thr Leu Ala Asp Ala
100 105 110
ggc gtc gcc gac ctc gtc gag gtg ctg gag ggc gac gcg ctc cag acc 384
Gly Val Ala Asp Leu Val Glu Val Leu Glu Gly Asp Ala Leu Gln Thr
115 120 125
ctg gac tcg gtg ccc gac ggc gtc cag ttc gtc ctg ctc gac ggc tgg 432
Leu Asp Ser Val Pro Asp Gly Val Gln Phe Val Leu Leu Asp Gly Trp
130 135 140
aac gag agc tac ctg cgg gtg atg aag atc ctg gag ccc aag ctc gcg 480
Asn Glu Ser Tyr Leu Arg Val Met Lys Ile Leu Glu Pro Lys Leu Ala
145 150 155 160
ccg ggc gcc ctc gtg ctc gcc gac gac gtc aac ctc ttc ggc gag ggc 528
Pro Gly Ala Leu Val Leu Ala Asp Asp Val Asn Leu Phe Gly Glu Gly
165 170 175
tgc gtg gac ttc ctg gag tac gtc cgc gac ccc gcg aac ggc tac ctg 576
Cys Val Asp Phe Leu Glu Tyr Val Arg Asp Pro Ala Asn Gly Tyr Leu
180 185 190
tcc gtc aac ttc ccg atg ggc gag ggc ctg gag ctc agc atg cgc gtg 624
Ser Val Asn Phe Pro Met Gly Glu Gly Leu Glu Leu Ser Met Arg Val
195 200 205
ggc tga 630
Gly
<210> 33
<211> 209
<212> PRT
<213> Streptoverticillium
<400> 33
Met Ser Ser Glu Val Pro Glu Ile Arg Val Ser Asp Glu Arg Val Asn
1 5 10 15
Arg Thr Leu Thr Ala Val Asn Ala Arg Ala Ala Glu His Asp Arg Ser
20 25 30
Leu Phe Glu Gln Val Arg Asp Ser Leu Ala Val Ala Val Pro Pro Glu
35 40 45
Ala Gly Thr Leu Met Tyr Gln Leu Val Arg Ala Thr Arg Ala Ala Lys
50 55 60
Val Val Glu Leu Gly Met Ser Leu Gly Val Ser Thr Val Tyr Leu Ala
65 70 75 80
Ala Ala Val Arg Asp Asn Gly Gly Glu Gly Arg Val Tyr Thr Thr Glu
85 90 95
Ile Asp Glu Ala Lys Ile Lys Gln Gly Arg Ala Thr Leu Ala Asp Ala
100 105 110
Gly Val Ala Asp Leu Val Glu Val Leu Glu Gly Asp Ala Leu Gln Thr
115 120 125
Leu Asp Ser Val Pro Asp Gly Val Gln Phe Val Leu Leu Asp Gly Trp
130 135 140
Asn Glu Ser Tyr Leu Arg Val Met Lys Ile Leu Glu Pro Lys Leu Ala
145 150 155 160
Pro Gly Ala Leu Val Leu Ala Asp Asp Val Asn Leu Phe Gly Glu Gly
165 170 175
Cys Val Asp Phe Leu Glu Tyr Val Arg Asp Pro Ala Asn Gly Tyr Leu
180 185 190
Ser Val Asn Phe Pro Met Gly Glu Gly Leu Glu Leu Ser Met Arg Val
195 200 205
Gly
<210> 34
<211> 1341
<212> DNA
<213> Streptoverticillium
<220>
<221> CDS
<222> (1)..(1341)
<223>
<400> 34
atg acg gaa ctg cgt gac gcg gtg ctg cgt ggc gcg tcc ccc gag gaa 48
Met Thr Glu Leu Arg Asp Ala Val Leu Arg Gly Ala Ser Pro Glu Glu
1 5 10 15
ctg ctg cgc gcc ccc ctc ccg gcc acc tac cgg gcc gcc cac ctg cgc 96
Leu Leu Arg Ala Pro Leu Pro Ala Thr Tyr Arg Ala Ala His Leu Arg
20 25 30
gcc gag gac gtc ggc atg ttc gac ggc acg gac ggc gac cgc gac gtg 144
Ala Glu Asp Val Gly Met Phe Asp Gly Thr Asp Gly Asp Arg Asp Val
35 40 45
cgc aag tcg gtg gcc gtg ggc cag gtg ccg ctg ccc gag atc gcg ccc 192
Arg Lys Ser Val Ala Val Gly Gln Val Pro Leu Pro Glu Ile Ala Pro
50 55 60
gac gag gtc ctg atc gcg gtc atg gcc gcc gcg gtc aac tac aac tcc 240
Asp Glu Val Leu Ile Ala Val Met Ala Ala Ala Val Asn Tyr Asn Ser
65 70 75 80
gtg tgg tcg gcg acg ttc ctg ccg atg ccg acc ttc cgc ttc ctc gag 288
Val Trp Ser Ala Thr Phe Leu Pro Met Pro Thr Phe Arg Phe Leu Glu
85 90 95
aag tac gcc cgc cag ggc ggc tgg gca gca cgc cac gac cag ccc tac 336
Lys Tyr Ala Arg Gln Gly Gly Trp Ala Ala Arg His Asp Gln Pro Tyr
100 105 110
cac gtg atc ggc tcc gac tgc tcg ggc gtc gtc gtg cgc gtc ggc tcc 384
His Val Ile Gly Ser Asp Cys Ser Gly Val Val Val Arg Val Gly Ser
115 120 125
ggc gtg cgc cgg tgg cgg gtc ggc gac cac gtg gtg atc cac ccg gtg 432
Gly Val Arg Arg Trp Arg Val Gly Asp His Val Val Ile His Pro Val
130 135 140
cac gtg gac gac cag ggc gcc gcc acc cac gac gac gcc atg atg gac 480
His Val Asp Asp Gln Gly Ala Ala Thr His Asp Asp Ala Met Met Asp
145 150 155 160
gac cag cag cgc gcc tgg ggg tac gag acc aac ttc ggc gcc ttc ggc 528
Asp Gln Gln Arg Ala Trp Gly Tyr Glu Thr Asn Phe Gly Ala Phe Gly
165 170 175
gag tac gcc gtc gcc cgc gcc agc caa ctg gtc gcc aag ccc ggc cac 576
Glu Tyr Ala Val Ala Arg Ala Ser Gln Leu Val Ala Lys Pro Gly His
180 185 190
ttg acg tgg gag gag tcg gcg gcg aac acg ctg tgc acc acc acg tcg 624
Leu Thr Trp Glu Glu Ser Ala Ala Asn Thr Leu Cys Thr Thr Thr Ser
195 200 205
tac cgc atg ctc gtc ggg gcg cac ggc gcc cgg atg aag cag ggg gac 672
Tyr Arg Met Leu Val Gly Ala His Gly Ala Arg Met Lys Gln Gly Asp
210 215 220
gtg gtc ctg gtc tgg ggc gcg gcg ggc ggc ctg ggg acg tac gcc gtg 720
Val Val Leu Val Trp Gly Ala Ala Gly Gly Leu Gly Thr Tyr Ala Val
225 230 235 240
cag ttg gtc aag aac ggc ggc ggt atc ccc gtc gcc gtc gtc agc tcg 768
Gln Leu Val Lys Asn Gly Gly Gly Ile Pro Val Ala Val Val Ser Ser
245 250 255
ccc gcg aag gcg gag gcg gtc cgc cgg ctg ggc tgc gag cac gtc atc 816
Pro Ala Lys Ala Glu Ala Val Arg Arg Leu Gly Cys Glu His Val Ile
260 265 270
gac cgc acc gaa ctc ggg ctc acc ggc gac ccc tcg ggc gac ttc gac 864
Asp Arg Thr Glu Leu Gly Leu Thr Gly Asp Pro Ser Gly Asp Phe Asp
275 280 285
gcc gtg cgg gag atc ggc aag cgg ctg ggc gcc cgc atc cgc gaa ctc 912
Ala Val Arg Glu Ile Gly Lys Arg Leu Gly Ala Arg Ile Arg Glu Leu
290 295 300
gcc ggc cgc gac ccc gac atc gtc ttc gag cac acc ggc cgg gcc acc 960
Ala Gly Arg Asp Pro Asp Ile Val Phe Glu His Thr Gly Arg Ala Thr
305 310 315 320
ttc gcc ctc tcg gtg ttc gtc gtc cgc cgc ggc ggc acc gtc gtc acc 1008
Phe Ala Leu Ser Val Phe Val Val Arg Arg Gly Gly Thr Val Val Thr
325 330 335
tgc gga tcc agc tcg ggc tac cgg cac ctg tac gac aac cgg tac ctg 1056
Cys Gly Ser Ser Ser Gly Tyr Arg His Leu Tyr Asp Asn Arg Tyr Leu
340 345 350
tgg atg aag ctg aac acc gtc atc ggc agc cac ggc gga aac ctg cag 1104
Trp Met Lys Leu Asn Thr Val Ile Gly Ser His Gly Gly Asn Leu Gln
355 360 365
gaa gcc acc gag agc acc cgc ctg atc gcc tcc ggc gcg atc gtt ccg 1152
Glu Ala Thr Glu Ser Thr Arg Leu Ile Ala Ser Gly Ala Ile Val Pro
370 375 380
gcg ctc tcc gag gtc cac ccc ttc gag gac gtg gcc gag gcg atg cgg 1200
Ala Leu Ser Glu Val His Pro Phe Glu Asp Val Ala Glu Ala Met Arg
385 390 395 400
cgg gtc cag ctc aac gag cac gtc ggc aag gtc gtc gtc ctg tgc cag 1248
Arg Val Gln Leu Asn Glu His Val Gly Lys Val Val Val Leu Cys Gln
405 410 415
gcc ccc acc gcc ggc ctg ggc gtg acc gac ccg gag ctg cgg gaa cgg 1296
Ala Pro Thr Ala Gly Leu Gly Val Thr Asp Pro Glu Leu Arg Glu Arg
420 425 430
ctg ggg gag gag cgg acg gca ccc ctg ctg cgg gac tcc gcc tga 1341
Leu Gly Glu Glu Arg Thr Ala Pro Leu Leu Arg Asp Ser Ala
435 440 445
<210> 35
<211> 446
<212> PRT
<213> Streptoverticillium
<400> 35
Met Thr Glu Leu Arg Asp Ala Val Leu Arg Gly Ala Ser Pro Glu Glu
1 5 10 15
Leu Leu Arg Ala Pro Leu Pro Ala Thr Tyr Arg Ala Ala His Leu Arg
20 25 30
Ala Glu Asp Val Gly Met Phe Asp Gly Thr Asp Gly Asp Arg Asp Val
35 40 45
Arg Lys Ser Val Ala Val Gly Gln Val Pro Leu Pro Glu Ile Ala Pro
50 55 60
Asp Glu Val Leu Ile Ala Val Met Ala Ala Ala Val Asn Tyr Asn Ser
65 70 75 80
Val Trp Ser Ala Thr Phe Leu Pro Met Pro Thr Phe Arg Phe Leu Glu
85 90 95
Lys Tyr Ala Arg Gln Gly Gly Trp Ala Ala Arg His Asp Gln Pro Tyr
100 105 110
His Val Ile Gly Ser Asp Cys Ser Gly Val Val Val Arg Val Gly Ser
115 120 125
Gly Val Arg Arg Trp Arg Val Gly Asp His Val Val Ile His Pro Val
130 135 140
His Val Asp Asp Gln Gly Ala Ala Thr His Asp Asp Ala Met Met Asp
145 150 155 160
Asp Gln Gln Arg Ala Trp Gly Tyr Glu Thr Asn Phe Gly Ala Phe Gly
165 170 175
Glu Tyr Ala Val Ala Arg Ala Ser Gln Leu Val Ala Lys Pro Gly His
180 185 190
Leu Thr Trp Glu Glu Ser Ala Ala Asn Thr Leu Cys Thr Thr Thr Ser
195 200 205
Tyr Arg Met Leu Val Gly Ala His Gly Ala Arg Met Lys Gln Gly Asp
210 215 220
Val Val Leu Val Trp Gly Ala Ala Gly Gly Leu Gly Thr Tyr Ala Val
225 230 235 240
Gln Leu Val Lys Asn Gly Gly Gly Ile Pro Val Ala Val Val Ser Ser
245 250 255
Pro Ala Lys Ala Glu Ala Val Arg Arg Leu Gly Cys Glu His Val Ile
260 265 270
Asp Arg Thr Glu Leu Gly Leu Thr Gly Asp Pro Ser Gly Asp Phe Asp
275 280 285
Ala Val Arg Glu Ile Gly Lys Arg Leu Gly Ala Arg Ile Arg Glu Leu
290 295 300
Ala Gly Arg Asp Pro Asp Ile Val Phe Glu His Thr Gly Arg Ala Thr
305 310 315 320
Phe Ala Leu Ser Val Phe Val Val Arg Arg Gly Gly Thr Val Val Thr
325 330 335
Cys Gly Ser Ser Ser Gly Tyr Arg His Leu Tyr Asp Asn Arg Tyr Leu
340 345 350
Trp Met Lys Leu Asn Thr Val Ile Gly Ser His Gly Gly Asn Leu Gln
355 360 365
Glu Ala Thr Glu Ser Thr Arg Leu Ile Ala Ser Gly Ala Ile Val Pro
370 375 380
Ala Leu Ser Glu Val His Pro Phe Glu Asp Val Ala Glu Ala Met Arg
385 390 395 400
Arg Val Gln Leu Asn Glu His Val Gly Lys Val Val Val Leu Cys Gln
405 410 415
Ala Pro Thr Ala Gly Leu Gly Val Thr Asp Pro Glu Leu Arg Glu Arg
420 425 430
Leu Gly Glu Glu Arg Thr Ala Pro Leu Leu Arg Asp Ser Ala
435 440 445
<210> 36
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 36
ggggcagcct gctcggcgag 20
<210> 37
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 37
ggtgagctcc ccgatcaggg 20
<210> 38
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 38
gcgctcgtac gcctcgctga t 21
<210> 39
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 39
cgggctcggt ggtgagcagg 20
<210> 40
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 40
gtccgtggcg ccgccggatt 20
<210> 41
<211> 59
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 41
gtcaccgtcc ccgcctacgg cgacggcgtc gtcctggtga ttccggggat ccgtcgacc 59
<210> 42
<211> 58
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 42
ggtcgcgggc gaaggcgtag ccgggcaggt cgggcaggat gtaggctgga gctgcttc 58
<210> 43
<211> 18
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 43
cgtgaccgag gtggcgcg 18
<210> 44
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 44
gtcgtcggat gcgccgtgcg 20
<210> 45
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 45
gcaccttcat gtccgggttg 20
<210> 46
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 46
atcgccgcgt acaccatgac 20
<210> 47
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 47
cgaaggtccg gttgatggtg 20
<210> 48
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Artificially synthesized primer sequence
<400> 48
atcgctgcga caccctggag 20
Claims (15)
- 하기 (a) 내지 (q)로 이루어지는 군으로부터 선택되는 적어도 하나의 핵산으로서, UK-2 생합성을 유도하고 UK-2의 생산성을 향상시키는, 분리된 핵산:
(a) SEQ ID NO: 3의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 3의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 3의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 2의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(b) SEQ ID NO: 5의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 5의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 5의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 4의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(c) SEQ ID NO: 7의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 7의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 7의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 6의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(d) SEQ ID NO: 9의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 9의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 9의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 8의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(e) SEQ ID NO: 11의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 11의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 11의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 10의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(f) SEQ ID NO: 13의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 13의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 13의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 12의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(g) SEQ ID NO: 15의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 15의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 15의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 14의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(h) SEQ ID NO: 17의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 17의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 17의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 16의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(i) SEQ ID NO: 19의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 19의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 19의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 18의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(j) SEQ ID NO: 21의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 21의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 21의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 20의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(k) SEQ ID NO: 23의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 23의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 23의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 22의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(l) SEQ ID NO: 25의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 25의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 25의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 24의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(m) SEQ ID NO: 27의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 27의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 27의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 26의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(n) SEQ ID NO: 29의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 29의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 29의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 28의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(o) SEQ ID NO: 31의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 31의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 31의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 30의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산;
(p) SEQ ID NO: 33의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 33의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 33의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 32의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산; 및
(q) SEQ ID NO: 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, 하나 또는 그 이상의 아미노산이 치환, 결실, 부가 및/또는 삽입된 SEQ ID NO: 35의 아미노산 서열을 포함하는 단백질을 인코딩하는 핵산, SEQ ID NO: 35의 아미노산 서열과 95% 이상의 상동성을 가지는 아미노산 서열을 인코딩하는 핵산, 또는 SEQ ID NO: 34의 염기 서열을 포함하는 핵산과 엄격한 조건 하에서 혼성화하는 핵산. - 제 1 항에 있어서, (a) 내지 (q)의 핵산을 모두 포함하는, 핵산.
- 제 2 항에 있어서, SEQ ID NO: 1의 염기 서열을 포함하는, 핵산.
- 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산이 삽입된, UK-2 생합성을 유도하고 UK-2 생산성을 향상시키기 위한 벡터.
- 시험 박테리아 내에서 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산의 염기 서열 또는 상기 서열에 상보적인 염기 서열을 포함하는 핵산의 존재를 탐지하는 것을 포함하는, UK-2 생산성을 판단하는 방법.
- 제 5 항에 있어서, 핵산의 존재를 탐지하는 방법은 PCR 방법인 것인, 방법.
- 제 6 항에 있어서, PCR 방법은 SEQ ID NO: 45의 염기 서열을 포함하는 프라이머 및 SEQ ID NO: 46의 염기 서열을 포함하는 프라이머를 사용하여 핵산이 증폭되는 방법인 것인, 방법.
- UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아로서, 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산의 염기 서열 또는 상기 서열과 상보적인 염기 서열을 포함하는 핵산의 존재가 제 5 항에 따른 방법에 의해 탐지되는, 박테리아.
- 제 4 항에 따른 벡터의 도입에 의해 UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아.
- 제 1 항에 따른 핵산이 유전체 내에 삽입된, UK-2 생합성이 유도되고 UK-2 생산성이 향상된 박테리아.
- 제 1 항 내지 제 3 항 중 어느 한 항에 따른 핵산의 염기 서열을 포함하는 핵산의 하나 또는 둘 또는 그 이상의 복제가 각 세포에 존재하는 박테리아.
- 제 8 항 내지 제 11 항 중 어느 한 항에 따른 박테리아로서, 스트렙토베르티실룸(Streptoverticillium), 스트렙토마이세스(Streptomyces), 대장균(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 효모(yeasts), 곰팡이(filamentous fungi) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 중 어느 하나인 것인, 박테리아.
- UK-2의 생산 방법으로서:
제 8 항 내지 제 12 항 중 어느 한 항에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2를 수집하는 것을 포함하는, 방법. - UK-2 유도체의 생산 방법으로서:
제 8 항 내지 제 12 항 중 어느 한 항에 따른 박테리아를 배양하고, 그리고 박테리아 배양으로부터 UK-2를 수집하고; 그리고
수집된 UK-2로부터 하기 식(1) 중 어느 하나로 표시되는 UK-2유도체를 합성하는 것을 포함하는 방법
[화학식 1]
(1)
[식(1)에서,
R은 2-메틸프로파노일기, 트랜스-2-메틸-2-부타노일기, 3-메틸부타노일기 및 2-메틸부타노일기 중 어느 하나를 나타냄.
R1은 C1-6 알킬기, 벤질기, C1-10 알킬카르보닐기(C1-10 알킬카보닐기는 카르복실기, 벤질옥시카르보닐기, C1-4 알킬옥시카르보닐기 및 벤질옥시카르보닐아미노기 중 어느 하나로 치환될 수 있음), 벤조일기, C1-4 알킬옥시카르보닐기, (C1-4)알킬옥시카르보닐(C1-4)알킬기, 니트로기로 치환가능한 벤질옥시카르보닐(C1-4)알킬기, C1-6 알킬술포닐, 디(C1-6)알킬포스포릴기, 디페닐포르포리기 및 하기 식(2)으로 표시되는 치환기 중 어느 하나를 나타내고;
[화학식 2]
(2)
(식(2)에서,
Q는 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
M은 H, CH3, CH2CH3, CF3, Ph, CH=CH2 및 시클로프로필로 이루어지는 군으로부터 선택됨.
T는 O, OC(O), OC(O)O, S, SC(O), SC(O)O 및 하기 식(3)으로 표시되는 치환기로 이루어지는 군으로부터 선택됨;
[화학식 3]
(3)
G는 H, C1-6 알킬기, C1-6 알콕시 C1-6 알킬기, C2-6 알케닐기, C2-6 알키닐기, C3-6 시클로알킬기, 아릴기 및 헤테로아릴기로 이루어지는 군으로부터 선택됨.
G 및 M은 임의적으로 옥소기를 가지는 이소벤조퓨란 고리를 형성할 수 있음.
M 및 Q는 3-8원 카르보시클릭 시스템을 형성할 수 있음.].
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012153986 | 2012-07-09 | ||
JPJP-P-2012-153986 | 2012-07-09 | ||
PCT/JP2013/069081 WO2014010714A1 (en) | 2012-07-09 | 2013-07-08 | Uk-2 biosynthetic genes and method for improving uk-2 productivity using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150035751A true KR20150035751A (ko) | 2015-04-07 |
KR102159415B1 KR102159415B1 (ko) | 2020-09-23 |
Family
ID=48874462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147036291A KR102159415B1 (ko) | 2012-07-09 | 2013-07-08 | Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 |
Country Status (28)
Country | Link |
---|---|
US (2) | US9365879B2 (ko) |
EP (1) | EP2731435B1 (ko) |
JP (1) | JP6263133B2 (ko) |
KR (1) | KR102159415B1 (ko) |
CN (1) | CN104427870B (ko) |
AU (1) | AU2013287626B2 (ko) |
BR (1) | BR112015000282B1 (ko) |
CA (1) | CA2878644C (ko) |
CR (1) | CR20150052A (ko) |
CY (1) | CY1118197T1 (ko) |
DK (1) | DK2731435T3 (ko) |
EA (1) | EA028269B1 (ko) |
EC (1) | ECSP15001894A (ko) |
ES (1) | ES2592405T3 (ko) |
GT (1) | GT201400294A (ko) |
IL (1) | IL236532B (ko) |
IN (1) | IN2014KN03120A (ko) |
MA (1) | MA37790B1 (ko) |
MX (1) | MX358867B (ko) |
NZ (1) | NZ703756A (ko) |
PE (1) | PE20150753A1 (ko) |
PH (1) | PH12015500004B1 (ko) |
PT (1) | PT2731435T (ko) |
TN (1) | TN2014000538A1 (ko) |
TW (1) | TWI601822B (ko) |
UA (1) | UA116989C2 (ko) |
WO (1) | WO2014010714A1 (ko) |
ZA (1) | ZA201500470B (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017205387A1 (en) * | 2016-05-23 | 2017-11-30 | Northwestern University | Systems and methods for untargeted metabolomic screening |
CN115261291B (zh) * | 2021-04-29 | 2023-10-20 | 上海医药工业研究院 | 一种生产uk 2a的基因工程菌及其制备方法和应用 |
CN114717208B (zh) * | 2022-05-18 | 2024-07-09 | 上海交通大学 | 一种酰基CoA合成酶及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07233165A (ja) | 1994-02-24 | 1995-09-05 | Suntory Ltd | 新規抗真菌化合物 |
WO1999011127A1 (fr) | 1997-08-29 | 1999-03-11 | Meiji Seika Kaisha, Ltd. | Agent de lutte contre la piriculariose du riz et agent de lutte contre la tavelure du ble |
WO2001018179A1 (fr) | 1999-09-07 | 2001-03-15 | Meiji Seika Kaisha, Ltd. | Synthases de depsipeptides cycliques, genes correspondants et systeme de production de masse de ces depsipeptides cycliques |
WO2003035617A2 (en) * | 2001-10-23 | 2003-05-01 | Dow Agrosciences Llc Patent Department | Derivatives of uk-2a |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ506249A (en) | 1998-02-06 | 2003-04-29 | Meiji Seika Kaisha | Antifungal compounds and process for producing the same from UK-2 |
-
2013
- 2013-07-08 WO PCT/JP2013/069081 patent/WO2014010714A1/en active Application Filing
- 2013-07-08 MX MX2014015928A patent/MX358867B/es active IP Right Grant
- 2013-07-08 JP JP2014560583A patent/JP6263133B2/ja active Active
- 2013-07-08 PE PE2014002494A patent/PE20150753A1/es active IP Right Grant
- 2013-07-08 EA EA201590170A patent/EA028269B1/ru unknown
- 2013-07-08 DK DK13740383.8T patent/DK2731435T3/en active
- 2013-07-08 IN IN3120KON2014 patent/IN2014KN03120A/en unknown
- 2013-07-08 MA MA37790A patent/MA37790B1/fr unknown
- 2013-07-08 EP EP13740383.8A patent/EP2731435B1/en active Active
- 2013-07-08 BR BR112015000282-0A patent/BR112015000282B1/pt active IP Right Grant
- 2013-07-08 CN CN201380036753.1A patent/CN104427870B/zh active Active
- 2013-07-08 KR KR1020147036291A patent/KR102159415B1/ko active IP Right Grant
- 2013-07-08 ES ES13740383.8T patent/ES2592405T3/es active Active
- 2013-07-08 AU AU2013287626A patent/AU2013287626B2/en active Active
- 2013-07-08 CA CA2878644A patent/CA2878644C/en active Active
- 2013-07-08 US US13/936,771 patent/US9365879B2/en active Active
- 2013-07-08 NZ NZ703756A patent/NZ703756A/en unknown
- 2013-07-08 PT PT137403838T patent/PT2731435T/pt unknown
- 2013-07-09 TW TW102124528A patent/TWI601822B/zh active
- 2013-08-07 UA UAA201500953A patent/UA116989C2/uk unknown
-
2014
- 2014-12-18 GT GT201400294A patent/GT201400294A/es unknown
- 2014-12-26 TN TN2014000538A patent/TN2014000538A1/fr unknown
- 2014-12-31 IL IL236532A patent/IL236532B/en active IP Right Grant
-
2015
- 2015-01-05 PH PH12015500004A patent/PH12015500004B1/en unknown
- 2015-01-19 EC ECIEPI20151894A patent/ECSP15001894A/es unknown
- 2015-01-22 ZA ZA2015/00470A patent/ZA201500470B/en unknown
- 2015-02-05 CR CR20150052A patent/CR20150052A/es unknown
-
2016
- 2016-05-10 US US15/150,887 patent/US9771606B2/en active Active
- 2016-07-22 CY CY20161100725T patent/CY1118197T1/el unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07233165A (ja) | 1994-02-24 | 1995-09-05 | Suntory Ltd | 新規抗真菌化合物 |
WO1999011127A1 (fr) | 1997-08-29 | 1999-03-11 | Meiji Seika Kaisha, Ltd. | Agent de lutte contre la piriculariose du riz et agent de lutte contre la tavelure du ble |
WO2001018179A1 (fr) | 1999-09-07 | 2001-03-15 | Meiji Seika Kaisha, Ltd. | Synthases de depsipeptides cycliques, genes correspondants et systeme de production de masse de ces depsipeptides cycliques |
WO2003035617A2 (en) * | 2001-10-23 | 2003-05-01 | Dow Agrosciences Llc Patent Department | Derivatives of uk-2a |
US20040192924A1 (en) * | 2001-10-23 | 2004-09-30 | Meyer Kevin Gerald | Derivatives of uk-2a |
JP2005507921A (ja) * | 2001-10-23 | 2005-03-24 | ダウ アグロサイエンシィズ エルエルシー | Uk−2aの誘導体 |
JP4560638B2 (ja) * | 2001-10-23 | 2010-10-13 | ダウ アグロサイエンシィズ エルエルシー | Uk−2aの誘導体 |
Non-Patent Citations (2)
Title |
---|
Namwat W. 등, Journal of Bacteriology, 2002년 9월, 184권, 17호, 4811~4818페이지 |
Ueki M. 등, Journal of antibiotics, 1996년 7월 25일, 49권, 7호, 639~643페이지 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2271666T3 (da) | Nrps-pks-gengruppe og dens manipulation og anvendelighed | |
CN107868789B (zh) | 可利霉素生物合成基因簇 | |
KR102159415B1 (ko) | Uk-2 생합성 유전자 및 그것을 사용한 uk-2 생산성을 향상시키기 위한 방법 | |
CN101691575B (zh) | 一种萨菲菌素的生物合成基因簇 | |
WO1998007868A1 (en) | Rifamycin biosynthesis gene cluster | |
CN110305881B (zh) | 一种聚酮类化合物neoenterocins的生物合成基因簇及其应用 | |
CN102517309A (zh) | 一种手霉素类抗生素生物合成基因簇 | |
KR102017788B1 (ko) | 밀베마이신 d를 생산하는 재조합 미생물 및 밀베마이신 d 생산 방법 | |
CN107164394B (zh) | 一种非典型角环素类化合物nenestatin A的生物合成基因簇及其应用 | |
US6210935B1 (en) | Staurosporin biosynthesis gene clusters | |
US20030113874A1 (en) | Genes and proteins for the biosynthesis of rosaramicin | |
KR20130097538A (ko) | 해양 미생물 하헬라 제주엔시스의 제주엔올라이드 생합성 유전자 클러스터 | |
US7105491B2 (en) | Biosynthesis of enediyne compounds by manipulation of C-1027 gene pathway | |
CN107541523B (zh) | 曲张链丝菌素生物合成基因簇及其应用 | |
KR101610970B1 (ko) | 갈보놀라이드 생합성에 관여하는 유전자 | |
EP1925668A2 (en) | Genes involved in the biosynthesis of thiocoraline and heterologous production of same | |
JP2004173537A (ja) | カナマイシン生合成遺伝子 | |
US20040132055A1 (en) | Recombinant chalcomycin polyketide synthase and modifying genes | |
OA17159A (en) | UK-2 biosynthetic genes and method for improving UK-2 productivity using the same | |
KR20110049740A (ko) | 타크롤리무스 생산 균주 및 이로부터 얻어진 타크롤리무스 생합성 유전자 | |
KR20140021082A (ko) | 스트렙토마이세스 아시디스카비스 에이티씨씨 49003 유래의 이차대사산물 생산 조절 유전자 및 그를 이용한 항생물질의 제조방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |