KR20220126740A - 올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼 - Google Patents
올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼 Download PDFInfo
- Publication number
- KR20220126740A KR20220126740A KR1020227027349A KR20227027349A KR20220126740A KR 20220126740 A KR20220126740 A KR 20220126740A KR 1020227027349 A KR1020227027349 A KR 1020227027349A KR 20227027349 A KR20227027349 A KR 20227027349A KR 20220126740 A KR20220126740 A KR 20220126740A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- ser
- val
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/78—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/22—Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/102—Plasmid DNA for yeast
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
본 발명은 미생물 및 무세포 시스템으로부터 높은 역가로 올리베톨산 및 이의 유사체들을 생성하는 생합성 플랫폼을 제공한다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 1월 10일에 출원된 가출원 일련 번호 62/959,849로부터 35 U.S.C. §119에 따른 우선권을 주장하며, 그 개시 내용은 여기에 참조로 포함된다.
정부 지원 성명서
이 발명은 국립 보건원에서 수여한 보조금 번호 1R35GM11805에 따라 정부 지원으로 만들어졌다. 정부는 발명에 대한 특정 권리를 갖는다.
기술분야
본 발명은 미생물 및 무세포 시스템으로부터 높은 역가로 올리베톨산 및 이의 유사체들을 생성하는 생합성 플랫폼을 제공한다.
서열 목록의 참조에 의한 통합
이 출원과 함께 2021년 1월 7일에 생성되고 IBM-PC, MS-Windows 운영 체제에서 기계 포맷된 350,174바이트의 데이터를 갖는 "Sequence-Listing_ST25"라는 제목의 서열 목록이 있다. 서열 목록은 모든 목적을 위해 그 전체가 참고로 여기에 포함된다.
칸나비노이드(Cannabinoids)는 인간 체내칸나비노이드 시스템의 칸나비노이드 수용체들(CB1 및 CB2)을 조절하고 다른 생물학적 시스템을 조절하는 생리활성 식물 유래 천연 제품의 큰 부류이다. 칸나비노이드는 항암제, 항구토제, 항경련제, 진통제 및 항우울제로서의 치료 이점을 조사하는 100개 이상의 진행 중인 임상 시험을 통해 유망한 약리학적 제제이다. 또한, 3가지 칸나비노이드 요법이 화학요법으로 유발된 메스꺼움, MS 경련 및 중증 간질과 관련된 발작을 치료하기 위해 FDA 승인을 받았다. 의학에서의 중요한 역할에도 불구하고 토종 식물의 낮은 풍부도와 대마초의 법적 일정은 칸나비노이드의 생물학을 풀기 위한 심층 연구를 방해하여 더 넓은 의약 적용을 방해하였다.
본 발명은 더 단순한 대사산물들로부터 올리베톨산(olivetolic acid) 및 이의 유사체들을 생산하는 일련의 분리된 효소들을 포함하는 생합성 플랫폼으로서, 상기 일련의 효소들은 헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산 및/또는 이들의 유사체들을 포함하는 일련의 대사산물들을 방향족 디올 대사산물로 전환시키는 비-환원 폴리케타이드 합성효소(non-reducing polyketide synthase, NRPKS); 및 상기 방향족 디올 대사산물을 올리베톨산 및 이의 유사체로 전환시키는 티오에스테라제(thioesterase)를 포함한다. 일 실시예에서, 상기 플랫폼은 아세틸-CoA, 말로닐-CoA 및 NADPH를 이용하여 헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산 및/또는 이들의 유사체(예를 들어, 부티르산, 헥센산, 옥텐산, 데칸산, 데센산, 라우르산, 나노노익산 및 관련된 co-A 등가물 등)로부터 선택되는 일련의 대사산물들을 합성하는 고-환원 폴리케타이드 합성효소(highly-reducing polyketide synthase, HRPKS)를 추가로 포함한다. 일 실시예에서, 헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산의 유사체는 C6 또는 C8 아실 사슬에서 다양하다. 다른 또는 추가의 실시예에서, 올리베톨산의 유사체들은 2-헵틸-4,6-디히드록시벤조산, (E)-2-(헵트-1-엔-1-일)-4,6-디히드록시벤조산, 및 (E)-2,4-디히드록시-6-(펜트-1-엔-1-일) 벤조산을 포함한다. 또 다른 또는 추가의 실시예에서, 생합성 플랫폼을 구성하는 하나 이상의 효소들은 진균으로부터 유래한다. 또 다른 실시예에서, 상기 생합성 플랫폼을 구성하는 앞서 언급한 일련의 효소들 중 어느 하나는 메타리지움 아니소플리애(Metarhizium anisopliae)로부터 유래된 것이다. 또 다른 실시예에서, 전술한 NRPKS 중 어느 하나는 SEQ ID NO: 4의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는다. 추가 실시예에서, NRPKS는 SEQ ID NO: 2의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 이는 1 내지 20개의 보존적 아미노산 치환(conservative amino acid substitutions)을 함유한다. 또 다른 실시예에서, NRPKS는 SEQ ID NO: 4의 서열을 포함한다. 전술한 어느 하나의 다른 실시예에서, TE는 SEQ ID NO: 3의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는다. 추가 실시예에서, TE는 SEQ ID NO: 6의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 이는 1 내지 20개의 보존적 아미노산 치환을 함유한다. 또 다른 실시예에서, TE는 SEQ ID NO: 6의 서열을 포함한다. 임의의 상기 실시예의 또 다른 실시예에서, HRPKS는 SEQ ID NO: 2의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는다. 추가 실시예에서, HRPKS는 SEQ ID NO: 2의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 이는 1 내지 20개의 보존적 아미노산 치환을 함유한다. 또 다른 실시예에서, HRPKS는 SEQ ID NO: 2의 서열을 포함한다.
본 발명은 또한 임의의 상기 실시예의 생합성 플랫폼을 구성하는 일련의 효소를 코딩하는 폴리뉴클레오티드 서열을 포함하는 무세포 시스템(cell-free system)에서 생합성 플랫폼을 발현하기 위한 선형 발현 템플릿(linear expression template, LET)을 제공한다. 또 다른 실시예에서, LET는 HRPKS 활성을 갖고, SEQ ID NO: 2의 서열과 적어도 95%, 98% 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열; NRPKS 활성을 갖고, SEQ ID NO: 4의 서열과 적어도 95%, 98% 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열; TE 활성을 갖고, SEQ ID NO: 6의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 본원에 기재된 바와 같은 생합성 플랫폼을 구성하는 일련의 효소들을 코딩하는 폴리뉴클레오티드 서열을 포함하는 플라스미드(들) 또는 벡터(들)를 제공한다. 일 실시예에서, 제1 플라스미드는 HRPKS 활성을 갖고 SEQ ID NO: 2의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고; 제2 플라스미드는 NRPKS 활성을 갖고 SEQ ID NO: 4의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하며; 및 제3 플라스미드는 TE 활성을 갖고 SEQ ID NO: 6의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한, 본 발명의 플라스미드(들) 또는 벡터(들)를 포함하는 재조합 미생물을 제공한다. 일 실시예에서, 상기 재조합 미생물은 박테리움(bacterium), 고세균(archaeum) 또는 진균(fungus)이다. 추가 실시예에서, 상기 재조합 미생물은 대장균(Escherichia coli), 로드호박터 스페로이데스(Rodhobacter sphaeroides), 슈도알테로모나스 할로플랑크티스(Pseudoalteromonas haloplanktis), 시와넬라 sp. 균주 Ac10(Shewanella sp. strain Ac10), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 푸티다(Pseudomonas putida), 녹농균(Pseudomonas aeruginosa), 할로모나스 엘롱가타(Halomonas elongata), 크로모할로박터 살렉시겐(Chromohalobacter salexigens), 스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 그리세우스(Streptomyces griseus), 노카르디아 락탐두란스(Nocardia lactamdurans), 마이코박테리움 스메그마티스(Mycobacterium smegmatis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘툼(Brevibacterium lactofermentum), 고초균(Bacillus subtilis), 바실러스 브레비스(Bacillus brevis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 락토코커스 락티스(Lactococcus lactis), 락토바실러스 플란타룸(Lactobacillus plantarum), 락토바실러스 카세이(Lactobacillus casei), 락토바실러스 루테리(Lactobacillus reuteri), 및 락토바실러스 가세리(Lactobacillus gasseri)로 구성된 군에서 선택되는 박테리움이다. 또 다른 실시예에서, 상기 재조합 미생물은 대장균속(Escherichia) 또는 슈도모나스 푸티다(Pseudomonas putida)이다. 또 다른 실시예에서, 상기 재조합 미생물은 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피치아 파스토리스(Pichia pastoris), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴리티카(Yarrowia lipolytica), 아스페르길루스 니둘란스(Aspergillus nidulans), 트리코데르마 리세이(Trichoderma reesei), 푸사리움 옥시스포룸(Fusarium oxysporum), 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 아쉬비아 고쉬피(Ashbya gossypii), 누룩곰팡이(A. oryzae), 및 크리소스포리움 룩크노웬스(Chrysosporium lucknowense)로 구성된 군에서 선택되는 박테리움이다. 또 다른 실시예에서, 상기 재조합 미생물은 아스페르길루스 니둘란스(Aspergillus nidulans) 또는 사카로마이세스 세레비지애(Saccharomyces cerevisiae)이다.
본 발명은 또한 본 발명의 재조합 미생물을 배양하는 단계를 포함하는 올리베톨산 및 이의 유사체를 생산하는 방법을 제공한다. 일 실시예에서, 상기 방법은 올리베톨산 및 이의 유사체를 분리(isolating) 및 정제(purifying)하는 단계를 추가로 포함한다. 예를 들어, 본 발명에 제시된 연구에서, 예를 들어 진균(fungus) 메타리지움 아니소플리애(Metarhizium anisopliae)에서 유래한 생합성 플랫폼 또는 클러스터는 높은 수율로 올리베톨산 및 이의 유사체를 제공하였다. 생합성 플랫폼은 (1) 고-환원성 폴리케타이드 합성효소(HRPKS), (2) 비-환원성 폴리케타이드 합성효소(NRPKS) 및 (3) 티오에스테라제(TE)를 포함한다. HRPKS는 아세틸-CoA, 말로닐-CoA 및 NADPH를 이용하여 아실-캐리어 단백질(acyl-carrier protein, ACP)에 연결된 C6 또는 C8 아실 사슬을 합성한다. HRPKS의 ACP 도메인은 아실 티오에스테르를 NRPKS의 스타터 유닛 아실-운반체 단백질 트랜스아실라제(starter unit acyl-carrier protein transacylase, SAT) 도메인으로 셔틀한다. 케토신타제(ketosynthase, KS) 도메인에 의해 촉매되는 3개의 탈탄산 축합(decarboxylative condensations) 및 생성물 주형(product template, PT) 도메인에 의한 방향족화 후, TE는 NRPKS에서 생성물을 가수분해하여 다음 촉매 주기를 시작한다. HRPKS의 합성 능력과 NRPKS SAT 도메인의 완화된 기질 선택성으로 인해, 고역가 올리베톨산 및 아실 사슬 길이와 포화도가 다른 세 가지 유사체에 접근할 수 있다. 앞서 언급한 효소는 스페르길루스 니둘란스(Aspergillus nidulans) 및 올리베톨산에서 이종적으로 발현되었으며, 이의 유사체는 대사 최적화 없이 >4 g/L의 총 역가로 수득하였다. 실제로, 생합성 플랫폼은 E. coli 및 효모를 포함하여 올리베톨산 및 이의 유사체를 생산하기 위해 다른 미생물 시스템에서도 발현될 수 있다.
도 1은 칸나비노이드(cannabinoids)의 생합성에서 올리베톨산이 중심적인 역할을 한다는 것을 입증한다.
도 2A-B는 올리베톨산 및 이의 유사체를 생산하기 위해 이용되는 본 발명의 생합성 경로의 실시예를 제공한다. (A) 메타리지움 아니소플리애(Metarhizium anisopliae) ARSEF23으로부터의 OVA를 포함하는 본 발명의 생합성 경로를 나타낸 것이다. (B) 생합성 경로의 이종 발현은 올리베톨산 및 이의 유사체를 제공한다.
도 3은 액체 플라스크 배양물로부터 올리베톨산 및 이의 유사체의 생산에 대한 액체 크로마토그래피(LC) 자취를 제공한다.
도 2A-B는 올리베톨산 및 이의 유사체를 생산하기 위해 이용되는 본 발명의 생합성 경로의 실시예를 제공한다. (A) 메타리지움 아니소플리애(Metarhizium anisopliae) ARSEF23으로부터의 OVA를 포함하는 본 발명의 생합성 경로를 나타낸 것이다. (B) 생합성 경로의 이종 발현은 올리베톨산 및 이의 유사체를 제공한다.
도 3은 액체 플라스크 배양물로부터 올리베톨산 및 이의 유사체의 생산에 대한 액체 크로마토그래피(LC) 자취를 제공한다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥이 명백하게 달리 지시하지 않는 한 복수 지시 대상을 포함한다. 따라서, 예를 들어, "폴리케타이드 합성효소"에 대한 언급은 다수의 이러한 폴리케타이드 합성효소를 포함하고 "카나비노이드 중간체"에 대한 언급은 당업자에게 공지된 하나 이상의 칸나비노이드 중간체 및 그의 등가물에 대한 언급을 포함한다.
또한, "또는"의 사용은 달리 명시되지 않는 한 "및/또는"을 의미한다. 유사하게, "comprise", "comprises", "comprising" "include", "include" 및 "include"는 상호 교환 가능하며 제한하려는 의도가 아니다.
다양한 실시예의 설명이 "포함하는(comprising)"이라는 용어를 사용하는 경우, 당업자는 일부 특정 경우에 "본질적으로 구성되는" 또는 "~로 구성되는"이라는 언어를 사용하여 실시예가 대안적으로 설명될 수 있음을 이해할 것이다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 일반적으로 이해되는 것과 동일한 의미를 갖는다. 많은 방법 및 시약이 본 명세서에 기재된 것과 유사하거나 동등하지만, 예시적인 방법 및 물질이 본 명세서에 개시되어 있다.
본 명세서에 언급된 모든 간행물은 본 명세서의 설명과 관련하여 사용될 수 있는 방법론을 기술하고 개시하기 위한 목적으로 전체가 참고로 본 명세서에 포함된다. 또한, 본 개시에서 명시적으로 정의된 용어와 유사하거나 동일한 하나 이상의 간행물에 제시된 용어와 관련하여, 본 개시에 명시적으로 제공된 용어의 정의는 모든 면에서 통제될 것입니다.
본 발명은 본 명세서에 기술된 특정 방법, 프로토콜, 및 시약 등에 제한되지 않고 다양할 수 있음을 이해해야 한다. 본 명세서에서 사용된 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 범위를 한정하려는 의도가 아니며, 청구 범위에 의해서만 정의된다.
작동 실시예에서 또는 달리 지시된 경우를 제외하고, 본원에서 사용된 성분 또는 반응 조건의 양을 나타내는 모든 숫자는 모든 경우에 "약"이라는 용어에 의해 수정된 것으로 이해되어야 한다. 백분율과 관련하여 본 발명을 설명하는 데 사용된 용어 "약"은 ±1%를 의미한다.
본 명세서에 사용된 바와 같이, 효소의 "활성"은 대사산물을 생성하는 반응을 촉매화하는 능력, 즉 "기능"의 척도이며, 반응의 대사산물이 생성되는 속도로서 표현될 수 있다. 예를 들어, 효소 활성은 단위 시간당 또는 단위 효소(예: 농도 또는 중량)당 생성된 대사산물의 양으로, 또는 친화도 또는 해리 상수의 관점에서 나타낼 수 있다.
용어 "생합성 경로(biosynthetic pathway)"는 기질이 더 복잡한 생성물로 전환되거나 단계적 방식으로 분해되는 다단계 효소 촉매 공정(multi-step, enzyme-catalyzed process)을 의미한다. 생합성 경로의 전제 요소는 일반적으로 전구체 화합물(기질), 선택적으로 화학 에너지(예: ATP) 및 조효소가 필요할 수 있는 촉매 효소(예: NADH, NADPH)가 포함된다. 본 발명은 아세틸-CoA 및 말로닐-CoA와 같은 보다 단순한 전구체 화합물로부터 올리베톨산 및 올리베톨산의 유사체를 생산하기 위한 생합성 경로를 제공한다. 본 발명은 또한 올리베톨산 및 올리베톨산 유사체의 생산을 위한 본 명세서에 개시된 생합성 경로를 발현하는 재조합 미생물을 제공한다. 특정 실시예에서, 본 명세서에 개시된 생합성 경로는 하나 이상의 폴리케타이드 합성효소를 포함한다. 추가 실시예에서, 본 명세서에 개시된 생합성 경로는 하나 이상의 티오에스테라제를 포함한다. 특정 실시예에서, 본 명세서의 생합성 경로를 포함하는 조작된 미생물은 조작된 미생물에 이종인 폴리케타이드 합성효소 또는 티오에스테라제로부터 선택되는 적어도 하나의 효소를 포함한다.
"효소"는 일반적으로 하나 이상의 화학적 또는 생화학적 반응을 촉매하거나 촉진하는 단백질 또는 폴리펩티드를 구성하는 아미노산으로 전체적으로 또는 크게 구성된 임의의 물질을 의미한다.
유전자 또는 폴리뉴클레오티드에 대한 용어 "발현"은 유전자 또는 폴리뉴클레오타이드의 전사 및 적절한 경우 생성된 mRNA 전사체의 단백질 또는 폴리펩타이드로의 번역(translation)을 의미한다. 따라서, 문맥에서 명백해지는 바와 같이, 단백질 또는 폴리펩타이드의 발현은 오픈 리딩 프레임의 전사(transcription) 및 번역(translation)의 결과이다.
"대사 산물"은 대사에 의해 생성되는 모든 물질 또는 원하는 대사산물, 화학 물질, 알코올 또는 폴리케타이드 등을 발생시키는 특정 대사 과정에 필요하거나 참여하는 물질을 의미한다. 대사산물은 대사의 출발 물질(예: 탄수화물, 당 인산, 피루브산 등), 중간체(예: 아세틸-coA) 또는 최종 생성물(예: 올리베톨산)을 수행하는 유기 화합물일 수 있다. 대사산물은 더 복잡한 분자를 구성하는 데 사용되거나 더 간단한 분자로 분해될 수 있다. 중간 대사산물은 다른 대사산물에서 합성되어 더 복잡한 물질을 만드는 데 사용되거나 때로는 화학 에너지의 방출과 함께 더 간단한 화합물로 분해될 수 있다.
본 명세서에 사용된 바와 같이, "대사적으로 조작된" 또는 "대사 조작"이라는 용어는 헥사노일-CoA, 또는 미생물 또는 무세포 시스템에서 올리베톨산 또는 이의 유사체와 같은 최종 생성물과 같이 원하는 대사산물의 생산을 위하여 생합성 유전자, 오페론과 관련된 유전자, 및 폴리뉴클레오티드의 제어 요소의 합리적인 경로 설계 및 조립을 포함한다. 생합성 경로의 합리적인 경로 설계 및 조립에는 원하는 대사 산물의 생산을 위한 보조 인자(co-factors)가 포함될 수 있다. "대사적으로 조작된"은 유전 공학 및 원하는 경로로 이어지는 중간체와 경쟁하는 경쟁 대사 경로의 감소, 파괴 또는 녹아웃을 포함하는 적절한 배양 조건을 사용하여 전사, 번역, 단백질 안정성 및 단백질 기능의 조절 및 최적화에 의한 대사 플럭스의 최적화를 추가로 포함할 수 있다. 예를 들어, 무세포 시스템에서 사용되는 하나 이상의 효소를 발현하는 숙주 세포는 경쟁 경로 효소를 제한하거나 제거하여 파괴되거나 무세포 제제에 존재할 수 있는 오염물질 또는 효소를 제거하도록 추가로 조작될 수 있다.
생합성 유전자는 숙주에 대해 이질적이거나 돌연변이유발, 재조합 및/또는 내인성 숙주 세포에서 이종 발현 조절 서열과의 회합에 의해 변형됨으로써 숙주 미생물에 대해 이종성(heterologous)일 수 있다. 일 실시예에서, 폴리뉴클레오티드가 숙주 유기체에 대해 이종 유전적인 경우, 폴리뉴클레오티드는 코돈 최적화될 수 있다.
용어 "폴리뉴클레오타이드", "핵산" 또는 "재조합 핵산"은 폴리뉴클레오타이드, 예를 들어 데옥시리보핵산(DNA), 및 적절한 경우 리보핵산(RNA)을 의미한다. 달리 명확하게 표시되지 않는 한 "T"를 포함하는 모든 서열은 "T"를 "U"로 대체하여 서열을 수정할 수 있음을 인식해야 한다.
본 명세서에서 상호교환적으로 사용되는 용어 "단백질" 또는 "폴리펩티드"는 펩티드 결합이라고 하는 화학 결합에 의해 함께 연결된 아미노산이라고 하는 화학적 빌딩 블록의 하나 이상의 사슬을 포함한다. 단백질 또는 폴리펩티드는 효소로 기능할 수 있다.
용어 "재조합 미생물" 및 "재조합 숙주 세포"는 본 명세서에서 상호교환적으로 사용되며, 이종 폴리뉴클레오티드를 발현하거나 내인성 폴리뉴클레오티드를 과발현하거나, 또는 비발현된 내인성 폴리뉴클레오티드를 발현하도록 유전적으로 변형된 미생물을 의미한다. 폴리뉴클레오티드는 일반적으로 본원에 기재된 바와 같이 원하는 대사산물을 생산하기 위한 대사 경로에 관여하는 표적 효소를 코딩하지만, 조절 또는 활성 또는 전사에 필요한 단백질 인자를 또한 포함할 수 있다. 따라서, 본 명세서에 기재된 재조합 미생물은 이전에 모 미생물(parental microorganism)에 의해 발현되거나 과발현되지 않은 표적 효소를 발현 또는 과발현하도록 유전적으로 조작되었다. 용어 "재조합 미생물" 및 "재조합 숙주 세포"는 특정 재조합 미생물뿐만 아니라 이러한 미생물의 자손(progeny) 또는 잠재적 자손(potential progeny)을 지칭하는 것으로 이해된다. 또한, 재조합 미생물이 폴리펩티드의 공급원으로서 사용될 수 있고 재조합 미생물이 원하는 대사산물의 생성을 위한 전체 경로를 가질 필요는 없다는 것을 이해해야 한다. 오히려, 대사 경로를 위한 폴리펩타이드의 전부는 아니지만 하나 이상을 각각 갖는 복수의 재조합 미생물은 원하는 대사산물을 생산하기 위해 공배양될 수 있거나, 파괴될 수 있고 무세포 환경이 사용되거나 발현된 폴리펩티드가 각각의 재조합 미생물로부터 분리될 수 있다.
용어 "기질" 또는 "적합한 기질"은 효소의 작용에 의해 다른 화합물로 전환되거나 전환되는 것을 의미하는 임의의 물질 또는 화합물을 의미한다. 이 용어는 단일 화합물뿐만 아니라 용액, 혼합물 및 적어도 하나의 기질을 함유하는 기타 물질 또는 이들의 유도체와 같은 화합물의 조합을 포함한다. 또한, 용어 "기질"은 출발 물질로 사용하기에 적합한 탄소원을 제공하는 화합물뿐만 아니라 본원에 기재된 바와 같은 경로에서 사용되는 중간체 및 최종 생성물 대사산물을 포함한다. 또한, 기질은 산화 또는 환원된 보조인자 또는 인산화 또는 탈인산화된 인자일 수 있다.
칸나비노이드의 확장 가능한 화학적 합성은 칸나비노이드의 복잡한 구조로 인해 어려운 과제로 남아 있다. 그러나 많은 장애에 대한 치료 옵션으로서 칸나비노이드에 대한 전례 없는 수요를 고려할 때 높은 역가에서 칸나비노이드를 얻기 위한 지속 가능한 접근 방식은 큰 유용성을 가질 것이다. 칸나비노이드는 주요 빌딩 블록인 제라닐 피로포스페이트(geranyl pyrophosphate, GPP)와 올리베톨산(olivetolic acid, OA)을 생성하는 지방산, 폴리케타이드 및 테르펜 생합성 경로의 조합에서 파생된다. 칸나비노이드의 미생물 발효에서 병목 현상은 단순한 빌딩 블록을 복잡한 후기 단계 화합물에 연결하는 중심 중간체인 올리베톨산(OA)이다(예: 도 1 참조). 현재까지 올리베톨산 합성을 위한 많은 발효 기반 공정이 개발되었다. 예를 들어, 헥사노일-CoA에서 시작하여 폴리케토아실-CoA 티올라제와 올리베톨산 사이클라제(OAC)의 탠덤 작용에 의한 올리베톨산의 구성이 제안되었다. 추가 제안에서는 특정 게라닐 전이효소를 사용하여 올리베톨산을 칸나비게롤산으로 전환할 수 있다고 제안했다. 두 제안 모두 대마(Cannabis sativa)에서 유래한 테트라케타이드 합성효소(tetraketide synthase, TKS)와 올리베톨산 사이클라제(olivetolic acid cyclase, OAC)라는 두 가지 효소의 동시 사용에 의존한다. 이러한 전략을 사용할 때의 단점은 두 가지다. (i) 시작 단위 헥사노일-CoA의 가용성은 일반적으로 미생물 숙주에서 낮으며, 이는 칸나비노이드의 최종 수율을 제한한다. (ii) TKS 및 OAC의 탠덤 사용은 하나의 제품인 올리베톨산만을 제공하지만, 추가 칸나비노이드 유사체의 생성은 칸나비노이드 기본 구조의 사소한 변화의 구조/활성을 결정하는 데 특히 유익할 것이다.
본 발명은 인시투 헥사노일-CoA를 생성할 수 있는 생합성 플랫폼/클러스터를 제공함으로써 상기 문제에 대한 객관적인 기술 솔루션을 제공하고, 추가로 올리베톨산(OA) 뿐만 아니라 그의 유사한 구조적 유사체를 생성함으로써 제품 유연성을 나타낼 수 있다. 추가로, 본 명세서에 기재된 생합성 경로는 비식물 유기체로부터 유래된 OA 합성효소 및 OA 사이클라제를 이용할 수 있어, 미생물 생산 시스템으로부터 OA 및 OA 유사체의 생산을 촉진할 수 있다.
특정 실시예에서, 본 발명은 본 명세서에 개시된 생합성 플랫폼을 포함하는, 올리베톨산 및 그의 유사체를 생성하기 위한 무세포 생물계(cell-free biosystem)를 제공한다. 미생물 시스템은 경쟁 경로로 인한 낮은 수율; 느린 성장률 또는 경로 최적화의 어려움으로 인한 낮은 생산성; 오염 미생물 성장; 제품 독성; 및 고가의 제품 격리를 포함하여 비용 경쟁력을 달성하기 어렵게 만드는 다양한 기술적 문제에 의해 방해를 받을 수 있다. 대조적으로, 무세포 바이오시스템은 이러한 많은 문제를 피할 수 있다. 예를 들어, 무세포 바이오시스템은 산업적 응용에 적합한 몇 가지 장점이 있다: 경로 설계의 더 높은 수준의 유연성; 구성 요소 최적화에 대한 더 큰 제어; 보다 빠른 설계-구축-테스트 주기; 및 중간체 또는 생성물의 세포 독성으로부터의 자유. 시험관 내 바이오시스템은 살아있는 미생물이나 화학 촉매가 구현할 수 없는 생물학적 반응을 구현할 수 있다. 세포막의 장벽이 없는 효소 시스템은 일반적으로 미생물 시스템보다 더 빠른 반응 속도를 갖는다. 예를 들어, 효소 연료 전지는 일반적으로 미생물 연료 전지보다 훨씬 더 높은 출력을 가지고 있다. 효소 칵테일은 또한 미생물보다 독성 화합물에 더 잘 견딘다. 효소 혼합물은 일반적으로 고온, 낮은 pH, 유기 용매 또는 이온성 액체의 존재와 같은 광범위한 반응 조건에서 작동한다. 시험관 내에서 단일 전용 경로를 구축하면 세포에서 발생하는 부반응을 제거할 수 있으므로 거의 100% 수율과 빠른 반응 시간이 가능하다.
무세포 생물계의 공통 구성요소는 세포 추출물, 에너지원, 아미노산 공급, 마그네슘과 같은 보조인자, 및 원하는 유전자를 갖는 DNA를 포함한다. 세포 추출물은 관심 세포를 용해하고 세포벽, DNA 게놈 및 기타 파편을 원심분리하여 수득한다. 나머지는 리보솜, 아미노아실-tRNA 합성효소, 번역 개시 및 신장 인자, 뉴클레아제 등을 포함한 필요한 세포 기계이다.
두 가지 유형의 DNA가 무세포 생물계에서 일반적으로 사용된다: 플라스미드 및 선형 발현 템플릿(LET). 플라스미드는 원형이며 세포 내부에서만 만들어진다. LETs는 인큐베이터에서 세포를 키우는 것보다 훨씬 빠르게 DNA를 복제하는 PCR을 통해 훨씬 더 효과적으로 만들 수 있다. LETs를 만드는 것이 더 쉽고 빠르지만 플라스미드 수율은 일반적으로 무세포 제제에서 훨씬 더 높다. 이 때문에 플라스미드가 있는 무세포 제제의 수율에 접근하기 위해 무세포 제제 LET 수율을 최적화하는 데 더 많은 연구가 집중되었다. 에너지원은 일반적으로 무세포 반응의 일부이다. 일반적으로 아미노산 공급과 함께 필요한 에너지원을 포함하는 별도의 혼합물이 반응을 위해 추출물에 첨가된다. 일반적인 공급원은 포스포엔올피루브산(phosphoenolpyruvate), 아세틸 포스페이트(acetyl phosphate), 크레아티닌 포스페이트(creatinine phosphate)이다.
일 실시에서, 본 발명은 올리베톨산 및 유사체를 생산하는 데 사용되는 본 명세서에 개시된 생합성 플랫폼을 포함하는 플라스미드 기반 무세포 생물계의 사용을 제공한다. 이러한 시스템에 사용되는 플라스미드 또는 벡터는 하기에 제시된 실시예에서 사용된 것과 동일한 벡터 또는 하기에 보다 충분히 기재된 HRPKS, NRPKS 및 ΨAC-TE 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 구축물일 수 있다. 다른 실시예에서, 무세포계는 무세포 추출물에 의해 생성된다. 이 실시예에서, 본 발명의 생합성 플랫폼의 다양한 효소, 예를 들어 HRPKS, NRPKS 및 ΨAC-TE는 미생물에서 발현되고, 추출되어 무세포 생물계에서 조 추출물로서 사용된다. 대안적으로, 다양한 효소는 무세포 생물계에서 사용하기 전에 추가로 정제될 수 있다. 당업계에 공지된 임의의 수의 기술을 사용하여 본원에 개시된 생물계의 효소를 정제할 수 있으며, 친화성 크로마토그래피(예: 금속 결합, 면역친화성, 단백질 태그 등); 전기영동; HPLC 및 LC 크로마토그래피 기반 방법(예: 크기 배제 크로마토그래피, 이온 교환 크로마토그래피, 역상 크로마토그래피, 양이온 교환 크로마토그래피); 여과 기술(예: 겔 여과); 면역블롯팅; 및 원심분리의 사용을 포함한다.
본 발명은 올리베톨산 및 유사체를 생산하는 데 사용되는 본 명세서에 개시된 생합성 플랫폼을 포함하는 LET 기반 무세포 생물계의 사용을 제공한다. 선형 발현 템플릿은 PCR로 빠르게 생성할 수 있어, 여러 구성을 빠르고 쉽게 스크리닝할 수 있다. 발현 벡터는 단백질 생산을 확대할 수 있게 한다. 관심 있는 유전자가 발현 벡터에 직접 삽입되거나 선형 템플릿이 먼저 PCR에 의해 생성되고 이어서 클로닝(cloned)된다. 달성된 단백질 수율은 확장된 기능 및 구조 분석 또는 NMR 분광 또는 X선 결정학 연구를 위한 표지된 단백질의 생산에 충분하다. LET 키트는 biotechrabbit과 같은 다양한 공급업체에서 상업적으로 구입할 수 있다.
본 발명은 본 발명의 생합성 플랫폼을 포함 및/또는 이를 발현시키기 위해 사용되는 조작된 미생물을 추가로 제공한다.
용어 "미생물(microorganism)"은 고세균(Archaea), 박테리아(Bacteria) 및 유카리아(Eucarya) 도메인으로부터의 원핵 및 진핵 미생물 종을 포함하고, 후자는 효모(yeast) 및 사상 진균(filamentous fungi), 원생동물(protozoa), 조류(algae) 또는 고등 원생생물(higher Protista)을 포함한다. 용어 "미생물 세포(microbial cells)" 및 "미생물(microbes)"은 용어 미생물과 상호교환적으로 사용된다.
용어 "원핵생물(prokaryotes)"는 당업계에서 인식되고 있으며 핵 또는 다른 세포 소기관을 함유하지 않는 세포를 의미한다. 원핵생물은 일반적으로 박테리아와 고세균의 두 영역 중 하나로 분류된다. 고세균과 박테리아 도메인의 유기체 사이의 결정적인 차이는 16S 리보솜 RNA의 뉴클레오티드 염기 서열의 근본적인 차이를 기반으로 한다.
용어 "고세균"은 일반적으로 특이한 환경에서 발견되고 리보솜 단백질의 수 및 세포 벽 내 무라믹산의 결핍을 비롯한 여러 기준에 의해 나머지 원핵생물과 구별되는 멘도시쿠테스(Mendosicutes) 분류 유기체의 분류를 의미한다. ssrRNA 분석에 기초하여 고세균은 계통발생학적으로 구별되는 두 그룹인 Crenarchaeota와 Euryarchaeota로 구성된다. 그들의 생리학에 기초하여 고세균은 세 가지 유형으로 구성될 수 있다: 메탄 생성 물질(메탄을 생성하는 원핵생물); 극도의 호염성체(매우 높은 농도의 염([NaCl])에서 사는 원핵생물), 및 극단(하이퍼) thermophilus(매우 높은 온도에서 사는 원핵생물). 박테리아와 구별되는 통합된 고고생물의 특징(즉, 세포벽에 뮤레인이 없음, 에스테르 결합 막 지질 등)외에도, 이 원핵생물은 특정 서식지에 적응하는 독특한 구조적 또는 생화학적 특성을 나타낸다. 크렌고균(Crenarchaeota)은 주로 고온성 황-의존성 원핵생물로 구성되며 에우리고균(Euryarchaeota)은 메탄생성균과 극도의 호염성 생물을 포함한다.
"박테리아(Bacteria)" 또는 "진정박테리아(eubacteria)"는 원핵 유기체의 도메인을 의미한다. 박테리아는 다음과 같이 최소한 11개의 별개의 그룹을 포함한다: (1) 그람 양성(그람+) 박테리아, 그 중 두 가지 주요 하위 분류가 있다: (1) 높은 G+C 그룹(방선균, 마이코박테리아, 마이크로코커스 등) (2) 낮은 G+C 그룹(바실러스, 클로스트리디아, 락토바실러스, 포도상구균, 연쇄상구균, 마이코플라스마); (2) 프로테오박테리아, 예를 들어 보라색 광합성 +비-광합성 그람-음성 박테리아(대부분의 "일반적인" 그람-음성 박테리아 포함); (3) 시아노박테리아, 예를 들어, 산소 광영양체; (4) 스피로헤타 및 관련 종; (5) 플랑토마이세스; (6) 박테로이데스, 플라보박테리아; (7) 클라미디아; (8) 녹색 유황 박테리아; (9) 녹색 비-황 박테리아(또한 혐기성 광영양체); (10) 방사선 내성 미세 구균 및 동족; 및 (11) Thermotoga 및 Thermosipho 호열성 물질.
"그람-음성 박테리아"는 구균(cocci), 비장내 간상체(nonenteric rods) 및 장내 간상체(enteric rods)를 포함한다. 그람 음성 박테리아의 속은 예를 들어 나이세리아(Neisseria), 스피릴룸(Spirillum), 파스퇴렐라(Pasteurella), 브루셀라(Brucella), 예르시니아(Yersinia), 프란시셀라(Francisella), 헤모필루스(Haemophilus), 보르데텔라(Bordetella), 에스케리키아(Escherichia), 살모넬라(Salmonella), 시겔라(Shigella), 클렙시엘라(Klebsiella), 프로테우스(Proteus), 비브리오(Vibrio), 슈도모나스(Pseudomonas), 박테로이데스(Bacteroides), 아세토박테리움(Acetobacterium), 에어로박터(Aerobacter), 아조토박터(Azotobacter), 스피릴라(Spirilla), 세라티아(Serratia), 비브리오(Vibrio), 리조비움(Rhizobium), 클라미디아(Chlamydia), 리케차(Rickettsia), 트레포네마(Treponema) 및 푸소박테리움(Fusobacterium)을 포함한다.
"그람 양성 박테리아"는 구균(cocci), 비포자성 간상체(nonsporulating rods) 및 포자성 간상체(sporulating rods)를 포함한다. 그람 양성 박테리아의 속은 예를 들어, 악티노마이세스(Actinomyces), 바실러스(Bacillus), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 에리시펠로트릭스(Erysipelothrix), 락토바실러스(Lactobacillus), 리스테리아(Listeria), 마이코박테리움(Mycobacterium), 믹소코커스(Myxococcus), 노카르디아(Nocardia), 스타필로코커스(Staphylococcus), 스트렙토코커스(Streptococcus) 및 스트렙토마이세스(Streptomyces)를 포함한다.
따라서, 본 발명은 유전 물질을 선택된 숙주 또는 모 미생물에 도입함으로써 생성된 "조작된" 또는 "변형된" 미생물을 제공함으로써 미생물의 세포 생리학 및 생화학을 변형 또는 변경시킨다. 유전 물질의 도입을 통해, 모 미생물은 새로운 특성, 예를 들어 새로운 또는 더 많은 양의 세포 내 대사산물을 생산하는 능력을 얻는다. 모 미생물에 도입된 유전 물질은 생합성 플랫폼에 관련된 하나 이상의 효소를 코딩하는 유전자(들) 또는 유전자(들)의 일부를 포함하고, 올리베톨산 및 이의 유사체 생성에 관여하는 하나 이상의 효소를 코딩하는 유전자(들) 또는 유전자(들)의 일부를 포함하며, 또한 이들 유전자의 발현 및/또는 발현 조절을 위한 추가 요소, 예를 들어 프로모터 서열을 포함할 수 있다. 본 명세서에 개시된 생합성 경로를 발현하도록 조작될 수 있는 미생물은 박테리아, 고세균, 조류 및 진균을 포함한다. 본 명세서에 개시된 생합성 경로를 발현하도록 조작될 수 있는 적절한 박테리아의 예로, 대장균(Escherichia coli), 로드호박터 스페로이데스(Rodhobacter sphaeroides), 슈도알테로모나스 할로플랑크티스(Pseudoalteromonas haloplanktis), 시와넬라 sp. 균주 Ac10(Shewanella sp. strain Ac10), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 푸티다(Pseudomonas putida), 녹농균(Pseudomonas aeruginosa), 할로모나스 엘롱가타(Halomonas elongata), 크로모할로박터 살렉시겐(Chromohalobacter salexigens), 스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 그리세우스(Streptomyces griseus), 노카르디아 락탐두란스(Nocardia lactamdurans), 마이코박테리움 스메그마티스(Mycobacterium smegmatis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘툼(Brevibacterium lactofermentum), 고초균(Bacillus subtilis), 바실러스 브레비스(Bacillus brevis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 락토코커스 락티스(Lactococcus lactis), 락토바실러스 플란타룸(Lactobacillus plantarum), 락토바실러스 카세이(Lactobacillus casei), 락토바실러스 루테리(Lactobacillus reuteri), 및 락토바실러스 가세리(Lactobacillus gasseri)를 포함한다. 본 명세서에 개시된 생합성 경로를 발현하도록 조작될 수 있는 적절한 고세균의 예로, 메타노칼도코커스 야나시(Methanocaldococcus jannaschii)(메타노코커스 야나시(Methanococcus jannaschii)) 및 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus)가 있다. 본 명세서에 개시된 생합성 경로를 발현하도록 조작될 수 있는 적절한 진균의 예로, 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피치아 파스토리스(Pichia pastoris), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴리티카(Yarrowia lipolytica), 아스페르길루스 니둘란스(Aspergillus nidulans), 트리코데르마 리세이(Trichoderma reesei), 푸사리움 옥시스포룸(Fusarium oxysporum), 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 아쉬비아 고쉬피(Ashbya gossypii), 누룩곰팡이(A. oryzae), 및 크리소스포리움 룩크노웬스(Chrysosporium lucknowense)를 포함한다.
조작되거나 변형된 미생물은 숙주 또는 모 미생물에 유전 물질을 도입하는 것 외에 대안으로 또는 추가로, 미생물의 세포 생리학 및 생화학을 변경하기 위해 유전자 또는 폴리뉴클레오티드의 파괴, 결실 또는 녹아웃을 포함할 수 있다. 유전자 또는 폴리뉴클레오타이드의 감소, 파괴 또는 녹아웃을 통해 미생물은 새롭거나 개선된 특성(예: 새롭거나 더 많은 양의 세포내 대사산물 생성, 원하는 경로로 대사산물의 흐름 개선, 및/또는 또는 바람직하지 않은 부산물의 생산을 감소)을 얻는다. 예를 들어, 경쟁 경로의 효소를 제거하면서 대사 경로에서 원하는 효소 세트를 발현하도록 유기체를 조작하는 것이 바람직할 수 있다. 이 엔지니어링은 시험관 내(파괴 또는 정제 시 바람직하지 않은 효소가 존재하지 않는 경우) 또는 생체 내 모두에 적용할 수 있다.
"천연" 또는 "야생형" 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포는 자연에서 발생하는 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포를 의미한다.
"모 미생물"은 재조합 미생물을 생성하는데 사용되는 세포를 의미한다. 용어 "모 미생물"은 일 실시예에서, 자연에서 발생하는 세포, 즉 유전적으로 변형되지 않은 "야생형" 세포를 설명한다. 용어 "모 미생물"은 추가 조작을 위한 "모" 역할을 하는 세포를 추가로 설명한다. 이 후자의 실시예에서, 세포는 유전적으로 조작되었을 수 있지만, 추가 유전 조작을 위한 소스 역할을 한다.
예를 들어, 야생형 미생물은 HRPKS와 같은 제1 표적 효소를 발현하거나 과발현하도록 유전적으로 변형될 수 있다. 이 미생물은 제2 표적 효소를 발현하거나 과발현하도록 변형된 미생물의 생성에서 모 미생물로서 작용할 수 있다. 본 명세서에 사용된 "발현" 또는 "과발현"은 원하는 유전자 생성물의 표현형 발현(phenotypic expression)을 의미한다. 일 실시예에서, 유기체에서 자연 발생 유전자는 이종 프로모터 또는 조절 도메인에 연결되도록 조작될 수 있으며, 여기서 조절 도메인은 유전자의 발현을 유발하여 야생형 유기체에 비해 그의 정상 발현을 변형시킨다. 대안적으로, 유기체는 유전자에 대한 억제인자 기능을 제거하거나 감소시켜 발현을 변형시키도록 조작될 수 있다. 또 다른 실시예에서, 원하는 발현 조절/조절 요소에 작동가능하게 연결된 유전자 서열을 포함하는 카세트는 미생물에 조작된다. 원하는 발현 조절/조절 요소에 작동 가능하게 연결된 유전자 서열을 포함하는 카세트가 미생물에 조작된다.
따라서, 모 미생물은 연속적인 유전자 변형 이벤트에 대한 참조 세포로서 기능한다. 각각의 변형 이벤트는 하나 이상의 핵산 분자를 참조 세포에 도입함으로써 달성될 수 있다. 도입은 하나 이상의 표적 효소의 발현 또는 과발현 또는 하나 이상의 표적 효소의 감소 또는 제거를 촉진한다. 용어 "촉진한다"는 예를 들어, 모 미생물에서 프로모터 서열의 유전적 변형을 통해 표적 효소를 코딩하는 내인성 폴리뉴클레오티드(endogenous polynucleotides)의 활성화를 포함하는 것으로 이해된다. 또한, 용어 "촉진한다"는 표적 효소를 코딩하는 외인성 폴리뉴클레오티드(exogenous polynucleotides)를 모 미생물에 도입하는 것을 포함하는 것으로 이해된다.
올리베톨산 및 이의 유사체를 생성하기 위한 효소를 코딩하는 폴리뉴클레오티드는 상동체, 변이체, 단편, 관련 융합 단백질 또는 이의 기능적 등가물을 포함하며, 박테리아(bacterial) 또는 효모 세포(yeast cells)와 같은 적절한 숙주 세포에서 이러한 폴리펩티드의 발현을 지시하는 재조합 핵산 분자에 사용된다.
본 명세서에 기재된 폴리뉴클레오티드는 "유전자"를 포함하고, 상기 기재된 핵산 분자는 "벡터" 또는 "플라스미드"를 포함하는 것으로 이해된다. 따라서, "구조적 유전자"라고도 하는 용어 "유전자"는 하나 이상의 단백질 또는 효소의 전부 또는 일부를 포함하는 아미노산 서열을 포함하는 특정 폴리펩티드를 코딩하는 폴리뉴클레오티드를 의미하고, 조절(전사되지 않은) DNA 서열, 예를 들어 유전자가 발현되는 조건을 결정하는 프로모터 영역 또는 발현 조절 요소를 포함할 수 있다. 유전자의 전사 영역은 코딩 서열 뿐만 아니라 인트론, 5'-UTR(untranslated region), 3'-UTR을 포함하는 비번역 영역을 포함할 수 있다.
당해 분야의 숙련가는 유전자 코드의 퇴행성 특성으로 인해, 뉴클레오티드 서열이 상이한 다양한 코돈을 사용하여 주어진 아미노산을 코딩할 수 있음을 인식할 것이다. 본 명세서에 기재된 생합성 효소 또는 폴리펩타이드(예를 들면, SEQ ID NO: 2)를 코딩하는 특정 폴리뉴클레오타이드 또는 유전자 서열은 단지 본 발명의 실시예를 예시하기 위해 본 명세서에 참조되며,
본 발명은 본 발명의 방법에 이용된 폴리펩티드 및 효소의 단백질과 동일한 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 임의의 서열의 폴리뉴클레오티드 또는 그에 대해 적어도 50%-99% 동일한 폴리펩티드 서열을 포함한며, 100% 동일성을 갖는 서열로서의 생물학적 활성을 갖는다. 예를 들어, 폴리펩티드는 전형적으로 원하는 활성의 손실 또는 상당한 손실 없이 그의 아미노산 서열에서 하나 이상의 아미노산 치환, 결실 및 삽입을 견딜 수 있다. 본 발명은 교대 아미노산 서열을 갖는 이러한 폴리펩티드를 포함하고, 본 명세서에 제시된 아미노산 서열은 단지 본 발명의 예시적인 실시예를 예시한다.
본 발명은 하나 이상의 표적 효소를 코딩하는, 본 명세서의 다른 곳에서 더 상세히 기재된 바와 같이, 재조합 DNA 발현 벡터 또는 플라스미드 형태의 폴리뉴클레오티드를 제공한다. 일반적으로, 이러한 벡터는 숙주 미생물의 세포질에서 복제하거나, 숙주 미생물의 염색체 DNA에 통합될 수 있고, 무세포 시스템에서 사용될 수 있다. 두 경우 모두 벡터는 안정적인 벡터(즉, 벡터는 선택적인 압력만 있어도 많은 세포 분열에 걸쳐 존재함) 또는 일시적인 벡터(즉, 벡터는 세포 분열 수가 증가함에 따라 숙주 미생물에 의해 점차적으로 손실됨)일 수 있다. 본 발명은 분리된 형태(즉, 순수하지 않지만, 자연에서 발견되지 않는 풍부 및/또는 농도로 제제에 존재함) 및 정제된 형태(즉, 오염 물질이 실질적으로 없거나 해당 DNA가 자연에서 발견되는 물질이 실질적으로 없음)로 DNA 분자를 제공한다.
본 발명의 폴리뉴클레오티드는 표준 PCR 증폭 기술 및 하기 실시예 섹션에 기재된 절차에 따라 주형 및 적절한 올리고뉴클레오티드 프라이머로서 cDNA, mRNA 또는 대안적으로 게놈 DNA를 사용하여 증폭될 수 있다. 그렇게 증폭된 핵산은 적절한 벡터로 클로닝될 수 있고, DNA 서열 분석에 의해 특성화될 수 있다. 또한, 뉴클레오티드 서열에 상응하는 올리고뉴클레오티드는 예를 들어 자동화된 DNA 합성기를 사용하여 표준 합성 기술에 의해 제조될 수 있다.
또한, 본 명세서에 기재된 효소와 상동성인 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드 분자는 특정 폴리펩티드를 코딩하는 뉴클레오티드 서열에 하나 이상의 뉴클레오티드 치환, 부가 또는 결실을 도입함으로써 생성될 수 있으며, 이로써 하나 이상의 아미노 산 치환, 첨가 또는 결실이 암호화된 단백질에 도입된다. 돌연변이는 부위 지정 돌연변이 유발 및 PCR 매개 돌연변이 유발과 같은 표준 기술에 의해 폴리뉴클레오타이드에 도입될 수 있다. 비보존적 아미노산 치환을 만드는 것이 바람직할 수 있는 위치와 대조적으로, 일부 위치에서는 보존적 아미노산 치환을 만드는 것이 바람직하다.
당업자에 의해 이해되는 바와 같이, 특정 숙주에서 그의 발현을 향상시키기 위해 코딩 서열을 변형시키는 것이 유리할 수 있다. 유전 코드는 64개의 가능한 코돈으로 중복되지만 대부분의 유기체는 일반적으로 이러한 코돈의 하위 집합을 사용한다. 한 종에서 가장 많이 사용되는 코돈을 최적 코돈이라고 하고, 자주 사용되지 않는 코돈을 희귀 코돈 또는 저사용 코돈으로 분류한다. 코돈은 숙주의 선호하는 코돈 사용을 반영하기 위해 대체될 수 있으며, 때때로 "코돈 최적화" 또는 "종 코돈 편향 제어"라고 하는 프로세스이다.
특정 원핵 또는 진핵 숙주가 선호하는 코돈을 함유하는 최적화된 코딩 서열(참고 항목 Murray et al. (1989) Nucl. Acids Res. 17:477-508)은 예를 들어, 번역 속도를 증가시키거나 최적화되지 않은 서열로부터 생성된 전사물과 비교하여 더 긴 반감기와 같은 바람직한 특성을 갖는 재조합 RNA 전사물을 생성하기 위해 제조될 수 있다. 번역 정지 코돈은 호스트 선호도를 반영하도록 수정될 수도 있다. 예를 들어, S. cerevisiae 및 포유류에 대한 전형적인 정지 코돈은 각각 UAA 및 UGA이다. 단자엽(monocotyledonous) 식물에 대한 전형적인 정지 코돈은 UGA인 반면, 곤충 및 대장균은 일반적으로 UAA를 정지 코돈으로 사용한다(Dalphin et al. (1996) Nucl. Acids Res. 24: 216-218).
"형질전환(Transformation)"은 벡터가 숙주 세포에 도입되는 과정을 의미한다. 형질전환(또는 형질도입(transduction) 또는 형질감염(transfection))은 전기천공, 미세주입, 바이오리스틱(또는 입자 충격 매개 전달), 또는 아그로박테리움 매개 형질전환을 포함하는 다수의 수단 중 임의의 하나에 의해 달성될 수 있다.
"벡터"는 일반적으로 유기체, 세포 또는 세포 성분 사이에서 증식 및/또는 전달될 수 있는 폴리뉴클레오티드를 의미한다. 벡터에는 바이러스, 박테리오파지, 프로바이러스, 플라스미드, 파지미드, 트랜스포존 및 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체) 및 PLAC(식물 인공 염색체) 등과 같은 인공 염색체가 포함되며, 즉, 자율적으로 복제하거나 숙주 세포의 염색체에 통합될 수 있는 "에피솜"이다. 벡터는 또한 네이키드 RNA 폴리뉴클레오타이드, 네이키드 DNA 폴리뉴클레오타이드, 동일한 가닥 내에서 DNA와 RNA 모두로 구성된 폴리뉴클레오타이드, 폴리-리신-컨쥬게이션된 DNA 또는 RNA, 펩타이드-컨쥬게이션된 DNA 또는 RNA, 리포솜-컨쥬게이트된 DNA 등, 본질적으로 에피솜이 아니거나, 박테리움 또는 진균과 같은 상기 폴리뉴클레오티드 구조물 중 하나 이상을 포함하는 유기체일 수 있다.
발현 벡터의 다양한 성분은 벡터의 의도된 용도 및 벡터가 발현을 복제하거나 유도하도록 의도된 숙주 세포(들)에 따라 광범위하게 변할 수 있다. 박테리아, 효모, 사상균 및 기타 일반적으로 사용되는 세포에서 유전자의 발현 및 벡터의 유지에 적합한 발현 벡터 성분은 널리 알려져 있고 상업적으로 입수가능하다. 예를 들어, 본 발명의 발현 벡터에 포함시키기에 적합한 프로모터는 진핵생물 또는 원핵생물 숙주 미생물에서 기능하는 것을 포함한다. 프로모터는 숙주 미생물의 성장과 관련된 발현의 조절을 가능하게 하거나 화학적 또는 물리적 자극에 반응하여 유전자의 발현이 켜지거나 꺼지도록 하는 조절 서열을 포함할 수 있다. E. coli 및 특정 다른 박테리아 숙주 세포의 경우, 생합성 효소, 항생제 내성 부여 효소 및 파지 단백질에 대한 유전자로부터 유래된 프로모터가 사용될 수 있으며, 예를 들어 갈락토스, 락토스(lac), 말토스, 트립토판(trp), 베타-락타마제(bla), 박테리오파지 람다 PL 및 T5 프로모터를 포함한다. 또한, tac 프로모터(미국 특허 제4,551,433호, 전문이 본원에 참고로 포함됨)와 같은 합성 촉진제가 또한 사용될 수 있다. E. coli 발현 벡터의 경우, pUC, p1P, p1 및 pBR과 같은 E. coli 복제 기점을 포함하는 것이 유용하다.
따라서, 재조합 발현 벡터는 본 명세서에 개시된 생합성 플랫폼을 위한 적어도 하나의 발현 시스템을 함유하고, 이는 차례로 프로모터에 작동가능하게 연결된 유전자 코딩 서열의 적어도 일부 및 임의적으로 호환 가능한 숙주 세포에서 코딩 서열의 발현에 영향을 미치도록 작동하는 종결 서열로 구성된다. 숙주 세포는 발현 시스템 서열을 염색체외 요소로서 함유하거나 염색체 내로 통합되도록 본 발명의 재조합 DNA 발현 벡터를 사용한 형질전환에 의해 변형된다.
시험관 내 증폭 방법을 통해 숙련된 사람을 지도하기에 충분한 프로토콜의 예로, 중합효소연쇄반응(PCR), 리가제연쇄반응(LCR), Qβ-복제효소 증폭 및 기타 RNA 중합효소 매개 기술(예: NASBA)을 포함하며, 예를 들어 본 발명의 상동 핵산의 생산에 대한 것은, Berger, Sambrook, 및 Ausubel, 또한 Mullis et al. (1987) U.S. Pat. No. 4,683,202; Innis et al., eds. (1990) PCR 프로토콜: 방법 및 응용 프로그램의 가이드(Academic Press Inc. San Diego, Calif.) ("Innis"); Arnheim & Levinson (Oct. 1, 1990) C&EN 36-47; The Journal Of NIH Research (1991) 3: 81-94; Kwoh et al. (1989) Proc. Natl. Acad. Sci. USA 86: 1173; Guatelli et al. (1990) Proc. Nat'l. Acad. Sci. USA 87: 1874; Lomell et al. (1989) J. Clin. Chem 35: 1826; Landegren et al. (1988) Science 241: 1077-1080; Van Brunt (1990) Biotechnology 8: 291-294; Wu and Wallace (1989) Gene 4:560; Barringer et al. (1990) Gene 89:117; 및 Sooknanan and Malek (1995) Biotechnology 13:563-564에서 발견된다.
시험관내 증폭된 핵산을 클로닝하기 위한 개선된 방법은 Wallace et al., U.S. Pat. No. 5,426,039에 개시되어 있다.
PCR에 의해 큰 핵산을 증폭하는 개선된 방법은 Cheng et al. (1994) Nature 369: 684-685 및 여기에 인용된 참고 문헌에서, 최대 40 kb의 PCR 앰플리콘이 생성되는 것이 요약되어 있다. 당업자는 본질적으로 임의의 RNA가 역전사효소 및 중합효소를 사용하여 제한 소화, PCR 확장 및 서열분석에 적합한 이중 가닥 DNA로 전환될 수 있음을 이해할 것이다. 예를 들어, 위의 Ausubel, Sambrook 및 Berger를 참조하십시오.
추가로, 그리고 위에서 언급한 바와 같이, 생산에 유용한 본 발명의 생합성 플랫폼의 효소의 상동체(예를 들어, HRPKS, NRPKS, 및 TE)는 본 명세서에 제공된 미생물 및 방법에 포함된다. 첫 번째 과(first family) 또는 종(species)의 원래 효소 또는 유전자와 관련하여 사용된 "상동체"라는 용어는 기능적, 구조적 또는 게놈적 분석에 의해 결정되는 두 번째 과(second family) 또는 종의 별개의 효소 또는 유전자를 의미하고, 첫 번째 과 또는 종의 원래 효소 또는 유전자에 해당하는 두 번째 과 또는 종의 효소 또는 유전자를 의미한다. 대부분의 경우 상동체는 기능적, 구조적 또는 게놈 유사성을 갖는다. 유전자 프로브 및 PCR을 사용하여 효소 또는 유전자의 상동체를 쉽게 복제할 수 있는 기술이 알려져 있다. 상동체로서의 복제된 서열의 동일성은 기능적 분석 및/또는 유전자의 게놈 매핑을 사용하여 확인할 수 있다.
단백질을 코딩하는 핵산 서열이 제2 단백질을 코딩하는 핵산 서열과 유사한 서열을 갖는 경우 단백질은 제2 단백질에 "상동관계(homologous)"을 갖거나 "상동성(homologous)"이다. 대안적으로, 두 단백질이 "유사한" 아미노산 서열을 갖는다면, 단백질은 두 번째 단백질과 상동성을 갖는다. (따라서, "상동 단백질"이라는 용어는 두 단백질이 유사한 아미노산 서열을 갖는 것을 의미하는 것으로 정의된다).
본 발명에 사용된 바와 같이, 2개의 단백질(또는 단백질의 영역)은 아미노산 서열이 적어도 약 50% 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖을 때 실질적으로 상동성이다. 2개의 아미노산 서열 또는 2개의 핵산 서열의 동일성 퍼센트를 결정하기 위해 최적의 비교 목적을 위해 서열을 정렬한다(예를 들어, 갭은 최적의 정렬을 위해 첫 번째 및 두 번째 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 도입될 수 있고 비-상동성 서열은 비교 목적으로 무시될 수 있다). 일 실시예에서, 비교 목적으로 정렬된 참조 서열의 길이는 30% 이상, 전형적으로 40% 이상, 보다 전형적으로 50% 이상, 훨씬 더 전형적으로 60% 이상, 및 훨씬 더 전형적으로 참조 서열 길이의 70%, 80%, 90%, 100% 이상이다. 상응하는 아미노산 위치 또는 뉴클레오타이드 위치에서 아미노산 잔기 또는 뉴클레오타이드를 비교한다. 첫 번째 서열의 위치가 두 번째 서열의 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자는 그 위치에서 동일하다(본 명세서에 사용된 아미노산 또는 핵산 "동일성"은 아미노산 또는 핵산 "상동성"과 동등하다). 두 서열 사이의 퍼센트 동일성은 두 서열의 최적 정렬을 위해 도입되어야 하는 간격의 수와 각 간격의 길이를 고려하여 서열이 공유하는 동일한 위치의 수의 함수(function)이다.
퍼센트 서열 동일성으로도 지칭될 수 있는 폴리펩티드에 대한 서열 상동성은 일반적으로 서열 분석 소프트웨어를 사용하여 측정된다. 예를 들어, Sequence Analysis Software Package of the Genetics Computer Group(GCG), University of Wisconsin Biotechnology Center, 910 University Avenue, Madison, Wis. 53705를 참조하십시오. 단백질 분석 소프트웨어는 다양한 치환, 결실 및 보존적 아미노산 치환을 포함한 기타 변형에 할당된 상동성 측정을 사용하여 유사한 서열을 일치시킨다. 예를 들어, GCG에는 다른 종의 유기체 또는 야생형 단백질과 야생형 단백질과 이의 돌연변이 단백질(mutein) 사이의 상동성 폴리펩티드와 같이 밀접하게 관련된 폴리펩티드 간의 서열 상동성 또는 서열 동일성을 결정하기 위해 기본 매개변수와 함께 사용할 수 있는 "Gap" 및 "Bestfit"과 같은 프로그램을 포함한다. 예를 들어, GCG 버전 6.1을 참조하십시오.
분자 서열을 상이한 유기체로부터의 다수의 서열을 포함하는 데이터베이스와 비교하기 위해 사용되는 전형적인 알고리즘은 컴퓨터 프로그램 BLAST(Altschul, 1990; Gish, 1993; Madden, 1996; Altschul, 1997; Zhang, 1997), 특히 blastp 또는 tblastn(Altschul, 1997)이다. BLASTp의 일반적인 매개변수는 다음과 같다: Expectation value: 10(default); Filter: seg(default); Cost to open a gap: 11(default); Cost to extend a gap: 1(default); Max. alignments: 100(default); Word size: 11(default); No. of descriptions: 100(default); Penalty Matrix: BLOWSUM62.
다수의 상이한 유기체로부터의 서열을 포함하는 데이터베이스를 검색할 때, 아미노산 서열을 비교하는 것이 일반적이다. 아미노산 서열을 이용한 데이터베이스 검색은 당업계에 공지된 blastp 이외의 알고리즘에 의해 측정될 수 있다. 예를 들어, 폴리펩타이드 서열은 GCG 버전 6.1의 프로그램인 FASTA를 사용하여 비교할 수 있다. FASTA는 질의 및 검색 서열 사이에서 가장 잘 중첩되는 영역의 정렬 및 퍼센트 서열 동일성을 제공한다(Pearson, 1990, 본원에 참조로 포함됨). 예를 들어, 아미노산 서열 간의 퍼센트 서열 동일성은 본 명세서에 참조로 포함되는 GCG 버전 6.1에 제공된 기본 매개변수(단어 크기 2 및 PAM250 스코어링 매트릭스)와 함께 FASTA를 사용하여 결정될 수 있다.
"상동성"이 단백질 또는 펩티드와 관련하여 사용될 때, 동일하지 않은 잔기 위치는 종종 보존적 아미노산 치환에 의해 상이하다는 것이 인식된다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 화학적 특성(예: 전하 또는 소수성)을 갖는 측쇄(R 그룹)를 갖는 다른 아미노산 잔기로 치환된 것이다. 일반적으로 보존적 아미노산 치환은 단백질의 기능적 특성을 실질적으로 바꾸지 않을 것이다. 2개 이상의 아미노산 서열이 보존적 치환에 의해 서로 상이한 경우, 퍼센트 서열 동일성 또는 상동성 정도는 치환의 보존적 성질을 교정하기 위해 상향 조정될 수 있다. 이러한 조정을 위한 수단은 당업자에게 잘 알려져 있다(예를 들어, 본 명세서에 참고로 포함되는 Pearson et al., 1994 참조).
"보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 패밀리는 당업계에 정의되어 있다. 이러한 패밀리는 염기성 측쇄(예: 라이신, 아르기닌, 히스티딘), 산성 측쇄(예: 아스파르트산, 글루탐산), 전하를 띠지 않는 극성 측쇄(예: 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄(예: 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지 측쇄(예: 트레오닌, 발린, 이소류신) 및 방향족 측쇄(예: 타이로신, 페닐알라닌, 트립토판, 히스티딘)가 있는 아미노산을 포함한다. 다음 6개 그룹은 각각 서로에 대한 보존적 치환인 아미노산을 포함한다: 1) 세린(S), 트레오닌(T); 2) 아스파르트산(D), 글루탐산(E); 3) 아스파라긴(N), 글루타민(Q); 4) 아르기닌(R), 라이신(K); 5) 이소류신(I), 류신(L), 메티오닌(M), 알라닌(A), 발린(V) 및 6) 페닐알라닌(F), 티로신(Y), 트립토판(W).
일부 경우에, 동일한 기능적 전환/반응을 수행하지만 구조가 너무 상이하여 일반적으로 "상동성"이 아닌 것으로 결정되는 "동종효소"가 사용될 수 있다.
본 발명은 고환원 폴리케타이드 합성효소(HRPKS)를 포함하는 시스템 및/또는 재조합 미생물을 제공한다. 이 효소는 상기 및 하기에 기재된 바와 같이 올리베톨산 및 이의 유사체의 생산을 위해 본 명세서에 기재된 생합성 플랫폼에서 다른 효소와 조합될 수 있다. 효소는 헥사노일-CoA, 헥사노익산, 및/또는 이의 유사체를 포함하는 대사산물을 생성한다. 고환원 폴리케타이드 합성효소는 HRPKS 유전자, 폴리뉴클레오티드 또는 이의 상동체에 의해 코딩될 수 있다. HRPKS 유전자 또는 폴리뉴클레오티드는 메타리지움 아니소플리애(Metarhizium anisopliae)를 비롯한 다양한 미생물로부터 유래될 수 있다.
전술한 내용에 추가하여, 용어 "고환원 폴리케타이드 합성효소" 또는 "HRPKS"는 아세틸-CoA 및 말로닐-CoA로부터 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체의 형성을 촉매할 수 있는 단백질을 의미하고, SEQ ID NO: 2의 서열과 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 유사성을 공유하고, 기본 매개변수를 사용하여 NCBI BLAST에 의해 계산된다. 추가적인 상동체는 표 1에 제시된 SEQ ID NO: 2의 서열을 갖는 HRPKS에 대한 상동성 서열을 포함한다. 제시된 수탁 번호와 관련된 서열은 본 명세서에 참고로 포함된다.
표 1: 메타리지움 아니소플리애 HRPKS(SEQ ID NO: 2)에 대한 상동체.
또 다른 실시예에서, 본 발명에서 제공되는 시스템 또는 재조합 미생물은 비환원성 폴리케타이드 합성효소(NRPKS)를 포함한다. 이 효소는 상기 및 하기에 기재된 바와 같이 올리베톨산 및 이의 유사체의 생산을 위해 본 명세서에 개시된 생합성 플랫폼에서 다른 효소와 조합될 수 있다. 효소는 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체로부터 방향족 디올 대사산물을 포함하는 대사산물을 생성한다. 비환원성 폴리케타이드 합성효소는 NRPKS 유전자, 폴리뉴클레오티드 또는 이의 상동체에 의해 코딩될 수 있다. NRPKS 유전자 또는 폴리뉴클레오티드는 메타리지움 아니소플리애(Metarhizium anisopliae)를 비롯한 다양한 미생물로부터 유래될 수 있다.
전술한 내용에 추가하여, 용어 "비환원 폴리케타이드 합성효소" 또는 "NRPKS"는 헥사노일-CoA, 헥산산, 또는 이들의 유사체로부터 방향족 디올 대사산물의 형성을 촉매할 수 있는 단백질을 지칭하고, SEQ ID NO: 4의 서열과 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 유사성을 공유하고, 기본 매개변수를 사용하여 NCBI BLAST에 의해 계산된다. 추가적인 상동체는 표 2에 제시된 SEQ ID NO: 4의 서열을 갖는 HRPKS에 대한 상동성 서열을 포함한다. 상기 수탁 번호와 관련된 서열은 본원에 참고로 포함된다.
표 2: 메타리지움 아니소플리애 NRPKS(SEQ ID NO: 4)에 대한 상동체.
또 다른 실시예에서, 본 명세서에 제공된 시스템 또는 재조합 미생물은 티오에스테라제(TE)를 포함한다. 이 효소는 상기 및 하기에 기재된 바와 같이 올리베톨산 및 이의 유사체의 생산을 위해 본 명세서에 개시된 생합성 플랫폼에서 다른 효소와 조합될 수 있다. 이 효소는 방향족 디올 대사산물로부터 올리베톨산과 유사체를 생성한다. 티오에스테라제는 TE 유전자, 폴리뉴클레오타이드 또는 이의 상동체에 의해 코딩될 수 있다. TE 유전자 또는 폴리뉴클레오티드는 메타리지움 아니소플리애(Metarhizium anisopliae)를 비롯한 다양한 미생물로부터 유래될 수 있다.
전술한 내용에 추가하여, "ΨACP-TE"의 "티오에스테라제" 또는 "TE"라는 용어는 방향족 디올 대사산물로부터 올리베톨산 및 이의 유사체의 형성을 촉매할 수 있는 단백질을 지칭하고, SEQ ID NO: 6의 서열과 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 유사성을 공유하고, 기본 매개변수를 사용하여 NCBI BLAST에 의해 계산된다. 추가적인 상동체는 표 3에 제시된 SEQ ID NO: 6의 서열을 갖는 ΨACP-TE에 대한 상동성 서열을 포함한다. 상기 수탁 번호와 관련된 서열은 본원에 참고로 포함된다.
표 3: 메타리지움 아니소플리애 TE(SEQ ID NO: 6)에 대한 상동체.
본 명세서에 제시된 연구에서, 진균 메타리지움 아니소플리애에서 유래한 생합성 플랫폼이 높은 수율로 올리베톨산 및 그 유사체를 제공한다는 것이 발견되었다. 특히, 앞서 언급한 생합성 플랫폼은 아스페르길루스 니둘란스 및 올리베톨산에서 이종적으로 발현되었으며, 이의 유사체는 대사 최적화 없이 >4g/L의 총 역가로 수득되었다. 실제로, 생합성 플랫폼은 또한 대장균, 효모 및 올리베톨산 및 이의 유사체의 생산을 위한 기타 이종 미생물 숙주에서 발현될 수 있다.
또 다른 실시예에서, 본 발명은 본 발명의 생합성 플랫폼을 사용하여 올리베톨산 및 이의 유사체의 생산을 입증한다. 생합성 플랫폼은 다음을 포함하는 하나 이상의 이종 폴리뉴클레오티드의 발현 또는 과발현을 포함한다: (i) 아세틸-CoA 및 말로닐-CoA로부터 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체의 생성을 촉매하는 폴리펩타이드; (ii) 헥사노일-CoA, 헥사노익산, 또는 이들의 유사체로부터 방향족 디올 대사산물의 생성을 촉매하는 폴리펩타이드; (iii) 방향족 디올로부터 올리베톨산 및 이의 유사체의 생성을 촉매하는 폴리펩타이드. 일 실시예에서, 생합성 플랫폼은 (i) 또는 (ii)를 포함한다: (i) 무세포 시스템이 아세틸-CoA 및 말로닐-CoA를 올리베톨산 또는 이의 유사체로 전환할 수 있도록 (1) SEQ ID NO: 2에 대해 적어도 50-100% 서열 동일성을 갖는 폴리펩티드, (2) SEQ ID NO: 4에 대해 적어도 50-100% 서열 동일성을 갖는 폴리펩티드, 및 (3) SEQ ID NO:6에 대해 적어도 45-100% 서열 동일성을 갖는 폴리펩티드를 포함하는 폴리펩티드 세트를 포함하는 무세포 시스템; 또는 (ii) 미생물이 아세틸-CoA 및 말로닐-CoA를 올리베톨산 또는 이의 유사체로 전환할 수 있도록 (1) SEQ ID NO: 2에 대해 적어도 50-100% 서열 동일성을 갖는 폴리펩티드, (2) SEQ ID NO: 4에 대해 적어도 50-100% 서열 동일성을 갖는 폴리펩티드, (3) SEQ ID NO:6에 대해 적어도 45-100% 서열 동일성을 갖는 폴리펩티드, 및 (4) (1) 내지 (3)의 조합으로 구성된 군에서 선택되는 이종 폴리펩티드를 발현하는 적어도 하나의 재조합 세포.
일 실시예에서, 무세포 시스템은 SEQ ID NO: 2, 8, 및 14로 구성된 군에서 선택되는 서열을 갖는 제1 폴리펩티드; SEQ ID NO: 4, 10 및 16로 구성된 군에서 선택되는 서열을 갖는 제2 폴리펩티드; 및 SEQ ID NO: 6, 12 및 18로 구성된 군에서 선택되는 서열을 갖는 제3 폴리펩티드를 포함하며, 여기서 무세포 시스템은 아세틸-CoA 및 말로닐-CoA를 올리베톨산으로 전환시킬 수 있다.
또 다른 실시예에서, 적어도 하나의 재조합 미생물은 SEQ ID NO: 2, 8, 및 14로 구성된 군에서 선택되는 서열을 갖는 제1 이종 폴리펩티드; SEQ ID NO: 4, 10 및 16로 구성된 군에서 선택되는 서열을 갖는 제2 이종 폴리펩티드; 및/또는 SEQ ID NO: 6, 12 및 18로 구성된 군에서 선택되는 서열을 갖는 제3 이종 폴리펩티드를 발현하고, 여기서 적어도 하나의 재조합 미생물을 포함하는 배양물은 제1, 제2 및 제3 이종 폴리펩티드를 발현하며 아세틸-CoA 및 말로닐-CoA를 올리베톨산으로 전환시킬 수 있다.
당업자는 위에서 확인된 다양한 대사산물이 다른 이화작용 또는 동화작용 경로에 대한 기질로서 작용할 수 있음을 인지할 것이다.
전술한 효소 중 하나 이상(전부는 아님)을 갖는 서브시스템 또는 유기체가 이용될 수 있고, 이어서 경로의 나머지 효소 구성원을 포함하는 유기체 또는 다른 서브시스템과 조합될 수 있다는 것이 인식될 것이다.
앞서 언급한 바와 같이, 본 명세서 전반에 걸쳐 기재된 표적 효소는 일반적으로 대사산물을 생성한다. 또한, 본 명세서 전반에 걸쳐 기재된 표적 효소는 폴리뉴클레오티드에 의해 코딩된다.
따라서, 일 실시예에서, 본 발명에 제공된 시스템 또는 재조합 미생물은 고환원 폴리케타이드 합성효소(HRPKS) 또는 그의 상동체 또는 변이체를 포함한다. 이 발현은 생합성 경로의 효소와 결합될 수 있으며, 올리베톨산 또는 추가 대사산물의 생산을 위한 추가 다운스트림 효소를 추가로 포함할 수 있다. HRPKS는 메타리지움 아니소플리애(Metarhizium anisopliae), 톨리포클라듐 인플라툼(Tolypocladium inflatum), 메타리지움 라일리(Metarhizium rileyi) 및/또는 탈라로마이세스 아일랜드이쿠스(Talaromyces isolandicus)(또는 상기 표 1에서 확인된 기타 유기체)에서 파생될 수 있다. 다른 실시예에서, HRPKS의 조작된 변이체는 고환원 폴리케타이드 합성효소 활성이 있는 한 사용할 수 있고, 아세틸-CoA 및 말로닐-CoA를 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체로 전환시킬 수 있다. 이러한 조작된 변이체는 부위 지정 돌연변이유발, 지정 진화 등에 의해 얻어질 수 있다. 따라서, 본 발명에 포함되는 것은 메타리지움 아니소플리애로부터의 HRPKS의 서열과 적어도 85-99% 동일하고, 고환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 2와 85-100% 동일). 따라서, 본 발명에 포함되는 것은 톨리포클라듐 인플라툼로부터의 HRPKS의 서열과 적어도 85-99% 동일하고, 고환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다. 따라서, 본 발명에 포함되는 것은 메타리지움 라일리로부터의 HRPKS의 서열과 적어도 85-99% 동일하고, 고환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 8과 85-100% 동일). 따라서, 본 발명에 포함되는 것은 탈라로마이세스 아일랜드이쿠스로부터의 HRPKS의 서열과 적어도 85-99% 동일하고, 고환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 14와 85-100% 동일).
다른 또는 추가 실시예에서, 본 발명에 제공된 시스템 또는 재조합 미생물은 비환원 폴리케타이드 합성효소(NRPKS) 또는 그의 상동체 또는 변이체를 포함한다. 이 발현은 생합성 경로의 효소와 결합될 수 있으며, 올리베톨산 또는 추가 대사산물의 생산을 위한 추가 다운스트림 효소를 추가로 포함할 수 있다. NRPKS는 메타리지움 아니소플리애(Metarhizium anisopliae), 톨리포클라듐 인플라툼(Tolypocladium inflatum), 메타리지움 라일리(Metarhizium rileyi) 및/또는 탈라로마이세스 아일랜드이쿠스(Talaromyces isolandicus)(또는 상기 표 2에서 확인된 기타 유기체)에서 파생될 수 있다. 다른 실시예에서, NRPKS의 조작된 변이체는 비환원 폴리케타이드 합성효소 활성이 있는 한 사용할 수 있고, 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체를 방향족 디올 대사산물로 전환시킬 수 있다. 이러한 조작된 변이체는 부위 지정 돌연변이유발, 지정 진화 등에 의해 얻어질 수 있다. 따라서, 본 발명에 포함되는 것은 메타리지움 아니소플리애로부터의 NRPKS의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 4와 85-100% 동일). 따라서, 본 발명에 포함되는 것은 톨리포클라듐 인플라툼로부터의 NRPKS의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다. 따라서, 본 발명에 포함되는 것은 메타리지움 라일리로부터의 NRPKS의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 10과 85-100% 동일). 따라서, 본 발명에 포함되는 것은 탈라로마이세스 아일랜드이쿠스로부터의 NRPKS의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 16과 85-100% 동일).
Such engineered variants can be obtained by site-directed mutagenesis, directed evolutions and the like.
다른 또는 추가 실시예에서, 본 발명에 제공된 시스템 또는 재조합 미생물은 티오에스테라제(TE) 또는 그의 상동체 또는 변이체를 포함한다. 이 발현은 생합성 경로의 효소와 결합될 수 있으며, 올리베톨산 또는 추가 대사산물의 생산을 위한 추가 다운스트림 효소를 추가로 포함할 수 있다. TE는 메타리지움 아니소플리애(Metarhizium anisopliae), 톨리포클라듐 인플라툼(Tolypocladium inflatum), 메타리지움 라일리(Metarhizium rileyi) 및/또는 탈라로마이세스 아일랜드이쿠스(Talaromyces isolandicus)(또는 상기 표 3에서 확인된 기타 유기체)에서 파생될 수 있다. 다른 실시예에서, TE의 조작된 변이체는 티오에스테라제 활성이 있는 한 사용할 수 있고, 방향족 디올 대사산물을 올리베톨산 및 이의 유사체로 전환시킬 수 있다. 이러한 조작된 변이체는 부위 지정 돌연변이유발, 지정 진화 등에 의해 얻어질 수 있다. 따라서, 본 발명에 포함되는 것은 메타리지움 아니소플리애로부터의 TE의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 6과 85-100% 동일). 따라서, 본 발명에 포함되는 것은 톨리포클라듐 인플라툼로부터의 TE의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다. 따라서, 본 발명에 포함되는 것은 메타리지움 라일리로부터의 TE의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 12와 85-100% 동일). 따라서, 본 발명에 포함되는 것은 탈라로마이세스 아일랜드이쿠스로부터의 TE의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 18과 85-100% 동일).
상기 나타낸 바와 같이, 본 발명은 본 명세서에 개시된 생합성 플랫폼을 구성하는 효소의 변이체를 생성하는 것을 추가로 제공한다. 이러한 효소 변이체는 기질 특이성을 확장하고, 기질 특이성을 변경하고, 반응 역학을 개선하고, 효소 안정성 등을 개선할 수 있다. 예를 들어, 본 명세서에 개시된 생합성 플랫폼을 구성하는 효소의 변이체는 C8 OA보다 더 많은 C6과 같은 이러한 생성물의 비율을 변경할 수 있다. 효소의 변이체는 돌연변이 방법 또는 유도 진화 방법을 사용하여 효소의 서열(예를 들어, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 또는 18)을 변경하는 것에 기초할 수 있다.
효소 변이체를 생성하는 돌연변이 방법은, 예를 들어, 부위 특이적 돌연변이 유발(Ling et al. (1997) "DNA 돌연변이 유발에 대한 접근: 개요" Anal Biochem. 254(2): 157-178; Dale et al. (1996) "포스포로티오에이트 방법을 사용한 올리고뉴클레오티드 유도 무작위 돌연변이 유발" Methods Mol. Biol. 57:369-374; Smith (1985) "시험관 내 돌연변이 유발" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985) "시험관 내 돌연변이 유발의 전략 및 응용" Science 229:1193-1201; Carter (1986) "부위 특이적 돌연변이 유발" Biochem. J. 237:1-7; 및 Kunkel (1987) "올리고뉴클레오티드 유도 돌연변이 유발의 효율성" 핵산 및 분자생물학 내(Eckstein, F. 및 Lilley, D. M. J. eds., Springer Verlag, Berlin)); 템플릿을 포함하는 우라실을 사용한 돌연변이 유발(Kunkel (1985) "표현형 선택 없이 신속하고 효율적인 부위 특이적 돌연변이 유발" Proc. Natl. Acad. Sci. USA 82:488-492; Kunkel et al. (1987) "표현형 선택 없이 신속하고 효율적인 부위 특이적 돌연변이 유발" Methods in Enzymol. 154, 367-382; 및 Bass et al. (1988) "새로운 DNA 결합 특이성을 가진 돌연변이 Trp 억제인자" Science 242:240-245); 올리고뉴클레오티드 유도 돌연변이 유발(Methods in Enzymol. 100: 468-500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller & Smith (1982) "M13 유래 벡터를 사용한 올리고뉴클레오티드 유도 돌연변이유발: 모든 DNA 단편에서 점 돌연변이 생성을 위한 효율적이고 일반적인 절차" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) "M13 벡터에 복제된 DNA 단편의 올리고뉴클레오티드 유도 돌연변이 유발" Methods in Enzymol. 100:468-500; 및 Zoller & Smith (1987) "올리고뉴클레오티드 유도 돌연변이 유발: 2개의 올리고뉴클레오티드 프라이머와 단일 가닥 DNA 템플릿을 이용한 간단한 방법" Methods in Enzymol. 154:329-350); 포스포로티오에이트 변형 DNA 돌연변이 유발(Taylor et al. (1985) "닉킹된 DNA를 제조하기 위한 제한 효소 반응에서 포스포로티오에이트 변형 DNA의 용도" Nucl. Acids Res. 13: 8749-8764; Taylor et al. (1985) "포스포로티오에이트 변형 DNA를 이용한 높은 빈도의 올리고뉴클레오티드 유도 돌연변이의 빠른 생성" Nucl. Acids Res. 13: 8765-8787; Nakamaye & Eckstein (1986) "포스포로티오에이트 그룹에 의한 제한 엔도뉴클레아제 Nci I 절단의 억제 및 올리고뉴클레오티드 유도 돌연변이 유발에 대한 적용" Nucl. Acids Res. 14: 9679-9698; Sayers et al. (1988) "포스포로티오에이트 기반 올리고뉴클레오티드 유도 돌연변이 유발에서 Y-T 엑소뉴클레아제" Nucl. Acids Res. 16:791-802; 및 Sayers et al. (1988) "에티듐 브로마이드 존재하에서 제한 엔도뉴클레아제와의 반응에 의한 포스포로티오에이트 함유 DNA의 가닥 특이적 절단" Nucl. Acids Res. 16: 803-814); 갭이 있는 이중 DNA를 사용한 돌연변이 유발(Kramer et al. (1984) "올리고뉴클레오타이드 유도 돌연변이 구축에 대한 갭이 있는 이중 DNA 접근" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "갭이 있는 이중 DNA를 통한 돌연변이의 올리고뉴클레오타이드 유도 구축" 154:350-367; Kramer et al. (1988) "돌연변이의 올리고뉴클레오타이드 유도 구축에 대한 갭이 있는 이중 DNA 접근 방식에서 개선된 효소 시험관내 반응" Nucl. Acids Res. 16: 7207; 및 Fritz et al. (1988) "돌연변이의 올리고뉴클레오티드 유도 구축: 시험관 내에서 효소 반응이 없는 갭이 있는 이중 DNA 절차" Nucl. Acids Res. 16: 6987-6999)를 포함한다(각각은 참조로 포함된다).
추가로 적절한 방법은 포인트 불일치 복구(Kramer et al. (1984) "포인트 불일치 복구" Cell 38:879-887), 복구 결핍 숙주 균주를 사용한 돌연변이 유발(Carter et al. (1985) "M13 벡터를 사용한 개선된 올리고뉴클레오티드 부위 지정 돌연변이 유발" Nucl. Acids Res. 13: 4431-4443; 및 Carter (1987) "M13 벡터를 사용한 개선된 올리고뉴클레오티드 지정 돌연변이 유발" Methods in Enzymol. 154: 382-403), 결실 돌연변이 유발(Eghtedarzadeh & Henikoff (1986) "큰 결실을 생성하기 위한 올리고뉴클레오티드의 용도" Nucl. Acids Res. 14: 5115), 제한 선택 및 제한 정제(Wells et al. (1986) "서브틸리신의 전이 상태 안정화에 있어서 수소 결합 형성의 중요성" Phil. Trans. R. Soc. Lond. A 317: 415-423), 전체 유전자 합성에 의한 돌연변이 유발(Nambiar et al. (1984) "리보뉴클레아제 S 단백질을 코딩하는 유전자의 전체 합성 및 클로닝" Science 223: 1299-1301; Sakamar 및 Khorana (1988) "소 간체 외부 분절 구아닌 뉴클레오티드 결합 단백질(트랜스듀신)의 a-서브유닛에 대한 유전자의 전체 합성 및 발현" Nucl. Acids Res. 14: 6361-6372; Wells et al. (1985) "카세트 돌연변이 유발: 정의된 부위에서 다중 돌연변이 생성을 위한 효율적인 방법" Gene 34:315-323; and Grundstrom et al. (1985) "마이크로스케일 '샷건' 유전자 합성에 의한 올리고뉴클레오티드 유도 돌연변이 유발" Nucl. Acids Res. 13: 3305-3316); 이중 가닥 파손 수리(Mandecki (1986); Arnold (1993) "비정상적인 환경을 위한 단백질 공학" Current Opinion in Biotechnology 4: 450-455; 및 "대장균 플라스미드의 올리고뉴클레오티드 지정 이중 가닥 파손 복구: 부위 특이적 돌연변이 유발 방법" Proc. Natl. Acad. Sci. USA, 83:7177-7181)를 포함한다(각각은 참조로 포함된다). 상기 많은 방법에 대한 추가 세부 정보는 다양한 돌연변이 유발 방법으로 문제를 해결하는 데 유용한 컨트롤을 설명하는 Enzymology Volume 154의 방법에서 찾을 수 있다.
다양한 다양성 생성 방법에 대한 추가 세부 정보는 하기 미국 특허, PCT 간행물 및 EPO 간행물에서 찾을 수 있다. U.S. Pat. No. 5,605,793 to Stemmer (Feb. 25, 1997), "시험관내 재조합 방법;" U.S. Pat. No. 5,811,238 to Stemmer et al. (Sep. 22, 1998) "반복 선택 및 재조합에 의해 원하는 특성을 갖는 폴리뉴클레오티드를 생성하는 방법;" U.S. Pat. No. 5,830,721 to Stemmer et al. (Nov. 3, 1998), "무작위 단편화 및 재조립에 의한 DNA 돌연변이 유발;" U.S. Pat. No. 5,834,252 to Stemmer, et al. (Nov. 10, 1998) "말단 상보성 중합효소 반응;" U.S. Pat. No. 5,837,458 to Minshull, et al. (Nov. 17, 1998), "세포 및 대사 공학을 위한 방법 및 조성물;" WO 95/22625, Stemmer and Crameri, "무작위 단편화 및 재조립에 의한 돌연변이 유발;" WO 96/33207 by Stemmer and Lipschutz "상보적 중합효소 연쇄 반응 종료;" WO 97/20078 by Stemmer and Crameri "반복 선택 및 재조합에 의해 원하는 특성을 갖는 폴리뉴클레오티드를 생성하는 방법;" WO 97/35966 by Minshull and Stemmer, "세포 및 대사 공학을 위한 방법 및 조성물;" WO 99/41402 by Punnonen et al. "유전자 백신 벡터의 표적화;" WO 99/41383 by Punnonen et al. "항원 라이브러리 면역화;" WO 99/41369 by Punnonen et al. "유전자 백신 벡터 공학;" WO 99/41368 by Punnonen et al. "유전자 백신의 면역 조절 특성의 최적화;" EP 752008 by Stemmer and Crameri, "무작위 단편화 및 재조립에 의한 DNA 돌연변이 유발;" EP 0932670 by Stemmer "재귀적 서열 재조합에 의한 진화하는 세포 DNA 흡수;" WO 99/23107 by Stemmer et al., "바이러스 게놈 셔플링에 의한 바이러스 친화성 및 숙주 범위 수정;" WO 99/21979 by Apt et al., "인유두종바이러스 벡터;" WO 98/31837 by del Cardayre et al. "재귀 시퀀스 재조합에 의한 전체 세포 및 유기체의 진화;" WO 98/27230 by Patten and Stemmer, "폴리펩티드 공학을 위한 방법 및 조성물;" WO 98/13487 by Stemmer et al., "재귀적 서열 셔플링 및 선택에 의한 유전자 치료의 최적화 방법;" WO 00/00632, "매우 다양한 라이브러리 생성 방법;" WO 00/09679, "시험관내 재조합 폴리뉴클레오티드 서열 뱅크 및 생성된 서열을 얻는 방법;" WO 98/42832 by Arnold et al., "무작위 또는 정의된 프라이머를 사용한 폴리뉴클레오티드 서열의 재조합;" WO 99/29902 by Arnold et al., "폴리뉴클레오타이드 및 폴리펩타이드 서열의 생성 방법;" WO 98/41653 by Vind, "DNA 라이브러리 구축을 위한 시험관 내 방법;" WO 98/41622 by Borchert et al., "DNA 셔플링을 이용한 라이브러리 구축 방법;" WO 98/42727 by Pati and Zarling, "상동 재조합을 사용한 서열 변경;" WO 00/18906 by Patten et al., "코돈 변형 유전자의 셔플링;" WO 00/04190 by del Cardayre et al. "재귀적 재조합에 의한 전체 세포와 유기체의 진화;" WO 00/42561 by Crameri et al., "올리고뉴클레오티드 매개 핵산 재조합;" WO 00/42559 by Selifonov and Stemmer "진화 시뮬레이션에 사용하기 위해 데이터 구조를 채우는 방법;" WO 00/42560 by Selifonov et al., "원하는 특성을 갖는 문자열, 폴리뉴클레오타이드 및 폴리펩타이드의 제조 방법;" WO 01/23401 by Welch et al., "합성 셔플링을 위한 코돈 변이 올리고뉴클레오티드 합성의 사용;" 및 WO 01/64864 by Affholter "단일 가닥 핵산 주형 매개 재조합 및 핵산 단편 분리"(각각은 참조로 포함된다).
유도 진화(Directed evolution)는 또한 본 명세서에 개시된 생합성 플랫폼의 효소 변이체를 생성하는데 사용될 수 있다. 유도 진화(DE)는 단백질 또는 핵산을 사용자가 정의한 목표로 조종하기 위해 자연 선택 과정을 모방하는 단백질 공학에서 사용되는 방법이다. 이는 유전자를 돌연변이 유발(변이체 라이브러리 생성), 선택(이러한 변종을 표현하고 원하는 기능으로 구성원을 분리) 및 증폭(다음 라운드를 위한 템플릿 생성)의 반복적인 라운드에 적용하는 것으로 구성된다. DE에서 단일 유전자는 반복적인 돌연변이 유발, 선택 또는 스크리닝 및 증폭에 의해 진화된다. 단계적 개선을 달성하기 위해 한 라운드의 최상의 변형을 다음 라운드의 템플릿으로 사용하여 이러한 단계의 라운드가 일반적으로 반복된다. 유도 진화의 주기를 수행하는 첫 번째 단계는 변이 유전자 라이브러리를 생성하는 것이다. 시작 유전자는 무작위 점 돌연변이(화학적 돌연변이 또는 오류가 발생하기 쉬운 PCR) 및 삽입 및 결실(트랜스포존)에 의해 돌연변이될 수 있다. 유전자 재조합은 뒤섞인 모 유전자 사이의 서열 공간 영역으로 점프하기 위해 여러 서열(보통 70% 이상의 서열 동일성)의 DNA 셔플링에 의해 모방될 수 있다. 마지막으로, 유전자의 특정 영역은 구조 및 기능 지식을 기반으로 하는 보다 집중적인 접근을 위해 체계적으로 무작위화될 수 있다.
본 발명은 본 명세서에 개시된 생합성 경로를 구성하는 효소의 추가 형태를 제조하는 것을 추가로 제공하며, 이는 (i) HRPKS 및 NRPKS를 해부하는 단계; (ii) NRPKS 및 TE와 같은 융합 효소; (iii) 한 효소의 일부가 다른 효소의 일부에 융합된 것과 같은 재셔플링 도메인을 포함하지만 이에 제한되지 않는다(예를 들어, see Kolkman et al. "엑손 셔플링에 의한 단백질의 유도 진화". Nature Biotechnology 19(5): 423-8 (2001); Morgante et al., "헬리트론과 같은 트랜스포존에 의한 유전자 복제 및 엑손 셔플링은 옥수수에서 종 내 다양성을 생성한다". Nature Genetics. 37(9):997-1002 (2005); Van Rijk, "엑손 셔플링의 분자 메커니즘: 불법적인 재조합". Genetica 118(2-3): 245-9 (2003)); Elluche, S. "자연의 발명에서 생명 공학 응용에 이르기까지 융합 효소와 기능을 결합" Appl Microbiol Biotechnol. 99(4):1545-56 (2015); Aalbers et al. "생촉매의 효소 융합: 효소 짝짓기에 의한 커플링 반응" Chembiochem. 20(1):20-28 (2019)).
본 발명의 폴리펩타이드를 암호화하는 폴리뉴클레오타이드가 SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 및 17에 제공된다. 서열이 DNA에 기재되어 있음을 쉽게 인지해야 하지만, 본 발명에 수반되는 서열 목록에서 "U" 또는 "T"를 치환하는 것을 포함하는 RNA가 고려된다. 상기 언급된 바와 같이, 본 발명의 폴리뉴클레오티드는 발현을 위한 벡터로 클로닝될 수 있다. 발현에 적합한 벡터는 당업계에 공지되어 있고 본 명세서의 다른 곳에 기술되어 있다. 일부 실시예에서, 본 발명의 세포 또는 벡터는 SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 및 17로 구성된 군에서 선택되는 적어도 하나의 폴리뉴클레오티드를 포함한다. 다른 실시예에서, 본 발명의 세포 또는 벡터는 SEQ ID NOs: 1, 7 및 13으로 구성된 군에서 선택되는 제1 폴리뉴클레오티드; SEQ ID NOs: 3, 9 및 15로 구성된 군에서 선택되는 제2 폴리뉴클레오티드; 및 SEQ ID NOs: 5, 11 및 17로 구성된 군에서 선택되는 제3 폴리뉴클레오티드를 포함한다. 또 다른 실시예에서, 본 발명은 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15, 및 17로부터 선택된 서열로 구성된 폴리뉴클레오티드와 적당히 엄격한 내지 엄격한 조건 하에 혼성화하는 폴리뉴클레오티드를 고려한다. 혼성화 엄격한 조건은 당업계에 잘 알려져 있다. 또한, 본 개시내용은 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15 또는 17의 어느 하나와 적어도 70%, 80%, 85%, 90%, 92%, 95%, 97%, 또는 99% 동일성을 갖는 폴리뉴클레오티드를 고려하고, 이는 각각 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16 또는 18의 서열을 갖는 폴리펩티드를 코딩한다.
이전에 논의된 바와 같이, 벡터, 프로모터 및 기타 많은 관련 주제의 사용을 포함하여 본 명세서에 유용한 분자 생물학적 기술을 설명하는 일반 텍스트는 Berger 및 Kimmel, 분자 복제 기술 가이드, Methods in Enzymology Volume 152, (Academic Press, Inc., San Diego, Calif.) ("Berger"); Sambrook et al., 분자 복제--실험실 매뉴얼, 2d ed., Vol. 1-3, 콜드 스프링 하버 연구소, 콜드 스프링 하버, N.Y., 1989 ("Sambrook") 및 분자생물학의 현재 프로토콜, F. M. Ausubel et al., eds., 현재 프로토콜, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (supplemented through 1999)("Ausubel")를 포함한다(각각은 참조로 포함된다).
중합효소연쇄반응(polymerase chain reaction, PCR), 리가제연쇄반응(ligase chain reaction, LCR), Qb-복제효소 증폭 및 기타 RNA 중합효소 매개 기술(예: NASBA)을 포함하는 시험관 내 증폭 방법을 통해 숙련가에게 지시하기에 충분한 프로토콜의 예, 본 발명의 상동 핵산의 생산은 Berger, Sambrook 및 Ausubel 뿐만 아니라 Mullis et al. (1987) U.S. Pat. No. 4,683,202; Innis et al., eds. (1990) PCR 프로토콜: 방법 및 응용 프로그램 가이드(Academic Press Inc. San Diego, Calif.) ("Innis"); Arnheim & Levinson (Oct. 1, 1990) C&EN 36-47; The Journal Of NIH Research (1991) 3: 81-94; Kwoh et al. (1989) Proc. Natl. Acad. Sci. USA 86: 1173; Guatelli et al. (1990) Proc. Nat'l. Acad. Sci. USA 87: 1874; Lomell et al. (1989) J. Clin. Chem 35: 1826; Landegren et al. (1988) 사이언스 241: 1077-1080; Van Brunt (1990) Biotechnology 8: 291-294; Wu 및 Wallace (1989) 유전자 4:560; Barringer et al. (1990) 유전자 89:117; 및 Sooknanan and Malek (1995) 생명공학 13: 563-564에서 발견된다(각각은 참조로 포함된다). 시험관내 증폭된 핵산을 클로닝하기 위한 개선된 방법은 Wallace et al., U.S. Pat. No. 5,426,039에 개시되었다. PCR에 의해 큰 핵산을 증폭하는 개선된 방법은 Cheng et al. (1994) Nature 369: 684-685 및 여기에 인용된 참고 문헌(본원에 참고로 포함됨)에서 최대 40kb의 PCR 앰플리콘이 생성되는 것이 요약되어 있다. 당업자는 본질적으로 임의의 RNA가 역전사효소 및 중합효소를 사용하여 제한 소화(restriction digestion), PCR 확장 및 서열분석에 적합한 이중 가닥 DNA로 전환될 수 있음을 이해할 것이다. 예를 들어, 상기 Ausubel, Sambrook 및 Berger를 참조하십시오.
하기 실시예는 본 발명을 예시하기 위한 것이지 제한하기 위한 것이 아니다. 그것들은 사용될 수 있는 것들의 전형이지만, 당업자에게 공지된 다른 절차들이 대안적으로 사용될 수 있다.
실시예
플라스미드 구성 및 발현: 플라스미드 pYTU, pYTP 및 pYTR을 PacI 및 SwaI로 분해하였다. 이러한 제한 부위를 사용하여 HRPKS, NRPKS 및 ΨACP-TE(즉, HRPKS(SEQ ID NO: 2), NRPKS(SEQ ID NO: 4) 및 ΨACP-TE(SEQ ID NO: 6))를 코딩하는 유전자르르 플라스미드에 삽입하는데 사용되었다. 메타리지움 아니소플리애 ARSEF23의 genomic DNA를 주형으로 사용하여 PCR을 통해 유전자를 증폭되었다. glaA 프로모터 및 trpC 터미네이터는 pYTR을 주형으로 사용하여 PCR을 통해 증폭되었다. PCR 단편을 효모에서 형질전환시키고 상동 재조합을 통해 플라스미드 pYTU-glaA-NRPKS-trpC, pYTP-glaA-ΨACP-TE 및 pYTR-glaA-HRPKS-trpC를 생성하였다. Frozen-EZ 효모 형질전환 II Kit™(Zymo Research)를 사용하여 효모 형질전환을 수행하였다. 플라스미드를 효모에서 추출하고 전기천공에 의해 대장균 TOP10으로 형질전환하여 단일 플라스미드를 분리하였다. 대장균에서 추출한 후, 플라스미드 서열을 시퀀싱하여 확인하였다. Liu et al.(Org Lett. 19:3560-3563 (2017))에 개시된 방법을 사용하여 3개의 플라스미드(pYTU-glaA-NRPKS-trpC, pYTP-glaA-ΨACP-TE, pYTR-glaA-HRPKS-trpC) 모두를 A. 니둘란스로 형질전환시켜 올리베톨산 생산 균주를 형성하였다.
이어서, 균주를 50 mL 팔콘 튜브에서 10 mL의 CD-ST 배지(20 g/L 전분, 20 g/L 카세인, 50 mL/L 질산염 및 1 mL/L 미량 원소)에서 배양하고, 하룻밤 동안 28℃ 및 250 rpm에서 진탕기에 보관하였다. 다음날 25 μL의 배양물을 125 mL 플라스크에 25 mL의 CD-ST 배지에 접종하고, 28℃ 및 250 rpm에서 진탕기에 보관하였다. HRPKS, NRPKS, 및 ΨACP-TE 유전자를 모두 함유하는 메타리지움 아니소플리애 클러스터와 상동인 3개의 다른 클러스터가 확인되었다. 클러스터는 모두 동일한 3개의 유전자를 갖고 있지만, 서열 동일성이 다르기 때문에 생성되는 생성물의 다양성이 있음을 나타낸다. 메타리지움 아니소플리애 클러스터의 유전자와 서열 동일성이 다른 상동 클러스터의 유전자로 인해, 메틸트랜스퍼라제 및 에노일 환원효소 도메인 활성의 차이를 통해 생성물의 확장된 다양성을 구상할 수 있다.
M. 아니소플리애에 대해 상기 기재된 바와 같은 플라스미드는 이들 상동 클러스터의 유전자로부터 생성되었고 A. 니둘란스에서 이종 발현되었다. 그런 다음 제품 프로필을 분석하였다.
검출 및 분리: 포지티브 및 네거티브 모드 전자분무 이온화를 사용하는 Shimadzu 2020 EVLC-MS(Phenomenex® Kinetex, 1.7 μm, 2.0 x 100 mm, C-18 컬럼)를 사용하여 LC-MS 분석을 수행하였다. 용출 방법은 13.25분 내에 5-95%(v/v) 아세토니트릴/물의 선형 구배에 이어 0.3 mL/분의 유속으로 4.75분 동안 95%(v/v) 아세토니트릴/물의 선형 구배를 포함한다. LC 이동상에 0.1% 포름산(v/v)이 보충되었다.
화합물의 대규모 생산은 20개의 페트리 접시로 분할된 1리터의 고체 CD-ST 한천에서 형질전환체를 배양함으로써 수행되었다. 28℃에서 4-5일 동안 성장시킨 후, 한천을 아세톤으로 광범위하게 추출했습니다. 추출물을 감압 농축하고 산성화된 에틸 아세테이트로 3회 더 추출하였다. 올리베톨산 및 유도체는 에틸 아세테이트 층에 남아 있으며, 이는 후속적으로 감압하에 건조되었다. 잔류물을 Teledyne Combi-Flash 시스템의 Redisep Rf Gold 역상 C18 컬럼에 로딩하였다. 그 후, Shimadzu UFLC 시스템을 사용하여 Phenomenex® Kinetex 컬럼(5μ, 10.0 x 250 mm, C18)으로 HPLC 정제를 수행하였다. HPLC 정제를 위해, 용매 A(물 중 0.1% 포름산) 및 용매 B(아세토니트릴 중 0.1% 포름산)를 사용하여 4 mL/분의 유속을 사용하였다.
올리베톨산 및 유사체를 생산하기 위한 생합성 경로. 도 2A에 도시된 바와 같이, 아스페르길루스 니둘란스는 각각 메타리지움 아니소플리애, 메타리지움 라일리 및 탈라로마이세스 아일랜드이쿠스로부터 다양한 이종 유전자(즉, HRPKS(SEQ ID NO: 2, 8 또는 14), NRPKS(SEQ ID NO: 4, 10 또는 16), 및 ΨACP-TE(SEQ ID NO: 6, 12 또는 18))를 발현하도록 재조합 조작되어, 올리베톨산(OA) 및 OA 유사체를 높은 수율로 제공한다. HRPKS는 아세틸-CoA, 말로닐-CoA 및 NADPH를 사용하여 아실-캐리어 단백질(ACP)에 연결된 C6 또는 C8 아실 사슬을 합성한다. 그런 다음 HRPKS의 ACP 도메인은 아실 티오에스테르를 비환원 폴리케타이드 합성효소(NRPKS)의 스타터 단위 아실-운반체 단백질 트랜스아실라제(SAT) 도메인으로 이동시킨다. 케토신타제(KS) 도메인과 생성물 주형(PT) 도메인에 의한 방향족화에 의해 촉매되는 3회의 탈탄산 축합 후, 티오에스테라제(TE)는 NRPKS에서 생성물을 가수분해하여 다음 촉매 주기를 시작한다. HRPKS의 합성 능력 및 NRPKS SAT 도메인의 완화된 기질 선택성으로 인해, 고역가 올리베톨산 및 아실 사슬 길이 및 포화도가 상이한 3개의 유사체가 접근된다(도 2B 참조).
아스페르길루스 니둘란스에서 상기 생합성 경로를 발현하는 이종은 대사 최적화 없이 총 역가가 >4g/L인 올리베톨산 및 이의 유사체를 수득하였다. 도 3에 제시된 액체 크로마토그래피(LC) 자취에 나타낸 바와 같이, 화합물 2는 다른 화합물보다 더 많은 양으로 생성되었으며, 다른 오염 생성물 형성이 최소 또는 전혀 없었다. 실제 수율은 도 2B에 제시되어 있으며, 다음과 같다: 화합물 2(~4 g/L) > 화합물 3(~800 mg/L) > 화합물 1(~450 mg/L) >> 화합물 4(80 mg/L)입니다. 화합물 1: 올리베톨산; 화합물 2: 2-헵틸-4,6-디히드록시벤조산; 화합물 3: (E)-2-(헵트-1-엔-1-일)-4,6-디히드록시벤조산; 및 화합물 4: (E)-2,4-디히드록시-6-(펜트-1-엔-1-일)벤조산.
T. 인플라툼, M. 라일리 및 T. 아일랜드이쿠스로부터 클로닝된 유전자에 대해 유사한 LC 추적이 얻어졌다. 톨리포클라듐 인플라툼 클러스터의 경우, 유전자가 아스페길루스 니둘란스에서 이종적으로 발현되었을 때, LC를 검토한 결과 메타리지움 아니소플리애의 유전자가 발현되었을 때와 동일한 프로파일이 나타났으며, 역가는 비슷하였다. 탈라로마이세스 아일랜드이쿠스 클러스터의 경우 아스페길루스 니둘란스에서 이종 발현되었을 때 LC는 주로 올리베톨산을 나타냈다.
본 발명의 사상 및 범위를 벗어나지 않고, 다양한 수정이 이루어질 수 있음을 이해할 것이다. 따라서, 다른 실시예들은 다음 청구범위의 범위 내에 있다.
SEQUENCE LISTING
<110> The Regents of the University of California
<120> BIOSYNTHETIC PLATFORM FOR THE PRODUCTION OF OLIVETOLIC ACID AND
ANALOGUES OF OLIVETOLIC ACID
<130> 00011-091WO1
<140> Not yet assigned
<141> 2021-01-07
<150> US 62/959,849
<151> 2020-01-10
<160> 18
<170> PatentIn version 3.5
<210> 1
<211> 7548
<212> DNA
<213> Metarhizium anisopliae
<220>
<221> CDS
<222> (1)..(7548)
<400> 1
atg caa gcg cca gca cca tca aga gac gac att gcc gtc gtc ggc ttg 48
Met Gln Ala Pro Ala Pro Ser Arg Asp Asp Ile Ala Val Val Gly Leu
1 5 10 15
tcg tgc cgc ttc ccg ggc gaa gca gat acc gcc gag cac ttt tgg gat 96
Ser Cys Arg Phe Pro Gly Glu Ala Asp Thr Ala Glu His Phe Trp Asp
20 25 30
ttc atc tgc aat gga cgt aat gca tac tct gag aat ccg gat cgg tgg 144
Phe Ile Cys Asn Gly Arg Asn Ala Tyr Ser Glu Asn Pro Asp Arg Trp
35 40 45
acg ccg gat gct ttt cac tac ggt gag aaa aaa atc aac acc agt ctg 192
Thr Pro Asp Ala Phe His Tyr Gly Glu Lys Lys Ile Asn Thr Ser Leu
50 55 60
ccc cgg gga ggg cat ttt atg aag caa gat gtg gcc gcc ttt gac gcc 240
Pro Arg Gly Gly His Phe Met Lys Gln Asp Val Ala Ala Phe Asp Ala
65 70 75 80
aac ttc ttc aac ctc tcc aag gtc gag gcc gag tcc atg gac ccc cag 288
Asn Phe Phe Asn Leu Ser Lys Val Glu Ala Glu Ser Met Asp Pro Gln
85 90 95
cag cgc atc atg atg gag gtg acg tac gag tcc atg gag agc gcc ggc 336
Gln Arg Ile Met Met Glu Val Thr Tyr Glu Ser Met Glu Ser Ala Gly
100 105 110
ctc cgc gtc gac cag ctc gcg ggc tcg cgg acg ggc gtc ttc atg gcc 384
Leu Arg Val Asp Gln Leu Ala Gly Ser Arg Thr Gly Val Phe Met Ala
115 120 125
agc ttc acg agc gac tac cgc gag atg ctg tac cgc gat gcc gag acg 432
Ser Phe Thr Ser Asp Tyr Arg Glu Met Leu Tyr Arg Asp Ala Glu Thr
130 135 140
gcg cct ctc tac acc gca acg ggc acc agc aac acg tcg acg tcg aac 480
Ala Pro Leu Tyr Thr Ala Thr Gly Thr Ser Asn Thr Ser Thr Ser Asn
145 150 155 160
cgc gtc tcg tgg ttc ttc gac ctg cgc ggg ccc agc ttc acc gtc aac 528
Arg Val Ser Trp Phe Phe Asp Leu Arg Gly Pro Ser Phe Thr Val Asn
165 170 175
acg gcc tgc tcg tcc agt ctg gtc gcc tgc cat ctc gcc tgc caa agc 576
Thr Ala Cys Ser Ser Ser Leu Val Ala Cys His Leu Ala Cys Gln Ser
180 185 190
cta tgg agc ggc gag acg gag agc gcc att gtc ggc ggc acc agc ctg 624
Leu Trp Ser Gly Glu Thr Glu Ser Ala Ile Val Gly Gly Thr Ser Leu
195 200 205
ctg ctg aac ccc gac atg ttc ctg tac ctt tcc aac cag cag ttc ctg 672
Leu Leu Asn Pro Asp Met Phe Leu Tyr Leu Ser Asn Gln Gln Phe Leu
210 215 220
gcc ccc gac ggc cag tgc aag agc ttt gac gag tcg ggc gac ggc tac 720
Ala Pro Asp Gly Gln Cys Lys Ser Phe Asp Glu Ser Gly Asp Gly Tyr
225 230 235 240
gcc agg ggc gac ggc atc ggc gtc gtc att ctg aag cga gtt gcc gac 768
Ala Arg Gly Asp Gly Ile Gly Val Val Ile Leu Lys Arg Val Ala Asp
245 250 255
gcc ctc cgc gac ggc gac ccg atc cgc gcc gtc atc cgt ggc agc gga 816
Ala Leu Arg Asp Gly Asp Pro Ile Arg Ala Val Ile Arg Gly Ser Gly
260 265 270
tgc aac cag gac ggc cat aca aag ggc ttc acc atc ccc agc gtc gac 864
Cys Asn Gln Asp Gly His Thr Lys Gly Phe Thr Ile Pro Ser Val Asp
275 280 285
gcg caa gcc tcc ctc att gca gaa acg tac cgc aac gcc ggc ctc tca 912
Ala Gln Ala Ser Leu Ile Ala Glu Thr Tyr Arg Asn Ala Gly Leu Ser
290 295 300
ctt gcg gag aca cgc tac gtc gag gct cac gga acg ggc acc cag gcc 960
Leu Ala Glu Thr Arg Tyr Val Glu Ala His Gly Thr Gly Thr Gln Ala
305 310 315 320
ggc gac acg cgt gag atg gaa ggc att gcc cgc aca ttc agc cag cac 1008
Gly Asp Thr Arg Glu Met Glu Gly Ile Ala Arg Thr Phe Ser Gln His
325 330 335
cgc acg gcg tcg gac gag ctg ctg gtg gga tca gtc aag gca aat atc 1056
Arg Thr Ala Ser Asp Glu Leu Leu Val Gly Ser Val Lys Ala Asn Ile
340 345 350
ggg cat ctc gaa gcc tgc gcg gga ctg gcc tcg ctc ata aag tgc gtc 1104
Gly His Leu Glu Ala Cys Ala Gly Leu Ala Ser Leu Ile Lys Cys Val
355 360 365
tac atc ctg gaa acg ggc gtg ata ccc ccg acg ccg agc gtc cgc gtc 1152
Tyr Ile Leu Glu Thr Gly Val Ile Pro Pro Thr Pro Ser Val Arg Val
370 375 380
ctg aac ccc aag atc cgc tgg gag gaa tgg cat ctc aag gtg cct gcg 1200
Leu Asn Pro Lys Ile Arg Trp Glu Glu Trp His Leu Lys Val Pro Ala
385 390 395 400
aca caa aca act tgg ccg acc gag ggc ctg cgg cgg atc agc acc caa 1248
Thr Gln Thr Thr Trp Pro Thr Glu Gly Leu Arg Arg Ile Ser Thr Gln
405 410 415
ggt ttt gga tat ggc ggt aca aac gcg cat ctg att ctc gac gac gcg 1296
Gly Phe Gly Tyr Gly Gly Thr Asn Ala His Leu Ile Leu Asp Asp Ala
420 425 430
gcc cat tat ctc gag gca cgc aaa ctc agg ggc cac cac tat acc cgt 1344
Ala His Tyr Leu Glu Ala Arg Lys Leu Arg Gly His His Tyr Thr Arg
435 440 445
aca cat ccc cag aca cag aga ctt ttg acc tcg gca atg cag gaa gac 1392
Thr His Pro Gln Thr Gln Arg Leu Leu Thr Ser Ala Met Gln Glu Asp
450 455 460
gtg tca aac gac cat ccg cca cgg tta ttt ctg ttc cgc gca aat gat 1440
Val Ser Asn Asp His Pro Pro Arg Leu Phe Leu Phe Arg Ala Asn Asp
465 470 475 480
cgc gag ggc ctg gga cgc gtc cgc tcg tcg ctg gcc cag cat ctc gag 1488
Arg Glu Gly Leu Gly Arg Val Arg Ser Ser Leu Ala Gln His Leu Glu
485 490 495
cag ctc ctc aag tcg tgg ccg cag gat tcg aga gac ggc ggc gca tac 1536
Gln Leu Leu Lys Ser Trp Pro Gln Asp Ser Arg Asp Gly Gly Ala Tyr
500 505 510
cta cac aat ctg gcc ttc acc cta gcc agt cga cgg tcc cat ctc caa 1584
Leu His Asn Leu Ala Phe Thr Leu Ala Ser Arg Arg Ser His Leu Gln
515 520 525
tgg cag acg tac gcc acg gcc tcg acg ccc tcg gag ctg ctc caa gcg 1632
Trp Gln Thr Tyr Ala Thr Ala Ser Thr Pro Ser Glu Leu Leu Gln Ala
530 535 540
ctc cag cac gag ggc agc gcg tgg gcg gct ccc gag act cgc ctc gcc 1680
Leu Gln His Glu Gly Ser Ala Trp Ala Ala Pro Glu Thr Arg Leu Ala
545 550 555 560
gcc tcg ccc ccc cgg ctc ggc ttc atc ttc acc ggc cag ggc gcg cag 1728
Ala Ser Pro Pro Arg Leu Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln
565 570 575
tgg gct cgc atg ggc gtc gag ctg atg gcg tac ccc gtg ttc cgc cag 1776
Trp Ala Arg Met Gly Val Glu Leu Met Ala Tyr Pro Val Phe Arg Gln
580 585 590
agc gtc gag gcg tcg gac ggg ttt ctg cgc agc gcc ctc ggg tgc ccc 1824
Ser Val Glu Ala Ser Asp Gly Phe Leu Arg Ser Ala Leu Gly Cys Pro
595 600 605
tgg tct gcc gtc gac gag ctg gcc cag ccg cag gct acg tcg cgg ctc 1872
Trp Ser Ala Val Asp Glu Leu Ala Gln Pro Gln Ala Thr Ser Arg Leu
610 615 620
tcc gag gcg gcc tac agc cag acg ctc tgc acg gtg ctc caa atc gcc 1920
Ser Glu Ala Ala Tyr Ser Gln Thr Leu Cys Thr Val Leu Gln Ile Ala
625 630 635 640
acc gtc gac ctg ctc gag gac tgg aac gtc tgt ccc acg cgc gtg gcc 1968
Thr Val Asp Leu Leu Glu Asp Trp Asn Val Cys Pro Thr Arg Val Ala
645 650 655
ggg cac tcg agc ggc gag atc gcc gcc gcc tac tgc ctg ggc gcc ctg 2016
Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Ala Leu
660 665 670
agc aag cac gac agt ctg cgg gtg gcc tac tac cgc ggg att ctg tcc 2064
Ser Lys His Asp Ser Leu Arg Val Ala Tyr Tyr Arg Gly Ile Leu Ser
675 680 685
tcg gag atg cag cag aca cac gcg gat cgc agg gga gcc atg atg gcc 2112
Ser Glu Met Gln Gln Thr His Ala Asp Arg Arg Gly Ala Met Met Ala
690 695 700
gtc ggg gct tcc ccc gaa gag gtc gag gcg tgg ctg gcc aag ctg acc 2160
Val Gly Ala Ser Pro Glu Glu Val Glu Ala Trp Leu Ala Lys Leu Thr
705 710 715 720
cgg gga cga gtc gtc gtc gcc tgc atc aac tcg ccg acc agc gtc acg 2208
Arg Gly Arg Val Val Val Ala Cys Ile Asn Ser Pro Thr Ser Val Thr
725 730 735
gca tcc ggg gac gcc gcg ggc gtc gac gag ctt ctc gcc atg gtc caa 2256
Ala Ser Gly Asp Ala Ala Gly Val Asp Glu Leu Leu Ala Met Val Gln
740 745 750
cag gcc ggc gtg ttt ggg cgc aag ctg cag gtg gac gtg gcc tat cac 2304
Gln Ala Gly Val Phe Gly Arg Lys Leu Gln Val Asp Val Ala Tyr His
755 760 765
tct cac cac atg cag tcg gtt tct tcc gcg tac tct gag ctc ctc aag 2352
Ser His His Met Gln Ser Val Ser Ser Ala Tyr Ser Glu Leu Leu Lys
770 775 780
gat ctt gcg ccg ctg ccg gcg cgt ccg gga cgc acc atg cac tcg agc 2400
Asp Leu Ala Pro Leu Pro Ala Arg Pro Gly Arg Thr Met His Ser Ser
785 790 795 800
gtc ttg ggc cgt gtc att gac gcc gcg gag ctc ggc gcc tcc aac tgg 2448
Val Leu Gly Arg Val Ile Asp Ala Ala Glu Leu Gly Ala Ser Asn Trp
805 810 815
gtg caa aac ctc gtc tcc ccg gtg cgc ttc tcc gaa gcc gtg tcg agc 2496
Val Gln Asn Leu Val Ser Pro Val Arg Phe Ser Glu Ala Val Ser Ser
820 825 830
ctc ctc tcc gcc ggg gac aag ccg gcc gtc gat gtg ctc gtc gag att 2544
Leu Leu Ser Ala Gly Asp Lys Pro Ala Val Asp Val Leu Val Glu Ile
835 840 845
gga ccg cac gcc gcg ctc aag ggg ccc gtc cag cag atc ctc cag gcc 2592
Gly Pro His Ala Ala Leu Lys Gly Pro Val Gln Gln Ile Leu Gln Ala
850 855 860
cag ggc gtg tcc gcg gtc aag tac acg agt gtc ctc tcc cgg gga cag 2640
Gln Gly Val Ser Ala Val Lys Tyr Thr Ser Val Leu Ser Arg Gly Gln
865 870 875 880
agc gcc gta aag acg gct ctg gcg tgc gcc ggc gag ctc gtc ctg tcg 2688
Ser Ala Val Lys Thr Ala Leu Ala Cys Ala Gly Glu Leu Val Leu Ser
885 890 895
agt gtg ccc gtc gcc gtg tct cgc gta aac ttg gag tcc ggg ccg ccg 2736
Ser Val Pro Val Ala Val Ser Arg Val Asn Leu Glu Ser Gly Pro Pro
900 905 910
ccg agt ccg ttg gtc gac ctg ccc ccc tat ccc tgg aac cga tca act 2784
Pro Ser Pro Leu Val Asp Leu Pro Pro Tyr Pro Trp Asn Arg Ser Thr
915 920 925
cga ttc tgg gcc gag tcg cgt ctt tcc cga gag tat cgg ctt cgc aag 2832
Arg Phe Trp Ala Glu Ser Arg Leu Ser Arg Glu Tyr Arg Leu Arg Lys
930 935 940
cac gcc cgc ctg ccg ctg ctg gga agt ccg tgt ccc acg atg ggc gcc 2880
His Ala Arg Leu Pro Leu Leu Gly Ser Pro Cys Pro Thr Met Gly Ala
945 950 955 960
cgc gag aga tac tgg cgc ggc atg gtg agg ttg gag gag gag ccc tgg 2928
Arg Glu Arg Tyr Trp Arg Gly Met Val Arg Leu Glu Glu Glu Pro Trp
965 970 975
atc cgg gac cat gag atc cag ggg tcc atc ctg tat ccc ggg gcc ggc 2976
Ile Arg Asp His Glu Ile Gln Gly Ser Ile Leu Tyr Pro Gly Ala Gly
980 985 990
ttc ttg atc atg gcc att gaa gct gcc tcc cag cag gca ggc gag cag 3024
Phe Leu Ile Met Ala Ile Glu Ala Ala Ser Gln Gln Ala Gly Glu Gln
995 1000 1005
cgc aaa gta agc gca ttc cga ctg cgc gac gtg cac ctc gac gcc 3069
Arg Lys Val Ser Ala Phe Arg Leu Arg Asp Val His Leu Asp Ala
1010 1015 1020
gcc ttg gtg gtg acc gag gac agc acc gcc gag gcc att ctg caa 3114
Ala Leu Val Val Thr Glu Asp Ser Thr Ala Glu Ala Ile Leu Gln
1025 1030 1035
ctc cga ccg cat ctt ctc gcg ccg ggc agc agc cag tcg tcc tgg 3159
Leu Arg Pro His Leu Leu Ala Pro Gly Ser Ser Gln Ser Ser Trp
1040 1045 1050
atg gag ttt acc gtc aat tca tct att gac ggc ggt gac ttg cgt 3204
Met Glu Phe Thr Val Asn Ser Ser Ile Asp Gly Gly Asp Leu Arg
1055 1060 1065
cag aac tgc tcc ggc ctc atc atg atc gag tat gcc gcc gac gcc 3249
Gln Asn Cys Ser Gly Leu Ile Met Ile Glu Tyr Ala Ala Asp Ala
1070 1075 1080
gac tcg gcc atg gac cgc gag cgt gcc ctg gag tcg gac atg gtt 3294
Asp Ser Ala Met Asp Arg Glu Arg Ala Leu Glu Ser Asp Met Val
1085 1090 1095
tgt gac tgg tac aag aaa acg tac gtc tct tgc cag cag tct gtc 3339
Cys Asp Trp Tyr Lys Lys Thr Tyr Val Ser Cys Gln Gln Ser Val
1100 1105 1110
gat gtg ggc aaa ttc tac tcg cgc ctt gct tct ctc ggc ctt gtt 3384
Asp Val Gly Lys Phe Tyr Ser Arg Leu Ala Ser Leu Gly Leu Val
1115 1120 1125
tac gga cca acc ttt gca aac gtg acg gag att cgg agg acg ggc 3429
Tyr Gly Pro Thr Phe Ala Asn Val Thr Glu Ile Arg Arg Thr Gly
1130 1135 1140
cag ggc cag tgt atc ggt gcc gtc cgt atc ccg gcc gtg gac agc 3474
Gln Gly Gln Cys Ile Gly Ala Val Arg Ile Pro Ala Val Asp Ser
1145 1150 1155
ctc gtg ccg ccc gca tac cgc agc cat cct cac gtc atc cat ccg 3519
Leu Val Pro Pro Ala Tyr Arg Ser His Pro His Val Ile His Pro
1160 1165 1170
ggg acg ttg gat gcc gtc ttc cac ctc gcc ttt gcg gcg ctc gag 3564
Gly Thr Leu Asp Ala Val Phe His Leu Ala Phe Ala Ala Leu Glu
1175 1180 1185
gac tcg ttg ctt ccg ggc ccc atg gtc cca acg aca atc gac gag 3609
Asp Ser Leu Leu Pro Gly Pro Met Val Pro Thr Thr Ile Asp Glu
1190 1195 1200
ctg gtc gtg gca gca gat aca cca aac acc cct ggc act ctg ctt 3654
Leu Val Val Ala Ala Asp Thr Pro Asn Thr Pro Gly Thr Leu Leu
1205 1210 1215
cgg gga gtc tca cgc tct tct cct cac ggc ttc aga gag ctc atc 3699
Arg Gly Val Ser Arg Ser Ser Pro His Gly Phe Arg Glu Leu Ile
1220 1225 1230
tcc gac att gac atg ctg gac gac caa agc agc aga gca ctt gtg 3744
Ser Asp Ile Asp Met Leu Asp Asp Gln Ser Ser Arg Ala Leu Val
1235 1240 1245
caa atc aag ggg ttc cgt tgc gcc gac gta tcc ggg ggg cgc atg 3789
Gln Ile Lys Gly Phe Arg Cys Ala Asp Val Ser Gly Gly Arg Met
1250 1255 1260
acg tcg tcg gag gcg gcg tca gca gag agc cgg ccg att ggc ttc 3834
Thr Ser Ser Glu Ala Ala Ser Ala Glu Ser Arg Pro Ile Gly Phe
1265 1270 1275
cgt ctc gag tgg aag ccg gca atc gac ttg ctg acc ggt gag cag 3879
Arg Leu Glu Trp Lys Pro Ala Ile Asp Leu Leu Thr Gly Glu Gln
1280 1285 1290
cta cgg aca cat ctt gac cgt cgt gtc aag cag gag ggt gcg tcc 3924
Leu Arg Thr His Leu Asp Arg Arg Val Lys Gln Glu Gly Ala Ser
1295 1300 1305
aac gtc gcc cgc gcc aca gag ctg aac aat cat gtc cat cac ctt 3969
Asn Val Ala Arg Ala Thr Glu Leu Asn Asn His Val His His Leu
1310 1315 1320
gaa gaa act tta cct cgc gtt gcc gtg gat cct gcc atg gca aac 4014
Glu Glu Thr Leu Pro Arg Val Ala Val Asp Pro Ala Met Ala Asn
1325 1330 1335
ttg tct gac tgg ctg tcg gcc aag tct gca aaa ctc acg aat ggt 4059
Leu Ser Asp Trp Leu Ser Ala Lys Ser Ala Lys Leu Thr Asn Gly
1340 1345 1350
act act tca tca tcc aaa cgt cta tcc cca ggg ggt gac atg ctc 4104
Thr Thr Ser Ser Ser Lys Arg Leu Ser Pro Gly Gly Asp Met Leu
1355 1360 1365
gca atg aga gac gcc ttg acc gcc gtg cga gca ggg agc att cca 4149
Ala Met Arg Asp Ala Leu Thr Ala Val Arg Ala Gly Ser Ile Pro
1370 1375 1380
tca cca gaa caa caa gac agg atg ctg aga gag gtg gag caa aac 4194
Ser Pro Glu Gln Gln Asp Arg Met Leu Arg Glu Val Glu Gln Asn
1385 1390 1395
ggc gct ctg tcc att cta ttc aag ccg ctc gac gca tat atc gac 4239
Gly Ala Leu Ser Ile Leu Phe Lys Pro Leu Asp Ala Tyr Ile Asp
1400 1405 1410
ctt cgc cat cat gcc aag ccc aac ctg tcg att ctt gag ctg agc 4284
Leu Arg His His Ala Lys Pro Asn Leu Ser Ile Leu Glu Leu Ser
1415 1420 1425
ctg gat tcg gtg cca tac tct gtc ttt gca gcc ctg ccc agt cga 4329
Leu Asp Ser Val Pro Tyr Ser Val Phe Ala Ala Leu Pro Ser Arg
1430 1435 1440
cac aag att ctc cag aca gcg cag tac gcc att aga gta tcg caa 4374
His Lys Ile Leu Gln Thr Ala Gln Tyr Ala Ile Arg Val Ser Gln
1445 1450 1455
gag ggc gtc gcc gac cga gtc agg gcc cag ttt ggg tct cag gct 4419
Glu Gly Val Ala Asp Arg Val Arg Ala Gln Phe Gly Ser Gln Ala
1460 1465 1470
tcc gac att gac gtc tcc gtc aca gac ttt aca aag aaa ctc gac 4464
Ser Asp Ile Asp Val Ser Val Thr Asp Phe Thr Lys Lys Leu Asp
1475 1480 1485
gag ggc ttg gga aag cat gat gtc att ctc ata ttt gac cct ggc 4509
Glu Gly Leu Gly Lys His Asp Val Ile Leu Ile Phe Asp Pro Gly
1490 1495 1500
ttc gta cac gca aag cta gag gtc gtt ttg cgc aac gcg cgc aag 4554
Phe Val His Ala Lys Leu Glu Val Val Leu Arg Asn Ala Arg Lys
1505 1510 1515
ctg ttg aac cca ggg ggc agg atc gtc gtc gca gaa gtc agc gac 4599
Leu Leu Asn Pro Gly Gly Arg Ile Val Val Ala Glu Val Ser Asp
1520 1525 1530
cct ggg ctc tac ttg ggc aca gca ctg ggc tgt ctt cag tgg aca 4644
Pro Gly Leu Tyr Leu Gly Thr Ala Leu Gly Cys Leu Gln Trp Thr
1535 1540 1545
aga aac cta gac gtt gcc cag agc agc agc agc tgg aca tcg tgt 4689
Arg Asn Leu Asp Val Ala Gln Ser Ser Ser Ser Trp Thr Ser Cys
1550 1555 1560
ctc gcg cgc tcg gga ctg acg cct gct ctc aaa ctc atc gac atg 4734
Leu Ala Arg Ser Gly Leu Thr Pro Ala Leu Lys Leu Ile Asp Met
1565 1570 1575
gac aca gag tcc gcc gtt cac gga cac ttc cgc ctg agt ctc aca 4779
Asp Thr Glu Ser Ala Val His Gly His Phe Arg Leu Ser Leu Thr
1580 1585 1590
ggc aat gcc gcc gag tcg acc aac agt gac aat cgc cag ccg cag 4824
Gly Asn Ala Ala Glu Ser Thr Asn Ser Asp Asn Arg Gln Pro Gln
1595 1600 1605
caa gtc acc ctc ata gaa gcc gcc aat cca tct gcc acg gcg caa 4869
Gln Val Thr Leu Ile Glu Ala Ala Asn Pro Ser Ala Thr Ala Gln
1610 1615 1620
gat atc gcg gca gcc gtg gcc cag aat ctt gac aag gcg tcg att 4914
Asp Ile Ala Ala Ala Val Ala Gln Asn Leu Asp Lys Ala Ser Ile
1625 1630 1635
ccc aca aag cgc atc cgt tgg ggc tcc gac gtg tcg cag ctc aag 4959
Pro Thr Lys Arg Ile Arg Trp Gly Ser Asp Val Ser Gln Leu Lys
1640 1645 1650
ggc cag cct tgc atc gtc ctg acg gac ttg gag tct gcg ctt ctc 5004
Gly Gln Pro Cys Ile Val Leu Thr Asp Leu Glu Ser Ala Leu Leu
1655 1660 1665
aag gac ccg gca cca gag gat ctc gcg gcc ctg cag tcg ctg ttc 5049
Lys Asp Pro Ala Pro Glu Asp Leu Ala Ala Leu Gln Ser Leu Phe
1670 1675 1680
gcg cat gcc gag agc acc ctc tgg gtc agt ggc ccc ctg gga cct 5094
Ala His Ala Glu Ser Thr Leu Trp Val Ser Gly Pro Leu Gly Pro
1685 1690 1695
gat gct gct ctg atc acg ggc ctg tct cgc agc gtt tgc aac gag 5139
Asp Ala Ala Leu Ile Thr Gly Leu Ser Arg Ser Val Cys Asn Glu
1700 1705 1710
gcg gcc gac gtc cat ata cgc acg ctt gag gtg act gat ctg cct 5184
Ala Ala Asp Val His Ile Arg Thr Leu Glu Val Thr Asp Leu Pro
1715 1720 1725
ggc ccc ggg gcc gac agc tac gcc gac ctg gtc act cgc gtc ttc 5229
Gly Pro Gly Ala Asp Ser Tyr Ala Asp Leu Val Thr Arg Val Phe
1730 1735 1740
cgg tat agc ggt ccc gat aca gag ttt cgg tgg cat tca gac gcg 5274
Arg Tyr Ser Gly Pro Asp Thr Glu Phe Arg Trp His Ser Asp Ala
1745 1750 1755
ctg ctt gtc agc cgc ctg gtc gag gat gag gcc cga aac aag gag 5319
Leu Leu Val Ser Arg Leu Val Glu Asp Glu Ala Arg Asn Lys Glu
1760 1765 1770
att gca cag ctg ctg ggc cag gga gaa aag gcc gcg gtt gcg act 5364
Ile Ala Gln Leu Leu Gly Gln Gly Glu Lys Ala Ala Val Ala Thr
1775 1780 1785
acg cta cag gag aag cca gag gga ctg aag cta tgc atg cgc cag 5409
Thr Leu Gln Glu Lys Pro Glu Gly Leu Lys Leu Cys Met Arg Gln
1790 1795 1800
att ggc atg ctg gac tct gtt tgc ttt gag ccc gac ttg ttg gct 5454
Ile Gly Met Leu Asp Ser Val Cys Phe Glu Pro Asp Leu Leu Ala
1805 1810 1815
ttg gag cca ctg gaa gca ggc gag gtg gaa gtc gac gtc aag gcc 5499
Leu Glu Pro Leu Glu Ala Gly Glu Val Glu Val Asp Val Lys Ala
1820 1825 1830
tcc gga gtc aac ttc cga gat gtc atg gtc gcc ttg gga cag att 5544
Ser Gly Val Asn Phe Arg Asp Val Met Val Ala Leu Gly Gln Ile
1835 1840 1845
cca gac cgg gca ttc ggg ttc gag ggc gct ggt gtc gtt cgc cgt 5589
Pro Asp Arg Ala Phe Gly Phe Glu Gly Ala Gly Val Val Arg Arg
1850 1855 1860
gta cat gct tca gag acg cgc ctc cgc cca gga gac cga gtc gtc 5634
Val His Ala Ser Glu Thr Arg Leu Arg Pro Gly Asp Arg Val Val
1865 1870 1875
ttc ctc gct cac gga gca cac cgt aca gtc cat cgc gta cgc gcc 5679
Phe Leu Ala His Gly Ala His Arg Thr Val His Arg Val Arg Ala
1880 1885 1890
gac tac gcc atg cct atg cct gat acc atg agc ttt gaa gag ggc 5724
Asp Tyr Ala Met Pro Met Pro Asp Thr Met Ser Phe Glu Glu Gly
1895 1900 1905
gcg gcc att ctc ctc gtc cac acg aca gct tgg tac gca ctc gtc 5769
Ala Ala Ile Leu Leu Val His Thr Thr Ala Trp Tyr Ala Leu Val
1910 1915 1920
aag tcg gcg cgc gca aca gcc ggc cag tca gtc ctc gtt cac gct 5814
Lys Ser Ala Arg Ala Thr Ala Gly Gln Ser Val Leu Val His Ala
1925 1930 1935
gcc gca ggt ggt gtt ggc cag gcc gtc ctc atg ctt gct cga cat 5859
Ala Ala Gly Gly Val Gly Gln Ala Val Leu Met Leu Ala Arg His
1940 1945 1950
cta ggt cta cag gtt ttc gcg acg gtt ggt tcc gag gag aag agg 5904
Leu Gly Leu Gln Val Phe Ala Thr Val Gly Ser Glu Glu Lys Arg
1955 1960 1965
aag ctt gtg cac gaa acg tac ggg gtt ccc cac gac cac atc ttc 5949
Lys Leu Val His Glu Thr Tyr Gly Val Pro His Asp His Ile Phe
1970 1975 1980
aac tcg cga gac gcc agc ttt gcc atg ggc gtg aag cgc atg acc 5994
Asn Ser Arg Asp Ala Ser Phe Ala Met Gly Val Lys Arg Met Thr
1985 1990 1995
aaa ggc cgc ggg gtc gat att gtt gtc aat tcg ctg gct ggg gaa 6039
Lys Gly Arg Gly Val Asp Ile Val Val Asn Ser Leu Ala Gly Glu
2000 2005 2010
gct ctc cgg cag acg tgg cac tgc ctg gcc ccc ttt ggc acc ttt 6084
Ala Leu Arg Gln Thr Trp His Cys Leu Ala Pro Phe Gly Thr Phe
2015 2020 2025
gtc gag ctc ggc atg aag gac atc ttg gac aac gca cgc ctg gac 6129
Val Glu Leu Gly Met Lys Asp Ile Leu Asp Asn Ala Arg Leu Asp
2030 2035 2040
atg aag ccc ttc ctc cag gat gcc aca ttc gtc ttc ttt aac ctg 6174
Met Lys Pro Phe Leu Gln Asp Ala Thr Phe Val Phe Phe Asn Leu
2045 2050 2055
aac cgt gtc caa aag gag cgg cca gac ctc atg gga gag gct ctc 6219
Asn Arg Val Gln Lys Glu Arg Pro Asp Leu Met Gly Glu Ala Leu
2060 2065 2070
cga gag aca atg gcc ctt gta cgc tcc ggc gct ctc aag ccc gcg 6264
Arg Glu Thr Met Ala Leu Val Arg Ser Gly Ala Leu Lys Pro Ala
2075 2080 2085
acg ccg ctc acc tcg tat ccc gcc tct cag gtg gaa gcg gca ttc 6309
Thr Pro Leu Thr Ser Tyr Pro Ala Ser Gln Val Glu Ala Ala Phe
2090 2095 2100
cgc aag att caa acg ggc cag cac cta ggg aag ctc gtg ctg aca 6354
Arg Lys Ile Gln Thr Gly Gln His Leu Gly Lys Leu Val Leu Thr
2105 2110 2115
ttc cag gag gga gat gtt gtc ccc gtc gtc aga cca gac ctc agc 6399
Phe Gln Glu Gly Asp Val Val Pro Val Val Arg Pro Asp Leu Ser
2120 2125 2130
cta agt gac tct ggc acc tac ctt ctc gtc gga gga ctc ggc ggc 6444
Leu Ser Asp Ser Gly Thr Tyr Leu Leu Val Gly Gly Leu Gly Gly
2135 2140 2145
ttg ggc cgg agt ctt gca cgg ctc ctg gtg cag ctt ggg gcg cgc 6489
Leu Gly Arg Ser Leu Ala Arg Leu Leu Val Gln Leu Gly Ala Arg
2150 2155 2160
cgg ctg tgc ttc ctc tct cgc tcc ggc gca gca agc agc gag gcg 6534
Arg Leu Cys Phe Leu Ser Arg Ser Gly Ala Ala Ser Ser Glu Ala
2165 2170 2175
cgc gcc ctc gtc aag gaa ctg gag atg cag cat cga gta cgc gtc 6579
Arg Ala Leu Val Lys Glu Leu Glu Met Gln His Arg Val Arg Val
2180 2185 2190
ctc gtc tgc aaa ggg gac gtg tcc gac gcc gac acc gta tcc cgc 6624
Leu Val Cys Lys Gly Asp Val Ser Asp Ala Asp Thr Val Ser Arg
2195 2200 2205
gtc gtc cag caa tgc cgg gcg gct ctg ggg ccc atc cgg ggc gtc 6669
Val Val Gln Gln Cys Arg Ala Ala Leu Gly Pro Ile Arg Gly Val
2210 2215 2220
att cag tgt gcc atg gtc ctc cgt gac ggt ctc ttt gag agg atg 6714
Ile Gln Cys Ala Met Val Leu Arg Asp Gly Leu Phe Glu Arg Met
2225 2230 2235
gct cac gat cag tgg acc gaa agc acg cgg ccc aag gtg cag ggc 6759
Ala His Asp Gln Trp Thr Glu Ser Thr Arg Pro Lys Val Gln Gly
2240 2245 2250
acg tgg aac ctg cac gag cag atc cca gtg tcc gac ttt ttc atc 6804
Thr Trp Asn Leu His Glu Gln Ile Pro Val Ser Asp Phe Phe Ile
2255 2260 2265
acg ctg agt tcc ttt gcg ggc gtc ttt gga agc cgt ggg cag agc 6849
Thr Leu Ser Ser Phe Ala Gly Val Phe Gly Ser Arg Gly Gln Ser
2270 2275 2280
aac tac gcc gct gcg ggt gcg tac gag gat gcc atg gca cac cat 6894
Asn Tyr Ala Ala Ala Gly Ala Tyr Glu Asp Ala Met Ala His His
2285 2290 2295
cgg gag tct ctg ggc cag agg gcc atc acc atc gac ttg ggc atc 6939
Arg Glu Ser Leu Gly Gln Arg Ala Ile Thr Ile Asp Leu Gly Ile
2300 2305 2310
atg cga gac gtg ggt gtt ctc gcc gag aac ggc atc acc gac tat 6984
Met Arg Asp Val Gly Val Leu Ala Glu Asn Gly Ile Thr Asp Tyr
2315 2320 2325
ctc cgc gag tgg gag gag ccg ttt gga atc cgc gag ccc gag ttc 7029
Leu Arg Glu Trp Glu Glu Pro Phe Gly Ile Arg Glu Pro Glu Phe
2330 2335 2340
cat gcg ctc atc aag tca gcc atc atg tcg acg acg cag ccc ctg 7074
His Ala Leu Ile Lys Ser Ala Ile Met Ser Thr Thr Gln Pro Leu
2345 2350 2355
act gaa cgc tcc gtg gtg cag atc cca acc ggc ctg gcc acg gcc 7119
Thr Glu Arg Ser Val Val Gln Ile Pro Thr Gly Leu Ala Thr Ala
2360 2365 2370
cgg tct gcg cag gca gcc ggt ata agc aca ccg ttc tac ttt gat 7164
Arg Ser Ala Gln Ala Ala Gly Ile Ser Thr Pro Phe Tyr Phe Asp
2375 2380 2385
gat gcc cgt ttc tcc atc ctg gcc cag aca cgc gcc tcg gcc ggt 7209
Asp Ala Arg Phe Ser Ile Leu Ala Gln Thr Arg Ala Ser Ala Gly
2390 2395 2400
gcc tcg tct gca gct ggg tct ggt gac gcc gat gcc ggc aag gtt 7254
Ala Ser Ser Ala Ala Gly Ser Gly Asp Ala Asp Ala Gly Lys Val
2405 2410 2415
tct gtg cgg acg cag ctt tcc cag gct cat tcc gtg gct gaa gcc 7299
Ser Val Arg Thr Gln Leu Ser Gln Ala His Ser Val Ala Glu Ala
2420 2425 2430
gcc gcc gcc gtc cag acg gtg ctt ctt gag cgc gtg gca agg acc 7344
Ala Ala Ala Val Gln Thr Val Leu Leu Glu Arg Val Ala Arg Thr
2435 2440 2445
ctt cag agc tcc gtg gcg gaa atc gat ccc tcc cgg cca ctg cac 7389
Leu Gln Ser Ser Val Ala Glu Ile Asp Pro Ser Arg Pro Leu His
2450 2455 2460
tcg tac ggt gta gat tcc ttg gtg gcc gtg gaa acg gtc aag tgg 7434
Ser Tyr Gly Val Asp Ser Leu Val Ala Val Glu Thr Val Lys Trp
2465 2470 2475
atg ttt aag acg ctg gac gct aag atg acg gtg ttt gat gtt ctt 7479
Met Phe Lys Thr Leu Asp Ala Lys Met Thr Val Phe Asp Val Leu
2480 2485 2490
tcc aac gtg tcc atc acg gcg ctg tgc gag aag att gca tcc atg 7524
Ser Asn Val Ser Ile Thr Ala Leu Cys Glu Lys Ile Ala Ser Met
2495 2500 2505
tct act ttg gtg aaa ttg aac tag 7548
Ser Thr Leu Val Lys Leu Asn
2510 2515
<210> 2
<211> 2515
<212> PRT
<213> Metarhizium anisopliae
<400> 2
Met Gln Ala Pro Ala Pro Ser Arg Asp Asp Ile Ala Val Val Gly Leu
1 5 10 15
Ser Cys Arg Phe Pro Gly Glu Ala Asp Thr Ala Glu His Phe Trp Asp
20 25 30
Phe Ile Cys Asn Gly Arg Asn Ala Tyr Ser Glu Asn Pro Asp Arg Trp
35 40 45
Thr Pro Asp Ala Phe His Tyr Gly Glu Lys Lys Ile Asn Thr Ser Leu
50 55 60
Pro Arg Gly Gly His Phe Met Lys Gln Asp Val Ala Ala Phe Asp Ala
65 70 75 80
Asn Phe Phe Asn Leu Ser Lys Val Glu Ala Glu Ser Met Asp Pro Gln
85 90 95
Gln Arg Ile Met Met Glu Val Thr Tyr Glu Ser Met Glu Ser Ala Gly
100 105 110
Leu Arg Val Asp Gln Leu Ala Gly Ser Arg Thr Gly Val Phe Met Ala
115 120 125
Ser Phe Thr Ser Asp Tyr Arg Glu Met Leu Tyr Arg Asp Ala Glu Thr
130 135 140
Ala Pro Leu Tyr Thr Ala Thr Gly Thr Ser Asn Thr Ser Thr Ser Asn
145 150 155 160
Arg Val Ser Trp Phe Phe Asp Leu Arg Gly Pro Ser Phe Thr Val Asn
165 170 175
Thr Ala Cys Ser Ser Ser Leu Val Ala Cys His Leu Ala Cys Gln Ser
180 185 190
Leu Trp Ser Gly Glu Thr Glu Ser Ala Ile Val Gly Gly Thr Ser Leu
195 200 205
Leu Leu Asn Pro Asp Met Phe Leu Tyr Leu Ser Asn Gln Gln Phe Leu
210 215 220
Ala Pro Asp Gly Gln Cys Lys Ser Phe Asp Glu Ser Gly Asp Gly Tyr
225 230 235 240
Ala Arg Gly Asp Gly Ile Gly Val Val Ile Leu Lys Arg Val Ala Asp
245 250 255
Ala Leu Arg Asp Gly Asp Pro Ile Arg Ala Val Ile Arg Gly Ser Gly
260 265 270
Cys Asn Gln Asp Gly His Thr Lys Gly Phe Thr Ile Pro Ser Val Asp
275 280 285
Ala Gln Ala Ser Leu Ile Ala Glu Thr Tyr Arg Asn Ala Gly Leu Ser
290 295 300
Leu Ala Glu Thr Arg Tyr Val Glu Ala His Gly Thr Gly Thr Gln Ala
305 310 315 320
Gly Asp Thr Arg Glu Met Glu Gly Ile Ala Arg Thr Phe Ser Gln His
325 330 335
Arg Thr Ala Ser Asp Glu Leu Leu Val Gly Ser Val Lys Ala Asn Ile
340 345 350
Gly His Leu Glu Ala Cys Ala Gly Leu Ala Ser Leu Ile Lys Cys Val
355 360 365
Tyr Ile Leu Glu Thr Gly Val Ile Pro Pro Thr Pro Ser Val Arg Val
370 375 380
Leu Asn Pro Lys Ile Arg Trp Glu Glu Trp His Leu Lys Val Pro Ala
385 390 395 400
Thr Gln Thr Thr Trp Pro Thr Glu Gly Leu Arg Arg Ile Ser Thr Gln
405 410 415
Gly Phe Gly Tyr Gly Gly Thr Asn Ala His Leu Ile Leu Asp Asp Ala
420 425 430
Ala His Tyr Leu Glu Ala Arg Lys Leu Arg Gly His His Tyr Thr Arg
435 440 445
Thr His Pro Gln Thr Gln Arg Leu Leu Thr Ser Ala Met Gln Glu Asp
450 455 460
Val Ser Asn Asp His Pro Pro Arg Leu Phe Leu Phe Arg Ala Asn Asp
465 470 475 480
Arg Glu Gly Leu Gly Arg Val Arg Ser Ser Leu Ala Gln His Leu Glu
485 490 495
Gln Leu Leu Lys Ser Trp Pro Gln Asp Ser Arg Asp Gly Gly Ala Tyr
500 505 510
Leu His Asn Leu Ala Phe Thr Leu Ala Ser Arg Arg Ser His Leu Gln
515 520 525
Trp Gln Thr Tyr Ala Thr Ala Ser Thr Pro Ser Glu Leu Leu Gln Ala
530 535 540
Leu Gln His Glu Gly Ser Ala Trp Ala Ala Pro Glu Thr Arg Leu Ala
545 550 555 560
Ala Ser Pro Pro Arg Leu Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln
565 570 575
Trp Ala Arg Met Gly Val Glu Leu Met Ala Tyr Pro Val Phe Arg Gln
580 585 590
Ser Val Glu Ala Ser Asp Gly Phe Leu Arg Ser Ala Leu Gly Cys Pro
595 600 605
Trp Ser Ala Val Asp Glu Leu Ala Gln Pro Gln Ala Thr Ser Arg Leu
610 615 620
Ser Glu Ala Ala Tyr Ser Gln Thr Leu Cys Thr Val Leu Gln Ile Ala
625 630 635 640
Thr Val Asp Leu Leu Glu Asp Trp Asn Val Cys Pro Thr Arg Val Ala
645 650 655
Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Ala Leu
660 665 670
Ser Lys His Asp Ser Leu Arg Val Ala Tyr Tyr Arg Gly Ile Leu Ser
675 680 685
Ser Glu Met Gln Gln Thr His Ala Asp Arg Arg Gly Ala Met Met Ala
690 695 700
Val Gly Ala Ser Pro Glu Glu Val Glu Ala Trp Leu Ala Lys Leu Thr
705 710 715 720
Arg Gly Arg Val Val Val Ala Cys Ile Asn Ser Pro Thr Ser Val Thr
725 730 735
Ala Ser Gly Asp Ala Ala Gly Val Asp Glu Leu Leu Ala Met Val Gln
740 745 750
Gln Ala Gly Val Phe Gly Arg Lys Leu Gln Val Asp Val Ala Tyr His
755 760 765
Ser His His Met Gln Ser Val Ser Ser Ala Tyr Ser Glu Leu Leu Lys
770 775 780
Asp Leu Ala Pro Leu Pro Ala Arg Pro Gly Arg Thr Met His Ser Ser
785 790 795 800
Val Leu Gly Arg Val Ile Asp Ala Ala Glu Leu Gly Ala Ser Asn Trp
805 810 815
Val Gln Asn Leu Val Ser Pro Val Arg Phe Ser Glu Ala Val Ser Ser
820 825 830
Leu Leu Ser Ala Gly Asp Lys Pro Ala Val Asp Val Leu Val Glu Ile
835 840 845
Gly Pro His Ala Ala Leu Lys Gly Pro Val Gln Gln Ile Leu Gln Ala
850 855 860
Gln Gly Val Ser Ala Val Lys Tyr Thr Ser Val Leu Ser Arg Gly Gln
865 870 875 880
Ser Ala Val Lys Thr Ala Leu Ala Cys Ala Gly Glu Leu Val Leu Ser
885 890 895
Ser Val Pro Val Ala Val Ser Arg Val Asn Leu Glu Ser Gly Pro Pro
900 905 910
Pro Ser Pro Leu Val Asp Leu Pro Pro Tyr Pro Trp Asn Arg Ser Thr
915 920 925
Arg Phe Trp Ala Glu Ser Arg Leu Ser Arg Glu Tyr Arg Leu Arg Lys
930 935 940
His Ala Arg Leu Pro Leu Leu Gly Ser Pro Cys Pro Thr Met Gly Ala
945 950 955 960
Arg Glu Arg Tyr Trp Arg Gly Met Val Arg Leu Glu Glu Glu Pro Trp
965 970 975
Ile Arg Asp His Glu Ile Gln Gly Ser Ile Leu Tyr Pro Gly Ala Gly
980 985 990
Phe Leu Ile Met Ala Ile Glu Ala Ala Ser Gln Gln Ala Gly Glu Gln
995 1000 1005
Arg Lys Val Ser Ala Phe Arg Leu Arg Asp Val His Leu Asp Ala
1010 1015 1020
Ala Leu Val Val Thr Glu Asp Ser Thr Ala Glu Ala Ile Leu Gln
1025 1030 1035
Leu Arg Pro His Leu Leu Ala Pro Gly Ser Ser Gln Ser Ser Trp
1040 1045 1050
Met Glu Phe Thr Val Asn Ser Ser Ile Asp Gly Gly Asp Leu Arg
1055 1060 1065
Gln Asn Cys Ser Gly Leu Ile Met Ile Glu Tyr Ala Ala Asp Ala
1070 1075 1080
Asp Ser Ala Met Asp Arg Glu Arg Ala Leu Glu Ser Asp Met Val
1085 1090 1095
Cys Asp Trp Tyr Lys Lys Thr Tyr Val Ser Cys Gln Gln Ser Val
1100 1105 1110
Asp Val Gly Lys Phe Tyr Ser Arg Leu Ala Ser Leu Gly Leu Val
1115 1120 1125
Tyr Gly Pro Thr Phe Ala Asn Val Thr Glu Ile Arg Arg Thr Gly
1130 1135 1140
Gln Gly Gln Cys Ile Gly Ala Val Arg Ile Pro Ala Val Asp Ser
1145 1150 1155
Leu Val Pro Pro Ala Tyr Arg Ser His Pro His Val Ile His Pro
1160 1165 1170
Gly Thr Leu Asp Ala Val Phe His Leu Ala Phe Ala Ala Leu Glu
1175 1180 1185
Asp Ser Leu Leu Pro Gly Pro Met Val Pro Thr Thr Ile Asp Glu
1190 1195 1200
Leu Val Val Ala Ala Asp Thr Pro Asn Thr Pro Gly Thr Leu Leu
1205 1210 1215
Arg Gly Val Ser Arg Ser Ser Pro His Gly Phe Arg Glu Leu Ile
1220 1225 1230
Ser Asp Ile Asp Met Leu Asp Asp Gln Ser Ser Arg Ala Leu Val
1235 1240 1245
Gln Ile Lys Gly Phe Arg Cys Ala Asp Val Ser Gly Gly Arg Met
1250 1255 1260
Thr Ser Ser Glu Ala Ala Ser Ala Glu Ser Arg Pro Ile Gly Phe
1265 1270 1275
Arg Leu Glu Trp Lys Pro Ala Ile Asp Leu Leu Thr Gly Glu Gln
1280 1285 1290
Leu Arg Thr His Leu Asp Arg Arg Val Lys Gln Glu Gly Ala Ser
1295 1300 1305
Asn Val Ala Arg Ala Thr Glu Leu Asn Asn His Val His His Leu
1310 1315 1320
Glu Glu Thr Leu Pro Arg Val Ala Val Asp Pro Ala Met Ala Asn
1325 1330 1335
Leu Ser Asp Trp Leu Ser Ala Lys Ser Ala Lys Leu Thr Asn Gly
1340 1345 1350
Thr Thr Ser Ser Ser Lys Arg Leu Ser Pro Gly Gly Asp Met Leu
1355 1360 1365
Ala Met Arg Asp Ala Leu Thr Ala Val Arg Ala Gly Ser Ile Pro
1370 1375 1380
Ser Pro Glu Gln Gln Asp Arg Met Leu Arg Glu Val Glu Gln Asn
1385 1390 1395
Gly Ala Leu Ser Ile Leu Phe Lys Pro Leu Asp Ala Tyr Ile Asp
1400 1405 1410
Leu Arg His His Ala Lys Pro Asn Leu Ser Ile Leu Glu Leu Ser
1415 1420 1425
Leu Asp Ser Val Pro Tyr Ser Val Phe Ala Ala Leu Pro Ser Arg
1430 1435 1440
His Lys Ile Leu Gln Thr Ala Gln Tyr Ala Ile Arg Val Ser Gln
1445 1450 1455
Glu Gly Val Ala Asp Arg Val Arg Ala Gln Phe Gly Ser Gln Ala
1460 1465 1470
Ser Asp Ile Asp Val Ser Val Thr Asp Phe Thr Lys Lys Leu Asp
1475 1480 1485
Glu Gly Leu Gly Lys His Asp Val Ile Leu Ile Phe Asp Pro Gly
1490 1495 1500
Phe Val His Ala Lys Leu Glu Val Val Leu Arg Asn Ala Arg Lys
1505 1510 1515
Leu Leu Asn Pro Gly Gly Arg Ile Val Val Ala Glu Val Ser Asp
1520 1525 1530
Pro Gly Leu Tyr Leu Gly Thr Ala Leu Gly Cys Leu Gln Trp Thr
1535 1540 1545
Arg Asn Leu Asp Val Ala Gln Ser Ser Ser Ser Trp Thr Ser Cys
1550 1555 1560
Leu Ala Arg Ser Gly Leu Thr Pro Ala Leu Lys Leu Ile Asp Met
1565 1570 1575
Asp Thr Glu Ser Ala Val His Gly His Phe Arg Leu Ser Leu Thr
1580 1585 1590
Gly Asn Ala Ala Glu Ser Thr Asn Ser Asp Asn Arg Gln Pro Gln
1595 1600 1605
Gln Val Thr Leu Ile Glu Ala Ala Asn Pro Ser Ala Thr Ala Gln
1610 1615 1620
Asp Ile Ala Ala Ala Val Ala Gln Asn Leu Asp Lys Ala Ser Ile
1625 1630 1635
Pro Thr Lys Arg Ile Arg Trp Gly Ser Asp Val Ser Gln Leu Lys
1640 1645 1650
Gly Gln Pro Cys Ile Val Leu Thr Asp Leu Glu Ser Ala Leu Leu
1655 1660 1665
Lys Asp Pro Ala Pro Glu Asp Leu Ala Ala Leu Gln Ser Leu Phe
1670 1675 1680
Ala His Ala Glu Ser Thr Leu Trp Val Ser Gly Pro Leu Gly Pro
1685 1690 1695
Asp Ala Ala Leu Ile Thr Gly Leu Ser Arg Ser Val Cys Asn Glu
1700 1705 1710
Ala Ala Asp Val His Ile Arg Thr Leu Glu Val Thr Asp Leu Pro
1715 1720 1725
Gly Pro Gly Ala Asp Ser Tyr Ala Asp Leu Val Thr Arg Val Phe
1730 1735 1740
Arg Tyr Ser Gly Pro Asp Thr Glu Phe Arg Trp His Ser Asp Ala
1745 1750 1755
Leu Leu Val Ser Arg Leu Val Glu Asp Glu Ala Arg Asn Lys Glu
1760 1765 1770
Ile Ala Gln Leu Leu Gly Gln Gly Glu Lys Ala Ala Val Ala Thr
1775 1780 1785
Thr Leu Gln Glu Lys Pro Glu Gly Leu Lys Leu Cys Met Arg Gln
1790 1795 1800
Ile Gly Met Leu Asp Ser Val Cys Phe Glu Pro Asp Leu Leu Ala
1805 1810 1815
Leu Glu Pro Leu Glu Ala Gly Glu Val Glu Val Asp Val Lys Ala
1820 1825 1830
Ser Gly Val Asn Phe Arg Asp Val Met Val Ala Leu Gly Gln Ile
1835 1840 1845
Pro Asp Arg Ala Phe Gly Phe Glu Gly Ala Gly Val Val Arg Arg
1850 1855 1860
Val His Ala Ser Glu Thr Arg Leu Arg Pro Gly Asp Arg Val Val
1865 1870 1875
Phe Leu Ala His Gly Ala His Arg Thr Val His Arg Val Arg Ala
1880 1885 1890
Asp Tyr Ala Met Pro Met Pro Asp Thr Met Ser Phe Glu Glu Gly
1895 1900 1905
Ala Ala Ile Leu Leu Val His Thr Thr Ala Trp Tyr Ala Leu Val
1910 1915 1920
Lys Ser Ala Arg Ala Thr Ala Gly Gln Ser Val Leu Val His Ala
1925 1930 1935
Ala Ala Gly Gly Val Gly Gln Ala Val Leu Met Leu Ala Arg His
1940 1945 1950
Leu Gly Leu Gln Val Phe Ala Thr Val Gly Ser Glu Glu Lys Arg
1955 1960 1965
Lys Leu Val His Glu Thr Tyr Gly Val Pro His Asp His Ile Phe
1970 1975 1980
Asn Ser Arg Asp Ala Ser Phe Ala Met Gly Val Lys Arg Met Thr
1985 1990 1995
Lys Gly Arg Gly Val Asp Ile Val Val Asn Ser Leu Ala Gly Glu
2000 2005 2010
Ala Leu Arg Gln Thr Trp His Cys Leu Ala Pro Phe Gly Thr Phe
2015 2020 2025
Val Glu Leu Gly Met Lys Asp Ile Leu Asp Asn Ala Arg Leu Asp
2030 2035 2040
Met Lys Pro Phe Leu Gln Asp Ala Thr Phe Val Phe Phe Asn Leu
2045 2050 2055
Asn Arg Val Gln Lys Glu Arg Pro Asp Leu Met Gly Glu Ala Leu
2060 2065 2070
Arg Glu Thr Met Ala Leu Val Arg Ser Gly Ala Leu Lys Pro Ala
2075 2080 2085
Thr Pro Leu Thr Ser Tyr Pro Ala Ser Gln Val Glu Ala Ala Phe
2090 2095 2100
Arg Lys Ile Gln Thr Gly Gln His Leu Gly Lys Leu Val Leu Thr
2105 2110 2115
Phe Gln Glu Gly Asp Val Val Pro Val Val Arg Pro Asp Leu Ser
2120 2125 2130
Leu Ser Asp Ser Gly Thr Tyr Leu Leu Val Gly Gly Leu Gly Gly
2135 2140 2145
Leu Gly Arg Ser Leu Ala Arg Leu Leu Val Gln Leu Gly Ala Arg
2150 2155 2160
Arg Leu Cys Phe Leu Ser Arg Ser Gly Ala Ala Ser Ser Glu Ala
2165 2170 2175
Arg Ala Leu Val Lys Glu Leu Glu Met Gln His Arg Val Arg Val
2180 2185 2190
Leu Val Cys Lys Gly Asp Val Ser Asp Ala Asp Thr Val Ser Arg
2195 2200 2205
Val Val Gln Gln Cys Arg Ala Ala Leu Gly Pro Ile Arg Gly Val
2210 2215 2220
Ile Gln Cys Ala Met Val Leu Arg Asp Gly Leu Phe Glu Arg Met
2225 2230 2235
Ala His Asp Gln Trp Thr Glu Ser Thr Arg Pro Lys Val Gln Gly
2240 2245 2250
Thr Trp Asn Leu His Glu Gln Ile Pro Val Ser Asp Phe Phe Ile
2255 2260 2265
Thr Leu Ser Ser Phe Ala Gly Val Phe Gly Ser Arg Gly Gln Ser
2270 2275 2280
Asn Tyr Ala Ala Ala Gly Ala Tyr Glu Asp Ala Met Ala His His
2285 2290 2295
Arg Glu Ser Leu Gly Gln Arg Ala Ile Thr Ile Asp Leu Gly Ile
2300 2305 2310
Met Arg Asp Val Gly Val Leu Ala Glu Asn Gly Ile Thr Asp Tyr
2315 2320 2325
Leu Arg Glu Trp Glu Glu Pro Phe Gly Ile Arg Glu Pro Glu Phe
2330 2335 2340
His Ala Leu Ile Lys Ser Ala Ile Met Ser Thr Thr Gln Pro Leu
2345 2350 2355
Thr Glu Arg Ser Val Val Gln Ile Pro Thr Gly Leu Ala Thr Ala
2360 2365 2370
Arg Ser Ala Gln Ala Ala Gly Ile Ser Thr Pro Phe Tyr Phe Asp
2375 2380 2385
Asp Ala Arg Phe Ser Ile Leu Ala Gln Thr Arg Ala Ser Ala Gly
2390 2395 2400
Ala Ser Ser Ala Ala Gly Ser Gly Asp Ala Asp Ala Gly Lys Val
2405 2410 2415
Ser Val Arg Thr Gln Leu Ser Gln Ala His Ser Val Ala Glu Ala
2420 2425 2430
Ala Ala Ala Val Gln Thr Val Leu Leu Glu Arg Val Ala Arg Thr
2435 2440 2445
Leu Gln Ser Ser Val Ala Glu Ile Asp Pro Ser Arg Pro Leu His
2450 2455 2460
Ser Tyr Gly Val Asp Ser Leu Val Ala Val Glu Thr Val Lys Trp
2465 2470 2475
Met Phe Lys Thr Leu Asp Ala Lys Met Thr Val Phe Asp Val Leu
2480 2485 2490
Ser Asn Val Ser Ile Thr Ala Leu Cys Glu Lys Ile Ala Ser Met
2495 2500 2505
Ser Thr Leu Val Lys Leu Asn
2510 2515
<210> 3
<211> 5148
<212> DNA
<213> Metarhizium anisopliae
<220>
<221> CDS
<222> (1)..(5148)
<400> 3
atg aaa ctg cgt gtc gca aac ttc ctc ctc ttt ggg gat cag acc gta 48
Met Lys Leu Arg Val Ala Asn Phe Leu Leu Phe Gly Asp Gln Thr Val
1 5 10 15
gag aag ctc cca gcc att cgg cac ctg gtg agc cat ggc gcg tcc tca 96
Glu Lys Leu Pro Ala Ile Arg His Leu Val Ser His Gly Ala Ser Ser
20 25 30
cct ctt gtc cag aga ttc ctg cgt caa gtg tgc gat gca gta cag ctc 144
Pro Leu Val Gln Arg Phe Leu Arg Gln Val Cys Asp Ala Val Gln Leu
35 40 45
cag gtc agc aag ctg cct ctg cac tcg gag caa cgc agc aac att ggg 192
Gln Val Ser Lys Leu Pro Leu His Ser Glu Gln Arg Ser Asn Ile Gly
50 55 60
aac ttc gac agt atc ctt cga cta gcc gag aac aat gcc cgg ctg gag 240
Asn Phe Asp Ser Ile Leu Arg Leu Ala Glu Asn Asn Ala Arg Leu Glu
65 70 75 80
gag ccc aac gag atc att gcc acc gtc ttg atg aat atc gca cgt cta 288
Glu Pro Asn Glu Ile Ile Ala Thr Val Leu Met Asn Ile Ala Arg Leu
85 90 95
gga gag ctc att cta tat gca gag caa gac cct acc gtt ctc gcc tcc 336
Gly Glu Leu Ile Leu Tyr Ala Glu Gln Asp Pro Thr Val Leu Ala Ser
100 105 110
aaa ggc aac cgc aac tgt att ctg gga ttc tgc acc ggc gag gtg gcc 384
Lys Gly Asn Arg Asn Cys Ile Leu Gly Phe Cys Thr Gly Glu Val Ala
115 120 125
gct gct gtg gcc gcc gtc gcg cag gac acc aac gaa ctc gtc gag ctg 432
Ala Ala Val Ala Ala Val Ala Gln Asp Thr Asn Glu Leu Val Glu Leu
130 135 140
gga gtc gag gtg aca cac atc atc ttt cgc atg gcc cgc gaa ctc aat 480
Gly Val Glu Val Thr His Ile Ile Phe Arg Met Ala Arg Glu Leu Asn
145 150 155 160
cgc cgg tct ctc atg gtt gac cgt acc aat ggc ccc tgg gcc cgg aca 528
Arg Arg Ser Leu Met Val Asp Arg Thr Asn Gly Pro Trp Ala Arg Thr
165 170 175
ata ctg ggc att tca gtc gat cgc gtc cgg gaa atc cta caa gac ttc 576
Ile Leu Gly Ile Ser Val Asp Arg Val Arg Glu Ile Leu Gln Asp Phe
180 185 190
cac gag aac cag tct att cct cgc gcg cga caa gtc tgc att ggc ttc 624
His Glu Asn Gln Ser Ile Pro Arg Ala Arg Gln Val Cys Ile Gly Phe
195 200 205
gtc tca gat ggc tgg tta aca ctc ttt ggc ccg ccc aca act ctg caa 672
Val Ser Asp Gly Trp Leu Thr Leu Phe Gly Pro Pro Thr Thr Leu Gln
210 215 220
cgg ctt tta gaa tgg tcg gca gag ctg gaa gac gct ccg caa atc gac 720
Arg Leu Leu Glu Trp Ser Ala Glu Leu Glu Asp Ala Pro Gln Ile Asp
225 230 235 240
acc gac gcc cgc gga ggc gtg cac atg gag acg ttg cca gaa gtt gac 768
Thr Asp Ala Arg Gly Gly Val His Met Glu Thr Leu Pro Glu Val Asp
245 250 255
ccg gat cgg att ctt ggc tca tcg cca tgg ctg gac cgg gcc ccc gtg 816
Pro Asp Arg Ile Leu Gly Ser Ser Pro Trp Leu Asp Arg Ala Pro Val
260 265 270
cac acg gcc acc ata atc tcg ccc tac acg tgc aaa ccg cgg cag cag 864
His Thr Ala Thr Ile Ile Ser Pro Tyr Thr Cys Lys Pro Arg Gln Gln
275 280 285
aag acg ttg cgg ggg ctt ctg gag gaa ata att gca gat gtc ggg cag 912
Lys Thr Leu Arg Gly Leu Leu Glu Glu Ile Ile Ala Asp Val Gly Gln
290 295 300
agg acg ttg aat ttg gcc acg tca atg aac gct gct gtt gag ctc gca 960
Arg Thr Leu Asn Leu Ala Thr Ser Met Asn Ala Ala Val Glu Leu Ala
305 310 315 320
cag gca gac aag ctc cgt ctt gtt atg ccc ggc tac act agt cac gac 1008
Gln Ala Asp Lys Leu Arg Leu Val Met Pro Gly Tyr Thr Ser His Asp
325 330 335
gtc tac ttt caa aga tta ctg caa aaa cgc ggc ata gag tat tcc gtc 1056
Val Tyr Phe Gln Arg Leu Leu Gln Lys Arg Gly Ile Glu Tyr Ser Val
340 345 350
atg tca cat ggg gac cat ttg tcg tca ggt ccc agc cga cag ggt tca 1104
Met Ser His Gly Asp His Leu Ser Ser Gly Pro Ser Arg Gln Gly Ser
355 360 365
gga ctt gtg gct gtc gtc ggc atg tct ggg agg ttc cca ggg agc ggc 1152
Gly Leu Val Ala Val Val Gly Met Ser Gly Arg Phe Pro Gly Ser Gly
370 375 380
gac atc aac gca ttt tgg gag ggt ctt tta gag ggc aaa aga tat atc 1200
Asp Ile Asn Ala Phe Trp Glu Gly Leu Leu Glu Gly Lys Arg Tyr Ile
385 390 395 400
caa gag att cca aat aca cga ttt gac ctg gag caa tgg tac gat gcc 1248
Gln Glu Ile Pro Asn Thr Arg Phe Asp Leu Glu Gln Trp Tyr Asp Ala
405 410 415
acg gga aaa caa aag aat tct acc atg gcg cgg aca gga gcc ttc ctc 1296
Thr Gly Lys Gln Lys Asn Ser Thr Met Ala Arg Thr Gly Ala Phe Leu
420 425 430
gac aag ccg ggc atg ttc gac aac cgc cta ttc gac atg tcg ccc agg 1344
Asp Lys Pro Gly Met Phe Asp Asn Arg Leu Phe Asp Met Ser Pro Arg
435 440 445
gag gcc atg cag aca gac gtc cag cac cgg ctg ctc atg aca acc agc 1392
Glu Ala Met Gln Thr Asp Val Gln His Arg Leu Leu Met Thr Thr Ser
450 455 460
tac gag gca ctg gag atg tcg ggc tac tat ccc gat ggc acg ctt tcg 1440
Tyr Glu Ala Leu Glu Met Ser Gly Tyr Tyr Pro Asp Gly Thr Leu Ser
465 470 475 480
aca aac aag gac cgc gtc gcc tcc ttc ttt ggc cag acg tct gat gat 1488
Thr Asn Lys Asp Arg Val Ala Ser Phe Phe Gly Gln Thr Ser Asp Asp
485 490 495
tgg cga gaa gtg gtg gtc cac caa ggg gta gac atc tac ttc gcc acg 1536
Trp Arg Glu Val Val Val His Gln Gly Val Asp Ile Tyr Phe Ala Thr
500 505 510
gga agc tgc cgc gct ttc gga cca ggc agg ctg cac cac cac ttc aaa 1584
Gly Ser Cys Arg Ala Phe Gly Pro Gly Arg Leu His His His Phe Lys
515 520 525
tgg gga ggt ccg tct tat agc gtc gac tcg gcc tgc tct tcc agc atc 1632
Trp Gly Gly Pro Ser Tyr Ser Val Asp Ser Ala Cys Ser Ser Ser Ile
530 535 540
gca gcc gtc ggt tta gcg tgc tcg gcg ctc ctc ggc cgc gaa tgc gac 1680
Ala Ala Val Gly Leu Ala Cys Ser Ala Leu Leu Gly Arg Glu Cys Asp
545 550 555 560
atg gct ctg gct ggt gga gga tcc ctc ctc ctc tcc cca tca ccc ttc 1728
Met Ala Leu Ala Gly Gly Gly Ser Leu Leu Leu Ser Pro Ser Pro Phe
565 570 575
tcg ggg tta agc cgt ggc ggt ttc ctg tcc gct cat gga ggg tgc cag 1776
Ser Gly Leu Ser Arg Gly Gly Phe Leu Ser Ala His Gly Gly Cys Gln
580 585 590
acg ttc cac gac aat gcc gac ggt tac gtc cgt gga gag gga gtt ggc 1824
Thr Phe His Asp Asn Ala Asp Gly Tyr Val Arg Gly Glu Gly Val Gly
595 600 605
gtg gtc gtt ctc aaa cgg ttg gag gac gcg ctg gac gac caa gac aac 1872
Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Asp Asp Gln Asp Asn
610 615 620
atc ctc ggc gtc gtc cgg gga tcc gga cgc aac tac agc agt gat gct 1920
Ile Leu Gly Val Val Arg Gly Ser Gly Arg Asn Tyr Ser Ser Asp Ala
625 630 635 640
tct tcc atg atg cat ccc tcg gca aat gct cag aaa aag ctg tac tgc 1968
Ser Ser Met Met His Pro Ser Ala Asn Ala Gln Lys Lys Leu Tyr Cys
645 650 655
gat gtg ctg gag caa agc ggt gta gac gcc aac agc atc tcg tac gtg 2016
Asp Val Leu Glu Gln Ser Gly Val Asp Ala Asn Ser Ile Ser Tyr Val
660 665 670
gag atg cat gga acc ggg aca cag gcg gga gac ttt atg gaa atg tcc 2064
Glu Met His Gly Thr Gly Thr Gln Ala Gly Asp Phe Met Glu Met Ser
675 680 685
tcg gtc ttg tca aca ttt gca gaa aag cga ggc tcg gat aat ccg ctc 2112
Ser Val Leu Ser Thr Phe Ala Glu Lys Arg Gly Ser Asp Asn Pro Leu
690 695 700
att gtt ggg gcc ctc aaa gca aat att ggc cac ggg gaa gct gcg gcc 2160
Ile Val Gly Ala Leu Lys Ala Asn Ile Gly His Gly Glu Ala Ala Ala
705 710 715 720
ggt gtt tgc gct ctt atc aaa acc ctc atg atg ctc cag tct cga cag 2208
Gly Val Cys Ala Leu Ile Lys Thr Leu Met Met Leu Gln Ser Arg Gln
725 730 735
att ccc ccc cag ccc gat ctt cct gga cct att aac cac cgc ttt cct 2256
Ile Pro Pro Gln Pro Asp Leu Pro Gly Pro Ile Asn His Arg Phe Pro
740 745 750
gat cta gca gcg cgt aat gta tac atc gcg gcc cgc aat atg aga ctg 2304
Asp Leu Ala Ala Arg Asn Val Tyr Ile Ala Ala Arg Asn Met Arg Leu
755 760 765
gag gcc agt cca gtg gct aag ggc acg cta cgc gtc ttt ctc aac agc 2352
Glu Ala Ser Pro Val Ala Lys Gly Thr Leu Arg Val Phe Leu Asn Ser
770 775 780
ttc gac gcc tcg gga gga aat tcg tgc ttg gtg ctt gaa gaa gct ccg 2400
Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Val Leu Glu Glu Ala Pro
785 790 795 800
cca cgg gcc gtc aag gat gca gac cct cga ggt cac cac gtc gtg acg 2448
Pro Arg Ala Val Lys Asp Ala Asp Pro Arg Gly His His Val Val Thr
805 810 815
ctt tca gcc cgt tcc cag aag tca ctt att ggc atc aaa gag agg tat 2496
Leu Ser Ala Arg Ser Gln Lys Ser Leu Ile Gly Ile Lys Glu Arg Tyr
820 825 830
ctc gct cat ctg cgc caa cat cct gac acc aaa ctg gcc gac ttg gcc 2544
Leu Ala His Leu Arg Gln His Pro Asp Thr Lys Leu Ala Asp Leu Ala
835 840 845
tat acc aca agc gct cga cgc att cac ggg tta ttg cgg tac gcc att 2592
Tyr Thr Thr Ser Ala Arg Arg Ile His Gly Leu Leu Arg Tyr Ala Ile
850 855 860
gcc gca tct tcc att gac gag gtc gtg caa tgc ctg gag acg gat ctc 2640
Ala Ala Ser Ser Ile Asp Glu Val Val Gln Cys Leu Glu Thr Asp Leu
865 870 875 880
gcc cag ggg aaa aca cca cgt cag cct ccg gca aca cca acg gta gtc 2688
Ala Gln Gly Lys Thr Pro Arg Gln Pro Pro Ala Thr Pro Thr Val Val
885 890 895
ttt aca ttt act ggc caa ggc gca cac tat atc ggc atg ggg gca aac 2736
Phe Thr Phe Thr Gly Gln Gly Ala His Tyr Ile Gly Met Gly Ala Asn
900 905 910
ttg tgg gag acg tct gcc aca ttc cgc aat acg ctt cac gac tac cag 2784
Leu Trp Glu Thr Ser Ala Thr Phe Arg Asn Thr Leu His Asp Tyr Gln
915 920 925
aca atg gcc agc gct caa ggc ctc ccc cat ttc ctg cat ctc atc acg 2832
Thr Met Ala Ser Ala Gln Gly Leu Pro His Phe Leu His Leu Ile Thr
930 935 940
gac agc agc aca ccc gcg cca cag tcg ggc ccg gat acc gtg cag gta 2880
Asp Ser Ser Thr Pro Ala Pro Gln Ser Gly Pro Asp Thr Val Gln Val
945 950 955 960
cag ctg gcc atg gta agc ttg gaa ctg gcc ctg gcc aag ctc tgg cgc 2928
Gln Leu Ala Met Val Ser Leu Glu Leu Ala Leu Ala Lys Leu Trp Arg
965 970 975
tcc tgg ggc atc cag cca gcc atg gtc ttg ggc cac agc ctg ggc gaa 2976
Ser Trp Gly Ile Gln Pro Ala Met Val Leu Gly His Ser Leu Gly Glu
980 985 990
tac gcg gcc ttg tgc gtg gcc gga gtc ttg tcc gtg agc gac act ctg 3024
Tyr Ala Ala Leu Cys Val Ala Gly Val Leu Ser Val Ser Asp Thr Leu
995 1000 1005
tac ctc gtc gcc aag cga gca caa atc atg gct gga gcc ctg acg 3069
Tyr Leu Val Ala Lys Arg Ala Gln Ile Met Ala Gly Ala Leu Thr
1010 1015 1020
ccg cac gaa tac gga atg ctg gct gtg aat cta agc gtt gct gac 3114
Pro His Glu Tyr Gly Met Leu Ala Val Asn Leu Ser Val Ala Asp
1025 1030 1035
acg cgg gaa gtg ctc tcg tct ggc cag cat act tcc tgc gcc gtg 3159
Thr Arg Glu Val Leu Ser Ser Gly Gln His Thr Ser Cys Ala Val
1040 1045 1050
gct tgc atc aac gcg ccc aag atg aca gtc gtg agc ggc ttg cgc 3204
Ala Cys Ile Asn Ala Pro Lys Met Thr Val Val Ser Gly Leu Arg
1055 1060 1065
tcg aag ctg gac gat ctc cag gac caa ctc aag tcg gac ggc acc 3249
Ser Lys Leu Asp Asp Leu Gln Asp Gln Leu Lys Ser Asp Gly Thr
1070 1075 1080
cgg tgc act ccc cta tct gtt ccc tat ggc ttc cac tcc agc cag 3294
Arg Cys Thr Pro Leu Ser Val Pro Tyr Gly Phe His Ser Ser Gln
1085 1090 1095
ctt gat ccc atc ttg ggc cag ttc gaa gag gcc tgc cag ggc gtg 3339
Leu Asp Pro Ile Leu Gly Gln Phe Glu Glu Ala Cys Gln Gly Val
1100 1105 1110
acc ttt tcc gcg ccg agt gtc ccg gtc gtt tcc acg ctc ttg gct 3384
Thr Phe Ser Ala Pro Ser Val Pro Val Val Ser Thr Leu Leu Ala
1115 1120 1125
acg aca gtc cgg gaa gaa gga aca ttc tct ccg gag tac ctg gca 3429
Thr Thr Val Arg Glu Glu Gly Thr Phe Ser Pro Glu Tyr Leu Ala
1130 1135 1140
cga cag gcg cgc gaa ccc gtc gac ttt gtc ggg gca ttg ggc gcg 3474
Arg Gln Ala Arg Glu Pro Val Asp Phe Val Gly Ala Leu Gly Ala
1145 1150 1155
gtg cag gag cac aag ttt ccc ggc ctg acc ttc ctc gag att ggg 3519
Val Gln Glu His Lys Phe Pro Gly Leu Thr Phe Leu Glu Ile Gly
1160 1165 1170
ccc gat ccc gtg tgc tcg ggt ctt gtg aat gct acg cta ggt gcc 3564
Pro Asp Pro Val Cys Ser Gly Leu Val Asn Ala Thr Leu Gly Ala
1175 1180 1185
gat gag gct gca ttg cgc tgc gtt gcc tcg atg cac cgc gga aag 3609
Asp Glu Ala Ala Leu Arg Cys Val Ala Ser Met His Arg Gly Lys
1190 1195 1200
gcc aac tgg gcg tcg ata tcg tgc agc ttg agg gat ctc tat acg 3654
Ala Asn Trp Ala Ser Ile Ser Cys Ser Leu Arg Asp Leu Tyr Thr
1205 1210 1215
gcg ggt gcc gcc att gac tgg cca gcc cat cac cgg gat ttc aaa 3699
Ala Gly Ala Ala Ile Asp Trp Pro Ala His His Arg Asp Phe Lys
1220 1225 1230
tca tcg gta tcc ctg ctg gac ctc cca aag tac tcg ttt gac gag 3744
Ser Ser Val Ser Leu Leu Asp Leu Pro Lys Tyr Ser Phe Asp Glu
1235 1240 1245
aag gaa ttc tgg gcg tcg ttc ccc gat cga gac ctt cag acc att 3789
Lys Glu Phe Trp Ala Ser Phe Pro Asp Arg Asp Leu Gln Thr Ile
1250 1255 1260
gga gac gtc gag acc aag cac agc caa ccg cct gcc att gtt cct 3834
Gly Asp Val Glu Thr Lys His Ser Gln Pro Pro Ala Ile Val Pro
1265 1270 1275
tcg gta caa ggg tat tgc aca acg act ctg cag cgg atc acg agg 3879
Ser Val Gln Gly Tyr Cys Thr Thr Thr Leu Gln Arg Ile Thr Arg
1280 1285 1290
gaa aca atc gag ccc gat ggg ttg tcg gtt aca ttc tca tca gac 3924
Glu Thr Ile Glu Pro Asp Gly Leu Ser Val Thr Phe Ser Ser Asp
1295 1300 1305
cta gcc gac cag cac cta cgg gca gcc gtg cga ggc cac gcc gtg 3969
Leu Ala Asp Gln His Leu Arg Ala Ala Val Arg Gly His Ala Val
1310 1315 1320
gcc gat gtg gaa att tgt tcc agc agt ctg ctc ttg gac atg gcg 4014
Ala Asp Val Glu Ile Cys Ser Ser Ser Leu Leu Leu Asp Met Ala
1325 1330 1335
ctc tcc gcg gcc caa tat gcc tac atg aag cat tct cct ggt cag 4059
Leu Ser Ala Ala Gln Tyr Ala Tyr Met Lys His Ser Pro Gly Gln
1340 1345 1350
aag atg cca gtg cca tta acc gtc cgc aac tgc tat ttc cac cgg 4104
Lys Met Pro Val Pro Leu Thr Val Arg Asn Cys Tyr Phe His Arg
1355 1360 1365
ggt gtt gtc ttg acg gac aag gcc cag acg gtg gaa gtc acc gtc 4149
Gly Val Val Leu Thr Asp Lys Ala Gln Thr Val Glu Val Thr Val
1370 1375 1380
act ctt aca tcc tcg gcc aag act gcg gat atc cgg tac cac tgc 4194
Thr Leu Thr Ser Ser Ala Lys Thr Ala Asp Ile Arg Tyr His Cys
1385 1390 1395
cgc act cct gac gag tat tac gag gtt ggc gcc tgc cag gtc gtc 4239
Arg Thr Pro Asp Glu Tyr Tyr Glu Val Gly Ala Cys Gln Val Val
1400 1405 1410
ttg aag cca gca agc aaa ccg gac caa gcc ggc ttc ctg gtt cgg 4284
Leu Lys Pro Ala Ser Lys Pro Asp Gln Ala Gly Phe Leu Val Arg
1415 1420 1425
tcc cgc atg gct gct ctc aag gcg tcc gca agt cac cgg cta ggc 4329
Ser Arg Met Ala Ala Leu Lys Ala Ser Ala Ser His Arg Leu Gly
1430 1435 1440
aga cgc gca gtc tat cga tta ttc gac aac gtt gtg cgt tat tcc 4374
Arg Arg Ala Val Tyr Arg Leu Phe Asp Asn Val Val Arg Tyr Ser
1445 1450 1455
gaa caa tac cag ggg cta gaa aat gtc cac ttg tca gag gac atg 4419
Glu Gln Tyr Gln Gly Leu Glu Asn Val His Leu Ser Glu Asp Met
1460 1465 1470
cag gat gcc gtg gcg gaa atc aac atg gcc cac gtc cca gcc gca 4464
Gln Asp Ala Val Ala Glu Ile Asn Met Ala His Val Pro Ala Ala
1475 1480 1485
ggc ggc cat tac ctc cac cac cca ttc ttg ctc gac tcg att gtt 4509
Gly Gly His Tyr Leu His His Pro Phe Leu Leu Asp Ser Ile Val
1490 1495 1500
cac ttg tcg ggg ttc ttg gtg aac aat ggg ctt cgc tat tcc agc 4554
His Leu Ser Gly Phe Leu Val Asn Asn Gly Leu Arg Tyr Ser Ser
1505 1510 1515
gag tgg gct tgc ctt tcc acc ggc ttt gac gag tgg cac ctg ctc 4599
Glu Trp Ala Cys Leu Ser Thr Gly Phe Asp Glu Trp His Leu Leu
1520 1525 1530
aag ccg ctt gat ccc acc act gtg tac acc agc tac acc ttc atg 4644
Lys Pro Leu Asp Pro Thr Thr Val Tyr Thr Ser Tyr Thr Phe Met
1535 1540 1545
gag gac tct cgg tcg acg agc aat ctg gta acg ggc gat gta tac 4689
Glu Asp Ser Arg Ser Thr Ser Asn Leu Val Thr Gly Asp Val Tyr
1550 1555 1560
gtc tat gac gga gag gag ctg gtc tcg gtg ctg acg ggg ctg cag 4734
Val Tyr Asp Gly Glu Glu Leu Val Ser Val Leu Thr Gly Leu Gln
1565 1570 1575
ttc caa aag atg aag agg acg gca ctc act cat cta ctg agc ccc 4779
Phe Gln Lys Met Lys Arg Thr Ala Leu Thr His Leu Leu Ser Pro
1580 1585 1590
ccg aca gtc ggt acc atg gcc gcc aag ccg agt aca tgt atg cca 4824
Pro Thr Val Gly Thr Met Ala Ala Lys Pro Ser Thr Cys Met Pro
1595 1600 1605
act atg gga caa acg gag ccg ttg ccg gct caa gcc aga gtg gcc 4869
Thr Met Gly Gln Thr Glu Pro Leu Pro Ala Gln Ala Arg Val Ala
1610 1615 1620
ggc ttg ccg gtt ccc aca cca ccg gct aca gca agt gtt gat gat 4914
Gly Leu Pro Val Pro Thr Pro Pro Ala Thr Ala Ser Val Asp Asp
1625 1630 1635
ggc gag ggg gag aag ttc gac ttg gtc aat aca ctc ttt tcc att 4959
Gly Glu Gly Glu Lys Phe Asp Leu Val Asn Thr Leu Phe Ser Ile
1640 1645 1650
atc gca cgc gag gtg ggc gtg gag cca agc gat ttg gag ggc gac 5004
Ile Ala Arg Glu Val Gly Val Glu Pro Ser Asp Leu Glu Gly Asp
1655 1660 1665
gtc aac ctg gcg aat ttg ggc ata gac tcc ctg atg gcc att acc 5049
Val Asn Leu Ala Asn Leu Gly Ile Asp Ser Leu Met Ala Ile Thr
1670 1675 1680
ata att tca gtc atg cag cag gaa aca ggt gtc gag ttg ccg ggg 5094
Ile Ile Ser Val Met Gln Gln Glu Thr Gly Val Glu Leu Pro Gly
1685 1690 1695
acc ttt ttc ctc gac aat gcc act aca acg gca gtg att gcg gcg 5139
Thr Phe Phe Leu Asp Asn Ala Thr Thr Thr Ala Val Ile Ala Ala
1700 1705 1710
gta ggg tag 5148
Val Gly
1715
<210> 4
<211> 1715
<212> PRT
<213> Metarhizium anisopliae
<400> 4
Met Lys Leu Arg Val Ala Asn Phe Leu Leu Phe Gly Asp Gln Thr Val
1 5 10 15
Glu Lys Leu Pro Ala Ile Arg His Leu Val Ser His Gly Ala Ser Ser
20 25 30
Pro Leu Val Gln Arg Phe Leu Arg Gln Val Cys Asp Ala Val Gln Leu
35 40 45
Gln Val Ser Lys Leu Pro Leu His Ser Glu Gln Arg Ser Asn Ile Gly
50 55 60
Asn Phe Asp Ser Ile Leu Arg Leu Ala Glu Asn Asn Ala Arg Leu Glu
65 70 75 80
Glu Pro Asn Glu Ile Ile Ala Thr Val Leu Met Asn Ile Ala Arg Leu
85 90 95
Gly Glu Leu Ile Leu Tyr Ala Glu Gln Asp Pro Thr Val Leu Ala Ser
100 105 110
Lys Gly Asn Arg Asn Cys Ile Leu Gly Phe Cys Thr Gly Glu Val Ala
115 120 125
Ala Ala Val Ala Ala Val Ala Gln Asp Thr Asn Glu Leu Val Glu Leu
130 135 140
Gly Val Glu Val Thr His Ile Ile Phe Arg Met Ala Arg Glu Leu Asn
145 150 155 160
Arg Arg Ser Leu Met Val Asp Arg Thr Asn Gly Pro Trp Ala Arg Thr
165 170 175
Ile Leu Gly Ile Ser Val Asp Arg Val Arg Glu Ile Leu Gln Asp Phe
180 185 190
His Glu Asn Gln Ser Ile Pro Arg Ala Arg Gln Val Cys Ile Gly Phe
195 200 205
Val Ser Asp Gly Trp Leu Thr Leu Phe Gly Pro Pro Thr Thr Leu Gln
210 215 220
Arg Leu Leu Glu Trp Ser Ala Glu Leu Glu Asp Ala Pro Gln Ile Asp
225 230 235 240
Thr Asp Ala Arg Gly Gly Val His Met Glu Thr Leu Pro Glu Val Asp
245 250 255
Pro Asp Arg Ile Leu Gly Ser Ser Pro Trp Leu Asp Arg Ala Pro Val
260 265 270
His Thr Ala Thr Ile Ile Ser Pro Tyr Thr Cys Lys Pro Arg Gln Gln
275 280 285
Lys Thr Leu Arg Gly Leu Leu Glu Glu Ile Ile Ala Asp Val Gly Gln
290 295 300
Arg Thr Leu Asn Leu Ala Thr Ser Met Asn Ala Ala Val Glu Leu Ala
305 310 315 320
Gln Ala Asp Lys Leu Arg Leu Val Met Pro Gly Tyr Thr Ser His Asp
325 330 335
Val Tyr Phe Gln Arg Leu Leu Gln Lys Arg Gly Ile Glu Tyr Ser Val
340 345 350
Met Ser His Gly Asp His Leu Ser Ser Gly Pro Ser Arg Gln Gly Ser
355 360 365
Gly Leu Val Ala Val Val Gly Met Ser Gly Arg Phe Pro Gly Ser Gly
370 375 380
Asp Ile Asn Ala Phe Trp Glu Gly Leu Leu Glu Gly Lys Arg Tyr Ile
385 390 395 400
Gln Glu Ile Pro Asn Thr Arg Phe Asp Leu Glu Gln Trp Tyr Asp Ala
405 410 415
Thr Gly Lys Gln Lys Asn Ser Thr Met Ala Arg Thr Gly Ala Phe Leu
420 425 430
Asp Lys Pro Gly Met Phe Asp Asn Arg Leu Phe Asp Met Ser Pro Arg
435 440 445
Glu Ala Met Gln Thr Asp Val Gln His Arg Leu Leu Met Thr Thr Ser
450 455 460
Tyr Glu Ala Leu Glu Met Ser Gly Tyr Tyr Pro Asp Gly Thr Leu Ser
465 470 475 480
Thr Asn Lys Asp Arg Val Ala Ser Phe Phe Gly Gln Thr Ser Asp Asp
485 490 495
Trp Arg Glu Val Val Val His Gln Gly Val Asp Ile Tyr Phe Ala Thr
500 505 510
Gly Ser Cys Arg Ala Phe Gly Pro Gly Arg Leu His His His Phe Lys
515 520 525
Trp Gly Gly Pro Ser Tyr Ser Val Asp Ser Ala Cys Ser Ser Ser Ile
530 535 540
Ala Ala Val Gly Leu Ala Cys Ser Ala Leu Leu Gly Arg Glu Cys Asp
545 550 555 560
Met Ala Leu Ala Gly Gly Gly Ser Leu Leu Leu Ser Pro Ser Pro Phe
565 570 575
Ser Gly Leu Ser Arg Gly Gly Phe Leu Ser Ala His Gly Gly Cys Gln
580 585 590
Thr Phe His Asp Asn Ala Asp Gly Tyr Val Arg Gly Glu Gly Val Gly
595 600 605
Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Asp Asp Gln Asp Asn
610 615 620
Ile Leu Gly Val Val Arg Gly Ser Gly Arg Asn Tyr Ser Ser Asp Ala
625 630 635 640
Ser Ser Met Met His Pro Ser Ala Asn Ala Gln Lys Lys Leu Tyr Cys
645 650 655
Asp Val Leu Glu Gln Ser Gly Val Asp Ala Asn Ser Ile Ser Tyr Val
660 665 670
Glu Met His Gly Thr Gly Thr Gln Ala Gly Asp Phe Met Glu Met Ser
675 680 685
Ser Val Leu Ser Thr Phe Ala Glu Lys Arg Gly Ser Asp Asn Pro Leu
690 695 700
Ile Val Gly Ala Leu Lys Ala Asn Ile Gly His Gly Glu Ala Ala Ala
705 710 715 720
Gly Val Cys Ala Leu Ile Lys Thr Leu Met Met Leu Gln Ser Arg Gln
725 730 735
Ile Pro Pro Gln Pro Asp Leu Pro Gly Pro Ile Asn His Arg Phe Pro
740 745 750
Asp Leu Ala Ala Arg Asn Val Tyr Ile Ala Ala Arg Asn Met Arg Leu
755 760 765
Glu Ala Ser Pro Val Ala Lys Gly Thr Leu Arg Val Phe Leu Asn Ser
770 775 780
Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Val Leu Glu Glu Ala Pro
785 790 795 800
Pro Arg Ala Val Lys Asp Ala Asp Pro Arg Gly His His Val Val Thr
805 810 815
Leu Ser Ala Arg Ser Gln Lys Ser Leu Ile Gly Ile Lys Glu Arg Tyr
820 825 830
Leu Ala His Leu Arg Gln His Pro Asp Thr Lys Leu Ala Asp Leu Ala
835 840 845
Tyr Thr Thr Ser Ala Arg Arg Ile His Gly Leu Leu Arg Tyr Ala Ile
850 855 860
Ala Ala Ser Ser Ile Asp Glu Val Val Gln Cys Leu Glu Thr Asp Leu
865 870 875 880
Ala Gln Gly Lys Thr Pro Arg Gln Pro Pro Ala Thr Pro Thr Val Val
885 890 895
Phe Thr Phe Thr Gly Gln Gly Ala His Tyr Ile Gly Met Gly Ala Asn
900 905 910
Leu Trp Glu Thr Ser Ala Thr Phe Arg Asn Thr Leu His Asp Tyr Gln
915 920 925
Thr Met Ala Ser Ala Gln Gly Leu Pro His Phe Leu His Leu Ile Thr
930 935 940
Asp Ser Ser Thr Pro Ala Pro Gln Ser Gly Pro Asp Thr Val Gln Val
945 950 955 960
Gln Leu Ala Met Val Ser Leu Glu Leu Ala Leu Ala Lys Leu Trp Arg
965 970 975
Ser Trp Gly Ile Gln Pro Ala Met Val Leu Gly His Ser Leu Gly Glu
980 985 990
Tyr Ala Ala Leu Cys Val Ala Gly Val Leu Ser Val Ser Asp Thr Leu
995 1000 1005
Tyr Leu Val Ala Lys Arg Ala Gln Ile Met Ala Gly Ala Leu Thr
1010 1015 1020
Pro His Glu Tyr Gly Met Leu Ala Val Asn Leu Ser Val Ala Asp
1025 1030 1035
Thr Arg Glu Val Leu Ser Ser Gly Gln His Thr Ser Cys Ala Val
1040 1045 1050
Ala Cys Ile Asn Ala Pro Lys Met Thr Val Val Ser Gly Leu Arg
1055 1060 1065
Ser Lys Leu Asp Asp Leu Gln Asp Gln Leu Lys Ser Asp Gly Thr
1070 1075 1080
Arg Cys Thr Pro Leu Ser Val Pro Tyr Gly Phe His Ser Ser Gln
1085 1090 1095
Leu Asp Pro Ile Leu Gly Gln Phe Glu Glu Ala Cys Gln Gly Val
1100 1105 1110
Thr Phe Ser Ala Pro Ser Val Pro Val Val Ser Thr Leu Leu Ala
1115 1120 1125
Thr Thr Val Arg Glu Glu Gly Thr Phe Ser Pro Glu Tyr Leu Ala
1130 1135 1140
Arg Gln Ala Arg Glu Pro Val Asp Phe Val Gly Ala Leu Gly Ala
1145 1150 1155
Val Gln Glu His Lys Phe Pro Gly Leu Thr Phe Leu Glu Ile Gly
1160 1165 1170
Pro Asp Pro Val Cys Ser Gly Leu Val Asn Ala Thr Leu Gly Ala
1175 1180 1185
Asp Glu Ala Ala Leu Arg Cys Val Ala Ser Met His Arg Gly Lys
1190 1195 1200
Ala Asn Trp Ala Ser Ile Ser Cys Ser Leu Arg Asp Leu Tyr Thr
1205 1210 1215
Ala Gly Ala Ala Ile Asp Trp Pro Ala His His Arg Asp Phe Lys
1220 1225 1230
Ser Ser Val Ser Leu Leu Asp Leu Pro Lys Tyr Ser Phe Asp Glu
1235 1240 1245
Lys Glu Phe Trp Ala Ser Phe Pro Asp Arg Asp Leu Gln Thr Ile
1250 1255 1260
Gly Asp Val Glu Thr Lys His Ser Gln Pro Pro Ala Ile Val Pro
1265 1270 1275
Ser Val Gln Gly Tyr Cys Thr Thr Thr Leu Gln Arg Ile Thr Arg
1280 1285 1290
Glu Thr Ile Glu Pro Asp Gly Leu Ser Val Thr Phe Ser Ser Asp
1295 1300 1305
Leu Ala Asp Gln His Leu Arg Ala Ala Val Arg Gly His Ala Val
1310 1315 1320
Ala Asp Val Glu Ile Cys Ser Ser Ser Leu Leu Leu Asp Met Ala
1325 1330 1335
Leu Ser Ala Ala Gln Tyr Ala Tyr Met Lys His Ser Pro Gly Gln
1340 1345 1350
Lys Met Pro Val Pro Leu Thr Val Arg Asn Cys Tyr Phe His Arg
1355 1360 1365
Gly Val Val Leu Thr Asp Lys Ala Gln Thr Val Glu Val Thr Val
1370 1375 1380
Thr Leu Thr Ser Ser Ala Lys Thr Ala Asp Ile Arg Tyr His Cys
1385 1390 1395
Arg Thr Pro Asp Glu Tyr Tyr Glu Val Gly Ala Cys Gln Val Val
1400 1405 1410
Leu Lys Pro Ala Ser Lys Pro Asp Gln Ala Gly Phe Leu Val Arg
1415 1420 1425
Ser Arg Met Ala Ala Leu Lys Ala Ser Ala Ser His Arg Leu Gly
1430 1435 1440
Arg Arg Ala Val Tyr Arg Leu Phe Asp Asn Val Val Arg Tyr Ser
1445 1450 1455
Glu Gln Tyr Gln Gly Leu Glu Asn Val His Leu Ser Glu Asp Met
1460 1465 1470
Gln Asp Ala Val Ala Glu Ile Asn Met Ala His Val Pro Ala Ala
1475 1480 1485
Gly Gly His Tyr Leu His His Pro Phe Leu Leu Asp Ser Ile Val
1490 1495 1500
His Leu Ser Gly Phe Leu Val Asn Asn Gly Leu Arg Tyr Ser Ser
1505 1510 1515
Glu Trp Ala Cys Leu Ser Thr Gly Phe Asp Glu Trp His Leu Leu
1520 1525 1530
Lys Pro Leu Asp Pro Thr Thr Val Tyr Thr Ser Tyr Thr Phe Met
1535 1540 1545
Glu Asp Ser Arg Ser Thr Ser Asn Leu Val Thr Gly Asp Val Tyr
1550 1555 1560
Val Tyr Asp Gly Glu Glu Leu Val Ser Val Leu Thr Gly Leu Gln
1565 1570 1575
Phe Gln Lys Met Lys Arg Thr Ala Leu Thr His Leu Leu Ser Pro
1580 1585 1590
Pro Thr Val Gly Thr Met Ala Ala Lys Pro Ser Thr Cys Met Pro
1595 1600 1605
Thr Met Gly Gln Thr Glu Pro Leu Pro Ala Gln Ala Arg Val Ala
1610 1615 1620
Gly Leu Pro Val Pro Thr Pro Pro Ala Thr Ala Ser Val Asp Asp
1625 1630 1635
Gly Glu Gly Glu Lys Phe Asp Leu Val Asn Thr Leu Phe Ser Ile
1640 1645 1650
Ile Ala Arg Glu Val Gly Val Glu Pro Ser Asp Leu Glu Gly Asp
1655 1660 1665
Val Asn Leu Ala Asn Leu Gly Ile Asp Ser Leu Met Ala Ile Thr
1670 1675 1680
Ile Ile Ser Val Met Gln Gln Glu Thr Gly Val Glu Leu Pro Gly
1685 1690 1695
Thr Phe Phe Leu Asp Asn Ala Thr Thr Thr Ala Val Ile Ala Ala
1700 1705 1710
Val Gly
1715
<210> 5
<211> 1128
<212> DNA
<213> Metarhizium anisopliae
<220>
<221> CDS
<222> (1)..(1128)
<400> 5
atg gcc gtc acc gtg tgg caa gat gcg ctc aac atc att gcg cag gag 48
Met Ala Val Thr Val Trp Gln Asp Ala Leu Asn Ile Ile Ala Gln Glu
1 5 10 15
agc ggg ctg gag ccc gca gaa atc atc gag acg gac gac acg gcg ttt 96
Ser Gly Leu Glu Pro Ala Glu Ile Ile Glu Thr Asp Asp Thr Ala Phe
20 25 30
ctc acg ctc ggc atc aat cag atc ctc gcc aca gcc atc ttg gcg cac 144
Leu Thr Leu Gly Ile Asn Gln Ile Leu Ala Thr Ala Ile Leu Ala His
35 40 45
ctc aga ggg cct cgt gga gag cct ctc cca cga gac atc ttt gac cag 192
Leu Arg Gly Pro Arg Gly Glu Pro Leu Pro Arg Asp Ile Phe Asp Gln
50 55 60
aag ccc acg gtt ggt gcg ttc cgc cgc ttc tat gag acc cct att cac 240
Lys Pro Thr Val Gly Ala Phe Arg Arg Phe Tyr Glu Thr Pro Ile His
65 70 75 80
ctg gac att gct ccc gtc gcg gca ccg gcg ccg ccc aag ctg aag cgc 288
Leu Asp Ile Ala Pro Val Ala Ala Pro Ala Pro Pro Lys Leu Lys Arg
85 90 95
gtg ccg tcg tct tct gtc ccg ctg tcc atc gtc ttg caa aac aac ccg 336
Val Pro Ser Ser Ser Val Pro Leu Ser Ile Val Leu Gln Asn Asn Pro
100 105 110
gcg tcg agc cgg cac acg gtg ttc ctc ctc ccg gac ggc agc ggc tcg 384
Ala Ser Ser Arg His Thr Val Phe Leu Leu Pro Asp Gly Ser Gly Ser
115 120 125
gcc atg gcc tac gcc aac ctc ccg ccc gtc cac ccg gcc gtc tgc atc 432
Ala Met Ala Tyr Ala Asn Leu Pro Pro Val His Pro Ala Val Cys Ile
130 135 140
gtc ggc atg aac agc ccg tac ctg cgc gac gcc ggc tcg tac cgc tgc 480
Val Gly Met Asn Ser Pro Tyr Leu Arg Asp Ala Gly Ser Tyr Arg Cys
145 150 155 160
tcc gtg gaa gac ctg gca tcg caa tgg gtc cgt gaa gtc tac cgc cgc 528
Ser Val Glu Asp Leu Ala Ser Gln Trp Val Arg Glu Val Tyr Arg Arg
165 170 175
caa cca cgg ggg ccg tac att gtc ggc ggg tgg tca gcg gga ggc tac 576
Gln Pro Arg Gly Pro Tyr Ile Val Gly Gly Trp Ser Ala Gly Gly Tyr
180 185 190
tac tcg tac gaa gtg gcc aag cgc ctc ctg cag gac gga cac gcc gtc 624
Tyr Ser Tyr Glu Val Ala Lys Arg Leu Leu Gln Asp Gly His Ala Val
195 200 205
gcc aag ctg atc ctg atc gac tcg ccg tgc cgc acc gtc ttt gag tcc 672
Ala Lys Leu Ile Leu Ile Asp Ser Pro Cys Arg Thr Val Phe Glu Ser
210 215 220
ctg tcc atg gac gtc gtc aac tac ctc tcc tct cga aac ctc atg ggc 720
Leu Ser Met Asp Val Val Asn Tyr Leu Ser Ser Arg Asn Leu Met Gly
225 230 235 240
aac tgg ggc tct ccg gaa atg ccc gag tgg ctg gtg cag cat ttc cgc 768
Asn Trp Gly Ser Pro Glu Met Pro Glu Trp Leu Val Gln His Phe Arg
245 250 255
tcg acg ctc gcc gcc gtg ggc aag tac cgc ccg cgg ccc atc gac tcg 816
Ser Thr Leu Ala Ala Val Gly Lys Tyr Arg Pro Arg Pro Ile Asp Ser
260 265 270
gct ggc aag atg cag acg tac atc atc tgg agc cga gac ggc gtg ctg 864
Ala Gly Lys Met Gln Thr Tyr Ile Ile Trp Ser Arg Asp Gly Val Leu
275 280 285
gac caa gac gcg ctg gcc agg tct gga ctc gac acg agc gtc aag gtg 912
Asp Gln Asp Ala Leu Ala Arg Ser Gly Leu Asp Thr Ser Val Lys Val
290 295 300
tcg cga ttt ctg ctg cag ggc aag gat gac ctg ggg ccg aat gga tgg 960
Ser Arg Phe Leu Leu Gln Gly Lys Asp Asp Leu Gly Pro Asn Gly Trp
305 310 315 320
gac gac ctg ctg ccc agc aag gac atg gct att gcg acg caa tcg ggg 1008
Asp Asp Leu Leu Pro Ser Lys Asp Met Ala Ile Ala Thr Gln Ser Gly
325 330 335
acg cac ttc acc atg att aac aag cct cat gtg gcc cag atg agc gat 1056
Thr His Phe Thr Met Ile Asn Lys Pro His Val Ala Gln Met Ser Asp
340 345 350
ctc ttg cgt gat gcc gtg att ggc atc ggc tct gac cga cag gcg cac 1104
Leu Leu Arg Asp Ala Val Ile Gly Ile Gly Ser Asp Arg Gln Ala His
355 360 365
tgg cag cga gtg agc cag tca tga 1128
Trp Gln Arg Val Ser Gln Ser
370 375
<210> 6
<211> 375
<212> PRT
<213> Metarhizium anisopliae
<400> 6
Met Ala Val Thr Val Trp Gln Asp Ala Leu Asn Ile Ile Ala Gln Glu
1 5 10 15
Ser Gly Leu Glu Pro Ala Glu Ile Ile Glu Thr Asp Asp Thr Ala Phe
20 25 30
Leu Thr Leu Gly Ile Asn Gln Ile Leu Ala Thr Ala Ile Leu Ala His
35 40 45
Leu Arg Gly Pro Arg Gly Glu Pro Leu Pro Arg Asp Ile Phe Asp Gln
50 55 60
Lys Pro Thr Val Gly Ala Phe Arg Arg Phe Tyr Glu Thr Pro Ile His
65 70 75 80
Leu Asp Ile Ala Pro Val Ala Ala Pro Ala Pro Pro Lys Leu Lys Arg
85 90 95
Val Pro Ser Ser Ser Val Pro Leu Ser Ile Val Leu Gln Asn Asn Pro
100 105 110
Ala Ser Ser Arg His Thr Val Phe Leu Leu Pro Asp Gly Ser Gly Ser
115 120 125
Ala Met Ala Tyr Ala Asn Leu Pro Pro Val His Pro Ala Val Cys Ile
130 135 140
Val Gly Met Asn Ser Pro Tyr Leu Arg Asp Ala Gly Ser Tyr Arg Cys
145 150 155 160
Ser Val Glu Asp Leu Ala Ser Gln Trp Val Arg Glu Val Tyr Arg Arg
165 170 175
Gln Pro Arg Gly Pro Tyr Ile Val Gly Gly Trp Ser Ala Gly Gly Tyr
180 185 190
Tyr Ser Tyr Glu Val Ala Lys Arg Leu Leu Gln Asp Gly His Ala Val
195 200 205
Ala Lys Leu Ile Leu Ile Asp Ser Pro Cys Arg Thr Val Phe Glu Ser
210 215 220
Leu Ser Met Asp Val Val Asn Tyr Leu Ser Ser Arg Asn Leu Met Gly
225 230 235 240
Asn Trp Gly Ser Pro Glu Met Pro Glu Trp Leu Val Gln His Phe Arg
245 250 255
Ser Thr Leu Ala Ala Val Gly Lys Tyr Arg Pro Arg Pro Ile Asp Ser
260 265 270
Ala Gly Lys Met Gln Thr Tyr Ile Ile Trp Ser Arg Asp Gly Val Leu
275 280 285
Asp Gln Asp Ala Leu Ala Arg Ser Gly Leu Asp Thr Ser Val Lys Val
290 295 300
Ser Arg Phe Leu Leu Gln Gly Lys Asp Asp Leu Gly Pro Asn Gly Trp
305 310 315 320
Asp Asp Leu Leu Pro Ser Lys Asp Met Ala Ile Ala Thr Gln Ser Gly
325 330 335
Thr His Phe Thr Met Ile Asn Lys Pro His Val Ala Gln Met Ser Asp
340 345 350
Leu Leu Arg Asp Ala Val Ile Gly Ile Gly Ser Asp Arg Gln Ala His
355 360 365
Trp Gln Arg Val Ser Gln Ser
370 375
<210> 7
<211> 7533
<212> DNA
<213> Metarhizium rileyi
<220>
<221> CDS
<222> (1)..(7533)
<400> 7
atg gag gct tcg tca caa tca aga gac gac atc gcc gtc att ggg tta 48
Met Glu Ala Ser Ser Gln Ser Arg Asp Asp Ile Ala Val Ile Gly Leu
1 5 10 15
tcg tgc cgc ttc ccg ggt gaa gca gac aca gcc gag cac ttt tgg gac 96
Ser Cys Arg Phe Pro Gly Glu Ala Asp Thr Ala Glu His Phe Trp Asp
20 25 30
ttc att tgc aac gga cgc aat gca tac tct gaa aac ccg gat cgg tgg 144
Phe Ile Cys Asn Gly Arg Asn Ala Tyr Ser Glu Asn Pro Asp Arg Trp
35 40 45
aat ccg gat gct ttc cac tac ggc gag aag aag ctc aac acc agc ttg 192
Asn Pro Asp Ala Phe His Tyr Gly Glu Lys Lys Leu Asn Thr Ser Leu
50 55 60
ccc cgg gga gga cat ttc atg aag caa gat gtg gcc gcc ttt gat gcc 240
Pro Arg Gly Gly His Phe Met Lys Gln Asp Val Ala Ala Phe Asp Ala
65 70 75 80
aac ttc ttc aac ctc tcc aag gtc gag gcg gag tcc atg gac ccc cag 288
Asn Phe Phe Asn Leu Ser Lys Val Glu Ala Glu Ser Met Asp Pro Gln
85 90 95
cag cgc atc gtc atg gag gtg acg tac gag tcc atg gag agc gca ggg 336
Gln Arg Ile Val Met Glu Val Thr Tyr Glu Ser Met Glu Ser Ala Gly
100 105 110
ctc cgc gtc gac cgg ctc gct ggc tct cgc acc ggc gtc ttc atg gcc 384
Leu Arg Val Asp Arg Leu Ala Gly Ser Arg Thr Gly Val Phe Met Ala
115 120 125
agt ttc acc agc gac tac cga gaa atg ctc tat cgt gat gct gag acg 432
Ser Phe Thr Ser Asp Tyr Arg Glu Met Leu Tyr Arg Asp Ala Glu Thr
130 135 140
gcg cct ctc tac acc gcg acg ggc act agc aac aca tca acc tcg aac 480
Ala Pro Leu Tyr Thr Ala Thr Gly Thr Ser Asn Thr Ser Thr Ser Asn
145 150 155 160
cgt gtc tcg tgg ttt ttc gac ttg cgc ggg cct agc ttt acc gtg aac 528
Arg Val Ser Trp Phe Phe Asp Leu Arg Gly Pro Ser Phe Thr Val Asn
165 170 175
aca gcc tgc tcc tcc agt ctg gta gca tgc cat ctc gcc tgc cag agt 576
Thr Ala Cys Ser Ser Ser Leu Val Ala Cys His Leu Ala Cys Gln Ser
180 185 190
ctg tgg aat ggc gag acg gag agc gcc atc gtc ggc ggc acc agc ctg 624
Leu Trp Asn Gly Glu Thr Glu Ser Ala Ile Val Gly Gly Thr Ser Leu
195 200 205
ctg ctc aac ccc gac atg ttt ctg tac ctc tcc aac cag cgg ttc ctg 672
Leu Leu Asn Pro Asp Met Phe Leu Tyr Leu Ser Asn Gln Arg Phe Leu
210 215 220
gcc ccc gac ggc cag tgc aaa agc ttc gac gag tcc ggc gac ggc tac 720
Ala Pro Asp Gly Gln Cys Lys Ser Phe Asp Glu Ser Gly Asp Gly Tyr
225 230 235 240
gcc aga ggt gat ggc atc ggc gtt gtc att ctg aag cgc gtt gct gac 768
Ala Arg Gly Asp Gly Ile Gly Val Val Ile Leu Lys Arg Val Ala Asp
245 250 255
gcc gtt cgc gat ggc gat ccg atc cga gcc gtg atc cgt ggc agc gga 816
Ala Val Arg Asp Gly Asp Pro Ile Arg Ala Val Ile Arg Gly Ser Gly
260 265 270
tgc aac caa gac ggc cac aca aag ggc ttc acc atc ccc agt gtt gag 864
Cys Asn Gln Asp Gly His Thr Lys Gly Phe Thr Ile Pro Ser Val Glu
275 280 285
gcg caa gcc tct ctt atc gag gag acg tac cgc aaa gca ggt ctt tca 912
Ala Gln Ala Ser Leu Ile Glu Glu Thr Tyr Arg Lys Ala Gly Leu Ser
290 295 300
ctt gca gag acg cgt tac gta gag gcc cac ggg acc ggc acc cag gcg 960
Leu Ala Glu Thr Arg Tyr Val Glu Ala His Gly Thr Gly Thr Gln Ala
305 310 315 320
ggc gac acg tgt gag atg gag ggt atc gca cga aca ttc ggc cag cac 1008
Gly Asp Thr Cys Glu Met Glu Gly Ile Ala Arg Thr Phe Gly Gln His
325 330 335
cgg ggc gac tca gat gat ctg cta gtc gga tct gtc aag tca aat att 1056
Arg Gly Asp Ser Asp Asp Leu Leu Val Gly Ser Val Lys Ser Asn Ile
340 345 350
gga cat ctc gaa gct tgc gct gga ctg gcc tcg ctc ata aag tgc atc 1104
Gly His Leu Glu Ala Cys Ala Gly Leu Ala Ser Leu Ile Lys Cys Ile
355 360 365
ttc att ctg gaa aca ggc gtg ata cca ccg acg ccc agt gtc cgc gtt 1152
Phe Ile Leu Glu Thr Gly Val Ile Pro Pro Thr Pro Ser Val Arg Val
370 375 380
ctc aac ccc aag atc cgc tgg gag gaa tgg cat ctc aag gtt ccc tcg 1200
Leu Asn Pro Lys Ile Arg Trp Glu Glu Trp His Leu Lys Val Pro Ser
385 390 395 400
aaa caa act cct tgg cca acc gac ggc cta cgg cga gtg agc aca cag 1248
Lys Gln Thr Pro Trp Pro Thr Asp Gly Leu Arg Arg Val Ser Thr Gln
405 410 415
ggt ttc gga tac ggt ggt aca aac gcc cat ctg att ctc gac gat gca 1296
Gly Phe Gly Tyr Gly Gly Thr Asn Ala His Leu Ile Leu Asp Asp Ala
420 425 430
gcc cac tat ctc gag ggg cga agt ctc agg ggt cat cat tac act cgc 1344
Ala His Tyr Leu Glu Gly Arg Ser Leu Arg Gly His His Tyr Thr Arg
435 440 445
aca cat cct cag gcg cag agg ctt ttg acc tct gca atc cac ggg gct 1392
Thr His Pro Gln Ala Gln Arg Leu Leu Thr Ser Ala Ile His Gly Ala
450 455 460
tcg cca aag gaa cag ctg ccg cgt ttg ttt ctg ttc cgc gcg aat gat 1440
Ser Pro Lys Glu Gln Leu Pro Arg Leu Phe Leu Phe Arg Ala Asn Asp
465 470 475 480
cgt gag ggc ctt ggg cgt gtc cgg gcg tct ttg gca caa cat ctc gac 1488
Arg Glu Gly Leu Gly Arg Val Arg Ala Ser Leu Ala Gln His Leu Asp
485 490 495
caa ctc ctg ccc tcg tgg tcc cag gac tcg agc ggc cgt gat gca tac 1536
Gln Leu Leu Pro Ser Trp Ser Gln Asp Ser Ser Gly Arg Asp Ala Tyr
500 505 510
ctc cag aac ttg gcc ttt acc ctc gcc agc cga cga tcc aat ctc aaa 1584
Leu Gln Asn Leu Ala Phe Thr Leu Ala Ser Arg Arg Ser Asn Leu Lys
515 520 525
tgg cag acg tat gcc acg gct tct acc ccg gac gag ttg ctt caa gtg 1632
Trp Gln Thr Tyr Ala Thr Ala Ser Thr Pro Asp Glu Leu Leu Gln Val
530 535 540
ctc aag acc aag ggc gac gca tgg gcg agt ccc gag gct cgc ctt gcc 1680
Leu Lys Thr Lys Gly Asp Ala Trp Ala Ser Pro Glu Ala Arg Leu Ala
545 550 555 560
gcg tca tcc ccc cgt ctt ggc ttt att ttc acc ggc cag ggc gct caa 1728
Ala Ser Ser Pro Arg Leu Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln
565 570 575
tgg gct cgc atg ggt gtt gag ctc atg gga tat ccc gtg ttt cgc caa 1776
Trp Ala Arg Met Gly Val Glu Leu Met Gly Tyr Pro Val Phe Arg Gln
580 585 590
agc gtc gag gag tcg gag cac ttc ctg cgc gag act ctc ggc tgt ccc 1824
Ser Val Glu Glu Ser Glu His Phe Leu Arg Glu Thr Leu Gly Cys Pro
595 600 605
tgg tct gcc atc gat gag ctg gcc aag ccg cag acc acg tcc cgt ctc 1872
Trp Ser Ala Ile Asp Glu Leu Ala Lys Pro Gln Thr Thr Ser Arg Leu
610 615 620
tcc gag gca gcc tac agt cag acg ctg tgc acc gta ctt caa att gcc 1920
Ser Glu Ala Ala Tyr Ser Gln Thr Leu Cys Thr Val Leu Gln Ile Ala
625 630 635 640
att gta gac ttg ctt caa gac tgg aat gtc tct ccc act cgc gtt gcc 1968
Ile Val Asp Leu Leu Gln Asp Trp Asn Val Ser Pro Thr Arg Val Ala
645 650 655
ggg cac tca agt ggc gaa ata gcg gcg gca tat tgc cta ggc gcc ctg 2016
Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Ala Leu
660 665 670
acc aag cag gac agt ctg aga gtc gcc tac tac cga gga atc ctg tcg 2064
Thr Lys Gln Asp Ser Leu Arg Val Ala Tyr Tyr Arg Gly Ile Leu Ser
675 680 685
tca gag atg caa gaa aca cac aag gac caa aag gga gcc atg atg gcc 2112
Ser Glu Met Gln Glu Thr His Lys Asp Gln Lys Gly Ala Met Met Ala
690 695 700
atc ggg gcc tcc ccc gag acg gta gca cag tgg ttg gca cag ctg act 2160
Ile Gly Ala Ser Pro Glu Thr Val Ala Gln Trp Leu Ala Gln Leu Thr
705 710 715 720
cgg gga aaa gtc gtc gtt gcc tgc atc aac tcg ccg acg agt gtc acg 2208
Arg Gly Lys Val Val Val Ala Cys Ile Asn Ser Pro Thr Ser Val Thr
725 730 735
gca tcc ggc gac gca gcg ggc atc gac gag ctc ctt tcc ata gta caa 2256
Ala Ser Gly Asp Ala Ala Gly Ile Asp Glu Leu Leu Ser Ile Val Gln
740 745 750
gag gcg gga gtc ttt gga cgc aag ttg aaa gtg gac gtg gca tat cac 2304
Glu Ala Gly Val Phe Gly Arg Lys Leu Lys Val Asp Val Ala Tyr His
755 760 765
tcg cat cat atg cag tcg gtt tct gcg gcc tac tct gcg ctc ctg aag 2352
Ser His His Met Gln Ser Val Ser Ala Ala Tyr Ser Ala Leu Leu Lys
770 775 780
gac ctc aag ccg ctg cca gcg cac gag ggc cgc acc atg cat tcg agc 2400
Asp Leu Lys Pro Leu Pro Ala His Glu Gly Arg Thr Met His Ser Ser
785 790 795 800
gta ttg ggt ggc ttg ata gac acc gca gag ctt ggt gcg tcc aac tgg 2448
Val Leu Gly Gly Leu Ile Asp Thr Ala Glu Leu Gly Ala Ser Asn Trp
805 810 815
gtg cgg aac ctg att tca ccg gtg cgt ttc tct gaa gcc gtc tcg agc 2496
Val Arg Asn Leu Ile Ser Pro Val Arg Phe Ser Glu Ala Val Ser Ser
820 825 830
ctc atc ttg gac ggg gac aag cca gcc gtc gat atg ctc atc gag atc 2544
Leu Ile Leu Asp Gly Asp Lys Pro Ala Val Asp Met Leu Ile Glu Ile
835 840 845
ggg cca cac gct gcg ctc aag gga ccc gtc cag gaa aca cta gag gcc 2592
Gly Pro His Ala Ala Leu Lys Gly Pro Val Gln Glu Thr Leu Glu Ala
850 855 860
aag ggc gtc tcc gcg gtc aag tac acg agc gtc gtg tct cgg ggc cag 2640
Lys Gly Val Ser Ala Val Lys Tyr Thr Ser Val Val Ser Arg Gly Gln
865 870 875 880
aat gct gtc aag acg gct ttg gcc tgc gcg ggc gag ctc gtc aac tcg 2688
Asn Ala Val Lys Thr Ala Leu Ala Cys Ala Gly Glu Leu Val Asn Ser
885 890 895
agc gtc ccc gtt gca atg gat cgt gta aat ctc gag tcg gag ctg caa 2736
Ser Val Pro Val Ala Met Asp Arg Val Asn Leu Glu Ser Glu Leu Gln
900 905 910
ccg agc ccg ctg gtc gat ctt cca tca tac cca tgg aac cgc tcg acc 2784
Pro Ser Pro Leu Val Asp Leu Pro Ser Tyr Pro Trp Asn Arg Ser Thr
915 920 925
cgg ttc tgg gcc gag tca cgt ctt tct caa gaa tat cgg ctt cgc aag 2832
Arg Phe Trp Ala Glu Ser Arg Leu Ser Gln Glu Tyr Arg Leu Arg Lys
930 935 940
cat gcc cgc ctg ccc ctg ctg gga agt ccg tgt ccc acg atg ggc gcc 2880
His Ala Arg Leu Pro Leu Leu Gly Ser Pro Cys Pro Thr Met Gly Ala
945 950 955 960
cgt gag aga tac tgg cgc ggc atg gtg agg ctg gac gag gag ccc tgg 2928
Arg Glu Arg Tyr Trp Arg Gly Met Val Arg Leu Asp Glu Glu Pro Trp
965 970 975
atc cga gac cat gag atc caa ggg tct atc ctg tat cct ggt gcc ggt 2976
Ile Arg Asp His Glu Ile Gln Gly Ser Ile Leu Tyr Pro Gly Ala Gly
980 985 990
ttc ctg atc atg gcc atc gaa gcc gct tct cag caa gca aac gaa cag 3024
Phe Leu Ile Met Ala Ile Glu Ala Ala Ser Gln Gln Ala Asn Glu Gln
995 1000 1005
cgc aaa gtg agc gcg ttt cgt ctg cgc gat gtg cac ctt gat gcc 3069
Arg Lys Val Ser Ala Phe Arg Leu Arg Asp Val His Leu Asp Ala
1010 1015 1020
gcc ttg gtg gtc acg gac aac agc act gcc gag gca att cta caa 3114
Ala Leu Val Val Thr Asp Asn Ser Thr Ala Glu Ala Ile Leu Gln
1025 1030 1035
ctt cgc ccg cat ctc ctc gcg ccg gga agc agc cag tcg tct tgg 3159
Leu Arg Pro His Leu Leu Ala Pro Gly Ser Ser Gln Ser Ser Trp
1040 1045 1050
atg gag ttt acc gtc aac tca tcc att gat ggc ggt gcc ctg cgt 3204
Met Glu Phe Thr Val Asn Ser Ser Ile Asp Gly Gly Ala Leu Arg
1055 1060 1065
cag aac tgc tcc ggc ctc atc atg atc gag tac gag gct gac gca 3249
Gln Asn Cys Ser Gly Leu Ile Met Ile Glu Tyr Glu Ala Asp Ala
1070 1075 1080
gac tcg gcc atg gcc cgt gaa cgt agc ttg gag tca gac acg gtt 3294
Asp Ser Ala Met Ala Arg Glu Arg Ser Leu Glu Ser Asp Thr Val
1085 1090 1095
tgt gat ttg tac aag aag acg tac att tcc tgc cgg cag tct gtc 3339
Cys Asp Leu Tyr Lys Lys Thr Tyr Ile Ser Cys Arg Gln Ser Val
1100 1105 1110
gat gtg gcc aag ttc tac tcc cgt ctc gcc tct ctt ggc ctc acc 3384
Asp Val Ala Lys Phe Tyr Ser Arg Leu Ala Ser Leu Gly Leu Thr
1115 1120 1125
tac ggg ccg gcg ttt gca aac ttg aca gag atc cgg agg acg ggc 3429
Tyr Gly Pro Ala Phe Ala Asn Leu Thr Glu Ile Arg Arg Thr Gly
1130 1135 1140
aac ggc cag tgt acc ggc gcc gtt cgt gtt ccc gct gtc gaa agc 3474
Asn Gly Gln Cys Thr Gly Ala Val Arg Val Pro Ala Val Glu Ser
1145 1150 1155
ctg gtg cct cca gca tac cgc agc cat cct cat gtc atc cat ccg 3519
Leu Val Pro Pro Ala Tyr Arg Ser His Pro His Val Ile His Pro
1160 1165 1170
ggg acg ttg gac gcc atc ttc cat ctt gcc ttt gcg gcc ctc gag 3564
Gly Thr Leu Asp Ala Ile Phe His Leu Ala Phe Ala Ala Leu Glu
1175 1180 1185
gac tct ctg ctt ccc ggt ccc atg gtc cca acg aca atc gat ggg 3609
Asp Ser Leu Leu Pro Gly Pro Met Val Pro Thr Thr Ile Asp Gly
1190 1195 1200
cta gtc gtt gca gca aac act cca aac gag ccc ggc act ttg ctt 3654
Leu Val Val Ala Ala Asn Thr Pro Asn Glu Pro Gly Thr Leu Leu
1205 1210 1215
cgc gga gtt tcg cag tct tct cca cat gga ttc agg gag ctc atc 3699
Arg Gly Val Ser Gln Ser Ser Pro His Gly Phe Arg Glu Leu Ile
1220 1225 1230
tcc gac att gac gtg ctg gat gat cag agc agc aga gcc gtt gta 3744
Ser Asp Ile Asp Val Leu Asp Asp Gln Ser Ser Arg Ala Val Val
1235 1240 1245
cag atc aag ggc ttc cgc tgc gcc gac gtc tcc gga ggc agc gcg 3789
Gln Ile Lys Gly Phe Arg Cys Ala Asp Val Ser Gly Gly Ser Ala
1250 1255 1260
aat tcg tca gac gcg gag cct gca gag gct cgt ccg atc agc ttc 3834
Asn Ser Ser Asp Ala Glu Pro Ala Glu Ala Arg Pro Ile Ser Phe
1265 1270 1275
cgt ctc aac tgg aag cca gca atc gac ctg ctt tct gct gag cag 3879
Arg Leu Asn Trp Lys Pro Ala Ile Asp Leu Leu Ser Ala Glu Gln
1280 1285 1290
ctg cgg aaa tat gtt ggt cgt gtt gcc aaa caa gca gat gct tct 3924
Leu Arg Lys Tyr Val Gly Arg Val Ala Lys Gln Ala Asp Ala Ser
1295 1300 1305
tcc cat ctc att cgt gcc acg gaa cta aac aac cag gtt gga aat 3969
Ser His Leu Ile Arg Ala Thr Glu Leu Asn Asn Gln Val Gly Asn
1310 1315 1320
ctt ccg gaa act gca cca tca gct gca ttg gat gcc gtc acg gaa 4014
Leu Pro Glu Thr Ala Pro Ser Ala Ala Leu Asp Ala Val Thr Glu
1325 1330 1335
aaa gcc act cga tgg ttc gct gcc aag tct gcg aag ctc gtc gac 4059
Lys Ala Thr Arg Trp Phe Ala Ala Lys Ser Ala Lys Leu Val Asp
1340 1345 1350
ggt gct gcc acg gca tcc agc gct tca tcc tca ggg ggc tac gtc 4104
Gly Ala Ala Thr Ala Ser Ser Ala Ser Ser Ser Gly Gly Tyr Val
1355 1360 1365
gac gca acg aga gac gca tgg gca gca gtg cga gaa ggc cgt atc 4149
Asp Ala Thr Arg Asp Ala Trp Ala Ala Val Arg Glu Gly Arg Ile
1370 1375 1380
cca tca cca gag aaa caa gac agg gtg ttg aga gag gta gag aag 4194
Pro Ser Pro Glu Lys Gln Asp Arg Val Leu Arg Glu Val Glu Lys
1385 1390 1395
aac ggc gca ctg tcc acc tta ctg ggg gcg ctc gac gcg tac atg 4239
Asn Gly Ala Leu Ser Thr Leu Leu Gly Ala Leu Asp Ala Tyr Met
1400 1405 1410
gat ctt cgc cat cat gcg aag ccc aac ttg tca gtt ctc gag ctg 4284
Asp Leu Arg His His Ala Lys Pro Asn Leu Ser Val Leu Glu Leu
1415 1420 1425
agc tta gac gcg gtg ccg tac tct att ttc gca gcc ctg ccc agt 4329
Ser Leu Asp Ala Val Pro Tyr Ser Ile Phe Ala Ala Leu Pro Ser
1430 1435 1440
cgg cag agc att ctc cag aca gcc cag tat gct att cga gta tct 4374
Arg Gln Ser Ile Leu Gln Thr Ala Gln Tyr Ala Ile Arg Val Ser
1445 1450 1455
caa gac ggc gtc cag gat cga att agg agt caa ttc ggg tcc caa 4419
Gln Asp Gly Val Gln Asp Arg Ile Arg Ser Gln Phe Gly Ser Gln
1460 1465 1470
gga tct ggc atc gac gtt gcc gtc acg gat ttc acc caa aag atc 4464
Gly Ser Gly Ile Asp Val Ala Val Thr Asp Phe Thr Gln Lys Ile
1475 1480 1485
gac gag aca ttg ggg aag cat gat gta att ctc ata ttt gat cct 4509
Asp Glu Thr Leu Gly Lys His Asp Val Ile Leu Ile Phe Asp Pro
1490 1495 1500
ggc ttc tta cac gcc aag ctc gag gtc gtc ttg cga aac gcc cgc 4554
Gly Phe Leu His Ala Lys Leu Glu Val Val Leu Arg Asn Ala Arg
1505 1510 1515
aag ctg ctg aac ccc gga ggc aag atc atc gtg gca gag gtc aac 4599
Lys Leu Leu Asn Pro Gly Gly Lys Ile Ile Val Ala Glu Val Asn
1520 1525 1530
gag ccc gga cta tat ctg ggc aca gca ctg ggc tgt ctt cac tgg 4644
Glu Pro Gly Leu Tyr Leu Gly Thr Ala Leu Gly Cys Leu His Trp
1535 1540 1545
aca aga aac ctc gac gtc tcg cag agt agc tgg aca tcg tgc ctc 4689
Thr Arg Asn Leu Asp Val Ser Gln Ser Ser Trp Thr Ser Cys Leu
1550 1555 1560
tcg cgc ttc gga ctg acg cct gcc ctg gaa ctc atc gac gca aac 4734
Ser Arg Phe Gly Leu Thr Pro Ala Leu Glu Leu Ile Asp Ala Asn
1565 1570 1575
aca gat gcc acc ggt cat ggg aag ttt cag ctc cgt ctt aca ggc 4779
Thr Asp Ala Thr Gly His Gly Lys Phe Gln Leu Arg Leu Thr Gly
1580 1585 1590
agt gcc gcg gag tcg aat ggg agt agc agc cat cag ccg cag caa 4824
Ser Ala Ala Glu Ser Asn Gly Ser Ser Ser His Gln Pro Gln Gln
1595 1600 1605
gtc acc ctc ata gaa tct gcc gat gca tct gag atg gcg caa ggc 4869
Val Thr Leu Ile Glu Ser Ala Asp Ala Ser Glu Met Ala Gln Gly
1610 1615 1620
gtc gca gaa gcg gta gcc cag cgt ctt caa gag gct tct att ccc 4914
Val Ala Glu Ala Val Ala Gln Arg Leu Gln Glu Ala Ser Ile Pro
1625 1630 1635
aca aag cgc gtc cat tgg ggc tgc gat gtc tcg caa ctc aag ggc 4959
Thr Lys Arg Val His Trp Gly Cys Asp Val Ser Gln Leu Lys Gly
1640 1645 1650
cag ccc tgc atc gtc ctg acg gac ctg cag tct gcg ctg ctg aaa 5004
Gln Pro Cys Ile Val Leu Thr Asp Leu Gln Ser Ala Leu Leu Lys
1655 1660 1665
gat ctg gca cca gag gac ctc gcg gcc ttg caa tca ctt ttc ttg 5049
Asp Leu Ala Pro Glu Asp Leu Ala Ala Leu Gln Ser Leu Phe Leu
1670 1675 1680
cat gct gag agc act ctt tgg gtg acc ggt ccc ctt ggc cca gac 5094
His Ala Glu Ser Thr Leu Trp Val Thr Gly Pro Leu Gly Pro Asp
1685 1690 1695
gcg gct ctg ata aca ggt ttg gct cgc agc gtt tgc aac gag gca 5139
Ala Ala Leu Ile Thr Gly Leu Ala Arg Ser Val Cys Asn Glu Ala
1700 1705 1710
gct gga gtt cag atc cgc acg ctt gag gtg act gat ttg ccg ata 5184
Ala Gly Val Gln Ile Arg Thr Leu Glu Val Thr Asp Leu Pro Ile
1715 1720 1725
tct gca gcc gcc ggc tat gcc gac atg gta gct cgt gtt ttc cgc 5229
Ser Ala Ala Ala Gly Tyr Ala Asp Met Val Ala Arg Val Phe Arg
1730 1735 1740
tat cgt ggc tcg gat aca gag ttt cag tgg cat tca gac gct ctg 5274
Tyr Arg Gly Ser Asp Thr Glu Phe Gln Trp His Ser Asp Ala Leu
1745 1750 1755
cta gtc agc cgg ctg act gag gat gag gac cga aac gag gag atc 5319
Leu Val Ser Arg Leu Thr Glu Asp Glu Asp Arg Asn Glu Glu Ile
1760 1765 1770
gcg cag ctg ctg gga cag gga gaa acg gcc gcg gct gag act acg 5364
Ala Gln Leu Leu Gly Gln Gly Glu Thr Ala Ala Ala Glu Thr Thr
1775 1780 1785
cta cag gag aca cca gag gga ctg aaa ctg tgc gtg agg caa ata 5409
Leu Gln Glu Thr Pro Glu Gly Leu Lys Leu Cys Val Arg Gln Ile
1790 1795 1800
ggc atg ctc gac tct gcc tgc tac gag cca gat ccg ttg gca ttg 5454
Gly Met Leu Asp Ser Ala Cys Tyr Glu Pro Asp Pro Leu Ala Leu
1805 1810 1815
gaa cca cta gag gcc ggc gag gtg gaa gtc gac gtg aag gct tca 5499
Glu Pro Leu Glu Ala Gly Glu Val Glu Val Asp Val Lys Ala Ser
1820 1825 1830
ggg gtc aac ttc cga gat gtc atg gtc gcc ctg ggg cag atc cca 5544
Gly Val Asn Phe Arg Asp Val Met Val Ala Leu Gly Gln Ile Pro
1835 1840 1845
gat cgg gct ttc gga ttc gag ggc gcc ggt gtc gtc cgc cgt gtc 5589
Asp Arg Ala Phe Gly Phe Glu Gly Ala Gly Val Val Arg Arg Val
1850 1855 1860
cac gct gaa gag tcg cgg ctt cgc cct gga gat cga gtc gtc ttc 5634
His Ala Glu Glu Ser Arg Leu Arg Pro Gly Asp Arg Val Val Phe
1865 1870 1875
ctt gct cac gga gcg cac cgc act gtt cat cgt gta cgc gcg gac 5679
Leu Ala His Gly Ala His Arg Thr Val His Arg Val Arg Ala Asp
1880 1885 1890
tat gcc atg cct atg ccc gat acc atg tcc ttt gaa gag ggc gcg 5724
Tyr Ala Met Pro Met Pro Asp Thr Met Ser Phe Glu Glu Gly Ala
1895 1900 1905
gct gtt ctc ctt gtc cac aca aca gcc tgg tac gcc ctc gtc aaa 5769
Ala Val Leu Leu Val His Thr Thr Ala Trp Tyr Ala Leu Val Lys
1910 1915 1920
tcg gca cgc gca aca gcc ggt cag tca gtc ctt gtt cat gcc gct 5814
Ser Ala Arg Ala Thr Ala Gly Gln Ser Val Leu Val His Ala Ala
1925 1930 1935
gca ggc ggt gtt ggc cag gca gtc ctc atg ctt gcc cga cat ctg 5859
Ala Gly Gly Val Gly Gln Ala Val Leu Met Leu Ala Arg His Leu
1940 1945 1950
ggc ctg gag gtt ttt gcg acg gtt ggc tcc gag gag aag agg aag 5904
Gly Leu Glu Val Phe Ala Thr Val Gly Ser Glu Glu Lys Arg Lys
1955 1960 1965
ctt gta cac gaa acg tac ggg att cct cac gac cac atg ttc aac 5949
Leu Val His Glu Thr Tyr Gly Ile Pro His Asp His Met Phe Asn
1970 1975 1980
tcg cgg gac tcc agc ttt gca atg ggc gtg aag cgg atg acc aac 5994
Ser Arg Asp Ser Ser Phe Ala Met Gly Val Lys Arg Met Thr Asn
1985 1990 1995
ggc cgc gga gtt gac att gtt gtc aat tcg ctc gct ggg gaa gct 6039
Gly Arg Gly Val Asp Ile Val Val Asn Ser Leu Ala Gly Glu Ala
2000 2005 2010
ctc cgg cag acg tgg cat tgc ctg gca ccg ttt ggc acc ttt gtc 6084
Leu Arg Gln Thr Trp His Cys Leu Ala Pro Phe Gly Thr Phe Val
2015 2020 2025
gag ctc ggc atg aag gac ata ttg gac aac gca cgc tta gac atg 6129
Glu Leu Gly Met Lys Asp Ile Leu Asp Asn Ala Arg Leu Asp Met
2030 2035 2040
aaa ccc ttc ctg cag gac gca acc ttt gtc ttc ttc aac ctg aac 6174
Lys Pro Phe Leu Gln Asp Ala Thr Phe Val Phe Phe Asn Leu Asn
2045 2050 2055
cgg gtc caa aag gag cgg cca gat ctc atg aag gag gct ctc agg 6219
Arg Val Gln Lys Glu Arg Pro Asp Leu Met Lys Glu Ala Leu Arg
2060 2065 2070
gaa acg atg gcc ctt gta tcc tct ggg gcg ctg aag cca gca acg 6264
Glu Thr Met Ala Leu Val Ser Ser Gly Ala Leu Lys Pro Ala Thr
2075 2080 2085
ccg ctc acc gca tac gca gct tct caa gtg gaa aca gca ttc cgg 6309
Pro Leu Thr Ala Tyr Ala Ala Ser Gln Val Glu Thr Ala Phe Arg
2090 2095 2100
aaa atc cag act ggg cag cac ctg ggt aag ctc gtg cta acg ttc 6354
Lys Ile Gln Thr Gly Gln His Leu Gly Lys Leu Val Leu Thr Phe
2105 2110 2115
cag acc gga gac gtt ctc cgc gtc atc aga ccg gat ctc agc ctg 6399
Gln Thr Gly Asp Val Leu Arg Val Ile Arg Pro Asp Leu Ser Leu
2120 2125 2130
ggc gac tcc ggc gcg tac ctc ctt gtt gga gga ctc ggc gga tta 6444
Gly Asp Ser Gly Ala Tyr Leu Leu Val Gly Gly Leu Gly Gly Leu
2135 2140 2145
ggt cgt agt ctt gca cgg ctg ctg gta cat ctc ggt gcc cgc cgg 6489
Gly Arg Ser Leu Ala Arg Leu Leu Val His Leu Gly Ala Arg Arg
2150 2155 2160
cta tgt ttc ttg tct cgg tct ggt gca aaa agc agc gag gca cag 6534
Leu Cys Phe Leu Ser Arg Ser Gly Ala Lys Ser Ser Glu Ala Gln
2165 2170 2175
gcg ctc gtc cag gaa ctc gag ttg cag cac cga gtt cgc gtg ctt 6579
Ala Leu Val Gln Glu Leu Glu Leu Gln His Arg Val Arg Val Leu
2180 2185 2190
gtc tgc caa ggg gat gtg tcc gac agc gac acg gtg gct cgc gtc 6624
Val Cys Gln Gly Asp Val Ser Asp Ser Asp Thr Val Ala Arg Val
2195 2200 2205
gtt cag caa tgc acc acg acc ctc ggg ccc atc cgt ggc gtc gtc 6669
Val Gln Gln Cys Thr Thr Thr Leu Gly Pro Ile Arg Gly Val Val
2210 2215 2220
cag tgt gcc atg att ctc cgg gat ggc ctg ttt gag aga atg aca 6714
Gln Cys Ala Met Ile Leu Arg Asp Gly Leu Phe Glu Arg Met Thr
2225 2230 2235
cac gag cag tgg acc gag agc acg cgg ccg aag gtg cag ggc acg 6759
His Glu Gln Trp Thr Glu Ser Thr Arg Pro Lys Val Gln Gly Thr
2240 2245 2250
tgg aac ttg cat gag cag atc cca tcg gcc gac ttc ttc atc acg 6804
Trp Asn Leu His Glu Gln Ile Pro Ser Ala Asp Phe Phe Ile Thr
2255 2260 2265
ctg agc tcc ttt gca ggc gtg ttt gga agc cgc ggg cag agc aac 6849
Leu Ser Ser Phe Ala Gly Val Phe Gly Ser Arg Gly Gln Ser Asn
2270 2275 2280
tac gcc gct gcg ggt gcg tac gag gat gcc ttg gca cat ttc cga 6894
Tyr Ala Ala Ala Gly Ala Tyr Glu Asp Ala Leu Ala His Phe Arg
2285 2290 2295
acg tct ctg gga cag agg gct atc acc atc gac ttg ggc atc atg 6939
Thr Ser Leu Gly Gln Arg Ala Ile Thr Ile Asp Leu Gly Ile Met
2300 2305 2310
cgt gac gtg ggc gtc ctc gcc gag cag ggc atc acg gac tac ctc 6984
Arg Asp Val Gly Val Leu Ala Glu Gln Gly Ile Thr Asp Tyr Leu
2315 2320 2325
cgg gag tgg gag gag ccc ttt gga ata cga gag cat gag ttt cat 7029
Arg Glu Trp Glu Glu Pro Phe Gly Ile Arg Glu His Glu Phe His
2330 2335 2340
gcc ctc atc aag tcg gcc atc atg tcg gcc acg gaa ccg ccg act 7074
Ala Leu Ile Lys Ser Ala Ile Met Ser Ala Thr Glu Pro Pro Thr
2345 2350 2355
gag cgc tcc gtg gtg cag atc cct acc ggc ttg gcc acc gcc cgt 7119
Glu Arg Ser Val Val Gln Ile Pro Thr Gly Leu Ala Thr Ala Arg
2360 2365 2370
tcc gcg caa gca gcc ggt ata agc aca cca ttc tac ttt gac gac 7164
Ser Ala Gln Ala Ala Gly Ile Ser Thr Pro Phe Tyr Phe Asp Asp
2375 2380 2385
gcc cgt ttc tcg atc ctc gcc cag aca cgc acc gcg gcc ggt gcg 7209
Ala Arg Phe Ser Ile Leu Ala Gln Thr Arg Thr Ala Ala Gly Ala
2390 2395 2400
tcg tcg gcg aac gct gat gat ggc aag gtt tcc atc cga aca cag 7254
Ser Ser Ala Asn Ala Asp Asp Gly Lys Val Ser Ile Arg Thr Gln
2405 2410 2415
ctc tct cag gcc cag tcg gtg gct gaa gca gcc tcc gcc gtt cag 7299
Leu Ser Gln Ala Gln Ser Val Ala Glu Ala Ala Ser Ala Val Gln
2420 2425 2430
acg gtg ctg ctt gag cgg gta gca aag acg ctc cag agc tct gta 7344
Thr Val Leu Leu Glu Arg Val Ala Lys Thr Leu Gln Ser Ser Val
2435 2440 2445
tcg gaa ata gat cca tct cag cca ctg cat tcg tat ggt gtc gat 7389
Ser Glu Ile Asp Pro Ser Gln Pro Leu His Ser Tyr Gly Val Asp
2450 2455 2460
tcc ctg gtc gcc gtg gaa acg gtc aag tgg atg ttt aaa acg cta 7434
Ser Leu Val Ala Val Glu Thr Val Lys Trp Met Phe Lys Thr Leu
2465 2470 2475
gag gct aag ctg acg gtg ttt gat gtt ctc tcc aac gtg tct att 7479
Glu Ala Lys Leu Thr Val Phe Asp Val Leu Ser Asn Val Ser Ile
2480 2485 2490
gtt gta tta tgc gag aag att gct acc acg tct act cta gta aag 7524
Val Val Leu Cys Glu Lys Ile Ala Thr Thr Ser Thr Leu Val Lys
2495 2500 2505
ttg agc tag 7533
Leu Ser
2510
<210> 8
<211> 2510
<212> PRT
<213> Metarhizium rileyi
<400> 8
Met Glu Ala Ser Ser Gln Ser Arg Asp Asp Ile Ala Val Ile Gly Leu
1 5 10 15
Ser Cys Arg Phe Pro Gly Glu Ala Asp Thr Ala Glu His Phe Trp Asp
20 25 30
Phe Ile Cys Asn Gly Arg Asn Ala Tyr Ser Glu Asn Pro Asp Arg Trp
35 40 45
Asn Pro Asp Ala Phe His Tyr Gly Glu Lys Lys Leu Asn Thr Ser Leu
50 55 60
Pro Arg Gly Gly His Phe Met Lys Gln Asp Val Ala Ala Phe Asp Ala
65 70 75 80
Asn Phe Phe Asn Leu Ser Lys Val Glu Ala Glu Ser Met Asp Pro Gln
85 90 95
Gln Arg Ile Val Met Glu Val Thr Tyr Glu Ser Met Glu Ser Ala Gly
100 105 110
Leu Arg Val Asp Arg Leu Ala Gly Ser Arg Thr Gly Val Phe Met Ala
115 120 125
Ser Phe Thr Ser Asp Tyr Arg Glu Met Leu Tyr Arg Asp Ala Glu Thr
130 135 140
Ala Pro Leu Tyr Thr Ala Thr Gly Thr Ser Asn Thr Ser Thr Ser Asn
145 150 155 160
Arg Val Ser Trp Phe Phe Asp Leu Arg Gly Pro Ser Phe Thr Val Asn
165 170 175
Thr Ala Cys Ser Ser Ser Leu Val Ala Cys His Leu Ala Cys Gln Ser
180 185 190
Leu Trp Asn Gly Glu Thr Glu Ser Ala Ile Val Gly Gly Thr Ser Leu
195 200 205
Leu Leu Asn Pro Asp Met Phe Leu Tyr Leu Ser Asn Gln Arg Phe Leu
210 215 220
Ala Pro Asp Gly Gln Cys Lys Ser Phe Asp Glu Ser Gly Asp Gly Tyr
225 230 235 240
Ala Arg Gly Asp Gly Ile Gly Val Val Ile Leu Lys Arg Val Ala Asp
245 250 255
Ala Val Arg Asp Gly Asp Pro Ile Arg Ala Val Ile Arg Gly Ser Gly
260 265 270
Cys Asn Gln Asp Gly His Thr Lys Gly Phe Thr Ile Pro Ser Val Glu
275 280 285
Ala Gln Ala Ser Leu Ile Glu Glu Thr Tyr Arg Lys Ala Gly Leu Ser
290 295 300
Leu Ala Glu Thr Arg Tyr Val Glu Ala His Gly Thr Gly Thr Gln Ala
305 310 315 320
Gly Asp Thr Cys Glu Met Glu Gly Ile Ala Arg Thr Phe Gly Gln His
325 330 335
Arg Gly Asp Ser Asp Asp Leu Leu Val Gly Ser Val Lys Ser Asn Ile
340 345 350
Gly His Leu Glu Ala Cys Ala Gly Leu Ala Ser Leu Ile Lys Cys Ile
355 360 365
Phe Ile Leu Glu Thr Gly Val Ile Pro Pro Thr Pro Ser Val Arg Val
370 375 380
Leu Asn Pro Lys Ile Arg Trp Glu Glu Trp His Leu Lys Val Pro Ser
385 390 395 400
Lys Gln Thr Pro Trp Pro Thr Asp Gly Leu Arg Arg Val Ser Thr Gln
405 410 415
Gly Phe Gly Tyr Gly Gly Thr Asn Ala His Leu Ile Leu Asp Asp Ala
420 425 430
Ala His Tyr Leu Glu Gly Arg Ser Leu Arg Gly His His Tyr Thr Arg
435 440 445
Thr His Pro Gln Ala Gln Arg Leu Leu Thr Ser Ala Ile His Gly Ala
450 455 460
Ser Pro Lys Glu Gln Leu Pro Arg Leu Phe Leu Phe Arg Ala Asn Asp
465 470 475 480
Arg Glu Gly Leu Gly Arg Val Arg Ala Ser Leu Ala Gln His Leu Asp
485 490 495
Gln Leu Leu Pro Ser Trp Ser Gln Asp Ser Ser Gly Arg Asp Ala Tyr
500 505 510
Leu Gln Asn Leu Ala Phe Thr Leu Ala Ser Arg Arg Ser Asn Leu Lys
515 520 525
Trp Gln Thr Tyr Ala Thr Ala Ser Thr Pro Asp Glu Leu Leu Gln Val
530 535 540
Leu Lys Thr Lys Gly Asp Ala Trp Ala Ser Pro Glu Ala Arg Leu Ala
545 550 555 560
Ala Ser Ser Pro Arg Leu Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln
565 570 575
Trp Ala Arg Met Gly Val Glu Leu Met Gly Tyr Pro Val Phe Arg Gln
580 585 590
Ser Val Glu Glu Ser Glu His Phe Leu Arg Glu Thr Leu Gly Cys Pro
595 600 605
Trp Ser Ala Ile Asp Glu Leu Ala Lys Pro Gln Thr Thr Ser Arg Leu
610 615 620
Ser Glu Ala Ala Tyr Ser Gln Thr Leu Cys Thr Val Leu Gln Ile Ala
625 630 635 640
Ile Val Asp Leu Leu Gln Asp Trp Asn Val Ser Pro Thr Arg Val Ala
645 650 655
Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Ala Leu
660 665 670
Thr Lys Gln Asp Ser Leu Arg Val Ala Tyr Tyr Arg Gly Ile Leu Ser
675 680 685
Ser Glu Met Gln Glu Thr His Lys Asp Gln Lys Gly Ala Met Met Ala
690 695 700
Ile Gly Ala Ser Pro Glu Thr Val Ala Gln Trp Leu Ala Gln Leu Thr
705 710 715 720
Arg Gly Lys Val Val Val Ala Cys Ile Asn Ser Pro Thr Ser Val Thr
725 730 735
Ala Ser Gly Asp Ala Ala Gly Ile Asp Glu Leu Leu Ser Ile Val Gln
740 745 750
Glu Ala Gly Val Phe Gly Arg Lys Leu Lys Val Asp Val Ala Tyr His
755 760 765
Ser His His Met Gln Ser Val Ser Ala Ala Tyr Ser Ala Leu Leu Lys
770 775 780
Asp Leu Lys Pro Leu Pro Ala His Glu Gly Arg Thr Met His Ser Ser
785 790 795 800
Val Leu Gly Gly Leu Ile Asp Thr Ala Glu Leu Gly Ala Ser Asn Trp
805 810 815
Val Arg Asn Leu Ile Ser Pro Val Arg Phe Ser Glu Ala Val Ser Ser
820 825 830
Leu Ile Leu Asp Gly Asp Lys Pro Ala Val Asp Met Leu Ile Glu Ile
835 840 845
Gly Pro His Ala Ala Leu Lys Gly Pro Val Gln Glu Thr Leu Glu Ala
850 855 860
Lys Gly Val Ser Ala Val Lys Tyr Thr Ser Val Val Ser Arg Gly Gln
865 870 875 880
Asn Ala Val Lys Thr Ala Leu Ala Cys Ala Gly Glu Leu Val Asn Ser
885 890 895
Ser Val Pro Val Ala Met Asp Arg Val Asn Leu Glu Ser Glu Leu Gln
900 905 910
Pro Ser Pro Leu Val Asp Leu Pro Ser Tyr Pro Trp Asn Arg Ser Thr
915 920 925
Arg Phe Trp Ala Glu Ser Arg Leu Ser Gln Glu Tyr Arg Leu Arg Lys
930 935 940
His Ala Arg Leu Pro Leu Leu Gly Ser Pro Cys Pro Thr Met Gly Ala
945 950 955 960
Arg Glu Arg Tyr Trp Arg Gly Met Val Arg Leu Asp Glu Glu Pro Trp
965 970 975
Ile Arg Asp His Glu Ile Gln Gly Ser Ile Leu Tyr Pro Gly Ala Gly
980 985 990
Phe Leu Ile Met Ala Ile Glu Ala Ala Ser Gln Gln Ala Asn Glu Gln
995 1000 1005
Arg Lys Val Ser Ala Phe Arg Leu Arg Asp Val His Leu Asp Ala
1010 1015 1020
Ala Leu Val Val Thr Asp Asn Ser Thr Ala Glu Ala Ile Leu Gln
1025 1030 1035
Leu Arg Pro His Leu Leu Ala Pro Gly Ser Ser Gln Ser Ser Trp
1040 1045 1050
Met Glu Phe Thr Val Asn Ser Ser Ile Asp Gly Gly Ala Leu Arg
1055 1060 1065
Gln Asn Cys Ser Gly Leu Ile Met Ile Glu Tyr Glu Ala Asp Ala
1070 1075 1080
Asp Ser Ala Met Ala Arg Glu Arg Ser Leu Glu Ser Asp Thr Val
1085 1090 1095
Cys Asp Leu Tyr Lys Lys Thr Tyr Ile Ser Cys Arg Gln Ser Val
1100 1105 1110
Asp Val Ala Lys Phe Tyr Ser Arg Leu Ala Ser Leu Gly Leu Thr
1115 1120 1125
Tyr Gly Pro Ala Phe Ala Asn Leu Thr Glu Ile Arg Arg Thr Gly
1130 1135 1140
Asn Gly Gln Cys Thr Gly Ala Val Arg Val Pro Ala Val Glu Ser
1145 1150 1155
Leu Val Pro Pro Ala Tyr Arg Ser His Pro His Val Ile His Pro
1160 1165 1170
Gly Thr Leu Asp Ala Ile Phe His Leu Ala Phe Ala Ala Leu Glu
1175 1180 1185
Asp Ser Leu Leu Pro Gly Pro Met Val Pro Thr Thr Ile Asp Gly
1190 1195 1200
Leu Val Val Ala Ala Asn Thr Pro Asn Glu Pro Gly Thr Leu Leu
1205 1210 1215
Arg Gly Val Ser Gln Ser Ser Pro His Gly Phe Arg Glu Leu Ile
1220 1225 1230
Ser Asp Ile Asp Val Leu Asp Asp Gln Ser Ser Arg Ala Val Val
1235 1240 1245
Gln Ile Lys Gly Phe Arg Cys Ala Asp Val Ser Gly Gly Ser Ala
1250 1255 1260
Asn Ser Ser Asp Ala Glu Pro Ala Glu Ala Arg Pro Ile Ser Phe
1265 1270 1275
Arg Leu Asn Trp Lys Pro Ala Ile Asp Leu Leu Ser Ala Glu Gln
1280 1285 1290
Leu Arg Lys Tyr Val Gly Arg Val Ala Lys Gln Ala Asp Ala Ser
1295 1300 1305
Ser His Leu Ile Arg Ala Thr Glu Leu Asn Asn Gln Val Gly Asn
1310 1315 1320
Leu Pro Glu Thr Ala Pro Ser Ala Ala Leu Asp Ala Val Thr Glu
1325 1330 1335
Lys Ala Thr Arg Trp Phe Ala Ala Lys Ser Ala Lys Leu Val Asp
1340 1345 1350
Gly Ala Ala Thr Ala Ser Ser Ala Ser Ser Ser Gly Gly Tyr Val
1355 1360 1365
Asp Ala Thr Arg Asp Ala Trp Ala Ala Val Arg Glu Gly Arg Ile
1370 1375 1380
Pro Ser Pro Glu Lys Gln Asp Arg Val Leu Arg Glu Val Glu Lys
1385 1390 1395
Asn Gly Ala Leu Ser Thr Leu Leu Gly Ala Leu Asp Ala Tyr Met
1400 1405 1410
Asp Leu Arg His His Ala Lys Pro Asn Leu Ser Val Leu Glu Leu
1415 1420 1425
Ser Leu Asp Ala Val Pro Tyr Ser Ile Phe Ala Ala Leu Pro Ser
1430 1435 1440
Arg Gln Ser Ile Leu Gln Thr Ala Gln Tyr Ala Ile Arg Val Ser
1445 1450 1455
Gln Asp Gly Val Gln Asp Arg Ile Arg Ser Gln Phe Gly Ser Gln
1460 1465 1470
Gly Ser Gly Ile Asp Val Ala Val Thr Asp Phe Thr Gln Lys Ile
1475 1480 1485
Asp Glu Thr Leu Gly Lys His Asp Val Ile Leu Ile Phe Asp Pro
1490 1495 1500
Gly Phe Leu His Ala Lys Leu Glu Val Val Leu Arg Asn Ala Arg
1505 1510 1515
Lys Leu Leu Asn Pro Gly Gly Lys Ile Ile Val Ala Glu Val Asn
1520 1525 1530
Glu Pro Gly Leu Tyr Leu Gly Thr Ala Leu Gly Cys Leu His Trp
1535 1540 1545
Thr Arg Asn Leu Asp Val Ser Gln Ser Ser Trp Thr Ser Cys Leu
1550 1555 1560
Ser Arg Phe Gly Leu Thr Pro Ala Leu Glu Leu Ile Asp Ala Asn
1565 1570 1575
Thr Asp Ala Thr Gly His Gly Lys Phe Gln Leu Arg Leu Thr Gly
1580 1585 1590
Ser Ala Ala Glu Ser Asn Gly Ser Ser Ser His Gln Pro Gln Gln
1595 1600 1605
Val Thr Leu Ile Glu Ser Ala Asp Ala Ser Glu Met Ala Gln Gly
1610 1615 1620
Val Ala Glu Ala Val Ala Gln Arg Leu Gln Glu Ala Ser Ile Pro
1625 1630 1635
Thr Lys Arg Val His Trp Gly Cys Asp Val Ser Gln Leu Lys Gly
1640 1645 1650
Gln Pro Cys Ile Val Leu Thr Asp Leu Gln Ser Ala Leu Leu Lys
1655 1660 1665
Asp Leu Ala Pro Glu Asp Leu Ala Ala Leu Gln Ser Leu Phe Leu
1670 1675 1680
His Ala Glu Ser Thr Leu Trp Val Thr Gly Pro Leu Gly Pro Asp
1685 1690 1695
Ala Ala Leu Ile Thr Gly Leu Ala Arg Ser Val Cys Asn Glu Ala
1700 1705 1710
Ala Gly Val Gln Ile Arg Thr Leu Glu Val Thr Asp Leu Pro Ile
1715 1720 1725
Ser Ala Ala Ala Gly Tyr Ala Asp Met Val Ala Arg Val Phe Arg
1730 1735 1740
Tyr Arg Gly Ser Asp Thr Glu Phe Gln Trp His Ser Asp Ala Leu
1745 1750 1755
Leu Val Ser Arg Leu Thr Glu Asp Glu Asp Arg Asn Glu Glu Ile
1760 1765 1770
Ala Gln Leu Leu Gly Gln Gly Glu Thr Ala Ala Ala Glu Thr Thr
1775 1780 1785
Leu Gln Glu Thr Pro Glu Gly Leu Lys Leu Cys Val Arg Gln Ile
1790 1795 1800
Gly Met Leu Asp Ser Ala Cys Tyr Glu Pro Asp Pro Leu Ala Leu
1805 1810 1815
Glu Pro Leu Glu Ala Gly Glu Val Glu Val Asp Val Lys Ala Ser
1820 1825 1830
Gly Val Asn Phe Arg Asp Val Met Val Ala Leu Gly Gln Ile Pro
1835 1840 1845
Asp Arg Ala Phe Gly Phe Glu Gly Ala Gly Val Val Arg Arg Val
1850 1855 1860
His Ala Glu Glu Ser Arg Leu Arg Pro Gly Asp Arg Val Val Phe
1865 1870 1875
Leu Ala His Gly Ala His Arg Thr Val His Arg Val Arg Ala Asp
1880 1885 1890
Tyr Ala Met Pro Met Pro Asp Thr Met Ser Phe Glu Glu Gly Ala
1895 1900 1905
Ala Val Leu Leu Val His Thr Thr Ala Trp Tyr Ala Leu Val Lys
1910 1915 1920
Ser Ala Arg Ala Thr Ala Gly Gln Ser Val Leu Val His Ala Ala
1925 1930 1935
Ala Gly Gly Val Gly Gln Ala Val Leu Met Leu Ala Arg His Leu
1940 1945 1950
Gly Leu Glu Val Phe Ala Thr Val Gly Ser Glu Glu Lys Arg Lys
1955 1960 1965
Leu Val His Glu Thr Tyr Gly Ile Pro His Asp His Met Phe Asn
1970 1975 1980
Ser Arg Asp Ser Ser Phe Ala Met Gly Val Lys Arg Met Thr Asn
1985 1990 1995
Gly Arg Gly Val Asp Ile Val Val Asn Ser Leu Ala Gly Glu Ala
2000 2005 2010
Leu Arg Gln Thr Trp His Cys Leu Ala Pro Phe Gly Thr Phe Val
2015 2020 2025
Glu Leu Gly Met Lys Asp Ile Leu Asp Asn Ala Arg Leu Asp Met
2030 2035 2040
Lys Pro Phe Leu Gln Asp Ala Thr Phe Val Phe Phe Asn Leu Asn
2045 2050 2055
Arg Val Gln Lys Glu Arg Pro Asp Leu Met Lys Glu Ala Leu Arg
2060 2065 2070
Glu Thr Met Ala Leu Val Ser Ser Gly Ala Leu Lys Pro Ala Thr
2075 2080 2085
Pro Leu Thr Ala Tyr Ala Ala Ser Gln Val Glu Thr Ala Phe Arg
2090 2095 2100
Lys Ile Gln Thr Gly Gln His Leu Gly Lys Leu Val Leu Thr Phe
2105 2110 2115
Gln Thr Gly Asp Val Leu Arg Val Ile Arg Pro Asp Leu Ser Leu
2120 2125 2130
Gly Asp Ser Gly Ala Tyr Leu Leu Val Gly Gly Leu Gly Gly Leu
2135 2140 2145
Gly Arg Ser Leu Ala Arg Leu Leu Val His Leu Gly Ala Arg Arg
2150 2155 2160
Leu Cys Phe Leu Ser Arg Ser Gly Ala Lys Ser Ser Glu Ala Gln
2165 2170 2175
Ala Leu Val Gln Glu Leu Glu Leu Gln His Arg Val Arg Val Leu
2180 2185 2190
Val Cys Gln Gly Asp Val Ser Asp Ser Asp Thr Val Ala Arg Val
2195 2200 2205
Val Gln Gln Cys Thr Thr Thr Leu Gly Pro Ile Arg Gly Val Val
2210 2215 2220
Gln Cys Ala Met Ile Leu Arg Asp Gly Leu Phe Glu Arg Met Thr
2225 2230 2235
His Glu Gln Trp Thr Glu Ser Thr Arg Pro Lys Val Gln Gly Thr
2240 2245 2250
Trp Asn Leu His Glu Gln Ile Pro Ser Ala Asp Phe Phe Ile Thr
2255 2260 2265
Leu Ser Ser Phe Ala Gly Val Phe Gly Ser Arg Gly Gln Ser Asn
2270 2275 2280
Tyr Ala Ala Ala Gly Ala Tyr Glu Asp Ala Leu Ala His Phe Arg
2285 2290 2295
Thr Ser Leu Gly Gln Arg Ala Ile Thr Ile Asp Leu Gly Ile Met
2300 2305 2310
Arg Asp Val Gly Val Leu Ala Glu Gln Gly Ile Thr Asp Tyr Leu
2315 2320 2325
Arg Glu Trp Glu Glu Pro Phe Gly Ile Arg Glu His Glu Phe His
2330 2335 2340
Ala Leu Ile Lys Ser Ala Ile Met Ser Ala Thr Glu Pro Pro Thr
2345 2350 2355
Glu Arg Ser Val Val Gln Ile Pro Thr Gly Leu Ala Thr Ala Arg
2360 2365 2370
Ser Ala Gln Ala Ala Gly Ile Ser Thr Pro Phe Tyr Phe Asp Asp
2375 2380 2385
Ala Arg Phe Ser Ile Leu Ala Gln Thr Arg Thr Ala Ala Gly Ala
2390 2395 2400
Ser Ser Ala Asn Ala Asp Asp Gly Lys Val Ser Ile Arg Thr Gln
2405 2410 2415
Leu Ser Gln Ala Gln Ser Val Ala Glu Ala Ala Ser Ala Val Gln
2420 2425 2430
Thr Val Leu Leu Glu Arg Val Ala Lys Thr Leu Gln Ser Ser Val
2435 2440 2445
Ser Glu Ile Asp Pro Ser Gln Pro Leu His Ser Tyr Gly Val Asp
2450 2455 2460
Ser Leu Val Ala Val Glu Thr Val Lys Trp Met Phe Lys Thr Leu
2465 2470 2475
Glu Ala Lys Leu Thr Val Phe Asp Val Leu Ser Asn Val Ser Ile
2480 2485 2490
Val Val Leu Cys Glu Lys Ile Ala Thr Thr Ser Thr Leu Val Lys
2495 2500 2505
Leu Ser
2510
<210> 9
<211> 5166
<212> DNA
<213> Metarhizium rileyi
<220>
<221> CDS
<222> (1)..(5166)
<400> 9
atg aaa atc cgg gct aca aac ttc ctc ctt ttt gga gat cag act gta 48
Met Lys Ile Arg Ala Thr Asn Phe Leu Leu Phe Gly Asp Gln Thr Val
1 5 10 15
gag aag ctt cca gcc att cgg cag ctg gta ggg cac gct gcg tcc tca 96
Glu Lys Leu Pro Ala Ile Arg Gln Leu Val Gly His Ala Ala Ser Ser
20 25 30
gct ctg ctt cag agg ttt ctg cgt caa gtt tgc gat gcg gtg cag ctc 144
Ala Leu Leu Gln Arg Phe Leu Arg Gln Val Cys Asp Ala Val Gln Leu
35 40 45
gaa gtc gcc aag ttg cct atg cac tcg gag caa cgc agc aac att gac 192
Glu Val Ala Lys Leu Pro Met His Ser Glu Gln Arg Ser Asn Ile Asp
50 55 60
aag ttt gac agc atc att cga cta gcc gaa aac aat gcc cgg ctg gac 240
Lys Phe Asp Ser Ile Ile Arg Leu Ala Glu Asn Asn Ala Arg Leu Asp
65 70 75 80
gag ccc aat gag atc gtt gcc acc gtc ttg atg aat atc gcc cgg ata 288
Glu Pro Asn Glu Ile Val Ala Thr Val Leu Met Asn Ile Ala Arg Ile
85 90 95
ggc gag ctc att ctg tat gca gaa gaa gac cct acc gtc ctc gtc tcc 336
Gly Glu Leu Ile Leu Tyr Ala Glu Glu Asp Pro Thr Val Leu Val Ser
100 105 110
aaa ggc aac cgc aac tgt att ctg gga ttc tgc act ggc gag gtg gct 384
Lys Gly Asn Arg Asn Cys Ile Leu Gly Phe Cys Thr Gly Glu Val Ala
115 120 125
gct gcc gcg gcc act atc gcg cag gac tcc aat gag ctg gtt gag ctg 432
Ala Ala Ala Ala Thr Ile Ala Gln Asp Ser Asn Glu Leu Val Glu Leu
130 135 140
ggc gtg gag atg act cac atc atc ttt cgc atg gcc cga gag cta aat 480
Gly Val Glu Met Thr His Ile Ile Phe Arg Met Ala Arg Glu Leu Asn
145 150 155 160
cac cgg tct ctc atg gtt gac cgt acc aac ggc ccc tgg gca aag aca 528
His Arg Ser Leu Met Val Asp Arg Thr Asn Gly Pro Trp Ala Lys Thr
165 170 175
atc ttg ggc att tca gtt gag cgc gtc cag gag att cta cat gag ttc 576
Ile Leu Gly Ile Ser Val Glu Arg Val Gln Glu Ile Leu His Glu Phe
180 185 190
cac gag agc gag tca att cct cgt gtc cga cga gtc tgc gtc ggg ttc 624
His Glu Ser Glu Ser Ile Pro Arg Val Arg Arg Val Cys Val Gly Phe
195 200 205
atc gca gaa ggc tgg ttg acg ctc ttc ggt ccc ccg aca acc ctg caa 672
Ile Ala Glu Gly Trp Leu Thr Leu Phe Gly Pro Pro Thr Thr Leu Gln
210 215 220
cga ctt ttc gaa tgg tca gta gag ctg gaa gac gct cca cag att gcc 720
Arg Leu Phe Glu Trp Ser Val Glu Leu Glu Asp Ala Pro Gln Ile Ala
225 230 235 240
aca gac gct cgt gga ggt gtg cac atg aag acg atg ccc gac gtt gac 768
Thr Asp Ala Arg Gly Gly Val His Met Lys Thr Met Pro Asp Val Asp
245 250 255
gtg gac tgg att ctt ggc tcg tcc gta tgg ctc gac cga acc ccc gtt 816
Val Asp Trp Ile Leu Gly Ser Ser Val Trp Leu Asp Arg Thr Pro Val
260 265 270
cac aca gct acc atc ttc tct ccc tat acg tgt cag cct cgg cag caa 864
His Thr Ala Thr Ile Phe Ser Pro Tyr Thr Cys Gln Pro Arg Gln Gln
275 280 285
cag act ctg cga ggg ctt ctg agg gaa atc att acc gac gtt gcg cag 912
Gln Thr Leu Arg Gly Leu Leu Arg Glu Ile Ile Thr Asp Val Ala Gln
290 295 300
cgg acg ttg tat ttg gcc aag gca atg aac gcg gct ctt gag ttt acc 960
Arg Thr Leu Tyr Leu Ala Lys Ala Met Asn Ala Ala Leu Glu Phe Thr
305 310 315 320
aag gca gac gag ctg cga gtc gtc atg ccc ggt cac acg agc cac gac 1008
Lys Ala Asp Glu Leu Arg Val Val Met Pro Gly His Thr Ser His Asp
325 330 335
gtc tat ttc ctc aag tcg ctt cag aaa cgt ggc ata gag tac tca gtc 1056
Val Tyr Phe Leu Lys Ser Leu Gln Lys Arg Gly Ile Glu Tyr Ser Val
340 345 350
atg tca cat ggc gat agc cca ccg tca gct ccg ggt agg caa ggt tca 1104
Met Ser His Gly Asp Ser Pro Pro Ser Ala Pro Gly Arg Gln Gly Ser
355 360 365
ggc ctt gtt gct gtc gtc ggc atg tcc ggc agg ttc ccg gga agc ggc 1152
Gly Leu Val Ala Val Val Gly Met Ser Gly Arg Phe Pro Gly Ser Gly
370 375 380
gac atc aat gcc ttc tgg gag ggt ctt ttg gag ggg aaa aga tat att 1200
Asp Ile Asn Ala Phe Trp Glu Gly Leu Leu Glu Gly Lys Arg Tyr Ile
385 390 395 400
caa gag att cca aat acc cga ttc gat ctg gag aag tgg tat gac gcg 1248
Gln Glu Ile Pro Asn Thr Arg Phe Asp Leu Glu Lys Trp Tyr Asp Ala
405 410 415
acg ggc aaa gta aag aac tcg aca att gcg cga acg gga gcc ttc ctt 1296
Thr Gly Lys Val Lys Asn Ser Thr Ile Ala Arg Thr Gly Ala Phe Leu
420 425 430
gat aag cca ggt atg ttc gac aac cgc ctg ttc gac atg tcg cca agg 1344
Asp Lys Pro Gly Met Phe Asp Asn Arg Leu Phe Asp Met Ser Pro Arg
435 440 445
gag gcc atg cag acg gac gtc cag cac cga cta ctc atg aca acc ggc 1392
Glu Ala Met Gln Thr Asp Val Gln His Arg Leu Leu Met Thr Thr Gly
450 455 460
tac gag gca ctg gag atg tcg gga tac tcc ccc gac ggg act ccc tca 1440
Tyr Glu Ala Leu Glu Met Ser Gly Tyr Ser Pro Asp Gly Thr Pro Ser
465 470 475 480
act gac acg agt cgc atc gca tca tac ttt gga cag acg tca gac gat 1488
Thr Asp Thr Ser Arg Ile Ala Ser Tyr Phe Gly Gln Thr Ser Asp Asp
485 490 495
tgg cgg gaa gtg gtg gtc cat cag ggg gtc gac atc tac ttc gcc acg 1536
Trp Arg Glu Val Val Val His Gln Gly Val Asp Ile Tyr Phe Ala Thr
500 505 510
gga agt tgc cgt gcc ttc ggg cca ggc aga ctg cat cac cat ttc aaa 1584
Gly Ser Cys Arg Ala Phe Gly Pro Gly Arg Leu His His His Phe Lys
515 520 525
tgg gga ggc ccg tct tac agt gtc gac tcg gca tgc tcc tcg agc atc 1632
Trp Gly Gly Pro Ser Tyr Ser Val Asp Ser Ala Cys Ser Ser Ser Ile
530 535 540
gca gcc gtc ggt ctg gca tgc tca gcg ctc ctc ggg cgc gaa tgc gac 1680
Ala Ala Val Gly Leu Ala Cys Ser Ala Leu Leu Gly Arg Glu Cys Asp
545 550 555 560
atg gcc ctg gct ggc gga gga tct cta ctt ctc tcc ccg tcg ccc ttc 1728
Met Ala Leu Ala Gly Gly Gly Ser Leu Leu Leu Ser Pro Ser Pro Phe
565 570 575
tca ggc ttg agc cgt ggt ggt ttc tta tcc gcc caa gga ggg tgc cag 1776
Ser Gly Leu Ser Arg Gly Gly Phe Leu Ser Ala Gln Gly Gly Cys Gln
580 585 590
aca ttc cac gac aac gcc gat ggc tac gtc cga gga gag ggc gtc gga 1824
Thr Phe His Asp Asn Ala Asp Gly Tyr Val Arg Gly Glu Gly Val Gly
595 600 605
gtg gtt gtt ctc aag cgc tta gaa gat gcg ctg gac gac cag gac aac 1872
Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Asp Asp Gln Asp Asn
610 615 620
ata ctc ggc gtt gtc cgc ggg tcc gga cgc aac tac agc agc gat gcc 1920
Ile Leu Gly Val Val Arg Gly Ser Gly Arg Asn Tyr Ser Ser Asp Ala
625 630 635 640
tct tcg atg atg cac ccc tcg gca aac gcc cag aaa cag ctg tac cgt 1968
Ser Ser Met Met His Pro Ser Ala Asn Ala Gln Lys Gln Leu Tyr Arg
645 650 655
gat gtt ctg gag cag agt ggt gta gag gcc aac agc atc tcc tac gtg 2016
Asp Val Leu Glu Gln Ser Gly Val Glu Ala Asn Ser Ile Ser Tyr Val
660 665 670
gaa atg cac ggg aca ggc acg cag gcc ggg gac ttt atg gaa atg tct 2064
Glu Met His Gly Thr Gly Thr Gln Ala Gly Asp Phe Met Glu Met Ser
675 680 685
tcc gtc ctg tca acg ttt gcg gag aag cga ggc gcg gat aat ccg ctc 2112
Ser Val Leu Ser Thr Phe Ala Glu Lys Arg Gly Ala Asp Asn Pro Leu
690 695 700
att gta gga gcc ctc aaa gca agt att ggc cac gga gaa gca gcg gcc 2160
Ile Val Gly Ala Leu Lys Ala Ser Ile Gly His Gly Glu Ala Ala Ala
705 710 715 720
ggc gtc tgc gct ctc atc aaa acc ctg atg atg ctt cag tgt cga cgg 2208
Gly Val Cys Ala Leu Ile Lys Thr Leu Met Met Leu Gln Cys Arg Arg
725 730 735
att cca cct caa ccc gac ctt cct ggg cct atc aac cat cga ttc cct 2256
Ile Pro Pro Gln Pro Asp Leu Pro Gly Pro Ile Asn His Arg Phe Pro
740 745 750
gat ctt gca gcc cgc aat gtg tac att gcg gcc cgc aac ttg aag ttg 2304
Asp Leu Ala Ala Arg Asn Val Tyr Ile Ala Ala Arg Asn Leu Lys Leu
755 760 765
gag gcc agc ccg atg gcc aaa ggg gtt ctt cgg atg ttt ctg aac agc 2352
Glu Ala Ser Pro Met Ala Lys Gly Val Leu Arg Met Phe Leu Asn Ser
770 775 780
ttc gat gct tcg ggt gga aat tcg tgt ttg ctg ctt gaa gaa gct ccg 2400
Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Leu Leu Glu Glu Ala Pro
785 790 795 800
ccg cgg gcc gtc aag gac gaa gac gct cga agt cat cat gtt gtg acc 2448
Pro Arg Ala Val Lys Asp Glu Asp Ala Arg Ser His His Val Val Thr
805 810 815
ctt tca gcc cgc tct cag aag tca ctc atc gga atc aaa gag aag tac 2496
Leu Ser Ala Arg Ser Gln Lys Ser Leu Ile Gly Ile Lys Glu Lys Tyr
820 825 830
ctg gcc cat ctg agt caa aat ccg ggc atc aag ctg gcg gac ctg gca 2544
Leu Ala His Leu Ser Gln Asn Pro Gly Ile Lys Leu Ala Asp Leu Ala
835 840 845
tac tcg aca act gct cgg cga atg cat gga ctg ttg cgg tat gcc atc 2592
Tyr Ser Thr Thr Ala Arg Arg Met His Gly Leu Leu Arg Tyr Ala Ile
850 855 860
gcc gca tcc tcc gtt gac gag gtc atg aac tct ctg gag acg gat ctc 2640
Ala Ala Ser Ser Val Asp Glu Val Met Asn Ser Leu Glu Thr Asp Leu
865 870 875 880
gcc cag ggg aaa aca cct cgt cag cct ccg gta gcg ccg agt ata gtt 2688
Ala Gln Gly Lys Thr Pro Arg Gln Pro Pro Val Ala Pro Ser Ile Val
885 890 895
ttc att ttt aca ggc cag ggc gca cat tac ctc ggt atg ggc tcg gaa 2736
Phe Ile Phe Thr Gly Gln Gly Ala His Tyr Leu Gly Met Gly Ser Glu
900 905 910
ctg tgg aag aca tct gcc atg ttc cgc aac acg ctt caa aag tac cag 2784
Leu Trp Lys Thr Ser Ala Met Phe Arg Asn Thr Leu Gln Lys Tyr Gln
915 920 925
acg atg gcc agt gcc gaa ggc ctc ccc tac ttc ctc gat ctc atc gta 2832
Thr Met Ala Ser Ala Glu Gly Leu Pro Tyr Phe Leu Asp Leu Ile Val
930 935 940
gga aac agc acg tcc acg caa cag tca ggg ccg gat act gta cag gta 2880
Gly Asn Ser Thr Ser Thr Gln Gln Ser Gly Pro Asp Thr Val Gln Val
945 950 955 960
cag ctg gcc atg gtc agc ttg gaa cta gcc ctc gct gag ctt tgg cgt 2928
Gln Leu Ala Met Val Ser Leu Glu Leu Ala Leu Ala Glu Leu Trp Arg
965 970 975
tcc tgg ggc atc cag cct gcc atg gtc ttg ggc cac agc cta ggc gaa 2976
Ser Trp Gly Ile Gln Pro Ala Met Val Leu Gly His Ser Leu Gly Glu
980 985 990
tac gcc gcc ctg tgc gtg gcc gga gtg ctc tcg gtg agc gat gct ctg 3024
Tyr Ala Ala Leu Cys Val Ala Gly Val Leu Ser Val Ser Asp Ala Leu
995 1000 1005
tac ctc gtg tac agg cga gct caa atc atg act gag gcc ctg act 3069
Tyr Leu Val Tyr Arg Arg Ala Gln Ile Met Thr Glu Ala Leu Thr
1010 1015 1020
gct agc gag tac ggc atg ttg gcc gtc aat cta agc gtc tgt gac 3114
Ala Ser Glu Tyr Gly Met Leu Ala Val Asn Leu Ser Val Cys Asp
1025 1030 1035
acg cgg gag gtg ctg tcg tct ggc cag cat gcc tca tgt gcc gtg 3159
Thr Arg Glu Val Leu Ser Ser Gly Gln His Ala Ser Cys Ala Val
1040 1045 1050
gct tgc atc aat gcc ccg aag atg acg gtg gtg agc ggt ccg ctg 3204
Ala Cys Ile Asn Ala Pro Lys Met Thr Val Val Ser Gly Pro Leu
1055 1060 1065
ccg aag ctt gaa gag ctc cag aat caa ctc aag tcg gac ggc act 3249
Pro Lys Leu Glu Glu Leu Gln Asn Gln Leu Lys Ser Asp Gly Thr
1070 1075 1080
cga tgt acg cct ctt tct gtt ccc tac ggc ttt cac tcg agt caa 3294
Arg Cys Thr Pro Leu Ser Val Pro Tyr Gly Phe His Ser Ser Gln
1085 1090 1095
ctt gac ccc atc ctg gac cag ttc gaa gct gcc tgc caa ggc gtc 3339
Leu Asp Pro Ile Leu Asp Gln Phe Glu Ala Ala Cys Gln Gly Val
1100 1105 1110
acc ttc tct gca ccg aaa gtc ccc gtg gtc tct acg ctc ttg gct 3384
Thr Phe Ser Ala Pro Lys Val Pro Val Val Ser Thr Leu Leu Ala
1115 1120 1125
act gtg gtc cga gaa gaa ggg act ttc tct ccg ggg tat ctg gcc 3429
Thr Val Val Arg Glu Glu Gly Thr Phe Ser Pro Gly Tyr Leu Ala
1130 1135 1140
cgg cag gcc cgc gaa cca gtc gac ttt gtc gga gct ttg ggc atg 3474
Arg Gln Ala Arg Glu Pro Val Asp Phe Val Gly Ala Leu Gly Met
1145 1150 1155
gtg cag gag cag agt ctt gcc tcc ctg gtg ttt ctc gaa gtt gga 3519
Val Gln Glu Gln Ser Leu Ala Ser Leu Val Phe Leu Glu Val Gly
1160 1165 1170
cct gaa cct gta tgt tcc ggt ctt gtg aac gcc acg cta agt gcc 3564
Pro Glu Pro Val Cys Ser Gly Leu Val Asn Ala Thr Leu Ser Ala
1175 1180 1185
ggg gag acc aag gca cgc tgc ttt gct tcg atg cat cgg ggt cat 3609
Gly Glu Thr Lys Ala Arg Cys Phe Ala Ser Met His Arg Gly His
1190 1195 1200
gaa aac tgg gcg tcg ata tca tca agc ttg aga gat ctc tac atg 3654
Glu Asn Trp Ala Ser Ile Ser Ser Ser Leu Arg Asp Leu Tyr Met
1205 1210 1215
gcg ggt gct ccc atc gac tgg cca gcc ttc cac cac gac ttc aag 3699
Ala Gly Ala Pro Ile Asp Trp Pro Ala Phe His His Asp Phe Lys
1220 1225 1230
tcg tcc gtc tcc ctt ctt gac ctt ccc aag tac tct ttc gac gag 3744
Ser Ser Val Ser Leu Leu Asp Leu Pro Lys Tyr Ser Phe Asp Glu
1235 1240 1245
aag gag ttc tgg gcg tca ttc cct aac aga gac atg cag ggc acg 3789
Lys Glu Phe Trp Ala Ser Phe Pro Asn Arg Asp Met Gln Gly Thr
1250 1255 1260
gga gag gtc gag ccc aag caa agc caa ccg ccc gtc atc gtt ccg 3834
Gly Glu Val Glu Pro Lys Gln Ser Gln Pro Pro Val Ile Val Pro
1265 1270 1275
tct gtg caa gga tac tgc acg acg act ctg cag cga atc gta aaa 3879
Ser Val Gln Gly Tyr Cys Thr Thr Thr Leu Gln Arg Ile Val Lys
1280 1285 1290
gaa acc gac cag ccg gac ggg cta tcg gtc acg ttt aca tcc gac 3924
Glu Thr Asp Gln Pro Asp Gly Leu Ser Val Thr Phe Thr Ser Asp
1295 1300 1305
ctg gca gaa cag cac cta cgt gcg gct gta cga ggt cat gcc gtg 3969
Leu Ala Glu Gln His Leu Arg Ala Ala Val Arg Gly His Ala Val
1310 1315 1320
gcc gac ata gaa atc tgt tcc agc agc ctg ctc ctg gac atg gca 4014
Ala Asp Ile Glu Ile Cys Ser Ser Ser Leu Leu Leu Asp Met Ala
1325 1330 1335
ctt tct gca gcc caa tat gcc tat ctg aaa cat tcc ccc ggc cag 4059
Leu Ser Ala Ala Gln Tyr Ala Tyr Leu Lys His Ser Pro Gly Gln
1340 1345 1350
aag atg cct gtt cca ttg acc gtc cgc aac tgc ttc ttc cac cgg 4104
Lys Met Pro Val Pro Leu Thr Val Arg Asn Cys Phe Phe His Arg
1355 1360 1365
gct gtc gtc ttg acc gag gaa gcg cag acc gtg gaa gtc acc gtc 4149
Ala Val Val Leu Thr Glu Glu Ala Gln Thr Val Glu Val Thr Val
1370 1375 1380
aca ttc agg tcc tcg acc aag act gcg gat att cag tac tac tgc 4194
Thr Phe Arg Ser Ser Thr Lys Thr Ala Asp Ile Gln Tyr Tyr Cys
1385 1390 1395
cga act tcc gac gag tac tac gag ttc gga tcc tgc cag gtg acg 4239
Arg Thr Ser Asp Glu Tyr Tyr Glu Phe Gly Ser Cys Gln Val Thr
1400 1405 1410
ttg gaa gca cca aga aaa cca gac cag gct gga ttt ctg gtt cgg 4284
Leu Glu Ala Pro Arg Lys Pro Asp Gln Ala Gly Phe Leu Val Arg
1415 1420 1425
tcc cgt att gct gca ctc aag gag tcg gca agt cac cgg cta ggc 4329
Ser Arg Ile Ala Ala Leu Lys Glu Ser Ala Ser His Arg Leu Gly
1430 1435 1440
aag cac gca gtt tac cgg ttg ttt gac aac att gtg cgg tat tca 4374
Lys His Ala Val Tyr Arg Leu Phe Asp Asn Ile Val Arg Tyr Ser
1445 1450 1455
gag caa tac cag ggg cta aag aac gtc cat ctt tcg gaa gac atg 4419
Glu Gln Tyr Gln Gly Leu Lys Asn Val His Leu Ser Glu Asp Met
1460 1465 1470
cgc gac gct gtg gcg gag atc aac atg acg caa gtc cca gcg gca 4464
Arg Asp Ala Val Ala Glu Ile Asn Met Thr Gln Val Pro Ala Ala
1475 1480 1485
ggc ggt cat tat ctt cac cac ccg ttt ttg atg gac tcg att gtt 4509
Gly Gly His Tyr Leu His His Pro Phe Leu Met Asp Ser Ile Val
1490 1495 1500
cat ctt tca gga ttc ttg gtg aac aac ggc ctc cgt tac tcc agc 4554
His Leu Ser Gly Phe Leu Val Asn Asn Gly Leu Arg Tyr Ser Ser
1505 1510 1515
gaa tgg gct tgt ctt tcc acc ggt ttc gag gag ctt cac ctg ctc 4599
Glu Trp Ala Cys Leu Ser Thr Gly Phe Glu Glu Leu His Leu Leu
1520 1525 1530
aag ccg cta gat cct gcc act gta tac acc agc tat act ttt atg 4644
Lys Pro Leu Asp Pro Ala Thr Val Tyr Thr Ser Tyr Thr Phe Met
1535 1540 1545
gaa gat tcc ccg acg acg agc aat gtc att ggc gat gtg tac gtc 4689
Glu Asp Ser Pro Thr Thr Ser Asn Val Ile Gly Asp Val Tyr Val
1550 1555 1560
tac gat ggg gca gag tta gtc tcc gtg gtg aca gga ttg cag ttt 4734
Tyr Asp Gly Ala Glu Leu Val Ser Val Val Thr Gly Leu Gln Phe
1565 1570 1575
caa aag atg aag agg aca gca ctc act cat ctg ctg agt ccc gcg 4779
Gln Lys Met Lys Arg Thr Ala Leu Thr His Leu Leu Ser Pro Ala
1580 1585 1590
acg gcg cgc aac acg gcg gcc aag acg atc cct cat aga ccg acg 4824
Thr Ala Arg Asn Thr Ala Ala Lys Thr Ile Pro His Arg Pro Thr
1595 1600 1605
acg gcc ccg gcg aag gcg ctt tct gac caa cag ccc atc act acc 4869
Thr Ala Pro Ala Lys Ala Leu Ser Asp Gln Gln Pro Ile Thr Thr
1610 1615 1620
att caa gcc gaa gca gct gtc ccg cag gct agt act cct tcg acc 4914
Ile Gln Ala Glu Ala Ala Val Pro Gln Ala Ser Thr Pro Ser Thr
1625 1630 1635
gcg gca agt gtc aat ggt ggt gag ggg gag aag ttt gac ctg gtg 4959
Ala Ala Ser Val Asn Gly Gly Glu Gly Glu Lys Phe Asp Leu Val
1640 1645 1650
gaa acg ctg ttt tcc atc atc gca cgc gag gtc ggc gtc gac tcg 5004
Glu Thr Leu Phe Ser Ile Ile Ala Arg Glu Val Gly Val Asp Ser
1655 1660 1665
agc gat ttg aag ggc gac gtg aac ctg gcg aat ctg ggc ata gac 5049
Ser Asp Leu Lys Gly Asp Val Asn Leu Ala Asn Leu Gly Ile Asp
1670 1675 1680
tcc ctc atg gcc atc aca atc atc tcg gtc atg cag cag gaa aca 5094
Ser Leu Met Ala Ile Thr Ile Ile Ser Val Met Gln Gln Glu Thr
1685 1690 1695
gga att gag ttg ccc ggg acg ttt ttc ctc gac aat tcc acg acg 5139
Gly Ile Glu Leu Pro Gly Thr Phe Phe Leu Asp Asn Ser Thr Thr
1700 1705 1710
acg gca gta atc gcg gca gtg gga tag 5166
Thr Ala Val Ile Ala Ala Val Gly
1715 1720
<210> 10
<211> 1721
<212> PRT
<213> Metarhizium rileyi
<400> 10
Met Lys Ile Arg Ala Thr Asn Phe Leu Leu Phe Gly Asp Gln Thr Val
1 5 10 15
Glu Lys Leu Pro Ala Ile Arg Gln Leu Val Gly His Ala Ala Ser Ser
20 25 30
Ala Leu Leu Gln Arg Phe Leu Arg Gln Val Cys Asp Ala Val Gln Leu
35 40 45
Glu Val Ala Lys Leu Pro Met His Ser Glu Gln Arg Ser Asn Ile Asp
50 55 60
Lys Phe Asp Ser Ile Ile Arg Leu Ala Glu Asn Asn Ala Arg Leu Asp
65 70 75 80
Glu Pro Asn Glu Ile Val Ala Thr Val Leu Met Asn Ile Ala Arg Ile
85 90 95
Gly Glu Leu Ile Leu Tyr Ala Glu Glu Asp Pro Thr Val Leu Val Ser
100 105 110
Lys Gly Asn Arg Asn Cys Ile Leu Gly Phe Cys Thr Gly Glu Val Ala
115 120 125
Ala Ala Ala Ala Thr Ile Ala Gln Asp Ser Asn Glu Leu Val Glu Leu
130 135 140
Gly Val Glu Met Thr His Ile Ile Phe Arg Met Ala Arg Glu Leu Asn
145 150 155 160
His Arg Ser Leu Met Val Asp Arg Thr Asn Gly Pro Trp Ala Lys Thr
165 170 175
Ile Leu Gly Ile Ser Val Glu Arg Val Gln Glu Ile Leu His Glu Phe
180 185 190
His Glu Ser Glu Ser Ile Pro Arg Val Arg Arg Val Cys Val Gly Phe
195 200 205
Ile Ala Glu Gly Trp Leu Thr Leu Phe Gly Pro Pro Thr Thr Leu Gln
210 215 220
Arg Leu Phe Glu Trp Ser Val Glu Leu Glu Asp Ala Pro Gln Ile Ala
225 230 235 240
Thr Asp Ala Arg Gly Gly Val His Met Lys Thr Met Pro Asp Val Asp
245 250 255
Val Asp Trp Ile Leu Gly Ser Ser Val Trp Leu Asp Arg Thr Pro Val
260 265 270
His Thr Ala Thr Ile Phe Ser Pro Tyr Thr Cys Gln Pro Arg Gln Gln
275 280 285
Gln Thr Leu Arg Gly Leu Leu Arg Glu Ile Ile Thr Asp Val Ala Gln
290 295 300
Arg Thr Leu Tyr Leu Ala Lys Ala Met Asn Ala Ala Leu Glu Phe Thr
305 310 315 320
Lys Ala Asp Glu Leu Arg Val Val Met Pro Gly His Thr Ser His Asp
325 330 335
Val Tyr Phe Leu Lys Ser Leu Gln Lys Arg Gly Ile Glu Tyr Ser Val
340 345 350
Met Ser His Gly Asp Ser Pro Pro Ser Ala Pro Gly Arg Gln Gly Ser
355 360 365
Gly Leu Val Ala Val Val Gly Met Ser Gly Arg Phe Pro Gly Ser Gly
370 375 380
Asp Ile Asn Ala Phe Trp Glu Gly Leu Leu Glu Gly Lys Arg Tyr Ile
385 390 395 400
Gln Glu Ile Pro Asn Thr Arg Phe Asp Leu Glu Lys Trp Tyr Asp Ala
405 410 415
Thr Gly Lys Val Lys Asn Ser Thr Ile Ala Arg Thr Gly Ala Phe Leu
420 425 430
Asp Lys Pro Gly Met Phe Asp Asn Arg Leu Phe Asp Met Ser Pro Arg
435 440 445
Glu Ala Met Gln Thr Asp Val Gln His Arg Leu Leu Met Thr Thr Gly
450 455 460
Tyr Glu Ala Leu Glu Met Ser Gly Tyr Ser Pro Asp Gly Thr Pro Ser
465 470 475 480
Thr Asp Thr Ser Arg Ile Ala Ser Tyr Phe Gly Gln Thr Ser Asp Asp
485 490 495
Trp Arg Glu Val Val Val His Gln Gly Val Asp Ile Tyr Phe Ala Thr
500 505 510
Gly Ser Cys Arg Ala Phe Gly Pro Gly Arg Leu His His His Phe Lys
515 520 525
Trp Gly Gly Pro Ser Tyr Ser Val Asp Ser Ala Cys Ser Ser Ser Ile
530 535 540
Ala Ala Val Gly Leu Ala Cys Ser Ala Leu Leu Gly Arg Glu Cys Asp
545 550 555 560
Met Ala Leu Ala Gly Gly Gly Ser Leu Leu Leu Ser Pro Ser Pro Phe
565 570 575
Ser Gly Leu Ser Arg Gly Gly Phe Leu Ser Ala Gln Gly Gly Cys Gln
580 585 590
Thr Phe His Asp Asn Ala Asp Gly Tyr Val Arg Gly Glu Gly Val Gly
595 600 605
Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Asp Asp Gln Asp Asn
610 615 620
Ile Leu Gly Val Val Arg Gly Ser Gly Arg Asn Tyr Ser Ser Asp Ala
625 630 635 640
Ser Ser Met Met His Pro Ser Ala Asn Ala Gln Lys Gln Leu Tyr Arg
645 650 655
Asp Val Leu Glu Gln Ser Gly Val Glu Ala Asn Ser Ile Ser Tyr Val
660 665 670
Glu Met His Gly Thr Gly Thr Gln Ala Gly Asp Phe Met Glu Met Ser
675 680 685
Ser Val Leu Ser Thr Phe Ala Glu Lys Arg Gly Ala Asp Asn Pro Leu
690 695 700
Ile Val Gly Ala Leu Lys Ala Ser Ile Gly His Gly Glu Ala Ala Ala
705 710 715 720
Gly Val Cys Ala Leu Ile Lys Thr Leu Met Met Leu Gln Cys Arg Arg
725 730 735
Ile Pro Pro Gln Pro Asp Leu Pro Gly Pro Ile Asn His Arg Phe Pro
740 745 750
Asp Leu Ala Ala Arg Asn Val Tyr Ile Ala Ala Arg Asn Leu Lys Leu
755 760 765
Glu Ala Ser Pro Met Ala Lys Gly Val Leu Arg Met Phe Leu Asn Ser
770 775 780
Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Leu Leu Glu Glu Ala Pro
785 790 795 800
Pro Arg Ala Val Lys Asp Glu Asp Ala Arg Ser His His Val Val Thr
805 810 815
Leu Ser Ala Arg Ser Gln Lys Ser Leu Ile Gly Ile Lys Glu Lys Tyr
820 825 830
Leu Ala His Leu Ser Gln Asn Pro Gly Ile Lys Leu Ala Asp Leu Ala
835 840 845
Tyr Ser Thr Thr Ala Arg Arg Met His Gly Leu Leu Arg Tyr Ala Ile
850 855 860
Ala Ala Ser Ser Val Asp Glu Val Met Asn Ser Leu Glu Thr Asp Leu
865 870 875 880
Ala Gln Gly Lys Thr Pro Arg Gln Pro Pro Val Ala Pro Ser Ile Val
885 890 895
Phe Ile Phe Thr Gly Gln Gly Ala His Tyr Leu Gly Met Gly Ser Glu
900 905 910
Leu Trp Lys Thr Ser Ala Met Phe Arg Asn Thr Leu Gln Lys Tyr Gln
915 920 925
Thr Met Ala Ser Ala Glu Gly Leu Pro Tyr Phe Leu Asp Leu Ile Val
930 935 940
Gly Asn Ser Thr Ser Thr Gln Gln Ser Gly Pro Asp Thr Val Gln Val
945 950 955 960
Gln Leu Ala Met Val Ser Leu Glu Leu Ala Leu Ala Glu Leu Trp Arg
965 970 975
Ser Trp Gly Ile Gln Pro Ala Met Val Leu Gly His Ser Leu Gly Glu
980 985 990
Tyr Ala Ala Leu Cys Val Ala Gly Val Leu Ser Val Ser Asp Ala Leu
995 1000 1005
Tyr Leu Val Tyr Arg Arg Ala Gln Ile Met Thr Glu Ala Leu Thr
1010 1015 1020
Ala Ser Glu Tyr Gly Met Leu Ala Val Asn Leu Ser Val Cys Asp
1025 1030 1035
Thr Arg Glu Val Leu Ser Ser Gly Gln His Ala Ser Cys Ala Val
1040 1045 1050
Ala Cys Ile Asn Ala Pro Lys Met Thr Val Val Ser Gly Pro Leu
1055 1060 1065
Pro Lys Leu Glu Glu Leu Gln Asn Gln Leu Lys Ser Asp Gly Thr
1070 1075 1080
Arg Cys Thr Pro Leu Ser Val Pro Tyr Gly Phe His Ser Ser Gln
1085 1090 1095
Leu Asp Pro Ile Leu Asp Gln Phe Glu Ala Ala Cys Gln Gly Val
1100 1105 1110
Thr Phe Ser Ala Pro Lys Val Pro Val Val Ser Thr Leu Leu Ala
1115 1120 1125
Thr Val Val Arg Glu Glu Gly Thr Phe Ser Pro Gly Tyr Leu Ala
1130 1135 1140
Arg Gln Ala Arg Glu Pro Val Asp Phe Val Gly Ala Leu Gly Met
1145 1150 1155
Val Gln Glu Gln Ser Leu Ala Ser Leu Val Phe Leu Glu Val Gly
1160 1165 1170
Pro Glu Pro Val Cys Ser Gly Leu Val Asn Ala Thr Leu Ser Ala
1175 1180 1185
Gly Glu Thr Lys Ala Arg Cys Phe Ala Ser Met His Arg Gly His
1190 1195 1200
Glu Asn Trp Ala Ser Ile Ser Ser Ser Leu Arg Asp Leu Tyr Met
1205 1210 1215
Ala Gly Ala Pro Ile Asp Trp Pro Ala Phe His His Asp Phe Lys
1220 1225 1230
Ser Ser Val Ser Leu Leu Asp Leu Pro Lys Tyr Ser Phe Asp Glu
1235 1240 1245
Lys Glu Phe Trp Ala Ser Phe Pro Asn Arg Asp Met Gln Gly Thr
1250 1255 1260
Gly Glu Val Glu Pro Lys Gln Ser Gln Pro Pro Val Ile Val Pro
1265 1270 1275
Ser Val Gln Gly Tyr Cys Thr Thr Thr Leu Gln Arg Ile Val Lys
1280 1285 1290
Glu Thr Asp Gln Pro Asp Gly Leu Ser Val Thr Phe Thr Ser Asp
1295 1300 1305
Leu Ala Glu Gln His Leu Arg Ala Ala Val Arg Gly His Ala Val
1310 1315 1320
Ala Asp Ile Glu Ile Cys Ser Ser Ser Leu Leu Leu Asp Met Ala
1325 1330 1335
Leu Ser Ala Ala Gln Tyr Ala Tyr Leu Lys His Ser Pro Gly Gln
1340 1345 1350
Lys Met Pro Val Pro Leu Thr Val Arg Asn Cys Phe Phe His Arg
1355 1360 1365
Ala Val Val Leu Thr Glu Glu Ala Gln Thr Val Glu Val Thr Val
1370 1375 1380
Thr Phe Arg Ser Ser Thr Lys Thr Ala Asp Ile Gln Tyr Tyr Cys
1385 1390 1395
Arg Thr Ser Asp Glu Tyr Tyr Glu Phe Gly Ser Cys Gln Val Thr
1400 1405 1410
Leu Glu Ala Pro Arg Lys Pro Asp Gln Ala Gly Phe Leu Val Arg
1415 1420 1425
Ser Arg Ile Ala Ala Leu Lys Glu Ser Ala Ser His Arg Leu Gly
1430 1435 1440
Lys His Ala Val Tyr Arg Leu Phe Asp Asn Ile Val Arg Tyr Ser
1445 1450 1455
Glu Gln Tyr Gln Gly Leu Lys Asn Val His Leu Ser Glu Asp Met
1460 1465 1470
Arg Asp Ala Val Ala Glu Ile Asn Met Thr Gln Val Pro Ala Ala
1475 1480 1485
Gly Gly His Tyr Leu His His Pro Phe Leu Met Asp Ser Ile Val
1490 1495 1500
His Leu Ser Gly Phe Leu Val Asn Asn Gly Leu Arg Tyr Ser Ser
1505 1510 1515
Glu Trp Ala Cys Leu Ser Thr Gly Phe Glu Glu Leu His Leu Leu
1520 1525 1530
Lys Pro Leu Asp Pro Ala Thr Val Tyr Thr Ser Tyr Thr Phe Met
1535 1540 1545
Glu Asp Ser Pro Thr Thr Ser Asn Val Ile Gly Asp Val Tyr Val
1550 1555 1560
Tyr Asp Gly Ala Glu Leu Val Ser Val Val Thr Gly Leu Gln Phe
1565 1570 1575
Gln Lys Met Lys Arg Thr Ala Leu Thr His Leu Leu Ser Pro Ala
1580 1585 1590
Thr Ala Arg Asn Thr Ala Ala Lys Thr Ile Pro His Arg Pro Thr
1595 1600 1605
Thr Ala Pro Ala Lys Ala Leu Ser Asp Gln Gln Pro Ile Thr Thr
1610 1615 1620
Ile Gln Ala Glu Ala Ala Val Pro Gln Ala Ser Thr Pro Ser Thr
1625 1630 1635
Ala Ala Ser Val Asn Gly Gly Glu Gly Glu Lys Phe Asp Leu Val
1640 1645 1650
Glu Thr Leu Phe Ser Ile Ile Ala Arg Glu Val Gly Val Asp Ser
1655 1660 1665
Ser Asp Leu Lys Gly Asp Val Asn Leu Ala Asn Leu Gly Ile Asp
1670 1675 1680
Ser Leu Met Ala Ile Thr Ile Ile Ser Val Met Gln Gln Glu Thr
1685 1690 1695
Gly Ile Glu Leu Pro Gly Thr Phe Phe Leu Asp Asn Ser Thr Thr
1700 1705 1710
Thr Ala Val Ile Ala Ala Val Gly
1715 1720
<210> 11
<211> 1149
<212> DNA
<213> Metarhizium rileyi
<220>
<221> CDS
<222> (1)..(1149)
<400> 11
atg gct gtc act gtg tgg caa gat gcg ctc gag atc atc gct cag gag 48
Met Ala Val Thr Val Trp Gln Asp Ala Leu Glu Ile Ile Ala Gln Glu
1 5 10 15
agc ggg ctg gaa ccc gca gag atc atc gag acg gac gac atg gag ttc 96
Ser Gly Leu Glu Pro Ala Glu Ile Ile Glu Thr Asp Asp Met Glu Phe
20 25 30
gcc aga ctt ggc atc aat cat att ctc gcc acg gcc atc ttg tcg cac 144
Ala Arg Leu Gly Ile Asn His Ile Leu Ala Thr Ala Ile Leu Ser His
35 40 45
ctc aga ggg cct cgc gga gag cct ctc cca cga gac att ttt gat cag 192
Leu Arg Gly Pro Arg Gly Glu Pro Leu Pro Arg Asp Ile Phe Asp Gln
50 55 60
aag cgc aca gtt gga gct ttc cgg cgt ttc tac gag acg tct att cac 240
Lys Arg Thr Val Gly Ala Phe Arg Arg Phe Tyr Glu Thr Ser Ile His
65 70 75 80
ctt gag act tct ccc atc acc ccc atc ctc gca ccc aag cga gct cag 288
Leu Glu Thr Ser Pro Ile Thr Pro Ile Leu Ala Pro Lys Arg Ala Gln
85 90 95
ctg aag cgt gag aag tcg ttt act gtt ccg ctc tcc atc gtc ttg cag 336
Leu Lys Arg Glu Lys Ser Phe Thr Val Pro Leu Ser Ile Val Leu Gln
100 105 110
aat agc ccg gct tcg agc cgg cac acc gta ttc ctc ctc cca gac ggc 384
Asn Ser Pro Ala Ser Ser Arg His Thr Val Phe Leu Leu Pro Asp Gly
115 120 125
agc ggc tct gcc atg gcg tac gca aac ctg cca cca gtc cac cca acc 432
Ser Gly Ser Ala Met Ala Tyr Ala Asn Leu Pro Pro Val His Pro Thr
130 135 140
gtc tgt gtc gtt ggg atg aac agt ccc tac ctc cgt gac gcc aac tca 480
Val Cys Val Val Gly Met Asn Ser Pro Tyr Leu Arg Asp Ala Asn Ser
145 150 155 160
tat cgc tgc tct gtc gag aat ctg gcg tcg caa tgg gtc cag gaa atc 528
Tyr Arg Cys Ser Val Glu Asn Leu Ala Ser Gln Trp Val Gln Glu Ile
165 170 175
tat cgc cgc cag cca cgc gga cct tat atc gtc ggt gga tgg tcg gcg 576
Tyr Arg Arg Gln Pro Arg Gly Pro Tyr Ile Val Gly Gly Trp Ser Ala
180 185 190
gga ggt tac tac tcg tac gaa gtg gcc caa cgc ctc ctg caa gat ggt 624
Gly Gly Tyr Tyr Ser Tyr Glu Val Ala Gln Arg Leu Leu Gln Asp Gly
195 200 205
cac gtc gtg gac aag ctg att ctg ata gac tcg cct tgc cgc act gtc 672
His Val Val Asp Lys Leu Ile Leu Ile Asp Ser Pro Cys Arg Thr Val
210 215 220
ttc gag tct ctc tcg atg gaa gtc gtc aac tat ctc tca aag cat aac 720
Phe Glu Ser Leu Ser Met Glu Val Val Asn Tyr Leu Ser Lys His Asn
225 230 235 240
cta atg ggc aac tgg ggc tcc caa gga ctt ccg gac tgg cta gtc cag 768
Leu Met Gly Asn Trp Gly Ser Gln Gly Leu Pro Asp Trp Leu Val Gln
245 250 255
cat ttc cgc tcc acg ctc gcc gcc gtg ggc aag tat cgt cca agg cca 816
His Phe Arg Ser Thr Leu Ala Ala Val Gly Lys Tyr Arg Pro Arg Pro
260 265 270
ctg cat tcg gtt ggg gaa atg gag acg tac atc atc tgg agt cgc gat 864
Leu His Ser Val Gly Glu Met Glu Thr Tyr Ile Ile Trp Ser Arg Asp
275 280 285
ggt gtg ctg gaa cac gat gct ttg gtc gag tct ggt ctc gac atg agc 912
Gly Val Leu Glu His Asp Ala Leu Val Glu Ser Gly Leu Asp Met Ser
290 295 300
atc aag gta tcc agg ttt ctg ctc gaa ggc aag gac gat ctg gga ccc 960
Ile Lys Val Ser Arg Phe Leu Leu Glu Gly Lys Asp Asp Leu Gly Pro
305 310 315 320
aac gga tgg gat gag ctg ctg ccc agc aag gat att gcg att gcc act 1008
Asn Gly Trp Asp Glu Leu Leu Pro Ser Lys Asp Ile Ala Ile Ala Thr
325 330 335
cag tcg ggg acg cat ttc acc atg atc aac aag cct cac gtg gca cag 1056
Gln Ser Gly Thr His Phe Thr Met Ile Asn Lys Pro His Val Ala Gln
340 345 350
atg agc gat ctt tta cgc gat gcg gtg act ggc atc act acc gac aga 1104
Met Ser Asp Leu Leu Arg Asp Ala Val Thr Gly Ile Thr Thr Asp Arg
355 360 365
cta tcg cag tgg cag aga gta aga aag gac gag cag gga aag tag 1149
Leu Ser Gln Trp Gln Arg Val Arg Lys Asp Glu Gln Gly Lys
370 375 380
<210> 12
<211> 382
<212> PRT
<213> Metarhizium rileyi
<400> 12
Met Ala Val Thr Val Trp Gln Asp Ala Leu Glu Ile Ile Ala Gln Glu
1 5 10 15
Ser Gly Leu Glu Pro Ala Glu Ile Ile Glu Thr Asp Asp Met Glu Phe
20 25 30
Ala Arg Leu Gly Ile Asn His Ile Leu Ala Thr Ala Ile Leu Ser His
35 40 45
Leu Arg Gly Pro Arg Gly Glu Pro Leu Pro Arg Asp Ile Phe Asp Gln
50 55 60
Lys Arg Thr Val Gly Ala Phe Arg Arg Phe Tyr Glu Thr Ser Ile His
65 70 75 80
Leu Glu Thr Ser Pro Ile Thr Pro Ile Leu Ala Pro Lys Arg Ala Gln
85 90 95
Leu Lys Arg Glu Lys Ser Phe Thr Val Pro Leu Ser Ile Val Leu Gln
100 105 110
Asn Ser Pro Ala Ser Ser Arg His Thr Val Phe Leu Leu Pro Asp Gly
115 120 125
Ser Gly Ser Ala Met Ala Tyr Ala Asn Leu Pro Pro Val His Pro Thr
130 135 140
Val Cys Val Val Gly Met Asn Ser Pro Tyr Leu Arg Asp Ala Asn Ser
145 150 155 160
Tyr Arg Cys Ser Val Glu Asn Leu Ala Ser Gln Trp Val Gln Glu Ile
165 170 175
Tyr Arg Arg Gln Pro Arg Gly Pro Tyr Ile Val Gly Gly Trp Ser Ala
180 185 190
Gly Gly Tyr Tyr Ser Tyr Glu Val Ala Gln Arg Leu Leu Gln Asp Gly
195 200 205
His Val Val Asp Lys Leu Ile Leu Ile Asp Ser Pro Cys Arg Thr Val
210 215 220
Phe Glu Ser Leu Ser Met Glu Val Val Asn Tyr Leu Ser Lys His Asn
225 230 235 240
Leu Met Gly Asn Trp Gly Ser Gln Gly Leu Pro Asp Trp Leu Val Gln
245 250 255
His Phe Arg Ser Thr Leu Ala Ala Val Gly Lys Tyr Arg Pro Arg Pro
260 265 270
Leu His Ser Val Gly Glu Met Glu Thr Tyr Ile Ile Trp Ser Arg Asp
275 280 285
Gly Val Leu Glu His Asp Ala Leu Val Glu Ser Gly Leu Asp Met Ser
290 295 300
Ile Lys Val Ser Arg Phe Leu Leu Glu Gly Lys Asp Asp Leu Gly Pro
305 310 315 320
Asn Gly Trp Asp Glu Leu Leu Pro Ser Lys Asp Ile Ala Ile Ala Thr
325 330 335
Gln Ser Gly Thr His Phe Thr Met Ile Asn Lys Pro His Val Ala Gln
340 345 350
Met Ser Asp Leu Leu Arg Asp Ala Val Thr Gly Ile Thr Thr Asp Arg
355 360 365
Leu Ser Gln Trp Gln Arg Val Arg Lys Asp Glu Gln Gly Lys
370 375 380
<210> 13
<211> 7524
<212> DNA
<213> Talaromyces islandicus
<220>
<221> CDS
<222> (1)..(7524)
<400> 13
atg gcg aca acg aat gaa gtc cgg tgg gct caa gat att gcc att gtt 48
Met Ala Thr Thr Asn Glu Val Arg Trp Ala Gln Asp Ile Ala Ile Val
1 5 10 15
ggc atg tcc tgc cga ttc gcc gat gac gcg gat tca ttc cct cgg ttc 96
Gly Met Ser Cys Arg Phe Ala Asp Asp Ala Asp Ser Phe Pro Arg Phe
20 25 30
tgg gat ttc att tgc aat gga aga tat gcg ttc cac tac cct gga aaa 144
Trp Asp Phe Ile Cys Asn Gly Arg Tyr Ala Phe His Tyr Pro Gly Lys
35 40 45
aaa aca aac aca agt ttg cct cgc ggt gca cat ttc ttc aaa gat gac 192
Lys Thr Asn Thr Ser Leu Pro Arg Gly Ala His Phe Phe Lys Asp Asp
50 55 60
atc gca gag ttc gat gcc aat ttc ttc aac atc tcc aaa gtc gag gcc 240
Ile Ala Glu Phe Asp Ala Asn Phe Phe Asn Ile Ser Lys Val Glu Ala
65 70 75 80
gaa tcg att gat ccg caa cag cgc atg gtg atg gaa aca acg ttc gaa 288
Glu Ser Ile Asp Pro Gln Gln Arg Met Val Met Glu Thr Thr Phe Glu
85 90 95
gcc cta gaa aat gct gga att act ata gac aaa gtg gca gga acc cgc 336
Ala Leu Glu Asn Ala Gly Ile Thr Ile Asp Lys Val Ala Gly Thr Arg
100 105 110
gct ggt gtc tgg atg gcc aat ttt act agc gat tat cgt gag atg cta 384
Ala Gly Val Trp Met Ala Asn Phe Thr Ser Asp Tyr Arg Glu Met Leu
115 120 125
tac cga gat tca gag aca gca ccg atg tat acc ctg tca ggc gcc agc 432
Tyr Arg Asp Ser Glu Thr Ala Pro Met Tyr Thr Leu Ser Gly Ala Ser
130 135 140
aac aca tcc acg tca aac cgt gta tca tgg ttc ttt gat ctc aaa ggc 480
Asn Thr Ser Thr Ser Asn Arg Val Ser Trp Phe Phe Asp Leu Lys Gly
145 150 155 160
cca agc ttt acc ttg aac act gca tgc tct tca agt atg gtg gct acc 528
Pro Ser Phe Thr Leu Asn Thr Ala Cys Ser Ser Ser Met Val Ala Thr
165 170 175
cat cta gct tgc cag agc ctt gct ctg ggt gaa tcc agc agt gcg ata 576
His Leu Ala Cys Gln Ser Leu Ala Leu Gly Glu Ser Ser Ser Ala Ile
180 185 190
gtt ggc ggg aca agt ctc ctc ttg aat cca gac cta ttc ctc ttt ttg 624
Val Gly Gly Thr Ser Leu Leu Leu Asn Pro Asp Leu Phe Leu Phe Leu
195 200 205
tcg aat cag cat ttc tta gca gct gat ggt aaa tct aaa gcc ttt gat 672
Ser Asn Gln His Phe Leu Ala Ala Asp Gly Lys Ser Lys Ala Phe Asp
210 215 220
gcc agt ggt gat gga tac ggc cgg ggt gaa ggc gtt gct gtt gtt gtc 720
Ala Ser Gly Asp Gly Tyr Gly Arg Gly Glu Gly Val Ala Val Val Val
225 230 235 240
tta aag cgt gtt gcg gac gcc atc gct gat ggt gat ccc att cga gca 768
Leu Lys Arg Val Ala Asp Ala Ile Ala Asp Gly Asp Pro Ile Arg Ala
245 250 255
gtg atc cgt ggg act gcc atc aat caa gat gga agg aca aag gga atg 816
Val Ile Arg Gly Thr Ala Ile Asn Gln Asp Gly Arg Thr Lys Gly Met
260 265 270
aca tta cct agt gta gat gct caa gaa caa ttg atc aag gat gcc tat 864
Thr Leu Pro Ser Val Asp Ala Gln Glu Gln Leu Ile Lys Asp Ala Tyr
275 280 285
cgc aat gca gga ctg tcc atg aag gac act cga tat gtc gaa gct cac 912
Arg Asn Ala Gly Leu Ser Met Lys Asp Thr Arg Tyr Val Glu Ala His
290 295 300
gga aca gga act caa gct ggt gac aag tgt gag acg gag gca tta tct 960
Gly Thr Gly Thr Gln Ala Gly Asp Lys Cys Glu Thr Glu Ala Leu Ser
305 310 315 320
cga act ttt agc cca tac cgt act gca tcc gaa cga ctc att ctt ggg 1008
Arg Thr Phe Ser Pro Tyr Arg Thr Ala Ser Glu Arg Leu Ile Leu Gly
325 330 335
tct gtc aag acc aac att ggg cat ttg gag gca tgt gcc ggt tta gcg 1056
Ser Val Lys Thr Asn Ile Gly His Leu Glu Ala Cys Ala Gly Leu Ala
340 345 350
tcc atg ata aaa tgc gtt ggt att ctt gaa gcc gga gtg att cct cca 1104
Ser Met Ile Lys Cys Val Gly Ile Leu Glu Ala Gly Val Ile Pro Pro
355 360 365
aat cca tta tac aaa aaa ggt aac ccg gga ata aaa ttc gac gac tgg 1152
Asn Pro Leu Tyr Lys Lys Gly Asn Pro Gly Ile Lys Phe Asp Asp Trp
370 375 380
aaa ctc cat gta cct act agc tca ata caa tgg ccg acc agt ggc ctg 1200
Lys Leu His Val Pro Thr Ser Ser Ile Gln Trp Pro Thr Ser Gly Leu
385 390 395 400
cgg cgc atc agc acc caa gga ttt ggg tat gga gga acc aat gcg cat 1248
Arg Arg Ile Ser Thr Gln Gly Phe Gly Tyr Gly Gly Thr Asn Ala His
405 410 415
atc atc atg gac gac gct cac aac tat ctg gta tct cgt gac ata act 1296
Ile Ile Met Asp Asp Ala His Asn Tyr Leu Val Ser Arg Asp Ile Thr
420 425 430
gcg ata cac aat aca tgc ctg ctc aat ctg aca aat gga acc act tat 1344
Ala Ile His Asn Thr Cys Leu Leu Asn Leu Thr Asn Gly Thr Thr Tyr
435 440 445
ata gag cat aaa gag gct cct cgg cca agg att ttc cat ttt agt gcc 1392
Ile Glu His Lys Glu Ala Pro Arg Pro Arg Ile Phe His Phe Ser Ala
450 455 460
cag gac aag gac ggg cta ggg agg gta cga gac gcc act tgc cag tat 1440
Gln Asp Lys Asp Gly Leu Gly Arg Val Arg Asp Ala Thr Cys Gln Tyr
465 470 475 480
ctc aag tca ggt gca tta gag gct ggg aaa atg cgc cag aat gaa gat 1488
Leu Lys Ser Gly Ala Leu Glu Ala Gly Lys Met Arg Gln Asn Glu Asp
485 490 495
aaa tac ctt aga gat cta gct tat aca ctg tca gag aga cgt tct cgg 1536
Lys Tyr Leu Arg Asp Leu Ala Tyr Thr Leu Ser Glu Arg Arg Ser Arg
500 505 510
ttg caa tgg cag aca ttt gcg gtg gcc tca tct gtc gaa gga ttg att 1584
Leu Gln Trp Gln Thr Phe Ala Val Ala Ser Ser Val Glu Gly Leu Ile
515 520 525
gaa aca tta cag acc aag cca tgg gcc agt cca gag aca cgc tca gcg 1632
Glu Thr Leu Gln Thr Lys Pro Trp Ala Ser Pro Glu Thr Arg Ser Ala
530 535 540
tca aaa gta cct cgc ata ggc ttc ata ttt act ggt caa ggg gct cag 1680
Ser Lys Val Pro Arg Ile Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln
545 550 555 560
tgg cca cgg atg gga atc gag ctg atg gaa tat gac att ttc cga aaa 1728
Trp Pro Arg Met Gly Ile Glu Leu Met Glu Tyr Asp Ile Phe Arg Lys
565 570 575
agc gtg gaa aga tca gat gtt tac ttg cgc gag gga ttg gac tgc tcc 1776
Ser Val Glu Arg Ser Asp Val Tyr Leu Arg Glu Gly Leu Asp Cys Ser
580 585 590
tgg tct gcc atc gaa gaa ctt gct aaa cct gat tcc tcg tct aac ctg 1824
Trp Ser Ala Ile Glu Glu Leu Ala Lys Pro Asp Ser Ser Ser Asn Leu
595 600 605
ggc gca gcg gaa tac agc caa gca ctc tgt tcc gtt ctt cag att gcc 1872
Gly Ala Ala Glu Tyr Ser Gln Ala Leu Cys Ser Val Leu Gln Ile Ala
610 615 620
cta ata gac ctg ctc gat agc tgg aac atc aga cca agc gca gta gcc 1920
Leu Ile Asp Leu Leu Asp Ser Trp Asn Ile Arg Pro Ser Ala Val Ala
625 630 635 640
ggc cat tct agt gga gaa ata gcg gcg gcc tac tgc ctt ggg gtt ctc 1968
Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Val Leu
645 650 655
tct tgg gag gat gcc cta aaa gta gct tac ttt cga ggg tcg cta tcg 2016
Ser Trp Glu Asp Ala Leu Lys Val Ala Tyr Phe Arg Gly Ser Leu Ser
660 665 670
gca gag atg aag gga aat gac agc tcg ctc aat gga gca atg atg gct 2064
Ala Glu Met Lys Gly Asn Asp Ser Ser Leu Asn Gly Ala Met Met Ala
675 680 685
gtc ggc tct tca cca gcg gat att gaa aag tgg ctc gac aaa gtt act 2112
Val Gly Ser Ser Pro Ala Asp Ile Glu Lys Trp Leu Asp Lys Val Thr
690 695 700
gca ggg gag gtt gta gtt gca tgc gtg aac tcc cct gcc agc att act 2160
Ala Gly Glu Val Val Val Ala Cys Val Asn Ser Pro Ala Ser Ile Thr
705 710 715 720
ttg tct ggt gat gct gcc ggt atc aac gaa ttg gag tcc atg ttg aaa 2208
Leu Ser Gly Asp Ala Ala Gly Ile Asn Glu Leu Glu Ser Met Leu Lys
725 730 735
gaa gca ggg ata ttt gca agg aaa cta aag gtg gac acg gca tac cac 2256
Glu Ala Gly Ile Phe Ala Arg Lys Leu Lys Val Asp Thr Ala Tyr His
740 745 750
tct cca cat atg cag acc att gcc ggc caa tac ttt gaa gcc att gcc 2304
Ser Pro His Met Gln Thr Ile Ala Gly Gln Tyr Phe Glu Ala Ile Ala
755 760 765
gac att tct ata tta ccg gtg agg aat ggg tgc caa atg cat tct agc 2352
Asp Ile Ser Ile Leu Pro Val Arg Asn Gly Cys Gln Met His Ser Ser
770 775 780
gtg cga ggt ggc tac att gat ccg aat gaa ctc ggt gcc gcg aat tgg 2400
Val Arg Gly Gly Tyr Ile Asp Pro Asn Glu Leu Gly Ala Ala Asn Trp
785 790 795 800
gta cgg aat ttg gta tcg act gtt cag ttt gct gat gct gtt cac gat 2448
Val Arg Asn Leu Val Ser Thr Val Gln Phe Ala Asp Ala Val His Asp
805 810 815
ctt ctt cga cca tta gtt tat ggt gag cgt gca gcg cac aat gct gtg 2496
Leu Leu Arg Pro Leu Val Tyr Gly Glu Arg Ala Ala His Asn Ala Val
820 825 830
gac att ctg gtt gaa gtc ggg ccg cat tct gct tta cag gga ccg gta 2544
Asp Ile Leu Val Glu Val Gly Pro His Ser Ala Leu Gln Gly Pro Val
835 840 845
aac cag aca atg aag gcc cat gga atc aat agt atc aat tat tgt aca 2592
Asn Gln Thr Met Lys Ala His Gly Ile Asn Ser Ile Asn Tyr Cys Thr
850 855 860
atg ctc tca cgt ggg aaa aat gcc atc aat acg gct cta tca tgt gcc 2640
Met Leu Ser Arg Gly Lys Asn Ala Ile Asn Thr Ala Leu Ser Cys Ala
865 870 875 880
gcc act ttg tat gtg gaa ggc ctc gca gtc gat ctt cgc agg gcc aac 2688
Ala Thr Leu Tyr Val Glu Gly Leu Ala Val Asp Leu Arg Arg Ala Asn
885 890 895
cag gat gaa agc ttt gcg gtt gag cct atc ttc gat atg cct tcg tac 2736
Gln Asp Glu Ser Phe Ala Val Glu Pro Ile Phe Asp Met Pro Ser Tyr
900 905 910
cct tgg aac cac tca att cga tat tgg gcc gaa tct cgt gtg gaa aag 2784
Pro Trp Asn His Ser Ile Arg Tyr Trp Ala Glu Ser Arg Val Glu Lys
915 920 925
gaa tat cga cag cgg aag tat ccc cgt aca cct tta ctc ggt gct cct 2832
Glu Tyr Arg Gln Arg Lys Tyr Pro Arg Thr Pro Leu Leu Gly Ala Pro
930 935 940
tgt ccg tct atg aat gcg ggt gag aag gtc tgg aga ggc ttt att cga 2880
Cys Pro Ser Met Asn Ala Gly Glu Lys Val Trp Arg Gly Phe Ile Arg
945 950 955 960
cct agt gag gag ccg tgg gtt cgc gat cat gtt att caa ggc tcc att 2928
Pro Ser Glu Glu Pro Trp Val Arg Asp His Val Ile Gln Gly Ser Ile
965 970 975
tta tat cca gct gcc gga ttc tta gca atg gcc att gaa gct gca agg 2976
Leu Tyr Pro Ala Ala Gly Phe Leu Ala Met Ala Ile Glu Ala Ala Arg
980 985 990
cag ggg act gag acg gga agg tca att gac ggt ttc aga ctt cgt gat 3024
Gln Gly Thr Glu Thr Gly Arg Ser Ile Asp Gly Phe Arg Leu Arg Asp
995 1000 1005
gtc cag att aat gct gcc ctg gtt att gag gaa aat gtc gaa cca 3069
Val Gln Ile Asn Ala Ala Leu Val Ile Glu Glu Asn Val Glu Pro
1010 1015 1020
gaa gtg ata ttg agg ttg cag cca cac aga atg ggc acc ctg gat 3114
Glu Val Ile Leu Arg Leu Gln Pro His Arg Met Gly Thr Leu Asp
1025 1030 1035
gcg ggt tca gta tcc tgg cag gaa ttc act gtt tca tct tca aca 3159
Ala Gly Ser Val Ser Trp Gln Glu Phe Thr Val Ser Ser Ser Thr
1040 1045 1050
gat gga aca gat cta cga caa aat tgt tca gga ctg ctt gcc atc 3204
Asp Gly Thr Asp Leu Arg Gln Asn Cys Ser Gly Leu Leu Ala Ile
1055 1060 1065
gat tat gaa ccc gct gag gga tct tct atg cac atc gag aaa atc 3249
Asp Tyr Glu Pro Ala Glu Gly Ser Ser Met His Ile Glu Lys Ile
1070 1075 1080
aag gag gtc gag act atc aaa gga aaa ttg gtc aag gcg aag gaa 3294
Lys Glu Val Glu Thr Ile Lys Gly Lys Leu Val Lys Ala Lys Glu
1085 1090 1095
cag tgt aga gct gct atc aat gtc gat gaa ttt tat gcc cat ctt 3339
Gln Cys Arg Ala Ala Ile Asn Val Asp Glu Phe Tyr Ala His Leu
1100 1105 1110
gac acc gtt ggc cta aca tat ggc gag act ttc gct aac ctg acc 3384
Asp Thr Val Gly Leu Thr Tyr Gly Glu Thr Phe Ala Asn Leu Thr
1115 1120 1125
gag gtt cac acc aat gca gca aca gga gaa tgt aca ggt cgt ttg 3429
Glu Val His Thr Asn Ala Ala Thr Gly Glu Cys Thr Gly Arg Leu
1130 1135 1140
ctc gta cct gat gtt gag tca gcc atc cct ccg cat atg agg gaa 3474
Leu Val Pro Asp Val Glu Ser Ala Ile Pro Pro His Met Arg Glu
1145 1150 1155
cgg cca cac atc ata cac cca aca acc tta gat gcc att ttt cac 3519
Arg Pro His Ile Ile His Pro Thr Thr Leu Asp Ala Ile Phe His
1160 1165 1170
tta gca ttt gct gca atc agc gaa cat cca ttc tca ctc aag agt 3564
Leu Ala Phe Ala Ala Ile Ser Glu His Pro Phe Ser Leu Lys Ser
1175 1180 1185
gcc atg gtt cct att tcg ata aca gag gta gtc att tca aac gaa 3609
Ala Met Val Pro Ile Ser Ile Thr Glu Val Val Ile Ser Asn Glu
1190 1195 1200
gtg ccc cac aga aag gga tcc cag ctc gaa gga ttc gct cag tct 3654
Val Pro His Arg Lys Gly Ser Gln Leu Glu Gly Phe Ala Gln Ser
1205 1210 1215
tct cgg ttt gga ttt cga gaa ttg gtc acc aat atc aac att ttt 3699
Ser Arg Phe Gly Phe Arg Glu Leu Val Thr Asn Ile Asn Ile Phe
1220 1225 1230
gac gag caa ctc aca gat gcc gtt gtc aag atc agc gga ttt aga 3744
Asp Glu Gln Leu Thr Asp Ala Val Val Lys Ile Ser Gly Phe Arg
1235 1240 1245
tgt gca gat gtg tct ggt tca agc caa agt acg agc agc ggt gag 3789
Cys Ala Asp Val Ser Gly Ser Ser Gln Ser Thr Ser Ser Gly Glu
1250 1255 1260
gca gcc aag cca att acg ttt aaa gaa atc cat cga cct gct ctg 3834
Ala Ala Lys Pro Ile Thr Phe Lys Glu Ile His Arg Pro Ala Leu
1265 1270 1275
gag ctt ctt gac tat gag gat ctc caa aga gct gtc aac gca aat 3879
Glu Leu Leu Asp Tyr Glu Asp Leu Gln Arg Ala Val Asn Ala Asn
1280 1285 1290
gcg gac gaa att gct agt gga ata ttt gaa cag gat acc tct ctc 3924
Ala Asp Glu Ile Ala Ser Gly Ile Phe Glu Gln Asp Thr Ser Leu
1295 1300 1305
gac aaa tcc gcc ctc gcc att gtt aag cgg aca ctg tct aac gtt 3969
Asp Lys Ser Ala Leu Ala Ile Val Lys Arg Thr Leu Ser Asn Val
1310 1315 1320
cca cgg tca tct gta cat aaa gat ttg ctc ggt ttc tac gat tgg 4014
Pro Arg Ser Ser Val His Lys Asp Leu Leu Gly Phe Tyr Asp Trp
1325 1330 1335
atg cag agg caa gtt tca tcg gca gac aaa gca tca ggt gct ggt 4059
Met Gln Arg Gln Val Ser Ser Ala Asp Lys Ala Ser Gly Ala Gly
1340 1345 1350
caa aga gac agc acg ggc tat aca aat ata tct gtg aag gac cta 4104
Gln Arg Asp Ser Thr Gly Tyr Thr Asn Ile Ser Val Lys Asp Leu
1355 1360 1365
gaa ggt att ctg tct ggt gaa aaa att gct gca cag gcc atg gat 4149
Glu Gly Ile Leu Ser Gly Glu Lys Ile Ala Ala Gln Ala Met Asp
1370 1375 1380
gag aac gtc att ctt atg cct gct ctc act agc tct gcg aac ttc 4194
Glu Asn Val Ile Leu Met Pro Ala Leu Thr Ser Ser Ala Asn Phe
1385 1390 1395
caa caa ata atg aaa aaa ttg agc cag tat tta ctt att ctg cag 4239
Gln Gln Ile Met Lys Lys Leu Ser Gln Tyr Leu Leu Ile Leu Gln
1400 1405 1410
cac aca tac cca gaa ctc tcc gtt ctc gag atc att cat tcg gcg 4284
His Thr Tyr Pro Glu Leu Ser Val Leu Glu Ile Ile His Ser Ala
1415 1420 1425
gaa aat tca act act gga tct att tta ccc cag ttg caa tct gct 4329
Glu Asn Ser Thr Thr Gly Ser Ile Leu Pro Gln Leu Gln Ser Ala
1430 1435 1440
gaa gtt att ctt gat aca agc aaa tac act gtg ctt gtg caa aat 4374
Glu Val Ile Leu Asp Thr Ser Lys Tyr Thr Val Leu Val Gln Asn
1445 1450 1455
gag aag gct gcc aaa aca gtg gaa agc cag cta ggt acc ctg acg 4419
Glu Lys Ala Ala Lys Thr Val Glu Ser Gln Leu Gly Thr Leu Thr
1460 1465 1470
gat ctt ata tcg ctt gaa gtg agc gcc aca gac aat agt gta caa 4464
Asp Leu Ile Ser Leu Glu Val Ser Ala Thr Asp Asn Ser Val Gln
1475 1480 1485
gac cat gga cgc cag tat gat ctt gct ctt gtg gta aac att gct 4509
Asp His Gly Arg Gln Tyr Asp Leu Ala Leu Val Val Asn Ile Ala
1490 1495 1500
cat aaa gac cct gat gta ctt ctc tgc gaa gca aaa tca tcc ctg 4554
His Lys Asp Pro Asp Val Leu Leu Cys Glu Ala Lys Ser Ser Leu
1505 1510 1515
aaa gaa ggg ggc cgt gtt tgc att atc gaa ata ggc gag cct ctc 4599
Lys Glu Gly Gly Arg Val Cys Ile Ile Glu Ile Gly Glu Pro Leu
1520 1525 1530
ttg aat ctt gga ata ggg ttg gcc gct tta cag cac act cat ttc 4644
Leu Asn Leu Gly Ile Gly Leu Ala Ala Leu Gln His Thr His Phe
1535 1540 1545
att att agt agc caa aac aca gac gag tct cac ttg aat cgt gct 4689
Ile Ile Ser Ser Gln Asn Thr Asp Glu Ser His Leu Asn Arg Ala
1550 1555 1560
ggg ttt acg aaa gag ctt ctt ctt gga gat gcc tta cca ccc aag 4734
Gly Phe Thr Lys Glu Leu Leu Leu Gly Asp Ala Leu Pro Pro Lys
1565 1570 1575
aac gag ttc cgg ctc ata gcc gga aat aca tcg aag cga tta gca 4779
Asn Glu Phe Arg Leu Ile Ala Gly Asn Thr Ser Lys Arg Leu Ala
1580 1585 1590
gtt act att caa gga gag ata gtc att gta cag gcg cct gag ccg 4824
Val Thr Ile Gln Gly Glu Ile Val Ile Val Gln Ala Pro Glu Pro
1595 1600 1605
tca aaa tct gct caa aat gtt gct gat gcc ctt act gaa gtg ctt 4869
Ser Lys Ser Ala Gln Asn Val Ala Asp Ala Leu Thr Glu Val Leu
1610 1615 1620
gag aaa caa tgt gtg cgc gcc att cgt gtt gat tgg agc tta ccc 4914
Glu Lys Gln Cys Val Arg Ala Ile Arg Val Asp Trp Ser Leu Pro
1625 1630 1635
gag tat att tcg gtc ata gaa ggc aag gaa tgt atc gtc ttg gct 4959
Glu Tyr Ile Ser Val Ile Glu Gly Lys Glu Cys Ile Val Leu Ala
1640 1645 1650
gat ctg gag aag tca cac cta cta gaa gca tct cag gag gaa ttc 5004
Asp Leu Glu Lys Ser His Leu Leu Glu Ala Ser Gln Glu Glu Phe
1655 1660 1665
cca ata ata caa cag acc atc ctg aag gct gga ggc atc ctt tgg 5049
Pro Ile Ile Gln Gln Thr Ile Leu Lys Ala Gly Gly Ile Leu Trp
1670 1675 1680
gtt agt ggc tct atc gga cca gac gcg gca tta gtc act gga ttg 5094
Val Ser Gly Ser Ile Gly Pro Asp Ala Ala Leu Val Thr Gly Leu
1685 1690 1695
gct cga aca att cgc aac gag ata cca ggc agc aag ctg cga gtt 5139
Ala Arg Thr Ile Arg Asn Glu Ile Pro Gly Ser Lys Leu Arg Val
1700 1705 1710
ctt cag aca aat gag ctc tcg tta gct tca ccg acc acg tgg tca 5184
Leu Gln Thr Asn Glu Leu Ser Leu Ala Ser Pro Thr Thr Trp Ser
1715 1720 1725
aat tat att ttg cga ttg cta caa tca cca acg cta gat agt gag 5229
Asn Tyr Ile Leu Arg Leu Leu Gln Ser Pro Thr Leu Asp Ser Glu
1730 1735 1740
ttc acc atc aaa gat ggt ttt ctc caa atc agt cgc gtc gta gaa 5274
Phe Thr Ile Lys Asp Gly Phe Leu Gln Ile Ser Arg Val Val Glu
1745 1750 1755
tat tac act cga aac gac gct ttg gcg gtt tct ctc ggg cgg cag 5319
Tyr Tyr Thr Arg Asn Asp Ala Leu Ala Val Ser Leu Gly Arg Gln
1760 1765 1770
gag cct aaa acg gtg cat atg cct ctt agt gaa act tca agc cca 5364
Glu Pro Lys Thr Val His Met Pro Leu Ser Glu Thr Ser Ser Pro
1775 1780 1785
gtc aaa ctg tgt atc aag aat cct ggg atg ctt gat tca cta tat 5409
Val Lys Leu Cys Ile Lys Asn Pro Gly Met Leu Asp Ser Leu Tyr
1790 1795 1800
ttt gaa ccg gat gat atc ctt aat agt cct cta gcc tcc ggg caa 5454
Phe Glu Pro Asp Asp Ile Leu Asn Ser Pro Leu Ala Ser Gly Gln
1805 1810 1815
gtc gaa ata gaa gtg aaa gca tcg ggt gtc aat ttc cgc gat gtc 5499
Val Glu Ile Glu Val Lys Ala Ser Gly Val Asn Phe Arg Asp Val
1820 1825 1830
atg gtt tgt atg ggt cag att cca gat agt ttg cta ggc ttc gag 5544
Met Val Cys Met Gly Gln Ile Pro Asp Ser Leu Leu Gly Phe Glu
1835 1840 1845
gca gct gga ata gtt cgt cga gtt ggt gag aat gtt caa aac atc 5589
Ala Ala Gly Ile Val Arg Arg Val Gly Glu Asn Val Gln Asn Ile
1850 1855 1860
aaa gca ggt gat cga gtt tgt ttt atc gca cac ggt tct cat cga 5634
Lys Ala Gly Asp Arg Val Cys Phe Ile Ala His Gly Ser His Arg
1865 1870 1875
act gtc cat cgt gtg aga aat gag tat gtg gta cac atc cca gat 5679
Thr Val His Arg Val Arg Asn Glu Tyr Val Val His Ile Pro Asp
1880 1885 1890
gaa atg tcc ttc gca gag gct tct ggc gtg ctt ctt gtt cat ggc 5724
Glu Met Ser Phe Ala Glu Ala Ser Gly Val Leu Leu Val His Gly
1895 1900 1905
acg gcg tgg tat ggt ctg gtc aag att gcc cag atc aaa gca ggg 5769
Thr Ala Trp Tyr Gly Leu Val Lys Ile Ala Gln Ile Lys Ala Gly
1910 1915 1920
caa acg att ctc atc cat gcc gct gcg ggt ggt gtt gga caa gca 5814
Gln Thr Ile Leu Ile His Ala Ala Ala Gly Gly Val Gly Gln Ala
1925 1930 1935
gca gtg atg ttg gcc cag cat ttt ggt ctc gag ata ttt gca aca 5859
Ala Val Met Leu Ala Gln His Phe Gly Leu Glu Ile Phe Ala Thr
1940 1945 1950
gtt ggc tcc gat gac aaa agg caa ctc atc cag gac ctt tat aag 5904
Val Gly Ser Asp Asp Lys Arg Gln Leu Ile Gln Asp Leu Tyr Lys
1955 1960 1965
atc cca gaa gac cac att ttc aat tct cgt gac ctg agt ttt gcc 5949
Ile Pro Glu Asp His Ile Phe Asn Ser Arg Asp Leu Ser Phe Ala
1970 1975 1980
aag gga gtg ctg cgt atg aca aat ggt cgt ggt gtg gat gtt atc 5994
Lys Gly Val Leu Arg Met Thr Asn Gly Arg Gly Val Asp Val Ile
1985 1990 1995
ctt aat tct cta tct ggg gag act ctt cgc caa aca tgg cac tgc 6039
Leu Asn Ser Leu Ser Gly Glu Thr Leu Arg Gln Thr Trp His Cys
2000 2005 2010
gtc gct cca ttt gga aca ttc atc gaa atc ggt att aaa gat atc 6084
Val Ala Pro Phe Gly Thr Phe Ile Glu Ile Gly Ile Lys Asp Ile
2015 2020 2025
ctc agc aat acc cga cta gac atg cgc cct ttc ctt caa gat gcc 6129
Leu Ser Asn Thr Arg Leu Asp Met Arg Pro Phe Leu Gln Asp Ala
2030 2035 2040
cga ttt gcc ttt ttt aat ttg aac cgt atc gag aac gag cga cca 6174
Arg Phe Ala Phe Phe Asn Leu Asn Arg Ile Glu Asn Glu Arg Pro
2045 2050 2055
gac ttg atg agc gag gca tta aat gaa agt atg gct ttc atc agc 6219
Asp Leu Met Ser Glu Ala Leu Asn Glu Ser Met Ala Phe Ile Ser
2060 2065 2070
tcg ggt gct aca cga cct gtt tca ccc ctg atg aac ttc cct gtc 6264
Ser Gly Ala Thr Arg Pro Val Ser Pro Leu Met Asn Phe Pro Val
2075 2080 2085
tcg cag gta gaa gat gcc ttc cgt ctc atg cag acg ggc aag cac 6309
Ser Gln Val Glu Asp Ala Phe Arg Leu Met Gln Thr Gly Lys His
2090 2095 2100
cgg ggg aaa cta tcc ctg aca tac tca tct tct gac gta gta ccc 6354
Arg Gly Lys Leu Ser Leu Thr Tyr Ser Ser Ser Asp Val Val Pro
2105 2110 2115
att cag agc cga cct act cgc tct att cgt ctg gat gaa act agt 6399
Ile Gln Ser Arg Pro Thr Arg Ser Ile Arg Leu Asp Glu Thr Ser
2120 2125 2130
gcc tat gtt ctc gta ggt ggt ctt ggt ggg ctt ggg cgc agt ctt 6444
Ala Tyr Val Leu Val Gly Gly Leu Gly Gly Leu Gly Arg Ser Leu
2135 2140 2145
gca caa ctt ttt gtc cga ctc ggg tgc aag aaa cta tgc ttt ctt 6489
Ala Gln Leu Phe Val Arg Leu Gly Cys Lys Lys Leu Cys Phe Leu
2150 2155 2160
tct cga tca gga ggg gca agt gaa aag gca cag aag ctc ctc aaa 6534
Ser Arg Ser Gly Gly Ala Ser Glu Lys Ala Gln Lys Leu Leu Lys
2165 2170 2175
gac ctt cag cag caa ggg gtc aaa act ctt gct ctt aga tgc gac 6579
Asp Leu Gln Gln Gln Gly Val Lys Thr Leu Ala Leu Arg Cys Asp
2180 2185 2190
gtt tct gat gca cag tct gtc aaa gcg gct att aat gaa tgc gcg 6624
Val Ser Asp Ala Gln Ser Val Lys Ala Ala Ile Asn Glu Cys Ala
2195 2200 2205
act cgc ttg gga cct gtc ctg ggt gtg gta cag tgt gca atg gtg 6669
Thr Arg Leu Gly Pro Val Leu Gly Val Val Gln Cys Ala Met Val
2210 2215 2220
ctt cga gat ggc cta ttc gag aag atg acc cac caa cag tgg gtt 6714
Leu Arg Asp Gly Leu Phe Glu Lys Met Thr His Gln Gln Trp Val
2225 2230 2235
gag ggt act cgg ccc aag gtc cag ggg tct tgg aac cta cat gtg 6759
Glu Gly Thr Arg Pro Lys Val Gln Gly Ser Trp Asn Leu His Val
2240 2245 2250
aac cta cca aat gtt gat ttc ttt att att ctc agt tcc ttt gct 6804
Asn Leu Pro Asn Val Asp Phe Phe Ile Ile Leu Ser Ser Phe Ala
2255 2260 2265
gga att ttt gga agc cga ggc caa agc aac tat acc gca gcg gga 6849
Gly Ile Phe Gly Ser Arg Gly Gln Ser Asn Tyr Thr Ala Ala Gly
2270 2275 2280
gcg tat gag gat gcg ctt gca aat tat cga cga tcg ctg ggt ctc 6894
Ala Tyr Glu Asp Ala Leu Ala Asn Tyr Arg Arg Ser Leu Gly Leu
2285 2290 2295
aaa gcg gtg aca gtt gac ttg ggt att atg cgc gat gtg ggc gtt 6939
Lys Ala Val Thr Val Asp Leu Gly Ile Met Arg Asp Val Gly Val
2300 2305 2310
ctt gcc gag caa ggt ata aca gat tat ctg cga gag tgg gag gag 6984
Leu Ala Glu Gln Gly Ile Thr Asp Tyr Leu Arg Glu Trp Glu Glu
2315 2320 2325
cca tgc ggt att cga gaa gct gaa ttc cat gcg ctt atg gaa aat 7029
Pro Cys Gly Ile Arg Glu Ala Glu Phe His Ala Leu Met Glu Asn
2330 2335 2340
gtc ttg act agt gaa gtt ctt gga gat cag gag cct cta ccg gca 7074
Val Leu Thr Ser Glu Val Leu Gly Asp Gln Glu Pro Leu Pro Ala
2345 2350 2355
cac att ccg acg ggc ttt gct acc gca aag aca gtt caa caa ttt 7119
His Ile Pro Thr Gly Phe Ala Thr Ala Lys Thr Val Gln Gln Phe
2360 2365 2370
ggt atc acc acg cca ttt tac ttt gat gat cct cgg ttt tca att 7164
Gly Ile Thr Thr Pro Phe Tyr Phe Asp Asp Pro Arg Phe Ser Ile
2375 2380 2385
cta tcc gcc gcc ggc tct agt aag aca gga gct ggt gat agc acg 7209
Leu Ser Ala Ala Gly Ser Ser Lys Thr Gly Ala Gly Asp Ser Thr
2390 2395 2400
gat tct aac aag gcc atc tca gtg caa aat caa att gcg cag tct 7254
Asp Ser Asn Lys Ala Ile Ser Val Gln Asn Gln Ile Ala Gln Ser
2405 2410 2415
ata tct att tca gag gca gca tca gcc gtc acc aat gct ctt gtt 7299
Ile Ser Ile Ser Glu Ala Ala Ser Ala Val Thr Asn Ala Leu Val
2420 2425 2430
gca cgc gtg gcc aaa tcg ctt caa agc gct ttg tcc gac atc gac 7344
Ala Arg Val Ala Lys Ser Leu Gln Ser Ala Leu Ser Asp Ile Asp
2435 2440 2445
cca tcc cgg ccg ctg cat gcc ttc ggt gtg gat tct ctt gtc gcc 7389
Pro Ser Arg Pro Leu His Ala Phe Gly Val Asp Ser Leu Val Ala
2450 2455 2460
gtc gaa gtg gtg aac tgg gtg ttc aaa gaa atc aag gcc aaa gtt 7434
Val Glu Val Val Asn Trp Val Phe Lys Glu Ile Lys Ala Lys Val
2465 2470 2475
acc gta ttt gac gtt ctt tct agt att cct att aca tct ctt gcc 7479
Thr Val Phe Asp Val Leu Ser Ser Ile Pro Ile Thr Ser Leu Ala
2480 2485 2490
gag aag att gcg ctg aag tct agt ctt ttg ccg caa ttg act tga 7524
Glu Lys Ile Ala Leu Lys Ser Ser Leu Leu Pro Gln Leu Thr
2495 2500 2505
<210> 14
<211> 2507
<212> PRT
<213> Talaromyces islandicus
<400> 14
Met Ala Thr Thr Asn Glu Val Arg Trp Ala Gln Asp Ile Ala Ile Val
1 5 10 15
Gly Met Ser Cys Arg Phe Ala Asp Asp Ala Asp Ser Phe Pro Arg Phe
20 25 30
Trp Asp Phe Ile Cys Asn Gly Arg Tyr Ala Phe His Tyr Pro Gly Lys
35 40 45
Lys Thr Asn Thr Ser Leu Pro Arg Gly Ala His Phe Phe Lys Asp Asp
50 55 60
Ile Ala Glu Phe Asp Ala Asn Phe Phe Asn Ile Ser Lys Val Glu Ala
65 70 75 80
Glu Ser Ile Asp Pro Gln Gln Arg Met Val Met Glu Thr Thr Phe Glu
85 90 95
Ala Leu Glu Asn Ala Gly Ile Thr Ile Asp Lys Val Ala Gly Thr Arg
100 105 110
Ala Gly Val Trp Met Ala Asn Phe Thr Ser Asp Tyr Arg Glu Met Leu
115 120 125
Tyr Arg Asp Ser Glu Thr Ala Pro Met Tyr Thr Leu Ser Gly Ala Ser
130 135 140
Asn Thr Ser Thr Ser Asn Arg Val Ser Trp Phe Phe Asp Leu Lys Gly
145 150 155 160
Pro Ser Phe Thr Leu Asn Thr Ala Cys Ser Ser Ser Met Val Ala Thr
165 170 175
His Leu Ala Cys Gln Ser Leu Ala Leu Gly Glu Ser Ser Ser Ala Ile
180 185 190
Val Gly Gly Thr Ser Leu Leu Leu Asn Pro Asp Leu Phe Leu Phe Leu
195 200 205
Ser Asn Gln His Phe Leu Ala Ala Asp Gly Lys Ser Lys Ala Phe Asp
210 215 220
Ala Ser Gly Asp Gly Tyr Gly Arg Gly Glu Gly Val Ala Val Val Val
225 230 235 240
Leu Lys Arg Val Ala Asp Ala Ile Ala Asp Gly Asp Pro Ile Arg Ala
245 250 255
Val Ile Arg Gly Thr Ala Ile Asn Gln Asp Gly Arg Thr Lys Gly Met
260 265 270
Thr Leu Pro Ser Val Asp Ala Gln Glu Gln Leu Ile Lys Asp Ala Tyr
275 280 285
Arg Asn Ala Gly Leu Ser Met Lys Asp Thr Arg Tyr Val Glu Ala His
290 295 300
Gly Thr Gly Thr Gln Ala Gly Asp Lys Cys Glu Thr Glu Ala Leu Ser
305 310 315 320
Arg Thr Phe Ser Pro Tyr Arg Thr Ala Ser Glu Arg Leu Ile Leu Gly
325 330 335
Ser Val Lys Thr Asn Ile Gly His Leu Glu Ala Cys Ala Gly Leu Ala
340 345 350
Ser Met Ile Lys Cys Val Gly Ile Leu Glu Ala Gly Val Ile Pro Pro
355 360 365
Asn Pro Leu Tyr Lys Lys Gly Asn Pro Gly Ile Lys Phe Asp Asp Trp
370 375 380
Lys Leu His Val Pro Thr Ser Ser Ile Gln Trp Pro Thr Ser Gly Leu
385 390 395 400
Arg Arg Ile Ser Thr Gln Gly Phe Gly Tyr Gly Gly Thr Asn Ala His
405 410 415
Ile Ile Met Asp Asp Ala His Asn Tyr Leu Val Ser Arg Asp Ile Thr
420 425 430
Ala Ile His Asn Thr Cys Leu Leu Asn Leu Thr Asn Gly Thr Thr Tyr
435 440 445
Ile Glu His Lys Glu Ala Pro Arg Pro Arg Ile Phe His Phe Ser Ala
450 455 460
Gln Asp Lys Asp Gly Leu Gly Arg Val Arg Asp Ala Thr Cys Gln Tyr
465 470 475 480
Leu Lys Ser Gly Ala Leu Glu Ala Gly Lys Met Arg Gln Asn Glu Asp
485 490 495
Lys Tyr Leu Arg Asp Leu Ala Tyr Thr Leu Ser Glu Arg Arg Ser Arg
500 505 510
Leu Gln Trp Gln Thr Phe Ala Val Ala Ser Ser Val Glu Gly Leu Ile
515 520 525
Glu Thr Leu Gln Thr Lys Pro Trp Ala Ser Pro Glu Thr Arg Ser Ala
530 535 540
Ser Lys Val Pro Arg Ile Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln
545 550 555 560
Trp Pro Arg Met Gly Ile Glu Leu Met Glu Tyr Asp Ile Phe Arg Lys
565 570 575
Ser Val Glu Arg Ser Asp Val Tyr Leu Arg Glu Gly Leu Asp Cys Ser
580 585 590
Trp Ser Ala Ile Glu Glu Leu Ala Lys Pro Asp Ser Ser Ser Asn Leu
595 600 605
Gly Ala Ala Glu Tyr Ser Gln Ala Leu Cys Ser Val Leu Gln Ile Ala
610 615 620
Leu Ile Asp Leu Leu Asp Ser Trp Asn Ile Arg Pro Ser Ala Val Ala
625 630 635 640
Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Val Leu
645 650 655
Ser Trp Glu Asp Ala Leu Lys Val Ala Tyr Phe Arg Gly Ser Leu Ser
660 665 670
Ala Glu Met Lys Gly Asn Asp Ser Ser Leu Asn Gly Ala Met Met Ala
675 680 685
Val Gly Ser Ser Pro Ala Asp Ile Glu Lys Trp Leu Asp Lys Val Thr
690 695 700
Ala Gly Glu Val Val Val Ala Cys Val Asn Ser Pro Ala Ser Ile Thr
705 710 715 720
Leu Ser Gly Asp Ala Ala Gly Ile Asn Glu Leu Glu Ser Met Leu Lys
725 730 735
Glu Ala Gly Ile Phe Ala Arg Lys Leu Lys Val Asp Thr Ala Tyr His
740 745 750
Ser Pro His Met Gln Thr Ile Ala Gly Gln Tyr Phe Glu Ala Ile Ala
755 760 765
Asp Ile Ser Ile Leu Pro Val Arg Asn Gly Cys Gln Met His Ser Ser
770 775 780
Val Arg Gly Gly Tyr Ile Asp Pro Asn Glu Leu Gly Ala Ala Asn Trp
785 790 795 800
Val Arg Asn Leu Val Ser Thr Val Gln Phe Ala Asp Ala Val His Asp
805 810 815
Leu Leu Arg Pro Leu Val Tyr Gly Glu Arg Ala Ala His Asn Ala Val
820 825 830
Asp Ile Leu Val Glu Val Gly Pro His Ser Ala Leu Gln Gly Pro Val
835 840 845
Asn Gln Thr Met Lys Ala His Gly Ile Asn Ser Ile Asn Tyr Cys Thr
850 855 860
Met Leu Ser Arg Gly Lys Asn Ala Ile Asn Thr Ala Leu Ser Cys Ala
865 870 875 880
Ala Thr Leu Tyr Val Glu Gly Leu Ala Val Asp Leu Arg Arg Ala Asn
885 890 895
Gln Asp Glu Ser Phe Ala Val Glu Pro Ile Phe Asp Met Pro Ser Tyr
900 905 910
Pro Trp Asn His Ser Ile Arg Tyr Trp Ala Glu Ser Arg Val Glu Lys
915 920 925
Glu Tyr Arg Gln Arg Lys Tyr Pro Arg Thr Pro Leu Leu Gly Ala Pro
930 935 940
Cys Pro Ser Met Asn Ala Gly Glu Lys Val Trp Arg Gly Phe Ile Arg
945 950 955 960
Pro Ser Glu Glu Pro Trp Val Arg Asp His Val Ile Gln Gly Ser Ile
965 970 975
Leu Tyr Pro Ala Ala Gly Phe Leu Ala Met Ala Ile Glu Ala Ala Arg
980 985 990
Gln Gly Thr Glu Thr Gly Arg Ser Ile Asp Gly Phe Arg Leu Arg Asp
995 1000 1005
Val Gln Ile Asn Ala Ala Leu Val Ile Glu Glu Asn Val Glu Pro
1010 1015 1020
Glu Val Ile Leu Arg Leu Gln Pro His Arg Met Gly Thr Leu Asp
1025 1030 1035
Ala Gly Ser Val Ser Trp Gln Glu Phe Thr Val Ser Ser Ser Thr
1040 1045 1050
Asp Gly Thr Asp Leu Arg Gln Asn Cys Ser Gly Leu Leu Ala Ile
1055 1060 1065
Asp Tyr Glu Pro Ala Glu Gly Ser Ser Met His Ile Glu Lys Ile
1070 1075 1080
Lys Glu Val Glu Thr Ile Lys Gly Lys Leu Val Lys Ala Lys Glu
1085 1090 1095
Gln Cys Arg Ala Ala Ile Asn Val Asp Glu Phe Tyr Ala His Leu
1100 1105 1110
Asp Thr Val Gly Leu Thr Tyr Gly Glu Thr Phe Ala Asn Leu Thr
1115 1120 1125
Glu Val His Thr Asn Ala Ala Thr Gly Glu Cys Thr Gly Arg Leu
1130 1135 1140
Leu Val Pro Asp Val Glu Ser Ala Ile Pro Pro His Met Arg Glu
1145 1150 1155
Arg Pro His Ile Ile His Pro Thr Thr Leu Asp Ala Ile Phe His
1160 1165 1170
Leu Ala Phe Ala Ala Ile Ser Glu His Pro Phe Ser Leu Lys Ser
1175 1180 1185
Ala Met Val Pro Ile Ser Ile Thr Glu Val Val Ile Ser Asn Glu
1190 1195 1200
Val Pro His Arg Lys Gly Ser Gln Leu Glu Gly Phe Ala Gln Ser
1205 1210 1215
Ser Arg Phe Gly Phe Arg Glu Leu Val Thr Asn Ile Asn Ile Phe
1220 1225 1230
Asp Glu Gln Leu Thr Asp Ala Val Val Lys Ile Ser Gly Phe Arg
1235 1240 1245
Cys Ala Asp Val Ser Gly Ser Ser Gln Ser Thr Ser Ser Gly Glu
1250 1255 1260
Ala Ala Lys Pro Ile Thr Phe Lys Glu Ile His Arg Pro Ala Leu
1265 1270 1275
Glu Leu Leu Asp Tyr Glu Asp Leu Gln Arg Ala Val Asn Ala Asn
1280 1285 1290
Ala Asp Glu Ile Ala Ser Gly Ile Phe Glu Gln Asp Thr Ser Leu
1295 1300 1305
Asp Lys Ser Ala Leu Ala Ile Val Lys Arg Thr Leu Ser Asn Val
1310 1315 1320
Pro Arg Ser Ser Val His Lys Asp Leu Leu Gly Phe Tyr Asp Trp
1325 1330 1335
Met Gln Arg Gln Val Ser Ser Ala Asp Lys Ala Ser Gly Ala Gly
1340 1345 1350
Gln Arg Asp Ser Thr Gly Tyr Thr Asn Ile Ser Val Lys Asp Leu
1355 1360 1365
Glu Gly Ile Leu Ser Gly Glu Lys Ile Ala Ala Gln Ala Met Asp
1370 1375 1380
Glu Asn Val Ile Leu Met Pro Ala Leu Thr Ser Ser Ala Asn Phe
1385 1390 1395
Gln Gln Ile Met Lys Lys Leu Ser Gln Tyr Leu Leu Ile Leu Gln
1400 1405 1410
His Thr Tyr Pro Glu Leu Ser Val Leu Glu Ile Ile His Ser Ala
1415 1420 1425
Glu Asn Ser Thr Thr Gly Ser Ile Leu Pro Gln Leu Gln Ser Ala
1430 1435 1440
Glu Val Ile Leu Asp Thr Ser Lys Tyr Thr Val Leu Val Gln Asn
1445 1450 1455
Glu Lys Ala Ala Lys Thr Val Glu Ser Gln Leu Gly Thr Leu Thr
1460 1465 1470
Asp Leu Ile Ser Leu Glu Val Ser Ala Thr Asp Asn Ser Val Gln
1475 1480 1485
Asp His Gly Arg Gln Tyr Asp Leu Ala Leu Val Val Asn Ile Ala
1490 1495 1500
His Lys Asp Pro Asp Val Leu Leu Cys Glu Ala Lys Ser Ser Leu
1505 1510 1515
Lys Glu Gly Gly Arg Val Cys Ile Ile Glu Ile Gly Glu Pro Leu
1520 1525 1530
Leu Asn Leu Gly Ile Gly Leu Ala Ala Leu Gln His Thr His Phe
1535 1540 1545
Ile Ile Ser Ser Gln Asn Thr Asp Glu Ser His Leu Asn Arg Ala
1550 1555 1560
Gly Phe Thr Lys Glu Leu Leu Leu Gly Asp Ala Leu Pro Pro Lys
1565 1570 1575
Asn Glu Phe Arg Leu Ile Ala Gly Asn Thr Ser Lys Arg Leu Ala
1580 1585 1590
Val Thr Ile Gln Gly Glu Ile Val Ile Val Gln Ala Pro Glu Pro
1595 1600 1605
Ser Lys Ser Ala Gln Asn Val Ala Asp Ala Leu Thr Glu Val Leu
1610 1615 1620
Glu Lys Gln Cys Val Arg Ala Ile Arg Val Asp Trp Ser Leu Pro
1625 1630 1635
Glu Tyr Ile Ser Val Ile Glu Gly Lys Glu Cys Ile Val Leu Ala
1640 1645 1650
Asp Leu Glu Lys Ser His Leu Leu Glu Ala Ser Gln Glu Glu Phe
1655 1660 1665
Pro Ile Ile Gln Gln Thr Ile Leu Lys Ala Gly Gly Ile Leu Trp
1670 1675 1680
Val Ser Gly Ser Ile Gly Pro Asp Ala Ala Leu Val Thr Gly Leu
1685 1690 1695
Ala Arg Thr Ile Arg Asn Glu Ile Pro Gly Ser Lys Leu Arg Val
1700 1705 1710
Leu Gln Thr Asn Glu Leu Ser Leu Ala Ser Pro Thr Thr Trp Ser
1715 1720 1725
Asn Tyr Ile Leu Arg Leu Leu Gln Ser Pro Thr Leu Asp Ser Glu
1730 1735 1740
Phe Thr Ile Lys Asp Gly Phe Leu Gln Ile Ser Arg Val Val Glu
1745 1750 1755
Tyr Tyr Thr Arg Asn Asp Ala Leu Ala Val Ser Leu Gly Arg Gln
1760 1765 1770
Glu Pro Lys Thr Val His Met Pro Leu Ser Glu Thr Ser Ser Pro
1775 1780 1785
Val Lys Leu Cys Ile Lys Asn Pro Gly Met Leu Asp Ser Leu Tyr
1790 1795 1800
Phe Glu Pro Asp Asp Ile Leu Asn Ser Pro Leu Ala Ser Gly Gln
1805 1810 1815
Val Glu Ile Glu Val Lys Ala Ser Gly Val Asn Phe Arg Asp Val
1820 1825 1830
Met Val Cys Met Gly Gln Ile Pro Asp Ser Leu Leu Gly Phe Glu
1835 1840 1845
Ala Ala Gly Ile Val Arg Arg Val Gly Glu Asn Val Gln Asn Ile
1850 1855 1860
Lys Ala Gly Asp Arg Val Cys Phe Ile Ala His Gly Ser His Arg
1865 1870 1875
Thr Val His Arg Val Arg Asn Glu Tyr Val Val His Ile Pro Asp
1880 1885 1890
Glu Met Ser Phe Ala Glu Ala Ser Gly Val Leu Leu Val His Gly
1895 1900 1905
Thr Ala Trp Tyr Gly Leu Val Lys Ile Ala Gln Ile Lys Ala Gly
1910 1915 1920
Gln Thr Ile Leu Ile His Ala Ala Ala Gly Gly Val Gly Gln Ala
1925 1930 1935
Ala Val Met Leu Ala Gln His Phe Gly Leu Glu Ile Phe Ala Thr
1940 1945 1950
Val Gly Ser Asp Asp Lys Arg Gln Leu Ile Gln Asp Leu Tyr Lys
1955 1960 1965
Ile Pro Glu Asp His Ile Phe Asn Ser Arg Asp Leu Ser Phe Ala
1970 1975 1980
Lys Gly Val Leu Arg Met Thr Asn Gly Arg Gly Val Asp Val Ile
1985 1990 1995
Leu Asn Ser Leu Ser Gly Glu Thr Leu Arg Gln Thr Trp His Cys
2000 2005 2010
Val Ala Pro Phe Gly Thr Phe Ile Glu Ile Gly Ile Lys Asp Ile
2015 2020 2025
Leu Ser Asn Thr Arg Leu Asp Met Arg Pro Phe Leu Gln Asp Ala
2030 2035 2040
Arg Phe Ala Phe Phe Asn Leu Asn Arg Ile Glu Asn Glu Arg Pro
2045 2050 2055
Asp Leu Met Ser Glu Ala Leu Asn Glu Ser Met Ala Phe Ile Ser
2060 2065 2070
Ser Gly Ala Thr Arg Pro Val Ser Pro Leu Met Asn Phe Pro Val
2075 2080 2085
Ser Gln Val Glu Asp Ala Phe Arg Leu Met Gln Thr Gly Lys His
2090 2095 2100
Arg Gly Lys Leu Ser Leu Thr Tyr Ser Ser Ser Asp Val Val Pro
2105 2110 2115
Ile Gln Ser Arg Pro Thr Arg Ser Ile Arg Leu Asp Glu Thr Ser
2120 2125 2130
Ala Tyr Val Leu Val Gly Gly Leu Gly Gly Leu Gly Arg Ser Leu
2135 2140 2145
Ala Gln Leu Phe Val Arg Leu Gly Cys Lys Lys Leu Cys Phe Leu
2150 2155 2160
Ser Arg Ser Gly Gly Ala Ser Glu Lys Ala Gln Lys Leu Leu Lys
2165 2170 2175
Asp Leu Gln Gln Gln Gly Val Lys Thr Leu Ala Leu Arg Cys Asp
2180 2185 2190
Val Ser Asp Ala Gln Ser Val Lys Ala Ala Ile Asn Glu Cys Ala
2195 2200 2205
Thr Arg Leu Gly Pro Val Leu Gly Val Val Gln Cys Ala Met Val
2210 2215 2220
Leu Arg Asp Gly Leu Phe Glu Lys Met Thr His Gln Gln Trp Val
2225 2230 2235
Glu Gly Thr Arg Pro Lys Val Gln Gly Ser Trp Asn Leu His Val
2240 2245 2250
Asn Leu Pro Asn Val Asp Phe Phe Ile Ile Leu Ser Ser Phe Ala
2255 2260 2265
Gly Ile Phe Gly Ser Arg Gly Gln Ser Asn Tyr Thr Ala Ala Gly
2270 2275 2280
Ala Tyr Glu Asp Ala Leu Ala Asn Tyr Arg Arg Ser Leu Gly Leu
2285 2290 2295
Lys Ala Val Thr Val Asp Leu Gly Ile Met Arg Asp Val Gly Val
2300 2305 2310
Leu Ala Glu Gln Gly Ile Thr Asp Tyr Leu Arg Glu Trp Glu Glu
2315 2320 2325
Pro Cys Gly Ile Arg Glu Ala Glu Phe His Ala Leu Met Glu Asn
2330 2335 2340
Val Leu Thr Ser Glu Val Leu Gly Asp Gln Glu Pro Leu Pro Ala
2345 2350 2355
His Ile Pro Thr Gly Phe Ala Thr Ala Lys Thr Val Gln Gln Phe
2360 2365 2370
Gly Ile Thr Thr Pro Phe Tyr Phe Asp Asp Pro Arg Phe Ser Ile
2375 2380 2385
Leu Ser Ala Ala Gly Ser Ser Lys Thr Gly Ala Gly Asp Ser Thr
2390 2395 2400
Asp Ser Asn Lys Ala Ile Ser Val Gln Asn Gln Ile Ala Gln Ser
2405 2410 2415
Ile Ser Ile Ser Glu Ala Ala Ser Ala Val Thr Asn Ala Leu Val
2420 2425 2430
Ala Arg Val Ala Lys Ser Leu Gln Ser Ala Leu Ser Asp Ile Asp
2435 2440 2445
Pro Ser Arg Pro Leu His Ala Phe Gly Val Asp Ser Leu Val Ala
2450 2455 2460
Val Glu Val Val Asn Trp Val Phe Lys Glu Ile Lys Ala Lys Val
2465 2470 2475
Thr Val Phe Asp Val Leu Ser Ser Ile Pro Ile Thr Ser Leu Ala
2480 2485 2490
Glu Lys Ile Ala Leu Lys Ser Ser Leu Leu Pro Gln Leu Thr
2495 2500 2505
<210> 15
<211> 7809
<212> DNA
<213> Talaromyces islandicus
<220>
<221> CDS
<222> (1)..(7809)
<400> 15
atg gct ttg gat ttc gac tac atc att gtc ggc ggg ggc act gca gga 48
Met Ala Leu Asp Phe Asp Tyr Ile Ile Val Gly Gly Gly Thr Ala Gly
1 5 10 15
tgt gtt ctc gca agc cgc ctt tct gaa tac cta ccg gac gcc tct att 96
Cys Val Leu Ala Ser Arg Leu Ser Glu Tyr Leu Pro Asp Ala Ser Ile
20 25 30
cta ttg atc gaa gcc ggt atc gag cat gac cct cgc gtg aaa cca acc 144
Leu Leu Ile Glu Ala Gly Ile Glu His Asp Pro Arg Val Lys Pro Thr
35 40 45
ctt ggg ttg act ggc caa gca gcg aac gaa att aaa tgg aac ata cag 192
Leu Gly Leu Thr Gly Gln Ala Ala Asn Glu Ile Lys Trp Asn Ile Gln
50 55 60
agt gct cct caa tct gct gtt ggc aac aag act atc gat cta gtg cag 240
Ser Ala Pro Gln Ser Ala Val Gly Asn Lys Thr Ile Asp Leu Val Gln
65 70 75 80
ggt aaa gtg ctc ggg ggc acc tcc ggt att aac cac caa gta tgg tcc 288
Gly Lys Val Leu Gly Gly Thr Ser Gly Ile Asn His Gln Val Trp Ser
85 90 95
cgc ggt gca gct gga gac ttc aat cgc tgg gca gca gaa gtt ggc gac 336
Arg Gly Ala Ala Gly Asp Phe Asn Arg Trp Ala Ala Glu Val Gly Asp
100 105 110
ccg cga tgg tca tgg aat gga cag ctc ccc ttc ttc aag aac acc gag 384
Pro Arg Trp Ser Trp Asn Gly Gln Leu Pro Phe Phe Lys Asn Thr Glu
115 120 125
aca ttc cat cca ggg gct gac cta cag ggc aaa gat tta agc gcc ctt 432
Thr Phe His Pro Gly Ala Asp Leu Gln Gly Lys Asp Leu Ser Ala Leu
130 135 140
cat ggc ttc gat ggt cct atc aag gtg tct caa act tca tcc tgt gga 480
His Gly Phe Asp Gly Pro Ile Lys Val Ser Gln Thr Ser Ser Cys Gly
145 150 155 160
cgc ccg cgc aac tac cca ctg aaa gga gcc att gct tcc atg tac aag 528
Arg Pro Arg Asn Tyr Pro Leu Lys Gly Ala Ile Ala Ser Met Tyr Lys
165 170 175
agt gcc ggc gta tcc caa ggt gaa gat ttg aat tct gga aat att ctt 576
Ser Ala Gly Val Ser Gln Gly Glu Asp Leu Asn Ser Gly Asn Ile Leu
180 185 190
ggc ttc agt gaa gca acg gcc ggg tcc tac gac ggt atc cgg caa tgg 624
Gly Phe Ser Glu Ala Thr Ala Gly Ser Tyr Asp Gly Ile Arg Gln Trp
195 200 205
gcg gga gga aac tac aaa ttt ggt ccc aac gtg act ttg tgg acg gaa 672
Ala Gly Gly Asn Tyr Lys Phe Gly Pro Asn Val Thr Leu Trp Thr Glu
210 215 220
acc cat gta tca aaa atc atc tca cag ggt tct cga gcc acg gga gtc 720
Thr His Val Ser Lys Ile Ile Ser Gln Gly Ser Arg Ala Thr Gly Val
225 230 235 240
gag tac ttg cgg cct gac aga agc act agt tcc tca gta tca gct aaa 768
Glu Tyr Leu Arg Pro Asp Arg Ser Thr Ser Ser Ser Val Ser Ala Lys
245 250 255
aaa gaa gtc atc gtc tca agc ggt gct cag ggc tca ccc aag cta cta 816
Lys Glu Val Ile Val Ser Ser Gly Ala Gln Gly Ser Pro Lys Leu Leu
260 265 270
ctg tta agt gga att gga ccc tcg gca gag cta caa aag cat agc att 864
Leu Leu Ser Gly Ile Gly Pro Ser Ala Glu Leu Gln Lys His Ser Ile
275 280 285
cag caa gta gtc gaa ctc cct gtg ggg gaa aac tac agc gac cac ccc 912
Gln Gln Val Val Glu Leu Pro Val Gly Glu Asn Tyr Ser Asp His Pro
290 295 300
atg atg gca aca tac tgg aac cta gaa aag cgc ggt ctg gct ctt ggt 960
Met Met Ala Thr Tyr Trp Asn Leu Glu Lys Arg Gly Leu Ala Leu Gly
305 310 315 320
gat gtt gaa atg cgt tca gct gaa tgc gat tgg act tct ggg ttg ccg 1008
Asp Val Glu Met Arg Ser Ala Glu Cys Asp Trp Thr Ser Gly Leu Pro
325 330 335
gtt gac tgg ttg gca ttc cac cgt cac gat caa gac cca acc att gct 1056
Val Asp Trp Leu Ala Phe His Arg His Asp Gln Asp Pro Thr Ile Ala
340 345 350
gca ttg gct gag agc cag tta agc tca aat gaa ttg gaa cgc ttt cag 1104
Ala Leu Ala Glu Ser Gln Leu Ser Ser Asn Glu Leu Glu Arg Phe Gln
355 360 365
gag caa aat agg gct cac act gag tct gtg gtc tta tac ggt cat att 1152
Glu Gln Asn Arg Ala His Thr Glu Ser Val Val Leu Tyr Gly His Ile
370 375 380
gac ttc tcg ggc aag gcg ggc cct cca cct cca gga tct aac gtg tgt 1200
Asp Phe Ser Gly Lys Ala Gly Pro Pro Pro Pro Gly Ser Asn Val Cys
385 390 395 400
gta atg aac att cta gtc act cca tcg tct cgg gga aca gtg acg ctc 1248
Val Met Asn Ile Leu Val Thr Pro Ser Ser Arg Gly Thr Val Thr Leu
405 410 415
aaa tcc acc aat cca ttc gat gca cct gtg tgt gac ccg aac atg tta 1296
Lys Ser Thr Asn Pro Phe Asp Ala Pro Val Cys Asp Pro Asn Met Leu
420 425 430
tcc aac gaa ctc gat aag caa ctt ctt tgg tct gtg acc cgt ttg aca 1344
Ser Asn Glu Leu Asp Lys Gln Leu Leu Trp Ser Val Thr Arg Leu Thr
435 440 445
agc caa ggt ctt gag cga act att tct cca gag tac gga ctt tct gag 1392
Ser Gln Gly Leu Glu Arg Thr Ile Ser Pro Glu Tyr Gly Leu Ser Glu
450 455 460
tat gcc att gat gac gat tta cgc ggt gac tac ggc gat gag gcc atg 1440
Tyr Ala Ile Asp Asp Asp Leu Arg Gly Asp Tyr Gly Asp Glu Ala Met
465 470 475 480
atg cga cgt gct gtc cga att gtt cgc acc gtg aat cat gga agt ggt 1488
Met Arg Arg Ala Val Arg Ile Val Arg Thr Val Asn His Gly Ser Gly
485 490 495
aca tgc tca atg ggc act gtc gtt gac aca gag tgt cga gta aag ggc 1536
Thr Cys Ser Met Gly Thr Val Val Asp Thr Glu Cys Arg Val Lys Gly
500 505 510
gtt gag ggc ttg cga gta gtc gac tcc agc gtc att cct ctt cca ctc 1584
Val Glu Gly Leu Arg Val Val Asp Ser Ser Val Ile Pro Leu Pro Leu
515 520 525
tgc gcg cac tac cag gcg tct gtg tac gca ttg gcg gaa cag gat cag 1632
Cys Ala His Tyr Gln Ala Ser Val Tyr Ala Leu Ala Glu Gln Asp Gln
530 535 540
aca gag cag ttc ctc ctc cta tat gga gat cag acg gta gag aag ctg 1680
Thr Glu Gln Phe Leu Leu Leu Tyr Gly Asp Gln Thr Val Glu Lys Leu
545 550 555 560
cct gct gtt cgg gct ctt gta gaa cat gcc cag agg tcg ccg gct ggt 1728
Pro Ala Val Arg Ala Leu Val Glu His Ala Gln Arg Ser Pro Ala Gly
565 570 575
cgt cgt ttt ctc cgc gat gcg tgc gat atc att caa ata gaa ata ttc 1776
Arg Arg Phe Leu Arg Asp Ala Cys Asp Ile Ile Gln Ile Glu Ile Phe
580 585 590
agc ctt gat aca gat gag aga gct cac gtc ggg cat ttt gat act ctg 1824
Ser Leu Asp Thr Asp Glu Arg Ala His Val Gly His Phe Asp Thr Leu
595 600 605
ttg cag ctg gca gaa agt aat gcc cag gct gac cag ccc agt gag atc 1872
Leu Gln Leu Ala Glu Ser Asn Ala Gln Ala Asp Gln Pro Ser Glu Ile
610 615 620
gtg gct aca att ctc atg aac gtg acc cga ctg gga gag ttt att ctt 1920
Val Ala Thr Ile Leu Met Asn Val Thr Arg Leu Gly Glu Phe Ile Leu
625 630 635 640
tac gca gaa gaa cac cca aac gtc tta ggc tct ata gag caa ccg aca 1968
Tyr Ala Glu Glu His Pro Asn Val Leu Gly Ser Ile Glu Gln Pro Thr
645 650 655
cat att gtt gct ttt tgc aca gga gaa att ccg gca gct gtg gca gca 2016
His Ile Val Ala Phe Cys Thr Gly Glu Ile Pro Ala Ala Val Ala Ala
660 665 670
gcc gcg cgc gat agc atc gaa tta tat aat ttg tca atc gag aca gtc 2064
Ala Ala Arg Asp Ser Ile Glu Leu Tyr Asn Leu Ser Ile Glu Thr Val
675 680 685
cgc ata ata tgt cgt ttt gcg cgg aac atc atc cgt cgg tcg gtc cta 2112
Arg Ile Ile Cys Arg Phe Ala Arg Asn Ile Ile Arg Arg Ser Val Leu
690 695 700
gta gac agg act aat ggt agc tgg gcg acc acc atc gtt ggt gtt tcg 2160
Val Asp Arg Thr Asn Gly Ser Trp Ala Thr Thr Ile Val Gly Val Ser
705 710 715 720
ccc gga cga gtt cag acc ata ctt gac act ttt cac cag agt cag aat 2208
Pro Gly Arg Val Gln Thr Ile Leu Asp Thr Phe His Gln Ser Gln Asn
725 730 735
att gct cct aca aga caa atc aac atc ggc atc atg gca gca ggt tgg 2256
Ile Ala Pro Thr Arg Gln Ile Asn Ile Gly Ile Met Ala Ala Gly Trp
740 745 750
cta aca ctt ttc ggg cct cct atc act aca gaa caa ctt ttt aac tgg 2304
Leu Thr Leu Phe Gly Pro Pro Ile Thr Thr Glu Gln Leu Phe Asn Trp
755 760 765
tct aag gag ctt gat ggg gca tct cgc atc aag aca gat gct ggc ggt 2352
Ser Lys Glu Leu Asp Gly Ala Ser Arg Ile Lys Thr Asp Ala Gly Gly
770 775 780
ggt gtt cat ctt ccc aat ctc ccc gag cta gac ttg gat gag gtc gta 2400
Gly Val His Leu Pro Asn Leu Pro Glu Leu Asp Leu Asp Glu Val Val
785 790 795 800
gga tta tca ccg ctt tta gat gtc cct att acc ccc aag gcg agg ctt 2448
Gly Leu Ser Pro Leu Leu Asp Val Pro Ile Thr Pro Lys Ala Arg Leu
805 810 815
tgg tca ccg tac agt tgc gag att cgc aat gca gca aca ctc aga gat 2496
Trp Ser Pro Tyr Ser Cys Glu Ile Arg Asn Ala Ala Thr Leu Arg Asp
820 825 830
tta atc cgt cag gtc atc cca gat atc acc caa tac tca cta cga tta 2544
Leu Ile Arg Gln Val Ile Pro Asp Ile Thr Gln Tyr Ser Leu Arg Leu
835 840 845
agt gat acc ata gag acg gcc gtt aaa ggg cta agc aat gga tca gtc 2592
Ser Asp Thr Ile Glu Thr Ala Val Lys Gly Leu Ser Asn Gly Ser Val
850 855 860
aag gtt gtc tgc gtt ggt tat act gct cac ctg ata tct ctg cag aaa 2640
Lys Val Val Cys Val Gly Tyr Thr Ala His Leu Ile Ser Leu Gln Lys
865 870 875 880
tca ctg cag cgc gaa aga cgc gag gcc act gtc tta caa cat tcc agc 2688
Ser Leu Gln Arg Glu Arg Arg Glu Ala Thr Val Leu Gln His Ser Ser
885 890 895
gca ggt tca aca ttt ttc aca tcg ccg cgc gga ggc tcg gag tcc att 2736
Ala Gly Ser Thr Phe Phe Thr Ser Pro Arg Gly Gly Ser Glu Ser Ile
900 905 910
gct att gta gga atg tct gga aga ttt cct ggt agc gac aat ata caa 2784
Ala Ile Val Gly Met Ser Gly Arg Phe Pro Gly Ser Asp Asn Ile Gln
915 920 925
gag tat tgg caa tcc ctg ttg gat gga gaa agg cat att aaa gag atc 2832
Glu Tyr Trp Gln Ser Leu Leu Asp Gly Glu Arg His Ile Lys Glu Ile
930 935 940
cct aaa aac cgg ttc gac ttg agc aaa tgg tac gat gag acc gga aaa 2880
Pro Lys Asn Arg Phe Asp Leu Ser Lys Trp Tyr Asp Glu Thr Gly Lys
945 950 955 960
cag aaa aac gcc acg atg aat cgc tcg ggc gcg ttt tta gat cga ccc 2928
Gln Lys Asn Ala Thr Met Asn Arg Ser Gly Ala Phe Leu Asp Arg Pro
965 970 975
ggt tac ttt gac aac cgg ttg ttc aat atg tca ccc cgg gaa gcc ctt 2976
Gly Tyr Phe Asp Asn Arg Leu Phe Asn Met Ser Pro Arg Glu Ala Leu
980 985 990
cag acc gat cct ctt cat cgt atg ttc ctc acc gtg agc tat gag gct 3024
Gln Thr Asp Pro Leu His Arg Met Phe Leu Thr Val Ser Tyr Glu Ala
995 1000 1005
ctc gag atg gca ggc tat tct cca gag gca aca ttg gca aca aac 3069
Leu Glu Met Ala Gly Tyr Ser Pro Glu Ala Thr Leu Ala Thr Asn
1010 1015 1020
agt aac cgc atc gca acc tat ttt ggt caa aca tca gat gac tgg 3114
Ser Asn Arg Ile Ala Thr Tyr Phe Gly Gln Thr Ser Asp Asp Trp
1025 1030 1035
aga gac att gtg ctt acc cag ggc gtg gat ata tac tac gct ccg 3159
Arg Asp Ile Val Leu Thr Gln Gly Val Asp Ile Tyr Tyr Ala Pro
1040 1045 1050
ggt att tgc cgt gcc ttt gca cct ggt cgt ctc aac tat cac ttt 3204
Gly Ile Cys Arg Ala Phe Ala Pro Gly Arg Leu Asn Tyr His Phe
1055 1060 1065
aag tgg gga ggg cca tcg tat agt gtt gat gca gct tgc gca tcg 3249
Lys Trp Gly Gly Pro Ser Tyr Ser Val Asp Ala Ala Cys Ala Ser
1070 1075 1080
agc atc gcc aca att tcc ctg gct tgt tct gcc ttg ctg gct cgc 3294
Ser Ile Ala Thr Ile Ser Leu Ala Cys Ser Ala Leu Leu Ala Arg
1085 1090 1095
gaa tgc gac acc gct ctc gca ggt gga ggc tcc att ctt gac tct 3339
Glu Cys Asp Thr Ala Leu Ala Gly Gly Gly Ser Ile Leu Asp Ser
1100 1105 1110
cct gca cca ttt gct ggt tta agc cga ggt ggc ttt ctc tcc ccg 3384
Pro Ala Pro Phe Ala Gly Leu Ser Arg Gly Gly Phe Leu Ser Pro
1115 1120 1125
gag aaa ggt tgt gaa act ttc cat gac gat gct gat ggt tac gtg 3429
Glu Lys Gly Cys Glu Thr Phe His Asp Asp Ala Asp Gly Tyr Val
1130 1135 1140
cgt ggc gaa ggc gtg ggt gtc gtt gtt ctt aag cgg ctc gaa gat 3474
Arg Gly Glu Gly Val Gly Val Val Val Leu Lys Arg Leu Glu Asp
1145 1150 1155
gct gtt gcg gat aac gac aac atc cta ggt gtc atc cgc gga tca 3519
Ala Val Ala Asp Asn Asp Asn Ile Leu Gly Val Ile Arg Gly Ser
1160 1165 1170
gcg aga aac tat agc aag gga gct tct tct att aca cat cca tct 3564
Ala Arg Asn Tyr Ser Lys Gly Ala Ser Ser Ile Thr His Pro Ser
1175 1180 1185
tcg gaa gcg cag cag cgt ctc tat cgg cag gtc ttg aat cag aat 3609
Ser Glu Ala Gln Gln Arg Leu Tyr Arg Gln Val Leu Asn Gln Asn
1190 1195 1200
gcc ata gac gcg gcg agt gtt tcc tat gtg gaa atg cac ggc acc 3654
Ala Ile Asp Ala Ala Ser Val Ser Tyr Val Glu Met His Gly Thr
1205 1210 1215
gga aca caa gcc ggt gac tct aca gag atg tcc tca gta ttg tct 3699
Gly Thr Gln Ala Gly Asp Ser Thr Glu Met Ser Ser Val Leu Ser
1220 1225 1230
aca ttt ggt caa tct cgt tcc aaa gat aac cca ctg gtt gtc ggc 3744
Thr Phe Gly Gln Ser Arg Ser Lys Asp Asn Pro Leu Val Val Gly
1235 1240 1245
gct gtt aag gca aat att ggt cat gga gaa gcc gct gct ggt gtt 3789
Ala Val Lys Ala Asn Ile Gly His Gly Glu Ala Ala Ala Gly Val
1250 1255 1260
tgt gcc ctc atc aag acc ttg atg atg ttt cag aag cat acc atc 3834
Cys Ala Leu Ile Lys Thr Leu Met Met Phe Gln Lys His Thr Ile
1265 1270 1275
cca ccg caa cct gga atg cct ttt aaa ctt aat cat cat ttc ccc 3879
Pro Pro Gln Pro Gly Met Pro Phe Lys Leu Asn His His Phe Pro
1280 1285 1290
gat ctg gag aag atg aac gtg cat ata cca gca act gca att ccg 3924
Asp Leu Glu Lys Met Asn Val His Ile Pro Ala Thr Ala Ile Pro
1295 1300 1305
cta acg agt gct agt aac gcc gcc aaa cga agg atc ttt ctc aac 3969
Leu Thr Ser Ala Ser Asn Ala Ala Lys Arg Arg Ile Phe Leu Asn
1310 1315 1320
agc ttc gat gcc tct ggg ggg aac tct tgc ctt cta tta gag gag 4014
Ser Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Leu Leu Glu Glu
1325 1330 1335
gcg cct cta aag cac tcc aag gct agt gat ccc cga aat cac cac 4059
Ala Pro Leu Lys His Ser Lys Ala Ser Asp Pro Arg Asn His His
1340 1345 1350
gtc gtg acc ttt tct gct cga act ccc ttc tct ctt cga gca att 4104
Val Val Thr Phe Ser Ala Arg Thr Pro Phe Ser Leu Arg Ala Ile
1355 1360 1365
aaa gaa aaa tac ctt caa tat att cgg ctc aac ccg aat aca tcg 4149
Lys Glu Lys Tyr Leu Gln Tyr Ile Arg Leu Asn Pro Asn Thr Ser
1370 1375 1380
ctg gct gat ctt gcc tac acc acg act gca cgc cgc atg cac caa 4194
Leu Ala Asp Leu Ala Tyr Thr Thr Thr Ala Arg Arg Met His Gln
1385 1390 1395
agc tcg gcc cgg tca aca ttt acc gct acg agt atc gaa gat ttt 4239
Ser Ser Ala Arg Ser Thr Phe Thr Ala Thr Ser Ile Glu Asp Phe
1400 1405 1410
gcc aat aag ctt gaa act gac ttg aag aaa gaa gat tcc cct gtc 4284
Ala Asn Lys Leu Glu Thr Asp Leu Lys Lys Glu Asp Ser Pro Val
1415 1420 1425
aaa aag agt aag ggg gct tct agt ggg cct aac gtt gta ttt gct 4329
Lys Lys Ser Lys Gly Ala Ser Ser Gly Pro Asn Val Val Phe Ala
1430 1435 1440
ttt acc ggt cag ggg tcc cag tat gca ggg atg gct cat caa ctc 4374
Phe Thr Gly Gln Gly Ser Gln Tyr Ala Gly Met Ala His Gln Leu
1445 1450 1455
tgg cac gac agt gcg gta ttc cgg cgg cta ata gac tcg atc caa 4419
Trp His Asp Ser Ala Val Phe Arg Arg Leu Ile Asp Ser Ile Gln
1460 1465 1470
tcc ata gcg act gct ttg gat ttg cct aag ttt gtt gac ctg att 4464
Ser Ile Ala Thr Ala Leu Asp Leu Pro Lys Phe Val Asp Leu Ile
1475 1480 1485
gct tcc caa agc ttc gat ttg tct aaa gcc agc cca att cag aca 4509
Ala Ser Gln Ser Phe Asp Leu Ser Lys Ala Ser Pro Ile Gln Thr
1490 1495 1500
caa cta gct ata gtg gcg ctt gaa att ggc ctg gct cag cta tgg 4554
Gln Leu Ala Ile Val Ala Leu Glu Ile Gly Leu Ala Gln Leu Trp
1505 1510 1515
gca tca tgg gga gtg cag cca agc ctt gtc att ggc cac agc ttg 4599
Ala Ser Trp Gly Val Gln Pro Ser Leu Val Ile Gly His Ser Leu
1520 1525 1530
gga gag tat gct gca tta tgc ata tca ggg gtt ctg acg gtc agc 4644
Gly Glu Tyr Ala Ala Leu Cys Ile Ser Gly Val Leu Thr Val Ser
1535 1540 1545
gat act ctc tat cta gtc gga aag agg gca atg atg tta gtt gag 4689
Asp Thr Leu Tyr Leu Val Gly Lys Arg Ala Met Met Leu Val Glu
1550 1555 1560
tct gtt gcg caa aac gaa tac gcc atg ctg gca atc aat gat gaa 4734
Ser Val Ala Gln Asn Glu Tyr Ala Met Leu Ala Ile Asn Asp Glu
1565 1570 1575
gtt gat atc att cgt cag cgc ctc gca aca gac gca tat aat aca 4779
Val Asp Ile Ile Arg Gln Arg Leu Ala Thr Asp Ala Tyr Asn Thr
1580 1585 1590
tgt gag atc gca tgc atc aac gca ccc aaa tcg acc gtg gta agt 4824
Cys Glu Ile Ala Cys Ile Asn Ala Pro Lys Ser Thr Val Val Ser
1595 1600 1605
ggc gct cta tca gaa atc aaa atc atg caa aag gag tta gag gaa 4869
Gly Ala Leu Ser Glu Ile Lys Ile Met Gln Lys Glu Leu Glu Glu
1610 1615 1620
caa ggg tat cgg tcc act ctt ctc cat gta cca ttc gga ttc cac 4914
Gln Gly Tyr Arg Ser Thr Leu Leu His Val Pro Phe Gly Phe His
1625 1630 1635
tcg aag caa atg gac cca atc cta gat tcg tac gag tcg tgt gta 4959
Ser Lys Gln Met Asp Pro Ile Leu Asp Ser Tyr Glu Ser Cys Val
1640 1645 1650
cag gga gtt ggt att tca tcc cct cgg gtt cca ata gca tcc act 5004
Gln Gly Val Gly Ile Ser Ser Pro Arg Val Pro Ile Ala Ser Thr
1655 1660 1665
ctc cta ggt gat att att cag gac aag tca acg gtt tct tct gtc 5049
Leu Leu Gly Asp Ile Ile Gln Asp Lys Ser Thr Val Ser Ser Val
1670 1675 1680
tac ctt aga cga cag acc cga gaa tct gtt aat ttt gtc gga gct 5094
Tyr Leu Arg Arg Gln Thr Arg Glu Ser Val Asn Phe Val Gly Ala
1685 1690 1695
cta caa gcg gca cag gtc tcc aat ttc ctg cgg gat gac aca ctc 5139
Leu Gln Ala Ala Gln Val Ser Asn Phe Leu Arg Asp Asp Thr Leu
1700 1705 1710
ttt ctc gag atg ggg ccc gat cca gtt tgt atg tcg ttg gtt cgc 5184
Phe Leu Glu Met Gly Pro Asp Pro Val Cys Met Ser Leu Val Arg
1715 1720 1725
tca act ctg ggg aca att gca acg cct cga ctt cta cct gcc ctt 5229
Ser Thr Leu Gly Thr Ile Ala Thr Pro Arg Leu Leu Pro Ala Leu
1730 1735 1740
cgc cgg aac gaa aac aat tgg ttg acc acg tca aat aca cta gca 5274
Arg Arg Asn Glu Asn Asn Trp Leu Thr Thr Ser Asn Thr Leu Ala
1745 1750 1755
gca gtc cac cag gcc ggt gtg ccc gtc aac tgg cca gac tat cac 5319
Ala Val His Gln Ala Gly Val Pro Val Asn Trp Pro Asp Tyr His
1760 1765 1770
cgg gag ttt aca aac tgt ctg aca ctg cta gat ttg ccc aca tat 5364
Arg Glu Phe Thr Asn Cys Leu Thr Leu Leu Asp Leu Pro Thr Tyr
1775 1780 1785
gtg ttt gat gaa aag gag ttc tgg aca tca tac ccg gac ccc gag 5409
Val Phe Asp Glu Lys Glu Phe Trp Thr Ser Tyr Pro Asp Pro Glu
1790 1795 1800
cag cta agt ggt gtt gag caa aag cat ttg tca cca cca cca gtt 5454
Gln Leu Ser Gly Val Glu Gln Lys His Leu Ser Pro Pro Pro Val
1805 1810 1815
cct gca gta cag gga ttc ccc aca aca act ctt caa agg cta acc 5499
Pro Ala Val Gln Gly Phe Pro Thr Thr Thr Leu Gln Arg Leu Thr
1820 1825 1830
caa gaa gca ttc gag gac ggt aaa atc tcg gtc act ttc gag tcc 5544
Gln Glu Ala Phe Glu Asp Gly Lys Ile Ser Val Thr Phe Glu Ser
1835 1840 1845
agc aca tct gat cct cac ctt ttt gaa gcg ata atg ggc cat gct 5589
Ser Thr Ser Asp Pro His Leu Phe Glu Ala Ile Met Gly His Ala
1850 1855 1860
gtg gcc gga gtc acg att tgt tcc agt agt atc ttc agc gac atg 5634
Val Ala Gly Val Thr Ile Cys Ser Ser Ser Ile Phe Ser Asp Met
1865 1870 1875
gca tta tcg gcc gct cgg tac acg tgc gaa cgg cta cag cca ggc 5679
Ala Leu Ser Ala Ala Arg Tyr Thr Cys Glu Arg Leu Gln Pro Gly
1880 1885 1890
agg tgg tct gaa gag cta ctt acc atc agc ggc ctg gat att cag 5724
Arg Trp Ser Glu Glu Leu Leu Thr Ile Ser Gly Leu Asp Ile Gln
1895 1900 1905
cgg cca ata gtg gtc ctt gat cga aaa gac tca cat atc att cag 5769
Arg Pro Ile Val Val Leu Asp Arg Lys Asp Ser His Ile Ile Gln
1910 1915 1920
atc aac gct aaa ctt gat gca aaa acc gaa gag gtt tat atc agc 5814
Ile Asn Ala Lys Leu Asp Ala Lys Thr Glu Glu Val Tyr Ile Ser
1925 1930 1935
ttt caa gac cag gtt ggg aaa ccc ata ggg tcc tgc aag atc tca 5859
Phe Gln Asp Gln Val Gly Lys Pro Ile Gly Ser Cys Lys Ile Ser
1940 1945 1950
ttt cac gac gct gcg agc tgg aag cag aac atc tcg cgt att ctg 5904
Phe His Asp Ala Ala Ser Trp Lys Gln Asn Ile Ser Arg Ile Leu
1955 1960 1965
tat ctt gtc tct ttc agg att gat gta cta aaa gag gca act atc 5949
Tyr Leu Val Ser Phe Arg Ile Asp Val Leu Lys Glu Ala Thr Ile
1970 1975 1980
act ggt caa gga cat cga ttc ttg cgg cca gtg atc tac cga ctc 5994
Thr Gly Gln Gly His Arg Phe Leu Arg Pro Val Ile Tyr Arg Leu
1985 1990 1995
ttc tcc aat gtc gtg aat tat ggg gaa cgt ttt caa ggg tta gaa 6039
Phe Ser Asn Val Val Asn Tyr Gly Glu Arg Phe Gln Gly Leu Glu
2000 2005 2010
gag gtt ttc ctc gat tcc gag tgt aac gat gtt gtt ggt caa gtt 6084
Glu Val Phe Leu Asp Ser Glu Cys Asn Asp Val Val Gly Gln Val
2015 2020 2025
aga ctt ccg gac ttg cca tcc agt aaa tca gga cat ttc cta tat 6129
Arg Leu Pro Asp Leu Pro Ser Ser Lys Ser Gly His Phe Leu Tyr
2030 2035 2040
agc ccc tat tta ctt gat gcc gtt gta cat gtt gcc ggc ttc ctg 6174
Ser Pro Tyr Leu Leu Asp Ala Val Val His Val Ala Gly Phe Leu
2045 2050 2055
gtc aac tgc ggc ttg aaa tat ccc gag gat ata ggg ttc ctg gct 6219
Val Asn Cys Gly Leu Lys Tyr Pro Glu Asp Ile Gly Phe Leu Ala
2060 2065 2070
tcc agc ttc gaa tcc tgg cac ata ttg aag cct atc tta cct aat 6264
Ser Ser Phe Glu Ser Trp His Ile Leu Lys Pro Ile Leu Pro Asn
2075 2080 2085
aaa act tac act agc tat tcc cac atg gaa gaa tca tct aac gga 6309
Lys Thr Tyr Thr Ser Tyr Ser His Met Glu Glu Ser Ser Asn Gly
2090 2095 2100
tcc tct ttg ttg gga gac gtg tac gtc ttt gat ggg aaa gat ctg 6354
Ser Ser Leu Leu Gly Asp Val Tyr Val Phe Asp Gly Lys Asp Leu
2105 2110 2115
gtc ggc tca cta act gga ctc cgc ttt caa aag atg aaa aag att 6399
Val Gly Ser Leu Thr Gly Leu Arg Phe Gln Lys Met Lys Lys Ile
2120 2125 2130
gct ctc aca aga att ttg caa tcg gca gcc cct cac tct tct atg 6444
Ala Leu Thr Arg Ile Leu Gln Ser Ala Ala Pro His Ser Ser Met
2135 2140 2145
aaa ata ggc gca gga gtc ttt cga cca gat ctt ctt ggg tca agt 6489
Lys Ile Gly Ala Gly Val Phe Arg Pro Asp Leu Leu Gly Ser Ser
2150 2155 2160
gaa aaa cag tct tca aga aat aag cag ttg gct agg gat gtt gat 6534
Glu Lys Gln Ser Ser Arg Asn Lys Gln Leu Ala Arg Asp Val Asp
2165 2170 2175
ttc gat aca cta cct tca tcg gtc gag ccg tct gct ttc acc act 6579
Phe Asp Thr Leu Pro Ser Ser Val Glu Pro Ser Ala Phe Thr Thr
2180 2185 2190
ccc aaa cct tcg tca tct gtc acc tct atc ata ggt cat gat gaa 6624
Pro Lys Pro Ser Ser Ser Val Thr Ser Ile Ile Gly His Asp Glu
2195 2200 2205
ccc ggg gtt gga gat aag ttt ctt gct gcc gtt gca gca gag gta 6669
Pro Gly Val Gly Asp Lys Phe Leu Ala Ala Val Ala Ala Glu Val
2210 2215 2220
ggc tgc gaa atc tcc gac ttg gaa ccc gac aca gta ttt gga gat 6714
Gly Cys Glu Ile Ser Asp Leu Glu Pro Asp Thr Val Phe Gly Asp
2225 2230 2235
cta ggg gta gac tcg ttg atg gca att acg gtt att gcc tca atc 6759
Leu Gly Val Asp Ser Leu Met Ala Ile Thr Val Ile Ala Ser Ile
2240 2245 2250
aga aat gac act gga gtc gaa ttg cca ggg tcg ttt ttc ctc gac 6804
Arg Asn Asp Thr Gly Val Glu Leu Pro Gly Ser Phe Phe Leu Asp
2255 2260 2265
aac ccg acc gtt gca gaa gct aca aaa gca ttg cgt ggg gat agc 6849
Asn Pro Thr Val Ala Glu Ala Thr Lys Ala Leu Arg Gly Asp Ser
2270 2275 2280
gac gct ggc atc tcc acg cct cag tct tct cct ccg aat ctt tcc 6894
Asp Ala Gly Ile Ser Thr Pro Gln Ser Ser Pro Pro Asn Leu Ser
2285 2290 2295
ccc aaa att cgt ggt gaa gaa gtg aac ggt gag tct tcg gtt cct 6939
Pro Lys Ile Arg Gly Glu Glu Val Asn Gly Glu Ser Ser Val Pro
2300 2305 2310
ttt gag ccg tta gag aca aca cca tct att acc aca gac ttc gaa 6984
Phe Glu Pro Leu Glu Thr Thr Pro Ser Ile Thr Thr Asp Phe Glu
2315 2320 2325
gtt gga agg gcg acg gaa aca ccg ttg tta ata gat aaa cca gct 7029
Val Gly Arg Ala Thr Glu Thr Pro Leu Leu Ile Asp Lys Pro Ala
2330 2335 2340
gct acc ctg tta ttg cag ggg tct gtg gct tca acg gag ccc cct 7074
Ala Thr Leu Leu Leu Gln Gly Ser Val Ala Ser Thr Glu Pro Pro
2345 2350 2355
ctt ttc ctc cta gct gat ggc acc ggt tca gtt tct tcc tac ata 7119
Leu Phe Leu Leu Ala Asp Gly Thr Gly Ser Val Ser Ser Tyr Ile
2360 2365 2370
cag ctt cct gcg ctt tca ggc ggt cgt cga atc tat ggg gtg gag 7164
Gln Leu Pro Ala Leu Ser Gly Gly Arg Arg Ile Tyr Gly Val Glu
2375 2380 2385
tct cca ttt gct cgc gat ccg tcg gcc ttc gtt gat atc agc gtg 7209
Ser Pro Phe Ala Arg Asp Pro Ser Ala Phe Val Asp Ile Ser Val
2390 2395 2400
ggt gat tta gca gac gct ttt att ttc tcc ata cgc aaa gtt cag 7254
Gly Asp Leu Ala Asp Ala Phe Ile Phe Ser Ile Arg Lys Val Gln
2405 2410 2415
cct gtt ggt cca tat gtt att gga ggt tcc tcg ttg ggt gct att 7299
Pro Val Gly Pro Tyr Val Ile Gly Gly Ser Ser Leu Gly Ala Ile
2420 2425 2430
cat gcg ttt gag gtt agc cat cgt tta ctc aat gct ggt gag act 7344
His Ala Phe Glu Val Ser His Arg Leu Leu Asn Ala Gly Glu Thr
2435 2440 2445
gtc tct gag ttg ctt ctc atc gca aat gca gca cca att cct gcc 7389
Val Ser Glu Leu Leu Leu Ile Ala Asn Ala Ala Pro Ile Pro Ala
2450 2455 2460
cca gct cat ctg aga cat ttg gaa att tcc acc gaa atg att gag 7434
Pro Ala His Leu Arg His Leu Glu Ile Ser Thr Glu Met Ile Glu
2465 2470 2475
aaa agt gga att gct tat ggc acc ggc cgg aag aag tta tcc acc 7479
Lys Ser Gly Ile Ala Tyr Gly Thr Gly Arg Lys Lys Leu Ser Thr
2480 2485 2490
cta tct gca aga caa aaa cag cat ctt acg gct tct gtt cga tct 7524
Leu Ser Ala Arg Gln Lys Gln His Leu Thr Ala Ser Val Arg Ser
2495 2500 2505
cac gta ctc tac gag ccc cag gcc ttt acc gaa acc cat cgg cca 7569
His Val Leu Tyr Glu Pro Gln Ala Phe Thr Glu Thr His Arg Pro
2510 2515 2520
gta cat aca acg ttg atc gtt gcc tca aag ggt ctt ggg ggt ggg 7614
Val His Thr Thr Leu Ile Val Ala Ser Lys Gly Leu Gly Gly Gly
2525 2530 2535
aca agc tcg cca gaa tgt cca tta act ccc tgg ata cag gct aat 7659
Thr Ser Ser Pro Glu Cys Pro Leu Thr Pro Trp Ile Gln Ala Asn
2540 2545 2550
tgg gga tcg tcg gag act ctg ggg tgg gat ggc ctg gtc ggc gag 7704
Trp Gly Ser Ser Glu Thr Leu Gly Trp Asp Gly Leu Val Gly Glu
2555 2560 2565
att cac tct att cac cgc gaa gac act gac agt ttc tca tta ctg 7749
Ile His Ser Ile His Arg Glu Asp Thr Asp Ser Phe Ser Leu Leu
2570 2575 2580
aag tat cct aac att acc aag tta ggc caa att atc aat gac cgc 7794
Lys Tyr Pro Asn Ile Thr Lys Leu Gly Gln Ile Ile Asn Asp Arg
2585 2590 2595
gtt tgt cat gca tag 7809
Val Cys His Ala
2600
<210> 16
<211> 2602
<212> PRT
<213> Talaromyces islandicus
<400> 16
Met Ala Leu Asp Phe Asp Tyr Ile Ile Val Gly Gly Gly Thr Ala Gly
1 5 10 15
Cys Val Leu Ala Ser Arg Leu Ser Glu Tyr Leu Pro Asp Ala Ser Ile
20 25 30
Leu Leu Ile Glu Ala Gly Ile Glu His Asp Pro Arg Val Lys Pro Thr
35 40 45
Leu Gly Leu Thr Gly Gln Ala Ala Asn Glu Ile Lys Trp Asn Ile Gln
50 55 60
Ser Ala Pro Gln Ser Ala Val Gly Asn Lys Thr Ile Asp Leu Val Gln
65 70 75 80
Gly Lys Val Leu Gly Gly Thr Ser Gly Ile Asn His Gln Val Trp Ser
85 90 95
Arg Gly Ala Ala Gly Asp Phe Asn Arg Trp Ala Ala Glu Val Gly Asp
100 105 110
Pro Arg Trp Ser Trp Asn Gly Gln Leu Pro Phe Phe Lys Asn Thr Glu
115 120 125
Thr Phe His Pro Gly Ala Asp Leu Gln Gly Lys Asp Leu Ser Ala Leu
130 135 140
His Gly Phe Asp Gly Pro Ile Lys Val Ser Gln Thr Ser Ser Cys Gly
145 150 155 160
Arg Pro Arg Asn Tyr Pro Leu Lys Gly Ala Ile Ala Ser Met Tyr Lys
165 170 175
Ser Ala Gly Val Ser Gln Gly Glu Asp Leu Asn Ser Gly Asn Ile Leu
180 185 190
Gly Phe Ser Glu Ala Thr Ala Gly Ser Tyr Asp Gly Ile Arg Gln Trp
195 200 205
Ala Gly Gly Asn Tyr Lys Phe Gly Pro Asn Val Thr Leu Trp Thr Glu
210 215 220
Thr His Val Ser Lys Ile Ile Ser Gln Gly Ser Arg Ala Thr Gly Val
225 230 235 240
Glu Tyr Leu Arg Pro Asp Arg Ser Thr Ser Ser Ser Val Ser Ala Lys
245 250 255
Lys Glu Val Ile Val Ser Ser Gly Ala Gln Gly Ser Pro Lys Leu Leu
260 265 270
Leu Leu Ser Gly Ile Gly Pro Ser Ala Glu Leu Gln Lys His Ser Ile
275 280 285
Gln Gln Val Val Glu Leu Pro Val Gly Glu Asn Tyr Ser Asp His Pro
290 295 300
Met Met Ala Thr Tyr Trp Asn Leu Glu Lys Arg Gly Leu Ala Leu Gly
305 310 315 320
Asp Val Glu Met Arg Ser Ala Glu Cys Asp Trp Thr Ser Gly Leu Pro
325 330 335
Val Asp Trp Leu Ala Phe His Arg His Asp Gln Asp Pro Thr Ile Ala
340 345 350
Ala Leu Ala Glu Ser Gln Leu Ser Ser Asn Glu Leu Glu Arg Phe Gln
355 360 365
Glu Gln Asn Arg Ala His Thr Glu Ser Val Val Leu Tyr Gly His Ile
370 375 380
Asp Phe Ser Gly Lys Ala Gly Pro Pro Pro Pro Gly Ser Asn Val Cys
385 390 395 400
Val Met Asn Ile Leu Val Thr Pro Ser Ser Arg Gly Thr Val Thr Leu
405 410 415
Lys Ser Thr Asn Pro Phe Asp Ala Pro Val Cys Asp Pro Asn Met Leu
420 425 430
Ser Asn Glu Leu Asp Lys Gln Leu Leu Trp Ser Val Thr Arg Leu Thr
435 440 445
Ser Gln Gly Leu Glu Arg Thr Ile Ser Pro Glu Tyr Gly Leu Ser Glu
450 455 460
Tyr Ala Ile Asp Asp Asp Leu Arg Gly Asp Tyr Gly Asp Glu Ala Met
465 470 475 480
Met Arg Arg Ala Val Arg Ile Val Arg Thr Val Asn His Gly Ser Gly
485 490 495
Thr Cys Ser Met Gly Thr Val Val Asp Thr Glu Cys Arg Val Lys Gly
500 505 510
Val Glu Gly Leu Arg Val Val Asp Ser Ser Val Ile Pro Leu Pro Leu
515 520 525
Cys Ala His Tyr Gln Ala Ser Val Tyr Ala Leu Ala Glu Gln Asp Gln
530 535 540
Thr Glu Gln Phe Leu Leu Leu Tyr Gly Asp Gln Thr Val Glu Lys Leu
545 550 555 560
Pro Ala Val Arg Ala Leu Val Glu His Ala Gln Arg Ser Pro Ala Gly
565 570 575
Arg Arg Phe Leu Arg Asp Ala Cys Asp Ile Ile Gln Ile Glu Ile Phe
580 585 590
Ser Leu Asp Thr Asp Glu Arg Ala His Val Gly His Phe Asp Thr Leu
595 600 605
Leu Gln Leu Ala Glu Ser Asn Ala Gln Ala Asp Gln Pro Ser Glu Ile
610 615 620
Val Ala Thr Ile Leu Met Asn Val Thr Arg Leu Gly Glu Phe Ile Leu
625 630 635 640
Tyr Ala Glu Glu His Pro Asn Val Leu Gly Ser Ile Glu Gln Pro Thr
645 650 655
His Ile Val Ala Phe Cys Thr Gly Glu Ile Pro Ala Ala Val Ala Ala
660 665 670
Ala Ala Arg Asp Ser Ile Glu Leu Tyr Asn Leu Ser Ile Glu Thr Val
675 680 685
Arg Ile Ile Cys Arg Phe Ala Arg Asn Ile Ile Arg Arg Ser Val Leu
690 695 700
Val Asp Arg Thr Asn Gly Ser Trp Ala Thr Thr Ile Val Gly Val Ser
705 710 715 720
Pro Gly Arg Val Gln Thr Ile Leu Asp Thr Phe His Gln Ser Gln Asn
725 730 735
Ile Ala Pro Thr Arg Gln Ile Asn Ile Gly Ile Met Ala Ala Gly Trp
740 745 750
Leu Thr Leu Phe Gly Pro Pro Ile Thr Thr Glu Gln Leu Phe Asn Trp
755 760 765
Ser Lys Glu Leu Asp Gly Ala Ser Arg Ile Lys Thr Asp Ala Gly Gly
770 775 780
Gly Val His Leu Pro Asn Leu Pro Glu Leu Asp Leu Asp Glu Val Val
785 790 795 800
Gly Leu Ser Pro Leu Leu Asp Val Pro Ile Thr Pro Lys Ala Arg Leu
805 810 815
Trp Ser Pro Tyr Ser Cys Glu Ile Arg Asn Ala Ala Thr Leu Arg Asp
820 825 830
Leu Ile Arg Gln Val Ile Pro Asp Ile Thr Gln Tyr Ser Leu Arg Leu
835 840 845
Ser Asp Thr Ile Glu Thr Ala Val Lys Gly Leu Ser Asn Gly Ser Val
850 855 860
Lys Val Val Cys Val Gly Tyr Thr Ala His Leu Ile Ser Leu Gln Lys
865 870 875 880
Ser Leu Gln Arg Glu Arg Arg Glu Ala Thr Val Leu Gln His Ser Ser
885 890 895
Ala Gly Ser Thr Phe Phe Thr Ser Pro Arg Gly Gly Ser Glu Ser Ile
900 905 910
Ala Ile Val Gly Met Ser Gly Arg Phe Pro Gly Ser Asp Asn Ile Gln
915 920 925
Glu Tyr Trp Gln Ser Leu Leu Asp Gly Glu Arg His Ile Lys Glu Ile
930 935 940
Pro Lys Asn Arg Phe Asp Leu Ser Lys Trp Tyr Asp Glu Thr Gly Lys
945 950 955 960
Gln Lys Asn Ala Thr Met Asn Arg Ser Gly Ala Phe Leu Asp Arg Pro
965 970 975
Gly Tyr Phe Asp Asn Arg Leu Phe Asn Met Ser Pro Arg Glu Ala Leu
980 985 990
Gln Thr Asp Pro Leu His Arg Met Phe Leu Thr Val Ser Tyr Glu Ala
995 1000 1005
Leu Glu Met Ala Gly Tyr Ser Pro Glu Ala Thr Leu Ala Thr Asn
1010 1015 1020
Ser Asn Arg Ile Ala Thr Tyr Phe Gly Gln Thr Ser Asp Asp Trp
1025 1030 1035
Arg Asp Ile Val Leu Thr Gln Gly Val Asp Ile Tyr Tyr Ala Pro
1040 1045 1050
Gly Ile Cys Arg Ala Phe Ala Pro Gly Arg Leu Asn Tyr His Phe
1055 1060 1065
Lys Trp Gly Gly Pro Ser Tyr Ser Val Asp Ala Ala Cys Ala Ser
1070 1075 1080
Ser Ile Ala Thr Ile Ser Leu Ala Cys Ser Ala Leu Leu Ala Arg
1085 1090 1095
Glu Cys Asp Thr Ala Leu Ala Gly Gly Gly Ser Ile Leu Asp Ser
1100 1105 1110
Pro Ala Pro Phe Ala Gly Leu Ser Arg Gly Gly Phe Leu Ser Pro
1115 1120 1125
Glu Lys Gly Cys Glu Thr Phe His Asp Asp Ala Asp Gly Tyr Val
1130 1135 1140
Arg Gly Glu Gly Val Gly Val Val Val Leu Lys Arg Leu Glu Asp
1145 1150 1155
Ala Val Ala Asp Asn Asp Asn Ile Leu Gly Val Ile Arg Gly Ser
1160 1165 1170
Ala Arg Asn Tyr Ser Lys Gly Ala Ser Ser Ile Thr His Pro Ser
1175 1180 1185
Ser Glu Ala Gln Gln Arg Leu Tyr Arg Gln Val Leu Asn Gln Asn
1190 1195 1200
Ala Ile Asp Ala Ala Ser Val Ser Tyr Val Glu Met His Gly Thr
1205 1210 1215
Gly Thr Gln Ala Gly Asp Ser Thr Glu Met Ser Ser Val Leu Ser
1220 1225 1230
Thr Phe Gly Gln Ser Arg Ser Lys Asp Asn Pro Leu Val Val Gly
1235 1240 1245
Ala Val Lys Ala Asn Ile Gly His Gly Glu Ala Ala Ala Gly Val
1250 1255 1260
Cys Ala Leu Ile Lys Thr Leu Met Met Phe Gln Lys His Thr Ile
1265 1270 1275
Pro Pro Gln Pro Gly Met Pro Phe Lys Leu Asn His His Phe Pro
1280 1285 1290
Asp Leu Glu Lys Met Asn Val His Ile Pro Ala Thr Ala Ile Pro
1295 1300 1305
Leu Thr Ser Ala Ser Asn Ala Ala Lys Arg Arg Ile Phe Leu Asn
1310 1315 1320
Ser Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Leu Leu Glu Glu
1325 1330 1335
Ala Pro Leu Lys His Ser Lys Ala Ser Asp Pro Arg Asn His His
1340 1345 1350
Val Val Thr Phe Ser Ala Arg Thr Pro Phe Ser Leu Arg Ala Ile
1355 1360 1365
Lys Glu Lys Tyr Leu Gln Tyr Ile Arg Leu Asn Pro Asn Thr Ser
1370 1375 1380
Leu Ala Asp Leu Ala Tyr Thr Thr Thr Ala Arg Arg Met His Gln
1385 1390 1395
Ser Ser Ala Arg Ser Thr Phe Thr Ala Thr Ser Ile Glu Asp Phe
1400 1405 1410
Ala Asn Lys Leu Glu Thr Asp Leu Lys Lys Glu Asp Ser Pro Val
1415 1420 1425
Lys Lys Ser Lys Gly Ala Ser Ser Gly Pro Asn Val Val Phe Ala
1430 1435 1440
Phe Thr Gly Gln Gly Ser Gln Tyr Ala Gly Met Ala His Gln Leu
1445 1450 1455
Trp His Asp Ser Ala Val Phe Arg Arg Leu Ile Asp Ser Ile Gln
1460 1465 1470
Ser Ile Ala Thr Ala Leu Asp Leu Pro Lys Phe Val Asp Leu Ile
1475 1480 1485
Ala Ser Gln Ser Phe Asp Leu Ser Lys Ala Ser Pro Ile Gln Thr
1490 1495 1500
Gln Leu Ala Ile Val Ala Leu Glu Ile Gly Leu Ala Gln Leu Trp
1505 1510 1515
Ala Ser Trp Gly Val Gln Pro Ser Leu Val Ile Gly His Ser Leu
1520 1525 1530
Gly Glu Tyr Ala Ala Leu Cys Ile Ser Gly Val Leu Thr Val Ser
1535 1540 1545
Asp Thr Leu Tyr Leu Val Gly Lys Arg Ala Met Met Leu Val Glu
1550 1555 1560
Ser Val Ala Gln Asn Glu Tyr Ala Met Leu Ala Ile Asn Asp Glu
1565 1570 1575
Val Asp Ile Ile Arg Gln Arg Leu Ala Thr Asp Ala Tyr Asn Thr
1580 1585 1590
Cys Glu Ile Ala Cys Ile Asn Ala Pro Lys Ser Thr Val Val Ser
1595 1600 1605
Gly Ala Leu Ser Glu Ile Lys Ile Met Gln Lys Glu Leu Glu Glu
1610 1615 1620
Gln Gly Tyr Arg Ser Thr Leu Leu His Val Pro Phe Gly Phe His
1625 1630 1635
Ser Lys Gln Met Asp Pro Ile Leu Asp Ser Tyr Glu Ser Cys Val
1640 1645 1650
Gln Gly Val Gly Ile Ser Ser Pro Arg Val Pro Ile Ala Ser Thr
1655 1660 1665
Leu Leu Gly Asp Ile Ile Gln Asp Lys Ser Thr Val Ser Ser Val
1670 1675 1680
Tyr Leu Arg Arg Gln Thr Arg Glu Ser Val Asn Phe Val Gly Ala
1685 1690 1695
Leu Gln Ala Ala Gln Val Ser Asn Phe Leu Arg Asp Asp Thr Leu
1700 1705 1710
Phe Leu Glu Met Gly Pro Asp Pro Val Cys Met Ser Leu Val Arg
1715 1720 1725
Ser Thr Leu Gly Thr Ile Ala Thr Pro Arg Leu Leu Pro Ala Leu
1730 1735 1740
Arg Arg Asn Glu Asn Asn Trp Leu Thr Thr Ser Asn Thr Leu Ala
1745 1750 1755
Ala Val His Gln Ala Gly Val Pro Val Asn Trp Pro Asp Tyr His
1760 1765 1770
Arg Glu Phe Thr Asn Cys Leu Thr Leu Leu Asp Leu Pro Thr Tyr
1775 1780 1785
Val Phe Asp Glu Lys Glu Phe Trp Thr Ser Tyr Pro Asp Pro Glu
1790 1795 1800
Gln Leu Ser Gly Val Glu Gln Lys His Leu Ser Pro Pro Pro Val
1805 1810 1815
Pro Ala Val Gln Gly Phe Pro Thr Thr Thr Leu Gln Arg Leu Thr
1820 1825 1830
Gln Glu Ala Phe Glu Asp Gly Lys Ile Ser Val Thr Phe Glu Ser
1835 1840 1845
Ser Thr Ser Asp Pro His Leu Phe Glu Ala Ile Met Gly His Ala
1850 1855 1860
Val Ala Gly Val Thr Ile Cys Ser Ser Ser Ile Phe Ser Asp Met
1865 1870 1875
Ala Leu Ser Ala Ala Arg Tyr Thr Cys Glu Arg Leu Gln Pro Gly
1880 1885 1890
Arg Trp Ser Glu Glu Leu Leu Thr Ile Ser Gly Leu Asp Ile Gln
1895 1900 1905
Arg Pro Ile Val Val Leu Asp Arg Lys Asp Ser His Ile Ile Gln
1910 1915 1920
Ile Asn Ala Lys Leu Asp Ala Lys Thr Glu Glu Val Tyr Ile Ser
1925 1930 1935
Phe Gln Asp Gln Val Gly Lys Pro Ile Gly Ser Cys Lys Ile Ser
1940 1945 1950
Phe His Asp Ala Ala Ser Trp Lys Gln Asn Ile Ser Arg Ile Leu
1955 1960 1965
Tyr Leu Val Ser Phe Arg Ile Asp Val Leu Lys Glu Ala Thr Ile
1970 1975 1980
Thr Gly Gln Gly His Arg Phe Leu Arg Pro Val Ile Tyr Arg Leu
1985 1990 1995
Phe Ser Asn Val Val Asn Tyr Gly Glu Arg Phe Gln Gly Leu Glu
2000 2005 2010
Glu Val Phe Leu Asp Ser Glu Cys Asn Asp Val Val Gly Gln Val
2015 2020 2025
Arg Leu Pro Asp Leu Pro Ser Ser Lys Ser Gly His Phe Leu Tyr
2030 2035 2040
Ser Pro Tyr Leu Leu Asp Ala Val Val His Val Ala Gly Phe Leu
2045 2050 2055
Val Asn Cys Gly Leu Lys Tyr Pro Glu Asp Ile Gly Phe Leu Ala
2060 2065 2070
Ser Ser Phe Glu Ser Trp His Ile Leu Lys Pro Ile Leu Pro Asn
2075 2080 2085
Lys Thr Tyr Thr Ser Tyr Ser His Met Glu Glu Ser Ser Asn Gly
2090 2095 2100
Ser Ser Leu Leu Gly Asp Val Tyr Val Phe Asp Gly Lys Asp Leu
2105 2110 2115
Val Gly Ser Leu Thr Gly Leu Arg Phe Gln Lys Met Lys Lys Ile
2120 2125 2130
Ala Leu Thr Arg Ile Leu Gln Ser Ala Ala Pro His Ser Ser Met
2135 2140 2145
Lys Ile Gly Ala Gly Val Phe Arg Pro Asp Leu Leu Gly Ser Ser
2150 2155 2160
Glu Lys Gln Ser Ser Arg Asn Lys Gln Leu Ala Arg Asp Val Asp
2165 2170 2175
Phe Asp Thr Leu Pro Ser Ser Val Glu Pro Ser Ala Phe Thr Thr
2180 2185 2190
Pro Lys Pro Ser Ser Ser Val Thr Ser Ile Ile Gly His Asp Glu
2195 2200 2205
Pro Gly Val Gly Asp Lys Phe Leu Ala Ala Val Ala Ala Glu Val
2210 2215 2220
Gly Cys Glu Ile Ser Asp Leu Glu Pro Asp Thr Val Phe Gly Asp
2225 2230 2235
Leu Gly Val Asp Ser Leu Met Ala Ile Thr Val Ile Ala Ser Ile
2240 2245 2250
Arg Asn Asp Thr Gly Val Glu Leu Pro Gly Ser Phe Phe Leu Asp
2255 2260 2265
Asn Pro Thr Val Ala Glu Ala Thr Lys Ala Leu Arg Gly Asp Ser
2270 2275 2280
Asp Ala Gly Ile Ser Thr Pro Gln Ser Ser Pro Pro Asn Leu Ser
2285 2290 2295
Pro Lys Ile Arg Gly Glu Glu Val Asn Gly Glu Ser Ser Val Pro
2300 2305 2310
Phe Glu Pro Leu Glu Thr Thr Pro Ser Ile Thr Thr Asp Phe Glu
2315 2320 2325
Val Gly Arg Ala Thr Glu Thr Pro Leu Leu Ile Asp Lys Pro Ala
2330 2335 2340
Ala Thr Leu Leu Leu Gln Gly Ser Val Ala Ser Thr Glu Pro Pro
2345 2350 2355
Leu Phe Leu Leu Ala Asp Gly Thr Gly Ser Val Ser Ser Tyr Ile
2360 2365 2370
Gln Leu Pro Ala Leu Ser Gly Gly Arg Arg Ile Tyr Gly Val Glu
2375 2380 2385
Ser Pro Phe Ala Arg Asp Pro Ser Ala Phe Val Asp Ile Ser Val
2390 2395 2400
Gly Asp Leu Ala Asp Ala Phe Ile Phe Ser Ile Arg Lys Val Gln
2405 2410 2415
Pro Val Gly Pro Tyr Val Ile Gly Gly Ser Ser Leu Gly Ala Ile
2420 2425 2430
His Ala Phe Glu Val Ser His Arg Leu Leu Asn Ala Gly Glu Thr
2435 2440 2445
Val Ser Glu Leu Leu Leu Ile Ala Asn Ala Ala Pro Ile Pro Ala
2450 2455 2460
Pro Ala His Leu Arg His Leu Glu Ile Ser Thr Glu Met Ile Glu
2465 2470 2475
Lys Ser Gly Ile Ala Tyr Gly Thr Gly Arg Lys Lys Leu Ser Thr
2480 2485 2490
Leu Ser Ala Arg Gln Lys Gln His Leu Thr Ala Ser Val Arg Ser
2495 2500 2505
His Val Leu Tyr Glu Pro Gln Ala Phe Thr Glu Thr His Arg Pro
2510 2515 2520
Val His Thr Thr Leu Ile Val Ala Ser Lys Gly Leu Gly Gly Gly
2525 2530 2535
Thr Ser Ser Pro Glu Cys Pro Leu Thr Pro Trp Ile Gln Ala Asn
2540 2545 2550
Trp Gly Ser Ser Glu Thr Leu Gly Trp Asp Gly Leu Val Gly Glu
2555 2560 2565
Ile His Ser Ile His Arg Glu Asp Thr Asp Ser Phe Ser Leu Leu
2570 2575 2580
Lys Tyr Pro Asn Ile Thr Lys Leu Gly Gln Ile Ile Asn Asp Arg
2585 2590 2595
Val Cys His Ala
2600
<210> 17
<211> 1143
<212> DNA
<213> Talaromyces islandicus
<220>
<221> CDS
<222> (1)..(1143)
<400> 17
atg tct gcg agc gta gaa aca gcg tgg tcg cag tgt ctg cga ata att 48
Met Ser Ala Ser Val Glu Thr Ala Trp Ser Gln Cys Leu Arg Ile Ile
1 5 10 15
gca aag gag aca ggg ttt agt atc gac gat atc gat gac gag gat gaa 96
Ala Lys Glu Thr Gly Phe Ser Ile Asp Asp Ile Asp Asp Glu Asp Glu
20 25 30
ttc acc aca gat ctc ggt gtc aac ccg att gtc gca cgg tca att ata 144
Phe Thr Thr Asp Leu Gly Val Asn Pro Ile Val Ala Arg Ser Ile Ile
35 40 45
cgt tct ttc gaa agc gtc ttg aaa aga gac att ccc tcg act gta ttt 192
Arg Ser Phe Glu Ser Val Leu Lys Arg Asp Ile Pro Ser Thr Val Phe
50 55 60
acc cag tgt cca act atc aaa gaa ttt cgc ggc gga tac ttt cag tca 240
Thr Gln Cys Pro Thr Ile Lys Glu Phe Arg Gly Gly Tyr Phe Gln Ser
65 70 75 80
tgc att gat agt atc acg gag cca aag gac gac ctg gca gta aag aaa 288
Cys Ile Asp Ser Ile Thr Glu Pro Lys Asp Asp Leu Ala Val Lys Lys
85 90 95
gct gca aca gcg cac gga gga aat aaa aaa tca act acg aac act act 336
Ala Ala Thr Ala His Gly Gly Asn Lys Lys Ser Thr Thr Asn Thr Thr
100 105 110
cgt acg cga gct cgc gtc ccg atc tcc att gtg ctc caa ggc aag cca 384
Arg Thr Arg Ala Arg Val Pro Ile Ser Ile Val Leu Gln Gly Lys Pro
115 120 125
acg atg gat tgt gcc gag aag acc aac atc ttc ctt cta cct gac ggc 432
Thr Met Asp Cys Ala Glu Lys Thr Asn Ile Phe Leu Leu Pro Asp Gly
130 135 140
agt ggt tcc ggg atg gct tat gtg gaa atg cca ctt atc gat cct tct 480
Ser Gly Ser Gly Met Ala Tyr Val Glu Met Pro Leu Ile Asp Pro Ser
145 150 155 160
act gtc tgt ctt gtt gcg ttg aat agt ccc tat ctc aac cgc gcc tcg 528
Thr Val Cys Leu Val Ala Leu Asn Ser Pro Tyr Leu Asn Arg Ala Ser
165 170 175
gag tac tgt tgt tca atc gaa gaa att gca aga gag tac gtg caa gag 576
Glu Tyr Cys Cys Ser Ile Glu Glu Ile Ala Arg Glu Tyr Val Gln Glu
180 185 190
att cgt aaa cgc caa cct cac gga cct tac gtg ctt ggg ggc tgg tct 624
Ile Arg Lys Arg Gln Pro His Gly Pro Tyr Val Leu Gly Gly Trp Ser
195 200 205
gcc ggt ggt tat tac tca tat gaa gtg gcg tgt gaa ctc atc cgt caa 672
Ala Gly Gly Tyr Tyr Ser Tyr Glu Val Ala Cys Glu Leu Ile Arg Gln
210 215 220
ggt gaa cgt gtg aaa aag ctc att ttg ctc gat tct cct tgt cgg cca 720
Gly Glu Arg Val Lys Lys Leu Ile Leu Leu Asp Ser Pro Cys Arg Pro
225 230 235 240
gat ttt gag gag ctt cca atg gaa gtg gtg cag tat tta tcc aaa aag 768
Asp Phe Glu Glu Leu Pro Met Glu Val Val Gln Tyr Leu Ser Lys Lys
245 250 255
aac ctt atg ggc aac tgg gac cgc agt gct cga cat aca agt gtt cct 816
Asn Leu Met Gly Asn Trp Asp Arg Ser Ala Arg His Thr Ser Val Pro
260 265 270
tct tgg gtc atc gag cat ttc cgc tcg act ctt cgg gcg gta cgt gag 864
Ser Trp Val Ile Glu His Phe Arg Ser Thr Leu Arg Ala Val Arg Glu
275 280 285
tat gtg cca gtg ccg atg gac gct gct gat gct cca gac gaa gtt tgc 912
Tyr Val Pro Val Pro Met Asp Ala Ala Asp Ala Pro Asp Glu Val Cys
290 295 300
atc atc tgg agt cga gaa ggt gta atg cca gca aac cag ctt cga aga 960
Ile Ile Trp Ser Arg Glu Gly Val Met Pro Ala Asn Gln Leu Arg Arg
305 310 315 320
acg ggt ttg gat ctc cgc gtc cgc gtc gca cgt ttt ctt ctc gaa gga 1008
Thr Gly Leu Asp Leu Arg Val Arg Val Ala Arg Phe Leu Leu Glu Gly
325 330 335
aaa cct gat ctc acc agt gca tac ggg tgg gac cgg ctt ttc ccc gga 1056
Lys Pro Asp Leu Thr Ser Ala Tyr Gly Trp Asp Arg Leu Phe Pro Gly
340 345 350
gcg cac atc agc att tcg tct atc tcg ggc aat cac ttc acc ctg atc 1104
Ala His Ile Ser Ile Ser Ser Ile Ser Gly Asn His Phe Thr Leu Ile
355 360 365
aac aaa ccc aac gta agc gtc tgt tcc ttt ccc gag tag 1143
Asn Lys Pro Asn Val Ser Val Cys Ser Phe Pro Glu
370 375 380
<210> 18
<211> 380
<212> PRT
<213> Talaromyces islandicus
<400> 18
Met Ser Ala Ser Val Glu Thr Ala Trp Ser Gln Cys Leu Arg Ile Ile
1 5 10 15
Ala Lys Glu Thr Gly Phe Ser Ile Asp Asp Ile Asp Asp Glu Asp Glu
20 25 30
Phe Thr Thr Asp Leu Gly Val Asn Pro Ile Val Ala Arg Ser Ile Ile
35 40 45
Arg Ser Phe Glu Ser Val Leu Lys Arg Asp Ile Pro Ser Thr Val Phe
50 55 60
Thr Gln Cys Pro Thr Ile Lys Glu Phe Arg Gly Gly Tyr Phe Gln Ser
65 70 75 80
Cys Ile Asp Ser Ile Thr Glu Pro Lys Asp Asp Leu Ala Val Lys Lys
85 90 95
Ala Ala Thr Ala His Gly Gly Asn Lys Lys Ser Thr Thr Asn Thr Thr
100 105 110
Arg Thr Arg Ala Arg Val Pro Ile Ser Ile Val Leu Gln Gly Lys Pro
115 120 125
Thr Met Asp Cys Ala Glu Lys Thr Asn Ile Phe Leu Leu Pro Asp Gly
130 135 140
Ser Gly Ser Gly Met Ala Tyr Val Glu Met Pro Leu Ile Asp Pro Ser
145 150 155 160
Thr Val Cys Leu Val Ala Leu Asn Ser Pro Tyr Leu Asn Arg Ala Ser
165 170 175
Glu Tyr Cys Cys Ser Ile Glu Glu Ile Ala Arg Glu Tyr Val Gln Glu
180 185 190
Ile Arg Lys Arg Gln Pro His Gly Pro Tyr Val Leu Gly Gly Trp Ser
195 200 205
Ala Gly Gly Tyr Tyr Ser Tyr Glu Val Ala Cys Glu Leu Ile Arg Gln
210 215 220
Gly Glu Arg Val Lys Lys Leu Ile Leu Leu Asp Ser Pro Cys Arg Pro
225 230 235 240
Asp Phe Glu Glu Leu Pro Met Glu Val Val Gln Tyr Leu Ser Lys Lys
245 250 255
Asn Leu Met Gly Asn Trp Asp Arg Ser Ala Arg His Thr Ser Val Pro
260 265 270
Ser Trp Val Ile Glu His Phe Arg Ser Thr Leu Arg Ala Val Arg Glu
275 280 285
Tyr Val Pro Val Pro Met Asp Ala Ala Asp Ala Pro Asp Glu Val Cys
290 295 300
Ile Ile Trp Ser Arg Glu Gly Val Met Pro Ala Asn Gln Leu Arg Arg
305 310 315 320
Thr Gly Leu Asp Leu Arg Val Arg Val Ala Arg Phe Leu Leu Glu Gly
325 330 335
Lys Pro Asp Leu Thr Ser Ala Tyr Gly Trp Asp Arg Leu Phe Pro Gly
340 345 350
Ala His Ile Ser Ile Ser Ser Ile Ser Gly Asn His Phe Thr Leu Ile
355 360 365
Asn Lys Pro Asn Val Ser Val Cys Ser Phe Pro Glu
370 375 380
Claims (32)
- 더 단순한 대사산물들로부터 올리베톨산(olivetolic acid) 및 이의 유사체들을 생산하는 일련의 분리된 효소들을 포함하는 생합성 플랫폼으로서, 상기 일련의 효소들은
헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산 및/또는 이들의 유사체들을 포함하는 일련의 대사산물들을 방향족 디올 대사산물로 전환시키는 비-환원 폴리케타이드 합성효소(non-reducing polyketide synthase, NRPKS); 및
상기 방향족 디올 대사산물을 올리베톨산 및 이의 유사체들로 전환시키는 티오에스테라제(thioesterase, TE)를 포함하는 생합성 플랫폼.
- 제1항에 있어서, 아세틸-CoA, 말로닐-CoA 및 NADPH를 이용하여 헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산 및/또는 이들의 유사체로부터 선택되는 일련의 대사산물들을 합성하는 고-환원 폴리케타이드 합성효소(highly-reducing polyketide synthase, HRPKS)를 추가로 포함하는 것을 특징으로 하는 생합성 플랫폼.
- 제1항 또는 제2항에 있어서, 상기 올리베톨산의 유사체들은 2-헵틸-4,6-디히드록시벤조산, (E)-2-(헵트-1-엔-1-일)-4,6-디히드록시벤조산, 및 (E)-2,4-디히드록시-6-(펜트-1-엔-1-일) 벤조산으로 구성된 군으로부터 선택되는 것을 특징으로 하는 생합성 플랫폼.
- 제1항에 있어서, 상기 생합성 플랫폼을 구성하는 하나 이상의 효소들은 진균(fungi)으로부터 유래하는 것을 특징으로 하는 생합성 플랫폼.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 생합성 플랫폼을 구성하는 일련의 효소들은 메타리지움 아니소플리애(Metarhizium anisopliae), 톨리포클라디움 인플라툼(Tolypocladium inflatum), 메타리지움 라일리(Metarhizium rileyi) 및/또는 탈라로마이세스 아일랜드디쿠스(Talaromyces islandicus)로부터 유래하는 것을 특징으로 하는 생합성 플랫폼.
- 제1항에 있어서, 상기 NRPKS는 SEQ ID NO: 4의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는 것을 특징으로 하는 생합성 플랫폼.
- 제6항에 있어서, 상기 NRPKS는 SEQ ID NO: 4, 10 또는 16의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 1 내지 20개의 보존적 아미노산 치환(conservative amino acid substitutions)을 함유하는 것을 특징으로 하는 생합성 플랫폼.
- 제6항에 있어서, 상기 NRPKS는 SEQ ID NO: 4, 10 또는 16의 서열을 포함하는 것을 특징으로 하는 생합성 플랫폼.
- 제1항에 있어서, 상기 TE는 SEQ ID NO: 6의 서열과 적어도 45%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는 것을 특징으로 하는 생합성 플랫폼.
- 제9항에 있어서, 상기 TE는 SEQ ID NO: 6, 12 또는 18의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 1 내지 20개의 보존적 아미노산 치환을 함유하는 것을 특징으로 하는 생합성 플랫폼.
- 제9항에 있어서, 상기 TE는 SEQ ID NO: 6, 12 또는 18의 서열을 포함하는 것을 특징으로 하는 생합성 플랫폼.
- 제2항에 있어서, 상기 HRPKS는 SEQ ID NO: 2의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는 것을 특징으로 하는 생합성 플랫폼.
- 제12항에 있어서, 상기 HRPKS는 SEQ ID NO: 2, 8 또는 14의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 1 내지 20개의 보존적 아미노산 치환을 함유하는 것을 특징으로 하는 생합성 플랫폼.
- 제12항에 있어서, 상기 HRPKS는 SEQ ID NO: 2, 8 또는 14의 서열을 포함하는 것을 특징으로 하는 생합성 플랫폼.
- 제1항 내지 제14항 중 어느 한 항의 생합성 플랫폼을 구성하는 일련의 효소들을 코딩하는 폴리뉴클레오티드 서열들을 포함하는 무세포(cell-free) 시스템에서 생합성 플랫폼을 발현하기 위한 선형 발현 템플릿(linear expression template, LET).
- 제15항에 있어서, 상기 폴리뉴클레오티드는 하기로 구성된 군으로부터 선택되는 폴리펩티드를 코딩하는 것을 특징으로 하는 LET:
(i) SEQ ID NO: 2, 8, 또는 14의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 폴리펩티드;
(ii) SEQ ID NO: 4, 10 또는 16의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 폴리펩티드;
(iii) SEQ ID NO: 6, 12, 또는 18의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 폴리펩티드; 및
(iv) (i), (ii) 및 (iii)의 임의의 조합.
- 제15항에 있어서,
HRPKS 활성을 갖고 SEQ ID NO: 2, 8 또는 14의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열;
NRPKS 활성을 갖고 SEQ ID NO: 4, 10 또는 16의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열; 및
TE 활성을 갖고 SEQ ID NO: 6, 12 또는 18의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열
을 포함하는 것을 특징으로 하는 LET.
- 제15항에 있어서, 상기 LET는 SEQ ID NO:1, 7 및 13으로 구성된 군으로부터 선택되는 폴리뉴클레오티드 서열을 포함하는 것을 특징으로 하는 LET.
- 제15항 또는 제18항에 있어서, 상기 LET는 SEQ ID NO: 3, 9 및 15로 구성된 군으로부터 선택되는 폴리뉴클레오티드 서열을 포함하는 것을 특징으로 하는 LET.
- 제15항, 제18항 또는 제19항에 있어서, 상기 LET는 SEQ ID NO: 5, 11 및 17로 구성된 군으로부터 선택되는 폴리뉴클레오티드 서열을 포함하는 것을 특징으로 하는 LET.
- 제1항 내지 제20항 중 어느 한 항의 생합성 플랫폼을 구성하는 일련의 효소들을 코딩하는 폴리뉴클레오티드 서열들을 포함하는 플라스미드(들) 또는 벡터(들).
- 제21항에 있어서,
HRPKS 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고, 상기 폴리펩티드는 SEQ ID NO: 2, 8 또는 14의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 제1 플라스미드;
NRPKS 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고, 상기 폴리펩티드는 SEQ ID NO: 4, 10 또는 16의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 제2 플라스미드; 및
TE 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고, 상기 폴리펩티드는 SEQ ID NO: 6, 12 또는 18의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 제3 플라스미드
를 포함하는 것을 특징으로 하는 플라스미드(들) 또는 벡터(들).
- 제21항 또는 제22항의 플라스미드(들) 또는 벡터(들)를 포함하는 재조합 미생물.
- 제23항에 있어서, 상기 재조합 미생물은 박테리움(bacterium), 고세균(archaeum) 또는 진균(fungus)인 것을 특징으로 하는 재조합 미생물.
- 제24항에 있어서, 상기 재조합 미생물은 대장균(Escherichia coli), 로드호박터 스페로이데스(Rodhobacter sphaeroides), 슈도알테로모나스 할로플랑크티스(Pseudoalteromonas haloplanktis), 시와넬라 sp. 균주 Ac10(Shewanella sp. strain Ac10), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 푸티다(Pseudomonas putida), 녹농균(Pseudomonas aeruginosa), 할로모나스 엘롱가타(Halomonas elongata), 크로모할로박터 살렉시겐(Chromohalobacter salexigens), 스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 그리세우스(Streptomyces griseus), 노카르디아 락탐두란스(Nocardia lactamdurans), 마이코박테리움 스메그마티스(Mycobacterium smegmatis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘툼(Brevibacterium lactofermentum), 고초균(Bacillus subtilis), 바실러스 브레비스(Bacillus brevis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 락토코커스 락티스(Lactococcus lactis), 락토바실러스 플란타룸(Lactobacillus plantarum), 락토바실러스 카세이(Lactobacillus casei), 락토바실러스 루테리(Lactobacillus reuteri), 및 락토바실러스 가세리(Lactobacillus gasseri)로 구성된 군에서 선택되는 박테리움인 것을 특징으로 하는 재조합 미생물.
- 제25항에 있어서, 상기 재조합 미생물은 대장균속(Escherichia) 또는 슈도모나스 푸티다(Pseudomonas putida)인 것을 특징으로 하는 재조합 미생물.
- 제24항에 있어서, 상기 재조합 미생물은 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피치아 파스토리스(Pichia pastoris), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴리티카(Yarrowia lipolytica), 아스페르길루스 니둘란스(Aspergillus nidulans), 트리코데르마 리세이(Trichoderma reesei), 푸사리움 옥시스포룸(Fusarium oxysporum), 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 아쉬비아 고쉬피(Ashbya gossypii), 누룩곰팡이(A. oryzae), 및 크리소스포리움 룩크노웬스(Chrysosporium lucknowense)로 구성된 군에서 선택되는 박테리움인 것을 특징으로 하는 재조합 미생물.
- 제27항에 있어서, 상기 재조합 미생물은 아스페르길루스 니둘란스(Aspergillus nidulans) 또는 사카로마이세스 세레비지애(Saccharomyces cerevisiae)인 것을 특징으로 하는 재조합 미생물.
- 아세틸-CoA, 말로닐-CoA, NADPH를 제15항 내지 제20항 중 어느 한 항의 LET를 포함하는 무세포 생물계, 또는 생합성 플랫폼을 포함하는 조 추출물 또는 정제된 추출물에 공급하는 단계를 포함하고, 상기 생합성 플랫폼은 제23항 내지 제28항 중 어느 한 항의 재조합 미생물로부터 추출된 것을 특징으로 하는 올리베톨산 및 이의 유사체들을 생산하는 무세포 방법.
- 제23항 내지 제28항 중 어느 한 항의 재조합 미생물을 배양하는 단계를 포함하는 올리베톨산 및 이의 유사체들을 생산하는 방법.
- 제29항에 있어서, 올리베톨산 및 이의 유사체들을 분리(isolating) 및 정제(purifying)하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
- 제30항에 있어서, 올리베톨산 및 이의 유사체들을 분리(isolating) 및 정제(purifying)하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062959849P | 2020-01-10 | 2020-01-10 | |
US62/959,849 | 2020-01-10 | ||
PCT/US2021/012866 WO2021142393A1 (en) | 2020-01-10 | 2021-01-09 | Biosynthetic platform for the production of olivetolic avid and analogues of olivetolic acid |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220126740A true KR20220126740A (ko) | 2022-09-16 |
Family
ID=76788339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227027349A KR20220126740A (ko) | 2020-01-10 | 2021-01-09 | 올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230051453A1 (ko) |
EP (1) | EP4087932A4 (ko) |
JP (1) | JP2023509662A (ko) |
KR (1) | KR20220126740A (ko) |
CN (1) | CN115151643A (ko) |
BR (1) | BR112022013503A2 (ko) |
CA (1) | CA3163708A1 (ko) |
MX (1) | MX2022008463A (ko) |
WO (1) | WO2021142393A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3129577A1 (en) * | 2019-02-10 | 2020-08-13 | Dyadic International (Usa), Inc. | Production of cannabinoids in filamentous fungi |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4551433A (en) | 1981-05-18 | 1985-11-05 | Genentech, Inc. | Microbial hybrid promoters |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US5426039A (en) | 1993-09-08 | 1995-06-20 | Bio-Rad Laboratories, Inc. | Direct molecular cloning of primer extended DNA containing an alkane diol |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US5834252A (en) | 1995-04-18 | 1998-11-10 | Glaxo Group Limited | End-complementary polymerase reaction |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6096548A (en) | 1996-03-25 | 2000-08-01 | Maxygen, Inc. | Method for directing evolution of a virus |
CA2266423A1 (en) | 1996-09-27 | 1998-04-02 | Maxygen, Inc. | Methods for optimization of gene therapy by recursive sequence shuffling and selection |
DE69835360T2 (de) | 1997-01-17 | 2007-08-16 | Maxygen, Inc., Redwood City | EVOLUTION Prokaryotischer GANZER ZELLEN DURCH REKURSIVE SEQUENZREKOMBINATION |
US6326204B1 (en) | 1997-01-17 | 2001-12-04 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
AU6611498A (en) | 1997-03-18 | 1998-10-12 | Novo Nordisk A/S | Method for constructing a library using dna shuffling |
BR9808368A (pt) | 1997-03-18 | 2000-05-23 | Novo Nordisk As | Processos para a construção de uma biblioteca de polinucleotideos homólogos recombinados, para a identificação um polipeptìdeo de interesse, e, para a produção de um polipeptìdeo de interesse. |
US5948653A (en) | 1997-03-21 | 1999-09-07 | Pati; Sushma | Sequence alterations using homologous recombination |
US6153410A (en) | 1997-03-25 | 2000-11-28 | California Institute Of Technology | Recombination of polynucleotide sequences using random or defined primers |
US6399383B1 (en) | 1997-10-28 | 2002-06-04 | Maxygen, Inc. | Human papilloma virus vectors |
EP1030861A4 (en) | 1997-10-31 | 2001-09-05 | Maxygen Inc | MODIFICATION OF VIRAL TROPISM AND THE DIVERSITY OF HOST SPECIES BY RECOMBINATION OF THE VIRAL GENOME |
US6537746B2 (en) | 1997-12-08 | 2003-03-25 | Maxygen, Inc. | Method for creating polynucleotide and polypeptide sequences |
CA2320958A1 (en) | 1998-02-11 | 1999-08-19 | Maxygen, Inc. | Antigen library immunization |
CA2320431A1 (en) | 1998-02-11 | 1999-08-19 | Maxygen, Inc. | Targeting of genetic vaccine vectors |
ATE547532T1 (de) | 1998-06-29 | 2012-03-15 | Bristol Myers Squibb Co | Verfahren zur erzeugung von hochgradig diversen bibliotheken |
FR2782323B1 (fr) | 1998-08-12 | 2002-01-11 | Proteus | Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues |
AU1199000A (en) | 1998-09-29 | 2000-04-17 | Maxygen, Inc. | Shuffling of codon altered genes |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
AU2415200A (en) | 1999-01-18 | 2000-08-01 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
EP1062614A1 (en) | 1999-01-19 | 2000-12-27 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides |
AU2001241939A1 (en) | 2000-02-28 | 2001-09-12 | Maxygen, Inc. | Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation |
CN110914416B (zh) * | 2017-04-27 | 2023-07-21 | 加州大学董事会 | 产生大麻素和大麻素衍生物的微生物和方法 |
-
2021
- 2021-01-09 KR KR1020227027349A patent/KR20220126740A/ko unknown
- 2021-01-09 US US17/791,854 patent/US20230051453A1/en active Pending
- 2021-01-09 CN CN202180016363.2A patent/CN115151643A/zh active Pending
- 2021-01-09 WO PCT/US2021/012866 patent/WO2021142393A1/en unknown
- 2021-01-09 BR BR112022013503A patent/BR112022013503A2/pt unknown
- 2021-01-09 EP EP21738010.4A patent/EP4087932A4/en active Pending
- 2021-01-09 CA CA3163708A patent/CA3163708A1/en active Pending
- 2021-01-09 MX MX2022008463A patent/MX2022008463A/es unknown
- 2021-01-09 JP JP2022540635A patent/JP2023509662A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4087932A1 (en) | 2022-11-16 |
CA3163708A1 (en) | 2021-07-15 |
JP2023509662A (ja) | 2023-03-09 |
EP4087932A4 (en) | 2024-01-17 |
CN115151643A (zh) | 2022-10-04 |
MX2022008463A (es) | 2022-10-18 |
US20230051453A1 (en) | 2023-02-16 |
WO2021142393A1 (en) | 2021-07-15 |
BR112022013503A2 (pt) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110651047B (zh) | 用于在酵母中生产植物大麻素和植物大麻素类似物的方法和细胞系 | |
US10837031B2 (en) | Recombinant production systems for prenylated polyketides of the cannabinoid family | |
CN112789505B (zh) | 用于生产大麻素和其它异戊二烯化的化合物的生物合成平台 | |
US10696991B2 (en) | Nepetalactol oxidoreductases, nepetalactol synthases, and microbes capable of producing nepetalactone | |
KR20100087695A (ko) | 이소프로판올을 생산하도록 조작된 미생물 | |
EP2935566B1 (en) | Cyanobacterium sp. for production of compounds | |
US20220333142A1 (en) | Engineered trans-enoyl coa reductase and methods of making and using | |
KR20220119046A (ko) | 칸나비노이드 및 기타 프레닐화 화합물의 제조를 위한 생합성 플랫폼 | |
JP2017534268A (ja) | 有用産物の生産のための改変微生物および方法 | |
KR20220126740A (ko) | 올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼 | |
CN105940111B (zh) | 从3-羟基羧酸经3-羟基羧基-核苷酸制备烯烃 | |
CN108473972B (zh) | 补身醇合酶iii | |
CN106011164B (zh) | 基因元件、表达载体及其应用 | |
CN114760980A (zh) | 针对10-乙酰基-3,7-二羟基吩噁嗪的过氧化物酶活性 | |
KR101725454B1 (ko) | 하프니아 알베이 유래의 라이신 디카르복실라아제를 코딩하는 유전자, 이를 포함하는 재조합 벡터, 숙주세포 및 이를 이용한 카다베린의 생산방법 | |
WO2023076966A1 (en) | Engineered enzymes and methods of making and using | |
KR20230003072A (ko) | 조작된 효소 및 이의 이용 및 제조 방법 | |
WO2022148377A1 (zh) | 异源合成黄酮类化合物的宿主细胞及其应用 | |
CN116948999B (zh) | 酮还原酶突变体、其组合物、生物材料及应用 | |
EP4410972A1 (en) | Modified benzalacetone synthase enzymes and uses thereof | |
CN111718966A (zh) | 一种丁香酚的微生物合成方法 |