KR20220126740A - 올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼 - Google Patents

올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼 Download PDF

Info

Publication number
KR20220126740A
KR20220126740A KR1020227027349A KR20227027349A KR20220126740A KR 20220126740 A KR20220126740 A KR 20220126740A KR 1020227027349 A KR1020227027349 A KR 1020227027349A KR 20227027349 A KR20227027349 A KR 20227027349A KR 20220126740 A KR20220126740 A KR 20220126740A
Authority
KR
South Korea
Prior art keywords
ala
leu
ser
val
gly
Prior art date
Application number
KR1020227027349A
Other languages
English (en)
Inventor
이 탕
멩빈 첸
이케추쿠 오코라포
Original Assignee
더 리젠츠 오브 더 유니버시티 오브 캘리포니아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 filed Critical 더 리젠츠 오브 더 유니버시티 오브 캘리포니아
Publication of KR20220126740A publication Critical patent/KR20220126740A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/78Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/22Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/102Plasmid DNA for yeast

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

본 발명은 미생물 및 무세포 시스템으로부터 높은 역가로 올리베톨산 및 이의 유사체들을 생성하는 생합성 플랫폼을 제공한다.

Description

올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼
관련 출원에 대한 상호 참조
본 출원은 2020년 1월 10일에 출원된 가출원 일련 번호 62/959,849로부터 35 U.S.C. §119에 따른 우선권을 주장하며, 그 개시 내용은 여기에 참조로 포함된다.
정부 지원 성명서
이 발명은 국립 보건원에서 수여한 보조금 번호 1R35GM11805에 따라 정부 지원으로 만들어졌다. 정부는 발명에 대한 특정 권리를 갖는다.
기술분야
본 발명은 미생물 및 무세포 시스템으로부터 높은 역가로 올리베톨산 및 이의 유사체들을 생성하는 생합성 플랫폼을 제공한다.
서열 목록의 참조에 의한 통합
이 출원과 함께 2021년 1월 7일에 생성되고 IBM-PC, MS-Windows 운영 체제에서 기계 포맷된 350,174바이트의 데이터를 갖는 "Sequence-Listing_ST25"라는 제목의 서열 목록이 있다. 서열 목록은 모든 목적을 위해 그 전체가 참고로 여기에 포함된다.
칸나비노이드(Cannabinoids)는 인간 체내칸나비노이드 시스템의 칸나비노이드 수용체들(CB1 및 CB2)을 조절하고 다른 생물학적 시스템을 조절하는 생리활성 식물 유래 천연 제품의 큰 부류이다. 칸나비노이드는 항암제, 항구토제, 항경련제, 진통제 및 항우울제로서의 치료 이점을 조사하는 100개 이상의 진행 중인 임상 시험을 통해 유망한 약리학적 제제이다. 또한, 3가지 칸나비노이드 요법이 화학요법으로 유발된 메스꺼움, MS 경련 및 중증 간질과 관련된 발작을 치료하기 위해 FDA 승인을 받았다. 의학에서의 중요한 역할에도 불구하고 토종 식물의 낮은 풍부도와 대마초의 법적 일정은 칸나비노이드의 생물학을 풀기 위한 심층 연구를 방해하여 더 넓은 의약 적용을 방해하였다.
본 발명은 더 단순한 대사산물들로부터 올리베톨산(olivetolic acid) 및 이의 유사체들을 생산하는 일련의 분리된 효소들을 포함하는 생합성 플랫폼으로서, 상기 일련의 효소들은 헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산 및/또는 이들의 유사체들을 포함하는 일련의 대사산물들을 방향족 디올 대사산물로 전환시키는 비-환원 폴리케타이드 합성효소(non-reducing polyketide synthase, NRPKS); 및 상기 방향족 디올 대사산물을 올리베톨산 및 이의 유사체로 전환시키는 티오에스테라제(thioesterase)를 포함한다. 일 실시예에서, 상기 플랫폼은 아세틸-CoA, 말로닐-CoA 및 NADPH를 이용하여 헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산 및/또는 이들의 유사체(예를 들어, 부티르산, 헥센산, 옥텐산, 데칸산, 데센산, 라우르산, 나노노익산 및 관련된 co-A 등가물 등)로부터 선택되는 일련의 대사산물들을 합성하는 고-환원 폴리케타이드 합성효소(highly-reducing polyketide synthase, HRPKS)를 추가로 포함한다. 일 실시예에서, 헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산의 유사체는 C6 또는 C8 아실 사슬에서 다양하다. 다른 또는 추가의 실시예에서, 올리베톨산의 유사체들은 2-헵틸-4,6-디히드록시벤조산, (E)-2-(헵트-1-엔-1-일)-4,6-디히드록시벤조산, 및 (E)-2,4-디히드록시-6-(펜트-1-엔-1-일) 벤조산을 포함한다. 또 다른 또는 추가의 실시예에서, 생합성 플랫폼을 구성하는 하나 이상의 효소들은 진균으로부터 유래한다. 또 다른 실시예에서, 상기 생합성 플랫폼을 구성하는 앞서 언급한 일련의 효소들 중 어느 하나는 메타리지움 아니소플리애(Metarhizium anisopliae)로부터 유래된 것이다. 또 다른 실시예에서, 전술한 NRPKS 중 어느 하나는 SEQ ID NO: 4의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는다. 추가 실시예에서, NRPKS는 SEQ ID NO: 2의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 이는 1 내지 20개의 보존적 아미노산 치환(conservative amino acid substitutions)을 함유한다. 또 다른 실시예에서, NRPKS는 SEQ ID NO: 4의 서열을 포함한다. 전술한 어느 하나의 다른 실시예에서, TE는 SEQ ID NO: 3의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는다. 추가 실시예에서, TE는 SEQ ID NO: 6의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 이는 1 내지 20개의 보존적 아미노산 치환을 함유한다. 또 다른 실시예에서, TE는 SEQ ID NO: 6의 서열을 포함한다. 임의의 상기 실시예의 또 다른 실시예에서, HRPKS는 SEQ ID NO: 2의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는다. 추가 실시예에서, HRPKS는 SEQ ID NO: 2의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 이는 1 내지 20개의 보존적 아미노산 치환을 함유한다. 또 다른 실시예에서, HRPKS는 SEQ ID NO: 2의 서열을 포함한다.
본 발명은 또한 임의의 상기 실시예의 생합성 플랫폼을 구성하는 일련의 효소를 코딩하는 폴리뉴클레오티드 서열을 포함하는 무세포 시스템(cell-free system)에서 생합성 플랫폼을 발현하기 위한 선형 발현 템플릿(linear expression template, LET)을 제공한다. 또 다른 실시예에서, LET는 HRPKS 활성을 갖고, SEQ ID NO: 2의 서열과 적어도 95%, 98% 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열; NRPKS 활성을 갖고, SEQ ID NO: 4의 서열과 적어도 95%, 98% 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열; TE 활성을 갖고, SEQ ID NO: 6의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한 본원에 기재된 바와 같은 생합성 플랫폼을 구성하는 일련의 효소들을 코딩하는 폴리뉴클레오티드 서열을 포함하는 플라스미드(들) 또는 벡터(들)를 제공한다. 일 실시예에서, 제1 플라스미드는 HRPKS 활성을 갖고 SEQ ID NO: 2의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고; 제2 플라스미드는 NRPKS 활성을 갖고 SEQ ID NO: 4의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하며; 및 제3 플라스미드는 TE 활성을 갖고 SEQ ID NO: 6의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함한다.
본 발명은 또한, 본 발명의 플라스미드(들) 또는 벡터(들)를 포함하는 재조합 미생물을 제공한다. 일 실시예에서, 상기 재조합 미생물은 박테리움(bacterium), 고세균(archaeum) 또는 진균(fungus)이다. 추가 실시예에서, 상기 재조합 미생물은 대장균(Escherichia coli), 로드호박터 스페로이데스(Rodhobacter sphaeroides), 슈도알테로모나스 할로플랑크티스(Pseudoalteromonas haloplanktis), 시와넬라 sp. 균주 Ac10(Shewanella sp. strain Ac10), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 푸티다(Pseudomonas putida), 녹농균(Pseudomonas aeruginosa), 할로모나스 엘롱가타(Halomonas elongata), 크로모할로박터 살렉시겐(Chromohalobacter salexigens), 스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 그리세우스(Streptomyces griseus), 노카르디아 락탐두란스(Nocardia lactamdurans), 마이코박테리움 스메그마티스(Mycobacterium smegmatis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘툼(Brevibacterium lactofermentum), 고초균(Bacillus subtilis), 바실러스 브레비스(Bacillus brevis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 락토코커스 락티스(Lactococcus lactis), 락토바실러스 플란타룸(Lactobacillus plantarum), 락토바실러스 카세이(Lactobacillus casei), 락토바실러스 루테리(Lactobacillus reuteri), 및 락토바실러스 가세리(Lactobacillus gasseri)로 구성된 군에서 선택되는 박테리움이다. 또 다른 실시예에서, 상기 재조합 미생물은 대장균속(Escherichia) 또는 슈도모나스 푸티다(Pseudomonas putida)이다. 또 다른 실시예에서, 상기 재조합 미생물은 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피치아 파스토리스(Pichia pastoris), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴리티카(Yarrowia lipolytica), 아스페르길루스 니둘란스(Aspergillus nidulans), 트리코데르마 리세이(Trichoderma reesei), 푸사리움 옥시스포룸(Fusarium oxysporum), 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 아쉬비아 고쉬피(Ashbya gossypii), 누룩곰팡이(A. oryzae), 및 크리소스포리움 룩크노웬스(Chrysosporium lucknowense)로 구성된 군에서 선택되는 박테리움이다. 또 다른 실시예에서, 상기 재조합 미생물은 아스페르길루스 니둘란스(Aspergillus nidulans) 또는 사카로마이세스 세레비지애(Saccharomyces cerevisiae)이다.
본 발명은 또한 본 발명의 재조합 미생물을 배양하는 단계를 포함하는 올리베톨산 및 이의 유사체를 생산하는 방법을 제공한다. 일 실시예에서, 상기 방법은 올리베톨산 및 이의 유사체를 분리(isolating) 및 정제(purifying)하는 단계를 추가로 포함한다. 예를 들어, 본 발명에 제시된 연구에서, 예를 들어 진균(fungus) 메타리지움 아니소플리애(Metarhizium anisopliae)에서 유래한 생합성 플랫폼 또는 클러스터는 높은 수율로 올리베톨산 및 이의 유사체를 제공하였다. 생합성 플랫폼은 (1) 고-환원성 폴리케타이드 합성효소(HRPKS), (2) 비-환원성 폴리케타이드 합성효소(NRPKS) 및 (3) 티오에스테라제(TE)를 포함한다. HRPKS는 아세틸-CoA, 말로닐-CoA 및 NADPH를 이용하여 아실-캐리어 단백질(acyl-carrier protein, ACP)에 연결된 C6 또는 C8 아실 사슬을 합성한다. HRPKS의 ACP 도메인은 아실 티오에스테르를 NRPKS의 스타터 유닛 아실-운반체 단백질 트랜스아실라제(starter unit acyl-carrier protein transacylase, SAT) 도메인으로 셔틀한다. 케토신타제(ketosynthase, KS) 도메인에 의해 촉매되는 3개의 탈탄산 축합(decarboxylative condensations) 및 생성물 주형(product template, PT) 도메인에 의한 방향족화 후, TE는 NRPKS에서 생성물을 가수분해하여 다음 촉매 주기를 시작한다. HRPKS의 합성 능력과 NRPKS SAT 도메인의 완화된 기질 선택성으로 인해, 고역가 올리베톨산 및 아실 사슬 길이와 포화도가 다른 세 가지 유사체에 접근할 수 있다. 앞서 언급한 효소는 스페르길루스 니둘란스(Aspergillus nidulans) 및 올리베톨산에서 이종적으로 발현되었으며, 이의 유사체는 대사 최적화 없이 >4 g/L의 총 역가로 수득하였다. 실제로, 생합성 플랫폼은 E. coli 및 효모를 포함하여 올리베톨산 및 이의 유사체를 생산하기 위해 다른 미생물 시스템에서도 발현될 수 있다.
도 1은 칸나비노이드(cannabinoids)의 생합성에서 올리베톨산이 중심적인 역할을 한다는 것을 입증한다.
도 2A-B는 올리베톨산 및 이의 유사체를 생산하기 위해 이용되는 본 발명의 생합성 경로의 실시예를 제공한다. (A) 메타리지움 아니소플리애(Metarhizium anisopliae) ARSEF23으로부터의 OVA를 포함하는 본 발명의 생합성 경로를 나타낸 것이다. (B) 생합성 경로의 이종 발현은 올리베톨산 및 이의 유사체를 제공한다.
도 3은 액체 플라스크 배양물로부터 올리베톨산 및 이의 유사체의 생산에 대한 액체 크로마토그래피(LC) 자취를 제공한다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥이 명백하게 달리 지시하지 않는 한 복수 지시 대상을 포함한다. 따라서, 예를 들어, "폴리케타이드 합성효소"에 대한 언급은 다수의 이러한 폴리케타이드 합성효소를 포함하고 "카나비노이드 중간체"에 대한 언급은 당업자에게 공지된 하나 이상의 칸나비노이드 중간체 및 그의 등가물에 대한 언급을 포함한다.
또한, "또는"의 사용은 달리 명시되지 않는 한 "및/또는"을 의미한다. 유사하게, "comprise", "comprises", "comprising" "include", "include" 및 "include"는 상호 교환 가능하며 제한하려는 의도가 아니다.
다양한 실시예의 설명이 "포함하는(comprising)"이라는 용어를 사용하는 경우, 당업자는 일부 특정 경우에 "본질적으로 구성되는" 또는 "~로 구성되는"이라는 언어를 사용하여 실시예가 대안적으로 설명될 수 있음을 이해할 것이다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 일반적으로 이해되는 것과 동일한 의미를 갖는다. 많은 방법 및 시약이 본 명세서에 기재된 것과 유사하거나 동등하지만, 예시적인 방법 및 물질이 본 명세서에 개시되어 있다.
본 명세서에 언급된 모든 간행물은 본 명세서의 설명과 관련하여 사용될 수 있는 방법론을 기술하고 개시하기 위한 목적으로 전체가 참고로 본 명세서에 포함된다. 또한, 본 개시에서 명시적으로 정의된 용어와 유사하거나 동일한 하나 이상의 간행물에 제시된 용어와 관련하여, 본 개시에 명시적으로 제공된 용어의 정의는 모든 면에서 통제될 것입니다.
본 발명은 본 명세서에 기술된 특정 방법, 프로토콜, 및 시약 등에 제한되지 않고 다양할 수 있음을 이해해야 한다. 본 명세서에서 사용된 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 범위를 한정하려는 의도가 아니며, 청구 범위에 의해서만 정의된다.
작동 실시예에서 또는 달리 지시된 경우를 제외하고, 본원에서 사용된 성분 또는 반응 조건의 양을 나타내는 모든 숫자는 모든 경우에 "약"이라는 용어에 의해 수정된 것으로 이해되어야 한다. 백분율과 관련하여 본 발명을 설명하는 데 사용된 용어 "약"은 ±1%를 의미한다.
본 명세서에 사용된 바와 같이, 효소의 "활성"은 대사산물을 생성하는 반응을 촉매화하는 능력, 즉 "기능"의 척도이며, 반응의 대사산물이 생성되는 속도로서 표현될 수 있다. 예를 들어, 효소 활성은 단위 시간당 또는 단위 효소(예: 농도 또는 중량)당 생성된 대사산물의 양으로, 또는 친화도 또는 해리 상수의 관점에서 나타낼 수 있다.
용어 "생합성 경로(biosynthetic pathway)"는 기질이 더 복잡한 생성물로 전환되거나 단계적 방식으로 분해되는 다단계 효소 촉매 공정(multi-step, enzyme-catalyzed process)을 의미한다. 생합성 경로의 전제 요소는 일반적으로 전구체 화합물(기질), 선택적으로 화학 에너지(예: ATP) 및 조효소가 필요할 수 있는 촉매 효소(예: NADH, NADPH)가 포함된다. 본 발명은 아세틸-CoA 및 말로닐-CoA와 같은 보다 단순한 전구체 화합물로부터 올리베톨산 및 올리베톨산의 유사체를 생산하기 위한 생합성 경로를 제공한다. 본 발명은 또한 올리베톨산 및 올리베톨산 유사체의 생산을 위한 본 명세서에 개시된 생합성 경로를 발현하는 재조합 미생물을 제공한다. 특정 실시예에서, 본 명세서에 개시된 생합성 경로는 하나 이상의 폴리케타이드 합성효소를 포함한다. 추가 실시예에서, 본 명세서에 개시된 생합성 경로는 하나 이상의 티오에스테라제를 포함한다. 특정 실시예에서, 본 명세서의 생합성 경로를 포함하는 조작된 미생물은 조작된 미생물에 이종인 폴리케타이드 합성효소 또는 티오에스테라제로부터 선택되는 적어도 하나의 효소를 포함한다.
"효소"는 일반적으로 하나 이상의 화학적 또는 생화학적 반응을 촉매하거나 촉진하는 단백질 또는 폴리펩티드를 구성하는 아미노산으로 전체적으로 또는 크게 구성된 임의의 물질을 의미한다.
유전자 또는 폴리뉴클레오티드에 대한 용어 "발현"은 유전자 또는 폴리뉴클레오타이드의 전사 및 적절한 경우 생성된 mRNA 전사체의 단백질 또는 폴리펩타이드로의 번역(translation)을 의미한다. 따라서, 문맥에서 명백해지는 바와 같이, 단백질 또는 폴리펩타이드의 발현은 오픈 리딩 프레임의 전사(transcription) 및 번역(translation)의 결과이다.
"대사 산물"은 대사에 의해 생성되는 모든 물질 또는 원하는 대사산물, 화학 물질, 알코올 또는 폴리케타이드 등을 발생시키는 특정 대사 과정에 필요하거나 참여하는 물질을 의미한다. 대사산물은 대사의 출발 물질(예: 탄수화물, 당 인산, 피루브산 등), 중간체(예: 아세틸-coA) 또는 최종 생성물(예: 올리베톨산)을 수행하는 유기 화합물일 수 있다. 대사산물은 더 복잡한 분자를 구성하는 데 사용되거나 더 간단한 분자로 분해될 수 있다. 중간 대사산물은 다른 대사산물에서 합성되어 더 복잡한 물질을 만드는 데 사용되거나 때로는 화학 에너지의 방출과 함께 더 간단한 화합물로 분해될 수 있다.
본 명세서에 사용된 바와 같이, "대사적으로 조작된" 또는 "대사 조작"이라는 용어는 헥사노일-CoA, 또는 미생물 또는 무세포 시스템에서 올리베톨산 또는 이의 유사체와 같은 최종 생성물과 같이 원하는 대사산물의 생산을 위하여 생합성 유전자, 오페론과 관련된 유전자, 및 폴리뉴클레오티드의 제어 요소의 합리적인 경로 설계 및 조립을 포함한다. 생합성 경로의 합리적인 경로 설계 및 조립에는 원하는 대사 산물의 생산을 위한 보조 인자(co-factors)가 포함될 수 있다. "대사적으로 조작된"은 유전 공학 및 원하는 경로로 이어지는 중간체와 경쟁하는 경쟁 대사 경로의 감소, 파괴 또는 녹아웃을 포함하는 적절한 배양 조건을 사용하여 전사, 번역, 단백질 안정성 및 단백질 기능의 조절 및 최적화에 의한 대사 플럭스의 최적화를 추가로 포함할 수 있다. 예를 들어, 무세포 시스템에서 사용되는 하나 이상의 효소를 발현하는 숙주 세포는 경쟁 경로 효소를 제한하거나 제거하여 파괴되거나 무세포 제제에 존재할 수 있는 오염물질 또는 효소를 제거하도록 추가로 조작될 수 있다.
생합성 유전자는 숙주에 대해 이질적이거나 돌연변이유발, 재조합 및/또는 내인성 숙주 세포에서 이종 발현 조절 서열과의 회합에 의해 변형됨으로써 숙주 미생물에 대해 이종성(heterologous)일 수 있다. 일 실시예에서, 폴리뉴클레오티드가 숙주 유기체에 대해 이종 유전적인 경우, 폴리뉴클레오티드는 코돈 최적화될 수 있다.
용어 "폴리뉴클레오타이드", "핵산" 또는 "재조합 핵산"은 폴리뉴클레오타이드, 예를 들어 데옥시리보핵산(DNA), 및 적절한 경우 리보핵산(RNA)을 의미한다. 달리 명확하게 표시되지 않는 한 "T"를 포함하는 모든 서열은 "T"를 "U"로 대체하여 서열을 수정할 수 있음을 인식해야 한다.
본 명세서에서 상호교환적으로 사용되는 용어 "단백질" 또는 "폴리펩티드"는 펩티드 결합이라고 하는 화학 결합에 의해 함께 연결된 아미노산이라고 하는 화학적 빌딩 블록의 하나 이상의 사슬을 포함한다. 단백질 또는 폴리펩티드는 효소로 기능할 수 있다.
용어 "재조합 미생물" 및 "재조합 숙주 세포"는 본 명세서에서 상호교환적으로 사용되며, 이종 폴리뉴클레오티드를 발현하거나 내인성 폴리뉴클레오티드를 과발현하거나, 또는 비발현된 내인성 폴리뉴클레오티드를 발현하도록 유전적으로 변형된 미생물을 의미한다. 폴리뉴클레오티드는 일반적으로 본원에 기재된 바와 같이 원하는 대사산물을 생산하기 위한 대사 경로에 관여하는 표적 효소를 코딩하지만, 조절 또는 활성 또는 전사에 필요한 단백질 인자를 또한 포함할 수 있다. 따라서, 본 명세서에 기재된 재조합 미생물은 이전에 모 미생물(parental microorganism)에 의해 발현되거나 과발현되지 않은 표적 효소를 발현 또는 과발현하도록 유전적으로 조작되었다. 용어 "재조합 미생물" 및 "재조합 숙주 세포"는 특정 재조합 미생물뿐만 아니라 이러한 미생물의 자손(progeny) 또는 잠재적 자손(potential progeny)을 지칭하는 것으로 이해된다. 또한, 재조합 미생물이 폴리펩티드의 공급원으로서 사용될 수 있고 재조합 미생물이 원하는 대사산물의 생성을 위한 전체 경로를 가질 필요는 없다는 것을 이해해야 한다. 오히려, 대사 경로를 위한 폴리펩타이드의 전부는 아니지만 하나 이상을 각각 갖는 복수의 재조합 미생물은 원하는 대사산물을 생산하기 위해 공배양될 수 있거나, 파괴될 수 있고 무세포 환경이 사용되거나 발현된 폴리펩티드가 각각의 재조합 미생물로부터 분리될 수 있다.
용어 "기질" 또는 "적합한 기질"은 효소의 작용에 의해 다른 화합물로 전환되거나 전환되는 것을 의미하는 임의의 물질 또는 화합물을 의미한다. 이 용어는 단일 화합물뿐만 아니라 용액, 혼합물 및 적어도 하나의 기질을 함유하는 기타 물질 또는 이들의 유도체와 같은 화합물의 조합을 포함한다. 또한, 용어 "기질"은 출발 물질로 사용하기에 적합한 탄소원을 제공하는 화합물뿐만 아니라 본원에 기재된 바와 같은 경로에서 사용되는 중간체 및 최종 생성물 대사산물을 포함한다. 또한, 기질은 산화 또는 환원된 보조인자 또는 인산화 또는 탈인산화된 인자일 수 있다.
칸나비노이드의 확장 가능한 화학적 합성은 칸나비노이드의 복잡한 구조로 인해 어려운 과제로 남아 있다. 그러나 많은 장애에 대한 치료 옵션으로서 칸나비노이드에 대한 전례 없는 수요를 고려할 때 높은 역가에서 칸나비노이드를 얻기 위한 지속 가능한 접근 방식은 큰 유용성을 가질 것이다. 칸나비노이드는 주요 빌딩 블록인 제라닐 피로포스페이트(geranyl pyrophosphate, GPP)와 올리베톨산(olivetolic acid, OA)을 생성하는 지방산, 폴리케타이드 및 테르펜 생합성 경로의 조합에서 파생된다. 칸나비노이드의 미생물 발효에서 병목 현상은 단순한 빌딩 블록을 복잡한 후기 단계 화합물에 연결하는 중심 중간체인 올리베톨산(OA)이다(예: 도 1 참조). 현재까지 올리베톨산 합성을 위한 많은 발효 기반 공정이 개발되었다. 예를 들어, 헥사노일-CoA에서 시작하여 폴리케토아실-CoA 티올라제와 올리베톨산 사이클라제(OAC)의 탠덤 작용에 의한 올리베톨산의 구성이 제안되었다. 추가 제안에서는 특정 게라닐 전이효소를 사용하여 올리베톨산을 칸나비게롤산으로 전환할 수 있다고 제안했다. 두 제안 모두 대마(Cannabis sativa)에서 유래한 테트라케타이드 합성효소(tetraketide synthase, TKS)와 올리베톨산 사이클라제(olivetolic acid cyclase, OAC)라는 두 가지 효소의 동시 사용에 의존한다. 이러한 전략을 사용할 때의 단점은 두 가지다. (i) 시작 단위 헥사노일-CoA의 가용성은 일반적으로 미생물 숙주에서 낮으며, 이는 칸나비노이드의 최종 수율을 제한한다. (ii) TKS 및 OAC의 탠덤 사용은 하나의 제품인 올리베톨산만을 제공하지만, 추가 칸나비노이드 유사체의 생성은 칸나비노이드 기본 구조의 사소한 변화의 구조/활성을 결정하는 데 특히 유익할 것이다.
본 발명은 인시투 헥사노일-CoA를 생성할 수 있는 생합성 플랫폼/클러스터를 제공함으로써 상기 문제에 대한 객관적인 기술 솔루션을 제공하고, 추가로 올리베톨산(OA) 뿐만 아니라 그의 유사한 구조적 유사체를 생성함으로써 제품 유연성을 나타낼 수 있다. 추가로, 본 명세서에 기재된 생합성 경로는 비식물 유기체로부터 유래된 OA 합성효소 및 OA 사이클라제를 이용할 수 있어, 미생물 생산 시스템으로부터 OA 및 OA 유사체의 생산을 촉진할 수 있다.
특정 실시예에서, 본 발명은 본 명세서에 개시된 생합성 플랫폼을 포함하는, 올리베톨산 및 그의 유사체를 생성하기 위한 무세포 생물계(cell-free biosystem)를 제공한다. 미생물 시스템은 경쟁 경로로 인한 낮은 수율; 느린 성장률 또는 경로 최적화의 어려움으로 인한 낮은 생산성; 오염 미생물 성장; 제품 독성; 및 고가의 제품 격리를 포함하여 비용 경쟁력을 달성하기 어렵게 만드는 다양한 기술적 문제에 의해 방해를 받을 수 있다. 대조적으로, 무세포 바이오시스템은 이러한 많은 문제를 피할 수 있다. 예를 들어, 무세포 바이오시스템은 산업적 응용에 적합한 몇 가지 장점이 있다: 경로 설계의 더 높은 수준의 유연성; 구성 요소 최적화에 대한 더 큰 제어; 보다 빠른 설계-구축-테스트 주기; 및 중간체 또는 생성물의 세포 독성으로부터의 자유. 시험관 내 바이오시스템은 살아있는 미생물이나 화학 촉매가 구현할 수 없는 생물학적 반응을 구현할 수 있다. 세포막의 장벽이 없는 효소 시스템은 일반적으로 미생물 시스템보다 더 빠른 반응 속도를 갖는다. 예를 들어, 효소 연료 전지는 일반적으로 미생물 연료 전지보다 훨씬 더 높은 출력을 가지고 있다. 효소 칵테일은 또한 미생물보다 독성 화합물에 더 잘 견딘다. 효소 혼합물은 일반적으로 고온, 낮은 pH, 유기 용매 또는 이온성 액체의 존재와 같은 광범위한 반응 조건에서 작동한다. 시험관 내에서 단일 전용 경로를 구축하면 세포에서 발생하는 부반응을 제거할 수 있으므로 거의 100% 수율과 빠른 반응 시간이 가능하다.
무세포 생물계의 공통 구성요소는 세포 추출물, 에너지원, 아미노산 공급, 마그네슘과 같은 보조인자, 및 원하는 유전자를 갖는 DNA를 포함한다. 세포 추출물은 관심 세포를 용해하고 세포벽, DNA 게놈 및 기타 파편을 원심분리하여 수득한다. 나머지는 리보솜, 아미노아실-tRNA 합성효소, 번역 개시 및 신장 인자, 뉴클레아제 등을 포함한 필요한 세포 기계이다.
두 가지 유형의 DNA가 무세포 생물계에서 일반적으로 사용된다: 플라스미드 및 선형 발현 템플릿(LET). 플라스미드는 원형이며 세포 내부에서만 만들어진다. LETs는 인큐베이터에서 세포를 키우는 것보다 훨씬 빠르게 DNA를 복제하는 PCR을 통해 훨씬 더 효과적으로 만들 수 있다. LETs를 만드는 것이 더 쉽고 빠르지만 플라스미드 수율은 일반적으로 무세포 제제에서 훨씬 더 높다. 이 때문에 플라스미드가 있는 무세포 제제의 수율에 접근하기 위해 무세포 제제 LET 수율을 최적화하는 데 더 많은 연구가 집중되었다. 에너지원은 일반적으로 무세포 반응의 일부이다. 일반적으로 아미노산 공급과 함께 필요한 에너지원을 포함하는 별도의 혼합물이 반응을 위해 추출물에 첨가된다. 일반적인 공급원은 포스포엔올피루브산(phosphoenolpyruvate), 아세틸 포스페이트(acetyl phosphate), 크레아티닌 포스페이트(creatinine phosphate)이다.
일 실시에서, 본 발명은 올리베톨산 및 유사체를 생산하는 데 사용되는 본 명세서에 개시된 생합성 플랫폼을 포함하는 플라스미드 기반 무세포 생물계의 사용을 제공한다. 이러한 시스템에 사용되는 플라스미드 또는 벡터는 하기에 제시된 실시예에서 사용된 것과 동일한 벡터 또는 하기에 보다 충분히 기재된 HRPKS, NRPKS 및 ΨAC-TE 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 구축물일 수 있다. 다른 실시예에서, 무세포계는 무세포 추출물에 의해 생성된다. 이 실시예에서, 본 발명의 생합성 플랫폼의 다양한 효소, 예를 들어 HRPKS, NRPKS 및 ΨAC-TE는 미생물에서 발현되고, 추출되어 무세포 생물계에서 조 추출물로서 사용된다. 대안적으로, 다양한 효소는 무세포 생물계에서 사용하기 전에 추가로 정제될 수 있다. 당업계에 공지된 임의의 수의 기술을 사용하여 본원에 개시된 생물계의 효소를 정제할 수 있으며, 친화성 크로마토그래피(예: 금속 결합, 면역친화성, 단백질 태그 등); 전기영동; HPLC 및 LC 크로마토그래피 기반 방법(예: 크기 배제 크로마토그래피, 이온 교환 크로마토그래피, 역상 크로마토그래피, 양이온 교환 크로마토그래피); 여과 기술(예: 겔 여과); 면역블롯팅; 및 원심분리의 사용을 포함한다.
본 발명은 올리베톨산 및 유사체를 생산하는 데 사용되는 본 명세서에 개시된 생합성 플랫폼을 포함하는 LET 기반 무세포 생물계의 사용을 제공한다. 선형 발현 템플릿은 PCR로 빠르게 생성할 수 있어, 여러 구성을 빠르고 쉽게 스크리닝할 수 있다. 발현 벡터는 단백질 생산을 확대할 수 있게 한다. 관심 있는 유전자가 발현 벡터에 직접 삽입되거나 선형 템플릿이 먼저 PCR에 의해 생성되고 이어서 클로닝(cloned)된다. 달성된 단백질 수율은 확장된 기능 및 구조 분석 또는 NMR 분광 또는 X선 결정학 연구를 위한 표지된 단백질의 생산에 충분하다. LET 키트는 biotechrabbit과 같은 다양한 공급업체에서 상업적으로 구입할 수 있다.
본 발명은 본 발명의 생합성 플랫폼을 포함 및/또는 이를 발현시키기 위해 사용되는 조작된 미생물을 추가로 제공한다.
용어 "미생물(microorganism)"은 고세균(Archaea), 박테리아(Bacteria) 및 유카리아(Eucarya) 도메인으로부터의 원핵 및 진핵 미생물 종을 포함하고, 후자는 효모(yeast) 및 사상 진균(filamentous fungi), 원생동물(protozoa), 조류(algae) 또는 고등 원생생물(higher Protista)을 포함한다. 용어 "미생물 세포(microbial cells)" 및 "미생물(microbes)"은 용어 미생물과 상호교환적으로 사용된다.
용어 "원핵생물(prokaryotes)"는 당업계에서 인식되고 있으며 핵 또는 다른 세포 소기관을 함유하지 않는 세포를 의미한다. 원핵생물은 일반적으로 박테리아와 고세균의 두 영역 중 하나로 분류된다. 고세균과 박테리아 도메인의 유기체 사이의 결정적인 차이는 16S 리보솜 RNA의 뉴클레오티드 염기 서열의 근본적인 차이를 기반으로 한다.
용어 "고세균"은 일반적으로 특이한 환경에서 발견되고 리보솜 단백질의 수 및 세포 벽 내 무라믹산의 결핍을 비롯한 여러 기준에 의해 나머지 원핵생물과 구별되는 멘도시쿠테스(Mendosicutes) 분류 유기체의 분류를 의미한다. ssrRNA 분석에 기초하여 고세균은 계통발생학적으로 구별되는 두 그룹인 Crenarchaeota와 Euryarchaeota로 구성된다. 그들의 생리학에 기초하여 고세균은 세 가지 유형으로 구성될 수 있다: 메탄 생성 물질(메탄을 생성하는 원핵생물); 극도의 호염성체(매우 높은 농도의 염([NaCl])에서 사는 원핵생물), 및 극단(하이퍼) thermophilus(매우 높은 온도에서 사는 원핵생물). 박테리아와 구별되는 통합된 고고생물의 특징(즉, 세포벽에 뮤레인이 없음, 에스테르 결합 막 지질 등)외에도, 이 원핵생물은 특정 서식지에 적응하는 독특한 구조적 또는 생화학적 특성을 나타낸다. 크렌고균(Crenarchaeota)은 주로 고온성 황-의존성 원핵생물로 구성되며 에우리고균(Euryarchaeota)은 메탄생성균과 극도의 호염성 생물을 포함한다.
"박테리아(Bacteria)" 또는 "진정박테리아(eubacteria)"는 원핵 유기체의 도메인을 의미한다. 박테리아는 다음과 같이 최소한 11개의 별개의 그룹을 포함한다: (1) 그람 양성(그람+) 박테리아, 그 중 두 가지 주요 하위 분류가 있다: (1) 높은 G+C 그룹(방선균, 마이코박테리아, 마이크로코커스 등) (2) 낮은 G+C 그룹(바실러스, 클로스트리디아, 락토바실러스, 포도상구균, 연쇄상구균, 마이코플라스마); (2) 프로테오박테리아, 예를 들어 보라색 광합성 +비-광합성 그람-음성 박테리아(대부분의 "일반적인" 그람-음성 박테리아 포함); (3) 시아노박테리아, 예를 들어, 산소 광영양체; (4) 스피로헤타 및 관련 종; (5) 플랑토마이세스; (6) 박테로이데스, 플라보박테리아; (7) 클라미디아; (8) 녹색 유황 박테리아; (9) 녹색 비-황 박테리아(또한 혐기성 광영양체); (10) 방사선 내성 미세 구균 및 동족; 및 (11) Thermotoga 및 Thermosipho 호열성 물질.
"그람-음성 박테리아"는 구균(cocci), 비장내 간상체(nonenteric rods) 및 장내 간상체(enteric rods)를 포함한다. 그람 음성 박테리아의 속은 예를 들어 나이세리아(Neisseria), 스피릴룸(Spirillum), 파스퇴렐라(Pasteurella), 브루셀라(Brucella), 예르시니아(Yersinia), 프란시셀라(Francisella), 헤모필루스(Haemophilus), 보르데텔라(Bordetella), 에스케리키아(Escherichia), 살모넬라(Salmonella), 시겔라(Shigella), 클렙시엘라(Klebsiella), 프로테우스(Proteus), 비브리오(Vibrio), 슈도모나스(Pseudomonas), 박테로이데스(Bacteroides), 아세토박테리움(Acetobacterium), 에어로박터(Aerobacter), 아조토박터(Azotobacter), 스피릴라(Spirilla), 세라티아(Serratia), 비브리오(Vibrio), 리조비움(Rhizobium), 클라미디아(Chlamydia), 리케차(Rickettsia), 트레포네마(Treponema) 및 푸소박테리움(Fusobacterium)을 포함한다.
"그람 양성 박테리아"는 구균(cocci), 비포자성 간상체(nonsporulating rods) 및 포자성 간상체(sporulating rods)를 포함한다. 그람 양성 박테리아의 속은 예를 들어, 악티노마이세스(Actinomyces), 바실러스(Bacillus), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 에리시펠로트릭스(Erysipelothrix), 락토바실러스(Lactobacillus), 리스테리아(Listeria), 마이코박테리움(Mycobacterium), 믹소코커스(Myxococcus), 노카르디아(Nocardia), 스타필로코커스(Staphylococcus), 스트렙토코커스(Streptococcus) 및 스트렙토마이세스(Streptomyces)를 포함한다.
따라서, 본 발명은 유전 물질을 선택된 숙주 또는 모 미생물에 도입함으로써 생성된 "조작된" 또는 "변형된" 미생물을 제공함으로써 미생물의 세포 생리학 및 생화학을 변형 또는 변경시킨다. 유전 물질의 도입을 통해, 모 미생물은 새로운 특성, 예를 들어 새로운 또는 더 많은 양의 세포 내 대사산물을 생산하는 능력을 얻는다. 모 미생물에 도입된 유전 물질은 생합성 플랫폼에 관련된 하나 이상의 효소를 코딩하는 유전자(들) 또는 유전자(들)의 일부를 포함하고, 올리베톨산 및 이의 유사체 생성에 관여하는 하나 이상의 효소를 코딩하는 유전자(들) 또는 유전자(들)의 일부를 포함하며, 또한 이들 유전자의 발현 및/또는 발현 조절을 위한 추가 요소, 예를 들어 프로모터 서열을 포함할 수 있다. 본 명세서에 개시된 생합성 경로를 발현하도록 조작될 수 있는 미생물은 박테리아, 고세균, 조류 및 진균을 포함한다. 본 명세서에 개시된 생합성 경로를 발현하도록 조작될 수 있는 적절한 박테리아의 예로, 대장균(Escherichia coli), 로드호박터 스페로이데스(Rodhobacter sphaeroides), 슈도알테로모나스 할로플랑크티스(Pseudoalteromonas haloplanktis), 시와넬라 sp. 균주 Ac10(Shewanella sp. strain Ac10), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 푸티다(Pseudomonas putida), 녹농균(Pseudomonas aeruginosa), 할로모나스 엘롱가타(Halomonas elongata), 크로모할로박터 살렉시겐(Chromohalobacter salexigens), 스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 그리세우스(Streptomyces griseus), 노카르디아 락탐두란스(Nocardia lactamdurans), 마이코박테리움 스메그마티스(Mycobacterium smegmatis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘툼(Brevibacterium lactofermentum), 고초균(Bacillus subtilis), 바실러스 브레비스(Bacillus brevis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 락토코커스 락티스(Lactococcus lactis), 락토바실러스 플란타룸(Lactobacillus plantarum), 락토바실러스 카세이(Lactobacillus casei), 락토바실러스 루테리(Lactobacillus reuteri), 및 락토바실러스 가세리(Lactobacillus gasseri)를 포함한다. 본 명세서에 개시된 생합성 경로를 발현하도록 조작될 수 있는 적절한 고세균의 예로, 메타노칼도코커스 야나시(Methanocaldococcus jannaschii)(메타노코커스 야나시(Methanococcus jannaschii)) 및 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus)가 있다. 본 명세서에 개시된 생합성 경로를 발현하도록 조작될 수 있는 적절한 진균의 예로, 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피치아 파스토리스(Pichia pastoris), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴리티카(Yarrowia lipolytica), 아스페르길루스 니둘란스(Aspergillus nidulans), 트리코데르마 리세이(Trichoderma reesei), 푸사리움 옥시스포룸(Fusarium oxysporum), 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 아쉬비아 고쉬피(Ashbya gossypii), 누룩곰팡이(A. oryzae), 및 크리소스포리움 룩크노웬스(Chrysosporium lucknowense)를 포함한다.
조작되거나 변형된 미생물은 숙주 또는 모 미생물에 유전 물질을 도입하는 것 외에 대안으로 또는 추가로, 미생물의 세포 생리학 및 생화학을 변경하기 위해 유전자 또는 폴리뉴클레오티드의 파괴, 결실 또는 녹아웃을 포함할 수 있다. 유전자 또는 폴리뉴클레오타이드의 감소, 파괴 또는 녹아웃을 통해 미생물은 새롭거나 개선된 특성(예: 새롭거나 더 많은 양의 세포내 대사산물 생성, 원하는 경로로 대사산물의 흐름 개선, 및/또는 또는 바람직하지 않은 부산물의 생산을 감소)을 얻는다. 예를 들어, 경쟁 경로의 효소를 제거하면서 대사 경로에서 원하는 효소 세트를 발현하도록 유기체를 조작하는 것이 바람직할 수 있다. 이 엔지니어링은 시험관 내(파괴 또는 정제 시 바람직하지 않은 효소가 존재하지 않는 경우) 또는 생체 내 모두에 적용할 수 있다.
"천연" 또는 "야생형" 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포는 자연에서 발생하는 단백질, 효소, 폴리뉴클레오티드, 유전자 또는 세포를 의미한다.
"모 미생물"은 재조합 미생물을 생성하는데 사용되는 세포를 의미한다. 용어 "모 미생물"은 일 실시예에서, 자연에서 발생하는 세포, 즉 유전적으로 변형되지 않은 "야생형" 세포를 설명한다. 용어 "모 미생물"은 추가 조작을 위한 "모" 역할을 하는 세포를 추가로 설명한다. 이 후자의 실시예에서, 세포는 유전적으로 조작되었을 수 있지만, 추가 유전 조작을 위한 소스 역할을 한다.
예를 들어, 야생형 미생물은 HRPKS와 같은 제1 표적 효소를 발현하거나 과발현하도록 유전적으로 변형될 수 있다. 이 미생물은 제2 표적 효소를 발현하거나 과발현하도록 변형된 미생물의 생성에서 모 미생물로서 작용할 수 있다. 본 명세서에 사용된 "발현" 또는 "과발현"은 원하는 유전자 생성물의 표현형 발현(phenotypic expression)을 의미한다. 일 실시예에서, 유기체에서 자연 발생 유전자는 이종 프로모터 또는 조절 도메인에 연결되도록 조작될 수 있으며, 여기서 조절 도메인은 유전자의 발현을 유발하여 야생형 유기체에 비해 그의 정상 발현을 변형시킨다. 대안적으로, 유기체는 유전자에 대한 억제인자 기능을 제거하거나 감소시켜 발현을 변형시키도록 조작될 수 있다. 또 다른 실시예에서, 원하는 발현 조절/조절 요소에 작동가능하게 연결된 유전자 서열을 포함하는 카세트는 미생물에 조작된다. 원하는 발현 조절/조절 요소에 작동 가능하게 연결된 유전자 서열을 포함하는 카세트가 미생물에 조작된다.
따라서, 모 미생물은 연속적인 유전자 변형 이벤트에 대한 참조 세포로서 기능한다. 각각의 변형 이벤트는 하나 이상의 핵산 분자를 참조 세포에 도입함으로써 달성될 수 있다. 도입은 하나 이상의 표적 효소의 발현 또는 과발현 또는 하나 이상의 표적 효소의 감소 또는 제거를 촉진한다. 용어 "촉진한다"는 예를 들어, 모 미생물에서 프로모터 서열의 유전적 변형을 통해 표적 효소를 코딩하는 내인성 폴리뉴클레오티드(endogenous polynucleotides)의 활성화를 포함하는 것으로 이해된다. 또한, 용어 "촉진한다"는 표적 효소를 코딩하는 외인성 폴리뉴클레오티드(exogenous polynucleotides)를 모 미생물에 도입하는 것을 포함하는 것으로 이해된다.
올리베톨산 및 이의 유사체를 생성하기 위한 효소를 코딩하는 폴리뉴클레오티드는 상동체, 변이체, 단편, 관련 융합 단백질 또는 이의 기능적 등가물을 포함하며, 박테리아(bacterial) 또는 효모 세포(yeast cells)와 같은 적절한 숙주 세포에서 이러한 폴리펩티드의 발현을 지시하는 재조합 핵산 분자에 사용된다.
본 명세서에 기재된 폴리뉴클레오티드는 "유전자"를 포함하고, 상기 기재된 핵산 분자는 "벡터" 또는 "플라스미드"를 포함하는 것으로 이해된다. 따라서, "구조적 유전자"라고도 하는 용어 "유전자"는 하나 이상의 단백질 또는 효소의 전부 또는 일부를 포함하는 아미노산 서열을 포함하는 특정 폴리펩티드를 코딩하는 폴리뉴클레오티드를 의미하고, 조절(전사되지 않은) DNA 서열, 예를 들어 유전자가 발현되는 조건을 결정하는 프로모터 영역 또는 발현 조절 요소를 포함할 수 있다. 유전자의 전사 영역은 코딩 서열 뿐만 아니라 인트론, 5'-UTR(untranslated region), 3'-UTR을 포함하는 비번역 영역을 포함할 수 있다.
당해 분야의 숙련가는 유전자 코드의 퇴행성 특성으로 인해, 뉴클레오티드 서열이 상이한 다양한 코돈을 사용하여 주어진 아미노산을 코딩할 수 있음을 인식할 것이다. 본 명세서에 기재된 생합성 효소 또는 폴리펩타이드(예를 들면, SEQ ID NO: 2)를 코딩하는 특정 폴리뉴클레오타이드 또는 유전자 서열은 단지 본 발명의 실시예를 예시하기 위해 본 명세서에 참조되며,
본 발명은 본 발명의 방법에 이용된 폴리펩티드 및 효소의 단백질과 동일한 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 임의의 서열의 폴리뉴클레오티드 또는 그에 대해 적어도 50%-99% 동일한 폴리펩티드 서열을 포함한며, 100% 동일성을 갖는 서열로서의 생물학적 활성을 갖는다. 예를 들어, 폴리펩티드는 전형적으로 원하는 활성의 손실 또는 상당한 손실 없이 그의 아미노산 서열에서 하나 이상의 아미노산 치환, 결실 및 삽입을 견딜 수 있다. 본 발명은 교대 아미노산 서열을 갖는 이러한 폴리펩티드를 포함하고, 본 명세서에 제시된 아미노산 서열은 단지 본 발명의 예시적인 실시예를 예시한다.
본 발명은 하나 이상의 표적 효소를 코딩하는, 본 명세서의 다른 곳에서 더 상세히 기재된 바와 같이, 재조합 DNA 발현 벡터 또는 플라스미드 형태의 폴리뉴클레오티드를 제공한다. 일반적으로, 이러한 벡터는 숙주 미생물의 세포질에서 복제하거나, 숙주 미생물의 염색체 DNA에 통합될 수 있고, 무세포 시스템에서 사용될 수 있다. 두 경우 모두 벡터는 안정적인 벡터(즉, 벡터는 선택적인 압력만 있어도 많은 세포 분열에 걸쳐 존재함) 또는 일시적인 벡터(즉, 벡터는 세포 분열 수가 증가함에 따라 숙주 미생물에 의해 점차적으로 손실됨)일 수 있다. 본 발명은 분리된 형태(즉, 순수하지 않지만, 자연에서 발견되지 않는 풍부 및/또는 농도로 제제에 존재함) 및 정제된 형태(즉, 오염 물질이 실질적으로 없거나 해당 DNA가 자연에서 발견되는 물질이 실질적으로 없음)로 DNA 분자를 제공한다.
본 발명의 폴리뉴클레오티드는 표준 PCR 증폭 기술 및 하기 실시예 섹션에 기재된 절차에 따라 주형 및 적절한 올리고뉴클레오티드 프라이머로서 cDNA, mRNA 또는 대안적으로 게놈 DNA를 사용하여 증폭될 수 있다. 그렇게 증폭된 핵산은 적절한 벡터로 클로닝될 수 있고, DNA 서열 분석에 의해 특성화될 수 있다. 또한, 뉴클레오티드 서열에 상응하는 올리고뉴클레오티드는 예를 들어 자동화된 DNA 합성기를 사용하여 표준 합성 기술에 의해 제조될 수 있다.
또한, 본 명세서에 기재된 효소와 상동성인 폴리펩티드를 코딩하는 분리된 폴리뉴클레오티드 분자는 특정 폴리펩티드를 코딩하는 뉴클레오티드 서열에 하나 이상의 뉴클레오티드 치환, 부가 또는 결실을 도입함으로써 생성될 수 있으며, 이로써 하나 이상의 아미노 산 치환, 첨가 또는 결실이 암호화된 단백질에 도입된다. 돌연변이는 부위 지정 돌연변이 유발 및 PCR 매개 돌연변이 유발과 같은 표준 기술에 의해 폴리뉴클레오타이드에 도입될 수 있다. 비보존적 아미노산 치환을 만드는 것이 바람직할 수 있는 위치와 대조적으로, 일부 위치에서는 보존적 아미노산 치환을 만드는 것이 바람직하다.
당업자에 의해 이해되는 바와 같이, 특정 숙주에서 그의 발현을 향상시키기 위해 코딩 서열을 변형시키는 것이 유리할 수 있다. 유전 코드는 64개의 가능한 코돈으로 중복되지만 대부분의 유기체는 일반적으로 이러한 코돈의 하위 집합을 사용한다. 한 종에서 가장 많이 사용되는 코돈을 최적 코돈이라고 하고, 자주 사용되지 않는 코돈을 희귀 코돈 또는 저사용 코돈으로 분류한다. 코돈은 숙주의 선호하는 코돈 사용을 반영하기 위해 대체될 수 있으며, 때때로 "코돈 최적화" 또는 "종 코돈 편향 제어"라고 하는 프로세스이다.
특정 원핵 또는 진핵 숙주가 선호하는 코돈을 함유하는 최적화된 코딩 서열(참고 항목 Murray et al. (1989) Nucl. Acids Res. 17:477-508)은 예를 들어, 번역 속도를 증가시키거나 최적화되지 않은 서열로부터 생성된 전사물과 비교하여 더 긴 반감기와 같은 바람직한 특성을 갖는 재조합 RNA 전사물을 생성하기 위해 제조될 수 있다. 번역 정지 코돈은 호스트 선호도를 반영하도록 수정될 수도 있다. 예를 들어, S. cerevisiae 및 포유류에 대한 전형적인 정지 코돈은 각각 UAA 및 UGA이다. 단자엽(monocotyledonous) 식물에 대한 전형적인 정지 코돈은 UGA인 반면, 곤충 및 대장균은 일반적으로 UAA를 정지 코돈으로 사용한다(Dalphin et al. (1996) Nucl. Acids Res. 24: 216-218).
"형질전환(Transformation)"은 벡터가 숙주 세포에 도입되는 과정을 의미한다. 형질전환(또는 형질도입(transduction) 또는 형질감염(transfection))은 전기천공, 미세주입, 바이오리스틱(또는 입자 충격 매개 전달), 또는 아그로박테리움 매개 형질전환을 포함하는 다수의 수단 중 임의의 하나에 의해 달성될 수 있다.
"벡터"는 일반적으로 유기체, 세포 또는 세포 성분 사이에서 증식 및/또는 전달될 수 있는 폴리뉴클레오티드를 의미한다. 벡터에는 바이러스, 박테리오파지, 프로바이러스, 플라스미드, 파지미드, 트랜스포존 및 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체) 및 PLAC(식물 인공 염색체) 등과 같은 인공 염색체가 포함되며, 즉, 자율적으로 복제하거나 숙주 세포의 염색체에 통합될 수 있는 "에피솜"이다. 벡터는 또한 네이키드 RNA 폴리뉴클레오타이드, 네이키드 DNA 폴리뉴클레오타이드, 동일한 가닥 내에서 DNA와 RNA 모두로 구성된 폴리뉴클레오타이드, 폴리-리신-컨쥬게이션된 DNA 또는 RNA, 펩타이드-컨쥬게이션된 DNA 또는 RNA, 리포솜-컨쥬게이트된 DNA 등, 본질적으로 에피솜이 아니거나, 박테리움 또는 진균과 같은 상기 폴리뉴클레오티드 구조물 중 하나 이상을 포함하는 유기체일 수 있다.
발현 벡터의 다양한 성분은 벡터의 의도된 용도 및 벡터가 발현을 복제하거나 유도하도록 의도된 숙주 세포(들)에 따라 광범위하게 변할 수 있다. 박테리아, 효모, 사상균 및 기타 일반적으로 사용되는 세포에서 유전자의 발현 및 벡터의 유지에 적합한 발현 벡터 성분은 널리 알려져 있고 상업적으로 입수가능하다. 예를 들어, 본 발명의 발현 벡터에 포함시키기에 적합한 프로모터는 진핵생물 또는 원핵생물 숙주 미생물에서 기능하는 것을 포함한다. 프로모터는 숙주 미생물의 성장과 관련된 발현의 조절을 가능하게 하거나 화학적 또는 물리적 자극에 반응하여 유전자의 발현이 켜지거나 꺼지도록 하는 조절 서열을 포함할 수 있다. E. coli 및 특정 다른 박테리아 숙주 세포의 경우, 생합성 효소, 항생제 내성 부여 효소 및 파지 단백질에 대한 유전자로부터 유래된 프로모터가 사용될 수 있으며, 예를 들어 갈락토스, 락토스(lac), 말토스, 트립토판(trp), 베타-락타마제(bla), 박테리오파지 람다 PL 및 T5 프로모터를 포함한다. 또한, tac 프로모터(미국 특허 제4,551,433호, 전문이 본원에 참고로 포함됨)와 같은 합성 촉진제가 또한 사용될 수 있다. E. coli 발현 벡터의 경우, pUC, p1P, p1 및 pBR과 같은 E. coli 복제 기점을 포함하는 것이 유용하다.
따라서, 재조합 발현 벡터는 본 명세서에 개시된 생합성 플랫폼을 위한 적어도 하나의 발현 시스템을 함유하고, 이는 차례로 프로모터에 작동가능하게 연결된 유전자 코딩 서열의 적어도 일부 및 임의적으로 호환 가능한 숙주 세포에서 코딩 서열의 발현에 영향을 미치도록 작동하는 종결 서열로 구성된다. 숙주 세포는 발현 시스템 서열을 염색체외 요소로서 함유하거나 염색체 내로 통합되도록 본 발명의 재조합 DNA 발현 벡터를 사용한 형질전환에 의해 변형된다.
시험관 내 증폭 방법을 통해 숙련된 사람을 지도하기에 충분한 프로토콜의 예로, 중합효소연쇄반응(PCR), 리가제연쇄반응(LCR), Qβ-복제효소 증폭 및 기타 RNA 중합효소 매개 기술(예: NASBA)을 포함하며, 예를 들어 본 발명의 상동 핵산의 생산에 대한 것은, Berger, Sambrook, 및 Ausubel, 또한 Mullis et al. (1987) U.S. Pat. No. 4,683,202; Innis et al., eds. (1990) PCR 프로토콜: 방법 및 응용 프로그램의 가이드(Academic Press Inc. San Diego, Calif.) ("Innis"); Arnheim & Levinson (Oct. 1, 1990) C&EN 36-47; The Journal Of NIH Research (1991) 3: 81-94; Kwoh et al. (1989) Proc. Natl. Acad. Sci. USA 86: 1173; Guatelli et al. (1990) Proc. Nat'l. Acad. Sci. USA 87: 1874; Lomell et al. (1989) J. Clin. Chem 35: 1826; Landegren et al. (1988) Science 241: 1077-1080; Van Brunt (1990) Biotechnology 8: 291-294; Wu and Wallace (1989) Gene 4:560; Barringer et al. (1990) Gene 89:117; 및 Sooknanan and Malek (1995) Biotechnology 13:563-564에서 발견된다.
시험관내 증폭된 핵산을 클로닝하기 위한 개선된 방법은 Wallace et al., U.S. Pat. No. 5,426,039에 개시되어 있다.
PCR에 의해 큰 핵산을 증폭하는 개선된 방법은 Cheng et al. (1994) Nature 369: 684-685 및 여기에 인용된 참고 문헌에서, 최대 40 kb의 PCR 앰플리콘이 생성되는 것이 요약되어 있다. 당업자는 본질적으로 임의의 RNA가 역전사효소 및 중합효소를 사용하여 제한 소화, PCR 확장 및 서열분석에 적합한 이중 가닥 DNA로 전환될 수 있음을 이해할 것이다. 예를 들어, 위의 Ausubel, Sambrook 및 Berger를 참조하십시오.
추가로, 그리고 위에서 언급한 바와 같이, 생산에 유용한 본 발명의 생합성 플랫폼의 효소의 상동체(예를 들어, HRPKS, NRPKS, 및 TE)는 본 명세서에 제공된 미생물 및 방법에 포함된다. 첫 번째 과(first family) 또는 종(species)의 원래 효소 또는 유전자와 관련하여 사용된 "상동체"라는 용어는 기능적, 구조적 또는 게놈적 분석에 의해 결정되는 두 번째 과(second family) 또는 종의 별개의 효소 또는 유전자를 의미하고, 첫 번째 과 또는 종의 원래 효소 또는 유전자에 해당하는 두 번째 과 또는 종의 효소 또는 유전자를 의미한다. 대부분의 경우 상동체는 기능적, 구조적 또는 게놈 유사성을 갖는다. 유전자 프로브 및 PCR을 사용하여 효소 또는 유전자의 상동체를 쉽게 복제할 수 있는 기술이 알려져 있다. 상동체로서의 복제된 서열의 동일성은 기능적 분석 및/또는 유전자의 게놈 매핑을 사용하여 확인할 수 있다.
단백질을 코딩하는 핵산 서열이 제2 단백질을 코딩하는 핵산 서열과 유사한 서열을 갖는 경우 단백질은 제2 단백질에 "상동관계(homologous)"을 갖거나 "상동성(homologous)"이다. 대안적으로, 두 단백질이 "유사한" 아미노산 서열을 갖는다면, 단백질은 두 번째 단백질과 상동성을 갖는다. (따라서, "상동 단백질"이라는 용어는 두 단백질이 유사한 아미노산 서열을 갖는 것을 의미하는 것으로 정의된다).
본 발명에 사용된 바와 같이, 2개의 단백질(또는 단백질의 영역)은 아미노산 서열이 적어도 약 50% 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖을 때 실질적으로 상동성이다. 2개의 아미노산 서열 또는 2개의 핵산 서열의 동일성 퍼센트를 결정하기 위해 최적의 비교 목적을 위해 서열을 정렬한다(예를 들어, 갭은 최적의 정렬을 위해 첫 번째 및 두 번째 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 도입될 수 있고 비-상동성 서열은 비교 목적으로 무시될 수 있다). 일 실시예에서, 비교 목적으로 정렬된 참조 서열의 길이는 30% 이상, 전형적으로 40% 이상, 보다 전형적으로 50% 이상, 훨씬 더 전형적으로 60% 이상, 및 훨씬 더 전형적으로 참조 서열 길이의 70%, 80%, 90%, 100% 이상이다. 상응하는 아미노산 위치 또는 뉴클레오타이드 위치에서 아미노산 잔기 또는 뉴클레오타이드를 비교한다. 첫 번째 서열의 위치가 두 번째 서열의 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자는 그 위치에서 동일하다(본 명세서에 사용된 아미노산 또는 핵산 "동일성"은 아미노산 또는 핵산 "상동성"과 동등하다). 두 서열 사이의 퍼센트 동일성은 두 서열의 최적 정렬을 위해 도입되어야 하는 간격의 수와 각 간격의 길이를 고려하여 서열이 공유하는 동일한 위치의 수의 함수(function)이다.
퍼센트 서열 동일성으로도 지칭될 수 있는 폴리펩티드에 대한 서열 상동성은 일반적으로 서열 분석 소프트웨어를 사용하여 측정된다. 예를 들어, Sequence Analysis Software Package of the Genetics Computer Group(GCG), University of Wisconsin Biotechnology Center, 910 University Avenue, Madison, Wis. 53705를 참조하십시오. 단백질 분석 소프트웨어는 다양한 치환, 결실 및 보존적 아미노산 치환을 포함한 기타 변형에 할당된 상동성 측정을 사용하여 유사한 서열을 일치시킨다. 예를 들어, GCG에는 다른 종의 유기체 또는 야생형 단백질과 야생형 단백질과 이의 돌연변이 단백질(mutein) 사이의 상동성 폴리펩티드와 같이 밀접하게 관련된 폴리펩티드 간의 서열 상동성 또는 서열 동일성을 결정하기 위해 기본 매개변수와 함께 사용할 수 있는 "Gap" 및 "Bestfit"과 같은 프로그램을 포함한다. 예를 들어, GCG 버전 6.1을 참조하십시오.
분자 서열을 상이한 유기체로부터의 다수의 서열을 포함하는 데이터베이스와 비교하기 위해 사용되는 전형적인 알고리즘은 컴퓨터 프로그램 BLAST(Altschul, 1990; Gish, 1993; Madden, 1996; Altschul, 1997; Zhang, 1997), 특히 blastp 또는 tblastn(Altschul, 1997)이다. BLASTp의 일반적인 매개변수는 다음과 같다: Expectation value: 10(default); Filter: seg(default); Cost to open a gap: 11(default); Cost to extend a gap: 1(default); Max. alignments: 100(default); Word size: 11(default); No. of descriptions: 100(default); Penalty Matrix: BLOWSUM62.
다수의 상이한 유기체로부터의 서열을 포함하는 데이터베이스를 검색할 때, 아미노산 서열을 비교하는 것이 일반적이다. 아미노산 서열을 이용한 데이터베이스 검색은 당업계에 공지된 blastp 이외의 알고리즘에 의해 측정될 수 있다. 예를 들어, 폴리펩타이드 서열은 GCG 버전 6.1의 프로그램인 FASTA를 사용하여 비교할 수 있다. FASTA는 질의 및 검색 서열 사이에서 가장 잘 중첩되는 영역의 정렬 및 퍼센트 서열 동일성을 제공한다(Pearson, 1990, 본원에 참조로 포함됨). 예를 들어, 아미노산 서열 간의 퍼센트 서열 동일성은 본 명세서에 참조로 포함되는 GCG 버전 6.1에 제공된 기본 매개변수(단어 크기 2 및 PAM250 스코어링 매트릭스)와 함께 FASTA를 사용하여 결정될 수 있다.
"상동성"이 단백질 또는 펩티드와 관련하여 사용될 때, 동일하지 않은 잔기 위치는 종종 보존적 아미노산 치환에 의해 상이하다는 것이 인식된다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 화학적 특성(예: 전하 또는 소수성)을 갖는 측쇄(R 그룹)를 갖는 다른 아미노산 잔기로 치환된 것이다. 일반적으로 보존적 아미노산 치환은 단백질의 기능적 특성을 실질적으로 바꾸지 않을 것이다. 2개 이상의 아미노산 서열이 보존적 치환에 의해 서로 상이한 경우, 퍼센트 서열 동일성 또는 상동성 정도는 치환의 보존적 성질을 교정하기 위해 상향 조정될 수 있다. 이러한 조정을 위한 수단은 당업자에게 잘 알려져 있다(예를 들어, 본 명세서에 참고로 포함되는 Pearson et al., 1994 참조).
"보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 패밀리는 당업계에 정의되어 있다. 이러한 패밀리는 염기성 측쇄(예: 라이신, 아르기닌, 히스티딘), 산성 측쇄(예: 아스파르트산, 글루탐산), 전하를 띠지 않는 극성 측쇄(예: 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄(예: 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지 측쇄(예: 트레오닌, 발린, 이소류신) 및 방향족 측쇄(예: 타이로신, 페닐알라닌, 트립토판, 히스티딘)가 있는 아미노산을 포함한다. 다음 6개 그룹은 각각 서로에 대한 보존적 치환인 아미노산을 포함한다: 1) 세린(S), 트레오닌(T); 2) 아스파르트산(D), 글루탐산(E); 3) 아스파라긴(N), 글루타민(Q); 4) 아르기닌(R), 라이신(K); 5) 이소류신(I), 류신(L), 메티오닌(M), 알라닌(A), 발린(V) 및 6) 페닐알라닌(F), 티로신(Y), 트립토판(W).
일부 경우에, 동일한 기능적 전환/반응을 수행하지만 구조가 너무 상이하여 일반적으로 "상동성"이 아닌 것으로 결정되는 "동종효소"가 사용될 수 있다.
본 발명은 고환원 폴리케타이드 합성효소(HRPKS)를 포함하는 시스템 및/또는 재조합 미생물을 제공한다. 이 효소는 상기 및 하기에 기재된 바와 같이 올리베톨산 및 이의 유사체의 생산을 위해 본 명세서에 기재된 생합성 플랫폼에서 다른 효소와 조합될 수 있다. 효소는 헥사노일-CoA, 헥사노익산, 및/또는 이의 유사체를 포함하는 대사산물을 생성한다. 고환원 폴리케타이드 합성효소는 HRPKS 유전자, 폴리뉴클레오티드 또는 이의 상동체에 의해 코딩될 수 있다. HRPKS 유전자 또는 폴리뉴클레오티드는 메타리지움 아니소플리애(Metarhizium anisopliae)를 비롯한 다양한 미생물로부터 유래될 수 있다.
전술한 내용에 추가하여, 용어 "고환원 폴리케타이드 합성효소" 또는 "HRPKS"는 아세틸-CoA 및 말로닐-CoA로부터 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체의 형성을 촉매할 수 있는 단백질을 의미하고, SEQ ID NO: 2의 서열과 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 유사성을 공유하고, 기본 매개변수를 사용하여 NCBI BLAST에 의해 계산된다. 추가적인 상동체는 표 1에 제시된 SEQ ID NO: 2의 서열을 갖는 HRPKS에 대한 상동성 서열을 포함한다. 제시된 수탁 번호와 관련된 서열은 본 명세서에 참고로 포함된다.
표 1: 메타리지움 아니소플리애 HRPKS(SEQ ID NO: 2)에 대한 상동체.
Figure pct00001
또 다른 실시예에서, 본 발명에서 제공되는 시스템 또는 재조합 미생물은 비환원성 폴리케타이드 합성효소(NRPKS)를 포함한다. 이 효소는 상기 및 하기에 기재된 바와 같이 올리베톨산 및 이의 유사체의 생산을 위해 본 명세서에 개시된 생합성 플랫폼에서 다른 효소와 조합될 수 있다. 효소는 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체로부터 방향족 디올 대사산물을 포함하는 대사산물을 생성한다. 비환원성 폴리케타이드 합성효소는 NRPKS 유전자, 폴리뉴클레오티드 또는 이의 상동체에 의해 코딩될 수 있다. NRPKS 유전자 또는 폴리뉴클레오티드는 메타리지움 아니소플리애(Metarhizium anisopliae)를 비롯한 다양한 미생물로부터 유래될 수 있다.
전술한 내용에 추가하여, 용어 "비환원 폴리케타이드 합성효소" 또는 "NRPKS"는 헥사노일-CoA, 헥산산, 또는 이들의 유사체로부터 방향족 디올 대사산물의 형성을 촉매할 수 있는 단백질을 지칭하고, SEQ ID NO: 4의 서열과 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 유사성을 공유하고, 기본 매개변수를 사용하여 NCBI BLAST에 의해 계산된다. 추가적인 상동체는 표 2에 제시된 SEQ ID NO: 4의 서열을 갖는 HRPKS에 대한 상동성 서열을 포함한다. 상기 수탁 번호와 관련된 서열은 본원에 참고로 포함된다.
표 2: 메타리지움 아니소플리애 NRPKS(SEQ ID NO: 4)에 대한 상동체.
Figure pct00002
또 다른 실시예에서, 본 명세서에 제공된 시스템 또는 재조합 미생물은 티오에스테라제(TE)를 포함한다. 이 효소는 상기 및 하기에 기재된 바와 같이 올리베톨산 및 이의 유사체의 생산을 위해 본 명세서에 개시된 생합성 플랫폼에서 다른 효소와 조합될 수 있다. 이 효소는 방향족 디올 대사산물로부터 올리베톨산과 유사체를 생성한다. 티오에스테라제는 TE 유전자, 폴리뉴클레오타이드 또는 이의 상동체에 의해 코딩될 수 있다. TE 유전자 또는 폴리뉴클레오티드는 메타리지움 아니소플리애(Metarhizium anisopliae)를 비롯한 다양한 미생물로부터 유래될 수 있다.
전술한 내용에 추가하여, "ΨACP-TE"의 "티오에스테라제" 또는 "TE"라는 용어는 방향족 디올 대사산물로부터 올리베톨산 및 이의 유사체의 형성을 촉매할 수 있는 단백질을 지칭하고, SEQ ID NO: 6의 서열과 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 또는 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 유사성을 공유하고, 기본 매개변수를 사용하여 NCBI BLAST에 의해 계산된다. 추가적인 상동체는 표 3에 제시된 SEQ ID NO: 6의 서열을 갖는 ΨACP-TE에 대한 상동성 서열을 포함한다. 상기 수탁 번호와 관련된 서열은 본원에 참고로 포함된다.
표 3: 메타리지움 아니소플리애 TE(SEQ ID NO: 6)에 대한 상동체.
Figure pct00003
본 명세서에 제시된 연구에서, 진균 메타리지움 아니소플리애에서 유래한 생합성 플랫폼이 높은 수율로 올리베톨산 및 그 유사체를 제공한다는 것이 발견되었다. 특히, 앞서 언급한 생합성 플랫폼은 아스페르길루스 니둘란스 및 올리베톨산에서 이종적으로 발현되었으며, 이의 유사체는 대사 최적화 없이 >4g/L의 총 역가로 수득되었다. 실제로, 생합성 플랫폼은 또한 대장균, 효모 및 올리베톨산 및 이의 유사체의 생산을 위한 기타 이종 미생물 숙주에서 발현될 수 있다.
또 다른 실시예에서, 본 발명은 본 발명의 생합성 플랫폼을 사용하여 올리베톨산 및 이의 유사체의 생산을 입증한다. 생합성 플랫폼은 다음을 포함하는 하나 이상의 이종 폴리뉴클레오티드의 발현 또는 과발현을 포함한다: (i) 아세틸-CoA 및 말로닐-CoA로부터 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체의 생성을 촉매하는 폴리펩타이드; (ii) 헥사노일-CoA, 헥사노익산, 또는 이들의 유사체로부터 방향족 디올 대사산물의 생성을 촉매하는 폴리펩타이드; (iii) 방향족 디올로부터 올리베톨산 및 이의 유사체의 생성을 촉매하는 폴리펩타이드. 일 실시예에서, 생합성 플랫폼은 (i) 또는 (ii)를 포함한다: (i) 무세포 시스템이 아세틸-CoA 및 말로닐-CoA를 올리베톨산 또는 이의 유사체로 전환할 수 있도록 (1) SEQ ID NO: 2에 대해 적어도 50-100% 서열 동일성을 갖는 폴리펩티드, (2) SEQ ID NO: 4에 대해 적어도 50-100% 서열 동일성을 갖는 폴리펩티드, 및 (3) SEQ ID NO:6에 대해 적어도 45-100% 서열 동일성을 갖는 폴리펩티드를 포함하는 폴리펩티드 세트를 포함하는 무세포 시스템; 또는 (ii) 미생물이 아세틸-CoA 및 말로닐-CoA를 올리베톨산 또는 이의 유사체로 전환할 수 있도록 (1) SEQ ID NO: 2에 대해 적어도 50-100% 서열 동일성을 갖는 폴리펩티드, (2) SEQ ID NO: 4에 대해 적어도 50-100% 서열 동일성을 갖는 폴리펩티드, (3) SEQ ID NO:6에 대해 적어도 45-100% 서열 동일성을 갖는 폴리펩티드, 및 (4) (1) 내지 (3)의 조합으로 구성된 군에서 선택되는 이종 폴리펩티드를 발현하는 적어도 하나의 재조합 세포.
일 실시예에서, 무세포 시스템은 SEQ ID NO: 2, 8, 및 14로 구성된 군에서 선택되는 서열을 갖는 제1 폴리펩티드; SEQ ID NO: 4, 10 및 16로 구성된 군에서 선택되는 서열을 갖는 제2 폴리펩티드; 및 SEQ ID NO: 6, 12 및 18로 구성된 군에서 선택되는 서열을 갖는 제3 폴리펩티드를 포함하며, 여기서 무세포 시스템은 아세틸-CoA 및 말로닐-CoA를 올리베톨산으로 전환시킬 수 있다.
또 다른 실시예에서, 적어도 하나의 재조합 미생물은 SEQ ID NO: 2, 8, 및 14로 구성된 군에서 선택되는 서열을 갖는 제1 이종 폴리펩티드; SEQ ID NO: 4, 10 및 16로 구성된 군에서 선택되는 서열을 갖는 제2 이종 폴리펩티드; 및/또는 SEQ ID NO: 6, 12 및 18로 구성된 군에서 선택되는 서열을 갖는 제3 이종 폴리펩티드를 발현하고, 여기서 적어도 하나의 재조합 미생물을 포함하는 배양물은 제1, 제2 및 제3 이종 폴리펩티드를 발현하며 아세틸-CoA 및 말로닐-CoA를 올리베톨산으로 전환시킬 수 있다.
당업자는 위에서 확인된 다양한 대사산물이 다른 이화작용 또는 동화작용 경로에 대한 기질로서 작용할 수 있음을 인지할 것이다.
전술한 효소 중 하나 이상(전부는 아님)을 갖는 서브시스템 또는 유기체가 이용될 수 있고, 이어서 경로의 나머지 효소 구성원을 포함하는 유기체 또는 다른 서브시스템과 조합될 수 있다는 것이 인식될 것이다.
앞서 언급한 바와 같이, 본 명세서 전반에 걸쳐 기재된 표적 효소는 일반적으로 대사산물을 생성한다. 또한, 본 명세서 전반에 걸쳐 기재된 표적 효소는 폴리뉴클레오티드에 의해 코딩된다.
따라서, 일 실시예에서, 본 발명에 제공된 시스템 또는 재조합 미생물은 고환원 폴리케타이드 합성효소(HRPKS) 또는 그의 상동체 또는 변이체를 포함한다. 이 발현은 생합성 경로의 효소와 결합될 수 있으며, 올리베톨산 또는 추가 대사산물의 생산을 위한 추가 다운스트림 효소를 추가로 포함할 수 있다. HRPKS는 메타리지움 아니소플리애(Metarhizium anisopliae), 톨리포클라듐 인플라툼(Tolypocladium inflatum), 메타리지움 라일리(Metarhizium rileyi) 및/또는 탈라로마이세스 아일랜드이쿠스(Talaromyces isolandicus)(또는 상기 표 1에서 확인된 기타 유기체)에서 파생될 수 있다. 다른 실시예에서, HRPKS의 조작된 변이체는 고환원 폴리케타이드 합성효소 활성이 있는 한 사용할 수 있고, 아세틸-CoA 및 말로닐-CoA를 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체로 전환시킬 수 있다. 이러한 조작된 변이체는 부위 지정 돌연변이유발, 지정 진화 등에 의해 얻어질 수 있다. 따라서, 본 발명에 포함되는 것은 메타리지움 아니소플리애로부터의 HRPKS의 서열과 적어도 85-99% 동일하고, 고환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 2와 85-100% 동일). 따라서, 본 발명에 포함되는 것은 톨리포클라듐 인플라툼로부터의 HRPKS의 서열과 적어도 85-99% 동일하고, 고환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다. 따라서, 본 발명에 포함되는 것은 메타리지움 라일리로부터의 HRPKS의 서열과 적어도 85-99% 동일하고, 고환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 8과 85-100% 동일). 따라서, 본 발명에 포함되는 것은 탈라로마이세스 아일랜드이쿠스로부터의 HRPKS의 서열과 적어도 85-99% 동일하고, 고환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 14와 85-100% 동일).
다른 또는 추가 실시예에서, 본 발명에 제공된 시스템 또는 재조합 미생물은 비환원 폴리케타이드 합성효소(NRPKS) 또는 그의 상동체 또는 변이체를 포함한다. 이 발현은 생합성 경로의 효소와 결합될 수 있으며, 올리베톨산 또는 추가 대사산물의 생산을 위한 추가 다운스트림 효소를 추가로 포함할 수 있다. NRPKS는 메타리지움 아니소플리애(Metarhizium anisopliae), 톨리포클라듐 인플라툼(Tolypocladium inflatum), 메타리지움 라일리(Metarhizium rileyi) 및/또는 탈라로마이세스 아일랜드이쿠스(Talaromyces isolandicus)(또는 상기 표 2에서 확인된 기타 유기체)에서 파생될 수 있다. 다른 실시예에서, NRPKS의 조작된 변이체는 비환원 폴리케타이드 합성효소 활성이 있는 한 사용할 수 있고, 헥사노일-CoA, 헥사노익산 및/또는 이들의 유사체를 방향족 디올 대사산물로 전환시킬 수 있다. 이러한 조작된 변이체는 부위 지정 돌연변이유발, 지정 진화 등에 의해 얻어질 수 있다. 따라서, 본 발명에 포함되는 것은 메타리지움 아니소플리애로부터의 NRPKS의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 4와 85-100% 동일). 따라서, 본 발명에 포함되는 것은 톨리포클라듐 인플라툼로부터의 NRPKS의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다. 따라서, 본 발명에 포함되는 것은 메타리지움 라일리로부터의 NRPKS의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 10과 85-100% 동일). 따라서, 본 발명에 포함되는 것은 탈라로마이세스 아일랜드이쿠스로부터의 NRPKS의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 16과 85-100% 동일).
Such engineered variants can be obtained by site-directed mutagenesis, directed evolutions and the like.
다른 또는 추가 실시예에서, 본 발명에 제공된 시스템 또는 재조합 미생물은 티오에스테라제(TE) 또는 그의 상동체 또는 변이체를 포함한다. 이 발현은 생합성 경로의 효소와 결합될 수 있으며, 올리베톨산 또는 추가 대사산물의 생산을 위한 추가 다운스트림 효소를 추가로 포함할 수 있다. TE는 메타리지움 아니소플리애(Metarhizium anisopliae), 톨리포클라듐 인플라툼(Tolypocladium inflatum), 메타리지움 라일리(Metarhizium rileyi) 및/또는 탈라로마이세스 아일랜드이쿠스(Talaromyces isolandicus)(또는 상기 표 3에서 확인된 기타 유기체)에서 파생될 수 있다. 다른 실시예에서, TE의 조작된 변이체는 티오에스테라제 활성이 있는 한 사용할 수 있고, 방향족 디올 대사산물을 올리베톨산 및 이의 유사체로 전환시킬 수 있다. 이러한 조작된 변이체는 부위 지정 돌연변이유발, 지정 진화 등에 의해 얻어질 수 있다. 따라서, 본 발명에 포함되는 것은 메타리지움 아니소플리애로부터의 TE의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 6과 85-100% 동일). 따라서, 본 발명에 포함되는 것은 톨리포클라듐 인플라툼로부터의 TE의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다. 따라서, 본 발명에 포함되는 것은 메타리지움 라일리로부터의 TE의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 12와 85-100% 동일). 따라서, 본 발명에 포함되는 것은 탈라로마이세스 아일랜드이쿠스로부터의 TE의 서열과 적어도 85-99% 동일하고, 비환원 폴리케타이드 합성효소 활성을 갖는 폴리펩티드이다(예를 들어, SEQ ID NO: 18과 85-100% 동일).
상기 나타낸 바와 같이, 본 발명은 본 명세서에 개시된 생합성 플랫폼을 구성하는 효소의 변이체를 생성하는 것을 추가로 제공한다. 이러한 효소 변이체는 기질 특이성을 확장하고, 기질 특이성을 변경하고, 반응 역학을 개선하고, 효소 안정성 등을 개선할 수 있다. 예를 들어, 본 명세서에 개시된 생합성 플랫폼을 구성하는 효소의 변이체는 C8 OA보다 더 많은 C6과 같은 이러한 생성물의 비율을 변경할 수 있다. 효소의 변이체는 돌연변이 방법 또는 유도 진화 방법을 사용하여 효소의 서열(예를 들어, SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 또는 18)을 변경하는 것에 기초할 수 있다.
효소 변이체를 생성하는 돌연변이 방법은, 예를 들어, 부위 특이적 돌연변이 유발(Ling et al. (1997) "DNA 돌연변이 유발에 대한 접근: 개요" Anal Biochem. 254(2): 157-178; Dale et al. (1996) "포스포로티오에이트 방법을 사용한 올리고뉴클레오티드 유도 무작위 돌연변이 유발" Methods Mol. Biol. 57:369-374; Smith (1985) "시험관 내 돌연변이 유발" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985) "시험관 내 돌연변이 유발의 전략 및 응용" Science 229:1193-1201; Carter (1986) "부위 특이적 돌연변이 유발" Biochem. J. 237:1-7; 및 Kunkel (1987) "올리고뉴클레오티드 유도 돌연변이 유발의 효율성" 핵산 및 분자생물학 내(Eckstein, F. 및 Lilley, D. M. J. eds., Springer Verlag, Berlin)); 템플릿을 포함하는 우라실을 사용한 돌연변이 유발(Kunkel (1985) "표현형 선택 없이 신속하고 효율적인 부위 특이적 돌연변이 유발" Proc. Natl. Acad. Sci. USA 82:488-492; Kunkel et al. (1987) "표현형 선택 없이 신속하고 효율적인 부위 특이적 돌연변이 유발" Methods in Enzymol. 154, 367-382; 및 Bass et al. (1988) "새로운 DNA 결합 특이성을 가진 돌연변이 Trp 억제인자" Science 242:240-245); 올리고뉴클레오티드 유도 돌연변이 유발(Methods in Enzymol. 100: 468-500 (1983); Methods in Enzymol. 154: 329-350 (1987); Zoller & Smith (1982) "M13 유래 벡터를 사용한 올리고뉴클레오티드 유도 돌연변이유발: 모든 DNA 단편에서 점 돌연변이 생성을 위한 효율적이고 일반적인 절차" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) "M13 벡터에 복제된 DNA 단편의 올리고뉴클레오티드 유도 돌연변이 유발" Methods in Enzymol. 100:468-500; 및 Zoller & Smith (1987) "올리고뉴클레오티드 유도 돌연변이 유발: 2개의 올리고뉴클레오티드 프라이머와 단일 가닥 DNA 템플릿을 이용한 간단한 방법" Methods in Enzymol. 154:329-350); 포스포로티오에이트 변형 DNA 돌연변이 유발(Taylor et al. (1985) "닉킹된 DNA를 제조하기 위한 제한 효소 반응에서 포스포로티오에이트 변형 DNA의 용도" Nucl. Acids Res. 13: 8749-8764; Taylor et al. (1985) "포스포로티오에이트 변형 DNA를 이용한 높은 빈도의 올리고뉴클레오티드 유도 돌연변이의 빠른 생성" Nucl. Acids Res. 13: 8765-8787; Nakamaye & Eckstein (1986) "포스포로티오에이트 그룹에 의한 제한 엔도뉴클레아제 Nci I 절단의 억제 및 올리고뉴클레오티드 유도 돌연변이 유발에 대한 적용" Nucl. Acids Res. 14: 9679-9698; Sayers et al. (1988) "포스포로티오에이트 기반 올리고뉴클레오티드 유도 돌연변이 유발에서 Y-T 엑소뉴클레아제" Nucl. Acids Res. 16:791-802; 및 Sayers et al. (1988) "에티듐 브로마이드 존재하에서 제한 엔도뉴클레아제와의 반응에 의한 포스포로티오에이트 함유 DNA의 가닥 특이적 절단" Nucl. Acids Res. 16: 803-814); 갭이 있는 이중 DNA를 사용한 돌연변이 유발(Kramer et al. (1984) "올리고뉴클레오타이드 유도 돌연변이 구축에 대한 갭이 있는 이중 DNA 접근" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "갭이 있는 이중 DNA를 통한 돌연변이의 올리고뉴클레오타이드 유도 구축" 154:350-367; Kramer et al. (1988) "돌연변이의 올리고뉴클레오타이드 유도 구축에 대한 갭이 있는 이중 DNA 접근 방식에서 개선된 효소 시험관내 반응" Nucl. Acids Res. 16: 7207; 및 Fritz et al. (1988) "돌연변이의 올리고뉴클레오티드 유도 구축: 시험관 내에서 효소 반응이 없는 갭이 있는 이중 DNA 절차" Nucl. Acids Res. 16: 6987-6999)를 포함한다(각각은 참조로 포함된다).
추가로 적절한 방법은 포인트 불일치 복구(Kramer et al. (1984) "포인트 불일치 복구" Cell 38:879-887), 복구 결핍 숙주 균주를 사용한 돌연변이 유발(Carter et al. (1985) "M13 벡터를 사용한 개선된 올리고뉴클레오티드 부위 지정 돌연변이 유발" Nucl. Acids Res. 13: 4431-4443; 및 Carter (1987) "M13 벡터를 사용한 개선된 올리고뉴클레오티드 지정 돌연변이 유발" Methods in Enzymol. 154: 382-403), 결실 돌연변이 유발(Eghtedarzadeh & Henikoff (1986) "큰 결실을 생성하기 위한 올리고뉴클레오티드의 용도" Nucl. Acids Res. 14: 5115), 제한 선택 및 제한 정제(Wells et al. (1986) "서브틸리신의 전이 상태 안정화에 있어서 수소 결합 형성의 중요성" Phil. Trans. R. Soc. Lond. A 317: 415-423), 전체 유전자 합성에 의한 돌연변이 유발(Nambiar et al. (1984) "리보뉴클레아제 S 단백질을 코딩하는 유전자의 전체 합성 및 클로닝" Science 223: 1299-1301; Sakamar 및 Khorana (1988) "소 간체 외부 분절 구아닌 뉴클레오티드 결합 단백질(트랜스듀신)의 a-서브유닛에 대한 유전자의 전체 합성 및 발현" Nucl. Acids Res. 14: 6361-6372; Wells et al. (1985) "카세트 돌연변이 유발: 정의된 부위에서 다중 돌연변이 생성을 위한 효율적인 방법" Gene 34:315-323; and Grundstrom et al. (1985) "마이크로스케일 '샷건' 유전자 합성에 의한 올리고뉴클레오티드 유도 돌연변이 유발" Nucl. Acids Res. 13: 3305-3316); 이중 가닥 파손 수리(Mandecki (1986); Arnold (1993) "비정상적인 환경을 위한 단백질 공학" Current Opinion in Biotechnology 4: 450-455; 및 "대장균 플라스미드의 올리고뉴클레오티드 지정 이중 가닥 파손 복구: 부위 특이적 돌연변이 유발 방법" Proc. Natl. Acad. Sci. USA, 83:7177-7181)를 포함한다(각각은 참조로 포함된다). 상기 많은 방법에 대한 추가 세부 정보는 다양한 돌연변이 유발 방법으로 문제를 해결하는 데 유용한 컨트롤을 설명하는 Enzymology Volume 154의 방법에서 찾을 수 있다.
다양한 다양성 생성 방법에 대한 추가 세부 정보는 하기 미국 특허, PCT 간행물 및 EPO 간행물에서 찾을 수 있다. U.S. Pat. No. 5,605,793 to Stemmer (Feb. 25, 1997), "시험관내 재조합 방법;" U.S. Pat. No. 5,811,238 to Stemmer et al. (Sep. 22, 1998) "반복 선택 및 재조합에 의해 원하는 특성을 갖는 폴리뉴클레오티드를 생성하는 방법;" U.S. Pat. No. 5,830,721 to Stemmer et al. (Nov. 3, 1998), "무작위 단편화 및 재조립에 의한 DNA 돌연변이 유발;" U.S. Pat. No. 5,834,252 to Stemmer, et al. (Nov. 10, 1998) "말단 상보성 중합효소 반응;" U.S. Pat. No. 5,837,458 to Minshull, et al. (Nov. 17, 1998), "세포 및 대사 공학을 위한 방법 및 조성물;" WO 95/22625, Stemmer and Crameri, "무작위 단편화 및 재조립에 의한 돌연변이 유발;" WO 96/33207 by Stemmer and Lipschutz "상보적 중합효소 연쇄 반응 종료;" WO 97/20078 by Stemmer and Crameri "반복 선택 및 재조합에 의해 원하는 특성을 갖는 폴리뉴클레오티드를 생성하는 방법;" WO 97/35966 by Minshull and Stemmer, "세포 및 대사 공학을 위한 방법 및 조성물;" WO 99/41402 by Punnonen et al. "유전자 백신 벡터의 표적화;" WO 99/41383 by Punnonen et al. "항원 라이브러리 면역화;" WO 99/41369 by Punnonen et al. "유전자 백신 벡터 공학;" WO 99/41368 by Punnonen et al. "유전자 백신의 면역 조절 특성의 최적화;" EP 752008 by Stemmer and Crameri, "무작위 단편화 및 재조립에 의한 DNA 돌연변이 유발;" EP 0932670 by Stemmer "재귀적 서열 재조합에 의한 진화하는 세포 DNA 흡수;" WO 99/23107 by Stemmer et al., "바이러스 게놈 셔플링에 의한 바이러스 친화성 및 숙주 범위 수정;" WO 99/21979 by Apt et al., "인유두종바이러스 벡터;" WO 98/31837 by del Cardayre et al. "재귀 시퀀스 재조합에 의한 전체 세포 및 유기체의 진화;" WO 98/27230 by Patten and Stemmer, "폴리펩티드 공학을 위한 방법 및 조성물;" WO 98/13487 by Stemmer et al., "재귀적 서열 셔플링 및 선택에 의한 유전자 치료의 최적화 방법;" WO 00/00632, "매우 다양한 라이브러리 생성 방법;" WO 00/09679, "시험관내 재조합 폴리뉴클레오티드 서열 뱅크 및 생성된 서열을 얻는 방법;" WO 98/42832 by Arnold et al., "무작위 또는 정의된 프라이머를 사용한 폴리뉴클레오티드 서열의 재조합;" WO 99/29902 by Arnold et al., "폴리뉴클레오타이드 및 폴리펩타이드 서열의 생성 방법;" WO 98/41653 by Vind, "DNA 라이브러리 구축을 위한 시험관 내 방법;" WO 98/41622 by Borchert et al., "DNA 셔플링을 이용한 라이브러리 구축 방법;" WO 98/42727 by Pati and Zarling, "상동 재조합을 사용한 서열 변경;" WO 00/18906 by Patten et al., "코돈 변형 유전자의 셔플링;" WO 00/04190 by del Cardayre et al. "재귀적 재조합에 의한 전체 세포와 유기체의 진화;" WO 00/42561 by Crameri et al., "올리고뉴클레오티드 매개 핵산 재조합;" WO 00/42559 by Selifonov and Stemmer "진화 시뮬레이션에 사용하기 위해 데이터 구조를 채우는 방법;" WO 00/42560 by Selifonov et al., "원하는 특성을 갖는 문자열, 폴리뉴클레오타이드 및 폴리펩타이드의 제조 방법;" WO 01/23401 by Welch et al., "합성 셔플링을 위한 코돈 변이 올리고뉴클레오티드 합성의 사용;" 및 WO 01/64864 by Affholter "단일 가닥 핵산 주형 매개 재조합 및 핵산 단편 분리"(각각은 참조로 포함된다).
유도 진화(Directed evolution)는 또한 본 명세서에 개시된 생합성 플랫폼의 효소 변이체를 생성하는데 사용될 수 있다. 유도 진화(DE)는 단백질 또는 핵산을 사용자가 정의한 목표로 조종하기 위해 자연 선택 과정을 모방하는 단백질 공학에서 사용되는 방법이다. 이는 유전자를 돌연변이 유발(변이체 라이브러리 생성), 선택(이러한 변종을 표현하고 원하는 기능으로 구성원을 분리) 및 증폭(다음 라운드를 위한 템플릿 생성)의 반복적인 라운드에 적용하는 것으로 구성된다. DE에서 단일 유전자는 반복적인 돌연변이 유발, 선택 또는 스크리닝 및 증폭에 의해 진화된다. 단계적 개선을 달성하기 위해 한 라운드의 최상의 변형을 다음 라운드의 템플릿으로 사용하여 이러한 단계의 라운드가 일반적으로 반복된다. 유도 진화의 주기를 수행하는 첫 번째 단계는 변이 유전자 라이브러리를 생성하는 것이다. 시작 유전자는 무작위 점 돌연변이(화학적 돌연변이 또는 오류가 발생하기 쉬운 PCR) 및 삽입 및 결실(트랜스포존)에 의해 돌연변이될 수 있다. 유전자 재조합은 뒤섞인 모 유전자 사이의 서열 공간 영역으로 점프하기 위해 여러 서열(보통 70% 이상의 서열 동일성)의 DNA 셔플링에 의해 모방될 수 있다. 마지막으로, 유전자의 특정 영역은 구조 및 기능 지식을 기반으로 하는 보다 집중적인 접근을 위해 체계적으로 무작위화될 수 있다.
본 발명은 본 명세서에 개시된 생합성 경로를 구성하는 효소의 추가 형태를 제조하는 것을 추가로 제공하며, 이는 (i) HRPKS 및 NRPKS를 해부하는 단계; (ii) NRPKS 및 TE와 같은 융합 효소; (iii) 한 효소의 일부가 다른 효소의 일부에 융합된 것과 같은 재셔플링 도메인을 포함하지만 이에 제한되지 않는다(예를 들어, see Kolkman et al. "엑손 셔플링에 의한 단백질의 유도 진화". Nature Biotechnology 19(5): 423-8 (2001); Morgante et al., "헬리트론과 같은 트랜스포존에 의한 유전자 복제 및 엑손 셔플링은 옥수수에서 종 내 다양성을 생성한다". Nature Genetics. 37(9):997-1002 (2005); Van Rijk, "엑손 셔플링의 분자 메커니즘: 불법적인 재조합". Genetica 118(2-3): 245-9 (2003)); Elluche, S. "자연의 발명에서 생명 공학 응용에 이르기까지 융합 효소와 기능을 결합" Appl Microbiol Biotechnol. 99(4):1545-56 (2015); Aalbers et al. "생촉매의 효소 융합: 효소 짝짓기에 의한 커플링 반응" Chembiochem. 20(1):20-28 (2019)).
본 발명의 폴리펩타이드를 암호화하는 폴리뉴클레오타이드가 SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 및 17에 제공된다. 서열이 DNA에 기재되어 있음을 쉽게 인지해야 하지만, 본 발명에 수반되는 서열 목록에서 "U" 또는 "T"를 치환하는 것을 포함하는 RNA가 고려된다. 상기 언급된 바와 같이, 본 발명의 폴리뉴클레오티드는 발현을 위한 벡터로 클로닝될 수 있다. 발현에 적합한 벡터는 당업계에 공지되어 있고 본 명세서의 다른 곳에 기술되어 있다. 일부 실시예에서, 본 발명의 세포 또는 벡터는 SEQ ID NOs: 1, 3, 5, 7, 9, 11, 13, 15, 및 17로 구성된 군에서 선택되는 적어도 하나의 폴리뉴클레오티드를 포함한다. 다른 실시예에서, 본 발명의 세포 또는 벡터는 SEQ ID NOs: 1, 7 및 13으로 구성된 군에서 선택되는 제1 폴리뉴클레오티드; SEQ ID NOs: 3, 9 및 15로 구성된 군에서 선택되는 제2 폴리뉴클레오티드; 및 SEQ ID NOs: 5, 11 및 17로 구성된 군에서 선택되는 제3 폴리뉴클레오티드를 포함한다. 또 다른 실시예에서, 본 발명은 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15, 및 17로부터 선택된 서열로 구성된 폴리뉴클레오티드와 적당히 엄격한 내지 엄격한 조건 하에 혼성화하는 폴리뉴클레오티드를 고려한다. 혼성화 엄격한 조건은 당업계에 잘 알려져 있다. 또한, 본 개시내용은 SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15 또는 17의 어느 하나와 적어도 70%, 80%, 85%, 90%, 92%, 95%, 97%, 또는 99% 동일성을 갖는 폴리뉴클레오티드를 고려하고, 이는 각각 SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16 또는 18의 서열을 갖는 폴리펩티드를 코딩한다.
이전에 논의된 바와 같이, 벡터, 프로모터 및 기타 많은 관련 주제의 사용을 포함하여 본 명세서에 유용한 분자 생물학적 기술을 설명하는 일반 텍스트는 Berger 및 Kimmel, 분자 복제 기술 가이드, Methods in Enzymology Volume 152, (Academic Press, Inc., San Diego, Calif.) ("Berger"); Sambrook et al., 분자 복제--실험실 매뉴얼, 2d ed., Vol. 1-3, 콜드 스프링 하버 연구소, 콜드 스프링 하버, N.Y., 1989 ("Sambrook") 및 분자생물학의 현재 프로토콜, F. M. Ausubel et al., eds., 현재 프로토콜, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (supplemented through 1999)("Ausubel")를 포함한다(각각은 참조로 포함된다).
중합효소연쇄반응(polymerase chain reaction, PCR), 리가제연쇄반응(ligase chain reaction, LCR), Qb-복제효소 증폭 및 기타 RNA 중합효소 매개 기술(예: NASBA)을 포함하는 시험관 내 증폭 방법을 통해 숙련가에게 지시하기에 충분한 프로토콜의 예, 본 발명의 상동 핵산의 생산은 Berger, Sambrook 및 Ausubel 뿐만 아니라 Mullis et al. (1987) U.S. Pat. No. 4,683,202; Innis et al., eds. (1990) PCR 프로토콜: 방법 및 응용 프로그램 가이드(Academic Press Inc. San Diego, Calif.) ("Innis"); Arnheim & Levinson (Oct. 1, 1990) C&EN 36-47; The Journal Of NIH Research (1991) 3: 81-94; Kwoh et al. (1989) Proc. Natl. Acad. Sci. USA 86: 1173; Guatelli et al. (1990) Proc. Nat'l. Acad. Sci. USA 87: 1874; Lomell et al. (1989) J. Clin. Chem 35: 1826; Landegren et al. (1988) 사이언스 241: 1077-1080; Van Brunt (1990) Biotechnology 8: 291-294; Wu 및 Wallace (1989) 유전자 4:560; Barringer et al. (1990) 유전자 89:117; 및 Sooknanan and Malek (1995) 생명공학 13: 563-564에서 발견된다(각각은 참조로 포함된다). 시험관내 증폭된 핵산을 클로닝하기 위한 개선된 방법은 Wallace et al., U.S. Pat. No. 5,426,039에 개시되었다. PCR에 의해 큰 핵산을 증폭하는 개선된 방법은 Cheng et al. (1994) Nature 369: 684-685 및 여기에 인용된 참고 문헌(본원에 참고로 포함됨)에서 최대 40kb의 PCR 앰플리콘이 생성되는 것이 요약되어 있다. 당업자는 본질적으로 임의의 RNA가 역전사효소 및 중합효소를 사용하여 제한 소화(restriction digestion), PCR 확장 및 서열분석에 적합한 이중 가닥 DNA로 전환될 수 있음을 이해할 것이다. 예를 들어, 상기 Ausubel, Sambrook 및 Berger를 참조하십시오.
하기 실시예는 본 발명을 예시하기 위한 것이지 제한하기 위한 것이 아니다. 그것들은 사용될 수 있는 것들의 전형이지만, 당업자에게 공지된 다른 절차들이 대안적으로 사용될 수 있다.
실시예
플라스미드 구성 및 발현: 플라스미드 pYTU, pYTP 및 pYTR을 PacI 및 SwaI로 분해하였다. 이러한 제한 부위를 사용하여 HRPKS, NRPKS 및 ΨACP-TE(즉, HRPKS(SEQ ID NO: 2), NRPKS(SEQ ID NO: 4) 및 ΨACP-TE(SEQ ID NO: 6))를 코딩하는 유전자르르 플라스미드에 삽입하는데 사용되었다. 메타리지움 아니소플리애 ARSEF23의 genomic DNA를 주형으로 사용하여 PCR을 통해 유전자를 증폭되었다. glaA 프로모터 및 trpC 터미네이터는 pYTR을 주형으로 사용하여 PCR을 통해 증폭되었다. PCR 단편을 효모에서 형질전환시키고 상동 재조합을 통해 플라스미드 pYTU-glaA-NRPKS-trpC, pYTP-glaA-ΨACP-TE 및 pYTR-glaA-HRPKS-trpC를 생성하였다. Frozen-EZ 효모 형질전환 II Kit™(Zymo Research)를 사용하여 효모 형질전환을 수행하였다. 플라스미드를 효모에서 추출하고 전기천공에 의해 대장균 TOP10으로 형질전환하여 단일 플라스미드를 분리하였다. 대장균에서 추출한 후, 플라스미드 서열을 시퀀싱하여 확인하였다. Liu et al.(Org Lett. 19:3560-3563 (2017))에 개시된 방법을 사용하여 3개의 플라스미드(pYTU-glaA-NRPKS-trpC, pYTP-glaA-ΨACP-TE, pYTR-glaA-HRPKS-trpC) 모두를 A. 니둘란스로 형질전환시켜 올리베톨산 생산 균주를 형성하였다.
이어서, 균주를 50 mL 팔콘 튜브에서 10 mL의 CD-ST 배지(20 g/L 전분, 20 g/L 카세인, 50 mL/L 질산염 및 1 mL/L 미량 원소)에서 배양하고, 하룻밤 동안 28℃ 및 250 rpm에서 진탕기에 보관하였다. 다음날 25 μL의 배양물을 125 mL 플라스크에 25 mL의 CD-ST 배지에 접종하고, 28℃ 및 250 rpm에서 진탕기에 보관하였다. HRPKS, NRPKS, 및 ΨACP-TE 유전자를 모두 함유하는 메타리지움 아니소플리애 클러스터와 상동인 3개의 다른 클러스터가 확인되었다. 클러스터는 모두 동일한 3개의 유전자를 갖고 있지만, 서열 동일성이 다르기 때문에 생성되는 생성물의 다양성이 있음을 나타낸다. 메타리지움 아니소플리애 클러스터의 유전자와 서열 동일성이 다른 상동 클러스터의 유전자로 인해, 메틸트랜스퍼라제 및 에노일 환원효소 도메인 활성의 차이를 통해 생성물의 확장된 다양성을 구상할 수 있다.
M. 아니소플리애에 대해 상기 기재된 바와 같은 플라스미드는 이들 상동 클러스터의 유전자로부터 생성되었고 A. 니둘란스에서 이종 발현되었다. 그런 다음 제품 프로필을 분석하였다.
검출 및 분리: 포지티브 및 네거티브 모드 전자분무 이온화를 사용하는 Shimadzu 2020 EVLC-MS(Phenomenex® Kinetex, 1.7 μm, 2.0 x 100 mm, C-18 컬럼)를 사용하여 LC-MS 분석을 수행하였다. 용출 방법은 13.25분 내에 5-95%(v/v) 아세토니트릴/물의 선형 구배에 이어 0.3 mL/분의 유속으로 4.75분 동안 95%(v/v) 아세토니트릴/물의 선형 구배를 포함한다. LC 이동상에 0.1% 포름산(v/v)이 보충되었다.
화합물의 대규모 생산은 20개의 페트리 접시로 분할된 1리터의 고체 CD-ST 한천에서 형질전환체를 배양함으로써 수행되었다. 28℃에서 4-5일 동안 성장시킨 후, 한천을 아세톤으로 광범위하게 추출했습니다. 추출물을 감압 농축하고 산성화된 에틸 아세테이트로 3회 더 추출하였다. 올리베톨산 및 유도체는 에틸 아세테이트 층에 남아 있으며, 이는 후속적으로 감압하에 건조되었다. 잔류물을 Teledyne Combi-Flash 시스템의 Redisep Rf Gold 역상 C18 컬럼에 로딩하였다. 그 후, Shimadzu UFLC 시스템을 사용하여 Phenomenex® Kinetex 컬럼(5μ, 10.0 x 250 mm, C18)으로 HPLC 정제를 수행하였다. HPLC 정제를 위해, 용매 A(물 중 0.1% 포름산) 및 용매 B(아세토니트릴 중 0.1% 포름산)를 사용하여 4 mL/분의 유속을 사용하였다.
올리베톨산 및 유사체를 생산하기 위한 생합성 경로. 도 2A에 도시된 바와 같이, 아스페르길루스 니둘란스는 각각 메타리지움 아니소플리애, 메타리지움 라일리 및 탈라로마이세스 아일랜드이쿠스로부터 다양한 이종 유전자(즉, HRPKS(SEQ ID NO: 2, 8 또는 14), NRPKS(SEQ ID NO: 4, 10 또는 16), 및 ΨACP-TE(SEQ ID NO: 6, 12 또는 18))를 발현하도록 재조합 조작되어, 올리베톨산(OA) 및 OA 유사체를 높은 수율로 제공한다. HRPKS는 아세틸-CoA, 말로닐-CoA 및 NADPH를 사용하여 아실-캐리어 단백질(ACP)에 연결된 C6 또는 C8 아실 사슬을 합성한다. 그런 다음 HRPKS의 ACP 도메인은 아실 티오에스테르를 비환원 폴리케타이드 합성효소(NRPKS)의 스타터 단위 아실-운반체 단백질 트랜스아실라제(SAT) 도메인으로 이동시킨다. 케토신타제(KS) 도메인과 생성물 주형(PT) 도메인에 의한 방향족화에 의해 촉매되는 3회의 탈탄산 축합 후, 티오에스테라제(TE)는 NRPKS에서 생성물을 가수분해하여 다음 촉매 주기를 시작한다. HRPKS의 합성 능력 및 NRPKS SAT 도메인의 완화된 기질 선택성으로 인해, 고역가 올리베톨산 및 아실 사슬 길이 및 포화도가 상이한 3개의 유사체가 접근된다(도 2B 참조).
아스페르길루스 니둘란스에서 상기 생합성 경로를 발현하는 이종은 대사 최적화 없이 총 역가가 >4g/L인 올리베톨산 및 이의 유사체를 수득하였다. 도 3에 제시된 액체 크로마토그래피(LC) 자취에 나타낸 바와 같이, 화합물 2는 다른 화합물보다 더 많은 양으로 생성되었으며, 다른 오염 생성물 형성이 최소 또는 전혀 없었다. 실제 수율은 도 2B에 제시되어 있으며, 다음과 같다: 화합물 2(~4 g/L) > 화합물 3(~800 mg/L) > 화합물 1(~450 mg/L) >> 화합물 4(80 mg/L)입니다. 화합물 1: 올리베톨산; 화합물 2: 2-헵틸-4,6-디히드록시벤조산; 화합물 3: (E)-2-(헵트-1-엔-1-일)-4,6-디히드록시벤조산; 및 화합물 4: (E)-2,4-디히드록시-6-(펜트-1-엔-1-일)벤조산.
T. 인플라툼, M. 라일리 및 T. 아일랜드이쿠스로부터 클로닝된 유전자에 대해 유사한 LC 추적이 얻어졌다. 톨리포클라듐 인플라툼 클러스터의 경우, 유전자가 아스페길루스 니둘란스에서 이종적으로 발현되었을 때, LC를 검토한 결과 메타리지움 아니소플리애의 유전자가 발현되었을 때와 동일한 프로파일이 나타났으며, 역가는 비슷하였다. 탈라로마이세스 아일랜드이쿠스 클러스터의 경우 아스페길루스 니둘란스에서 이종 발현되었을 때 LC는 주로 올리베톨산을 나타냈다.
본 발명의 사상 및 범위를 벗어나지 않고, 다양한 수정이 이루어질 수 있음을 이해할 것이다. 따라서, 다른 실시예들은 다음 청구범위의 범위 내에 있다.
SEQUENCE LISTING <110> The Regents of the University of California <120> BIOSYNTHETIC PLATFORM FOR THE PRODUCTION OF OLIVETOLIC ACID AND ANALOGUES OF OLIVETOLIC ACID <130> 00011-091WO1 <140> Not yet assigned <141> 2021-01-07 <150> US 62/959,849 <151> 2020-01-10 <160> 18 <170> PatentIn version 3.5 <210> 1 <211> 7548 <212> DNA <213> Metarhizium anisopliae <220> <221> CDS <222> (1)..(7548) <400> 1 atg caa gcg cca gca cca tca aga gac gac att gcc gtc gtc ggc ttg 48 Met Gln Ala Pro Ala Pro Ser Arg Asp Asp Ile Ala Val Val Gly Leu 1 5 10 15 tcg tgc cgc ttc ccg ggc gaa gca gat acc gcc gag cac ttt tgg gat 96 Ser Cys Arg Phe Pro Gly Glu Ala Asp Thr Ala Glu His Phe Trp Asp 20 25 30 ttc atc tgc aat gga cgt aat gca tac tct gag aat ccg gat cgg tgg 144 Phe Ile Cys Asn Gly Arg Asn Ala Tyr Ser Glu Asn Pro Asp Arg Trp 35 40 45 acg ccg gat gct ttt cac tac ggt gag aaa aaa atc aac acc agt ctg 192 Thr Pro Asp Ala Phe His Tyr Gly Glu Lys Lys Ile Asn Thr Ser Leu 50 55 60 ccc cgg gga ggg cat ttt atg aag caa gat gtg gcc gcc ttt gac gcc 240 Pro Arg Gly Gly His Phe Met Lys Gln Asp Val Ala Ala Phe Asp Ala 65 70 75 80 aac ttc ttc aac ctc tcc aag gtc gag gcc gag tcc atg gac ccc cag 288 Asn Phe Phe Asn Leu Ser Lys Val Glu Ala Glu Ser Met Asp Pro Gln 85 90 95 cag cgc atc atg atg gag gtg acg tac gag tcc atg gag agc gcc ggc 336 Gln Arg Ile Met Met Glu Val Thr Tyr Glu Ser Met Glu Ser Ala Gly 100 105 110 ctc cgc gtc gac cag ctc gcg ggc tcg cgg acg ggc gtc ttc atg gcc 384 Leu Arg Val Asp Gln Leu Ala Gly Ser Arg Thr Gly Val Phe Met Ala 115 120 125 agc ttc acg agc gac tac cgc gag atg ctg tac cgc gat gcc gag acg 432 Ser Phe Thr Ser Asp Tyr Arg Glu Met Leu Tyr Arg Asp Ala Glu Thr 130 135 140 gcg cct ctc tac acc gca acg ggc acc agc aac acg tcg acg tcg aac 480 Ala Pro Leu Tyr Thr Ala Thr Gly Thr Ser Asn Thr Ser Thr Ser Asn 145 150 155 160 cgc gtc tcg tgg ttc ttc gac ctg cgc ggg ccc agc ttc acc gtc aac 528 Arg Val Ser Trp Phe Phe Asp Leu Arg Gly Pro Ser Phe Thr Val Asn 165 170 175 acg gcc tgc tcg tcc agt ctg gtc gcc tgc cat ctc gcc tgc caa agc 576 Thr Ala Cys Ser Ser Ser Leu Val Ala Cys His Leu Ala Cys Gln Ser 180 185 190 cta tgg agc ggc gag acg gag agc gcc att gtc ggc ggc acc agc ctg 624 Leu Trp Ser Gly Glu Thr Glu Ser Ala Ile Val Gly Gly Thr Ser Leu 195 200 205 ctg ctg aac ccc gac atg ttc ctg tac ctt tcc aac cag cag ttc ctg 672 Leu Leu Asn Pro Asp Met Phe Leu Tyr Leu Ser Asn Gln Gln Phe Leu 210 215 220 gcc ccc gac ggc cag tgc aag agc ttt gac gag tcg ggc gac ggc tac 720 Ala Pro Asp Gly Gln Cys Lys Ser Phe Asp Glu Ser Gly Asp Gly Tyr 225 230 235 240 gcc agg ggc gac ggc atc ggc gtc gtc att ctg aag cga gtt gcc gac 768 Ala Arg Gly Asp Gly Ile Gly Val Val Ile Leu Lys Arg Val Ala Asp 245 250 255 gcc ctc cgc gac ggc gac ccg atc cgc gcc gtc atc cgt ggc agc gga 816 Ala Leu Arg Asp Gly Asp Pro Ile Arg Ala Val Ile Arg Gly Ser Gly 260 265 270 tgc aac cag gac ggc cat aca aag ggc ttc acc atc ccc agc gtc gac 864 Cys Asn Gln Asp Gly His Thr Lys Gly Phe Thr Ile Pro Ser Val Asp 275 280 285 gcg caa gcc tcc ctc att gca gaa acg tac cgc aac gcc ggc ctc tca 912 Ala Gln Ala Ser Leu Ile Ala Glu Thr Tyr Arg Asn Ala Gly Leu Ser 290 295 300 ctt gcg gag aca cgc tac gtc gag gct cac gga acg ggc acc cag gcc 960 Leu Ala Glu Thr Arg Tyr Val Glu Ala His Gly Thr Gly Thr Gln Ala 305 310 315 320 ggc gac acg cgt gag atg gaa ggc att gcc cgc aca ttc agc cag cac 1008 Gly Asp Thr Arg Glu Met Glu Gly Ile Ala Arg Thr Phe Ser Gln His 325 330 335 cgc acg gcg tcg gac gag ctg ctg gtg gga tca gtc aag gca aat atc 1056 Arg Thr Ala Ser Asp Glu Leu Leu Val Gly Ser Val Lys Ala Asn Ile 340 345 350 ggg cat ctc gaa gcc tgc gcg gga ctg gcc tcg ctc ata aag tgc gtc 1104 Gly His Leu Glu Ala Cys Ala Gly Leu Ala Ser Leu Ile Lys Cys Val 355 360 365 tac atc ctg gaa acg ggc gtg ata ccc ccg acg ccg agc gtc cgc gtc 1152 Tyr Ile Leu Glu Thr Gly Val Ile Pro Pro Thr Pro Ser Val Arg Val 370 375 380 ctg aac ccc aag atc cgc tgg gag gaa tgg cat ctc aag gtg cct gcg 1200 Leu Asn Pro Lys Ile Arg Trp Glu Glu Trp His Leu Lys Val Pro Ala 385 390 395 400 aca caa aca act tgg ccg acc gag ggc ctg cgg cgg atc agc acc caa 1248 Thr Gln Thr Thr Trp Pro Thr Glu Gly Leu Arg Arg Ile Ser Thr Gln 405 410 415 ggt ttt gga tat ggc ggt aca aac gcg cat ctg att ctc gac gac gcg 1296 Gly Phe Gly Tyr Gly Gly Thr Asn Ala His Leu Ile Leu Asp Asp Ala 420 425 430 gcc cat tat ctc gag gca cgc aaa ctc agg ggc cac cac tat acc cgt 1344 Ala His Tyr Leu Glu Ala Arg Lys Leu Arg Gly His His Tyr Thr Arg 435 440 445 aca cat ccc cag aca cag aga ctt ttg acc tcg gca atg cag gaa gac 1392 Thr His Pro Gln Thr Gln Arg Leu Leu Thr Ser Ala Met Gln Glu Asp 450 455 460 gtg tca aac gac cat ccg cca cgg tta ttt ctg ttc cgc gca aat gat 1440 Val Ser Asn Asp His Pro Pro Arg Leu Phe Leu Phe Arg Ala Asn Asp 465 470 475 480 cgc gag ggc ctg gga cgc gtc cgc tcg tcg ctg gcc cag cat ctc gag 1488 Arg Glu Gly Leu Gly Arg Val Arg Ser Ser Leu Ala Gln His Leu Glu 485 490 495 cag ctc ctc aag tcg tgg ccg cag gat tcg aga gac ggc ggc gca tac 1536 Gln Leu Leu Lys Ser Trp Pro Gln Asp Ser Arg Asp Gly Gly Ala Tyr 500 505 510 cta cac aat ctg gcc ttc acc cta gcc agt cga cgg tcc cat ctc caa 1584 Leu His Asn Leu Ala Phe Thr Leu Ala Ser Arg Arg Ser His Leu Gln 515 520 525 tgg cag acg tac gcc acg gcc tcg acg ccc tcg gag ctg ctc caa gcg 1632 Trp Gln Thr Tyr Ala Thr Ala Ser Thr Pro Ser Glu Leu Leu Gln Ala 530 535 540 ctc cag cac gag ggc agc gcg tgg gcg gct ccc gag act cgc ctc gcc 1680 Leu Gln His Glu Gly Ser Ala Trp Ala Ala Pro Glu Thr Arg Leu Ala 545 550 555 560 gcc tcg ccc ccc cgg ctc ggc ttc atc ttc acc ggc cag ggc gcg cag 1728 Ala Ser Pro Pro Arg Leu Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln 565 570 575 tgg gct cgc atg ggc gtc gag ctg atg gcg tac ccc gtg ttc cgc cag 1776 Trp Ala Arg Met Gly Val Glu Leu Met Ala Tyr Pro Val Phe Arg Gln 580 585 590 agc gtc gag gcg tcg gac ggg ttt ctg cgc agc gcc ctc ggg tgc ccc 1824 Ser Val Glu Ala Ser Asp Gly Phe Leu Arg Ser Ala Leu Gly Cys Pro 595 600 605 tgg tct gcc gtc gac gag ctg gcc cag ccg cag gct acg tcg cgg ctc 1872 Trp Ser Ala Val Asp Glu Leu Ala Gln Pro Gln Ala Thr Ser Arg Leu 610 615 620 tcc gag gcg gcc tac agc cag acg ctc tgc acg gtg ctc caa atc gcc 1920 Ser Glu Ala Ala Tyr Ser Gln Thr Leu Cys Thr Val Leu Gln Ile Ala 625 630 635 640 acc gtc gac ctg ctc gag gac tgg aac gtc tgt ccc acg cgc gtg gcc 1968 Thr Val Asp Leu Leu Glu Asp Trp Asn Val Cys Pro Thr Arg Val Ala 645 650 655 ggg cac tcg agc ggc gag atc gcc gcc gcc tac tgc ctg ggc gcc ctg 2016 Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Ala Leu 660 665 670 agc aag cac gac agt ctg cgg gtg gcc tac tac cgc ggg att ctg tcc 2064 Ser Lys His Asp Ser Leu Arg Val Ala Tyr Tyr Arg Gly Ile Leu Ser 675 680 685 tcg gag atg cag cag aca cac gcg gat cgc agg gga gcc atg atg gcc 2112 Ser Glu Met Gln Gln Thr His Ala Asp Arg Arg Gly Ala Met Met Ala 690 695 700 gtc ggg gct tcc ccc gaa gag gtc gag gcg tgg ctg gcc aag ctg acc 2160 Val Gly Ala Ser Pro Glu Glu Val Glu Ala Trp Leu Ala Lys Leu Thr 705 710 715 720 cgg gga cga gtc gtc gtc gcc tgc atc aac tcg ccg acc agc gtc acg 2208 Arg Gly Arg Val Val Val Ala Cys Ile Asn Ser Pro Thr Ser Val Thr 725 730 735 gca tcc ggg gac gcc gcg ggc gtc gac gag ctt ctc gcc atg gtc caa 2256 Ala Ser Gly Asp Ala Ala Gly Val Asp Glu Leu Leu Ala Met Val Gln 740 745 750 cag gcc ggc gtg ttt ggg cgc aag ctg cag gtg gac gtg gcc tat cac 2304 Gln Ala Gly Val Phe Gly Arg Lys Leu Gln Val Asp Val Ala Tyr His 755 760 765 tct cac cac atg cag tcg gtt tct tcc gcg tac tct gag ctc ctc aag 2352 Ser His His Met Gln Ser Val Ser Ser Ala Tyr Ser Glu Leu Leu Lys 770 775 780 gat ctt gcg ccg ctg ccg gcg cgt ccg gga cgc acc atg cac tcg agc 2400 Asp Leu Ala Pro Leu Pro Ala Arg Pro Gly Arg Thr Met His Ser Ser 785 790 795 800 gtc ttg ggc cgt gtc att gac gcc gcg gag ctc ggc gcc tcc aac tgg 2448 Val Leu Gly Arg Val Ile Asp Ala Ala Glu Leu Gly Ala Ser Asn Trp 805 810 815 gtg caa aac ctc gtc tcc ccg gtg cgc ttc tcc gaa gcc gtg tcg agc 2496 Val Gln Asn Leu Val Ser Pro Val Arg Phe Ser Glu Ala Val Ser Ser 820 825 830 ctc ctc tcc gcc ggg gac aag ccg gcc gtc gat gtg ctc gtc gag att 2544 Leu Leu Ser Ala Gly Asp Lys Pro Ala Val Asp Val Leu Val Glu Ile 835 840 845 gga ccg cac gcc gcg ctc aag ggg ccc gtc cag cag atc ctc cag gcc 2592 Gly Pro His Ala Ala Leu Lys Gly Pro Val Gln Gln Ile Leu Gln Ala 850 855 860 cag ggc gtg tcc gcg gtc aag tac acg agt gtc ctc tcc cgg gga cag 2640 Gln Gly Val Ser Ala Val Lys Tyr Thr Ser Val Leu Ser Arg Gly Gln 865 870 875 880 agc gcc gta aag acg gct ctg gcg tgc gcc ggc gag ctc gtc ctg tcg 2688 Ser Ala Val Lys Thr Ala Leu Ala Cys Ala Gly Glu Leu Val Leu Ser 885 890 895 agt gtg ccc gtc gcc gtg tct cgc gta aac ttg gag tcc ggg ccg ccg 2736 Ser Val Pro Val Ala Val Ser Arg Val Asn Leu Glu Ser Gly Pro Pro 900 905 910 ccg agt ccg ttg gtc gac ctg ccc ccc tat ccc tgg aac cga tca act 2784 Pro Ser Pro Leu Val Asp Leu Pro Pro Tyr Pro Trp Asn Arg Ser Thr 915 920 925 cga ttc tgg gcc gag tcg cgt ctt tcc cga gag tat cgg ctt cgc aag 2832 Arg Phe Trp Ala Glu Ser Arg Leu Ser Arg Glu Tyr Arg Leu Arg Lys 930 935 940 cac gcc cgc ctg ccg ctg ctg gga agt ccg tgt ccc acg atg ggc gcc 2880 His Ala Arg Leu Pro Leu Leu Gly Ser Pro Cys Pro Thr Met Gly Ala 945 950 955 960 cgc gag aga tac tgg cgc ggc atg gtg agg ttg gag gag gag ccc tgg 2928 Arg Glu Arg Tyr Trp Arg Gly Met Val Arg Leu Glu Glu Glu Pro Trp 965 970 975 atc cgg gac cat gag atc cag ggg tcc atc ctg tat ccc ggg gcc ggc 2976 Ile Arg Asp His Glu Ile Gln Gly Ser Ile Leu Tyr Pro Gly Ala Gly 980 985 990 ttc ttg atc atg gcc att gaa gct gcc tcc cag cag gca ggc gag cag 3024 Phe Leu Ile Met Ala Ile Glu Ala Ala Ser Gln Gln Ala Gly Glu Gln 995 1000 1005 cgc aaa gta agc gca ttc cga ctg cgc gac gtg cac ctc gac gcc 3069 Arg Lys Val Ser Ala Phe Arg Leu Arg Asp Val His Leu Asp Ala 1010 1015 1020 gcc ttg gtg gtg acc gag gac agc acc gcc gag gcc att ctg caa 3114 Ala Leu Val Val Thr Glu Asp Ser Thr Ala Glu Ala Ile Leu Gln 1025 1030 1035 ctc cga ccg cat ctt ctc gcg ccg ggc agc agc cag tcg tcc tgg 3159 Leu Arg Pro His Leu Leu Ala Pro Gly Ser Ser Gln Ser Ser Trp 1040 1045 1050 atg gag ttt acc gtc aat tca tct att gac ggc ggt gac ttg cgt 3204 Met Glu Phe Thr Val Asn Ser Ser Ile Asp Gly Gly Asp Leu Arg 1055 1060 1065 cag aac tgc tcc ggc ctc atc atg atc gag tat gcc gcc gac gcc 3249 Gln Asn Cys Ser Gly Leu Ile Met Ile Glu Tyr Ala Ala Asp Ala 1070 1075 1080 gac tcg gcc atg gac cgc gag cgt gcc ctg gag tcg gac atg gtt 3294 Asp Ser Ala Met Asp Arg Glu Arg Ala Leu Glu Ser Asp Met Val 1085 1090 1095 tgt gac tgg tac aag aaa acg tac gtc tct tgc cag cag tct gtc 3339 Cys Asp Trp Tyr Lys Lys Thr Tyr Val Ser Cys Gln Gln Ser Val 1100 1105 1110 gat gtg ggc aaa ttc tac tcg cgc ctt gct tct ctc ggc ctt gtt 3384 Asp Val Gly Lys Phe Tyr Ser Arg Leu Ala Ser Leu Gly Leu Val 1115 1120 1125 tac gga cca acc ttt gca aac gtg acg gag att cgg agg acg ggc 3429 Tyr Gly Pro Thr Phe Ala Asn Val Thr Glu Ile Arg Arg Thr Gly 1130 1135 1140 cag ggc cag tgt atc ggt gcc gtc cgt atc ccg gcc gtg gac agc 3474 Gln Gly Gln Cys Ile Gly Ala Val Arg Ile Pro Ala Val Asp Ser 1145 1150 1155 ctc gtg ccg ccc gca tac cgc agc cat cct cac gtc atc cat ccg 3519 Leu Val Pro Pro Ala Tyr Arg Ser His Pro His Val Ile His Pro 1160 1165 1170 ggg acg ttg gat gcc gtc ttc cac ctc gcc ttt gcg gcg ctc gag 3564 Gly Thr Leu Asp Ala Val Phe His Leu Ala Phe Ala Ala Leu Glu 1175 1180 1185 gac tcg ttg ctt ccg ggc ccc atg gtc cca acg aca atc gac gag 3609 Asp Ser Leu Leu Pro Gly Pro Met Val Pro Thr Thr Ile Asp Glu 1190 1195 1200 ctg gtc gtg gca gca gat aca cca aac acc cct ggc act ctg ctt 3654 Leu Val Val Ala Ala Asp Thr Pro Asn Thr Pro Gly Thr Leu Leu 1205 1210 1215 cgg gga gtc tca cgc tct tct cct cac ggc ttc aga gag ctc atc 3699 Arg Gly Val Ser Arg Ser Ser Pro His Gly Phe Arg Glu Leu Ile 1220 1225 1230 tcc gac att gac atg ctg gac gac caa agc agc aga gca ctt gtg 3744 Ser Asp Ile Asp Met Leu Asp Asp Gln Ser Ser Arg Ala Leu Val 1235 1240 1245 caa atc aag ggg ttc cgt tgc gcc gac gta tcc ggg ggg cgc atg 3789 Gln Ile Lys Gly Phe Arg Cys Ala Asp Val Ser Gly Gly Arg Met 1250 1255 1260 acg tcg tcg gag gcg gcg tca gca gag agc cgg ccg att ggc ttc 3834 Thr Ser Ser Glu Ala Ala Ser Ala Glu Ser Arg Pro Ile Gly Phe 1265 1270 1275 cgt ctc gag tgg aag ccg gca atc gac ttg ctg acc ggt gag cag 3879 Arg Leu Glu Trp Lys Pro Ala Ile Asp Leu Leu Thr Gly Glu Gln 1280 1285 1290 cta cgg aca cat ctt gac cgt cgt gtc aag cag gag ggt gcg tcc 3924 Leu Arg Thr His Leu Asp Arg Arg Val Lys Gln Glu Gly Ala Ser 1295 1300 1305 aac gtc gcc cgc gcc aca gag ctg aac aat cat gtc cat cac ctt 3969 Asn Val Ala Arg Ala Thr Glu Leu Asn Asn His Val His His Leu 1310 1315 1320 gaa gaa act tta cct cgc gtt gcc gtg gat cct gcc atg gca aac 4014 Glu Glu Thr Leu Pro Arg Val Ala Val Asp Pro Ala Met Ala Asn 1325 1330 1335 ttg tct gac tgg ctg tcg gcc aag tct gca aaa ctc acg aat ggt 4059 Leu Ser Asp Trp Leu Ser Ala Lys Ser Ala Lys Leu Thr Asn Gly 1340 1345 1350 act act tca tca tcc aaa cgt cta tcc cca ggg ggt gac atg ctc 4104 Thr Thr Ser Ser Ser Lys Arg Leu Ser Pro Gly Gly Asp Met Leu 1355 1360 1365 gca atg aga gac gcc ttg acc gcc gtg cga gca ggg agc att cca 4149 Ala Met Arg Asp Ala Leu Thr Ala Val Arg Ala Gly Ser Ile Pro 1370 1375 1380 tca cca gaa caa caa gac agg atg ctg aga gag gtg gag caa aac 4194 Ser Pro Glu Gln Gln Asp Arg Met Leu Arg Glu Val Glu Gln Asn 1385 1390 1395 ggc gct ctg tcc att cta ttc aag ccg ctc gac gca tat atc gac 4239 Gly Ala Leu Ser Ile Leu Phe Lys Pro Leu Asp Ala Tyr Ile Asp 1400 1405 1410 ctt cgc cat cat gcc aag ccc aac ctg tcg att ctt gag ctg agc 4284 Leu Arg His His Ala Lys Pro Asn Leu Ser Ile Leu Glu Leu Ser 1415 1420 1425 ctg gat tcg gtg cca tac tct gtc ttt gca gcc ctg ccc agt cga 4329 Leu Asp Ser Val Pro Tyr Ser Val Phe Ala Ala Leu Pro Ser Arg 1430 1435 1440 cac aag att ctc cag aca gcg cag tac gcc att aga gta tcg caa 4374 His Lys Ile Leu Gln Thr Ala Gln Tyr Ala Ile Arg Val Ser Gln 1445 1450 1455 gag ggc gtc gcc gac cga gtc agg gcc cag ttt ggg tct cag gct 4419 Glu Gly Val Ala Asp Arg Val Arg Ala Gln Phe Gly Ser Gln Ala 1460 1465 1470 tcc gac att gac gtc tcc gtc aca gac ttt aca aag aaa ctc gac 4464 Ser Asp Ile Asp Val Ser Val Thr Asp Phe Thr Lys Lys Leu Asp 1475 1480 1485 gag ggc ttg gga aag cat gat gtc att ctc ata ttt gac cct ggc 4509 Glu Gly Leu Gly Lys His Asp Val Ile Leu Ile Phe Asp Pro Gly 1490 1495 1500 ttc gta cac gca aag cta gag gtc gtt ttg cgc aac gcg cgc aag 4554 Phe Val His Ala Lys Leu Glu Val Val Leu Arg Asn Ala Arg Lys 1505 1510 1515 ctg ttg aac cca ggg ggc agg atc gtc gtc gca gaa gtc agc gac 4599 Leu Leu Asn Pro Gly Gly Arg Ile Val Val Ala Glu Val Ser Asp 1520 1525 1530 cct ggg ctc tac ttg ggc aca gca ctg ggc tgt ctt cag tgg aca 4644 Pro Gly Leu Tyr Leu Gly Thr Ala Leu Gly Cys Leu Gln Trp Thr 1535 1540 1545 aga aac cta gac gtt gcc cag agc agc agc agc tgg aca tcg tgt 4689 Arg Asn Leu Asp Val Ala Gln Ser Ser Ser Ser Trp Thr Ser Cys 1550 1555 1560 ctc gcg cgc tcg gga ctg acg cct gct ctc aaa ctc atc gac atg 4734 Leu Ala Arg Ser Gly Leu Thr Pro Ala Leu Lys Leu Ile Asp Met 1565 1570 1575 gac aca gag tcc gcc gtt cac gga cac ttc cgc ctg agt ctc aca 4779 Asp Thr Glu Ser Ala Val His Gly His Phe Arg Leu Ser Leu Thr 1580 1585 1590 ggc aat gcc gcc gag tcg acc aac agt gac aat cgc cag ccg cag 4824 Gly Asn Ala Ala Glu Ser Thr Asn Ser Asp Asn Arg Gln Pro Gln 1595 1600 1605 caa gtc acc ctc ata gaa gcc gcc aat cca tct gcc acg gcg caa 4869 Gln Val Thr Leu Ile Glu Ala Ala Asn Pro Ser Ala Thr Ala Gln 1610 1615 1620 gat atc gcg gca gcc gtg gcc cag aat ctt gac aag gcg tcg att 4914 Asp Ile Ala Ala Ala Val Ala Gln Asn Leu Asp Lys Ala Ser Ile 1625 1630 1635 ccc aca aag cgc atc cgt tgg ggc tcc gac gtg tcg cag ctc aag 4959 Pro Thr Lys Arg Ile Arg Trp Gly Ser Asp Val Ser Gln Leu Lys 1640 1645 1650 ggc cag cct tgc atc gtc ctg acg gac ttg gag tct gcg ctt ctc 5004 Gly Gln Pro Cys Ile Val Leu Thr Asp Leu Glu Ser Ala Leu Leu 1655 1660 1665 aag gac ccg gca cca gag gat ctc gcg gcc ctg cag tcg ctg ttc 5049 Lys Asp Pro Ala Pro Glu Asp Leu Ala Ala Leu Gln Ser Leu Phe 1670 1675 1680 gcg cat gcc gag agc acc ctc tgg gtc agt ggc ccc ctg gga cct 5094 Ala His Ala Glu Ser Thr Leu Trp Val Ser Gly Pro Leu Gly Pro 1685 1690 1695 gat gct gct ctg atc acg ggc ctg tct cgc agc gtt tgc aac gag 5139 Asp Ala Ala Leu Ile Thr Gly Leu Ser Arg Ser Val Cys Asn Glu 1700 1705 1710 gcg gcc gac gtc cat ata cgc acg ctt gag gtg act gat ctg cct 5184 Ala Ala Asp Val His Ile Arg Thr Leu Glu Val Thr Asp Leu Pro 1715 1720 1725 ggc ccc ggg gcc gac agc tac gcc gac ctg gtc act cgc gtc ttc 5229 Gly Pro Gly Ala Asp Ser Tyr Ala Asp Leu Val Thr Arg Val Phe 1730 1735 1740 cgg tat agc ggt ccc gat aca gag ttt cgg tgg cat tca gac gcg 5274 Arg Tyr Ser Gly Pro Asp Thr Glu Phe Arg Trp His Ser Asp Ala 1745 1750 1755 ctg ctt gtc agc cgc ctg gtc gag gat gag gcc cga aac aag gag 5319 Leu Leu Val Ser Arg Leu Val Glu Asp Glu Ala Arg Asn Lys Glu 1760 1765 1770 att gca cag ctg ctg ggc cag gga gaa aag gcc gcg gtt gcg act 5364 Ile Ala Gln Leu Leu Gly Gln Gly Glu Lys Ala Ala Val Ala Thr 1775 1780 1785 acg cta cag gag aag cca gag gga ctg aag cta tgc atg cgc cag 5409 Thr Leu Gln Glu Lys Pro Glu Gly Leu Lys Leu Cys Met Arg Gln 1790 1795 1800 att ggc atg ctg gac tct gtt tgc ttt gag ccc gac ttg ttg gct 5454 Ile Gly Met Leu Asp Ser Val Cys Phe Glu Pro Asp Leu Leu Ala 1805 1810 1815 ttg gag cca ctg gaa gca ggc gag gtg gaa gtc gac gtc aag gcc 5499 Leu Glu Pro Leu Glu Ala Gly Glu Val Glu Val Asp Val Lys Ala 1820 1825 1830 tcc gga gtc aac ttc cga gat gtc atg gtc gcc ttg gga cag att 5544 Ser Gly Val Asn Phe Arg Asp Val Met Val Ala Leu Gly Gln Ile 1835 1840 1845 cca gac cgg gca ttc ggg ttc gag ggc gct ggt gtc gtt cgc cgt 5589 Pro Asp Arg Ala Phe Gly Phe Glu Gly Ala Gly Val Val Arg Arg 1850 1855 1860 gta cat gct tca gag acg cgc ctc cgc cca gga gac cga gtc gtc 5634 Val His Ala Ser Glu Thr Arg Leu Arg Pro Gly Asp Arg Val Val 1865 1870 1875 ttc ctc gct cac gga gca cac cgt aca gtc cat cgc gta cgc gcc 5679 Phe Leu Ala His Gly Ala His Arg Thr Val His Arg Val Arg Ala 1880 1885 1890 gac tac gcc atg cct atg cct gat acc atg agc ttt gaa gag ggc 5724 Asp Tyr Ala Met Pro Met Pro Asp Thr Met Ser Phe Glu Glu Gly 1895 1900 1905 gcg gcc att ctc ctc gtc cac acg aca gct tgg tac gca ctc gtc 5769 Ala Ala Ile Leu Leu Val His Thr Thr Ala Trp Tyr Ala Leu Val 1910 1915 1920 aag tcg gcg cgc gca aca gcc ggc cag tca gtc ctc gtt cac gct 5814 Lys Ser Ala Arg Ala Thr Ala Gly Gln Ser Val Leu Val His Ala 1925 1930 1935 gcc gca ggt ggt gtt ggc cag gcc gtc ctc atg ctt gct cga cat 5859 Ala Ala Gly Gly Val Gly Gln Ala Val Leu Met Leu Ala Arg His 1940 1945 1950 cta ggt cta cag gtt ttc gcg acg gtt ggt tcc gag gag aag agg 5904 Leu Gly Leu Gln Val Phe Ala Thr Val Gly Ser Glu Glu Lys Arg 1955 1960 1965 aag ctt gtg cac gaa acg tac ggg gtt ccc cac gac cac atc ttc 5949 Lys Leu Val His Glu Thr Tyr Gly Val Pro His Asp His Ile Phe 1970 1975 1980 aac tcg cga gac gcc agc ttt gcc atg ggc gtg aag cgc atg acc 5994 Asn Ser Arg Asp Ala Ser Phe Ala Met Gly Val Lys Arg Met Thr 1985 1990 1995 aaa ggc cgc ggg gtc gat att gtt gtc aat tcg ctg gct ggg gaa 6039 Lys Gly Arg Gly Val Asp Ile Val Val Asn Ser Leu Ala Gly Glu 2000 2005 2010 gct ctc cgg cag acg tgg cac tgc ctg gcc ccc ttt ggc acc ttt 6084 Ala Leu Arg Gln Thr Trp His Cys Leu Ala Pro Phe Gly Thr Phe 2015 2020 2025 gtc gag ctc ggc atg aag gac atc ttg gac aac gca cgc ctg gac 6129 Val Glu Leu Gly Met Lys Asp Ile Leu Asp Asn Ala Arg Leu Asp 2030 2035 2040 atg aag ccc ttc ctc cag gat gcc aca ttc gtc ttc ttt aac ctg 6174 Met Lys Pro Phe Leu Gln Asp Ala Thr Phe Val Phe Phe Asn Leu 2045 2050 2055 aac cgt gtc caa aag gag cgg cca gac ctc atg gga gag gct ctc 6219 Asn Arg Val Gln Lys Glu Arg Pro Asp Leu Met Gly Glu Ala Leu 2060 2065 2070 cga gag aca atg gcc ctt gta cgc tcc ggc gct ctc aag ccc gcg 6264 Arg Glu Thr Met Ala Leu Val Arg Ser Gly Ala Leu Lys Pro Ala 2075 2080 2085 acg ccg ctc acc tcg tat ccc gcc tct cag gtg gaa gcg gca ttc 6309 Thr Pro Leu Thr Ser Tyr Pro Ala Ser Gln Val Glu Ala Ala Phe 2090 2095 2100 cgc aag att caa acg ggc cag cac cta ggg aag ctc gtg ctg aca 6354 Arg Lys Ile Gln Thr Gly Gln His Leu Gly Lys Leu Val Leu Thr 2105 2110 2115 ttc cag gag gga gat gtt gtc ccc gtc gtc aga cca gac ctc agc 6399 Phe Gln Glu Gly Asp Val Val Pro Val Val Arg Pro Asp Leu Ser 2120 2125 2130 cta agt gac tct ggc acc tac ctt ctc gtc gga gga ctc ggc ggc 6444 Leu Ser Asp Ser Gly Thr Tyr Leu Leu Val Gly Gly Leu Gly Gly 2135 2140 2145 ttg ggc cgg agt ctt gca cgg ctc ctg gtg cag ctt ggg gcg cgc 6489 Leu Gly Arg Ser Leu Ala Arg Leu Leu Val Gln Leu Gly Ala Arg 2150 2155 2160 cgg ctg tgc ttc ctc tct cgc tcc ggc gca gca agc agc gag gcg 6534 Arg Leu Cys Phe Leu Ser Arg Ser Gly Ala Ala Ser Ser Glu Ala 2165 2170 2175 cgc gcc ctc gtc aag gaa ctg gag atg cag cat cga gta cgc gtc 6579 Arg Ala Leu Val Lys Glu Leu Glu Met Gln His Arg Val Arg Val 2180 2185 2190 ctc gtc tgc aaa ggg gac gtg tcc gac gcc gac acc gta tcc cgc 6624 Leu Val Cys Lys Gly Asp Val Ser Asp Ala Asp Thr Val Ser Arg 2195 2200 2205 gtc gtc cag caa tgc cgg gcg gct ctg ggg ccc atc cgg ggc gtc 6669 Val Val Gln Gln Cys Arg Ala Ala Leu Gly Pro Ile Arg Gly Val 2210 2215 2220 att cag tgt gcc atg gtc ctc cgt gac ggt ctc ttt gag agg atg 6714 Ile Gln Cys Ala Met Val Leu Arg Asp Gly Leu Phe Glu Arg Met 2225 2230 2235 gct cac gat cag tgg acc gaa agc acg cgg ccc aag gtg cag ggc 6759 Ala His Asp Gln Trp Thr Glu Ser Thr Arg Pro Lys Val Gln Gly 2240 2245 2250 acg tgg aac ctg cac gag cag atc cca gtg tcc gac ttt ttc atc 6804 Thr Trp Asn Leu His Glu Gln Ile Pro Val Ser Asp Phe Phe Ile 2255 2260 2265 acg ctg agt tcc ttt gcg ggc gtc ttt gga agc cgt ggg cag agc 6849 Thr Leu Ser Ser Phe Ala Gly Val Phe Gly Ser Arg Gly Gln Ser 2270 2275 2280 aac tac gcc gct gcg ggt gcg tac gag gat gcc atg gca cac cat 6894 Asn Tyr Ala Ala Ala Gly Ala Tyr Glu Asp Ala Met Ala His His 2285 2290 2295 cgg gag tct ctg ggc cag agg gcc atc acc atc gac ttg ggc atc 6939 Arg Glu Ser Leu Gly Gln Arg Ala Ile Thr Ile Asp Leu Gly Ile 2300 2305 2310 atg cga gac gtg ggt gtt ctc gcc gag aac ggc atc acc gac tat 6984 Met Arg Asp Val Gly Val Leu Ala Glu Asn Gly Ile Thr Asp Tyr 2315 2320 2325 ctc cgc gag tgg gag gag ccg ttt gga atc cgc gag ccc gag ttc 7029 Leu Arg Glu Trp Glu Glu Pro Phe Gly Ile Arg Glu Pro Glu Phe 2330 2335 2340 cat gcg ctc atc aag tca gcc atc atg tcg acg acg cag ccc ctg 7074 His Ala Leu Ile Lys Ser Ala Ile Met Ser Thr Thr Gln Pro Leu 2345 2350 2355 act gaa cgc tcc gtg gtg cag atc cca acc ggc ctg gcc acg gcc 7119 Thr Glu Arg Ser Val Val Gln Ile Pro Thr Gly Leu Ala Thr Ala 2360 2365 2370 cgg tct gcg cag gca gcc ggt ata agc aca ccg ttc tac ttt gat 7164 Arg Ser Ala Gln Ala Ala Gly Ile Ser Thr Pro Phe Tyr Phe Asp 2375 2380 2385 gat gcc cgt ttc tcc atc ctg gcc cag aca cgc gcc tcg gcc ggt 7209 Asp Ala Arg Phe Ser Ile Leu Ala Gln Thr Arg Ala Ser Ala Gly 2390 2395 2400 gcc tcg tct gca gct ggg tct ggt gac gcc gat gcc ggc aag gtt 7254 Ala Ser Ser Ala Ala Gly Ser Gly Asp Ala Asp Ala Gly Lys Val 2405 2410 2415 tct gtg cgg acg cag ctt tcc cag gct cat tcc gtg gct gaa gcc 7299 Ser Val Arg Thr Gln Leu Ser Gln Ala His Ser Val Ala Glu Ala 2420 2425 2430 gcc gcc gcc gtc cag acg gtg ctt ctt gag cgc gtg gca agg acc 7344 Ala Ala Ala Val Gln Thr Val Leu Leu Glu Arg Val Ala Arg Thr 2435 2440 2445 ctt cag agc tcc gtg gcg gaa atc gat ccc tcc cgg cca ctg cac 7389 Leu Gln Ser Ser Val Ala Glu Ile Asp Pro Ser Arg Pro Leu His 2450 2455 2460 tcg tac ggt gta gat tcc ttg gtg gcc gtg gaa acg gtc aag tgg 7434 Ser Tyr Gly Val Asp Ser Leu Val Ala Val Glu Thr Val Lys Trp 2465 2470 2475 atg ttt aag acg ctg gac gct aag atg acg gtg ttt gat gtt ctt 7479 Met Phe Lys Thr Leu Asp Ala Lys Met Thr Val Phe Asp Val Leu 2480 2485 2490 tcc aac gtg tcc atc acg gcg ctg tgc gag aag att gca tcc atg 7524 Ser Asn Val Ser Ile Thr Ala Leu Cys Glu Lys Ile Ala Ser Met 2495 2500 2505 tct act ttg gtg aaa ttg aac tag 7548 Ser Thr Leu Val Lys Leu Asn 2510 2515 <210> 2 <211> 2515 <212> PRT <213> Metarhizium anisopliae <400> 2 Met Gln Ala Pro Ala Pro Ser Arg Asp Asp Ile Ala Val Val Gly Leu 1 5 10 15 Ser Cys Arg Phe Pro Gly Glu Ala Asp Thr Ala Glu His Phe Trp Asp 20 25 30 Phe Ile Cys Asn Gly Arg Asn Ala Tyr Ser Glu Asn Pro Asp Arg Trp 35 40 45 Thr Pro Asp Ala Phe His Tyr Gly Glu Lys Lys Ile Asn Thr Ser Leu 50 55 60 Pro Arg Gly Gly His Phe Met Lys Gln Asp Val Ala Ala Phe Asp Ala 65 70 75 80 Asn Phe Phe Asn Leu Ser Lys Val Glu Ala Glu Ser Met Asp Pro Gln 85 90 95 Gln Arg Ile Met Met Glu Val Thr Tyr Glu Ser Met Glu Ser Ala Gly 100 105 110 Leu Arg Val Asp Gln Leu Ala Gly Ser Arg Thr Gly Val Phe Met Ala 115 120 125 Ser Phe Thr Ser Asp Tyr Arg Glu Met Leu Tyr Arg Asp Ala Glu Thr 130 135 140 Ala Pro Leu Tyr Thr Ala Thr Gly Thr Ser Asn Thr Ser Thr Ser Asn 145 150 155 160 Arg Val Ser Trp Phe Phe Asp Leu Arg Gly Pro Ser Phe Thr Val Asn 165 170 175 Thr Ala Cys Ser Ser Ser Leu Val Ala Cys His Leu Ala Cys Gln Ser 180 185 190 Leu Trp Ser Gly Glu Thr Glu Ser Ala Ile Val Gly Gly Thr Ser Leu 195 200 205 Leu Leu Asn Pro Asp Met Phe Leu Tyr Leu Ser Asn Gln Gln Phe Leu 210 215 220 Ala Pro Asp Gly Gln Cys Lys Ser Phe Asp Glu Ser Gly Asp Gly Tyr 225 230 235 240 Ala Arg Gly Asp Gly Ile Gly Val Val Ile Leu Lys Arg Val Ala Asp 245 250 255 Ala Leu Arg Asp Gly Asp Pro Ile Arg Ala Val Ile Arg Gly Ser Gly 260 265 270 Cys Asn Gln Asp Gly His Thr Lys Gly Phe Thr Ile Pro Ser Val Asp 275 280 285 Ala Gln Ala Ser Leu Ile Ala Glu Thr Tyr Arg Asn Ala Gly Leu Ser 290 295 300 Leu Ala Glu Thr Arg Tyr Val Glu Ala His Gly Thr Gly Thr Gln Ala 305 310 315 320 Gly Asp Thr Arg Glu Met Glu Gly Ile Ala Arg Thr Phe Ser Gln His 325 330 335 Arg Thr Ala Ser Asp Glu Leu Leu Val Gly Ser Val Lys Ala Asn Ile 340 345 350 Gly His Leu Glu Ala Cys Ala Gly Leu Ala Ser Leu Ile Lys Cys Val 355 360 365 Tyr Ile Leu Glu Thr Gly Val Ile Pro Pro Thr Pro Ser Val Arg Val 370 375 380 Leu Asn Pro Lys Ile Arg Trp Glu Glu Trp His Leu Lys Val Pro Ala 385 390 395 400 Thr Gln Thr Thr Trp Pro Thr Glu Gly Leu Arg Arg Ile Ser Thr Gln 405 410 415 Gly Phe Gly Tyr Gly Gly Thr Asn Ala His Leu Ile Leu Asp Asp Ala 420 425 430 Ala His Tyr Leu Glu Ala Arg Lys Leu Arg Gly His His Tyr Thr Arg 435 440 445 Thr His Pro Gln Thr Gln Arg Leu Leu Thr Ser Ala Met Gln Glu Asp 450 455 460 Val Ser Asn Asp His Pro Pro Arg Leu Phe Leu Phe Arg Ala Asn Asp 465 470 475 480 Arg Glu Gly Leu Gly Arg Val Arg Ser Ser Leu Ala Gln His Leu Glu 485 490 495 Gln Leu Leu Lys Ser Trp Pro Gln Asp Ser Arg Asp Gly Gly Ala Tyr 500 505 510 Leu His Asn Leu Ala Phe Thr Leu Ala Ser Arg Arg Ser His Leu Gln 515 520 525 Trp Gln Thr Tyr Ala Thr Ala Ser Thr Pro Ser Glu Leu Leu Gln Ala 530 535 540 Leu Gln His Glu Gly Ser Ala Trp Ala Ala Pro Glu Thr Arg Leu Ala 545 550 555 560 Ala Ser Pro Pro Arg Leu Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln 565 570 575 Trp Ala Arg Met Gly Val Glu Leu Met Ala Tyr Pro Val Phe Arg Gln 580 585 590 Ser Val Glu Ala Ser Asp Gly Phe Leu Arg Ser Ala Leu Gly Cys Pro 595 600 605 Trp Ser Ala Val Asp Glu Leu Ala Gln Pro Gln Ala Thr Ser Arg Leu 610 615 620 Ser Glu Ala Ala Tyr Ser Gln Thr Leu Cys Thr Val Leu Gln Ile Ala 625 630 635 640 Thr Val Asp Leu Leu Glu Asp Trp Asn Val Cys Pro Thr Arg Val Ala 645 650 655 Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Ala Leu 660 665 670 Ser Lys His Asp Ser Leu Arg Val Ala Tyr Tyr Arg Gly Ile Leu Ser 675 680 685 Ser Glu Met Gln Gln Thr His Ala Asp Arg Arg Gly Ala Met Met Ala 690 695 700 Val Gly Ala Ser Pro Glu Glu Val Glu Ala Trp Leu Ala Lys Leu Thr 705 710 715 720 Arg Gly Arg Val Val Val Ala Cys Ile Asn Ser Pro Thr Ser Val Thr 725 730 735 Ala Ser Gly Asp Ala Ala Gly Val Asp Glu Leu Leu Ala Met Val Gln 740 745 750 Gln Ala Gly Val Phe Gly Arg Lys Leu Gln Val Asp Val Ala Tyr His 755 760 765 Ser His His Met Gln Ser Val Ser Ser Ala Tyr Ser Glu Leu Leu Lys 770 775 780 Asp Leu Ala Pro Leu Pro Ala Arg Pro Gly Arg Thr Met His Ser Ser 785 790 795 800 Val Leu Gly Arg Val Ile Asp Ala Ala Glu Leu Gly Ala Ser Asn Trp 805 810 815 Val Gln Asn Leu Val Ser Pro Val Arg Phe Ser Glu Ala Val Ser Ser 820 825 830 Leu Leu Ser Ala Gly Asp Lys Pro Ala Val Asp Val Leu Val Glu Ile 835 840 845 Gly Pro His Ala Ala Leu Lys Gly Pro Val Gln Gln Ile Leu Gln Ala 850 855 860 Gln Gly Val Ser Ala Val Lys Tyr Thr Ser Val Leu Ser Arg Gly Gln 865 870 875 880 Ser Ala Val Lys Thr Ala Leu Ala Cys Ala Gly Glu Leu Val Leu Ser 885 890 895 Ser Val Pro Val Ala Val Ser Arg Val Asn Leu Glu Ser Gly Pro Pro 900 905 910 Pro Ser Pro Leu Val Asp Leu Pro Pro Tyr Pro Trp Asn Arg Ser Thr 915 920 925 Arg Phe Trp Ala Glu Ser Arg Leu Ser Arg Glu Tyr Arg Leu Arg Lys 930 935 940 His Ala Arg Leu Pro Leu Leu Gly Ser Pro Cys Pro Thr Met Gly Ala 945 950 955 960 Arg Glu Arg Tyr Trp Arg Gly Met Val Arg Leu Glu Glu Glu Pro Trp 965 970 975 Ile Arg Asp His Glu Ile Gln Gly Ser Ile Leu Tyr Pro Gly Ala Gly 980 985 990 Phe Leu Ile Met Ala Ile Glu Ala Ala Ser Gln Gln Ala Gly Glu Gln 995 1000 1005 Arg Lys Val Ser Ala Phe Arg Leu Arg Asp Val His Leu Asp Ala 1010 1015 1020 Ala Leu Val Val Thr Glu Asp Ser Thr Ala Glu Ala Ile Leu Gln 1025 1030 1035 Leu Arg Pro His Leu Leu Ala Pro Gly Ser Ser Gln Ser Ser Trp 1040 1045 1050 Met Glu Phe Thr Val Asn Ser Ser Ile Asp Gly Gly Asp Leu Arg 1055 1060 1065 Gln Asn Cys Ser Gly Leu Ile Met Ile Glu Tyr Ala Ala Asp Ala 1070 1075 1080 Asp Ser Ala Met Asp Arg Glu Arg Ala Leu Glu Ser Asp Met Val 1085 1090 1095 Cys Asp Trp Tyr Lys Lys Thr Tyr Val Ser Cys Gln Gln Ser Val 1100 1105 1110 Asp Val Gly Lys Phe Tyr Ser Arg Leu Ala Ser Leu Gly Leu Val 1115 1120 1125 Tyr Gly Pro Thr Phe Ala Asn Val Thr Glu Ile Arg Arg Thr Gly 1130 1135 1140 Gln Gly Gln Cys Ile Gly Ala Val Arg Ile Pro Ala Val Asp Ser 1145 1150 1155 Leu Val Pro Pro Ala Tyr Arg Ser His Pro His Val Ile His Pro 1160 1165 1170 Gly Thr Leu Asp Ala Val Phe His Leu Ala Phe Ala Ala Leu Glu 1175 1180 1185 Asp Ser Leu Leu Pro Gly Pro Met Val Pro Thr Thr Ile Asp Glu 1190 1195 1200 Leu Val Val Ala Ala Asp Thr Pro Asn Thr Pro Gly Thr Leu Leu 1205 1210 1215 Arg Gly Val Ser Arg Ser Ser Pro His Gly Phe Arg Glu Leu Ile 1220 1225 1230 Ser Asp Ile Asp Met Leu Asp Asp Gln Ser Ser Arg Ala Leu Val 1235 1240 1245 Gln Ile Lys Gly Phe Arg Cys Ala Asp Val Ser Gly Gly Arg Met 1250 1255 1260 Thr Ser Ser Glu Ala Ala Ser Ala Glu Ser Arg Pro Ile Gly Phe 1265 1270 1275 Arg Leu Glu Trp Lys Pro Ala Ile Asp Leu Leu Thr Gly Glu Gln 1280 1285 1290 Leu Arg Thr His Leu Asp Arg Arg Val Lys Gln Glu Gly Ala Ser 1295 1300 1305 Asn Val Ala Arg Ala Thr Glu Leu Asn Asn His Val His His Leu 1310 1315 1320 Glu Glu Thr Leu Pro Arg Val Ala Val Asp Pro Ala Met Ala Asn 1325 1330 1335 Leu Ser Asp Trp Leu Ser Ala Lys Ser Ala Lys Leu Thr Asn Gly 1340 1345 1350 Thr Thr Ser Ser Ser Lys Arg Leu Ser Pro Gly Gly Asp Met Leu 1355 1360 1365 Ala Met Arg Asp Ala Leu Thr Ala Val Arg Ala Gly Ser Ile Pro 1370 1375 1380 Ser Pro Glu Gln Gln Asp Arg Met Leu Arg Glu Val Glu Gln Asn 1385 1390 1395 Gly Ala Leu Ser Ile Leu Phe Lys Pro Leu Asp Ala Tyr Ile Asp 1400 1405 1410 Leu Arg His His Ala Lys Pro Asn Leu Ser Ile Leu Glu Leu Ser 1415 1420 1425 Leu Asp Ser Val Pro Tyr Ser Val Phe Ala Ala Leu Pro Ser Arg 1430 1435 1440 His Lys Ile Leu Gln Thr Ala Gln Tyr Ala Ile Arg Val Ser Gln 1445 1450 1455 Glu Gly Val Ala Asp Arg Val Arg Ala Gln Phe Gly Ser Gln Ala 1460 1465 1470 Ser Asp Ile Asp Val Ser Val Thr Asp Phe Thr Lys Lys Leu Asp 1475 1480 1485 Glu Gly Leu Gly Lys His Asp Val Ile Leu Ile Phe Asp Pro Gly 1490 1495 1500 Phe Val His Ala Lys Leu Glu Val Val Leu Arg Asn Ala Arg Lys 1505 1510 1515 Leu Leu Asn Pro Gly Gly Arg Ile Val Val Ala Glu Val Ser Asp 1520 1525 1530 Pro Gly Leu Tyr Leu Gly Thr Ala Leu Gly Cys Leu Gln Trp Thr 1535 1540 1545 Arg Asn Leu Asp Val Ala Gln Ser Ser Ser Ser Trp Thr Ser Cys 1550 1555 1560 Leu Ala Arg Ser Gly Leu Thr Pro Ala Leu Lys Leu Ile Asp Met 1565 1570 1575 Asp Thr Glu Ser Ala Val His Gly His Phe Arg Leu Ser Leu Thr 1580 1585 1590 Gly Asn Ala Ala Glu Ser Thr Asn Ser Asp Asn Arg Gln Pro Gln 1595 1600 1605 Gln Val Thr Leu Ile Glu Ala Ala Asn Pro Ser Ala Thr Ala Gln 1610 1615 1620 Asp Ile Ala Ala Ala Val Ala Gln Asn Leu Asp Lys Ala Ser Ile 1625 1630 1635 Pro Thr Lys Arg Ile Arg Trp Gly Ser Asp Val Ser Gln Leu Lys 1640 1645 1650 Gly Gln Pro Cys Ile Val Leu Thr Asp Leu Glu Ser Ala Leu Leu 1655 1660 1665 Lys Asp Pro Ala Pro Glu Asp Leu Ala Ala Leu Gln Ser Leu Phe 1670 1675 1680 Ala His Ala Glu Ser Thr Leu Trp Val Ser Gly Pro Leu Gly Pro 1685 1690 1695 Asp Ala Ala Leu Ile Thr Gly Leu Ser Arg Ser Val Cys Asn Glu 1700 1705 1710 Ala Ala Asp Val His Ile Arg Thr Leu Glu Val Thr Asp Leu Pro 1715 1720 1725 Gly Pro Gly Ala Asp Ser Tyr Ala Asp Leu Val Thr Arg Val Phe 1730 1735 1740 Arg Tyr Ser Gly Pro Asp Thr Glu Phe Arg Trp His Ser Asp Ala 1745 1750 1755 Leu Leu Val Ser Arg Leu Val Glu Asp Glu Ala Arg Asn Lys Glu 1760 1765 1770 Ile Ala Gln Leu Leu Gly Gln Gly Glu Lys Ala Ala Val Ala Thr 1775 1780 1785 Thr Leu Gln Glu Lys Pro Glu Gly Leu Lys Leu Cys Met Arg Gln 1790 1795 1800 Ile Gly Met Leu Asp Ser Val Cys Phe Glu Pro Asp Leu Leu Ala 1805 1810 1815 Leu Glu Pro Leu Glu Ala Gly Glu Val Glu Val Asp Val Lys Ala 1820 1825 1830 Ser Gly Val Asn Phe Arg Asp Val Met Val Ala Leu Gly Gln Ile 1835 1840 1845 Pro Asp Arg Ala Phe Gly Phe Glu Gly Ala Gly Val Val Arg Arg 1850 1855 1860 Val His Ala Ser Glu Thr Arg Leu Arg Pro Gly Asp Arg Val Val 1865 1870 1875 Phe Leu Ala His Gly Ala His Arg Thr Val His Arg Val Arg Ala 1880 1885 1890 Asp Tyr Ala Met Pro Met Pro Asp Thr Met Ser Phe Glu Glu Gly 1895 1900 1905 Ala Ala Ile Leu Leu Val His Thr Thr Ala Trp Tyr Ala Leu Val 1910 1915 1920 Lys Ser Ala Arg Ala Thr Ala Gly Gln Ser Val Leu Val His Ala 1925 1930 1935 Ala Ala Gly Gly Val Gly Gln Ala Val Leu Met Leu Ala Arg His 1940 1945 1950 Leu Gly Leu Gln Val Phe Ala Thr Val Gly Ser Glu Glu Lys Arg 1955 1960 1965 Lys Leu Val His Glu Thr Tyr Gly Val Pro His Asp His Ile Phe 1970 1975 1980 Asn Ser Arg Asp Ala Ser Phe Ala Met Gly Val Lys Arg Met Thr 1985 1990 1995 Lys Gly Arg Gly Val Asp Ile Val Val Asn Ser Leu Ala Gly Glu 2000 2005 2010 Ala Leu Arg Gln Thr Trp His Cys Leu Ala Pro Phe Gly Thr Phe 2015 2020 2025 Val Glu Leu Gly Met Lys Asp Ile Leu Asp Asn Ala Arg Leu Asp 2030 2035 2040 Met Lys Pro Phe Leu Gln Asp Ala Thr Phe Val Phe Phe Asn Leu 2045 2050 2055 Asn Arg Val Gln Lys Glu Arg Pro Asp Leu Met Gly Glu Ala Leu 2060 2065 2070 Arg Glu Thr Met Ala Leu Val Arg Ser Gly Ala Leu Lys Pro Ala 2075 2080 2085 Thr Pro Leu Thr Ser Tyr Pro Ala Ser Gln Val Glu Ala Ala Phe 2090 2095 2100 Arg Lys Ile Gln Thr Gly Gln His Leu Gly Lys Leu Val Leu Thr 2105 2110 2115 Phe Gln Glu Gly Asp Val Val Pro Val Val Arg Pro Asp Leu Ser 2120 2125 2130 Leu Ser Asp Ser Gly Thr Tyr Leu Leu Val Gly Gly Leu Gly Gly 2135 2140 2145 Leu Gly Arg Ser Leu Ala Arg Leu Leu Val Gln Leu Gly Ala Arg 2150 2155 2160 Arg Leu Cys Phe Leu Ser Arg Ser Gly Ala Ala Ser Ser Glu Ala 2165 2170 2175 Arg Ala Leu Val Lys Glu Leu Glu Met Gln His Arg Val Arg Val 2180 2185 2190 Leu Val Cys Lys Gly Asp Val Ser Asp Ala Asp Thr Val Ser Arg 2195 2200 2205 Val Val Gln Gln Cys Arg Ala Ala Leu Gly Pro Ile Arg Gly Val 2210 2215 2220 Ile Gln Cys Ala Met Val Leu Arg Asp Gly Leu Phe Glu Arg Met 2225 2230 2235 Ala His Asp Gln Trp Thr Glu Ser Thr Arg Pro Lys Val Gln Gly 2240 2245 2250 Thr Trp Asn Leu His Glu Gln Ile Pro Val Ser Asp Phe Phe Ile 2255 2260 2265 Thr Leu Ser Ser Phe Ala Gly Val Phe Gly Ser Arg Gly Gln Ser 2270 2275 2280 Asn Tyr Ala Ala Ala Gly Ala Tyr Glu Asp Ala Met Ala His His 2285 2290 2295 Arg Glu Ser Leu Gly Gln Arg Ala Ile Thr Ile Asp Leu Gly Ile 2300 2305 2310 Met Arg Asp Val Gly Val Leu Ala Glu Asn Gly Ile Thr Asp Tyr 2315 2320 2325 Leu Arg Glu Trp Glu Glu Pro Phe Gly Ile Arg Glu Pro Glu Phe 2330 2335 2340 His Ala Leu Ile Lys Ser Ala Ile Met Ser Thr Thr Gln Pro Leu 2345 2350 2355 Thr Glu Arg Ser Val Val Gln Ile Pro Thr Gly Leu Ala Thr Ala 2360 2365 2370 Arg Ser Ala Gln Ala Ala Gly Ile Ser Thr Pro Phe Tyr Phe Asp 2375 2380 2385 Asp Ala Arg Phe Ser Ile Leu Ala Gln Thr Arg Ala Ser Ala Gly 2390 2395 2400 Ala Ser Ser Ala Ala Gly Ser Gly Asp Ala Asp Ala Gly Lys Val 2405 2410 2415 Ser Val Arg Thr Gln Leu Ser Gln Ala His Ser Val Ala Glu Ala 2420 2425 2430 Ala Ala Ala Val Gln Thr Val Leu Leu Glu Arg Val Ala Arg Thr 2435 2440 2445 Leu Gln Ser Ser Val Ala Glu Ile Asp Pro Ser Arg Pro Leu His 2450 2455 2460 Ser Tyr Gly Val Asp Ser Leu Val Ala Val Glu Thr Val Lys Trp 2465 2470 2475 Met Phe Lys Thr Leu Asp Ala Lys Met Thr Val Phe Asp Val Leu 2480 2485 2490 Ser Asn Val Ser Ile Thr Ala Leu Cys Glu Lys Ile Ala Ser Met 2495 2500 2505 Ser Thr Leu Val Lys Leu Asn 2510 2515 <210> 3 <211> 5148 <212> DNA <213> Metarhizium anisopliae <220> <221> CDS <222> (1)..(5148) <400> 3 atg aaa ctg cgt gtc gca aac ttc ctc ctc ttt ggg gat cag acc gta 48 Met Lys Leu Arg Val Ala Asn Phe Leu Leu Phe Gly Asp Gln Thr Val 1 5 10 15 gag aag ctc cca gcc att cgg cac ctg gtg agc cat ggc gcg tcc tca 96 Glu Lys Leu Pro Ala Ile Arg His Leu Val Ser His Gly Ala Ser Ser 20 25 30 cct ctt gtc cag aga ttc ctg cgt caa gtg tgc gat gca gta cag ctc 144 Pro Leu Val Gln Arg Phe Leu Arg Gln Val Cys Asp Ala Val Gln Leu 35 40 45 cag gtc agc aag ctg cct ctg cac tcg gag caa cgc agc aac att ggg 192 Gln Val Ser Lys Leu Pro Leu His Ser Glu Gln Arg Ser Asn Ile Gly 50 55 60 aac ttc gac agt atc ctt cga cta gcc gag aac aat gcc cgg ctg gag 240 Asn Phe Asp Ser Ile Leu Arg Leu Ala Glu Asn Asn Ala Arg Leu Glu 65 70 75 80 gag ccc aac gag atc att gcc acc gtc ttg atg aat atc gca cgt cta 288 Glu Pro Asn Glu Ile Ile Ala Thr Val Leu Met Asn Ile Ala Arg Leu 85 90 95 gga gag ctc att cta tat gca gag caa gac cct acc gtt ctc gcc tcc 336 Gly Glu Leu Ile Leu Tyr Ala Glu Gln Asp Pro Thr Val Leu Ala Ser 100 105 110 aaa ggc aac cgc aac tgt att ctg gga ttc tgc acc ggc gag gtg gcc 384 Lys Gly Asn Arg Asn Cys Ile Leu Gly Phe Cys Thr Gly Glu Val Ala 115 120 125 gct gct gtg gcc gcc gtc gcg cag gac acc aac gaa ctc gtc gag ctg 432 Ala Ala Val Ala Ala Val Ala Gln Asp Thr Asn Glu Leu Val Glu Leu 130 135 140 gga gtc gag gtg aca cac atc atc ttt cgc atg gcc cgc gaa ctc aat 480 Gly Val Glu Val Thr His Ile Ile Phe Arg Met Ala Arg Glu Leu Asn 145 150 155 160 cgc cgg tct ctc atg gtt gac cgt acc aat ggc ccc tgg gcc cgg aca 528 Arg Arg Ser Leu Met Val Asp Arg Thr Asn Gly Pro Trp Ala Arg Thr 165 170 175 ata ctg ggc att tca gtc gat cgc gtc cgg gaa atc cta caa gac ttc 576 Ile Leu Gly Ile Ser Val Asp Arg Val Arg Glu Ile Leu Gln Asp Phe 180 185 190 cac gag aac cag tct att cct cgc gcg cga caa gtc tgc att ggc ttc 624 His Glu Asn Gln Ser Ile Pro Arg Ala Arg Gln Val Cys Ile Gly Phe 195 200 205 gtc tca gat ggc tgg tta aca ctc ttt ggc ccg ccc aca act ctg caa 672 Val Ser Asp Gly Trp Leu Thr Leu Phe Gly Pro Pro Thr Thr Leu Gln 210 215 220 cgg ctt tta gaa tgg tcg gca gag ctg gaa gac gct ccg caa atc gac 720 Arg Leu Leu Glu Trp Ser Ala Glu Leu Glu Asp Ala Pro Gln Ile Asp 225 230 235 240 acc gac gcc cgc gga ggc gtg cac atg gag acg ttg cca gaa gtt gac 768 Thr Asp Ala Arg Gly Gly Val His Met Glu Thr Leu Pro Glu Val Asp 245 250 255 ccg gat cgg att ctt ggc tca tcg cca tgg ctg gac cgg gcc ccc gtg 816 Pro Asp Arg Ile Leu Gly Ser Ser Pro Trp Leu Asp Arg Ala Pro Val 260 265 270 cac acg gcc acc ata atc tcg ccc tac acg tgc aaa ccg cgg cag cag 864 His Thr Ala Thr Ile Ile Ser Pro Tyr Thr Cys Lys Pro Arg Gln Gln 275 280 285 aag acg ttg cgg ggg ctt ctg gag gaa ata att gca gat gtc ggg cag 912 Lys Thr Leu Arg Gly Leu Leu Glu Glu Ile Ile Ala Asp Val Gly Gln 290 295 300 agg acg ttg aat ttg gcc acg tca atg aac gct gct gtt gag ctc gca 960 Arg Thr Leu Asn Leu Ala Thr Ser Met Asn Ala Ala Val Glu Leu Ala 305 310 315 320 cag gca gac aag ctc cgt ctt gtt atg ccc ggc tac act agt cac gac 1008 Gln Ala Asp Lys Leu Arg Leu Val Met Pro Gly Tyr Thr Ser His Asp 325 330 335 gtc tac ttt caa aga tta ctg caa aaa cgc ggc ata gag tat tcc gtc 1056 Val Tyr Phe Gln Arg Leu Leu Gln Lys Arg Gly Ile Glu Tyr Ser Val 340 345 350 atg tca cat ggg gac cat ttg tcg tca ggt ccc agc cga cag ggt tca 1104 Met Ser His Gly Asp His Leu Ser Ser Gly Pro Ser Arg Gln Gly Ser 355 360 365 gga ctt gtg gct gtc gtc ggc atg tct ggg agg ttc cca ggg agc ggc 1152 Gly Leu Val Ala Val Val Gly Met Ser Gly Arg Phe Pro Gly Ser Gly 370 375 380 gac atc aac gca ttt tgg gag ggt ctt tta gag ggc aaa aga tat atc 1200 Asp Ile Asn Ala Phe Trp Glu Gly Leu Leu Glu Gly Lys Arg Tyr Ile 385 390 395 400 caa gag att cca aat aca cga ttt gac ctg gag caa tgg tac gat gcc 1248 Gln Glu Ile Pro Asn Thr Arg Phe Asp Leu Glu Gln Trp Tyr Asp Ala 405 410 415 acg gga aaa caa aag aat tct acc atg gcg cgg aca gga gcc ttc ctc 1296 Thr Gly Lys Gln Lys Asn Ser Thr Met Ala Arg Thr Gly Ala Phe Leu 420 425 430 gac aag ccg ggc atg ttc gac aac cgc cta ttc gac atg tcg ccc agg 1344 Asp Lys Pro Gly Met Phe Asp Asn Arg Leu Phe Asp Met Ser Pro Arg 435 440 445 gag gcc atg cag aca gac gtc cag cac cgg ctg ctc atg aca acc agc 1392 Glu Ala Met Gln Thr Asp Val Gln His Arg Leu Leu Met Thr Thr Ser 450 455 460 tac gag gca ctg gag atg tcg ggc tac tat ccc gat ggc acg ctt tcg 1440 Tyr Glu Ala Leu Glu Met Ser Gly Tyr Tyr Pro Asp Gly Thr Leu Ser 465 470 475 480 aca aac aag gac cgc gtc gcc tcc ttc ttt ggc cag acg tct gat gat 1488 Thr Asn Lys Asp Arg Val Ala Ser Phe Phe Gly Gln Thr Ser Asp Asp 485 490 495 tgg cga gaa gtg gtg gtc cac caa ggg gta gac atc tac ttc gcc acg 1536 Trp Arg Glu Val Val Val His Gln Gly Val Asp Ile Tyr Phe Ala Thr 500 505 510 gga agc tgc cgc gct ttc gga cca ggc agg ctg cac cac cac ttc aaa 1584 Gly Ser Cys Arg Ala Phe Gly Pro Gly Arg Leu His His His Phe Lys 515 520 525 tgg gga ggt ccg tct tat agc gtc gac tcg gcc tgc tct tcc agc atc 1632 Trp Gly Gly Pro Ser Tyr Ser Val Asp Ser Ala Cys Ser Ser Ser Ile 530 535 540 gca gcc gtc ggt tta gcg tgc tcg gcg ctc ctc ggc cgc gaa tgc gac 1680 Ala Ala Val Gly Leu Ala Cys Ser Ala Leu Leu Gly Arg Glu Cys Asp 545 550 555 560 atg gct ctg gct ggt gga gga tcc ctc ctc ctc tcc cca tca ccc ttc 1728 Met Ala Leu Ala Gly Gly Gly Ser Leu Leu Leu Ser Pro Ser Pro Phe 565 570 575 tcg ggg tta agc cgt ggc ggt ttc ctg tcc gct cat gga ggg tgc cag 1776 Ser Gly Leu Ser Arg Gly Gly Phe Leu Ser Ala His Gly Gly Cys Gln 580 585 590 acg ttc cac gac aat gcc gac ggt tac gtc cgt gga gag gga gtt ggc 1824 Thr Phe His Asp Asn Ala Asp Gly Tyr Val Arg Gly Glu Gly Val Gly 595 600 605 gtg gtc gtt ctc aaa cgg ttg gag gac gcg ctg gac gac caa gac aac 1872 Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Asp Asp Gln Asp Asn 610 615 620 atc ctc ggc gtc gtc cgg gga tcc gga cgc aac tac agc agt gat gct 1920 Ile Leu Gly Val Val Arg Gly Ser Gly Arg Asn Tyr Ser Ser Asp Ala 625 630 635 640 tct tcc atg atg cat ccc tcg gca aat gct cag aaa aag ctg tac tgc 1968 Ser Ser Met Met His Pro Ser Ala Asn Ala Gln Lys Lys Leu Tyr Cys 645 650 655 gat gtg ctg gag caa agc ggt gta gac gcc aac agc atc tcg tac gtg 2016 Asp Val Leu Glu Gln Ser Gly Val Asp Ala Asn Ser Ile Ser Tyr Val 660 665 670 gag atg cat gga acc ggg aca cag gcg gga gac ttt atg gaa atg tcc 2064 Glu Met His Gly Thr Gly Thr Gln Ala Gly Asp Phe Met Glu Met Ser 675 680 685 tcg gtc ttg tca aca ttt gca gaa aag cga ggc tcg gat aat ccg ctc 2112 Ser Val Leu Ser Thr Phe Ala Glu Lys Arg Gly Ser Asp Asn Pro Leu 690 695 700 att gtt ggg gcc ctc aaa gca aat att ggc cac ggg gaa gct gcg gcc 2160 Ile Val Gly Ala Leu Lys Ala Asn Ile Gly His Gly Glu Ala Ala Ala 705 710 715 720 ggt gtt tgc gct ctt atc aaa acc ctc atg atg ctc cag tct cga cag 2208 Gly Val Cys Ala Leu Ile Lys Thr Leu Met Met Leu Gln Ser Arg Gln 725 730 735 att ccc ccc cag ccc gat ctt cct gga cct att aac cac cgc ttt cct 2256 Ile Pro Pro Gln Pro Asp Leu Pro Gly Pro Ile Asn His Arg Phe Pro 740 745 750 gat cta gca gcg cgt aat gta tac atc gcg gcc cgc aat atg aga ctg 2304 Asp Leu Ala Ala Arg Asn Val Tyr Ile Ala Ala Arg Asn Met Arg Leu 755 760 765 gag gcc agt cca gtg gct aag ggc acg cta cgc gtc ttt ctc aac agc 2352 Glu Ala Ser Pro Val Ala Lys Gly Thr Leu Arg Val Phe Leu Asn Ser 770 775 780 ttc gac gcc tcg gga gga aat tcg tgc ttg gtg ctt gaa gaa gct ccg 2400 Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Val Leu Glu Glu Ala Pro 785 790 795 800 cca cgg gcc gtc aag gat gca gac cct cga ggt cac cac gtc gtg acg 2448 Pro Arg Ala Val Lys Asp Ala Asp Pro Arg Gly His His Val Val Thr 805 810 815 ctt tca gcc cgt tcc cag aag tca ctt att ggc atc aaa gag agg tat 2496 Leu Ser Ala Arg Ser Gln Lys Ser Leu Ile Gly Ile Lys Glu Arg Tyr 820 825 830 ctc gct cat ctg cgc caa cat cct gac acc aaa ctg gcc gac ttg gcc 2544 Leu Ala His Leu Arg Gln His Pro Asp Thr Lys Leu Ala Asp Leu Ala 835 840 845 tat acc aca agc gct cga cgc att cac ggg tta ttg cgg tac gcc att 2592 Tyr Thr Thr Ser Ala Arg Arg Ile His Gly Leu Leu Arg Tyr Ala Ile 850 855 860 gcc gca tct tcc att gac gag gtc gtg caa tgc ctg gag acg gat ctc 2640 Ala Ala Ser Ser Ile Asp Glu Val Val Gln Cys Leu Glu Thr Asp Leu 865 870 875 880 gcc cag ggg aaa aca cca cgt cag cct ccg gca aca cca acg gta gtc 2688 Ala Gln Gly Lys Thr Pro Arg Gln Pro Pro Ala Thr Pro Thr Val Val 885 890 895 ttt aca ttt act ggc caa ggc gca cac tat atc ggc atg ggg gca aac 2736 Phe Thr Phe Thr Gly Gln Gly Ala His Tyr Ile Gly Met Gly Ala Asn 900 905 910 ttg tgg gag acg tct gcc aca ttc cgc aat acg ctt cac gac tac cag 2784 Leu Trp Glu Thr Ser Ala Thr Phe Arg Asn Thr Leu His Asp Tyr Gln 915 920 925 aca atg gcc agc gct caa ggc ctc ccc cat ttc ctg cat ctc atc acg 2832 Thr Met Ala Ser Ala Gln Gly Leu Pro His Phe Leu His Leu Ile Thr 930 935 940 gac agc agc aca ccc gcg cca cag tcg ggc ccg gat acc gtg cag gta 2880 Asp Ser Ser Thr Pro Ala Pro Gln Ser Gly Pro Asp Thr Val Gln Val 945 950 955 960 cag ctg gcc atg gta agc ttg gaa ctg gcc ctg gcc aag ctc tgg cgc 2928 Gln Leu Ala Met Val Ser Leu Glu Leu Ala Leu Ala Lys Leu Trp Arg 965 970 975 tcc tgg ggc atc cag cca gcc atg gtc ttg ggc cac agc ctg ggc gaa 2976 Ser Trp Gly Ile Gln Pro Ala Met Val Leu Gly His Ser Leu Gly Glu 980 985 990 tac gcg gcc ttg tgc gtg gcc gga gtc ttg tcc gtg agc gac act ctg 3024 Tyr Ala Ala Leu Cys Val Ala Gly Val Leu Ser Val Ser Asp Thr Leu 995 1000 1005 tac ctc gtc gcc aag cga gca caa atc atg gct gga gcc ctg acg 3069 Tyr Leu Val Ala Lys Arg Ala Gln Ile Met Ala Gly Ala Leu Thr 1010 1015 1020 ccg cac gaa tac gga atg ctg gct gtg aat cta agc gtt gct gac 3114 Pro His Glu Tyr Gly Met Leu Ala Val Asn Leu Ser Val Ala Asp 1025 1030 1035 acg cgg gaa gtg ctc tcg tct ggc cag cat act tcc tgc gcc gtg 3159 Thr Arg Glu Val Leu Ser Ser Gly Gln His Thr Ser Cys Ala Val 1040 1045 1050 gct tgc atc aac gcg ccc aag atg aca gtc gtg agc ggc ttg cgc 3204 Ala Cys Ile Asn Ala Pro Lys Met Thr Val Val Ser Gly Leu Arg 1055 1060 1065 tcg aag ctg gac gat ctc cag gac caa ctc aag tcg gac ggc acc 3249 Ser Lys Leu Asp Asp Leu Gln Asp Gln Leu Lys Ser Asp Gly Thr 1070 1075 1080 cgg tgc act ccc cta tct gtt ccc tat ggc ttc cac tcc agc cag 3294 Arg Cys Thr Pro Leu Ser Val Pro Tyr Gly Phe His Ser Ser Gln 1085 1090 1095 ctt gat ccc atc ttg ggc cag ttc gaa gag gcc tgc cag ggc gtg 3339 Leu Asp Pro Ile Leu Gly Gln Phe Glu Glu Ala Cys Gln Gly Val 1100 1105 1110 acc ttt tcc gcg ccg agt gtc ccg gtc gtt tcc acg ctc ttg gct 3384 Thr Phe Ser Ala Pro Ser Val Pro Val Val Ser Thr Leu Leu Ala 1115 1120 1125 acg aca gtc cgg gaa gaa gga aca ttc tct ccg gag tac ctg gca 3429 Thr Thr Val Arg Glu Glu Gly Thr Phe Ser Pro Glu Tyr Leu Ala 1130 1135 1140 cga cag gcg cgc gaa ccc gtc gac ttt gtc ggg gca ttg ggc gcg 3474 Arg Gln Ala Arg Glu Pro Val Asp Phe Val Gly Ala Leu Gly Ala 1145 1150 1155 gtg cag gag cac aag ttt ccc ggc ctg acc ttc ctc gag att ggg 3519 Val Gln Glu His Lys Phe Pro Gly Leu Thr Phe Leu Glu Ile Gly 1160 1165 1170 ccc gat ccc gtg tgc tcg ggt ctt gtg aat gct acg cta ggt gcc 3564 Pro Asp Pro Val Cys Ser Gly Leu Val Asn Ala Thr Leu Gly Ala 1175 1180 1185 gat gag gct gca ttg cgc tgc gtt gcc tcg atg cac cgc gga aag 3609 Asp Glu Ala Ala Leu Arg Cys Val Ala Ser Met His Arg Gly Lys 1190 1195 1200 gcc aac tgg gcg tcg ata tcg tgc agc ttg agg gat ctc tat acg 3654 Ala Asn Trp Ala Ser Ile Ser Cys Ser Leu Arg Asp Leu Tyr Thr 1205 1210 1215 gcg ggt gcc gcc att gac tgg cca gcc cat cac cgg gat ttc aaa 3699 Ala Gly Ala Ala Ile Asp Trp Pro Ala His His Arg Asp Phe Lys 1220 1225 1230 tca tcg gta tcc ctg ctg gac ctc cca aag tac tcg ttt gac gag 3744 Ser Ser Val Ser Leu Leu Asp Leu Pro Lys Tyr Ser Phe Asp Glu 1235 1240 1245 aag gaa ttc tgg gcg tcg ttc ccc gat cga gac ctt cag acc att 3789 Lys Glu Phe Trp Ala Ser Phe Pro Asp Arg Asp Leu Gln Thr Ile 1250 1255 1260 gga gac gtc gag acc aag cac agc caa ccg cct gcc att gtt cct 3834 Gly Asp Val Glu Thr Lys His Ser Gln Pro Pro Ala Ile Val Pro 1265 1270 1275 tcg gta caa ggg tat tgc aca acg act ctg cag cgg atc acg agg 3879 Ser Val Gln Gly Tyr Cys Thr Thr Thr Leu Gln Arg Ile Thr Arg 1280 1285 1290 gaa aca atc gag ccc gat ggg ttg tcg gtt aca ttc tca tca gac 3924 Glu Thr Ile Glu Pro Asp Gly Leu Ser Val Thr Phe Ser Ser Asp 1295 1300 1305 cta gcc gac cag cac cta cgg gca gcc gtg cga ggc cac gcc gtg 3969 Leu Ala Asp Gln His Leu Arg Ala Ala Val Arg Gly His Ala Val 1310 1315 1320 gcc gat gtg gaa att tgt tcc agc agt ctg ctc ttg gac atg gcg 4014 Ala Asp Val Glu Ile Cys Ser Ser Ser Leu Leu Leu Asp Met Ala 1325 1330 1335 ctc tcc gcg gcc caa tat gcc tac atg aag cat tct cct ggt cag 4059 Leu Ser Ala Ala Gln Tyr Ala Tyr Met Lys His Ser Pro Gly Gln 1340 1345 1350 aag atg cca gtg cca tta acc gtc cgc aac tgc tat ttc cac cgg 4104 Lys Met Pro Val Pro Leu Thr Val Arg Asn Cys Tyr Phe His Arg 1355 1360 1365 ggt gtt gtc ttg acg gac aag gcc cag acg gtg gaa gtc acc gtc 4149 Gly Val Val Leu Thr Asp Lys Ala Gln Thr Val Glu Val Thr Val 1370 1375 1380 act ctt aca tcc tcg gcc aag act gcg gat atc cgg tac cac tgc 4194 Thr Leu Thr Ser Ser Ala Lys Thr Ala Asp Ile Arg Tyr His Cys 1385 1390 1395 cgc act cct gac gag tat tac gag gtt ggc gcc tgc cag gtc gtc 4239 Arg Thr Pro Asp Glu Tyr Tyr Glu Val Gly Ala Cys Gln Val Val 1400 1405 1410 ttg aag cca gca agc aaa ccg gac caa gcc ggc ttc ctg gtt cgg 4284 Leu Lys Pro Ala Ser Lys Pro Asp Gln Ala Gly Phe Leu Val Arg 1415 1420 1425 tcc cgc atg gct gct ctc aag gcg tcc gca agt cac cgg cta ggc 4329 Ser Arg Met Ala Ala Leu Lys Ala Ser Ala Ser His Arg Leu Gly 1430 1435 1440 aga cgc gca gtc tat cga tta ttc gac aac gtt gtg cgt tat tcc 4374 Arg Arg Ala Val Tyr Arg Leu Phe Asp Asn Val Val Arg Tyr Ser 1445 1450 1455 gaa caa tac cag ggg cta gaa aat gtc cac ttg tca gag gac atg 4419 Glu Gln Tyr Gln Gly Leu Glu Asn Val His Leu Ser Glu Asp Met 1460 1465 1470 cag gat gcc gtg gcg gaa atc aac atg gcc cac gtc cca gcc gca 4464 Gln Asp Ala Val Ala Glu Ile Asn Met Ala His Val Pro Ala Ala 1475 1480 1485 ggc ggc cat tac ctc cac cac cca ttc ttg ctc gac tcg att gtt 4509 Gly Gly His Tyr Leu His His Pro Phe Leu Leu Asp Ser Ile Val 1490 1495 1500 cac ttg tcg ggg ttc ttg gtg aac aat ggg ctt cgc tat tcc agc 4554 His Leu Ser Gly Phe Leu Val Asn Asn Gly Leu Arg Tyr Ser Ser 1505 1510 1515 gag tgg gct tgc ctt tcc acc ggc ttt gac gag tgg cac ctg ctc 4599 Glu Trp Ala Cys Leu Ser Thr Gly Phe Asp Glu Trp His Leu Leu 1520 1525 1530 aag ccg ctt gat ccc acc act gtg tac acc agc tac acc ttc atg 4644 Lys Pro Leu Asp Pro Thr Thr Val Tyr Thr Ser Tyr Thr Phe Met 1535 1540 1545 gag gac tct cgg tcg acg agc aat ctg gta acg ggc gat gta tac 4689 Glu Asp Ser Arg Ser Thr Ser Asn Leu Val Thr Gly Asp Val Tyr 1550 1555 1560 gtc tat gac gga gag gag ctg gtc tcg gtg ctg acg ggg ctg cag 4734 Val Tyr Asp Gly Glu Glu Leu Val Ser Val Leu Thr Gly Leu Gln 1565 1570 1575 ttc caa aag atg aag agg acg gca ctc act cat cta ctg agc ccc 4779 Phe Gln Lys Met Lys Arg Thr Ala Leu Thr His Leu Leu Ser Pro 1580 1585 1590 ccg aca gtc ggt acc atg gcc gcc aag ccg agt aca tgt atg cca 4824 Pro Thr Val Gly Thr Met Ala Ala Lys Pro Ser Thr Cys Met Pro 1595 1600 1605 act atg gga caa acg gag ccg ttg ccg gct caa gcc aga gtg gcc 4869 Thr Met Gly Gln Thr Glu Pro Leu Pro Ala Gln Ala Arg Val Ala 1610 1615 1620 ggc ttg ccg gtt ccc aca cca ccg gct aca gca agt gtt gat gat 4914 Gly Leu Pro Val Pro Thr Pro Pro Ala Thr Ala Ser Val Asp Asp 1625 1630 1635 ggc gag ggg gag aag ttc gac ttg gtc aat aca ctc ttt tcc att 4959 Gly Glu Gly Glu Lys Phe Asp Leu Val Asn Thr Leu Phe Ser Ile 1640 1645 1650 atc gca cgc gag gtg ggc gtg gag cca agc gat ttg gag ggc gac 5004 Ile Ala Arg Glu Val Gly Val Glu Pro Ser Asp Leu Glu Gly Asp 1655 1660 1665 gtc aac ctg gcg aat ttg ggc ata gac tcc ctg atg gcc att acc 5049 Val Asn Leu Ala Asn Leu Gly Ile Asp Ser Leu Met Ala Ile Thr 1670 1675 1680 ata att tca gtc atg cag cag gaa aca ggt gtc gag ttg ccg ggg 5094 Ile Ile Ser Val Met Gln Gln Glu Thr Gly Val Glu Leu Pro Gly 1685 1690 1695 acc ttt ttc ctc gac aat gcc act aca acg gca gtg att gcg gcg 5139 Thr Phe Phe Leu Asp Asn Ala Thr Thr Thr Ala Val Ile Ala Ala 1700 1705 1710 gta ggg tag 5148 Val Gly 1715 <210> 4 <211> 1715 <212> PRT <213> Metarhizium anisopliae <400> 4 Met Lys Leu Arg Val Ala Asn Phe Leu Leu Phe Gly Asp Gln Thr Val 1 5 10 15 Glu Lys Leu Pro Ala Ile Arg His Leu Val Ser His Gly Ala Ser Ser 20 25 30 Pro Leu Val Gln Arg Phe Leu Arg Gln Val Cys Asp Ala Val Gln Leu 35 40 45 Gln Val Ser Lys Leu Pro Leu His Ser Glu Gln Arg Ser Asn Ile Gly 50 55 60 Asn Phe Asp Ser Ile Leu Arg Leu Ala Glu Asn Asn Ala Arg Leu Glu 65 70 75 80 Glu Pro Asn Glu Ile Ile Ala Thr Val Leu Met Asn Ile Ala Arg Leu 85 90 95 Gly Glu Leu Ile Leu Tyr Ala Glu Gln Asp Pro Thr Val Leu Ala Ser 100 105 110 Lys Gly Asn Arg Asn Cys Ile Leu Gly Phe Cys Thr Gly Glu Val Ala 115 120 125 Ala Ala Val Ala Ala Val Ala Gln Asp Thr Asn Glu Leu Val Glu Leu 130 135 140 Gly Val Glu Val Thr His Ile Ile Phe Arg Met Ala Arg Glu Leu Asn 145 150 155 160 Arg Arg Ser Leu Met Val Asp Arg Thr Asn Gly Pro Trp Ala Arg Thr 165 170 175 Ile Leu Gly Ile Ser Val Asp Arg Val Arg Glu Ile Leu Gln Asp Phe 180 185 190 His Glu Asn Gln Ser Ile Pro Arg Ala Arg Gln Val Cys Ile Gly Phe 195 200 205 Val Ser Asp Gly Trp Leu Thr Leu Phe Gly Pro Pro Thr Thr Leu Gln 210 215 220 Arg Leu Leu Glu Trp Ser Ala Glu Leu Glu Asp Ala Pro Gln Ile Asp 225 230 235 240 Thr Asp Ala Arg Gly Gly Val His Met Glu Thr Leu Pro Glu Val Asp 245 250 255 Pro Asp Arg Ile Leu Gly Ser Ser Pro Trp Leu Asp Arg Ala Pro Val 260 265 270 His Thr Ala Thr Ile Ile Ser Pro Tyr Thr Cys Lys Pro Arg Gln Gln 275 280 285 Lys Thr Leu Arg Gly Leu Leu Glu Glu Ile Ile Ala Asp Val Gly Gln 290 295 300 Arg Thr Leu Asn Leu Ala Thr Ser Met Asn Ala Ala Val Glu Leu Ala 305 310 315 320 Gln Ala Asp Lys Leu Arg Leu Val Met Pro Gly Tyr Thr Ser His Asp 325 330 335 Val Tyr Phe Gln Arg Leu Leu Gln Lys Arg Gly Ile Glu Tyr Ser Val 340 345 350 Met Ser His Gly Asp His Leu Ser Ser Gly Pro Ser Arg Gln Gly Ser 355 360 365 Gly Leu Val Ala Val Val Gly Met Ser Gly Arg Phe Pro Gly Ser Gly 370 375 380 Asp Ile Asn Ala Phe Trp Glu Gly Leu Leu Glu Gly Lys Arg Tyr Ile 385 390 395 400 Gln Glu Ile Pro Asn Thr Arg Phe Asp Leu Glu Gln Trp Tyr Asp Ala 405 410 415 Thr Gly Lys Gln Lys Asn Ser Thr Met Ala Arg Thr Gly Ala Phe Leu 420 425 430 Asp Lys Pro Gly Met Phe Asp Asn Arg Leu Phe Asp Met Ser Pro Arg 435 440 445 Glu Ala Met Gln Thr Asp Val Gln His Arg Leu Leu Met Thr Thr Ser 450 455 460 Tyr Glu Ala Leu Glu Met Ser Gly Tyr Tyr Pro Asp Gly Thr Leu Ser 465 470 475 480 Thr Asn Lys Asp Arg Val Ala Ser Phe Phe Gly Gln Thr Ser Asp Asp 485 490 495 Trp Arg Glu Val Val Val His Gln Gly Val Asp Ile Tyr Phe Ala Thr 500 505 510 Gly Ser Cys Arg Ala Phe Gly Pro Gly Arg Leu His His His Phe Lys 515 520 525 Trp Gly Gly Pro Ser Tyr Ser Val Asp Ser Ala Cys Ser Ser Ser Ile 530 535 540 Ala Ala Val Gly Leu Ala Cys Ser Ala Leu Leu Gly Arg Glu Cys Asp 545 550 555 560 Met Ala Leu Ala Gly Gly Gly Ser Leu Leu Leu Ser Pro Ser Pro Phe 565 570 575 Ser Gly Leu Ser Arg Gly Gly Phe Leu Ser Ala His Gly Gly Cys Gln 580 585 590 Thr Phe His Asp Asn Ala Asp Gly Tyr Val Arg Gly Glu Gly Val Gly 595 600 605 Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Asp Asp Gln Asp Asn 610 615 620 Ile Leu Gly Val Val Arg Gly Ser Gly Arg Asn Tyr Ser Ser Asp Ala 625 630 635 640 Ser Ser Met Met His Pro Ser Ala Asn Ala Gln Lys Lys Leu Tyr Cys 645 650 655 Asp Val Leu Glu Gln Ser Gly Val Asp Ala Asn Ser Ile Ser Tyr Val 660 665 670 Glu Met His Gly Thr Gly Thr Gln Ala Gly Asp Phe Met Glu Met Ser 675 680 685 Ser Val Leu Ser Thr Phe Ala Glu Lys Arg Gly Ser Asp Asn Pro Leu 690 695 700 Ile Val Gly Ala Leu Lys Ala Asn Ile Gly His Gly Glu Ala Ala Ala 705 710 715 720 Gly Val Cys Ala Leu Ile Lys Thr Leu Met Met Leu Gln Ser Arg Gln 725 730 735 Ile Pro Pro Gln Pro Asp Leu Pro Gly Pro Ile Asn His Arg Phe Pro 740 745 750 Asp Leu Ala Ala Arg Asn Val Tyr Ile Ala Ala Arg Asn Met Arg Leu 755 760 765 Glu Ala Ser Pro Val Ala Lys Gly Thr Leu Arg Val Phe Leu Asn Ser 770 775 780 Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Val Leu Glu Glu Ala Pro 785 790 795 800 Pro Arg Ala Val Lys Asp Ala Asp Pro Arg Gly His His Val Val Thr 805 810 815 Leu Ser Ala Arg Ser Gln Lys Ser Leu Ile Gly Ile Lys Glu Arg Tyr 820 825 830 Leu Ala His Leu Arg Gln His Pro Asp Thr Lys Leu Ala Asp Leu Ala 835 840 845 Tyr Thr Thr Ser Ala Arg Arg Ile His Gly Leu Leu Arg Tyr Ala Ile 850 855 860 Ala Ala Ser Ser Ile Asp Glu Val Val Gln Cys Leu Glu Thr Asp Leu 865 870 875 880 Ala Gln Gly Lys Thr Pro Arg Gln Pro Pro Ala Thr Pro Thr Val Val 885 890 895 Phe Thr Phe Thr Gly Gln Gly Ala His Tyr Ile Gly Met Gly Ala Asn 900 905 910 Leu Trp Glu Thr Ser Ala Thr Phe Arg Asn Thr Leu His Asp Tyr Gln 915 920 925 Thr Met Ala Ser Ala Gln Gly Leu Pro His Phe Leu His Leu Ile Thr 930 935 940 Asp Ser Ser Thr Pro Ala Pro Gln Ser Gly Pro Asp Thr Val Gln Val 945 950 955 960 Gln Leu Ala Met Val Ser Leu Glu Leu Ala Leu Ala Lys Leu Trp Arg 965 970 975 Ser Trp Gly Ile Gln Pro Ala Met Val Leu Gly His Ser Leu Gly Glu 980 985 990 Tyr Ala Ala Leu Cys Val Ala Gly Val Leu Ser Val Ser Asp Thr Leu 995 1000 1005 Tyr Leu Val Ala Lys Arg Ala Gln Ile Met Ala Gly Ala Leu Thr 1010 1015 1020 Pro His Glu Tyr Gly Met Leu Ala Val Asn Leu Ser Val Ala Asp 1025 1030 1035 Thr Arg Glu Val Leu Ser Ser Gly Gln His Thr Ser Cys Ala Val 1040 1045 1050 Ala Cys Ile Asn Ala Pro Lys Met Thr Val Val Ser Gly Leu Arg 1055 1060 1065 Ser Lys Leu Asp Asp Leu Gln Asp Gln Leu Lys Ser Asp Gly Thr 1070 1075 1080 Arg Cys Thr Pro Leu Ser Val Pro Tyr Gly Phe His Ser Ser Gln 1085 1090 1095 Leu Asp Pro Ile Leu Gly Gln Phe Glu Glu Ala Cys Gln Gly Val 1100 1105 1110 Thr Phe Ser Ala Pro Ser Val Pro Val Val Ser Thr Leu Leu Ala 1115 1120 1125 Thr Thr Val Arg Glu Glu Gly Thr Phe Ser Pro Glu Tyr Leu Ala 1130 1135 1140 Arg Gln Ala Arg Glu Pro Val Asp Phe Val Gly Ala Leu Gly Ala 1145 1150 1155 Val Gln Glu His Lys Phe Pro Gly Leu Thr Phe Leu Glu Ile Gly 1160 1165 1170 Pro Asp Pro Val Cys Ser Gly Leu Val Asn Ala Thr Leu Gly Ala 1175 1180 1185 Asp Glu Ala Ala Leu Arg Cys Val Ala Ser Met His Arg Gly Lys 1190 1195 1200 Ala Asn Trp Ala Ser Ile Ser Cys Ser Leu Arg Asp Leu Tyr Thr 1205 1210 1215 Ala Gly Ala Ala Ile Asp Trp Pro Ala His His Arg Asp Phe Lys 1220 1225 1230 Ser Ser Val Ser Leu Leu Asp Leu Pro Lys Tyr Ser Phe Asp Glu 1235 1240 1245 Lys Glu Phe Trp Ala Ser Phe Pro Asp Arg Asp Leu Gln Thr Ile 1250 1255 1260 Gly Asp Val Glu Thr Lys His Ser Gln Pro Pro Ala Ile Val Pro 1265 1270 1275 Ser Val Gln Gly Tyr Cys Thr Thr Thr Leu Gln Arg Ile Thr Arg 1280 1285 1290 Glu Thr Ile Glu Pro Asp Gly Leu Ser Val Thr Phe Ser Ser Asp 1295 1300 1305 Leu Ala Asp Gln His Leu Arg Ala Ala Val Arg Gly His Ala Val 1310 1315 1320 Ala Asp Val Glu Ile Cys Ser Ser Ser Leu Leu Leu Asp Met Ala 1325 1330 1335 Leu Ser Ala Ala Gln Tyr Ala Tyr Met Lys His Ser Pro Gly Gln 1340 1345 1350 Lys Met Pro Val Pro Leu Thr Val Arg Asn Cys Tyr Phe His Arg 1355 1360 1365 Gly Val Val Leu Thr Asp Lys Ala Gln Thr Val Glu Val Thr Val 1370 1375 1380 Thr Leu Thr Ser Ser Ala Lys Thr Ala Asp Ile Arg Tyr His Cys 1385 1390 1395 Arg Thr Pro Asp Glu Tyr Tyr Glu Val Gly Ala Cys Gln Val Val 1400 1405 1410 Leu Lys Pro Ala Ser Lys Pro Asp Gln Ala Gly Phe Leu Val Arg 1415 1420 1425 Ser Arg Met Ala Ala Leu Lys Ala Ser Ala Ser His Arg Leu Gly 1430 1435 1440 Arg Arg Ala Val Tyr Arg Leu Phe Asp Asn Val Val Arg Tyr Ser 1445 1450 1455 Glu Gln Tyr Gln Gly Leu Glu Asn Val His Leu Ser Glu Asp Met 1460 1465 1470 Gln Asp Ala Val Ala Glu Ile Asn Met Ala His Val Pro Ala Ala 1475 1480 1485 Gly Gly His Tyr Leu His His Pro Phe Leu Leu Asp Ser Ile Val 1490 1495 1500 His Leu Ser Gly Phe Leu Val Asn Asn Gly Leu Arg Tyr Ser Ser 1505 1510 1515 Glu Trp Ala Cys Leu Ser Thr Gly Phe Asp Glu Trp His Leu Leu 1520 1525 1530 Lys Pro Leu Asp Pro Thr Thr Val Tyr Thr Ser Tyr Thr Phe Met 1535 1540 1545 Glu Asp Ser Arg Ser Thr Ser Asn Leu Val Thr Gly Asp Val Tyr 1550 1555 1560 Val Tyr Asp Gly Glu Glu Leu Val Ser Val Leu Thr Gly Leu Gln 1565 1570 1575 Phe Gln Lys Met Lys Arg Thr Ala Leu Thr His Leu Leu Ser Pro 1580 1585 1590 Pro Thr Val Gly Thr Met Ala Ala Lys Pro Ser Thr Cys Met Pro 1595 1600 1605 Thr Met Gly Gln Thr Glu Pro Leu Pro Ala Gln Ala Arg Val Ala 1610 1615 1620 Gly Leu Pro Val Pro Thr Pro Pro Ala Thr Ala Ser Val Asp Asp 1625 1630 1635 Gly Glu Gly Glu Lys Phe Asp Leu Val Asn Thr Leu Phe Ser Ile 1640 1645 1650 Ile Ala Arg Glu Val Gly Val Glu Pro Ser Asp Leu Glu Gly Asp 1655 1660 1665 Val Asn Leu Ala Asn Leu Gly Ile Asp Ser Leu Met Ala Ile Thr 1670 1675 1680 Ile Ile Ser Val Met Gln Gln Glu Thr Gly Val Glu Leu Pro Gly 1685 1690 1695 Thr Phe Phe Leu Asp Asn Ala Thr Thr Thr Ala Val Ile Ala Ala 1700 1705 1710 Val Gly 1715 <210> 5 <211> 1128 <212> DNA <213> Metarhizium anisopliae <220> <221> CDS <222> (1)..(1128) <400> 5 atg gcc gtc acc gtg tgg caa gat gcg ctc aac atc att gcg cag gag 48 Met Ala Val Thr Val Trp Gln Asp Ala Leu Asn Ile Ile Ala Gln Glu 1 5 10 15 agc ggg ctg gag ccc gca gaa atc atc gag acg gac gac acg gcg ttt 96 Ser Gly Leu Glu Pro Ala Glu Ile Ile Glu Thr Asp Asp Thr Ala Phe 20 25 30 ctc acg ctc ggc atc aat cag atc ctc gcc aca gcc atc ttg gcg cac 144 Leu Thr Leu Gly Ile Asn Gln Ile Leu Ala Thr Ala Ile Leu Ala His 35 40 45 ctc aga ggg cct cgt gga gag cct ctc cca cga gac atc ttt gac cag 192 Leu Arg Gly Pro Arg Gly Glu Pro Leu Pro Arg Asp Ile Phe Asp Gln 50 55 60 aag ccc acg gtt ggt gcg ttc cgc cgc ttc tat gag acc cct att cac 240 Lys Pro Thr Val Gly Ala Phe Arg Arg Phe Tyr Glu Thr Pro Ile His 65 70 75 80 ctg gac att gct ccc gtc gcg gca ccg gcg ccg ccc aag ctg aag cgc 288 Leu Asp Ile Ala Pro Val Ala Ala Pro Ala Pro Pro Lys Leu Lys Arg 85 90 95 gtg ccg tcg tct tct gtc ccg ctg tcc atc gtc ttg caa aac aac ccg 336 Val Pro Ser Ser Ser Val Pro Leu Ser Ile Val Leu Gln Asn Asn Pro 100 105 110 gcg tcg agc cgg cac acg gtg ttc ctc ctc ccg gac ggc agc ggc tcg 384 Ala Ser Ser Arg His Thr Val Phe Leu Leu Pro Asp Gly Ser Gly Ser 115 120 125 gcc atg gcc tac gcc aac ctc ccg ccc gtc cac ccg gcc gtc tgc atc 432 Ala Met Ala Tyr Ala Asn Leu Pro Pro Val His Pro Ala Val Cys Ile 130 135 140 gtc ggc atg aac agc ccg tac ctg cgc gac gcc ggc tcg tac cgc tgc 480 Val Gly Met Asn Ser Pro Tyr Leu Arg Asp Ala Gly Ser Tyr Arg Cys 145 150 155 160 tcc gtg gaa gac ctg gca tcg caa tgg gtc cgt gaa gtc tac cgc cgc 528 Ser Val Glu Asp Leu Ala Ser Gln Trp Val Arg Glu Val Tyr Arg Arg 165 170 175 caa cca cgg ggg ccg tac att gtc ggc ggg tgg tca gcg gga ggc tac 576 Gln Pro Arg Gly Pro Tyr Ile Val Gly Gly Trp Ser Ala Gly Gly Tyr 180 185 190 tac tcg tac gaa gtg gcc aag cgc ctc ctg cag gac gga cac gcc gtc 624 Tyr Ser Tyr Glu Val Ala Lys Arg Leu Leu Gln Asp Gly His Ala Val 195 200 205 gcc aag ctg atc ctg atc gac tcg ccg tgc cgc acc gtc ttt gag tcc 672 Ala Lys Leu Ile Leu Ile Asp Ser Pro Cys Arg Thr Val Phe Glu Ser 210 215 220 ctg tcc atg gac gtc gtc aac tac ctc tcc tct cga aac ctc atg ggc 720 Leu Ser Met Asp Val Val Asn Tyr Leu Ser Ser Arg Asn Leu Met Gly 225 230 235 240 aac tgg ggc tct ccg gaa atg ccc gag tgg ctg gtg cag cat ttc cgc 768 Asn Trp Gly Ser Pro Glu Met Pro Glu Trp Leu Val Gln His Phe Arg 245 250 255 tcg acg ctc gcc gcc gtg ggc aag tac cgc ccg cgg ccc atc gac tcg 816 Ser Thr Leu Ala Ala Val Gly Lys Tyr Arg Pro Arg Pro Ile Asp Ser 260 265 270 gct ggc aag atg cag acg tac atc atc tgg agc cga gac ggc gtg ctg 864 Ala Gly Lys Met Gln Thr Tyr Ile Ile Trp Ser Arg Asp Gly Val Leu 275 280 285 gac caa gac gcg ctg gcc agg tct gga ctc gac acg agc gtc aag gtg 912 Asp Gln Asp Ala Leu Ala Arg Ser Gly Leu Asp Thr Ser Val Lys Val 290 295 300 tcg cga ttt ctg ctg cag ggc aag gat gac ctg ggg ccg aat gga tgg 960 Ser Arg Phe Leu Leu Gln Gly Lys Asp Asp Leu Gly Pro Asn Gly Trp 305 310 315 320 gac gac ctg ctg ccc agc aag gac atg gct att gcg acg caa tcg ggg 1008 Asp Asp Leu Leu Pro Ser Lys Asp Met Ala Ile Ala Thr Gln Ser Gly 325 330 335 acg cac ttc acc atg att aac aag cct cat gtg gcc cag atg agc gat 1056 Thr His Phe Thr Met Ile Asn Lys Pro His Val Ala Gln Met Ser Asp 340 345 350 ctc ttg cgt gat gcc gtg att ggc atc ggc tct gac cga cag gcg cac 1104 Leu Leu Arg Asp Ala Val Ile Gly Ile Gly Ser Asp Arg Gln Ala His 355 360 365 tgg cag cga gtg agc cag tca tga 1128 Trp Gln Arg Val Ser Gln Ser 370 375 <210> 6 <211> 375 <212> PRT <213> Metarhizium anisopliae <400> 6 Met Ala Val Thr Val Trp Gln Asp Ala Leu Asn Ile Ile Ala Gln Glu 1 5 10 15 Ser Gly Leu Glu Pro Ala Glu Ile Ile Glu Thr Asp Asp Thr Ala Phe 20 25 30 Leu Thr Leu Gly Ile Asn Gln Ile Leu Ala Thr Ala Ile Leu Ala His 35 40 45 Leu Arg Gly Pro Arg Gly Glu Pro Leu Pro Arg Asp Ile Phe Asp Gln 50 55 60 Lys Pro Thr Val Gly Ala Phe Arg Arg Phe Tyr Glu Thr Pro Ile His 65 70 75 80 Leu Asp Ile Ala Pro Val Ala Ala Pro Ala Pro Pro Lys Leu Lys Arg 85 90 95 Val Pro Ser Ser Ser Val Pro Leu Ser Ile Val Leu Gln Asn Asn Pro 100 105 110 Ala Ser Ser Arg His Thr Val Phe Leu Leu Pro Asp Gly Ser Gly Ser 115 120 125 Ala Met Ala Tyr Ala Asn Leu Pro Pro Val His Pro Ala Val Cys Ile 130 135 140 Val Gly Met Asn Ser Pro Tyr Leu Arg Asp Ala Gly Ser Tyr Arg Cys 145 150 155 160 Ser Val Glu Asp Leu Ala Ser Gln Trp Val Arg Glu Val Tyr Arg Arg 165 170 175 Gln Pro Arg Gly Pro Tyr Ile Val Gly Gly Trp Ser Ala Gly Gly Tyr 180 185 190 Tyr Ser Tyr Glu Val Ala Lys Arg Leu Leu Gln Asp Gly His Ala Val 195 200 205 Ala Lys Leu Ile Leu Ile Asp Ser Pro Cys Arg Thr Val Phe Glu Ser 210 215 220 Leu Ser Met Asp Val Val Asn Tyr Leu Ser Ser Arg Asn Leu Met Gly 225 230 235 240 Asn Trp Gly Ser Pro Glu Met Pro Glu Trp Leu Val Gln His Phe Arg 245 250 255 Ser Thr Leu Ala Ala Val Gly Lys Tyr Arg Pro Arg Pro Ile Asp Ser 260 265 270 Ala Gly Lys Met Gln Thr Tyr Ile Ile Trp Ser Arg Asp Gly Val Leu 275 280 285 Asp Gln Asp Ala Leu Ala Arg Ser Gly Leu Asp Thr Ser Val Lys Val 290 295 300 Ser Arg Phe Leu Leu Gln Gly Lys Asp Asp Leu Gly Pro Asn Gly Trp 305 310 315 320 Asp Asp Leu Leu Pro Ser Lys Asp Met Ala Ile Ala Thr Gln Ser Gly 325 330 335 Thr His Phe Thr Met Ile Asn Lys Pro His Val Ala Gln Met Ser Asp 340 345 350 Leu Leu Arg Asp Ala Val Ile Gly Ile Gly Ser Asp Arg Gln Ala His 355 360 365 Trp Gln Arg Val Ser Gln Ser 370 375 <210> 7 <211> 7533 <212> DNA <213> Metarhizium rileyi <220> <221> CDS <222> (1)..(7533) <400> 7 atg gag gct tcg tca caa tca aga gac gac atc gcc gtc att ggg tta 48 Met Glu Ala Ser Ser Gln Ser Arg Asp Asp Ile Ala Val Ile Gly Leu 1 5 10 15 tcg tgc cgc ttc ccg ggt gaa gca gac aca gcc gag cac ttt tgg gac 96 Ser Cys Arg Phe Pro Gly Glu Ala Asp Thr Ala Glu His Phe Trp Asp 20 25 30 ttc att tgc aac gga cgc aat gca tac tct gaa aac ccg gat cgg tgg 144 Phe Ile Cys Asn Gly Arg Asn Ala Tyr Ser Glu Asn Pro Asp Arg Trp 35 40 45 aat ccg gat gct ttc cac tac ggc gag aag aag ctc aac acc agc ttg 192 Asn Pro Asp Ala Phe His Tyr Gly Glu Lys Lys Leu Asn Thr Ser Leu 50 55 60 ccc cgg gga gga cat ttc atg aag caa gat gtg gcc gcc ttt gat gcc 240 Pro Arg Gly Gly His Phe Met Lys Gln Asp Val Ala Ala Phe Asp Ala 65 70 75 80 aac ttc ttc aac ctc tcc aag gtc gag gcg gag tcc atg gac ccc cag 288 Asn Phe Phe Asn Leu Ser Lys Val Glu Ala Glu Ser Met Asp Pro Gln 85 90 95 cag cgc atc gtc atg gag gtg acg tac gag tcc atg gag agc gca ggg 336 Gln Arg Ile Val Met Glu Val Thr Tyr Glu Ser Met Glu Ser Ala Gly 100 105 110 ctc cgc gtc gac cgg ctc gct ggc tct cgc acc ggc gtc ttc atg gcc 384 Leu Arg Val Asp Arg Leu Ala Gly Ser Arg Thr Gly Val Phe Met Ala 115 120 125 agt ttc acc agc gac tac cga gaa atg ctc tat cgt gat gct gag acg 432 Ser Phe Thr Ser Asp Tyr Arg Glu Met Leu Tyr Arg Asp Ala Glu Thr 130 135 140 gcg cct ctc tac acc gcg acg ggc act agc aac aca tca acc tcg aac 480 Ala Pro Leu Tyr Thr Ala Thr Gly Thr Ser Asn Thr Ser Thr Ser Asn 145 150 155 160 cgt gtc tcg tgg ttt ttc gac ttg cgc ggg cct agc ttt acc gtg aac 528 Arg Val Ser Trp Phe Phe Asp Leu Arg Gly Pro Ser Phe Thr Val Asn 165 170 175 aca gcc tgc tcc tcc agt ctg gta gca tgc cat ctc gcc tgc cag agt 576 Thr Ala Cys Ser Ser Ser Leu Val Ala Cys His Leu Ala Cys Gln Ser 180 185 190 ctg tgg aat ggc gag acg gag agc gcc atc gtc ggc ggc acc agc ctg 624 Leu Trp Asn Gly Glu Thr Glu Ser Ala Ile Val Gly Gly Thr Ser Leu 195 200 205 ctg ctc aac ccc gac atg ttt ctg tac ctc tcc aac cag cgg ttc ctg 672 Leu Leu Asn Pro Asp Met Phe Leu Tyr Leu Ser Asn Gln Arg Phe Leu 210 215 220 gcc ccc gac ggc cag tgc aaa agc ttc gac gag tcc ggc gac ggc tac 720 Ala Pro Asp Gly Gln Cys Lys Ser Phe Asp Glu Ser Gly Asp Gly Tyr 225 230 235 240 gcc aga ggt gat ggc atc ggc gtt gtc att ctg aag cgc gtt gct gac 768 Ala Arg Gly Asp Gly Ile Gly Val Val Ile Leu Lys Arg Val Ala Asp 245 250 255 gcc gtt cgc gat ggc gat ccg atc cga gcc gtg atc cgt ggc agc gga 816 Ala Val Arg Asp Gly Asp Pro Ile Arg Ala Val Ile Arg Gly Ser Gly 260 265 270 tgc aac caa gac ggc cac aca aag ggc ttc acc atc ccc agt gtt gag 864 Cys Asn Gln Asp Gly His Thr Lys Gly Phe Thr Ile Pro Ser Val Glu 275 280 285 gcg caa gcc tct ctt atc gag gag acg tac cgc aaa gca ggt ctt tca 912 Ala Gln Ala Ser Leu Ile Glu Glu Thr Tyr Arg Lys Ala Gly Leu Ser 290 295 300 ctt gca gag acg cgt tac gta gag gcc cac ggg acc ggc acc cag gcg 960 Leu Ala Glu Thr Arg Tyr Val Glu Ala His Gly Thr Gly Thr Gln Ala 305 310 315 320 ggc gac acg tgt gag atg gag ggt atc gca cga aca ttc ggc cag cac 1008 Gly Asp Thr Cys Glu Met Glu Gly Ile Ala Arg Thr Phe Gly Gln His 325 330 335 cgg ggc gac tca gat gat ctg cta gtc gga tct gtc aag tca aat att 1056 Arg Gly Asp Ser Asp Asp Leu Leu Val Gly Ser Val Lys Ser Asn Ile 340 345 350 gga cat ctc gaa gct tgc gct gga ctg gcc tcg ctc ata aag tgc atc 1104 Gly His Leu Glu Ala Cys Ala Gly Leu Ala Ser Leu Ile Lys Cys Ile 355 360 365 ttc att ctg gaa aca ggc gtg ata cca ccg acg ccc agt gtc cgc gtt 1152 Phe Ile Leu Glu Thr Gly Val Ile Pro Pro Thr Pro Ser Val Arg Val 370 375 380 ctc aac ccc aag atc cgc tgg gag gaa tgg cat ctc aag gtt ccc tcg 1200 Leu Asn Pro Lys Ile Arg Trp Glu Glu Trp His Leu Lys Val Pro Ser 385 390 395 400 aaa caa act cct tgg cca acc gac ggc cta cgg cga gtg agc aca cag 1248 Lys Gln Thr Pro Trp Pro Thr Asp Gly Leu Arg Arg Val Ser Thr Gln 405 410 415 ggt ttc gga tac ggt ggt aca aac gcc cat ctg att ctc gac gat gca 1296 Gly Phe Gly Tyr Gly Gly Thr Asn Ala His Leu Ile Leu Asp Asp Ala 420 425 430 gcc cac tat ctc gag ggg cga agt ctc agg ggt cat cat tac act cgc 1344 Ala His Tyr Leu Glu Gly Arg Ser Leu Arg Gly His His Tyr Thr Arg 435 440 445 aca cat cct cag gcg cag agg ctt ttg acc tct gca atc cac ggg gct 1392 Thr His Pro Gln Ala Gln Arg Leu Leu Thr Ser Ala Ile His Gly Ala 450 455 460 tcg cca aag gaa cag ctg ccg cgt ttg ttt ctg ttc cgc gcg aat gat 1440 Ser Pro Lys Glu Gln Leu Pro Arg Leu Phe Leu Phe Arg Ala Asn Asp 465 470 475 480 cgt gag ggc ctt ggg cgt gtc cgg gcg tct ttg gca caa cat ctc gac 1488 Arg Glu Gly Leu Gly Arg Val Arg Ala Ser Leu Ala Gln His Leu Asp 485 490 495 caa ctc ctg ccc tcg tgg tcc cag gac tcg agc ggc cgt gat gca tac 1536 Gln Leu Leu Pro Ser Trp Ser Gln Asp Ser Ser Gly Arg Asp Ala Tyr 500 505 510 ctc cag aac ttg gcc ttt acc ctc gcc agc cga cga tcc aat ctc aaa 1584 Leu Gln Asn Leu Ala Phe Thr Leu Ala Ser Arg Arg Ser Asn Leu Lys 515 520 525 tgg cag acg tat gcc acg gct tct acc ccg gac gag ttg ctt caa gtg 1632 Trp Gln Thr Tyr Ala Thr Ala Ser Thr Pro Asp Glu Leu Leu Gln Val 530 535 540 ctc aag acc aag ggc gac gca tgg gcg agt ccc gag gct cgc ctt gcc 1680 Leu Lys Thr Lys Gly Asp Ala Trp Ala Ser Pro Glu Ala Arg Leu Ala 545 550 555 560 gcg tca tcc ccc cgt ctt ggc ttt att ttc acc ggc cag ggc gct caa 1728 Ala Ser Ser Pro Arg Leu Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln 565 570 575 tgg gct cgc atg ggt gtt gag ctc atg gga tat ccc gtg ttt cgc caa 1776 Trp Ala Arg Met Gly Val Glu Leu Met Gly Tyr Pro Val Phe Arg Gln 580 585 590 agc gtc gag gag tcg gag cac ttc ctg cgc gag act ctc ggc tgt ccc 1824 Ser Val Glu Glu Ser Glu His Phe Leu Arg Glu Thr Leu Gly Cys Pro 595 600 605 tgg tct gcc atc gat gag ctg gcc aag ccg cag acc acg tcc cgt ctc 1872 Trp Ser Ala Ile Asp Glu Leu Ala Lys Pro Gln Thr Thr Ser Arg Leu 610 615 620 tcc gag gca gcc tac agt cag acg ctg tgc acc gta ctt caa att gcc 1920 Ser Glu Ala Ala Tyr Ser Gln Thr Leu Cys Thr Val Leu Gln Ile Ala 625 630 635 640 att gta gac ttg ctt caa gac tgg aat gtc tct ccc act cgc gtt gcc 1968 Ile Val Asp Leu Leu Gln Asp Trp Asn Val Ser Pro Thr Arg Val Ala 645 650 655 ggg cac tca agt ggc gaa ata gcg gcg gca tat tgc cta ggc gcc ctg 2016 Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Ala Leu 660 665 670 acc aag cag gac agt ctg aga gtc gcc tac tac cga gga atc ctg tcg 2064 Thr Lys Gln Asp Ser Leu Arg Val Ala Tyr Tyr Arg Gly Ile Leu Ser 675 680 685 tca gag atg caa gaa aca cac aag gac caa aag gga gcc atg atg gcc 2112 Ser Glu Met Gln Glu Thr His Lys Asp Gln Lys Gly Ala Met Met Ala 690 695 700 atc ggg gcc tcc ccc gag acg gta gca cag tgg ttg gca cag ctg act 2160 Ile Gly Ala Ser Pro Glu Thr Val Ala Gln Trp Leu Ala Gln Leu Thr 705 710 715 720 cgg gga aaa gtc gtc gtt gcc tgc atc aac tcg ccg acg agt gtc acg 2208 Arg Gly Lys Val Val Val Ala Cys Ile Asn Ser Pro Thr Ser Val Thr 725 730 735 gca tcc ggc gac gca gcg ggc atc gac gag ctc ctt tcc ata gta caa 2256 Ala Ser Gly Asp Ala Ala Gly Ile Asp Glu Leu Leu Ser Ile Val Gln 740 745 750 gag gcg gga gtc ttt gga cgc aag ttg aaa gtg gac gtg gca tat cac 2304 Glu Ala Gly Val Phe Gly Arg Lys Leu Lys Val Asp Val Ala Tyr His 755 760 765 tcg cat cat atg cag tcg gtt tct gcg gcc tac tct gcg ctc ctg aag 2352 Ser His His Met Gln Ser Val Ser Ala Ala Tyr Ser Ala Leu Leu Lys 770 775 780 gac ctc aag ccg ctg cca gcg cac gag ggc cgc acc atg cat tcg agc 2400 Asp Leu Lys Pro Leu Pro Ala His Glu Gly Arg Thr Met His Ser Ser 785 790 795 800 gta ttg ggt ggc ttg ata gac acc gca gag ctt ggt gcg tcc aac tgg 2448 Val Leu Gly Gly Leu Ile Asp Thr Ala Glu Leu Gly Ala Ser Asn Trp 805 810 815 gtg cgg aac ctg att tca ccg gtg cgt ttc tct gaa gcc gtc tcg agc 2496 Val Arg Asn Leu Ile Ser Pro Val Arg Phe Ser Glu Ala Val Ser Ser 820 825 830 ctc atc ttg gac ggg gac aag cca gcc gtc gat atg ctc atc gag atc 2544 Leu Ile Leu Asp Gly Asp Lys Pro Ala Val Asp Met Leu Ile Glu Ile 835 840 845 ggg cca cac gct gcg ctc aag gga ccc gtc cag gaa aca cta gag gcc 2592 Gly Pro His Ala Ala Leu Lys Gly Pro Val Gln Glu Thr Leu Glu Ala 850 855 860 aag ggc gtc tcc gcg gtc aag tac acg agc gtc gtg tct cgg ggc cag 2640 Lys Gly Val Ser Ala Val Lys Tyr Thr Ser Val Val Ser Arg Gly Gln 865 870 875 880 aat gct gtc aag acg gct ttg gcc tgc gcg ggc gag ctc gtc aac tcg 2688 Asn Ala Val Lys Thr Ala Leu Ala Cys Ala Gly Glu Leu Val Asn Ser 885 890 895 agc gtc ccc gtt gca atg gat cgt gta aat ctc gag tcg gag ctg caa 2736 Ser Val Pro Val Ala Met Asp Arg Val Asn Leu Glu Ser Glu Leu Gln 900 905 910 ccg agc ccg ctg gtc gat ctt cca tca tac cca tgg aac cgc tcg acc 2784 Pro Ser Pro Leu Val Asp Leu Pro Ser Tyr Pro Trp Asn Arg Ser Thr 915 920 925 cgg ttc tgg gcc gag tca cgt ctt tct caa gaa tat cgg ctt cgc aag 2832 Arg Phe Trp Ala Glu Ser Arg Leu Ser Gln Glu Tyr Arg Leu Arg Lys 930 935 940 cat gcc cgc ctg ccc ctg ctg gga agt ccg tgt ccc acg atg ggc gcc 2880 His Ala Arg Leu Pro Leu Leu Gly Ser Pro Cys Pro Thr Met Gly Ala 945 950 955 960 cgt gag aga tac tgg cgc ggc atg gtg agg ctg gac gag gag ccc tgg 2928 Arg Glu Arg Tyr Trp Arg Gly Met Val Arg Leu Asp Glu Glu Pro Trp 965 970 975 atc cga gac cat gag atc caa ggg tct atc ctg tat cct ggt gcc ggt 2976 Ile Arg Asp His Glu Ile Gln Gly Ser Ile Leu Tyr Pro Gly Ala Gly 980 985 990 ttc ctg atc atg gcc atc gaa gcc gct tct cag caa gca aac gaa cag 3024 Phe Leu Ile Met Ala Ile Glu Ala Ala Ser Gln Gln Ala Asn Glu Gln 995 1000 1005 cgc aaa gtg agc gcg ttt cgt ctg cgc gat gtg cac ctt gat gcc 3069 Arg Lys Val Ser Ala Phe Arg Leu Arg Asp Val His Leu Asp Ala 1010 1015 1020 gcc ttg gtg gtc acg gac aac agc act gcc gag gca att cta caa 3114 Ala Leu Val Val Thr Asp Asn Ser Thr Ala Glu Ala Ile Leu Gln 1025 1030 1035 ctt cgc ccg cat ctc ctc gcg ccg gga agc agc cag tcg tct tgg 3159 Leu Arg Pro His Leu Leu Ala Pro Gly Ser Ser Gln Ser Ser Trp 1040 1045 1050 atg gag ttt acc gtc aac tca tcc att gat ggc ggt gcc ctg cgt 3204 Met Glu Phe Thr Val Asn Ser Ser Ile Asp Gly Gly Ala Leu Arg 1055 1060 1065 cag aac tgc tcc ggc ctc atc atg atc gag tac gag gct gac gca 3249 Gln Asn Cys Ser Gly Leu Ile Met Ile Glu Tyr Glu Ala Asp Ala 1070 1075 1080 gac tcg gcc atg gcc cgt gaa cgt agc ttg gag tca gac acg gtt 3294 Asp Ser Ala Met Ala Arg Glu Arg Ser Leu Glu Ser Asp Thr Val 1085 1090 1095 tgt gat ttg tac aag aag acg tac att tcc tgc cgg cag tct gtc 3339 Cys Asp Leu Tyr Lys Lys Thr Tyr Ile Ser Cys Arg Gln Ser Val 1100 1105 1110 gat gtg gcc aag ttc tac tcc cgt ctc gcc tct ctt ggc ctc acc 3384 Asp Val Ala Lys Phe Tyr Ser Arg Leu Ala Ser Leu Gly Leu Thr 1115 1120 1125 tac ggg ccg gcg ttt gca aac ttg aca gag atc cgg agg acg ggc 3429 Tyr Gly Pro Ala Phe Ala Asn Leu Thr Glu Ile Arg Arg Thr Gly 1130 1135 1140 aac ggc cag tgt acc ggc gcc gtt cgt gtt ccc gct gtc gaa agc 3474 Asn Gly Gln Cys Thr Gly Ala Val Arg Val Pro Ala Val Glu Ser 1145 1150 1155 ctg gtg cct cca gca tac cgc agc cat cct cat gtc atc cat ccg 3519 Leu Val Pro Pro Ala Tyr Arg Ser His Pro His Val Ile His Pro 1160 1165 1170 ggg acg ttg gac gcc atc ttc cat ctt gcc ttt gcg gcc ctc gag 3564 Gly Thr Leu Asp Ala Ile Phe His Leu Ala Phe Ala Ala Leu Glu 1175 1180 1185 gac tct ctg ctt ccc ggt ccc atg gtc cca acg aca atc gat ggg 3609 Asp Ser Leu Leu Pro Gly Pro Met Val Pro Thr Thr Ile Asp Gly 1190 1195 1200 cta gtc gtt gca gca aac act cca aac gag ccc ggc act ttg ctt 3654 Leu Val Val Ala Ala Asn Thr Pro Asn Glu Pro Gly Thr Leu Leu 1205 1210 1215 cgc gga gtt tcg cag tct tct cca cat gga ttc agg gag ctc atc 3699 Arg Gly Val Ser Gln Ser Ser Pro His Gly Phe Arg Glu Leu Ile 1220 1225 1230 tcc gac att gac gtg ctg gat gat cag agc agc aga gcc gtt gta 3744 Ser Asp Ile Asp Val Leu Asp Asp Gln Ser Ser Arg Ala Val Val 1235 1240 1245 cag atc aag ggc ttc cgc tgc gcc gac gtc tcc gga ggc agc gcg 3789 Gln Ile Lys Gly Phe Arg Cys Ala Asp Val Ser Gly Gly Ser Ala 1250 1255 1260 aat tcg tca gac gcg gag cct gca gag gct cgt ccg atc agc ttc 3834 Asn Ser Ser Asp Ala Glu Pro Ala Glu Ala Arg Pro Ile Ser Phe 1265 1270 1275 cgt ctc aac tgg aag cca gca atc gac ctg ctt tct gct gag cag 3879 Arg Leu Asn Trp Lys Pro Ala Ile Asp Leu Leu Ser Ala Glu Gln 1280 1285 1290 ctg cgg aaa tat gtt ggt cgt gtt gcc aaa caa gca gat gct tct 3924 Leu Arg Lys Tyr Val Gly Arg Val Ala Lys Gln Ala Asp Ala Ser 1295 1300 1305 tcc cat ctc att cgt gcc acg gaa cta aac aac cag gtt gga aat 3969 Ser His Leu Ile Arg Ala Thr Glu Leu Asn Asn Gln Val Gly Asn 1310 1315 1320 ctt ccg gaa act gca cca tca gct gca ttg gat gcc gtc acg gaa 4014 Leu Pro Glu Thr Ala Pro Ser Ala Ala Leu Asp Ala Val Thr Glu 1325 1330 1335 aaa gcc act cga tgg ttc gct gcc aag tct gcg aag ctc gtc gac 4059 Lys Ala Thr Arg Trp Phe Ala Ala Lys Ser Ala Lys Leu Val Asp 1340 1345 1350 ggt gct gcc acg gca tcc agc gct tca tcc tca ggg ggc tac gtc 4104 Gly Ala Ala Thr Ala Ser Ser Ala Ser Ser Ser Gly Gly Tyr Val 1355 1360 1365 gac gca acg aga gac gca tgg gca gca gtg cga gaa ggc cgt atc 4149 Asp Ala Thr Arg Asp Ala Trp Ala Ala Val Arg Glu Gly Arg Ile 1370 1375 1380 cca tca cca gag aaa caa gac agg gtg ttg aga gag gta gag aag 4194 Pro Ser Pro Glu Lys Gln Asp Arg Val Leu Arg Glu Val Glu Lys 1385 1390 1395 aac ggc gca ctg tcc acc tta ctg ggg gcg ctc gac gcg tac atg 4239 Asn Gly Ala Leu Ser Thr Leu Leu Gly Ala Leu Asp Ala Tyr Met 1400 1405 1410 gat ctt cgc cat cat gcg aag ccc aac ttg tca gtt ctc gag ctg 4284 Asp Leu Arg His His Ala Lys Pro Asn Leu Ser Val Leu Glu Leu 1415 1420 1425 agc tta gac gcg gtg ccg tac tct att ttc gca gcc ctg ccc agt 4329 Ser Leu Asp Ala Val Pro Tyr Ser Ile Phe Ala Ala Leu Pro Ser 1430 1435 1440 cgg cag agc att ctc cag aca gcc cag tat gct att cga gta tct 4374 Arg Gln Ser Ile Leu Gln Thr Ala Gln Tyr Ala Ile Arg Val Ser 1445 1450 1455 caa gac ggc gtc cag gat cga att agg agt caa ttc ggg tcc caa 4419 Gln Asp Gly Val Gln Asp Arg Ile Arg Ser Gln Phe Gly Ser Gln 1460 1465 1470 gga tct ggc atc gac gtt gcc gtc acg gat ttc acc caa aag atc 4464 Gly Ser Gly Ile Asp Val Ala Val Thr Asp Phe Thr Gln Lys Ile 1475 1480 1485 gac gag aca ttg ggg aag cat gat gta att ctc ata ttt gat cct 4509 Asp Glu Thr Leu Gly Lys His Asp Val Ile Leu Ile Phe Asp Pro 1490 1495 1500 ggc ttc tta cac gcc aag ctc gag gtc gtc ttg cga aac gcc cgc 4554 Gly Phe Leu His Ala Lys Leu Glu Val Val Leu Arg Asn Ala Arg 1505 1510 1515 aag ctg ctg aac ccc gga ggc aag atc atc gtg gca gag gtc aac 4599 Lys Leu Leu Asn Pro Gly Gly Lys Ile Ile Val Ala Glu Val Asn 1520 1525 1530 gag ccc gga cta tat ctg ggc aca gca ctg ggc tgt ctt cac tgg 4644 Glu Pro Gly Leu Tyr Leu Gly Thr Ala Leu Gly Cys Leu His Trp 1535 1540 1545 aca aga aac ctc gac gtc tcg cag agt agc tgg aca tcg tgc ctc 4689 Thr Arg Asn Leu Asp Val Ser Gln Ser Ser Trp Thr Ser Cys Leu 1550 1555 1560 tcg cgc ttc gga ctg acg cct gcc ctg gaa ctc atc gac gca aac 4734 Ser Arg Phe Gly Leu Thr Pro Ala Leu Glu Leu Ile Asp Ala Asn 1565 1570 1575 aca gat gcc acc ggt cat ggg aag ttt cag ctc cgt ctt aca ggc 4779 Thr Asp Ala Thr Gly His Gly Lys Phe Gln Leu Arg Leu Thr Gly 1580 1585 1590 agt gcc gcg gag tcg aat ggg agt agc agc cat cag ccg cag caa 4824 Ser Ala Ala Glu Ser Asn Gly Ser Ser Ser His Gln Pro Gln Gln 1595 1600 1605 gtc acc ctc ata gaa tct gcc gat gca tct gag atg gcg caa ggc 4869 Val Thr Leu Ile Glu Ser Ala Asp Ala Ser Glu Met Ala Gln Gly 1610 1615 1620 gtc gca gaa gcg gta gcc cag cgt ctt caa gag gct tct att ccc 4914 Val Ala Glu Ala Val Ala Gln Arg Leu Gln Glu Ala Ser Ile Pro 1625 1630 1635 aca aag cgc gtc cat tgg ggc tgc gat gtc tcg caa ctc aag ggc 4959 Thr Lys Arg Val His Trp Gly Cys Asp Val Ser Gln Leu Lys Gly 1640 1645 1650 cag ccc tgc atc gtc ctg acg gac ctg cag tct gcg ctg ctg aaa 5004 Gln Pro Cys Ile Val Leu Thr Asp Leu Gln Ser Ala Leu Leu Lys 1655 1660 1665 gat ctg gca cca gag gac ctc gcg gcc ttg caa tca ctt ttc ttg 5049 Asp Leu Ala Pro Glu Asp Leu Ala Ala Leu Gln Ser Leu Phe Leu 1670 1675 1680 cat gct gag agc act ctt tgg gtg acc ggt ccc ctt ggc cca gac 5094 His Ala Glu Ser Thr Leu Trp Val Thr Gly Pro Leu Gly Pro Asp 1685 1690 1695 gcg gct ctg ata aca ggt ttg gct cgc agc gtt tgc aac gag gca 5139 Ala Ala Leu Ile Thr Gly Leu Ala Arg Ser Val Cys Asn Glu Ala 1700 1705 1710 gct gga gtt cag atc cgc acg ctt gag gtg act gat ttg ccg ata 5184 Ala Gly Val Gln Ile Arg Thr Leu Glu Val Thr Asp Leu Pro Ile 1715 1720 1725 tct gca gcc gcc ggc tat gcc gac atg gta gct cgt gtt ttc cgc 5229 Ser Ala Ala Ala Gly Tyr Ala Asp Met Val Ala Arg Val Phe Arg 1730 1735 1740 tat cgt ggc tcg gat aca gag ttt cag tgg cat tca gac gct ctg 5274 Tyr Arg Gly Ser Asp Thr Glu Phe Gln Trp His Ser Asp Ala Leu 1745 1750 1755 cta gtc agc cgg ctg act gag gat gag gac cga aac gag gag atc 5319 Leu Val Ser Arg Leu Thr Glu Asp Glu Asp Arg Asn Glu Glu Ile 1760 1765 1770 gcg cag ctg ctg gga cag gga gaa acg gcc gcg gct gag act acg 5364 Ala Gln Leu Leu Gly Gln Gly Glu Thr Ala Ala Ala Glu Thr Thr 1775 1780 1785 cta cag gag aca cca gag gga ctg aaa ctg tgc gtg agg caa ata 5409 Leu Gln Glu Thr Pro Glu Gly Leu Lys Leu Cys Val Arg Gln Ile 1790 1795 1800 ggc atg ctc gac tct gcc tgc tac gag cca gat ccg ttg gca ttg 5454 Gly Met Leu Asp Ser Ala Cys Tyr Glu Pro Asp Pro Leu Ala Leu 1805 1810 1815 gaa cca cta gag gcc ggc gag gtg gaa gtc gac gtg aag gct tca 5499 Glu Pro Leu Glu Ala Gly Glu Val Glu Val Asp Val Lys Ala Ser 1820 1825 1830 ggg gtc aac ttc cga gat gtc atg gtc gcc ctg ggg cag atc cca 5544 Gly Val Asn Phe Arg Asp Val Met Val Ala Leu Gly Gln Ile Pro 1835 1840 1845 gat cgg gct ttc gga ttc gag ggc gcc ggt gtc gtc cgc cgt gtc 5589 Asp Arg Ala Phe Gly Phe Glu Gly Ala Gly Val Val Arg Arg Val 1850 1855 1860 cac gct gaa gag tcg cgg ctt cgc cct gga gat cga gtc gtc ttc 5634 His Ala Glu Glu Ser Arg Leu Arg Pro Gly Asp Arg Val Val Phe 1865 1870 1875 ctt gct cac gga gcg cac cgc act gtt cat cgt gta cgc gcg gac 5679 Leu Ala His Gly Ala His Arg Thr Val His Arg Val Arg Ala Asp 1880 1885 1890 tat gcc atg cct atg ccc gat acc atg tcc ttt gaa gag ggc gcg 5724 Tyr Ala Met Pro Met Pro Asp Thr Met Ser Phe Glu Glu Gly Ala 1895 1900 1905 gct gtt ctc ctt gtc cac aca aca gcc tgg tac gcc ctc gtc aaa 5769 Ala Val Leu Leu Val His Thr Thr Ala Trp Tyr Ala Leu Val Lys 1910 1915 1920 tcg gca cgc gca aca gcc ggt cag tca gtc ctt gtt cat gcc gct 5814 Ser Ala Arg Ala Thr Ala Gly Gln Ser Val Leu Val His Ala Ala 1925 1930 1935 gca ggc ggt gtt ggc cag gca gtc ctc atg ctt gcc cga cat ctg 5859 Ala Gly Gly Val Gly Gln Ala Val Leu Met Leu Ala Arg His Leu 1940 1945 1950 ggc ctg gag gtt ttt gcg acg gtt ggc tcc gag gag aag agg aag 5904 Gly Leu Glu Val Phe Ala Thr Val Gly Ser Glu Glu Lys Arg Lys 1955 1960 1965 ctt gta cac gaa acg tac ggg att cct cac gac cac atg ttc aac 5949 Leu Val His Glu Thr Tyr Gly Ile Pro His Asp His Met Phe Asn 1970 1975 1980 tcg cgg gac tcc agc ttt gca atg ggc gtg aag cgg atg acc aac 5994 Ser Arg Asp Ser Ser Phe Ala Met Gly Val Lys Arg Met Thr Asn 1985 1990 1995 ggc cgc gga gtt gac att gtt gtc aat tcg ctc gct ggg gaa gct 6039 Gly Arg Gly Val Asp Ile Val Val Asn Ser Leu Ala Gly Glu Ala 2000 2005 2010 ctc cgg cag acg tgg cat tgc ctg gca ccg ttt ggc acc ttt gtc 6084 Leu Arg Gln Thr Trp His Cys Leu Ala Pro Phe Gly Thr Phe Val 2015 2020 2025 gag ctc ggc atg aag gac ata ttg gac aac gca cgc tta gac atg 6129 Glu Leu Gly Met Lys Asp Ile Leu Asp Asn Ala Arg Leu Asp Met 2030 2035 2040 aaa ccc ttc ctg cag gac gca acc ttt gtc ttc ttc aac ctg aac 6174 Lys Pro Phe Leu Gln Asp Ala Thr Phe Val Phe Phe Asn Leu Asn 2045 2050 2055 cgg gtc caa aag gag cgg cca gat ctc atg aag gag gct ctc agg 6219 Arg Val Gln Lys Glu Arg Pro Asp Leu Met Lys Glu Ala Leu Arg 2060 2065 2070 gaa acg atg gcc ctt gta tcc tct ggg gcg ctg aag cca gca acg 6264 Glu Thr Met Ala Leu Val Ser Ser Gly Ala Leu Lys Pro Ala Thr 2075 2080 2085 ccg ctc acc gca tac gca gct tct caa gtg gaa aca gca ttc cgg 6309 Pro Leu Thr Ala Tyr Ala Ala Ser Gln Val Glu Thr Ala Phe Arg 2090 2095 2100 aaa atc cag act ggg cag cac ctg ggt aag ctc gtg cta acg ttc 6354 Lys Ile Gln Thr Gly Gln His Leu Gly Lys Leu Val Leu Thr Phe 2105 2110 2115 cag acc gga gac gtt ctc cgc gtc atc aga ccg gat ctc agc ctg 6399 Gln Thr Gly Asp Val Leu Arg Val Ile Arg Pro Asp Leu Ser Leu 2120 2125 2130 ggc gac tcc ggc gcg tac ctc ctt gtt gga gga ctc ggc gga tta 6444 Gly Asp Ser Gly Ala Tyr Leu Leu Val Gly Gly Leu Gly Gly Leu 2135 2140 2145 ggt cgt agt ctt gca cgg ctg ctg gta cat ctc ggt gcc cgc cgg 6489 Gly Arg Ser Leu Ala Arg Leu Leu Val His Leu Gly Ala Arg Arg 2150 2155 2160 cta tgt ttc ttg tct cgg tct ggt gca aaa agc agc gag gca cag 6534 Leu Cys Phe Leu Ser Arg Ser Gly Ala Lys Ser Ser Glu Ala Gln 2165 2170 2175 gcg ctc gtc cag gaa ctc gag ttg cag cac cga gtt cgc gtg ctt 6579 Ala Leu Val Gln Glu Leu Glu Leu Gln His Arg Val Arg Val Leu 2180 2185 2190 gtc tgc caa ggg gat gtg tcc gac agc gac acg gtg gct cgc gtc 6624 Val Cys Gln Gly Asp Val Ser Asp Ser Asp Thr Val Ala Arg Val 2195 2200 2205 gtt cag caa tgc acc acg acc ctc ggg ccc atc cgt ggc gtc gtc 6669 Val Gln Gln Cys Thr Thr Thr Leu Gly Pro Ile Arg Gly Val Val 2210 2215 2220 cag tgt gcc atg att ctc cgg gat ggc ctg ttt gag aga atg aca 6714 Gln Cys Ala Met Ile Leu Arg Asp Gly Leu Phe Glu Arg Met Thr 2225 2230 2235 cac gag cag tgg acc gag agc acg cgg ccg aag gtg cag ggc acg 6759 His Glu Gln Trp Thr Glu Ser Thr Arg Pro Lys Val Gln Gly Thr 2240 2245 2250 tgg aac ttg cat gag cag atc cca tcg gcc gac ttc ttc atc acg 6804 Trp Asn Leu His Glu Gln Ile Pro Ser Ala Asp Phe Phe Ile Thr 2255 2260 2265 ctg agc tcc ttt gca ggc gtg ttt gga agc cgc ggg cag agc aac 6849 Leu Ser Ser Phe Ala Gly Val Phe Gly Ser Arg Gly Gln Ser Asn 2270 2275 2280 tac gcc gct gcg ggt gcg tac gag gat gcc ttg gca cat ttc cga 6894 Tyr Ala Ala Ala Gly Ala Tyr Glu Asp Ala Leu Ala His Phe Arg 2285 2290 2295 acg tct ctg gga cag agg gct atc acc atc gac ttg ggc atc atg 6939 Thr Ser Leu Gly Gln Arg Ala Ile Thr Ile Asp Leu Gly Ile Met 2300 2305 2310 cgt gac gtg ggc gtc ctc gcc gag cag ggc atc acg gac tac ctc 6984 Arg Asp Val Gly Val Leu Ala Glu Gln Gly Ile Thr Asp Tyr Leu 2315 2320 2325 cgg gag tgg gag gag ccc ttt gga ata cga gag cat gag ttt cat 7029 Arg Glu Trp Glu Glu Pro Phe Gly Ile Arg Glu His Glu Phe His 2330 2335 2340 gcc ctc atc aag tcg gcc atc atg tcg gcc acg gaa ccg ccg act 7074 Ala Leu Ile Lys Ser Ala Ile Met Ser Ala Thr Glu Pro Pro Thr 2345 2350 2355 gag cgc tcc gtg gtg cag atc cct acc ggc ttg gcc acc gcc cgt 7119 Glu Arg Ser Val Val Gln Ile Pro Thr Gly Leu Ala Thr Ala Arg 2360 2365 2370 tcc gcg caa gca gcc ggt ata agc aca cca ttc tac ttt gac gac 7164 Ser Ala Gln Ala Ala Gly Ile Ser Thr Pro Phe Tyr Phe Asp Asp 2375 2380 2385 gcc cgt ttc tcg atc ctc gcc cag aca cgc acc gcg gcc ggt gcg 7209 Ala Arg Phe Ser Ile Leu Ala Gln Thr Arg Thr Ala Ala Gly Ala 2390 2395 2400 tcg tcg gcg aac gct gat gat ggc aag gtt tcc atc cga aca cag 7254 Ser Ser Ala Asn Ala Asp Asp Gly Lys Val Ser Ile Arg Thr Gln 2405 2410 2415 ctc tct cag gcc cag tcg gtg gct gaa gca gcc tcc gcc gtt cag 7299 Leu Ser Gln Ala Gln Ser Val Ala Glu Ala Ala Ser Ala Val Gln 2420 2425 2430 acg gtg ctg ctt gag cgg gta gca aag acg ctc cag agc tct gta 7344 Thr Val Leu Leu Glu Arg Val Ala Lys Thr Leu Gln Ser Ser Val 2435 2440 2445 tcg gaa ata gat cca tct cag cca ctg cat tcg tat ggt gtc gat 7389 Ser Glu Ile Asp Pro Ser Gln Pro Leu His Ser Tyr Gly Val Asp 2450 2455 2460 tcc ctg gtc gcc gtg gaa acg gtc aag tgg atg ttt aaa acg cta 7434 Ser Leu Val Ala Val Glu Thr Val Lys Trp Met Phe Lys Thr Leu 2465 2470 2475 gag gct aag ctg acg gtg ttt gat gtt ctc tcc aac gtg tct att 7479 Glu Ala Lys Leu Thr Val Phe Asp Val Leu Ser Asn Val Ser Ile 2480 2485 2490 gtt gta tta tgc gag aag att gct acc acg tct act cta gta aag 7524 Val Val Leu Cys Glu Lys Ile Ala Thr Thr Ser Thr Leu Val Lys 2495 2500 2505 ttg agc tag 7533 Leu Ser 2510 <210> 8 <211> 2510 <212> PRT <213> Metarhizium rileyi <400> 8 Met Glu Ala Ser Ser Gln Ser Arg Asp Asp Ile Ala Val Ile Gly Leu 1 5 10 15 Ser Cys Arg Phe Pro Gly Glu Ala Asp Thr Ala Glu His Phe Trp Asp 20 25 30 Phe Ile Cys Asn Gly Arg Asn Ala Tyr Ser Glu Asn Pro Asp Arg Trp 35 40 45 Asn Pro Asp Ala Phe His Tyr Gly Glu Lys Lys Leu Asn Thr Ser Leu 50 55 60 Pro Arg Gly Gly His Phe Met Lys Gln Asp Val Ala Ala Phe Asp Ala 65 70 75 80 Asn Phe Phe Asn Leu Ser Lys Val Glu Ala Glu Ser Met Asp Pro Gln 85 90 95 Gln Arg Ile Val Met Glu Val Thr Tyr Glu Ser Met Glu Ser Ala Gly 100 105 110 Leu Arg Val Asp Arg Leu Ala Gly Ser Arg Thr Gly Val Phe Met Ala 115 120 125 Ser Phe Thr Ser Asp Tyr Arg Glu Met Leu Tyr Arg Asp Ala Glu Thr 130 135 140 Ala Pro Leu Tyr Thr Ala Thr Gly Thr Ser Asn Thr Ser Thr Ser Asn 145 150 155 160 Arg Val Ser Trp Phe Phe Asp Leu Arg Gly Pro Ser Phe Thr Val Asn 165 170 175 Thr Ala Cys Ser Ser Ser Leu Val Ala Cys His Leu Ala Cys Gln Ser 180 185 190 Leu Trp Asn Gly Glu Thr Glu Ser Ala Ile Val Gly Gly Thr Ser Leu 195 200 205 Leu Leu Asn Pro Asp Met Phe Leu Tyr Leu Ser Asn Gln Arg Phe Leu 210 215 220 Ala Pro Asp Gly Gln Cys Lys Ser Phe Asp Glu Ser Gly Asp Gly Tyr 225 230 235 240 Ala Arg Gly Asp Gly Ile Gly Val Val Ile Leu Lys Arg Val Ala Asp 245 250 255 Ala Val Arg Asp Gly Asp Pro Ile Arg Ala Val Ile Arg Gly Ser Gly 260 265 270 Cys Asn Gln Asp Gly His Thr Lys Gly Phe Thr Ile Pro Ser Val Glu 275 280 285 Ala Gln Ala Ser Leu Ile Glu Glu Thr Tyr Arg Lys Ala Gly Leu Ser 290 295 300 Leu Ala Glu Thr Arg Tyr Val Glu Ala His Gly Thr Gly Thr Gln Ala 305 310 315 320 Gly Asp Thr Cys Glu Met Glu Gly Ile Ala Arg Thr Phe Gly Gln His 325 330 335 Arg Gly Asp Ser Asp Asp Leu Leu Val Gly Ser Val Lys Ser Asn Ile 340 345 350 Gly His Leu Glu Ala Cys Ala Gly Leu Ala Ser Leu Ile Lys Cys Ile 355 360 365 Phe Ile Leu Glu Thr Gly Val Ile Pro Pro Thr Pro Ser Val Arg Val 370 375 380 Leu Asn Pro Lys Ile Arg Trp Glu Glu Trp His Leu Lys Val Pro Ser 385 390 395 400 Lys Gln Thr Pro Trp Pro Thr Asp Gly Leu Arg Arg Val Ser Thr Gln 405 410 415 Gly Phe Gly Tyr Gly Gly Thr Asn Ala His Leu Ile Leu Asp Asp Ala 420 425 430 Ala His Tyr Leu Glu Gly Arg Ser Leu Arg Gly His His Tyr Thr Arg 435 440 445 Thr His Pro Gln Ala Gln Arg Leu Leu Thr Ser Ala Ile His Gly Ala 450 455 460 Ser Pro Lys Glu Gln Leu Pro Arg Leu Phe Leu Phe Arg Ala Asn Asp 465 470 475 480 Arg Glu Gly Leu Gly Arg Val Arg Ala Ser Leu Ala Gln His Leu Asp 485 490 495 Gln Leu Leu Pro Ser Trp Ser Gln Asp Ser Ser Gly Arg Asp Ala Tyr 500 505 510 Leu Gln Asn Leu Ala Phe Thr Leu Ala Ser Arg Arg Ser Asn Leu Lys 515 520 525 Trp Gln Thr Tyr Ala Thr Ala Ser Thr Pro Asp Glu Leu Leu Gln Val 530 535 540 Leu Lys Thr Lys Gly Asp Ala Trp Ala Ser Pro Glu Ala Arg Leu Ala 545 550 555 560 Ala Ser Ser Pro Arg Leu Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln 565 570 575 Trp Ala Arg Met Gly Val Glu Leu Met Gly Tyr Pro Val Phe Arg Gln 580 585 590 Ser Val Glu Glu Ser Glu His Phe Leu Arg Glu Thr Leu Gly Cys Pro 595 600 605 Trp Ser Ala Ile Asp Glu Leu Ala Lys Pro Gln Thr Thr Ser Arg Leu 610 615 620 Ser Glu Ala Ala Tyr Ser Gln Thr Leu Cys Thr Val Leu Gln Ile Ala 625 630 635 640 Ile Val Asp Leu Leu Gln Asp Trp Asn Val Ser Pro Thr Arg Val Ala 645 650 655 Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Ala Leu 660 665 670 Thr Lys Gln Asp Ser Leu Arg Val Ala Tyr Tyr Arg Gly Ile Leu Ser 675 680 685 Ser Glu Met Gln Glu Thr His Lys Asp Gln Lys Gly Ala Met Met Ala 690 695 700 Ile Gly Ala Ser Pro Glu Thr Val Ala Gln Trp Leu Ala Gln Leu Thr 705 710 715 720 Arg Gly Lys Val Val Val Ala Cys Ile Asn Ser Pro Thr Ser Val Thr 725 730 735 Ala Ser Gly Asp Ala Ala Gly Ile Asp Glu Leu Leu Ser Ile Val Gln 740 745 750 Glu Ala Gly Val Phe Gly Arg Lys Leu Lys Val Asp Val Ala Tyr His 755 760 765 Ser His His Met Gln Ser Val Ser Ala Ala Tyr Ser Ala Leu Leu Lys 770 775 780 Asp Leu Lys Pro Leu Pro Ala His Glu Gly Arg Thr Met His Ser Ser 785 790 795 800 Val Leu Gly Gly Leu Ile Asp Thr Ala Glu Leu Gly Ala Ser Asn Trp 805 810 815 Val Arg Asn Leu Ile Ser Pro Val Arg Phe Ser Glu Ala Val Ser Ser 820 825 830 Leu Ile Leu Asp Gly Asp Lys Pro Ala Val Asp Met Leu Ile Glu Ile 835 840 845 Gly Pro His Ala Ala Leu Lys Gly Pro Val Gln Glu Thr Leu Glu Ala 850 855 860 Lys Gly Val Ser Ala Val Lys Tyr Thr Ser Val Val Ser Arg Gly Gln 865 870 875 880 Asn Ala Val Lys Thr Ala Leu Ala Cys Ala Gly Glu Leu Val Asn Ser 885 890 895 Ser Val Pro Val Ala Met Asp Arg Val Asn Leu Glu Ser Glu Leu Gln 900 905 910 Pro Ser Pro Leu Val Asp Leu Pro Ser Tyr Pro Trp Asn Arg Ser Thr 915 920 925 Arg Phe Trp Ala Glu Ser Arg Leu Ser Gln Glu Tyr Arg Leu Arg Lys 930 935 940 His Ala Arg Leu Pro Leu Leu Gly Ser Pro Cys Pro Thr Met Gly Ala 945 950 955 960 Arg Glu Arg Tyr Trp Arg Gly Met Val Arg Leu Asp Glu Glu Pro Trp 965 970 975 Ile Arg Asp His Glu Ile Gln Gly Ser Ile Leu Tyr Pro Gly Ala Gly 980 985 990 Phe Leu Ile Met Ala Ile Glu Ala Ala Ser Gln Gln Ala Asn Glu Gln 995 1000 1005 Arg Lys Val Ser Ala Phe Arg Leu Arg Asp Val His Leu Asp Ala 1010 1015 1020 Ala Leu Val Val Thr Asp Asn Ser Thr Ala Glu Ala Ile Leu Gln 1025 1030 1035 Leu Arg Pro His Leu Leu Ala Pro Gly Ser Ser Gln Ser Ser Trp 1040 1045 1050 Met Glu Phe Thr Val Asn Ser Ser Ile Asp Gly Gly Ala Leu Arg 1055 1060 1065 Gln Asn Cys Ser Gly Leu Ile Met Ile Glu Tyr Glu Ala Asp Ala 1070 1075 1080 Asp Ser Ala Met Ala Arg Glu Arg Ser Leu Glu Ser Asp Thr Val 1085 1090 1095 Cys Asp Leu Tyr Lys Lys Thr Tyr Ile Ser Cys Arg Gln Ser Val 1100 1105 1110 Asp Val Ala Lys Phe Tyr Ser Arg Leu Ala Ser Leu Gly Leu Thr 1115 1120 1125 Tyr Gly Pro Ala Phe Ala Asn Leu Thr Glu Ile Arg Arg Thr Gly 1130 1135 1140 Asn Gly Gln Cys Thr Gly Ala Val Arg Val Pro Ala Val Glu Ser 1145 1150 1155 Leu Val Pro Pro Ala Tyr Arg Ser His Pro His Val Ile His Pro 1160 1165 1170 Gly Thr Leu Asp Ala Ile Phe His Leu Ala Phe Ala Ala Leu Glu 1175 1180 1185 Asp Ser Leu Leu Pro Gly Pro Met Val Pro Thr Thr Ile Asp Gly 1190 1195 1200 Leu Val Val Ala Ala Asn Thr Pro Asn Glu Pro Gly Thr Leu Leu 1205 1210 1215 Arg Gly Val Ser Gln Ser Ser Pro His Gly Phe Arg Glu Leu Ile 1220 1225 1230 Ser Asp Ile Asp Val Leu Asp Asp Gln Ser Ser Arg Ala Val Val 1235 1240 1245 Gln Ile Lys Gly Phe Arg Cys Ala Asp Val Ser Gly Gly Ser Ala 1250 1255 1260 Asn Ser Ser Asp Ala Glu Pro Ala Glu Ala Arg Pro Ile Ser Phe 1265 1270 1275 Arg Leu Asn Trp Lys Pro Ala Ile Asp Leu Leu Ser Ala Glu Gln 1280 1285 1290 Leu Arg Lys Tyr Val Gly Arg Val Ala Lys Gln Ala Asp Ala Ser 1295 1300 1305 Ser His Leu Ile Arg Ala Thr Glu Leu Asn Asn Gln Val Gly Asn 1310 1315 1320 Leu Pro Glu Thr Ala Pro Ser Ala Ala Leu Asp Ala Val Thr Glu 1325 1330 1335 Lys Ala Thr Arg Trp Phe Ala Ala Lys Ser Ala Lys Leu Val Asp 1340 1345 1350 Gly Ala Ala Thr Ala Ser Ser Ala Ser Ser Ser Gly Gly Tyr Val 1355 1360 1365 Asp Ala Thr Arg Asp Ala Trp Ala Ala Val Arg Glu Gly Arg Ile 1370 1375 1380 Pro Ser Pro Glu Lys Gln Asp Arg Val Leu Arg Glu Val Glu Lys 1385 1390 1395 Asn Gly Ala Leu Ser Thr Leu Leu Gly Ala Leu Asp Ala Tyr Met 1400 1405 1410 Asp Leu Arg His His Ala Lys Pro Asn Leu Ser Val Leu Glu Leu 1415 1420 1425 Ser Leu Asp Ala Val Pro Tyr Ser Ile Phe Ala Ala Leu Pro Ser 1430 1435 1440 Arg Gln Ser Ile Leu Gln Thr Ala Gln Tyr Ala Ile Arg Val Ser 1445 1450 1455 Gln Asp Gly Val Gln Asp Arg Ile Arg Ser Gln Phe Gly Ser Gln 1460 1465 1470 Gly Ser Gly Ile Asp Val Ala Val Thr Asp Phe Thr Gln Lys Ile 1475 1480 1485 Asp Glu Thr Leu Gly Lys His Asp Val Ile Leu Ile Phe Asp Pro 1490 1495 1500 Gly Phe Leu His Ala Lys Leu Glu Val Val Leu Arg Asn Ala Arg 1505 1510 1515 Lys Leu Leu Asn Pro Gly Gly Lys Ile Ile Val Ala Glu Val Asn 1520 1525 1530 Glu Pro Gly Leu Tyr Leu Gly Thr Ala Leu Gly Cys Leu His Trp 1535 1540 1545 Thr Arg Asn Leu Asp Val Ser Gln Ser Ser Trp Thr Ser Cys Leu 1550 1555 1560 Ser Arg Phe Gly Leu Thr Pro Ala Leu Glu Leu Ile Asp Ala Asn 1565 1570 1575 Thr Asp Ala Thr Gly His Gly Lys Phe Gln Leu Arg Leu Thr Gly 1580 1585 1590 Ser Ala Ala Glu Ser Asn Gly Ser Ser Ser His Gln Pro Gln Gln 1595 1600 1605 Val Thr Leu Ile Glu Ser Ala Asp Ala Ser Glu Met Ala Gln Gly 1610 1615 1620 Val Ala Glu Ala Val Ala Gln Arg Leu Gln Glu Ala Ser Ile Pro 1625 1630 1635 Thr Lys Arg Val His Trp Gly Cys Asp Val Ser Gln Leu Lys Gly 1640 1645 1650 Gln Pro Cys Ile Val Leu Thr Asp Leu Gln Ser Ala Leu Leu Lys 1655 1660 1665 Asp Leu Ala Pro Glu Asp Leu Ala Ala Leu Gln Ser Leu Phe Leu 1670 1675 1680 His Ala Glu Ser Thr Leu Trp Val Thr Gly Pro Leu Gly Pro Asp 1685 1690 1695 Ala Ala Leu Ile Thr Gly Leu Ala Arg Ser Val Cys Asn Glu Ala 1700 1705 1710 Ala Gly Val Gln Ile Arg Thr Leu Glu Val Thr Asp Leu Pro Ile 1715 1720 1725 Ser Ala Ala Ala Gly Tyr Ala Asp Met Val Ala Arg Val Phe Arg 1730 1735 1740 Tyr Arg Gly Ser Asp Thr Glu Phe Gln Trp His Ser Asp Ala Leu 1745 1750 1755 Leu Val Ser Arg Leu Thr Glu Asp Glu Asp Arg Asn Glu Glu Ile 1760 1765 1770 Ala Gln Leu Leu Gly Gln Gly Glu Thr Ala Ala Ala Glu Thr Thr 1775 1780 1785 Leu Gln Glu Thr Pro Glu Gly Leu Lys Leu Cys Val Arg Gln Ile 1790 1795 1800 Gly Met Leu Asp Ser Ala Cys Tyr Glu Pro Asp Pro Leu Ala Leu 1805 1810 1815 Glu Pro Leu Glu Ala Gly Glu Val Glu Val Asp Val Lys Ala Ser 1820 1825 1830 Gly Val Asn Phe Arg Asp Val Met Val Ala Leu Gly Gln Ile Pro 1835 1840 1845 Asp Arg Ala Phe Gly Phe Glu Gly Ala Gly Val Val Arg Arg Val 1850 1855 1860 His Ala Glu Glu Ser Arg Leu Arg Pro Gly Asp Arg Val Val Phe 1865 1870 1875 Leu Ala His Gly Ala His Arg Thr Val His Arg Val Arg Ala Asp 1880 1885 1890 Tyr Ala Met Pro Met Pro Asp Thr Met Ser Phe Glu Glu Gly Ala 1895 1900 1905 Ala Val Leu Leu Val His Thr Thr Ala Trp Tyr Ala Leu Val Lys 1910 1915 1920 Ser Ala Arg Ala Thr Ala Gly Gln Ser Val Leu Val His Ala Ala 1925 1930 1935 Ala Gly Gly Val Gly Gln Ala Val Leu Met Leu Ala Arg His Leu 1940 1945 1950 Gly Leu Glu Val Phe Ala Thr Val Gly Ser Glu Glu Lys Arg Lys 1955 1960 1965 Leu Val His Glu Thr Tyr Gly Ile Pro His Asp His Met Phe Asn 1970 1975 1980 Ser Arg Asp Ser Ser Phe Ala Met Gly Val Lys Arg Met Thr Asn 1985 1990 1995 Gly Arg Gly Val Asp Ile Val Val Asn Ser Leu Ala Gly Glu Ala 2000 2005 2010 Leu Arg Gln Thr Trp His Cys Leu Ala Pro Phe Gly Thr Phe Val 2015 2020 2025 Glu Leu Gly Met Lys Asp Ile Leu Asp Asn Ala Arg Leu Asp Met 2030 2035 2040 Lys Pro Phe Leu Gln Asp Ala Thr Phe Val Phe Phe Asn Leu Asn 2045 2050 2055 Arg Val Gln Lys Glu Arg Pro Asp Leu Met Lys Glu Ala Leu Arg 2060 2065 2070 Glu Thr Met Ala Leu Val Ser Ser Gly Ala Leu Lys Pro Ala Thr 2075 2080 2085 Pro Leu Thr Ala Tyr Ala Ala Ser Gln Val Glu Thr Ala Phe Arg 2090 2095 2100 Lys Ile Gln Thr Gly Gln His Leu Gly Lys Leu Val Leu Thr Phe 2105 2110 2115 Gln Thr Gly Asp Val Leu Arg Val Ile Arg Pro Asp Leu Ser Leu 2120 2125 2130 Gly Asp Ser Gly Ala Tyr Leu Leu Val Gly Gly Leu Gly Gly Leu 2135 2140 2145 Gly Arg Ser Leu Ala Arg Leu Leu Val His Leu Gly Ala Arg Arg 2150 2155 2160 Leu Cys Phe Leu Ser Arg Ser Gly Ala Lys Ser Ser Glu Ala Gln 2165 2170 2175 Ala Leu Val Gln Glu Leu Glu Leu Gln His Arg Val Arg Val Leu 2180 2185 2190 Val Cys Gln Gly Asp Val Ser Asp Ser Asp Thr Val Ala Arg Val 2195 2200 2205 Val Gln Gln Cys Thr Thr Thr Leu Gly Pro Ile Arg Gly Val Val 2210 2215 2220 Gln Cys Ala Met Ile Leu Arg Asp Gly Leu Phe Glu Arg Met Thr 2225 2230 2235 His Glu Gln Trp Thr Glu Ser Thr Arg Pro Lys Val Gln Gly Thr 2240 2245 2250 Trp Asn Leu His Glu Gln Ile Pro Ser Ala Asp Phe Phe Ile Thr 2255 2260 2265 Leu Ser Ser Phe Ala Gly Val Phe Gly Ser Arg Gly Gln Ser Asn 2270 2275 2280 Tyr Ala Ala Ala Gly Ala Tyr Glu Asp Ala Leu Ala His Phe Arg 2285 2290 2295 Thr Ser Leu Gly Gln Arg Ala Ile Thr Ile Asp Leu Gly Ile Met 2300 2305 2310 Arg Asp Val Gly Val Leu Ala Glu Gln Gly Ile Thr Asp Tyr Leu 2315 2320 2325 Arg Glu Trp Glu Glu Pro Phe Gly Ile Arg Glu His Glu Phe His 2330 2335 2340 Ala Leu Ile Lys Ser Ala Ile Met Ser Ala Thr Glu Pro Pro Thr 2345 2350 2355 Glu Arg Ser Val Val Gln Ile Pro Thr Gly Leu Ala Thr Ala Arg 2360 2365 2370 Ser Ala Gln Ala Ala Gly Ile Ser Thr Pro Phe Tyr Phe Asp Asp 2375 2380 2385 Ala Arg Phe Ser Ile Leu Ala Gln Thr Arg Thr Ala Ala Gly Ala 2390 2395 2400 Ser Ser Ala Asn Ala Asp Asp Gly Lys Val Ser Ile Arg Thr Gln 2405 2410 2415 Leu Ser Gln Ala Gln Ser Val Ala Glu Ala Ala Ser Ala Val Gln 2420 2425 2430 Thr Val Leu Leu Glu Arg Val Ala Lys Thr Leu Gln Ser Ser Val 2435 2440 2445 Ser Glu Ile Asp Pro Ser Gln Pro Leu His Ser Tyr Gly Val Asp 2450 2455 2460 Ser Leu Val Ala Val Glu Thr Val Lys Trp Met Phe Lys Thr Leu 2465 2470 2475 Glu Ala Lys Leu Thr Val Phe Asp Val Leu Ser Asn Val Ser Ile 2480 2485 2490 Val Val Leu Cys Glu Lys Ile Ala Thr Thr Ser Thr Leu Val Lys 2495 2500 2505 Leu Ser 2510 <210> 9 <211> 5166 <212> DNA <213> Metarhizium rileyi <220> <221> CDS <222> (1)..(5166) <400> 9 atg aaa atc cgg gct aca aac ttc ctc ctt ttt gga gat cag act gta 48 Met Lys Ile Arg Ala Thr Asn Phe Leu Leu Phe Gly Asp Gln Thr Val 1 5 10 15 gag aag ctt cca gcc att cgg cag ctg gta ggg cac gct gcg tcc tca 96 Glu Lys Leu Pro Ala Ile Arg Gln Leu Val Gly His Ala Ala Ser Ser 20 25 30 gct ctg ctt cag agg ttt ctg cgt caa gtt tgc gat gcg gtg cag ctc 144 Ala Leu Leu Gln Arg Phe Leu Arg Gln Val Cys Asp Ala Val Gln Leu 35 40 45 gaa gtc gcc aag ttg cct atg cac tcg gag caa cgc agc aac att gac 192 Glu Val Ala Lys Leu Pro Met His Ser Glu Gln Arg Ser Asn Ile Asp 50 55 60 aag ttt gac agc atc att cga cta gcc gaa aac aat gcc cgg ctg gac 240 Lys Phe Asp Ser Ile Ile Arg Leu Ala Glu Asn Asn Ala Arg Leu Asp 65 70 75 80 gag ccc aat gag atc gtt gcc acc gtc ttg atg aat atc gcc cgg ata 288 Glu Pro Asn Glu Ile Val Ala Thr Val Leu Met Asn Ile Ala Arg Ile 85 90 95 ggc gag ctc att ctg tat gca gaa gaa gac cct acc gtc ctc gtc tcc 336 Gly Glu Leu Ile Leu Tyr Ala Glu Glu Asp Pro Thr Val Leu Val Ser 100 105 110 aaa ggc aac cgc aac tgt att ctg gga ttc tgc act ggc gag gtg gct 384 Lys Gly Asn Arg Asn Cys Ile Leu Gly Phe Cys Thr Gly Glu Val Ala 115 120 125 gct gcc gcg gcc act atc gcg cag gac tcc aat gag ctg gtt gag ctg 432 Ala Ala Ala Ala Thr Ile Ala Gln Asp Ser Asn Glu Leu Val Glu Leu 130 135 140 ggc gtg gag atg act cac atc atc ttt cgc atg gcc cga gag cta aat 480 Gly Val Glu Met Thr His Ile Ile Phe Arg Met Ala Arg Glu Leu Asn 145 150 155 160 cac cgg tct ctc atg gtt gac cgt acc aac ggc ccc tgg gca aag aca 528 His Arg Ser Leu Met Val Asp Arg Thr Asn Gly Pro Trp Ala Lys Thr 165 170 175 atc ttg ggc att tca gtt gag cgc gtc cag gag att cta cat gag ttc 576 Ile Leu Gly Ile Ser Val Glu Arg Val Gln Glu Ile Leu His Glu Phe 180 185 190 cac gag agc gag tca att cct cgt gtc cga cga gtc tgc gtc ggg ttc 624 His Glu Ser Glu Ser Ile Pro Arg Val Arg Arg Val Cys Val Gly Phe 195 200 205 atc gca gaa ggc tgg ttg acg ctc ttc ggt ccc ccg aca acc ctg caa 672 Ile Ala Glu Gly Trp Leu Thr Leu Phe Gly Pro Pro Thr Thr Leu Gln 210 215 220 cga ctt ttc gaa tgg tca gta gag ctg gaa gac gct cca cag att gcc 720 Arg Leu Phe Glu Trp Ser Val Glu Leu Glu Asp Ala Pro Gln Ile Ala 225 230 235 240 aca gac gct cgt gga ggt gtg cac atg aag acg atg ccc gac gtt gac 768 Thr Asp Ala Arg Gly Gly Val His Met Lys Thr Met Pro Asp Val Asp 245 250 255 gtg gac tgg att ctt ggc tcg tcc gta tgg ctc gac cga acc ccc gtt 816 Val Asp Trp Ile Leu Gly Ser Ser Val Trp Leu Asp Arg Thr Pro Val 260 265 270 cac aca gct acc atc ttc tct ccc tat acg tgt cag cct cgg cag caa 864 His Thr Ala Thr Ile Phe Ser Pro Tyr Thr Cys Gln Pro Arg Gln Gln 275 280 285 cag act ctg cga ggg ctt ctg agg gaa atc att acc gac gtt gcg cag 912 Gln Thr Leu Arg Gly Leu Leu Arg Glu Ile Ile Thr Asp Val Ala Gln 290 295 300 cgg acg ttg tat ttg gcc aag gca atg aac gcg gct ctt gag ttt acc 960 Arg Thr Leu Tyr Leu Ala Lys Ala Met Asn Ala Ala Leu Glu Phe Thr 305 310 315 320 aag gca gac gag ctg cga gtc gtc atg ccc ggt cac acg agc cac gac 1008 Lys Ala Asp Glu Leu Arg Val Val Met Pro Gly His Thr Ser His Asp 325 330 335 gtc tat ttc ctc aag tcg ctt cag aaa cgt ggc ata gag tac tca gtc 1056 Val Tyr Phe Leu Lys Ser Leu Gln Lys Arg Gly Ile Glu Tyr Ser Val 340 345 350 atg tca cat ggc gat agc cca ccg tca gct ccg ggt agg caa ggt tca 1104 Met Ser His Gly Asp Ser Pro Pro Ser Ala Pro Gly Arg Gln Gly Ser 355 360 365 ggc ctt gtt gct gtc gtc ggc atg tcc ggc agg ttc ccg gga agc ggc 1152 Gly Leu Val Ala Val Val Gly Met Ser Gly Arg Phe Pro Gly Ser Gly 370 375 380 gac atc aat gcc ttc tgg gag ggt ctt ttg gag ggg aaa aga tat att 1200 Asp Ile Asn Ala Phe Trp Glu Gly Leu Leu Glu Gly Lys Arg Tyr Ile 385 390 395 400 caa gag att cca aat acc cga ttc gat ctg gag aag tgg tat gac gcg 1248 Gln Glu Ile Pro Asn Thr Arg Phe Asp Leu Glu Lys Trp Tyr Asp Ala 405 410 415 acg ggc aaa gta aag aac tcg aca att gcg cga acg gga gcc ttc ctt 1296 Thr Gly Lys Val Lys Asn Ser Thr Ile Ala Arg Thr Gly Ala Phe Leu 420 425 430 gat aag cca ggt atg ttc gac aac cgc ctg ttc gac atg tcg cca agg 1344 Asp Lys Pro Gly Met Phe Asp Asn Arg Leu Phe Asp Met Ser Pro Arg 435 440 445 gag gcc atg cag acg gac gtc cag cac cga cta ctc atg aca acc ggc 1392 Glu Ala Met Gln Thr Asp Val Gln His Arg Leu Leu Met Thr Thr Gly 450 455 460 tac gag gca ctg gag atg tcg gga tac tcc ccc gac ggg act ccc tca 1440 Tyr Glu Ala Leu Glu Met Ser Gly Tyr Ser Pro Asp Gly Thr Pro Ser 465 470 475 480 act gac acg agt cgc atc gca tca tac ttt gga cag acg tca gac gat 1488 Thr Asp Thr Ser Arg Ile Ala Ser Tyr Phe Gly Gln Thr Ser Asp Asp 485 490 495 tgg cgg gaa gtg gtg gtc cat cag ggg gtc gac atc tac ttc gcc acg 1536 Trp Arg Glu Val Val Val His Gln Gly Val Asp Ile Tyr Phe Ala Thr 500 505 510 gga agt tgc cgt gcc ttc ggg cca ggc aga ctg cat cac cat ttc aaa 1584 Gly Ser Cys Arg Ala Phe Gly Pro Gly Arg Leu His His His Phe Lys 515 520 525 tgg gga ggc ccg tct tac agt gtc gac tcg gca tgc tcc tcg agc atc 1632 Trp Gly Gly Pro Ser Tyr Ser Val Asp Ser Ala Cys Ser Ser Ser Ile 530 535 540 gca gcc gtc ggt ctg gca tgc tca gcg ctc ctc ggg cgc gaa tgc gac 1680 Ala Ala Val Gly Leu Ala Cys Ser Ala Leu Leu Gly Arg Glu Cys Asp 545 550 555 560 atg gcc ctg gct ggc gga gga tct cta ctt ctc tcc ccg tcg ccc ttc 1728 Met Ala Leu Ala Gly Gly Gly Ser Leu Leu Leu Ser Pro Ser Pro Phe 565 570 575 tca ggc ttg agc cgt ggt ggt ttc tta tcc gcc caa gga ggg tgc cag 1776 Ser Gly Leu Ser Arg Gly Gly Phe Leu Ser Ala Gln Gly Gly Cys Gln 580 585 590 aca ttc cac gac aac gcc gat ggc tac gtc cga gga gag ggc gtc gga 1824 Thr Phe His Asp Asn Ala Asp Gly Tyr Val Arg Gly Glu Gly Val Gly 595 600 605 gtg gtt gtt ctc aag cgc tta gaa gat gcg ctg gac gac cag gac aac 1872 Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Asp Asp Gln Asp Asn 610 615 620 ata ctc ggc gtt gtc cgc ggg tcc gga cgc aac tac agc agc gat gcc 1920 Ile Leu Gly Val Val Arg Gly Ser Gly Arg Asn Tyr Ser Ser Asp Ala 625 630 635 640 tct tcg atg atg cac ccc tcg gca aac gcc cag aaa cag ctg tac cgt 1968 Ser Ser Met Met His Pro Ser Ala Asn Ala Gln Lys Gln Leu Tyr Arg 645 650 655 gat gtt ctg gag cag agt ggt gta gag gcc aac agc atc tcc tac gtg 2016 Asp Val Leu Glu Gln Ser Gly Val Glu Ala Asn Ser Ile Ser Tyr Val 660 665 670 gaa atg cac ggg aca ggc acg cag gcc ggg gac ttt atg gaa atg tct 2064 Glu Met His Gly Thr Gly Thr Gln Ala Gly Asp Phe Met Glu Met Ser 675 680 685 tcc gtc ctg tca acg ttt gcg gag aag cga ggc gcg gat aat ccg ctc 2112 Ser Val Leu Ser Thr Phe Ala Glu Lys Arg Gly Ala Asp Asn Pro Leu 690 695 700 att gta gga gcc ctc aaa gca agt att ggc cac gga gaa gca gcg gcc 2160 Ile Val Gly Ala Leu Lys Ala Ser Ile Gly His Gly Glu Ala Ala Ala 705 710 715 720 ggc gtc tgc gct ctc atc aaa acc ctg atg atg ctt cag tgt cga cgg 2208 Gly Val Cys Ala Leu Ile Lys Thr Leu Met Met Leu Gln Cys Arg Arg 725 730 735 att cca cct caa ccc gac ctt cct ggg cct atc aac cat cga ttc cct 2256 Ile Pro Pro Gln Pro Asp Leu Pro Gly Pro Ile Asn His Arg Phe Pro 740 745 750 gat ctt gca gcc cgc aat gtg tac att gcg gcc cgc aac ttg aag ttg 2304 Asp Leu Ala Ala Arg Asn Val Tyr Ile Ala Ala Arg Asn Leu Lys Leu 755 760 765 gag gcc agc ccg atg gcc aaa ggg gtt ctt cgg atg ttt ctg aac agc 2352 Glu Ala Ser Pro Met Ala Lys Gly Val Leu Arg Met Phe Leu Asn Ser 770 775 780 ttc gat gct tcg ggt gga aat tcg tgt ttg ctg ctt gaa gaa gct ccg 2400 Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Leu Leu Glu Glu Ala Pro 785 790 795 800 ccg cgg gcc gtc aag gac gaa gac gct cga agt cat cat gtt gtg acc 2448 Pro Arg Ala Val Lys Asp Glu Asp Ala Arg Ser His His Val Val Thr 805 810 815 ctt tca gcc cgc tct cag aag tca ctc atc gga atc aaa gag aag tac 2496 Leu Ser Ala Arg Ser Gln Lys Ser Leu Ile Gly Ile Lys Glu Lys Tyr 820 825 830 ctg gcc cat ctg agt caa aat ccg ggc atc aag ctg gcg gac ctg gca 2544 Leu Ala His Leu Ser Gln Asn Pro Gly Ile Lys Leu Ala Asp Leu Ala 835 840 845 tac tcg aca act gct cgg cga atg cat gga ctg ttg cgg tat gcc atc 2592 Tyr Ser Thr Thr Ala Arg Arg Met His Gly Leu Leu Arg Tyr Ala Ile 850 855 860 gcc gca tcc tcc gtt gac gag gtc atg aac tct ctg gag acg gat ctc 2640 Ala Ala Ser Ser Val Asp Glu Val Met Asn Ser Leu Glu Thr Asp Leu 865 870 875 880 gcc cag ggg aaa aca cct cgt cag cct ccg gta gcg ccg agt ata gtt 2688 Ala Gln Gly Lys Thr Pro Arg Gln Pro Pro Val Ala Pro Ser Ile Val 885 890 895 ttc att ttt aca ggc cag ggc gca cat tac ctc ggt atg ggc tcg gaa 2736 Phe Ile Phe Thr Gly Gln Gly Ala His Tyr Leu Gly Met Gly Ser Glu 900 905 910 ctg tgg aag aca tct gcc atg ttc cgc aac acg ctt caa aag tac cag 2784 Leu Trp Lys Thr Ser Ala Met Phe Arg Asn Thr Leu Gln Lys Tyr Gln 915 920 925 acg atg gcc agt gcc gaa ggc ctc ccc tac ttc ctc gat ctc atc gta 2832 Thr Met Ala Ser Ala Glu Gly Leu Pro Tyr Phe Leu Asp Leu Ile Val 930 935 940 gga aac agc acg tcc acg caa cag tca ggg ccg gat act gta cag gta 2880 Gly Asn Ser Thr Ser Thr Gln Gln Ser Gly Pro Asp Thr Val Gln Val 945 950 955 960 cag ctg gcc atg gtc agc ttg gaa cta gcc ctc gct gag ctt tgg cgt 2928 Gln Leu Ala Met Val Ser Leu Glu Leu Ala Leu Ala Glu Leu Trp Arg 965 970 975 tcc tgg ggc atc cag cct gcc atg gtc ttg ggc cac agc cta ggc gaa 2976 Ser Trp Gly Ile Gln Pro Ala Met Val Leu Gly His Ser Leu Gly Glu 980 985 990 tac gcc gcc ctg tgc gtg gcc gga gtg ctc tcg gtg agc gat gct ctg 3024 Tyr Ala Ala Leu Cys Val Ala Gly Val Leu Ser Val Ser Asp Ala Leu 995 1000 1005 tac ctc gtg tac agg cga gct caa atc atg act gag gcc ctg act 3069 Tyr Leu Val Tyr Arg Arg Ala Gln Ile Met Thr Glu Ala Leu Thr 1010 1015 1020 gct agc gag tac ggc atg ttg gcc gtc aat cta agc gtc tgt gac 3114 Ala Ser Glu Tyr Gly Met Leu Ala Val Asn Leu Ser Val Cys Asp 1025 1030 1035 acg cgg gag gtg ctg tcg tct ggc cag cat gcc tca tgt gcc gtg 3159 Thr Arg Glu Val Leu Ser Ser Gly Gln His Ala Ser Cys Ala Val 1040 1045 1050 gct tgc atc aat gcc ccg aag atg acg gtg gtg agc ggt ccg ctg 3204 Ala Cys Ile Asn Ala Pro Lys Met Thr Val Val Ser Gly Pro Leu 1055 1060 1065 ccg aag ctt gaa gag ctc cag aat caa ctc aag tcg gac ggc act 3249 Pro Lys Leu Glu Glu Leu Gln Asn Gln Leu Lys Ser Asp Gly Thr 1070 1075 1080 cga tgt acg cct ctt tct gtt ccc tac ggc ttt cac tcg agt caa 3294 Arg Cys Thr Pro Leu Ser Val Pro Tyr Gly Phe His Ser Ser Gln 1085 1090 1095 ctt gac ccc atc ctg gac cag ttc gaa gct gcc tgc caa ggc gtc 3339 Leu Asp Pro Ile Leu Asp Gln Phe Glu Ala Ala Cys Gln Gly Val 1100 1105 1110 acc ttc tct gca ccg aaa gtc ccc gtg gtc tct acg ctc ttg gct 3384 Thr Phe Ser Ala Pro Lys Val Pro Val Val Ser Thr Leu Leu Ala 1115 1120 1125 act gtg gtc cga gaa gaa ggg act ttc tct ccg ggg tat ctg gcc 3429 Thr Val Val Arg Glu Glu Gly Thr Phe Ser Pro Gly Tyr Leu Ala 1130 1135 1140 cgg cag gcc cgc gaa cca gtc gac ttt gtc gga gct ttg ggc atg 3474 Arg Gln Ala Arg Glu Pro Val Asp Phe Val Gly Ala Leu Gly Met 1145 1150 1155 gtg cag gag cag agt ctt gcc tcc ctg gtg ttt ctc gaa gtt gga 3519 Val Gln Glu Gln Ser Leu Ala Ser Leu Val Phe Leu Glu Val Gly 1160 1165 1170 cct gaa cct gta tgt tcc ggt ctt gtg aac gcc acg cta agt gcc 3564 Pro Glu Pro Val Cys Ser Gly Leu Val Asn Ala Thr Leu Ser Ala 1175 1180 1185 ggg gag acc aag gca cgc tgc ttt gct tcg atg cat cgg ggt cat 3609 Gly Glu Thr Lys Ala Arg Cys Phe Ala Ser Met His Arg Gly His 1190 1195 1200 gaa aac tgg gcg tcg ata tca tca agc ttg aga gat ctc tac atg 3654 Glu Asn Trp Ala Ser Ile Ser Ser Ser Leu Arg Asp Leu Tyr Met 1205 1210 1215 gcg ggt gct ccc atc gac tgg cca gcc ttc cac cac gac ttc aag 3699 Ala Gly Ala Pro Ile Asp Trp Pro Ala Phe His His Asp Phe Lys 1220 1225 1230 tcg tcc gtc tcc ctt ctt gac ctt ccc aag tac tct ttc gac gag 3744 Ser Ser Val Ser Leu Leu Asp Leu Pro Lys Tyr Ser Phe Asp Glu 1235 1240 1245 aag gag ttc tgg gcg tca ttc cct aac aga gac atg cag ggc acg 3789 Lys Glu Phe Trp Ala Ser Phe Pro Asn Arg Asp Met Gln Gly Thr 1250 1255 1260 gga gag gtc gag ccc aag caa agc caa ccg ccc gtc atc gtt ccg 3834 Gly Glu Val Glu Pro Lys Gln Ser Gln Pro Pro Val Ile Val Pro 1265 1270 1275 tct gtg caa gga tac tgc acg acg act ctg cag cga atc gta aaa 3879 Ser Val Gln Gly Tyr Cys Thr Thr Thr Leu Gln Arg Ile Val Lys 1280 1285 1290 gaa acc gac cag ccg gac ggg cta tcg gtc acg ttt aca tcc gac 3924 Glu Thr Asp Gln Pro Asp Gly Leu Ser Val Thr Phe Thr Ser Asp 1295 1300 1305 ctg gca gaa cag cac cta cgt gcg gct gta cga ggt cat gcc gtg 3969 Leu Ala Glu Gln His Leu Arg Ala Ala Val Arg Gly His Ala Val 1310 1315 1320 gcc gac ata gaa atc tgt tcc agc agc ctg ctc ctg gac atg gca 4014 Ala Asp Ile Glu Ile Cys Ser Ser Ser Leu Leu Leu Asp Met Ala 1325 1330 1335 ctt tct gca gcc caa tat gcc tat ctg aaa cat tcc ccc ggc cag 4059 Leu Ser Ala Ala Gln Tyr Ala Tyr Leu Lys His Ser Pro Gly Gln 1340 1345 1350 aag atg cct gtt cca ttg acc gtc cgc aac tgc ttc ttc cac cgg 4104 Lys Met Pro Val Pro Leu Thr Val Arg Asn Cys Phe Phe His Arg 1355 1360 1365 gct gtc gtc ttg acc gag gaa gcg cag acc gtg gaa gtc acc gtc 4149 Ala Val Val Leu Thr Glu Glu Ala Gln Thr Val Glu Val Thr Val 1370 1375 1380 aca ttc agg tcc tcg acc aag act gcg gat att cag tac tac tgc 4194 Thr Phe Arg Ser Ser Thr Lys Thr Ala Asp Ile Gln Tyr Tyr Cys 1385 1390 1395 cga act tcc gac gag tac tac gag ttc gga tcc tgc cag gtg acg 4239 Arg Thr Ser Asp Glu Tyr Tyr Glu Phe Gly Ser Cys Gln Val Thr 1400 1405 1410 ttg gaa gca cca aga aaa cca gac cag gct gga ttt ctg gtt cgg 4284 Leu Glu Ala Pro Arg Lys Pro Asp Gln Ala Gly Phe Leu Val Arg 1415 1420 1425 tcc cgt att gct gca ctc aag gag tcg gca agt cac cgg cta ggc 4329 Ser Arg Ile Ala Ala Leu Lys Glu Ser Ala Ser His Arg Leu Gly 1430 1435 1440 aag cac gca gtt tac cgg ttg ttt gac aac att gtg cgg tat tca 4374 Lys His Ala Val Tyr Arg Leu Phe Asp Asn Ile Val Arg Tyr Ser 1445 1450 1455 gag caa tac cag ggg cta aag aac gtc cat ctt tcg gaa gac atg 4419 Glu Gln Tyr Gln Gly Leu Lys Asn Val His Leu Ser Glu Asp Met 1460 1465 1470 cgc gac gct gtg gcg gag atc aac atg acg caa gtc cca gcg gca 4464 Arg Asp Ala Val Ala Glu Ile Asn Met Thr Gln Val Pro Ala Ala 1475 1480 1485 ggc ggt cat tat ctt cac cac ccg ttt ttg atg gac tcg att gtt 4509 Gly Gly His Tyr Leu His His Pro Phe Leu Met Asp Ser Ile Val 1490 1495 1500 cat ctt tca gga ttc ttg gtg aac aac ggc ctc cgt tac tcc agc 4554 His Leu Ser Gly Phe Leu Val Asn Asn Gly Leu Arg Tyr Ser Ser 1505 1510 1515 gaa tgg gct tgt ctt tcc acc ggt ttc gag gag ctt cac ctg ctc 4599 Glu Trp Ala Cys Leu Ser Thr Gly Phe Glu Glu Leu His Leu Leu 1520 1525 1530 aag ccg cta gat cct gcc act gta tac acc agc tat act ttt atg 4644 Lys Pro Leu Asp Pro Ala Thr Val Tyr Thr Ser Tyr Thr Phe Met 1535 1540 1545 gaa gat tcc ccg acg acg agc aat gtc att ggc gat gtg tac gtc 4689 Glu Asp Ser Pro Thr Thr Ser Asn Val Ile Gly Asp Val Tyr Val 1550 1555 1560 tac gat ggg gca gag tta gtc tcc gtg gtg aca gga ttg cag ttt 4734 Tyr Asp Gly Ala Glu Leu Val Ser Val Val Thr Gly Leu Gln Phe 1565 1570 1575 caa aag atg aag agg aca gca ctc act cat ctg ctg agt ccc gcg 4779 Gln Lys Met Lys Arg Thr Ala Leu Thr His Leu Leu Ser Pro Ala 1580 1585 1590 acg gcg cgc aac acg gcg gcc aag acg atc cct cat aga ccg acg 4824 Thr Ala Arg Asn Thr Ala Ala Lys Thr Ile Pro His Arg Pro Thr 1595 1600 1605 acg gcc ccg gcg aag gcg ctt tct gac caa cag ccc atc act acc 4869 Thr Ala Pro Ala Lys Ala Leu Ser Asp Gln Gln Pro Ile Thr Thr 1610 1615 1620 att caa gcc gaa gca gct gtc ccg cag gct agt act cct tcg acc 4914 Ile Gln Ala Glu Ala Ala Val Pro Gln Ala Ser Thr Pro Ser Thr 1625 1630 1635 gcg gca agt gtc aat ggt ggt gag ggg gag aag ttt gac ctg gtg 4959 Ala Ala Ser Val Asn Gly Gly Glu Gly Glu Lys Phe Asp Leu Val 1640 1645 1650 gaa acg ctg ttt tcc atc atc gca cgc gag gtc ggc gtc gac tcg 5004 Glu Thr Leu Phe Ser Ile Ile Ala Arg Glu Val Gly Val Asp Ser 1655 1660 1665 agc gat ttg aag ggc gac gtg aac ctg gcg aat ctg ggc ata gac 5049 Ser Asp Leu Lys Gly Asp Val Asn Leu Ala Asn Leu Gly Ile Asp 1670 1675 1680 tcc ctc atg gcc atc aca atc atc tcg gtc atg cag cag gaa aca 5094 Ser Leu Met Ala Ile Thr Ile Ile Ser Val Met Gln Gln Glu Thr 1685 1690 1695 gga att gag ttg ccc ggg acg ttt ttc ctc gac aat tcc acg acg 5139 Gly Ile Glu Leu Pro Gly Thr Phe Phe Leu Asp Asn Ser Thr Thr 1700 1705 1710 acg gca gta atc gcg gca gtg gga tag 5166 Thr Ala Val Ile Ala Ala Val Gly 1715 1720 <210> 10 <211> 1721 <212> PRT <213> Metarhizium rileyi <400> 10 Met Lys Ile Arg Ala Thr Asn Phe Leu Leu Phe Gly Asp Gln Thr Val 1 5 10 15 Glu Lys Leu Pro Ala Ile Arg Gln Leu Val Gly His Ala Ala Ser Ser 20 25 30 Ala Leu Leu Gln Arg Phe Leu Arg Gln Val Cys Asp Ala Val Gln Leu 35 40 45 Glu Val Ala Lys Leu Pro Met His Ser Glu Gln Arg Ser Asn Ile Asp 50 55 60 Lys Phe Asp Ser Ile Ile Arg Leu Ala Glu Asn Asn Ala Arg Leu Asp 65 70 75 80 Glu Pro Asn Glu Ile Val Ala Thr Val Leu Met Asn Ile Ala Arg Ile 85 90 95 Gly Glu Leu Ile Leu Tyr Ala Glu Glu Asp Pro Thr Val Leu Val Ser 100 105 110 Lys Gly Asn Arg Asn Cys Ile Leu Gly Phe Cys Thr Gly Glu Val Ala 115 120 125 Ala Ala Ala Ala Thr Ile Ala Gln Asp Ser Asn Glu Leu Val Glu Leu 130 135 140 Gly Val Glu Met Thr His Ile Ile Phe Arg Met Ala Arg Glu Leu Asn 145 150 155 160 His Arg Ser Leu Met Val Asp Arg Thr Asn Gly Pro Trp Ala Lys Thr 165 170 175 Ile Leu Gly Ile Ser Val Glu Arg Val Gln Glu Ile Leu His Glu Phe 180 185 190 His Glu Ser Glu Ser Ile Pro Arg Val Arg Arg Val Cys Val Gly Phe 195 200 205 Ile Ala Glu Gly Trp Leu Thr Leu Phe Gly Pro Pro Thr Thr Leu Gln 210 215 220 Arg Leu Phe Glu Trp Ser Val Glu Leu Glu Asp Ala Pro Gln Ile Ala 225 230 235 240 Thr Asp Ala Arg Gly Gly Val His Met Lys Thr Met Pro Asp Val Asp 245 250 255 Val Asp Trp Ile Leu Gly Ser Ser Val Trp Leu Asp Arg Thr Pro Val 260 265 270 His Thr Ala Thr Ile Phe Ser Pro Tyr Thr Cys Gln Pro Arg Gln Gln 275 280 285 Gln Thr Leu Arg Gly Leu Leu Arg Glu Ile Ile Thr Asp Val Ala Gln 290 295 300 Arg Thr Leu Tyr Leu Ala Lys Ala Met Asn Ala Ala Leu Glu Phe Thr 305 310 315 320 Lys Ala Asp Glu Leu Arg Val Val Met Pro Gly His Thr Ser His Asp 325 330 335 Val Tyr Phe Leu Lys Ser Leu Gln Lys Arg Gly Ile Glu Tyr Ser Val 340 345 350 Met Ser His Gly Asp Ser Pro Pro Ser Ala Pro Gly Arg Gln Gly Ser 355 360 365 Gly Leu Val Ala Val Val Gly Met Ser Gly Arg Phe Pro Gly Ser Gly 370 375 380 Asp Ile Asn Ala Phe Trp Glu Gly Leu Leu Glu Gly Lys Arg Tyr Ile 385 390 395 400 Gln Glu Ile Pro Asn Thr Arg Phe Asp Leu Glu Lys Trp Tyr Asp Ala 405 410 415 Thr Gly Lys Val Lys Asn Ser Thr Ile Ala Arg Thr Gly Ala Phe Leu 420 425 430 Asp Lys Pro Gly Met Phe Asp Asn Arg Leu Phe Asp Met Ser Pro Arg 435 440 445 Glu Ala Met Gln Thr Asp Val Gln His Arg Leu Leu Met Thr Thr Gly 450 455 460 Tyr Glu Ala Leu Glu Met Ser Gly Tyr Ser Pro Asp Gly Thr Pro Ser 465 470 475 480 Thr Asp Thr Ser Arg Ile Ala Ser Tyr Phe Gly Gln Thr Ser Asp Asp 485 490 495 Trp Arg Glu Val Val Val His Gln Gly Val Asp Ile Tyr Phe Ala Thr 500 505 510 Gly Ser Cys Arg Ala Phe Gly Pro Gly Arg Leu His His His Phe Lys 515 520 525 Trp Gly Gly Pro Ser Tyr Ser Val Asp Ser Ala Cys Ser Ser Ser Ile 530 535 540 Ala Ala Val Gly Leu Ala Cys Ser Ala Leu Leu Gly Arg Glu Cys Asp 545 550 555 560 Met Ala Leu Ala Gly Gly Gly Ser Leu Leu Leu Ser Pro Ser Pro Phe 565 570 575 Ser Gly Leu Ser Arg Gly Gly Phe Leu Ser Ala Gln Gly Gly Cys Gln 580 585 590 Thr Phe His Asp Asn Ala Asp Gly Tyr Val Arg Gly Glu Gly Val Gly 595 600 605 Val Val Val Leu Lys Arg Leu Glu Asp Ala Leu Asp Asp Gln Asp Asn 610 615 620 Ile Leu Gly Val Val Arg Gly Ser Gly Arg Asn Tyr Ser Ser Asp Ala 625 630 635 640 Ser Ser Met Met His Pro Ser Ala Asn Ala Gln Lys Gln Leu Tyr Arg 645 650 655 Asp Val Leu Glu Gln Ser Gly Val Glu Ala Asn Ser Ile Ser Tyr Val 660 665 670 Glu Met His Gly Thr Gly Thr Gln Ala Gly Asp Phe Met Glu Met Ser 675 680 685 Ser Val Leu Ser Thr Phe Ala Glu Lys Arg Gly Ala Asp Asn Pro Leu 690 695 700 Ile Val Gly Ala Leu Lys Ala Ser Ile Gly His Gly Glu Ala Ala Ala 705 710 715 720 Gly Val Cys Ala Leu Ile Lys Thr Leu Met Met Leu Gln Cys Arg Arg 725 730 735 Ile Pro Pro Gln Pro Asp Leu Pro Gly Pro Ile Asn His Arg Phe Pro 740 745 750 Asp Leu Ala Ala Arg Asn Val Tyr Ile Ala Ala Arg Asn Leu Lys Leu 755 760 765 Glu Ala Ser Pro Met Ala Lys Gly Val Leu Arg Met Phe Leu Asn Ser 770 775 780 Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Leu Leu Glu Glu Ala Pro 785 790 795 800 Pro Arg Ala Val Lys Asp Glu Asp Ala Arg Ser His His Val Val Thr 805 810 815 Leu Ser Ala Arg Ser Gln Lys Ser Leu Ile Gly Ile Lys Glu Lys Tyr 820 825 830 Leu Ala His Leu Ser Gln Asn Pro Gly Ile Lys Leu Ala Asp Leu Ala 835 840 845 Tyr Ser Thr Thr Ala Arg Arg Met His Gly Leu Leu Arg Tyr Ala Ile 850 855 860 Ala Ala Ser Ser Val Asp Glu Val Met Asn Ser Leu Glu Thr Asp Leu 865 870 875 880 Ala Gln Gly Lys Thr Pro Arg Gln Pro Pro Val Ala Pro Ser Ile Val 885 890 895 Phe Ile Phe Thr Gly Gln Gly Ala His Tyr Leu Gly Met Gly Ser Glu 900 905 910 Leu Trp Lys Thr Ser Ala Met Phe Arg Asn Thr Leu Gln Lys Tyr Gln 915 920 925 Thr Met Ala Ser Ala Glu Gly Leu Pro Tyr Phe Leu Asp Leu Ile Val 930 935 940 Gly Asn Ser Thr Ser Thr Gln Gln Ser Gly Pro Asp Thr Val Gln Val 945 950 955 960 Gln Leu Ala Met Val Ser Leu Glu Leu Ala Leu Ala Glu Leu Trp Arg 965 970 975 Ser Trp Gly Ile Gln Pro Ala Met Val Leu Gly His Ser Leu Gly Glu 980 985 990 Tyr Ala Ala Leu Cys Val Ala Gly Val Leu Ser Val Ser Asp Ala Leu 995 1000 1005 Tyr Leu Val Tyr Arg Arg Ala Gln Ile Met Thr Glu Ala Leu Thr 1010 1015 1020 Ala Ser Glu Tyr Gly Met Leu Ala Val Asn Leu Ser Val Cys Asp 1025 1030 1035 Thr Arg Glu Val Leu Ser Ser Gly Gln His Ala Ser Cys Ala Val 1040 1045 1050 Ala Cys Ile Asn Ala Pro Lys Met Thr Val Val Ser Gly Pro Leu 1055 1060 1065 Pro Lys Leu Glu Glu Leu Gln Asn Gln Leu Lys Ser Asp Gly Thr 1070 1075 1080 Arg Cys Thr Pro Leu Ser Val Pro Tyr Gly Phe His Ser Ser Gln 1085 1090 1095 Leu Asp Pro Ile Leu Asp Gln Phe Glu Ala Ala Cys Gln Gly Val 1100 1105 1110 Thr Phe Ser Ala Pro Lys Val Pro Val Val Ser Thr Leu Leu Ala 1115 1120 1125 Thr Val Val Arg Glu Glu Gly Thr Phe Ser Pro Gly Tyr Leu Ala 1130 1135 1140 Arg Gln Ala Arg Glu Pro Val Asp Phe Val Gly Ala Leu Gly Met 1145 1150 1155 Val Gln Glu Gln Ser Leu Ala Ser Leu Val Phe Leu Glu Val Gly 1160 1165 1170 Pro Glu Pro Val Cys Ser Gly Leu Val Asn Ala Thr Leu Ser Ala 1175 1180 1185 Gly Glu Thr Lys Ala Arg Cys Phe Ala Ser Met His Arg Gly His 1190 1195 1200 Glu Asn Trp Ala Ser Ile Ser Ser Ser Leu Arg Asp Leu Tyr Met 1205 1210 1215 Ala Gly Ala Pro Ile Asp Trp Pro Ala Phe His His Asp Phe Lys 1220 1225 1230 Ser Ser Val Ser Leu Leu Asp Leu Pro Lys Tyr Ser Phe Asp Glu 1235 1240 1245 Lys Glu Phe Trp Ala Ser Phe Pro Asn Arg Asp Met Gln Gly Thr 1250 1255 1260 Gly Glu Val Glu Pro Lys Gln Ser Gln Pro Pro Val Ile Val Pro 1265 1270 1275 Ser Val Gln Gly Tyr Cys Thr Thr Thr Leu Gln Arg Ile Val Lys 1280 1285 1290 Glu Thr Asp Gln Pro Asp Gly Leu Ser Val Thr Phe Thr Ser Asp 1295 1300 1305 Leu Ala Glu Gln His Leu Arg Ala Ala Val Arg Gly His Ala Val 1310 1315 1320 Ala Asp Ile Glu Ile Cys Ser Ser Ser Leu Leu Leu Asp Met Ala 1325 1330 1335 Leu Ser Ala Ala Gln Tyr Ala Tyr Leu Lys His Ser Pro Gly Gln 1340 1345 1350 Lys Met Pro Val Pro Leu Thr Val Arg Asn Cys Phe Phe His Arg 1355 1360 1365 Ala Val Val Leu Thr Glu Glu Ala Gln Thr Val Glu Val Thr Val 1370 1375 1380 Thr Phe Arg Ser Ser Thr Lys Thr Ala Asp Ile Gln Tyr Tyr Cys 1385 1390 1395 Arg Thr Ser Asp Glu Tyr Tyr Glu Phe Gly Ser Cys Gln Val Thr 1400 1405 1410 Leu Glu Ala Pro Arg Lys Pro Asp Gln Ala Gly Phe Leu Val Arg 1415 1420 1425 Ser Arg Ile Ala Ala Leu Lys Glu Ser Ala Ser His Arg Leu Gly 1430 1435 1440 Lys His Ala Val Tyr Arg Leu Phe Asp Asn Ile Val Arg Tyr Ser 1445 1450 1455 Glu Gln Tyr Gln Gly Leu Lys Asn Val His Leu Ser Glu Asp Met 1460 1465 1470 Arg Asp Ala Val Ala Glu Ile Asn Met Thr Gln Val Pro Ala Ala 1475 1480 1485 Gly Gly His Tyr Leu His His Pro Phe Leu Met Asp Ser Ile Val 1490 1495 1500 His Leu Ser Gly Phe Leu Val Asn Asn Gly Leu Arg Tyr Ser Ser 1505 1510 1515 Glu Trp Ala Cys Leu Ser Thr Gly Phe Glu Glu Leu His Leu Leu 1520 1525 1530 Lys Pro Leu Asp Pro Ala Thr Val Tyr Thr Ser Tyr Thr Phe Met 1535 1540 1545 Glu Asp Ser Pro Thr Thr Ser Asn Val Ile Gly Asp Val Tyr Val 1550 1555 1560 Tyr Asp Gly Ala Glu Leu Val Ser Val Val Thr Gly Leu Gln Phe 1565 1570 1575 Gln Lys Met Lys Arg Thr Ala Leu Thr His Leu Leu Ser Pro Ala 1580 1585 1590 Thr Ala Arg Asn Thr Ala Ala Lys Thr Ile Pro His Arg Pro Thr 1595 1600 1605 Thr Ala Pro Ala Lys Ala Leu Ser Asp Gln Gln Pro Ile Thr Thr 1610 1615 1620 Ile Gln Ala Glu Ala Ala Val Pro Gln Ala Ser Thr Pro Ser Thr 1625 1630 1635 Ala Ala Ser Val Asn Gly Gly Glu Gly Glu Lys Phe Asp Leu Val 1640 1645 1650 Glu Thr Leu Phe Ser Ile Ile Ala Arg Glu Val Gly Val Asp Ser 1655 1660 1665 Ser Asp Leu Lys Gly Asp Val Asn Leu Ala Asn Leu Gly Ile Asp 1670 1675 1680 Ser Leu Met Ala Ile Thr Ile Ile Ser Val Met Gln Gln Glu Thr 1685 1690 1695 Gly Ile Glu Leu Pro Gly Thr Phe Phe Leu Asp Asn Ser Thr Thr 1700 1705 1710 Thr Ala Val Ile Ala Ala Val Gly 1715 1720 <210> 11 <211> 1149 <212> DNA <213> Metarhizium rileyi <220> <221> CDS <222> (1)..(1149) <400> 11 atg gct gtc act gtg tgg caa gat gcg ctc gag atc atc gct cag gag 48 Met Ala Val Thr Val Trp Gln Asp Ala Leu Glu Ile Ile Ala Gln Glu 1 5 10 15 agc ggg ctg gaa ccc gca gag atc atc gag acg gac gac atg gag ttc 96 Ser Gly Leu Glu Pro Ala Glu Ile Ile Glu Thr Asp Asp Met Glu Phe 20 25 30 gcc aga ctt ggc atc aat cat att ctc gcc acg gcc atc ttg tcg cac 144 Ala Arg Leu Gly Ile Asn His Ile Leu Ala Thr Ala Ile Leu Ser His 35 40 45 ctc aga ggg cct cgc gga gag cct ctc cca cga gac att ttt gat cag 192 Leu Arg Gly Pro Arg Gly Glu Pro Leu Pro Arg Asp Ile Phe Asp Gln 50 55 60 aag cgc aca gtt gga gct ttc cgg cgt ttc tac gag acg tct att cac 240 Lys Arg Thr Val Gly Ala Phe Arg Arg Phe Tyr Glu Thr Ser Ile His 65 70 75 80 ctt gag act tct ccc atc acc ccc atc ctc gca ccc aag cga gct cag 288 Leu Glu Thr Ser Pro Ile Thr Pro Ile Leu Ala Pro Lys Arg Ala Gln 85 90 95 ctg aag cgt gag aag tcg ttt act gtt ccg ctc tcc atc gtc ttg cag 336 Leu Lys Arg Glu Lys Ser Phe Thr Val Pro Leu Ser Ile Val Leu Gln 100 105 110 aat agc ccg gct tcg agc cgg cac acc gta ttc ctc ctc cca gac ggc 384 Asn Ser Pro Ala Ser Ser Arg His Thr Val Phe Leu Leu Pro Asp Gly 115 120 125 agc ggc tct gcc atg gcg tac gca aac ctg cca cca gtc cac cca acc 432 Ser Gly Ser Ala Met Ala Tyr Ala Asn Leu Pro Pro Val His Pro Thr 130 135 140 gtc tgt gtc gtt ggg atg aac agt ccc tac ctc cgt gac gcc aac tca 480 Val Cys Val Val Gly Met Asn Ser Pro Tyr Leu Arg Asp Ala Asn Ser 145 150 155 160 tat cgc tgc tct gtc gag aat ctg gcg tcg caa tgg gtc cag gaa atc 528 Tyr Arg Cys Ser Val Glu Asn Leu Ala Ser Gln Trp Val Gln Glu Ile 165 170 175 tat cgc cgc cag cca cgc gga cct tat atc gtc ggt gga tgg tcg gcg 576 Tyr Arg Arg Gln Pro Arg Gly Pro Tyr Ile Val Gly Gly Trp Ser Ala 180 185 190 gga ggt tac tac tcg tac gaa gtg gcc caa cgc ctc ctg caa gat ggt 624 Gly Gly Tyr Tyr Ser Tyr Glu Val Ala Gln Arg Leu Leu Gln Asp Gly 195 200 205 cac gtc gtg gac aag ctg att ctg ata gac tcg cct tgc cgc act gtc 672 His Val Val Asp Lys Leu Ile Leu Ile Asp Ser Pro Cys Arg Thr Val 210 215 220 ttc gag tct ctc tcg atg gaa gtc gtc aac tat ctc tca aag cat aac 720 Phe Glu Ser Leu Ser Met Glu Val Val Asn Tyr Leu Ser Lys His Asn 225 230 235 240 cta atg ggc aac tgg ggc tcc caa gga ctt ccg gac tgg cta gtc cag 768 Leu Met Gly Asn Trp Gly Ser Gln Gly Leu Pro Asp Trp Leu Val Gln 245 250 255 cat ttc cgc tcc acg ctc gcc gcc gtg ggc aag tat cgt cca agg cca 816 His Phe Arg Ser Thr Leu Ala Ala Val Gly Lys Tyr Arg Pro Arg Pro 260 265 270 ctg cat tcg gtt ggg gaa atg gag acg tac atc atc tgg agt cgc gat 864 Leu His Ser Val Gly Glu Met Glu Thr Tyr Ile Ile Trp Ser Arg Asp 275 280 285 ggt gtg ctg gaa cac gat gct ttg gtc gag tct ggt ctc gac atg agc 912 Gly Val Leu Glu His Asp Ala Leu Val Glu Ser Gly Leu Asp Met Ser 290 295 300 atc aag gta tcc agg ttt ctg ctc gaa ggc aag gac gat ctg gga ccc 960 Ile Lys Val Ser Arg Phe Leu Leu Glu Gly Lys Asp Asp Leu Gly Pro 305 310 315 320 aac gga tgg gat gag ctg ctg ccc agc aag gat att gcg att gcc act 1008 Asn Gly Trp Asp Glu Leu Leu Pro Ser Lys Asp Ile Ala Ile Ala Thr 325 330 335 cag tcg ggg acg cat ttc acc atg atc aac aag cct cac gtg gca cag 1056 Gln Ser Gly Thr His Phe Thr Met Ile Asn Lys Pro His Val Ala Gln 340 345 350 atg agc gat ctt tta cgc gat gcg gtg act ggc atc act acc gac aga 1104 Met Ser Asp Leu Leu Arg Asp Ala Val Thr Gly Ile Thr Thr Asp Arg 355 360 365 cta tcg cag tgg cag aga gta aga aag gac gag cag gga aag tag 1149 Leu Ser Gln Trp Gln Arg Val Arg Lys Asp Glu Gln Gly Lys 370 375 380 <210> 12 <211> 382 <212> PRT <213> Metarhizium rileyi <400> 12 Met Ala Val Thr Val Trp Gln Asp Ala Leu Glu Ile Ile Ala Gln Glu 1 5 10 15 Ser Gly Leu Glu Pro Ala Glu Ile Ile Glu Thr Asp Asp Met Glu Phe 20 25 30 Ala Arg Leu Gly Ile Asn His Ile Leu Ala Thr Ala Ile Leu Ser His 35 40 45 Leu Arg Gly Pro Arg Gly Glu Pro Leu Pro Arg Asp Ile Phe Asp Gln 50 55 60 Lys Arg Thr Val Gly Ala Phe Arg Arg Phe Tyr Glu Thr Ser Ile His 65 70 75 80 Leu Glu Thr Ser Pro Ile Thr Pro Ile Leu Ala Pro Lys Arg Ala Gln 85 90 95 Leu Lys Arg Glu Lys Ser Phe Thr Val Pro Leu Ser Ile Val Leu Gln 100 105 110 Asn Ser Pro Ala Ser Ser Arg His Thr Val Phe Leu Leu Pro Asp Gly 115 120 125 Ser Gly Ser Ala Met Ala Tyr Ala Asn Leu Pro Pro Val His Pro Thr 130 135 140 Val Cys Val Val Gly Met Asn Ser Pro Tyr Leu Arg Asp Ala Asn Ser 145 150 155 160 Tyr Arg Cys Ser Val Glu Asn Leu Ala Ser Gln Trp Val Gln Glu Ile 165 170 175 Tyr Arg Arg Gln Pro Arg Gly Pro Tyr Ile Val Gly Gly Trp Ser Ala 180 185 190 Gly Gly Tyr Tyr Ser Tyr Glu Val Ala Gln Arg Leu Leu Gln Asp Gly 195 200 205 His Val Val Asp Lys Leu Ile Leu Ile Asp Ser Pro Cys Arg Thr Val 210 215 220 Phe Glu Ser Leu Ser Met Glu Val Val Asn Tyr Leu Ser Lys His Asn 225 230 235 240 Leu Met Gly Asn Trp Gly Ser Gln Gly Leu Pro Asp Trp Leu Val Gln 245 250 255 His Phe Arg Ser Thr Leu Ala Ala Val Gly Lys Tyr Arg Pro Arg Pro 260 265 270 Leu His Ser Val Gly Glu Met Glu Thr Tyr Ile Ile Trp Ser Arg Asp 275 280 285 Gly Val Leu Glu His Asp Ala Leu Val Glu Ser Gly Leu Asp Met Ser 290 295 300 Ile Lys Val Ser Arg Phe Leu Leu Glu Gly Lys Asp Asp Leu Gly Pro 305 310 315 320 Asn Gly Trp Asp Glu Leu Leu Pro Ser Lys Asp Ile Ala Ile Ala Thr 325 330 335 Gln Ser Gly Thr His Phe Thr Met Ile Asn Lys Pro His Val Ala Gln 340 345 350 Met Ser Asp Leu Leu Arg Asp Ala Val Thr Gly Ile Thr Thr Asp Arg 355 360 365 Leu Ser Gln Trp Gln Arg Val Arg Lys Asp Glu Gln Gly Lys 370 375 380 <210> 13 <211> 7524 <212> DNA <213> Talaromyces islandicus <220> <221> CDS <222> (1)..(7524) <400> 13 atg gcg aca acg aat gaa gtc cgg tgg gct caa gat att gcc att gtt 48 Met Ala Thr Thr Asn Glu Val Arg Trp Ala Gln Asp Ile Ala Ile Val 1 5 10 15 ggc atg tcc tgc cga ttc gcc gat gac gcg gat tca ttc cct cgg ttc 96 Gly Met Ser Cys Arg Phe Ala Asp Asp Ala Asp Ser Phe Pro Arg Phe 20 25 30 tgg gat ttc att tgc aat gga aga tat gcg ttc cac tac cct gga aaa 144 Trp Asp Phe Ile Cys Asn Gly Arg Tyr Ala Phe His Tyr Pro Gly Lys 35 40 45 aaa aca aac aca agt ttg cct cgc ggt gca cat ttc ttc aaa gat gac 192 Lys Thr Asn Thr Ser Leu Pro Arg Gly Ala His Phe Phe Lys Asp Asp 50 55 60 atc gca gag ttc gat gcc aat ttc ttc aac atc tcc aaa gtc gag gcc 240 Ile Ala Glu Phe Asp Ala Asn Phe Phe Asn Ile Ser Lys Val Glu Ala 65 70 75 80 gaa tcg att gat ccg caa cag cgc atg gtg atg gaa aca acg ttc gaa 288 Glu Ser Ile Asp Pro Gln Gln Arg Met Val Met Glu Thr Thr Phe Glu 85 90 95 gcc cta gaa aat gct gga att act ata gac aaa gtg gca gga acc cgc 336 Ala Leu Glu Asn Ala Gly Ile Thr Ile Asp Lys Val Ala Gly Thr Arg 100 105 110 gct ggt gtc tgg atg gcc aat ttt act agc gat tat cgt gag atg cta 384 Ala Gly Val Trp Met Ala Asn Phe Thr Ser Asp Tyr Arg Glu Met Leu 115 120 125 tac cga gat tca gag aca gca ccg atg tat acc ctg tca ggc gcc agc 432 Tyr Arg Asp Ser Glu Thr Ala Pro Met Tyr Thr Leu Ser Gly Ala Ser 130 135 140 aac aca tcc acg tca aac cgt gta tca tgg ttc ttt gat ctc aaa ggc 480 Asn Thr Ser Thr Ser Asn Arg Val Ser Trp Phe Phe Asp Leu Lys Gly 145 150 155 160 cca agc ttt acc ttg aac act gca tgc tct tca agt atg gtg gct acc 528 Pro Ser Phe Thr Leu Asn Thr Ala Cys Ser Ser Ser Met Val Ala Thr 165 170 175 cat cta gct tgc cag agc ctt gct ctg ggt gaa tcc agc agt gcg ata 576 His Leu Ala Cys Gln Ser Leu Ala Leu Gly Glu Ser Ser Ser Ala Ile 180 185 190 gtt ggc ggg aca agt ctc ctc ttg aat cca gac cta ttc ctc ttt ttg 624 Val Gly Gly Thr Ser Leu Leu Leu Asn Pro Asp Leu Phe Leu Phe Leu 195 200 205 tcg aat cag cat ttc tta gca gct gat ggt aaa tct aaa gcc ttt gat 672 Ser Asn Gln His Phe Leu Ala Ala Asp Gly Lys Ser Lys Ala Phe Asp 210 215 220 gcc agt ggt gat gga tac ggc cgg ggt gaa ggc gtt gct gtt gtt gtc 720 Ala Ser Gly Asp Gly Tyr Gly Arg Gly Glu Gly Val Ala Val Val Val 225 230 235 240 tta aag cgt gtt gcg gac gcc atc gct gat ggt gat ccc att cga gca 768 Leu Lys Arg Val Ala Asp Ala Ile Ala Asp Gly Asp Pro Ile Arg Ala 245 250 255 gtg atc cgt ggg act gcc atc aat caa gat gga agg aca aag gga atg 816 Val Ile Arg Gly Thr Ala Ile Asn Gln Asp Gly Arg Thr Lys Gly Met 260 265 270 aca tta cct agt gta gat gct caa gaa caa ttg atc aag gat gcc tat 864 Thr Leu Pro Ser Val Asp Ala Gln Glu Gln Leu Ile Lys Asp Ala Tyr 275 280 285 cgc aat gca gga ctg tcc atg aag gac act cga tat gtc gaa gct cac 912 Arg Asn Ala Gly Leu Ser Met Lys Asp Thr Arg Tyr Val Glu Ala His 290 295 300 gga aca gga act caa gct ggt gac aag tgt gag acg gag gca tta tct 960 Gly Thr Gly Thr Gln Ala Gly Asp Lys Cys Glu Thr Glu Ala Leu Ser 305 310 315 320 cga act ttt agc cca tac cgt act gca tcc gaa cga ctc att ctt ggg 1008 Arg Thr Phe Ser Pro Tyr Arg Thr Ala Ser Glu Arg Leu Ile Leu Gly 325 330 335 tct gtc aag acc aac att ggg cat ttg gag gca tgt gcc ggt tta gcg 1056 Ser Val Lys Thr Asn Ile Gly His Leu Glu Ala Cys Ala Gly Leu Ala 340 345 350 tcc atg ata aaa tgc gtt ggt att ctt gaa gcc gga gtg att cct cca 1104 Ser Met Ile Lys Cys Val Gly Ile Leu Glu Ala Gly Val Ile Pro Pro 355 360 365 aat cca tta tac aaa aaa ggt aac ccg gga ata aaa ttc gac gac tgg 1152 Asn Pro Leu Tyr Lys Lys Gly Asn Pro Gly Ile Lys Phe Asp Asp Trp 370 375 380 aaa ctc cat gta cct act agc tca ata caa tgg ccg acc agt ggc ctg 1200 Lys Leu His Val Pro Thr Ser Ser Ile Gln Trp Pro Thr Ser Gly Leu 385 390 395 400 cgg cgc atc agc acc caa gga ttt ggg tat gga gga acc aat gcg cat 1248 Arg Arg Ile Ser Thr Gln Gly Phe Gly Tyr Gly Gly Thr Asn Ala His 405 410 415 atc atc atg gac gac gct cac aac tat ctg gta tct cgt gac ata act 1296 Ile Ile Met Asp Asp Ala His Asn Tyr Leu Val Ser Arg Asp Ile Thr 420 425 430 gcg ata cac aat aca tgc ctg ctc aat ctg aca aat gga acc act tat 1344 Ala Ile His Asn Thr Cys Leu Leu Asn Leu Thr Asn Gly Thr Thr Tyr 435 440 445 ata gag cat aaa gag gct cct cgg cca agg att ttc cat ttt agt gcc 1392 Ile Glu His Lys Glu Ala Pro Arg Pro Arg Ile Phe His Phe Ser Ala 450 455 460 cag gac aag gac ggg cta ggg agg gta cga gac gcc act tgc cag tat 1440 Gln Asp Lys Asp Gly Leu Gly Arg Val Arg Asp Ala Thr Cys Gln Tyr 465 470 475 480 ctc aag tca ggt gca tta gag gct ggg aaa atg cgc cag aat gaa gat 1488 Leu Lys Ser Gly Ala Leu Glu Ala Gly Lys Met Arg Gln Asn Glu Asp 485 490 495 aaa tac ctt aga gat cta gct tat aca ctg tca gag aga cgt tct cgg 1536 Lys Tyr Leu Arg Asp Leu Ala Tyr Thr Leu Ser Glu Arg Arg Ser Arg 500 505 510 ttg caa tgg cag aca ttt gcg gtg gcc tca tct gtc gaa gga ttg att 1584 Leu Gln Trp Gln Thr Phe Ala Val Ala Ser Ser Val Glu Gly Leu Ile 515 520 525 gaa aca tta cag acc aag cca tgg gcc agt cca gag aca cgc tca gcg 1632 Glu Thr Leu Gln Thr Lys Pro Trp Ala Ser Pro Glu Thr Arg Ser Ala 530 535 540 tca aaa gta cct cgc ata ggc ttc ata ttt act ggt caa ggg gct cag 1680 Ser Lys Val Pro Arg Ile Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln 545 550 555 560 tgg cca cgg atg gga atc gag ctg atg gaa tat gac att ttc cga aaa 1728 Trp Pro Arg Met Gly Ile Glu Leu Met Glu Tyr Asp Ile Phe Arg Lys 565 570 575 agc gtg gaa aga tca gat gtt tac ttg cgc gag gga ttg gac tgc tcc 1776 Ser Val Glu Arg Ser Asp Val Tyr Leu Arg Glu Gly Leu Asp Cys Ser 580 585 590 tgg tct gcc atc gaa gaa ctt gct aaa cct gat tcc tcg tct aac ctg 1824 Trp Ser Ala Ile Glu Glu Leu Ala Lys Pro Asp Ser Ser Ser Asn Leu 595 600 605 ggc gca gcg gaa tac agc caa gca ctc tgt tcc gtt ctt cag att gcc 1872 Gly Ala Ala Glu Tyr Ser Gln Ala Leu Cys Ser Val Leu Gln Ile Ala 610 615 620 cta ata gac ctg ctc gat agc tgg aac atc aga cca agc gca gta gcc 1920 Leu Ile Asp Leu Leu Asp Ser Trp Asn Ile Arg Pro Ser Ala Val Ala 625 630 635 640 ggc cat tct agt gga gaa ata gcg gcg gcc tac tgc ctt ggg gtt ctc 1968 Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Val Leu 645 650 655 tct tgg gag gat gcc cta aaa gta gct tac ttt cga ggg tcg cta tcg 2016 Ser Trp Glu Asp Ala Leu Lys Val Ala Tyr Phe Arg Gly Ser Leu Ser 660 665 670 gca gag atg aag gga aat gac agc tcg ctc aat gga gca atg atg gct 2064 Ala Glu Met Lys Gly Asn Asp Ser Ser Leu Asn Gly Ala Met Met Ala 675 680 685 gtc ggc tct tca cca gcg gat att gaa aag tgg ctc gac aaa gtt act 2112 Val Gly Ser Ser Pro Ala Asp Ile Glu Lys Trp Leu Asp Lys Val Thr 690 695 700 gca ggg gag gtt gta gtt gca tgc gtg aac tcc cct gcc agc att act 2160 Ala Gly Glu Val Val Val Ala Cys Val Asn Ser Pro Ala Ser Ile Thr 705 710 715 720 ttg tct ggt gat gct gcc ggt atc aac gaa ttg gag tcc atg ttg aaa 2208 Leu Ser Gly Asp Ala Ala Gly Ile Asn Glu Leu Glu Ser Met Leu Lys 725 730 735 gaa gca ggg ata ttt gca agg aaa cta aag gtg gac acg gca tac cac 2256 Glu Ala Gly Ile Phe Ala Arg Lys Leu Lys Val Asp Thr Ala Tyr His 740 745 750 tct cca cat atg cag acc att gcc ggc caa tac ttt gaa gcc att gcc 2304 Ser Pro His Met Gln Thr Ile Ala Gly Gln Tyr Phe Glu Ala Ile Ala 755 760 765 gac att tct ata tta ccg gtg agg aat ggg tgc caa atg cat tct agc 2352 Asp Ile Ser Ile Leu Pro Val Arg Asn Gly Cys Gln Met His Ser Ser 770 775 780 gtg cga ggt ggc tac att gat ccg aat gaa ctc ggt gcc gcg aat tgg 2400 Val Arg Gly Gly Tyr Ile Asp Pro Asn Glu Leu Gly Ala Ala Asn Trp 785 790 795 800 gta cgg aat ttg gta tcg act gtt cag ttt gct gat gct gtt cac gat 2448 Val Arg Asn Leu Val Ser Thr Val Gln Phe Ala Asp Ala Val His Asp 805 810 815 ctt ctt cga cca tta gtt tat ggt gag cgt gca gcg cac aat gct gtg 2496 Leu Leu Arg Pro Leu Val Tyr Gly Glu Arg Ala Ala His Asn Ala Val 820 825 830 gac att ctg gtt gaa gtc ggg ccg cat tct gct tta cag gga ccg gta 2544 Asp Ile Leu Val Glu Val Gly Pro His Ser Ala Leu Gln Gly Pro Val 835 840 845 aac cag aca atg aag gcc cat gga atc aat agt atc aat tat tgt aca 2592 Asn Gln Thr Met Lys Ala His Gly Ile Asn Ser Ile Asn Tyr Cys Thr 850 855 860 atg ctc tca cgt ggg aaa aat gcc atc aat acg gct cta tca tgt gcc 2640 Met Leu Ser Arg Gly Lys Asn Ala Ile Asn Thr Ala Leu Ser Cys Ala 865 870 875 880 gcc act ttg tat gtg gaa ggc ctc gca gtc gat ctt cgc agg gcc aac 2688 Ala Thr Leu Tyr Val Glu Gly Leu Ala Val Asp Leu Arg Arg Ala Asn 885 890 895 cag gat gaa agc ttt gcg gtt gag cct atc ttc gat atg cct tcg tac 2736 Gln Asp Glu Ser Phe Ala Val Glu Pro Ile Phe Asp Met Pro Ser Tyr 900 905 910 cct tgg aac cac tca att cga tat tgg gcc gaa tct cgt gtg gaa aag 2784 Pro Trp Asn His Ser Ile Arg Tyr Trp Ala Glu Ser Arg Val Glu Lys 915 920 925 gaa tat cga cag cgg aag tat ccc cgt aca cct tta ctc ggt gct cct 2832 Glu Tyr Arg Gln Arg Lys Tyr Pro Arg Thr Pro Leu Leu Gly Ala Pro 930 935 940 tgt ccg tct atg aat gcg ggt gag aag gtc tgg aga ggc ttt att cga 2880 Cys Pro Ser Met Asn Ala Gly Glu Lys Val Trp Arg Gly Phe Ile Arg 945 950 955 960 cct agt gag gag ccg tgg gtt cgc gat cat gtt att caa ggc tcc att 2928 Pro Ser Glu Glu Pro Trp Val Arg Asp His Val Ile Gln Gly Ser Ile 965 970 975 tta tat cca gct gcc gga ttc tta gca atg gcc att gaa gct gca agg 2976 Leu Tyr Pro Ala Ala Gly Phe Leu Ala Met Ala Ile Glu Ala Ala Arg 980 985 990 cag ggg act gag acg gga agg tca att gac ggt ttc aga ctt cgt gat 3024 Gln Gly Thr Glu Thr Gly Arg Ser Ile Asp Gly Phe Arg Leu Arg Asp 995 1000 1005 gtc cag att aat gct gcc ctg gtt att gag gaa aat gtc gaa cca 3069 Val Gln Ile Asn Ala Ala Leu Val Ile Glu Glu Asn Val Glu Pro 1010 1015 1020 gaa gtg ata ttg agg ttg cag cca cac aga atg ggc acc ctg gat 3114 Glu Val Ile Leu Arg Leu Gln Pro His Arg Met Gly Thr Leu Asp 1025 1030 1035 gcg ggt tca gta tcc tgg cag gaa ttc act gtt tca tct tca aca 3159 Ala Gly Ser Val Ser Trp Gln Glu Phe Thr Val Ser Ser Ser Thr 1040 1045 1050 gat gga aca gat cta cga caa aat tgt tca gga ctg ctt gcc atc 3204 Asp Gly Thr Asp Leu Arg Gln Asn Cys Ser Gly Leu Leu Ala Ile 1055 1060 1065 gat tat gaa ccc gct gag gga tct tct atg cac atc gag aaa atc 3249 Asp Tyr Glu Pro Ala Glu Gly Ser Ser Met His Ile Glu Lys Ile 1070 1075 1080 aag gag gtc gag act atc aaa gga aaa ttg gtc aag gcg aag gaa 3294 Lys Glu Val Glu Thr Ile Lys Gly Lys Leu Val Lys Ala Lys Glu 1085 1090 1095 cag tgt aga gct gct atc aat gtc gat gaa ttt tat gcc cat ctt 3339 Gln Cys Arg Ala Ala Ile Asn Val Asp Glu Phe Tyr Ala His Leu 1100 1105 1110 gac acc gtt ggc cta aca tat ggc gag act ttc gct aac ctg acc 3384 Asp Thr Val Gly Leu Thr Tyr Gly Glu Thr Phe Ala Asn Leu Thr 1115 1120 1125 gag gtt cac acc aat gca gca aca gga gaa tgt aca ggt cgt ttg 3429 Glu Val His Thr Asn Ala Ala Thr Gly Glu Cys Thr Gly Arg Leu 1130 1135 1140 ctc gta cct gat gtt gag tca gcc atc cct ccg cat atg agg gaa 3474 Leu Val Pro Asp Val Glu Ser Ala Ile Pro Pro His Met Arg Glu 1145 1150 1155 cgg cca cac atc ata cac cca aca acc tta gat gcc att ttt cac 3519 Arg Pro His Ile Ile His Pro Thr Thr Leu Asp Ala Ile Phe His 1160 1165 1170 tta gca ttt gct gca atc agc gaa cat cca ttc tca ctc aag agt 3564 Leu Ala Phe Ala Ala Ile Ser Glu His Pro Phe Ser Leu Lys Ser 1175 1180 1185 gcc atg gtt cct att tcg ata aca gag gta gtc att tca aac gaa 3609 Ala Met Val Pro Ile Ser Ile Thr Glu Val Val Ile Ser Asn Glu 1190 1195 1200 gtg ccc cac aga aag gga tcc cag ctc gaa gga ttc gct cag tct 3654 Val Pro His Arg Lys Gly Ser Gln Leu Glu Gly Phe Ala Gln Ser 1205 1210 1215 tct cgg ttt gga ttt cga gaa ttg gtc acc aat atc aac att ttt 3699 Ser Arg Phe Gly Phe Arg Glu Leu Val Thr Asn Ile Asn Ile Phe 1220 1225 1230 gac gag caa ctc aca gat gcc gtt gtc aag atc agc gga ttt aga 3744 Asp Glu Gln Leu Thr Asp Ala Val Val Lys Ile Ser Gly Phe Arg 1235 1240 1245 tgt gca gat gtg tct ggt tca agc caa agt acg agc agc ggt gag 3789 Cys Ala Asp Val Ser Gly Ser Ser Gln Ser Thr Ser Ser Gly Glu 1250 1255 1260 gca gcc aag cca att acg ttt aaa gaa atc cat cga cct gct ctg 3834 Ala Ala Lys Pro Ile Thr Phe Lys Glu Ile His Arg Pro Ala Leu 1265 1270 1275 gag ctt ctt gac tat gag gat ctc caa aga gct gtc aac gca aat 3879 Glu Leu Leu Asp Tyr Glu Asp Leu Gln Arg Ala Val Asn Ala Asn 1280 1285 1290 gcg gac gaa att gct agt gga ata ttt gaa cag gat acc tct ctc 3924 Ala Asp Glu Ile Ala Ser Gly Ile Phe Glu Gln Asp Thr Ser Leu 1295 1300 1305 gac aaa tcc gcc ctc gcc att gtt aag cgg aca ctg tct aac gtt 3969 Asp Lys Ser Ala Leu Ala Ile Val Lys Arg Thr Leu Ser Asn Val 1310 1315 1320 cca cgg tca tct gta cat aaa gat ttg ctc ggt ttc tac gat tgg 4014 Pro Arg Ser Ser Val His Lys Asp Leu Leu Gly Phe Tyr Asp Trp 1325 1330 1335 atg cag agg caa gtt tca tcg gca gac aaa gca tca ggt gct ggt 4059 Met Gln Arg Gln Val Ser Ser Ala Asp Lys Ala Ser Gly Ala Gly 1340 1345 1350 caa aga gac agc acg ggc tat aca aat ata tct gtg aag gac cta 4104 Gln Arg Asp Ser Thr Gly Tyr Thr Asn Ile Ser Val Lys Asp Leu 1355 1360 1365 gaa ggt att ctg tct ggt gaa aaa att gct gca cag gcc atg gat 4149 Glu Gly Ile Leu Ser Gly Glu Lys Ile Ala Ala Gln Ala Met Asp 1370 1375 1380 gag aac gtc att ctt atg cct gct ctc act agc tct gcg aac ttc 4194 Glu Asn Val Ile Leu Met Pro Ala Leu Thr Ser Ser Ala Asn Phe 1385 1390 1395 caa caa ata atg aaa aaa ttg agc cag tat tta ctt att ctg cag 4239 Gln Gln Ile Met Lys Lys Leu Ser Gln Tyr Leu Leu Ile Leu Gln 1400 1405 1410 cac aca tac cca gaa ctc tcc gtt ctc gag atc att cat tcg gcg 4284 His Thr Tyr Pro Glu Leu Ser Val Leu Glu Ile Ile His Ser Ala 1415 1420 1425 gaa aat tca act act gga tct att tta ccc cag ttg caa tct gct 4329 Glu Asn Ser Thr Thr Gly Ser Ile Leu Pro Gln Leu Gln Ser Ala 1430 1435 1440 gaa gtt att ctt gat aca agc aaa tac act gtg ctt gtg caa aat 4374 Glu Val Ile Leu Asp Thr Ser Lys Tyr Thr Val Leu Val Gln Asn 1445 1450 1455 gag aag gct gcc aaa aca gtg gaa agc cag cta ggt acc ctg acg 4419 Glu Lys Ala Ala Lys Thr Val Glu Ser Gln Leu Gly Thr Leu Thr 1460 1465 1470 gat ctt ata tcg ctt gaa gtg agc gcc aca gac aat agt gta caa 4464 Asp Leu Ile Ser Leu Glu Val Ser Ala Thr Asp Asn Ser Val Gln 1475 1480 1485 gac cat gga cgc cag tat gat ctt gct ctt gtg gta aac att gct 4509 Asp His Gly Arg Gln Tyr Asp Leu Ala Leu Val Val Asn Ile Ala 1490 1495 1500 cat aaa gac cct gat gta ctt ctc tgc gaa gca aaa tca tcc ctg 4554 His Lys Asp Pro Asp Val Leu Leu Cys Glu Ala Lys Ser Ser Leu 1505 1510 1515 aaa gaa ggg ggc cgt gtt tgc att atc gaa ata ggc gag cct ctc 4599 Lys Glu Gly Gly Arg Val Cys Ile Ile Glu Ile Gly Glu Pro Leu 1520 1525 1530 ttg aat ctt gga ata ggg ttg gcc gct tta cag cac act cat ttc 4644 Leu Asn Leu Gly Ile Gly Leu Ala Ala Leu Gln His Thr His Phe 1535 1540 1545 att att agt agc caa aac aca gac gag tct cac ttg aat cgt gct 4689 Ile Ile Ser Ser Gln Asn Thr Asp Glu Ser His Leu Asn Arg Ala 1550 1555 1560 ggg ttt acg aaa gag ctt ctt ctt gga gat gcc tta cca ccc aag 4734 Gly Phe Thr Lys Glu Leu Leu Leu Gly Asp Ala Leu Pro Pro Lys 1565 1570 1575 aac gag ttc cgg ctc ata gcc gga aat aca tcg aag cga tta gca 4779 Asn Glu Phe Arg Leu Ile Ala Gly Asn Thr Ser Lys Arg Leu Ala 1580 1585 1590 gtt act att caa gga gag ata gtc att gta cag gcg cct gag ccg 4824 Val Thr Ile Gln Gly Glu Ile Val Ile Val Gln Ala Pro Glu Pro 1595 1600 1605 tca aaa tct gct caa aat gtt gct gat gcc ctt act gaa gtg ctt 4869 Ser Lys Ser Ala Gln Asn Val Ala Asp Ala Leu Thr Glu Val Leu 1610 1615 1620 gag aaa caa tgt gtg cgc gcc att cgt gtt gat tgg agc tta ccc 4914 Glu Lys Gln Cys Val Arg Ala Ile Arg Val Asp Trp Ser Leu Pro 1625 1630 1635 gag tat att tcg gtc ata gaa ggc aag gaa tgt atc gtc ttg gct 4959 Glu Tyr Ile Ser Val Ile Glu Gly Lys Glu Cys Ile Val Leu Ala 1640 1645 1650 gat ctg gag aag tca cac cta cta gaa gca tct cag gag gaa ttc 5004 Asp Leu Glu Lys Ser His Leu Leu Glu Ala Ser Gln Glu Glu Phe 1655 1660 1665 cca ata ata caa cag acc atc ctg aag gct gga ggc atc ctt tgg 5049 Pro Ile Ile Gln Gln Thr Ile Leu Lys Ala Gly Gly Ile Leu Trp 1670 1675 1680 gtt agt ggc tct atc gga cca gac gcg gca tta gtc act gga ttg 5094 Val Ser Gly Ser Ile Gly Pro Asp Ala Ala Leu Val Thr Gly Leu 1685 1690 1695 gct cga aca att cgc aac gag ata cca ggc agc aag ctg cga gtt 5139 Ala Arg Thr Ile Arg Asn Glu Ile Pro Gly Ser Lys Leu Arg Val 1700 1705 1710 ctt cag aca aat gag ctc tcg tta gct tca ccg acc acg tgg tca 5184 Leu Gln Thr Asn Glu Leu Ser Leu Ala Ser Pro Thr Thr Trp Ser 1715 1720 1725 aat tat att ttg cga ttg cta caa tca cca acg cta gat agt gag 5229 Asn Tyr Ile Leu Arg Leu Leu Gln Ser Pro Thr Leu Asp Ser Glu 1730 1735 1740 ttc acc atc aaa gat ggt ttt ctc caa atc agt cgc gtc gta gaa 5274 Phe Thr Ile Lys Asp Gly Phe Leu Gln Ile Ser Arg Val Val Glu 1745 1750 1755 tat tac act cga aac gac gct ttg gcg gtt tct ctc ggg cgg cag 5319 Tyr Tyr Thr Arg Asn Asp Ala Leu Ala Val Ser Leu Gly Arg Gln 1760 1765 1770 gag cct aaa acg gtg cat atg cct ctt agt gaa act tca agc cca 5364 Glu Pro Lys Thr Val His Met Pro Leu Ser Glu Thr Ser Ser Pro 1775 1780 1785 gtc aaa ctg tgt atc aag aat cct ggg atg ctt gat tca cta tat 5409 Val Lys Leu Cys Ile Lys Asn Pro Gly Met Leu Asp Ser Leu Tyr 1790 1795 1800 ttt gaa ccg gat gat atc ctt aat agt cct cta gcc tcc ggg caa 5454 Phe Glu Pro Asp Asp Ile Leu Asn Ser Pro Leu Ala Ser Gly Gln 1805 1810 1815 gtc gaa ata gaa gtg aaa gca tcg ggt gtc aat ttc cgc gat gtc 5499 Val Glu Ile Glu Val Lys Ala Ser Gly Val Asn Phe Arg Asp Val 1820 1825 1830 atg gtt tgt atg ggt cag att cca gat agt ttg cta ggc ttc gag 5544 Met Val Cys Met Gly Gln Ile Pro Asp Ser Leu Leu Gly Phe Glu 1835 1840 1845 gca gct gga ata gtt cgt cga gtt ggt gag aat gtt caa aac atc 5589 Ala Ala Gly Ile Val Arg Arg Val Gly Glu Asn Val Gln Asn Ile 1850 1855 1860 aaa gca ggt gat cga gtt tgt ttt atc gca cac ggt tct cat cga 5634 Lys Ala Gly Asp Arg Val Cys Phe Ile Ala His Gly Ser His Arg 1865 1870 1875 act gtc cat cgt gtg aga aat gag tat gtg gta cac atc cca gat 5679 Thr Val His Arg Val Arg Asn Glu Tyr Val Val His Ile Pro Asp 1880 1885 1890 gaa atg tcc ttc gca gag gct tct ggc gtg ctt ctt gtt cat ggc 5724 Glu Met Ser Phe Ala Glu Ala Ser Gly Val Leu Leu Val His Gly 1895 1900 1905 acg gcg tgg tat ggt ctg gtc aag att gcc cag atc aaa gca ggg 5769 Thr Ala Trp Tyr Gly Leu Val Lys Ile Ala Gln Ile Lys Ala Gly 1910 1915 1920 caa acg att ctc atc cat gcc gct gcg ggt ggt gtt gga caa gca 5814 Gln Thr Ile Leu Ile His Ala Ala Ala Gly Gly Val Gly Gln Ala 1925 1930 1935 gca gtg atg ttg gcc cag cat ttt ggt ctc gag ata ttt gca aca 5859 Ala Val Met Leu Ala Gln His Phe Gly Leu Glu Ile Phe Ala Thr 1940 1945 1950 gtt ggc tcc gat gac aaa agg caa ctc atc cag gac ctt tat aag 5904 Val Gly Ser Asp Asp Lys Arg Gln Leu Ile Gln Asp Leu Tyr Lys 1955 1960 1965 atc cca gaa gac cac att ttc aat tct cgt gac ctg agt ttt gcc 5949 Ile Pro Glu Asp His Ile Phe Asn Ser Arg Asp Leu Ser Phe Ala 1970 1975 1980 aag gga gtg ctg cgt atg aca aat ggt cgt ggt gtg gat gtt atc 5994 Lys Gly Val Leu Arg Met Thr Asn Gly Arg Gly Val Asp Val Ile 1985 1990 1995 ctt aat tct cta tct ggg gag act ctt cgc caa aca tgg cac tgc 6039 Leu Asn Ser Leu Ser Gly Glu Thr Leu Arg Gln Thr Trp His Cys 2000 2005 2010 gtc gct cca ttt gga aca ttc atc gaa atc ggt att aaa gat atc 6084 Val Ala Pro Phe Gly Thr Phe Ile Glu Ile Gly Ile Lys Asp Ile 2015 2020 2025 ctc agc aat acc cga cta gac atg cgc cct ttc ctt caa gat gcc 6129 Leu Ser Asn Thr Arg Leu Asp Met Arg Pro Phe Leu Gln Asp Ala 2030 2035 2040 cga ttt gcc ttt ttt aat ttg aac cgt atc gag aac gag cga cca 6174 Arg Phe Ala Phe Phe Asn Leu Asn Arg Ile Glu Asn Glu Arg Pro 2045 2050 2055 gac ttg atg agc gag gca tta aat gaa agt atg gct ttc atc agc 6219 Asp Leu Met Ser Glu Ala Leu Asn Glu Ser Met Ala Phe Ile Ser 2060 2065 2070 tcg ggt gct aca cga cct gtt tca ccc ctg atg aac ttc cct gtc 6264 Ser Gly Ala Thr Arg Pro Val Ser Pro Leu Met Asn Phe Pro Val 2075 2080 2085 tcg cag gta gaa gat gcc ttc cgt ctc atg cag acg ggc aag cac 6309 Ser Gln Val Glu Asp Ala Phe Arg Leu Met Gln Thr Gly Lys His 2090 2095 2100 cgg ggg aaa cta tcc ctg aca tac tca tct tct gac gta gta ccc 6354 Arg Gly Lys Leu Ser Leu Thr Tyr Ser Ser Ser Asp Val Val Pro 2105 2110 2115 att cag agc cga cct act cgc tct att cgt ctg gat gaa act agt 6399 Ile Gln Ser Arg Pro Thr Arg Ser Ile Arg Leu Asp Glu Thr Ser 2120 2125 2130 gcc tat gtt ctc gta ggt ggt ctt ggt ggg ctt ggg cgc agt ctt 6444 Ala Tyr Val Leu Val Gly Gly Leu Gly Gly Leu Gly Arg Ser Leu 2135 2140 2145 gca caa ctt ttt gtc cga ctc ggg tgc aag aaa cta tgc ttt ctt 6489 Ala Gln Leu Phe Val Arg Leu Gly Cys Lys Lys Leu Cys Phe Leu 2150 2155 2160 tct cga tca gga ggg gca agt gaa aag gca cag aag ctc ctc aaa 6534 Ser Arg Ser Gly Gly Ala Ser Glu Lys Ala Gln Lys Leu Leu Lys 2165 2170 2175 gac ctt cag cag caa ggg gtc aaa act ctt gct ctt aga tgc gac 6579 Asp Leu Gln Gln Gln Gly Val Lys Thr Leu Ala Leu Arg Cys Asp 2180 2185 2190 gtt tct gat gca cag tct gtc aaa gcg gct att aat gaa tgc gcg 6624 Val Ser Asp Ala Gln Ser Val Lys Ala Ala Ile Asn Glu Cys Ala 2195 2200 2205 act cgc ttg gga cct gtc ctg ggt gtg gta cag tgt gca atg gtg 6669 Thr Arg Leu Gly Pro Val Leu Gly Val Val Gln Cys Ala Met Val 2210 2215 2220 ctt cga gat ggc cta ttc gag aag atg acc cac caa cag tgg gtt 6714 Leu Arg Asp Gly Leu Phe Glu Lys Met Thr His Gln Gln Trp Val 2225 2230 2235 gag ggt act cgg ccc aag gtc cag ggg tct tgg aac cta cat gtg 6759 Glu Gly Thr Arg Pro Lys Val Gln Gly Ser Trp Asn Leu His Val 2240 2245 2250 aac cta cca aat gtt gat ttc ttt att att ctc agt tcc ttt gct 6804 Asn Leu Pro Asn Val Asp Phe Phe Ile Ile Leu Ser Ser Phe Ala 2255 2260 2265 gga att ttt gga agc cga ggc caa agc aac tat acc gca gcg gga 6849 Gly Ile Phe Gly Ser Arg Gly Gln Ser Asn Tyr Thr Ala Ala Gly 2270 2275 2280 gcg tat gag gat gcg ctt gca aat tat cga cga tcg ctg ggt ctc 6894 Ala Tyr Glu Asp Ala Leu Ala Asn Tyr Arg Arg Ser Leu Gly Leu 2285 2290 2295 aaa gcg gtg aca gtt gac ttg ggt att atg cgc gat gtg ggc gtt 6939 Lys Ala Val Thr Val Asp Leu Gly Ile Met Arg Asp Val Gly Val 2300 2305 2310 ctt gcc gag caa ggt ata aca gat tat ctg cga gag tgg gag gag 6984 Leu Ala Glu Gln Gly Ile Thr Asp Tyr Leu Arg Glu Trp Glu Glu 2315 2320 2325 cca tgc ggt att cga gaa gct gaa ttc cat gcg ctt atg gaa aat 7029 Pro Cys Gly Ile Arg Glu Ala Glu Phe His Ala Leu Met Glu Asn 2330 2335 2340 gtc ttg act agt gaa gtt ctt gga gat cag gag cct cta ccg gca 7074 Val Leu Thr Ser Glu Val Leu Gly Asp Gln Glu Pro Leu Pro Ala 2345 2350 2355 cac att ccg acg ggc ttt gct acc gca aag aca gtt caa caa ttt 7119 His Ile Pro Thr Gly Phe Ala Thr Ala Lys Thr Val Gln Gln Phe 2360 2365 2370 ggt atc acc acg cca ttt tac ttt gat gat cct cgg ttt tca att 7164 Gly Ile Thr Thr Pro Phe Tyr Phe Asp Asp Pro Arg Phe Ser Ile 2375 2380 2385 cta tcc gcc gcc ggc tct agt aag aca gga gct ggt gat agc acg 7209 Leu Ser Ala Ala Gly Ser Ser Lys Thr Gly Ala Gly Asp Ser Thr 2390 2395 2400 gat tct aac aag gcc atc tca gtg caa aat caa att gcg cag tct 7254 Asp Ser Asn Lys Ala Ile Ser Val Gln Asn Gln Ile Ala Gln Ser 2405 2410 2415 ata tct att tca gag gca gca tca gcc gtc acc aat gct ctt gtt 7299 Ile Ser Ile Ser Glu Ala Ala Ser Ala Val Thr Asn Ala Leu Val 2420 2425 2430 gca cgc gtg gcc aaa tcg ctt caa agc gct ttg tcc gac atc gac 7344 Ala Arg Val Ala Lys Ser Leu Gln Ser Ala Leu Ser Asp Ile Asp 2435 2440 2445 cca tcc cgg ccg ctg cat gcc ttc ggt gtg gat tct ctt gtc gcc 7389 Pro Ser Arg Pro Leu His Ala Phe Gly Val Asp Ser Leu Val Ala 2450 2455 2460 gtc gaa gtg gtg aac tgg gtg ttc aaa gaa atc aag gcc aaa gtt 7434 Val Glu Val Val Asn Trp Val Phe Lys Glu Ile Lys Ala Lys Val 2465 2470 2475 acc gta ttt gac gtt ctt tct agt att cct att aca tct ctt gcc 7479 Thr Val Phe Asp Val Leu Ser Ser Ile Pro Ile Thr Ser Leu Ala 2480 2485 2490 gag aag att gcg ctg aag tct agt ctt ttg ccg caa ttg act tga 7524 Glu Lys Ile Ala Leu Lys Ser Ser Leu Leu Pro Gln Leu Thr 2495 2500 2505 <210> 14 <211> 2507 <212> PRT <213> Talaromyces islandicus <400> 14 Met Ala Thr Thr Asn Glu Val Arg Trp Ala Gln Asp Ile Ala Ile Val 1 5 10 15 Gly Met Ser Cys Arg Phe Ala Asp Asp Ala Asp Ser Phe Pro Arg Phe 20 25 30 Trp Asp Phe Ile Cys Asn Gly Arg Tyr Ala Phe His Tyr Pro Gly Lys 35 40 45 Lys Thr Asn Thr Ser Leu Pro Arg Gly Ala His Phe Phe Lys Asp Asp 50 55 60 Ile Ala Glu Phe Asp Ala Asn Phe Phe Asn Ile Ser Lys Val Glu Ala 65 70 75 80 Glu Ser Ile Asp Pro Gln Gln Arg Met Val Met Glu Thr Thr Phe Glu 85 90 95 Ala Leu Glu Asn Ala Gly Ile Thr Ile Asp Lys Val Ala Gly Thr Arg 100 105 110 Ala Gly Val Trp Met Ala Asn Phe Thr Ser Asp Tyr Arg Glu Met Leu 115 120 125 Tyr Arg Asp Ser Glu Thr Ala Pro Met Tyr Thr Leu Ser Gly Ala Ser 130 135 140 Asn Thr Ser Thr Ser Asn Arg Val Ser Trp Phe Phe Asp Leu Lys Gly 145 150 155 160 Pro Ser Phe Thr Leu Asn Thr Ala Cys Ser Ser Ser Met Val Ala Thr 165 170 175 His Leu Ala Cys Gln Ser Leu Ala Leu Gly Glu Ser Ser Ser Ala Ile 180 185 190 Val Gly Gly Thr Ser Leu Leu Leu Asn Pro Asp Leu Phe Leu Phe Leu 195 200 205 Ser Asn Gln His Phe Leu Ala Ala Asp Gly Lys Ser Lys Ala Phe Asp 210 215 220 Ala Ser Gly Asp Gly Tyr Gly Arg Gly Glu Gly Val Ala Val Val Val 225 230 235 240 Leu Lys Arg Val Ala Asp Ala Ile Ala Asp Gly Asp Pro Ile Arg Ala 245 250 255 Val Ile Arg Gly Thr Ala Ile Asn Gln Asp Gly Arg Thr Lys Gly Met 260 265 270 Thr Leu Pro Ser Val Asp Ala Gln Glu Gln Leu Ile Lys Asp Ala Tyr 275 280 285 Arg Asn Ala Gly Leu Ser Met Lys Asp Thr Arg Tyr Val Glu Ala His 290 295 300 Gly Thr Gly Thr Gln Ala Gly Asp Lys Cys Glu Thr Glu Ala Leu Ser 305 310 315 320 Arg Thr Phe Ser Pro Tyr Arg Thr Ala Ser Glu Arg Leu Ile Leu Gly 325 330 335 Ser Val Lys Thr Asn Ile Gly His Leu Glu Ala Cys Ala Gly Leu Ala 340 345 350 Ser Met Ile Lys Cys Val Gly Ile Leu Glu Ala Gly Val Ile Pro Pro 355 360 365 Asn Pro Leu Tyr Lys Lys Gly Asn Pro Gly Ile Lys Phe Asp Asp Trp 370 375 380 Lys Leu His Val Pro Thr Ser Ser Ile Gln Trp Pro Thr Ser Gly Leu 385 390 395 400 Arg Arg Ile Ser Thr Gln Gly Phe Gly Tyr Gly Gly Thr Asn Ala His 405 410 415 Ile Ile Met Asp Asp Ala His Asn Tyr Leu Val Ser Arg Asp Ile Thr 420 425 430 Ala Ile His Asn Thr Cys Leu Leu Asn Leu Thr Asn Gly Thr Thr Tyr 435 440 445 Ile Glu His Lys Glu Ala Pro Arg Pro Arg Ile Phe His Phe Ser Ala 450 455 460 Gln Asp Lys Asp Gly Leu Gly Arg Val Arg Asp Ala Thr Cys Gln Tyr 465 470 475 480 Leu Lys Ser Gly Ala Leu Glu Ala Gly Lys Met Arg Gln Asn Glu Asp 485 490 495 Lys Tyr Leu Arg Asp Leu Ala Tyr Thr Leu Ser Glu Arg Arg Ser Arg 500 505 510 Leu Gln Trp Gln Thr Phe Ala Val Ala Ser Ser Val Glu Gly Leu Ile 515 520 525 Glu Thr Leu Gln Thr Lys Pro Trp Ala Ser Pro Glu Thr Arg Ser Ala 530 535 540 Ser Lys Val Pro Arg Ile Gly Phe Ile Phe Thr Gly Gln Gly Ala Gln 545 550 555 560 Trp Pro Arg Met Gly Ile Glu Leu Met Glu Tyr Asp Ile Phe Arg Lys 565 570 575 Ser Val Glu Arg Ser Asp Val Tyr Leu Arg Glu Gly Leu Asp Cys Ser 580 585 590 Trp Ser Ala Ile Glu Glu Leu Ala Lys Pro Asp Ser Ser Ser Asn Leu 595 600 605 Gly Ala Ala Glu Tyr Ser Gln Ala Leu Cys Ser Val Leu Gln Ile Ala 610 615 620 Leu Ile Asp Leu Leu Asp Ser Trp Asn Ile Arg Pro Ser Ala Val Ala 625 630 635 640 Gly His Ser Ser Gly Glu Ile Ala Ala Ala Tyr Cys Leu Gly Val Leu 645 650 655 Ser Trp Glu Asp Ala Leu Lys Val Ala Tyr Phe Arg Gly Ser Leu Ser 660 665 670 Ala Glu Met Lys Gly Asn Asp Ser Ser Leu Asn Gly Ala Met Met Ala 675 680 685 Val Gly Ser Ser Pro Ala Asp Ile Glu Lys Trp Leu Asp Lys Val Thr 690 695 700 Ala Gly Glu Val Val Val Ala Cys Val Asn Ser Pro Ala Ser Ile Thr 705 710 715 720 Leu Ser Gly Asp Ala Ala Gly Ile Asn Glu Leu Glu Ser Met Leu Lys 725 730 735 Glu Ala Gly Ile Phe Ala Arg Lys Leu Lys Val Asp Thr Ala Tyr His 740 745 750 Ser Pro His Met Gln Thr Ile Ala Gly Gln Tyr Phe Glu Ala Ile Ala 755 760 765 Asp Ile Ser Ile Leu Pro Val Arg Asn Gly Cys Gln Met His Ser Ser 770 775 780 Val Arg Gly Gly Tyr Ile Asp Pro Asn Glu Leu Gly Ala Ala Asn Trp 785 790 795 800 Val Arg Asn Leu Val Ser Thr Val Gln Phe Ala Asp Ala Val His Asp 805 810 815 Leu Leu Arg Pro Leu Val Tyr Gly Glu Arg Ala Ala His Asn Ala Val 820 825 830 Asp Ile Leu Val Glu Val Gly Pro His Ser Ala Leu Gln Gly Pro Val 835 840 845 Asn Gln Thr Met Lys Ala His Gly Ile Asn Ser Ile Asn Tyr Cys Thr 850 855 860 Met Leu Ser Arg Gly Lys Asn Ala Ile Asn Thr Ala Leu Ser Cys Ala 865 870 875 880 Ala Thr Leu Tyr Val Glu Gly Leu Ala Val Asp Leu Arg Arg Ala Asn 885 890 895 Gln Asp Glu Ser Phe Ala Val Glu Pro Ile Phe Asp Met Pro Ser Tyr 900 905 910 Pro Trp Asn His Ser Ile Arg Tyr Trp Ala Glu Ser Arg Val Glu Lys 915 920 925 Glu Tyr Arg Gln Arg Lys Tyr Pro Arg Thr Pro Leu Leu Gly Ala Pro 930 935 940 Cys Pro Ser Met Asn Ala Gly Glu Lys Val Trp Arg Gly Phe Ile Arg 945 950 955 960 Pro Ser Glu Glu Pro Trp Val Arg Asp His Val Ile Gln Gly Ser Ile 965 970 975 Leu Tyr Pro Ala Ala Gly Phe Leu Ala Met Ala Ile Glu Ala Ala Arg 980 985 990 Gln Gly Thr Glu Thr Gly Arg Ser Ile Asp Gly Phe Arg Leu Arg Asp 995 1000 1005 Val Gln Ile Asn Ala Ala Leu Val Ile Glu Glu Asn Val Glu Pro 1010 1015 1020 Glu Val Ile Leu Arg Leu Gln Pro His Arg Met Gly Thr Leu Asp 1025 1030 1035 Ala Gly Ser Val Ser Trp Gln Glu Phe Thr Val Ser Ser Ser Thr 1040 1045 1050 Asp Gly Thr Asp Leu Arg Gln Asn Cys Ser Gly Leu Leu Ala Ile 1055 1060 1065 Asp Tyr Glu Pro Ala Glu Gly Ser Ser Met His Ile Glu Lys Ile 1070 1075 1080 Lys Glu Val Glu Thr Ile Lys Gly Lys Leu Val Lys Ala Lys Glu 1085 1090 1095 Gln Cys Arg Ala Ala Ile Asn Val Asp Glu Phe Tyr Ala His Leu 1100 1105 1110 Asp Thr Val Gly Leu Thr Tyr Gly Glu Thr Phe Ala Asn Leu Thr 1115 1120 1125 Glu Val His Thr Asn Ala Ala Thr Gly Glu Cys Thr Gly Arg Leu 1130 1135 1140 Leu Val Pro Asp Val Glu Ser Ala Ile Pro Pro His Met Arg Glu 1145 1150 1155 Arg Pro His Ile Ile His Pro Thr Thr Leu Asp Ala Ile Phe His 1160 1165 1170 Leu Ala Phe Ala Ala Ile Ser Glu His Pro Phe Ser Leu Lys Ser 1175 1180 1185 Ala Met Val Pro Ile Ser Ile Thr Glu Val Val Ile Ser Asn Glu 1190 1195 1200 Val Pro His Arg Lys Gly Ser Gln Leu Glu Gly Phe Ala Gln Ser 1205 1210 1215 Ser Arg Phe Gly Phe Arg Glu Leu Val Thr Asn Ile Asn Ile Phe 1220 1225 1230 Asp Glu Gln Leu Thr Asp Ala Val Val Lys Ile Ser Gly Phe Arg 1235 1240 1245 Cys Ala Asp Val Ser Gly Ser Ser Gln Ser Thr Ser Ser Gly Glu 1250 1255 1260 Ala Ala Lys Pro Ile Thr Phe Lys Glu Ile His Arg Pro Ala Leu 1265 1270 1275 Glu Leu Leu Asp Tyr Glu Asp Leu Gln Arg Ala Val Asn Ala Asn 1280 1285 1290 Ala Asp Glu Ile Ala Ser Gly Ile Phe Glu Gln Asp Thr Ser Leu 1295 1300 1305 Asp Lys Ser Ala Leu Ala Ile Val Lys Arg Thr Leu Ser Asn Val 1310 1315 1320 Pro Arg Ser Ser Val His Lys Asp Leu Leu Gly Phe Tyr Asp Trp 1325 1330 1335 Met Gln Arg Gln Val Ser Ser Ala Asp Lys Ala Ser Gly Ala Gly 1340 1345 1350 Gln Arg Asp Ser Thr Gly Tyr Thr Asn Ile Ser Val Lys Asp Leu 1355 1360 1365 Glu Gly Ile Leu Ser Gly Glu Lys Ile Ala Ala Gln Ala Met Asp 1370 1375 1380 Glu Asn Val Ile Leu Met Pro Ala Leu Thr Ser Ser Ala Asn Phe 1385 1390 1395 Gln Gln Ile Met Lys Lys Leu Ser Gln Tyr Leu Leu Ile Leu Gln 1400 1405 1410 His Thr Tyr Pro Glu Leu Ser Val Leu Glu Ile Ile His Ser Ala 1415 1420 1425 Glu Asn Ser Thr Thr Gly Ser Ile Leu Pro Gln Leu Gln Ser Ala 1430 1435 1440 Glu Val Ile Leu Asp Thr Ser Lys Tyr Thr Val Leu Val Gln Asn 1445 1450 1455 Glu Lys Ala Ala Lys Thr Val Glu Ser Gln Leu Gly Thr Leu Thr 1460 1465 1470 Asp Leu Ile Ser Leu Glu Val Ser Ala Thr Asp Asn Ser Val Gln 1475 1480 1485 Asp His Gly Arg Gln Tyr Asp Leu Ala Leu Val Val Asn Ile Ala 1490 1495 1500 His Lys Asp Pro Asp Val Leu Leu Cys Glu Ala Lys Ser Ser Leu 1505 1510 1515 Lys Glu Gly Gly Arg Val Cys Ile Ile Glu Ile Gly Glu Pro Leu 1520 1525 1530 Leu Asn Leu Gly Ile Gly Leu Ala Ala Leu Gln His Thr His Phe 1535 1540 1545 Ile Ile Ser Ser Gln Asn Thr Asp Glu Ser His Leu Asn Arg Ala 1550 1555 1560 Gly Phe Thr Lys Glu Leu Leu Leu Gly Asp Ala Leu Pro Pro Lys 1565 1570 1575 Asn Glu Phe Arg Leu Ile Ala Gly Asn Thr Ser Lys Arg Leu Ala 1580 1585 1590 Val Thr Ile Gln Gly Glu Ile Val Ile Val Gln Ala Pro Glu Pro 1595 1600 1605 Ser Lys Ser Ala Gln Asn Val Ala Asp Ala Leu Thr Glu Val Leu 1610 1615 1620 Glu Lys Gln Cys Val Arg Ala Ile Arg Val Asp Trp Ser Leu Pro 1625 1630 1635 Glu Tyr Ile Ser Val Ile Glu Gly Lys Glu Cys Ile Val Leu Ala 1640 1645 1650 Asp Leu Glu Lys Ser His Leu Leu Glu Ala Ser Gln Glu Glu Phe 1655 1660 1665 Pro Ile Ile Gln Gln Thr Ile Leu Lys Ala Gly Gly Ile Leu Trp 1670 1675 1680 Val Ser Gly Ser Ile Gly Pro Asp Ala Ala Leu Val Thr Gly Leu 1685 1690 1695 Ala Arg Thr Ile Arg Asn Glu Ile Pro Gly Ser Lys Leu Arg Val 1700 1705 1710 Leu Gln Thr Asn Glu Leu Ser Leu Ala Ser Pro Thr Thr Trp Ser 1715 1720 1725 Asn Tyr Ile Leu Arg Leu Leu Gln Ser Pro Thr Leu Asp Ser Glu 1730 1735 1740 Phe Thr Ile Lys Asp Gly Phe Leu Gln Ile Ser Arg Val Val Glu 1745 1750 1755 Tyr Tyr Thr Arg Asn Asp Ala Leu Ala Val Ser Leu Gly Arg Gln 1760 1765 1770 Glu Pro Lys Thr Val His Met Pro Leu Ser Glu Thr Ser Ser Pro 1775 1780 1785 Val Lys Leu Cys Ile Lys Asn Pro Gly Met Leu Asp Ser Leu Tyr 1790 1795 1800 Phe Glu Pro Asp Asp Ile Leu Asn Ser Pro Leu Ala Ser Gly Gln 1805 1810 1815 Val Glu Ile Glu Val Lys Ala Ser Gly Val Asn Phe Arg Asp Val 1820 1825 1830 Met Val Cys Met Gly Gln Ile Pro Asp Ser Leu Leu Gly Phe Glu 1835 1840 1845 Ala Ala Gly Ile Val Arg Arg Val Gly Glu Asn Val Gln Asn Ile 1850 1855 1860 Lys Ala Gly Asp Arg Val Cys Phe Ile Ala His Gly Ser His Arg 1865 1870 1875 Thr Val His Arg Val Arg Asn Glu Tyr Val Val His Ile Pro Asp 1880 1885 1890 Glu Met Ser Phe Ala Glu Ala Ser Gly Val Leu Leu Val His Gly 1895 1900 1905 Thr Ala Trp Tyr Gly Leu Val Lys Ile Ala Gln Ile Lys Ala Gly 1910 1915 1920 Gln Thr Ile Leu Ile His Ala Ala Ala Gly Gly Val Gly Gln Ala 1925 1930 1935 Ala Val Met Leu Ala Gln His Phe Gly Leu Glu Ile Phe Ala Thr 1940 1945 1950 Val Gly Ser Asp Asp Lys Arg Gln Leu Ile Gln Asp Leu Tyr Lys 1955 1960 1965 Ile Pro Glu Asp His Ile Phe Asn Ser Arg Asp Leu Ser Phe Ala 1970 1975 1980 Lys Gly Val Leu Arg Met Thr Asn Gly Arg Gly Val Asp Val Ile 1985 1990 1995 Leu Asn Ser Leu Ser Gly Glu Thr Leu Arg Gln Thr Trp His Cys 2000 2005 2010 Val Ala Pro Phe Gly Thr Phe Ile Glu Ile Gly Ile Lys Asp Ile 2015 2020 2025 Leu Ser Asn Thr Arg Leu Asp Met Arg Pro Phe Leu Gln Asp Ala 2030 2035 2040 Arg Phe Ala Phe Phe Asn Leu Asn Arg Ile Glu Asn Glu Arg Pro 2045 2050 2055 Asp Leu Met Ser Glu Ala Leu Asn Glu Ser Met Ala Phe Ile Ser 2060 2065 2070 Ser Gly Ala Thr Arg Pro Val Ser Pro Leu Met Asn Phe Pro Val 2075 2080 2085 Ser Gln Val Glu Asp Ala Phe Arg Leu Met Gln Thr Gly Lys His 2090 2095 2100 Arg Gly Lys Leu Ser Leu Thr Tyr Ser Ser Ser Asp Val Val Pro 2105 2110 2115 Ile Gln Ser Arg Pro Thr Arg Ser Ile Arg Leu Asp Glu Thr Ser 2120 2125 2130 Ala Tyr Val Leu Val Gly Gly Leu Gly Gly Leu Gly Arg Ser Leu 2135 2140 2145 Ala Gln Leu Phe Val Arg Leu Gly Cys Lys Lys Leu Cys Phe Leu 2150 2155 2160 Ser Arg Ser Gly Gly Ala Ser Glu Lys Ala Gln Lys Leu Leu Lys 2165 2170 2175 Asp Leu Gln Gln Gln Gly Val Lys Thr Leu Ala Leu Arg Cys Asp 2180 2185 2190 Val Ser Asp Ala Gln Ser Val Lys Ala Ala Ile Asn Glu Cys Ala 2195 2200 2205 Thr Arg Leu Gly Pro Val Leu Gly Val Val Gln Cys Ala Met Val 2210 2215 2220 Leu Arg Asp Gly Leu Phe Glu Lys Met Thr His Gln Gln Trp Val 2225 2230 2235 Glu Gly Thr Arg Pro Lys Val Gln Gly Ser Trp Asn Leu His Val 2240 2245 2250 Asn Leu Pro Asn Val Asp Phe Phe Ile Ile Leu Ser Ser Phe Ala 2255 2260 2265 Gly Ile Phe Gly Ser Arg Gly Gln Ser Asn Tyr Thr Ala Ala Gly 2270 2275 2280 Ala Tyr Glu Asp Ala Leu Ala Asn Tyr Arg Arg Ser Leu Gly Leu 2285 2290 2295 Lys Ala Val Thr Val Asp Leu Gly Ile Met Arg Asp Val Gly Val 2300 2305 2310 Leu Ala Glu Gln Gly Ile Thr Asp Tyr Leu Arg Glu Trp Glu Glu 2315 2320 2325 Pro Cys Gly Ile Arg Glu Ala Glu Phe His Ala Leu Met Glu Asn 2330 2335 2340 Val Leu Thr Ser Glu Val Leu Gly Asp Gln Glu Pro Leu Pro Ala 2345 2350 2355 His Ile Pro Thr Gly Phe Ala Thr Ala Lys Thr Val Gln Gln Phe 2360 2365 2370 Gly Ile Thr Thr Pro Phe Tyr Phe Asp Asp Pro Arg Phe Ser Ile 2375 2380 2385 Leu Ser Ala Ala Gly Ser Ser Lys Thr Gly Ala Gly Asp Ser Thr 2390 2395 2400 Asp Ser Asn Lys Ala Ile Ser Val Gln Asn Gln Ile Ala Gln Ser 2405 2410 2415 Ile Ser Ile Ser Glu Ala Ala Ser Ala Val Thr Asn Ala Leu Val 2420 2425 2430 Ala Arg Val Ala Lys Ser Leu Gln Ser Ala Leu Ser Asp Ile Asp 2435 2440 2445 Pro Ser Arg Pro Leu His Ala Phe Gly Val Asp Ser Leu Val Ala 2450 2455 2460 Val Glu Val Val Asn Trp Val Phe Lys Glu Ile Lys Ala Lys Val 2465 2470 2475 Thr Val Phe Asp Val Leu Ser Ser Ile Pro Ile Thr Ser Leu Ala 2480 2485 2490 Glu Lys Ile Ala Leu Lys Ser Ser Leu Leu Pro Gln Leu Thr 2495 2500 2505 <210> 15 <211> 7809 <212> DNA <213> Talaromyces islandicus <220> <221> CDS <222> (1)..(7809) <400> 15 atg gct ttg gat ttc gac tac atc att gtc ggc ggg ggc act gca gga 48 Met Ala Leu Asp Phe Asp Tyr Ile Ile Val Gly Gly Gly Thr Ala Gly 1 5 10 15 tgt gtt ctc gca agc cgc ctt tct gaa tac cta ccg gac gcc tct att 96 Cys Val Leu Ala Ser Arg Leu Ser Glu Tyr Leu Pro Asp Ala Ser Ile 20 25 30 cta ttg atc gaa gcc ggt atc gag cat gac cct cgc gtg aaa cca acc 144 Leu Leu Ile Glu Ala Gly Ile Glu His Asp Pro Arg Val Lys Pro Thr 35 40 45 ctt ggg ttg act ggc caa gca gcg aac gaa att aaa tgg aac ata cag 192 Leu Gly Leu Thr Gly Gln Ala Ala Asn Glu Ile Lys Trp Asn Ile Gln 50 55 60 agt gct cct caa tct gct gtt ggc aac aag act atc gat cta gtg cag 240 Ser Ala Pro Gln Ser Ala Val Gly Asn Lys Thr Ile Asp Leu Val Gln 65 70 75 80 ggt aaa gtg ctc ggg ggc acc tcc ggt att aac cac caa gta tgg tcc 288 Gly Lys Val Leu Gly Gly Thr Ser Gly Ile Asn His Gln Val Trp Ser 85 90 95 cgc ggt gca gct gga gac ttc aat cgc tgg gca gca gaa gtt ggc gac 336 Arg Gly Ala Ala Gly Asp Phe Asn Arg Trp Ala Ala Glu Val Gly Asp 100 105 110 ccg cga tgg tca tgg aat gga cag ctc ccc ttc ttc aag aac acc gag 384 Pro Arg Trp Ser Trp Asn Gly Gln Leu Pro Phe Phe Lys Asn Thr Glu 115 120 125 aca ttc cat cca ggg gct gac cta cag ggc aaa gat tta agc gcc ctt 432 Thr Phe His Pro Gly Ala Asp Leu Gln Gly Lys Asp Leu Ser Ala Leu 130 135 140 cat ggc ttc gat ggt cct atc aag gtg tct caa act tca tcc tgt gga 480 His Gly Phe Asp Gly Pro Ile Lys Val Ser Gln Thr Ser Ser Cys Gly 145 150 155 160 cgc ccg cgc aac tac cca ctg aaa gga gcc att gct tcc atg tac aag 528 Arg Pro Arg Asn Tyr Pro Leu Lys Gly Ala Ile Ala Ser Met Tyr Lys 165 170 175 agt gcc ggc gta tcc caa ggt gaa gat ttg aat tct gga aat att ctt 576 Ser Ala Gly Val Ser Gln Gly Glu Asp Leu Asn Ser Gly Asn Ile Leu 180 185 190 ggc ttc agt gaa gca acg gcc ggg tcc tac gac ggt atc cgg caa tgg 624 Gly Phe Ser Glu Ala Thr Ala Gly Ser Tyr Asp Gly Ile Arg Gln Trp 195 200 205 gcg gga gga aac tac aaa ttt ggt ccc aac gtg act ttg tgg acg gaa 672 Ala Gly Gly Asn Tyr Lys Phe Gly Pro Asn Val Thr Leu Trp Thr Glu 210 215 220 acc cat gta tca aaa atc atc tca cag ggt tct cga gcc acg gga gtc 720 Thr His Val Ser Lys Ile Ile Ser Gln Gly Ser Arg Ala Thr Gly Val 225 230 235 240 gag tac ttg cgg cct gac aga agc act agt tcc tca gta tca gct aaa 768 Glu Tyr Leu Arg Pro Asp Arg Ser Thr Ser Ser Ser Val Ser Ala Lys 245 250 255 aaa gaa gtc atc gtc tca agc ggt gct cag ggc tca ccc aag cta cta 816 Lys Glu Val Ile Val Ser Ser Gly Ala Gln Gly Ser Pro Lys Leu Leu 260 265 270 ctg tta agt gga att gga ccc tcg gca gag cta caa aag cat agc att 864 Leu Leu Ser Gly Ile Gly Pro Ser Ala Glu Leu Gln Lys His Ser Ile 275 280 285 cag caa gta gtc gaa ctc cct gtg ggg gaa aac tac agc gac cac ccc 912 Gln Gln Val Val Glu Leu Pro Val Gly Glu Asn Tyr Ser Asp His Pro 290 295 300 atg atg gca aca tac tgg aac cta gaa aag cgc ggt ctg gct ctt ggt 960 Met Met Ala Thr Tyr Trp Asn Leu Glu Lys Arg Gly Leu Ala Leu Gly 305 310 315 320 gat gtt gaa atg cgt tca gct gaa tgc gat tgg act tct ggg ttg ccg 1008 Asp Val Glu Met Arg Ser Ala Glu Cys Asp Trp Thr Ser Gly Leu Pro 325 330 335 gtt gac tgg ttg gca ttc cac cgt cac gat caa gac cca acc att gct 1056 Val Asp Trp Leu Ala Phe His Arg His Asp Gln Asp Pro Thr Ile Ala 340 345 350 gca ttg gct gag agc cag tta agc tca aat gaa ttg gaa cgc ttt cag 1104 Ala Leu Ala Glu Ser Gln Leu Ser Ser Asn Glu Leu Glu Arg Phe Gln 355 360 365 gag caa aat agg gct cac act gag tct gtg gtc tta tac ggt cat att 1152 Glu Gln Asn Arg Ala His Thr Glu Ser Val Val Leu Tyr Gly His Ile 370 375 380 gac ttc tcg ggc aag gcg ggc cct cca cct cca gga tct aac gtg tgt 1200 Asp Phe Ser Gly Lys Ala Gly Pro Pro Pro Pro Gly Ser Asn Val Cys 385 390 395 400 gta atg aac att cta gtc act cca tcg tct cgg gga aca gtg acg ctc 1248 Val Met Asn Ile Leu Val Thr Pro Ser Ser Arg Gly Thr Val Thr Leu 405 410 415 aaa tcc acc aat cca ttc gat gca cct gtg tgt gac ccg aac atg tta 1296 Lys Ser Thr Asn Pro Phe Asp Ala Pro Val Cys Asp Pro Asn Met Leu 420 425 430 tcc aac gaa ctc gat aag caa ctt ctt tgg tct gtg acc cgt ttg aca 1344 Ser Asn Glu Leu Asp Lys Gln Leu Leu Trp Ser Val Thr Arg Leu Thr 435 440 445 agc caa ggt ctt gag cga act att tct cca gag tac gga ctt tct gag 1392 Ser Gln Gly Leu Glu Arg Thr Ile Ser Pro Glu Tyr Gly Leu Ser Glu 450 455 460 tat gcc att gat gac gat tta cgc ggt gac tac ggc gat gag gcc atg 1440 Tyr Ala Ile Asp Asp Asp Leu Arg Gly Asp Tyr Gly Asp Glu Ala Met 465 470 475 480 atg cga cgt gct gtc cga att gtt cgc acc gtg aat cat gga agt ggt 1488 Met Arg Arg Ala Val Arg Ile Val Arg Thr Val Asn His Gly Ser Gly 485 490 495 aca tgc tca atg ggc act gtc gtt gac aca gag tgt cga gta aag ggc 1536 Thr Cys Ser Met Gly Thr Val Val Asp Thr Glu Cys Arg Val Lys Gly 500 505 510 gtt gag ggc ttg cga gta gtc gac tcc agc gtc att cct ctt cca ctc 1584 Val Glu Gly Leu Arg Val Val Asp Ser Ser Val Ile Pro Leu Pro Leu 515 520 525 tgc gcg cac tac cag gcg tct gtg tac gca ttg gcg gaa cag gat cag 1632 Cys Ala His Tyr Gln Ala Ser Val Tyr Ala Leu Ala Glu Gln Asp Gln 530 535 540 aca gag cag ttc ctc ctc cta tat gga gat cag acg gta gag aag ctg 1680 Thr Glu Gln Phe Leu Leu Leu Tyr Gly Asp Gln Thr Val Glu Lys Leu 545 550 555 560 cct gct gtt cgg gct ctt gta gaa cat gcc cag agg tcg ccg gct ggt 1728 Pro Ala Val Arg Ala Leu Val Glu His Ala Gln Arg Ser Pro Ala Gly 565 570 575 cgt cgt ttt ctc cgc gat gcg tgc gat atc att caa ata gaa ata ttc 1776 Arg Arg Phe Leu Arg Asp Ala Cys Asp Ile Ile Gln Ile Glu Ile Phe 580 585 590 agc ctt gat aca gat gag aga gct cac gtc ggg cat ttt gat act ctg 1824 Ser Leu Asp Thr Asp Glu Arg Ala His Val Gly His Phe Asp Thr Leu 595 600 605 ttg cag ctg gca gaa agt aat gcc cag gct gac cag ccc agt gag atc 1872 Leu Gln Leu Ala Glu Ser Asn Ala Gln Ala Asp Gln Pro Ser Glu Ile 610 615 620 gtg gct aca att ctc atg aac gtg acc cga ctg gga gag ttt att ctt 1920 Val Ala Thr Ile Leu Met Asn Val Thr Arg Leu Gly Glu Phe Ile Leu 625 630 635 640 tac gca gaa gaa cac cca aac gtc tta ggc tct ata gag caa ccg aca 1968 Tyr Ala Glu Glu His Pro Asn Val Leu Gly Ser Ile Glu Gln Pro Thr 645 650 655 cat att gtt gct ttt tgc aca gga gaa att ccg gca gct gtg gca gca 2016 His Ile Val Ala Phe Cys Thr Gly Glu Ile Pro Ala Ala Val Ala Ala 660 665 670 gcc gcg cgc gat agc atc gaa tta tat aat ttg tca atc gag aca gtc 2064 Ala Ala Arg Asp Ser Ile Glu Leu Tyr Asn Leu Ser Ile Glu Thr Val 675 680 685 cgc ata ata tgt cgt ttt gcg cgg aac atc atc cgt cgg tcg gtc cta 2112 Arg Ile Ile Cys Arg Phe Ala Arg Asn Ile Ile Arg Arg Ser Val Leu 690 695 700 gta gac agg act aat ggt agc tgg gcg acc acc atc gtt ggt gtt tcg 2160 Val Asp Arg Thr Asn Gly Ser Trp Ala Thr Thr Ile Val Gly Val Ser 705 710 715 720 ccc gga cga gtt cag acc ata ctt gac act ttt cac cag agt cag aat 2208 Pro Gly Arg Val Gln Thr Ile Leu Asp Thr Phe His Gln Ser Gln Asn 725 730 735 att gct cct aca aga caa atc aac atc ggc atc atg gca gca ggt tgg 2256 Ile Ala Pro Thr Arg Gln Ile Asn Ile Gly Ile Met Ala Ala Gly Trp 740 745 750 cta aca ctt ttc ggg cct cct atc act aca gaa caa ctt ttt aac tgg 2304 Leu Thr Leu Phe Gly Pro Pro Ile Thr Thr Glu Gln Leu Phe Asn Trp 755 760 765 tct aag gag ctt gat ggg gca tct cgc atc aag aca gat gct ggc ggt 2352 Ser Lys Glu Leu Asp Gly Ala Ser Arg Ile Lys Thr Asp Ala Gly Gly 770 775 780 ggt gtt cat ctt ccc aat ctc ccc gag cta gac ttg gat gag gtc gta 2400 Gly Val His Leu Pro Asn Leu Pro Glu Leu Asp Leu Asp Glu Val Val 785 790 795 800 gga tta tca ccg ctt tta gat gtc cct att acc ccc aag gcg agg ctt 2448 Gly Leu Ser Pro Leu Leu Asp Val Pro Ile Thr Pro Lys Ala Arg Leu 805 810 815 tgg tca ccg tac agt tgc gag att cgc aat gca gca aca ctc aga gat 2496 Trp Ser Pro Tyr Ser Cys Glu Ile Arg Asn Ala Ala Thr Leu Arg Asp 820 825 830 tta atc cgt cag gtc atc cca gat atc acc caa tac tca cta cga tta 2544 Leu Ile Arg Gln Val Ile Pro Asp Ile Thr Gln Tyr Ser Leu Arg Leu 835 840 845 agt gat acc ata gag acg gcc gtt aaa ggg cta agc aat gga tca gtc 2592 Ser Asp Thr Ile Glu Thr Ala Val Lys Gly Leu Ser Asn Gly Ser Val 850 855 860 aag gtt gtc tgc gtt ggt tat act gct cac ctg ata tct ctg cag aaa 2640 Lys Val Val Cys Val Gly Tyr Thr Ala His Leu Ile Ser Leu Gln Lys 865 870 875 880 tca ctg cag cgc gaa aga cgc gag gcc act gtc tta caa cat tcc agc 2688 Ser Leu Gln Arg Glu Arg Arg Glu Ala Thr Val Leu Gln His Ser Ser 885 890 895 gca ggt tca aca ttt ttc aca tcg ccg cgc gga ggc tcg gag tcc att 2736 Ala Gly Ser Thr Phe Phe Thr Ser Pro Arg Gly Gly Ser Glu Ser Ile 900 905 910 gct att gta gga atg tct gga aga ttt cct ggt agc gac aat ata caa 2784 Ala Ile Val Gly Met Ser Gly Arg Phe Pro Gly Ser Asp Asn Ile Gln 915 920 925 gag tat tgg caa tcc ctg ttg gat gga gaa agg cat att aaa gag atc 2832 Glu Tyr Trp Gln Ser Leu Leu Asp Gly Glu Arg His Ile Lys Glu Ile 930 935 940 cct aaa aac cgg ttc gac ttg agc aaa tgg tac gat gag acc gga aaa 2880 Pro Lys Asn Arg Phe Asp Leu Ser Lys Trp Tyr Asp Glu Thr Gly Lys 945 950 955 960 cag aaa aac gcc acg atg aat cgc tcg ggc gcg ttt tta gat cga ccc 2928 Gln Lys Asn Ala Thr Met Asn Arg Ser Gly Ala Phe Leu Asp Arg Pro 965 970 975 ggt tac ttt gac aac cgg ttg ttc aat atg tca ccc cgg gaa gcc ctt 2976 Gly Tyr Phe Asp Asn Arg Leu Phe Asn Met Ser Pro Arg Glu Ala Leu 980 985 990 cag acc gat cct ctt cat cgt atg ttc ctc acc gtg agc tat gag gct 3024 Gln Thr Asp Pro Leu His Arg Met Phe Leu Thr Val Ser Tyr Glu Ala 995 1000 1005 ctc gag atg gca ggc tat tct cca gag gca aca ttg gca aca aac 3069 Leu Glu Met Ala Gly Tyr Ser Pro Glu Ala Thr Leu Ala Thr Asn 1010 1015 1020 agt aac cgc atc gca acc tat ttt ggt caa aca tca gat gac tgg 3114 Ser Asn Arg Ile Ala Thr Tyr Phe Gly Gln Thr Ser Asp Asp Trp 1025 1030 1035 aga gac att gtg ctt acc cag ggc gtg gat ata tac tac gct ccg 3159 Arg Asp Ile Val Leu Thr Gln Gly Val Asp Ile Tyr Tyr Ala Pro 1040 1045 1050 ggt att tgc cgt gcc ttt gca cct ggt cgt ctc aac tat cac ttt 3204 Gly Ile Cys Arg Ala Phe Ala Pro Gly Arg Leu Asn Tyr His Phe 1055 1060 1065 aag tgg gga ggg cca tcg tat agt gtt gat gca gct tgc gca tcg 3249 Lys Trp Gly Gly Pro Ser Tyr Ser Val Asp Ala Ala Cys Ala Ser 1070 1075 1080 agc atc gcc aca att tcc ctg gct tgt tct gcc ttg ctg gct cgc 3294 Ser Ile Ala Thr Ile Ser Leu Ala Cys Ser Ala Leu Leu Ala Arg 1085 1090 1095 gaa tgc gac acc gct ctc gca ggt gga ggc tcc att ctt gac tct 3339 Glu Cys Asp Thr Ala Leu Ala Gly Gly Gly Ser Ile Leu Asp Ser 1100 1105 1110 cct gca cca ttt gct ggt tta agc cga ggt ggc ttt ctc tcc ccg 3384 Pro Ala Pro Phe Ala Gly Leu Ser Arg Gly Gly Phe Leu Ser Pro 1115 1120 1125 gag aaa ggt tgt gaa act ttc cat gac gat gct gat ggt tac gtg 3429 Glu Lys Gly Cys Glu Thr Phe His Asp Asp Ala Asp Gly Tyr Val 1130 1135 1140 cgt ggc gaa ggc gtg ggt gtc gtt gtt ctt aag cgg ctc gaa gat 3474 Arg Gly Glu Gly Val Gly Val Val Val Leu Lys Arg Leu Glu Asp 1145 1150 1155 gct gtt gcg gat aac gac aac atc cta ggt gtc atc cgc gga tca 3519 Ala Val Ala Asp Asn Asp Asn Ile Leu Gly Val Ile Arg Gly Ser 1160 1165 1170 gcg aga aac tat agc aag gga gct tct tct att aca cat cca tct 3564 Ala Arg Asn Tyr Ser Lys Gly Ala Ser Ser Ile Thr His Pro Ser 1175 1180 1185 tcg gaa gcg cag cag cgt ctc tat cgg cag gtc ttg aat cag aat 3609 Ser Glu Ala Gln Gln Arg Leu Tyr Arg Gln Val Leu Asn Gln Asn 1190 1195 1200 gcc ata gac gcg gcg agt gtt tcc tat gtg gaa atg cac ggc acc 3654 Ala Ile Asp Ala Ala Ser Val Ser Tyr Val Glu Met His Gly Thr 1205 1210 1215 gga aca caa gcc ggt gac tct aca gag atg tcc tca gta ttg tct 3699 Gly Thr Gln Ala Gly Asp Ser Thr Glu Met Ser Ser Val Leu Ser 1220 1225 1230 aca ttt ggt caa tct cgt tcc aaa gat aac cca ctg gtt gtc ggc 3744 Thr Phe Gly Gln Ser Arg Ser Lys Asp Asn Pro Leu Val Val Gly 1235 1240 1245 gct gtt aag gca aat att ggt cat gga gaa gcc gct gct ggt gtt 3789 Ala Val Lys Ala Asn Ile Gly His Gly Glu Ala Ala Ala Gly Val 1250 1255 1260 tgt gcc ctc atc aag acc ttg atg atg ttt cag aag cat acc atc 3834 Cys Ala Leu Ile Lys Thr Leu Met Met Phe Gln Lys His Thr Ile 1265 1270 1275 cca ccg caa cct gga atg cct ttt aaa ctt aat cat cat ttc ccc 3879 Pro Pro Gln Pro Gly Met Pro Phe Lys Leu Asn His His Phe Pro 1280 1285 1290 gat ctg gag aag atg aac gtg cat ata cca gca act gca att ccg 3924 Asp Leu Glu Lys Met Asn Val His Ile Pro Ala Thr Ala Ile Pro 1295 1300 1305 cta acg agt gct agt aac gcc gcc aaa cga agg atc ttt ctc aac 3969 Leu Thr Ser Ala Ser Asn Ala Ala Lys Arg Arg Ile Phe Leu Asn 1310 1315 1320 agc ttc gat gcc tct ggg ggg aac tct tgc ctt cta tta gag gag 4014 Ser Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Leu Leu Glu Glu 1325 1330 1335 gcg cct cta aag cac tcc aag gct agt gat ccc cga aat cac cac 4059 Ala Pro Leu Lys His Ser Lys Ala Ser Asp Pro Arg Asn His His 1340 1345 1350 gtc gtg acc ttt tct gct cga act ccc ttc tct ctt cga gca att 4104 Val Val Thr Phe Ser Ala Arg Thr Pro Phe Ser Leu Arg Ala Ile 1355 1360 1365 aaa gaa aaa tac ctt caa tat att cgg ctc aac ccg aat aca tcg 4149 Lys Glu Lys Tyr Leu Gln Tyr Ile Arg Leu Asn Pro Asn Thr Ser 1370 1375 1380 ctg gct gat ctt gcc tac acc acg act gca cgc cgc atg cac caa 4194 Leu Ala Asp Leu Ala Tyr Thr Thr Thr Ala Arg Arg Met His Gln 1385 1390 1395 agc tcg gcc cgg tca aca ttt acc gct acg agt atc gaa gat ttt 4239 Ser Ser Ala Arg Ser Thr Phe Thr Ala Thr Ser Ile Glu Asp Phe 1400 1405 1410 gcc aat aag ctt gaa act gac ttg aag aaa gaa gat tcc cct gtc 4284 Ala Asn Lys Leu Glu Thr Asp Leu Lys Lys Glu Asp Ser Pro Val 1415 1420 1425 aaa aag agt aag ggg gct tct agt ggg cct aac gtt gta ttt gct 4329 Lys Lys Ser Lys Gly Ala Ser Ser Gly Pro Asn Val Val Phe Ala 1430 1435 1440 ttt acc ggt cag ggg tcc cag tat gca ggg atg gct cat caa ctc 4374 Phe Thr Gly Gln Gly Ser Gln Tyr Ala Gly Met Ala His Gln Leu 1445 1450 1455 tgg cac gac agt gcg gta ttc cgg cgg cta ata gac tcg atc caa 4419 Trp His Asp Ser Ala Val Phe Arg Arg Leu Ile Asp Ser Ile Gln 1460 1465 1470 tcc ata gcg act gct ttg gat ttg cct aag ttt gtt gac ctg att 4464 Ser Ile Ala Thr Ala Leu Asp Leu Pro Lys Phe Val Asp Leu Ile 1475 1480 1485 gct tcc caa agc ttc gat ttg tct aaa gcc agc cca att cag aca 4509 Ala Ser Gln Ser Phe Asp Leu Ser Lys Ala Ser Pro Ile Gln Thr 1490 1495 1500 caa cta gct ata gtg gcg ctt gaa att ggc ctg gct cag cta tgg 4554 Gln Leu Ala Ile Val Ala Leu Glu Ile Gly Leu Ala Gln Leu Trp 1505 1510 1515 gca tca tgg gga gtg cag cca agc ctt gtc att ggc cac agc ttg 4599 Ala Ser Trp Gly Val Gln Pro Ser Leu Val Ile Gly His Ser Leu 1520 1525 1530 gga gag tat gct gca tta tgc ata tca ggg gtt ctg acg gtc agc 4644 Gly Glu Tyr Ala Ala Leu Cys Ile Ser Gly Val Leu Thr Val Ser 1535 1540 1545 gat act ctc tat cta gtc gga aag agg gca atg atg tta gtt gag 4689 Asp Thr Leu Tyr Leu Val Gly Lys Arg Ala Met Met Leu Val Glu 1550 1555 1560 tct gtt gcg caa aac gaa tac gcc atg ctg gca atc aat gat gaa 4734 Ser Val Ala Gln Asn Glu Tyr Ala Met Leu Ala Ile Asn Asp Glu 1565 1570 1575 gtt gat atc att cgt cag cgc ctc gca aca gac gca tat aat aca 4779 Val Asp Ile Ile Arg Gln Arg Leu Ala Thr Asp Ala Tyr Asn Thr 1580 1585 1590 tgt gag atc gca tgc atc aac gca ccc aaa tcg acc gtg gta agt 4824 Cys Glu Ile Ala Cys Ile Asn Ala Pro Lys Ser Thr Val Val Ser 1595 1600 1605 ggc gct cta tca gaa atc aaa atc atg caa aag gag tta gag gaa 4869 Gly Ala Leu Ser Glu Ile Lys Ile Met Gln Lys Glu Leu Glu Glu 1610 1615 1620 caa ggg tat cgg tcc act ctt ctc cat gta cca ttc gga ttc cac 4914 Gln Gly Tyr Arg Ser Thr Leu Leu His Val Pro Phe Gly Phe His 1625 1630 1635 tcg aag caa atg gac cca atc cta gat tcg tac gag tcg tgt gta 4959 Ser Lys Gln Met Asp Pro Ile Leu Asp Ser Tyr Glu Ser Cys Val 1640 1645 1650 cag gga gtt ggt att tca tcc cct cgg gtt cca ata gca tcc act 5004 Gln Gly Val Gly Ile Ser Ser Pro Arg Val Pro Ile Ala Ser Thr 1655 1660 1665 ctc cta ggt gat att att cag gac aag tca acg gtt tct tct gtc 5049 Leu Leu Gly Asp Ile Ile Gln Asp Lys Ser Thr Val Ser Ser Val 1670 1675 1680 tac ctt aga cga cag acc cga gaa tct gtt aat ttt gtc gga gct 5094 Tyr Leu Arg Arg Gln Thr Arg Glu Ser Val Asn Phe Val Gly Ala 1685 1690 1695 cta caa gcg gca cag gtc tcc aat ttc ctg cgg gat gac aca ctc 5139 Leu Gln Ala Ala Gln Val Ser Asn Phe Leu Arg Asp Asp Thr Leu 1700 1705 1710 ttt ctc gag atg ggg ccc gat cca gtt tgt atg tcg ttg gtt cgc 5184 Phe Leu Glu Met Gly Pro Asp Pro Val Cys Met Ser Leu Val Arg 1715 1720 1725 tca act ctg ggg aca att gca acg cct cga ctt cta cct gcc ctt 5229 Ser Thr Leu Gly Thr Ile Ala Thr Pro Arg Leu Leu Pro Ala Leu 1730 1735 1740 cgc cgg aac gaa aac aat tgg ttg acc acg tca aat aca cta gca 5274 Arg Arg Asn Glu Asn Asn Trp Leu Thr Thr Ser Asn Thr Leu Ala 1745 1750 1755 gca gtc cac cag gcc ggt gtg ccc gtc aac tgg cca gac tat cac 5319 Ala Val His Gln Ala Gly Val Pro Val Asn Trp Pro Asp Tyr His 1760 1765 1770 cgg gag ttt aca aac tgt ctg aca ctg cta gat ttg ccc aca tat 5364 Arg Glu Phe Thr Asn Cys Leu Thr Leu Leu Asp Leu Pro Thr Tyr 1775 1780 1785 gtg ttt gat gaa aag gag ttc tgg aca tca tac ccg gac ccc gag 5409 Val Phe Asp Glu Lys Glu Phe Trp Thr Ser Tyr Pro Asp Pro Glu 1790 1795 1800 cag cta agt ggt gtt gag caa aag cat ttg tca cca cca cca gtt 5454 Gln Leu Ser Gly Val Glu Gln Lys His Leu Ser Pro Pro Pro Val 1805 1810 1815 cct gca gta cag gga ttc ccc aca aca act ctt caa agg cta acc 5499 Pro Ala Val Gln Gly Phe Pro Thr Thr Thr Leu Gln Arg Leu Thr 1820 1825 1830 caa gaa gca ttc gag gac ggt aaa atc tcg gtc act ttc gag tcc 5544 Gln Glu Ala Phe Glu Asp Gly Lys Ile Ser Val Thr Phe Glu Ser 1835 1840 1845 agc aca tct gat cct cac ctt ttt gaa gcg ata atg ggc cat gct 5589 Ser Thr Ser Asp Pro His Leu Phe Glu Ala Ile Met Gly His Ala 1850 1855 1860 gtg gcc gga gtc acg att tgt tcc agt agt atc ttc agc gac atg 5634 Val Ala Gly Val Thr Ile Cys Ser Ser Ser Ile Phe Ser Asp Met 1865 1870 1875 gca tta tcg gcc gct cgg tac acg tgc gaa cgg cta cag cca ggc 5679 Ala Leu Ser Ala Ala Arg Tyr Thr Cys Glu Arg Leu Gln Pro Gly 1880 1885 1890 agg tgg tct gaa gag cta ctt acc atc agc ggc ctg gat att cag 5724 Arg Trp Ser Glu Glu Leu Leu Thr Ile Ser Gly Leu Asp Ile Gln 1895 1900 1905 cgg cca ata gtg gtc ctt gat cga aaa gac tca cat atc att cag 5769 Arg Pro Ile Val Val Leu Asp Arg Lys Asp Ser His Ile Ile Gln 1910 1915 1920 atc aac gct aaa ctt gat gca aaa acc gaa gag gtt tat atc agc 5814 Ile Asn Ala Lys Leu Asp Ala Lys Thr Glu Glu Val Tyr Ile Ser 1925 1930 1935 ttt caa gac cag gtt ggg aaa ccc ata ggg tcc tgc aag atc tca 5859 Phe Gln Asp Gln Val Gly Lys Pro Ile Gly Ser Cys Lys Ile Ser 1940 1945 1950 ttt cac gac gct gcg agc tgg aag cag aac atc tcg cgt att ctg 5904 Phe His Asp Ala Ala Ser Trp Lys Gln Asn Ile Ser Arg Ile Leu 1955 1960 1965 tat ctt gtc tct ttc agg att gat gta cta aaa gag gca act atc 5949 Tyr Leu Val Ser Phe Arg Ile Asp Val Leu Lys Glu Ala Thr Ile 1970 1975 1980 act ggt caa gga cat cga ttc ttg cgg cca gtg atc tac cga ctc 5994 Thr Gly Gln Gly His Arg Phe Leu Arg Pro Val Ile Tyr Arg Leu 1985 1990 1995 ttc tcc aat gtc gtg aat tat ggg gaa cgt ttt caa ggg tta gaa 6039 Phe Ser Asn Val Val Asn Tyr Gly Glu Arg Phe Gln Gly Leu Glu 2000 2005 2010 gag gtt ttc ctc gat tcc gag tgt aac gat gtt gtt ggt caa gtt 6084 Glu Val Phe Leu Asp Ser Glu Cys Asn Asp Val Val Gly Gln Val 2015 2020 2025 aga ctt ccg gac ttg cca tcc agt aaa tca gga cat ttc cta tat 6129 Arg Leu Pro Asp Leu Pro Ser Ser Lys Ser Gly His Phe Leu Tyr 2030 2035 2040 agc ccc tat tta ctt gat gcc gtt gta cat gtt gcc ggc ttc ctg 6174 Ser Pro Tyr Leu Leu Asp Ala Val Val His Val Ala Gly Phe Leu 2045 2050 2055 gtc aac tgc ggc ttg aaa tat ccc gag gat ata ggg ttc ctg gct 6219 Val Asn Cys Gly Leu Lys Tyr Pro Glu Asp Ile Gly Phe Leu Ala 2060 2065 2070 tcc agc ttc gaa tcc tgg cac ata ttg aag cct atc tta cct aat 6264 Ser Ser Phe Glu Ser Trp His Ile Leu Lys Pro Ile Leu Pro Asn 2075 2080 2085 aaa act tac act agc tat tcc cac atg gaa gaa tca tct aac gga 6309 Lys Thr Tyr Thr Ser Tyr Ser His Met Glu Glu Ser Ser Asn Gly 2090 2095 2100 tcc tct ttg ttg gga gac gtg tac gtc ttt gat ggg aaa gat ctg 6354 Ser Ser Leu Leu Gly Asp Val Tyr Val Phe Asp Gly Lys Asp Leu 2105 2110 2115 gtc ggc tca cta act gga ctc cgc ttt caa aag atg aaa aag att 6399 Val Gly Ser Leu Thr Gly Leu Arg Phe Gln Lys Met Lys Lys Ile 2120 2125 2130 gct ctc aca aga att ttg caa tcg gca gcc cct cac tct tct atg 6444 Ala Leu Thr Arg Ile Leu Gln Ser Ala Ala Pro His Ser Ser Met 2135 2140 2145 aaa ata ggc gca gga gtc ttt cga cca gat ctt ctt ggg tca agt 6489 Lys Ile Gly Ala Gly Val Phe Arg Pro Asp Leu Leu Gly Ser Ser 2150 2155 2160 gaa aaa cag tct tca aga aat aag cag ttg gct agg gat gtt gat 6534 Glu Lys Gln Ser Ser Arg Asn Lys Gln Leu Ala Arg Asp Val Asp 2165 2170 2175 ttc gat aca cta cct tca tcg gtc gag ccg tct gct ttc acc act 6579 Phe Asp Thr Leu Pro Ser Ser Val Glu Pro Ser Ala Phe Thr Thr 2180 2185 2190 ccc aaa cct tcg tca tct gtc acc tct atc ata ggt cat gat gaa 6624 Pro Lys Pro Ser Ser Ser Val Thr Ser Ile Ile Gly His Asp Glu 2195 2200 2205 ccc ggg gtt gga gat aag ttt ctt gct gcc gtt gca gca gag gta 6669 Pro Gly Val Gly Asp Lys Phe Leu Ala Ala Val Ala Ala Glu Val 2210 2215 2220 ggc tgc gaa atc tcc gac ttg gaa ccc gac aca gta ttt gga gat 6714 Gly Cys Glu Ile Ser Asp Leu Glu Pro Asp Thr Val Phe Gly Asp 2225 2230 2235 cta ggg gta gac tcg ttg atg gca att acg gtt att gcc tca atc 6759 Leu Gly Val Asp Ser Leu Met Ala Ile Thr Val Ile Ala Ser Ile 2240 2245 2250 aga aat gac act gga gtc gaa ttg cca ggg tcg ttt ttc ctc gac 6804 Arg Asn Asp Thr Gly Val Glu Leu Pro Gly Ser Phe Phe Leu Asp 2255 2260 2265 aac ccg acc gtt gca gaa gct aca aaa gca ttg cgt ggg gat agc 6849 Asn Pro Thr Val Ala Glu Ala Thr Lys Ala Leu Arg Gly Asp Ser 2270 2275 2280 gac gct ggc atc tcc acg cct cag tct tct cct ccg aat ctt tcc 6894 Asp Ala Gly Ile Ser Thr Pro Gln Ser Ser Pro Pro Asn Leu Ser 2285 2290 2295 ccc aaa att cgt ggt gaa gaa gtg aac ggt gag tct tcg gtt cct 6939 Pro Lys Ile Arg Gly Glu Glu Val Asn Gly Glu Ser Ser Val Pro 2300 2305 2310 ttt gag ccg tta gag aca aca cca tct att acc aca gac ttc gaa 6984 Phe Glu Pro Leu Glu Thr Thr Pro Ser Ile Thr Thr Asp Phe Glu 2315 2320 2325 gtt gga agg gcg acg gaa aca ccg ttg tta ata gat aaa cca gct 7029 Val Gly Arg Ala Thr Glu Thr Pro Leu Leu Ile Asp Lys Pro Ala 2330 2335 2340 gct acc ctg tta ttg cag ggg tct gtg gct tca acg gag ccc cct 7074 Ala Thr Leu Leu Leu Gln Gly Ser Val Ala Ser Thr Glu Pro Pro 2345 2350 2355 ctt ttc ctc cta gct gat ggc acc ggt tca gtt tct tcc tac ata 7119 Leu Phe Leu Leu Ala Asp Gly Thr Gly Ser Val Ser Ser Tyr Ile 2360 2365 2370 cag ctt cct gcg ctt tca ggc ggt cgt cga atc tat ggg gtg gag 7164 Gln Leu Pro Ala Leu Ser Gly Gly Arg Arg Ile Tyr Gly Val Glu 2375 2380 2385 tct cca ttt gct cgc gat ccg tcg gcc ttc gtt gat atc agc gtg 7209 Ser Pro Phe Ala Arg Asp Pro Ser Ala Phe Val Asp Ile Ser Val 2390 2395 2400 ggt gat tta gca gac gct ttt att ttc tcc ata cgc aaa gtt cag 7254 Gly Asp Leu Ala Asp Ala Phe Ile Phe Ser Ile Arg Lys Val Gln 2405 2410 2415 cct gtt ggt cca tat gtt att gga ggt tcc tcg ttg ggt gct att 7299 Pro Val Gly Pro Tyr Val Ile Gly Gly Ser Ser Leu Gly Ala Ile 2420 2425 2430 cat gcg ttt gag gtt agc cat cgt tta ctc aat gct ggt gag act 7344 His Ala Phe Glu Val Ser His Arg Leu Leu Asn Ala Gly Glu Thr 2435 2440 2445 gtc tct gag ttg ctt ctc atc gca aat gca gca cca att cct gcc 7389 Val Ser Glu Leu Leu Leu Ile Ala Asn Ala Ala Pro Ile Pro Ala 2450 2455 2460 cca gct cat ctg aga cat ttg gaa att tcc acc gaa atg att gag 7434 Pro Ala His Leu Arg His Leu Glu Ile Ser Thr Glu Met Ile Glu 2465 2470 2475 aaa agt gga att gct tat ggc acc ggc cgg aag aag tta tcc acc 7479 Lys Ser Gly Ile Ala Tyr Gly Thr Gly Arg Lys Lys Leu Ser Thr 2480 2485 2490 cta tct gca aga caa aaa cag cat ctt acg gct tct gtt cga tct 7524 Leu Ser Ala Arg Gln Lys Gln His Leu Thr Ala Ser Val Arg Ser 2495 2500 2505 cac gta ctc tac gag ccc cag gcc ttt acc gaa acc cat cgg cca 7569 His Val Leu Tyr Glu Pro Gln Ala Phe Thr Glu Thr His Arg Pro 2510 2515 2520 gta cat aca acg ttg atc gtt gcc tca aag ggt ctt ggg ggt ggg 7614 Val His Thr Thr Leu Ile Val Ala Ser Lys Gly Leu Gly Gly Gly 2525 2530 2535 aca agc tcg cca gaa tgt cca tta act ccc tgg ata cag gct aat 7659 Thr Ser Ser Pro Glu Cys Pro Leu Thr Pro Trp Ile Gln Ala Asn 2540 2545 2550 tgg gga tcg tcg gag act ctg ggg tgg gat ggc ctg gtc ggc gag 7704 Trp Gly Ser Ser Glu Thr Leu Gly Trp Asp Gly Leu Val Gly Glu 2555 2560 2565 att cac tct att cac cgc gaa gac act gac agt ttc tca tta ctg 7749 Ile His Ser Ile His Arg Glu Asp Thr Asp Ser Phe Ser Leu Leu 2570 2575 2580 aag tat cct aac att acc aag tta ggc caa att atc aat gac cgc 7794 Lys Tyr Pro Asn Ile Thr Lys Leu Gly Gln Ile Ile Asn Asp Arg 2585 2590 2595 gtt tgt cat gca tag 7809 Val Cys His Ala 2600 <210> 16 <211> 2602 <212> PRT <213> Talaromyces islandicus <400> 16 Met Ala Leu Asp Phe Asp Tyr Ile Ile Val Gly Gly Gly Thr Ala Gly 1 5 10 15 Cys Val Leu Ala Ser Arg Leu Ser Glu Tyr Leu Pro Asp Ala Ser Ile 20 25 30 Leu Leu Ile Glu Ala Gly Ile Glu His Asp Pro Arg Val Lys Pro Thr 35 40 45 Leu Gly Leu Thr Gly Gln Ala Ala Asn Glu Ile Lys Trp Asn Ile Gln 50 55 60 Ser Ala Pro Gln Ser Ala Val Gly Asn Lys Thr Ile Asp Leu Val Gln 65 70 75 80 Gly Lys Val Leu Gly Gly Thr Ser Gly Ile Asn His Gln Val Trp Ser 85 90 95 Arg Gly Ala Ala Gly Asp Phe Asn Arg Trp Ala Ala Glu Val Gly Asp 100 105 110 Pro Arg Trp Ser Trp Asn Gly Gln Leu Pro Phe Phe Lys Asn Thr Glu 115 120 125 Thr Phe His Pro Gly Ala Asp Leu Gln Gly Lys Asp Leu Ser Ala Leu 130 135 140 His Gly Phe Asp Gly Pro Ile Lys Val Ser Gln Thr Ser Ser Cys Gly 145 150 155 160 Arg Pro Arg Asn Tyr Pro Leu Lys Gly Ala Ile Ala Ser Met Tyr Lys 165 170 175 Ser Ala Gly Val Ser Gln Gly Glu Asp Leu Asn Ser Gly Asn Ile Leu 180 185 190 Gly Phe Ser Glu Ala Thr Ala Gly Ser Tyr Asp Gly Ile Arg Gln Trp 195 200 205 Ala Gly Gly Asn Tyr Lys Phe Gly Pro Asn Val Thr Leu Trp Thr Glu 210 215 220 Thr His Val Ser Lys Ile Ile Ser Gln Gly Ser Arg Ala Thr Gly Val 225 230 235 240 Glu Tyr Leu Arg Pro Asp Arg Ser Thr Ser Ser Ser Val Ser Ala Lys 245 250 255 Lys Glu Val Ile Val Ser Ser Gly Ala Gln Gly Ser Pro Lys Leu Leu 260 265 270 Leu Leu Ser Gly Ile Gly Pro Ser Ala Glu Leu Gln Lys His Ser Ile 275 280 285 Gln Gln Val Val Glu Leu Pro Val Gly Glu Asn Tyr Ser Asp His Pro 290 295 300 Met Met Ala Thr Tyr Trp Asn Leu Glu Lys Arg Gly Leu Ala Leu Gly 305 310 315 320 Asp Val Glu Met Arg Ser Ala Glu Cys Asp Trp Thr Ser Gly Leu Pro 325 330 335 Val Asp Trp Leu Ala Phe His Arg His Asp Gln Asp Pro Thr Ile Ala 340 345 350 Ala Leu Ala Glu Ser Gln Leu Ser Ser Asn Glu Leu Glu Arg Phe Gln 355 360 365 Glu Gln Asn Arg Ala His Thr Glu Ser Val Val Leu Tyr Gly His Ile 370 375 380 Asp Phe Ser Gly Lys Ala Gly Pro Pro Pro Pro Gly Ser Asn Val Cys 385 390 395 400 Val Met Asn Ile Leu Val Thr Pro Ser Ser Arg Gly Thr Val Thr Leu 405 410 415 Lys Ser Thr Asn Pro Phe Asp Ala Pro Val Cys Asp Pro Asn Met Leu 420 425 430 Ser Asn Glu Leu Asp Lys Gln Leu Leu Trp Ser Val Thr Arg Leu Thr 435 440 445 Ser Gln Gly Leu Glu Arg Thr Ile Ser Pro Glu Tyr Gly Leu Ser Glu 450 455 460 Tyr Ala Ile Asp Asp Asp Leu Arg Gly Asp Tyr Gly Asp Glu Ala Met 465 470 475 480 Met Arg Arg Ala Val Arg Ile Val Arg Thr Val Asn His Gly Ser Gly 485 490 495 Thr Cys Ser Met Gly Thr Val Val Asp Thr Glu Cys Arg Val Lys Gly 500 505 510 Val Glu Gly Leu Arg Val Val Asp Ser Ser Val Ile Pro Leu Pro Leu 515 520 525 Cys Ala His Tyr Gln Ala Ser Val Tyr Ala Leu Ala Glu Gln Asp Gln 530 535 540 Thr Glu Gln Phe Leu Leu Leu Tyr Gly Asp Gln Thr Val Glu Lys Leu 545 550 555 560 Pro Ala Val Arg Ala Leu Val Glu His Ala Gln Arg Ser Pro Ala Gly 565 570 575 Arg Arg Phe Leu Arg Asp Ala Cys Asp Ile Ile Gln Ile Glu Ile Phe 580 585 590 Ser Leu Asp Thr Asp Glu Arg Ala His Val Gly His Phe Asp Thr Leu 595 600 605 Leu Gln Leu Ala Glu Ser Asn Ala Gln Ala Asp Gln Pro Ser Glu Ile 610 615 620 Val Ala Thr Ile Leu Met Asn Val Thr Arg Leu Gly Glu Phe Ile Leu 625 630 635 640 Tyr Ala Glu Glu His Pro Asn Val Leu Gly Ser Ile Glu Gln Pro Thr 645 650 655 His Ile Val Ala Phe Cys Thr Gly Glu Ile Pro Ala Ala Val Ala Ala 660 665 670 Ala Ala Arg Asp Ser Ile Glu Leu Tyr Asn Leu Ser Ile Glu Thr Val 675 680 685 Arg Ile Ile Cys Arg Phe Ala Arg Asn Ile Ile Arg Arg Ser Val Leu 690 695 700 Val Asp Arg Thr Asn Gly Ser Trp Ala Thr Thr Ile Val Gly Val Ser 705 710 715 720 Pro Gly Arg Val Gln Thr Ile Leu Asp Thr Phe His Gln Ser Gln Asn 725 730 735 Ile Ala Pro Thr Arg Gln Ile Asn Ile Gly Ile Met Ala Ala Gly Trp 740 745 750 Leu Thr Leu Phe Gly Pro Pro Ile Thr Thr Glu Gln Leu Phe Asn Trp 755 760 765 Ser Lys Glu Leu Asp Gly Ala Ser Arg Ile Lys Thr Asp Ala Gly Gly 770 775 780 Gly Val His Leu Pro Asn Leu Pro Glu Leu Asp Leu Asp Glu Val Val 785 790 795 800 Gly Leu Ser Pro Leu Leu Asp Val Pro Ile Thr Pro Lys Ala Arg Leu 805 810 815 Trp Ser Pro Tyr Ser Cys Glu Ile Arg Asn Ala Ala Thr Leu Arg Asp 820 825 830 Leu Ile Arg Gln Val Ile Pro Asp Ile Thr Gln Tyr Ser Leu Arg Leu 835 840 845 Ser Asp Thr Ile Glu Thr Ala Val Lys Gly Leu Ser Asn Gly Ser Val 850 855 860 Lys Val Val Cys Val Gly Tyr Thr Ala His Leu Ile Ser Leu Gln Lys 865 870 875 880 Ser Leu Gln Arg Glu Arg Arg Glu Ala Thr Val Leu Gln His Ser Ser 885 890 895 Ala Gly Ser Thr Phe Phe Thr Ser Pro Arg Gly Gly Ser Glu Ser Ile 900 905 910 Ala Ile Val Gly Met Ser Gly Arg Phe Pro Gly Ser Asp Asn Ile Gln 915 920 925 Glu Tyr Trp Gln Ser Leu Leu Asp Gly Glu Arg His Ile Lys Glu Ile 930 935 940 Pro Lys Asn Arg Phe Asp Leu Ser Lys Trp Tyr Asp Glu Thr Gly Lys 945 950 955 960 Gln Lys Asn Ala Thr Met Asn Arg Ser Gly Ala Phe Leu Asp Arg Pro 965 970 975 Gly Tyr Phe Asp Asn Arg Leu Phe Asn Met Ser Pro Arg Glu Ala Leu 980 985 990 Gln Thr Asp Pro Leu His Arg Met Phe Leu Thr Val Ser Tyr Glu Ala 995 1000 1005 Leu Glu Met Ala Gly Tyr Ser Pro Glu Ala Thr Leu Ala Thr Asn 1010 1015 1020 Ser Asn Arg Ile Ala Thr Tyr Phe Gly Gln Thr Ser Asp Asp Trp 1025 1030 1035 Arg Asp Ile Val Leu Thr Gln Gly Val Asp Ile Tyr Tyr Ala Pro 1040 1045 1050 Gly Ile Cys Arg Ala Phe Ala Pro Gly Arg Leu Asn Tyr His Phe 1055 1060 1065 Lys Trp Gly Gly Pro Ser Tyr Ser Val Asp Ala Ala Cys Ala Ser 1070 1075 1080 Ser Ile Ala Thr Ile Ser Leu Ala Cys Ser Ala Leu Leu Ala Arg 1085 1090 1095 Glu Cys Asp Thr Ala Leu Ala Gly Gly Gly Ser Ile Leu Asp Ser 1100 1105 1110 Pro Ala Pro Phe Ala Gly Leu Ser Arg Gly Gly Phe Leu Ser Pro 1115 1120 1125 Glu Lys Gly Cys Glu Thr Phe His Asp Asp Ala Asp Gly Tyr Val 1130 1135 1140 Arg Gly Glu Gly Val Gly Val Val Val Leu Lys Arg Leu Glu Asp 1145 1150 1155 Ala Val Ala Asp Asn Asp Asn Ile Leu Gly Val Ile Arg Gly Ser 1160 1165 1170 Ala Arg Asn Tyr Ser Lys Gly Ala Ser Ser Ile Thr His Pro Ser 1175 1180 1185 Ser Glu Ala Gln Gln Arg Leu Tyr Arg Gln Val Leu Asn Gln Asn 1190 1195 1200 Ala Ile Asp Ala Ala Ser Val Ser Tyr Val Glu Met His Gly Thr 1205 1210 1215 Gly Thr Gln Ala Gly Asp Ser Thr Glu Met Ser Ser Val Leu Ser 1220 1225 1230 Thr Phe Gly Gln Ser Arg Ser Lys Asp Asn Pro Leu Val Val Gly 1235 1240 1245 Ala Val Lys Ala Asn Ile Gly His Gly Glu Ala Ala Ala Gly Val 1250 1255 1260 Cys Ala Leu Ile Lys Thr Leu Met Met Phe Gln Lys His Thr Ile 1265 1270 1275 Pro Pro Gln Pro Gly Met Pro Phe Lys Leu Asn His His Phe Pro 1280 1285 1290 Asp Leu Glu Lys Met Asn Val His Ile Pro Ala Thr Ala Ile Pro 1295 1300 1305 Leu Thr Ser Ala Ser Asn Ala Ala Lys Arg Arg Ile Phe Leu Asn 1310 1315 1320 Ser Phe Asp Ala Ser Gly Gly Asn Ser Cys Leu Leu Leu Glu Glu 1325 1330 1335 Ala Pro Leu Lys His Ser Lys Ala Ser Asp Pro Arg Asn His His 1340 1345 1350 Val Val Thr Phe Ser Ala Arg Thr Pro Phe Ser Leu Arg Ala Ile 1355 1360 1365 Lys Glu Lys Tyr Leu Gln Tyr Ile Arg Leu Asn Pro Asn Thr Ser 1370 1375 1380 Leu Ala Asp Leu Ala Tyr Thr Thr Thr Ala Arg Arg Met His Gln 1385 1390 1395 Ser Ser Ala Arg Ser Thr Phe Thr Ala Thr Ser Ile Glu Asp Phe 1400 1405 1410 Ala Asn Lys Leu Glu Thr Asp Leu Lys Lys Glu Asp Ser Pro Val 1415 1420 1425 Lys Lys Ser Lys Gly Ala Ser Ser Gly Pro Asn Val Val Phe Ala 1430 1435 1440 Phe Thr Gly Gln Gly Ser Gln Tyr Ala Gly Met Ala His Gln Leu 1445 1450 1455 Trp His Asp Ser Ala Val Phe Arg Arg Leu Ile Asp Ser Ile Gln 1460 1465 1470 Ser Ile Ala Thr Ala Leu Asp Leu Pro Lys Phe Val Asp Leu Ile 1475 1480 1485 Ala Ser Gln Ser Phe Asp Leu Ser Lys Ala Ser Pro Ile Gln Thr 1490 1495 1500 Gln Leu Ala Ile Val Ala Leu Glu Ile Gly Leu Ala Gln Leu Trp 1505 1510 1515 Ala Ser Trp Gly Val Gln Pro Ser Leu Val Ile Gly His Ser Leu 1520 1525 1530 Gly Glu Tyr Ala Ala Leu Cys Ile Ser Gly Val Leu Thr Val Ser 1535 1540 1545 Asp Thr Leu Tyr Leu Val Gly Lys Arg Ala Met Met Leu Val Glu 1550 1555 1560 Ser Val Ala Gln Asn Glu Tyr Ala Met Leu Ala Ile Asn Asp Glu 1565 1570 1575 Val Asp Ile Ile Arg Gln Arg Leu Ala Thr Asp Ala Tyr Asn Thr 1580 1585 1590 Cys Glu Ile Ala Cys Ile Asn Ala Pro Lys Ser Thr Val Val Ser 1595 1600 1605 Gly Ala Leu Ser Glu Ile Lys Ile Met Gln Lys Glu Leu Glu Glu 1610 1615 1620 Gln Gly Tyr Arg Ser Thr Leu Leu His Val Pro Phe Gly Phe His 1625 1630 1635 Ser Lys Gln Met Asp Pro Ile Leu Asp Ser Tyr Glu Ser Cys Val 1640 1645 1650 Gln Gly Val Gly Ile Ser Ser Pro Arg Val Pro Ile Ala Ser Thr 1655 1660 1665 Leu Leu Gly Asp Ile Ile Gln Asp Lys Ser Thr Val Ser Ser Val 1670 1675 1680 Tyr Leu Arg Arg Gln Thr Arg Glu Ser Val Asn Phe Val Gly Ala 1685 1690 1695 Leu Gln Ala Ala Gln Val Ser Asn Phe Leu Arg Asp Asp Thr Leu 1700 1705 1710 Phe Leu Glu Met Gly Pro Asp Pro Val Cys Met Ser Leu Val Arg 1715 1720 1725 Ser Thr Leu Gly Thr Ile Ala Thr Pro Arg Leu Leu Pro Ala Leu 1730 1735 1740 Arg Arg Asn Glu Asn Asn Trp Leu Thr Thr Ser Asn Thr Leu Ala 1745 1750 1755 Ala Val His Gln Ala Gly Val Pro Val Asn Trp Pro Asp Tyr His 1760 1765 1770 Arg Glu Phe Thr Asn Cys Leu Thr Leu Leu Asp Leu Pro Thr Tyr 1775 1780 1785 Val Phe Asp Glu Lys Glu Phe Trp Thr Ser Tyr Pro Asp Pro Glu 1790 1795 1800 Gln Leu Ser Gly Val Glu Gln Lys His Leu Ser Pro Pro Pro Val 1805 1810 1815 Pro Ala Val Gln Gly Phe Pro Thr Thr Thr Leu Gln Arg Leu Thr 1820 1825 1830 Gln Glu Ala Phe Glu Asp Gly Lys Ile Ser Val Thr Phe Glu Ser 1835 1840 1845 Ser Thr Ser Asp Pro His Leu Phe Glu Ala Ile Met Gly His Ala 1850 1855 1860 Val Ala Gly Val Thr Ile Cys Ser Ser Ser Ile Phe Ser Asp Met 1865 1870 1875 Ala Leu Ser Ala Ala Arg Tyr Thr Cys Glu Arg Leu Gln Pro Gly 1880 1885 1890 Arg Trp Ser Glu Glu Leu Leu Thr Ile Ser Gly Leu Asp Ile Gln 1895 1900 1905 Arg Pro Ile Val Val Leu Asp Arg Lys Asp Ser His Ile Ile Gln 1910 1915 1920 Ile Asn Ala Lys Leu Asp Ala Lys Thr Glu Glu Val Tyr Ile Ser 1925 1930 1935 Phe Gln Asp Gln Val Gly Lys Pro Ile Gly Ser Cys Lys Ile Ser 1940 1945 1950 Phe His Asp Ala Ala Ser Trp Lys Gln Asn Ile Ser Arg Ile Leu 1955 1960 1965 Tyr Leu Val Ser Phe Arg Ile Asp Val Leu Lys Glu Ala Thr Ile 1970 1975 1980 Thr Gly Gln Gly His Arg Phe Leu Arg Pro Val Ile Tyr Arg Leu 1985 1990 1995 Phe Ser Asn Val Val Asn Tyr Gly Glu Arg Phe Gln Gly Leu Glu 2000 2005 2010 Glu Val Phe Leu Asp Ser Glu Cys Asn Asp Val Val Gly Gln Val 2015 2020 2025 Arg Leu Pro Asp Leu Pro Ser Ser Lys Ser Gly His Phe Leu Tyr 2030 2035 2040 Ser Pro Tyr Leu Leu Asp Ala Val Val His Val Ala Gly Phe Leu 2045 2050 2055 Val Asn Cys Gly Leu Lys Tyr Pro Glu Asp Ile Gly Phe Leu Ala 2060 2065 2070 Ser Ser Phe Glu Ser Trp His Ile Leu Lys Pro Ile Leu Pro Asn 2075 2080 2085 Lys Thr Tyr Thr Ser Tyr Ser His Met Glu Glu Ser Ser Asn Gly 2090 2095 2100 Ser Ser Leu Leu Gly Asp Val Tyr Val Phe Asp Gly Lys Asp Leu 2105 2110 2115 Val Gly Ser Leu Thr Gly Leu Arg Phe Gln Lys Met Lys Lys Ile 2120 2125 2130 Ala Leu Thr Arg Ile Leu Gln Ser Ala Ala Pro His Ser Ser Met 2135 2140 2145 Lys Ile Gly Ala Gly Val Phe Arg Pro Asp Leu Leu Gly Ser Ser 2150 2155 2160 Glu Lys Gln Ser Ser Arg Asn Lys Gln Leu Ala Arg Asp Val Asp 2165 2170 2175 Phe Asp Thr Leu Pro Ser Ser Val Glu Pro Ser Ala Phe Thr Thr 2180 2185 2190 Pro Lys Pro Ser Ser Ser Val Thr Ser Ile Ile Gly His Asp Glu 2195 2200 2205 Pro Gly Val Gly Asp Lys Phe Leu Ala Ala Val Ala Ala Glu Val 2210 2215 2220 Gly Cys Glu Ile Ser Asp Leu Glu Pro Asp Thr Val Phe Gly Asp 2225 2230 2235 Leu Gly Val Asp Ser Leu Met Ala Ile Thr Val Ile Ala Ser Ile 2240 2245 2250 Arg Asn Asp Thr Gly Val Glu Leu Pro Gly Ser Phe Phe Leu Asp 2255 2260 2265 Asn Pro Thr Val Ala Glu Ala Thr Lys Ala Leu Arg Gly Asp Ser 2270 2275 2280 Asp Ala Gly Ile Ser Thr Pro Gln Ser Ser Pro Pro Asn Leu Ser 2285 2290 2295 Pro Lys Ile Arg Gly Glu Glu Val Asn Gly Glu Ser Ser Val Pro 2300 2305 2310 Phe Glu Pro Leu Glu Thr Thr Pro Ser Ile Thr Thr Asp Phe Glu 2315 2320 2325 Val Gly Arg Ala Thr Glu Thr Pro Leu Leu Ile Asp Lys Pro Ala 2330 2335 2340 Ala Thr Leu Leu Leu Gln Gly Ser Val Ala Ser Thr Glu Pro Pro 2345 2350 2355 Leu Phe Leu Leu Ala Asp Gly Thr Gly Ser Val Ser Ser Tyr Ile 2360 2365 2370 Gln Leu Pro Ala Leu Ser Gly Gly Arg Arg Ile Tyr Gly Val Glu 2375 2380 2385 Ser Pro Phe Ala Arg Asp Pro Ser Ala Phe Val Asp Ile Ser Val 2390 2395 2400 Gly Asp Leu Ala Asp Ala Phe Ile Phe Ser Ile Arg Lys Val Gln 2405 2410 2415 Pro Val Gly Pro Tyr Val Ile Gly Gly Ser Ser Leu Gly Ala Ile 2420 2425 2430 His Ala Phe Glu Val Ser His Arg Leu Leu Asn Ala Gly Glu Thr 2435 2440 2445 Val Ser Glu Leu Leu Leu Ile Ala Asn Ala Ala Pro Ile Pro Ala 2450 2455 2460 Pro Ala His Leu Arg His Leu Glu Ile Ser Thr Glu Met Ile Glu 2465 2470 2475 Lys Ser Gly Ile Ala Tyr Gly Thr Gly Arg Lys Lys Leu Ser Thr 2480 2485 2490 Leu Ser Ala Arg Gln Lys Gln His Leu Thr Ala Ser Val Arg Ser 2495 2500 2505 His Val Leu Tyr Glu Pro Gln Ala Phe Thr Glu Thr His Arg Pro 2510 2515 2520 Val His Thr Thr Leu Ile Val Ala Ser Lys Gly Leu Gly Gly Gly 2525 2530 2535 Thr Ser Ser Pro Glu Cys Pro Leu Thr Pro Trp Ile Gln Ala Asn 2540 2545 2550 Trp Gly Ser Ser Glu Thr Leu Gly Trp Asp Gly Leu Val Gly Glu 2555 2560 2565 Ile His Ser Ile His Arg Glu Asp Thr Asp Ser Phe Ser Leu Leu 2570 2575 2580 Lys Tyr Pro Asn Ile Thr Lys Leu Gly Gln Ile Ile Asn Asp Arg 2585 2590 2595 Val Cys His Ala 2600 <210> 17 <211> 1143 <212> DNA <213> Talaromyces islandicus <220> <221> CDS <222> (1)..(1143) <400> 17 atg tct gcg agc gta gaa aca gcg tgg tcg cag tgt ctg cga ata att 48 Met Ser Ala Ser Val Glu Thr Ala Trp Ser Gln Cys Leu Arg Ile Ile 1 5 10 15 gca aag gag aca ggg ttt agt atc gac gat atc gat gac gag gat gaa 96 Ala Lys Glu Thr Gly Phe Ser Ile Asp Asp Ile Asp Asp Glu Asp Glu 20 25 30 ttc acc aca gat ctc ggt gtc aac ccg att gtc gca cgg tca att ata 144 Phe Thr Thr Asp Leu Gly Val Asn Pro Ile Val Ala Arg Ser Ile Ile 35 40 45 cgt tct ttc gaa agc gtc ttg aaa aga gac att ccc tcg act gta ttt 192 Arg Ser Phe Glu Ser Val Leu Lys Arg Asp Ile Pro Ser Thr Val Phe 50 55 60 acc cag tgt cca act atc aaa gaa ttt cgc ggc gga tac ttt cag tca 240 Thr Gln Cys Pro Thr Ile Lys Glu Phe Arg Gly Gly Tyr Phe Gln Ser 65 70 75 80 tgc att gat agt atc acg gag cca aag gac gac ctg gca gta aag aaa 288 Cys Ile Asp Ser Ile Thr Glu Pro Lys Asp Asp Leu Ala Val Lys Lys 85 90 95 gct gca aca gcg cac gga gga aat aaa aaa tca act acg aac act act 336 Ala Ala Thr Ala His Gly Gly Asn Lys Lys Ser Thr Thr Asn Thr Thr 100 105 110 cgt acg cga gct cgc gtc ccg atc tcc att gtg ctc caa ggc aag cca 384 Arg Thr Arg Ala Arg Val Pro Ile Ser Ile Val Leu Gln Gly Lys Pro 115 120 125 acg atg gat tgt gcc gag aag acc aac atc ttc ctt cta cct gac ggc 432 Thr Met Asp Cys Ala Glu Lys Thr Asn Ile Phe Leu Leu Pro Asp Gly 130 135 140 agt ggt tcc ggg atg gct tat gtg gaa atg cca ctt atc gat cct tct 480 Ser Gly Ser Gly Met Ala Tyr Val Glu Met Pro Leu Ile Asp Pro Ser 145 150 155 160 act gtc tgt ctt gtt gcg ttg aat agt ccc tat ctc aac cgc gcc tcg 528 Thr Val Cys Leu Val Ala Leu Asn Ser Pro Tyr Leu Asn Arg Ala Ser 165 170 175 gag tac tgt tgt tca atc gaa gaa att gca aga gag tac gtg caa gag 576 Glu Tyr Cys Cys Ser Ile Glu Glu Ile Ala Arg Glu Tyr Val Gln Glu 180 185 190 att cgt aaa cgc caa cct cac gga cct tac gtg ctt ggg ggc tgg tct 624 Ile Arg Lys Arg Gln Pro His Gly Pro Tyr Val Leu Gly Gly Trp Ser 195 200 205 gcc ggt ggt tat tac tca tat gaa gtg gcg tgt gaa ctc atc cgt caa 672 Ala Gly Gly Tyr Tyr Ser Tyr Glu Val Ala Cys Glu Leu Ile Arg Gln 210 215 220 ggt gaa cgt gtg aaa aag ctc att ttg ctc gat tct cct tgt cgg cca 720 Gly Glu Arg Val Lys Lys Leu Ile Leu Leu Asp Ser Pro Cys Arg Pro 225 230 235 240 gat ttt gag gag ctt cca atg gaa gtg gtg cag tat tta tcc aaa aag 768 Asp Phe Glu Glu Leu Pro Met Glu Val Val Gln Tyr Leu Ser Lys Lys 245 250 255 aac ctt atg ggc aac tgg gac cgc agt gct cga cat aca agt gtt cct 816 Asn Leu Met Gly Asn Trp Asp Arg Ser Ala Arg His Thr Ser Val Pro 260 265 270 tct tgg gtc atc gag cat ttc cgc tcg act ctt cgg gcg gta cgt gag 864 Ser Trp Val Ile Glu His Phe Arg Ser Thr Leu Arg Ala Val Arg Glu 275 280 285 tat gtg cca gtg ccg atg gac gct gct gat gct cca gac gaa gtt tgc 912 Tyr Val Pro Val Pro Met Asp Ala Ala Asp Ala Pro Asp Glu Val Cys 290 295 300 atc atc tgg agt cga gaa ggt gta atg cca gca aac cag ctt cga aga 960 Ile Ile Trp Ser Arg Glu Gly Val Met Pro Ala Asn Gln Leu Arg Arg 305 310 315 320 acg ggt ttg gat ctc cgc gtc cgc gtc gca cgt ttt ctt ctc gaa gga 1008 Thr Gly Leu Asp Leu Arg Val Arg Val Ala Arg Phe Leu Leu Glu Gly 325 330 335 aaa cct gat ctc acc agt gca tac ggg tgg gac cgg ctt ttc ccc gga 1056 Lys Pro Asp Leu Thr Ser Ala Tyr Gly Trp Asp Arg Leu Phe Pro Gly 340 345 350 gcg cac atc agc att tcg tct atc tcg ggc aat cac ttc acc ctg atc 1104 Ala His Ile Ser Ile Ser Ser Ile Ser Gly Asn His Phe Thr Leu Ile 355 360 365 aac aaa ccc aac gta agc gtc tgt tcc ttt ccc gag tag 1143 Asn Lys Pro Asn Val Ser Val Cys Ser Phe Pro Glu 370 375 380 <210> 18 <211> 380 <212> PRT <213> Talaromyces islandicus <400> 18 Met Ser Ala Ser Val Glu Thr Ala Trp Ser Gln Cys Leu Arg Ile Ile 1 5 10 15 Ala Lys Glu Thr Gly Phe Ser Ile Asp Asp Ile Asp Asp Glu Asp Glu 20 25 30 Phe Thr Thr Asp Leu Gly Val Asn Pro Ile Val Ala Arg Ser Ile Ile 35 40 45 Arg Ser Phe Glu Ser Val Leu Lys Arg Asp Ile Pro Ser Thr Val Phe 50 55 60 Thr Gln Cys Pro Thr Ile Lys Glu Phe Arg Gly Gly Tyr Phe Gln Ser 65 70 75 80 Cys Ile Asp Ser Ile Thr Glu Pro Lys Asp Asp Leu Ala Val Lys Lys 85 90 95 Ala Ala Thr Ala His Gly Gly Asn Lys Lys Ser Thr Thr Asn Thr Thr 100 105 110 Arg Thr Arg Ala Arg Val Pro Ile Ser Ile Val Leu Gln Gly Lys Pro 115 120 125 Thr Met Asp Cys Ala Glu Lys Thr Asn Ile Phe Leu Leu Pro Asp Gly 130 135 140 Ser Gly Ser Gly Met Ala Tyr Val Glu Met Pro Leu Ile Asp Pro Ser 145 150 155 160 Thr Val Cys Leu Val Ala Leu Asn Ser Pro Tyr Leu Asn Arg Ala Ser 165 170 175 Glu Tyr Cys Cys Ser Ile Glu Glu Ile Ala Arg Glu Tyr Val Gln Glu 180 185 190 Ile Arg Lys Arg Gln Pro His Gly Pro Tyr Val Leu Gly Gly Trp Ser 195 200 205 Ala Gly Gly Tyr Tyr Ser Tyr Glu Val Ala Cys Glu Leu Ile Arg Gln 210 215 220 Gly Glu Arg Val Lys Lys Leu Ile Leu Leu Asp Ser Pro Cys Arg Pro 225 230 235 240 Asp Phe Glu Glu Leu Pro Met Glu Val Val Gln Tyr Leu Ser Lys Lys 245 250 255 Asn Leu Met Gly Asn Trp Asp Arg Ser Ala Arg His Thr Ser Val Pro 260 265 270 Ser Trp Val Ile Glu His Phe Arg Ser Thr Leu Arg Ala Val Arg Glu 275 280 285 Tyr Val Pro Val Pro Met Asp Ala Ala Asp Ala Pro Asp Glu Val Cys 290 295 300 Ile Ile Trp Ser Arg Glu Gly Val Met Pro Ala Asn Gln Leu Arg Arg 305 310 315 320 Thr Gly Leu Asp Leu Arg Val Arg Val Ala Arg Phe Leu Leu Glu Gly 325 330 335 Lys Pro Asp Leu Thr Ser Ala Tyr Gly Trp Asp Arg Leu Phe Pro Gly 340 345 350 Ala His Ile Ser Ile Ser Ser Ile Ser Gly Asn His Phe Thr Leu Ile 355 360 365 Asn Lys Pro Asn Val Ser Val Cys Ser Phe Pro Glu 370 375 380

Claims (32)

  1. 더 단순한 대사산물들로부터 올리베톨산(olivetolic acid) 및 이의 유사체들을 생산하는 일련의 분리된 효소들을 포함하는 생합성 플랫폼으로서, 상기 일련의 효소들은
    헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산 및/또는 이들의 유사체들을 포함하는 일련의 대사산물들을 방향족 디올 대사산물로 전환시키는 비-환원 폴리케타이드 합성효소(non-reducing polyketide synthase, NRPKS); 및
    상기 방향족 디올 대사산물을 올리베톨산 및 이의 유사체들로 전환시키는 티오에스테라제(thioesterase, TE)를 포함하는 생합성 플랫폼.
  2. 제1항에 있어서, 아세틸-CoA, 말로닐-CoA 및 NADPH를 이용하여 헥사노일-CoA, 헥사노익산, 옥타노일-CoA, 옥탄산 및/또는 이들의 유사체로부터 선택되는 일련의 대사산물들을 합성하는 고-환원 폴리케타이드 합성효소(highly-reducing polyketide synthase, HRPKS)를 추가로 포함하는 것을 특징으로 하는 생합성 플랫폼.
  3. 제1항 또는 제2항에 있어서, 상기 올리베톨산의 유사체들은 2-헵틸-4,6-디히드록시벤조산, (E)-2-(헵트-1-엔-1-일)-4,6-디히드록시벤조산, 및 (E)-2,4-디히드록시-6-(펜트-1-엔-1-일) 벤조산으로 구성된 군으로부터 선택되는 것을 특징으로 하는 생합성 플랫폼.
  4. 제1항에 있어서, 상기 생합성 플랫폼을 구성하는 하나 이상의 효소들은 진균(fungi)으로부터 유래하는 것을 특징으로 하는 생합성 플랫폼.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 생합성 플랫폼을 구성하는 일련의 효소들은 메타리지움 아니소플리애(Metarhizium anisopliae), 톨리포클라디움 인플라툼(Tolypocladium inflatum), 메타리지움 라일리(Metarhizium rileyi) 및/또는 탈라로마이세스 아일랜드디쿠스(Talaromyces islandicus)로부터 유래하는 것을 특징으로 하는 생합성 플랫폼.
  6. 제1항에 있어서, 상기 NRPKS는 SEQ ID NO: 4의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는 것을 특징으로 하는 생합성 플랫폼.
  7. 제6항에 있어서, 상기 NRPKS는 SEQ ID NO: 4, 10 또는 16의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 1 내지 20개의 보존적 아미노산 치환(conservative amino acid substitutions)을 함유하는 것을 특징으로 하는 생합성 플랫폼.
  8. 제6항에 있어서, 상기 NRPKS는 SEQ ID NO: 4, 10 또는 16의 서열을 포함하는 것을 특징으로 하는 생합성 플랫폼.
  9. 제1항에 있어서, 상기 TE는 SEQ ID NO: 6의 서열과 적어도 45%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는 것을 특징으로 하는 생합성 플랫폼.
  10. 제9항에 있어서, 상기 TE는 SEQ ID NO: 6, 12 또는 18의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 1 내지 20개의 보존적 아미노산 치환을 함유하는 것을 특징으로 하는 생합성 플랫폼.
  11. 제9항에 있어서, 상기 TE는 SEQ ID NO: 6, 12 또는 18의 서열을 포함하는 것을 특징으로 하는 생합성 플랫폼.
  12. 제2항에 있어서, 상기 HRPKS는 SEQ ID NO: 2의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 서열을 갖는 것을 특징으로 하는 생합성 플랫폼.
  13. 제12항에 있어서, 상기 HRPKS는 SEQ ID NO: 2, 8 또는 14의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖고, 1 내지 20개의 보존적 아미노산 치환을 함유하는 것을 특징으로 하는 생합성 플랫폼.
  14. 제12항에 있어서, 상기 HRPKS는 SEQ ID NO: 2, 8 또는 14의 서열을 포함하는 것을 특징으로 하는 생합성 플랫폼.
  15. 제1항 내지 제14항 중 어느 한 항의 생합성 플랫폼을 구성하는 일련의 효소들을 코딩하는 폴리뉴클레오티드 서열들을 포함하는 무세포(cell-free) 시스템에서 생합성 플랫폼을 발현하기 위한 선형 발현 템플릿(linear expression template, LET).
  16. 제15항에 있어서, 상기 폴리뉴클레오티드는 하기로 구성된 군으로부터 선택되는 폴리펩티드를 코딩하는 것을 특징으로 하는 LET:
    (i) SEQ ID NO: 2, 8, 또는 14의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 폴리펩티드;
    (ii) SEQ ID NO: 4, 10 또는 16의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 폴리펩티드;
    (iii) SEQ ID NO: 6, 12, 또는 18의 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 또는 99% 동일한 폴리펩티드; 및
    (iv) (i), (ii) 및 (iii)의 임의의 조합.
  17. 제15항에 있어서,
    HRPKS 활성을 갖고 SEQ ID NO: 2, 8 또는 14의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열;
    NRPKS 활성을 갖고 SEQ ID NO: 4, 10 또는 16의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열; 및
    TE 활성을 갖고 SEQ ID NO: 6, 12 또는 18의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열
    을 포함하는 것을 특징으로 하는 LET.
  18. 제15항에 있어서, 상기 LET는 SEQ ID NO:1, 7 및 13으로 구성된 군으로부터 선택되는 폴리뉴클레오티드 서열을 포함하는 것을 특징으로 하는 LET.
  19. 제15항 또는 제18항에 있어서, 상기 LET는 SEQ ID NO: 3, 9 및 15로 구성된 군으로부터 선택되는 폴리뉴클레오티드 서열을 포함하는 것을 특징으로 하는 LET.
  20. 제15항, 제18항 또는 제19항에 있어서, 상기 LET는 SEQ ID NO: 5, 11 및 17로 구성된 군으로부터 선택되는 폴리뉴클레오티드 서열을 포함하는 것을 특징으로 하는 LET.
  21. 제1항 내지 제20항 중 어느 한 항의 생합성 플랫폼을 구성하는 일련의 효소들을 코딩하는 폴리뉴클레오티드 서열들을 포함하는 플라스미드(들) 또는 벡터(들).
  22. 제21항에 있어서,
    HRPKS 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고, 상기 폴리펩티드는 SEQ ID NO: 2, 8 또는 14의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 제1 플라스미드;
    NRPKS 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고, 상기 폴리펩티드는 SEQ ID NO: 4, 10 또는 16의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 제2 플라스미드; 및
    TE 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고, 상기 폴리펩티드는 SEQ ID NO: 6, 12 또는 18의 서열과 적어도 95%, 98%, 또는 99% 동일한 서열을 갖는 제3 플라스미드
    를 포함하는 것을 특징으로 하는 플라스미드(들) 또는 벡터(들).
  23. 제21항 또는 제22항의 플라스미드(들) 또는 벡터(들)를 포함하는 재조합 미생물.
  24. 제23항에 있어서, 상기 재조합 미생물은 박테리움(bacterium), 고세균(archaeum) 또는 진균(fungus)인 것을 특징으로 하는 재조합 미생물.
  25. 제24항에 있어서, 상기 재조합 미생물은 대장균(Escherichia coli), 로드호박터 스페로이데스(Rodhobacter sphaeroides), 슈도알테로모나스 할로플랑크티스(Pseudoalteromonas haloplanktis), 시와넬라 sp. 균주 Ac10(Shewanella sp. strain Ac10), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 푸티다(Pseudomonas putida), 녹농균(Pseudomonas aeruginosa), 할로모나스 엘롱가타(Halomonas elongata), 크로모할로박터 살렉시겐(Chromohalobacter salexigens), 스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 그리세우스(Streptomyces griseus), 노카르디아 락탐두란스(Nocardia lactamdurans), 마이코박테리움 스메그마티스(Mycobacterium smegmatis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 브레비박테리움 락토퍼멘툼(Brevibacterium lactofermentum), 고초균(Bacillus subtilis), 바실러스 브레비스(Bacillus brevis), 바실러스 메가테리움(Bacillus megaterium), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 락토코커스 락티스(Lactococcus lactis), 락토바실러스 플란타룸(Lactobacillus plantarum), 락토바실러스 카세이(Lactobacillus casei), 락토바실러스 루테리(Lactobacillus reuteri), 및 락토바실러스 가세리(Lactobacillus gasseri)로 구성된 군에서 선택되는 박테리움인 것을 특징으로 하는 재조합 미생물.
  26. 제25항에 있어서, 상기 재조합 미생물은 대장균속(Escherichia) 또는 슈도모나스 푸티다(Pseudomonas putida)인 것을 특징으로 하는 재조합 미생물.
  27. 제24항에 있어서, 상기 재조합 미생물은 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피치아 파스토리스(Pichia pastoris), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴리티카(Yarrowia lipolytica), 아스페르길루스 니둘란스(Aspergillus nidulans), 트리코데르마 리세이(Trichoderma reesei), 푸사리움 옥시스포룸(Fusarium oxysporum), 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 아쉬비아 고쉬피(Ashbya gossypii), 누룩곰팡이(A. oryzae), 및 크리소스포리움 룩크노웬스(Chrysosporium lucknowense)로 구성된 군에서 선택되는 박테리움인 것을 특징으로 하는 재조합 미생물.
  28. 제27항에 있어서, 상기 재조합 미생물은 아스페르길루스 니둘란스(Aspergillus nidulans) 또는 사카로마이세스 세레비지애(Saccharomyces cerevisiae)인 것을 특징으로 하는 재조합 미생물.
  29. 아세틸-CoA, 말로닐-CoA, NADPH를 제15항 내지 제20항 중 어느 한 항의 LET를 포함하는 무세포 생물계, 또는 생합성 플랫폼을 포함하는 조 추출물 또는 정제된 추출물에 공급하는 단계를 포함하고, 상기 생합성 플랫폼은 제23항 내지 제28항 중 어느 한 항의 재조합 미생물로부터 추출된 것을 특징으로 하는 올리베톨산 및 이의 유사체들을 생산하는 무세포 방법.
  30. 제23항 내지 제28항 중 어느 한 항의 재조합 미생물을 배양하는 단계를 포함하는 올리베톨산 및 이의 유사체들을 생산하는 방법.
  31. 제29항에 있어서, 올리베톨산 및 이의 유사체들을 분리(isolating) 및 정제(purifying)하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  32. 제30항에 있어서, 올리베톨산 및 이의 유사체들을 분리(isolating) 및 정제(purifying)하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
KR1020227027349A 2020-01-10 2021-01-09 올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼 KR20220126740A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062959849P 2020-01-10 2020-01-10
US62/959,849 2020-01-10
PCT/US2021/012866 WO2021142393A1 (en) 2020-01-10 2021-01-09 Biosynthetic platform for the production of olivetolic avid and analogues of olivetolic acid

Publications (1)

Publication Number Publication Date
KR20220126740A true KR20220126740A (ko) 2022-09-16

Family

ID=76788339

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227027349A KR20220126740A (ko) 2020-01-10 2021-01-09 올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼

Country Status (9)

Country Link
US (1) US20230051453A1 (ko)
EP (1) EP4087932A4 (ko)
JP (1) JP2023509662A (ko)
KR (1) KR20220126740A (ko)
CN (1) CN115151643A (ko)
BR (1) BR112022013503A2 (ko)
CA (1) CA3163708A1 (ko)
MX (1) MX2022008463A (ko)
WO (1) WO2021142393A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3129577A1 (en) * 2019-02-10 2020-08-13 Dyadic International (Usa), Inc. Production of cannabinoids in filamentous fungi

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4551433A (en) 1981-05-18 1985-11-05 Genentech, Inc. Microbial hybrid promoters
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5426039A (en) 1993-09-08 1995-06-20 Bio-Rad Laboratories, Inc. Direct molecular cloning of primer extended DNA containing an alkane diol
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
CA2266423A1 (en) 1996-09-27 1998-04-02 Maxygen, Inc. Methods for optimization of gene therapy by recursive sequence shuffling and selection
DE69835360T2 (de) 1997-01-17 2007-08-16 Maxygen, Inc., Redwood City EVOLUTION Prokaryotischer GANZER ZELLEN DURCH REKURSIVE SEQUENZREKOMBINATION
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
AU6611498A (en) 1997-03-18 1998-10-12 Novo Nordisk A/S Method for constructing a library using dna shuffling
BR9808368A (pt) 1997-03-18 2000-05-23 Novo Nordisk As Processos para a construção de uma biblioteca de polinucleotideos homólogos recombinados, para a identificação um polipeptìdeo de interesse, e, para a produção de um polipeptìdeo de interesse.
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6399383B1 (en) 1997-10-28 2002-06-04 Maxygen, Inc. Human papilloma virus vectors
EP1030861A4 (en) 1997-10-31 2001-09-05 Maxygen Inc MODIFICATION OF VIRAL TROPISM AND THE DIVERSITY OF HOST SPECIES BY RECOMBINATION OF THE VIRAL GENOME
US6537746B2 (en) 1997-12-08 2003-03-25 Maxygen, Inc. Method for creating polynucleotide and polypeptide sequences
CA2320958A1 (en) 1998-02-11 1999-08-19 Maxygen, Inc. Antigen library immunization
CA2320431A1 (en) 1998-02-11 1999-08-19 Maxygen, Inc. Targeting of genetic vaccine vectors
ATE547532T1 (de) 1998-06-29 2012-03-15 Bristol Myers Squibb Co Verfahren zur erzeugung von hochgradig diversen bibliotheken
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
AU1199000A (en) 1998-09-29 2000-04-17 Maxygen, Inc. Shuffling of codon altered genes
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
AU2415200A (en) 1999-01-18 2000-08-01 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
EP1062614A1 (en) 1999-01-19 2000-12-27 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides
AU2001241939A1 (en) 2000-02-28 2001-09-12 Maxygen, Inc. Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation
CN110914416B (zh) * 2017-04-27 2023-07-21 加州大学董事会 产生大麻素和大麻素衍生物的微生物和方法

Also Published As

Publication number Publication date
EP4087932A1 (en) 2022-11-16
CA3163708A1 (en) 2021-07-15
JP2023509662A (ja) 2023-03-09
EP4087932A4 (en) 2024-01-17
CN115151643A (zh) 2022-10-04
MX2022008463A (es) 2022-10-18
US20230051453A1 (en) 2023-02-16
WO2021142393A1 (en) 2021-07-15
BR112022013503A2 (pt) 2022-09-13

Similar Documents

Publication Publication Date Title
CN110651047B (zh) 用于在酵母中生产植物大麻素和植物大麻素类似物的方法和细胞系
US10837031B2 (en) Recombinant production systems for prenylated polyketides of the cannabinoid family
CN112789505B (zh) 用于生产大麻素和其它异戊二烯化的化合物的生物合成平台
US10696991B2 (en) Nepetalactol oxidoreductases, nepetalactol synthases, and microbes capable of producing nepetalactone
KR20100087695A (ko) 이소프로판올을 생산하도록 조작된 미생물
EP2935566B1 (en) Cyanobacterium sp. for production of compounds
US20220333142A1 (en) Engineered trans-enoyl coa reductase and methods of making and using
KR20220119046A (ko) 칸나비노이드 및 기타 프레닐화 화합물의 제조를 위한 생합성 플랫폼
JP2017534268A (ja) 有用産物の生産のための改変微生物および方法
KR20220126740A (ko) 올리베톨산 및 올리베톨산 유사체 생산을 위한 생합성 플랫폼
CN105940111B (zh) 从3-羟基羧酸经3-羟基羧基-核苷酸制备烯烃
CN108473972B (zh) 补身醇合酶iii
CN106011164B (zh) 基因元件、表达载体及其应用
CN114760980A (zh) 针对10-乙酰基-3,7-二羟基吩噁嗪的过氧化物酶活性
KR101725454B1 (ko) 하프니아 알베이 유래의 라이신 디카르복실라아제를 코딩하는 유전자, 이를 포함하는 재조합 벡터, 숙주세포 및 이를 이용한 카다베린의 생산방법
WO2023076966A1 (en) Engineered enzymes and methods of making and using
KR20230003072A (ko) 조작된 효소 및 이의 이용 및 제조 방법
WO2022148377A1 (zh) 异源合成黄酮类化合物的宿主细胞及其应用
CN116948999B (zh) 酮还原酶突变体、其组合物、生物材料及应用
EP4410972A1 (en) Modified benzalacetone synthase enzymes and uses thereof
CN111718966A (zh) 一种丁香酚的微生物合成方法