KR20150128705A - 재조합 숙주에서 스테비올 글리코시드의 효율적인 생성 - Google Patents
재조합 숙주에서 스테비올 글리코시드의 효율적인 생성 Download PDFInfo
- Publication number
- KR20150128705A KR20150128705A KR1020157024717A KR20157024717A KR20150128705A KR 20150128705 A KR20150128705 A KR 20150128705A KR 1020157024717 A KR1020157024717 A KR 1020157024717A KR 20157024717 A KR20157024717 A KR 20157024717A KR 20150128705 A KR20150128705 A KR 20150128705A
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- rebaudioside
- steviol
- polypeptide
- transporter
- Prior art date
Links
- 0 CC(CS(C1)(CC2)C(CC3)C4(C)C2C(C)(**)CCC4)C13C(C)=C Chemical compound CC(CS(C1)(CC2)C(CC3)C4(C)C2C(C)(**)CCC4)C13C(C)=C 0.000 description 6
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
- C07K14/395—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
- C12N9/0038—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12N9/0042—NADPH-cytochrome P450 reductase (1.6.2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0073—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
- C12N9/1062—Sucrose synthase (2.4.1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P15/00—Preparation of compounds containing at least three condensed carbocyclic rings
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y106/00—Oxidoreductases acting on NADH or NADPH (1.6)
- C12Y106/02—Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12Y106/02004—NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
- C12Y114/13078—Ent-kaurene oxidase (1.14.13.78)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01013—Sucrose synthase (2.4.1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01035—Phenol beta-glucosyltransferase (2.4.1.35)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01029—Geranylgeranyl diphosphate synthase (2.5.1.29)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/03—Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/03—Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
- C12Y402/03019—Ent-kaurene synthase (4.2.3.19)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y505/00—Intramolecular lyases (5.5)
- C12Y505/01—Intramolecular lyases (5.5.1)
- C12Y505/01013—Ent-copalyl diphosphate synthase (5.5.1.13)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Mycology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
Abstract
스테비올 글리코시드를 생성하거나, 하나 이상의 내인성 트랜스포터 또는 전사 인자 유전자의 변형된 발현을 지니거나, 하나 이상의 이종성 트랜스포터를 과다발현하여 관심 대상의 스테비올 글리코시드의 분비를 증가시키는, 재조합 미생물이 기재되어 있다.
Description
관련 출원의 상호 참조
본 출원은 2013년 2월 11일 출원된 미국 가출원 번호: 61/763,290, 및 2013년 2월 11일 출원된 미국 가출원 번호: 61/763,308의 이익을 청구하며, 이들 각각의 기재내용은 참조로 통합된다.
기술 분야
본 발명은 스테비올 글리코시드의 재조합 생성 및 이의 분리 방법에 관한 것이다. 특히, 본 발명은 재조합 숙주 예컨대, 재조합 미생물에 의한 스테비올 글리코시드 예컨대, 레바우디오시드 A (RebA), 레바우디오시드 B (RebB), 레바우디오시드 D (RebD), 레바우디오시드 E (RebE) 및 레바우디오시드 M (RebM)의 생성에 관한 것이다. 본 발명은 또한 이러한 스테비올 글리코시드의 생성, 분비 또는 이 둘 모두를 증가시키기 위한 재조합 숙주에서의 수송 시스템에 대한 변형에 관한 것이다.
감미료는 식품, 음료, 또는 과자 산업에서 가장 흔히 이용되는 성분들로 잘 알려져 있다. 감미료는 생산 동안 최종 식품에 통합될 수 있거나 단독 용도로 적절하게 희석시켰을 때, 식탁 감미료 또는 베이킹에서 설탕을 대체하는 가정용 대체물로 이용할 수 있다. 감미료는 예를 들어 수크로스, 고과당 옥수수 시럽, 당밀, 메이플 시럽, 및 꿀과 같은 천연 감미료, 및 예를 들어 아스파르탐, 사카린 및 수크랄로스와 같은 인공 감미료를 포함한다. 스테비아(Stevia) 추출물은 다년생 관목, 스테비아 레바우디아나(Stevia rebaudiana)로부터 분리되고 추출될 수 있는 천연 감미료이다. 스테비아 추출물의 상업적 생산을 위한 스테비아는 남미 및 아시에에서 흔히 자란다. 다양한 수준으로 정제된 스테비아 추출물은 식품 및 블렌드에서 고감도 감미료로 또는 단독으로 식탁 감미료로 상업적으로 이용된다.
스테비아 식물의 추출물들은 레바우디오시드 및 단맛에 기여하는 기타 스테비올 글리코시드를 함유하지만, 각 글리코시드의 양은 다양한 생산 일괄량 (batches)에 따라 흔히 변화한다. 전형적으로, 스테비오시드 및 레바우디오시드 A는 시판되는 스테비아 추출물의 주요 화합물이다. 스테비오시드는 레바우디오시드 A에 비해 보다 쓴맛이며 단맛이 덜한 것으로 보고된다. 스테비아 추출물의 조성물은 식물이 성장하는 토양 및 기후에 따라 매우 다양할 수 있다. 원료 식물, 기후 조건, 및 추출 공정에 따라, 상업적 제조 과정에서 레바우디오시드 A의 양은 총 스테비올 글리코시드 함량의 20 내지 97%로 다양한 것으로 보고된다. 또 다른 스테비올 글리코시드는 스테비아 추출물 중에 다양한 양으로 존재한다. 예를 들어, 레바우디오시드 B는 통상적으로 1-2% 미만으로 존재하는 반면, 레바우디오시드 C는 7-15% 만큼 높은 수준으로 존재할 수 있다. 레바우디오시드 D는 총 스테비올 글리코시드의 통상적으로 2% 이하의 수준으로 존재하고, 레바우디오시드 M은 통상적으로 미량 수준 (<0.1%)으로 존재하고, 레바우디오시드 F는 통상적으로 3.5% 이하로 조성물에 존재한다. 소량의 스테비올 글리코시드는 스테비아 추출물의 향미 프로필에 영향을 줄 수 있다.
디테르펜 스테비올 및 다양한 스테비올 글리코시드를 포함하여 스테비아 추출물들에서 발견된 몇몇 화합물에 대한 화학 구조물들을 표 1에 나타내었다. CAS 번호는 하기 표 1에 나타낸다. 또한, 문헌 [Hariet Wallin, Food Agric.Org (2007)]에 의해 제시된 스테비올 글리코시드 화학적 및 기술적 평가 (Steviol Glycosides Chemical and Technical Assessment) 69th JECFA를 참조하라.
화합물 | CAS # |
스테비올 | 471-80-7 |
레바우디오시드 A (RebA) | 58543-16-1 |
스테비올비오시드 | 41093-60-1 |
스테비오시드 | 57817-89-7 |
레바우디오시드 B (RebB) | 58543-17-2 |
레바우디오시드 C (RebC) | 63550-99-2 |
레바우디오시드 D (RebD) | 63279-13-0 |
레바우디오시드 E (RebE) | 63279-14-1 |
레바우디오시드 F (RebF) | 438045-89-7 |
레바우디오시드 M (RebM) | 1220616-44-3 |
루부소시드 (Rubu) | 63849-39-4 |
둘코시드 A | 64432-06-0 |
개요
본 문헌은 스테비올 글리코시드의 분비에 관련된 재조합 숙주에서 수송 시스템의 변형에 의해 스테비올 글리코시드 조성물을 유효하게 생성하는데 이용될 수 있는 물질 및 방법을 기술한다. 일부 구체예에서, 본원에 기술된 재조합 숙주는 적어도 하나의 스테비올 글리코시드를 생성할 수 있으며, 항생제를 활성적으로 분비하는 트랜스포터와 같은 이종성 트랜스포터를 발현할 수 있다. 일부 구체예에서, 본원에 기술된 재조합 숙주는 적어도 하나의 스테비올 글리코시드를 생성하며, 내인성 트랜스포터 유전자의 발현이 숙주에서 변형되고/거나 전사 인자 유전자의 발현이 변형되며, 여기에서 전사 인자는 적어도 하나의 내인성 트랜스포터 유전자의 발현을 조절한다. 활성적으로 항생제를 분비하는 내인성 트랜스포터의 발현 변형이 특히 유용하다. 일부 구체예에서, 복수의 내인성 트랜스포터 유전자, 전사 인자 유전자 또는 이 둘 모두의 발현이 변형된다. 이러한 재조합 숙주는 하나 이상의 생합성 유전자를 포함할 수 있는데, 이러한 유전자의 발현은 스테비올 글리코시드 예컨대, 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E, 또는 레바우디오시드 M의 생성을 유도한다. 이러한 생합성 유전자는 13-모노글루코시드 베타 1,2 글리코실트랜스퍼라제 및/또는 19-모노글루코시드-베타 1,2-글루코실트랜스퍼라제 (예를 들어, 91D2e 및 EUGT11) 및 기타 UDP 글리코실 트랜스퍼라제 예컨대, UGT74G1, UGT76G1, 및/또는 UGT85C2를 포함하여, 재조합 숙주에서 스테비올 글리코시드의 생성을 허용한다.
본 문헌은 또한, 스테비올 글리코시드 생성물을 생성하는 방법을 특징으로 한다. 이들 방법은 내인성 트랜스포터 유전자의 변형된 발현을 갖는 재조합 미생물 (예를 들어, 사카로마이세스 세레비시애 (Saccharomyces cerevisiae))을 이용하여 스테비올 글리코시드를 생성하고, 이어서 이를 선택적으로 발효 브로쓰로부터 정제할 수 있는, 발효 방법을 포함한다.
일 양태에서, 본 문헌은 스테비올 글리코시드의 분비에 영향을 끼치는 유전자 또는 유전자들을 확인하는 것은 물론 본원에 제시된 바와 같은 스테비올 글리코시드를 생성하도록 재조합 세포 특히, 미생물을 유전적으로 조작하기 위한 이의 재조합 구체예를 이용하는 대안적 방법을 특징으로 한다. 이들 방법은 스테비올 또는 스테비올 글리코시드를 생성할 수 있는 재조합 미생물에서 적어도 하나의 내인성 트랜스포터의 발현을 변형시키고; 스테비올 글리코시드가 합성되는 조건하에 배지에서 변형된 미생물을 배양하고; 변형이 결여된 상응하는 미생물에 의해 생성된 양과 비교하여 배양 단계 동안 생성된 세포외 및/또는 세포내 스테비올 글리코시드의 양을 측정하여 스테비올 글리코시드의 분비에 영향을 끼치는 것으로서 내인성 트랜스포터를 확인하는 것을 포함한다.
본 문헌은 또한, 스테비올 글리코시드의 분비에 영향을 끼치는 유전자 또는 유전자들을 확인하는 것은 물론 본원에 제시된 바와 같은 스테비올 글리코시드를 생성하도록 재조합 세포 특히, 미생물을 유전적으로 조작하기 위한 이의 재조합 구체예를 이용하는 방법을 특징으로 한다. 이들 방법은 미생물에서 적어도 하나의 내인성 트랜스포터의 발현을 변형시켜 변형된 미생물을 생성시키고; 변형된 미생물로 스테비올 글리코시드를 생성할 수 있는 하나 이상의 재조합 유전자를 도입시키고; 스테비올 글리코시드가 합성되는 조건하에 배지에서 변형된 미생물을 배양하고; 변형이 결여된 상응하는 미생물에 의해 생성된 양과 비교하여 배양 단계 동안 생성된 세포외 및/또는 세포내 스테비올 글리코시드의 양을 측정함으로써, 스테비올 글리코시드의 분비에 영향을 끼치는 것으로서 내인성 트랜스포터를 확인하는 것을 포함한다.
본 문헌은 또한, 스테비올 글리코시드의 분비에 영향을 끼치는 유전자 또는 유전자들을 확인하는 추가적인 방법을 여전히 특징으로 한다. 이들 방법은 스테비올 또는 스테비올 글리코시드를 생성할 수 있는 재조합 미생물에서 내인성 트랜스포터 유전자의 발현을 조절하는 적어도 하나의 내인성 전사 인자의 발현을 변형시키고; 스테비올 글리코시드가 합성되는 조건하에 배지에서 변형된 미생물을 배양하고; 변형이 결여된 상응하는 미생물에 의해 생성된 양과 비교하여 배양 단계 동안 생성된 세포외 및/또는 세포내 스테비올 글리코시드의 양을 측정함으로써, 스테비올 글리코시드의 분비에 영향을 끼치는 것으로서 전사 인자를 확인하는 것을 포함한다.
또 다른 구체예에서, 본 문헌은 여전히 스테비올 글리코시드의 분비에 영향을 끼치는 유전자 또는 유전자들을 확인하기 위한 더욱 추가의 방법을 특징으로 한다. 이들 방법은 미생물에서 내인성 트랜스포터 유전자의 발현을 조절하는 적어도 하나의 내인성 전사 인자의 발현을 변형시켜 변형된 미생물을 생성시키고; 변형된 미생물로 스테비올 글리코시드를 생성할 수 있는 하나 이상의 재조합 유전자를 도입시키고; 스테비올 글리코시드가 합성되는 조건하에 배지에서 변형된 미생물을 배양하고; 변형이 결여된 상응하는 미생물에 의해 생성된 양과 비교하여 배양 단계 동안 생성된 세포외 및/또는 세포내 스테비올 글리코시드의 양을 측정함으로써, 스테비올 글리코시드의 분비에 영향을 끼치는 것으로서 전사 인자를 확인하는 것을 포함한다.
또 다른 양태에서, 본 문헌은 스테비올 글리코시드의 분비에 영향을 끼치는 것으로 확인된 유전자 또는 유전자들의 발현을 변형시킴으로써 스테비올 글리코시드의 분비를 증가시키는 방법으로서, 확인된 유전자의 발현이 스테비올 또는 스테비올 글리코시드를 생성할 수 있는 재조합 미생물에서 변형될, 방법에 관한 것이다. 일부 구체예에서, 확인된 유전자 또는 유전자들은 내인성 프로모터를 야생형 프로모터와 비교하여 각각 더 강한 프로모터 또는 더 약한 프로모터로 대체함으로써 과다발현 또는 억제될 수 있는 내인성 유전자이다. 또 다른 구체예에서, 확인된 유전자 또는 유전자들은 내인성 유전자 또는 유전자들을 과다발현하거나 억제하도록 조작된 외인성 DNA를 도입시킴으로써 과다발현되거나 억제되는 내인성 유전자일 수 있다. 추가의 또 다른 구체예에서, 확인된 내인성 유전자의 상동성 또는 이종상동성 유전자가 과다발현될 수 있다. 추가의 구체예에서, 내인성 유전자는 재조합 미생물에 대한 천연 메카니즘 (예를 들어, 열 쇼크, 스트레스, 중금속 또는 항생제 노출)을 이용하여 과다발현되거나 억제되도록 유도될 수 있다.
본원에 기술된 임의의 방법에서, 발현 변형은 상응하는 비변형된 미생물에서 관찰된 발현 수준보다 적어도 5% 초과 또는 미만으로 내인성 트랜스포터 또는 전사 인자의 발현 또는 활성을 증가시키거나 감소시키는 것을 포함할 수 있다.
본원에 기술된 임의의 방법에서, 재조합 유전자는 외인성 핵산에 의해 인코딩된 하기 유전자 중 하나 이상을 포함할 수 있다:
(a) 수크로스 트랜스포터 및 수크로스 신타제를 인코딩하는 하나 이상의 재조합 유전자;
(b) GGPPS 폴리펩티드를 인코딩하는 핵산;
(c) ent-코팔릴 디포스페이트 신타제 폴리펩티드를 인코딩하는 핵산;
(d) 카우렌 신타제 (KS) 폴리펩티드를 인코딩하는 핵산;
(e) 카우렌 옥시다제 (KO) 폴리펩티드를 인코딩하는 핵산;
(f) 스테비올 신타제 (KAH) 폴리펩티드를 인코딩하는 핵산;
(g) 사이토크롬 P450 리덕타제 (CPR) 폴리펩티드를 인코딩하는 핵산; 및 또한, 적절한 조합의,
(h) UGT85C2 폴리펩티드를 인코딩하는 핵산;
(i) UGT76G1 폴리펩티드를 인코딩하는 핵산;
(j) UGT74G1 폴리펩티드를 인코딩하는 핵산;
(k) UGT91D2 폴리펩티드를 인코딩하는 핵산; 또는
(l) EUGT11 폴리펩티드를 인코딩하는 핵산.
본 문헌은 스테비올 글리코시드의 분비에 영향을 끼치는 유전자 또는 유전자들을 확인하는 방법은 물론 본원에 제시된 바와 같은 스테비올 글리코시드를 생성하도록 재조합 세포 특히, 미생물을 유전적으로 조작하기 위한 이의 재조합 구체예를 이용하는 방법을 특징으로 한다. 본 방법은 스테비올 또는 스테비올 글리코시드를 생성할 수 있는 재조합 미생물에서 적어도 하나의 이종성 트랜스포터를 발현시키고; 스테비올 글리코시드가 합성되는 조건하에 배지에서 미생물을 배양하고; 변형이 결여된 상응하는 미생물에 의해 생성된 양과 비교하여 배양 단계 동안 생성된 세포외 및/또는 세포내 스테비올 글리코시드의 양을 측정함으로써, 스테비올 글리코시드의 분비에 영향을 끼치는 이종성 트랜스포터를 확인하는 것을 포함한다. 이종성 트랜스포터는 스테비아 (Stevia) 트랜스포터일 수 있다.
본원에 기술된 임의의 방법에서, 미생물은 아가리쿠스 (Agaricus), 아스퍼길루스 (Aspergillus), 바실루스 (Bacillus), 캔디다 (Candida), 코리네박테리움 (Corynebacterium), 에스체리치아 (Escherichia), 푸사리움/깁베렐라 (Fusarium/Gibberella), 클루이베로마이세스 (Kluyveromyces), 래티포루스 (Laetiporus), 렌티누스 (Lentinus), 파피아 (Phaffia), 파네로새테 (Phanerochaete), 피치아 (Pichia), 피스코미트렐라 (Physcomitrella), 로도투룰라 (Rhodoturula), 사카로마이세스 (Saccharomyces), 쉬조사카로마이세스 (Schizosaccharomyces), 스파셀로마 (Sphaceloma), 잔토필로마이세스 (Xanthophyllomyces) 및 야로위아 (Yarrowia)로 구성된 군으로부터 선택된 속으로부터의 적합한 종을 포함할 수 있으나 이에 제한되지 않는다. 이러한 속으로부터의 예시적인 종은 비제한적으로, 사카로마이세스 세레비시애 (Saccharomyces cerevisiae), 쉬조사카로마이세스 폼베 (Schizosaccharomyces pombe), 야로위아 리폴리티카 (Yarrowia lipolytica), 캔디다 글라브라타 (Candida glabrata), 아쉬비아 고스시피 (Ashbya gossypii), 사이버린드네라 자디니 (Cyberlindnera jadinii), 피치아 파스토리스 (Pichia pastoris), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 한세눌라 폴리모르파 (Hansenula polymorpha), 캔디다 보이디니 (Candida boidinii), 아르술라 아데니니보란스 (Arxula adeninivorans), 잔토필로마이세스 덴드로로우스 (Xanthophyllomyces dendrorhous) 또는 캔디다 알비칸스 (Candida albicans) 종을 포함한다.
본 발명의 이러한 및 그 밖의 특징 및 이점은 첨부된 청구범위와 함께 취해진 본 발명의 하기 상세한 설명으로부터 더욱 잘 이해될 것이다. 청구범위는 청구범위의 기술에 의해 규정되며 본 설명에서 제시된 특징 및 이점의 특정 논의에 의해 규정되지 않음이 주지된다.
도 1은 다양한 스테비올 글리코시드에 대한 화학 구조 및 합성 경로를 보여준다.
도 2는 트랜스포터 유전자를 과다발현하는 RebA-생성 효모 균주로부터의 배양 상청액중 RebA 퍼센트의 막대 그래프이다. 천연 트랜스포터 프로모터는 상동성 재조합에 의해 강한 항시성 프로모터 TEF1으로 대체되었다. 균주를 48 시간 동안 합성 완전 (SC) 배지에서 성장시키고, RebA 함량은 LC-MS에 의해 펠렛 및 상청액 분획에서 측정하였다.
도 3은 YOR1 유전자 앞에 천연 프로모터를 갖는 야생형 균주와 비교하여 YOR1 과다발현 효모 균주의 상청액중 RebA 퍼센트의 막대 그래프이다. RebA 함량은 LC-MS에 의해 펠렛 및 상청액 분획에서 측정하였다.
도 4a-m은 빈 플라스미드 (PSB314)를 함유하는 효모 균주와 비교하여 효모 균주 EFSC2797에서 2 마이크론 플라스미드에서 과다발현된 다양한 트랜스포터의 각 도면에 지시된 바와 같은 전체 양 또는 상청액중 각 스테비올 글리코시드의 분비된 퍼센트 (도 4a-i) 또는 마이크로몰/OD600 (도 4j-k) 또는 마이크로몰 농도 (도 4l-m)의 막대 그래프이다. 내인성 효모 트랜스포터 유전자 PDR1, PDR3, PDR13, SNQ2, YOR1_BY, YOR1_IS1, FLR1, AZR1 및 DTR1은 EFSC2797 Reb 생성 균주에서 PSB314 플라스미드를 사용하여 과다발현되었으며, 각 스테비올 글리코시드의 함량은 LC-MS에 의해 펠렛 및 상청액 분획에서 측정하였다.
도 5a-i는 대조군 균주 (PSB314)와 비교하여 효모 균주 EFSC2797에서 PSB314를 사용하여 과다발현된 내인성 효모 트랜스포터 유전자 PDR1, SNQ2, YOR1_BY, YOR1_IS1 및 FLR1의 상청액중의 양 (도 5a-d), 분비된 각 스테비올 글리코시드 퍼센트 (도 5e-i)의 막대 그래프이다. 내인성 효모 트랜스포터 유전자 PDR1, SNQ2, YOR1_BY, YOR1_IS1 및 FLR1는 ERSC2797 Reb 생성 균주에서 PSB314 플라스미드를 사용하여 과다발현되었으며, 각 스테비올 글리코시드의 함량은 LC-MS에 의해 펠렛 및 상청액 분획에서 측정하였다.
도 6은 효모 ERSC2797 균주에서 과다발현하는 내인성 효모 트랜스포터 유전자 PDR1, SNQ2, YOR1_BY, YOR1_IS1 및 FLR1로부터 효모 성장에 대한 영향을 설명하는 막대 그래프이다.
도 7은 RebA 생성 균주에서 S. 레바우디아나 (S. rebaudiana) 트랜스포터의 발현 효과를 설명하는 막대 그래프이다.
도 8은 4개의 내인성 트랜스포터에 대한 로커스에서 돌연변이를 수반하는 효모 균주를 스테비올-공급 배지에서 배양한 후 생성된 스테비올-19-O-글루코시드의 농도 (마이크로몰)를 보여주는 막대 그래프이다. Sup 19-SMG = 상청액중 스테비올-19-O- 글루코시드의 양; Pel 19-SMG = 세포 펠렛중 스테비올-19-O-글루코시드의 양; WT = 4개의 S. 레바우디아나 UGT (76G1, 74G1, 91D2e, 및 85C2)를 발현하는 야생형; 및 4X KO = 4개의 S. 레바우디아나 UGT를 발현하고, pdr5 , pdr10, pdr15 , snq2 트랜스포터 로커스의 결실을 수반하는 4X 트랜스포터 파괴 변이체 효모 균주.
도 9는 스테비올-공급 배지에서 4X 트랜스포터 파괴 효모 균주의 배양 후 생성된 19-SMG 및 레바우디오시드 A의 농도 (마이크로몰)를 보여주는 막대 그래프이다. 제시된 양은 각 균주에 대한 전체 세포외 (왼쪽 막대) 및 세포내 (오른쪽 막대) 19-SMG 및 레바우디오시드 A이다.
도 10은 4개의 S. 레바우디아나 UGT (76G1, 74G1, 91D2e, 및 85C2)를 발현하는 효모 야생형 균주에 의해 생성된 크로마토그래픽 미량의 스테비올 글리코시드이다. Y-축 = 디스플레이에서 자동화된 스켈링에 따른 상대량. 위부터 아래쪽으로의 횡은 m/z 자동기록 (trace)이며, 이는 모노글루코시드, 비오시드, 스테비올 플러스 3 글루코스 잔류물, 스테비올 + 4 글루코스 잔류물, 및 스테비올 + 5 글루코스 잔류물에 상응한다.
도 11은 4개의 S. 레바우디아나 UGT (76G1, 74G1, 91D2e, 및 85C2)를 발현하는 효모 4X 트랜스포터 파괴 변이체 균주에 의해 생성된 크로마토그래픽 미량의 스테비올 글리코시드이다. Y-축 = 디스플레이에서 자동화된 스켈링에 따른 상대량. 위부터 아래쪽으로의 행은 m/z 자동기록이며, 이는 모노글루코시드, 비오시드, 스테비올 플러스 3 글루코스 잔류물, 스테비올 + 4 글루코스 잔류물, 및 스테비올 + 5 글루코스 잔류물에 상응한다.
도 12는 4개의 S. 레바우디아나 UGT (76G1, 74G1, 91D2e, 및 85C2)를 발현하는 효모 7X 트랜스포터 파괴 변이체 균주에 의해 생성된 크로마토그래픽 미량의 스테비올 글리코시드이다. Y-축 = 디스플레이에서 자동화된 스켈링에 따른 상대량. 위부터 아래쪽으로의 행은 m/z 자동기록이며, 이는 모노글루코시드, 비오시드, 스테비올 플러스 3 글루코스 잔류물, 스테비올 + 4 글루코스 잔류물, 및 스테비올 + 5 글루코스 잔류물에 상응한다.
도 13a-d는 특정 트랜스포터 유전자 (PDR5, SNQ2, YOR1, YHK8, FLR1)가 단일 결실된 효모 균주의 상청액에 분비된 각 스테비올 글리코시드의 농도 (도 13a-b) 또는 마이크로몰/OD600 (도 13c) 또는 퍼센트 (도 13d-f)의 막대 그래프이다.
도 2는 트랜스포터 유전자를 과다발현하는 RebA-생성 효모 균주로부터의 배양 상청액중 RebA 퍼센트의 막대 그래프이다. 천연 트랜스포터 프로모터는 상동성 재조합에 의해 강한 항시성 프로모터 TEF1으로 대체되었다. 균주를 48 시간 동안 합성 완전 (SC) 배지에서 성장시키고, RebA 함량은 LC-MS에 의해 펠렛 및 상청액 분획에서 측정하였다.
도 3은 YOR1 유전자 앞에 천연 프로모터를 갖는 야생형 균주와 비교하여 YOR1 과다발현 효모 균주의 상청액중 RebA 퍼센트의 막대 그래프이다. RebA 함량은 LC-MS에 의해 펠렛 및 상청액 분획에서 측정하였다.
도 4a-m은 빈 플라스미드 (PSB314)를 함유하는 효모 균주와 비교하여 효모 균주 EFSC2797에서 2 마이크론 플라스미드에서 과다발현된 다양한 트랜스포터의 각 도면에 지시된 바와 같은 전체 양 또는 상청액중 각 스테비올 글리코시드의 분비된 퍼센트 (도 4a-i) 또는 마이크로몰/OD600 (도 4j-k) 또는 마이크로몰 농도 (도 4l-m)의 막대 그래프이다. 내인성 효모 트랜스포터 유전자 PDR1, PDR3, PDR13, SNQ2, YOR1_BY, YOR1_IS1, FLR1, AZR1 및 DTR1은 EFSC2797 Reb 생성 균주에서 PSB314 플라스미드를 사용하여 과다발현되었으며, 각 스테비올 글리코시드의 함량은 LC-MS에 의해 펠렛 및 상청액 분획에서 측정하였다.
도 5a-i는 대조군 균주 (PSB314)와 비교하여 효모 균주 EFSC2797에서 PSB314를 사용하여 과다발현된 내인성 효모 트랜스포터 유전자 PDR1, SNQ2, YOR1_BY, YOR1_IS1 및 FLR1의 상청액중의 양 (도 5a-d), 분비된 각 스테비올 글리코시드 퍼센트 (도 5e-i)의 막대 그래프이다. 내인성 효모 트랜스포터 유전자 PDR1, SNQ2, YOR1_BY, YOR1_IS1 및 FLR1는 ERSC2797 Reb 생성 균주에서 PSB314 플라스미드를 사용하여 과다발현되었으며, 각 스테비올 글리코시드의 함량은 LC-MS에 의해 펠렛 및 상청액 분획에서 측정하였다.
도 6은 효모 ERSC2797 균주에서 과다발현하는 내인성 효모 트랜스포터 유전자 PDR1, SNQ2, YOR1_BY, YOR1_IS1 및 FLR1로부터 효모 성장에 대한 영향을 설명하는 막대 그래프이다.
도 7은 RebA 생성 균주에서 S. 레바우디아나 (S. rebaudiana) 트랜스포터의 발현 효과를 설명하는 막대 그래프이다.
도 8은 4개의 내인성 트랜스포터에 대한 로커스에서 돌연변이를 수반하는 효모 균주를 스테비올-공급 배지에서 배양한 후 생성된 스테비올-19-O-글루코시드의 농도 (마이크로몰)를 보여주는 막대 그래프이다. Sup 19-SMG = 상청액중 스테비올-19-O- 글루코시드의 양; Pel 19-SMG = 세포 펠렛중 스테비올-19-O-글루코시드의 양; WT = 4개의 S. 레바우디아나 UGT (76G1, 74G1, 91D2e, 및 85C2)를 발현하는 야생형; 및 4X KO = 4개의 S. 레바우디아나 UGT를 발현하고, pdr5 , pdr10, pdr15 , snq2 트랜스포터 로커스의 결실을 수반하는 4X 트랜스포터 파괴 변이체 효모 균주.
도 9는 스테비올-공급 배지에서 4X 트랜스포터 파괴 효모 균주의 배양 후 생성된 19-SMG 및 레바우디오시드 A의 농도 (마이크로몰)를 보여주는 막대 그래프이다. 제시된 양은 각 균주에 대한 전체 세포외 (왼쪽 막대) 및 세포내 (오른쪽 막대) 19-SMG 및 레바우디오시드 A이다.
도 10은 4개의 S. 레바우디아나 UGT (76G1, 74G1, 91D2e, 및 85C2)를 발현하는 효모 야생형 균주에 의해 생성된 크로마토그래픽 미량의 스테비올 글리코시드이다. Y-축 = 디스플레이에서 자동화된 스켈링에 따른 상대량. 위부터 아래쪽으로의 횡은 m/z 자동기록 (trace)이며, 이는 모노글루코시드, 비오시드, 스테비올 플러스 3 글루코스 잔류물, 스테비올 + 4 글루코스 잔류물, 및 스테비올 + 5 글루코스 잔류물에 상응한다.
도 11은 4개의 S. 레바우디아나 UGT (76G1, 74G1, 91D2e, 및 85C2)를 발현하는 효모 4X 트랜스포터 파괴 변이체 균주에 의해 생성된 크로마토그래픽 미량의 스테비올 글리코시드이다. Y-축 = 디스플레이에서 자동화된 스켈링에 따른 상대량. 위부터 아래쪽으로의 행은 m/z 자동기록이며, 이는 모노글루코시드, 비오시드, 스테비올 플러스 3 글루코스 잔류물, 스테비올 + 4 글루코스 잔류물, 및 스테비올 + 5 글루코스 잔류물에 상응한다.
도 12는 4개의 S. 레바우디아나 UGT (76G1, 74G1, 91D2e, 및 85C2)를 발현하는 효모 7X 트랜스포터 파괴 변이체 균주에 의해 생성된 크로마토그래픽 미량의 스테비올 글리코시드이다. Y-축 = 디스플레이에서 자동화된 스켈링에 따른 상대량. 위부터 아래쪽으로의 행은 m/z 자동기록이며, 이는 모노글루코시드, 비오시드, 스테비올 플러스 3 글루코스 잔류물, 스테비올 + 4 글루코스 잔류물, 및 스테비올 + 5 글루코스 잔류물에 상응한다.
도 13a-d는 특정 트랜스포터 유전자 (PDR5, SNQ2, YOR1, YHK8, FLR1)가 단일 결실된 효모 균주의 상청액에 분비된 각 스테비올 글리코시드의 농도 (도 13a-b) 또는 마이크로몰/OD600 (도 13c) 또는 퍼센트 (도 13d-f)의 막대 그래프이다.
상세한 설명
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 발명을 실시하는데 사용될 수 있으나, 적합한 방법 및 물질은 하기에 기재된다. 본원에 언급된 모든 간행물, 특허 출원, 특허, 및 다른 참고문헌은 이들의 전체내용이 참조로서 포함된다. 상충되는 경우, 정의를 포함하는 본 명세서가 기준이 될 것이다. 또한, 물질, 방법, 및 예는 단지 예시이고, 제한하고자 하는 것이 아니다. 본 발명의 다른 특징 및 장점은 하기 상세한 설명으로부터 명백해질 것이다. 본 출원인은 특허법 하에서 표준 실시에 따라 과도적 관용구 "포함하는", "-로 본질적으로 구성되는" 또는 "-로 구성되는"을 이용하여 임의의 개시된 발명을 대안적으로 주장할 권리를 보유한다.
당업자에게 널리 공지된 방법을 이용하여 본 발명에 따른 유전자 발현 작제물 및 재조합 세포를 작제할 수 있다. 이러한 방법은 시험관내 재조합 DNA 기법, 합성 기법, 생체내 재조합 기법, 및 중합효소 연쇄 반응 (PCR) 기법을 포함한다. 예를 들어, 문헌[Maniatis et al., 1989, MOLECULAR CLONING: A LABORATORY MANUAL, Cold Spring Harbor Laboratory, New York; Ausubel et al., 1989, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Greene Publishing Associates and Wiley Interscience, New York, and PCR Protocols: A Guide to Methods and Applications (Innis et al., 1990, Academic Press, San Diego, CA)]에 기재된 기법을 참조하라.
본 발명을 상세히 기재하기에 앞서, 다수의 용어가 정의될 것이다. 본원에서 사용되는 단수 형태는 문맥에서 달리 명백하게 기술하지 않는 한 복수 대상물을 포함한다. 예를 들어 "핵산"에 대한 언급은 하나 이상의 핵산을 의미한다.
"바람직하게는", "보통", 및 "전형적으로"와 같은 용어는 청구된 발명의 범위를 제한한다거나 특정 특성이 청구된 발명의 구조나 기능에 결정적이거나, 필수적이거나, 심지어 중요함을 의미하기 위해 본원에서 이용된 것이 아님에 유의한다. 오히려, 이러한 용어들은 본 발명의 특정 구체예에 이용될 수 있거나 이용될 수 없는 대안적이거나 추가적인 특성을 단지 강조하기 위한 것이다.
본 발명을 기재하고 정의할 목적으로, 용어 "실질적으로"는 임의의 정량적 비교, 값, 측정, 또는 다른 표현에서 비롯될 수 있는 고유의 불확실성 정도를 나타내기 위해 본원에 이용된 것임에 유의한다. 용어 "실질적으로"는 또한 정량적인 표현이 관심 주제의 기본적인 기능에서의 변화를 발생시키지 않으며 언급 기준으로부터 변화될 수 있음을 나타내기 위해 본원에서 이용된다.
본원에서 사용되는 용어 "폴리누클레오티드", "누클레오티드", "올리고누클레오티드", 및 "핵산"은 DNA, RNA, 이의 유도체, 또는 이의 조합물을 포함하는 핵산을 나타내기 위해 상호교환적으로 이용될 수 있다.
본원에서 사용되는 용어 "및/또는"은 또 다른 것과 함께 또는 서로에 배타적으로 여러 구성요소를 기재하기 위해 이용된다. 예를 들어, "x, y, 및/또는 z"는 "x" 단독, "y" 단독, "z" 단독, "x, y, 및 z," "(x 및 y) 또는 z", "x 및 (y 또는 z)" 또는 "x 또는 y 또는 z"를 나타낼 수 있다. 일부 구체예에서, "및/또는"은 재조합 세포가 포함하는 외인성 핵산을 나타내는데 이용되며, 이 때 재조합 세포는 그룹에서 선택되는 하나 이상의 외인성 핵산을 포함한다. 일부 구체예에서, "및/또는"은 스테비올 글리코시드의 생성을 나타내는데 이용되며, 이 때 하나 이상의 그룹에서 선택되는 스테비올 글리코시드가 생성된다. 일부 구체예에서, "및/또는"은 스테비올 글리코시드의 생성을 나타내는데 이용되며, 이 때 하나 이상의 스테비올 글리코시드가 재조합 미생물을 배양하는 단계, 재조합 미생물에서 하나 이상의 스테비올 글리코시드를 합성하는 단계, 및 하나 이상의 스테비올 글리코시드를 분리시키는 단계 중 하나 이상을 통해 생성된다.
본 문헌은 스테비올 글리코시드의 분비에 관련된 재조합 숙주에서 수송 시스템을 변형시켜 스테비올 글리코시드 조성물을 효율적으로 생성하는데 사용될 수 있는 재료 및 방법을 기술한다. 일부 구체예에서, 본원에 기술된 재조합 숙주는 적어도 하나의 스테비올 글리코시드를 생성하며, 이종성 트랜스포터 예컨대, 항생제를 활성적으로 분비하는 트랜스포터를 발현한다. 일부 구체예에서, 본원에 기술된 재조합 숙주는 적어도 하나의 스테비올 글리코시드를 생성하며, 내인성 트랜스포터 유전자의 발현은 숙주에서 변형되고/거나 전사 인자 유전자의 발현이 변형되며, 여기에서 전사 인자는 적어도 하나의 내인성 트랜스포터 유전자의 발현을 조절한다. 항생제를 활성적으로 분비하는 내인성 트랜스포터의 발현 변형이 특히 유용하다. 일부 구체예에서, 복수의 내인성 트랜스포터 유전자, 전사 인자 유전자 또는 이 둘 모두의 발현이 변형된다. 이러한 재조합 숙주는 하나 이상의 생합성 유전자를 포함할 수 있으며 이의 발현은 스테비올 글리코시드 예컨대, 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E 또는 레바우디오시드 M의 생성을 유도한다. 이러한 생합성 유전자는 13-모노글루코시드 베타 1,2 글리코실트랜스퍼라제 및/또는 19-모노글루코시드-베타 1,2-글루코실트랜스퍼라제 (예를 들어, UGT91D2e 및 EUGT11) 및 기타 UDP 글리코실 트랜스퍼라제 예컨대, UGT74G1, UGT76G1, 및/또는 UGT85C2를 포함하여, 재조합 숙주에서 스테비올 글리코시드의 생성을 허용한다.
일 양태에서, 본 문헌은 트랜스포터 유전자, 적어도 하나의 트랜스포터 유전자의 발현을 조절하는 전사 인자 유전자 또는 이 둘 모두인 적어도 하나의 유전자의 변형된 발현을 포함하는 적어도 하나의 스테비올 글리코시드를 합성할 수 있는 재조합 미생물에 관한 것이다. 일 구체예에서, 트랜스포터 유전자는 내인성 트랜스포터 유전자 또는 이종성 트랜스포터 유전자일 수 있다. 또 다른 구체예에서, 트랜스포터 유전자는 ABC 트랜스포터 또는 MFS 트랜스포터를 인코딩할 수 있으며, 여기에서 트랜스포터 유전자 또는 전사 인자 유전자는 PDR1, PDR3, PDR5, PDR8, PDR10, PDR11, PDR12, PDR15, PDR18, YOR1, AUS1, SNQ2, PDR12, STE6, THI73, NFT1, ADP1, FLR1, QDR1, QDR2, QDR3, DTR1, TPO1, TPO2, TPO4, TPO3, AQR1, AZR1, ENB1, SGE1, YHK8, GEX2, HOL1, ATR1, HXT11, ENB1, ARN1, ARN2, SSU1, THI7, TPN1, SEO1, SIT1 또는 DTR1이다.
또 다른 구체예에서, 재조합 미생물에서 표적 유전자의 변형된 발현은 트랜스포터 유전자 또는 전사 인자 유전자의 과다발현 또는 감소된 발현을 포함한다. 추가의 또 다른 구체예에서, 재조합 미생물은 복수의 내인성 트랜스포터 유전자 또는 전사 인자 유전자의 과다발현 또는 감소된 발현을 포함한다. 일 구체예에서, 재조합 미생물은 각 유전자 로커스를 파괴함으로써 PDR5, PDR10, PDR15 및 SNQ2 유전자의 감소된 발현을 포함한다. 또 다른 구체예에서, 재조합 미생물은 각 유전자 로커스를 파괴함으로써 PDR1, PDR3, PDR5, PDR10, PDR15, SNQ2 및 TPO1 유전자의 감소된 발현을 포함한다.
추가의 구체예에서, 본 문헌의 재조합 미생물은 하기 외인성 핵산 중 하나 이상을 포함한다: 수크로스 트랜스포터 및 수크로스 신타제를 인코딩하는 하나 이상의 재조합 유전자; GGPPS 폴리펩티드를 인코딩하는 핵산; ent-코팔릴 디포스페이트 신타제 폴리펩티드를 인코딩하는 핵산; 카우렌 신타제 (KS) 폴리펩티드를 인코딩하는 핵산; 카우렌 옥시다제 (KO) 폴리펩티드를 인코딩하는 핵산; 스테비올 신타제 (KAH) 폴리펩티드를 인코딩하는 핵산; 사이토크롬 P450 리덕타제 (CPR)폴리펩티드를 인코딩하는 핵산; UGT85C2 폴리펩티드를 인코딩하는 핵산; UGT76G 폴리펩티드를 인코딩하는 핵산; UGT74G1 폴리펩티드를 인코딩하는 핵산; UGT91D2 폴리펩티드를 인코딩하는 핵산; 또는 EUGT11 폴리펩티드를 인코딩하는 핵산. 일 구체예에서, 재조합 미생물은 UGT85C2, UGT76G1 및 UGT91D2 폴리펩티드를 인코딩하는 외인성 핵산을 포함한다. 또 다른 구체예에서, 재조합 미생물은 UGT85C2, UGT76G1, UGT74G1, 및 UGT91D2 폴리펩티드를 인코딩하는 외인성 핵산을 포함한다. 추가의 또 다른 구체예에서, 재조합 미생물은 UGT85C2, UGT76G1, UGT74G1, 및 EUGT11 폴리펩티드를 인코딩하는 외인성 핵산을 포함한다. 추가의 또 다른 구체예에서, 재조합 미생물은 UGT85C2, UGT76G1, UGT74G1, UGT91D2 (특히, 91D2e, 91D2m, 91D2e-b 및 이의 기능성 호몰로그 포함) 및 EUGT11 폴리펩티드를 인코딩하는 외인성 핵산을 포함한다.
또 다른 양태에서, 본 문헌은 레바우디오시드를 생성하는 방법으로서; GGPPS; ent-코팔릴 디포스페이트 신타제 (CDPS) 폴리펩티드; 카우렌 옥시다제 (KO) 폴리펩티드; 카우렌 신타제 (KS) 폴리펩티드; 스테비올 신타제 (KAH) 폴리펩티드; 사이토크롬 P450 리덕타제 (CPR) 폴리펩티드; UGT85C2 폴리펩티드; UGT74G1 폴리펩티드; UGT76G1 폴리펩티드; UGT91D2 폴리펩티드; 또는 EUGT11 폴리펩티드를 인코딩하는 유전자의 유도성 발현 또는 항시성 발현을 포함하여, 상기 유전자가 발현되는 조건하에 배양 배지에서 본원에 기술된 재조합 미생물을 배양하고; 재조합 미생물에서 레바우디오시드를 포함하는 화합물 중 하나 이상을 합성하고; 레바우디오시드를 포함하는 화합물 중 하나 이상을 분리하는 것을 포함하는 방법에 관한 것이다. 일 구체예에서, 레바우디오시드는 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E, 또는 레바우디오시드 M이다. 또 다른 구체예에서, 재조합 미생물은 YOR1, SNQ2, PDR1 또는 FLR1를 과다발현한다.
일 구체예에서, 재조합 미생물은 본원에 기술된 미생물로서, 비제한적으로, 아가리쿠스, 아스퍼길루스, 바실루스, 캔디다, 코리네박테리움, 에스체리치아, 푸사리움/깁베렐라, 클루이베로마이세스, 래티포루스, 렌티누스, 파피아, 파네로새테, 피치아, 피스코미트렐라, 로도투룰라, 사카로마이세스, 쉬조사카로마이세스, 스파셀로마, 잔토필로마이세스 및 야로위아 속으로부터 선택된다. 또 다른 구체예에서, 재조합 미생물은 사카로마이세스 세레비시애, 쉬조사카로마이세스 폼베, 야로위아 리폴리티카, 캔디다 글라브라타, 아쉬비아 고스시피, 사이버린드네라 자디니, 피치아 파스토리스, 클루이베로마이세스 락티스, 한세눌라 폴리모르파, 캔디다 보이디니, 아르술라 아데니니보란스, 잔토필로마이세스 덴드로로우스 또는 캔디다 알비칸스 종으로부터의 효모 세포이다.
추가의 또 다른 양태에서, 본 문헌은 스테비올 글리코시드의 분비에 영향을 끼치는 방법으로서, 본원에 기술된 방법을 이용하여 스테비올 글리코시드를 생성하고, 이때 적어도 하나의 재조합 유전자가 발현되며, 재조합 미생물을 스테비올 글리코시드가 합성되는 조건하에 배지에서 배양하고; 트랜스포터 유전자, 적어도 하나의 트랜스포터 유전자의 발현을 조절하는 전사 인자 유전자 또는 이 둘 모두인 적어도 하나의 유전자를 발현시키고, 배양 단계 동안 생성된 스테비올 글리코시드를 분리하는 것을 포함하는 방법에 관한 것이다.
I. 스테비올 및 스테비올 글리코시드 생합성 폴리펩티드
A. 스테비올 생합성 폴리펩티드
이종성 트랜스포터 및/또는 전사 인자 유전자를 발현하거나 상기 기술된 바와 같은 내인성 트랜스포터 유전자의 발현을 변형시키는 것 이외에, 본원에 기술된 숙주는 스테비올로의 이소프레노이드 전구체의 전환에 관련된 유전자 생성물을 함유하고 이를 발현한다.
스테비올을 생성하기 위한 생화학적 경로는 스테비올 형성을 위한, 게라닐게라닐 디포스페이트의 형성, (-) 코팔릴 디포스페이트로의 고리화, 이어서 산화, 및 하이드록실화를 수반한다. 이에 따라, 재조합 미생물에서 게라닐게라닐 디포스페이트의 스테비올로의 전환은 카우렌 신타제 (KS)를 인코딩하는 유전자, 카우렌 옥시다제 (KO)를 인코딩하는 유전자, 및 스테비올 신타제 (KAH)를 인코딩하는 유전자의 발현을 수반한다. 스테비올 신타제는 카우렌산 13-하이드록실라제로도 알려져 있다.
적합한 KS 폴리펩티드는 공지되어 있다. 예를 들어, 적합한 KS 효소는 스테비아 레바우디아나, 제아 메이즈 (Zea mays) 및 포풀루스 트리초카르파 (Populus trichocarpa), 및 아라비돕시스 탈리아나 (Arabidopsis thaliana)에 의해 제조된 것들을 포함한다. 표 2 및 그 전문이 본원에 참조로서 포함되는 PCT 출원 PCT/US2012/050021호 및 PCT/US2011/038967호를 참조하라.
표
2.: 카우렌
신타제
(KS) 클론
효소 공급 유기체 | gi 번호 | 수탁 번호 | 작제물 명칭 | 길이 (nt) |
스테비아 레바우디아나 | 4959241 | AAD34295 (SEQ ID NO: 1) |
MM-12 | 2355 |
스테비아 레바우디아나 | 4959239 | AAD34294 (SEQ ID NO: 2) |
MM-13 | 2355 |
제아 메이즈 | 162458963 | NP_001105097 (SEQ ID NO: 3) |
MM-14 | 1773 |
포풀루스 트리초카르파 | 224098838 | XP_002311286 (SEQ ID NO: 4) |
MM-15 | 2232 |
아라비돕시스 탈리아나 | 3056724 | AF034774 (SEQ ID NO: 5) AAC39443 (SEQ ID NO: 6) |
EV-70 | 2358 |
적합한 KO 폴리펩티드는 공지되어 있다. 예를 들어, 적합한 KO 효소는 스테비아 레바우디아나, 아라비돕시스 탈리아나, 깁베렐라 푸지코로이(Gibberella fujikoroi) 및 트라메테스 베르시컬러(Trametes versicolor)에 의해 제조된 것들을 포함한다. 표 3 및 그 전문이 본원에 참조로서 포함되는 PCT 출원 PCT/US2012/050021호 및 PCT/US2011/038967호를 참조하라.
표 3:
카우렌
옥시다제
(KO 클론)
효소 공급 유기체 | gi 번호 | 수탁 번호 | 작제물 명칭 | 길이 (nt) |
스테비아 레바우디아나 | 76446107 | ABA42921 (SEQ ID NO: 7) |
MM-18 | 1542 |
아라비돕시스 탈리아나 | 3342249 | AAC39505 (SEQ ID NO: 8) |
MM-19 | 1530 |
깁베렐라 푸지코로이 | 4127832 | CAA76703 (SEQ ID NO: 9) |
MM-20 | 1578 |
트라메테스 베르시컬러 | 14278967 | BAB59027 (SEQ ID NO: 10) |
MM-21 | 1500 |
적합한 KAH 폴리펩티드는 공지되어 있다. 예를 들어, 적합한 KAH 효소는 스테비아 레바우디아나, 아라비돕시스 탈리아나, 비티스 비니페라(Vitis vinifera) 및 메디카고 트룬쿨라타(Medicago trunculata)에 의해 제조된 것들을 포함한다. 예컨대, 표 4 및 그 전문이 본원에 참조로서 포함되는 PCT 출원 PCT/US2012/050021호 및 PCT/US2011/038967호, 미국특허공개 2008/0271205호 및 2008/0064063호, 및 Genbank 수탁 번호 gi 189098312 (SEQ ID NO: 11) 및 GenBank 수탁 ABD60225; GI:89242710 (SEQ ID NO: 12)을 참조하라. 아라비돕시스 탈리아나로부터의 스테비올 신타제는 CYP714A2로서 분류된다.
표 4:
스테비올
신타제
(
KAH
) 클론
효소 공급 유기체 | gi 번호 | 수탁 번호 | 플라스미드 명칭 | 작제물 명칭 | 길이(nt) |
스테비아 레바우디아나 | --* | (SEQ ID NO: 13) | pMUS35 | MM-22 | 1578 |
스테비아 레바우디아나 | 189418962 | ACD93722 (SEQ ID NO: 14) |
pMUS36 | MM-23 | 1431 |
아라비돕시스 탈리아나 | 15238644 | NP_197872 (SEQ ID NO: 15) |
pMUS37 | MM-24 | 1578 |
비티스 비니페라 | 225458454 | XP_002282091 (SEQ ID NO: 16) |
pMUS38 | MM-25 | 1590 |
메디카고 트룬쿨라타 | 84514135 | ABC59076 (SEQ ID NO: 17) |
pMUS39 | MM-26 | 1440 |
* = 서열은 미국특허공개 No. 2008-0064063에 도시된 서열 식별 번호 2로 확인된다.
또한, PCT 출원 PCT/US2012/050021호에 기재된 대로 확인된 스테비아 레바우디아나로부터의 KAH 폴리펩티드는 재조합 숙주에 특히 유용하다. S. 레바우디아나 KAH (SrKAHe1; SEQ ID NO:18)를 인코딩하는 누클레오티드 서열 및 효모에서 발현하기 위해 코돈-최적화된 S. 레바우디아나 KAH는 S. 레바우디아나 KAH (SEQ ID NO: 19)의 인코딩된 아미노산 서열인 것으로서 동일 PCT 출원에 기재되어 있다. S. 레바우디아나 KAH는 S. 세레비시애에서 발현되는 경우 야마구치 등 (Yamaguchi et al., 미국특허공개 2008/0271205호 A1)에 의해 기재된 아라비돕시스 탈리아나 ent-카우렌산 하이드록실라제와 비교하여, 현저하게 더 높은 스테비올 신타제 활성을 보여준다. S. 레바우디아나 KAH 폴리펩티드는 미국특허공개 2008/0271205호의 KAH와 20% 미만의 동일성을 지니고 미국특허공개 2008/0064063호의 KAH와 35% 미만의 동일성을 지닌다.
일부 구체예에서, 재조합 미생물은 KO 및/또는 KAH 폴리펩티드를 인코딩하는 재조합 유전자를 함유한다. 이러한 미생물은 전형적으로 사이토크롬 P450 리덕타제 (CPR) 폴리펩티드를 인코딩하는 재조합 유전자를 또한 함유하는데, 그 이유는 KO 및/또는 KAH 폴리펩티드의 특정 조합은 외인성 CPR 폴리펩티드의 발현을 필요로 하기 때문이다. 특히, 트랜스포터 기원의 KO 및/또는 KAH 폴리펩티드의 활성은 외인성 CPR 폴리펩티드를 인코딩하는 재조합 유전자의 포함에 의해 현저하게 증가될 수 있다. 적합한 CPR 폴리펩티드는 공지되어 있다. 예를 들어, 적합한 CPR 효소는 스테비아 레바우디아나 및 아라비돕시스 탈리아나에 의해 제조된 것들을 포함한다. 예컨대, 표 5 및 그 전문이 본원에 참조로서 포함되는 PCT 출원 PCT/US2012/050021호 및 PCT/US2011/038967호를 참조하라.
표
5: 사이토크롬
P450
리덕타제
(CPR) 클론
효소 공급 유기체 | gi 번호 | 수탁 번호 | 플라스미드 명칭 | 작제물 명칭 | 길이(nt) |
스테비아 레바우디아나 | 93211213 | ABB88839 (SEQ ID NO: 20) |
pMUS40 | MM-27 | 2133 |
아라비돕시스 탈리아나 | 15233853 | NP_194183 (SEQ ID NO: 21) |
pMUS41 | MM-28 | 2079 |
깁베렐라 푸지쿠로이 | 32562989 | CAE09055 (SEQ ID NO: 22) |
pMUS42 | MM-29 | 2142 |
예를 들어, 스테비아 레바우디아나 KAHe1에 의해 인코딩된 스테비올 신타제는 유전자 NCP1 (YHR042W)에 의해 인코딩된 S. 세레비시애 CPR에 의해 활성화된다. SrKAHe1에 의해 인코딩된 스테비올 신타제의 더욱 우수한 활성화는 유전자 ATR2 (SEQ ID NO: 99)에 의해 인코딩된 아라비돕시스 탈리아나 CPR 또는 유전자 CPR7 (SEQ ID NO: 23) 또는 CPR8 (SEQ ID NO: 24)에 의해 인코딩된 S. 레바우디아나 CPR이 공동-발현되는 경우 관찰된다. A. 탈리아나 폴리펩티드 ATR1 (SEQ ID NO: 25) 및 ATR2 (SEQ ID NO: 26) 및 S. 레바우디아나 CPR7 (SEQ ID NO: 27) 및 CPR8 (SEQ ID NO: 28) 폴리펩티드의 아미노산 서열은 PCR 출원 PCT/US2012/050021호에 도시되어 있다.
재조합 미생물에서 이러한 유전자의 발현은 게라닐게라닐 디포스페이트를 스테비올로 전환시킬 수 있다.
B. 스테비올
글리코시드 생합성 폴리펩티드
상기 기술된 수송 돌연변이에 더하여, 본원에 기술된 바와 같은 숙주 세포는 스테비올을 스테비올 글리코시드로 전환시킬 수 있다. 이러한 숙주 (예를 들어, 미생물)은 UGT로도 알려진 하나 이상의 UDP 글리코실 트랜스퍼라제를 인코딩하는 유전자를 함유한다. UGT는 활성화된 누클레오티드 당으로부터의 모노사카라이드 단위체를 수용체 모이어티, 본 경우에 스테비올 상의 -OH 또는 -COOH 모이어티, 스테비올 글리코시드 상의 글루코스 모이어티 또는 스테비올 유도체에 전달한다. UGT는 서열 상동성에 기반하여 패밀리 및 서브패밀리로 분류되었다. 문헌[Li et al., J. Biol. Chem. 276:4338-4343 (2001)].
B.1
루부소시드
생합성 폴리펩티드
루부소시드의 생합성은 스테비올의 13-OH 및 19-COOH의 글리코실화를 수반한다. 도 1을 참조하라. 미생물과 같은 재조합 숙주에서 스테비올의 루부소시드로의 전환은 글루코스 단위체를 스테비올의 각각 13-OH 또는 19-COOH로 전달하는 UGT 85C2 및 74G1을 인코딩하는 유전자(들)의 발현에 의해 달성될 수 있다.
적합한 UGT85C2는 우리딘 5'-디포스포 글루코실:스테비올 13-OH 트랜스퍼라제, 및 우리딘 5'-디포스포 글루코실:스테비올-19-O-글루코시드 13-OH 트랜스퍼라제로서 기능한다. 기능성 UGT85C2 폴리펩티드는 또한 스테비올 및 스테비올-19-O-글루코시드 이외의 스테비올 글리코시드 기질을 이용하는 글루코실 트랜스퍼라제 반응을 촉매작용할 수 있다.
적합한 UGT74G1 폴리펩티드는 우리딘 5'-디포스포 글루코실: 스테비올 19-COOH 트랜스퍼라제 및 우리딘 5'-디포스포 글루코실: 스테비올-13-O-글루코시드 19-COOH 트랜스퍼라제로서 기능한다. 기능성 UGT74G1 폴리펩티드는 또한 스테비올 및 스테비올-13-O-글루코시드 이외의 스테비올 글리코시드 기질을 이용하거나, 우리딘 디포스페이트 글루코스 이외의 공여체로부터 당 모이어티를 전달하는 글루코실 트랜스퍼라제 반응을 촉매작용할 수 있다.
기능성 UGT74G1 및 기능성 UGT85C2를 발현하는 재조합 미생물은 스테비올이 배지에서 공급원료로서 사용될 때 루부소시드 및 두 스테비올 모노시드 모두 (즉, 스테비올 13-O-모노글루코시드 및 스테비올 19-O-모노글루코시드)를 만들 수 있다. 이러한 유전자 중 하나 이상은 숙주에서 천연으로 존재할 수 있다. 그러나, 전형적으로, 이러한 유전자는 자연적으로 이들을 지니지 않는 숙주 (예컨대, 미생물)로 형질전환된 재조합 유전자이다.
본원에서 사용되는 용어 재조합 숙주는 숙주로서, 이의 유전체가 적어도 하나의 혼입된 DNA 서열에 의해 보강된 숙주를 나타내는 것으로 의도된다. 그러한 DNA 서열은 자연적으로 존재하지 않는 유전자, RNA로 일반적으로 전사되지 않거나 단백질로 번역("발현")되지 않는 DNA 서열, 및 비재조합 숙주에 도입하고자 하는 그 밖의 유전자 또는 DNA 서열을 포함하나 이로 제한되는 것은 아니다. 본원에 기재된 재조합 숙주의 유전체는 전형적으로 하나 이상의 재조합 유전자의 안정적인 도입을 통하여 보강되는 것이 이해될 것이다. 일반적으로, 도입된 DNA는 그 DNA의 수용체인 숙주에 원래 존재하는 것은 아니지만, 주어진 숙주로부터 DNA 세그먼트를 단리시키고, 후속하여 동일한 숙주 안에 그 DNA의 하나 이상의 추가적인 복사체를 도입시켜, 예컨대 유전자 생성물의 생성을 향상시키거나 유전자의 발현 패턴을 변경시키는 것은 본 발명의 범위 내에 있다. 일부 예에서, 도입된 DNA는, 예를 들어 상동 재조합 또는 부위-특이적 돌연변이유발에 의해 내인성 유전자 또는 DNA 서열을 변형시키거나 심지어 대체할 수 있다. 적합한 재조합 숙주는 미생물을 포함한다.
용어 "재조합 유전자"는, 동일하거나 유사한 유전자 또는 DNA 서열이 이미 그러한 숙주에 존재할 수 있는 것과 무관하게, 수용체 숙주에 도입되는 유전자 또는 DNA 서열을 의미한다. 이러한 문맥에서 "도입"되거나 "보강된"은 사람의 손에 의해 도입되거나 보강되는 것을 의미함이 당 분야에 알려져 있다. 따라서, 재조합 유전자는 또 다른 종으로부터의 DNA 서열일 수 있거나, 동일한 종으로부터 기원하거나 동일한 종에 존재하는 DNA 서열일 수 있으나, 이는 재조합 숙주를 형성하기 의해 재조합 방법에 숙주에 혼입되었다. 숙주에 도입되는 재조합 유전자는 형질전환되는 숙주에 일반적으로 존재하고, DNA의 하나 이상의 추가적인 복사체를 제공하기 위해 도입되어 그 DNA의 유전자 생성물의 과다발현 또는 변형된 발현을 허용하는 DNA 서열과 동일할 수 있음이 이해될 것이다.
적합한 UGT74G1 및 UGT85C2 폴리펩티드는 S. 레바우디아나에 의해 제조된 것들을 포함한다. 스테비아로부터 기능성 UGT74G1 및 UGT85C2 폴리펩티드를 인코딩하는 유전자는 문헌[Richman et al., Plant J. 41: 56-67, (2005)]에서 보고된다. S. 레바우디아나 UGT74G1 (SEQ ID NO: 29) 및 UGT85C2 (SEQ ID NO: 30) 폴리펩티드의 아미노산 서열은 PCT 출원 PCT/US2012/050021호의 서열 식별 번호 1 및 3에 각각 제시되어 있다. 효모에서의 발현에 최적화된 UGT74G1 (SEQ ID NO: 100) 및 UGT85C2(SEQ ID NO: 31)는 물론 UGT 서열, 예를 들어, UGT 85C2 (SEQ ID NO: 32), 91D2e, 91D2e-b, EUGT11 및 76G1을 인코딩하는 누클레오티드 서열이 제공된다. 또한, "기능성 호몰로그"섹션에 하기 기재된 UGT85C2 및 UGT74G1 변이체를 참조하라. 예를 들어, 위치 65, 71, 270, 289, 및 389에서 치환을 함유할 수 있는 UGT85C2 폴리펩티드가 사용될 수 있다 (예컨대, A65S, E71Q, T270M, Q289H, 및 A389V).
일부 구체예에서, 재조합 숙주는 미생물이다. 재조합 미생물은 루부소시드를 생성하기 위하여 스테비올을 함유하는 배지에서 성장할 수 있다. 다른 구체예에서, 그러나, 재조합 미생물은 스테비올 생합성에 관련된 하나 이상의 재조합 유전자, 예컨대, CDPS 유전자, KS 유전자, KO 유전자, 및/또는 KAH 유전자를 발현시킨다. 적합한 CDPS 폴리펩티드가 공지되어 있다.
예를 들어, 적합한 CDPS 효소는 스테비아 레바우디아나, 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus), 브라디리조비움 자포니쿰(Bradyrhizobium japonicum), 제아 메이즈, 및 아라비돕시스에 의해 제조된 것들을 포함한다. 예컨대, 표 6 및 그 전문이 본원에 참조로서 포함되는 PCT 출원 PCT/US2012/050021호 및 PCT/US2011/038967호를 참조하라.
일부 구체예에서, 변형되지 않은 폴리펩티드의 아미노 말단에서 엽록체 운반 펩티드가 결여된 CDPS 폴리펩티드를 이용할 수 있다. 예를 들어, PCT 공개 번호 PCT/US2012/050021의 도 14에 도시된 제아 메이즈 CDPS 코딩 서열의 5' 말단으로부터 처음 150개 누클레오티드가 제거될 수 있다. 이렇게 함으로써 엽록체 운반 펩티드를 인코딩하는 아미노산 서열의 아미노 말단 50개 잔기가 제거된다. 절두된 CDPS 유전자는 새로운 ATG 번역 개시 부위에 핏팅되어, 프로모터, 전형적으로 항시성 또는 고도 발현성 프로모터에 작동적으로 연결될 수 있다. 절두된 코딩 서열의 복수의 복사체가 미생물에 도입될 때, 프로모터로부터 CDPS 폴리펩티드의 발현은 ent-카우렌 생합성을 향한 증가된 탄소 유동을 발생시킨다.
표 6:
CDPS
클론
효소 공급 유기체 | gi 번호 | 수탁 번호 | 플라스미드 명칭 | 작제물 명칭 | 길이(nt) |
스테비아 레바우디아나 | 2642661 | AAB87091 (SEQ ID NO: 33) |
pMUS22 | MM-9 | 2364 |
스트렙토마이세스 클라불리게루스 | 197705855 | EDY51667 (SEQ ID NO: 34) |
pMUS23 | MM-10 | 1584 |
브라디리조비움 자포니쿰 | 529968 | AAC28895.1 (SEQ ID NO: 35) |
pMUS24 | MM-11 | 1551 |
제아 메이즈 | 50082774 50082775 |
AY562490 (SEQ ID NO: 36) AAT70083 (SEQ ID NO: 37) |
EV65 | 2484 |
|
아라비돕시스 탈리아나 | 18412041 15235504 |
NM_116512 (SEQ ID NO: 38) NP_192187 (SEQ ID NO: 39) |
EV64 | 2409 |
CDPS-KS 이기능성 단백질도 이용될 수 있다. 표 7에 제시된 CDPS-KS 이기능성 효소를 인코딩하는 누클레오티드 서열은 효모에서의 발현을 위해 변형되었다 (PCT 출원 PCT/US2012/050021호를 참조하라). 깁베렐라 푸지쿠로이로부터의 이기능성 효소도 이용될 수 있다.
표
7: CDPS
-KS 클론
효소 공급 유기체 | gi 번호 | 수탁 번호 | 작제물 명칭 |
길이
(bp) |
포몹시스 아미그달리 (Phomopsis amygdali ) | 186704306 | BAG30962 (SEQ ID NO: 40) |
MM-16 | 2952 |
피스코미트렐라 파텐스 | 146325986 | BAF61135 (SEQ ID NO: 41) |
MM-17 | 2646 |
깁베렐라 푸지쿠로이 | 62900107 | Q9UVY5.1 (SEQ ID NO: 42) |
2859 |
따라서, UGT74G1 및 UGT85C2 유전자 외에 CDPS 유전자, KS 유전자, KO 유전자 및 KAH 유전자를 함유하는 미생물은 공급원료로서 스테비올을 사용할 필요 없이 스테비올 모노시드 및 루부소시드 둘 모두를 생성할 수 있다.
일부 구체예에서, 재조합 미생물은 게라닐게라닐 디포스페이트 신타제 (GGPPS)를 인코딩하는 재조합 유전자를 추가로 발현시킨다. 적합한 GGPPS 폴리펩티드는 공지되어 있다. 예를 들어, 적합한 GGPPS 효소는 스테비아 레바우디아나, 깁베렐라 푸지쿠로이, 무스 무스쿨루스(Mus musculus), 탈라시오시라 슈도나나(Thalassiosira pseudonana), 스트렙토마이세스 클라불리게루스, 술풀로부스 아시도칼다리우스(Sulfulobus acidocaldarius), 시네초코쿠스 종 및 아라비돕시스 탈리아나에 의해 제조된 것들을 포함한다. 표 8 및 그 전문이 본원에 참조로서 포함되는 PCT 출원 PCT/US2012/050021호 및 PCT/US2011/038967호를 참조하라.
표 8:
GGPPS
클론
효소 공급 유기체 | gi 번호 | 수탁 번호 | 플라스미드 명칭 | 작제물 명칭 |
길이(nt)
|
스테비아 레바우디아나 | 90289577 | ABD92926 (SEQ ID NO: 43) |
pMUS14 | MM-1 | 1086 |
깁베렐라 푸지쿠로이 | 3549881 | CAA75568 (SEQ ID NO: 44) |
pMUS15 | MM-2 | 1029 |
무스 무스쿨루스 | 47124116 | AAH69913 (SEQ ID NO: 45) |
pMUS16 | MM-3 | 903 |
탈라시오시라 슈도나나 | 223997332 | XP_002288339 (SEQ ID NO: 46) |
pMUS17 | MM-4 | 1020 |
스트렙토마이세스 클라불리게루스 | 254389342 | ZP_05004570 (SEQ ID NO: 47) |
pMUS18 | MM-5 | 1068 |
술풀로부스 아시도칼다리우스 | 506371 | BAA43200 (SEQ ID NO: 47) |
pMUS19 | MM-6 | 993 |
시네초코쿠스 종 | 86553638 | ABC98596 (SEQ ID NO: 49) |
pMUS20 | MM-7 | 894 |
아라비돕시스 탈리아나 | 15234534 | NP_195399 (SEQ ID NO: 50) |
pMUS21 | MM-8 | 1113 |
일부 구체예에서, 재조합 미생물은 디테르펜 생합성 또는 테르페노이드 전구체의 생성에 관여하는 재조합 유전자, 예컨대, 하기에서 논의된 메틸에리트리톨 4-포스페이트 (MEP) 경로의 유전자 또는 메발로네이트 (MEV) 경로의 유전자를 추가로 발현시키고/거나, 감소된 포스파타제 활성을 갖고/거나, 본원에서 논의된 수크로스 신타제 (SUS)를 발현시킬 수 있다. 다른 구체예에서, 내인성 유전자 (예를 들어, DPP1)는 일부 GGPP/FPP 전구체의 이용가능성에 영향을 끼치기 위해 불활성화되거나 결실될 수 있다.
B.2
레바우디오시드
A,
레바우디오시드
B,
레바우디오시드
D,
레바우디오시
드 E, 및 레바우디오시드 M 생합성 폴리펩티드
레바우디오시드 A의 생합성은 아글리콘 스테비올(aglycone steviol)의 글루코실화를 수반한다. 특히, 레바우디오시드 A는 13-O-스테비올모노시드를 형성하는 스테비올의 13-OH의 글루코실화, 스테비올-1,2-비오시드를 형성하는 스테비올모노시드의 13-O-글루코스의 C-2'의 글루코실화, 스테비오시드를 형성하는 스테비올-1,2-비오시드의 C-19 카르복실의 글루코실화, 및 스테비오시드의 C-13-O-글루코스의 C-3'의 글루코실화에 의해 형성될 수 있다. 각 글리코실화 반응이 일어나는 순서는 변화될 수 있다. 도 1을 참조하라.
레바우디오시드 B의 생합성은 아글리콘 스테비올의 글루코실화를 포함한다. 구체적으로, 레바우디오시드 B는 13-O-스테비올모노시드를 형성하는 스테비올의 13-OH의 글루코실화, 스테비올-1,2-비오시드를 형성하는 스테비올모노시드의 13-O-글루코스의 C-2'의 글루코실화, 및 스테비올-1,2-비오시드의 C-13-O-글루코스의 C-3'의 글루코실화에 의해 형성될 수 있다. 각 글루코실화 반응이 발생하는 순서는 변화될 수 있다.
레바우디오시드 E 및/또는 레바우디오시드 D의 생합성은 아글리콘 스테비올의 글루코실화를 수반한다. 구체적으로, 레바우디오시드 E는 스테비올-13-O-글루코시드를 형성하는 스테비올의 13-OH의 글루코실화, 스테비올-1,2-비오시드를 형성하는 스테비올-13-O-글루코시드의 13-O-글루코스의 C-2'의 글루코실화, 1,2-스테비오시드를 형성하는 1,2-비오시드의 C-19 카르복실의 글루코실화, 및 레바우디오시드 E를 형성하는 1,2-스테비오시드의 19-O-글루코스의 C-2'의 글루코실화에 의해 형성될 수 있다. 레바우디오시드 D는 레바우디오시드 E의 C-13-O-글루코스의 C-3'의 글루코실화에 의해 형성될 수 있다. 각 글리코실화 반응이 일어나는 순서는 변화될 수 있다. 예를 들어, 19-O-글루코스의 C-2'의 글루코실화가 경로의 마지막 단계일 수 있고, 이 때 레바우디오시드 A는 경로의 중간체이다. 도 1을 참조하라.
재조합 숙주에서 스테비올의 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 M, 및/또는 레바우디오시드 E로의 전환이 하기 기능성 UGT를 발현함으로써 달성될 수 있음이 밝혀졌다: EUGT11, 91D2, 74G1, 85C2, 및 76G1. 따라서, 이들 UGT의 조합물을 발현하는 재조합 미생물은 스테비올이 공급원료로서 사용되는 경우 레바우디오시드 A 및 레바우디오시드 D를 제조할 수 있다. 전형적으로, 이들 유전자들 중 하나 이상은 자연적으로는 이들을 지니지 않는 미생물 내로 형질전환된 재조합 유전자이다. 또한, SM12UGT로서 본원에 지정된 UGT는 UGT91D2 대신에 치환될 수 있음이 밝혀졌다.
일부 구체예에서, 5개 미만 (예를 들어, 1, 2, 3 또는 4개)의 UGT가 숙주에서 발현된다. 예를 들어, 기능성 EUGT11을 발현하는 재조합 미생물은 공급원료로서 레바우디오시드 A가 사용되는 경우 레바우디오시드 D를 제조할 수 있다. UGT 85C, 91D2e 또는 EUGT11, 그러나 바람직하게는, 91D2e, 및 76G1를 발현하는 재조합 미생물은 레바우디오시드 B를 제조할 수 있다. EUGT11, 76G1, 및 91D12 (예를 들어, 91D2e)를 발현하는 재조합 미생물은 루부소시드 또는 1,2-스테비오시드가 공급원료로서 사용되는 경우 레바우디오시드 D를 제조할 수 있다. 또 다른 대안으로서, 3개의 기능성 UGT 즉, EUGT11, 74G1, 76G1 및 임의적으로 91D2를 발현하는 재조합 미생물이 매질중에 모노시드, 스테비올-13-O-글루코시드가 공급될 경우 레바우디오시드 D를 제조할 수 있다. 유사하게는, 재조합 미생물에서 스테비올-19-O-글루코시드의 레바우디오시드 D로의 전환은 스테비올-19-O-글루코시드가 공급될 경우, UGT EUGT11, 85C2, 76G1, 및 91D2 (예를 들어, 91D2e)을 인코딩하는 유전자의 발현에 의해 달성될 수 있다. 전형적으로, 이들 유전자 중 하나 이상은 자연적으로는 이들을 지니지 않는 숙주내로 형질전환된 재조합 유전자이다.
레바우디오시드
M 폴리펩티드
재조합 숙주에서 스테비올의 레바우디오시드 M으로의 전환은 하기 기능성 UGT 91D2, EUGT11, 74G1, 85C2, 및 76G1의 조합물을 발현시킴에 의해 달성될 수 있다. 도 1을 참조하라. 높은 복사체수 플라스미드를 이용하거나, 강한 프로모터, 또는 다수의 통합된 유전자의 복사체, 또는 에피솜을 높은 복사체수의 유전자를 위한 선택 하에 이용하여 EUGT11을 높은 수준으로 발현시키는 것이 특히 유용하다. 따라서, 이러한 UGT의 조합물을 발현시키는 재조합 미생물은 레바우디오시드 A (85C2; 76G1; 74G1; 91D2e), 레바우디오시드 D (85C2; 76G1; 74G1; 91D2e; EUGT11), 레바우디오시드 E (85C2; 74G1; 91D2e; EUGT11), 또는 레바우디오시드 M (85C2; 76G1; 74G1; 91D2e; EUGT11)을 제조할 수 있다. 도 1을 참조하라. 전형적으로, 이러한 유전자 중 하나 이상은 자연적으로 이들을 지니지 않는 미생물로 형질전환된 재조합 유전자이다. 또한, 본원에서 SM12UGT로서 지정된 UGT는 UGT91D2를 대신하여 치환될 수 있음이 발견되었다.
도 1에 도시된 바와 같은 개별적인 레바우디오시드의 표적화 생성은 UDP-글리코실 트랜스퍼라제 활성의 상대적 수준을 제어함으로써 달성된다. 이는 UGT-인코딩 유전자의 차별적인 복사체 수, 차별적인 프로모터 강도에 의해, 및/또는 관심 생성물로의 증가된 특이성/활성을 갖는 돌연변이체를 이용함에 의해 달성될 수 있다. 도 1 참조하라. 예를 들어, EUGT11이 다른 UGT에 비해 낮은 수준으로 발현되는 경우 낮은 수준의 레바우디오시드 D, E, 및 M이 형성되어, 레바우디오시드 A 형성을 촉진할 것이다. 높은 수준의 EUGT11 발현은 레바우디오시드 M을 형성하기 위해 반응할 UGT76G1에 대한 더 많은 19-O 1,2 디글루코시드 기질을 발생시킨다. 이는 UGT76G1 폴리펩티드의 선호되는 활성이 아니기 때문에, UGT76G1의 추가적인 복사체 또는 변이체 버젼이 레바우디오시드 D로부터 레바우디오시드 M 형성 속도를 증가시킬 수 있다. 적합한 UGT76G1은 또한 수용체 분자의 19-O 글루코스의 C-3'로의 글루코스 모이어티의 전달을 촉매작용하며, 여기서 수용체 분자는 스테비올의 19-O 위치에서 1,2 글리코시드 모이어티를 함유할 수 있다.
적합한 UGT74G1 및 UGT85C2 폴리펩티드는 상기 논의된 것들을 포함한다. 적합한 UGT76G1은 글루코스 모이어티를 수용체 분자, 스테비올 1,2 글리코시드의 C-13-O-글루코스의 C-3'에 첨가한다. 이에 따라, UGT76G1은, 예를 들어, 우리딘 5'-디포스포 글루코실: 스테비올 13-O-1,2 글루코시드 C-3' 글루코실 트랜스퍼라제 및 우리딘 5'-디포스포 글루코실: 스테비올-19-O-글루코스, 13-O-1,2 비오시드 C-3' 글루코실 트랜스퍼라제로서 기능한다. 기능성 UGT76G1 폴리펩티드는 또한 글루코스 이외의 당을 함유하는 스테비올 글리코시드 기질을 이용하는 글루코실 트랜스퍼라제 반응을 촉매작용할 수 있다. 적합한 UGT76G1 폴리펩티드는 S. 레바우디아나에 의해 제조되고 문헌[Richman et al. Plant J. 41: 56-67 (2005)]에 보고된 것들을 포함한다. S. 레바우디아나 UGT76G1 폴리펩티드의 아미노산 서열 (예를 들어, SEQ ID NO: 85)은 UGT76G1 폴리펩티드를 인코딩하고 효모에서의 발현에 최적화된 누클레오티드 서열로서, PCT 공개 번호 PCT/US2012/050021에 제시되어 있다. 또한 "기능성 호몰로그" 섹션에 제시된 UGT76G1 변이체를 참조하라.
적합한 EUGT11 또는 UGT91D2 폴리펩티드는 우리딘 5'-디포스포 글루코실: 스테비올-13-O-글루코시드 트랜스퍼라제 (스테비올-13-모노글루코시드 1,2-글루코실라제로도 언급됨)로서 기능하여, 글루코스 모이어티를 수용체 분자, 스테비올-13-O-글루코시드의 13-O-글루코스의 C-2'에 전달한다.
적합한 EUGT11 또는 UGT91D2 폴리펩티드는 또한 글루코스 모이어티를 수용체 분자, 루부소시드의 13-O-글루코스의 C-2'에 전달하여 스테비오시드를 생성하는 우리딘 5'-디포스포 글루코실: 루부소시드 트랜스퍼라제로서 기능한다. EUGT11 폴리펩티드는 또한 글루코스 모이어티를 수용체 분자, 루부소시드의 19-O-글루코스의 C-2'에 효율적으로 전달하여 19-O-1,2-디글리코실화된 루부소시드를 생성할 수 있다. EUGT11은 19-O-글루코스 치환된 스테비올 글리코시드 분자로의 글루코스 분자의 전달에 특히 효율적이다.
기능성 EUGT11 또는 UGT91D2 폴리펩티드는 또한 스테비올-13-O-글루코시드 및 루부소시드 이외의 스테비올 글리코시드 기질을 이용하는 반응을 촉매작용시킬 수 있다. 예를 들어, 기능성 EUGT11 폴리펩티드는 기질로서 스테비오시드를 효율적으로 이용하여, 글루코스 모이어티를 19-O-글루코스 잔기의 C-2'에 전달함으로써 레바우디오시드 E를 생성할 수 있다. 기능성 EUGT11 및 UGT91D2 폴리펩티드는 또한 기질로서 레바우디오시드 A를 이용하여, 글루코스 모이어티를 레바우디오시드 A의 19-O-글루코스 잔기의 C-2'에 전달함으로써 레바우디오시드 D를 생성할 수 있다. EUGT11 (SEQ ID NO: 51)은 반응이 유사한 조건 즉, 유사한 시간, 온도, 순도, 및 기질 농도 하에 수행될 때 상응하는 UGT91D2e (SEQ ID NO: 54)의 속도보다 적어도 20배 더 빠른 속도로 (예컨대, 적어도 25배 또는 적어도 30배 더 빠름) 레바우디오시드 A를 레바우디오시드 D로 전환시킬 수 있다. 이와 같이, EUGT11은 유사한 조건 하에 인큐베이션되는 경우, UGT91D2e 보다 많은 양의 RebD를 생성한다.
또한, 기능성 EUGT11은 기질로서 루부소시드 또는 스테비오시드 이용시 상당한 C-2' 19-O-디글리코실화 활성을 나타내는 반면, UGT91D2e는 이러한 기질에 의해 디글리코실화 활성을 덜 갖는다. 따라서, 기능성 EUGT11은 스테비올 글리코시드 기질-특이성에서의 차이에 의해 UGT91D2e와 구별될 수 있다.
기능성 EUGT11 또는 UGT91D2 폴리펩티드는 전형적으로, 글루코스 모이어티를 C-13 위치에 1,3-결합된 글루코스를 갖는 스테비올 화합물에 전달하지 않으며, 즉 스테비올-1,3-비오시드 및 1,3-스테비오시드로의 글루코스 모이어티의 전달은 대부분의 조건하에서 검출가능한 수준으로 발생하지 않는다.
적합한 EUGT11 폴리펩티드가 오리자 사티바 (Oryza sativa)로부터의 EUGT11 폴리펩티드 (GenBank 수탁 번호 AC133334; SEQ ID NO:51)를 포함할 수 있다. 예를 들어, EUGT11 폴리펩티드는 SEQ ID NO:51에 개시된 아미노산 서열과 적어도 70% 서열 동일성 (예컨대, 적어도 75, 80, 85, 90, 95, 96, 97, 98, 또는 99% 서열 동일성)을 갖는 아미노산 서열을 지닐 수 있다. EUGT11의 아미노산 서열을 인코딩하는 누클레오티드 서열은 또한 SEQ ID NO:52에 개시되며, 효모에서의 발현에 코돈 최적화된 누클레오티드 서열과 같다 (SEQ ID NO:53).
적합한 기능성 UGT91D2 폴리펩티드는 UGT91D2e 및 UGT91D2m로 지정된 폴리펩티드를 포함한다. 스테비아 레바우디아나로부터의 예시적인 UGT91D2e 폴리펩티드의 아미노산 서열은 SEQ ID NO:54 (PCT 출원 PCT/US2012/050021의 누클레오티드 서열 식별 번호 5에 의해 인코딩됨)로 개시되며, 이는 또한 폴리펩티드를 인코딩하는 S. 레바우디아나 누클레오티드 서열, 폴리펩티드를 인코딩하고 효모 발현을 위해 코돈 최적화된 누클레오티드 서열 (SEQ ID NO:158), S. 레바우디아나로부터의 예시적인 UGT91D2m 폴리펩티드의 아미노산 서열, 및 예시적인 UGT91D2m 폴리펩티드를 인코딩하는 핵산 서열을 개시한다. 예시적인 UGT91D2m의 아미노산 서열은 SEQ ID NO:55에 제시되어 있다. 아미노산 잔기 206, 207, 및 343에서 치환을 함유하는 UGT91D2 변이체가 또한, 이용될 수 있다. 예를 들어, 야생형 UGT92D2e에 비해 G206R, Y207C, 및 W343R 돌연변이를 갖는 아미노산 서열이 이용될 수 있다. 또한, 아미노산 잔기 211 및 286에 치환을 함유하는 UGT91D2 변이체가 이용될 수 있다. 예를 들어, UGT91D2 변이체는 위치 211에 류신을 대신한 메티오닌의 치환 및 위치 286에 발린을 대신한 알라닌의 치환을 포함할 수 있다. 또한, "기능성 호몰로그" 섹션에 기술된 UGT91D2 변이체를 참조하라.
상기에서 지시된 바와 같이, 본원에서 SM12UGT로서 지정된 UGT는 UGT91D2를 대신에 치환될 수 있다. 적합한 기능성 SM12UGT 폴리펩티드는 이포모에아 푸르푸레아(Ipomoea purpurea)(일본산 나팔꽃)에 의해 제조되고 문헌[Morita et al. Plant J. 42: 353-363 (2005)]에 기재된 것들을 포함한다. I. 푸르푸레아 IP3GGT 폴리펩티드를 인코딩하는 아미노산 서열 (SEQ ID NO: 56)이 PCT 출원 번호 PCT/US2012/050021의 서열 식별 번호 76을 사용하여 제시되며, 이는 폴리펩티드를 인코딩하며 효모에서의 발현에 코돈 최적화된 누클레오티드 서열 (SEQ ID NO: 57)이다. 또 다른 적합한 SM12UGT 폴리펩티드는 R25S 돌연변이를 갖는 Bp94B1 폴리펩티드이다. 문헌 [Osmani et al. Plant Phys. 148: 1295-1308 (2008) and Sawada et al. J. Biol. Chem. 280: 899-906 (2005)]을 참조하라. 벨리스 페렌니스(Bellis perennis)(붉은 데이지) UGT94B1 폴리펩티드의 아미노산 서열 (SEQ ID NO: 58)은 PCT 출원 번호 PCT/US2012/050021에서 서열 식별 번호 78을 사용하여 제시되며, 이는 폴리펩티드를 인코딩하며 효모에서의 발현에 코돈 최적화된 누클레오티드 서열 (SEQ ID NO: 59)이다.
일부 구체예에서, 재조합 미생물은 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E 및/또는 레바우디오시드 M을 생성하기 위해 스테비올-13-O-글루코시드 또는 스테비올-19-O-글루코시드를 함유하는 배지에서 성장한다. 그러한 구체예에서, 미생물은 기능성 EUGT11, 기능성 UGT74G1, 기능성 UGT85C2, 기능성 UGT76G1, 및 기능성 UGT91D2를 인코딩하는 유전자를 함유하고 발현시키며, 스테비올, 하나 또는 둘 모두의 스테비올모노시드, 또는 루부소시드가 공급원료로서 이용될 때 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E 및/또는 레바우디오시드 M을 축적시킬 수 있다.
다른 구체예에서, 재조합 미생물은 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E 및/또는 레바우디오시드 M을 생성하기 위하여 루부소시드를 함유하는 배지에서 성장한다. 그러한 구체예에서, 미생물은 기능성 EUGT11, 기능성 UGT76G1, 및 기능성 UGT91D2를 인코딩하는 유전자를 함유하고 발현시키며, 루부소시드가 공급원료로서 이용될 때 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E 및/또는 레바우디오시드 M을 생성시킬 수 있다.
다른 구체예에서, 재조합 미생물은 스테비올 생합성에 관련된 하나 이상의 유전자, 예컨대, CDPS 유전자, KS 유전자, KO 유전자 및/또는 KAH 유전자를 발현시킨다. 이에 따라, 예를 들어, EUGT11, UGT74G1, UGT85C2, UGT76G1, 및 임의적으로, 기능성 UGT91D2 (예컨대, UGT91D2e) 외에 CDPS 유전자, KS 유전자, KO 유전자 및 KAH 유전자를 함유하는 미생물은 배양 배지에 스테비올을 포함시킬 필요 없이 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E 및/또는 레바우디오시드 M을 생성할 수 있다. 또 다른 예에서, UGT74G1, UGT85C2, UGT76G1, 및 임의적으로 기능적 UGT91D2 (예를 들어, UGT91D2e)에 더하여 CDPS 유전자, KS 유전자, KO 유전자 및 KAH 유전자를 함유하는 미생물은 배양 배지에 스테비올을 포함시킬 필요없이 레바우디오시드 A를 생성할 수 있다. 추가의 또 다른 예에서, UGT85C2, UGT76G1, 및 임의적으로, 기능적 UGT91D2 (예를 들어, UGT91D2e)에 더하여, CDPS 유전자, KS 유전자, KO 유전자 및 KAH 유전자를 함유하는 미생물은 배양 배지에 스테비올을 포함시킬 필요없이 레바우디오시드 B를 생성할 수 있다.
일부 구체예에서, 재조합 숙주는 스테비올 생합성 경로를 통한 증가된 유동을 위하여 디테르펜 전구체 게라닐게라닐 디포스페이트의 증가된 수준을 제공하기 위해 재조합 GGPPS 유전자를 추가로 함유하고 발현한다.
일부 구체예에서, 재조합 숙주는 게라닐게라닐 디포스페이트, ent-카우렌산 또는 파르네실 피로포스페이트를 소비하는 비-스테비올 경로의 발현에 침묵하여, 스테비올 및 스테비올 글리코시드 생합성 경로를 통한 증가된 유동을 제공하는 작제물을 추가로 함유한다. 예를 들어, 에르고스테롤과 같은 스테롤 생성 경로로의 유동은 ERG9 유전자의 하향조절에 의해 감소될 수 있다. 하기 섹션 C.4을 참조하라. 깁베렐린을 생성하는 세포에서, 깁베렐린 합성은 스테비올로의 ent-카우렌산의 유동을 증가시키기 위해 하향조절될 수 있다. 카로테노이드-생성 유기체에서, 스테비올로의 유동은 하나 이상의 카로테노이드 생합성 유전자의 하향조절에 의해 증가될 수 있다. 일부 구체예에서, 재조합 미생물은 추가로 디테르펜 생합성 또는 테르페노이드 전구체의 생성에 관여하는 재조합 유전자, 예컨대, MEP 또는 MEV 경로에서의 유전자를 추가로 발현시키고/거나, 감소된 포스파타제 활성을 갖고/거나, SUS를 발현시킬 수 있다.
당 업계의 숙련자는 상이한 UGT 유전자들의 상대적 발현 수준을 변경시킴으로써, 재조합 숙주가 소정의 비율로 스테비올 글리코시드 생성물을 특정하게 생성하도록 만들 수 있다는 것을 인지할 것이다. 스테비올 생합성 유전자 및 스테비올 글리코시드 생합성 유전자의 전사 조절은 당 업자에게 공지된 기술들을 이용하여 전사 활성 및 억제의 조합을 통해 달성할 수 있다. 시험관 내 반응의 경우, 당업계의 숙련자는 상이한 수준의 UGT 효소들을 조합하여 첨가 또는 상이한 UGTS의 상대적 활성들에 영향을 주는 조건들을 조합하여 각 스테비올 글리코시드의 소정의 비율을 위한 생합성을 지시할 것임을 인지할 것이다. 당 업계의 숙련자는 레바우디오시드 D 또는 E의 보다 높은 비율, 또는 레바우디오시드 D 또는 E로 보다 효과적인 전환은 13-O-글루코시드 반응 (기질 레바우디오시드 A 및 스테비오시드)와 비교하여 19-O-글루코시드 반응 동안 보다 높은 활성을 갖는 디글리코실화 효소를 사용하여 수득될 수 있음을 인지할 것이다.
일부 구체예에서, 미생물과 같은 재조합 숙주는 총 스테비올 글리코시드중량에 대해 적어도 3% 초과의 레바우디오시드 D, 예를 들어 적어도 4% 레바우디오시드 D, 적어도 5%의 레바우디오시드 D, 10 내지 20% 레바우디오시드 D, 20 내지 30%의 레바우디오시드 D, 30 내지 40%의 레바우디오시드 D, 40 내지 50%의 레바우디오시드 D, 50 내지 60%의 레바우디오시드 D, 60 내지 70%의 레바우디오시드 D, 70 내지 80%의 레바우디오시드 D를 갖는 레바우디오시드 D-풍부 스테비올 글리코시드 조성물을 생성한다.
일부 구체예에서, 미생물과 같은 재조합 숙주는 적어도 90%의 레바우디오시드 D, 예를 들어 90 내지 99%의 레바우디오시드 D를 갖는 스테비올 글리코시드 조성물을 생성한다. 존재하는 기타 스테비올 글리코시드는 스테비올 모노시드, 스테비올 글루코비오시드, 레바우디오시드 A, 레바우디오시드 E, 및 스테비오시드를 포함할 수 있다. 일부 구체예에서, 숙주 (예를 들어, 미생물)로부터 생성된 레바우디오시드 D-풍부 조성물은 또한 추가로 정제될 수 있고, 그렇게 정제된 레바우디오시드 D 또는 레바우디오시드 E는 이후 소정의 향미 시스템 또는 감미 조성물을 수득하기 위해 다른 스테비올 글리코시드, 향료 또는 감미료와 혼합될 수 있다. 예를 들어, 재조합 숙주에 의해 생성된 레바우디오시드 D-풍부 조성물은 상이한 재조합 숙주에 의해 생성된 레바우디오시드 A 또는 F-풍부 조성물, 스테비아 추출물로부터 정제된 레바우디오시드 A 또는 F, 또는 시험관 내에서 생성된 레바우디오시드 A 또는 F와 조합될 수 있다.
일부 구체예에서, 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E 및/또는 레바우디오시드 M은 식물 추출물로부터 유래된 스테비올 글리코시드의 혼합물을 포함하는, 스테비올 및/또는 스테비올 글리코시드와 같은 전구체 분자를 함유하는 원재료(raw materials)에 공급되는 전체 재조합 세포를 이용하여 생성될 수 있으며, 여기에서 상기 재조합 세포는 모든 UGT 폴리펩티드 또는 이의 적절한 조합을 발현하여 상기 스테비올의 각각의 특정 글루코실화된 레바우디오시드로의 글루코실화를 수행한다. 일부 구체예에서, 재조합 세포는 투과제를 첨가할 필요 없이 레바우디오시드를 효과적으로 분비하도록 선택적으로 트랜스포터를 발현할 수 있다. 원재료는 세포 성장 동안 또는 세포 성장 이후에 공급될 수 있다. 전세포는 현탁되거나 고정될 수 있다. 전세포는 비드(beads), 예를 들어 칼슘 또는 소듐 알기네이트 비드 포집될 수 있다. 전세포는 중공 섬유 (hollow fiber) 튜브 반응기 시스템에 연결될 수 있다. 전세포는 막형 반응기 (membrane reactor) 시스템 내에서 농축되고 포집될 수 있다. 전세포는 발효 브로쓰 또는 반응 완충액 내에 있을 수 있다. 일부 구체예에서, 투과성 시약이 기질을 세포로 효과적으로 전달되기 위해 사용될 수 있다. 일부 구체예에서, 세포는 톨루엔과 같은 용매, 또는 트리톤-X (Triton-X) 또는 트윈 (Tween)과 같은 유기세제로 투과가능하게 된다. 일부 구체예에서, 세포는 계면활성제, 예를 들어 세틸트리메틸암모늄 브로마이미드 (CTAB)와 같은 양이온성 계면활성제로 투과가능하게 된다. 일부 구체예에서, 세포는 전기천공법 (electroporation) 또는 경미한 삼투압 충격 (osmotic shock)과 같은 주기적인 기계 충격으로 투과가능하게 된다. 세포는 하나의 재조합 UGT 또는 다수의 재조합 UGT를 포함할 수 있다. 예를 들어, 세포는 스테비오시드 및 RebA의 혼합물이 RebD로 효과적으로 전환되도록 UGT76G1 및 EUGT11을 포함할 수 있다. 일부 구체예에서, 전세포는 섹션 III A에 기재된 숙주 세포이다. 일부 구체예에서, 전세포는 E. 콜라이와 같은 그람-음성 박테리아이다. 일부 구체예에서, 전세포는 바실러스 (Bacillus)와 같은 그람-양성 박테리아이다. 일부 구체예에서, 전세포는 아스퍼길루스와 같은 진균종, 또는 사카로마이세스 (Saccharomyces)와 같은 효모이다. 일부 구체예에서, 용어 "전세포 생촉매(whole cell biocatalysis)"는 전세포가 상기 기재된 바와 같이 성장하고 (예를 들어, 배지에서 및 선택적으로는 투과가능하게), RebA 또는 스테비오시드와 같은 기질이 제공되고 세포로부터의 효소를 이용하여 최종 생성물로 전환되는 과정을 언급하는데 사용한다. 세포는 생세포이거나 아닐 수 있고, 생전환 반응 동안 성장하거나 안할 수 있다. 반대로, 발효의 경우 세포를 성장 배지에서 배양시키고 글루코스와 같은 탄소 및 에너지원을 공급하며, 최종 생성물은 생세포로 생성된다.
C. 기타 폴리펩티드
유전자의 발현으로 좀더 효과적인 또는 더 큰 규모의 스테비올 또는 스테비올 글리코시드의 생성을 도모할 수 있는 추가의 폴리펩티드들의 유전자가 또한 재조합 숙주 안으로 도입될 수 있다. 예를 들어, 재조합 미생물은 게라닐게라닐 디포스페이트 신타제 (GGPPS, GGPDS로도 언급됨)를 인코딩하는 하나 이상의 유전자를 또한 포함할 수 있다. 또 다른 예로서, 재조합 숙주는 람노스 신타제를 인코딩하는 하나 이상의 유전자, 또는 UDP-글루코스 탈수소효소 및/또는 UDP-글루쿠론산 데카르복실라제를 인코딩하는 하나 이상의 유전자를 포함할 수 있다. 또 다른 예로는, 재조합 숙주는 사이토크롬 P450 리덕타제 (CPR)을 인코딩하는 하나 이상의 유전자를 또한 포함할 수 있다. 재조합 CPR의 발현은 테르페노이드 생합성을 위한 보조인자로 사용되는 NADPH를 재생하기 위해 NADP+의 순환을 촉진시킨다. NADHP 수준을 재생하기 위한 다른 방법들도 물론 사용될 수 있다. NADPH가 제한되는 환경에서; 균주들은 외인성 트랜스히드로제나제 (transhydrogenase) 유전자를 포함하도록 변형될 수도 있다. 예를 들어, 문헌 [Sauer et al., J. Biol . Chem . 279:6613-6619(2004)] 참조. 요망되는 보조인자 수준이 증가되도록 NADH/NADPH의 비율을 감소시키거나 달리 변경시키는 다른 방법들은 당업계의 숙련자들에게 공지되어 있다.
또 다른 예로서, 재조합 숙주는 MEP 경로 또는 메발로네이트 경로에서 하나 이상의 효소들을 인코딩하는 하나 이상의 유전자를 포함할 수 있다. 이러한 유전자는 이들이 디테르펜 생합성 경로로 탄소 유동을 증가시킬 수 있어, 이 경로에 의해 생성된 이소펜테닐 디포스페이트 및 디메틸알릴 디포스페이트로부터 게라닐게라닐 디포스페이트를 생성하기 때문에 유용하다. 이렇게 생성된 게라닐게라닐 디포스페이트는 스테비올 생합성 폴리펩티드 및 스테비올 글리코시드 생합성 폴리펩티드의 발현으로 인하여 스테비올 및 스테비올 글리코시드 생합성으로 향하게 될 것이다.
또 다른 실시예로서, 재조합 숙주는 수크로스 신타제를 인코딩하는 하나 이상의 유전자를 포함할 수 있으며, 추가적으로 필요에 따라 수크로스 흡수 유전자를 함유할 수 있다. 수크로스 신타제 반응은 발효 숙주 또는 전세포 생전환(bioconversion) 과정에서 UDP-글루코스 풀(pool)을 증가시키기 위해 이용될 수 있다. 이것은 글리코실화 동안 생성된 UDP로부터 UDP-글루코스 및 수크로스를 재생시켜 효과적인 글리코실화를 허용한다. 일부 유기체에서, 내인성 인베르타제(invertase)의 파괴는 수크로스의 분해를 방해하는데 잇점이 있다. 예를 들어, S. 세레비시애 SUC2 인베르타제는 파괴될 수 있다. 수크로스 신타제 (SUS)는 임의의 적합한 유기체로부터 기인할 수 있다. 예를 들어, 비제한적으로 아라비돕시스 탈리아나, 스테비아 레바우디아나, 또는 코페아 아라비카로부터의 수크로스 신타제 코딩 서열은 적합한 프로모터의 조절하에서 발현 플라스미드로 클로닝되고, 미생물에서 발현될 수 있다. 수크로스 신타제는 수크로스 트랜스포터 (예를 들어, A. 탈리아나 SUC1 트랜스포터 또는 그의 기능성 호몰로그) 및 하나 이상의 UGT (예를 들어, UGT85C2, UGT74G1, UGT76G1, 및 UGT91D2e, EUGT11 또는 그들의 기능성 호몰로그 중 하나 이상)를 조합하여 이러한 균주에서 발현될 수 있다. 수크로스를 함유하는 배지에서 숙주를 배양하면 UDP-글루코스 뿐만 아니라 하나 이상의 글루코시드 (예를 들어, 스테비올 글리코시드)의 생성을 촉진시킬 수 있다.
스쿠알렌 신타제 (SQS)를 인코딩하는 ERG9 유전자의 발현은 또한, 재조합 숙주에서 스쿠알렌 신타제에 대한 전구체가 증가되도록 재조합 숙주에서 감소될 수 있다. SQS는 EC 2.5.1.21 하에 분류되며, 스테롤의 생성을 이끄는 생합성 경로의 첫번째 헌신적(committed) 효소이다. 이는 중간 프리스쿠알렌 피로포스페이트를 통하여 파르네실 피로포스페이트로부터 스쿠알렌의 합성을 촉매작용한다. 이러한 효소는 테르페노이드/이소프레노이드의 생합성에서 중요한 분기점(critical branch) 효소이고, 스테롤 경로를 통해 이소프렌 중간체의 유동을 조절하는 것으로 간주된다. 상기 효소는 종종 파르네실-디포스페이트 파르네실트랜스퍼라제 (FDFT1)으로 언급된다. SQS의 메카니즘은 파르네실 피로포스페이트의 2개 단위체를 스쿠알렌으로 전환시키는 것이다. SQS는 적어도 하나의 원핵생물이 기능적으로 유사한 효소를 지니는 것으로 입증되었으나, 진핵생물 또는 진화된 유기체의 효소로 간주된다.
폴리펩티드의 불활성화가 스테비올 또는 스테비올 글리코시드의 더욱 효율적이거나 더 큰 규모의 생성을 조장하는 폴리펩티드의 유전자는 재조합 숙주에서 변형될 수 있다. 예를 들어, DPP1 유전자에 의해 인코딩된 포스파타제 예컨대, 효모 디아실글리세롤 피로포스페이트 포스파타제 및/또는 LPP1 유전자에 의해 인코딩된 효모 지질 포스페이트 포스파타제를 인코딩하는 내인성 유전자는, 파르네솔로의 파르네실 피로포스페이트 (FPP)의 분해가 감소되고 게라닐게라니올 (GGOH)의 게라닐게라닐피로포스페이트 (GGPP)의 분해가 감소되도록 불활성화될 수 있다. 이러한 유전자는 공지된 기법 예컨대, 상동 재조합, 돌연변이유발 또는 전사 활성인자-유사 이펙터 누클레아제 (TALEN)에 의해 불활성되거나 발현 감소될 수 있다.
C.1
MEP
생합성 폴리펩티드
일부 구체예에서, 재조합 숙주는 이소프레노이드 생합성을 위한 메틸에리트리톨 4-포스페이트 (MEP) 경로에 관련된 효소들을 인코딩하는 하나 이상의 유전자를 함유하다. MEP 경로의 효소들은 데옥시자일룰로스 5-포스페이트 신타제 (DXS), D-1-데옥시자일룰로스 5-포스페이트 리덕토이소머라제 (reductoisomerase; DXR), 4-디포스포씨티딜-2-C-메틸-D-에리트리톨 신타제 (CMS), 4-디포스포씨티딜-2-메틸-D-에리트리톨 키나제 (CMK), 4-디포스포씨티딜-2-C-메틸-D-에리트리톨 2,4-사이클로디포스페이트 신타제 (MCS), 1-히드록시-2-메틸-2(E)-부테닐 4-디포스페이트 신타제 (HDS) 및 1-히드록시-2-메틸-2(E)-부테닐 4-디포스페이트 리덕타제 (HDR)를 포함한다. 하나 이상의 DXS 유전자, DXR 유전자, CMS 유전자, CMK 유전자, MCS 유전자, HDS 유전자 및/또는 HDR 유전자는 재조합 미생물에서 통합될 수 있다. 문헌 [Rodriguez-Concepcion and Boronat, Plant Phys.130:1079-1089 (2002)] 참조.
DXS, DXR, CMS, CMK, MCS, HDS 및/또는 HDR 폴리펩티드를 인코딩하는 적합한 유전자는 E. 콜라이, 아라비돕시스 탈리아나 및 시네초코쿠스 레오폴리엔시스에 의해 만들어진 것들을 포함한다. DXR 폴리펩티드를 인코딩하는 누클레오티드 서열을 예를 들어 미국 특허 번호 제7,335,815호에 기재되어 있다.
C. 2
메발로네이트
생합성 폴리펩티드
일부 구체예에서, 재조합 숙주는 이소프레노이드 생합성을 위한 메발로네이트 경로에 관련된 효소들을 인코딩하는 하나 이상의 유전자를 포함한다. 숙주 안으로 형질전환시키기에 적합한 유전자는 메발로네이트 경로의 효소, 예를 들어 절두된 3-히드록시-3-메틸-글루타릴 (HMG)-CoA 리덕타제 (tHMG)를 인코딩하고/거나 메발로네이트 키나제 (MK)를 인코딩하는 유전자, 및/또는 포스포메발로네이트 키나제 (PMK)를 인코딩하는 유전자, 및/또는 메발로네이트 피로포스페이트 데카르복실라제 (MPPD)를 인코딩하는 유전자가 있다. 따라서, 하나 이상의 HMG-CoA 리덕타제 유전자, MK 유전자, PMK 유전자, 및/또는 MPPD 유전자는 미생물과 같은 재조합 숙주에 통합될 수 있다.
메발로네이트 경로 폴리펩티드를 인코딩하는 적합한 유전자는 공지되어 있다. 예를 들어, 적합한 폴리펩티드는 E. 콜라이, 파라코쿠스 데니트리피칸스 (Paracoccus denitrificans), 사카로마이세스 세레비시애, 아라비돕시스 탈리아나, 키타사토스포라 그리세올라 (Kitasatospora griseola), 호모 사피엔스 (Homo sapiens), 드로소필라 멜라노가스터 (Drosophila melanogaster), 갈루스 갈루스 (Gallus gallus), 스트렙토마이세스 종 (Streptomyces sp.) KO-3988, 니코티아나 아테누아타 (Nicotiana attenuata), 키타사토스포라 그리세올라 (Kitasatospora griseola), 헤베아 브라실리엔시스 (Hevea brasiliensis), 엔테로코쿠스 패시움 (Enterococcus faecium) 및 헤마토코커스 플루비알리스 (Haematococcus pluvialis)에 의해 만들어진 것들을 포함한다. 예컨대, 표 9, 그 전문이 본원에 참조로서 포함되는 미국특허 7,183,089호, 5,460,949호, 및 5,306,862호, 및 PCT 출원 PCT/US2012/050021호 및 PCT/US2011/038967호를 참조하라.
표 9.
HMG
CoA
리덕타제
및 기타
메발로네이트
유전자의 공급원
수탁# | 유기체 | 효소 | 크기 (nt) | 유전자 명칭 |
XM_001467423 (aa SEQ ID NO: 60) |
레이쉬마니아 인판툼 ( Leishmania infantum) | 아세틸-CoA C-아세틸트랜스퍼라제 | 1323 (nt SEQ ID NO: 61) |
MEV-4 |
YML075C (aaSEQ ID NO: 62) |
사카로마이세스 세레비시애 | 절두된 HMG (tHMG1) | 1584 (nt SEQ ID NO: 63) |
tHMG1 |
EU263989 (aaSEQ ID NO: 64) |
가노데르마 루시둠 (Ganoderma lucidum) | 3-HMG-CoA 리덕타제 | 3681 (nt SEQ ID NO: 65) |
MEV-11 |
BC153262 (aa SEQ ID NO: 66) |
보스 타우루스 (Bos taurus) | 3-HMG-CoA 리덕타제 | 2667 (nt SEQ ID NO: 67) |
MEV-12 |
AAD47596 (aa SEQ ID NO: 68) |
아르테미시아 안누아 ( Artemisia annua) | 3-HMG-CoA 리덕타제 | 1704 (nt SEQ ID NO: 69) |
MEV-13 |
AAB62280
(aa SEQ ID NO: 70) |
트리파노소마 크루지 ( Trypanosoma cruzi) | 3-HMG-CoA 리덕타제 | 1308 (nt SEQ ID NO: 71) |
MEV-14 |
CAG41604 (aa SEQ ID NO: 72) |
스타피 아우레우스 (Staph aureus ) | 3-HMG-CoA 리덕타제 | 1281 (nt SEQ ID NO: 73) |
MEV-15 |
DNA2.0 서열 (aa SEQ ID NO: 74) |
아르채오글로부스 풀기두스 (Archaeoglobus fulgidus) | 3-HMG-CoA 리덕타제 | 1311 (nt SEQ ID NO: 75) |
HMG 리덕타제 |
DNA2.0 서열 (aa SEQ ID NO: 76) |
슈도모나스 메발로니 ( Pseudomonas mevalonii) | 3-HMG-CoA 리덕타제 | 1287 (nt SEQ ID NO: 77) |
HMG 리덕타제 |
C.3
수크로스
신타제
폴리펩티드
수크로스 신타제 (SUS)는 UDP-당을 생성하는 도구로 이용될 수 있다. SUS (EC 2.4.1.13)은 수크로스 및 UDP로부터 UDP-글루코스와 프룩토오스의 생성을 촉매작용한다. 따라서, UGTs의 반응으로 생성된 UDP는 수크로스의 존재하에서 UDP-글루코스로 전환될 수 있다. 예를 들어, 문헌 [Chen et al. (2001) J. Am. Chem . Soc . 123:8866-8867; Shao et al. (2003) Appl . Env . Microbiol . 69:5238-5242; Masada et al. (2007) FEBS Lett. 581:2562-2566; and Son et el. (2009) J. Microbiol . Biotechnol. 19:709-712] 참조.
수크로스 신타제는 UDP-글루코스를 생성하고 UDP를 제거하는데 사용되어, 다양한 시스템에서 화합물들의 효과적인 글리코실화를 도모할 수 있게 한다. 예를 들어, 수크로스를 이용하는 능력이 결여된 효모는 수크로스 트랜스포터 및 SUS를 도입함으로써 수크로스에서 성장하도록 만들 수 있다. 예를 들어, 사카로마이세스 세레비시애는 효과적인 수크로스 흡수 시스템을 가지고 있지 않아, 수크로스를 이용하기 위한 세포외 SUC2에 의존한다. 내인성 S. 세레비시애 SUC2 인베르타제의 파괴 및 재조합 SUS 발현의 조합은 세포내 수크로스를 대사작용할 수 있으나 세포외 수크로스는 그럴 수 없는 효모 균주를 나타낼 수 있다 (Riesmeier et al. (1992) EMBO J. 11:4705-4713). 균주는, cDNA 발현 라이브러리로 형질전환되고 수크로스를 취하는 능력을 얻게된 형질전환체(transformants)의 선별에 의해 수크로스 트랜스포터를 단리하는데 사용되었다.
생체내에서 재조합 수크로스 신타제와 수크로스 트랜스포터의 조합된 발현은 증가된 UDP-글루코스 이용가능성 및 원치않는 UDP의 제거를 가져올 수 있다. 예를 들어, 재조합 수크로스 신타제, 수크로스 트랜스포터, 및 글리코실 트랜스퍼라제의 기능적 발현은 자연적 수크로스 분해 시스템 (S. 세레비시애의 경우에는 SUC2)의 넉아웃과 조합되어 스테비올 글리코시드와 같은 글리코실화된 화합물의 양을 증가 생성할 수 있는 세포를 생성하는데 이용될 수 있다. 이러한 보다 높은 글리코실화 성능은 적어도 (a) 보다 고효율로 UDP-글루코스를 생성하는 높은 성능, 및 (b) 글리코실화 반응을 저해하는 UDP의 성장 배지로부터 제거로 인한 것일 수 있다.
수크로스 신타제는 임의의 적합한 유기체로부터 비롯될 수 있다. 예를 들어, 비제한적으로, 아라비돕시스 탈리아나 (예를 들어, SEQ ID NO: 78 또는 79), 또는 코페아 아라비카 (예를 들어, SEQ ID NO:80) (예를 들어, PCT/US2012/050021의 SEQ ID NO: 178, 179 및 180 참조)로부터의 수크로스 신타제 코딩 서열은 적합한 프로모터의 조절하에서 발현 플라스미드로 클로닝될 수 있고, 숙주 (예를 들어, 미생물 또는 식물) 내에서 발현될 수 있다. SUS 코딩 서열은 효모에 의해 세포외 수크로스의 분해를 피하기 위해 SUC2 (수크로스 가수분해 효소) 결여된 S. 세레비시애 균주에서 발현될 수 있다. 수크로스 신타제는 이러한 균주에서 수크로스 트랜스포터 (예를 들어, A. 탈리아나 SUC1 트랜스포터 또는 그의 기능성 호몰로그) 및 하나 이상의 UGT (예를 들어, UGT85C2, UGT74G1, UGT76G1, EUGT11, 및 UGT91D2e, 또는 그들의 기능적 호몰로그 중 하나 이상)와 조합되어 발현될 수 있다. 수크로스가 함유된 배지에서 숙주를 배양하면 UDP-글루코스 뿐만 아니라 하나 이상의 글루코시드 (예를 들어, 스테비올 글리코시드)의 생성을 촉진시킬 수 있다. 몇몇 경우에서, 수크로스 신타제 및 수크로스 트랜스포터가 또한, 특정 화합물 (예를 들어, 스테비올)의 생성을 위한 재조합체인 숙주 세포에서 UGT와 함께 발현될 수 있음이 주지된다.
C.4 스쿠알렌
신타제
폴리펩티드
내인성 스쿠알렌 신타제 유전자의 발현은 예를 들어, 각각 스쿠알렌 신타제를 인코딩하는 유전자의 프로모터 또는 스쿠알렌 신타제를 인코딩하는 오픈 리딩 프레임 (ORF)의 5' 말단 내의 유전체 서열의 일부에 상동인 2개 영역을 함유하는 핵산 작제물을 사용하여 본원에 기술된 재조합 숙주에서 변형될 수 있다. 효모에서, 예를 들어, 이러한 작제물은 각각 ERG9 프로모터 또는 ERG9 오픈 리딩 프레임의 5' 말단 내의 유전체 서열의 일부에 상동인 2개의 영역을 함유할 수 있다. 작제물은 효모에 대해 야생형 ScKex2 또는 야생형 ScCyc1과 같은 프로모터를 추가로 포함할 수 있다. 프로모터는 헤어핀과 같은 이종성 삽입물을 이의 3'-말단에 추가로 포함할 수 있다. ORF에 의해 인코딩되는 폴리펩티드는 스쿠알렌 신타제 (EC 2.5.1.21) 또는 이의 생물학적 활성 단편과 적어도 70% 동일성을 갖고, 상기 단편은 적어도 100개 아미노산의 중첩 범위에서 상기 스쿠알렌 신타제와 적어도 70% 서열 동일성을 갖는다. 예를 들어, PCT/US2012/050021을 참조하라.
이종성 삽입물은 헤어핀 루프를 갖는 헤어핀의 이차 구조 요소에 적합화될 수 있다. 이종성 삽입물 서열은 다음 일반식 (I)을 갖는다:
-X1-X2-X3-X4-X5,
X2는 X4의 적어도 4개의 연속 누클레오티드에 상보적이며, X4의 적어도 4개의 연속 누클레오티드를 지니는 헤어핀 이차 구조 요소를 형성하는 적어도 4개의 연속 누클레오티드를 포함하여, X3은 임의적이며, 존재하는 경우, X2 및 X4 사이에 헤어핀 루프를 형성하는데 관련되는 누클레오티드를 포함하고,
X1 및 X5는 개별적으로 그리고 임의로 하나 이상의 누클레오티드를 포함하고, X2 및 X4는, X2의 적어도 4개의 누클레오티드의 연속 서열이 X4의 적어도 4개의 누클레오티드의 연속 서열에 상보적인 한, 개별적으로 임의의 적합한 수의 누클레오티드로 구성될 수 있다. 일부 구체예에서, X2 및 X4는 동일한 수의 누클레오티드로 구성된다.
이종성 삽입물은 헤어핀을 완성할 수 있도록 충분히 길지만, 인-프레임(in-frame) 및 이종성 삽입물에 대해 바로 3'측에 존재하는 ORF의 제한된 번역이 가능하도록 충분히 짧다. 전형적으로, 이종성 삽입물은 10-50개 누클레오티드 길이, 예컨대, 10-30개 누클레오티드, 15-25개 누클레오티드, 17-22개 누클레오티드, 18-21개 누클레오티드, 18-20개 누클레오티드, 또는 19개 누클레오티드 길이이다.
X2는 예를 들어 4 내지 25개 범위의 누클레오티드, 예컨대 4 내지 20개, 4 내지 15개, 6 내지 12개, 8 내지 12개, 또는 9 내지 11개 범위의 누클레오티드로 구성될 수 있다.
X4는 예를 들어 4 내지 25개 범위의 누클레오티드, 예컨대 4 내지 20개, 4 내지 15개, 6 내지 12개, 8 내지 12개, 또는 9 내지 11개 범위의 누클레오티드로 구성될 수 있다.
일부 구체예에서, X2는 X4의 누클레오티드 서열과 상보적인 누클레오티드 서열로 구성되고, X2의 모든 누클레오티드는 X4의 누클레오티드 서열과 상보적이다.
X3은 부재할 수 있고, 즉 X3은 0개의 누클레오티드로 구성될 수 있다. X3은 1 내지 5개 범위의 누클레오티드, 예컨대 1 내지 3개 범위의 누클레오티드로 구성되는 것이 또한 가능하다.
X1은 부재할 수 있고, 즉 X1은 0개의 누클레오티드로 구성될 수 있다. X1은 1 내지 25개 범위의 누클레오티드, 예컨대 1 내지 20개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 또는 1 내지 3개 범위의 누클레오티드로 구성되는 것이 또한 가능하다.
X5는 부재할 수 있고, 즉 X5는 0개의 누클레오티드로 구성될 수 있다. X5는 1 내지 5개 범위의 누클레오티드, 예컨대 1 내지 3개 범위의 누클레오티드로 구성되는 것이 또한 가능하다.
이종성 삽입물은 본원에 정의된 요건을 충족시키는 임의의 적합한 서열일 수 있다. 예를 들어, 이종성 삽입물은 tgaattcgttaacgaattc (SEQ ID NO: 81), tgaattcgttaacgaactc (SEQ ID NO: 82), tgaattcgttaacgaagtc (SEQ ID NO: 83), 또는 tgaattcgttaacgaaatt (SEQ ID NO: 84)를 포함할 수 있다.
특정 메커니즘에 얽매이지 않으며, 효모에서 ERG9 발현은 RNA에 대한 리보솜의 결합을 적어도 부분적으로 입체적으로 방해함에 의해 감소되어, 스쿠알렌 신타제의 번역을 감소시킬 수 있다. 그러한 작제물을 이용하는 것은 파르네실-피로포스페이트에서 스쿠알렌으로의 턴오버를 감소시키고/거나 파르네실-피로포스페이트, 이소펜테닐-피로포스페이트, 디메틸알릴-피로포스페이트, 게라닐-피로포스페이트 및 게라닐게라닐-피로포스페이트로 구성된 군으로부터 선택되는 화합물의 축적을 향상시킬 수 있다.
때때로, 본원에 기재된 재조합 숙주를 배양할 때 스쿠알렌 신타제 억제제를 포함시키는 것이 유리할 수 있다. 스쿠알렌 신타제, 예컨대, 라파퀴스태트(lapaquistat)에 의한 화학적 억제가 당 분야에 공지되어 있다. 그 밖의 스쿠알렌 신타제 억제제는 자라고직산(Zaragozic acid) 및 RPR 107393을 포함한다. 따라서, 한 구체예에서 본원에 정의된 방법(들)의 배양 단계는 스쿠알렌 신타제 억제제의 존재하에 수행된다.
일부 구체예에서, 본원에 기재된 재조합 효모 숙주는 ERG9 오픈 리딩 프레임에 돌연변이를 함유한다.
일부 구체예에서, 본원에 기재된 재조합 효모 숙주는 ERG9[Δ]::HIS3 결실/삽입 대립유전자를 함유한다.
D. 기능성
호몰로그
본원에 기재된 폴리펩티드의 기능성 호몰로그는 또한 재조합 숙주에서 스테비올 또는 스테비올 글리코시드를 생성하는데 이용하기 적합하다. 기능성 호몰로그는 기준 폴리펩티드에 대한 서열 유사성을 지니고, 기준 폴리펩티드의 생화학적 또는 생리학적 기능(들) 중 하나 이상을 보유하는 폴리펩티드이다. 기능성 호몰로그 및 기준 폴리펩티드는 자연 발생 폴리펩티드일 수 있고, 서열 유사성은 수렴성 (convergent) 또는 분기성 (divergnt) 진화 사건 때문일 수 있다. 이와 같이, 기능성 호몰로그는 때로 문헌에서 호몰로그, 또는 오르톨로그(ortholog), 또는 파라로그 (paralog)로 명명된다. 자연 발생 기능성 호몰로그의 변이체, 예컨대 야생형 코딩 서열의 돌연변이체에 의해 인코딩되는 폴리펩티드는 그 자체가 기능성 호몰로그일 수 있다. 기능성 호몰로그는 또한 폴리펩티드에 대한 코딩 서열의 부위-특이적 돌연변이유발을 통해, 또는 상이한 자연-발생 폴리펩티드들에 대한 코딩 서열로부터의 도메인을 조합시켜 ("도메인 교환 (swapping)") 생성될 수 있다. 본원에 기재된 기능성 UGT 폴리펩티드를 인코딩하는 유전자를 변형시키는 기법은 공지되어 있고, 그 중에도 특히, 지향된 진화 기법, 부위-특이적 돌연변이유발 기법 및 무작위 돌연변이유발 기법을 포함하며, 이는 폴리펩티드의 특이적 활성을 증가시키거나, 기질 특이성을 변경시키거나, 발현 수준을 변경시키거나, 아세포(subcellular) 위치를 변경시키거나, 폴리펩티드:폴리펩티드 상호작용을 요망되는 방식으로 변형시키는데 유용할 수 있다. 그러한 변형된 폴리펩티드는 기능성 호몰로그로 간주된다. 용어 "기능성 호몰로그"는 때로 기능적으로 상동인 폴리펩티드를 인코딩하는 핵산에 적용된다.
기능성 호몰로그는 누클레오티드 및 폴리펩티드 서열 정렬의 분석에 의해 확인될 수 있다. 예를 들어, 누클레오티드 또는 폴리펩티드 서열의 데이터베이스에 쿼리 (query)를 실행함으로써 스테비올 또는 스테비올 글리코시드 생합성 폴리펩티드 또는 트랜스포터 유전자 또는 단백질 또는 적어도 하나의 트랜스포터 유전자의 발현을 조절하는 전사 인자 유전자 또는 단백질의 호몰로그를 확인할 수 있다. 서열 분석은 GGPPS, CDPS, KS, KO, KAH 또는 트랜스포터 또는 전사 인자 아미노산 서열을 기준 서열로 이용하는 비중복된 (nonredundant) 데이터베이스의 BLAST, 상호 BLAST, 또는 PSI-BLAST 분석을 포함할 수 있다. 아미노산 서열은, 일부 경우에, 누클레오티드 서열로부터 유추된다. 데이터베이스에서 40% 초과의 서열 동일성을 갖는 이들 폴리펩티드는 스테비올 또는 스테비올 글리코시드 생합성 폴리펩티드에 대한 기능성 호몰로그 또는 트랜스포터 단백질 또는 적어도 하나의 트랜스포터 유전자의 발현을 조절하는 전사 인자에 대한 기능성 호몰로그로서의 적합성을 추가로 평가하기 위한 후보들이다. 아미노산 서열 유사성은 보존적 아미노산 치환, 예를 들어 하나의 소수성 잔기를 또 다른 소수성 잔기로 치환하거나 하나의 극성 잔기를 또 다른 극성 잔기로 치환하는 것을 허용한다. 요망되는 경우, 추가로 평가되어야 하는 후보의 수를 좁히기 위해 그러한 후보의 수동 검사를 수행할 수 있다. 수동 검사는 스테비올 생합성 폴리펩티드 또는 트랜스포터 단백질 또는 적어도 하나의 트랜스포터 유전자의 발현을 조절하는 전사 인자에 존재하는 도메인, 예컨대 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택함에 의해 수행될 수 있다.
보존된 영역은 반복되는 서열이거나, 일부 이차 구조 (예를 들어, 나선형 및 베타 시트)를 형성하거나, 양 또는 음으로 하전된 도메인을 확립하거나, 단백질 모티프 또는 도메인을 나타내는 스테비올 또는 스테비올 글리코시드 생합성 폴리펩티드 또는 트랜스포터 유전자 또는 적어도 하나의 트랜스포터 유전자의 발현을 조절하는 전사 인자의 일차 아미노산 서열 내의 영역의 위치를 찾아냄에 의해 확인될 수 있다. 예컨대, 월드와이드웹 상에서 다양한 단백질 모티프 및 도메인에 대한 컨센서스 서열을 기재하고 있는 Pfam 웹사이트 sanger.ac.uk/Software/Pfam/ 및 pfam.janelia.org/를 참조하라. Pfam 데이터베이스에 포함된 정보는 문헌[Sonnhammer et al., Nucl. Acids Res., 26:320-322 (1998); Sonnhammer et al., Proteins, 28:405-420 (1997); and Bateman et al., Nucl. Acids Res., 27:260-262 (1999)]에 기재된다. 보존된 영역은 밀접하게 관련된 종으로부터의 동일하거나 관련된 폴리펩티드의 서열을 정렬함으로써 또한 결정할 수 있다. 밀접하게 관련된 종은 바람직하게는 동일한 패밀리로부터의 종이다. 일부 구체예들에서, 두 상이한 종으로부터의 서열을 정렬하는 것이 적합하다.
전형적으로, 적어도 약 40%의 아미노산 서열 동일성을 나타내는 폴리펩티드가 보존된 영역을 확인하는데 유용하다. 관련 폴리펩티드의 보존된 영역은 적어도 45%의 아미노산 서열 동일성 (예컨대, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%의 아미노산 서열 동일성)을 나타낸다. 일부 구체예에서, 보존된 영역은 적어도 92%, 94%, 96%, 98%, 또는 99%의 아미노산 서열 동일성을 나타낸다.
예를 들어, 재조합 숙주에서 스테비올 글리코시드를 생성하는데 적합한 폴리펩티드는 EUGT11, UGT91D2e, UGT91D2m, UGT85C, 및 UGT76G의 기능성 호몰로그를 포함한다. 그러한 호몰로그는 PCT 출원 PCT/US2012/050021호에 기재된 EUGT11, UGT91D2e, UGT91D2m, UGT85C, 또는 UGT76G의 아미노산 서열과 90% 초과 (예컨대, 적어도 95% 또는 99%)의 서열 동일성을 갖는다. EUGT11, UGT91D2, UGT85C, 및 UGT76G 폴리펩티드의 변이체는 전형적으로 일차 아미노산 서열 내에 10개 또는 그 미만의 아미노산 치환을 갖고, 예컨대, 7개 또는 그 미만의 아미노산 치환, 5개 또는 보존적 아미노산 치환, 또는 1 내지 5개의 치환을 갖는다. 그러나, 일부 구체예에서, EUGT11, UGT91D2, UGT85C, 및 UGT76G 폴리펩티드의 변이체는 10개 또는 그 초과의 아미노산 치환 (예컨대, 10, 15, 20, 25, 30, 35, 10-20, 10-35, 20-30, 또는 25-35개 아미노산 치환)을 지닐 수 있다. 치환은 보존적이거나, 일부 구체예에서, 비-보존적일 수 있다. UGT91D2e 폴리펩티드에서 비-보존적 변화의 비제한적인 예는 글리신에서 아르기닌 및 트립토판에서 아르기닌으로의 변화를 포함한다. UGT76G 폴리펩티드에서 비-보존적 치환의 비제한적인 예는 발린에서 글루탐산, 글리신에서 글루탐산, 글루타민에서 알라닌 및 세린에서 프롤린으로의 치환을 포함한다. UGT85C 폴리펩티드에 대한 변화의 비제한적인 예는 히스티딘에서 아스파르트산, 프롤린에서 세린, 리신에서 트레오닌, 및 트레오닌에서 아르기닌으로의 변화를 포함한다.
일부 구체예에서, 유용한 UGT91D2 호몰로그는 예측된 루프의 밖에 있는 폴리펩티드의 영역에 아미노산 치환 (예컨대, 보존적 아미노산 치환)을 지닐 수 있고, 예컨대, 잔기 20-26, 39-43, 88-95, 121-124, 142-158, 185-198, 및 203-214는 N-말단 도메인의 예측된 루프이고 잔기 381-386는 91D2e의 C-말단 도메인의 예측된 루프이다 (SEQ ID NO:54 참조). 예를 들어, 유용한 UGT91D2 호몰로그는 잔기 1-19, 27-38, 44-87, 96-120, 125-141, 159-184, 199-202, 215-380, 또는 387-473에 적어도 하나의 아미노산 치환을 포함할 수 있다. 일부 구체예에서, UGT91D2 호몰로그는 잔기 30, 93, 99, 122, 140, 142, 148, 153, 156, 195, 196, 199, 206, 207, 211, 221, 286, 343, 427, 및 438로 구성된 군으로부터 선택되는 하나 이상의 잔기에 아미노산 치환을 지닐 수 있다. 예를 들어, UGT91D2 기능성 호몰로그는 잔기 206, 207, 및 343 중 하나 이상에 아미노산 치환을 지닐 수 있고, 예컨대 잔기 206에 아르기닌, 잔기 207에 시스테인, 및 잔기 343에 아르기닌을 지닐 수 있다. 예를 들어, SEQ ID NO:86 참조. UGT91D2의 그 밖의 기능성 호몰로그는 하기 중 하나 이상을 지닐 수 있다: 잔기 30에 티로신 또는 페닐알라닌, 잔기 93에 프롤린 또는 글루타민, 잔기 99에 세린 또는 발린, 잔기 122에 티로신 또는 페닐알라닌, 잔기 140에 히스티딘 또는 티로신, 잔기 142에 세린 또는 시스테인, 잔기 148에 알라닌 또는 트레오닌, 잔기 152에 메티오닌, 잔기 153에 알라닌, 잔기 156에 알라닌 또는 세린, 잔기 162에 글리신, 잔기 195에 류신 또는 메티오닌, 잔기 196에 글루탐산, 잔기 199에 리신 또는 글루탐산, 잔기 211에 류신 또는 메티오닌, 잔기 213에 류신, 잔기 221에 세린 또는 페닐알라닌, 잔기 253에 발린 또는 이소류신, 잔기 286에 발린 또는 알라닌, 잔기 427에 리신 또는 아스파라긴, 잔기 438에 알라닌, 및 잔기 462에 알라닌 또는 트레오닌. 또 다른 구체예에서, UGT91D2 기능성 호몰로그는 잔기 211에 메티오닌 및 잔기 286에 알라닌을 함유한다.
일부 구체예에서, 유용한 UGT85C 호몰로그는 잔기 9, 10, 13, 15, 21, 27, 60, 65, 71, 87, 91, 220, 243, 270, 289, 298, 334, 336, 350, 368, 389, 394, 397, 418, 420, 440, 441, 444, 및 471에 하나 이상의 아미노산 치환을 지닐 수 있다. 유용한 UGT85C 호몰로그의 비제한적인 예 (SEQ ID NO: 30에 비해)는 잔기 65 (예컨대, 잔기 65에 세린), 잔기 15 (잔기 15에 류신)와 함께 잔기 65, 270 (예컨대, 잔기 270에 메티오닌, 아르기닌, 또는 알라닌), 418 (예컨대, 잔기 418에 발린), 440 (예컨대, 잔기 440에 아스파르트산), 또는 441 (예컨대, 잔기 441에 아스파라긴); 잔기 13 (예컨대, 잔기 13에 페닐알라닌), 15, 60 (예컨대, 잔기 60에 아스파르트산), 270, 289 (예컨대, 잔기 289에 히스티딘), 및 418에 치환; 잔기 13, 60, 및 270에 치환; 잔기 60 및 87 (예컨대, 잔기 87에 페닐알라닌)에 치환; 잔기 65, 71 (예컨대, 잔기 71에 글루타민), 220 (예컨대, 잔기 220에 트레오닌), 243 (예컨대, 잔기 243에 트립토판), 및 270에 치환; 잔기 65, 71, 220, 243, 270, 및 441에 치환; 잔기 65, 71, 220, 389 (예컨대, 잔기 389에 발린), 및 394 (예컨대, 잔기 394에 발린)에 치환; 잔기 65, 71, 270, 및 289에 치환; 잔기 220, 243, 270, 및 334 (예컨대, 잔기 334에 세린)에 치환; 또는 잔기 270 및 289에 치환을 갖는 폴리펩티드를 포함한다. 하기 아미노산 돌연변이는 85C2 폴리펩티드에서 활성의 손실을 발생시키지 않았다: V13F, F15L, H60D, A65S, E71Q, I87F, K220T, R243W, T270M, T270R, Q289H, L334S, A389V, I394V, P397S, E418V, G440D, 및 H441N. 활성 클론에서 보여지는 추가의 돌연변이는 K9E, K10R, Q21H, M27V, L91P, Y298C, K350T, H368R, G420R, L431P, R444G, 및 M471T를 포함한다. 일부 구체예에서, UGT85C2는 위치 65 (예컨대, 세린), 71 (글루타민), 270 (메티오닌), 289 (히스티딘), 및 389 (발린)에 치환을 함유한다.
인간의 MDM2 단백질의 처음 158 아미노산이 N-말단에서 프레임안에 융합된 스테비아 레바우디아나 UGT 74G1, 76G1 및 91D2e, 및 합성된 PMI 펩티드의 4개의 반복서열 (4 X TSFAEYWNLLSP, 서열 번호:87)이 N-말단에서 프레임안에 융합된 스테비아 레바우디아나 UGT85C2의 아미노산 서열은 서열 번호: 88, 89, 90, 및 91에 각각 제시된다.
일부 구체예에서, 유용한 UGT76G 호몰로그는 SEQ ID NO:85의 잔기 29, 74, 87, 91, 116, 123, 125, 126, 130, 145, 192, 193, 194, 196, 198, 199, 200, 203, 204, 205, 206, 207, 208, 266, 273, 274, 284, 285, 291, 330, 331, 및 346에 하나 이상의 아미노산 치환을 지닐 수 있다.
유용한 UGT76G 호몰로그의 비제한적인 예는 잔기 74, 87, 91, 116, 123, 125, 126, 130, 145, 192, 193, 194, 196, 198, 199, 200, 203, 204, 205, 206, 207, 208, 및 291; 잔기 74, 87, 91, 116, 123, 125, 126, 130, 145, 192, 193, 194, 196, 198, 199, 200, 203, 204, 205, 206, 207, 208, 266, 273, 274, 284, 285, 및 291; 또는 잔기 74, 87, 91, 116, 123, 125, 126, 130, 145, 192, 193, 194, 196, 198, 199, 200, 203, 204, 205, 206, 207, 208, 266, 273, 274, 284, 285, 291, 330, 331, 및 346에 치환을 갖는 폴리펩티드를 포함한다. 표 10을 참조하라.
클론 | 돌연변이 |
76G_G7 | M29I, V74E, V87G, L91P, G116E, A123T, Q125A, I126L, T130A, V145M, C192S, S193A, F194Y, M196N, K198Q, K199I, Y200L, Y203I, F204L, E205G, N206K, I207M, T208I, P266Q, S273P, R274S, G284T, T285S, 287-3 bp 결실, L330V, G331A, L346I |
76G_H12 | M29I, V74E, V87G, L91P, G116E, A123T, Q125A, I126L, T130A, V145M, C192S, S193A, F194Y, M196N, K198Q, K199I, Y200L, Y203I, F204L, E205G, N206K, I207M, T208I, P266Q, S273P, R274S, G284T, T285S, 287-3 bp 결실 |
76G_C4 | M29I, V74E, V87G, L91P, G116E, A123T, Q125A, I126L, T130A, V145M, C192S, S193A, F194Y, M196N, K198Q, K199I, Y200L, Y203I, F204L, E205G, N206K, I207M, T208I |
예를 들어, EUGT11 또는 UGT91D2e의 기질 특이성을 변경시키는 방법은 당업자에게 공지되어 있으며, 부위-특이적/논리적 돌연변이유발 접근법, 무작위 유도되는 진화 접근법 및 무작위 돌연변이유발/포화 기법이 효소의 활성 부위 부근에서 수행되는 조합법을 포함하나, 이로 한정되는 것은 아니다. 예를 들어, 문헌[Osmani, et al., Phytochemistry 70 325-347 (2009)]을 참조하라.
후보 서열은 전형적으로 기준 서열 길이의 80 퍼센트 내지 200 퍼센트의 길이, 예컨대, 기준 서열 길이의 82, 85, 87, 89, 90, 93, 95, 97, 99, 100, 105, 110, 115, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200 퍼센트의 길이를 갖는다. 기능성 호몰로그 폴리펩티드는 전형적으로 기준 서열 길이의 95 퍼센트 내지 105 퍼센트의 길이, 예컨대, 기준 서열 길이의 90, 93, 95, 97, 99, 100, 105, 110, 115, 또는 120 퍼센트의 길이, 또는 그 사이의 임의의 범위의 길이를 갖는다. 기준 핵산 또는 폴리펩티드에 대한 임의의 후보 핵산 또는 폴리펩티드의 퍼센트 동일성은 다음과 같이 결정될 수 있다. 기준 서열 (예컨대, 핵산 서열 또는 아미노산 서열)은 컴퓨터 프로그램 ClustalW (버전 1.83, 디폴트 파라미터)를 이용하여 하나 이상의 후보 서열에 정렬되는데, 이는 이들의 전장에 걸쳐 핵산 또는 폴리펩티드 서열의 정렬이 수행될 수 있게 한다 (글로벌 정렬). 문헌[Chenna et al., Nucleic Acids Res., 31(13):3497-500 (2003)].
ClustalW는 기준 서열과 하나 이상의 후보 서열 간의 최상의 매칭을 계산하고, 동일성, 유사성 및 차이가 결정될 수 있게 이들을 정렬시킨다. 하나 이상의 잔기의 갭이 기준 서열, 후보 서열 또는 둘 모두에 삽입되어 서열 정렬을 최대화시킬 수 있다. 핵산 서열의 신속한 쌍(pairwise) 정렬을 위해, 다음의 디폴트 파라미터가 이용된다: 워드 크기: 2; 윈도 크기: 4; 득점 방법: 백분율; 상부 대각선의 수: 4; 및 갭 페널티: 5. 핵산 서열의 다수 정렬을 위해, 다음의 파라미터가 이용된다: 갭 개방 페널티: 10.0; 갭 연장 페널티: 5.0; 및 중량 변화: 있음. 단백질 서열의 신속한 쌍 정렬을 위해, 다음의 파라미터가 이용된다: 워드 크기: 1; 윈도 크기: 5; 득점 방법: 백분율; 상부 대각선의 수: 5; 갭 페널티: 3. 단백질 서열의 다수 정렬을 위해, 다음의 파라미터가 이용된다: 중량 매트릭스: 블로섬(blosum); 갭 개방 페널티: 10.0; 갭 연장 페널티: 0.05; 친수성 갭: 켜짐(on); 친수성 잔기: Gly, Pro, Ser, Asn, Asp, Gln, Glu, Arg, 및 Lys; 잔기-특이적 갭 페널티: 켜짐. ClustalW 결과는 서열 간의 관계를 반영하는 서열 정렬이다. ClustalW는, 예를 들어, 월드와이드웹 상의 Baylor College of Medicine Search Launcher 사이트 (searchlauncher.bcm.tmc.edu/multi-align/multi-align.html) 및 월드와이드웹 상의 European Bioinformatics Institute 사이트 (ebi.ac.uk/clustalw)에서 실행될 수 있다.
기준 서열에 대한 후보 핵산 또는 아미노산 서열의 퍼센트 동일성을 결정하기 위해, 서열을 ClustalW를 이용하여 정렬시키고, 정렬에서 동일한 매칭의 수를 기준 서열의 길이로 나누고, 그 결과에 100을 곱한다. 퍼센트 동일성 값은 가장 근접한 소수점 첫째 자리까지 반올림할 수 있음에 유의한다. 예를 들어, 78.11, 78.12, 78.13, 및 78.14는 78.1로 반내림되는 반면, 78.15, 78.16, 78.17, 78.18, 및 78.19는 78.2로 반올림된다.
기능성 UGT는 글루코실화 또는 효소에 의해 수행되는 그 밖의 효소 활성에 관여하지 않는 추가의 아미노산을 포함할 수 있어서, 이러한 폴리펩티드는 그렇지 않은 경우보다 더 길어질 수 있음을 인지할 것이다. 예를 들어, EUGT11 폴리펩티드는 아미노 또는 카르복시 말단에 첨가되는 정제 태그 (예컨대, HIS 태그 또는 GST 태그), 엽록체 운반 펩티드, 미토콘드리아 운반 펩티드, 녹말체 펩티드, 신호 펩티드, 또는 분비 태그를 포함할 수 있다. 일부 구체예에서, EUGT11 폴리펩티드는 리포터로서 기능하는 아미노산 서열, 예컨대, 그린 형광 단백질 또는 옐로우 형광 단백질을 포함한다.
II. 스테비올 및 스테비올 글리코시드 생합성 핵산
본원에 기재된 폴리펩티드를 인코딩하는 재조합 유전자는 폴리펩티드 발현에 적합한 하나 이상의 조절 영역에 센스 배향으로 작동적으로 연결된, 상기 폴리펩티드에 대한 코딩 서열을 포함한다. 많은 미생물이 폴리시스트론 mRNA로부터 다수의 유전자 생성물을 발현할 수 있으므로, 요망되는 경우 다수의 폴리펩티드가 상기 미생물에 대한 단일한 조절 영역의 제어 하에 발현될 수 있다. 코딩 서열 및 조절 영역은, 조절 영역과 코딩 서열이 상기 서열의 전사 또는 번역을 조절하는데 유효하도록 정위될 때 작동적으로 연결된 것으로 간주된다. 전형적으로, 코딩 서열의 번역적 리딩 프레임의 번역 개시 부위는 모노시스트론 유전자에 대한 조절 영역의 1 내지 약 50개 누클레오티드 다운스트림 사이에 위치한다.
많은 경우에, 본원에 기재된 폴리펩티드에 대한 코딩 서열은 재조합 숙주 이외의 종에서 확인되며, 즉, 이종성 핵산이다. 따라서, 재조합 숙주가 미생물인 경우, 코딩 서열은 그 밖의 원핵 또는 진핵 미생물, 식물 또는 동물로부터 유래될 수 있다. 그러나, 일부 경우에 코딩 서열은 상기 숙주에 고유한 서열이며 해당 유기체에 재도입된다. 천연 서열은 종종 외인성 핵산에 연결된 비-자연 서열, 예를 들어 재조합 핵산 작제물에서 천연 서열의 측면에 있는 비-천연 조절 서열의 존재에 의해 자연 발생 서열과 구별될 수 있다. 또한, 안정하게 형질전환된 외인성 핵산은 전형적으로 천연 서열이 발견되는 위치가 아닌 다른 위치에 통합된다. "조절 영역"은 전사 또는 번역 개시 및 속도, 및 전사 또는 번역 생성물의 안정성 및/또는 운동성에 영향을 주는 누클레오티드 서열을 지닌 핵산을 의미한다. 조절 영역은, 비제한적으로, 프로모터 서열, 인핸서 서열, 반응 요소, 단백질 인지 부위, 유도성 요소, 단백질 결합 서열, 5' 및 3' 비번역된 영역 (UTR), 전사 출발 부위, 종결 서열, 폴리아데닐화 서열, 인트론, 및 이의 조합물을 포함한다. 조절 영역은 전형적으로 적어도 코어(기저) 프로모터를 포함한다. 조절 영역은 또한 적어도 하나의 제어 요소, 예를 들어 인핸서 서열, 업스트림 요소 또는 업스트림 활성화 영역 (UAR)을 포함할 수 있다. 조절 영역은, 조절 영역이 서열의 전사 또는 번역을 조절하는데 유효하도록 조절 영역과 코딩 서열을 정위시킴으로써 코딩 서열에 작동적으로 연결된다. 예를 들어, 코딩 서열 및 프로모터 서열을 작동적으로 연결시키기 위해, 코딩 서열의 번역적 리딩 프레임의 번역 개시 부위는 전형적으로 프로모터의 1 내지 약 50개 누클레오티드 다운스트림에 정위된다. 그러나, 조절 영역은 번역 개시 부위의 약 5,000개 만큼 많은 누클레오티드 업스트림, 또는 전사 출발 부위의 약 2,000개 누클레오티드 업스트림에 정위될 수 있다.
포함되는 조절 영역의 선택은 비제한적으로 특정 배양 단계 동안의 효율, 선택성, 유도성, 요망되는 발현 수준, 및 우선적인 발현을 포함하는 여러 인자에 의해 좌우된다. 코딩 서열에 대한 조절 영역을 적절하게 선택하고 정위함에 의해 코딩 서열의 발현을 조절하는 것은 당업자에게는 일상적인 것이다. 하나를 초과하는 조절 영역, 예컨대 인트론, 인핸서, 업스트림 활성화 영역, 전사 터미네이터, 및 유도성 요소가 존재할 수 있음이 이해될 것이다.
하나 이상의 유전자는 스테비올 및/또는 스테비올 글리코시드 생성의 별개의 양태에 유용한 "모듈"로 재조합 핵산 작제물에 조합될 수 있다. 모듈, 특히 폴리시스트론 모듈에서 복수의 유전자를 조합시키는 것은 다양한 종에서의 모듈의 이용을 촉진한다. 예를 들어, 스테비올 생합성 유전자 클러스터, 또는 UGT 유전자 클러스터는 폴리시스트론 모듈에서 조합될 수 있어서, 적합한 조절 영역의 삽입 후, 상기 모듈은 광범하게 다양한 종에 도입될 수 있다. 또 다른 예로서, UGT 유전자 클러스터는 각각의 UGT 코딩 서열이 분리된 조절 영역에 작동적으로 연결되어 UGT 모듈을 형성하도록 조합될 수 있다. 그러한 모듈은 모노시스트론 발현이 필수적이거나 또는 바람직한 종들에서 이용될 수 있다. 재조합 작제물은 스테비올 또는 스테비올 글리코시드 생성에 유용한 유전자 외에, 전형적으로 복제 기점, 및 적절한 종에서 작제물의 유지를 위한 하나 이상의 선택 마커를 또한 함유한다.
유전자 코드의 축퇴로 인해, 다수의 핵산은 특정한 폴리펩티드를 인코딩할 수 있으며; 즉, 다수의 아미노산의 경우, 아미노산에 대한 코돈으로서 작용하는 하나를 초과하는 누클레오티드 트리플렛(triplet)이 존재함을 인지할 것이다. 따라서, 주어진 폴리펩티드에 대한 코딩 서열의 코돈은 특정 숙주에서 최적의 발현이 얻어지도록, 그 숙주 (예를 들어, 미생물)에 적절한 코돈 바이어스 테이블을 이용하여 변형될 수 있다. 분리된 핵산으로서, 이러한 변형된 서열은 정제된 분자로서 존재할 수 있고 재조합 핵산 작제물에 대한 모듈을 구성하는데 사용하기 위해 벡터 또는 바이러스에 혼입될 수 있다.
일부 경우에 대사 중간체를 스테비올 또는 스테비올 글리코시드 생합성 쪽으로 전용시키기 위해 내인성 폴리펩티드의 하나 이상의 기능을 억제하는 것이 바람직하다. 예를 들어, 스테비올 또는 스테비올 글리코시드 생성을 더 증가시키기 위해, 예컨대 스쿠알렌 에폭시다제를 하향조절함으로써, 효모 균주에서 스테롤의 합성을 하향조절하는 것이 바람직할 수 있다. 또 다른 예로서, 특정한 내인성 유전자 생성물, 예를 들어 본원에 논의된 대로 이차 대사산물로부터 글루코스 모이어티를 제거하는 글리코하이드롤라제 또는 포스파타제의 분해 기능을 억제하는 것이 바람직할 수 있다. 또 다른 예로서, 스테비올 글리코시드의 수송에 관여하는 막 트랜스포터의 발현이 억제될 수 있어서, 글리코실화된 스테비오시드의 분비가 억제된다. 그러한 조절은 미생물의 배양 중에 요망되는 기간 동안 스테비올 글리코시드의 분비를 억제시킬 수 있어서, 이에 의해 회수되는 글리코시드 생성물(들)의 수율을 증가시키는데 유리할 수 있다. 그러한 경우에, 폴리펩티드 또는 유전자 생성물의 발현을 억제하는 핵산은 균주로 형질전환되는 재조합 작제물에 포함될 수 있다. 대안적으로, 돌연변이유발을 이용하여 기능을 억제하는 것이 요망되는 유전자의 돌연변이체를 생성할 수 있다.
III. 트랜스포터
발현
본 문헌은 내인성 트랜스포터 유전자의 발현이 변형되거나 이종성 트랜스포터 유전자가 발현되는 재조합 숙주 세포에 관한 것이다. 일부 구체예에서, 내인성 트랜스포터의 발현은 내인성 프로모터를 트랜스포터 단백질의 증가된 발현을 유도하는 상이한 프로모터로 대체함으로써 변형될 수 있다 (예를 들어, 적어도 5% 발현 증가 예컨대, 적어도 10%, 15%, 20%, 또는 25% 발현 증가). 예를 들어, 내인성 프로모터는 트랜스포터의 증가된 발현을 유도하는 항시성 또는 유도성 프로모터로 대체될 수 있다. 상동 재조합은 내인성 유전자를, 트랜스포터의 증가된 발현을 유도하는 상이한 프로모터로 대체하는데 이용될 수 있다. 기타 구체예에서, 유도성 또는 항시성 프로모터 및 내인성 프로모터 또는 전사 인자 유전자는 상동 재조합을 이용하여 유전체의 또 다른 로커스로 통합될 수 있다. 기타 구체예에서, 트랜스포터 유전자는 미생물에서 트랜스포터의 과다발현을 유도하는 프로모터를 갖는 외인성 플라스미드를 사용하여 미생물내로 도입될 수 있다. 추가의 또 다른 구체예에서, 외인성 플라스미드는 또한, 트랜스포터 유전자의 다수의 복사체를 함유할 수 있다. 추가의 구체예에서, 내인성 트랜스포터는 재조합 미생물에 대한 천연 메카니즘 (예를 들어, 열 쇼크, 스트레스, 중금속 또는 항생제 노출)을 이용하여 과다발현되는 것으로 유도될 수 있다. 예를 들어, 올리고마이신 및/또는 카드뮴이 배양 배지 (여기서, YOR1 발현은 상기 분자에 의해 유도될 수 있음)에 첨가되어 YOR1의 발현을 증가시키고, 이에 따라 스테비올 글리코시드의 분비를 증가시킬 수 있다. 예를 들어, 문헌 [Hallstrom & Moye-Rowley (1998) JBC 273(4): 2098-104; Nagy et al., (2006) Biochimie. 88(11):1665-71; and Katzmann et al., (1995) Mol Cell Biol. 15(12):6875-83] 참조.
본원에 기술된 바와 같이, 특정 내인성 트랜스포터의 발현을 증가시키거나 재조합 숙주에서 이종성 트랜스포터를 발현 (예를 들어, 미생물 예컨대, S. 세레비시애에서 S. 레바우디아나 트랜스포터를 발현)시키는 것은 스테비올 글리코시드를 더욱 효율적으로 생성하고 분비하는 능력을 그 숙주에 부여할 수 있다. 숙주를 배양하는 동안 생성된 세포외 및/또는 세포내 스테비올 글리코시드의 양은 본원에 기술된 바와 같은 액체 크로마토그래피 - 질량 분광계 (LC-MS)에 의해 측정될 수 있다.
트랜스포터 (또한, 멤브레인 수송 단백질로서 언급됨)는 생물학적 멤브레인을 횡단하는 분자 및 이온의 움직임과 관련된 멤브레인 단백질이다. 트랜스포터는 이들이 위치하는 막에 걸쳐 있으며 이러한 막을 가로질러 물질을 수송한다. 트랜스포터는 조장된 확산 또는 활성 수송에 의해 물질을 이동시키도록 작동할 수 있다. 수송 단백질은 트랜스포터 분류 데이타베이스 (Transporter Classification Database)에서 다양한 기준에 따라 분류되었다. 문헌 [Saier Jr. et al., Nucl. Acids Res., 37:D274-278 (2009)]을 참조하라. 2개 패밀리의 플라즈마 멤브레인 트랜스포터는 생 유기체에 편재된 것으로 여겨진다: ATP-결합 카세트 (ABC) 트랜스포터 및 주요 촉진자 슈퍼패밀리 (MFS) 트랜스포터. ATP-결합 카세트 트랜스포터 (ABC 트랜스포터)는 멤브레인을 횡단하여 다양한 물질의 전위를 수행하기 위해 아데노신 트리포스페이트 (ATP) 가수분해의 에너지를 이용하는 트랜스멤브레인 단백질이다. 이들은 세포외 및 세포내 멤브레인을 횡단하여 대사 산물, 지질 및 스테롤, 및 약물을 포함하는 매우 다양한 물질을 수송할 수 있다. 단백질은 이들의 ATP-결합 카세트 도메인의 서열 및 구성을 기반으로 하여 ABC 트랜스포터로서 분류된다. 전형적으로, ABC 패밀리 트랜스포터는 ATP 가수분해에 반응하여 분자를 수송할 수 있는 다중성분 주 활성 트랜스포터이다. 내인성 ABC 트랜스포터 유전자의 비제한적 예는 PDR5, PDR10, PDR15, SNQ2, YOR1, YOL075c 및 PDR18에서의 유전자 (또는 이의 기능적 호몰로그)를 포함한다.
주요 촉진자 슈퍼패밀리 (MFS) 트랜스포터는 화학삼투 이온 구배에 반응하여 작은 용질을 수송할 수 있는 폴리펩티드이다. 문헌 [Saier, Jr. et al., J. Mol. Microbiol. Biotechnol. 1:257-279 (1999)]. MFS 트랜스포터 패밀리는 종종 단일트랜스포터-공동트랜스포터-역트랜스포터 패밀리로서 언급된다. MFS 트랜스포터는 특히 당 흡수 및 약물 유출 시스템에서 작용한다. MFS 트랜스포터는 전형적으로 보존된 MSF-특이적 모티프를 함유한다. 내인성 MFS 트랜스포터 유전자의 비제한적 예는 TPO1, TPO3, 및 FLR1 로커스에서의 유전자 (또는 이의 기능적 호몰로그)를 포함한다.
그 밖의 트랜스포터 패밀리는 SMR (작은 다중약물 내성) 패밀리, RND (내성-근류형성-세포 분열) 패밀리, 및 MATE (다중약물 및 독성 화합물 압출) 패밀리를 포함한다. SMR 패밀리 구성원은 광범위한 소독제, 친유성 사차 암모늄 화합물 (QAC)에 대한 내성 및 박테리아에서 아미노글리코시드 내성을 부여하는 4개의 알파-헬릭스 트랜스멤브레인 가닥을 특징으로 하는 내재막 단백질이다. 문헌 [Bay and Turner, BMC Evol Biol., 9: 140 (2009)] 참조. 예를 들어, 에스체리치아 콜라이 (GenBank: BAE76318.1; SEQ ID NO: 92)의 EmrE 유출 트랜스포터는 아미노글리코시드 내성과 관련된다. 이는 2개 양성자에 대한 교환시 양으로 하전된 방향족 약물 (즉, 메틸 비올로겐 또는 에티듐)을 압출하는 호모올리고머이다.
RND 패밀리 구성원은 그람-음성 박테리아를 포함하여 이 중에 널리 분포되며, 많은 항생제 및 화학요법제의 활성 유출을 촉매작용한다. 문헌 [Nikaido and Takatsuk, Biochim Biophys Acta., 1794(5):769-81 (2009)] 참조. 예시적인 단백질은 에리트로마이신 D 수송에 관련된 에스체리치아 콜라이로부터의 AcrAB이다 (GenBank: BAE76241.1; SEQ ID NO: 93, 및 AAA23410.1; SEQ ID NO: 94).
MATE 패밀리 구성원은 12개 트랜스멤브레인 (TM) 도메인을 함유한다. MATE 패밀리의 구성원은 원핵생물, 효모 예컨대, 사카로마이세스 세레비시애 및 쉬조사카로마이세스 폼베, 및 식물에서 확인되었다. 문헌 [Diener et al., Plant Cell. 13(7): 1625-1638 (2001)]. MATE 패밀리 구성원은 소듐 또는 양성자 역트랜스포터이다. 예시적인 표적 분자는 E. 콜라이로부터의 ydhE (GenBank AAB47941.1; SEQ ID NO: 95)이며, 이는 플루오로퀴놀론, 카나마이신, 스트렙토마이신, 기타 아미노글리코시드 및 베르베린 (Berberine)을 수송한다.
A. 전사 인자
전사 인자 발현의 변형이 또한, 트랜스포터 발현을 증가시키는데 이용될 수 있다. 예를 들어, 효모 전사 인자 PDR1 및/또는 PDR3는 ABC 트랜스포터 PDR5, SNQ2 및 YOR1를 인코딩하는 유전자의 발현을 조절한다. 따라서, 일부 구체예에서, 내인성 PDR1 및 PDR3 로커스에 대한 프로모터는 전사 인자의 증가된 발현을 유도하는 상이한 프로모터로 대체될 수 있으며, 이는 내인성 트랜스포터의 생성을 증가시킬 수 있다. 다른 구체예에서, 전사 인자는 미생물에서 전사 인자의 과다발현을 유도하는 프로모터를 지닌 외인성 플라스미드를 사용하여 미생물 내로 도입될 수 있다. 또 다른 추가의 구체예에서, 외인성 플라스미드는 또한 전사 인자의 다수의 복사체를 함유할 수 있다. 추가의 구체예에서, 내인성 전사 인자는 재조합 미생물에 대한 천연 메카니즘 (예를 들어, 열 쇼크, 스트레스, 중금속 또는 항생제 노출)을 이용하여 과다발현되도록 활성화되거나 유도될 수 있다.
B. 스테비올 분비 경로 중간체에 영향을 끼치는 유전자 식별
스테비올 분비 경로 중간체에 영향을 끼치는 유전자를 식별하는 방법이 본원에 기술되어 있다. 이러한 방법은 적어도 하나의 내인성 트랜스포터 유전자의 발현을 불활성화시키거나 적어도 하나의 트랜스포터 유전자의 발현을 변형시키는 것을 포함할 수 있다. 전형적으로, 변이체 미생물의 라이브러리가 준비되며, 라이브러리에서 각 변이체는 불활성화된 상이한 내인성 트랜스포터 유전자를 갖는다. 일부 구체예에서, 상이한 내인성 트랜스포터 유전자의 발현은 라이브러리의 각 미생물에서 변형된다. 변형이 발생하는 어미 미생물은 스테비올 글리코시드 경로 유전자가 결여될 수 있으며, 요망되는 경우 이러한 유전자중 하나 이상을 함유할 수 있긴 하다. 일반적으로, 스테비올 글리코시드 경로 유전자의 부재하에 변형을 발생시키고 후속하여 요망되는 상이한 표적 글리코시드 생성물의 생성을 촉진하는 그러한 경로 유전자를 도입시키는 것이 더욱 편리하다. 하나 이상의 스테비올 글리코시드 경로 유전자를 함유하는 변이체 미생물이 스테비올 또는 스테비올 글리코시드가 합성되는 조건하에서 배지에서 배양되며, 미생물에 의해 생성된 세포외 및/또는 세포내 스테비올 글리코시드 경로 중간체의 양은 본원에 기술된 바와 같이 (예를 들어, LC-MS를 사용하여) 측정될 수 있다.
특징지어진 중간체(들)는 미생물에서 특정 관심 경로에 의존적이다. 예를 들어, 76G1, 74G1, 91D2e, 및 85C2 UGT (하기 기술됨)를 발현하는 미생물은 스테비올로부터 중간체 화합물 스테비올-19-O-글루코시드 (19-SMG), 루부소시드 및 스테비오시드를 경유해 표적 생성물 레바우디오시드 A를 합성할 수 있다. 도 1을 참조하라. 따라서, 레바우디오시드 A가 표적 생성물인 경우, 미생물에 의해 배양 상청액으로 분비된 19-SMG의 양 및 미생물 내부에 유지된 19-SMG의 양이 측정될 수 있다. 미생물의 배양 동안 생성된 각 중간체의 양 또는 개별 중간체의 양이 측정될 수 있다. 변이체 미생물에 의해 생성된 세포외 경로 중간체(들)의 양이 트랜스포터 유전자에 대해 야생형인 상응하는 미생물에 의해 생성된 양보다 큰 경우, 내인성 트랜스포터 유전자는 스테비올 경로 중간체의 분비에 영향을 끼치는 것으로서 확인된다. 트랜스포터가 기타 중간체의 분비에 영향을 끼치는 지를 측정하는데 유사한 방법이 이용될 수 있다.
IV.
내인성
트랜스포터
불활성화
본 문헌은 하나 이상의 불활성화된 내인성 트랜스포터 유전자를 포함하는 재조합 숙주에 관한 것일 수 있다. 내인성 트랜스포터 유전자는 전형적으로, 유전자의 발현을 파괴함으로써 또는 돌연변이를 도입시킴으로써 불활성화되어 돌연변이 예를 들어, 하나 이상의 내인성 트랜스포터 유전자의 파괴를 포함하는 숙주에서 트랜스포터 활성을 감소시키거나 심지어 완전히 제거하며, 이렇게 하여 숙주가 파괴된 유전자에 의해 인코딩된 트랜스포터에 대한 감소된 트랜스포터 발현 또는 활성을 갖는다.
일부 구체예에서, 넉아웃되는 트랜스포터는 또한, 더 큰 분자량의 레바우디오시드 (예를 들어, RebA)의 분비에 대한 특이성을 가질 수 있으며, 따라서, RebA의 배지로의 분비가 요망되는 균주에서 과다발현시키는데 유용할 수 있다. 경로 UGT의 발현을 통한 글리코실화 활성 비율의 적절한 균형을 이용하여, 더 적은 분자량의 스테비올 글리코시드가 이들이 배지로 분비되기 전에 추가로 글리코실화된다. 예를 들어, UGT74G1 및 UGT85C2 효소와 비교하여 UGT76G1 및 UGT91D2e 및/또는 EUGT11의 더 높은 발현 수준은 더욱 용이하게 분비되는 스테비올 모노글루코시드의 축적을 방지할 수 있다. UGT 활성 수준이 수송의 속도보다 높다면 (그래서, 글리코실화 속도가 더 빠르면), 더 높은 분자량의 스테비올 글리코시드가 생성될 것이다.
많은 트랜스포터는 중복되는 기질 특이성을 가지기 때문에 그리고, 특정 트랜스포터에서의 파괴는 기타 트랜스포터의 상향-조절에 의해 보완되기 때문에, 이는 복수의 불활성화된 트랜스포터 유전자를 함유하는 숙주를 생성시키는데 종종 유용하다. 예를 들어, 본원에 기술된 바와 같이, PDR5, PDR10, PDR15 및 SNQ2 로커스는 하기 실시예에 제시된 바와 같이 파괴될 수 있다. 일부 구체예에서, TPO1, PDR5, PDR10, PDR15 및 SNQ2 로커스는 하기 실시예에 제시된 바와 같이 파괴될 수 있다.
불활성화될 수 있는 추가적인 트랜스포터 유전자는 관련된 서열 예를 들어, 효모 PDR5, PDR10, PDR15 및 SNQ2 로커스에서 발견된 서열의 기능을 기반으로 확인될 수 있다. 내인성 트랜스포터 유전자는 유전자를 파괴하는 돌연변이에 의해 불활성화될 수 있다. 예를 들어, 유전자 대체 벡터는 상동 재조합을 매개하는데 충분한 길이의 트랜스포터 유전자의 일부에 의해 5' 및 3' 말단 둘 모두에서 플랭킹된 선택 마커 유전자를 포함하는 방식으로 작제될 수 있다. 선택 마커는 숙주 세포 영양요구를 보완하거나, 항생제 내성을 제공하거나 색상 변화를 유도하는 임의의 수의 유전자중 하나일 수 있다. 이어서, 플라스미드 DNA 또는 ars 요소를 함유하지 않는 유전자 대체 벡터의 선형화된 DNA 단편이 공지된 방법을 이용하여 세포내로 도입된다. 선형 단편의 유전체로의 통합 및 트랜스포터 유전자의 파괴는 선택 마커를 기초로 결정될 수 있으며 예를 들어, 서던 블롯 분석에 의해 입증될 수 있다. 생성 세포는 트랜스포터에 대한 로커스에서 선택 마커의 삽입으로 인해 불활성화된 변이체 트랜스포터 유전자를 함유한다. 결실-파괴 유전자 대체 벡터는 공지된 기법을 이용하여 유사한 방식으로 작제될 수 있고, 상동 재조합에 의해 내인성 트랜스포터 유전자에 통합되어 이를 불활성화시킬 수 있다. 일부 구체예에서, 선택 마커는 요망된 파괴 돌연변이가 도입되었음을 결정한 후 숙주 세포의 유전체로부터 제거될 수 있다. 예를 들어, 문헌 [Gossen et al. (2002) Ann. Rev. Genetics 36:153-173] 및 미국 출원 공개 번호 20060014264를 참조하라.
내인성 트랜스포터 유전자는 또한, 전사 활성인자-유사 이펙터 누클레아제 (TALEN) 또는 변형된 아연 핑거 누클레아제를 사용함으로써 불활성화되어 요망되는 삽입 또는 결실 돌연변이를 도입할 수 있다. 미국 특허 공개 번호 2012-0178169를 참조하라. 일부 구체예에서, 내인성 트랜스포터 유전자는 누클레오티드의 삽입, 누클레오티드의 결실, 또는 야생형 트랜스포터 유전자 서열에서 전이 또는 전환 점변이를 유도하는 돌연변이를 도입함으로써 불활성화된다. 트랜스포터 유전자에 도입될 수 있는 다른 유형의 돌연변이는 야생형 서열에서의 복제 및 전도를 포함한다. 돌연변이는 트랜스포터 로커스에서의 코딩 서열은 물론 비코딩 서열 예컨대, 조절 영역, 인트론 및 기타 비번역된 서열에서 이루어질 수 있다. 코딩 서열에서의 돌연변이는 상응하는 유전자 생성물에서 하나 이상의 아미노산의 삽입, 하나 이상의 아미노산의 결실 및/또는 비-보존적 아미노산 치환을 유도할 수 있다. 일부 경우에, 트랜스포터 유전자의 서열은 하나 초과의 돌연변이 또는 하나 초과의 유형의 돌연변이를 포함한다. 코딩 서열에서 아미노산의 삽입 또는 결실은 예를 들어, 생성 유전자 생성물의 기질 결합 포켓의 형태를 파괴할 수 있다.
아미노산 삽입 또는 결실은 또한 유전자 생성물 활성에 중요한 촉매 부위를 파괴할 수 있다. 더 큰 수의 인접 아미노산의 삽입 또는 결실은 더 적은 수의 삽입되거나 결실된 아미노산과 비교하여, 유전자 생성물이 좀 더 비-기능성을 띠게 하는 것 같다. 비-보존적 치환은 유전자 생성물의 전하 또는 소수성에서의 실질적인 변화를 유도할 수 있다. 비-보존적 아미노산 치환은 또한, 대부분의 측쇄 잔기에서의 실질적 변화, 예를 들어, 이소류신 잔기 대신 알라닌 잔기로의 치환을 유도할 수 있다. 비-보존적 치환의 예는 비-극성 아미노산 대신 염기성 아미노산, 또는 산성 아미노산 대신 극성 아미노산을 포함한다.
일부 구체예에서, 트랜스포터 유전자에서의 돌연변이는 아미노산 변화를 유도할 수 없으나, 비록 인코딩된 트랜스포터의 아미노산 서열에 영향을 끼치지 않지만, 전사 수준을 변화시킬 수 있거나 (예를 들어, 전사 증가 또는 감소), 번역 수준을 감소시키거나, DNA 또는 mRNA의 이차 구조를 변형시키거나, 전사 또는 번역 기기에 대한 결합 부위를 변경시키거나 tRNA 결합 효율을 감소시킬 수 있다.
트랜스포터 로커스에서의 돌연변이는 시험관내에서 트랜스포터 유전자 서열의 부위-특이적 돌연변이 유발에 이어서, 상동 재조합에 의해 발생되어 돌연변이를 상기 기술된 비와 같은 숙주 유전체로 도입시킬 수 있다. 그러나, 돌연변이는 또한, 돌연변이 유인제를 사용하여 숙주 세포에서 돌연변이 유발을 유도함으로써 발생하여 세포 군집내에서 유전자 돌연변이를 유도할 수 있다. 돌연변이 유발은 특히, 시험관내에서 돌연변이 유발 및 상동 재조합이 덜 잘 확립되거나 불편한 그러한 종 또는 균주에 유용하다. 특정 종 또는 균주에 대한 돌연변이 유발 화학물질 또는 방사선의 용량은, 치사 또는 재현가능한 멸균을 특징으로 하는 한계 수준 미만의 빈도의 돌연변이가 수득되도록 실험적으로 결정된다.
A. 전사 인자
전사 인자 발현의 변형은 또한 트랜스포터 발현을 감소시키거나 제거하는데 이용될 수 있다. 예를 들어, 효모 전사 인자 PDR1 및/또는 PDR3은 ABC 트랜스포터 PDR5, SNQ2 및 YOR1을 인코딩하는 유전자의 발현을 조절한다. 로커스 파괴 또는 PDR1 및/또는 PDR3의 발현 감소는 스테비올 글리코시드 중간체의 분비의 검출가능한 감소를 유도할 수 있다. 따라서, 일부 구체예에서, 효모 숙주는 복수의 불활성화된 트랜스포터 유전자와 조합된 불활성화된 내인성 PDR1 및 PDR3 로커스를 함유하여 임의의 단일 트랜스포터 또는 전사 인자의 불활성화에 의해 제공되는 것보다 더 많이 감소된 중간체의 분비를 제공한다. 또 다른 구체예에서, 전사 인자의 발현을 파괴하거나 감소시킴으로써 스테비올 글리코시드 분비를 감소시키는 것으로 확인된 전사 인자는 이어서 스테비올 글리코시드의 분비를 증가시키기 위해 재조합 미생물에서 과다발현될 수 있다.
B. 스테비올 분비 경로 중간체에 영향을 끼치는 유전자 식별
스테비올 분비 경로 중간체에 영향을 끼치는 유전자를 확인하는 방법이 본원에 기술되어 있다. 이러한 방법은 적어도 하나의 내인성 트랜스포터 유전자를 불활성화시키거나 파괴하거나 감소시키는 것을 포함할 수 있다. 전형적으로, 변이체 미생물의 라이브러리가 준비되며, 라이브러리에서 각 변이체는 불활성화되거나 파괴되거나 발현이 감소된 상이한 내인성 트랜스포터 유전자를 갖는다. 변형이 발생하는 어미 미생물은 스테비올 글리코시드 경로 유전자가 결여될 수 있으나, 요망되는 경우 이러한 유전자 중 하나 이상을 함유할 수 있긴 하다. 일반적으로, 스테비올 글리코시드 경로 유전자의 부재하에 돌연변이를 발생시키고 후속하여 요망되는 상이한 표적 글리코시드 생성물의 생성을 촉진하는 그러한 경로 유전자를 도입시키는 것이 더욱 편리하다. 하나 이상의 스테비올 글리코시드 경로 유전자를 함유하는 변이체 미생물이 스테비올 또는 스테비올 글리코시드가 합성되는 조건하에서 배지에서 배양될 수 있으며, 미생물에 의해 생성된 세포외 및/또는 세포내 스테비올 글리코시드 경로 중간체의 양이 측정될 수 있다.
특징지어진 중간체(들)는 미생물에서 특정 관심 경로에 의존적이다. 예를 들어, 76G1, 74G1, 91D2e, 및 85C2 UGT (하기 기술됨)를 발현하는 미생물은 스테비올로부터 중간체 화합물 스테비올-19-O-글루코시드 (19-SMG), 스테비올-13-O-글루코스 (13-SMG), 루부소시드 및 스테비오시드를 경유해 표적 생성물 레바우디오시드 A를 합성할 수 있다. 도 1을 참조하라. 따라서, 레바우디오시드 A가 표적 생성물인 경우, 미생물에 의해 배양 상청액으로 분비된 19-SMG의 양 및 미생물 내부에 유지된 19-SMG의 양이 측정될 수 있다 (예를 들어, 액체 크로마토그래프 - 질량 분광계 (LC-MS)를 사용). 미생물의 배양 동안 생성된 각 중간체의 양 또는 개별 중간체의 양이 측정될 수 있다. 변이체 미생물에 의해 생성된 세포외 경로 중간체(들)의 양이 트랜스포터 유전자에 대해 야생형인 상응하는 미생물에 의해 생성된 양보다 큰 경우, 내인성 트랜스포터 유전자는 스테비올 경로 중간체의 분비에 영향을 끼치는 것으로서 확인된다. 트랜스포터가 기타 중간체의 분비에 영향을 끼치는 지를 측정하는데 유사한 방법이 이용될 수 있다.
V. 숙주
많은 원핵생물 및 진핵생물이 본원에 기재된 재조합 미생물, 예를 들어 그람-음성 박테리아, 효모 및 진균을 구성하는데 적합하다. 스테비올 또는 스테비올 글리코시드 생성 균주로 사용하도록 선택한 종 및 균주는 우선 생성 유전자가 이 균주에 내인성인지, 유전자가 존재하지 않는 지를 판단하기 위하여 분석한다. 균주에 내인성 대응 부분이 존재하지 않는 유전자는 하나 이상의 재조합 작제물에 통합되고, 이는 그 다음 손실 기능(들)을 공급하기 위하여 균주내로 형질전환된다.
예시적인 원핵생물 및 진핵생물 종들은 하기에서 더욱 상세하게 설명한다. 그러나, 기타 다른 종들이 적합할 수 있음을 인지할 것이다. 예를 들어, 적합한 종은 사카로미케스강에 존재할 수 있다. 추가적인 적합한 종은 아가리쿠스, 아스퍼길루스, 바실루스, 캔디다, 코리네박테리움, 에스체리치아, 푸사리움/깁베렐라, 클루이베로마이세스, 래티포루스, 렌티누스, 파피아, 파네로새테, 피치아, 피스코미트렐라, 로도투룰라 사카로마이세스, 쉬조사카로마이세스 , 스파셀로마, 잔토필로마이세스, 및 야로위아로 구성된 군으로부터 선택된 속에 속할 수 있다.
이러한 속으로부터 선택된 예시적은 종은 렌티누스 티그리누스 (Lentinus tigrinus), 래티포루스 술푸레우스 (Laetiporus sulphureus), 파네로새테 크리소스포리움 (Phanerochaete chrysosporium), 피치아 파스토리스 (Pichia pastoris), 피스코미트렐라 파텐스 (Physcomitrella patens), 로도투룰라 글루티니스 (Rhodoturula glutinis) 32, 로도투룰라 무실라기노사 (Rhodoturula mucilaginosa), 파피아 로도자이마 (Phaffia rhodozyma) UBV-AX, 잔토필로마이세스 덴드로우스, 푸사리움 푸지쿠로이/깁베렐라 푸지코로이, 캔디다 유틸리스 (Candida utilis), 및 야로위아 리폴리티카를 포함한다. 일부 구체예에서, 미생물은 아스코미세테 (Ascomycete), 예를 들어 기베레라 푸지코로이, 클루이베로마이세스 락티스, 쉬조사카로마이세스 폼베, 아스퍼길루스 나이저 또는 사카로마이세스 세레비시애일 수 있다. 일부 구체예에서, 미생물은 원핵생물, 예컨대 에스체리치아 콜라이 로도박터 스패로이데스 (Rhodobacter sphaeroides), 또는 로도박터 캡슐라투스 (Rhodobacter capsulatus)일 수 있다. 특정 미생물은 관심 유전자를 고처리량 (high throughput) 방식으로 스크리닝하고 테스트하는데 이용될 수 있는 반면, 원하는 생산성 또는 성장 특징을 가진 기타 다른 미생물은 스테비올 글리코시드를 대규모로 생산하는데 이용할 수 있음을 인지할 것이다.
사카로마이세스
세레비시애
및 관련 효모 종
사카로마이세스 세레비시애는 합성 생물학에서 광범위하게 이용되는 새시 (chassis) 유기체이고, 재조합 미생물 플랫폼으로 이용될 수 있다. S. 세레비시애에 이용할 수 있는 변이체의 라이브러리, 플라스미드, 상세한 대사 컴퓨터 모델 및 기타 정보가 있어서, 생성물 수율을 향상시키기 위한 다양한 모듈의 합리적인 설계가 가능하다. 재조합 미생물을 만드는 방법은 공지되어 있다. 다수의 공지된 프로모터를 이용하여 스테비올 생합성 유전자 클러스터를 효모, 특히 사카로미케스강에서 발현시킬 수 있다. 테르펜을 과다 생성하는 균주는 공지되어 있으며, 이를 이용하여 스테비올 및 스테비올 글리코시드 생성에 이용할 수 있는 게라닐게라닐 디포스페이트의 양을 증가시킬 수 있다. 사카로마이세스 세레비시애는 예시적인 사카로마이세스 종이다.
아스퍼길루스
종
아스퍼길루스 종, 예를 들어, A. 오리재 (A. oryzae), A. 니거 (A. niger), 및 A. 소재 (A. sojae)는 식품 생산에 광범위하게 이용되는 미생물이며, 재조합 미생물 플랫폼으로 또한 이용될 수 있다. 누클레오티드 서열은 A. 니둘란스 (A. nidulans), A. 푸미가투스 (A. fumigatus), A. 오리재, A. 플래버스 (A. flavus), A. 니거, 및 A. 테레우스 (A. terreus)의 유전체로 이용가능하여, 유동을 증대시키고, 생성물 수율을 증가시키기 위하여 내인성 경로의 합리적인 설계 및 변경이 가능하게 한다. 아스퍼길루스 뿐만 아니라 트랜스크립토믹 (transcriptomic) 연구와 프로테오믹스 (proteomics) 연구를 위한 대사 모델이 개발되어 왔다. A. 니거는 많은 식품 성분, 예를 들어, 시트르산 및 글루콘산의 산업적 생산을 위해 배양되며, 이에 따라, A. 니거는 스테비올 및 스테비올 글리코시드와 같은 식품 성분의 생산에 일반적으로 적합하다.
에스체리치아
콜라이
합성 생물학에서 광범위하게 이용되는 또 다른 플랫폼 유기체인 에스체리치아 콜라이는 재조합 미생물 플랫폼으로 또한 이용할 수 있다. 사카로마이세스와 유사하게, E. 콜라이에 이용가능한 돌연변이체의 라이브러리, 플라스미드, 상세한 대사 컴퓨터 모델 및 기타 정보가 있어서, 생성물 수율을 향상시키기 위해 다양한 모듈의 합리적인 설계가 가능하다. 사카로마이세스에 대해 상기에서 기재한 바와 유사한 방법들을 이용하여 재조합 E. 콜라이 미생물을 만들 수 있다.
아가리쿠스,
깁베렐라
및
파네로새테
종
아가리쿠스, 깁베렐라, 및 파네로새테 종은 이들이 배양액에서 다량의 깁베렐린을 생성하는 것으로 공지되어 있기 때문에 유용할 수 있다. 따라서, 다량의 스테비올 및 스테비올 글리코시드를 생성하기 위한 테르펜 전구체는 이미 내인성 유전자에 의해 생성된다. 따라서, 스테비올 또는 스테비올 글리코시드 생합성 폴리펩티드에 대한 재조합 유전자를 포함하는 모듈은 메발로네이트 또는 MEP 경로 유전자를 도입할 필요없이 이러한 속으로부터의 종에 도입될 수 있다.
아르술라
아데니니보란스
(
블라스토보트리스
아데니니보란스
(
Blastobotrys adeniniborans
))
아르술라 아데니니보란스는 일반적이지 않은 생화학적 특성들을 갖는 이형태 효모이다 (42℃의 온도까지 빵효모와 같은 출아 효모로서 성장하고, 이러한 임계값 위에서 필라멘트 모양으로 성장함). 이것은 광범위한 기질 상에서 성장할 수 있는 니트레이트를 흡수할 수 있다. 이는 천연 플라스틱을 생성할 수 있는 균주의 생성 또는 환경 샘플에서 에스트로겐에 대한 바이오센서의 개발에 성공적으로 적용되어 왔다.
야로위아
리폴리티카
야로위아 리폴리티카는 광범위한 기질에서 성장할 수 있는 이형태 효모이다 (아르술라 아데니니보란스 참조). 이것은 산업상 이용가능성에서 높은 가능성을 갖지만, 아직 시판되는 재조합 생성물은 없다.
로도박터 종 (
Rhodobacter
spp.)
로도박터 종은 재조합 미생물 플렛폼으로 이용될 수 있다. E. 콜라이과 유사하게, 이용가능한 돌연변이체 라이브러리 뿐만 아니라 적합한 플라스미드 벡터들이 있어, 생성물 수율을 증대시키기 위한 다양한 모듈의 합리적인 설계가 가능하다. 카로테노이드 및 CoQ10의 생성 증가를 위하여, 로도박터의 막세균 종의 이소프레노이드 경로들이 조작되었다. 미국 특허 공개 번호 제20050003474호 및 제20040078846호 참조. E. 콜라이에 대해 상기 기재한 것과 유사한 방법을 이용하여 재조합 로도박터 미생물을 만들 수 있다.
캔디다
보이디니
캔디다 보이디니는 (메탄올에서 성장할 수 있는) 메탄올자화(methylotrophic) 효모이다. 한세눌라 폴리모르파 및 피치아 파스토리스와 같은 다른 메탄올자화종과 같이, 이것은 이종성 단백질 생성에 탁월한 플랫폼을 제공한다. 멀티그램 범위의 분비된 외래 단백질의 수율이 보고되었다. 컴퓨터활용 방법, IPRO은 캔디다 보이디니 자일로스 리덕타제의 보조인자 특이성을 NADPH로부터 NADH로으로 실험적으로 교환시키는 돌연변이를 최근에 예측하였다.
한세눌라
폴리모르파
(
피치아
안구스타
(
Pichia
angusta
))
한세눌라 폴리모르파는 또 다른 메탄올자화 효모이다 (캔디다 보이디니 참조). 이것은 더욱이 광범위한 또 다른 기질에서도 많이 성장할 수 있다; 이것은 열-내성이며 니트레이트를 흡수할 수 있다 (클루이베로마이세스 락티스 참조). 이것은 B형 간염 백신, 인슐린 및 C형 간염의 치료를 위한 인터페론 알파-2a의 생성, 더 나아가 기술적 효소 범위에 활용되고 있다.
클루이베로마이세스
락티스
클루이베로마이세스 락티스는 케피어 (kefir)의 생성에 정기적으로 활용되는 효모이다. 이것은 여러 당들, 가장 중요하게는 우유 및 유장에 존재하는 락토스에서 성장할 수 있다. 이것은 특히 치즈 생산을 위한 키모신 (대개 소 위장에 존재하는 효소)의 생성에 성공적으로 활용되었다. 생성은 40,000L 크기의 발효조에서 일어난다.
피치아
파스토리스
피치아 파스토리스는 메탄올자화 효모이다 (캔디다 보이디니 및 한세눌라 폴리모르파 참조). 이것은 외래 단백질의 생성을 위한 효과적인 플랫폼을 제공한다. 플랫폼 요소는 키트로 이용가능하며, 단백질 생성을 위해 전세계적으로 학계에서 이용된다. 균주는 복잡한 인간 N-글리칸 (효모 글리칸은 인간에서 발견되는 것과 유사하나 동일하지는 않음)을 생성할 수 있도록 조작되었다.
피스코미트렐라
종
피스코미트렐라 이끼는 현탁 배양액에서 성장할 때 효모 또는 기타 진균 배양과 유사한 특징을 갖는다. 이 속은 식물 2차 대사물의 생성에 중요해진 유형의 세포인데, 이는 일부 다른 유형의 세포에서는 생성하기 어렵다.
VI. 스테비올 글리코시드 생성 방법
본원에 기재된 재조합 미생물은 스테비올 또는 스테비올 글리코시드를 생성하는 방법에 이용할 수 있다. 예를 들어, 상기 방법은 스테비올 및/또는 스테비올 글리코시드 생합성 유전자가 발현되는 조건하에서 배양 배지에 재조합 미생물을 성장시키는 것을 포함할 수 있다. 재조합 미생물은 유가식 배양 (fed batch) 또는 연속 공정에서 성장할 수 있다. 전형적으로, 재조합 미생물은 원하는 기간 동안 정해진 온도(들)에서 발효기에서 성장한다. 방법에 이용되는 특정 미생물에 따라, 다른 재조합 유전자, 예를 들어 이소펜테닐 생합성 유전자 및 테르펜 신타제 및 시클라제 유전자가 또한 존재하고, 발현될 수 있다. 기질 및 중간체, 예를 들어 이소펜테닐 디포스페이트, 디메틸알릴 디포스페이트, 게라닐게라닐 디포스페이트, 카우렌 및 카우레논산의 수준은 공개된 방법에 따라 분석용 배양 배지로부터 시료를 추출하여 측정될 수 있다.
재조합 미생물을 원하는 기간 동안 배양물에서 성장시킨 후, 스테비올 및/또는 하나 이상의 스테비올 글리코시드를 당업계에 공지되어 있는 다양한 기술을 이용하여 배양물로부터 회수할 수 있다. 일부 구체예에서, 투과제 (permeabilizing agent)는 공급원료가 숙주로 들어가고 생성물이 밖으로 나오는 것을 돕기 위해 첨가될 수 있다. 예를 들어, 배양된 미생물의 미정제 용해물을 원심분리시켜 상청액을 수득할 수 있다. 이어서, 생성된 상청액을 크로마토그래피 칼럼, 예컨대 C-18 칼럼에 가하고, 물로 세척하여 친수성 화합물을 제거하고, 메탄올과 같은 용매를 이용하여 관심 화합물(들)을 용리시킨다. 이어서 화합물(들)은 분취용 HPLC에 의해 추가 정제될 수 있다. 또한, WO 2009/140394를 참조하라.
생성된 스테비올 글리코시드 (예를 들어, 레바우디오시드 A 또는 레바우디오시드 D)의 양은 약 1mg/L 내지 약 2000 mg/L, 예를 들어, 약 1 내지 약 10 mg/L, 약 3 내지 약 10 mg/L, 약 5 내지 약 20 mg/L, 약 10 내지 약 50 mg/L, 약 10 내지 약 100 mg/L, 약 25 내지 약 500 mg/L, 약 100 내지 약 1,500 mg/L, 또는 약 200 내지 약 1,000 mg/L, 적어도 약 1,000 mg/L, 적어도 약 1,200 mg/L, 적어도 약 1,400 약 mg/L, 적어도 약 1,600 mg/L, 적어도 약 1,800mg/L 또는 적어도 약 2,000 mg/L, 일 수 있다. 일반적으로, 배양시간이 길면 더 많은 양의 생성물을 얻을 수 있다. 따라서, 재조합 미생물은 1일 내지 7일까지, 1일 내지 5일까지, 3일 내지 5일까지, 약 3일, 약 4일, 또는 약 5일 동안 배양할 수 있다.
본원에 기재된 다양한 유전자와 모듈은 단일 미생물보다는 2가지 이상의 재조합 미생물에 존재할 수 있음을 인지할 것이다. 복수의 재조합 미생물이 이용될 때, 이들은 스테비올 및/또는 스테비올 글리코시드를 생성하기 위하여 혼합된 배양액에서 성장할 수 있다. 예를 들어, 제 1 미생물은 스테비올을 생성하기 위한 하나 이상의 생합성 유전자 및 내인성 트랜스포터의 제 1 군에서의 삭제 돌연변이를 포함할 수 있는 반면, 제 2 미생물은 스테비올 글리코시드 생합성 유전자 및 내인성 트랜스포터의 제 2 군에서의 삭제 돌연변이를 포함한다.
대안으로, 2개 이상의 미생물 각각이 별도의 배양 배지에서 성장될 수 있고, 제 1 배양 배지의 생성물, 예를 들어 스테비올을 제 2 배양 배지로 도입하여, 후속 중간 생성물로 전환시키거나 레바우디오시드 A와 같은 최종 생성물로 전환시킬 수 있다. 제 2 또는 최종 미생물에 의해 생성된 생성물을 이어 회수한다. 미생물은 내인성 트랜스포터에서 동일하거나 상이한 군의 돌연변이를 가질 수 있다. 일부 구체예에서, 재조합 미생물은 배양 배지 이외의 영양 원천을 사용하고, 발효기 이외의 시스템을 이용하여 성장됨이 또한 인지할 것이다.
스테비올 글리코시드는 상이한 식품 시스템에서 동일한 성능을 반드시 가질 필요는 없다. 따라서, 선택된 스테비올 글리코시드 조성물로 합성을 유도하는 능력을 보유하는 것이 바람직하다. 본원에 기재된 재조합 숙주는 특이적 스테비올 글리코시드 (예를 들어, 레바우디오시드 D)에 대해 선택적으로 풍부하고, 일관된 맛 프로파일을 보유하는 조성물을 생성할 수 있다. 따라서, 본원에 기재된 재조합 미생물은 주어진 식품 생성물에 바람직한 단맛 프로파일에 부합되도록 맞춰지고, 배치 (batch) 간에 일관된 각 스테비올 글리코시드 비율을 보유하는 조성물의 생성을 용이하게 할 수 있다. 본원에 기재된 미생물은 스테비아 추출물에서 볼 수 있는 원치않는 식물 부산물을 생성하지 않는다. 따라서, 본원에 기재된 재조합 미생물에 의해 생성된 스테비올 글리코시드 조성물은 스테비아 식물로부터 유래된 조성물과는 구별된다.
VII. 스테비올 글리코시드, 조성물 및 식품
본원에 기재된 방법에 의해 수득한 스테비올 글리코시드 및 조성물은 식품, 규정식 보충물 및 감미료 조성물을 만드는데 이용될 수 있다. 예를 들어, 실질적으로 순수한 스테비올 또는 스테비올 글리코시드, 예를 들어 레바우디오시드 A 또는 레바우디오시드 D는 식품 제품, 예를 들어 아이스크림, 탄산음료, 과일 쥬스, 요거트, 구운 제품, 츄잉검, 단단하고 부드러운 캔디, 및 소스에 포함될 수 있다. 실질적으로 순수한 스테비올 또는 스테비올 글리코시드는 비-식품 제품, 예를 들어 약제품, 의학 제품, 규정식 보충물 및 영양 보충물에 또한 포함될 수 있다. 실질적으로 순수한 스테비올 또는 스테비올 글리코시드는 또한 농업 산업 및 애완동물 산업 둘 모두를 위한 동물 사료 제품에 포함될 수 있다. 대안으로, 스테비올 및/또는 스테비올 글리코시드의 혼합물은 재조합 미생물을 별도로 배양하고, 특이적 스테비올 또는 스테비올 글리코시드를 각각 생성하고, 각 미생물로부터 실질적으로 순수한 형태로 스테비올 또는 스테비올 글리코시드를 회수하고, 그 뒤 원하는 비율의 각 화합물을 포함하는 혼합물을 수득하기 위하여 이러한 화합물을 조합시켜 만들 수 있다. 본원에 기재된 재조합 미생물은 현재 스테비아 제품과 비교하여 좀더 정확하고 일관된 혼합물의 수득을 허용한다. 또 다른 대안에서, 실질적으로 순수한 스테비올 또는 스테비올 글리코시드는 다른 감미료, 예를 들어 사카린, 덱스트로스, 수크로스, 푸룩토스, 에리트리톨, 아스파르탐, 수크랄로스, 모나틴, 또는 아세술팜 포타슘과 함께 식품 제품에 통합될 수 있다. 기타 감미료에 대하여 스테비올 또는 스테비올 글리코시드의 중량비는 최종 식품 제품에서 만족할 만한 맛에 도달하기 위해 필요에 따라 변화될 수 있다. 예를 들어, 미국 특허 공개 번호 제2007/0128311호 참조. 일부 구체예에서, 스테비올 또는 스테비올 글리코시드는 향미 조절제로서 향미료 (예를 들어, 시트루스)와 함께 제공될 수 있다.
본원에 기재된 재조합 미생물에 의해 생성된 조성물은 식품 제품에 통합될 수 있다. 예를 들어, 재조합 미생물에 의해 생성된 스테비올 글리코시드 조성물은 스테비올 글리코시드 및 식품 제품의 유형에 따라 건중량을 기준으로 약 20 mg 스테비올 글리코시드/kg 식품 내지 약 1800 mg 스테비올 글리코시드/kg 식품 범위의 양으로 식품 제품에 통합될 수 있다. 예를 들어, 재조합 미생물에 의해 생성된 스테비올 글리코시드 조성물은, 식품 제품이 건중량을 기준으로 최대 500 mg의 스테비올 글리코시드/kg 식품을 갖도록 디저트, 차가운 과자류 (예를 들어, 아이스크림), 유제품 (예를 들어, 요거트), 또은 음료 (예를 들어, 탄산 음료)에 통합될 수 있다. 재조합 미생물에 의해 생성된 스테비올 글리코시드 조성물은, 식품 제품이 건중량을 기준으로 최대 300 mg의 스테비올 글리코시드/kg 식품을 갖도록 구운 제품 (예를 들어, 비스킷)에 통합될 수 있다. 재조합 미생물에 의해 생성된 스테비올 글리코시드 조성물은, 식품 제품이 건중량을 기준으로 최대 1000 mg의 스테비올 글리코시드/kg 식품을 갖도록 소스 (예를 들어, 초콜릿 시럽) 또는 식물 제품 (예를 들어, 피클)에 통합될 수 있다. 재조합 미생물에 의해 생성된 스테비올 글리코시드 조성물은, 식품 제품이 건중량을 기준으로 최대 160 mg의 스테비올 글리코시드/kg 식품을 갖도록 빵에 통합될 수 있다. 재조합 미생물, 식물 또는 식물 세포에 의해 생성된 스테비올 글리코시드 조성물은, 식품 제품이 건중량을 기준으로 최대 1600 mg의 스테비올 글리코시드/kg 식품을 갖도록 단단한 또는 부드러운 사탕에 통합될 수 있다. 재조합 미생물, 식물, 또는 식물 세포에 의해 생성된 스테비올 글리코시드 조성물은, 식품 제품이 건중량을 기준으로 최대 1000 mg의 스테비올 글리코시드/kg 식품을 갖도록 가공된 과일 제품 (예를 들어, 과일 쥬스, 과일 필링, 잼 및 젤리)에 통합될 수 있다.
예를 들어, 상기 스테비올 글리코시드 조성물은 90-99% 레바우디오시드 A와 검출불가능한 양의 스테비아 식물-유래된 오염물질을 함유할 수 있고, 건중량을 기준으로 25-1600 mg/kg, 예를 들어, 100-500 mg/kg, 25-100 mg/kg, 250-1000 mg/kg, 50-500 mg/kg 또는 500-1000 mg/kg이 되도록 식품 제품에 통합될 수 있다.
이러한 스테비올 글리코시드 조성물은 3% 초과의 레바우디오시드 B를 함유하는 레바우디오시드 B-풍부 조성물일 수 있고, 레바우디오시드 B의 양이 건중량을 기준으로 25-1600 mg/kg, 예를 들어, 100-500 mg/kg, 25-100 mg/kg, 250-1000 mg/kg, 50-500 mg/kg 또는 500-1000 mg/kg이 되도록 식품 제품에 통합될 수 있다. 전형적으로, 레바우디오시드 B-풍부 조성물은 스테비아 식물-유래된 검출불가능한 양의 오염물질을 함유한다.
이러한 스테비올 글리코시드 조성물은 3% 초과의 레바우디오시드 D를 함유하는 레바우디오시드 D-풍부 조성물일 수 있고, 제품 중의 레바우디오시드 D의 양은 건중량을 기준으로 25-1600 mg/kg, 예를 들어, 100-500 mg/kg, 25-100 mg/kg, 250-1000 mg/kg, 50-500 mg/kg 또는 500-1000 mg/kg이 되도록 식품 제품에 통합될 수 있다. 전형적으로, 레바우디오시드 D-풍부 조성물은 스테비아 식물-유래된 검출불가능한 양의 오염물질을 함유한다.
이러한 스테비올 글리코시드 조성물은 3% 초과의 레바우디오시드 E를 함유하는 레바우디오시드 E-풍부 조성물일 수 있고, 제품 중의 레바우디오시드 E의 양은 건중량을 기준으로 25-1600 mg/kg, 예를 들어 100-500 mg/kg, 25-100 mg/kg, 250-1000 mg/kg, 50-500 mg/kg 또는 500-1000 mg/kg이 되도록 식품 제품에 통합될 수 있다. 전형적으로, 레바우디오시드 E-풍부 조성물은 스테비아 식물-유래된 검출불가능한 양의 오염물질을 함유한다.
이러한 스테비올 글리코시드 조성물은 3% 초과의 레바우디오시드 M을 함유하는 레바우디오시드 M-풍부 조성물일 수 있고, 제품 중의 레바우디오시드 M의 양은 건중량을 기준으로 25-1600 mg/kg, 예를 들어 100-500 mg/kg, 25-100 mg/kg, 250-1000 mg/kg, 50-500 mg/kg 또는 500-1000 mg/kg이 되도록 식품 제품에 통합될 수 있다. 전형적으로, 레바우디오시드 M이 풍부한 조성물은 스테비아 식물에서 유도된 검출불가능한 양의 오염물질을 함유한다.
일부 구체예에서, 실질적으로 순수한 스테비올 또는 스테비올 글리코시드는 탁상용 감미료 또는 "컵-포-컵(cup-for-cup)" 제품에 통합된다. 이러한 제품은 전형적으로 하나 이상의 증량제, 예를 들어 당업자에게 공지되어 있는 말토덱스트린을 이용하여 적절한 단맛 수준으로 희석될 수 있다. 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E, 또는 레바우디오시드 M이 풍부한 스테비올 글리코시드 조성물은 식탁용으로 건중량을 기준으로 10,000 내지 30,000 mg 스테비올 글리코시드/kg 제품으로 한 봉지에 포장될 수 있다.
본 발명은 하기 실시예에서 추가로 기술될 것이며, 이는 청구범위에 기술된 본 발명의 범위를 제한하지 않는다.
실시예
실시예
1. LC-MS 분석 절차
LC-MS 분석은 달리 언급되지 않는 한, 가열된 전자분사 이온 (HESI) 공급원을 갖춘 TSQ Quantum Access (써모피셔 사이언티픽) 삼중 쿼드로폴 질량 분광계에 연결된 워터 액퀴티 (water acquity) UPLC®BEH 쉴드 RP18 칼럼 (2.1 x 50 mm, 1.7 ㎛ 입자, 130 Å 포어 크기)로 제작한 Ultimate 3000 UPLC 시스템 (Dionex)을 사용하여 수행하였다. 용리는 용리제 B (0.1% 포름산 함유 MeCN) 및 용리제 A (0.1% 포름산 함유 물)의 이동상을 이용하여, 0.0분에서 4.0분까지 25%에서 47%로 B 증가, 4.0분에서 5.0분까지 47%에서 100%로 B 증가, 5.0분에서 6.5분까지 100% B를 유지하여 재평형 (re-equilibration)시킴으로써 실행하였다. 유속은 0.4ml/min이며, 칼럼 온도는 35℃이다. 스테비올 글리코시드는 하기의 m/z-자동기록장치 (trace)를 갖는 SIM (단일 이온 모니터링; Single Ion Monitering)을 사용하여 검출하였다.
표
11: 스테비올
글리코시드에 대한 MS 분석 정보
설명 | 추출물 질량 | m/z 자동기록 | 화합물 (통상 분당 t R ) |
스테비올 + 1 글루코스 | [M+H]+ 481.2796 [M+Na]+ 503.2615 |
481.2± 0.5 503.1± 0.5 |
19-SMG (2.29), 13-SMG (3.5) |
스테비올 + 2 글루코스 | [M+Na]+ 665.3149 | 665± 0.5 | 루부소시드 (2.52) 스테비올-1,2-비오시드 (2.92) 스테비올-1,3-비오시드 (2.28) |
스테비올 + 3 글루코스 | [M+Na]+ 827.3677 | 827.4 ± 0.5 | 1,2-스테비오시드 (2.01) 1,3-스테비오시드 (2.39) 레바우디오시드 B (2.88) |
스테비올 + 4 글루코스 | [M+Na]+ 989.4200 | 989.4 ± 0.5 | 레바우디오시드 A (2.0) |
스테비올 + 5 글루코스 | [M+Na]+ 1151.4728 | 1151.4 ± 0.5 | 레바우디오시드 D (1.1) |
스테비올 + 6 글루코스 | [M+Na]+ 1313.5257 | 1313.5 ± 0.5 | 레바우디오시드 M (1.3) |
스테비올 글리코시드의 수준은 LGC 표준으로부터 진정 (authentic) 기준으로 획득한 검정 곡선 (calibration curve)과 비교하여 정량화하였다. 예를 들어, 0.5 내지 100 μM 레바우디오시드 A의 표준 용액을 검정 곡선을 만드는데 전형적으로 이용하였다.
실시예
2.
레바우디오시드
생성 효모 균주의
작제
A. 효모 균주 EFSC2772는 3개의 영양요구 변형을 함유한, 즉 URA3, LEU2 및 HIS3의 결실을 갖는 야생형 사카로마이세스 세레비시애 균주로부터 작제하였다. 상기 야생형 균주는 표준 유전자 방법을 이용하여 조작될 수 있고 보통의 이배체 또는 반수체 효모 균주로서 이용될 수 있다. EFSC2772는 4개 DNA 작제물의 유전체-통합에 의해 스테비올 글리코시드 생성 효모로 전환되었다. 각각의 작제물은 다수의 유전자를 함유하였고 이는 상동 재조합에 의해 효모 유전체에 도입되었다. 더욱이, 작제물 1 및 2는 상동 재조합에 의해 어셈블링되었다.
제 1 작제물은 8개의 유전자를 함유하였고 DPP1 로커스에 삽입되어 DPP1 (포스파타제)를 붕괴시키고 부분적으로 결실시켰다. 삽입된 DNA는 natMX 유전자 (선택 마커)를 발현시키는 아쉬비아 고스시피 TEF1 프로모터 다음에 A. 고스시피로부터의 TEF 터미네이터; 천연 효모 GPD1 프로모터로부터 발현되는 Gene Art 코돈 최적화 스테비아 레바우디아나 UGT85C2 (GenBank AAR06916.1; SEQ ID NO:32) 및 이어서 천연 효모 CYC1 터미네이터; 천연 효모 TPI1 프로모터를 이용하여 발현되는 S. 레바우디아나 CPR-8 (SEQ ID NO:24) 다음에 천연 효모 TDH1 터미네이터; 천연 효모 PDC1 프로모터로부터 발현되는 아라비돕시스 탈리아나 카우렌 신타제 (GenBank AEE36246.1과 유사함; SEQ ID NO:96) 및 이어지는 천연 효모 FBA1 터미네이터; 천연 효모 TEF2 프로모터를 이용하여 발현되는 시네초코쿠스 종 GGPPS (GenBank ABC98596.1, SEQ ID NO: 97) 및 이어지는 천연 효모 PGI1 터미네이터; 천연 효모 TEF1 프로모터로부터 발현되는 DNA2.0 코돈-최적화 S. 레바우디아나 KAHe1 (SEQ ID NO:18) 및 이어지는 천연 효모 ENO2 터미네이터; 천연 효모 FBA1 프로모터를 이용하여 발현되는 S. 레바우디아나 KO-1 (GenBank ABA42921.1, gi76446107; SEQ ID NO: 98) 및 이어지는 천연 효모 TDH2 터미네이터; 및 천연 효모 PGK1 프로모터를 이용하여 발현되는 제아 메이즈 절두된 CDPS 및 이어지는 천연 효모 ADH2 터미네이터를 함유한다
제 2 작제물은 YPRCΔ15 로커스에 삽입되었고, kanMX 유전자 (선택 마커)의 앞에 A. 고스시피로부터의 TEF1 프로모터, 이어서 A. 고스시피로부터의 TEF1 터미네이터; 천연 효모 PGK1 프로모터로부터 발현되는 Gene Art 코돈 최적화된 A. 탈리아나 ATR2 (SEQ ID NO: 99) 이어서 천연 효모 ADH2 터미네이, 천연 효모 TPI1 프로모터로부터 발현되는 S. 레바우디아나 UGT74G1 (GenBank AAR06920.1; SEQ ID NO:100) 이어서 천연 효모 TDH1 터미네이터, 천연 효모 TEF1 프로모터로부터 발현되는 Gene Art 코돈-최적화된 S. 레바우디아나 UGT76G1 (GenBank AAR06912; SEQ ID NO:101) 이어서 천연 효모 ENO2 터미네이터, 및 천연 효모 GPD1 프로모터로부터 발현되는, 아미노산 변형 L211M 및 V286A를 갖는 UGT91D2e 폴리펩티드를 생성하는 GeneArt 코돈-최적화 S. 레바우디아나 UGT91D2e-b (UGT91D2e 아미노산 서열에 대한 야생형 서열의 경우 SEQ ID NO: 54; 코돈 최적화 누클레오티드 서열은 SEQ ID NO: 102에 제시됨) 및 이어지는 천연 효모 CYC1 터미네이터를 함유하였다.
제 1 및 제 2 작제물은 메이팅 및 절단에 의해 동일한 스포어 클론에서 조합되었다. 이러한 효모 균주는 이후 두 가지 연속 사건으로 제 3 및 제 4 작제물로 형질전환되었다.
제 3 작제물은 유전자 PRP5 및 YBR238C 사이에 통합되었고, K. 락티스 leu2 유전자를 발현시키는 클루이베로마이세스 락티스 LEU2 프로모터 이어서 K. 락티스로부터의 LEU2 터미네이터, DNA2.0-최적화 S. 레바우디아나 KAHe1 (SEQ ID NO:18)을 발현시키는 천연 효모 GPD1 프로모터 이어서 천연 효모 CYC1 터미네이터, 및 제아 메이즈 절두된 CDPS (SEQ ID NO: 103)를 발현시키는 천연 효모 TPI1 프로모터 이어서 천연 효모 TPI1 터미네이터를 함유하였다.
제 4 작제물은 유전체에서 유전자 ECM3 및 YOR093C 사이에 통합되었고, K. 뉴모니애 (K. pneumoniae) hphMX 유전자를 발현시키는 A. 고스시피로부터의 TEF 프로모터 이어서 A. 고스시피로부터의 TEF1 터미네이터; 천연 효모 GPD1 프로모터로부터 발현되는 시네초코쿠스 종 GGPPS (SEQ ID NO: 97) 이어서 천연 효모 CYC1 터미네이터, 이어서 A. 탈리아나 카우렌 신타제 (SEQ ID NO: 96)를 발현시키는 천연 효모 TPI1 프로모터 이어서 천연 효모 TPI1 터미네이터를 함유하였다.
균주는 형질전환에 의한 2개 플라스미드 p413TEF (HIS3 마커를 갖는 CEN/ARS 셔틀 플라스미드) 및 p416-TEF (URA3 마커를 갖는 CEN/ARS 셔틀 플라스미드)의 도입에 의해 독립영양식으로 제조하였으며, EFSC2772로 지정되었다.
LC-MS에 의해 입증된 바와 같이, 조합된 세포성 및 세포외 생성물 농도는 EFSC2772의 2개의 상이한 배치에서 920-1660 mg/L의 RebA 및 대략 300-320 mg/L의 RebD이며, 더 높은 역가 결과가 수득되는 경우 대략 700 mg/L의 RebA가 브로쓰에서 검출되었다. 추가적으로, RebB에 대한 큰 피크가 관찰되었으며, 당업자는 UGT74G1의 추가적인 복사체 또는 UGT74G1의 상향조절이 RebB의 RebA로의 전환을 추가로 증가시킬 것임을 인지할 것이다. 반대로, RebB가 표적 글리코시드인 경우, 그러면 UGT74G1은 크로모좀으로부터 붕괴되거나 결실될 수 있다.
B. EFSC2763 효모 균주는 3가지 영양요구 변경, 즉 URA3, LEU2 및 HIS3의 결손을 갖는 야생형 사카로마이세스 세레비시애) 균주로부터 유래된다. 균주의 유전자는 안정화되어 있어, 보통 이배체 (diploid) 또는 반수체 (haploid) 효모 균주로서 사용될 수 있다. EFSC2763은 4개의 DNA 작제물의 유전체 통합에 의해 스테비올 글리코시드 생성 효모로 전환될 수 있다. 각 작제물은 동종 재조합으로 효모 유전체에 도입된 다수의 유전자를 포함한다. 또한, 제 1 및 2 작제물은 동종 재조합에 의해 어셈블링된다.
제 1 작제물은 8개 유전자를 포함하고, DPP1 로커스에 삽입되어 DPP1를 붕괴하거나 부분적으로 결실시킨다. 삽입된 DNA는 다음을 포함한다: NatMX 유전자 (선택 마커)를 발현시키는 A. 고스시피 TEF 프로모터 이어서 A. 고스시피로부터의 TEF 터미네이터; 천연 효모 GPD1 프로모터로부터 발현되는 GeneArt 코돈 최적화된 S. 레바우디아나 UGT85C2 (SEQ ID NO: 32) 및 이어서 천연 천연 효모 CYC1 터미네이터; TPI1 프로모터를 이용하여 발현된 S. 레바우디아나 CPR-8 (SEQ ID NO: 24) 이어서 천연 효모 TDH1 터미네이터; PDC1 프로모터로부터 발현된 A. 탈리아나 카우렌 신타제 (KS-5; SEQ ID NO: 96) 이어서 천연 효모 FBA1 터미네이터; TEF2 프로모터를 이용하여 발현된 시네초코쿠스 종 GGPPS (GGPPS-7; SEQ ID NO: 97) 및 이어서 천연 효모 PFI1 터미네이터; TEF1 프로모터로부터 발현된 DNA2.0 코돈-최적화된 S. 레바우디아나 KAHe1 (SEQ ID NO:18) 및 이어서 ENO2 터미네이터; FBA1 프로모터를 이용하여 발현된 S. 레바우디아나 KO-1 (SEQ ID NO: 98) 및 이어서 천연 효모 TDH2 터미네이터; 및 PGK1 프로모터를 이용하여 발현된 제아 메이즈 절두된 CDPS (SEQ ID NO: 103) 및 이어서 천연 효모 ADH2 터미네이터.
제 2 작제물은 YPRCΔ15 로커스에 삽입되었고, KanMX 유전자 (선택 마커)를 먼저 발현시키는 A. 고스시피로부터의 천연 효모 TEF 프로모터 이어서 A. 고스시피로부터의 TEF 터미네이터; PGK1 프로모터로부터 발현된 Gene Art 코돈 최적화돈 A. 탈리아나 ATR2 (SEQ ID NO: 9) 이어서 효모 ADH2 터미네이터; TPI1 프로모터로부터 발현된 S. 레바우디아나 UGT74G1 (SEQ ID NO:100) 이어서 효모 TDH1 터미네이터; TEF1 프로모터로부터 발현된 Gene Art 코돈 최적화된 S. 레바우디아나 UGT76G1 (SEQ ID NO: 101) 이어서 효모 ENO2 터미네이터, 및 GPD1 프로모터로부터 발현된 GeneArt 코돈-최적화된 S. 레바우디아나 UGT91D2e-b (SEQ ID NO: 102) 및 이어서 효모 CYC1 터미네이터를 포함하였다.
제 1 및 제 2 작제물은 메이팅 및 절단에 의해 동일한 스포어 클론에서 조합되었다. 이 효모 균주는 이후 두 가지 후속 사건에서 제 3 및 제 4 작제물로 형질전환되었다.
제 3 작제물은 유전자 PRP5 및 YBR238C 사이에 통합되었고, K. 락티스 LEU2 유전자를 발현시키는 A. 고스시피으로부터의 TEF 프로모터 이어서 A. 고스시피로부터의 TEF 터미네이터, DNA2.0 최적화된 S. 레바우디아나 KAHe1 (SEQ ID NO: 18)을 발현시키는 GPD1 프로모터 이어서 CYC1 터미네이터, 및 제아 메이즈 절두된 CDPS (SEQ ID NO: 103)를 발현시키는 TPI1 프로모터를 포함하였다.
제 4 작제물은 유전자 ECM3과 YOR093C 사이의 유전체에 통합되었고, K. 뉴모니애 hph 유전자 (SEQ ID NO: 157; 문헌 [Gritz et al., (1983) Gene 25:179-88] 참조)를 발현시키는 A. 고스시피로부터의 TEF 프로모터 이어서 A. 고스시피로부터의 TEF 터미네이터, GPD1 프로모터로부터 발현된 시네초코쿠스 종 GGPPS 이어서 CYC1 터미네이터, 및 A. 탈리아나 카우렌 신타제를 발현시키는 TPI1 프로모터를 포함하는 발현 카세트를 갖는다. 사용된 4가지 유전 마커는 이후 제거되었다.
세포 및 브로쓰로부터 전체 스테비올 글리코시드의 DMSO-추출 후 LC-MS에 의해 분석한 것으로서, 딥-웰 플레이트에서 30℃ 및 320 RPM 진탕하에 3 ml SC (합성 완전) 배지에서 4일 동안 성장시킨 후 EFSC2763은 40-50 μM 또는 2-3 μM/OD600 레바우디오시드 A를 생성하였다.
C. YORW 로커스에 어셈블리 작제물을 하나 더 첨가함으로써 균주 EFSC2763으로부터 균주 EFSC2797을 생성시켰다. 추가적인 작제물은 하기와 같다. S. 폼베로부터의 HIS 유전자 (선택 마커)를 발현시키는 A. 고스시피 TEF 프로모터 이어서, A. 고스시피로부터의 TEF 터미네이터; GPD1 프로모터를 사용하여 발현된 S. 레바우디아나 KO-1 (SEQ ID NO:98) 및 이어서 천연 효모 tCYC1 터미네이터; TPI1 프로모터를 사용하여 발현된 S. 레바우디아나 CPR-8 (SEQ ID NO: 24) 이어서 천연 효모 TDH1 터미네이터; PDC1 프로모터로부터 발현된 A. 탈리아나 카우렌 신타제 (KS-5; SEQ ID NO: 96) 및 이어서 천연 효모 FBA1 터미네이터; TEF2 프로모터로부터 발현된 오리자 사티바 (Oryza sativa) EUGT11 (SEQ ID NO: 53) 이어서 효모 PGI1 터미네이터; TEF1 프로모터로부터 발현된 DNA2.0 코돈-최적화된 S. 레바우디아나 KAHe1 (SEQ ID NO: 18) 및 이어서 ENO2 터미네이터; PGK1 프로모터로부터 발현된 제아 메이즈 절두된 CDPS (SEQ ID NO: 103) 및 이어서 ADH2 터미네이터.
세포 (4일 동안 30℃에서 24-웰 플레이트에서 성장한 세포) 및 브로쓰로부터의 전체 스테비올 글리코시드의 DMSO-추출 후 LC-MS 분석은 EFSC2797이 다양한 양의 RebA, RebB, RebD, RebM 및 루부소시드를 생성함을 입증하였다 (하기 표 12 참조).
표 12.
EFSC2797로부터
스테비올 글리코시드 생성
Rubu
( μM /OD600) |
RebB
( μM /OD600) |
RebA
( μM /OD600) |
RebD
( μM /OD600) |
RebM
( μM /OD600) |
OD600에 의해 표준화됨 |
0.110 | 0.634 | 3.364 | 3.451 | 5.411 | 평균 |
0.065 | 0.263 | 1.119 | 1.222 | 1.614 | 표준 편차 |
Rubu ( μM ) | RebB ( μM ) | RebA ( μM ) | RebD ( μM ) | RebM ( μM ) | |
1.349 | 8.477 | 46.737 | 47.691 | 75.952 | 평균 |
0.0611 | 2.2025 | 16.7505 | 17.1447 | 28.1131 | 표준 편차 |
D. EFSC3248 효모 균주는 상기 기술된 동일한 어미 야생형 사카로마이세스 세레비시애 균주로부터 유래하며, 상기와 유사한 방법을 이용하여 표 13에 기술된 하기 유전자를 통합하였다. 또한, 이러한 균주는 교배형에서 스위칭을 방지하기 위한 HO-이다.
표 13. 균주
EFSC
3248에서 사용된 재조합 경로 유전자 및 프로모터의 목록.
이종성 경로 유전자 | 복사체의 수 | 사용된 프로모터(들) |
GGPPS7 (시네초코쿠스 종) 합성 (SEQ ID NO: 97) | 1 | TEF2 |
CDPS (절두됨, 제아 메이즈) 천연 유전자 (SEQ ID NO: 103) | 2 | PGK1 X 2 |
KS5 (A. 탈리아나) 천연 유전자 (SEQ ID NO: 96) | 2 | PDC1 X 2 |
KO-1 (S. 레바우디아나 KO1) 합성 유전자 (SEQ ID NO: 98) | 2 | FBA1, GPD1 |
ATR2 합성 유전자 (SEQ ID NO: 99) | 1 | PGK1 |
KAH (S. 레바우디아나 KAHe1) 합성 유전자 (SEQ ID NO: 18) | 2 | TEF1 X 2 |
S. 레바우디아나 CPR 8 천연 유전자 (SEQ ID NO: 24) | 2 | TPI1 X 2 |
UGT85C2 (S. 레바우디아나) 합성 (SEQ ID NO: 32) | 1 | GPD1 |
UGT74G1 천연 (S. 레바우디아나) (SEQ ID NO: 100) | 1 | TPI1 |
UGT76G1 합성 (S. 레바우디아나) (SEQ ID NO: 101) | 1 | TEF1 |
91D2e-b 2X 변이체, 합성, S. 레바우디아나로부터 유래 (SEQ ID NO: 102) | 1 | GPD1 |
EUGT11 합성 (오리자 사티바) (SEQ ID NO: 53) | 1 | TEF2 |
실시예
3.
트랜스포터를
과다발현하는 효모 균주의
작제
레바우디오시드를 생성하는 효모 균주는 상기 실시예 2 및 국제 출원 번호: PCT/US2011/038967 (WO/2011/153378) 및 PCT/US2012/050021 (WO/2013/022989) (이 둘 모두는 그 전체가 본원에 참조로서 통합됨)에 기술되어 있다. 유사한 균주의 진탕 플라스크 연구로부터의 관찰은 상청액중 RebA의 분획이 시간에 따라 증가함을 나타내며, 이러한 효과는 세포 용해의 결과가 아닌 것으로 측정되었다. 사카로마이세스 세레비시애에서 스테비올 글리코시드 분비에 대한 다양한 트랜스포터의 효과를 측정하기 위해, 사카로마이세스 세레비시애 균주의 라이브러리를 트랜스포터 유전자에 대한 내인성 프로모터 대신에 TEF1 항시성 프로모터로 치환함으로써 작제하였다.
TEF 프로모터, 및 lox P 부위에 의해 플랭킹된 HIS5 (쉬조사카로마이세스 폼베) 마커로 구성된 카세트를 작제하였다. 특정 테일을 갖는 프라이머를 카세트의 PCR 증폭에 사용하였으며, 생성물을 상기 기술된 RebA 생산자 EFSC2763에서 상동 재조합에 의해 관심 유전자로부터의 업스트립에 통합시켰다. 유전자의 출발부에 어닐링시킨 프라이머 테일에 Kosak 서열을 부가하여, 출발 코돈 바로 앞에 위치시켰다. 카세트의 올바른 삽입은 TEF1 프로모터에 어닐링되는 전방향 프라이머 및 특이적 트랜스포터 유전자에 어닐링되는 유전자 특이적 역 프라이머를 사용하여 PCR에 의해 확인하였다. 표 14는 TEF1 항시성 프로모터를 사용하여 내인성 프로모터를 대체한 44개 수송 관련 유전자의 목록을 함유한다.
표
14: 수송
관련 유전자 (
UniProtKB
/Swiss-
Prot
넘버링
)
유전자 | ORF | 수탁 번호 | |
1 | PDR1 | YGL013C | P12383 (SEQ ID NO: 104) |
2 | PDR3 | YBL005W | P33200 (SEQ ID NO: 105) |
3 | PDR8 | YLR266C | Q06149 (SEQ ID NO: 106) |
4 | PDR5 | YOR153W | P33302 (SEQ ID NO: 107) |
5 | PDR10 | YOR328 | P51533 (SEQ ID NO: 108) |
6 | PDR11 | YIL013 | P40550 (SEQ ID NO: 109) |
7 | PDR12 | YPL058 | Q02785 (SEQ ID NO: 110) |
8 | PDR15 | YDR406 | Q04182 (SEQ ID NO: 111) |
9 | PDR18 | YNR070w | P53756 (SEQ ID NO: 112) |
10 | SNQ2 | YOR328 | P32568 (SEQ ID NO: 113) |
11 | STE6 | YKL209c | P12866 (SEQ ID NO: 114) |
12 | YOR1 | YGR281 | P53049 (SEQ ID NO: 115) |
13 | AUS1 | YOR011W | Q08409 (SEQ ID NO: 116) |
14 | - | YOL075c | Q08234 (SEQ ID NO: 117) |
15 | - | YIL166c | P40445 (SEQ ID NO: 118) |
16 | THI73 | YLR004c | Q07904 (SEQ ID NO: 119) |
17 | NFT1 | YKR103w | P0CE68 (SEQ ID NO: 120) |
18 | ADP1 | YCR011C | P25371 (SEQ ID NO: 121) |
19 | FLR1 | YBR008C | P38124 (SEQ ID NO: 122) |
20 | QDR1 | YIL120W | P40475 (SEQ ID NO: 123) |
21 | QDR2 | YIL121W | P40474 (SEQ ID NO: 124) |
22 | QDR3 | YBR043C | P38227 (SEQ ID NO: 125) |
23 | TPO1 | YLL028W | Q07824 (SEQ ID NO: 126) |
24 | TPO2 | YGR138C | P53283 (SEQ ID NO: 127) |
25 | TPO3 | YPR156c | Q06451 (SEQ ID NO: 128) |
26 | TPO4 | YOR273C | Q12256 (SEQ ID NO: 129) |
27 | AQR1 | YNL065W | P53943 (SEQ ID NO: 130) |
28 | AZR1 | YGR224W | P50080 (SEQ ID NO: 131) |
29 | SGE1 | YPR198W | P33335 (SEQ ID NO: 132) |
30 | YHK8 | YHR048W | P38776 (SEQ ID NO: 133) |
31 | ATR1 | YML116W | P13090 (SEQ ID NO: 134) |
32 | GEX2 | YKR106W | P36173 (SEQ ID NO: 135) |
33 | HOL1 | YNR055C | P53389 (SEQ ID NO: 136) |
34 | - | YOR378W | Q08902 (SEQ ID NO: 137) |
35 | - | YMR279C | Q03263 (SEQ ID NO: 138) |
36 | ENB1 | YOL158C | Q08299 (SEQ ID NO: 139) |
37 | ARN1 | YHL040C | P38731 (SEQ ID NO: 140) |
38 | ARN2 | YHL047C | P38724 (SEQ ID NO: 141) |
39 | SSU1 | YPL092W | P41930 (SEQ ID NO: 142) |
40 | THI7 | YLR237W | Q05998 (SEQ ID NO: 143) |
41 | TPN1 | YGL186C | P53099 (SEQ ID NO: 144) |
42 | SEO1 | YAL067C | P39709 (SEQ ID NO: 145) |
43 | SIT1 | YEL065W | P39980 (SEQ ID NO: 146) |
44 | DTR1 | YBR180W | P38125 (SEQ ID NO: 147) |
44개 균주를 RebA 분비에 대해 평가하였다. 복제 배양물을 48 시간 동안 3 ml 합성 완전 (SC) 배지에서 인큐베이션하였다 (30℃, 310 rpm, 24 웰 플레이트). 100 ㎕의 배양물을 원심분리하여 (4000 rcf, 7 분) 상청액 샘플을 수득하였다. 상청액의 25㎕를 두배량의 50% DMSO에 첨가하였다.
상청액 (세포-비함유) 샘플로서의 이들 샘플을 LC-MS로 분석하였다. 이용된 LC-MS 방법은 Phenomenex® 키네텍스 (kinetex) C18 칼럼 (150 x 2.1 mm, 2.6 μM 입자, 100 Å 포어 크기)을 사용하고, 40-50%B의 더욱 얕은 구배를 이용하여 전형적으로 더 긴 체류 시간을 유도한다는 점을 제외하고는 실시예 1과 유사하다. 원래 샘플로부터 잔존하는 상청액을 제거하고 펠렛을 100 ㎕ 물로 세척하였다. 펠렛을 100 ㎕ 50% DMSO에서 재현탁시키고 10분 동안 80℃로 가열한 후 샘플을 원심분리하였다 (4000 rcf, 5 분). 재현탁된 펠렛으로부터 수득된 25 ㎕의 상청액을 동량의 50% DMSO 및 동량의 물에 첨가한 후, 샘플을 필터 플레이트로 옮겼다. 필터 플레이트로부터 샘플을 채취하고 (2000 rcf, 2 분), 펠렛 샘플로서 LC-MS에서 측정하였다. 결과는 도 2에 도시되어 있다.
균주 "12_YOR1"은 EFSC2763 대조군 균주와 비교하여 펠렛에서 보다 높은 백분율의 상청액중 RebA를 보여주었다. "18_ADP1" 및 "EFSC2763" 균주는 다른 균주보다 적은 총 RebA를 생성하였으며, "40_THI7"은 샘플간의 큰 편차를 갖는다. YOR1 과다발현 균주를 다시 평가하였다. 제 2 실험에서, YOR1 과다발현 균주 "YOR1_OE"는 EFSC2763 대조군 균주보다 적은 총 RebA를 생성하였으나, 대조군 균주보다 상청액중 더 높은 백분율의 RebA를 여전히 보여주었다 (도 3). 메신저 RNA 수준은 후보 트랜스포터에 대해 측정하고, 많은 경우에서, 발현 수준은 야생형 수준으로부터 실질적으로 증가하지 않았다.
9개 후보 (PDR1, PDR3, PDR13, SNQ2, YOR1_BY, YOR1_IS1, FLR1, AZR1 및 DTR1)를 또 다른 생성 균주 EFSC2797 (상기 기술됨)에서 레바우디오시드 생성 및 분비에 대해 그리고, 2 마이크론 플라스미드 (PSB314)에 대해 재-평가하였다. 복제 배양물을 3 ml 합성 완전 (SC) 배지에서 48 시간 (30℃, 310 rpm, 24 웰 플레이트) 동안 인큐베이션하였다. 상청액 샘플은 100 ㎕의 배양물 (13,000 rcf, 5 분)을 원심분리함으로써 수득하였다. 50 마이크로리터의 상청액을 동량의 100% DMSO에 첨가하였다. 이들 샘플을 상청액 샘플로서 LC-MS에 의해 분석하였다. 총 브로쓰 샘플을 동일 용적의 100% DMSO와 혼합하고, 10분 동안 80℃로 가열한 후, 샘플을 원심분리하고 (4000 rcf, 5 분), 액체 부분을 "전체" 스테비올 글리코시드 수준으로서 LC-MS에 의해 분석하였다. 배양 상청액으로 분비된 다양한 스테비올 글리코시드 (RebA, RebB, RebD, RebM, 루부소시드, 13-SMG, 1.2 스테비오시드, 1.2 비오시드 및 비공지의 스테비올 글리코시드 (4.13분에서 LC-MS 피크)를 포함)의 양은 물론 전체 배양 브로쓰 중의 총 양을 실시예 1에 기술된 바와 같이 LC-MS로 측정하였다. 결과는 도 4a-m에 도시되어 있다. 분비에 대해 플롯팅된 백분율은 도 4a-k에서 "총" 량으로 나눈 상청액 값에 대한 것이거나, OD600 당 마이크로몰 농도를 플롯팅하거나 (도 4j-k), 상청액 또는 전체 중 농도를 플롯팅하였다 (도 4l-m).
각 9개 후보 유전자 (PDR1, PDR3, PDR13, SNQ2, YOR1_BY, YOR1_IS1, FLR1, AZR1 및 DTR1)의 독립적인 과다발현은 다양한 스테비올 글리코시드가 대조군 균주 (대조군은 빈 PSB314 플라스미드를 갖는 EFSC2797임; 도 4a-m에서 "PSB314"로서 도시됨)와 비교하여 상청액 중 더 높은 백분율 및/또는 농도로 분비되었음이 입증되었다. YOR1_BY (SEQ ID NO: 148)은 BY 4741 유전체 DNA로부터 증폭되고 URA 영양요구성 마커 (P426-GPD)를 함유하는 2 마이크론 플라스미드에서 클로닝된 YOR1 유전자의 DNA 서열을 나타내며; YOR1_IS1 (SEQ ID NO: 149)은 YOR1 유전자의 DNA 서열이 추가적인 야생형 사카로마이세스 세레비시애 유전체 DNA로부터 증폭되고, URA 영양요구성 마커 (P426-GPD)를 함유하는 2 마이크론 플라스미드에서 클로닝됨을 나타낸다. 예를 들어, 균주 "SNQ2"는 상청액중 더 높은 백분율의 RebA, RebB, RebD, RebM, 1.2 스테비오시드, 1.2 비오시드 및 4.13분에서의 비공지의 스테비올 글리코시드를 보여주었으며, 총 생성은 빈 PSB314 플라스미드 (도 4-6에서 "PSB314" 또는 "빈 플라스미드"로서 도시됨)를 갖는 EFSC2797 대조군 균주와 비교하여 동일하다. 균주 "YOR1_IS1"는 EFSC2797 대조군 균주와 비교하여 총 샘플중에서 상청액 중에 더 높은 백분율의 RebB, RebD, 루부소시드, 1.2 스테비오시드, 1.2 비오시드 및 4.13분에서의 비공지의 스테비올 글리코시드를 보여주었다. 게다가, SNQ2 및 YOR1 과다발현은 대조군과 비교하여 상청액에서 RebD 및 RebA의 농도 증가를 입증하였다 (도 4j-m 참조).
상기 9개 후보중 4개를 트랜스포터를 과다발현하기 위해 PSB314 2 마이크론 플라스미드를 사용하여 생성 EFSC2797 균주에서 레바우디오시드 생성 및 분비에 대해 다시 평가하엿다. 배양물을 72시간 동안 (30℃, 310 rpm, 24 웰 플레이트) 3 ml 합성 완전 (SC) 배지 -URA (압력 선택)에서 인큐베이션하였다. 상청액 샘플을 100 ㎕의 배양물 (13,000 rcf, 5 분)의 원심분리에 의해 수득하였다. 50 마이크로리터의 상청액을 50 ul의 100% DMSO에 첨가하였다. 이들 샘플을 상청액 샘플로서 LC-MS로 분석하였다. 50 ㎕의 세포 현탁액을 50 ㎕의 100% DMSO와 혼합하고, 10분 동안 80℃로 가열한 후 샘플을 원심분리하고 (4000 rcf, 5 분); 액체 부분을 "총" 샘플로서 LC-MS에서 측정하였다. 배양 상청액으로 분비된 다양한 스테비올 글리코시드 (RebA, RebB, RebD, RebM, 루부소시드, 13-SMG, 1.2 스테비오시드, 1.2 비오시드 및 비공지된 스테비올 글리코시드 (4.13분에서 LC-MS 피크) 포함)의 양은 물론 전체 배양 브로쓰 중의 총 양을 실시예 1에 기술된 바와 같이 LC-MS로 측정하였다. 곡선하 영역 (AUC)은 Xcalibur 소프트웨어 (Thermo)를 사용하여 데이타 처리 동안 적분에 의해 결정하였다. 분비된 양을 보여주는 결과 (AUC)는 도 5a-d에서 보여주며, 결과는 상청액에 분비된 퍼센트 (상청액/총 값의 비)를 보여주며, 도 5e-i에 도시되어 있다.
각각 4개 후보 유전자 각각의 과다발현 (PDR1, SNQ2, YOR1_BY, YOR1_IS1 및 FLR1)은 다양한 스테비올 글리코시드가 대조군 균주 (빈 PSB314 플라스미드를 갖는 EFSC2797; 도 5a-i에서 "PSB314"로서 도시됨)와 비교하여 상청액중에 더 높은 백분율 및/또는 농도로 분비됨을 입증하였다. 예를 들어, 균주 "YOR1_BY" 및 "YOR1_IS1" 둘 모두는 EFSC2797 대조군 균주와 비교하여 전체에서 보다 상청액중에서 더 높은 백분율의 RebA, RebB, 1.2 스테비오시드 및 4.13분의 비공지된 스테비올 글리코시드를 보여주었다. 게다가, 과다발현된 SNQ2, YOR1, PDR1 및 FLR1은 대조군과 비교하여 상청액중에서 RebB의 AUC 증가를 별도로 입증하였다 (도 5a-d 참조). 각각 4개 후보 유전자의 각각의 과다발현은 대조군과 비교하여 EFSC2797 효모 균주의 OD600에 의해 측정할 경우 성장 속도를 현저하게 변경시키지 않았다 (도 6 참조).
실시예
4. 스테비아
트랜스포터를
과다발현하는 효모 균주
6개의 추정되는 S. 레바우디아나 RebA 트랜스포터를 피로시퀀싱 데이타에서 확인하였다: SrDTX24 (SEQ ID NO: 150), SrMRP10 (SEQ ID NO: 151), SrPDR12 (SEQ ID NO: 152), SrMRP2 (SEQ ID NO: 153), SrMRP4a (SEQ ID NO: 154), 및 SrMRP4b (SEQ ID NO: 155). 추정되는 트랜스포터중 5개 즉, SrDTX24, SrMRP10, SrPDR12, SrMRP4a 및 SrMRP4b를 추가 연구를 위해 선택하고 클로닝하였다. 클로닝된 트랜스포터 서열은 안정한 RebA-생성 S. 세레비시애에서 발현시켰다. 스테비올-글리코시드 분비 수준을 측정하고 도 7에서 도시하였다.
실시예
5. 효모에서
레바우디오시드
트랜스포터를
식별하는 방법
4중
트랜스포터
변이체
효모 균주의
작제
레바우디오시드를 생성하는 효모 균주는 상기 실시예 2 및 그 전체가 본원에 참조로서 통합된 국제 출원 번호 PCT/US2011/038967 (WO/2011/153378) 및 PCT/US2012/050021 (WO/2013/022989)에 기술되어 있다. 유사한 균주의 진탕 플라스크 연구로부터의 관찰은, 스테비올 글리코시드가 분자의 분자량이 증가함에 따라 감소하는 것으로 보여지는 효율을 갖는 S. 세레비시애 세포로부터 분비됨을 나타냈다. S. 세레비시애에서 스테비올 글리코시드 분비에 대한 다양한 트랜스포터의 효과를 측정하기 위해, 내인성 트랜스포터의 파괴를 각각 수반하는 S. 세레비시애 변이체의 라이브러리를 작제하였다.
원형질막-위치한 ABC 및 MFS 트랜스포터는 45-65 bp 유전자 특이적 장-테일을 갖는 프라이머로 증폭된 항생제 마커 카세트를 사용하여, S. 세레비시애 균주 BY4741 및/또는 BY4742 (BY4741은 ATCC 201388로서 입수가능하고, BY4742는 ATCC 201389로서 입수가능함; 문헌 [Brachmann, et al. "Designer deletion strains derived from Sacchromyces cerevisiae S288C: a useful set of strains and plasmids for PCR-mediated gene disruption and other applications." Yeast 14:115-32, 1998] 참조)에서 하나씩 파괴하였다. 카세트는 균주로 형질전환되고, 특이적 트랜스포터 유전자는 항생제 마커 카세트의 상동 재조합에 의해 파괴하였다. 천연 트랜스포터 유전자의 파괴는 천연 유전자의 업스트림 서열에 특이적인 전방향 프라이머 및 항생제 마커 카세트에서 내부에 위치한 역 프라이머를 사용하여 PCR에 의해 확인하였다. 변이체 라이브러리는 총 34개 트랜스포터 (14 ABC, 19 MFS, 및 1 기타) 및 2개의 전사 인자를 포함하였다. 표 15 참조.
표 15: 라이브러리 균주에서 효모
변이체를
생성하기 위한 수송-관련 유전자
넉아웃
명칭 | ORF | 타입/단백질 위치 | 수탁 번호* | |
PDR1 /3 | YGL013C/YBL005W | 전사 인자 | P12383/ (SEQ ID NO: 104) P33200 (SEQ ID NO: 105) |
|
PDR3 | YBL005W | 전사 인자 | P33200 (SEQ ID NO: 105) | |
1 | PDR11 | YIL013 | 원형질막 | P40550 (SEQ ID NO: 109) |
2 | PDR15 | YDR406 | 원형질막 | Q04182 (SEQ ID NO: 111) |
3 | PDR10 | YOR328 | 원형질막 | P51533 (SEQ ID NO: 108) |
4 | PDR5 | YOR153W | 원형질막 | P33302 (SEQ ID NO: 107) |
5 | YOR1 | YGR281 | 원형질막 | P53049 (SEQ ID NO: 115) |
6 | AUS1 | YOR011W | 미토콘드리아 ( 원형질막) | Q08409 (SEQ ID NO: 116) |
7 | SNQ2 | YDR011 | 원형질막 | P32568 (SEQ ID NO: 113) |
8 | PDR12 | YPL058 | 원형질막 | Q02785 (SEQ ID NO: 110) |
9 | STE6 | YKL209c | 원형질막 | P12866 (SEQ ID NO: 114) |
10 | - | YOL075c | (막) | Q08234 (SEQ ID NO: 117) |
11 | - | YIL166c | (막) | P40445 (SEQ ID NO: 118) |
12 | THI73 | YLR004c | (원형질/ER 막) | Q07904 (SEQ ID NO: 119) |
13 | NFT1 | YKR103w/YKR104w | 막 | P0CE68 (SEQ ID NO: 120) |
14 | PDR18 | YNR070w | (미토콘드리아) | P53756 (SEQ ID NO: 112) |
15 | FLR1 | YBR008C | 원형질막 | P38124 (SEQ ID NO: 122) |
16 | QDR1 | YIL120W | 원형질막 | P40475 (SEQ ID NO: 123) |
17 | QDR2 | YIL121W | 원형질막 | P40474 (SEQ ID NO: 124) |
18 | QDR3 | YBR043C | 원형질막 | P38227 (SEQ ID NO: 125) |
19 | DTR1 | YBR180W | (프로스포어 막) | P38125 (SEQ ID NO: 147) |
20 | TPO1 | YLL028W | 원형질막 | Q07824 (SEQ ID NO: 126) |
21 | TPO2 | YGR138C | 원형질막 | P53283 (SEQ ID NO: 127) |
22 | AQR1 | YNL065W | 원형질막 | P53943 (SEQ ID NO: 130) |
23 | AZR1 | YGR224W | 원형질막 | P50080 (SEQ ID NO: 131) |
24 | ENB1 | YOL158C | 원형질막 | Q08299 (SEQ ID NO: 139) |
25 | SGE1 | YPR198W | 원형질막 | P33335 (SEQ ID NO: 132) |
26 | YHK8 | YHR048W | 막 | P38776 (SEQ ID NO: 133) |
27 | GEX2 | YKR106W | 막 | P36173 (SEQ ID NO: 135) |
28 | HOL1 | YNR055C | 원형질막 /미토콘드리아 | P53389 (SEQ ID NO: 136) |
29 | TPO4 | YOR273C | 원형질막 /(액포) | Q12256 (SEQ ID NO: 129) |
30 | TPO3 | YPR156c | 원형질막 /(액포) | Q06451 (SEQ ID NO: 128) |
31 | ATR1 | YML116W | 원형질막 (액포) | P13090 (SEQ ID NO: 134) |
32 | - | YOR378W | - | Q08902 (SEQ ID NO: 137) |
33 | - | YMR279C | - | Q03263 (SEQ ID NO: 138) |
34 | HXT11 | YOL156W | 원형질막 | P54862 (SEQ ID NO: 156) |
* -- <uniprot.org/uniprot> 웹사이트에서 기록된 수탁 번호.
개시 분석은 이러한 36개 유전자의 변이체 중에서, 효모 PDR5 , PDR10 , PDR15 및 SNQ2 로커스에 의해 인코딩된 트랜스포터는 스테비올 글리코시드 예컨대, 19-SMG 및 루부소시드의 배양 배지로의 분비에 대한 검출가능한 효과를 가짐을 보여주었다. TPO1 , TPO3 , YOR1 , YOL075c , PDR18 , 및 FLR1 로커스에 의해 인코딩된 효모 내인성 트랜스포터는 물론 PDR1 및 PDR3 로커스에 의해 인코딩된 전사 인자는 또한, PDR5 , PDR10 , PDR15 및 SNQ2의 것보다 더 적은 정도이긴 하나, 스테비올 글리코시드 분비에 대한 검출가능한 효과를 가졌다. 스테비올 글리코시드의 분비에 영향을 끼치는 수개의 트랜스포터가 확인되었기 때문에, 단일 트랜스포터는 효모에서 스테비올 글리코시드의 분비를 단독으로 책임지는 것으로 보이지 않는다.
스테비올 글리코시드 분비에 대한 하나 초과의 트랜스포터의 파괴 효과를 측정하기 위해, 4중 파괴 변이체 (pdr5 , pdr10 , pdr15 , snq2)를 생성시켰다. 결실 변이체 pdr15 (BY4742를 기반으로 하는 S. 세레비시애 균주에서 생성됨)를 테일로서 PDR10 플래킹 서열을 갖는 프라이머를 사용하여 PCR로부터 제조된 선택 마커 결실 카세트로 형질전환시켜, 형질전환시 생동 재조합을 허용한다. 동일한 방식으로, snq2 결실 균주를 생성시키고 (BY4741 기반으로 함), 프라이머 테일로서 PDR5 플랭킹 서열을 사용하여 제 2 선택 마커 결실 카세트로 형질전환시켰다. 생성되는 2개의 이중 변이체 균주 (pdr15-pdr10 및 snq2-pdr5)를 메이팅시켜 모두 4개의 트랜스포터 유전자에서 파괴된 스포어 생성물을 생성시켰다. 단일 파괴 변이체에 대해 기술된 바와 같은 프라이머 전법을 이용하여 파괴를 PCR에 의해 입증하였으며, 4X 파괴 변이체로서 언급된 4중 pdr5 , pdr10 , pdr15, snq2 파괴 변이체의 형성을 유도하였다.
4X 파괴 변이체는 4개의 스테비아 레바우디아나 UGT를 인코딩하는 2 마이크론 플라스미드로 형질전환시켰다: 76G1, 74G1, 91D2e, 및 85C2. WO 2011/153378A1 참조. 4개의 UGT를 발현하는 4X 파괴 변이체의 배양물을 히스티딘 및 우라실이 결여된 2-3 ml의 합성 완전 (SC) 배지를 함유하는 13-ml 배양 튜브에서 밤새 사전-성장시켰다. UGT 플라스미드를 가지나 PDR5 , PDR10 , PDR15, SNG2 로커스에서 야생형인 어미 균주의 배양물을 대조군으로서 제공하였다.
다음날 0.25 OD600 단위체를 스핀다운시키고, 100 μM 스테비올을 함유하는 새로운 배지에 재현탁시키고, 배양 튜브에서 2h 동안 30℃에서 진탕하였다. 100 ㎕의 배양물 분취액을 스핀다운시키고, 동량의 DMSO를 상청액에 첨가하였다. 세포 펠렛을 H2O로 세척하고, 후속하여 200 ㎕의 50% DMSO에 재현탁하였다. 이어서, 혼합물을 볼텍싱하고, 10분 동안 80℃에서 가열하고, 원심분리하여 찌꺼기를 제거하였다. 생성 용액 (세포 펠렛 샘플)을, Phenomenex® 키네텍스 C18 칼럼 (150 x 2.1 mm, 2.6 μM 입자, 100 Å 포어 크기)를 사용하고, 40-50% B의 더 얕은 구배를 사용하여 전형적으로 더 긴 체류 시간을 유도한다는 점을 제외하고는 실시예 1에 기술된 것과 유사한 방법을 이용하여 LC-MS에 의해 19-SMG의 양에 대해 분석하였다. 도 8에 도시된 결과는 4X 파괴 변이체 균주에 의해 제조된 전체 19-SMG의 대략 90%가 펠렛에 존재함을 나타낸다. 반대로, 야생형 균주에 의해 제조된 전체 19-SMG의 단지 약 25%만이 펠렛에 존재하였다.
4개의 S. 레바우디아나 UGT를 발현하는 4X 파괴 변이체 균주를 레바우디오시드 A 생성에 대해 평가하였다. 사전-배양된 세포를 250 ㎕ 스테비올 함유 배지 (SC-His-Ura, 100 μM 스테비올)에서 OD600 = 20으로 농축하였다. 24 시간 인큐베이션 (30℃ 및 200 rpm) 후, 세포를 채취하였다. 배양물의 100 ㎕ 분취액을 스핀다운시키고, 동일 용적의 DMSO를 이러한 샘플의 상청액에 첨가하였다. 세포 펠렛을 H2O에서 1회 세척하고, 200 ㎕의 50% DMSO를 펠렛에 첨가하였다. 샘플을 볼텍싱하고, 10분 동안 80℃로 가열시키고 원심분리하였다. 2개의 DMSO 혼합물로부터의 상청액을 풀링시키고, 스테비올 글리코시드 함량을 Phenomenex® 키네텍스 C18 칼럼을 사용한 LC-MS에 의해 분석하였다. 결과는 도 9에 도시하였다. 이러한 결과는 RebA 축적에서의 큰 증가가, 4개의 S. 레바우디아나 UGT를 발현하는 야생형 균주와 비교하여 4개의 S. 레바우디아나 UGT를 발현하는 4X 변이체 균주에서 관찰되었음을 나타낸다. 이러한 결과는 모노글루코시드 중간체가 4X 변이체 균주에서 아마도 덜 분비되고, 대신에 이들 효모 균주의 세포질에서 추가의 글리코실화에 대한 기질로서 기능함을 암시한다. 그러나, 넉아웃된 트랜스포터중 일부는 또한 RebA와 같은 더 큰 분자량의 레바우디오시드의 분비에 대한 특이성을 가질 수 있으며, 배지에서의 RebA의 분비가 요망되는 균주에서 과다발현시키기에 유용할 수 있다. 경로 UGT의 발현을 통해 글리코실화 활성 속도의 적절한 균형을 이용하여, 더 적은 분자량의 스테비올 글리코시드는 추가로 글리코실화된 후 배지로 분비된다. 예를 들어, UGT74G1 및 UGT85C2 효소와 비교하여 UGT76G1 및 UGT91D2e 및/또는 EUGT11 UGT의 더 높은 발현 수준은 스테비올 모노글루코시드의 축적을 방지하며, 이는 더욱 용이하게 분비된다. UGT 활성 수준이 특정 스테비올 글리코시드에 대한 수송 속도보다 높은 경우 (따라서, 글리코실화 속도가 더 빠른 경우), 더 높은 분자량의 스테비올 글리코시드가 생성될 것이다.
7X
트랜스포터
변이체
효모 균주의
작제
상기 기술된 4중 트랜스포터 변이체 결과를 기반으로 하여, 7X 트랜스포터 파괴 변이체 (pdr15 - pdr10 - snq2 - pdr5 - tpo1 - pdr1 - pdr3)를 생성시켰다. pdr1 및 pdr3 이중 변이체는 BY4741 배경에서 생성시켰다. 그 후, 이중 변이체를 생성하기 위해 사용된 마커를 제거하였다. 생성된 이중 변이체를 선택 마커 결실 카세트로 형질전환시켰다. 테일로서 TPO1 플랭킹 서열을 갖는 프라이머를 사용하여 PCR로부터 카세트를 제조하여 형질전환시 상동 재조합을 허용하게 하였다. 3중 변이체 pdr1 - pdr3-tpo1를 상기 기술된 4X 파괴 변이체 (BY4742 기반)와 메이팅시켰다. 생성 스포어에서, 모두 7개 위치에서 파괴된 균주를 발견하였다. 유전자의 파괴는 PCR에 의해 확인하였다. 표적화된 유전자를 대체하는 카세트의 경우에, 상기 기술된 PCR 방법을 적용하여 유전자의 파괴를 확인하였다. pdr1 및 pdr3 로커스에 있어서, 각 유전자로부터의 업스트림 및 다운스트림 서열에 어닐링하기 위해 설계된 전방향 및 역방향 프라이머를 사용하여 파괴를 확인하였다. PCR 생산물은 모든 클론에 존재하였으며, 짧은 PCR 생산물은 표적화된 유전자의 손실을 나타내었다.
상기 기술된 4개의 S. 레바우디아나 UGT를 4X 및 7X 트랜스포터 파괴 변이체는 물론 야생형 균주의 유전체으로 상동 재조합을 이용하여 통합시켰다. 스테비올-구배 시간-과정 실험을 수행하여 야생형, 4X 및 7X 변이체 균주에서 스테비올-글리코시드 축적에 대한 영향을 평가하였다. 4개의 S. 레바우디아나 UGT를 각각 발현하는 4X 및 7X 파괴 변이체 균주의 사전-배양된 세포를 400 ㎕ 스테비올 함유 배지 (SC-Ura, 0 μM, 20 μM, 50 μM, 100 μM, 또는 250 μM 스테비올)에서 OD600 = 1로 농축하였다. 균주를 30℃, 320 rpm하에 96 딥 웰 플레이트에서 성장시키고, 대략 0, 1, 2, 4, 8 또는 24 시간 배양 후, 각 배양물의 50 ㎕ 분취액을 스핀다운시키고, 동일 용적의 DMSO를 각 분취액의 상청액에 첨가하였다. 스테비올 글리코시드 함량을 Phenomenex® 키네텍스 C18 칼럼을 이용하여 상기 기술된 바와 같은 LC-MS에 의해 분석하였다.
결과는 도 10-12에 도시되어 있다. 도 10에 도시된 바와 같이, 야생형 균주는 19-SMG 및 13-SMG를 세포외 브로쓰로 분비하였다. 도 11 및 도 12에 도시된 바와 같이, 4X 및 7X 트랜스포터 파괴 변이체는 세포외 브로쓰로 19-SMG 및 13-SMG를 분비하지 않았다. 그러나, 4X- 및 7X 트랜스포터 파괴 변이체는 야생형 균주보다 더 많은 양의 1,3-비오시드를 분비하였다 (도 12 참조). 이들 데이타는 파괴되는 내인성 트랜스포터가 효모에서 스테비올 글리코시드 축적에 영향을 끼침을 보여준다.
상기 데이타는 효모에서 내인성 트랜스포터의 넉아웃은 단독으로 또는 스테비올 글리코시드의 증가된 보유에 대한 스크리닝과 조합되어 배지에서 스테비올 글리코시드 분비를 증가시키기 위한 과다발현에 대한 잠재적 트랜스포터를 확인하기 위한 우수한 방법임을 설명한다.
트랜스포터
변이체의
추가 스크리닝
더 높은 분자량의 레바우디오시드의 분비에 대한 효모 유전자 넉아웃 효과를 실시예 2에 기술된 효모 균주 EFSC3248에서 평가하였다. 크로모좀에 대한 각 특이적 트랜스포터 유전자 (PDR5, SNQ2, YOR1, YHK8 및 FLR1)의 파괴를 이전에 기술된 바와 같은 상동 재조합에 의해 수행하였다. 96 시간 인큐베이션 (30℃ 및 200 rpm) 후, 세포를 채취하였다. 배양물의 100 ㎕ 분취액을 스핀다운시키고, 동일 용적의 100% DMSO를 상청액에 첨가하였다. 80 마이크로리터의 혼합물을 '상청액' 샘플로서 LC-MS에 의해 분석하였다. 100uL의 100% DMSO중 100 마이크로리터의 세포 현탁액을 10분 동안 80℃에서 가열한 후 원심분리하였다. 혼합물을 볼텍싱하고, 80℃에서 10분 동안 가열하고 원심분리하여 임의의 잔류하는 찌꺼기를 제거하였다. 40 마이크로리터의 생성 용액을 40uL DMSO (50%)와 혼합하고 샘플을 '총' 샘플로서 LC-MS에 의해 분석하였다. 배양 상청액으로 분비된 다양한 스테비올 글리코시드 (RebA, RebB, RebD, RebM, 루부소시드, 13-SMG, 1.2 스테비오시드, 1.2 비오시드 및 비공지된 스테비올 글리코시드 (4.13분에서의 LC-MS 피크) 포함)의 양은 물론 전체 배양 브로쓰에서의 총 양을 실시예 1에 기술된 바와 같이 LC-MS에 의해 측정하였다. 데이타는 단일의 내인성 효모 트랜스포터 유전자의 파괴가 배양 배지의 상청액중 다양한 스테비올 글리코시드의 분비된 양 (도 13a-c) 및 백분율 (도 13d-f)의 감소를 유도함을 입증한다. 구체적으로, SNQ2, YOR1 및 FLR1의 파괴는 대조군과 비교하여, 상청액 또는 효모 균주에서 분비된 RebA, RebB 및 RebD의 감소 또는 효모 균주에서 RebA, RebB 및 RebD 농도의 감소를 유도하였다 (도 13a-f 참조; 도 13의 대조군은 "EFSC3248"임).
본 발명이 이의 특정 구체예를 참조로 상세히 기술되어 있으나, 변형 및 변경이 첨부된 청구범위에 규정된 본 발명의 범위로부터 벗어나지 않으면서 가능하다는 것이 자명할 것이다. 더욱 구체적으로, 본 발명의 일부 양태가 특히 유리한 것으로 본원에서 확인되었으나, 본 발명은 본 발명의 이러한 특정 양태로 반드시 제한될 필요가 없음이 고려된다.
SEQUENCE LISTING
<110> Evolva SA
Simon, Ernesto
Stockler, Iben Nordmark
Mikkelsen, Michael Dalgaard
Hansen, Jorgen Dalgaard
Douchin, Veronique
<120> PRODUCTION OF STEVIOL GLYCOSIDES IN RECOMBINANT HOSTS
<130> 13-1790-WO
<150> US 61/763,290
<151> 2013-02-11
<150> US 61/763,308
<151> 2013-02-11
<160> 158
<170> PatentIn version 3.5
<210> 1
<211> 784
<212> PRT
<213> Stevia rebaudiana
<400> 1
Met Asn Leu Ser Leu Cys Ile Ala Ser Pro Leu Leu Thr Lys Ser Asn
1 5 10 15
Arg Pro Ala Ala Leu Ser Ala Ile His Thr Ala Ser Thr Ser His Gly
20 25 30
Gly Gln Thr Asn Pro Thr Asn Leu Ile Ile Asp Thr Thr Lys Glu Arg
35 40 45
Ile Gln Lys Gln Phe Lys Asn Val Glu Ile Ser Val Ser Ser Tyr Asp
50 55 60
Thr Ala Trp Val Ala Met Val Pro Ser Pro Asn Ser Pro Lys Ser Pro
65 70 75 80
Cys Phe Pro Glu Cys Leu Asn Trp Leu Ile Asn Asn Gln Leu Asn Asp
85 90 95
Gly Ser Trp Gly Leu Val Asn His Thr His Asn His Asn His Pro Leu
100 105 110
Leu Lys Asp Ser Leu Ser Ser Thr Leu Ala Cys Ile Val Ala Leu Lys
115 120 125
Arg Trp Asn Val Gly Glu Asp Gln Ile Asn Lys Gly Leu Ser Phe Ile
130 135 140
Glu Ser Asn Leu Ala Ser Ala Thr Glu Lys Ser Gln Pro Ser Pro Ile
145 150 155 160
Gly Phe Asp Ile Ile Phe Pro Gly Leu Leu Glu Tyr Ala Lys Asn Leu
165 170 175
Asp Ile Asn Leu Leu Ser Lys Gln Thr Asp Phe Ser Leu Met Leu His
180 185 190
Lys Arg Glu Leu Glu Gln Lys Arg Cys His Ser Asn Glu Met Asp Gly
195 200 205
Tyr Leu Ala Tyr Ile Ser Glu Gly Leu Gly Asn Leu Tyr Asp Trp Asn
210 215 220
Met Val Lys Lys Tyr Gln Met Lys Asn Gly Ser Val Phe Asn Ser Pro
225 230 235 240
Ser Ala Thr Ala Ala Ala Phe Ile Asn His Gln Asn Pro Gly Cys Leu
245 250 255
Asn Tyr Leu Asn Ser Leu Leu Asp Lys Phe Gly Asn Ala Val Pro Thr
260 265 270
Val Tyr Pro His Asp Leu Phe Ile Arg Leu Ser Met Val Asp Thr Ile
275 280 285
Glu Arg Leu Gly Ile Ser His His Phe Arg Val Glu Ile Lys Asn Val
290 295 300
Leu Asp Glu Thr Tyr Arg Cys Trp Val Glu Arg Asp Glu Gln Ile Phe
305 310 315 320
Met Asp Val Val Thr Cys Ala Leu Ala Phe Arg Leu Leu Arg Ile Asn
325 330 335
Gly Tyr Glu Val Ser Pro Asp Pro Leu Ala Glu Ile Thr Asn Glu Leu
340 345 350
Ala Leu Lys Asp Glu Tyr Ala Ala Leu Glu Thr Tyr His Ala Ser His
355 360 365
Ile Leu Tyr Gln Glu Asp Leu Ser Ser Gly Lys Gln Ile Leu Lys Ser
370 375 380
Ala Asp Phe Leu Lys Glu Ile Ile Ser Thr Asp Ser Asn Arg Leu Ser
385 390 395 400
Lys Leu Ile His Lys Glu Val Glu Asn Ala Leu Lys Phe Pro Ile Asn
405 410 415
Thr Gly Leu Glu Arg Ile Asn Thr Arg Arg Asn Ile Gln Leu Tyr Asn
420 425 430
Val Asp Asn Thr Arg Ile Leu Lys Thr Thr Tyr His Ser Ser Asn Ile
435 440 445
Ser Asn Thr Asp Tyr Leu Arg Leu Ala Val Glu Asp Phe Tyr Thr Cys
450 455 460
Gln Ser Ile Tyr Arg Glu Glu Leu Lys Gly Leu Glu Arg Trp Val Val
465 470 475 480
Glu Asn Lys Leu Asp Gln Leu Lys Phe Ala Arg Gln Lys Thr Ala Tyr
485 490 495
Cys Tyr Phe Ser Val Ala Ala Thr Leu Ser Ser Pro Glu Leu Ser Asp
500 505 510
Ala Arg Ile Ser Trp Ala Lys Asn Gly Ile Leu Thr Thr Val Val Asp
515 520 525
Asp Phe Phe Asp Ile Gly Gly Thr Ile Asp Glu Leu Thr Asn Leu Ile
530 535 540
Gln Cys Val Glu Lys Trp Asn Val Asp Val Asp Lys Asp Cys Cys Ser
545 550 555 560
Glu His Val Arg Ile Leu Phe Leu Ala Leu Lys Asp Ala Ile Cys Trp
565 570 575
Ile Gly Asp Glu Ala Phe Lys Trp Gln Ala Arg Asp Val Thr Ser His
580 585 590
Val Ile Gln Thr Trp Leu Glu Leu Met Asn Ser Met Leu Arg Glu Ala
595 600 605
Ile Trp Thr Arg Asp Ala Tyr Val Pro Thr Leu Asn Glu Tyr Met Glu
610 615 620
Asn Ala Tyr Val Ser Phe Ala Leu Gly Pro Ile Val Lys Pro Ala Ile
625 630 635 640
Tyr Phe Val Gly Pro Lys Leu Ser Glu Glu Ile Val Glu Ser Ser Glu
645 650 655
Tyr His Asn Leu Phe Lys Leu Met Ser Thr Gln Gly Arg Leu Leu Asn
660 665 670
Asp Ile His Ser Phe Lys Arg Glu Phe Lys Glu Gly Lys Leu Asn Ala
675 680 685
Val Ala Leu His Leu Ser Asn Gly Glu Ser Gly Lys Val Glu Glu Glu
690 695 700
Val Val Glu Glu Met Met Met Met Ile Lys Asn Lys Arg Lys Glu Leu
705 710 715 720
Met Lys Leu Ile Phe Glu Glu Asn Gly Ser Ile Val Pro Arg Ala Cys
725 730 735
Lys Asp Ala Phe Trp Asn Met Cys His Val Leu Asn Phe Phe Tyr Ala
740 745 750
Asn Asp Asp Gly Phe Thr Gly Asn Thr Ile Leu Asp Thr Val Lys Asp
755 760 765
Ile Ile Tyr Asn Pro Leu Val Leu Val Asn Glu Asn Glu Glu Gln Arg
770 775 780
<210> 2
<211> 784
<212> PRT
<213> Stevia rebaudiana
<400> 2
Met Asn Leu Ser Leu Cys Ile Ala Ser Pro Leu Leu Thr Lys Ser Ser
1 5 10 15
Arg Pro Thr Ala Leu Ser Ala Ile His Thr Ala Ser Thr Ser His Gly
20 25 30
Gly Gln Thr Asn Pro Thr Asn Leu Ile Ile Asp Thr Thr Lys Glu Arg
35 40 45
Ile Gln Lys Leu Phe Lys Asn Val Glu Ile Ser Val Ser Ser Tyr Asp
50 55 60
Thr Ala Trp Val Ala Met Val Pro Ser Pro Asn Ser Pro Lys Ser Pro
65 70 75 80
Cys Phe Pro Glu Cys Leu Asn Trp Leu Ile Asn Asn Gln Leu Asn Asp
85 90 95
Gly Ser Trp Gly Leu Val Asn His Thr His Asn His Asn His Pro Leu
100 105 110
Leu Lys Asp Ser Leu Ser Ser Thr Leu Ala Cys Ile Val Ala Leu Lys
115 120 125
Arg Trp Asn Val Gly Glu Asp Gln Ile Asn Lys Gly Leu Ser Phe Ile
130 135 140
Glu Ser Asn Leu Ala Ser Ala Thr Asp Lys Ser Gln Pro Ser Pro Ile
145 150 155 160
Gly Phe Asp Ile Ile Phe Pro Gly Leu Leu Glu Tyr Ala Lys Asn Leu
165 170 175
Asp Ile Asn Leu Leu Ser Lys Gln Thr Asp Phe Ser Leu Met Leu His
180 185 190
Lys Arg Glu Leu Glu Gln Lys Arg Cys His Ser Asn Glu Ile Asp Gly
195 200 205
Tyr Leu Ala Tyr Ile Ser Glu Gly Leu Gly Asn Leu Tyr Asp Trp Asn
210 215 220
Met Val Lys Lys Tyr Gln Met Lys Asn Gly Ser Val Phe Asn Ser Pro
225 230 235 240
Ser Ala Thr Ala Ala Ala Phe Ile Asn His Gln Asn Pro Gly Cys Leu
245 250 255
Asn Tyr Leu Asn Ser Leu Leu Asp Lys Phe Gly Asn Ala Val Pro Thr
260 265 270
Val Tyr Pro Leu Asp Leu Tyr Ile Arg Leu Ser Met Val Asp Thr Ile
275 280 285
Glu Arg Leu Gly Ile Ser His His Phe Arg Val Glu Ile Lys Asn Val
290 295 300
Leu Asp Glu Thr Tyr Arg Cys Trp Val Glu Arg Asp Glu Gln Ile Phe
305 310 315 320
Met Asp Val Val Thr Cys Ala Leu Ala Phe Arg Leu Leu Arg Ile His
325 330 335
Gly Tyr Lys Val Ser Pro Asp Gln Leu Ala Glu Ile Thr Asn Glu Leu
340 345 350
Ala Phe Lys Asp Glu Tyr Ala Ala Leu Glu Thr Tyr His Ala Ser Gln
355 360 365
Ile Leu Tyr Gln Glu Asp Leu Ser Ser Gly Lys Gln Ile Leu Lys Ser
370 375 380
Ala Asp Phe Leu Lys Gly Ile Leu Ser Thr Asp Ser Asn Arg Leu Ser
385 390 395 400
Lys Leu Ile His Lys Glu Val Glu Asn Ala Leu Lys Phe Pro Ile Asn
405 410 415
Thr Gly Leu Glu Arg Ile Asn Thr Arg Arg Asn Ile Gln Leu Tyr Asn
420 425 430
Val Asp Asn Thr Arg Ile Leu Lys Thr Thr Tyr His Ser Ser Asn Ile
435 440 445
Ser Asn Thr Tyr Tyr Leu Arg Leu Ala Val Glu Asp Phe Tyr Thr Cys
450 455 460
Gln Ser Ile Tyr Arg Glu Glu Leu Lys Gly Leu Glu Arg Trp Val Val
465 470 475 480
Gln Asn Lys Leu Asp Gln Leu Lys Phe Ala Arg Gln Lys Thr Ala Tyr
485 490 495
Cys Tyr Phe Ser Val Ala Ala Thr Leu Ser Ser Pro Glu Leu Ser Asp
500 505 510
Ala Arg Ile Ser Trp Ala Lys Asn Gly Ile Leu Thr Thr Val Val Asp
515 520 525
Asp Phe Phe Asp Ile Gly Gly Thr Ile Asp Glu Leu Thr Asn Leu Ile
530 535 540
Gln Cys Val Glu Lys Trp Asn Val Asp Val Asp Lys Asp Cys Cys Ser
545 550 555 560
Glu His Val Arg Ile Leu Phe Leu Ala Leu Lys Asp Ala Ile Cys Trp
565 570 575
Ile Gly Asp Glu Ala Phe Lys Trp Gln Ala Arg Asp Val Thr Ser His
580 585 590
Val Ile Gln Thr Trp Leu Glu Leu Met Asn Ser Met Leu Arg Glu Ala
595 600 605
Ile Trp Thr Arg Asp Ala Tyr Val Pro Thr Leu Asn Glu Tyr Met Glu
610 615 620
Asn Ala Tyr Val Ser Phe Ala Leu Gly Pro Ile Val Lys Pro Ala Ile
625 630 635 640
Tyr Phe Val Gly Pro Lys Leu Ser Glu Glu Ile Val Glu Ser Ser Glu
645 650 655
Tyr His Asn Leu Phe Lys Leu Met Ser Thr Gln Gly Arg Leu Leu Asn
660 665 670
Asp Ile His Ser Phe Lys Arg Glu Phe Lys Glu Gly Lys Leu Asn Ala
675 680 685
Val Ala Leu His Leu Ser Asn Gly Glu Ser Gly Lys Val Glu Glu Glu
690 695 700
Val Val Glu Glu Met Met Met Met Ile Lys Asn Lys Arg Lys Glu Leu
705 710 715 720
Met Lys Leu Ile Phe Glu Glu Asn Gly Ser Ile Val Pro Arg Ala Cys
725 730 735
Lys Asp Ala Phe Trp Asn Met Cys His Val Leu Asn Phe Phe Tyr Ala
740 745 750
Asn Asp Asp Gly Phe Thr Gly Asn Thr Ile Leu Asp Thr Val Lys Asp
755 760 765
Ile Ile Tyr Asn Pro Leu Val Leu Val Asn Glu Asn Glu Glu Gln Arg
770 775 780
<210> 3
<211> 590
<212> PRT
<213> Zea mays
<400> 3
Met Ala Met Pro Val Lys Leu Thr Pro Ala Ser Leu Ser Leu Lys Ala
1 5 10 15
Val Cys Cys Arg Phe Ser Ser Gly Gly His Ala Leu Arg Phe Gly Ser
20 25 30
Ser Leu Pro Cys Trp Arg Arg Thr Pro Thr Gln Arg Ser Thr Ser Ser
35 40 45
Ser Thr Thr Arg Pro Ala Ala Glu Val Ser Ser Gly Lys Ser Lys Gln
50 55 60
His Asp Gln Glu Ala Ser Glu Ala Thr Ile Arg Gln Gln Leu Gln Leu
65 70 75 80
Val Asp Val Leu Glu Asn Met Gly Ile Ser Arg His Phe Ala Ala Glu
85 90 95
Ile Lys Cys Ile Leu Asp Arg Thr Tyr Arg Ser Trp Leu Gln Arg His
100 105 110
Glu Glu Ile Met Leu Asp Thr Met Thr Cys Ala Met Ala Phe Arg Ile
115 120 125
Leu Arg Leu Asn Gly Tyr Asn Val Ser Ser Asp Glu Leu Tyr His Val
130 135 140
Val Glu Ala Ser Gly Leu His Asn Ser Leu Gly Gly Tyr Leu Asn Asp
145 150 155 160
Thr Arg Thr Leu Leu Glu Leu His Lys Ala Ser Thr Val Ser Ile Ser
165 170 175
Glu Asp Glu Ser Ile Leu Asp Ser Ile Gly Ser Arg Ser Arg Thr Leu
180 185 190
Leu Arg Glu Gln Leu Glu Ser Gly Gly Ala Leu Arg Lys Pro Ser Leu
195 200 205
Phe Lys Glu Val Glu His Ala Leu Asp Gly Pro Phe Tyr Thr Thr Leu
210 215 220
Asp Arg Leu His His Arg Trp Asn Ile Glu Asn Phe Asn Ile Ile Glu
225 230 235 240
Gln His Met Leu Glu Thr Pro Tyr Leu Ser Asn Gln His Thr Ser Arg
245 250 255
Asp Ile Leu Ala Leu Ser Ile Arg Asp Phe Ser Ser Ser Gln Phe Thr
260 265 270
Tyr Gln Gln Glu Leu Gln His Leu Glu Ser Trp Val Lys Glu Cys Arg
275 280 285
Leu Asp Gln Leu Gln Phe Ala Arg Gln Lys Leu Ala Tyr Phe Tyr Leu
290 295 300
Ser Ala Ala Gly Thr Met Phe Ser Pro Glu Leu Ser Asp Ala Arg Thr
305 310 315 320
Leu Trp Ala Lys Asn Gly Val Leu Thr Thr Ile Val Asp Asp Phe Phe
325 330 335
Asp Val Ala Gly Ser Lys Glu Glu Leu Glu Asn Leu Val Met Leu Val
340 345 350
Glu Met Trp Asp Glu His His Lys Val Glu Phe Tyr Ser Glu Gln Val
355 360 365
Glu Ile Ile Phe Ser Ser Ile Tyr Asp Ser Val Asn Gln Leu Gly Glu
370 375 380
Lys Ala Ser Leu Val Gln Asp Arg Ser Ile Thr Lys His Leu Val Glu
385 390 395 400
Ile Trp Leu Asp Leu Leu Lys Ser Met Met Thr Glu Val Glu Trp Arg
405 410 415
Leu Ser Lys Tyr Val Pro Thr Glu Lys Glu Tyr Met Ile Asn Ala Ser
420 425 430
Leu Ile Phe Gly Leu Gly Pro Ile Val Leu Pro Ala Leu Tyr Phe Val
435 440 445
Gly Pro Lys Ile Ser Glu Ser Ile Val Lys Asp Pro Glu Tyr Asp Glu
450 455 460
Leu Phe Lys Leu Met Ser Thr Cys Gly Arg Leu Leu Asn Asp Val Gln
465 470 475 480
Thr Phe Glu Arg Glu Tyr Asn Glu Gly Lys Leu Asn Ser Val Ser Leu
485 490 495
Leu Val Leu His Gly Gly Pro Met Ser Ile Ser Asp Ala Lys Arg Lys
500 505 510
Leu Gln Lys Pro Ile Asp Thr Cys Arg Arg Asp Leu Leu Ser Leu Val
515 520 525
Leu Arg Glu Glu Ser Val Val Pro Arg Pro Cys Lys Glu Leu Phe Trp
530 535 540
Lys Met Cys Lys Val Cys Tyr Phe Phe Tyr Ser Thr Thr Asp Gly Phe
545 550 555 560
Ser Ser Gln Val Glu Arg Ala Lys Glu Val Asp Ala Val Ile Asn Glu
565 570 575
Pro Leu Lys Leu Gln Gly Ser His Thr Leu Val Ser Asp Val
580 585 590
<210> 4
<211> 775
<212> PRT
<213> Populus trichocarpa
<400> 4
Met Ser Cys Ile Arg Pro Trp Phe Cys Pro Ser Ser Ile Ser Ala Thr
1 5 10 15
Leu Thr Asp Pro Ala Ser Lys Leu Val Thr Gly Glu Phe Lys Thr Thr
20 25 30
Ser Leu Asn Phe His Gly Thr Lys Glu Arg Ile Lys Lys Met Phe Asp
35 40 45
Lys Ile Glu Leu Ser Val Ser Ser Tyr Asp Thr Ala Trp Val Ala Met
50 55 60
Val Pro Ser Pro Asp Cys Pro Glu Thr Pro Cys Phe Pro Glu Cys Thr
65 70 75 80
Lys Trp Ile Leu Glu Asn Gln Leu Gly Asp Gly Ser Trp Ser Leu Pro
85 90 95
His Gly Asn Pro Leu Leu Val Lys Asp Ala Leu Ser Ser Thr Leu Ala
100 105 110
Cys Ile Leu Ala Leu Lys Arg Trp Gly Ile Gly Glu Glu Gln Ile Asn
115 120 125
Lys Gly Leu Arg Phe Ile Glu Leu Asn Ser Ala Ser Val Thr Asp Asn
130 135 140
Glu Gln His Lys Pro Ile Gly Phe Asp Ile Ile Phe Pro Gly Met Ile
145 150 155 160
Glu Tyr Ala Lys Asp Leu Asp Leu Asn Leu Pro Leu Lys Pro Thr Asp
165 170 175
Ile Asn Ser Met Leu His Arg Arg Ala Leu Glu Leu Thr Ser Gly Gly
180 185 190
Gly Lys Asn Leu Glu Gly Arg Arg Ala Tyr Leu Ala Tyr Val Ser Glu
195 200 205
Gly Ile Gly Lys Leu Gln Asp Trp Glu Met Ala Met Lys Tyr Gln Arg
210 215 220
Lys Asn Gly Ser Leu Phe Asn Ser Pro Ser Thr Thr Ala Ala Ala Phe
225 230 235 240
Ile His Ile Gln Asp Ala Glu Cys Leu His Tyr Ile Arg Ser Leu Leu
245 250 255
Gln Lys Phe Gly Asn Ala Val Pro Thr Ile Tyr Pro Leu Asp Ile Tyr
260 265 270
Ala Arg Leu Ser Met Val Asp Ala Leu Glu Arg Leu Gly Ile Asp Arg
275 280 285
His Phe Arg Lys Glu Arg Lys Phe Val Leu Asp Glu Thr Tyr Arg Phe
290 295 300
Trp Leu Gln Gly Glu Glu Glu Ile Phe Ser Asp Asn Ala Thr Cys Ala
305 310 315 320
Leu Ala Phe Arg Ile Leu Arg Leu Asn Gly Tyr Asp Val Ser Leu Glu
325 330 335
Asp His Phe Ser Asn Ser Leu Gly Gly Tyr Leu Lys Asp Ser Gly Ala
340 345 350
Ala Leu Glu Leu Tyr Arg Ala Leu Gln Leu Ser Tyr Pro Asp Glu Ser
355 360 365
Leu Leu Glu Lys Gln Asn Ser Arg Thr Ser Tyr Phe Leu Lys Gln Gly
370 375 380
Leu Ser Asn Val Ser Leu Cys Gly Asp Arg Leu Arg Lys Asn Ile Ile
385 390 395 400
Gly Glu Val His Asp Ala Leu Asn Phe Pro Asp His Ala Asn Leu Gln
405 410 415
Arg Leu Ala Ile Arg Arg Arg Ile Lys His Tyr Ala Thr Asp Asp Thr
420 425 430
Arg Ile Leu Lys Thr Ser Tyr Arg Cys Ser Thr Ile Gly Asn Gln Asp
435 440 445
Phe Leu Lys Leu Ala Val Glu Asp Phe Asn Ile Cys Gln Ser Ile Gln
450 455 460
Arg Glu Glu Phe Lys His Ile Glu Arg Trp Val Val Glu Arg Arg Leu
465 470 475 480
Asp Lys Leu Lys Phe Ala Arg Gln Lys Glu Ala Tyr Cys Tyr Phe Ser
485 490 495
Ala Ala Ala Thr Leu Phe Ala Pro Glu Leu Ser Asp Ala Arg Met Ser
500 505 510
Trp Ala Lys Asn Gly Val Leu Thr Thr Val Val Asp Asp Phe Phe Asp
515 520 525
Val Gly Gly Ser Glu Glu Glu Leu Val Asn Leu Ile Glu Leu Ile Glu
530 535 540
Arg Trp Asp Val Asn Gly Ser Ala Asp Phe Cys Ser Glu Glu Val Glu
545 550 555 560
Ile Ile Tyr Ser Ala Ile His Ser Thr Ile Ser Glu Ile Gly Asp Lys
565 570 575
Ser Phe Gly Trp Gln Gly Arg Asp Val Lys Ser His Val Ile Lys Ile
580 585 590
Trp Leu Asp Leu Leu Lys Ser Met Leu Thr Glu Ala Gln Trp Ser Ser
595 600 605
Asn Lys Ser Val Pro Thr Leu Asp Glu Tyr Met Thr Thr Ala His Val
610 615 620
Ser Phe Ala Leu Gly Pro Ile Val Leu Pro Ala Leu Tyr Phe Val Gly
625 630 635 640
Pro Lys Leu Ser Glu Glu Val Ala Gly His Pro Glu Leu Leu Asn Leu
645 650 655
Tyr Lys Val Met Ser Thr Cys Gly Arg Leu Leu Asn Asp Trp Arg Ser
660 665 670
Phe Lys Arg Glu Ser Glu Glu Gly Lys Leu Asn Ala Ile Ser Leu Tyr
675 680 685
Met Ile His Ser Gly Gly Ala Ser Thr Glu Glu Glu Thr Ile Glu His
690 695 700
Phe Lys Gly Leu Ile Asp Ser Gln Arg Arg Gln Leu Leu Gln Leu Val
705 710 715 720
Leu Gln Glu Lys Asp Ser Ile Ile Pro Arg Pro Cys Lys Asp Leu Phe
725 730 735
Trp Asn Met Ile Lys Leu Leu His Thr Phe Tyr Met Lys Asp Asp Gly
740 745 750
Phe Thr Ser Asn Glu Met Arg Asn Val Val Lys Ala Ile Ile Asn Glu
755 760 765
Pro Ile Ser Leu Asp Glu Leu
770 775
<210> 5
<211> 2506
<212> DNA
<213> Arabidopsis thaliana
<400> 5
cgtcagtcat caaggctaat tcgtcgcgag ttgctacgac gccgtttcgg ttgcttctgg 60
tttctttatg tctatcaacc ttcgctcctc cggttgttcg tctccgatct cagctacttt 120
ggaacgagga ttggactcag aagtacagac aagagctaac aatgtgagct ttgagcaaac 180
aaaggagaag attaggaaga tgttggagaa agtggagctt tctgtttcgg cctacgatac 240
tagttgggta gcaatggttc catcaccgag ctcccaaaat gctccacttt tcccacagtg 300
tgtgaaatgg ttattggata atcaacatga agatggatct tggggacttg ataaccatga 360
ccatcaatct cttaagaagg atgtgttatc atctacactg gctagtatcc tcgcgttaaa 420
gaagtgggga attggtgaaa gacaaataaa caagggtctc cagtttattg agctgaattc 480
tgcattagtc actgatgaaa ccatacagaa accaacaggg tttgatatta tatttcctgg 540
gatgattaaa tatgctagag atttgaatct gacgattcca ttgggctcag aagtggtgga 600
tgacatgata cgaaaaagag atctggatct taaatgtgat agtgaaaagt tttcaaaggg 660
aagagaagca tatctggcct atgttttaga ggggacaaga aacctaaaag attgggattt 720
gatagtcaaa tatcaaagga aaaatgggtc actgtttgat tctccagcca caacagcagc 780
tgcttttact cagtttggga atgatggttg tctccgttat ctctgttctc tccttcagaa 840
attcgaggct gcagttcctt cagtttatcc atttgatcaa tatgcacgcc ttagtataat 900
tgtcactctt gaaagcttag gaattgatag agatttcaaa accgaaatca aaagcatatt 960
ggatgaaacc tatagatatt ggcttcgtgg ggatgaagaa atatgtttgg acttggccac 1020
ttgtgctttg gctttccgat tattgcttgc tcatggctat gatgtgtctt acgatccgct 1080
aaaaccattt gcagaagaat ctggtttctc tgatactttg gaaggatatg ttaagaatac 1140
gttttctgtg ttagaattat ttaaggctgc tcaaagttat ccacatgaat cagctttgaa 1200
gaagcagtgt tgttggacta aacaatatct ggagatggaa ttgtccagct gggttaagac 1260
ctctgttcga gataaatacc tcaagaaaga ggtcgaggat gctcttgctt ttccctccta 1320
tgcaagccta gaaagatcag atcacaggag aaaaatactc aatggttctg ctgtggaaaa 1380
caccagagtt acaaaaacct catatcgttt gcacaatatt tgcacctctg atatcctgaa 1440
gttagctgtg gatgacttca atttctgcca gtccatacac cgtgaagaaa tggaacgtct 1500
tgataggtgg attgtggaga atagattgca ggaactgaaa tttgccagac agaagctggc 1560
ttactgttat ttctctgggg ctgcaacttt attttctcca gaactatctg atgctcgtat 1620
atcgtgggcc aaaggtggag tacttacaac ggttgtagac gacttctttg atgttggagg 1680
gtccaaagaa gaactggaaa acctcataca cttggtcgaa aagtgggatt tgaacggtgt 1740
tcctgagtac agctcagaac atgttgagat catattctca gttctaaggg acaccattct 1800
cgaaacagga gacaaagcat tcacctatca aggacgcaat gtgacacacc acattgtgaa 1860
aatttggttg gatctgctca agtctatgtt gagagaagcc gagtggtcca gtgacaagtc 1920
aacaccaagc ttggaggatt acatggaaaa tgcgtacata tcatttgcat taggaccaat 1980
tgtcctccca gctacctatc tgatcggacc tccacttcca gagaagacag tcgatagcca 2040
ccaatataat cagctctaca agctcgtgag cactatgggt cgtcttctaa atgacataca 2100
aggttttaag agagaaagcg cggaagggaa gctgaatgcg gtttcattgc acatgaaaca 2160
cgagagagac aatcgcagca aagaagtgat catagaatcg atgaaaggtt tagcagagag 2220
aaagagggaa gaattgcata agctagtttt ggaggagaaa ggaagtgtgg ttccaaggga 2280
atgcaaagaa gcgttcttga aaatgagcaa agtgttgaac ttattttaca ggaaggacga 2340
tggattcaca tcaaatgatc tgatgagtct tgttaaatca gtgatctacg agcctgttag 2400
cttacagaaa gaatctttaa cttgatccaa gttgatctgg caggtaaact cagtaaatga 2460
aaataagact ttggtcttct tctttgttgc ttcagaacaa gaagag 2506
<210> 6
<211> 785
<212> PRT
<213> Arabidopsis thaliana
<400> 6
Met Ser Ile Asn Leu Arg Ser Ser Gly Cys Ser Ser Pro Ile Ser Ala
1 5 10 15
Thr Leu Glu Arg Gly Leu Asp Ser Glu Val Gln Thr Arg Ala Asn Asn
20 25 30
Val Ser Phe Glu Gln Thr Lys Glu Lys Ile Arg Lys Met Leu Glu Lys
35 40 45
Val Glu Leu Ser Val Ser Ala Tyr Asp Thr Ser Trp Val Ala Met Val
50 55 60
Pro Ser Pro Ser Ser Gln Asn Ala Pro Leu Phe Pro Gln Cys Val Lys
65 70 75 80
Trp Leu Leu Asp Asn Gln His Glu Asp Gly Ser Trp Gly Leu Asp Asn
85 90 95
His Asp His Gln Ser Leu Lys Lys Asp Val Leu Ser Ser Thr Leu Ala
100 105 110
Ser Ile Leu Ala Leu Lys Lys Trp Gly Ile Gly Glu Arg Gln Ile Asn
115 120 125
Lys Gly Leu Gln Phe Ile Glu Leu Asn Ser Ala Leu Val Thr Asp Glu
130 135 140
Thr Ile Gln Lys Pro Thr Gly Phe Asp Ile Ile Phe Pro Gly Met Ile
145 150 155 160
Lys Tyr Ala Arg Asp Leu Asn Leu Thr Ile Pro Leu Gly Ser Glu Val
165 170 175
Val Asp Asp Met Ile Arg Lys Arg Asp Leu Asp Leu Lys Cys Asp Ser
180 185 190
Glu Lys Phe Ser Lys Gly Arg Glu Ala Tyr Leu Ala Tyr Val Leu Glu
195 200 205
Gly Thr Arg Asn Leu Lys Asp Trp Asp Leu Ile Val Lys Tyr Gln Arg
210 215 220
Lys Asn Gly Ser Leu Phe Asp Ser Pro Ala Thr Thr Ala Ala Ala Phe
225 230 235 240
Thr Gln Phe Gly Asn Asp Gly Cys Leu Arg Tyr Leu Cys Ser Leu Leu
245 250 255
Gln Lys Phe Glu Ala Ala Val Pro Ser Val Tyr Pro Phe Asp Gln Tyr
260 265 270
Ala Arg Leu Ser Ile Ile Val Thr Leu Glu Ser Leu Gly Ile Asp Arg
275 280 285
Asp Phe Lys Thr Glu Ile Lys Ser Ile Leu Asp Glu Thr Tyr Arg Tyr
290 295 300
Trp Leu Arg Gly Asp Glu Glu Ile Cys Leu Asp Leu Ala Thr Cys Ala
305 310 315 320
Leu Ala Phe Arg Leu Leu Leu Ala His Gly Tyr Asp Val Ser Tyr Asp
325 330 335
Pro Leu Lys Pro Phe Ala Glu Glu Ser Gly Phe Ser Asp Thr Leu Glu
340 345 350
Gly Tyr Val Lys Asn Thr Phe Ser Val Leu Glu Leu Phe Lys Ala Ala
355 360 365
Gln Ser Tyr Pro His Glu Ser Ala Leu Lys Lys Gln Cys Cys Trp Thr
370 375 380
Lys Gln Tyr Leu Glu Met Glu Leu Ser Ser Trp Val Lys Thr Ser Val
385 390 395 400
Arg Asp Lys Tyr Leu Lys Lys Glu Val Glu Asp Ala Leu Ala Phe Pro
405 410 415
Ser Tyr Ala Ser Leu Glu Arg Ser Asp His Arg Arg Lys Ile Leu Asn
420 425 430
Gly Ser Ala Val Glu Asn Thr Arg Val Thr Lys Thr Ser Tyr Arg Leu
435 440 445
His Asn Ile Cys Thr Ser Asp Ile Leu Lys Leu Ala Val Asp Asp Phe
450 455 460
Asn Phe Cys Gln Ser Ile His Arg Glu Glu Met Glu Arg Leu Asp Arg
465 470 475 480
Trp Ile Val Glu Asn Arg Leu Gln Glu Leu Lys Phe Ala Arg Gln Lys
485 490 495
Leu Ala Tyr Cys Tyr Phe Ser Gly Ala Ala Thr Leu Phe Ser Pro Glu
500 505 510
Leu Ser Asp Ala Arg Ile Ser Trp Ala Lys Gly Gly Val Leu Thr Thr
515 520 525
Val Val Asp Asp Phe Phe Asp Val Gly Gly Ser Lys Glu Glu Leu Glu
530 535 540
Asn Leu Ile His Leu Val Glu Lys Trp Asp Leu Asn Gly Val Pro Glu
545 550 555 560
Tyr Ser Ser Glu His Val Glu Ile Ile Phe Ser Val Leu Arg Asp Thr
565 570 575
Ile Leu Glu Thr Gly Asp Lys Ala Phe Thr Tyr Gln Gly Arg Asn Val
580 585 590
Thr His His Ile Val Lys Ile Trp Leu Asp Leu Leu Lys Ser Met Leu
595 600 605
Arg Glu Ala Glu Trp Ser Ser Asp Lys Ser Thr Pro Ser Leu Glu Asp
610 615 620
Tyr Met Glu Asn Ala Tyr Ile Ser Phe Ala Leu Gly Pro Ile Val Leu
625 630 635 640
Pro Ala Thr Tyr Leu Ile Gly Pro Pro Leu Pro Glu Lys Thr Val Asp
645 650 655
Ser His Gln Tyr Asn Gln Leu Tyr Lys Leu Val Ser Thr Met Gly Arg
660 665 670
Leu Leu Asn Asp Ile Gln Gly Phe Lys Arg Glu Ser Ala Glu Gly Lys
675 680 685
Leu Asn Ala Val Ser Leu His Met Lys His Glu Arg Asp Asn Arg Ser
690 695 700
Lys Glu Val Ile Ile Glu Ser Met Lys Gly Leu Ala Glu Arg Lys Arg
705 710 715 720
Glu Glu Leu His Lys Leu Val Leu Glu Glu Lys Gly Ser Val Val Pro
725 730 735
Arg Glu Cys Lys Glu Ala Phe Leu Lys Met Ser Lys Val Leu Asn Leu
740 745 750
Phe Tyr Arg Lys Asp Asp Gly Phe Thr Ser Asn Asp Leu Met Ser Leu
755 760 765
Val Lys Ser Val Ile Tyr Glu Pro Val Ser Leu Gln Lys Glu Ser Leu
770 775 780
Thr
785
<210> 7
<211> 513
<212> PRT
<213> Arabidopsis thaliana
<400> 7
Met Asp Ala Val Thr Gly Leu Leu Thr Val Pro Ala Thr Ala Ile Thr
1 5 10 15
Ile Gly Gly Thr Ala Val Ala Leu Ala Val Ala Leu Ile Phe Trp Tyr
20 25 30
Leu Lys Ser Tyr Thr Ser Ala Arg Arg Ser Gln Ser Asn His Leu Pro
35 40 45
Arg Val Pro Glu Val Pro Gly Val Pro Leu Leu Gly Asn Leu Leu Gln
50 55 60
Leu Lys Glu Lys Lys Pro Tyr Met Thr Phe Thr Arg Trp Ala Ala Thr
65 70 75 80
Tyr Gly Pro Ile Tyr Ser Ile Lys Thr Gly Ala Thr Ser Met Val Val
85 90 95
Val Ser Ser Asn Glu Ile Ala Lys Glu Ala Leu Val Thr Arg Phe Gln
100 105 110
Ser Ile Ser Thr Arg Asn Leu Ser Lys Ala Leu Lys Val Leu Thr Ala
115 120 125
Asp Lys Thr Met Val Ala Met Ser Asp Tyr Asp Asp Tyr His Lys Thr
130 135 140
Val Lys Arg His Ile Leu Thr Ala Val Leu Gly Pro Asn Ala Gln Lys
145 150 155 160
Lys His Arg Ile His Arg Asp Ile Met Met Asp Asn Ile Ser Thr Gln
165 170 175
Leu His Glu Phe Val Lys Asn Asn Pro Glu Gln Glu Glu Val Asp Leu
180 185 190
Arg Lys Ile Phe Gln Ser Glu Leu Phe Gly Leu Ala Met Arg Gln Ala
195 200 205
Leu Gly Lys Asp Val Glu Ser Leu Tyr Val Glu Asp Leu Lys Ile Thr
210 215 220
Met Asn Arg Asp Glu Ile Phe Gln Val Leu Val Val Asp Pro Met Met
225 230 235 240
Gly Ala Ile Asp Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Lys Trp
245 250 255
Val Pro Asn Lys Lys Phe Glu Asn Thr Ile Gln Gln Met Tyr Ile Arg
260 265 270
Arg Glu Ala Val Met Lys Ser Leu Ile Lys Glu His Lys Lys Arg Ile
275 280 285
Ala Ser Gly Glu Lys Leu Asn Ser Tyr Ile Asp Tyr Leu Leu Ser Glu
290 295 300
Ala Gln Thr Leu Thr Asp Gln Gln Leu Leu Met Ser Leu Trp Glu Pro
305 310 315 320
Ile Ile Glu Ser Ser Asp Thr Thr Met Val Thr Thr Glu Trp Ala Met
325 330 335
Tyr Glu Leu Ala Lys Asn Pro Lys Leu Gln Asp Arg Leu Tyr Arg Asp
340 345 350
Ile Lys Ser Val Cys Gly Ser Glu Lys Ile Thr Glu Glu His Leu Ser
355 360 365
Gln Leu Pro Tyr Ile Thr Ala Ile Phe His Glu Thr Leu Arg Arg His
370 375 380
Ser Pro Val Pro Ile Ile Pro Leu Arg His Val His Glu Asp Thr Val
385 390 395 400
Leu Gly Gly Tyr His Val Pro Ala Gly Thr Glu Leu Ala Val Asn Ile
405 410 415
Tyr Gly Cys Asn Met Asp Lys Asn Val Trp Glu Asn Pro Glu Glu Trp
420 425 430
Asn Pro Glu Arg Phe Met Lys Glu Asn Glu Thr Ile Asp Phe Gln Lys
435 440 445
Thr Met Ala Phe Gly Gly Gly Lys Arg Val Cys Ala Gly Ser Leu Gln
450 455 460
Ala Leu Leu Thr Ala Ser Ile Gly Ile Gly Arg Met Val Gln Glu Phe
465 470 475 480
Glu Trp Lys Leu Lys Asp Met Thr Gln Glu Glu Val Asn Thr Ile Gly
485 490 495
Leu Thr Thr Gln Met Leu Arg Pro Leu Arg Ala Ile Ile Lys Pro Arg
500 505 510
Ile
<210> 8
<211> 509
<212> PRT
<213> Arabidopsis thaliana
<400> 8
Met Ala Phe Phe Ser Met Ile Ser Ile Leu Leu Gly Phe Val Ile Ser
1 5 10 15
Ser Phe Ile Phe Ile Phe Phe Phe Lys Lys Leu Leu Ser Phe Ser Arg
20 25 30
Lys Asn Met Ser Glu Val Ser Thr Leu Pro Ser Val Pro Val Val Pro
35 40 45
Gly Phe Pro Val Ile Gly Asn Leu Leu Gln Leu Lys Glu Lys Lys Pro
50 55 60
His Lys Thr Phe Thr Arg Trp Ser Glu Ile Tyr Gly Pro Ile Tyr Ser
65 70 75 80
Ile Lys Met Gly Ser Ser Ser Leu Ile Val Leu Asn Ser Thr Glu Thr
85 90 95
Ala Lys Glu Ala Met Val Thr Arg Phe Ser Ser Ile Ser Thr Arg Lys
100 105 110
Leu Ser Asn Ala Leu Thr Val Leu Thr Cys Asp Lys Ser Met Val Ala
115 120 125
Thr Ser Asp Tyr Asp Asp Phe His Lys Leu Val Lys Arg Cys Leu Leu
130 135 140
Asn Gly Leu Leu Gly Ala Asn Ala Gln Lys Arg Lys Arg His Tyr Arg
145 150 155 160
Asp Ala Leu Ile Glu Asn Val Ser Ser Lys Leu His Ala His Ala Arg
165 170 175
Asp His Pro Gln Glu Pro Val Asn Phe Arg Ala Ile Phe Glu His Glu
180 185 190
Leu Phe Gly Val Ala Leu Lys Gln Ala Phe Gly Lys Asp Val Glu Ser
195 200 205
Ile Tyr Val Lys Glu Leu Gly Val Thr Leu Ser Lys Asp Glu Ile Phe
210 215 220
Lys Val Leu Val His Asp Met Met Glu Gly Ala Ile Asp Val Asp Trp
225 230 235 240
Arg Asp Phe Phe Pro Tyr Leu Lys Trp Ile Pro Asn Lys Ser Phe Glu
245 250 255
Ala Arg Ile Gln Gln Lys His Lys Arg Arg Leu Ala Val Met Asn Ala
260 265 270
Leu Ile Gln Asp Arg Leu Lys Gln Asn Gly Ser Glu Ser Asp Asp Asp
275 280 285
Cys Tyr Leu Asn Phe Leu Met Ser Glu Ala Lys Thr Leu Thr Lys Glu
290 295 300
Gln Ile Ala Ile Leu Val Trp Glu Thr Ile Ile Glu Thr Ala Asp Thr
305 310 315 320
Thr Leu Val Thr Thr Glu Trp Ala Ile Tyr Glu Leu Ala Lys His Pro
325 330 335
Ser Val Gln Asp Arg Leu Cys Lys Glu Ile Gln Asn Val Cys Gly Gly
340 345 350
Glu Lys Phe Lys Glu Glu Gln Leu Ser Gln Val Pro Tyr Leu Asn Gly
355 360 365
Val Phe His Glu Thr Leu Arg Lys Tyr Ser Pro Ala Pro Leu Val Pro
370 375 380
Ile Arg Tyr Ala His Glu Asp Thr Gln Ile Gly Gly Tyr His Val Pro
385 390 395 400
Ala Gly Ser Glu Ile Ala Ile Asn Ile Tyr Gly Cys Asn Met Asp Lys
405 410 415
Lys Arg Trp Glu Arg Pro Glu Asp Trp Trp Pro Glu Arg Phe Leu Asp
420 425 430
Asp Gly Lys Tyr Glu Thr Ser Asp Leu His Lys Thr Met Ala Phe Gly
435 440 445
Ala Gly Lys Arg Val Cys Ala Gly Ala Leu Gln Ala Ser Leu Met Ala
450 455 460
Gly Ile Ala Ile Gly Arg Leu Val Gln Glu Phe Glu Trp Lys Leu Arg
465 470 475 480
Asp Gly Glu Glu Glu Asn Val Asp Thr Tyr Gly Leu Thr Ser Gln Lys
485 490 495
Leu Tyr Pro Leu Met Ala Ile Ile Asn Pro Arg Arg Ser
500 505
<210> 9
<211> 525
<212> PRT
<213> Fusarium fujikuroi
<400> 9
Met Ser Lys Ser Asn Ser Met Asn Ser Thr Ser His Glu Thr Leu Phe
1 5 10 15
Gln Gln Leu Val Leu Gly Leu Asp Arg Met Pro Leu Met Asp Val His
20 25 30
Trp Leu Ile Tyr Val Ala Phe Gly Ala Trp Leu Cys Ser Tyr Val Ile
35 40 45
His Val Leu Ser Ser Ser Ser Thr Val Lys Val Pro Val Val Gly Tyr
50 55 60
Arg Ser Val Phe Glu Pro Thr Trp Leu Leu Arg Leu Arg Phe Val Trp
65 70 75 80
Glu Gly Gly Ser Ile Ile Gly Gln Gly Tyr Asn Lys Phe Lys Asp Ser
85 90 95
Ile Phe Gln Val Arg Lys Leu Gly Thr Asp Ile Val Ile Ile Pro Pro
100 105 110
Asn Tyr Ile Asp Glu Val Arg Lys Leu Ser Gln Asp Lys Thr Arg Ser
115 120 125
Val Glu Pro Phe Ile Asn Asp Phe Ala Gly Gln Tyr Thr Arg Gly Met
130 135 140
Val Phe Leu Gln Ser Asp Leu Gln Asn Arg Val Ile Gln Gln Arg Leu
145 150 155 160
Thr Pro Lys Leu Val Ser Leu Thr Lys Val Met Lys Glu Glu Leu Asp
165 170 175
Tyr Ala Leu Thr Lys Glu Met Pro Asp Met Lys Asn Asp Glu Trp Val
180 185 190
Glu Val Asp Ile Ser Ser Ile Met Val Arg Leu Ile Ser Arg Ile Ser
195 200 205
Ala Arg Val Phe Leu Gly Pro Glu His Cys Arg Asn Gln Glu Trp Leu
210 215 220
Thr Thr Thr Ala Glu Tyr Ser Glu Ser Leu Phe Ile Thr Gly Phe Ile
225 230 235 240
Leu Arg Val Val Pro His Ile Leu Arg Pro Phe Ile Ala Pro Leu Leu
245 250 255
Pro Ser Tyr Arg Thr Leu Leu Arg Asn Val Ser Ser Gly Arg Arg Val
260 265 270
Ile Gly Asp Ile Ile Arg Ser Gln Gln Gly Asp Gly Asn Glu Asp Ile
275 280 285
Leu Ser Trp Met Arg Asp Ala Ala Thr Gly Glu Glu Lys Gln Ile Asp
290 295 300
Asn Ile Ala Gln Arg Met Leu Ile Leu Ser Leu Ala Ser Ile His Thr
305 310 315 320
Thr Ala Met Thr Met Thr His Ala Met Tyr Asp Leu Cys Ala Cys Pro
325 330 335
Glu Tyr Ile Glu Pro Leu Arg Asp Glu Val Lys Ser Val Val Gly Ala
340 345 350
Ser Gly Trp Asp Lys Thr Ala Leu Asn Arg Phe His Lys Leu Asp Ser
355 360 365
Phe Leu Lys Glu Ser Gln Arg Phe Asn Pro Val Phe Leu Leu Thr Phe
370 375 380
Asn Arg Ile Tyr His Gln Ser Met Thr Leu Ser Asp Gly Thr Asn Ile
385 390 395 400
Pro Ser Gly Thr Arg Ile Ala Val Pro Ser His Ala Met Leu Gln Asp
405 410 415
Ser Ala His Val Pro Gly Pro Thr Pro Pro Thr Glu Phe Asp Gly Phe
420 425 430
Arg Tyr Ser Lys Ile Arg Ser Asp Ser Asn Tyr Ala Gln Lys Tyr Leu
435 440 445
Phe Ser Met Thr Asp Ser Ser Asn Met Ala Phe Gly Tyr Gly Lys Tyr
450 455 460
Ala Cys Pro Gly Arg Phe Tyr Ala Ser Asn Glu Met Lys Leu Thr Leu
465 470 475 480
Ala Ile Leu Leu Leu Gln Phe Glu Phe Lys Leu Pro Asp Gly Lys Gly
485 490 495
Arg Pro Arg Asn Ile Thr Ile Asp Ser Asp Met Ile Pro Asp Pro Arg
500 505 510
Ala Arg Leu Cys Val Arg Lys Arg Ser Leu Arg Asp Glu
515 520 525
<210> 10
<211> 499
<212> PRT
<213> Trametes versicolor
<400> 10
Met Glu Asp Pro Thr Val Leu Tyr Ala Cys Leu Ala Ile Ala Val Ala
1 5 10 15
Thr Phe Val Val Arg Trp Tyr Arg Asp Pro Leu Arg Ser Ile Pro Thr
20 25 30
Val Gly Gly Ser Asp Leu Pro Ile Leu Ser Tyr Ile Gly Ala Leu Arg
35 40 45
Trp Thr Arg Arg Gly Arg Glu Ile Leu Gln Glu Gly Tyr Asp Gly Tyr
50 55 60
Arg Gly Ser Thr Phe Lys Ile Ala Met Leu Asp Arg Trp Ile Val Ile
65 70 75 80
Ala Asn Gly Pro Lys Leu Ala Asp Glu Val Arg Arg Arg Pro Asp Glu
85 90 95
Glu Leu Asn Phe Met Asp Gly Leu Gly Ala Phe Val Gln Thr Lys Tyr
100 105 110
Thr Leu Gly Glu Ala Ile His Asn Asp Pro Tyr His Val Asp Ile Ile
115 120 125
Arg Glu Lys Leu Thr Arg Gly Leu Pro Ala Val Leu Pro Asp Val Ile
130 135 140
Glu Glu Leu Thr Leu Ala Val Arg Gln Tyr Ile Pro Thr Glu Gly Asp
145 150 155 160
Glu Trp Val Ser Val Asn Cys Ser Lys Ala Ala Arg Asp Ile Val Ala
165 170 175
Arg Ala Ser Asn Arg Val Phe Val Gly Leu Pro Ala Cys Arg Asn Gln
180 185 190
Gly Tyr Leu Asp Leu Ala Ile Asp Phe Thr Leu Ser Val Val Lys Asp
195 200 205
Arg Ala Ile Ile Asn Met Phe Pro Glu Leu Leu Lys Pro Ile Val Gly
210 215 220
Arg Val Val Gly Asn Ala Thr Arg Asn Val Arg Arg Ala Val Pro Phe
225 230 235 240
Val Ala Pro Leu Val Glu Glu Arg Arg Arg Leu Met Glu Glu Tyr Gly
245 250 255
Glu Asp Trp Ser Glu Lys Pro Asn Asp Met Leu Gln Trp Ile Met Asp
260 265 270
Glu Ala Ala Ser Arg Asp Ser Ser Val Lys Ala Ile Ala Glu Arg Leu
275 280 285
Leu Met Val Asn Phe Ala Ala Ile His Thr Ser Ser Asn Thr Ile Thr
290 295 300
His Ala Leu Tyr His Leu Ala Glu Met Pro Glu Thr Leu Gln Pro Leu
305 310 315 320
Arg Glu Glu Ile Glu Pro Leu Val Lys Glu Glu Gly Trp Thr Lys Ala
325 330 335
Ala Met Gly Lys Met Trp Trp Leu Asp Ser Phe Leu Arg Glu Ser Gln
340 345 350
Arg Tyr Asn Gly Ile Asn Ile Val Ser Leu Thr Arg Met Ala Asp Lys
355 360 365
Asp Ile Thr Leu Ser Asp Gly Thr Phe Leu Pro Lys Gly Thr Leu Val
370 375 380
Ala Val Pro Ala Tyr Ser Thr His Arg Asp Asp Ala Val Tyr Ala Asp
385 390 395 400
Ala Leu Val Phe Asp Pro Phe Arg Phe Ser Arg Met Arg Ala Arg Glu
405 410 415
Gly Glu Gly Thr Lys His Gln Phe Val Asn Thr Ser Val Glu Tyr Val
420 425 430
Pro Phe Gly His Gly Lys His Ala Cys Pro Gly Arg Phe Phe Ala Ala
435 440 445
Asn Glu Leu Lys Ala Met Leu Ala Tyr Ile Val Leu Asn Tyr Asp Val
450 455 460
Lys Leu Pro Gly Asp Gly Lys Arg Pro Leu Asn Met Tyr Trp Gly Pro
465 470 475 480
Thr Val Leu Pro Ala Pro Ala Gly Gln Val Leu Phe Arg Lys Arg Gln
485 490 495
Val Ser Leu
<210> 11
<211> 1678
<212> DNA
<213> Stevia rebaudiana
<400> 11
aaacaaagaa tgattcaagt tctaacaccg atccttctct tcctcatttt cttcgttttc 60
tggaaggttt acaagcacca gaaaaccaaa atcaatcttc caccgggaag cttcggatgg 120
ccatttctgg gcgaaactct ggcactccta cgtgcaggtt gggactcaga gccggagaga 180
tttgttcgtg aacggatcaa gaaacacgga agtcctctag tgtttaagac gtcgttgttt 240
ggcgaccgtt ttgcggtgtt gtgtggacct gccggaaaca agttcctgtt ctgcaacgag 300
aacaagctgg tggcgtcgtg gtggccggtt ccggtgagga agcttttcgg caagtctctg 360
ctcacgattc gtggtgatga agctaagtgg atgaggaaga tgttgttatc gtatctcggt 420
cctgatgctt tcgcaactca ttatgccgtc accatggacg tcgtcacccg tcggcatatc 480
gacgttcatt ggcgagggaa ggaagaggtg aacgtattcc aaaccgttaa gttatatgcc 540
tttgagcttg catgtcgttt attcatgaac ctagacgacc caaaccacat tgcaaaactc 600
ggttccttgt tcaacatttt cttgaaaggc atcattgagc ttccaatcga cgtcccaggg 660
acacgatttt atagctccaa aaaagcagca gcagctatca ggattgaact aaaaaaattg 720
attaaagcaa gaaaactgga actgaaagaa gggaaggcat catcttcaca agacctctta 780
tcacatttgc ttacatctcc agatgaaaat ggtatgtttc taaccgaaga agagattgta 840
gacaacatct tgttactact ctttgcgggt catgatacct cggctctttc aatcactttg 900
ctcatgaaga ctcttggcga acattctgat gtttatgaca aggtgttaaa agagcaacta 960
gagatatcga agacgaaaga agcatgggag tccctgaaat gggaggacat acaaaagatg 1020
aaatactcct ggagtgttat atgtgaagtc atgagactaa atccacctgt tataggaacc 1080
tatagagagg cccttgtgga tattgattat gcgggttata ccatccccaa aggatggaag 1140
ctgcactgga gtgctgtatc gacacaaagg gacgaggcta actttgaaga cgtaacacgt 1200
tttgacccat cacggtttga aggcgcagga ccgactccat tcacctttgt tccgtttgga 1260
ggggggccta gaatgtgttt agggaaagaa tttgctcgat tggaagtact tgcgtttctt 1320
cacaatattg tcaccaattt caaatgggac ctgttgatac ctgatgagaa aatagaatat 1380
gatcccatgg ctaccccagc aaaggggctt ccaattcgtc ttcatcccca tcaagtttga 1440
ttacttcaag catgaatcag tgatgtgaag gtaaaccata atggatctta ttggtagtta 1500
cagattatgt gtttttatgg catgaagaag ttatgataaa taaaattgtg ttattctaca 1560
acttatgtaa tttgtgcctg taagtaactg aatctattaa tgttttatgt gacatgaaac 1620
ataaatgtat aattagtaaa ttttctgctc aaaaaaaaaa aaaaaaaaaa aaaaaaaa 1678
<210> 12
<211> 476
<212> PRT
<213> Stevia rebaudiana
<400> 12
Met Ile Gln Val Leu Thr Pro Ile Leu Leu Phe Leu Ile Phe Phe Val
1 5 10 15
Phe Trp Lys Val Tyr Lys His Gln Lys Thr Lys Ile Asn Leu Pro Pro
20 25 30
Gly Ser Phe Gly Trp Pro Phe Leu Gly Glu Thr Leu Ala Leu Leu Arg
35 40 45
Ala Gly Trp Asp Ser Glu Pro Glu Arg Phe Val Arg Glu Arg Ile Lys
50 55 60
Lys His Gly Ser Pro Leu Val Phe Lys Thr Ser Leu Phe Gly Asp Arg
65 70 75 80
Phe Ala Val Leu Cys Gly Pro Ala Gly Asn Lys Phe Leu Phe Cys Asn
85 90 95
Glu Asn Lys Leu Val Ala Ser Trp Trp Pro Val Pro Val Arg Lys Leu
100 105 110
Phe Gly Lys Ser Leu Leu Thr Ile Arg Gly Asp Glu Ala Lys Trp Met
115 120 125
Arg Lys Met Leu Leu Ser Tyr Leu Gly Pro Asp Ala Phe Ala Thr His
130 135 140
Tyr Ala Val Thr Met Asp Val Val Thr Arg Arg His Ile Asp Val His
145 150 155 160
Trp Arg Gly Lys Glu Glu Val Asn Val Phe Gln Thr Val Lys Leu Tyr
165 170 175
Ala Phe Glu Leu Ala Cys Arg Leu Phe Met Asn Leu Asp Asp Pro Asn
180 185 190
His Ile Ala Lys Leu Gly Ser Leu Phe Asn Ile Phe Leu Lys Gly Ile
195 200 205
Ile Glu Leu Pro Ile Asp Val Pro Gly Thr Arg Phe Tyr Ser Ser Lys
210 215 220
Lys Ala Ala Ala Ala Ile Arg Ile Glu Leu Lys Lys Leu Ile Lys Ala
225 230 235 240
Arg Lys Leu Glu Leu Lys Glu Gly Lys Ala Ser Ser Ser Gln Asp Leu
245 250 255
Leu Ser His Leu Leu Thr Ser Pro Asp Glu Asn Gly Met Phe Leu Thr
260 265 270
Glu Glu Glu Ile Val Asp Asn Ile Leu Leu Leu Leu Phe Ala Gly His
275 280 285
Asp Thr Ser Ala Leu Ser Ile Thr Leu Leu Met Lys Thr Leu Gly Glu
290 295 300
His Ser Asp Val Tyr Asp Lys Val Leu Lys Glu Gln Leu Glu Ile Ser
305 310 315 320
Lys Thr Lys Glu Ala Trp Glu Ser Leu Lys Trp Glu Asp Ile Gln Lys
325 330 335
Met Lys Tyr Ser Trp Ser Val Ile Cys Glu Val Met Arg Leu Asn Pro
340 345 350
Pro Val Ile Gly Thr Tyr Arg Glu Ala Leu Val Asp Ile Asp Tyr Ala
355 360 365
Gly Tyr Thr Ile Pro Lys Gly Trp Lys Leu His Trp Ser Ala Val Ser
370 375 380
Thr Gln Arg Asp Glu Ala Asn Phe Glu Asp Val Thr Arg Phe Asp Pro
385 390 395 400
Ser Arg Phe Glu Gly Ala Gly Pro Thr Pro Phe Thr Phe Val Pro Phe
405 410 415
Gly Gly Gly Pro Arg Met Cys Leu Gly Lys Glu Phe Ala Arg Leu Glu
420 425 430
Val Leu Ala Phe Leu His Asn Ile Val Thr Asn Phe Lys Trp Asp Leu
435 440 445
Leu Ile Pro Asp Glu Lys Ile Glu Tyr Asp Pro Met Ala Thr Pro Ala
450 455 460
Lys Gly Leu Pro Ile Arg Leu His Pro His Gln Val
465 470 475
<210> 13
<211> 522
<212> PRT
<213> Stevia rebaudiana
<400> 13
Met Gly Leu Phe Pro Leu Glu Asp Ser Tyr Ala Leu Val Phe Glu Gly
1 5 10 15
Leu Ala Ile Thr Leu Ala Leu Tyr Tyr Leu Leu Ser Phe Ile Tyr Lys
20 25 30
Thr Ser Lys Lys Thr Cys Thr Pro Pro Lys Ala Ser Gly Glu His Pro
35 40 45
Ile Thr Gly His Leu Asn Leu Leu Ser Gly Ser Ser Gly Leu Pro His
50 55 60
Leu Ala Leu Ala Ser Leu Ala Asp Arg Cys Gly Pro Ile Phe Thr Ile
65 70 75 80
Arg Leu Gly Ile Arg Arg Val Leu Val Val Ser Asn Trp Glu Ile Ala
85 90 95
Lys Glu Ile Phe Thr Thr His Asp Leu Ile Val Ser Asn Arg Pro Lys
100 105 110
Tyr Leu Ala Ala Lys Ile Leu Gly Phe Asn Tyr Val Ser Phe Ser Phe
115 120 125
Ala Pro Tyr Gly Pro Tyr Trp Val Gly Ile Arg Lys Ile Ile Ala Thr
130 135 140
Lys Leu Met Ser Ser Ser Arg Leu Gln Lys Leu Gln Phe Val Arg Val
145 150 155 160
Phe Glu Leu Glu Asn Ser Met Lys Ser Ile Arg Glu Ser Trp Lys Glu
165 170 175
Lys Lys Asp Glu Glu Gly Lys Val Leu Val Glu Met Lys Lys Trp Phe
180 185 190
Trp Glu Leu Asn Met Asn Ile Val Leu Arg Thr Val Ala Gly Lys Gln
195 200 205
Tyr Thr Gly Thr Val Asp Asp Ala Asp Ala Lys Arg Ile Ser Glu Leu
210 215 220
Phe Arg Glu Trp Phe His Tyr Thr Gly Arg Phe Val Val Gly Asp Ala
225 230 235 240
Phe Pro Phe Leu Gly Trp Leu Asp Leu Gly Gly Tyr Lys Lys Thr Met
245 250 255
Glu Leu Val Ala Ser Arg Leu Asp Ser Met Val Ser Lys Trp Leu Asp
260 265 270
Glu His Arg Lys Lys Gln Ala Asn Asp Asp Lys Lys Glu Asp Met Asp
275 280 285
Phe Met Asp Ile Met Ile Ser Met Thr Glu Ala Asn Ser Pro Leu Glu
290 295 300
Gly Tyr Gly Thr Asp Thr Ile Ile Lys Thr Thr Cys Met Thr Leu Ile
305 310 315 320
Val Ser Gly Val Asp Thr Thr Ser Ile Val Leu Thr Trp Ala Leu Ser
325 330 335
Leu Leu Leu Asn Asn Arg Asp Thr Leu Lys Lys Ala Gln Glu Glu Leu
340 345 350
Asp Met Cys Val Gly Lys Gly Arg Gln Val Asn Glu Ser Asp Leu Val
355 360 365
Asn Leu Ile Tyr Leu Glu Ala Val Leu Lys Glu Ala Leu Arg Leu Tyr
370 375 380
Pro Ala Ala Phe Leu Gly Gly Pro Arg Ala Phe Leu Glu Asp Cys Thr
385 390 395 400
Val Ala Gly Tyr Arg Ile Pro Lys Gly Thr Cys Leu Leu Ile Asn Met
405 410 415
Trp Lys Leu His Arg Asp Pro Asn Ile Trp Ser Asp Pro Cys Glu Phe
420 425 430
Lys Pro Glu Arg Phe Leu Thr Pro Asn Gln Lys Asp Val Asp Val Ile
435 440 445
Gly Met Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Tyr Cys
450 455 460
Pro Gly Thr Arg Leu Ala Leu Gln Met Leu His Ile Val Leu Ala Thr
465 470 475 480
Leu Leu Gln Asn Phe Glu Met Ser Thr Pro Asn Asp Ala Pro Val Asp
485 490 495
Met Thr Ala Ser Val Gly Met Thr Asn Ala Lys Ala Ser Pro Leu Glu
500 505 510
Val Leu Leu Ser Pro Arg Val Lys Trp Ser
515 520
<210> 14
<211> 476
<212> PRT
<213> Stevia rebaudiana
<400> 14
Met Ile Gln Val Leu Thr Pro Ile Leu Leu Phe Leu Ile Phe Phe Val
1 5 10 15
Phe Trp Lys Val Tyr Lys His Gln Lys Thr Lys Ile Asn Leu Pro Pro
20 25 30
Gly Ser Phe Gly Trp Pro Phe Leu Gly Glu Thr Leu Ala Leu Leu Arg
35 40 45
Ala Gly Trp Asp Ser Glu Pro Glu Arg Phe Val Arg Glu Arg Ile Lys
50 55 60
Lys His Gly Ser Pro Leu Val Phe Lys Thr Ser Leu Phe Gly Asp Arg
65 70 75 80
Phe Ala Val Leu Cys Gly Pro Ala Gly Asn Lys Phe Leu Phe Cys Asn
85 90 95
Glu Asn Lys Leu Val Ala Ser Trp Trp Pro Val Pro Val Arg Lys Leu
100 105 110
Phe Gly Lys Ser Leu Leu Thr Ile Arg Gly Asp Glu Ala Lys Trp Met
115 120 125
Arg Lys Met Leu Leu Ser Tyr Leu Gly Pro Asp Ala Phe Ala Thr His
130 135 140
Tyr Ala Val Thr Met Asp Val Val Thr Arg Arg His Ile Asp Val His
145 150 155 160
Trp Arg Gly Lys Glu Glu Val Asn Val Phe Gln Thr Val Lys Leu Tyr
165 170 175
Ala Phe Glu Leu Ala Cys Arg Leu Phe Met Asn Leu Asp Asp Pro Asn
180 185 190
His Ile Ala Lys Leu Gly Ser Leu Phe Asn Ile Phe Leu Lys Gly Ile
195 200 205
Ile Glu Leu Pro Ile Asp Val Pro Gly Thr Arg Phe Tyr Ser Ser Lys
210 215 220
Lys Ala Ala Ala Ala Ile Arg Ile Glu Leu Lys Lys Leu Ile Lys Ala
225 230 235 240
Arg Lys Leu Glu Leu Lys Glu Gly Lys Ala Ser Ser Ser Gln Asp Leu
245 250 255
Leu Ser His Leu Leu Thr Ser Pro Asp Glu Asn Gly Met Phe Leu Thr
260 265 270
Glu Glu Glu Ile Val Asp Asn Ile Leu Leu Leu Leu Phe Ala Gly His
275 280 285
Asp Thr Ser Ala Leu Ser Ile Thr Leu Leu Met Lys Thr Leu Gly Glu
290 295 300
His Ser Asp Val Tyr Asp Lys Val Leu Lys Glu Gln Leu Glu Ile Ser
305 310 315 320
Lys Thr Lys Glu Ala Trp Glu Ser Leu Lys Trp Glu Asp Ile Gln Lys
325 330 335
Met Lys Tyr Ser Trp Ser Val Ile Cys Glu Val Met Arg Leu Asn Pro
340 345 350
Pro Val Ile Gly Thr Tyr Arg Glu Ala Leu Val Asp Ile Asp Tyr Ala
355 360 365
Gly Tyr Thr Ile Pro Lys Gly Trp Lys Leu His Trp Ser Ala Val Ser
370 375 380
Thr Gln Arg Asp Glu Ala Asn Phe Glu Asp Val Thr Arg Phe Asp Pro
385 390 395 400
Ser Arg Phe Glu Gly Ala Gly Pro Thr Pro Phe Thr Phe Val Pro Phe
405 410 415
Gly Gly Gly Pro Arg Met Cys Leu Gly Lys Glu Phe Ala Arg Leu Glu
420 425 430
Val Leu Ala Phe Leu His Asn Ile Val Thr Asn Phe Lys Trp Asp Leu
435 440 445
Leu Ile Pro Asp Glu Lys Ile Glu Tyr Asp Pro Met Ala Thr Pro Ala
450 455 460
Lys Gly Leu Pro Ile Arg Leu His Pro His Gln Val
465 470 475
<210> 15
<211> 525
<212> PRT
<213> Arabidopsis thaliana
<400> 15
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 16
<211> 526
<212> PRT
<213> Vitis vinifera
<400> 16
Met Tyr Phe Leu Leu Gln Tyr Leu Asn Ile Thr Thr Val Gly Val Phe
1 5 10 15
Ala Thr Leu Phe Leu Ser Tyr Cys Leu Leu Leu Trp Arg Ser Arg Ala
20 25 30
Gly Asn Lys Lys Ile Ala Pro Glu Ala Ala Ala Ala Trp Pro Ile Ile
35 40 45
Gly His Leu His Leu Leu Ala Gly Gly Ser His Gln Leu Pro His Ile
50 55 60
Thr Leu Gly Asn Met Ala Asp Lys Tyr Gly Pro Val Phe Thr Ile Arg
65 70 75 80
Ile Gly Leu His Arg Ala Val Val Val Ser Ser Trp Glu Met Ala Lys
85 90 95
Glu Cys Ser Thr Ala Asn Asp Gln Val Ser Ser Ser Arg Pro Glu Leu
100 105 110
Leu Ala Ser Lys Leu Leu Gly Tyr Asn Tyr Ala Met Phe Gly Phe Ser
115 120 125
Pro Tyr Gly Ser Tyr Trp Arg Glu Met Arg Lys Ile Ile Ser Leu Glu
130 135 140
Leu Leu Ser Asn Ser Arg Leu Glu Leu Leu Lys Asp Val Arg Ala Ser
145 150 155 160
Glu Val Val Thr Ser Ile Lys Glu Leu Tyr Lys Leu Trp Ala Glu Lys
165 170 175
Lys Asn Glu Ser Gly Leu Val Ser Val Glu Met Lys Gln Trp Phe Gly
180 185 190
Asp Leu Thr Leu Asn Val Ile Leu Arg Met Val Ala Gly Lys Arg Tyr
195 200 205
Phe Ser Ala Ser Asp Ala Ser Glu Asn Lys Gln Ala Gln Arg Cys Arg
210 215 220
Arg Val Phe Arg Glu Phe Phe His Leu Ser Gly Leu Phe Val Val Ala
225 230 235 240
Asp Ala Ile Pro Phe Leu Gly Trp Leu Asp Trp Gly Arg His Glu Lys
245 250 255
Thr Leu Lys Lys Thr Ala Ile Glu Met Asp Ser Ile Ala Gln Glu Trp
260 265 270
Leu Glu Glu His Arg Arg Arg Lys Asp Ser Gly Asp Asp Asn Ser Thr
275 280 285
Gln Asp Phe Met Asp Val Met Gln Ser Val Leu Asp Gly Lys Asn Leu
290 295 300
Gly Gly Tyr Asp Ala Asp Thr Ile Asn Lys Ala Thr Cys Leu Thr Leu
305 310 315 320
Ile Ser Gly Gly Ser Asp Thr Thr Val Val Ser Leu Thr Trp Ala Leu
325 330 335
Ser Leu Val Leu Asn Asn Arg Asp Thr Leu Lys Lys Ala Gln Glu Glu
340 345 350
Leu Asp Ile Gln Val Gly Lys Glu Arg Leu Val Asn Glu Gln Asp Ile
355 360 365
Ser Lys Leu Val Tyr Leu Gln Ala Ile Val Lys Glu Thr Leu Arg Leu
370 375 380
Tyr Pro Pro Gly Pro Leu Gly Gly Leu Arg Gln Phe Thr Glu Asp Cys
385 390 395 400
Thr Leu Gly Gly Tyr His Val Ser Lys Gly Thr Arg Leu Ile Met Asn
405 410 415
Leu Ser Lys Ile Gln Lys Asp Pro Arg Ile Trp Ser Asp Pro Thr Glu
420 425 430
Phe Gln Pro Glu Arg Phe Leu Thr Thr His Lys Asp Val Asp Pro Arg
435 440 445
Gly Lys His Phe Glu Phe Ile Pro Phe Gly Ala Gly Arg Arg Ala Cys
450 455 460
Pro Gly Ile Thr Phe Gly Leu Gln Val Leu His Leu Thr Leu Ala Ser
465 470 475 480
Phe Leu His Ala Phe Glu Phe Ser Thr Pro Ser Asn Glu Gln Val Asn
485 490 495
Met Arg Glu Ser Leu Gly Leu Thr Asn Met Lys Ser Thr Pro Leu Glu
500 505 510
Val Leu Ile Ser Pro Arg Leu Ser Ser Cys Ser Leu Tyr Asn
515 520 525
<210> 17
<211> 479
<212> PRT
<213> Medicago truncatula
<400> 17
Met Glu Pro Asn Phe Tyr Leu Ser Leu Leu Leu Leu Phe Val Thr Phe
1 5 10 15
Ile Ser Leu Ser Leu Phe Phe Ile Phe Tyr Lys Gln Lys Ser Pro Leu
20 25 30
Asn Leu Pro Pro Gly Lys Met Gly Tyr Pro Ile Ile Gly Glu Ser Leu
35 40 45
Glu Phe Leu Ser Thr Gly Trp Lys Gly His Pro Glu Lys Phe Ile Phe
50 55 60
Asp Arg Met Arg Lys Tyr Ser Ser Glu Leu Phe Lys Thr Ser Ile Val
65 70 75 80
Gly Glu Ser Thr Val Val Cys Cys Gly Ala Ala Ser Asn Lys Phe Leu
85 90 95
Phe Ser Asn Glu Asn Lys Leu Val Thr Ala Trp Trp Pro Asp Ser Val
100 105 110
Asn Lys Ile Phe Pro Thr Thr Ser Leu Asp Ser Asn Leu Lys Glu Glu
115 120 125
Ser Ile Lys Met Arg Lys Leu Leu Pro Gln Phe Phe Lys Pro Glu Ala
130 135 140
Leu Gln Arg Tyr Val Gly Val Met Asp Val Ile Ala Gln Arg His Phe
145 150 155 160
Val Thr His Trp Asp Asn Lys Asn Glu Ile Thr Val Tyr Pro Leu Ala
165 170 175
Lys Arg Tyr Thr Phe Leu Leu Ala Cys Arg Leu Phe Met Ser Val Glu
180 185 190
Asp Glu Asn His Val Ala Lys Phe Ser Asp Pro Phe Gln Leu Ile Ala
195 200 205
Ala Gly Ile Ile Ser Leu Pro Ile Asp Leu Pro Gly Thr Pro Phe Asn
210 215 220
Lys Ala Ile Lys Ala Ser Asn Phe Ile Arg Lys Glu Leu Ile Lys Ile
225 230 235 240
Ile Lys Gln Arg Arg Val Asp Leu Ala Glu Gly Thr Ala Ser Pro Thr
245 250 255
Gln Asp Ile Leu Ser His Met Leu Leu Thr Ser Asp Glu Asn Gly Lys
260 265 270
Ser Met Asn Glu Leu Asn Ile Ala Asp Lys Ile Leu Gly Leu Leu Ile
275 280 285
Gly Gly His Asp Thr Ala Ser Val Ala Cys Thr Phe Leu Val Lys Tyr
290 295 300
Leu Gly Glu Leu Pro His Ile Tyr Asp Lys Val Tyr Gln Glu Gln Met
305 310 315 320
Glu Ile Ala Lys Ser Lys Pro Ala Gly Glu Leu Leu Asn Trp Asp Asp
325 330 335
Leu Lys Lys Met Lys Tyr Ser Trp Asn Val Ala Cys Glu Val Met Arg
340 345 350
Leu Ser Pro Pro Leu Gln Gly Gly Phe Arg Glu Ala Ile Thr Asp Phe
355 360 365
Met Phe Asn Gly Phe Ser Ile Pro Lys Gly Trp Lys Leu Tyr Trp Ser
370 375 380
Ala Asn Ser Thr His Lys Asn Ala Glu Cys Phe Pro Met Pro Glu Lys
385 390 395 400
Phe Asp Pro Thr Arg Phe Glu Gly Asn Gly Pro Ala Pro Tyr Thr Phe
405 410 415
Val Pro Phe Gly Gly Gly Pro Arg Met Cys Pro Gly Lys Glu Tyr Ala
420 425 430
Arg Leu Glu Ile Leu Val Phe Met His Asn Leu Val Lys Arg Phe Lys
435 440 445
Trp Glu Lys Val Ile Pro Asp Glu Lys Ile Ile Val Asp Pro Phe Pro
450 455 460
Ile Pro Ala Lys Asp Leu Pro Ile Arg Leu Tyr Pro His Lys Ala
465 470 475
<210> 18
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon-optimized Stevia rebaudiana KAHe1
<400> 18
atggaagcct cttacctata catttctatt ttgcttttac tggcatcata cctgttcacc 60
actcaactta gaaggaagag cgctaatcta ccaccaaccg tgtttccatc aataccaatc 120
attggacact tatacttact caaaaagcct ctttatagaa ctttagcaaa aattgccgct 180
aagtacggac caatactgca attacaactc ggctacagac gtgttctggt gatttcctca 240
ccatcagcag cagaagagtg ctttaccaat aacgatgtaa tcttcgcaaa tagacctaag 300
acattgtttg gcaaaatagt gggtggaaca tcccttggca gtttatccta cggcgatcaa 360
tggcgtaatc taaggagagt agcttctatc gaaatcctat cagttcatag gttgaacgaa 420
tttcatgata tcagagtgga tgagaacaga ttgttaatta gaaaacttag aagttcatct 480
tctcctgtta ctcttataac agtcttttat gctctaacat tgaacgtcat tatgagaatg 540
atctctggca aaagatattt cgacagtggg gatagagaat tggaggagga aggtaagaga 600
tttcgagaaa tcttagacga aacgttgctt ctagccggtg cttctaatgt tggcgactac 660
ttaccaatat tgaactggtt gggagttaag tctcttgaaa agaaattgat cgctttgcag 720
aaaaagagag atgacttttt ccagggtttg attgaacagg ttagaaaatc tcgtggtgct 780
aaagtaggca aaggtagaaa aacgatgatc gaactcttat tatctttgca agagtcagaa 840
cctgagtact atacagatgc tatgataaga tcttttgtcc taggtctgct ggctgcaggt 900
agtgatactt cagcgggcac tatggaatgg gccatgagct tactggtcaa tcacccacat 960
gtattgaaga aagctcaagc tgaaatcgat agagttatcg gtaataacag attgattgac 1020
gagtcagaca ttggaaatat cccttacatc gggtgtatta tcaatgaaac tctaagactc 1080
tatccagcag ggccattgtt gttcccacat gaaagttctg ccgactgcgt tatttccggt 1140
tacaatatac ctagaggtac aatgttaatc gtaaaccaat gggcgattca tcacgatcct 1200
aaagtctggg atgatcctga aacctttaaa cctgaaagat ttcaaggatt agaaggaact 1260
agagatggtt tcaaacttat gccattcggt tctgggagaa gaggatgtcc aggtgaaggt 1320
ttggcaataa ggctgttagg gatgacacta ggctcagtga tccaatgttt tgattgggag 1380
agagtaggag atgagatggt tgacatgaca gaaggtttgg gtgtcacact tcctaaggcc 1440
gttccattag ttgccaaatg taagccacgt tccgaaatga ctaatctcct atccgaactt 1500
taa 1503
<210> 19
<211> 500
<212> PRT
<213> Stevia rebaudiana
<400> 19
Met Glu Ala Ser Tyr Leu Tyr Ile Ser Ile Leu Leu Leu Leu Ala Ser
1 5 10 15
Tyr Leu Phe Thr Thr Gln Leu Arg Arg Lys Ser Ala Asn Leu Pro Pro
20 25 30
Thr Val Phe Pro Ser Ile Pro Ile Ile Gly His Leu Tyr Leu Leu Lys
35 40 45
Lys Pro Leu Tyr Arg Thr Leu Ala Lys Ile Ala Ala Lys Tyr Gly Pro
50 55 60
Ile Leu Gln Leu Gln Leu Gly Tyr Arg Arg Val Leu Val Ile Ser Ser
65 70 75 80
Pro Ser Ala Ala Glu Glu Cys Phe Thr Asn Asn Asp Val Ile Phe Ala
85 90 95
Asn Arg Pro Lys Thr Leu Phe Gly Lys Ile Val Gly Gly Thr Ser Leu
100 105 110
Gly Ser Leu Ser Tyr Gly Asp Gln Trp Arg Asn Leu Arg Arg Val Ala
115 120 125
Ser Ile Glu Ile Leu Ser Val His Arg Leu Asn Glu Phe His Asp Ile
130 135 140
Arg Val Asp Glu Asn Arg Leu Leu Ile Arg Lys Leu Arg Ser Ser Ser
145 150 155 160
Ser Pro Val Thr Leu Ile Thr Val Phe Tyr Ala Leu Thr Leu Asn Val
165 170 175
Ile Met Arg Met Ile Ser Gly Lys Arg Tyr Phe Asp Ser Gly Asp Arg
180 185 190
Glu Leu Glu Glu Glu Gly Lys Arg Phe Arg Glu Ile Leu Asp Glu Thr
195 200 205
Leu Leu Leu Ala Gly Ala Ser Asn Val Gly Asp Tyr Leu Pro Ile Leu
210 215 220
Asn Trp Leu Gly Val Lys Ser Leu Glu Lys Lys Leu Ile Ala Leu Gln
225 230 235 240
Lys Lys Arg Asp Asp Phe Phe Gln Gly Leu Ile Glu Gln Val Arg Lys
245 250 255
Ser Arg Gly Ala Lys Val Gly Lys Gly Arg Lys Thr Met Ile Glu Leu
260 265 270
Leu Leu Ser Leu Gln Glu Ser Glu Pro Glu Tyr Tyr Thr Asp Ala Met
275 280 285
Ile Arg Ser Phe Val Leu Gly Leu Leu Ala Ala Gly Ser Asp Thr Ser
290 295 300
Ala Gly Thr Met Glu Trp Ala Met Ser Leu Leu Val Asn His Pro His
305 310 315 320
Val Leu Lys Lys Ala Gln Ala Glu Ile Asp Arg Val Ile Gly Asn Asn
325 330 335
Arg Leu Ile Asp Glu Ser Asp Ile Gly Asn Ile Pro Tyr Ile Gly Cys
340 345 350
Ile Ile Asn Glu Thr Leu Arg Leu Tyr Pro Ala Gly Pro Leu Leu Phe
355 360 365
Pro His Glu Ser Ser Ala Asp Cys Val Ile Ser Gly Tyr Asn Ile Pro
370 375 380
Arg Gly Thr Met Leu Ile Val Asn Gln Trp Ala Ile His His Asp Pro
385 390 395 400
Lys Val Trp Asp Asp Pro Glu Thr Phe Lys Pro Glu Arg Phe Gln Gly
405 410 415
Leu Glu Gly Thr Arg Asp Gly Phe Lys Leu Met Pro Phe Gly Ser Gly
420 425 430
Arg Arg Gly Cys Pro Gly Glu Gly Leu Ala Ile Arg Leu Leu Gly Met
435 440 445
Thr Leu Gly Ser Val Ile Gln Cys Phe Asp Trp Glu Arg Val Gly Asp
450 455 460
Glu Met Val Asp Met Thr Glu Gly Leu Gly Val Thr Leu Pro Lys Ala
465 470 475 480
Val Pro Leu Val Ala Lys Cys Lys Pro Arg Ser Glu Met Thr Asn Leu
485 490 495
Leu Ser Glu Leu
500
<210> 20
<211> 710
<212> PRT
<213> Stevia rebaudiana
<400> 20
Met Gln Ser Asp Ser Val Lys Val Ser Pro Phe Asp Leu Val Ser Ala
1 5 10 15
Ala Met Asn Gly Lys Ala Met Glu Lys Leu Asn Ala Ser Glu Ser Glu
20 25 30
Asp Pro Thr Thr Leu Pro Ala Leu Lys Met Leu Val Glu Asn Arg Glu
35 40 45
Leu Leu Thr Leu Phe Thr Thr Ser Phe Ala Val Leu Ile Gly Cys Leu
50 55 60
Val Phe Leu Met Trp Arg Arg Ser Ser Ser Lys Lys Leu Val Gln Asp
65 70 75 80
Pro Val Pro Gln Val Ile Val Val Lys Lys Lys Glu Lys Glu Ser Glu
85 90 95
Val Asp Asp Gly Lys Lys Lys Val Ser Ile Phe Tyr Gly Thr Gln Thr
100 105 110
Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Val Glu Glu Ala Lys Val
115 120 125
Arg Tyr Glu Lys Thr Ser Phe Lys Val Ile Asp Leu Asp Asp Tyr Ala
130 135 140
Ala Asp Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Ser Leu Ala
145 150 155 160
Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala
165 170 175
Ala Asn Phe Tyr Lys Trp Phe Thr Glu Gly Asp Asp Lys Gly Glu Trp
180 185 190
Leu Lys Lys Leu Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln Tyr
195 200 205
Glu His Phe Asn Lys Ile Ala Ile Val Val Asp Asp Lys Leu Thr Glu
210 215 220
Met Gly Ala Lys Arg Leu Val Pro Val Gly Leu Gly Asp Asp Asp Gln
225 230 235 240
Cys Ile Glu Asp Asp Phe Thr Ala Trp Lys Glu Leu Val Trp Pro Glu
245 250 255
Leu Asp Gln Leu Leu Arg Asp Glu Asp Asp Thr Ser Val Thr Thr Pro
260 265 270
Tyr Thr Ala Ala Val Leu Glu Tyr Arg Val Val Tyr His Asp Lys Pro
275 280 285
Ala Asp Ser Tyr Ala Glu Asp Gln Thr His Thr Asn Gly His Val Val
290 295 300
His Asp Ala Gln His Pro Ser Arg Ser Asn Val Ala Phe Lys Lys Glu
305 310 315 320
Leu His Thr Ser Gln Ser Asp Arg Ser Cys Thr His Leu Glu Phe Asp
325 330 335
Ile Ser His Thr Gly Leu Ser Tyr Glu Thr Gly Asp His Val Gly Val
340 345 350
Tyr Ser Glu Asn Leu Ser Glu Val Val Asp Glu Ala Leu Lys Leu Leu
355 360 365
Gly Leu Ser Pro Asp Thr Tyr Phe Ser Val His Ala Asp Lys Glu Asp
370 375 380
Gly Thr Pro Ile Gly Gly Ala Ser Leu Pro Pro Pro Phe Pro Pro Cys
385 390 395 400
Thr Leu Arg Asp Ala Leu Thr Arg Tyr Ala Asp Val Leu Ser Ser Pro
405 410 415
Lys Lys Val Ala Leu Leu Ala Leu Ala Ala His Ala Ser Asp Pro Ser
420 425 430
Glu Ala Asp Arg Leu Lys Phe Leu Ala Ser Pro Ala Gly Lys Asp Glu
435 440 445
Tyr Ala Gln Trp Ile Val Ala Asn Gln Arg Ser Leu Leu Glu Val Met
450 455 460
Gln Ser Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala
465 470 475 480
Val Ala Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro
485 490 495
Lys Met Ser Pro Asn Arg Ile His Val Thr Cys Ala Leu Val Tyr Glu
500 505 510
Thr Thr Pro Ala Gly Arg Ile His Arg Gly Leu Cys Ser Thr Trp Met
515 520 525
Lys Asn Ala Val Pro Leu Thr Glu Ser Pro Asp Cys Ser Gln Ala Ser
530 535 540
Ile Phe Val Arg Thr Ser Asn Phe Arg Leu Pro Val Asp Pro Lys Val
545 550 555 560
Pro Val Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly
565 570 575
Phe Leu Gln Glu Arg Leu Ala Leu Lys Glu Ser Gly Thr Glu Leu Gly
580 585 590
Ser Ser Ile Phe Phe Phe Gly Cys Arg Asn Arg Lys Val Asp Phe Ile
595 600 605
Tyr Glu Asp Glu Leu Asn Asn Phe Val Glu Thr Gly Ala Leu Ser Glu
610 615 620
Leu Ile Val Ala Phe Ser Arg Glu Gly Thr Ala Lys Glu Tyr Val Gln
625 630 635 640
His Lys Met Ser Gln Lys Ala Ser Asp Ile Trp Lys Leu Leu Ser Glu
645 650 655
Gly Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Lys Asp
660 665 670
Val His Arg Thr Leu His Thr Ile Val Gln Glu Gln Gly Ser Leu Asp
675 680 685
Ser Ser Lys Ala Glu Leu Tyr Val Lys Asn Leu Gln Met Ser Gly Arg
690 695 700
Tyr Leu Arg Asp Val Trp
705 710
<210> 21
<211> 692
<212> PRT
<213> Arabidopsis thaliana
<400> 21
Met Thr Ser Ala Leu Tyr Ala Ser Asp Leu Phe Lys Gln Leu Lys Ser
1 5 10 15
Ile Met Gly Thr Asp Ser Leu Ser Asp Asp Val Val Leu Val Ile Ala
20 25 30
Thr Thr Ser Leu Ala Leu Val Ala Gly Phe Val Val Leu Leu Trp Lys
35 40 45
Lys Thr Thr Ala Asp Arg Ser Gly Glu Leu Lys Pro Leu Met Ile Pro
50 55 60
Lys Ser Leu Met Ala Lys Asp Glu Asp Asp Asp Leu Asp Leu Gly Ser
65 70 75 80
Gly Lys Thr Arg Val Ser Ile Phe Phe Gly Thr Gln Thr Gly Thr Ala
85 90 95
Glu Gly Phe Ala Lys Ala Leu Ser Glu Glu Ile Lys Ala Arg Tyr Glu
100 105 110
Lys Ala Ala Val Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp Asp
115 120 125
Asp Gln Tyr Glu Glu Lys Leu Lys Lys Glu Thr Leu Ala Phe Phe Cys
130 135 140
Val Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe
145 150 155 160
Tyr Lys Trp Phe Thr Glu Glu Asn Glu Arg Asp Ile Lys Leu Gln Gln
165 170 175
Leu Ala Tyr Gly Val Phe Ala Leu Gly Asn Arg Gln Tyr Glu His Phe
180 185 190
Asn Lys Ile Gly Ile Val Leu Asp Glu Glu Leu Cys Lys Lys Gly Ala
195 200 205
Lys Arg Leu Ile Glu Val Gly Leu Gly Asp Asp Asp Gln Ser Ile Glu
210 215 220
Asp Asp Phe Asn Ala Trp Lys Glu Ser Leu Trp Ser Glu Leu Asp Lys
225 230 235 240
Leu Leu Lys Asp Glu Asp Asp Lys Ser Val Ala Thr Pro Tyr Thr Ala
245 250 255
Val Ile Pro Glu Tyr Arg Val Val Thr His Asp Pro Arg Phe Thr Thr
260 265 270
Gln Lys Ser Met Glu Ser Asn Val Ala Asn Gly Asn Thr Thr Ile Asp
275 280 285
Ile His His Pro Cys Arg Val Asp Val Ala Val Gln Lys Glu Leu His
290 295 300
Thr His Glu Ser Asp Arg Ser Cys Ile His Leu Glu Phe Asp Ile Ser
305 310 315 320
Arg Thr Gly Ile Thr Tyr Glu Thr Gly Asp His Val Gly Val Tyr Ala
325 330 335
Glu Asn His Val Glu Ile Val Glu Glu Ala Gly Lys Leu Leu Gly His
340 345 350
Ser Leu Asp Leu Val Phe Ser Ile His Ala Asp Lys Glu Asp Gly Ser
355 360 365
Pro Leu Glu Ser Ala Val Pro Pro Pro Phe Pro Gly Pro Cys Thr Leu
370 375 380
Gly Thr Gly Leu Ala Arg Tyr Ala Asp Leu Leu Asn Pro Pro Arg Lys
385 390 395 400
Ser Ala Leu Val Ala Leu Ala Ala Tyr Ala Thr Glu Pro Ser Glu Ala
405 410 415
Glu Lys Leu Lys His Leu Thr Ser Pro Asp Gly Lys Asp Glu Tyr Ser
420 425 430
Gln Trp Ile Val Ala Ser Gln Arg Ser Leu Leu Glu Val Met Ala Ala
435 440 445
Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala Ile Ala
450 455 460
Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg Leu
465 470 475 480
Ala Pro Ser Arg Val His Val Thr Ser Ala Leu Val Tyr Gly Pro Thr
485 490 495
Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys Asn
500 505 510
Ala Val Pro Ala Glu Lys Ser His Glu Cys Ser Gly Ala Pro Ile Phe
515 520 525
Ile Arg Ala Ser Asn Phe Lys Leu Pro Ser Asn Pro Ser Thr Pro Ile
530 535 540
Val Met Val Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe Leu
545 550 555 560
Gln Glu Arg Met Ala Leu Lys Glu Asp Gly Glu Glu Leu Gly Ser Ser
565 570 575
Leu Leu Phe Phe Gly Cys Arg Asn Arg Gln Met Asp Phe Ile Tyr Glu
580 585 590
Asp Glu Leu Asn Asn Phe Val Asp Gln Gly Val Ile Ser Glu Leu Ile
595 600 605
Met Ala Phe Ser Arg Glu Gly Ala Gln Lys Glu Tyr Val Gln His Lys
610 615 620
Met Met Glu Lys Ala Ala Gln Val Trp Asp Leu Ile Lys Glu Glu Gly
625 630 635 640
Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val His
645 650 655
Arg Thr Leu His Thr Ile Val Gln Glu Gln Glu Gly Val Ser Ser Ser
660 665 670
Glu Ala Glu Ala Ile Val Lys Lys Leu Gln Thr Glu Gly Arg Tyr Leu
675 680 685
Arg Asp Val Trp
690
<210> 22
<211> 713
<212> PRT
<213> Fusarium fujikuroi
<400> 22
Met Ala Glu Leu Asp Thr Leu Asp Ile Val Val Leu Gly Val Ile Phe
1 5 10 15
Leu Gly Thr Val Ala Tyr Phe Thr Lys Gly Lys Leu Trp Gly Val Thr
20 25 30
Lys Asp Pro Tyr Ala Asn Gly Phe Ala Ala Gly Gly Ala Ser Lys Pro
35 40 45
Gly Arg Thr Arg Asn Ile Val Glu Ala Met Glu Glu Ser Gly Lys Asn
50 55 60
Cys Val Val Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala
65 70 75 80
Ser Arg Leu Ala Lys Glu Gly Lys Ser Arg Phe Gly Leu Asn Thr Met
85 90 95
Ile Ala Asp Leu Glu Asp Tyr Asp Phe Asp Asn Leu Asp Thr Val Pro
100 105 110
Ser Asp Asn Ile Val Met Phe Val Leu Ala Thr Tyr Gly Glu Gly Glu
115 120 125
Pro Thr Asp Asn Ala Val Asp Phe Tyr Glu Phe Ile Thr Gly Glu Asp
130 135 140
Ala Ser Phe Asn Glu Gly Asn Asp Pro Pro Leu Gly Asn Leu Asn Tyr
145 150 155 160
Val Ala Phe Gly Leu Gly Asn Asn Thr Tyr Glu His Tyr Asn Ser Met
165 170 175
Val Arg Asn Val Asn Lys Ala Leu Glu Lys Leu Gly Ala His Arg Ile
180 185 190
Gly Glu Ala Gly Glu Gly Asp Asp Gly Ala Gly Thr Met Glu Glu Asp
195 200 205
Phe Leu Ala Trp Lys Asp Pro Met Trp Glu Ala Leu Ala Lys Lys Met
210 215 220
Gly Leu Glu Glu Arg Glu Ala Val Tyr Glu Pro Ile Phe Ala Ile Asn
225 230 235 240
Glu Arg Asp Asp Leu Thr Pro Glu Ala Asn Glu Val Tyr Leu Gly Glu
245 250 255
Pro Asn Lys Leu His Leu Glu Gly Thr Ala Lys Gly Pro Phe Asn Ser
260 265 270
His Asn Pro Tyr Ile Ala Pro Ile Ala Glu Ser Tyr Glu Leu Phe Ser
275 280 285
Ala Lys Asp Arg Asn Cys Leu His Met Glu Ile Asp Ile Ser Gly Ser
290 295 300
Asn Leu Lys Tyr Glu Thr Gly Asp His Ile Ala Ile Trp Pro Thr Asn
305 310 315 320
Pro Gly Glu Glu Val Asn Lys Phe Leu Asp Ile Leu Asp Leu Ser Gly
325 330 335
Lys Gln His Ser Val Val Thr Val Lys Ala Leu Glu Pro Thr Ala Lys
340 345 350
Val Pro Phe Pro Asn Pro Thr Thr Tyr Asp Ala Ile Leu Arg Tyr His
355 360 365
Leu Glu Ile Cys Ala Pro Val Ser Arg Gln Phe Val Ser Thr Leu Ala
370 375 380
Ala Phe Ala Pro Asn Asp Asp Ile Lys Ala Glu Met Asn Arg Leu Gly
385 390 395 400
Ser Asp Lys Asp Tyr Phe His Glu Lys Thr Gly Pro His Tyr Tyr Asn
405 410 415
Ile Ala Arg Phe Leu Ala Ser Val Ser Lys Gly Glu Lys Trp Thr Lys
420 425 430
Ile Pro Phe Ser Ala Phe Ile Glu Gly Leu Thr Lys Leu Gln Pro Arg
435 440 445
Tyr Tyr Ser Ile Ser Ser Ser Ser Leu Val Gln Pro Lys Lys Ile Ser
450 455 460
Ile Thr Ala Val Val Glu Ser Gln Gln Ile Pro Gly Arg Asp Asp Pro
465 470 475 480
Phe Arg Gly Val Ala Thr Asn Tyr Leu Phe Ala Leu Lys Gln Lys Gln
485 490 495
Asn Gly Asp Pro Asn Pro Ala Pro Phe Gly Gln Ser Tyr Glu Leu Thr
500 505 510
Gly Pro Arg Asn Lys Tyr Asp Gly Ile His Val Pro Val His Val Arg
515 520 525
His Ser Asn Phe Lys Leu Pro Ser Asp Pro Gly Lys Pro Ile Ile Met
530 535 540
Ile Gly Pro Gly Thr Gly Val Ala Pro Phe Arg Gly Phe Val Gln Glu
545 550 555 560
Arg Ala Lys Gln Ala Arg Asp Gly Val Glu Val Gly Lys Thr Leu Leu
565 570 575
Phe Phe Gly Cys Arg Lys Ser Thr Glu Asp Phe Met Tyr Gln Lys Glu
580 585 590
Trp Gln Glu Tyr Lys Glu Ala Leu Gly Asp Lys Phe Glu Met Ile Thr
595 600 605
Ala Phe Ser Arg Glu Gly Ser Lys Lys Val Tyr Val Gln His Arg Leu
610 615 620
Lys Glu Arg Ser Lys Glu Val Ser Asp Leu Leu Ser Gln Lys Ala Tyr
625 630 635 640
Phe Tyr Val Cys Gly Asp Ala Ala His Met Ala Arg Glu Val Asn Thr
645 650 655
Val Leu Ala Gln Ile Ile Ala Glu Gly Arg Gly Val Ser Glu Ala Lys
660 665 670
Gly Glu Glu Ile Val Lys Asn Met Arg Ser Ala Asn Gln Tyr Gln Val
675 680 685
Cys Ser Asp Phe Val Thr Leu His Cys Lys Glu Thr Thr Tyr Ala Asn
690 695 700
Ser Glu Leu Gln Glu Asp Val Trp Ser
705 710
<210> 23
<211> 2130
<212> DNA
<213> Stevia rebaudiana
<400> 23
atgcaatcgg aatccgttga agcatcgacg attgatttga tgactgctgt tttgaaggac 60
acagtgatcg atacagcgaa cgcatctgat aacggagact caaagatgcc gccggcgttg 120
gcgatgatgt tcgaaattcg tgatctgttg ctgattttga ctacgtcagt tgctgttttg 180
gtcggatgtt tcgttgtttt ggtgtggaag agatcgtccg ggaagaagtc cggcaaggaa 240
ttggagccgc cgaagatcgt tgtgccgaag aggcggctgg agcaggaggt tgatgatggt 300
aagaagaagg ttacgatttt cttcggaaca caaactggaa cggctgaagg tttcgctaag 360
gcacttttcg aagaagcgaa agcgcgatat gaaaaggcag cgtttaaagt gattgatttg 420
gatgattatg ctgctgattt ggatgagtat gcagagaagc tgaagaagga aacatatgct 480
ttcttcttct tggctacata tggagatggt gagccaactg ataatgctgc caaattttat 540
aaatggttta ctgagggaga cgagaaaggc gtttggcttc aaaaacttca atatggagta 600
tttggtcttg gcaacagaca atatgaacat ttcaacaaga ttggaatagt ggttgatgat 660
ggtctcaccg agcagggtgc aaaacgcatt gttcccgttg gtcttggaga cgacgatcaa 720
tcaattgaag acgatttttc ggcatggaaa gagttagtgt ggcccgaatt ggatctattg 780
cttcgcgatg aagatgacaa agctgctgca actccttaca cagctgcaat ccctgaatac 840
cgcgtcgtat ttcatgacaa acccgatgcg ttttctgatg atcatactca aaccaatggt 900
catgctgttc atgatgctca acatccatgc agatccaatg tggctgttaa aaaagagctt 960
catactcctg aatccgatcg ttcatgcaca catcttgaat ttgacatttc tcacactgga 1020
ttatcttatg aaactgggga tcatgttggt gtatactgtg aaaacctaat tgaagtagtg 1080
gaagaagctg ggaaattgtt aggattatca acagatactt atttctcgtt acatattgat 1140
aacgaagatg gttcaccact tggtggacct tcattacaac ctccttttcc tccttgtact 1200
ttaagaaaag cattgactaa ttatgcagat ctgttaagct ctcccaaaaa gtcaactttg 1260
cttgctctag ctgctcatgc ttccgatccc actgaagctg atcgtttaag atttcttgca 1320
tctcgcgagg gcaaggatga atatgctgaa tgggttgttg caaaccaaag aagtcttctt 1380
gaagtcatgg aagctttccc gtcagctaga ccgccacttg gtgttttctt tgcagcggtt 1440
gcaccgcgtt tacagcctcg ttactactct atttcttcct ccccaaagat ggaaccaaac 1500
aggattcatg ttacttgcgc gttggtttat gaaaaaactc ccgcaggtcg tatccacaaa 1560
ggaatctgct caacctggat gaagaacgct gtacctttga ccgaaagtca agattgcagt 1620
tgggcaccga tttttgttag aacatcaaac ttcagacttc caattgaccc gaaagtcccg 1680
gttatcatga ttggtcctgg aaccgggttg gctccattta ggggttttct tcaagaaaga 1740
ttggctctta aagaatccgg aaccgaactc gggtcatcta ttttattctt cggttgtaga 1800
aaccgcaaag tggattacat atatgagaat gaactcaaca actttgttga aaatggtgcg 1860
ctttctgagc ttgatgttgc tttctcccgc gatggcccga cgaaagaata cgtgcaacat 1920
aaaatgaccc aaaaggcttc tgaaatatgg aatatgcttt ctgagggagc atatttatat 1980
gtatgtggtg atgctaaagg catggctaaa gatgtacacc gtacacttca caccattgtg 2040
caagaacagg gaagtttgga ctcgtctaaa gcggagttgt atgtgaagaa tctacaaatg 2100
tcaggaagat acctccgtga tgtttggtaa 2130
<210> 24
<211> 2124
<212> DNA
<213> Stevia rebaudiana
<400> 24
atgcaatcta actccgtgaa gatttcgccg cttgatctgg taactgcgct gtttagcggc 60
aaggttttgg acacatcgaa cgcatcggaa tcgggagaat ctgctatgct gccgactata 120
gcgatgatta tggagaatcg tgagctgttg atgatactca caacgtcggt tgctgtattg 180
atcggatgcg ttgtcgtttt ggtgtggcgg agatcgtcta cgaagaagtc ggcgttggag 240
ccaccggtga ttgtggttcc gaagagagtg caagaggagg aagttgatga tggtaagaag 300
aaagttacgg ttttcttcgg cacccaaact ggaacagctg aaggcttcgc taaggcactt 360
gttgaggaag ctaaagctcg atatgaaaag gctgtcttta aagtaattga tttggatgat 420
tatgctgctg atgacgatga gtatgaggag aaactaaaga aagaatcttt ggcctttttc 480
tttttggcta cgtatggaga tggtgagcca acagataatg ctgccagatt ttataaatgg 540
tttactgagg gagatgcgaa aggagaatgg cttaataagc ttcaatatgg agtatttggt 600
ttgggtaaca gacaatatga acattttaac aagatcgcaa aagtggttga tgatggtctt 660
gtagaacagg gtgcaaagcg tcttgttcct gttggacttg gagatgatga tcaatgtatt 720
gaagatgact tcaccgcatg gaaagagtta gtatggccgg agttggatca attacttcgt 780
gatgaggatg acacaactgt tgctactcca tacacagctg ctgttgcaga atatcgcgtt 840
gtttttcatg aaaaaccaga cgcgctttct gaagattata gttatacaaa tggccatgct 900
gttcatgatg ctcaacatcc atgcagatcc aacgtggctg tcaaaaagga acttcatagt 960
cctgaatctg accggtcttg cactcatctt gaatttgaca tctcgaacac cggactatca 1020
tatgaaactg gggaccatgt tggagtttac tgtgaaaact tgagtgaagt tgtgaatgat 1080
gctgaaagat tagtaggatt accaccagac acttactcct ccatccacac tgatagtgaa 1140
gacgggtcgc cacttggcgg agcctcattg ccgcctcctt tcccgccatg cactttaagg 1200
aaagcattga cgtgttatgc tgatgttttg agttctccca agaagtcggc tttgcttgca 1260
ctagctgctc atgccaccga tcccagtgaa gctgatagat tgaaatttct tgcatccccc 1320
gccggaaagg atgaatattc tcaatggata gttgcaagcc aaagaagtct ccttgaagtc 1380
atggaagcat tcccgtcagc taagccttca cttggtgttt tctttgcatc tgttgccccg 1440
cgcttacaac caagatacta ctctatttct tcctcaccca agatggcacc ggataggatt 1500
catgttacat gtgcattagt ctatgagaaa acacctgcag gccgcatcca caaaggagtt 1560
tgttcaactt ggatgaagaa cgcagtgcct atgaccgaga gtcaagattg cagttgggcc 1620
ccaatatacg tccgaacatc caatttcaga ctaccatctg accctaaggt cccggttatc 1680
atgattggac ctggcactgg tttggctcct tttagaggtt tccttcaaga gcggttagct 1740
ttaaaggaag ccggaactga cctcggttta tccattttat tcttcggatg taggaatcgc 1800
aaagtggatt tcatatatga aaacgagctt aacaactttg tggagactgg tgctctttct 1860
gagcttattg ttgctttctc ccgtgaaggc ccgactaagg aatatgtgca acacaagatg 1920
agtgagaagg cttcggatat ctggaacttg ctttctgaag gagcatattt atacgtatgt 1980
ggtgatgcca aaggcatggc caaagatgta catcgaaccc tccacacaat tgtgcaagaa 2040
cagggatctc ttgactcgtc aaaggcagaa ctctacgtga agaatctaca aatgtcagga 2100
agatacctcc gtgacgtttg gtaa 2124
<210> 25
<211> 692
<212> PRT
<213> Arabidopsis thaliana
<400> 25
Met Thr Ser Ala Leu Tyr Ala Ser Asp Leu Phe Lys Gln Leu Lys Ser
1 5 10 15
Ile Met Gly Thr Asp Ser Leu Ser Asp Asp Val Val Leu Val Ile Ala
20 25 30
Thr Thr Ser Leu Ala Leu Val Ala Gly Phe Val Val Leu Leu Trp Lys
35 40 45
Lys Thr Thr Ala Asp Arg Ser Gly Glu Leu Lys Pro Leu Met Ile Pro
50 55 60
Lys Ser Leu Met Ala Lys Asp Glu Asp Asp Asp Leu Asp Leu Gly Ser
65 70 75 80
Gly Lys Thr Arg Val Ser Ile Phe Phe Gly Thr Gln Thr Gly Thr Ala
85 90 95
Glu Gly Phe Ala Lys Ala Leu Ser Glu Glu Ile Lys Ala Arg Tyr Glu
100 105 110
Lys Ala Ala Val Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp Asp
115 120 125
Asp Gln Tyr Glu Glu Lys Leu Lys Lys Glu Thr Leu Ala Phe Phe Cys
130 135 140
Val Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe
145 150 155 160
Tyr Lys Trp Phe Thr Glu Glu Asn Glu Arg Asp Ile Lys Leu Gln Gln
165 170 175
Leu Ala Tyr Gly Val Phe Ala Leu Gly Asn Arg Gln Tyr Glu His Phe
180 185 190
Asn Lys Ile Gly Ile Val Leu Asp Glu Glu Leu Cys Lys Lys Gly Ala
195 200 205
Lys Arg Leu Ile Glu Val Gly Leu Gly Asp Asp Asp Gln Ser Ile Glu
210 215 220
Asp Asp Phe Asn Ala Trp Lys Glu Ser Leu Trp Ser Glu Leu Asp Lys
225 230 235 240
Leu Leu Lys Asp Glu Asp Asp Lys Ser Val Ala Thr Pro Tyr Thr Ala
245 250 255
Val Ile Pro Glu Tyr Arg Val Val Thr His Asp Pro Arg Phe Thr Thr
260 265 270
Gln Lys Ser Met Glu Ser Asn Val Ala Asn Gly Asn Thr Thr Ile Asp
275 280 285
Ile His His Pro Cys Arg Val Asp Val Ala Val Gln Lys Glu Leu His
290 295 300
Thr His Glu Ser Asp Arg Ser Cys Ile His Leu Glu Phe Asp Ile Ser
305 310 315 320
Arg Thr Gly Ile Thr Tyr Glu Thr Gly Asp His Val Gly Val Tyr Ala
325 330 335
Glu Asn His Val Glu Ile Val Glu Glu Ala Gly Lys Leu Leu Gly His
340 345 350
Ser Leu Asp Leu Val Phe Ser Ile His Ala Asp Lys Glu Asp Gly Ser
355 360 365
Pro Leu Glu Ser Ala Val Pro Pro Pro Phe Pro Gly Pro Cys Thr Leu
370 375 380
Gly Thr Gly Leu Ala Arg Tyr Ala Asp Leu Leu Asn Pro Pro Arg Lys
385 390 395 400
Ser Ala Leu Val Ala Leu Ala Ala Tyr Ala Thr Glu Pro Ser Glu Ala
405 410 415
Glu Lys Leu Lys His Leu Thr Ser Pro Asp Gly Lys Asp Glu Tyr Ser
420 425 430
Gln Trp Ile Val Ala Ser Gln Arg Ser Leu Leu Glu Val Met Ala Ala
435 440 445
Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala Ile Ala
450 455 460
Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg Leu
465 470 475 480
Ala Pro Ser Arg Val His Val Thr Ser Ala Leu Val Tyr Gly Pro Thr
485 490 495
Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys Asn
500 505 510
Ala Val Pro Ala Glu Lys Ser His Glu Cys Ser Gly Ala Pro Ile Phe
515 520 525
Ile Arg Ala Ser Asn Phe Lys Leu Pro Ser Asn Pro Ser Thr Pro Ile
530 535 540
Val Met Val Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe Leu
545 550 555 560
Gln Glu Arg Met Ala Leu Lys Glu Asp Gly Glu Glu Leu Gly Ser Ser
565 570 575
Leu Leu Phe Phe Gly Cys Arg Asn Arg Gln Met Asp Phe Ile Tyr Glu
580 585 590
Asp Glu Leu Asn Asn Phe Val Asp Gln Gly Val Ile Ser Glu Leu Ile
595 600 605
Met Ala Phe Ser Arg Glu Gly Ala Gln Lys Glu Tyr Val Gln His Lys
610 615 620
Met Met Glu Lys Ala Ala Gln Val Trp Asp Leu Ile Lys Glu Glu Gly
625 630 635 640
Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val His
645 650 655
Arg Thr Leu His Thr Ile Val Gln Glu Gln Glu Gly Val Ser Ser Ser
660 665 670
Glu Ala Glu Ala Ile Val Lys Lys Leu Gln Thr Glu Gly Arg Tyr Leu
675 680 685
Arg Asp Val Trp
690
<210> 26
<211> 712
<212> PRT
<213> Arabidopsis thaliana
<400> 26
Met Ser Ser Ser Ser Ser Ser Ser Thr Ser Met Ile Asp Leu Met Ala
1 5 10 15
Ala Ile Ile Lys Gly Glu Pro Val Ile Val Ser Asp Pro Ala Asn Ala
20 25 30
Ser Ala Tyr Glu Ser Val Ala Ala Glu Leu Ser Ser Met Leu Ile Glu
35 40 45
Asn Arg Gln Phe Ala Met Ile Val Thr Thr Ser Ile Ala Val Leu Ile
50 55 60
Gly Cys Ile Val Met Leu Val Trp Arg Arg Ser Gly Ser Gly Asn Ser
65 70 75 80
Lys Arg Val Glu Pro Leu Lys Pro Leu Val Ile Lys Pro Arg Glu Glu
85 90 95
Glu Ile Asp Asp Gly Arg Lys Lys Val Thr Ile Phe Phe Gly Thr Gln
100 105 110
Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Gly Glu Glu Ala Lys
115 120 125
Ala Arg Tyr Glu Lys Thr Arg Phe Lys Ile Val Asp Leu Asp Asp Tyr
130 135 140
Ala Ala Asp Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asp Val
145 150 155 160
Ala Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn
165 170 175
Ala Ala Arg Phe Tyr Lys Trp Phe Thr Glu Gly Asn Asp Arg Gly Glu
180 185 190
Trp Leu Lys Asn Leu Lys Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln
195 200 205
Tyr Glu His Phe Asn Lys Val Ala Lys Val Val Asp Asp Ile Leu Val
210 215 220
Glu Gln Gly Ala Gln Arg Leu Val Gln Val Gly Leu Gly Asp Asp Asp
225 230 235 240
Gln Cys Ile Glu Asp Asp Phe Thr Ala Trp Arg Glu Ala Leu Trp Pro
245 250 255
Glu Leu Asp Thr Ile Leu Arg Glu Glu Gly Asp Thr Ala Val Ala Thr
260 265 270
Pro Tyr Thr Ala Ala Val Leu Glu Tyr Arg Val Ser Ile His Asp Ser
275 280 285
Glu Asp Ala Lys Phe Asn Asp Ile Thr Leu Ala Asn Gly Asn Gly Tyr
290 295 300
Thr Val Phe Asp Ala Gln His Pro Tyr Lys Ala Asn Val Ala Val Lys
305 310 315 320
Arg Glu Leu His Thr Pro Glu Ser Asp Arg Ser Cys Ile His Leu Glu
325 330 335
Phe Asp Ile Ala Gly Ser Gly Leu Thr Met Lys Leu Gly Asp His Val
340 345 350
Gly Val Leu Cys Asp Asn Leu Ser Glu Thr Val Asp Glu Ala Leu Arg
355 360 365
Leu Leu Asp Met Ser Pro Asp Thr Tyr Phe Ser Leu His Ala Glu Lys
370 375 380
Glu Asp Gly Thr Pro Ile Ser Ser Ser Leu Pro Pro Pro Phe Pro Pro
385 390 395 400
Cys Asn Leu Arg Thr Ala Leu Thr Arg Tyr Ala Cys Leu Leu Ser Ser
405 410 415
Pro Lys Lys Ser Ala Leu Val Ala Leu Ala Ala His Ala Ser Asp Pro
420 425 430
Thr Glu Ala Glu Arg Leu Lys His Leu Ala Ser Pro Ala Gly Lys Asp
435 440 445
Glu Tyr Ser Lys Trp Val Val Glu Ser Gln Arg Ser Leu Leu Glu Val
450 455 460
Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala
465 470 475 480
Gly Val Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser Ser
485 490 495
Pro Lys Ile Ala Glu Thr Arg Ile His Val Thr Cys Ala Leu Val Tyr
500 505 510
Glu Lys Met Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp
515 520 525
Met Lys Asn Ala Val Pro Tyr Glu Lys Ser Glu Lys Leu Phe Leu Gly
530 535 540
Arg Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro Ser Asp Ser
545 550 555 560
Lys Val Pro Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe
565 570 575
Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Val Glu Ser Gly Val Glu
580 585 590
Leu Gly Pro Ser Val Leu Phe Phe Gly Cys Arg Asn Arg Arg Met Asp
595 600 605
Phe Ile Tyr Glu Glu Glu Leu Gln Arg Phe Val Glu Ser Gly Ala Leu
610 615 620
Ala Glu Leu Ser Val Ala Phe Ser Arg Glu Gly Pro Thr Lys Glu Tyr
625 630 635 640
Val Gln His Lys Met Met Asp Lys Ala Ser Asp Ile Trp Asn Met Ile
645 650 655
Ser Gln Gly Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala
660 665 670
Arg Asp Val His Arg Ser Leu His Thr Ile Ala Gln Glu Gln Gly Ser
675 680 685
Met Asp Ser Thr Lys Ala Glu Gly Phe Val Lys Asn Leu Gln Thr Ser
690 695 700
Gly Arg Tyr Leu Arg Asp Val Trp
705 710
<210> 27
<211> 709
<212> PRT
<213> Stevia rebaudiana
<400> 27
Met Gln Ser Glu Ser Val Glu Ala Ser Thr Ile Asp Leu Met Thr Ala
1 5 10 15
Val Leu Lys Asp Thr Val Ile Asp Thr Ala Asn Ala Ser Asp Asn Gly
20 25 30
Asp Ser Lys Met Pro Pro Ala Leu Ala Met Met Phe Glu Ile Arg Asp
35 40 45
Leu Leu Leu Ile Leu Thr Thr Ser Val Ala Val Leu Val Gly Cys Phe
50 55 60
Val Val Leu Val Trp Lys Arg Ser Ser Gly Lys Lys Ser Gly Lys Glu
65 70 75 80
Leu Glu Pro Pro Lys Ile Val Val Pro Lys Arg Arg Leu Glu Gln Glu
85 90 95
Val Asp Asp Gly Lys Lys Lys Val Thr Ile Phe Phe Gly Thr Gln Thr
100 105 110
Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Phe Glu Glu Ala Lys Ala
115 120 125
Arg Tyr Glu Lys Ala Ala Phe Lys Val Ile Asp Leu Asp Asp Tyr Ala
130 135 140
Ala Asp Leu Asp Glu Tyr Ala Glu Lys Leu Lys Lys Glu Thr Tyr Ala
145 150 155 160
Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala
165 170 175
Ala Lys Phe Tyr Lys Trp Phe Thr Glu Gly Asp Glu Lys Gly Val Trp
180 185 190
Leu Gln Lys Leu Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln Tyr
195 200 205
Glu His Phe Asn Lys Ile Gly Ile Val Val Asp Asp Gly Leu Thr Glu
210 215 220
Gln Gly Ala Lys Arg Ile Val Pro Val Gly Leu Gly Asp Asp Asp Gln
225 230 235 240
Ser Ile Glu Asp Asp Phe Ser Ala Trp Lys Glu Leu Val Trp Pro Glu
245 250 255
Leu Asp Leu Leu Leu Arg Asp Glu Asp Asp Lys Ala Ala Ala Thr Pro
260 265 270
Tyr Thr Ala Ala Ile Pro Glu Tyr Arg Val Val Phe His Asp Lys Pro
275 280 285
Asp Ala Phe Ser Asp Asp His Thr Gln Thr Asn Gly His Ala Val His
290 295 300
Asp Ala Gln His Pro Cys Arg Ser Asn Val Ala Val Lys Lys Glu Leu
305 310 315 320
His Thr Pro Glu Ser Asp Arg Ser Cys Thr His Leu Glu Phe Asp Ile
325 330 335
Ser His Thr Gly Leu Ser Tyr Glu Thr Gly Asp His Val Gly Val Tyr
340 345 350
Cys Glu Asn Leu Ile Glu Val Val Glu Glu Ala Gly Lys Leu Leu Gly
355 360 365
Leu Ser Thr Asp Thr Tyr Phe Ser Leu His Ile Asp Asn Glu Asp Gly
370 375 380
Ser Pro Leu Gly Gly Pro Ser Leu Gln Pro Pro Phe Pro Pro Cys Thr
385 390 395 400
Leu Arg Lys Ala Leu Thr Asn Tyr Ala Asp Leu Leu Ser Ser Pro Lys
405 410 415
Lys Ser Thr Leu Leu Ala Leu Ala Ala His Ala Ser Asp Pro Thr Glu
420 425 430
Ala Asp Arg Leu Arg Phe Leu Ala Ser Arg Glu Gly Lys Asp Glu Tyr
435 440 445
Ala Glu Trp Val Val Ala Asn Gln Arg Ser Leu Leu Glu Val Met Glu
450 455 460
Ala Phe Pro Ser Ala Arg Pro Pro Leu Gly Val Phe Phe Ala Ala Val
465 470 475 480
Ala Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Lys
485 490 495
Met Glu Pro Asn Arg Ile His Val Thr Cys Ala Leu Val Tyr Glu Lys
500 505 510
Thr Pro Ala Gly Arg Ile His Lys Gly Ile Cys Ser Thr Trp Met Lys
515 520 525
Asn Ala Val Pro Leu Thr Glu Ser Gln Asp Cys Ser Trp Ala Pro Ile
530 535 540
Phe Val Arg Thr Ser Asn Phe Arg Leu Pro Ile Asp Pro Lys Val Pro
545 550 555 560
Val Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe
565 570 575
Leu Gln Glu Arg Leu Ala Leu Lys Glu Ser Gly Thr Glu Leu Gly Ser
580 585 590
Ser Ile Leu Phe Phe Gly Cys Arg Asn Arg Lys Val Asp Tyr Ile Tyr
595 600 605
Glu Asn Glu Leu Asn Asn Phe Val Glu Asn Gly Ala Leu Ser Glu Leu
610 615 620
Asp Val Ala Phe Ser Arg Asp Gly Pro Thr Lys Glu Tyr Val Gln His
625 630 635 640
Lys Met Thr Gln Lys Ala Ser Glu Ile Trp Asn Met Leu Ser Glu Gly
645 650 655
Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Lys Asp Val
660 665 670
His Arg Thr Leu His Thr Ile Val Gln Glu Gln Gly Ser Leu Asp Ser
675 680 685
Ser Lys Ala Glu Leu Tyr Val Lys Asn Leu Gln Met Ser Gly Arg Tyr
690 695 700
Leu Arg Asp Val Trp
705
<210> 28
<211> 707
<212> PRT
<213> Stevia rebaudiana
<400> 28
Met Gln Ser Asn Ser Val Lys Ile Ser Pro Leu Asp Leu Val Thr Ala
1 5 10 15
Leu Phe Ser Gly Lys Val Leu Asp Thr Ser Asn Ala Ser Glu Ser Gly
20 25 30
Glu Ser Ala Met Leu Pro Thr Ile Ala Met Ile Met Glu Asn Arg Glu
35 40 45
Leu Leu Met Ile Leu Thr Thr Ser Val Ala Val Leu Ile Gly Cys Val
50 55 60
Val Val Leu Val Trp Arg Arg Ser Ser Thr Lys Lys Ser Ala Leu Glu
65 70 75 80
Pro Pro Val Ile Val Val Pro Lys Arg Val Gln Glu Glu Glu Val Asp
85 90 95
Asp Gly Lys Lys Lys Val Thr Val Phe Phe Gly Thr Gln Thr Gly Thr
100 105 110
Ala Glu Gly Phe Ala Lys Ala Leu Val Glu Glu Ala Lys Ala Arg Tyr
115 120 125
Glu Lys Ala Val Phe Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp
130 135 140
Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Ser Leu Ala Phe Phe
145 150 155 160
Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg
165 170 175
Phe Tyr Lys Trp Phe Thr Glu Gly Asp Ala Lys Gly Glu Trp Leu Asn
180 185 190
Lys Leu Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln Tyr Glu His
195 200 205
Phe Asn Lys Ile Ala Lys Val Val Asp Asp Gly Leu Val Glu Gln Gly
210 215 220
Ala Lys Arg Leu Val Pro Val Gly Leu Gly Asp Asp Asp Gln Cys Ile
225 230 235 240
Glu Asp Asp Phe Thr Ala Trp Lys Glu Leu Val Trp Pro Glu Leu Asp
245 250 255
Gln Leu Leu Arg Asp Glu Asp Asp Thr Thr Val Ala Thr Pro Tyr Thr
260 265 270
Ala Ala Val Ala Glu Tyr Arg Val Val Phe His Glu Lys Pro Asp Ala
275 280 285
Leu Ser Glu Asp Tyr Ser Tyr Thr Asn Gly His Ala Val His Asp Ala
290 295 300
Gln His Pro Cys Arg Ser Asn Val Ala Val Lys Lys Glu Leu His Ser
305 310 315 320
Pro Glu Ser Asp Arg Ser Cys Thr His Leu Glu Phe Asp Ile Ser Asn
325 330 335
Thr Gly Leu Ser Tyr Glu Thr Gly Asp His Val Gly Val Tyr Cys Glu
340 345 350
Asn Leu Ser Glu Val Val Asn Asp Ala Glu Arg Leu Val Gly Leu Pro
355 360 365
Pro Asp Thr Tyr Ser Ser Ile His Thr Asp Ser Glu Asp Gly Ser Pro
370 375 380
Leu Gly Gly Ala Ser Leu Pro Pro Pro Phe Pro Pro Cys Thr Leu Arg
385 390 395 400
Lys Ala Leu Thr Cys Tyr Ala Asp Val Leu Ser Ser Pro Lys Lys Ser
405 410 415
Ala Leu Leu Ala Leu Ala Ala His Ala Thr Asp Pro Ser Glu Ala Asp
420 425 430
Arg Leu Lys Phe Leu Ala Ser Pro Ala Gly Lys Asp Glu Tyr Ser Gln
435 440 445
Trp Ile Val Ala Ser Gln Arg Ser Leu Leu Glu Val Met Glu Ala Phe
450 455 460
Pro Ser Ala Lys Pro Ser Leu Gly Val Phe Phe Ala Ser Val Ala Pro
465 470 475 480
Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Lys Met Ala
485 490 495
Pro Asp Arg Ile His Val Thr Cys Ala Leu Val Tyr Glu Lys Thr Pro
500 505 510
Ala Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys Asn Ala
515 520 525
Val Pro Met Thr Glu Ser Gln Asp Cys Ser Trp Ala Pro Ile Tyr Val
530 535 540
Arg Thr Ser Asn Phe Arg Leu Pro Ser Asp Pro Lys Val Pro Val Ile
545 550 555 560
Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe Leu Gln
565 570 575
Glu Arg Leu Ala Leu Lys Glu Ala Gly Thr Asp Leu Gly Leu Ser Ile
580 585 590
Leu Phe Phe Gly Cys Arg Asn Arg Lys Val Asp Phe Ile Tyr Glu Asn
595 600 605
Glu Leu Asn Asn Phe Val Glu Thr Gly Ala Leu Ser Glu Leu Ile Val
610 615 620
Ala Phe Ser Arg Glu Gly Pro Thr Lys Glu Tyr Val Gln His Lys Met
625 630 635 640
Ser Glu Lys Ala Ser Asp Ile Trp Asn Leu Leu Ser Glu Gly Ala Tyr
645 650 655
Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Lys Asp Val His Arg
660 665 670
Thr Leu His Thr Ile Val Gln Glu Gln Gly Ser Leu Asp Ser Ser Lys
675 680 685
Ala Glu Leu Tyr Val Lys Asn Leu Gln Met Ser Gly Arg Tyr Leu Arg
690 695 700
Asp Val Trp
705
<210> 29
<211> 460
<212> PRT
<213> Stevia rebaudiana
<400> 29
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 30
<211> 481
<212> PRT
<213> Stevia rebaudiana
<400> 30
Met Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe Ile
1 5 10 15
Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala Gln
20 25 30
Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp Phe
35 40 45
Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp Gly
50 55 60
Ala Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His Ser
65 70 75 80
Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile Glu
85 90 95
Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro Asp
100 105 110
Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr Ile
115 120 125
Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr Leu
130 135 140
Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile Glu
145 150 155 160
Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly Tyr
165 170 175
Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg Leu
180 185 190
Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val Leu
195 200 205
Met Phe Thr Thr Glu Ala Pro Gln Arg Ser His Lys Val Ser His His
210 215 220
Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr Leu
225 230 235 240
Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu Leu
245 250 255
Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser Leu
260 265 270
His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp Leu
275 280 285
Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser Thr
290 295 300
Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu Ala
305 310 315 320
Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val Ile
325 330 335
Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys Lys
340 345 350
Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys His
355 360 365
Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr Ile
370 375 380
Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser Trp
385 390 395 400
Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val Gly
405 410 415
Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu Val
420 425 430
Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala Lys
435 440 445
Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser Ser
450 455 460
Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala Arg
465 470 475 480
Asn
<210> 31
<211> 1586
<212> DNA
<213> Stevia rebaudiana
<400> 31
atggatgcaa tggctacaac tgagaagaaa ccacacgtca tcttcatacc atttccagca 60
caaagccaca ttaaagccat gctcaaacta gcacaacttc tccaccacaa aggactccag 120
ataaccttcg tcaacaccga cttcatccac aaccagtttc ttgaatcatc gggcccacat 180
tgtctagacg gtgcaccggg tttccggttc gaaaccattc cggatggtgt ttctcacagt 240
ccggaagcga gcatcccaat cagagaatca ctcttgagat ccattgaaac caacttcttg 300
gatcgtttca ttgatcttgt aaccaaactt ccggatcctc cgacttgtat tatctcagat 360
gggttcttgt cggttttcac aattgacgct gcaaaaaagc ttggaattcc ggtcatgatg 420
tattggacac ttgctgcctg tgggttcatg ggtttttacc atattcattc tctcattgag 480
aaaggatttg caccacttaa agatgcaagt tacttgacaa atgggtattt ggacaccgtc 540
attgattggg ttccgggaat ggaaggcatc cgtctcaagg atttcccgct ggactggagc 600
actgacctca atgacaaagt tttgatgttc actacggaag ctcctcaaag gtcacacaag 660
gtttcacatc atattttcca cacgttcgat gagttggagc ctagtattat aaaaactttg 720
tcattgaggt ataatcacat ttacaccatc ggcccactgc aattacttct tgatcaaata 780
cccgaagaga aaaagcaaac tggaattacg agtctccatg gatacagttt agtaaaagaa 840
gaaccagagt gtttccagtg gcttcagtct aaagaaccaa attccgtcgt ttatgtaaat 900
tttggaagta ctacagtaat gtctttagaa gacatgacgg aatttggttg gggacttgct 960
aatagcaacc attatttcct ttggatcatc cgatcaaact tggtgatagg ggaaaatgca 1020
gttttgcccc ctgaacttga ggaacatata aagaaaagag gctttattgc tagctggtgt 1080
tcacaagaaa aggtcttgaa gcacccttcg gttggagggt tcttgactca ttgtgggtgg 1140
ggatcgacca tcgagagctt gtctgctggg gtgccaatga tatgctggcc ttattcgtgg 1200
gaccagctga ccaactgtag gtatatatgc aaagaatggg aggttgggct cgagatggga 1260
accaaagtga aacgagatga agtcaagagg cttgtacaag agttgatggg agaaggaggt 1320
cacaaaatga ggaacaaggc taaagattgg aaagaaaagg ctcgcattgc aatagctcct 1380
aacggttcat cttctttgaa catagacaaa atggtcaagg aaatcaccgt gctagcaaga 1440
aactagttac aaagttgttt cacattgtgc tttctattta agatgtaact ttgttctaat 1500
ttaatattgt ctagatgtat tgaaccataa gtttagttgg tctcaggaat tgatttttaa 1560
tgaaataatg gtcattaggg gtgagt 1586
<210> 32
<211> 1446
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized nucleotide sequence encoding Stevia rebaudiana
UGT85C2
<400> 32
atggatgcaa tggcaactac tgagaaaaag cctcatgtga tcttcattcc atttcctgca 60
caatctcaca taaaggcaat gctaaagtta gcacaactat tacaccataa gggattacag 120
ataactttcg tgaataccga cttcatccat aatcaatttc tggaatctag tggccctcat 180
tgtttggacg gagccccagg gtttagattc gaaacaattc ctgacggtgt ttcacattcc 240
ccagaggcct ccatcccaat aagagagagt ttactgaggt caatagaaac caactttttg 300
gatcgtttca ttgacttggt cacaaaactt ccagacccac caacttgcat aatctctgat 360
ggctttctgt cagtgtttac tatcgacgct gccaaaaagt tgggtatccc agttatgatg 420
tactggactc ttgctgcatg cggtttcatg ggtttctatc acatccattc tcttatcgaa 480
aagggttttg ctccactgaa agatgcatca tacttaacca acggctacct ggatactgtt 540
attgactggg taccaggtat ggaaggtata agacttaaag attttccttt ggattggtct 600
acagacctta atgataaagt attgatgttt actacagaag ctccacaaag atctcataag 660
gtttcacatc atatctttca cacctttgat gaattggaac catcaatcat caaaaccttg 720
tctctaagat acaatcatat ctacactatt ggtccattac aattacttct agatcaaatt 780
cctgaagaga aaaagcaaac tggtattaca tccttacacg gctactcttt agtgaaagag 840
gaaccagaat gttttcaatg gctacaaagt aaagagccta attctgtggt ctacgtcaac 900
ttcggaagta caacagtcat gtccttggaa gatatgactg aatttggttg gggccttgct 960
aattcaaatc attactttct atggattatc aggtccaatt tggtaatagg ggaaaacgcc 1020
gtattacctc cagaattgga ggaacacatc aaaaagagag gtttcattgc ttcctggtgt 1080
tctcaggaaa aggtattgaa acatccttct gttggtggtt tccttactca ttgcggttgg 1140
ggctctacaa tcgaatcact aagtgcagga gttccaatga tttgttggcc atattcatgg 1200
gaccaactta caaattgtag gtatatctgt aaagagtggg aagttggatt agaaatggga 1260
acaaaggtta aacgtgatga agtgaaaaga ttggttcagg agttgatggg ggaaggtggc 1320
cacaagatga gaaacaaggc caaagattgg aaggaaaaag ccagaattgc tattgctcct 1380
aacgggtcat cctctctaaa cattgataag atggtcaaag agattacagt cttagccaga 1440
aactaa 1446
<210> 33
<211> 787
<212> PRT
<213> Stevia rebaudiana
<400> 33
Met Lys Thr Gly Phe Ile Ser Pro Ala Thr Val Phe His His Arg Ile
1 5 10 15
Ser Pro Ala Thr Thr Phe Arg His His Leu Ser Pro Ala Thr Thr Asn
20 25 30
Ser Thr Gly Ile Val Ala Leu Arg Asp Ile Asn Phe Arg Cys Lys Ala
35 40 45
Val Ser Lys Glu Tyr Ser Asp Leu Leu Gln Lys Asp Glu Ala Ser Phe
50 55 60
Thr Lys Trp Asp Asp Asp Lys Val Lys Asp His Leu Asp Thr Asn Lys
65 70 75 80
Asn Leu Tyr Pro Asn Asp Glu Ile Lys Glu Phe Val Glu Ser Val Lys
85 90 95
Ala Met Phe Gly Ser Met Asn Asp Gly Glu Ile Asn Val Ser Ala Tyr
100 105 110
Asp Thr Ala Trp Val Ala Leu Val Gln Asp Val Asp Gly Ser Gly Ser
115 120 125
Pro Gln Phe Pro Ser Ser Leu Glu Trp Ile Ala Asn Asn Gln Leu Ser
130 135 140
Asp Gly Ser Trp Gly Asp His Leu Leu Phe Ser Ala His Asp Arg Ile
145 150 155 160
Ile Asn Thr Leu Ala Cys Val Ile Ala Leu Thr Ser Trp Asn Val His
165 170 175
Pro Ser Lys Cys Glu Lys Gly Leu Asn Phe Leu Arg Glu Asn Ile Cys
180 185 190
Lys Leu Glu Asp Glu Asn Ala Glu His Met Pro Ile Gly Phe Glu Val
195 200 205
Thr Phe Pro Ser Leu Ile Asp Ile Ala Lys Lys Leu Asn Ile Glu Val
210 215 220
Pro Glu Asp Thr Pro Ala Leu Lys Glu Ile Tyr Ala Arg Arg Asp Ile
225 230 235 240
Lys Leu Thr Lys Ile Pro Met Glu Val Leu His Lys Val Pro Thr Thr
245 250 255
Leu Leu His Ser Leu Glu Gly Met Pro Asp Leu Glu Trp Glu Lys Leu
260 265 270
Leu Lys Leu Gln Cys Lys Asp Gly Ser Phe Leu Phe Ser Pro Ser Ser
275 280 285
Thr Ala Phe Ala Leu Met Gln Thr Lys Asp Glu Lys Cys Leu Gln Tyr
290 295 300
Leu Thr Asn Ile Val Thr Lys Phe Asn Gly Gly Val Pro Asn Val Tyr
305 310 315 320
Pro Val Asp Leu Phe Glu His Ile Trp Val Val Asp Arg Leu Gln Arg
325 330 335
Leu Gly Ile Ala Arg Tyr Phe Lys Ser Glu Ile Lys Asp Cys Val Glu
340 345 350
Tyr Ile Asn Lys Tyr Trp Thr Lys Asn Gly Ile Cys Trp Ala Arg Asn
355 360 365
Thr His Val Gln Asp Ile Asp Asp Thr Ala Met Gly Phe Arg Val Leu
370 375 380
Arg Ala His Gly Tyr Asp Val Thr Pro Asp Val Phe Arg Gln Phe Glu
385 390 395 400
Lys Asp Gly Lys Phe Val Cys Phe Ala Gly Gln Ser Thr Gln Ala Val
405 410 415
Thr Gly Met Phe Asn Val Tyr Arg Ala Ser Gln Met Leu Phe Pro Gly
420 425 430
Glu Arg Ile Leu Glu Asp Ala Lys Lys Phe Ser Tyr Asn Tyr Leu Lys
435 440 445
Glu Lys Gln Ser Thr Asn Glu Leu Leu Asp Lys Trp Ile Ile Ala Lys
450 455 460
Asp Leu Pro Gly Glu Val Gly Tyr Ala Leu Asp Ile Pro Trp Tyr Ala
465 470 475 480
Ser Leu Pro Arg Leu Glu Thr Arg Tyr Tyr Leu Glu Gln Tyr Gly Gly
485 490 495
Glu Asp Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg Met Gly Tyr Val
500 505 510
Ser Asn Asn Thr Tyr Leu Glu Met Ala Lys Leu Asp Tyr Asn Asn Tyr
515 520 525
Val Ala Val Leu Gln Leu Glu Trp Tyr Thr Ile Gln Gln Trp Tyr Val
530 535 540
Asp Ile Gly Ile Glu Lys Phe Glu Ser Asp Asn Ile Lys Ser Val Leu
545 550 555 560
Val Ser Tyr Tyr Leu Ala Ala Ala Ser Ile Phe Glu Pro Glu Arg Ser
565 570 575
Lys Glu Arg Ile Ala Trp Ala Lys Thr Thr Ile Leu Val Asp Lys Ile
580 585 590
Thr Ser Ile Phe Asp Ser Ser Gln Ser Ser Lys Glu Asp Ile Thr Ala
595 600 605
Phe Ile Asp Lys Phe Arg Asn Lys Ser Ser Ser Lys Lys His Ser Ile
610 615 620
Asn Gly Glu Pro Trp His Glu Val Met Val Ala Leu Lys Lys Thr Leu
625 630 635 640
His Gly Phe Ala Leu Asp Ala Leu Met Thr His Ser Gln Asp Ile His
645 650 655
Pro Gln Leu His Gln Ala Trp Glu Met Trp Leu Thr Lys Leu Gln Asp
660 665 670
Gly Val Asp Val Thr Ala Glu Leu Met Val Gln Met Ile Asn Met Thr
675 680 685
Ala Gly Arg Trp Val Ser Lys Glu Leu Leu Thr His Pro Gln Tyr Gln
690 695 700
Arg Leu Ser Thr Val Thr Asn Ser Val Cys His Asp Ile Thr Lys Leu
705 710 715 720
His Asn Phe Lys Glu Asn Ser Thr Thr Val Asp Ser Lys Val Gln Glu
725 730 735
Leu Val Gln Leu Val Phe Ser Asp Thr Pro Asp Asp Leu Asp Gln Asp
740 745 750
Met Lys Gln Thr Phe Leu Thr Val Met Lys Thr Phe Tyr Tyr Lys Ala
755 760 765
Trp Cys Asp Pro Asn Thr Ile Asn Asp His Ile Ser Lys Val Phe Glu
770 775 780
Ile Val Ile
785
<210> 34
<211> 527
<212> PRT
<213> Streptomyces clavuligerus
<400> 34
Met Pro Asp Ala His Asp Ala Pro Pro Pro Gln Ile Arg Gln Arg Thr
1 5 10 15
Leu Val Asp Glu Ala Thr Gln Leu Leu Thr Glu Ser Ala Glu Asp Ala
20 25 30
Trp Gly Glu Val Ser Val Ser Glu Tyr Glu Thr Ala Arg Leu Val Ala
35 40 45
His Ala Thr Trp Leu Gly Gly His Ala Thr Arg Val Ala Phe Leu Leu
50 55 60
Glu Arg Gln His Glu Asp Gly Ser Trp Gly Pro Pro Gly Gly Tyr Arg
65 70 75 80
Leu Val Pro Thr Leu Ser Ala Val His Ala Leu Leu Thr Cys Leu Ala
85 90 95
Ser Pro Ala Gln Asp His Gly Val Pro His Asp Arg Leu Leu Arg Ala
100 105 110
Val Asp Ala Gly Leu Thr Ala Leu Arg Arg Leu Gly Thr Ser Asp Ser
115 120 125
Pro Pro Asp Thr Ile Ala Val Glu Leu Val Ile Pro Ser Leu Leu Glu
130 135 140
Gly Ile Gln His Leu Leu Asp Pro Ala His Pro His Ser Arg Pro Ala
145 150 155 160
Phe Ser Gln His Arg Gly Ser Leu Val Cys Pro Gly Gly Leu Asp Gly
165 170 175
Arg Thr Leu Gly Ala Leu Arg Ser His Ala Ala Ala Gly Thr Pro Val
180 185 190
Pro Gly Lys Val Trp His Ala Ser Glu Thr Leu Gly Leu Ser Thr Glu
195 200 205
Ala Ala Ser His Leu Gln Pro Ala Gln Gly Ile Ile Gly Gly Ser Ala
210 215 220
Ala Ala Thr Ala Thr Trp Leu Thr Arg Val Ala Pro Ser Gln Gln Ser
225 230 235 240
Asp Ser Ala Arg Arg Tyr Leu Glu Glu Leu Gln His Arg Tyr Ser Gly
245 250 255
Pro Val Pro Ser Ile Thr Pro Ile Thr Tyr Phe Glu Arg Ala Trp Leu
260 265 270
Leu Asn Asn Phe Ala Ala Ala Gly Val Pro Cys Glu Ala Pro Ala Ala
275 280 285
Leu Leu Asp Ser Leu Glu Ala Ala Leu Thr Pro Gln Gly Ala Pro Ala
290 295 300
Gly Ala Gly Leu Pro Pro Asp Ala Asp Asp Thr Ala Ala Val Leu Leu
305 310 315 320
Ala Leu Ala Thr His Gly Arg Gly Arg Arg Pro Glu Val Leu Met Asp
325 330 335
Tyr Arg Thr Asp Gly Tyr Phe Gln Cys Phe Ile Gly Glu Arg Thr Pro
340 345 350
Ser Ile Ser Thr Asn Ala His Val Leu Glu Thr Leu Gly His His Val
355 360 365
Ala Gln His Pro Gln Asp Arg Ala Arg Tyr Gly Ser Ala Met Asp Thr
370 375 380
Ala Ser Ala Trp Leu Leu Ala Ala Gln Lys Gln Asp Gly Ser Trp Leu
385 390 395 400
Asp Lys Trp His Ala Ser Pro Tyr Tyr Ala Thr Val Cys Cys Thr Gln
405 410 415
Ala Leu Ala Ala His Ala Ser Pro Ala Thr Ala Pro Ala Arg Gln Arg
420 425 430
Ala Val Arg Trp Val Leu Ala Thr Gln Arg Ser Asp Gly Gly Trp Gly
435 440 445
Leu Trp His Ser Thr Val Glu Glu Thr Ala Tyr Ala Leu Gln Ile Leu
450 455 460
Ala Pro Pro Ser Gly Gly Gly Asn Ile Pro Val Gln Gln Ala Leu Thr
465 470 475 480
Arg Gly Arg Ala Arg Leu Cys Gly Ala Leu Pro Leu Thr Pro Leu Trp
485 490 495
His Asp Lys Asp Leu Tyr Thr Pro Val Arg Val Val Arg Ala Ala Arg
500 505 510
Ala Ala Ala Leu Tyr Thr Thr Arg Asp Leu Leu Leu Pro Pro Leu
515 520 525
<210> 35
<211> 516
<212> PRT
<213> Bradyrhizobium diazoefficiens
<400> 35
Met Asn Ala Leu Ser Glu His Ile Leu Ser Glu Leu Arg Arg Leu Leu
1 5 10 15
Ser Glu Met Ser Asp Gly Gly Ser Val Gly Pro Ser Val Tyr Asp Thr
20 25 30
Ala Gln Ala Leu Arg Phe His Gly Asn Val Thr Gly Arg Gln Asp Ala
35 40 45
Tyr Ala Trp Leu Ile Ala Gln Gln Gln Ala Asp Gly Gly Trp Gly Ser
50 55 60
Ala Asp Phe Pro Leu Phe Arg His Ala Pro Thr Trp Ala Ala Leu Leu
65 70 75 80
Ala Leu Gln Arg Ala Asp Pro Leu Pro Gly Ala Ala Asp Ala Val Gln
85 90 95
Thr Ala Thr Arg Phe Leu Gln Arg Gln Pro Asp Pro Tyr Ala His Ala
100 105 110
Val Pro Glu Asp Ala Pro Ile Gly Ala Glu Leu Ile Leu Pro Gln Phe
115 120 125
Cys Gly Glu Ala Ala Trp Leu Leu Gly Gly Val Ala Phe Pro Arg His
130 135 140
Pro Ala Leu Leu Pro Leu Arg Gln Ala Cys Leu Val Lys Leu Gly Ala
145 150 155 160
Val Ala Met Leu Pro Ser Gly His Pro Leu Leu His Ser Trp Glu Ala
165 170 175
Trp Gly Thr Ser Pro Thr Thr Ala Cys Pro Asp Asp Asp Gly Ser Ile
180 185 190
Gly Ile Ser Pro Ala Ala Thr Ala Ala Trp Arg Ala Gln Ala Val Thr
195 200 205
Arg Gly Ser Thr Pro Gln Val Gly Arg Ala Asp Ala Tyr Leu Gln Met
210 215 220
Ala Ser Arg Ala Thr Arg Ser Gly Ile Glu Gly Val Phe Pro Asn Val
225 230 235 240
Trp Pro Ile Asn Val Phe Glu Pro Cys Trp Ser Leu Tyr Thr Leu His
245 250 255
Leu Ala Gly Leu Phe Ala His Pro Ala Leu Ala Glu Ala Val Arg Val
260 265 270
Ile Val Ala Gln Leu Glu Ala Arg Leu Gly Val His Gly Leu Gly Pro
275 280 285
Ala Leu His Phe Ala Ala Asp Ala Asp Asp Thr Ala Val Ala Leu Cys
290 295 300
Val Leu His Leu Ala Gly Arg Asp Pro Ala Val Asp Ala Leu Arg His
305 310 315 320
Phe Glu Ile Gly Glu Leu Phe Val Thr Phe Pro Gly Glu Arg Asn Ala
325 330 335
Ser Val Ser Thr Asn Ile His Ala Leu His Ala Leu Arg Leu Leu Gly
340 345 350
Lys Pro Ala Ala Gly Ala Ser Ala Tyr Val Glu Ala Asn Arg Asn Pro
355 360 365
His Gly Leu Trp Asp Asn Glu Lys Trp His Val Ser Trp Leu Tyr Pro
370 375 380
Thr Ala His Ala Val Ala Ala Leu Ala Gln Gly Lys Pro Gln Trp Arg
385 390 395 400
Asp Glu Arg Ala Leu Ala Ala Leu Leu Gln Ala Gln Arg Asp Asp Gly
405 410 415
Gly Trp Gly Ala Gly Arg Gly Ser Thr Phe Glu Glu Thr Ala Tyr Ala
420 425 430
Leu Phe Ala Leu His Val Met Asp Gly Ser Glu Glu Ala Thr Gly Arg
435 440 445
Arg Arg Ile Ala Gln Val Val Ala Arg Ala Leu Glu Trp Met Leu Ala
450 455 460
Arg His Ala Ala His Gly Leu Pro Gln Thr Pro Leu Trp Ile Gly Lys
465 470 475 480
Glu Leu Tyr Cys Pro Thr Arg Val Val Arg Val Ala Glu Leu Ala Gly
485 490 495
Leu Trp Leu Ala Leu Arg Trp Gly Arg Arg Val Leu Ala Glu Gly Ala
500 505 510
Gly Ala Ala Pro
515
<210> 36
<211> 4577
<212> DNA
<213> Zea mays
<400> 36
gacctgacca ccaccccccg gccggccctt tcattctttc cttactttct tcctcctgct 60
gctcttgccg tttcagtgat tattagctgc tgtacgtgcg tgcgtacatt gttctctctg 120
ctgacaccca tacacgctgt agcttctaca cataccagtt cgatcgcaag ctatagcatg 180
gggcttcaat catcgcccat gctgctgcca gcgccgacgg caacggcggc cggcagcggg 240
tcacagtggc gcacggctgt ggcgggtaat ggtaactcgt ttatcttctt ctacacgtaa 300
tctctattat atacctagat tttctccaca ggcagatcag attctttaca cagctgtatt 360
ctcaaaaaaa actcatagaa aaaaaagaaa aaactaaacc aaaggagcga cctcaacctg 420
taccagtgcc cctgctagca gtagcttcgt tctgtccctt ttttttcatt tggatcctct 480
acataaatgc tgggtggtgg tgtcctttca cgcacacatc cgcagatagc gccccagcag 540
catttatgtg gggacgacgg ctctgaaatg aattactagt cagtttcatg cgtttcagtg 600
cgagtattat agtagtagat ctcttctccg atatatccgg ccaaaggaag aagagaagag 660
aaaccacaca tctcattctc aactagtagt agaaaagtaa aaacgtacta caagcgcaag 720
cgcaaagatg gttctttcat cgtcttgcac aacagttcct cacctttctt cccttgcggt 780
cgttcaacta ggcccatgga gttcccgcat caagaagaag acggatacag tcgccgtccc 840
cgcggccgcc ggccggtgga ggagggcact ggcgcgggcc cagcacacca gcgaatccgc 900
cgccgtcgcc aaaggtacgg gtgatcgcta gctttgatag ctccaaatct gagcagcaaa 960
ttaaatagct aggtttgtaa cgcacgcacg catgcaggtt cgtccctaac gcccatcgtg 1020
agaaccgatg ccgaaagccg ccgcacgaga tggcctacgg acgacgacga cgctgagccg 1080
ctggtcgacg agatcagggc aatgctgacg tcgatgagcg acggggacat cagcgtgtcg 1140
gcgtacgaca ccgcctgggt gggtcttgtg cccaggctgg acggcggcga gggcccgcag 1200
ttcccggccg ccgtgcggtg gatccggaac aaccagctcc ccgacggctc gtggggcgac 1260
gcggccctgt tctccgcgta cgaccgcctg atcaacacgc tggcgtgcgt cgtcacgctc 1320
accaggtggt cgctggagcc cgagatgcgc ggcagaggta cgtaattact gtgtgctggc 1380
cgatcgagag aacacacgac ggcagtgtac ctcgacagaa aacgggcgtt gctgaagact 1440
caagtgtgtg tgtgtgtgtg ttcacagggc tctctttcct cggccggaac atgtggaagc 1500
tagcgacgga ggacgaggag tccatgccga tagggttcga gctcgcgttc ccttctctca 1560
tcgaactagc caagagtctg ggcgtccacg acttcccgta cgaccaccag gctctgcagg 1620
gaatatactc gagcagggag atcaagatga agaggattcc taaggaagtg atgcacacgg 1680
ttcccacatc cattctccac agcctggaag ggatgcccgg gctagactgg gcgaagctgc 1740
tgaaactgca gtcgagcgac gggtccttcc tcttctctcc cgcggccacc gcgtacgctc 1800
tcatgaacac cggcgacgac aggtgcttca gctacatcga caggacagtc aagaaattca 1860
acggaggagg tacgcaagca gtagcgtaga tacatgggca tagcatgcat gcatgcaatg 1920
cagcgttgcc cactgcatgc gccttccttc cttccttctc gtctcttcaa cggttcgtct 1980
tctctcgccg tttctcgcag tgcccaacgt ctaccccgtg gaccttttcg agcacatatg 2040
ggctgtcgat cgcctggagc gtctcgggat ctcccgctac ttccagaaag agattgagca 2100
gtgcatggac tacgtgaaca ggcactggac tgaggacggg atctgctggg cgaggaactc 2160
cgacgtgaag gaggtggacg acacggccat ggctttccgc ctgctacggc tgcacggata 2220
cagcgtctcg ccaggtacgt aacaaacaca aaaaaaaaaa acgcgcagac aacagagatc 2280
gtcacgtcat acacacgcgt gtcctgaaca tttttcattt ggtctcccac ccatcgtacg 2340
taataataat aaaaaaaaac gtgcttctgc cctgcctgtg tacgtgtaga tgtgttcaag 2400
aacttcgaga aggacgggga gttcttcgcc ttcgtggggc agtcgaacca ggcggtgacg 2460
gggatgtaca acctcaacag ggcctcccag ataagcttcc cgggggagga cgtcctgcac 2520
cgtgcagggg ctttctcgta cgagtttctc aggcggaaag aggccgaggg agcgctccgt 2580
gacaaatgga tcatatctaa ggacctgcct ggggaggtag tgtacaccct ggacttccct 2640
tggtatggga acctgccgcg cgtggaggcg agagactatc tggaacagta cggcggcggc 2700
gacgatgtct ggatcgggaa gacgctctac aggtagatag atctttttag ctattaattg 2760
gtttcagatc gaccagataa aatttgcatt attggttctt ttgatgcatg taattgaaag 2820
ccaataaata acctcagtat gcgtgatggc tgacttttgc attggcagga tgcctcttgt 2880
gaataacgat gtgtatcttg agctggctag gatggacttc aaccattgcc aagccctaca 2940
tcagcttgag tggcaaggcc tgaaaaggta tgtatgttac tatatatata cagcccggtt 3000
gttgagtttt ttttttattt tatttttttc gcgattacca tttcttctcg atgcaaaata 3060
aatctgcaca gatcatcata tatatccttg atgatatata agggcttctc gtatatatat 3120
cttatcacct atatatacat aggtggtaca ctgagaaccg gctcatggat ttcggagtgg 3180
cgcaagagga tgctctgcga gcgtatttcc tggccgccgc ttccgtctac gagccgtgcc 3240
gagccgcgga gcggcttgcg tgggccagag cggcgatact tgccaacgcc gtctctaccc 3300
atctccgtaa cagcccctca ttcagagaac gcttggaaca ctccttgcgt tgccgcccca 3360
gtgaagaaac ggatggatca tggtaataag ctgatcgatg ggaaattaaa aatttaagtt 3420
ttttttttct tttttgttgc cattatctga gaccaatgca atgtggtgca tatatatcca 3480
ggttcaactc atcaagtgga agtgacgctg ttcttgtgaa ggcagttctg cggcttaccg 3540
actcgttagc gcgagaagcg cagccgattc atggcggtga tccggaggac atcatccaca 3600
agctactgag atcagctgta agttaaacgt aacgttcaga agaagatttt tttttttttt 3660
tgcagttaac aagtactacg acatctatcg tttttgttca gcatgcacag tcatcctagc 3720
tactaatacc attattcttc tgtgaacttg tgtagtgggc tgaatgggtc agggagaagg 3780
cagatgcagc agacagcgtg tgtaatggat ccagtgctgt ggaacaagaa gggtcgcgca 3840
tggttcatga caagcaaacg tgtctgcttt tagctcgaat gatcgagatc agcgctgggc 3900
gagctgcagg tgaggctgcg agcgaagatg gtgaccgtcg gattatccag ctcactgggt 3960
ctatatgtga cagtctcaag cagaagatgc tagtatctca ggtatagcac atatatacta 4020
cagaaagttt gtgcgtagtt attatttccc ttttttcatg tgacgaacat gatgacctga 4080
tgatgcatgt atatggcttc atataggacc ccgagaagaa cgaagagatg atgagccatg 4140
tcgatgacga attgaagctg cgtatacgag agttcgttca gtatcttctg agactcggtg 4200
agaagaaaac cggcagcagc gagacaaggc agacctttct gagcatcgtg aaaagctgtt 4260
actacgctgc tcactgcccg ccgcatgtgg tagacaggca tatttccaga gttatttttg 4320
aacctgtttc cgccgcaaaa taatggtaat ggtagatgtg aatgtgatat ggagataaga 4380
gagagagaaa atgttgatag tggaaattgg cgttgatgtc gcctccacat tctttacgca 4440
aaagtagcgt ctgttttgga taaaaaaaat ccagtttctg taaattatag aataaatcaa 4500
tcgctgtgtc ccaaactcta aaatgttatt ctgtgaagta tggaataaat cggtcactat 4560
acctatcttg tggatgc 4577
<210> 37
<211> 827
<212> PRT
<213> Zea mays
<400> 37
Met Val Leu Ser Ser Ser Cys Thr Thr Val Pro His Leu Ser Ser Leu
1 5 10 15
Ala Val Val Gln Leu Gly Pro Trp Ser Ser Arg Ile Lys Lys Lys Thr
20 25 30
Asp Thr Val Ala Val Pro Ala Ala Ala Gly Arg Trp Arg Arg Ala Leu
35 40 45
Ala Arg Ala Gln His Thr Ser Glu Ser Ala Ala Val Ala Lys Gly Ser
50 55 60
Ser Leu Thr Pro Ile Val Arg Thr Asp Ala Glu Ser Arg Arg Thr Arg
65 70 75 80
Trp Pro Thr Asp Asp Asp Asp Ala Glu Pro Leu Val Asp Glu Ile Arg
85 90 95
Ala Met Leu Thr Ser Met Ser Asp Gly Asp Ile Ser Val Ser Ala Tyr
100 105 110
Asp Thr Ala Trp Val Gly Leu Val Pro Arg Leu Asp Gly Gly Glu Gly
115 120 125
Pro Gln Phe Pro Ala Ala Val Arg Trp Ile Arg Asn Asn Gln Leu Pro
130 135 140
Asp Gly Ser Trp Gly Asp Ala Ala Leu Phe Ser Ala Tyr Asp Arg Leu
145 150 155 160
Ile Asn Thr Leu Ala Cys Val Val Thr Leu Thr Arg Trp Ser Leu Glu
165 170 175
Pro Glu Met Arg Gly Arg Gly Leu Ser Phe Leu Gly Arg Asn Met Trp
180 185 190
Lys Leu Ala Thr Glu Asp Glu Glu Ser Met Pro Ile Gly Phe Glu Leu
195 200 205
Ala Phe Pro Ser Leu Ile Glu Leu Ala Lys Ser Leu Gly Val His Asp
210 215 220
Phe Pro Tyr Asp His Gln Ala Leu Gln Gly Ile Tyr Ser Ser Arg Glu
225 230 235 240
Ile Lys Met Lys Arg Ile Pro Lys Glu Val Met His Thr Val Pro Thr
245 250 255
Ser Ile Leu His Ser Leu Glu Gly Met Pro Gly Leu Asp Trp Ala Lys
260 265 270
Leu Leu Lys Leu Gln Ser Ser Asp Gly Ser Phe Leu Phe Ser Pro Ala
275 280 285
Ala Thr Ala Tyr Ala Leu Met Asn Thr Gly Asp Asp Arg Cys Phe Ser
290 295 300
Tyr Ile Asp Arg Thr Val Lys Lys Phe Asn Gly Gly Val Pro Asn Val
305 310 315 320
Tyr Pro Val Asp Leu Phe Glu His Ile Trp Ala Val Asp Arg Leu Glu
325 330 335
Arg Leu Gly Ile Ser Arg Tyr Phe Gln Lys Glu Ile Glu Gln Cys Met
340 345 350
Asp Tyr Val Asn Arg His Trp Thr Glu Asp Gly Ile Cys Trp Ala Arg
355 360 365
Asn Ser Asp Val Lys Glu Val Asp Asp Thr Ala Met Ala Phe Arg Leu
370 375 380
Leu Arg Leu His Gly Tyr Ser Val Ser Pro Asp Val Phe Lys Asn Phe
385 390 395 400
Glu Lys Asp Gly Glu Phe Phe Ala Phe Val Gly Gln Ser Asn Gln Ala
405 410 415
Val Thr Gly Met Tyr Asn Leu Asn Arg Ala Ser Gln Ile Ser Phe Pro
420 425 430
Gly Glu Asp Val Leu His Arg Ala Gly Ala Phe Ser Tyr Glu Phe Leu
435 440 445
Arg Arg Lys Glu Ala Glu Gly Ala Leu Arg Asp Lys Trp Ile Ile Ser
450 455 460
Lys Asp Leu Pro Gly Glu Val Val Tyr Thr Leu Asp Phe Pro Trp Tyr
465 470 475 480
Gly Asn Leu Pro Arg Val Glu Ala Arg Asp Tyr Leu Glu Gln Tyr Gly
485 490 495
Gly Gly Asp Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg Met Pro Leu
500 505 510
Val Asn Asn Asp Val Tyr Leu Glu Leu Ala Arg Met Asp Phe Asn His
515 520 525
Cys Gln Ala Leu His Gln Leu Glu Trp Gln Gly Leu Lys Arg Trp Tyr
530 535 540
Thr Glu Asn Arg Leu Met Asp Phe Gly Val Ala Gln Glu Asp Ala Leu
545 550 555 560
Arg Ala Tyr Phe Leu Ala Ala Ala Ser Val Tyr Glu Pro Cys Arg Ala
565 570 575
Ala Glu Arg Leu Ala Trp Ala Arg Ala Ala Ile Leu Ala Asn Ala Val
580 585 590
Ser Thr His Leu Arg Asn Ser Pro Ser Phe Arg Glu Arg Leu Glu His
595 600 605
Ser Leu Arg Cys Arg Pro Ser Glu Glu Thr Asp Gly Ser Trp Phe Asn
610 615 620
Ser Ser Ser Gly Ser Asp Ala Val Leu Val Lys Ala Val Leu Arg Leu
625 630 635 640
Thr Asp Ser Leu Ala Arg Glu Ala Gln Pro Ile His Gly Gly Asp Pro
645 650 655
Glu Asp Ile Ile His Lys Leu Leu Arg Ser Ala Trp Ala Glu Trp Val
660 665 670
Arg Glu Lys Ala Asp Ala Ala Asp Ser Val Cys Asn Gly Ser Ser Ala
675 680 685
Val Glu Gln Glu Gly Ser Arg Met Val His Asp Lys Gln Thr Cys Leu
690 695 700
Leu Leu Ala Arg Met Ile Glu Ile Ser Ala Gly Arg Ala Ala Gly Glu
705 710 715 720
Ala Ala Ser Glu Asp Gly Asp Arg Arg Ile Ile Gln Leu Thr Gly Ser
725 730 735
Ile Cys Asp Ser Leu Lys Gln Lys Met Leu Val Ser Gln Asp Pro Glu
740 745 750
Lys Asn Glu Glu Met Met Ser His Val Asp Asp Glu Leu Lys Leu Arg
755 760 765
Ile Arg Glu Phe Val Gln Tyr Leu Leu Arg Leu Gly Glu Lys Lys Thr
770 775 780
Gly Ser Ser Glu Thr Arg Gln Thr Phe Leu Ser Ile Val Lys Ser Cys
785 790 795 800
Tyr Tyr Ala Ala His Cys Pro Pro His Val Val Asp Arg His Ile Ser
805 810 815
Arg Val Ile Phe Glu Pro Val Ser Ala Ala Lys
820 825
<210> 38
<211> 2570
<212> DNA
<213> Arabidopsis thaliana
<400> 38
cttcttcact aaatacttag acagagaaaa cagagctttt taaagccatg tctcttcagt 60
atcatgttct aaactccatt ccaagtacaa cctttctcag ttctactaaa acaacaatat 120
cttcttcttt ccttaccatc tcaggatctc ctctcaatgt cgctagagac aaatccagaa 180
gcggttccat acattgttca aagcttcgaa ctcaagaata cattaattct caagaggttc 240
aacatgattt gcctctaata catgagtggc aacagcttca aggagaagat gctcctcaga 300
ttagtgttgg aagtaatagt aatgcattca aagaagcagt gaagagtgtg aaaacgatct 360
tgagaaacct aacggacggg gaaattacga tatcggctta cgatacagct tgggttgcat 420
tgatcgatgc cggagataaa actccggcgt ttccctccgc cgtgaaatgg atcgccgaga 480
accaactttc cgatggttct tggggagatg cgtatctctt ctcttatcat gatcgtctca 540
tcaataccct tgcatgcgtc gttgctctaa gatcatggaa tctctttcct catcaatgca 600
acaaaggaat cacgtttttc cgggaaaata ttgggaagct agaagacgaa aatgatgagc 660
atatgccaat cggattcgaa gtagcattcc catcgttgct tgagatagct cgaggaataa 720
acattgatgt accgtacgat tctccggtct taaaagatat atacgccaag aaagagctaa 780
agcttacaag gataccaaaa gagataatgc acaagatacc aacaacattg ttgcatagtt 840
tggaggggat gcgtgattta gattgggaaa agctcttgaa acttcaatct caagacggat 900
ctttcctctt ctctccttcc tctaccgctt ttgcattcat gcagacccga gacagtaact 960
gcctcgagta tttgcgaaat gccgtcaaac gtttcaatgg aggagttccc aatgtctttc 1020
ccgtggatct tttcgagcac atatggatag tggatcggtt acaacgttta gggatatcga 1080
gatactttga agaagagatt aaagagtgtc ttgactatgt ccacagatat tggaccgaca 1140
atggcatatg ttgggctaga tgttcccatg tccaagacat cgatgataca gccatggcat 1200
ttaggctctt aagacaacat ggataccaag tgtccgcaga tgtattcaag aactttgaga 1260
aagagggaga gtttttctgc tttgtggggc aatcaaacca agcagtaacc ggtatgttca 1320
acctataccg ggcatcacaa ttggcgtttc caagggaaga gatattgaaa aacgccaaag 1380
agttttctta taattatctg ctagaaaaac gggagagaga ggagttgatt gataagtgga 1440
ttataatgaa agacttacct ggcgagattg ggtttgcgtt agagattcca tggtacgcaa 1500
gcttgcctcg agtagagacg agattctata ttgatcaata tggtggagaa aacgacgttt 1560
ggattggcaa gactctttat aggatgccat acgtgaacaa taatggatat ctggaattag 1620
caaaacaaga ttacaacaat tgccaagctc agcatcagct cgaatgggac atattccaaa 1680
agtggtatga agaaaatagg ttaagtgagt ggggtgtgcg cagaagtgag cttctcgagt 1740
gttactactt agcggctgca actatatttg aatcagaaag gtcacatgag agaatggttt 1800
gggctaagtc aagtgtattg gttaaagcca tttcttcttc ttttggggaa tcctctgact 1860
ccagaagaag cttctccgat cagtttcatg aatacattgc caatgctcga cgaagtgatc 1920
atcactttaa tgacaggaac atgagattgg accgaccagg atcggttcag gccagtcggc 1980
ttgccggagt gttaatcggg actttgaatc aaatgtcttt tgaccttttc atgtctcatg 2040
gccgtgacgt taacaatctc ctctatctat cgtggggaga ttggatggaa aaatggaaac 2100
tatatggaga tgaaggagaa ggagagctca tggtgaagat gataattcta atgaagaaca 2160
atgacctaac taacttcttc acccacactc acttcgttcg tctcgcggaa atcatcaatc 2220
gaatctgtct tcctcgccaa tacttaaagg caaggagaaa cgatgagaag gagaagacaa 2280
taaagagtat ggagaaggag atggggaaaa tggttgagtt agcattgtcg gagagtgaca 2340
catttcgtga cgtcagcatc acgtttcttg atgtagcaaa agcattttac tactttgctt 2400
tatgtggcga tcatctccaa actcacatct ccaaagtctt gtttcaaaaa gtctagtaac 2460
ctcatcatca tcatcgatcc attaacaatc agtggatcga tgtatccata gatgcgtgaa 2520
taatatttca tgtagagaag gagaacaaat tagatcatgt agggttatca 2570
<210> 39
<211> 802
<212> PRT
<213> Arabidopsis thaliana
<400> 39
Met Ser Leu Gln Tyr His Val Leu Asn Ser Ile Pro Ser Thr Thr Phe
1 5 10 15
Leu Ser Ser Thr Lys Thr Thr Ile Ser Ser Ser Phe Leu Thr Ile Ser
20 25 30
Gly Ser Pro Leu Asn Val Ala Arg Asp Lys Ser Arg Ser Gly Ser Ile
35 40 45
His Cys Ser Lys Leu Arg Thr Gln Glu Tyr Ile Asn Ser Gln Glu Val
50 55 60
Gln His Asp Leu Pro Leu Ile His Glu Trp Gln Gln Leu Gln Gly Glu
65 70 75 80
Asp Ala Pro Gln Ile Ser Val Gly Ser Asn Ser Asn Ala Phe Lys Glu
85 90 95
Ala Val Lys Ser Val Lys Thr Ile Leu Arg Asn Leu Thr Asp Gly Glu
100 105 110
Ile Thr Ile Ser Ala Tyr Asp Thr Ala Trp Val Ala Leu Ile Asp Ala
115 120 125
Gly Asp Lys Thr Pro Ala Phe Pro Ser Ala Val Lys Trp Ile Ala Glu
130 135 140
Asn Gln Leu Ser Asp Gly Ser Trp Gly Asp Ala Tyr Leu Phe Ser Tyr
145 150 155 160
His Asp Arg Leu Ile Asn Thr Leu Ala Cys Val Val Ala Leu Arg Ser
165 170 175
Trp Asn Leu Phe Pro His Gln Cys Asn Lys Gly Ile Thr Phe Phe Arg
180 185 190
Glu Asn Ile Gly Lys Leu Glu Asp Glu Asn Asp Glu His Met Pro Ile
195 200 205
Gly Phe Glu Val Ala Phe Pro Ser Leu Leu Glu Ile Ala Arg Gly Ile
210 215 220
Asn Ile Asp Val Pro Tyr Asp Ser Pro Val Leu Lys Asp Ile Tyr Ala
225 230 235 240
Lys Lys Glu Leu Lys Leu Thr Arg Ile Pro Lys Glu Ile Met His Lys
245 250 255
Ile Pro Thr Thr Leu Leu His Ser Leu Glu Gly Met Arg Asp Leu Asp
260 265 270
Trp Glu Lys Leu Leu Lys Leu Gln Ser Gln Asp Gly Ser Phe Leu Phe
275 280 285
Ser Pro Ser Ser Thr Ala Phe Ala Phe Met Gln Thr Arg Asp Ser Asn
290 295 300
Cys Leu Glu Tyr Leu Arg Asn Ala Val Lys Arg Phe Asn Gly Gly Val
305 310 315 320
Pro Asn Val Phe Pro Val Asp Leu Phe Glu His Ile Trp Ile Val Asp
325 330 335
Arg Leu Gln Arg Leu Gly Ile Ser Arg Tyr Phe Glu Glu Glu Ile Lys
340 345 350
Glu Cys Leu Asp Tyr Val His Arg Tyr Trp Thr Asp Asn Gly Ile Cys
355 360 365
Trp Ala Arg Cys Ser His Val Gln Asp Ile Asp Asp Thr Ala Met Ala
370 375 380
Phe Arg Leu Leu Arg Gln His Gly Tyr Gln Val Ser Ala Asp Val Phe
385 390 395 400
Lys Asn Phe Glu Lys Glu Gly Glu Phe Phe Cys Phe Val Gly Gln Ser
405 410 415
Asn Gln Ala Val Thr Gly Met Phe Asn Leu Tyr Arg Ala Ser Gln Leu
420 425 430
Ala Phe Pro Arg Glu Glu Ile Leu Lys Asn Ala Lys Glu Phe Ser Tyr
435 440 445
Asn Tyr Leu Leu Glu Lys Arg Glu Arg Glu Glu Leu Ile Asp Lys Trp
450 455 460
Ile Ile Met Lys Asp Leu Pro Gly Glu Ile Gly Phe Ala Leu Glu Ile
465 470 475 480
Pro Trp Tyr Ala Ser Leu Pro Arg Val Glu Thr Arg Phe Tyr Ile Asp
485 490 495
Gln Tyr Gly Gly Glu Asn Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg
500 505 510
Met Pro Tyr Val Asn Asn Asn Gly Tyr Leu Glu Leu Ala Lys Gln Asp
515 520 525
Tyr Asn Asn Cys Gln Ala Gln His Gln Leu Glu Trp Asp Ile Phe Gln
530 535 540
Lys Trp Tyr Glu Glu Asn Arg Leu Ser Glu Trp Gly Val Arg Arg Ser
545 550 555 560
Glu Leu Leu Glu Cys Tyr Tyr Leu Ala Ala Ala Thr Ile Phe Glu Ser
565 570 575
Glu Arg Ser His Glu Arg Met Val Trp Ala Lys Ser Ser Val Leu Val
580 585 590
Lys Ala Ile Ser Ser Ser Phe Gly Glu Ser Ser Asp Ser Arg Arg Ser
595 600 605
Phe Ser Asp Gln Phe His Glu Tyr Ile Ala Asn Ala Arg Arg Ser Asp
610 615 620
His His Phe Asn Asp Arg Asn Met Arg Leu Asp Arg Pro Gly Ser Val
625 630 635 640
Gln Ala Ser Arg Leu Ala Gly Val Leu Ile Gly Thr Leu Asn Gln Met
645 650 655
Ser Phe Asp Leu Phe Met Ser His Gly Arg Asp Val Asn Asn Leu Leu
660 665 670
Tyr Leu Ser Trp Gly Asp Trp Met Glu Lys Trp Lys Leu Tyr Gly Asp
675 680 685
Glu Gly Glu Gly Glu Leu Met Val Lys Met Ile Ile Leu Met Lys Asn
690 695 700
Asn Asp Leu Thr Asn Phe Phe Thr His Thr His Phe Val Arg Leu Ala
705 710 715 720
Glu Ile Ile Asn Arg Ile Cys Leu Pro Arg Gln Tyr Leu Lys Ala Arg
725 730 735
Arg Asn Asp Glu Lys Glu Lys Thr Ile Lys Ser Met Glu Lys Glu Met
740 745 750
Gly Lys Met Val Glu Leu Ala Leu Ser Glu Ser Asp Thr Phe Arg Asp
755 760 765
Val Ser Ile Thr Phe Leu Asp Val Ala Lys Ala Phe Tyr Tyr Phe Ala
770 775 780
Leu Cys Gly Asp His Leu Gln Thr His Ile Ser Lys Val Leu Phe Gln
785 790 795 800
Lys Val
<210> 40
<211> 983
<212> PRT
<213> Diaporthe amygdali
<400> 40
Met Glu Phe Asp Glu Pro Leu Val Asp Glu Ala Arg Ser Leu Val Gln
1 5 10 15
Arg Thr Leu Gln Asp Tyr Asp Asp Arg Tyr Gly Phe Gly Thr Met Ser
20 25 30
Cys Ala Ala Tyr Asp Thr Ala Trp Val Ser Leu Val Thr Lys Thr Val
35 40 45
Asp Gly Arg Lys Gln Trp Leu Phe Pro Glu Cys Phe Glu Phe Leu Leu
50 55 60
Glu Thr Gln Ser Asp Ala Gly Gly Trp Glu Ile Gly Asn Ser Ala Pro
65 70 75 80
Ile Asp Gly Ile Leu Asn Thr Ala Ala Ser Leu Leu Ala Leu Lys Arg
85 90 95
His Val Gln Thr Glu Gln Ile Ile Gln Pro Gln His Asp His Lys Asp
100 105 110
Leu Ala Gly Arg Ala Glu Arg Ala Ala Ala Ser Leu Arg Ala Gln Leu
115 120 125
Ala Ala Leu Asp Val Ser Thr Thr Glu His Val Gly Phe Glu Ile Ile
130 135 140
Val Pro Ala Met Leu Asp Pro Leu Glu Ala Glu Asp Pro Ser Leu Val
145 150 155 160
Phe Asp Phe Pro Ala Arg Lys Pro Leu Met Lys Ile His Asp Ala Lys
165 170 175
Met Ser Arg Phe Arg Pro Glu Tyr Leu Tyr Gly Lys Gln Pro Met Thr
180 185 190
Ala Leu His Ser Leu Glu Ala Phe Ile Gly Lys Ile Asp Phe Asp Lys
195 200 205
Val Arg His His Arg Thr His Gly Ser Met Met Gly Ser Pro Ser Ser
210 215 220
Thr Ala Ala Tyr Leu Met His Ala Ser Gln Trp Asp Gly Asp Ser Glu
225 230 235 240
Ala Tyr Leu Arg His Val Ile Lys His Ala Ala Gly Gln Gly Thr Gly
245 250 255
Ala Val Pro Ser Ala Phe Pro Ser Thr His Phe Glu Ser Ser Trp Ile
260 265 270
Leu Thr Thr Leu Phe Arg Ala Gly Phe Ser Ala Ser His Leu Ala Cys
275 280 285
Asp Glu Leu Asn Lys Leu Val Glu Ile Leu Glu Gly Ser Phe Glu Lys
290 295 300
Glu Gly Gly Ala Ile Gly Tyr Ala Pro Gly Phe Gln Ala Asp Val Asp
305 310 315 320
Asp Thr Ala Lys Thr Ile Ser Thr Leu Ala Val Leu Gly Arg Asp Ala
325 330 335
Thr Pro Arg Gln Met Ile Lys Val Phe Glu Ala Asn Thr His Phe Arg
340 345 350
Thr Tyr Pro Gly Glu Arg Asp Pro Ser Leu Thr Ala Asn Cys Asn Ala
355 360 365
Leu Ser Ala Leu Leu His Gln Pro Asp Ala Ala Met Tyr Gly Ser Gln
370 375 380
Ile Gln Lys Ile Thr Lys Phe Val Cys Asp Tyr Trp Trp Lys Ser Asp
385 390 395 400
Gly Lys Ile Lys Asp Lys Trp Asn Thr Cys Tyr Leu Tyr Pro Ser Val
405 410 415
Leu Leu Val Glu Val Leu Val Asp Leu Val Ser Leu Leu Glu Gln Gly
420 425 430
Lys Leu Pro Asp Val Leu Asp Gln Glu Leu Gln Tyr Arg Val Ala Ile
435 440 445
Thr Leu Phe Gln Ala Cys Leu Arg Pro Leu Leu Asp Gln Asp Ala Glu
450 455 460
Gly Ser Trp Asn Lys Ser Ile Glu Ala Thr Ala Tyr Gly Ile Leu Ile
465 470 475 480
Leu Thr Glu Ala Arg Arg Val Cys Phe Phe Asp Arg Leu Ser Glu Pro
485 490 495
Leu Asn Glu Ala Ile Arg Arg Gly Ile Ala Phe Ala Asp Ser Met Ser
500 505 510
Gly Thr Glu Ala Gln Leu Asn Tyr Ile Trp Ile Glu Lys Val Ser Tyr
515 520 525
Ala Pro Ala Leu Leu Thr Lys Ser Tyr Leu Leu Ala Ala Arg Trp Ala
530 535 540
Ala Lys Ser Pro Leu Gly Ala Ser Val Gly Ser Ser Leu Trp Thr Pro
545 550 555 560
Pro Arg Glu Gly Leu Asp Lys His Val Arg Leu Phe His Gln Ala Glu
565 570 575
Leu Phe Arg Ser Leu Pro Glu Trp Glu Leu Arg Ala Ser Met Ile Glu
580 585 590
Ala Ala Leu Phe Thr Pro Leu Leu Arg Ala His Arg Leu Asp Val Phe
595 600 605
Pro Arg Gln Asp Val Gly Glu Asp Lys Tyr Leu Asp Val Val Pro Phe
610 615 620
Phe Trp Thr Ala Ala Asn Asn Arg Asp Arg Thr Tyr Ala Ser Thr Leu
625 630 635 640
Phe Leu Tyr Asp Met Cys Phe Ile Ala Met Leu Asn Phe Gln Leu Asp
645 650 655
Glu Phe Met Glu Ala Thr Ala Gly Ile Leu Phe Arg Asp His Met Asp
660 665 670
Asp Leu Arg Gln Leu Ile His Asp Leu Leu Ala Glu Lys Thr Ser Pro
675 680 685
Lys Ser Ser Gly Arg Ser Ser Gln Gly Thr Lys Asp Ala Asp Ser Gly
690 695 700
Ile Glu Glu Asp Val Ser Met Ser Asp Ser Ala Ser Asp Ser Gln Asp
705 710 715 720
Arg Ser Pro Glu Tyr Asp Leu Val Phe Ser Ala Leu Ser Thr Phe Thr
725 730 735
Lys His Val Leu Gln His Pro Ser Ile Gln Ser Ala Ser Val Trp Asp
740 745 750
Arg Lys Leu Leu Ala Arg Glu Met Lys Ala Tyr Leu Leu Ala His Ile
755 760 765
Gln Gln Ala Glu Asp Ser Thr Pro Leu Ser Glu Leu Lys Asp Val Pro
770 775 780
Gln Lys Thr Asp Val Thr Arg Val Ser Thr Ser Thr Thr Thr Phe Phe
785 790 795 800
Asn Trp Val Arg Thr Thr Ser Ala Asp His Ile Ser Cys Pro Tyr Ser
805 810 815
Phe His Phe Val Ala Cys His Leu Gly Ala Ala Leu Ser Pro Lys Gly
820 825 830
Ser Asn Gly Asp Cys Tyr Pro Ser Ala Gly Glu Lys Phe Leu Ala Ala
835 840 845
Ala Val Cys Arg His Leu Ala Thr Met Cys Arg Met Tyr Asn Asp Leu
850 855 860
Gly Ser Ala Glu Arg Asp Ser Asp Glu Gly Asn Leu Asn Ser Leu Asp
865 870 875 880
Phe Pro Glu Phe Ala Asp Ser Ala Gly Asn Gly Gly Ile Glu Ile Gln
885 890 895
Lys Ala Ala Leu Leu Arg Leu Ala Glu Phe Glu Arg Asp Ser Tyr Leu
900 905 910
Glu Ala Phe Arg Arg Leu Gln Asp Glu Ser Asn Arg Val His Gly Pro
915 920 925
Ala Gly Gly Asp Glu Ala Arg Leu Ser Arg Arg Arg Met Ala Ile Leu
930 935 940
Glu Phe Phe Ala Gln Gln Val Asp Leu Tyr Gly Gln Val Tyr Val Ile
945 950 955 960
Arg Asp Ile Ser Ala Arg Ile Pro Lys Asn Glu Val Glu Lys Lys Arg
965 970 975
Lys Leu Asp Asp Ala Phe Asn
980
<210> 41
<211> 881
<212> PRT
<213> Physcomitrella patens
<400> 41
Met Ala Ser Ser Thr Leu Ile Gln Asn Arg Ser Cys Gly Val Thr Ser
1 5 10 15
Ser Met Ser Ser Phe Gln Ile Phe Arg Gly Gln Pro Leu Arg Phe Pro
20 25 30
Gly Thr Arg Thr Pro Ala Ala Val Gln Cys Leu Lys Lys Arg Arg Cys
35 40 45
Leu Arg Pro Thr Glu Ser Val Leu Glu Ser Ser Pro Gly Ser Gly Ser
50 55 60
Tyr Arg Ile Val Thr Gly Pro Ser Gly Ile Asn Pro Ser Ser Asn Gly
65 70 75 80
His Leu Gln Glu Gly Ser Leu Thr His Arg Leu Pro Ile Pro Met Glu
85 90 95
Lys Ser Ile Asp Asn Phe Gln Ser Thr Leu Tyr Val Ser Asp Ile Trp
100 105 110
Ser Glu Thr Leu Gln Arg Thr Glu Cys Leu Leu Gln Val Thr Glu Asn
115 120 125
Val Gln Met Asn Glu Trp Ile Glu Glu Ile Arg Met Tyr Phe Arg Asn
130 135 140
Met Thr Leu Gly Glu Ile Ser Met Ser Pro Tyr Asp Thr Ala Trp Val
145 150 155 160
Ala Arg Val Pro Ala Leu Asp Gly Ser His Gly Pro Gln Phe His Arg
165 170 175
Ser Leu Gln Trp Ile Ile Asp Asn Gln Leu Pro Asp Gly Asp Trp Gly
180 185 190
Glu Pro Ser Leu Phe Leu Gly Tyr Asp Arg Val Cys Asn Thr Leu Ala
195 200 205
Cys Val Ile Ala Leu Lys Thr Trp Gly Val Gly Ala Gln Asn Val Glu
210 215 220
Arg Gly Ile Gln Phe Leu Gln Ser Asn Ile Tyr Lys Met Glu Glu Asp
225 230 235 240
Asp Ala Asn His Met Pro Ile Gly Phe Glu Ile Val Phe Pro Ala Met
245 250 255
Met Glu Asp Ala Lys Ala Leu Gly Leu Asp Leu Pro Tyr Asp Ala Thr
260 265 270
Ile Leu Gln Gln Ile Ser Ala Glu Arg Glu Lys Lys Met Lys Lys Ile
275 280 285
Pro Met Ala Met Val Tyr Lys Tyr Pro Thr Thr Leu Leu His Ser Leu
290 295 300
Glu Gly Leu His Arg Glu Val Asp Trp Asn Lys Leu Leu Gln Leu Gln
305 310 315 320
Ser Glu Asn Gly Ser Phe Leu Tyr Ser Pro Ala Ser Thr Ala Cys Ala
325 330 335
Leu Met Tyr Thr Lys Asp Val Lys Cys Phe Asp Tyr Leu Asn Gln Leu
340 345 350
Leu Ile Lys Phe Asp His Ala Cys Pro Asn Val Tyr Pro Val Asp Leu
355 360 365
Phe Glu Arg Leu Trp Met Val Asp Arg Leu Gln Arg Leu Gly Ile Ser
370 375 380
Arg Tyr Phe Glu Arg Glu Ile Arg Asp Cys Leu Gln Tyr Val Tyr Arg
385 390 395 400
Tyr Trp Lys Asp Cys Gly Ile Gly Trp Ala Ser Asn Ser Ser Val Gln
405 410 415
Asp Val Asp Asp Thr Ala Met Ala Phe Arg Leu Leu Arg Thr His Gly
420 425 430
Phe Asp Val Lys Glu Asp Cys Phe Arg Gln Phe Phe Lys Asp Gly Glu
435 440 445
Phe Phe Cys Phe Ala Gly Gln Ser Ser Gln Ala Val Thr Gly Met Phe
450 455 460
Asn Leu Ser Arg Ala Ser Gln Thr Leu Phe Pro Gly Glu Ser Leu Leu
465 470 475 480
Lys Lys Ala Arg Thr Phe Ser Arg Asn Phe Leu Arg Thr Lys His Glu
485 490 495
Asn Asn Glu Cys Phe Asp Lys Trp Ile Ile Thr Lys Asp Leu Ala Gly
500 505 510
Glu Val Glu Tyr Asn Leu Thr Phe Pro Trp Tyr Ala Ser Leu Pro Arg
515 520 525
Leu Glu His Arg Thr Tyr Leu Asp Gln Tyr Gly Ile Asp Asp Ile Trp
530 535 540
Ile Gly Lys Ser Leu Tyr Lys Met Pro Ala Val Thr Asn Glu Val Phe
545 550 555 560
Leu Lys Leu Ala Lys Ala Asp Phe Asn Met Cys Gln Ala Leu His Lys
565 570 575
Lys Glu Leu Glu Gln Val Ile Lys Trp Asn Ala Ser Cys Gln Phe Arg
580 585 590
Asp Leu Glu Phe Ala Arg Gln Lys Ser Val Glu Cys Tyr Phe Ala Gly
595 600 605
Ala Ala Thr Met Phe Glu Pro Glu Met Val Gln Ala Arg Leu Val Trp
610 615 620
Ala Arg Cys Cys Val Leu Thr Thr Val Leu Asp Asp Tyr Phe Asp His
625 630 635 640
Gly Thr Pro Val Glu Glu Leu Arg Val Phe Val Gln Ala Val Arg Thr
645 650 655
Trp Asn Pro Glu Leu Ile Asn Gly Leu Pro Glu Gln Ala Lys Ile Leu
660 665 670
Phe Met Gly Leu Tyr Lys Thr Val Asn Thr Ile Ala Glu Glu Ala Phe
675 680 685
Met Ala Gln Lys Arg Asp Val His His His Leu Lys His Tyr Trp Asp
690 695 700
Lys Leu Ile Thr Ser Ala Leu Lys Glu Ala Glu Trp Ala Glu Ser Gly
705 710 715 720
Tyr Val Pro Thr Phe Asp Glu Tyr Met Glu Val Ala Glu Ile Ser Val
725 730 735
Ala Leu Glu Pro Ile Val Cys Ser Thr Leu Phe Phe Ala Gly His Arg
740 745 750
Leu Asp Glu Asp Val Leu Asp Ser Tyr Asp Tyr His Leu Val Met His
755 760 765
Leu Val Asn Arg Val Gly Arg Ile Leu Asn Asp Ile Gln Gly Met Lys
770 775 780
Arg Glu Ala Ser Gln Gly Lys Ile Ser Ser Val Gln Ile Tyr Met Glu
785 790 795 800
Glu His Pro Ser Val Pro Ser Glu Ala Met Ala Ile Ala His Leu Gln
805 810 815
Glu Leu Val Asp Asn Ser Met Gln Gln Leu Thr Tyr Glu Val Leu Arg
820 825 830
Phe Thr Ala Val Pro Lys Ser Cys Lys Arg Ile His Leu Asn Met Ala
835 840 845
Lys Ile Met His Ala Phe Tyr Lys Asp Thr Asp Gly Phe Ser Ser Leu
850 855 860
Thr Ala Met Thr Gly Phe Val Lys Lys Val Leu Phe Glu Pro Val Pro
865 870 875 880
Glu
<210> 42
<211> 952
<212> PRT
<213> Fusarium fujikuroi
<400> 42
Met Pro Gly Lys Ile Glu Asn Gly Thr Pro Lys Asp Leu Lys Thr Gly
1 5 10 15
Asn Asp Phe Val Ser Ala Ala Lys Ser Leu Leu Asp Arg Ala Phe Lys
20 25 30
Ser His His Ser Tyr Tyr Gly Leu Cys Ser Thr Ser Cys Gln Val Tyr
35 40 45
Asp Thr Ala Trp Val Ala Met Ile Pro Lys Thr Arg Asp Asn Val Lys
50 55 60
Gln Trp Leu Phe Pro Glu Cys Phe His Tyr Leu Leu Lys Thr Gln Ala
65 70 75 80
Ala Asp Gly Ser Trp Gly Ser Leu Pro Thr Thr Gln Thr Ala Gly Ile
85 90 95
Leu Asp Thr Ala Ser Ala Val Leu Ala Leu Leu Cys His Ala Gln Glu
100 105 110
Pro Leu Gln Ile Leu Asp Val Ser Pro Asp Glu Met Gly Leu Arg Ile
115 120 125
Glu His Gly Val Thr Ser Leu Lys Arg Gln Leu Ala Val Trp Asn Asp
130 135 140
Val Glu Asp Thr Asn His Ile Gly Val Glu Phe Ile Ile Pro Ala Leu
145 150 155 160
Leu Ser Met Leu Glu Lys Glu Leu Asp Val Pro Ser Phe Glu Phe Pro
165 170 175
Cys Arg Ser Ile Leu Glu Arg Met His Gly Glu Lys Leu Gly His Phe
180 185 190
Asp Leu Glu Gln Val Tyr Gly Lys Pro Ser Ser Leu Leu His Ser Leu
195 200 205
Glu Ala Phe Leu Gly Lys Leu Asp Phe Asp Arg Leu Ser His His Leu
210 215 220
Tyr His Gly Ser Met Met Ala Ser Pro Ser Ser Thr Ala Ala Tyr Leu
225 230 235 240
Ile Gly Ala Thr Lys Trp Asp Asp Glu Ala Glu Asp Tyr Leu Arg His
245 250 255
Val Met Arg Asn Gly Ala Gly His Gly Asn Gly Gly Ile Ser Gly Thr
260 265 270
Phe Pro Thr Thr His Phe Glu Cys Ser Trp Ile Ile Ala Thr Leu Leu
275 280 285
Lys Val Gly Phe Thr Leu Lys Gln Ile Asp Gly Asp Gly Leu Arg Gly
290 295 300
Leu Ser Thr Ile Leu Leu Glu Ala Leu Arg Asp Glu Asn Gly Val Ile
305 310 315 320
Gly Phe Ala Pro Arg Thr Ala Asp Val Asp Asp Thr Ala Lys Ala Leu
325 330 335
Leu Ala Leu Ser Leu Val Asn Gln Pro Val Ser Pro Asp Ile Met Ile
340 345 350
Lys Val Phe Glu Gly Lys Asp His Phe Thr Thr Phe Gly Ser Glu Arg
355 360 365
Asp Pro Ser Leu Thr Ser Asn Leu His Val Leu Leu Ser Leu Leu Lys
370 375 380
Gln Ser Asn Leu Ser Gln Tyr His Pro Gln Ile Leu Lys Thr Thr Leu
385 390 395 400
Phe Thr Cys Arg Trp Trp Trp Gly Ser Asp His Cys Val Lys Asp Lys
405 410 415
Trp Asn Leu Ser His Leu Tyr Pro Thr Met Leu Leu Val Glu Ala Phe
420 425 430
Thr Glu Val Leu His Leu Ile Asp Gly Gly Glu Leu Ser Ser Leu Phe
435 440 445
Asp Glu Ser Phe Lys Cys Lys Ile Gly Leu Ser Ile Phe Gln Ala Val
450 455 460
Leu Arg Ile Ile Leu Thr Gln Asp Asn Asp Gly Ser Trp Arg Gly Tyr
465 470 475 480
Arg Glu Gln Thr Cys Tyr Ala Ile Leu Ala Leu Val Gln Ala Arg His
485 490 495
Val Cys Phe Phe Thr His Met Val Asp Arg Leu Gln Ser Cys Val Asp
500 505 510
Arg Gly Phe Ser Trp Leu Lys Ser Cys Ser Phe His Ser Gln Asp Leu
515 520 525
Thr Trp Thr Ser Lys Thr Ala Tyr Glu Val Gly Phe Val Ala Glu Ala
530 535 540
Tyr Lys Leu Ala Ala Leu Gln Ser Ala Ser Leu Glu Val Pro Ala Ala
545 550 555 560
Thr Ile Gly His Ser Val Thr Ser Ala Val Pro Ser Ser Asp Leu Glu
565 570 575
Lys Tyr Met Arg Leu Val Arg Lys Thr Ala Leu Phe Ser Pro Leu Asp
580 585 590
Glu Trp Gly Leu Met Ala Ser Ile Ile Glu Ser Ser Phe Phe Val Pro
595 600 605
Leu Leu Gln Ala Gln Arg Val Glu Ile Tyr Pro Arg Asp Asn Ile Lys
610 615 620
Val Asp Glu Asp Lys Tyr Leu Ser Ile Ile Pro Phe Thr Trp Val Gly
625 630 635 640
Cys Asn Asn Arg Ser Arg Thr Phe Ala Ser Asn Arg Trp Leu Tyr Asp
645 650 655
Met Met Tyr Leu Ser Leu Leu Gly Tyr Gln Thr Asp Glu Tyr Met Glu
660 665 670
Ala Val Ala Gly Pro Val Phe Gly Asp Val Ser Leu Leu His Gln Thr
675 680 685
Ile Asp Lys Val Ile Asp Asn Thr Met Gly Asn Leu Ala Arg Ala Asn
690 695 700
Gly Thr Val His Ser Gly Asn Gly His Gln His Glu Ser Pro Asn Ile
705 710 715 720
Gly Gln Val Glu Asp Thr Leu Thr Arg Phe Thr Asn Ser Val Leu Asn
725 730 735
His Lys Asp Val Leu Asn Ser Ser Ser Ser Asp Gln Asp Thr Leu Arg
740 745 750
Arg Glu Phe Arg Thr Phe Met His Ala His Ile Thr Gln Ile Glu Asp
755 760 765
Asn Ser Arg Phe Ser Lys Gln Ala Ser Ser Asp Ala Phe Ser Ser Pro
770 775 780
Glu Gln Ser Tyr Phe Gln Trp Val Asn Ser Thr Gly Gly Ser His Val
785 790 795 800
Ala Cys Ala Tyr Ser Phe Ala Phe Ser Asn Cys Leu Met Ser Ala Asn
805 810 815
Leu Leu Gln Gly Lys Asp Ala Phe Pro Ser Gly Thr Gln Lys Tyr Leu
820 825 830
Ile Ser Ser Val Met Arg His Ala Thr Asn Met Cys Arg Met Tyr Asn
835 840 845
Asp Phe Gly Ser Ile Ala Arg Asp Asn Ala Glu Arg Asn Val Asn Ser
850 855 860
Ile His Phe Pro Glu Phe Thr Leu Cys Asn Gly Thr Ser Gln Asn Leu
865 870 875 880
Asp Glu Arg Lys Glu Arg Leu Leu Lys Ile Ala Thr Tyr Glu Gln Gly
885 890 895
Tyr Leu Asp Arg Ala Leu Glu Ala Leu Glu Arg Gln Ser Arg Asp Asp
900 905 910
Ala Gly Asp Arg Ala Gly Ser Lys Asp Met Arg Lys Leu Lys Ile Val
915 920 925
Lys Leu Phe Cys Asp Val Thr Asp Leu Tyr Asp Gln Leu Tyr Val Ile
930 935 940
Lys Asp Leu Ser Ser Ser Met Lys
945 950
<210> 43
<211> 361
<212> PRT
<213> Stevia rebaudiana
<400> 43
Met Ala Leu Val Asn Pro Thr Ala Leu Phe Tyr Gly Thr Ser Ile Arg
1 5 10 15
Thr Arg Pro Thr Asn Leu Leu Asn Pro Thr Gln Lys Leu Arg Pro Val
20 25 30
Ser Ser Ser Ser Leu Pro Ser Phe Ser Ser Val Ser Ala Ile Leu Thr
35 40 45
Glu Lys His Gln Ser Asn Pro Ser Glu Asn Asn Asn Leu Gln Thr His
50 55 60
Leu Glu Thr Pro Phe Asn Phe Asp Ser Tyr Met Leu Glu Lys Val Asn
65 70 75 80
Met Val Asn Glu Ala Leu Asp Ala Ser Val Pro Leu Lys Asp Pro Ile
85 90 95
Lys Ile His Glu Ser Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys Arg
100 105 110
Ile Arg Pro Met Met Cys Ile Ala Ala Cys Glu Ile Val Gly Gly Asn
115 120 125
Ile Leu Asn Ala Met Pro Ala Ala Cys Ala Val Glu Met Ile His Thr
130 135 140
Met Ser Leu Val His Asp Asp Leu Pro Cys Met Asp Asn Asp Asp Phe
145 150 155 160
Arg Arg Gly Lys Pro Ile Ser His Lys Val Tyr Gly Glu Glu Met Ala
165 170 175
Val Leu Thr Gly Asp Ala Leu Leu Ser Leu Ser Phe Glu His Ile Ala
180 185 190
Thr Ala Thr Lys Gly Val Ser Lys Asp Arg Ile Val Arg Ala Ile Gly
195 200 205
Glu Leu Ala Arg Ser Val Gly Ser Glu Gly Leu Val Ala Gly Gln Val
210 215 220
Val Asp Ile Leu Ser Glu Gly Ala Asp Val Gly Leu Asp His Leu Glu
225 230 235 240
Tyr Ile His Ile His Lys Thr Ala Met Leu Leu Glu Ser Ser Val Val
245 250 255
Ile Gly Ala Ile Met Gly Gly Gly Ser Asp Gln Gln Ile Glu Lys Leu
260 265 270
Arg Lys Phe Ala Arg Ser Ile Gly Leu Leu Phe Gln Val Val Asp Asp
275 280 285
Ile Leu Asp Val Thr Lys Ser Thr Glu Glu Leu Gly Lys Thr Ala Gly
290 295 300
Lys Asp Leu Leu Thr Asp Lys Thr Thr Tyr Pro Lys Leu Leu Gly Ile
305 310 315 320
Glu Lys Ser Arg Glu Phe Ala Glu Lys Leu Asn Lys Glu Ala Gln Glu
325 330 335
Gln Leu Ser Gly Phe Asp Arg Arg Lys Ala Ala Pro Leu Ile Ala Leu
340 345 350
Ala Asn Tyr Asn Ala Tyr Arg Gln Asn
355 360
<210> 44
<211> 342
<212> PRT
<213> Fusarium fujikuroi
<400> 44
Met Ala Glu Gln Gln Ile Ser Asn Leu Leu Ser Met Phe Asp Ala Ser
1 5 10 15
His Ala Ser Gln Lys Leu Glu Ile Thr Val Gln Met Met Asp Thr Tyr
20 25 30
His Tyr Arg Glu Thr Pro Pro Asp Ser Ser Ser Ser Glu Gly Gly Ser
35 40 45
Leu Ser Arg Tyr Asp Glu Arg Arg Val Ser Leu Pro Leu Ser His Asn
50 55 60
Ala Ala Ser Pro Asp Ile Val Ser Gln Leu Cys Phe Ser Thr Ala Met
65 70 75 80
Ser Ser Glu Leu Asn His Arg Trp Lys Ser Gln Arg Leu Lys Val Ala
85 90 95
Asp Ser Pro Tyr Asn Tyr Ile Leu Thr Leu Pro Ser Lys Gly Ile Arg
100 105 110
Gly Ala Phe Ile Asp Ser Leu Asn Val Trp Leu Glu Val Pro Glu Asp
115 120 125
Glu Thr Ser Val Ile Lys Glu Val Ile Gly Met Leu His Asn Ser Ser
130 135 140
Leu Ile Ile Asp Asp Phe Gln Asp Asn Ser Pro Leu Arg Arg Gly Lys
145 150 155 160
Pro Ser Thr His Thr Val Phe Gly Pro Ala Gln Ala Ile Asn Thr Ala
165 170 175
Thr Tyr Val Ile Val Lys Ala Ile Glu Lys Ile Gln Asp Ile Val Gly
180 185 190
His Asp Ala Leu Ala Asp Val Thr Gly Thr Ile Thr Thr Ile Phe Gln
195 200 205
Gly Gln Ala Met Asp Leu Trp Trp Thr Ala Asn Ala Ile Val Pro Ser
210 215 220
Ile Gln Glu Tyr Leu Leu Met Val Asn Asp Lys Thr Gly Ala Leu Phe
225 230 235 240
Arg Leu Ser Leu Glu Leu Leu Ala Leu Asn Ser Glu Ala Ser Ile Ser
245 250 255
Asp Ser Ala Leu Glu Ser Leu Ser Ser Ala Val Ser Leu Leu Gly Gln
260 265 270
Tyr Phe Gln Ile Arg Asp Asp Tyr Met Asn Leu Ile Asp Asn Lys Tyr
275 280 285
Thr Asp Gln Lys Gly Phe Cys Glu Asp Leu Asp Glu Gly Lys Tyr Ser
290 295 300
Leu Thr Leu Ile His Ala Leu Gln Thr Asp Ser Ser Asp Leu Leu Thr
305 310 315 320
Asn Ile Leu Ser Met Arg Arg Val Gln Gly Lys Leu Thr Ala Gln Lys
325 330 335
Arg Cys Trp Phe Trp Lys
340
<210> 45
<211> 300
<212> PRT
<213> Mus musculus
<400> 45
Met Glu Lys Thr Lys Glu Lys Ala Glu Arg Ile Leu Leu Glu Pro Tyr
1 5 10 15
Arg Tyr Leu Leu Gln Leu Pro Gly Lys Gln Val Arg Ser Lys Leu Ser
20 25 30
Gln Ala Phe Asn His Trp Leu Lys Val Pro Glu Asp Lys Leu Gln Ile
35 40 45
Ile Ile Glu Val Thr Glu Met Leu His Asn Ala Ser Leu Leu Ile Asp
50 55 60
Asp Ile Glu Asp Ser Ser Lys Leu Arg Arg Gly Phe Pro Val Ala His
65 70 75 80
Ser Ile Tyr Gly Val Pro Ser Val Ile Asn Ser Ala Asn Tyr Val Tyr
85 90 95
Phe Leu Gly Leu Glu Lys Val Leu Thr Leu Asp His Pro Asp Ala Val
100 105 110
Lys Leu Phe Thr Arg Gln Leu Leu Glu Leu His Gln Gly Gln Gly Leu
115 120 125
Asp Ile Tyr Trp Arg Asp Thr Tyr Thr Cys Pro Thr Glu Glu Glu Tyr
130 135 140
Lys Ala Met Val Leu Gln Lys Thr Gly Gly Leu Phe Gly Leu Ala Val
145 150 155 160
Gly Leu Met Gln Leu Phe Ser Asp Tyr Lys Glu Asp Leu Lys Pro Leu
165 170 175
Leu Asp Thr Leu Gly Leu Phe Phe Gln Ile Arg Asp Asp Tyr Ala Asn
180 185 190
Leu His Ser Lys Glu Tyr Ser Glu Asn Lys Ser Phe Cys Glu Asp Leu
195 200 205
Thr Glu Gly Lys Phe Ser Phe Pro Thr Ile His Ala Ile Trp Ser Arg
210 215 220
Pro Glu Ser Thr Gln Val Gln Asn Ile Leu Arg Gln Arg Thr Glu Asn
225 230 235 240
Ile Asp Ile Lys Lys Tyr Cys Val Gln Tyr Leu Glu Asp Val Gly Ser
245 250 255
Phe Ala Tyr Thr Arg His Thr Leu Arg Glu Leu Glu Ala Lys Ala Tyr
260 265 270
Lys Gln Ile Glu Ala Cys Gly Gly Asn Pro Ser Leu Val Ala Leu Val
275 280 285
Lys His Leu Ser Lys Met Phe Thr Glu Glu Asn Lys
290 295 300
<210> 46
<211> 339
<212> PRT
<213> Thalassiosira pseudonana
<400> 46
Met Ala Arg Phe Tyr Phe Leu Asn Ala Leu Leu Met Val Ile Ser Leu
1 5 10 15
Gln Ser Thr Thr Ala Phe Thr Pro Ala Lys Leu Ala Tyr Pro Thr Thr
20 25 30
Thr Thr Ala Leu Asn Val Ala Ser Ala Glu Thr Ser Phe Ser Leu Asp
35 40 45
Glu Tyr Leu Ala Ser Lys Ile Gly Pro Ile Glu Ser Ala Leu Glu Ala
50 55 60
Ser Val Lys Ser Arg Ile Pro Gln Thr Asp Lys Ile Cys Glu Ser Met
65 70 75 80
Ala Tyr Ser Leu Met Ala Gly Gly Lys Arg Ile Arg Pro Val Leu Cys
85 90 95
Ile Ala Ala Cys Glu Met Phe Gly Gly Ser Gln Asp Val Ala Met Pro
100 105 110
Thr Ala Val Ala Leu Glu Met Ile His Thr Met Ser Leu Ile His Asp
115 120 125
Asp Leu Pro Ser Met Asp Asn Asp Asp Leu Arg Arg Gly Lys Pro Thr
130 135 140
Asn His Val Val Phe Gly Glu Asp Val Ala Ile Leu Ala Gly Asp Ser
145 150 155 160
Leu Leu Ser Thr Ser Phe Glu His Val Ala Arg Glu Thr Lys Gly Val
165 170 175
Ser Ala Glu Lys Ile Val Asp Val Ile Ala Arg Leu Gly Lys Ser Val
180 185 190
Gly Ala Glu Gly Leu Ala Gly Gly Gln Val Met Asp Leu Glu Cys Glu
195 200 205
Ala Lys Pro Gly Thr Thr Leu Asp Asp Leu Lys Trp Ile His Ile His
210 215 220
Lys Thr Ala Thr Leu Leu Gln Val Ala Val Ala Ser Gly Ala Val Leu
225 230 235 240
Gly Gly Ala Thr Pro Glu Glu Val Ala Ala Cys Glu Leu Phe Ala Met
245 250 255
Asn Ile Gly Leu Ala Phe Gln Val Ala Asp Asp Ile Leu Asp Val Thr
260 265 270
Ala Ser Ser Glu Asp Leu Gly Lys Thr Ala Gly Lys Asp Glu Ala Thr
275 280 285
Asp Lys Thr Thr Tyr Pro Lys Leu Leu Gly Leu Glu Glu Ser Lys Ala
290 295 300
Tyr Ala Arg Gln Leu Ile Asp Glu Ala Lys Glu Ser Leu Ala Pro Phe
305 310 315 320
Gly Asp Arg Ala Ala Pro Leu Leu Ala Ile Ala Asp Phe Ile Ile Asp
325 330 335
Arg Lys Asn
<210> 47
<211> 355
<212> PRT
<213> Streptomyces clavuligerus
<400> 47
Met His Leu Ala Pro Arg Arg Val Pro Arg Gly Arg Arg Ser Pro Pro
1 5 10 15
Asp Arg Val Pro Glu Arg Gln Gly Ala Leu Gly Arg Arg Arg Gly Ala
20 25 30
Gly Ser Thr Gly Cys Ala Arg Ala Ala Ala Gly Val His Arg Arg Arg
35 40 45
Gly Gly Gly Glu Ala Asp Pro Ser Ala Ala Val His Arg Gly Trp Gln
50 55 60
Ala Gly Gly Gly Thr Gly Leu Pro Asp Glu Val Val Ser Thr Ala Ala
65 70 75 80
Ala Leu Glu Met Phe His Ala Phe Ala Leu Ile His Asp Asp Ile Met
85 90 95
Asp Asp Ser Ala Thr Arg Arg Gly Ser Pro Thr Val His Arg Ala Leu
100 105 110
Ala Asp Arg Leu Gly Ala Ala Leu Asp Pro Asp Gln Ala Gly Gln Leu
115 120 125
Gly Val Ser Thr Ala Ile Leu Val Gly Asp Leu Ala Leu Thr Trp Ser
130 135 140
Asp Glu Leu Leu Tyr Ala Pro Leu Thr Pro His Arg Leu Ala Ala Val
145 150 155 160
Leu Pro Leu Val Thr Ala Met Arg Ala Glu Thr Val His Gly Gln Tyr
165 170 175
Leu Asp Ile Thr Ser Ala Arg Arg Pro Gly Thr Asp Thr Ser Leu Ala
180 185 190
Leu Arg Ile Ala Arg Tyr Lys Thr Ala Ala Tyr Thr Met Glu Arg Pro
195 200 205
Leu His Ile Gly Ala Ala Leu Ala Gly Ala Arg Pro Glu Leu Leu Ala
210 215 220
Gly Leu Ser Ala Tyr Ala Leu Pro Ala Gly Glu Ala Phe Gln Leu Ala
225 230 235 240
Asp Asp Leu Leu Gly Val Phe Gly Asp Pro Arg Arg Thr Gly Lys Pro
245 250 255
Asp Leu Asp Asp Leu Arg Gly Gly Lys His Thr Val Leu Val Ala Leu
260 265 270
Ala Arg Glu His Ala Thr Pro Glu Gln Arg His Thr Leu Asp Thr Leu
275 280 285
Leu Gly Thr Pro Gly Leu Asp Arg Gln Gly Ala Ser Arg Leu Arg Cys
290 295 300
Val Leu Val Ala Thr Gly Ala Arg Ala Glu Ala Glu Arg Leu Ile Thr
305 310 315 320
Glu Arg Arg Asp Gln Ala Leu Thr Ala Leu Asn Ala Leu Thr Leu Pro
325 330 335
Pro Pro Leu Ala Glu Ala Leu Ala Arg Leu Thr Leu Gly Ser Thr Ala
340 345 350
His Pro Ala
355
<210> 48
<211> 330
<212> PRT
<213> Sulfolobus acidocaldarius
<400> 48
Met Ser Tyr Phe Asp Asn Tyr Phe Asn Glu Ile Val Asn Ser Val Asn
1 5 10 15
Asp Ile Ile Lys Ser Tyr Ile Ser Gly Asp Val Pro Lys Leu Tyr Glu
20 25 30
Ala Ser Tyr His Leu Phe Thr Ser Gly Gly Lys Arg Leu Arg Pro Leu
35 40 45
Ile Leu Thr Ile Ser Ser Asp Leu Phe Gly Gly Gln Arg Glu Arg Ala
50 55 60
Tyr Tyr Ala Gly Ala Ala Ile Glu Val Leu His Thr Phe Thr Leu Val
65 70 75 80
His Asp Asp Ile Met Asp Gln Asp Asn Ile Arg Arg Gly Leu Pro Thr
85 90 95
Val His Val Lys Tyr Gly Leu Pro Leu Ala Ile Leu Ala Gly Asp Leu
100 105 110
Leu His Ala Lys Ala Phe Gln Leu Leu Thr Gln Ala Leu Arg Gly Leu
115 120 125
Pro Ser Glu Thr Ile Ile Lys Ala Phe Asp Ile Phe Thr Arg Ser Ile
130 135 140
Ile Ile Ile Ser Glu Gly Gln Ala Val Asp Met Glu Phe Glu Asp Arg
145 150 155 160
Ile Asp Ile Lys Glu Gln Glu Tyr Leu Asp Met Ile Ser Arg Lys Thr
165 170 175
Ala Ala Leu Phe Ser Ala Ser Ser Ser Ile Gly Ala Leu Ile Ala Gly
180 185 190
Ala Asn Asp Asn Asp Val Arg Leu Met Ser Asp Phe Gly Thr Asn Leu
195 200 205
Gly Ile Ala Phe Gln Ile Val Asp Asp Ile Leu Gly Leu Thr Ala Asp
210 215 220
Glu Lys Glu Leu Gly Lys Pro Val Phe Ser Asp Ile Arg Glu Gly Lys
225 230 235 240
Lys Thr Ile Leu Val Ile Lys Thr Leu Glu Leu Cys Lys Glu Asp Glu
245 250 255
Lys Lys Ile Val Leu Lys Ala Leu Gly Asn Lys Ser Ala Ser Lys Glu
260 265 270
Glu Leu Met Ser Ser Ala Asp Ile Ile Lys Lys Tyr Ser Leu Asp Tyr
275 280 285
Ala Tyr Asn Leu Ala Glu Lys Tyr Tyr Lys Asn Ala Ile Asp Ser Leu
290 295 300
Asn Gln Val Ser Ser Lys Ser Asp Ile Pro Gly Lys Ala Leu Lys Tyr
305 310 315 320
Leu Ala Glu Phe Thr Ile Arg Arg Arg Lys
325 330
<210> 49
<211> 297
<212> PRT
<213> Synechococcus sp.
<400> 49
Met Val Ala Gln Thr Phe Asn Leu Asp Thr Tyr Leu Ser Gln Arg Gln
1 5 10 15
Gln Gln Val Glu Glu Ala Leu Ser Ala Ala Leu Val Pro Ala Tyr Pro
20 25 30
Glu Arg Ile Tyr Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys
35 40 45
Arg Leu Arg Pro Ile Leu Cys Leu Ala Ala Cys Glu Leu Ala Gly Gly
50 55 60
Ser Val Glu Gln Ala Met Pro Thr Ala Cys Ala Leu Glu Met Ile His
65 70 75 80
Thr Met Ser Leu Ile His Asp Asp Leu Pro Ala Met Asp Asn Asp Asp
85 90 95
Phe Arg Arg Gly Lys Pro Thr Asn His Lys Val Phe Gly Glu Asp Ile
100 105 110
Ala Ile Leu Ala Gly Asp Ala Leu Leu Ala Tyr Ala Phe Glu His Ile
115 120 125
Ala Ser Gln Thr Arg Gly Val Pro Pro Gln Leu Val Leu Gln Val Ile
130 135 140
Ala Arg Ile Gly His Ala Val Ala Ala Thr Gly Leu Val Gly Gly Gln
145 150 155 160
Val Val Asp Leu Glu Ser Glu Gly Lys Ala Ile Ser Leu Glu Thr Leu
165 170 175
Glu Tyr Ile His Ser His Lys Thr Gly Ala Leu Leu Glu Ala Ser Val
180 185 190
Val Ser Gly Gly Ile Leu Ala Gly Ala Asp Glu Glu Leu Leu Ala Arg
195 200 205
Leu Ser His Tyr Ala Arg Asp Ile Gly Leu Ala Phe Gln Ile Val Asp
210 215 220
Asp Ile Leu Asp Val Thr Ala Thr Ser Glu Gln Leu Gly Lys Thr Ala
225 230 235 240
Gly Lys Asp Gln Ala Ala Ala Lys Ala Thr Tyr Pro Ser Leu Leu Gly
245 250 255
Leu Glu Ala Ser Arg Gln Lys Ala Glu Glu Leu Ile Gln Ser Ala Lys
260 265 270
Glu Ala Leu Arg Pro Tyr Gly Ser Gln Ala Glu Pro Leu Leu Ala Leu
275 280 285
Ala Asp Phe Ile Thr Arg Arg Gln His
290 295
<210> 50
<211> 371
<212> PRT
<213> Arabidopsis thaliana
<400> 50
Met Ala Ser Val Thr Leu Gly Ser Trp Ile Val Val His His His Asn
1 5 10 15
His His His Pro Ser Ser Ile Leu Thr Lys Ser Arg Ser Arg Ser Cys
20 25 30
Pro Ile Thr Leu Thr Lys Pro Ile Ser Phe Arg Ser Lys Arg Thr Val
35 40 45
Ser Ser Ser Ser Ser Ile Val Ser Ser Ser Val Val Thr Lys Glu Asp
50 55 60
Asn Leu Arg Gln Ser Glu Pro Ser Ser Phe Asp Phe Met Ser Tyr Ile
65 70 75 80
Ile Thr Lys Ala Glu Leu Val Asn Lys Ala Leu Asp Ser Ala Val Pro
85 90 95
Leu Arg Glu Pro Leu Lys Ile His Glu Ala Met Arg Tyr Ser Leu Leu
100 105 110
Ala Gly Gly Lys Arg Val Arg Pro Val Leu Cys Ile Ala Ala Cys Glu
115 120 125
Leu Val Gly Gly Glu Glu Ser Thr Ala Met Pro Ala Ala Cys Ala Val
130 135 140
Glu Met Ile His Thr Met Ser Leu Ile His Asp Asp Leu Pro Cys Met
145 150 155 160
Asp Asn Asp Asp Leu Arg Arg Gly Lys Pro Thr Asn His Lys Val Phe
165 170 175
Gly Glu Asp Val Ala Val Leu Ala Gly Asp Ala Leu Leu Ser Phe Ala
180 185 190
Phe Glu His Leu Ala Ser Ala Thr Ser Ser Asp Val Val Ser Pro Val
195 200 205
Arg Val Val Arg Ala Val Gly Glu Leu Ala Lys Ala Ile Gly Thr Glu
210 215 220
Gly Leu Val Ala Gly Gln Val Val Asp Ile Ser Ser Glu Gly Leu Asp
225 230 235 240
Leu Asn Asp Val Gly Leu Glu His Leu Glu Phe Ile His Leu His Lys
245 250 255
Thr Ala Ala Leu Leu Glu Ala Ser Ala Val Leu Gly Ala Ile Val Gly
260 265 270
Gly Gly Ser Asp Asp Glu Ile Glu Arg Leu Arg Lys Phe Ala Arg Cys
275 280 285
Ile Gly Leu Leu Phe Gln Val Val Asp Asp Ile Leu Asp Val Thr Lys
290 295 300
Ser Ser Lys Glu Leu Gly Lys Thr Ala Gly Lys Asp Leu Ile Ala Asp
305 310 315 320
Lys Leu Thr Tyr Pro Lys Ile Met Gly Leu Glu Lys Ser Arg Glu Phe
325 330 335
Ala Glu Lys Leu Asn Arg Glu Ala Arg Asp Gln Leu Leu Gly Phe Asp
340 345 350
Ser Asp Lys Val Ala Pro Leu Leu Ala Leu Ala Asn Tyr Ile Ala Tyr
355 360 365
Arg Gln Asn
370
<210> 51
<211> 462
<212> PRT
<213> Oryza sativa
<400> 51
Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His
1 5 10 15
Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu
20 25 30
Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val
35 40 45
Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu
50 55 60
Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly
65 70 75 80
Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro
85 90 95
Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro
100 105 110
Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp
115 120 125
Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro
130 135 140
Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala
145 150 155 160
Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly
165 170 175
Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys
180 185 190
Leu Ile Arg Thr Lys Gly Ser Ser Gly Met Ser Leu Ala Glu Arg Phe
195 200 205
Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val
210 215 220
Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys
225 230 235 240
Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg
245 250 255
Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala
260 265 270
Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val
275 280 285
Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg
290 295 300
Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu
305 310 315 320
Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala
325 330 335
Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly
340 345 350
Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met
355 360 365
Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Gly Pro
370 375 380
Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg
385 390 395 400
Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile
405 410 415
Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys
420 425 430
Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg
435 440 445
Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp
450 455 460
<210> 52
<211> 1389
<212> DNA
<213> Oryza sativa
<400> 52
atggactccg gctactcctc ctcctacgcc gccgccgccg ggatgcacgt cgtgatctgc 60
ccgtggctcg ccttcggcca cctgctcccg tgcctcgacc tcgcccagcg cctcgcgtcg 120
cggggccacc gcgtgtcgtt cgtctccacg ccgcggaaca tatcccgcct cccgccggtg 180
cgccccgcgc tcgcgccgct cgtcgccttc gtggcgctgc cgctcccgcg cgtcgagggg 240
ctccccgacg gcgccgagtc caccaacgac gtcccccacg acaggccgga catggtcgag 300
ctccaccgga gggccttcga cgggctcgcc gcgcccttct cggagttctt gggcaccgcg 360
tgcgccgact gggtcatcgt cgacgtcttc caccactggg ccgcagccgc cgctctcgag 420
cacaaggtgc catgtgcaat gatgttgttg ggctctgcac atatgatcgc ttccatagca 480
gacagacggc tcgagcgcgc ggagacagag tcgcctgcgg ctgccgggca gggacgccca 540
gcggcggcgc caacgttcga ggtggcgagg atgaagttga tacgaaccaa aggctcatcg 600
ggaatgtccc tcgccgagcg cttctccttg acgctctcga ggagcagcct cgtcgtcggg 660
cggagctgcg tggagttcga gccggagacc gtcccgctcc tgtcgacgct ccgcggtaag 720
cctattacct tccttggcct tatgccgccg ttgcatgaag gccgccgcga ggacggcgag 780
gatgccaccg tccgctggct cgacgcgcag ccggccaagt ccgtcgtgta cgtcgcgcta 840
ggcagcgagg tgccactggg agtggagaag gtccacgagc tcgcgctcgg gctggagctc 900
gccgggacgc gcttcctctg ggctcttagg aagcccactg gcgtctccga cgccgacctc 960
ctccccgccg gcttcgagga gcgcacgcgc ggccgcggcg tcgtggcgac gagatgggtt 1020
cctcagatga gcatactggc gcacgccgcc gtgggcgcgt tcctgaccca ctgcggctgg 1080
aactcgacca tcgaggggct catgttcggc cacccgctta tcatgctgcc gatcttcggc 1140
gaccagggac cgaacgcgcg gctaatcgag gcgaagaacg ccggattgca ggtggcaaga 1200
aacgacggcg atggatcgtt cgaccgagaa ggcgtcgcgg cggcgattcg tgcagtcgcg 1260
gtggaggaag aaagcagcaa agtgtttcaa gccaaagcca agaagctgca ggagatcgtc 1320
gcggacatgg cctgccatga gaggtacatc gacggattca ttcagcaatt gagatcttac 1380
aaggattga 1389
<210> 53
<211> 1389
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized Oryza sativa sequence encoding EUGT11
<400> 53
atggatagtg gctactcctc atcttatgct gctgccgctg gtatgcacgt tgtgatctgc 60
ccttggttgg cctttggtca cctgttacca tgtctggatt tagcccaaag actggcctca 120
agaggccata gagtatcatt tgtgtctact cctagaaata tctctcgttt accaccagtc 180
agacctgctc tagctcctct agttgcattc gttgctcttc cacttccaag agtagaagga 240
ttgccagacg gcgctgaatc tactaatgac gtaccacatg atagacctga catggtcgaa 300
ttgcatagaa gagcctttga tggattggca gctccatttt ctgagttcct gggcacagca 360
tgtgcagact gggttatagt cgatgtattt catcactggg ctgctgcagc cgcattggaa 420
cataaggtgc cttgtgctat gatgttgtta gggtcagcac acatgatcgc atccatagct 480
gatagaagat tggaaagagc tgaaacagaa tccccagccg cagcaggaca aggtaggcca 540
gctgccgccc caacctttga agtggctaga atgaaattga ttcgtactaa aggtagttca 600
gggatgagtc ttgctgaaag gttttctctg acattatcta gatcatcatt agttgtaggt 660
agatcctgcg tcgagttcga acctgaaaca gtacctttac tatctacttt gagaggcaaa 720
cctattactt tccttggtct aatgcctcca ttacatgaag gaaggagaga agatggtgaa 780
gatgctactg ttaggtggtt agatgcccaa cctgctaagt ctgttgttta cgttgcattg 840
ggttctgagg taccactagg ggtggaaaag gtgcatgaat tagcattagg acttgagctg 900
gccggaacaa gattcctttg ggctttgaga aaaccaaccg gtgtttctga cgccgacttg 960
ctaccagctg ggttcgaaga gagaacaaga ggccgtggtg tcgttgctac tagatgggtc 1020
ccacaaatga gtattctagc tcatgcagct gtaggggcct ttctaaccca ttgcggttgg 1080
aactcaacaa tagaaggact gatgtttggt catccactta ttatgttacc aatctttggc 1140
gatcagggac ctaacgcaag attgattgag gcaaagaacg caggtctgca ggttgcacgt 1200
aatgatggtg atggttcctt tgatagagaa ggcgttgcag ctgccatcag agcagtcgcc 1260
gttgaggaag agtcatctaa agttttccaa gctaaggcca aaaaattaca agagattgtg 1320
gctgacatgg cttgtcacga aagatacatc gatggtttca tccaacaatt gagaagttat 1380
aaagactaa 1389
<210> 54
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<223> UGT91D2e
<400> 54
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val
1 5 10 15
Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln
20 25 30
Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp
245 250 255
Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys
260 265 270
Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val
435 440 445
Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 55
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<223> UGT91D2m
<400> 55
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val
1 5 10 15
Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln
20 25 30
Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Val Pro Gly Asp
245 250 255
Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys
260 265 270
Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val
435 440 445
Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Thr
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 56
<211> 459
<212> PRT
<213> Ipomoea purpurea
<400> 56
Met Gly Ser Gln Ala Thr Thr Tyr His Met Ala Met Tyr Pro Trp Phe
1 5 10 15
Gly Val Gly His Leu Thr Gly Phe Phe Arg Leu Ala Asn Lys Leu Ala
20 25 30
Gly Lys Gly His Arg Ile Ser Phe Leu Ile Pro Lys Asn Thr Gln Ser
35 40 45
Lys Leu Glu Ser Phe Asn Leu His Pro His Leu Ile Ser Phe Val Pro
50 55 60
Ile Val Val Pro Ser Ile Pro Gly Leu Pro Pro Gly Ala Glu Thr Thr
65 70 75 80
Ser Asp Val Pro Phe Pro Ser Thr His Leu Leu Met Glu Ala Met Asp
85 90 95
Lys Thr Gln Asn Asp Ile Glu Ile Ile Leu Lys Asp Leu Lys Val Asp
100 105 110
Val Val Phe Tyr Asp Phe Thr His Trp Leu Pro Ser Leu Ala Arg Lys
115 120 125
Ile Gly Ile Lys Ser Val Phe Tyr Ser Thr Ile Ser Pro Leu Met His
130 135 140
Gly Tyr Ala Leu Ser Pro Glu Arg Arg Val Val Gly Lys Gln Leu Thr
145 150 155 160
Glu Ala Asp Met Met Lys Ala Pro Ala Ser Phe Pro Asp Pro Ser Ile
165 170 175
Lys Leu His Ala His Glu Ala Arg Gly Phe Thr Ala Arg Thr Val Met
180 185 190
Lys Phe Gly Gly Asp Ile Thr Phe Phe Asp Arg Ile Phe Thr Ala Val
195 200 205
Ser Glu Ser Asp Gly Leu Ala Tyr Ser Thr Cys Arg Glu Ile Glu Gly
210 215 220
Gln Phe Cys Asp Tyr Ile Glu Thr Gln Phe Gln Lys Pro Val Leu Leu
225 230 235 240
Ala Gly Pro Ala Leu Pro Val Pro Ser Lys Ser Thr Met Glu Gln Lys
245 250 255
Trp Ser Asp Trp Leu Gly Lys Phe Lys Glu Gly Ser Val Ile Tyr Cys
260 265 270
Ala Phe Gly Ser Glu Cys Thr Leu Arg Lys Asp Lys Phe Gln Glu Leu
275 280 285
Leu Trp Gly Leu Glu Leu Thr Gly Met Pro Phe Phe Ala Ala Leu Lys
290 295 300
Pro Pro Phe Glu Thr Glu Ser Val Glu Ala Ala Ile Pro Glu Glu Leu
305 310 315 320
Lys Glu Lys Ile Gln Gly Arg Gly Ile Val His Gly Glu Trp Val Gln
325 330 335
Gln Gln Leu Phe Leu Gln His Pro Ser Val Gly Cys Phe Val Ser His
340 345 350
Cys Gly Trp Ala Ser Leu Ser Glu Ala Leu Val Asn Asp Cys Gln Ile
355 360 365
Val Leu Leu Pro Gln Val Gly Asp Gln Ile Ile Asn Ala Arg Ile Met
370 375 380
Ser Val Ser Leu Lys Val Gly Val Glu Val Glu Lys Gly Glu Glu Asp
385 390 395 400
Gly Val Phe Ser Arg Glu Ser Val Cys Lys Ala Val Lys Ala Val Met
405 410 415
Asp Glu Lys Ser Glu Ile Gly Arg Glu Val Arg Gly Asn His Asp Lys
420 425 430
Leu Arg Gly Phe Leu Met Asn Ala Asp Leu Asp Ser Lys Tyr Met Asp
435 440 445
Ser Phe Asn Gln Lys Leu Gln Asp Leu Leu Gly
450 455
<210> 57
<211> 1380
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized I. purpurea IP3GGT nucleotide sequence
<400> 57
atgggttctc aagctacaac ttaccatatg gccatgtatc catggtttgg ggttggacat 60
ttgactggtt tcttccgttt ggcaaacaaa ttagctggca aaggacatag aatctcattt 120
ctaattccta aaaacactca atctaagtta gaatctttca accttcatcc acacttaatc 180
tcttttgtgc ctatcgttgt cccaagtata ccaggcctgc cacctggtgc agagactaca 240
tcagatgttc ctttcccaag tacacatttg ctaatggaag caatggacaa gactcaaaac 300
gatatagaga ttatcctgaa ggatcttaaa gtagatgttg ttttctatga ttttactcac 360
tggttgcctt ctctggccag aaagattggc attaagagtg tcttttactc caccatttct 420
cctttaatgc atggatatgc tttatcacca gaaagacgtg tagttggtaa gcaattgaca 480
gaggcagata tgatgaaggc cccagcttct ttcccagacc catccattaa gctacatgca 540
catgaagcta ggggttttac agccagaacc gttatgaaat tcggtggtga catcaccttt 600
ttcgatagaa tattcacagc agtttccgaa agtgatggcc tggcctactc tacttgtaga 660
gagatcgagg gacaattctg tgattacatt gaaacacaat tccagaagcc agtcttgtta 720
gccggtccag ctttgccagt cccatccaaa tccactatgg aacaaaagtg gtcagattgg 780
ttggggaaat tcaaggaagg ctccgtcatc tactgtgctt tcgggtctga atgtacattg 840
agaaaggaca aatttcagga acttttatgg ggtttggaat tgacaggaat gcctttcttc 900
gctgctctga agccaccttt tgagactgag tctgttgagg ctgctatccc tgaggaacta 960
aaggaaaaga ttcagggaag aggtatagta catggagaat gggtacaaca acaattgttt 1020
cttcaacacc catctgtcgg gtgcttcgtt tctcactgcg gctgggcaag tttatctgaa 1080
gcccttgtta atgattgtca aatcgtgtta cttccacaag ttggcgatca gattatcaac 1140
gccagaataa tgtcagtatc acttaaagtg ggcgtggaag ttgaaaaggg tgaggaggac 1200
ggtgtctttt caagagaatc tgtgtgcaag gctgttaaag cagtaatgga tgaaaaatct 1260
gaaatcggta gagaagtcag aggtaatcat gataaactga ggggtttctt gatgaatgca 1320
gacttagatt caaagtacat ggattcattc aatcaaaagc tacaagattt gctaggttaa 1380
<210> 58
<211> 438
<212> PRT
<213> Bellis perennis
<400> 58
Met Asp Ser Lys Ile Asp Ser Lys Thr Phe Arg Val Val Met Leu Pro
1 5 10 15
Trp Leu Ala Tyr Ser His Ile Ser Ser Phe Leu Val Phe Ala Lys Arg
20 25 30
Leu Thr Asn His Asn Phe His Ile Tyr Ile Cys Ser Ser Gln Thr Asn
35 40 45
Met Gln Tyr Leu Lys Asn Asn Leu Thr Ser Gln Tyr Ser Lys Ser Ile
50 55 60
Gln Leu Ile Glu Leu Asn Leu Pro Ser Ser Ser Glu Leu Pro Leu Gln
65 70 75 80
Tyr His Thr Thr His Gly Leu Pro Pro His Leu Thr Lys Thr Leu Ser
85 90 95
Asp Asp Tyr Gln Lys Ser Gly Pro Asp Phe Glu Thr Ile Leu Ile Lys
100 105 110
Leu Asn Pro His Leu Val Ile Tyr Asp Phe Asn Gln Leu Trp Ala Pro
115 120 125
Glu Val Ala Ser Thr Leu His Ile Pro Ser Ile Gln Leu Leu Ser Gly
130 135 140
Cys Val Ala Leu Tyr Ala Leu Asp Ala His Leu Tyr Thr Lys Pro Leu
145 150 155 160
Asp Glu Asn Leu Ala Lys Phe Pro Phe Pro Glu Ile Tyr Pro Lys Asn
165 170 175
Arg Asp Ile Pro Lys Gly Gly Ser Lys Tyr Ile Glu Arg Phe Val Asp
180 185 190
Cys Met Arg Arg Ser Cys Glu Ile Ile Leu Val Arg Ser Thr Met Glu
195 200 205
Leu Glu Gly Lys Tyr Ile Asp Tyr Leu Ser Lys Thr Leu Gly Lys Lys
210 215 220
Val Leu Pro Val Gly Pro Leu Val Gln Glu Ala Ser Leu Leu Gln Asp
225 230 235 240
Asp His Ile Trp Ile Met Lys Trp Leu Asp Lys Lys Glu Glu Ser Ser
245 250 255
Val Val Phe Val Cys Phe Gly Ser Glu Tyr Ile Leu Ser Asp Asn Glu
260 265 270
Ile Glu Asp Ile Ala Tyr Gly Leu Glu Leu Ser Gln Val Ser Phe Val
275 280 285
Trp Ala Ile Arg Ala Lys Thr Ser Ala Leu Asn Gly Phe Ile Asp Arg
290 295 300
Val Gly Asp Lys Gly Leu Val Ile Asp Lys Trp Val Pro Gln Ala Asn
305 310 315 320
Ile Leu Ser His Ser Ser Thr Gly Gly Phe Ile Ser His Cys Gly Trp
325 330 335
Ser Ser Thr Met Glu Ser Ile Arg Tyr Gly Val Pro Ile Ile Ala Met
340 345 350
Pro Met Gln Phe Asp Gln Pro Tyr Asn Ala Arg Leu Met Glu Thr Val
355 360 365
Gly Ala Gly Ile Glu Val Gly Arg Asp Gly Glu Gly Arg Leu Lys Arg
370 375 380
Glu Glu Ile Ala Ala Val Val Arg Lys Val Val Val Glu Asp Ser Gly
385 390 395 400
Glu Ser Ile Arg Glu Lys Ala Lys Glu Leu Gly Glu Ile Met Lys Lys
405 410 415
Asn Met Glu Ala Glu Val Asp Gly Ile Val Ile Glu Asn Leu Val Lys
420 425 430
Leu Cys Glu Met Asn Asn
435
<210> 59
<211> 1317
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon-optimized Bellis perennis UGT94B1 nucleotide sequence
<400> 59
atggattcta aaatcgattc aaagacattc agagtcgtta tgttgccttg gcttgcatac 60
tcacacattt catcattcct agtgtttgcc aagagactaa caaatcataa cttccacatc 120
tacatttgtt cctctcaaac aaatatgcaa tacctgaaaa acaacttgac gtctcagtat 180
tcaaaatcta tacaactgat tgagttgaat cttccatcta gttccgaatt gcctctgcag 240
tatcatacta ctcacggact accaccacac cttacgaaaa cattgtctga tgattatcaa 300
aagtccggac ctgactttga aaccattttg atcaaattga acccacatct ggtaatctac 360
gactttaatc aactttgggc tccagaggtt gctagtacac ttcatattcc atccatacag 420
ttactgtctg gttgcgtcgc cttatatgcc ttagacgccc atctgtacac aaagccacta 480
gacgaaaact tggctaagtt tcctttccca gaaatctatc ctaaaaacag agatattcct 540
aagggaggta gtaaatacat cgaaaggttc gtagactgta tgagaagatc ttgtgaaatc 600
atattagtca gaagtaccat ggaacttgaa ggaaaataca ttgattactt gtctaagaca 660
ttagggaaaa aggtgttgcc agtagggcct ctggtgcaag aggcttcttt gttgcaagat 720
gatcatatat ggattatgaa gtggttagac aaaaaggagg agtcatccgt cgtgtttgtt 780
tgttttggtt ctgagtacat cttatcagac aacgaaatag aagatattgc ttatggccta 840
gagttgtccc aagtaagttt cgtttgggca ataagagcta agacttctgc cttaaatggc 900
ttcattgata gagtgggtga taaaggctta gtcatcgata aatgggttcc acaggctaac 960
atcttatctc actcttctac tggtggattc attagtcatt gcggttggtc atcaacaatg 1020
gaatctatta gatatggggt tcctattatc gccatgccaa tgcaattcga tcaaccttac 1080
aatgctaggt tgatggaaac tgttggtgca ggtatcgaag ttggcagaga tggcgaaggt 1140
agattgaaaa gagaagagat tgctgccgtg gttagaaagg tcgttgttga agattctggg 1200
gaatccataa gggagaaggc aaaggaattg ggagaaatca tgaaaaaaaa catggaggcc 1260
gaagtagatg gtatagtgat tgaaaatcta gttaagctat gtgagatgaa caattaa 1317
<210> 60
<211> 440
<212> PRT
<213> Leishmania infantum
<400> 60
Met His Ser Thr Arg His Ile Leu Arg Gln Arg Ala Val Leu Val Thr
1 5 10 15
Gly Ala Arg Thr Pro Phe Val Lys Ser Phe Gly Ala Leu Met Lys Ala
20 25 30
Asp Thr Leu Glu Leu Ala Ser Ala Ser Val Ala Gly Leu Leu Asn Lys
35 40 45
Thr Ser Leu Asp Pro Arg Asp Ile Asp His Ile Val Trp Gly Asn Val
50 55 60
Val Leu Gln Gly Ser Ala His Asn Cys Ala Arg Glu Ile Val Ile Asp
65 70 75 80
Leu Asn Met Pro Lys Lys Ile Ile Gly Asn Leu Thr Ser Met Ala Cys
85 90 95
Ala Ser Gly Leu Ser Ser Leu Ser Gln Ala Cys Met Leu Ile Glu Gly
100 105 110
Gly His Ala Asp Val Val Ile Ala Gly Gly Ser Asp Ser Val Ser Asn
115 120 125
Thr Glu Val Pro Leu Pro Arg Ser Val Thr Tyr Gly Leu Met Met Ala
130 135 140
Gln Arg Lys Gly Val Met Gly Phe Phe Lys Glu Ala Gly Tyr Asn Pro
145 150 155 160
Phe Lys Trp Phe Pro Gly Gly Ile Ala Leu Thr Glu Arg Ser Thr Gly
165 170 175
Lys Thr Met Gly Trp His Gly Asp Leu Ile Ala Glu Leu Asn Ser Ile
180 185 190
Ser Arg Asp Asp Gln Glu Ala Leu Ala Val Ala Ser His Ala Asn Ala
195 200 205
Ala Arg Ala Glu Lys Ala Gly Tyr Phe Lys Glu Glu Ile Val Pro Val
210 215 220
Thr Ile Asp Lys Lys Gly Lys Lys Thr Glu Val Thr Cys Asp Asp Val
225 230 235 240
Met Gln Arg Asp Thr Glu Lys Met Lys Ala Lys Met Pro Ser Leu Lys
245 250 255
Pro Val Phe Arg Lys Glu Gly Gly Thr Ile Thr Ala Ala Thr Ser Ser
260 265 270
Thr Leu Thr Asp Gly Gly Ser Ala Met Leu Val Met Ser Glu Glu Lys
275 280 285
Ala Lys Lys Leu Gly Tyr Pro Thr Asp Val Cys Val Lys Ser Trp Tyr
290 295 300
Phe Ser Gly Ile Asp Pro Tyr Pro Gln Leu Leu Leu Ala Pro Val Leu
305 310 315 320
Gly Trp Gly Pro Ala Leu Lys Lys Ala Gly Leu Thr Pro Lys Asp Ile
325 330 335
Asp Leu Tyr Glu Ile His Glu Ala Phe Ala Ala Gln Val Leu Ala Thr
340 345 350
Ile Lys Cys Leu Lys Ser Gln Glu Phe Phe Asp Arg Tyr Ala Asn Gly
355 360 365
Ala Lys Pro Val Leu Thr Glu Asp Ile Asp Leu Ser Lys Leu Asn Val
370 375 380
Asn Gly Gly Ser Leu Ala Leu Gly His Pro Phe Ala Ala Thr Gly Gly
385 390 395 400
Arg Ile Val Ile Ser Leu Ala Asn Glu Leu Arg Arg Ser Gly Lys Arg
405 410 415
His Gly Leu Val Ser Ile Cys Ala Ala Gly Gly Leu Gly Gly Val Ala
420 425 430
Ile Leu Glu His Thr Ala Ser Lys
435 440
<210> 61
<211> 1323
<212> DNA
<213> Leishmania infantum
<400> 61
atgcactcga ctcgccatat tttgcgtcaa cgagcggtcc tcgtcaccgg ggcgaggacg 60
ccgtttgtca agtcctttgg ggctctgatg aaggcagaca cgctggagct ggcgagtgca 120
tccgtagccg gtctcctcaa caagacgtcg ctggatccca gagacattga ccacattgtg 180
tggggcaacg tggtgcttca aggaagcgct cacaactgcg cgcgcgagat agtgattgat 240
ctgaacatgc cgaagaagat catcggcaat ctcacaagca tggcatgcgc gagtggactt 300
agctcgctct cgcaggcatg catgctgatc gagggtgggc atgctgatgt cgttattgcc 360
ggtgggagcg acagtgtgag caatacagag gtcccactgc cacgctccgt gacgtacggg 420
ctgatgatgg cccagaggaa gggcgtcatg ggcttcttca aggaagcggg ctacaatccg 480
ttcaagtggt ttccgggcgg cattgcgctg acagagcgga gcactggaaa gaccatgggg 540
tggcacgggg atctcattgc ggagctcaac agcatctcgc gcgacgacca ggaggctctg 600
gcggtggctt cgcacgctaa tgccgcccgg gctgaaaagg cggggtactt caaagaggaa 660
attgtccctg tcacgattga taagaaaggt aagaagaccg aggtgacctg cgacgacgtt 720
atgcagcgcg acactgagaa aatgaaagcc aaaatgccaa gcctcaagcc cgtttttcga 780
aaggagggag gaaccatcac ggctgccacg tcaagcacct tgacagatgg aggtagcgcg 840
atgctcgtca tgtctgagga gaaggcgaag aagcttggat acccgaccga tgtttgtgtc 900
aagagctggt acttctccgg aattgatcct tatccgcagc tccttctcgc acctgttctg 960
ggctggggcc cagcgctgaa gaaggcgggc ctgacgccga aggacatcga tctctacgag 1020
atccacgaag cctttgcggc tcaggtgctc gcgacgatca agtgcctgaa gtcgcaggag 1080
ttctttgacc ggtacgctaa cggcgccaaa cctgttctaa cggaagacat cgacttgtcg 1140
aagctgaacg tgaatggcgg gtccctggca ctgggtcacc cgttcgctgc aactggtggt 1200
cggattgtga cctcgcttgc caatgagctg cgacggtccg gcaagcgcca tggccttgtg 1260
agcatttgcg ctgctggcgg tctcggcggc gttgctattc tagagcacac tgccagtaag 1320
tag 1323
<210> 62
<211> 527
<212> PRT
<213> Artificial Sequence
<220>
<223> truncated Saccharomyces cerevisiae HMG
<400> 62
Met Ala Ala Asp Gln Leu Val Lys Thr Glu Val Thr Lys Lys Ser Phe
1 5 10 15
Thr Ala Pro Val Gln Lys Ala Ser Thr Pro Val Leu Thr Asn Lys Thr
20 25 30
Val Ile Ser Gly Ser Lys Val Lys Ser Leu Ser Ser Ala Gln Ser Ser
35 40 45
Ser Ser Gly Pro Ser Ser Ser Ser Glu Glu Asp Asp Ser Arg Asp Ile
50 55 60
Glu Ser Leu Asp Lys Lys Ile Arg Pro Leu Glu Glu Leu Glu Ala Leu
65 70 75 80
Leu Ser Ser Gly Asn Thr Lys Gln Leu Lys Asn Lys Glu Val Ala Ala
85 90 95
Leu Val Ile His Gly Lys Leu Pro Leu Tyr Ala Leu Glu Lys Lys Leu
100 105 110
Gly Asp Thr Thr Arg Ala Val Ala Val Arg Arg Lys Ala Leu Ser Ile
115 120 125
Leu Ala Glu Ala Pro Val Leu Ala Ser Asp Arg Leu Pro Tyr Lys Asn
130 135 140
Tyr Asp Tyr Asp Arg Val Phe Gly Ala Cys Cys Glu Asn Val Ile Gly
145 150 155 160
Tyr Met Pro Leu Pro Val Gly Val Ile Gly Pro Leu Val Ile Asp Gly
165 170 175
Thr Ser Tyr His Ile Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala
180 185 190
Ser Ala Met Arg Gly Cys Lys Ala Ile Asn Ala Gly Gly Gly Ala Thr
195 200 205
Thr Val Leu Thr Lys Asp Gly Met Thr Arg Gly Pro Val Val Arg Phe
210 215 220
Pro Thr Leu Lys Arg Ser Gly Ala Cys Lys Ile Trp Leu Asp Ser Glu
225 230 235 240
Glu Gly Gln Asn Ala Ile Lys Lys Ala Phe Asn Ser Thr Ser Arg Phe
245 250 255
Ala Arg Leu Gln His Ile Gln Thr Cys Leu Ala Gly Asp Leu Leu Phe
260 265 270
Met Arg Phe Arg Thr Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile
275 280 285
Ser Lys Gly Val Glu Tyr Ser Leu Lys Gln Met Val Glu Glu Tyr Gly
290 295 300
Trp Glu Asp Met Glu Val Val Ser Val Ser Gly Asn Tyr Cys Thr Asp
305 310 315 320
Lys Lys Pro Ala Ala Ile Asn Trp Ile Glu Gly Arg Gly Lys Ser Val
325 330 335
Val Ala Glu Ala Thr Ile Pro Gly Asp Val Val Arg Lys Val Leu Lys
340 345 350
Ser Asp Val Ser Ala Leu Val Glu Leu Asn Ile Ala Lys Asn Leu Val
355 360 365
Gly Ser Ala Met Ala Gly Ser Val Gly Gly Phe Asn Ala His Ala Ala
370 375 380
Asn Leu Val Thr Ala Val Phe Leu Ala Leu Gly Gln Asp Pro Ala Gln
385 390 395 400
Asn Val Glu Ser Ser Asn Cys Ile Thr Leu Met Lys Glu Val Asp Gly
405 410 415
Asp Leu Arg Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Ile
420 425 430
Gly Gly Gly Thr Val Leu Glu Pro Gln Gly Ala Met Leu Asp Leu Leu
435 440 445
Gly Val Arg Gly Pro His Ala Thr Ala Pro Gly Thr Asn Ala Arg Gln
450 455 460
Leu Ala Arg Ile Val Ala Cys Ala Val Leu Ala Gly Glu Leu Ser Leu
465 470 475 480
Cys Ala Ala Leu Ala Ala Gly His Leu Val Gln Ser His Met Thr His
485 490 495
Asn Arg Lys Pro Ala Glu Pro Thr Lys Pro Asn Asn Leu Asp Ala Thr
500 505 510
Asp Ile Asn Arg Leu Lys Asp Gly Ser Val Thr Cys Ile Lys Ser
515 520 525
<210> 63
<211> 1584
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic nucleotide sequence encoding truncated Saccharomyces
cerevisiae HMG
<400> 63
atggcagctg accaattggt gaaaactgaa gtcaccaaga agtcttttac tgctcctgta 60
caaaaggctt ctacaccagt tttaaccaat aaaacagtca tttctggatc gaaagtcaaa 120
agtttatcat ctgcgcaatc gagctcatca ggaccttcat catctagtga ggaagatgat 180
tcccgcgata ttgaaagctt ggataagaaa atacgtcctt tagaagaatt agaagcatta 240
ttaagtagtg gaaatacaaa acaattgaag aacaaagagg tcgctgcctt ggttattcac 300
ggtaagttac ctttgtacgc tttggagaaa aaattaggtg atactacgag agcggttgcg 360
gtacgtagga aggctctttc aattttggca gaagctcctg tattagcatc tgatcgttta 420
ccatataaaa attatgacta cgaccgcgta tttggcgctt gttgtgaaaa tgttataggt 480
tacatgcctt tgcccgttgg tgttataggc cccttggtta tcgatggtac atcttatcat 540
ataccaatgg caactacaga gggttgtttg gtagcttctg ccatgcgtgg ctgtaaggca 600
atcaatgctg gcggtggtgc aacaactgtt ttaactaagg atggtatgac aagaggccca 660
gtagtccgtt tcccaacttt gaaaagatct ggtgcctgta agatatggtt agactcagaa 720
gagggacaaa acgcaattaa aaaagctttt aactctacat caagatttgc acgtctgcaa 780
catattcaaa cttgtctagc aggagattta ctcttcatga gatttagaac aactactggt 840
gacgcaatgg gtatgaatat gatttctaaa ggtgtcgaat actcattaaa gcaaatggta 900
gaagagtatg gctgggaaga tatggaggtt gtctccgttt ctggtaacta ctgtaccgac 960
aaaaaaccag ctgccatcaa ctggatcgaa ggtcgtggta agagtgtcgt cgcagaagct 1020
actattcctg gtgatgttgt cagaaaagtg ttaaaaagtg atgtttccgc attggttgag 1080
ttgaacattg ctaagaattt ggttggatct gcaatggctg ggtctgttgg tggatttaac 1140
gcacatgcag ctaatttagt gacagctgtt ttcttggcat taggacaaga tcctgcacaa 1200
aatgttgaaa gttccaactg tataacattg atgaaagaag tggacggtga tttgagaatt 1260
tccgtatcca tgccatccat cgaagtaggt accatcggtg gtggtactgt tctagaacca 1320
caaggtgcca tgttggactt attaggtgta agaggcccgc atgctaccgc tcctggtacc 1380
aacgcacgtc aattagcaag aatagttgcc tgtgccgtct tggcaggtga attatcctta 1440
tgtgctgccc tagcagccgg ccatttggtt caaagtcata tgacccacaa caggaaacct 1500
gctgaaccaa caaaacctaa caatttggac gccactgata taaatcgttt gaaagatggg 1560
tccgtcacct gcattaaatc ctaa 1584
<210> 64
<211> 1226
<212> PRT
<213> Ganoderma lucidium
<400> 64
Met Arg Ala Val Leu Arg Leu Leu Ser Thr His Thr Val Phe Ser Pro
1 5 10 15
Ile Glu Thr Ile Val Ser Val Phe Val Leu Ala Thr Leu Ala Tyr Phe
20 25 30
His Ile Leu Ser Gly Ile Lys His Ser Ser Phe Phe Ala Ser Ser His
35 40 45
Pro Pro Ala Ile Arg Pro Ala Phe Ala His Leu Thr Asn Gly Glu Trp
50 55 60
Val Ala Val Ser Gln His Asp Trp Thr Glu Ala Trp Lys His Pro Gly
65 70 75 80
Gly Ser Leu Asp Ala Leu Glu Leu Gln Gln Val Val Phe Thr Leu Asp
85 90 95
Asp Lys Thr Gln Pro Ser Ala Val Leu Asp Ala Ser Ala Ile Ser Gln
100 105 110
His Leu Val Ser Asn Val Pro Ala Leu Ser Gly Lys Ala Tyr Ser Ser
115 120 125
Leu Cys His His Pro Asn Val Ser Gly Thr Ser Cys Phe Thr Ser Val
130 135 140
Ser Gly Pro Gly Ala Ser Pro Ile Leu Thr Leu Ser Phe Lys Pro Gly
145 150 155 160
Thr Arg Asp Asp Trp Leu Gly Ser Leu Arg Lys Glu Lys Thr Ile Thr
165 170 175
Leu Asp Gly Val Lys Tyr Asp Val Gly Ala Gly Lys Arg Gln Glu Ser
180 185 190
Ile Gly Asp Met Glu Ser Ser Lys Trp Val Ala Tyr Ala Leu Ser Ala
195 200 205
Leu Val Leu Arg Phe Trp Glu Leu Thr Lys Ala Asp Ser Leu Asp Ile
210 215 220
Leu Val Val Leu Thr Gly Tyr Ile Leu Met His Val Thr Phe Met Arg
225 230 235 240
Leu Phe Leu Ala Ser Arg Ala Leu Gly Ser Asn Phe Trp Leu Ser Ala
245 250 255
Gly Ile Phe Ser Ser Ala Thr Ile Ser Phe Leu Phe Thr Leu Pro Met
260 265 270
Cys Arg Ser Met Asp Ile Pro Leu Asp Pro Ile Ala Leu Thr Glu Ala
275 280 285
Leu Pro Phe Leu Val Cys Thr Val Gly Phe Asp Lys Pro Leu Arg Leu
290 295 300
Ala Arg Ala Val Met Ala His Pro Asn Ile Leu Lys Pro Gln Asp Asp
305 310 315 320
Gly Arg Met Lys Ala Ala Gly Asp Val Ile Leu Glu Ala Leu Asp Arg
325 330 335
Val Gly Asn Met Ile Leu Arg Asp Tyr Ala Leu Glu Ile Ala Val Leu
340 345 350
Phe Val Gly Val Asn Ser Arg Val Gly Gly Leu Lys Glu Phe Cys Ala
355 360 365
Val Ala Ala Ala Leu Leu Ala Met Asp Arg Leu Met Thr Phe Thr Leu
370 375 380
Tyr Thr Ala Val Leu Thr Ile Met Val Glu Val Arg Arg Ile Lys Lys
385 390 395 400
Val Arg Asp Met Thr Lys Ala Arg Ser Arg Ser Ser Ser Ile Thr Ala
405 410 415
Val Thr Ala Asn Gly Thr Ala Ile Arg Gly Val Leu Ser Arg Lys Ser
420 425 430
Ser Lys Gln Ser Val Thr Glu Pro Glu Thr Thr Lys Asn Leu Arg Gln
435 440 445
Arg Ala Thr Asp Ser Ala Ile Gly Val Lys Gly Ser Leu Leu Lys Asp
450 455 460
Gly Gly Arg Leu Gln Glu Ala Glu Glu Asn Pro Met Ala Arg Leu Lys
465 470 475 480
Leu Leu Leu Ile Ala Ser Phe Leu Thr Leu His Ile Leu Asn Phe Cys
485 490 495
Thr Thr Leu Thr Ser Ala Thr Ala Asn Ala Arg His Gln Arg His Pro
500 505 510
Phe Arg Thr Val Gln Glu Val Val Pro Ile Pro Arg Val Asp Ile Thr
515 520 525
Thr Pro Ala Ile Ala Asn Ile Leu Ser His Leu Ala Val Ala Gln Glu
530 535 540
Pro Met Phe Thr Val Val Gly Ser Glu Pro Ile Glu Leu Leu Val Lys
545 550 555 560
Val Ala Ala Pro Val Tyr Val His Ala Leu Pro Leu Ala Pro Ala Leu
565 570 575
Arg Ala Ser Asn Thr Asn Thr Gly Glu Ala Ile Glu Asn Phe Met Ser
580 585 590
Ser Trp Ser Ser Leu Val Gly Asp Pro Val Val Ser Lys Trp Ile Val
595 600 605
Ala Leu Leu Ala Val Ser Val Ala Leu Asn Gly Tyr Leu Leu Lys Gly
610 615 620
Ile Ala Ala Gly Ser Gly Leu Ala Ala Met Arg Ala Val Arg Ser Gln
625 630 635 640
Gly Val Arg Phe Arg Ser Arg Ala Arg Ser Ile Val Lys Ile Ser Asp
645 650 655
Glu Pro Glu Pro Glu Pro Glu His Ser Ile Asp Pro Ala Pro Val Val
660 665 670
Phe Phe Ala Ser Ala Ala Pro Ala Val Glu Ala Pro Ala Pro Ala Pro
675 680 685
Ala Pro Glu Pro Glu Pro Pro Val Asn Arg Pro Pro Pro Leu Thr Ile
690 695 700
Phe Ser Arg Pro Leu Asn Leu Glu Thr Val Asp Lys Lys Leu Gln Asp
705 710 715 720
Ala Leu Pro Ile Arg Ser Pro Pro Pro Val Glu Pro Ile Thr Pro Glu
725 730 735
Ser Arg Glu Val Glu Pro Thr Gln Val Glu Val Arg Ser Leu Ala Glu
740 745 750
Cys Val Asp Val Phe Glu Asn Gly Pro Arg Pro Val Ser Val Ala Leu
755 760 765
Lys Thr Leu Asn Asp Glu Glu Val Ile Leu Leu Cys Gln Thr Gly Lys
770 775 780
Ile Ala Pro Tyr Ala Leu Val Lys Met Leu Ala Asp Phe Asp Arg Ala
785 790 795 800
Val Arg Val Arg Arg Ala Leu Ile Ser Arg Ala Ser Arg Thr Lys Thr
805 810 815
Leu Glu Asn Ser Leu Val Pro Met Lys Asp Tyr Asp Tyr Ala Arg Val
820 825 830
Met Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Leu Pro Leu
835 840 845
Gly Ile Ala Gly Pro Leu Lys Ile Asp Gly Leu Met Tyr Pro Ile Pro
850 855 860
Met Ala Thr Ala Glu Gly Thr Leu Val Ala Ser Thr Ser Arg Gly Cys
865 870 875 880
Lys Ala Leu Asn Ala Gly Gly Gly Val Thr Thr Val Leu Thr Ala Asp
885 890 895
Gly Met Thr Arg Gly Pro Ala Ile Asp Phe Pro Ser Ile Val Arg Ala
900 905 910
Ala Glu Ala Lys Ala Phe Ile Glu Ser Glu Asp Gly Tyr Ala Thr Ile
915 920 925
Arg Glu Ala Phe Glu Ser Thr Ser Arg Phe Ala Lys Leu Gln Lys Ile
930 935 940
Lys Cys Ala Leu Ala Gly Arg Thr Leu Phe Val Arg Phe Ala Thr Arg
945 950 955 960
Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Ala Thr Glu Lys
965 970 975
Ala Leu Asp Val Leu Ser His Glu Phe Pro Glu Met Val Val Leu Ala
980 985 990
Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ala Ala Ile Ser Trp
995 1000 1005
Ile Glu Gly Arg Gly Lys Ser Ile Val Ala Glu Ala Val Ile Pro
1010 1015 1020
Gly Lys Val Val Lys Ser Val Leu Lys Thr Thr Val Glu Ser Leu
1025 1030 1035
Cys Asn Val Asn Thr Lys Lys Asn Leu Ile Gly Ser Ala Met Ala
1040 1045 1050
Gly Ser Val Gly Gly Phe Asn Ala His Ala Ala Asn Ile Leu Thr
1055 1060 1065
Ala Val Phe Leu Ala Thr Gly Gln Asp Pro Ala Gln Asn Val Glu
1070 1075 1080
Ser Ser Asn Cys Met Thr Leu Met Glu Pro Thr Asn Gly Gly Glu
1085 1090 1095
Asp Leu Leu Met Thr Ile Ser Met Pro Cys Ile Glu Val Gly Thr
1100 1105 1110
Val Gly Gly Gly Thr Ile Leu Glu Pro Gln Gly Ala Val Leu Asp
1115 1120 1125
Leu Leu Gly Val Arg Gly Ala His Pro Thr Asn Pro Gly Gln Asn
1130 1135 1140
Ala Gln Gln Leu Ala Arg Ile Ile Ala Ser Ala Val Met Ala Gly
1145 1150 1155
Glu Leu Ser Leu Ile Ser Ala Leu Ala Ala Gly His Leu Val Arg
1160 1165 1170
Ala His Leu Ala His Asn Arg Ser Gln Leu Asn Thr Pro Met Pro
1175 1180 1185
Ser Arg Pro His Thr Pro Gly Pro Glu Asp Val Ser His Val Gln
1190 1195 1200
Gln Leu Pro Thr Pro Ser Ala Ser Asp Asp Lys Gly Val Thr Ala
1205 1210 1215
Gln Gly Tyr Val Val Glu Ala Lys
1220 1225
<210> 65
<211> 3681
<212> DNA
<213> Ganoderma lucidium
<400> 65
atgcgtgcgg ttctgcgcct gctgtccaca cacacagtct tctcccccat cgagaccatt 60
gtctccgtct tcgtccttgc aaccctcgca tacttccata tcctctcggg catcaagcac 120
tcctctttct ttgcctcctc acaccctcct gccatccgcc cggcgttcgc ccatctcacc 180
aacggagaat gggttgcggt ctcacagcac gattggacag aagcctggaa gcatcctggt 240
ggtagcctcg acgcgttgga gttgcagcag gtggtcttca cgcttgacga caagacgcag 300
ccgagtgccg tgcttgacgc gtctgccatc tcacaacacc tggtgtcaaa cgttcctgcg 360
ctttccggca aagcctactc atccctttgc caccatccta acgtatccgg aacgtcgtgt 420
ttcaccagtg tctctggccc cggagcatct cccatcctca ctctttcctt caagcctgga 480
actcgggacg attggcttgg ttcgctccgg aaggagaaga cgatcacgct tgatggtgtc 540
aagtacgacg ttggtgcagg gaaacgccag gagagcatcg gagacatgga gagtagcaag 600
tgggttgctt acgctctcag tgcgctcgtc ttgcgtttct gggagctcac caaggcggac 660
tcgcttgata tcctcgtcgt cctgacagga tatattctca tgcatgtgac gttcatgagg 720
ctattcctgg cttctcgggc actgggttcc aacttctggc tctccgccgg catattctcc 780
tcggcaacta tttccttcct cttcactcta cccatgtgca gatccatgga cattcccctc 840
gatcccatcg cccttacgga ggccctaccc ttcctggttt gcactgtcgg attcgacaag 900
ccgctccgtc tcgcacgtgc cgtcatggcc catcccaaca tccttaagcc acaggacgat 960
gggcggatga aggcggctgg cgacgtcatt cttgaggcgc tcgatcgcgt cggtaacatg 1020
atccttcgcg actacgcttt ggagatcgct gtgctctttg tcggtgtcaa cagccgcgtc 1080
ggtggcctca aggagttctg cgccgttgcc gctgcgctgc tcgctatgga ccgtttaatg 1140
actttcacgc tttacactgc ggttctgacg atcatggtgg aggttcgtcg tatcaagaag 1200
gtccgggaca tgacgaaggc ccgttcccgg tccagttcca tcacagcggt tacggctaat 1260
gggacggcta ttcgcggagt cttgtctcgc aagagcagca agcagagcgt gactgagccg 1320
gagacgacga agaacttgcg ccagcgggca accgactcag ctattggcgt caaaggttcg 1380
ttactgaagg acggtggcag gttgcaggaa gccgaggaga acccgatggc gaggctcaag 1440
ctgcttttga tcgcctcttt cctcacgcta cacatcctga acttctgcac gaccctcact 1500
tctgccaccg ccaacgctcg tcaccaaaga catccctttc gcacagttca ggaggttgtt 1560
cctatcccgc gtgtcgacat cactaccccg gccattgcga acatcctttc tcatctcgca 1620
gtggcacagg agcccatgtt caccgtggtg ggctcggagc ccatcgaact tttggtcaag 1680
gtcgccgcgc ccgtctacgt ccacgctctc cctcttgccc cggccctccg tgcttctaac 1740
accaacaccg gggaggccat cgagaacttc atgtcgtcct ggagctcgct cgtcggcgac 1800
cccgttgtct cgaagtggat tgtcgccctc ctcgcagtca gcgtggcact gaacggttac 1860
ctgctcaagg gtatcgctgc tggttctggt ctcgcggcca tgcgtgcggt ccgcagccaa 1920
ggcgttcgtt tccgttcgcg cgcccgctcc atcgtcaaga tctccgacga gccggaaccg 1980
gaaccggaac actcgattga tcccgctccc gtcgtgttct tcgccagtgc tgccccagct 2040
gtggaggctc ccgcacccgc ccctgctccc gaacccgagc ctcccgtgaa ccgtccccct 2100
cccttgacta tcttcagccg tccgttgaac ttggagaccg tcgacaagaa gctccaggat 2160
gcccttccca tccggtcgcc gcctcccgtg gagcctatta cccccgaatc gcgcgaagtc 2220
gagcctaccc aggttgaggt gcggtctctt gccgaatgtg tcgatgtctt cgagaacggt 2280
ccgcgccccg tatcggttgc gctcaagacc ttgaacgacg aagaggtcat cctcctatgc 2340
caaactggaa agatcgcccc gtacgccctc gtgaagatgc ttgctgactt cgaccgcgct 2400
gtgcgggtcc gtcgtgccct catttcccgt gcttcgcgaa ccaagaccct cgagaactcg 2460
ctcgtcccga tgaaggacta cgactacgcc cgtgtgatgg gcgcgtgctg cgagaacgtc 2520
attggctaca tgcctctgcc cctcggtatc gccggcccgc tcaagatcga cggcctcatg 2580
taccccatcc cgatggccac cgctgaaggc acgctcgtcg cgtcaacatc tcggggctgc 2640
aaggctctca acgccggcgg aggtgttacc acggtcctca ccgctgacgg catgacgcgc 2700
ggccccgcga tcgacttccc gtccattgtg cgcgcggcgg aggcgaaggc gttcatcgag 2760
tccgaggacg gctacgcgac gattagggag gcgttcgagt cgacatcgcg gttcgcgaag 2820
ctgcagaaga tcaagtgcgc gctcgcgggg cggacgctgt tcgtgcggtt cgccacgcgg 2880
acaggggacg cgatgggcat gaacatgatc tcgaaggcga cggagaaggc gctcgatgtg 2940
ctcagccacg agttcccgga gatggtcgtg ctcgcgctgt cgggcaacta ctgcacggac 3000
aagaagcctg ccgcgatcag ctggatcgag ggccgcggga agagtatcgt cgcggaggcg 3060
gtcatccccg ggaaggtcgt caagagtgtg ctcaagacga cagtcgagag cctgtgcaac 3120
gtgaacacga agaagaactt gatcgggagt gcgatggcgg gctcggtcgg cggattcaac 3180
gcgcatgcgg cgaacatcct caccgcggtc ttccttgcga ctggccagga tcctgcacag 3240
aacgtggaga gctcgaactg catgaccctc atggagccaa caaatggcgg tgaggaccta 3300
ctcatgacca tctccatgcc ctgcatcgag gtcggcactg tcggcggcgg caccatcctc 3360
gagccccagg gcgctgtcct cgacctgctt ggcgtccgcg gcgcgcaccc tacgaaccct 3420
ggacagaacg cgcagcagct cgcgcgcatc atcgcgtcag cggtcatggc gggcgagctc 3480
tcgctcatct ctgcactcgc cgctggccac ctcgtacgtg cgcaccttgc gcacaaccgc 3540
tcgcagctca acacgccgat gccgtcgcgg ccacatacgc caggccccga ggatgtctcg 3600
cacgtgcagc agctgccgac accaagtgcg agcgacgaca agggcgtcac cgcgcagggg 3660
tacgtcgtcg aggcgaagtg a 3681
<210> 66
<211> 888
<212> PRT
<213> Bos taurus
<400> 66
Met Leu Ser Arg Leu Phe Arg Met His Gly Leu Phe Val Ala Ser His
1 5 10 15
Pro Trp Glu Val Ile Val Gly Thr Val Thr Leu Thr Ile Cys Met Met
20 25 30
Ser Met Asn Met Phe Thr Gly Asn Asn Lys Ile Cys Gly Trp Asn Tyr
35 40 45
Glu Cys Pro Lys Leu Glu Glu Asp Val Leu Ser Ser Asp Ile Ile Ile
50 55 60
Leu Thr Ile Thr Arg Cys Ile Ala Ile Leu Tyr Ile Tyr Phe Gln Phe
65 70 75 80
Gln Asn Leu Arg Gln Leu Gly Ser Lys Tyr Ile Leu Gly Ile Ala Gly
85 90 95
Leu Phe Thr Ile Phe Ser Ser Phe Val Phe Ser Thr Val Val Ile His
100 105 110
Phe Leu Asp Lys Glu Leu Thr Gly Leu Asn Glu Ala Leu Pro Phe Phe
115 120 125
Leu Leu Leu Val Asp Leu Ser Arg Ala Ser Ala Leu Ala Lys Phe Ala
130 135 140
Leu Ser Ser Asn Ser Gln Asp Glu Val Arg Glu Asn Ile Ala Arg Gly
145 150 155 160
Met Ala Ile Leu Gly Pro Thr Phe Thr Leu Asp Ala Leu Val Glu Cys
165 170 175
Leu Val Ile Gly Val Gly Thr Met Ser Gly Val Arg Gln Leu Glu Ile
180 185 190
Met Cys Cys Phe Gly Cys Met Ser Val Leu Ala Asn Tyr Phe Val Phe
195 200 205
Met Thr Phe Phe Pro Ala Cys Val Ser Leu Val Leu Glu Leu Ser Arg
210 215 220
Glu Ser Arg Glu Gly Arg Pro Ile Trp Gln Leu Ser His Phe Ala Arg
225 230 235 240
Val Leu Glu Glu Glu Glu Asn Lys Pro Asn Pro Val Thr Gln Arg Val
245 250 255
Lys Met Ile Met Ser Leu Gly Leu Val Leu Val His Ala His Ser Arg
260 265 270
Trp Ile Ala Asp Pro Ser Pro Gln Asn Ser Thr Ala Asp Asn Ser Lys
275 280 285
Val Ser Leu Gly Leu Asp Glu Asn Val Ser Lys Arg Ile Glu Pro Ser
290 295 300
Val Ser Leu Trp Gln Phe Tyr Leu Ser Lys Met Ile Ser Met Asp Ile
305 310 315 320
Glu Gln Val Ile Thr Leu Ser Leu Ala Leu Leu Leu Ala Val Lys Tyr
325 330 335
Ile Phe Phe Glu Gln Ala Glu Thr Glu Ser Thr Leu Ser Leu Lys Asn
340 345 350
Pro Ile Thr Ser Pro Val Val Thr Gln Lys Lys Ile Thr Asp Asp Cys
355 360 365
Cys Arg Arg Asp Pro Val Leu Val Arg Asn Asp Gln Lys Phe His Ala
370 375 380
Met Glu Glu Glu Thr Arg Lys Asn Arg Glu Arg Lys Val Glu Val Ile
385 390 395 400
Lys Pro Leu Leu Ala Glu Asn Asp Thr Ser His Arg Ala Thr Phe Val
405 410 415
Val Gly Asn Ser Ser Leu Leu Gly Thr Ser Leu Glu Leu Glu Thr Gln
420 425 430
Glu Pro Glu Met Glu Leu Pro Val Glu Pro Arg Pro Asn Glu Glu Cys
435 440 445
Leu Gln Ile Leu Glu Asn Ala Glu Lys Gly Ala Lys Phe Leu Ser Asp
450 455 460
Ala Glu Ile Ile Gln Leu Val Asn Ala Lys His Ile Pro Ala Tyr Lys
465 470 475 480
Leu Glu Thr Leu Met Glu Thr His Glu Arg Gly Val Ser Ile Arg Arg
485 490 495
Gln Leu Leu Ser Lys Lys Leu Pro Glu Pro Ser Ser Leu Gln Tyr Leu
500 505 510
Pro Tyr Arg Asp Tyr Asn Tyr Ser Leu Val Met Gly Ala Cys Cys Glu
515 520 525
Asn Val Ile Gly Tyr Met Pro Ile Pro Val Gly Val Ala Gly Pro Leu
530 535 540
Cys Leu Asp Gly Lys Glu Phe Gln Val Pro Met Ala Thr Thr Glu Gly
545 550 555 560
Cys Leu Val Ala Ser Thr Asn Arg Gly Cys Arg Ala Ile Gly Leu Gly
565 570 575
Gly Gly Ala Ser Ser Arg Val Leu Ala Asp Gly Met Thr Arg Gly Pro
580 585 590
Val Val Arg Phe Pro Arg Ala Cys Asp Ser Ala Glu Val Lys Ala Trp
595 600 605
Leu Glu Thr Pro Glu Gly Phe Thr Val Ile Lys Glu Ala Phe Asp Ser
610 615 620
Thr Ser Arg Val Ala Arg Leu Gln Lys Leu His Met Ser Val Ala Gly
625 630 635 640
Arg Asn Leu Tyr Ile Arg Phe Gln Ser Arg Ser Gly Asp Ala Met Gly
645 650 655
Met Asn Met Ile Ser Lys Gly Thr Glu Lys Ala Leu Ser Lys Leu Gln
660 665 670
Glu Tyr Phe Pro Glu Met Gln Ile Leu Ala Val Ser Gly Asn Tyr Cys
675 680 685
Thr Asp Lys Lys Pro Ala Ala Ile Asn Trp Ile Glu Gly Arg Gly Lys
690 695 700
Ser Val Val Cys Glu Ala Val Ile Pro Ala Lys Val Val Arg Glu Val
705 710 715 720
Leu Lys Thr Thr Thr Glu Ala Met Ile Glu Val Asn Ile Asn Lys Asn
725 730 735
Leu Val Gly Ser Ala Met Ala Gly Ser Ile Gly Gly Tyr Asn Ala His
740 745 750
Ala Ala Asn Ile Val Thr Ala Ile Tyr Ile Ala Cys Gly Gln Asp Ala
755 760 765
Ala Gln Asn Val Gly Ser Ser Asn Cys Ile Thr Leu Met Glu Ala Ser
770 775 780
Gly Pro Thr Asn Glu Asp Leu Tyr Ile Ser Cys Thr Met Pro Ser Ile
785 790 795 800
Glu Ile Gly Thr Val Gly Gly Gly Thr Asn Leu Leu Pro Gln Gln Ala
805 810 815
Cys Leu Gln Met Leu Gly Val Gln Gly Ala Cys Arg Asp Asn Pro Gly
820 825 830
Glu Asn Ala Arg Gln Leu Ala Arg Ile Val Cys Gly Thr Val Met Ala
835 840 845
Gly Glu Leu Ser Leu Met Ala Ala Leu Ala Ala Gly His Leu Val Arg
850 855 860
Ser His Met Ile His Asn Arg Ser Lys Ile Asn Leu Gln Asp Leu Gln
865 870 875 880
Gly Thr Cys Thr Lys Lys Ala Ala
885
<210> 67
<211> 4618
<212> DNA
<213> Bos taurus
<400> 67
ccgcgtctcc gttgactgga gacgggtgga gcgccggctc ccgggaactg tggcctctag 60
tgagatccgg aggatccgag gactctgcag ctgcaatgct gtcaagactt ttccgaatgc 120
atggcctctt cgtggcctcc catccctggg aagtcatagt ggggacagtg acgctgacca 180
tctgcatgat gtccatgaac atgtttactg gcaacaataa gatctgcggt tggaattatg 240
aatgtccgaa gttggaagag gatgttttga gcagcgacat cataattctg acaataacac 300
gatgcatagc aatattgtat atttacttcc agttccagaa tttacgccaa cttggatcaa 360
aatatatttt gggtattgct ggactcttca caattttctc cagtttcgta ttcagtacag 420
ttgtcattca tttcttagat aaagaattga caggtttgaa tgaagctttg ccctttttcc 480
tgctgctggt cgacctttct agagcaagtg cgctagccaa gttcgccctc agttctaact 540
cacaggatga agtgagggag aacattgctc gtgggatggc gattttaggt cccaccttca 600
ccctggatgc tcttgtagaa tgtcttgtga ttggagttgg taccatgtca ggggtgcgtc 660
agctcgaaat catgtgctgc tttggctgca tgtcggttct cgccaactac tttgtgttca 720
tgactttctt cccagcttgt gtgtccttgg ttctggagct ttctcgggaa agccgcgagg 780
gccgtccaat ctggcagctc agccattttg cccgagtctt agaagaagaa gaaaataagc 840
caaatcctgt tactcagagg gttaagatga ttatgtctct aggcttggtt cttgttcacg 900
ctcacagtcg ctggatagct gatccttctc ctcaaaacag cacagcagac aattctaagg 960
tctctttagg actggatgaa aatgtgtcca agagaattga accgagtgtt tccctctggc 1020
aattttatct ctctaaaatg atcagcatgg atattgaaca agttattacc ctaagtttag 1080
ctctccttct ggctgtcaag tacatcttct ttgaacaagc agagacagaa tctacactct 1140
cgttaaaaaa tcctatcaca tctcctgtag tgacccaaaa gaaaatcaca gacgattgtt 1200
gtagacgtga ccctgtactg gtcagaaatg accagaaatt ccatgcaatg gaggaggaga 1260
ccaggaaaaa cagagaaaga aaagttgagg ttataaaacc cttactggca gaaaatgaca 1320
cctcacacag agccacattc gtggtgggga actcctcctt actcggtact tcgctggaac 1380
tagagacaca ggagcctgaa atggaactcc ctgtggagcc tcggcctaat gaagagtgtc 1440
tgcagattct tgagaatgca gagaaaggtg caaaattcct tagtgatgct gagatcatcc 1500
agttggtcaa tgcaaagcat atcccagctt acaaattgga aactctgatg gaaacccatg 1560
agcgaggtgt atctattcgc cgacagctac tttccaaaaa acttccagag ccttcttctc 1620
tccagtatct accttacagg gactataatt actccttggt gatgggagct tgctgtgaga 1680
acgttattgg atatatgccc atccctgttg gagtggcagg acctctgtgc ttggatggaa 1740
aagaatttca ggttccaatg gcaacaacag aaggctgtct tgtggccagc actaatagag 1800
gctgcagagc aataggcctt ggtggaggtg ccagcagccg agtccttgca gacgggatga 1860
ctcgtggccc agtggtgcgt tttccccgtg cttgtgactc tgcagaagtg aaggcctggc 1920
ttgagacgcc tgaagggttc acagtgataa aggaagcctt cgacagcacc agcagggttg 1980
cacgtctaca gaaactgcat atgagtgtgg ccggacgcaa cctttacatc cgttttcagt 2040
ccaggtcagg tgatgccatg gggatgaaca tgatttcaaa gggtacagag aaagcactgt 2100
ccaaacttca ggagtatttc cccgaaatgc agattttggc cgtcagtggg aactattgta 2160
cagacaagaa acctgcggcc atcaactgga tagagggacg aggaaagtct gtggtctgtg 2220
aagctgtcat tccagccaag gttgtcagag aagtattaaa gactacaaca gaggctatga 2280
ttgaggtcaa cattaataaa aacctggtgg gctctgccat ggctgggagc atcggcggct 2340
acaacgccca cgcagcgaac attgtaactg ccatctacat tgcctgtgga caggatgcag 2400
cacagaatgt tggtagttcg aactgtatta ctttaatgga agcaagcggt cccacgaacg 2460
aagacctgta catcagctgc accatgccat ctatagaaat aggaaccgtg ggcgggggca 2520
ccaacttgct gcctcagcag gcctgcctgc agatgctagg cgtccaagga gcatgcagag 2580
acaaccccgg ggaaaatgcg cggcagctgg cccgaatcgt gtgcggcacg gtgatggctg 2640
gggagctgtc tctgatggca gcactggcag caggccatct ggtcagaagt cacatgattc 2700
acaacaggtc aaagataaat ttgcaagacc tccaaggaac ttgcactaag aaggcagctt 2760
gaacagcctg accattcaga actaaaaaat gggcattggg ttctaaagga ctaacgtaaa 2820
atctgtgaat taaaaaactc aatgcaatgt cgtgttgaga atgagtagac atgatcagtg 2880
agacgactgc ttggtttctg gctctttcag aatgattgag gttcttcttt ccatgcagag 2940
ttctcagatc tgaaaacagt ttacatgctt tacatgctgt gtcctctgca agatctcgac 3000
atggatatta tgcctttata gcatcacaga tggtaatcta cagcacactt ctgaaggaga 3060
atacagctgg aaaaaaaact gttttctttt catggaactc atggagatca gtgtgagatt 3120
gaaccctcct cctgtccaca cccacccggc cccaaccctg ggttgaaaat ggatttttaa 3180
attatattgt agctgacaaa actcctgatt tcatagttaa tttattaagt ctgggttgta 3240
gacctttaag aaataggagc taagtttatt ttttgtaaac taatacttca tttggtgctg 3300
gtctattttg atttcgggga atagccaaca taattcttca gaaagggacc tgctttctta 3360
aaaggaagaa ttactcttat tcccagatta cagaattatg tgctaagcag tgctaaacag 3420
ttttctttca agaaaacaaa tcactgcatt tatttttgca ggctatttgt tcagagacga 3480
cttgtctaaa tataaatgtt tgtctagatt gattataacg gatctttcag tatataaggc 3540
tttaagaagc agagttttgt gctctttatt aaagatacaa gagctcttaa tattgcttag 3600
acaaaggtga ctatttatca atgaaataca agtctgtgac ctctctcaga actcagaggg 3660
tggaaaagga caggtttggg agaaatttac catttcttga agccaactta aatttcttaa 3720
gagacaaatt tatttagctg aaaaatctag gtagtttttg taaagaactg taccagatct 3780
gtatatgttg taataaagtt tcttgtgcta ggagtttatt gaaagtgttc aagaaataaa 3840
taaaatcaac tgatattctg gtaaaatact ctcagcttgg gccagagcag acagtattct 3900
ttaatgttgt ccaggaaacc ctggcttgct tgttgagcct aatgaagggg agagtcctct 3960
ttcagagcca gtgaaggcac cgcatgaatg gccttggagg gagtgtccct tgtcctgtgg 4020
ccaggaggtt ggtggctgaa aggttcacac agggctattt gatggaccca aaaaagcttc 4080
ctcagggggt cagcagagtt gttgaatctt aatttttttt aatgtaactt ttgtataaat 4140
aataaagaac tccttatttt gtattacatc aaatgcttca agtgttggtc ctggaaggct 4200
ggaggctcat gcagaagatg gactttgaga accattccag tcatgccatg gcagcatgga 4260
gagcctgaat ggtggtgtct gctttattgc tggggaagac tgacattttc tgttgttata 4320
taaaagttta aattgtttct gttgtgactt ttcatccagt gacttcttat ttatctgaat 4380
tttttatgga agtggcagtg aaaaatattt tgggtcctca ttttggtgac tgtaacacat 4440
atcatcttgc taaactgatg ttttgtacaa ttactaaact gtatacattt tgttatactt 4500
ttttcccccc agttccagta aattatgaaa aggaagttaa tactaaaaaa aaaaaaaaaa 4560
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 4618
<210> 68
<211> 567
<212> PRT
<213> Artemisia annua
<400> 68
Met Asp Leu Arg Arg Lys Leu Pro Pro Lys Pro Pro Ser Ser Thr Thr
1 5 10 15
Thr Lys Gln Pro Ser His Arg Ser His Ser Pro Thr Pro Ile Pro Lys
20 25 30
Ala Ser Asp Ala Leu Pro Leu Pro Leu Tyr Leu Thr Asn Thr Phe Phe
35 40 45
Phe Thr Leu Phe Phe Ser Val Ala Tyr Tyr Leu Leu His Arg Trp Arg
50 55 60
Asp Lys Ile Arg Ser Gly Thr Pro Leu His Val Val Thr Leu Thr Glu
65 70 75 80
Leu Ser Ala Ile Val Leu Leu Ile Ala Ser Phe Ile Tyr Leu Leu Gly
85 90 95
Phe Phe Gly Ile Asp Phe Val Gln Ser Phe Thr Ser Arg Glu Asn Glu
100 105 110
Gln Leu Asn Asn Asp Asp His Asn Val Val Ser Thr Asn Asn Val Leu
115 120 125
Ser Asp Arg Arg Leu Val Tyr Asp Tyr Gly Phe Asp Val Thr Gly Asp
130 135 140
Asn Asp Asn Asp Asn Asp Asp Asp Val Ile Val Lys Ser Val Val Ser
145 150 155 160
Gly Glu Val Asn Ser Tyr Ser Leu Glu Ala Ser Leu Gly Asp Cys Tyr
165 170 175
Arg Ala Ala Lys Ile Arg Lys Arg Ala Val Glu Arg Ile Val Gly Arg
180 185 190
Glu Val Leu Gly Leu Gly Phe Glu Gly Phe Asp Tyr Glu Ser Ile Leu
195 200 205
Gly Gln Cys Cys Glu Met Pro Ile Gly Tyr Val Gln Val Pro Val Gly
210 215 220
Val Ala Gly Pro Leu Leu Leu Asn Gly Gly Glu Phe Met Val Pro Met
225 230 235 240
Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Thr Asn Arg Gly Cys Lys
245 250 255
Ala Ile Cys Leu Ser Gly Gly Ala Thr Ala Ile Leu Leu Lys Asp Gly
260 265 270
Met Thr Arg Ala Pro Val Val Arg Phe Ala Thr Ala Glu Arg Ala Ser
275 280 285
Gln Leu Lys Phe Tyr Leu Glu Asp Gly Val Asn Phe Asp Thr Leu Ser
290 295 300
Val Val Phe Asn Lys Ser Ser Arg Phe Ala Arg Leu Gln Asn Ile Gln
305 310 315 320
Cys Ser Ile Ala Gly Lys Asn Leu Tyr Ile Arg Phe Thr Cys Ser Thr
325 330 335
Gly Asp Ala Met Gly Met Asn Met Val Ser Lys Gly Val Gln Asn Val
340 345 350
Leu Asp Phe Leu Gln Asn Asp Phe Pro Asp Met Asp Val Ile Gly Ile
355 360 365
Ser Trp Lys Phe Cys Ser Asp Lys Lys Pro Thr Ala Val Asn Trp Ile
370 375 380
Glu Gly Arg Gly Lys Ser Val Val Phe Gln Ala Val Ile Thr Lys Lys
385 390 395 400
Val Val Arg Lys Ser Ala Leu Asn Pro Gln Thr Cys Thr Cys Arg Thr
405 410 415
Leu Thr Cys Leu Arg Pro Leu Leu Val Leu Leu Leu Leu Val Leu Leu
420 425 430
Val Asp Leu Met His Met Leu His Ile Val Ser Ala Val Phe Ile Ala
435 440 445
Thr Gly Gln Asp Pro Ala Gln Asn Ile Glu Ser Ser His Cys Ile Thr
450 455 460
Met Met Glu Ala Val Asn Asn Gly Lys Asp Leu His Val Asn Val Thr
465 470 475 480
Met Pro Ser Ile Glu Val Gly Thr Val Gly Gly Gly Thr Gln Leu Ala
485 490 495
Ser Gln Ser Ala Cys Leu Asn Leu Leu Gly Val Lys Gly Ala Cys Ile
500 505 510
Glu Ser Pro Gly Ser Asn Ala Gln Leu Leu Ala Arg Ile Val Ala Gly
515 520 525
Ser Val Leu Ala Gly Glu Leu Ser Leu Met Ser Ala Ile Ser Ala Gly
530 535 540
Gln Leu Val Lys Ser His Met Lys Tyr Asn Arg Ser Ser Arg Asp Met
545 550 555 560
Ser Ala Ile Ala Ser Lys Val
565
<210> 69
<211> 1704
<212> DNA
<213> Artemisia annua
<400> 69
atggatttga gaaggaaatt accacctaag cctccatctt caacaacaac aaaacagcca 60
agtcataggt cccattctcc tacgccaatt ccaaaggctt cagatgcatt gcctcttcca 120
ttgtacctga ccaatacgtt tttcttcact cttttctttt ccgtagcata ttacctgttg 180
cataggtgga gagacaagat tagatccgga acacctttac acgttgtgac actgactgaa 240
ctatccgcaa ttgtactgct gattgcttcc ttcatctatc ttttaggctt tttcggtatt 300
gattttgtgc aatctttcac atcaagagaa aatgagcaac taaacaacga tgatcacaac 360
gtcgtgtcaa caaacaatgt tttatctgat agaaggttag tttacgacta tggattcgat 420
gtgacaggag acaacgataa cgataatgat gacgatgtta ttgtgaaaag tgtcgtttct 480
ggggaagtta attcttatag tttggaggct tccctaggag attgttacag agccgcaaag 540
attagaaaga gagccgtcga gagaattgtc gggagagaag tattaggctt gggtttcgag 600
ggatttgatt atgaatctat cctggggcaa tgttgtgaaa tgcctatcgg gtacgtccaa 660
gtgccagtag gtgtcgctgg acctttattg ttaaatggtg gggaattcat ggttccaatg 720
gctacaactg aaggctgtct tgtagcttcc actaatagag gttgtaaagc catatgctta 780
tcaggtggtg ccactgccat attgctaaaa gatggtatga caagagcccc agtagtgaga 840
ttcgccacag ctgagagagc ttcacaacta aagttttact tggaagatgg tgtcaatttc 900
gatacattgt ctgttgtctt taacaaaagt tcaagatttg ccagattgca aaacatccaa 960
tgctcaattg ccggtaaaaa cttgtacatt aggtttactt gctccacagg cgacgccatg 1020
ggtatgaaca tggtttcaaa aggagtacaa aatgtattag actttttaca aaatgatttt 1080
cctgatatgg acgtaattgg gatctcttgg aagttctgct ctgacaaaaa gccaacagct 1140
gtcaactgga ttgagggcag aggaaagtct gtcgttttcc aggccgtaat taccaaaaag 1200
gtggttagaa agtctgcact gaaccctcaa acttgcacat gtagaacttt gacctgttta 1260
agaccattat tggttctgct acttctggtt ttgctagtgg acttaatgca tatgcttcat 1320
atcgtgtctg ccgtgttcat cgctaccggt caagatccag ctcagaatat cgaatctagt 1380
cactgtatca ctatgatgga ggctgtcaac aatggtaagg atttgcacgt taatgttacg 1440
atgccatcta tagaagttgg cacggtggga ggtggcactc agctagcctc tcaatcagcc 1500
tgtttgaact tgcttggtgt aaagggtgcc tgtatagaat ccccaggatc aaacgcccag 1560
ttgttagcta gaatcgttgc tggttctgtt ctggcaggcg aattaagttt gatgtcagct 1620
ataagtgctg ggcaactagt taaatctcat atgaaataca ataggtctag tagagatatg 1680
tcagcaatag cttctaaggt ctaa 1704
<210> 70
<211> 435
<212> PRT
<213> Trypanosoma cruzi
<400> 70
Met Phe Arg Arg Ala Ile Leu Leu Gly Cys Ser Ala Ala Lys Thr Pro
1 5 10 15
Trp Ser Glu Cys Ser Asn Ala Gln Leu Val Asp Ala Val Lys Ser Arg
20 25 30
Lys Ile Ser Phe Tyr Gly Leu Glu Gln Ala Leu Glu Pro Asp Tyr Arg
35 40 45
Arg Ala Ile Glu Val Arg Arg Glu Val Val Ser Glu Ile Ala Ser Gln
50 55 60
Gln Pro Glu Ala Lys Lys Lys Gln Ser Ala Leu His Thr Ile Pro Phe
65 70 75 80
Glu Asn Tyr Asp Trp Asn Lys Val Val Gly Gln Asn Cys Glu Asn Ile
85 90 95
Ile Gly Tyr Val Pro Ile Pro Leu Gly Val Ala Gly Pro Ile Leu Ile
100 105 110
Asp Gly Lys Glu Tyr Pro Ile Pro Met Ala Thr Thr Glu Gly Ala Leu
115 120 125
Val Ala Ser Thr His Arg Gly Ala Arg Ala Ile Thr Arg Ser Gly Gly
130 135 140
Cys Lys Thr Leu Leu Leu Gly Glu Gly Met Thr Arg Ala Pro Val Val
145 150 155 160
Glu Leu Pro Ser Leu Glu Glu Ala Gly Arg Leu His Lys Tyr Cys Asn
165 170 175
Glu Asn Phe Leu Ser Leu Lys Glu Ala Phe Glu Ser Thr Thr Gln Tyr
180 185 190
Gly Lys Leu Asn Ser Leu Lys Cys Val Leu Ala Gly Arg Lys Ala Tyr
195 200 205
Leu Arg Phe Arg Ala Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile
210 215 220
Thr Lys Gly Val Asp Lys Ala Leu Ser Val Leu Gln Gln His Phe Pro
225 230 235 240
Ser Met Glu Ile Leu Ala Leu Ser Gly Asn Tyr Cys Thr Asp Lys Lys
245 250 255
Pro Ser Ala Val Asn Trp Ile Asp Gly Arg Gly Lys Ser Val Val Ala
260 265 270
Glu Ala Thr Leu Leu Ala Asp Val Val Glu Asp Thr Leu Lys Cys Thr
275 280 285
Val Asp Ser Leu Val Ser Leu Asn Ile Asp Lys Asn Leu Val Gly Ser
290 295 300
Ala Met Ala Gly Ser Val Gly Gly Phe Asn Ala Gln Ala Ala Asn Ala
305 310 315 320
Val Ala Ala Ile Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Val Val
325 330 335
Glu Ser Ser Met Cys Ile Thr Thr Met Ser Lys Val Gly Asn Asp Leu
340 345 350
Leu Ile Ser Val Thr Met Pro Ser Ile Glu Val Gly Val Val Gly Gly
355 360 365
Gly Thr Gly Leu Ala Ala Gln Arg Gly Cys Leu Glu Leu Ile Gly Cys
370 375 380
Gly Gly Pro Ser Lys Glu Ser Pro Gly Thr Asn Ala Gln Leu Leu Ser
385 390 395 400
Arg Val Val Ala Ala Gly Val Leu Ser Ala Glu Leu Ser Leu Met Ser
405 410 415
Gly Leu Ala Ala Gly His Leu Leu Ser Ala His Met Arg Leu Asn Arg
420 425 430
Lys Lys Lys
435
<210> 71
<211> 1308
<212> DNA
<213> Trypanosoma cruzi
<400> 71
atgtttagaa gagctatact gttaggatgc tctgctgcca agacaccatg gtctgagtgt 60
tctaacgctc aattagttga tgcagttaag tctagaaaga tctcattcta cggtcttgaa 120
caagccttgg aaccagatta tagaagggct atcgaagtaa ggagagaggt tgtctctgaa 180
atcgcctcac aacagccaga agcaaaaaag aagcaatccg cattgcacac aataccattt 240
gagaattatg attggaataa ggtcgttggc caaaactgtg aaaacattat tggatacgtc 300
ccaataccac tgggcgttgc tggccctatt ttgattgatg gtaaagagta cccaatacca 360
atggctacaa cagaaggcgc tttggtcgct agtactcata gaggtgctag agctattaca 420
agatccggag gttgtaagac attgttatta ggtgaaggta tgacaagagc accagtggtt 480
gaattgcctt cattagagga agctgggcgt ttgcacaagt actgtaatga gaacttctta 540
tctttaaagg aagcatttga atcaactacc caatatggaa aacttaattc tttaaagtgc 600
gtactagctg gtagaaaagc ataccttaga ttcagagcca ctacaggcga tgctatgggc 660
atgaacatga taacaaaggg tgtagacaaa gcactgtctg ttctacagca acatttccct 720
tcaatggaaa tcctagccct aagtggtaat tactgtaccg acaaaaagcc atctgctgta 780
aattggattg atggcagagg taaatcagtg gttgcagaag ccactttatt ggctgatgtt 840
gtcgaagata ctctgaaatg tacagtcgat tctttggtat ccttgaatat cgacaaaaac 900
cttgttgggt cagctatggc tggttctgtt ggaggtttta acgcccaggc tgcaaacgct 960
gtggcagcca ttttcattgc aaccggtcaa gatcctgctc aagtggtaga aagttcaatg 1020
tgtatcacta caatgtccaa ggtaggtaac gatctattga tctctgtgac catgccttct 1080
atcgaggtcg gggtcgtggg aggagggact ggtcttgctg cccaaagagg atgcttagag 1140
ttaatagggt gcggaggccc atctaaggag tctcctggta ctaatgccca acttctaagt 1200
agagttgttg cagctggcgt tttatcagcc gaactttcct tgatgtccgg actggcagca 1260
ggtcatctat tgtcagcaca tatgagattg aacagaaaga agaaataa 1308
<210> 72
<211> 426
<212> PRT
<213> Staphylococcus aureus
<400> 72
Met Gln Ser Leu Asp Lys Asn Phe Arg His Leu Ser Arg Gln Gln Lys
1 5 10 15
Leu Gln Gln Leu Val Asp Lys Gln Trp Leu Ser Glu Glu Gln Phe Asn
20 25 30
Ile Leu Leu Asn His Pro Leu Ile Asp Glu Glu Val Ala Asn Ser Leu
35 40 45
Ile Glu Asn Val Ile Ala Gln Gly Ala Leu Pro Val Gly Leu Leu Pro
50 55 60
Asn Ile Ile Val Asp Asp Lys Ala Tyr Val Val Pro Met Met Val Glu
65 70 75 80
Glu Pro Ser Val Val Ala Ala Ala Ser Tyr Gly Ala Lys Leu Val Asn
85 90 95
Gln Thr Gly Gly Phe Lys Thr Val Ser Ser Glu Arg Ile Met Ile Gly
100 105 110
Gln Ile Val Phe Asp Gly Val Asp Asp Thr Glu Lys Leu Ser Ala Asp
115 120 125
Ile Lys Ala Leu Glu Lys Gln Ile His Gln Ile Ala Asp Glu Ala Tyr
130 135 140
Pro Ser Ile Lys Ala Arg Gly Gly Gly Tyr Gln Arg Ile Ala Ile Asp
145 150 155 160
Thr Phe Pro Glu Gln Gln Leu Leu Ser Leu Lys Val Phe Val Asp Thr
165 170 175
Lys Asp Ala Met Gly Ala Asn Met Leu Asn Thr Ile Leu Glu Ala Ile
180 185 190
Thr Ala Phe Leu Lys Asn Glu Phe Pro Gln Ser Asp Ile Leu Met Ser
195 200 205
Ile Leu Ser Asn His Ala Thr Ala Ser Val Val Lys Val Gln Gly Glu
210 215 220
Ile Asp Val Lys Asp Leu Ala Arg Gly Glu Arg Thr Gly Glu Glu Val
225 230 235 240
Ala Lys Arg Met Glu Arg Ala Ser Val Leu Ala Gln Val Asp Ile His
245 250 255
Arg Ala Ala Thr His Asn Lys Gly Val Met Asn Gly Ile His Ala Val
260 265 270
Val Leu Ala Thr Gly Asn Asp Thr Arg Gly Ala Glu Ala Ser Ala His
275 280 285
Ala Tyr Ala Ser Lys Asp Gly Gln Tyr Arg Gly Ile Ala Thr Trp Arg
290 295 300
Tyr Asp Gln Glu Arg Gln Arg Leu Ile Gly Thr Ile Glu Val Pro Met
305 310 315 320
Thr Leu Ala Ile Val Gly Gly Gly Thr Lys Val Leu Pro Ile Ala Lys
325 330 335
Ala Ser Leu Glu Leu Leu Asn Val Glu Ser Ala Gln Glu Leu Gly His
340 345 350
Val Val Ala Ala Val Gly Leu Ala Gln Asn Phe Ala Ala Cys Arg Ala
355 360 365
Leu Val Ser Glu Gly Ile Gln Gln Gly His Met Ser Leu Gln Tyr Lys
370 375 380
Ser Leu Ala Ile Val Val Gly Ala Lys Gly Asp Glu Ile Ala Gln Val
385 390 395 400
Ala Glu Ala Leu Lys Gln Glu Pro Arg Ala Asn Thr Gln Val Ala Glu
405 410 415
Arg Ile Leu Gln Asp Leu Arg Ser Gln Gln
420 425
<210> 73
<211> 1281
<212> DNA
<213> Staphylococcus aureus
<400> 73
atgcaatccc tggacaaaaa ctttagacac ttatcaagac aacagaagtt acaacagcta 60
gttgataaac aatggctatc agaggaacaa ttcaatattc tacttaacca cccacttatt 120
gatgaagagg tagcaaactc attgatagaa aatgtcatcg cacagggcgc actgcctgtt 180
ggtttactac caaatatcat cgttgatgac aaagcatacg tcgtgcctat gatggtggaa 240
gagccatctg ttgttgccgc tgcttcatac ggcgctaaat tggtgaacca aacaggtggt 300
ttcaaaaccg tgtcctcaga acgtatcatg ataggtcaaa tagtatttga tggagtcgat 360
gataccgaga aactgtctgc agatatcaag gctcttgaaa aacaaatcca tcagattgca 420
gatgaggctt acccttctat taaggccaga ggtggaggct atcaaaggat cgccatcgat 480
acattcccag aacaacagtt gctttcattg aaggttttcg ttgatactaa ggatgctatg 540
ggcgctaata tgttaaacac aatcctagaa gcaatcacag cctttttgaa aaacgaattc 600
ccacaatctg atatcttgat gtctatcctt tccaaccacg caacagccag tgttgtcaag 660
gtccagggtg aaatagacgt taaggatttg gcaagaggag aacgtactgg agaagaggtc 720
gctaagagaa tggaaagagc atctgtgtta gctcaagtgg acattcatag agcagcaaca 780
cacaataagg gtgttatgaa tggcattcat gctgtagtct tggctacagg taatgatact 840
agaggtgcag aagcctctgc tcacgcttac gcttccaaag acggtcaata tagagggata 900
gctacatgga gatacgatca agagagacaa aggttaatag gaactataga agttccaatg 960
actctggcca ttgttggtgg cggtaccaag gtactgccta ttgctaaggc ctctttagaa 1020
ctgttaaacg tagaaagtgc ccaagagttg ggacatgttg tcgctgccgt tggactagct 1080
caaaacttcg ctgcatgtag agctttggtt tccgaaggta ttcaacaagg gcatatgtct 1140
ttgcaataca agtctttagc catcgtagtc ggggctaagg gcgatgaaat tgctcaggta 1200
gccgaagcac taaagcaaga gccaagagca aacactcaag ttgcagagag aattttgcaa 1260
gatttgagaa gtcaacaata a 1281
<210> 74
<211> 436
<212> PRT
<213> Artificial Sequence
<220>
<223> Codon optimized Archaeoglobus fulgidus polypeptide
<400> 74
Met Gln Val Leu Arg Leu Asp Arg Arg His Tyr Lys Ser Gly Lys Ile
1 5 10 15
Arg Arg Ala Met Ser Ser Arg Ile Pro Gly Phe Tyr Lys Leu Ser Val
20 25 30
Glu Glu Arg Leu Lys Lys Val Ala Glu Phe Ala Gly Leu Ser Asp Glu
35 40 45
Glu Val Lys Ala Val Leu Ser Gln Gly Leu Pro Leu Asp Val Ala Asp
50 55 60
Arg Met Ile Glu Asn Val Ile Gly Thr Phe Glu Leu Pro Leu Gly Ile
65 70 75 80
Ala Thr Asn Phe Leu Ile Asp Gly Lys Asp Tyr Leu Ile Pro Met Ala
85 90 95
Ile Glu Glu Pro Ser Val Val Ala Ala Ala Ser Asn Ala Ala Arg Met
100 105 110
Ala Arg Glu Ser Gly Gly Phe Thr Thr Asp Tyr Thr Gly Ser Leu Met
115 120 125
Ile Gly Gln Ile Gln Val Thr Lys Leu Leu Asn Pro Asn Ala Ala Lys
130 135 140
Phe Glu Val Leu Arg Gln Lys Asp Glu Ile Ile Glu Arg Ala Asn Glu
145 150 155 160
Cys Asp Pro Met Leu Val Asn Leu Gly Gly Gly Cys Lys Asp Ile Glu
165 170 175
Ala Arg Val Ile Asp Thr Ile Met Gly Lys Met Leu Ile Val His Leu
180 185 190
Ile Val Asp Val Lys Asp Ala Met Gly Ala Asn Ala Val Asn Thr Met
195 200 205
Cys Glu Lys Val Ala Pro Phe Ile Glu Arg Ile Thr Gly Gly Lys Val
210 215 220
Tyr Leu Arg Ile Ile Ser Asn Leu Ala Ala Tyr Arg Leu Ala Arg Ala
225 230 235 240
Lys Ala Val Phe Asp Lys Asp Val Ile Gly Gly Glu Glu Val Val Glu
245 250 255
Gly Ile Met Leu Ala Tyr Ala Phe Ala Ala Ala Asp Pro Phe Arg Cys
260 265 270
Ala Thr His Asn Lys Gly Ile Met Asn Gly Ile Ser Ala Leu Met Ile
275 280 285
Ala Thr Gly Asn Asp Phe Arg Ala Ile Glu Ala Gly Ala His Ser Tyr
290 295 300
Ala Ala Ile Gly Gly Tyr Lys Pro Leu Thr Thr Tyr Glu Val Asp Arg
305 310 315 320
Lys Gly Asn Leu Val Gly Thr Ile Glu Ile Pro Met Ala Val Gly Val
325 330 335
Ile Gly Gly Ala Thr Lys Val Asn Pro Leu Ala Lys Ile Ser Leu Lys
340 345 350
Ile Leu Gly Val Asn Thr Ala Glu Glu Leu Ala Arg Val Ala Ala Ala
355 360 365
Leu Gly Leu Ala Gln Asn Phe Ala Ala Leu Arg Ala Leu Ala Thr Glu
370 375 380
Gly Ile Gln Arg Gly His Met Glu Leu His Ala Arg Asn Leu Ala Ile
385 390 395 400
Met Ala Gly Ala Thr Gly Asp Glu Val Asp Arg Val Val Glu Ile Met
405 410 415
Val Arg Asp Gly Lys Ile Arg Leu Asp Tyr Ala Lys Glu Val Leu Glu
420 425 430
Arg Leu Arg Ser
435
<210> 75
<211> 1311
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized Archaeoglobus fulgidus nucleotide sequence
<400> 75
atgcaggtct taagattgga taggagacat tacaaaagtg gcaagattag aagagcaatg 60
agttctagaa ttcctggttt ctacaaattg tcagtcgagg aaagactgaa aaaggttgct 120
gaatttgcag ggttatctga tgaggaagtg aaagctgttt tgtcacaagg tttacctttg 180
gacgtagctg atagaatgat cgaaaatgtg atcggtacat ttgaattacc acttggtata 240
gcaaccaatt tccttattga tggcaaggat tatctaatcc ctatggctat agaggaacca 300
tcagtagttg cagctgcttc taacgcagct agaatggcca gagagtctgg cgggtttaca 360
actgattaca cagggtccct gatgattggt caaattcaag tcacaaaact gttgaatcca 420
aatgcagcta agttcgaagt tctacgtcaa aaagacgaaa tcatagaaag agcaaatgag 480
tgtgatccaa tgttggtgaa tttgggcggt ggatgtaaag atatagaagc aagggtgatc 540
gatacaatca tgggtaagat gctaattgtt catctgatcg ttgatgttaa agacgctatg 600
ggtgcaaatg ctgtcaacac tatgtgtgaa aaagttgctc ctttcatcga acgtattact 660
gggggaaagg tctatcttag aatcatttcc aacttggctg catatagact tgctagagca 720
aaggccgttt ttgacaaaga cgttattggc ggagaggagg ttgtagaagg gatcatgctt 780
gcatacgcct tcgctgccgc tgacccattt cgttgcgcca cccacaataa gggtatcatg 840
aatggcatat cagccttaat gatcgctaca ggaaacgact ttagagccat tgaagcagga 900
gctcattcct atgctgcaat aggtggatac aaaccactaa ctacctacga agttgataga 960
aaaggtaatc tagtaggcac aattgaaata cctatggcag taggcgtgat tggtggtgca 1020
accaaagtca acccactagc caagatctct cttaagatac taggagtgaa cactgctgaa 1080
gagttagcca gagtcgcagc cgctctaggt ttggctcaaa actttgctgc cttaagagcc 1140
ttggccacag aaggtatcca aagaggtcac atggaattac atgccaggaa cttagcaatc 1200
atggctggag ctactggaga tgaggttgac agagttgtag agattatggt gagagatggc 1260
aaaatcagat tggactacgc taaggaagta ttggagagac tgcgttccta a 1311
<210> 76
<211> 428
<212> PRT
<213> Artificial Sequence
<220>
<223> Codon optimized Pseudomonas mevalonii polypeptide
<400> 76
Met Ser Leu Asp Ser Arg Leu Pro Ala Phe Arg Asn Leu Ser Pro Ala
1 5 10 15
Ala Arg Leu Asp His Ile Gly Gln Leu Leu Gly Leu Ser His Asp Asp
20 25 30
Val Ser Leu Leu Ala Asn Ala Gly Ala Leu Pro Met Asp Ile Ala Asn
35 40 45
Gly Met Ile Glu Asn Val Ile Gly Thr Phe Glu Leu Pro Tyr Ala Val
50 55 60
Ala Ser Asn Phe Gln Ile Asn Gly Arg Asp Val Leu Val Pro Leu Val
65 70 75 80
Val Glu Glu Pro Ser Ile Val Ala Ala Ala Ser Tyr Met Ala Lys Leu
85 90 95
Ala Arg Ala Asn Gly Gly Phe Thr Thr Ser Ser Ser Ala Pro Leu Met
100 105 110
His Ala Gln Val Gln Ile Val Gly Ile Gln Asp Pro Leu Asn Ala Arg
115 120 125
Leu Ser Leu Leu Arg Arg Lys Asp Glu Ile Ile Glu Leu Ala Asn Arg
130 135 140
Lys Asp Gln Leu Leu Asn Ser Leu Gly Gly Gly Cys Arg Asp Ile Glu
145 150 155 160
Val His Thr Phe Ala Asp Thr Pro Arg Gly Pro Met Leu Val Ala His
165 170 175
Leu Ile Val Asp Val Arg Asp Ala Met Gly Ala Asn Thr Val Asn Thr
180 185 190
Met Ala Glu Ala Val Ala Pro Leu Met Glu Ala Ile Thr Gly Gly Gln
195 200 205
Val Arg Leu Arg Ile Leu Ser Asn Leu Ala Asp Leu Arg Leu Ala Arg
210 215 220
Ala Gln Val Arg Ile Thr Pro Gln Gln Leu Glu Thr Ala Glu Phe Ser
225 230 235 240
Gly Glu Ala Val Ile Glu Gly Ile Leu Asp Ala Tyr Ala Phe Ala Ala
245 250 255
Val Asp Pro Tyr Arg Ala Ala Thr His Asn Lys Gly Ile Met Asn Gly
260 265 270
Ile Asp Pro Leu Ile Val Ala Thr Gly Asn Asp Trp Arg Ala Val Glu
275 280 285
Ala Gly Ala His Ala Tyr Ala Cys Arg Ser Gly His Tyr Gly Ser Leu
290 295 300
Thr Thr Trp Glu Lys Asp Asn Asn Gly His Leu Val Gly Thr Leu Glu
305 310 315 320
Met Pro Met Pro Val Gly Leu Val Gly Gly Ala Thr Lys Thr His Pro
325 330 335
Leu Ala Gln Leu Ser Leu Arg Ile Leu Gly Val Lys Thr Ala Gln Ala
340 345 350
Leu Ala Glu Ile Ala Val Ala Val Gly Leu Ala Gln Asn Leu Gly Ala
355 360 365
Met Arg Ala Leu Ala Thr Glu Gly Ile Gln Arg Gly His Met Ala Leu
370 375 380
His Ala Arg Asn Ile Ala Val Val Ala Gly Ala Arg Gly Asp Glu Val
385 390 395 400
Asp Trp Val Ala Arg Gln Leu Val Glu Tyr His Asp Val Arg Ala Asp
405 410 415
Arg Ala Val Ala Leu Leu Lys Gln Lys Arg Gly Gln
420 425
<210> 77
<211> 1287
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized Pseudomonas mevalonii nucleotide sequence
<400> 77
atgtccttag attcaagact gccagctttc agaaatctgt ctccagctgc aagactagat 60
cacattggcc aacttttggg actaagtcat gacgacgttt cccttttagc aaacgccggt 120
gctttaccaa tggatatcgc taatggtatg attgaaaatg taatcgggac ctttgaactg 180
ccatatgcag tggccagtaa ctttcagatc aatggccgtg acgtcttagt accattagtt 240
gtggaggaac ctagtatcgt tgctgcagcc tcttacatgg caaagttagc tagagccaat 300
ggtgggttca ctacatcttc atctgctcca ctaatgcatg cacaagtaca aattgtcggc 360
attcaggatc cactaaacgc aagattgtct ttactgcgta gaaaggatga gatcatagaa 420
ttagccaata ggaaggacca acttctgaat tcattgggcg gtggttgcag agacatagag 480
gtgcatacat ttgccgatac tccaagagga ccaatgcttg tagcacacct tattgtcgat 540
gtgcgtgatg ccatgggagc taatactgtt aacactatgg ctgaagcagt agcacctctg 600
atggaagcca taacaggtgg ccaggtaaga ttgagaatcc tttccaattt ggctgatctt 660
agattggcca gagcccaagt gagaatcact cctcagcaat tggaaactgc cgaattctca 720
ggtgaggcag taattgaggg tatcttggac gcatatgctt ttgccgctgt ggacccttac 780
agagccgcta cccacaacaa aggcataatg aacggtatcg atcctttgat cgtcgctaca 840
ggaaatgatt ggagagctgt tgaggcagga gctcatgcat acgcttgtag atccggacat 900
tacggttcat taacaacatg ggaaaaagat aacaatggac acttggtcgg gacattggaa 960
atgcctatgc cagttggttt agttgggggt gctacaaaaa cccatcctct tgctcaattg 1020
tctttgagga tacttggtgt caaaactgct caagcactag ccgaaattgc cgttgctgtt 1080
ggtttggcac aaaacttggg tgcaatgcgt gctttagcta cagaaggcat ccaaagagga 1140
catatggctc tacacgctag aaacattgca gttgttgcag gagccagagg tgatgaggtt 1200
gattgggtgg ctagacaact tgtcgaatat catgatgtca gagcagacag ggctgtggca 1260
ttactgaaac agaagagagg tcaataa 1287
<210> 78
<211> 481
<212> PRT
<213> Arabidopsis thaliana
<400> 78
Met His Ile Thr Lys Pro His Ala Ala Met Phe Ser Ser Pro Gly Met
1 5 10 15
Gly His Val Ile Pro Val Ile Glu Leu Gly Lys Arg Leu Ser Ala Asn
20 25 30
Asn Gly Phe His Val Thr Val Phe Val Leu Glu Thr Asp Ala Ala Ser
35 40 45
Ala Gln Ser Lys Phe Leu Asn Ser Thr Gly Val Asp Ile Val Lys Leu
50 55 60
Pro Ser Pro Asp Ile Tyr Gly Leu Val Asp Pro Asp Asp His Val Val
65 70 75 80
Thr Lys Ile Gly Val Ile Met Arg Ala Ala Val Pro Ala Leu Arg Ser
85 90 95
Lys Ile Ala Ala Met His Gln Lys Pro Thr Ala Leu Ile Val Asp Leu
100 105 110
Phe Gly Thr Asp Ala Leu Cys Leu Ala Lys Glu Phe Asn Met Leu Ser
115 120 125
Tyr Val Phe Ile Pro Thr Asn Ala Arg Phe Leu Gly Val Ser Ile Tyr
130 135 140
Tyr Pro Asn Leu Asp Lys Asp Ile Lys Glu Glu His Thr Val Gln Arg
145 150 155 160
Asn Pro Leu Ala Ile Pro Gly Cys Glu Pro Val Arg Phe Glu Asp Thr
165 170 175
Leu Asp Ala Tyr Leu Val Pro Asp Glu Pro Val Tyr Arg Asp Phe Val
180 185 190
Arg His Gly Leu Ala Tyr Pro Lys Ala Asp Gly Ile Leu Val Asn Thr
195 200 205
Trp Glu Glu Met Glu Pro Lys Ser Leu Lys Ser Leu Leu Asn Pro Lys
210 215 220
Leu Leu Gly Arg Val Ala Arg Val Pro Val Tyr Pro Ile Gly Pro Leu
225 230 235 240
Cys Arg Pro Ile Gln Ser Ser Glu Thr Asp His Pro Val Leu Asp Trp
245 250 255
Leu Asn Glu Gln Pro Asn Glu Ser Val Leu Tyr Ile Ser Phe Gly Ser
260 265 270
Gly Gly Cys Leu Ser Ala Lys Gln Leu Thr Glu Leu Ala Trp Gly Leu
275 280 285
Glu Gln Ser Gln Gln Arg Phe Val Trp Val Val Arg Pro Pro Val Asp
290 295 300
Gly Ser Cys Cys Ser Glu Tyr Val Ser Ala Asn Gly Gly Gly Thr Glu
305 310 315 320
Asp Asn Thr Pro Glu Tyr Leu Pro Glu Gly Phe Val Ser Arg Thr Ser
325 330 335
Asp Arg Gly Phe Val Val Pro Ser Trp Ala Pro Gln Ala Glu Ile Leu
340 345 350
Ser His Arg Ala Val Gly Gly Phe Leu Thr His Cys Gly Trp Ser Ser
355 360 365
Thr Leu Glu Ser Val Val Gly Gly Val Pro Met Ile Ala Trp Pro Leu
370 375 380
Phe Ala Glu Gln Asn Met Asn Ala Ala Leu Leu Ser Asp Glu Leu Gly
385 390 395 400
Ile Ala Val Arg Leu Asp Asp Pro Lys Glu Asp Ile Ser Arg Trp Lys
405 410 415
Ile Glu Ala Leu Val Arg Lys Val Met Thr Glu Lys Glu Gly Glu Ala
420 425 430
Met Arg Arg Lys Val Lys Lys Leu Arg Asp Ser Ala Glu Met Ser Leu
435 440 445
Ser Ile Asp Gly Gly Gly Leu Ala His Glu Ser Leu Cys Arg Val Thr
450 455 460
Lys Glu Cys Gln Arg Phe Leu Glu Arg Val Val Asp Leu Ser Arg Gly
465 470 475 480
Ala
<210> 79
<211> 806
<212> PRT
<213> Coffea arabica
<400> 79
Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Asp Val Leu Leu Phe Met Ser
20 25 30
Arg Leu Glu Thr His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45
Ala Glu Phe Glu Glu Ile Asn Lys Asp Gly Lys Gln Lys Ile His Asp
50 55 60
His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95
Tyr Val Arg Val Asn Val His Ala Leu Val Val Glu Glu Leu Thr Val
100 105 110
Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Ser Lys Asn
115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Lys Pro Thr Leu Thr Lys Tyr Ile Gly Asp Gly Val Glu Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Ala
165 170 175
Pro Leu Leu Asp Phe Leu Arg Val His Gln Tyr Lys Gly Lys Thr Met
180 185 190
Met Leu Asn Asp Arg Ile Lys Asp Leu Asn Thr Leu Gln Ala Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Ala Asp Thr Pro Tyr
210 215 220
Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255
Leu Leu Gly Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Val Lys Pro Arg Ile Leu Ile Ile Thr
325 330 335
Arg Leu Leu Pro Asp Ala Pro Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Tyr Gly Ser Glu Tyr Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Val Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Val Thr Ala
385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Val Ile Gly Asn Tyr Ser Glu Gly
405 410 415
Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445
Tyr Leu Ser Lys Phe Asp Glu Lys Tyr His Phe Ser Cys Gln Phe Thr
450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Thr
515 520 525
Asn Leu Tyr Phe Pro His Thr Glu Lys Glu Lys Arg Leu Thr Ser Phe
530 535 540
His Pro Glu Ile Glu Glu Leu Leu Phe Ser Asp Val Glu Asn Glu Glu
545 550 555 560
His Leu Cys Val Leu Lys Asp Lys Lys Lys Pro Ile Leu Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Leu Tyr
580 585 590
Ala Lys Asn Pro Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620
Lys Lys Met Tyr Ser Leu Ile Glu Thr Tyr Asn Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Ile His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Val Ser Glu
705 710 715 720
Leu Leu Ala Asn Phe Phe Glu Arg Cys Lys Lys Glu Pro Ser Tyr Trp
725 730 735
Asp Thr Ile Ser Ala Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Gly Val Tyr Gly
755 760 765
Phe Trp Lys Cys Val Ser Lys Leu Asp Arg Gln Glu Ile Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ala Val
785 790 795 800
Pro Leu Ala Val Asp Gln
805
<210> 80
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<400> 80
tgaattcgtt aacgaattc 19
<210> 81
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<400> 81
tgaattcgtt aacgaactc 19
<210> 82
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<400> 82
tgaattcgtt aacgaagtc 19
<210> 83
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic oligonucleotide
<400> 83
tgaattcgtt aacgaaatt 19
<210> 84
<211> 458
<212> PRT
<213> Stevia rebaudiana
<400> 84
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 85
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<223> UGT91D2
<400> 85
Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val
1 5 10 15
Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln
20 25 30
Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser
35 40 45
Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile
50 55 60
Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp
65 70 75 80
Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys
85 90 95
Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln
100 105 110
His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro
115 120 125
Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr
130 135 140
Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile
145 150 155 160
Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro
165 170 175
Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu
180 185 190
Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Arg Cys Arg
195 200 205
Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr
210 215 220
His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln
225 230 235 240
Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp
245 250 255
Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys
260 265 270
Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val
275 280 285
Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly
290 295 300
Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser
305 310 315 320
Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg
325 330 335
Gly Leu Val Trp Thr Ser Arg Ala Pro Gln Leu Arg Ile Leu Ser His
340 345 350
Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val
355 360 365
Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly
370 375 380
Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile
385 390 395 400
Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val
405 410 415
Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr
420 425 430
Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val
435 440 445
Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala
450 455 460
Arg Ala Val Ala Ile Asp His Glu Ser
465 470
<210> 86
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 86
Thr Ser Phe Ala Glu Tyr Trp Asn Leu Leu Ser Pro
1 5 10
<210> 87
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 87
Met Cys Asn Thr Asn Met Ser Val Pro Thr Asp Gly Ala Val Thr Thr
1 5 10 15
Ser Gln Ile Pro Ala Ser Glu Gln Glu Thr Leu Val Arg Pro Lys Pro
20 25 30
Leu Leu Leu Lys Leu Leu Lys Ser Val Gly Ala Gln Lys Asp Thr Tyr
35 40 45
Thr Met Lys Glu Val Leu Phe Tyr Leu Gly Gln Tyr Ile Met Thr Lys
50 55 60
Arg Leu Tyr Asp Glu Lys Gln Gln His Ile Val Tyr Cys Ser Asn Asp
65 70 75 80
Leu Leu Gly Asp Leu Phe Gly Val Pro Ser Phe Ser Val Lys Glu His
85 90 95
Arg Lys Ile Tyr Thr Met Ile Tyr Arg Asn Leu Val Val Val Asn Gln
100 105 110
Gln Glu Ser Ser Asp Ser Gly Thr Ser Val Ser Glu Asn Arg Cys His
115 120 125
Leu Glu Gly Gly Ser Asp Gln Lys Asp Leu Val Gln Glu Leu Gln Glu
130 135 140
Glu Lys Pro Ser Ser Ser His Leu Val Ser Arg Pro Ser Thr Gly Gly
145 150 155 160
Ser Gly Ser Ser Gly Gly Ser Ala Ser Lys Met Ala Glu Gln Gln Lys
165 170 175
Ile Lys Lys Ser Pro His Val Leu Leu Ile Pro Phe Pro Leu Gln Gly
180 185 190
His Ile Asn Pro Phe Ile Gln Phe Gly Lys Arg Leu Ile Ser Lys Gly
195 200 205
Val Lys Thr Thr Leu Val Thr Thr Ile His Thr Leu Asn Ser Thr Leu
210 215 220
Asn His Ser Asn Thr Thr Thr Thr Ser Ile Glu Ile Gln Ala Ile Ser
225 230 235 240
Asp Gly Cys Asp Glu Gly Gly Phe Met Ser Ala Gly Glu Ser Tyr Leu
245 250 255
Glu Thr Phe Lys Gln Val Gly Ser Lys Ser Leu Ala Asp Leu Ile Lys
260 265 270
Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp Ala Ile Ile Tyr Asp Ser
275 280 285
Met Thr Glu Trp Val Leu Asp Val Ala Ile Glu Phe Gly Ile Asp Gly
290 295 300
Gly Ser Phe Phe Thr Gln Ala Cys Val Val Asn Ser Leu Tyr Tyr His
305 310 315 320
Val His Lys Gly Leu Ile Ser Leu Pro Leu Gly Glu Thr Val Ser Val
325 330 335
Pro Gly Phe Pro Val Leu Gln Arg Trp Glu Thr Pro Leu Ile Leu Gln
340 345 350
Asn His Glu Gln Ile Gln Ser Pro Trp Ser Gln Met Leu Phe Gly Gln
355 360 365
Phe Ala Asn Ile Asp Gln Ala Arg Trp Val Phe Thr Asn Ser Phe Tyr
370 375 380
Lys Leu Glu Glu Glu Val Ile Glu Trp Thr Arg Lys Ile Trp Asn Leu
385 390 395 400
Lys Val Ile Gly Pro Thr Leu Pro Ser Met Tyr Leu Asp Lys Arg Leu
405 410 415
Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu Tyr Lys Ala Asn His His
420 425 430
Glu Cys Met Asn Trp Leu Asp Asp Lys Pro Lys Glu Ser Val Val Tyr
435 440 445
Val Ala Phe Gly Ser Leu Val Lys His Gly Pro Glu Gln Val Glu Glu
450 455 460
Ile Thr Arg Ala Leu Ile Asp Ser Asp Val Asn Phe Leu Trp Val Ile
465 470 475 480
Lys His Lys Glu Glu Gly Lys Leu Pro Glu Asn Leu Ser Glu Val Ile
485 490 495
Lys Thr Gly Lys Gly Leu Ile Val Ala Trp Cys Lys Gln Leu Asp Val
500 505 510
Leu Ala His Glu Ser Val Gly Cys Phe Val Thr His Cys Gly Phe Asn
515 520 525
Ser Thr Leu Glu Ala Ile Ser Leu Gly Val Pro Val Val Ala Met Pro
530 535 540
Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys Leu Leu Asp Glu Ile Leu
545 550 555 560
Gly Val Gly Val Arg Val Lys Ala Asp Glu Asn Gly Ile Val Arg Arg
565 570 575
Gly Asn Leu Ala Ser Cys Ile Lys Met Ile Met Glu Glu Glu Arg Gly
580 585 590
Val Ile Ile Arg Lys Asn Ala Val Lys Trp Lys Asp Leu Ala Lys Val
595 600 605
Ala Val His Glu Gly Gly Ser Ser Asp Asn Asp Ile Val Glu Phe Val
610 615 620
Ser Glu Leu Ile Lys Ala
625 630
<210> 88
<211> 533
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 88
Met Thr Ser Phe Ala Glu Tyr Trp Asn Leu Leu Ser Pro Thr Ser Phe
1 5 10 15
Ala Glu Tyr Trp Asn Leu Leu Ser Pro Thr Ser Phe Ala Glu Tyr Trp
20 25 30
Asn Leu Phe Ser Pro Thr Ser Phe Ala Glu Tyr Trp Asn Leu Leu Ser
35 40 45
Pro Ala Ser Lys Met Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His
50 55 60
Val Ile Phe Ile Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu
65 70 75 80
Lys Leu Ala Gln Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val
85 90 95
Asn Thr Asp Phe Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His
100 105 110
Cys Leu Asp Gly Ala Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly
115 120 125
Val Ser His Ser Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu
130 135 140
Arg Ser Ile Glu Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr
145 150 155 160
Lys Leu Pro Asp Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser
165 170 175
Val Phe Thr Ile Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met
180 185 190
Tyr Trp Thr Leu Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His
195 200 205
Ser Leu Ile Glu Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu
210 215 220
Thr Asn Gly Tyr Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu
225 230 235 240
Gly Ile Arg Leu Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn
245 250 255
Asp Lys Val Leu Met Phe Thr Thr Glu Ala Pro Gln Arg Ser His Lys
260 265 270
Val Ser His His Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile
275 280 285
Ile Lys Thr Leu Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro
290 295 300
Leu Gln Leu Leu Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly
305 310 315 320
Ile Thr Ser Leu His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys
325 330 335
Phe Gln Trp Leu Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn
340 345 350
Phe Gly Ser Thr Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly
355 360 365
Trp Gly Leu Ala Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser
370 375 380
Asn Leu Val Ile Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu
385 390 395 400
His Ile Lys Lys Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys
405 410 415
Val Leu Lys His Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp
420 425 430
Gly Ser Thr Ile Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp
435 440 445
Pro Tyr Ser Trp Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu
450 455 460
Trp Glu Val Gly Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val
465 470 475 480
Lys Arg Leu Val Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg
485 490 495
Asn Lys Ala Lys Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro
500 505 510
Asn Gly Ser Ser Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr
515 520 525
Val Leu Ala Arg Asn
530
<210> 89
<211> 628
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 89
Met Cys Asn Thr Asn Met Ser Val Pro Thr Asp Gly Ala Val Thr Thr
1 5 10 15
Ser Gln Ile Pro Ala Ser Glu Gln Glu Thr Leu Val Arg Pro Lys Pro
20 25 30
Leu Leu Leu Lys Leu Leu Lys Ser Val Gly Ala Gln Lys Asp Thr Tyr
35 40 45
Thr Met Lys Glu Val Leu Phe Tyr Leu Gly Gln Tyr Ile Met Thr Lys
50 55 60
Arg Leu Tyr Asp Glu Lys Gln Gln His Ile Val Tyr Cys Ser Asn Asp
65 70 75 80
Leu Leu Gly Asp Leu Phe Gly Val Pro Ser Phe Ser Val Lys Glu His
85 90 95
Arg Lys Ile Tyr Thr Met Ile Tyr Arg Asn Leu Val Val Val Asn Gln
100 105 110
Gln Glu Ser Ser Asp Ser Gly Thr Ser Val Ser Glu Asn Arg Cys His
115 120 125
Leu Glu Gly Gly Ser Asp Gln Lys Asp Leu Val Gln Glu Leu Gln Glu
130 135 140
Glu Lys Pro Ser Ser Ser His Leu Val Ser Arg Pro Ser Thr Gly Gly
145 150 155 160
Ser Gly Ser Ser Gly Gly Ser Ala Ser Lys Met Glu Asn Lys Thr Glu
165 170 175
Thr Thr Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe
180 185 190
Gln Gly His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser
195 200 205
Lys Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys
210 215 220
Thr Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp
225 230 235 240
Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala
245 250 255
Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg
260 265 270
Arg Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val
275 280 285
Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala
290 295 300
Asp Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe
305 310 315 320
Asn Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr
325 330 335
Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe
340 345 350
Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln
355 360 365
Ile Leu Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser
370 375 380
Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu
385 390 395 400
Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu
405 410 415
Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp His Asp Arg
420 425 430
Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr
435 440 445
Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu
450 455 460
Ile Ala Arg Gly Leu Val Asp Ser Lys Gln Ser Phe Leu Trp Val Val
465 470 475 480
Arg Pro Gly Phe Val Lys Gly Ser Thr Trp Val Glu Pro Leu Pro Asp
485 490 495
Gly Phe Leu Gly Glu Arg Gly Arg Ile Val Lys Trp Val Pro Gln Gln
500 505 510
Glu Val Leu Ala His Gly Ala Ile Gly Ala Phe Trp Thr His Ser Gly
515 520 525
Trp Asn Ser Thr Leu Glu Ser Val Cys Glu Gly Val Pro Met Ile Phe
530 535 540
Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala Arg Tyr Met Ser Asp
545 550 555 560
Val Leu Lys Val Gly Val Tyr Leu Glu Asn Gly Trp Glu Arg Gly Glu
565 570 575
Ile Ala Asn Ala Ile Arg Arg Val Met Val Asp Glu Glu Gly Glu Tyr
580 585 590
Ile Arg Gln Asn Ala Arg Val Leu Lys Gln Lys Ala Asp Val Ser Leu
595 600 605
Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu Ser Leu Val Ser Tyr
610 615 620
Ile Ser Ser Leu
625
<210> 90
<211> 643
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<400> 90
Met Cys Asn Thr Asn Met Ser Val Pro Thr Asp Gly Ala Val Thr Thr
1 5 10 15
Ser Gln Ile Pro Ala Ser Glu Gln Glu Thr Leu Val Arg Pro Lys Pro
20 25 30
Leu Leu Leu Lys Leu Leu Lys Ser Val Gly Ala Gln Lys Asp Thr Tyr
35 40 45
Thr Met Lys Glu Val Leu Phe Tyr Leu Gly Gln Tyr Ile Met Thr Lys
50 55 60
Arg Leu Tyr Asp Glu Lys Gln Gln His Ile Val Tyr Cys Ser Asn Asp
65 70 75 80
Leu Leu Gly Asp Leu Phe Gly Val Pro Ser Phe Ser Val Lys Glu His
85 90 95
Arg Lys Ile Tyr Thr Met Ile Tyr Arg Asn Leu Val Val Val Asn Gln
100 105 110
Gln Glu Ser Ser Asp Ser Gly Thr Ser Val Ser Glu Asn Arg Cys His
115 120 125
Leu Glu Gly Gly Ser Asp Gln Lys Asp Leu Val Gln Glu Leu Gln Glu
130 135 140
Glu Lys Pro Ser Ser Ser His Leu Val Ser Arg Pro Ser Thr Gly Gly
145 150 155 160
Ser Gly Ser Ser Gly Gly Ser Ala Ser Lys Met Ala Thr Ser Asp Ser
165 170 175
Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro Trp Leu
180 185 190
Ala Phe Gly His Ile Leu Pro Tyr Leu Gln Leu Ser Lys Leu Ile Ala
195 200 205
Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn Ile Gln
210 215 220
Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln Leu Thr
225 230 235 240
Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr Thr Asp
245 250 255
Val His Pro Glu Asp Ile Pro Tyr Leu Lys Lys Ala Ser Asp Gly Leu
260 265 270
Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp Trp Ile
275 280 285
Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro Ser Ile Ala Ala Ser Leu
290 295 300
Gly Ile Ser Arg Ala His Phe Ser Val Thr Thr Pro Trp Ala Ile Ala
305 310 315 320
Tyr Met Gly Pro Ser Ala Asp Ala Met Ile Asn Gly Ser Asp Gly Arg
325 330 335
Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro Phe Pro
340 345 350
Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Leu Val Pro Tyr
355 360 365
Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Leu Val Leu Lys
370 375 380
Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr His Glu Phe Gly Thr Gln
385 390 395 400
Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val Pro Val
405 410 415
Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu Thr Trp
420 425 430
Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser Val Val
435 440 445
Tyr Val Ala Leu Gly Ser Glu Val Leu Val Ser Gln Thr Glu Val Val
450 455 460
Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val Trp Ala
465 470 475 480
Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu Leu Pro
485 490 495
Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp Thr Ser
500 505 510
Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys Gly Phe
515 520 525
Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met Phe Gly
530 535 540
His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Pro Leu Asn Ala
545 550 555 560
Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg Asn Glu
565 570 575
Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu Arg Ser
580 585 590
Val Val Val Glu Lys Glu Gly Glu Ile Tyr Lys Ala Asn Ala Arg Glu
595 600 605
Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr Val Ser
610 615 620
Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala Ile Asp
625 630 635 640
His Glu Ser
<210> 91
<211> 110
<212> PRT
<213> Escherichia coli
<400> 91
Met Asn Pro Tyr Ile Tyr Leu Gly Gly Ala Ile Leu Ala Glu Val Ile
1 5 10 15
Gly Thr Thr Leu Met Lys Phe Ser Glu Gly Phe Thr Arg Leu Trp Pro
20 25 30
Ser Val Gly Thr Ile Ile Cys Tyr Cys Ala Ser Phe Trp Leu Leu Ala
35 40 45
Gln Thr Leu Ala Tyr Ile Pro Thr Gly Ile Ala Tyr Ala Ile Trp Ser
50 55 60
Gly Val Gly Ile Val Leu Ile Ser Leu Leu Ser Trp Gly Phe Phe Gly
65 70 75 80
Gln Arg Leu Asp Leu Pro Ala Ile Ile Gly Met Met Leu Ile Cys Ala
85 90 95
Gly Val Leu Ile Ile Asn Leu Leu Ser Arg Ser Thr Pro His
100 105 110
<210> 92
<211> 1049
<212> PRT
<213> Escherichia coli
<400> 92
Met Pro Asn Phe Phe Ile Asp Arg Pro Ile Phe Ala Trp Val Ile Ala
1 5 10 15
Ile Ile Ile Met Leu Ala Gly Gly Leu Ala Ile Leu Lys Leu Pro Val
20 25 30
Ala Gln Tyr Pro Thr Ile Ala Pro Pro Ala Val Thr Ile Ser Ala Ser
35 40 45
Tyr Pro Gly Ala Asp Ala Lys Thr Val Gln Asp Thr Val Thr Gln Val
50 55 60
Ile Glu Gln Asn Met Asn Gly Ile Asp Asn Leu Met Tyr Met Ser Ser
65 70 75 80
Asn Ser Asp Ser Thr Gly Thr Val Gln Ile Thr Leu Thr Phe Glu Ser
85 90 95
Gly Thr Asp Ala Asp Ile Ala Gln Val Gln Val Gln Asn Lys Leu Gln
100 105 110
Leu Ala Met Pro Leu Leu Pro Gln Glu Val Gln Gln Gln Gly Val Ser
115 120 125
Val Glu Lys Ser Ser Ser Ser Phe Leu Met Val Val Gly Val Ile Asn
130 135 140
Thr Asp Gly Thr Met Thr Gln Glu Asp Ile Ser Asp Tyr Val Ala Ala
145 150 155 160
Asn Met Lys Asp Ala Ile Ser Arg Thr Ser Gly Val Gly Asp Val Gln
165 170 175
Leu Phe Gly Ser Gln Tyr Ala Met Arg Ile Trp Met Asn Pro Asn Glu
180 185 190
Leu Asn Lys Phe Gln Leu Thr Pro Val Asp Val Ile Thr Ala Ile Lys
195 200 205
Ala Gln Asn Ala Gln Val Ala Ala Gly Gln Leu Gly Gly Thr Pro Pro
210 215 220
Val Lys Gly Gln Gln Leu Asn Ala Ser Ile Ile Ala Gln Thr Arg Leu
225 230 235 240
Thr Ser Thr Glu Glu Phe Gly Lys Ile Leu Leu Lys Val Asn Gln Asp
245 250 255
Gly Ser Arg Val Leu Leu Arg Asp Val Ala Lys Ile Glu Leu Gly Gly
260 265 270
Glu Asn Tyr Asp Ile Ile Ala Glu Phe Asn Gly Gln Pro Ala Ser Gly
275 280 285
Leu Gly Ile Lys Leu Ala Thr Gly Ala Asn Ala Leu Asp Thr Ala Ala
290 295 300
Ala Ile Arg Ala Glu Leu Ala Lys Met Glu Pro Phe Phe Pro Ser Gly
305 310 315 320
Leu Lys Ile Val Tyr Pro Tyr Asp Thr Thr Pro Phe Val Lys Ile Ser
325 330 335
Ile His Glu Val Val Lys Thr Leu Val Glu Ala Ile Ile Leu Val Phe
340 345 350
Leu Val Met Tyr Leu Phe Leu Gln Asn Phe Arg Ala Thr Leu Ile Pro
355 360 365
Thr Ile Ala Val Pro Val Val Leu Leu Gly Thr Phe Ala Val Leu Ala
370 375 380
Ala Phe Gly Phe Ser Ile Asn Thr Leu Thr Met Phe Gly Met Val Leu
385 390 395 400
Ala Ile Gly Leu Leu Val Asp Asp Ala Ile Val Val Val Glu Asn Val
405 410 415
Glu Arg Val Met Ala Glu Glu Gly Leu Pro Pro Lys Glu Ala Thr Arg
420 425 430
Lys Ser Met Gly Gln Ile Gln Gly Ala Leu Val Gly Ile Ala Met Val
435 440 445
Leu Ser Ala Val Phe Val Pro Met Ala Phe Phe Gly Gly Ser Thr Gly
450 455 460
Ala Ile Tyr Arg Gln Phe Ser Ile Thr Ile Val Ser Ala Met Ala Leu
465 470 475 480
Ser Val Leu Val Ala Leu Ile Leu Thr Pro Ala Leu Cys Ala Thr Met
485 490 495
Leu Lys Pro Ile Ala Lys Gly Asp His Gly Glu Gly Lys Lys Gly Phe
500 505 510
Phe Gly Trp Phe Asn Arg Met Phe Glu Lys Ser Thr His His Tyr Thr
515 520 525
Asp Ser Val Gly Gly Ile Leu Arg Ser Thr Gly Arg Tyr Leu Val Leu
530 535 540
Tyr Leu Ile Ile Val Val Gly Met Ala Tyr Leu Phe Val Arg Leu Pro
545 550 555 560
Ser Ser Phe Leu Pro Asp Glu Asp Gln Gly Val Phe Met Thr Met Val
565 570 575
Gln Leu Pro Ala Gly Ala Thr Gln Glu Arg Thr Gln Lys Val Leu Asn
580 585 590
Glu Val Thr His Tyr Tyr Leu Thr Lys Glu Lys Asn Asn Val Glu Ser
595 600 605
Val Phe Ala Val Asn Gly Phe Gly Phe Ala Gly Arg Gly Gln Asn Thr
610 615 620
Gly Ile Ala Phe Val Ser Leu Lys Asp Trp Ala Asp Arg Pro Gly Glu
625 630 635 640
Glu Asn Lys Val Glu Ala Ile Thr Met Arg Ala Thr Arg Ala Phe Ser
645 650 655
Gln Ile Lys Asp Ala Met Val Phe Ala Phe Asn Leu Pro Ala Ile Val
660 665 670
Glu Leu Gly Thr Ala Thr Gly Phe Asp Phe Glu Leu Ile Asp Gln Ala
675 680 685
Gly Leu Gly His Glu Lys Leu Thr Gln Ala Arg Asn Gln Leu Leu Ala
690 695 700
Glu Ala Ala Lys His Pro Asp Met Leu Thr Ser Val Arg Pro Asn Gly
705 710 715 720
Leu Glu Asp Thr Pro Gln Phe Lys Ile Asp Ile Asp Gln Glu Lys Ala
725 730 735
Gln Ala Leu Gly Val Ser Ile Asn Asp Ile Asn Thr Thr Leu Gly Ala
740 745 750
Ala Trp Gly Gly Ser Tyr Val Asn Asp Phe Ile Asp Arg Gly Arg Val
755 760 765
Lys Lys Val Tyr Val Met Ser Glu Ala Lys Tyr Arg Met Leu Pro Asp
770 775 780
Asp Ile Gly Asp Trp Tyr Val Arg Ala Ala Asp Gly Gln Met Val Pro
785 790 795 800
Phe Ser Ala Phe Ser Ser Ser Arg Trp Glu Tyr Gly Ser Pro Arg Leu
805 810 815
Glu Arg Tyr Asn Gly Leu Pro Ser Met Glu Ile Leu Gly Gln Ala Ala
820 825 830
Pro Gly Lys Ser Thr Gly Glu Ala Met Glu Leu Met Glu Gln Leu Ala
835 840 845
Ser Lys Leu Pro Thr Gly Val Gly Tyr Asp Trp Thr Gly Met Ser Tyr
850 855 860
Gln Glu Arg Leu Ser Gly Asn Gln Ala Pro Ser Leu Tyr Ala Ile Ser
865 870 875 880
Leu Ile Val Val Phe Leu Cys Leu Ala Ala Leu Tyr Glu Ser Trp Ser
885 890 895
Ile Pro Phe Ser Val Met Leu Val Val Pro Leu Gly Val Ile Gly Ala
900 905 910
Leu Leu Ala Ala Thr Phe Arg Gly Leu Thr Asn Asp Val Tyr Phe Gln
915 920 925
Val Gly Leu Leu Thr Thr Ile Gly Leu Ser Ala Lys Asn Ala Ile Leu
930 935 940
Ile Val Glu Phe Ala Lys Asp Leu Met Asp Lys Glu Gly Lys Gly Leu
945 950 955 960
Ile Glu Ala Thr Leu Asp Ala Val Arg Met Arg Leu Arg Pro Ile Leu
965 970 975
Met Thr Ser Leu Ala Phe Ile Leu Gly Val Met Pro Leu Val Ile Ser
980 985 990
Thr Gly Ala Gly Ser Gly Ala Gln Asn Ala Val Gly Thr Gly Val Met
995 1000 1005
Gly Gly Met Val Thr Ala Thr Val Leu Ala Ile Phe Phe Val Pro
1010 1015 1020
Val Phe Phe Val Val Val Arg Arg Arg Phe Ser Arg Lys Asn Glu
1025 1030 1035
Asp Ile Glu His Ser His Thr Val Asp His His
1040 1045
<210> 93
<211> 397
<212> PRT
<213> Escherichia coli
<400> 93
Met Asn Lys Asn Arg Gly Phe Thr Pro Leu Ala Val Val Leu Met Leu
1 5 10 15
Ser Gly Ser Leu Ala Leu Thr Gly Cys Asp Asp Lys Gln Ala Gln Gln
20 25 30
Gly Gly Gln Gln Met Pro Ala Val Gly Val Val Thr Val Lys Thr Glu
35 40 45
Pro Leu Gln Ile Thr Thr Glu Leu Pro Gly Arg Thr Ser Ala Tyr Arg
50 55 60
Ile Ala Glu Val Arg Pro Gln Val Ser Gly Ile Ile Leu Lys Arg Asn
65 70 75 80
Phe Lys Glu Gly Ser Asp Ile Glu Ala Gly Val Ser Leu Tyr Gln Ile
85 90 95
Asp Pro Ala Thr Tyr Gln Ala Thr Tyr Asp Ser Ala Lys Gly Asp Leu
100 105 110
Ala Lys Ala Gln Ala Ala Ala Asn Ile Ala Gln Leu Thr Val Asn Arg
115 120 125
Tyr Gln Lys Leu Leu Gly Thr Gln Tyr Ile Ser Lys Gln Glu Tyr Asp
130 135 140
Gln Ala Leu Ala Asp Ala Gln Gln Ala Asn Ala Ala Val Thr Ala Ala
145 150 155 160
Lys Ala Ala Val Glu Thr Ala Arg Ile Asn Leu Ala Tyr Thr Lys Val
165 170 175
Thr Ser Pro Ile Ser Gly Arg Ile Gly Lys Ser Asn Val Thr Glu Gly
180 185 190
Ala Leu Val Gln Asn Gly Gln Ala Thr Ala Leu Ala Thr Val Gln Gln
195 200 205
Leu Asp Pro Ile Tyr Val Asp Val Thr Gln Ser Ser Asn Asp Phe Leu
210 215 220
Arg Leu Lys Gln Glu Leu Ala Asn Gly Thr Leu Lys Gln Glu Asn Gly
225 230 235 240
Lys Ala Lys Val Ser Leu Ile Thr Ser Asp Gly Ile Lys Phe Pro Gln
245 250 255
Asp Gly Thr Leu Glu Phe Ser Asp Val Thr Val Asp Gln Thr Thr Gly
260 265 270
Ser Ile Thr Leu Arg Ala Ile Phe Pro Asn Pro Asp His Thr Leu Leu
275 280 285
Pro Gly Met Phe Val Arg Ala Arg Leu Glu Glu Gly Leu Asn Pro Asn
290 295 300
Ala Ile Leu Val Pro Gln Gln Gly Val Thr Arg Thr Pro Arg Gly Asp
305 310 315 320
Ala Thr Val Leu Val Val Gly Ala Asp Asp Lys Val Glu Thr Arg Pro
325 330 335
Ile Val Ala Ser Gln Ala Ile Gly Asp Lys Trp Leu Val Thr Glu Gly
340 345 350
Leu Lys Ala Gly Asp Arg Val Val Ile Ser Gly Leu Gln Lys Val Arg
355 360 365
Pro Gly Val Gln Val Lys Ala Gln Glu Val Thr Ala Asp Asn Asn Gln
370 375 380
Gln Ala Ala Ser Gly Ala Gln Pro Glu Gln Ser Lys Ser
385 390 395
<210> 94
<211> 457
<212> PRT
<213> Escherichia coli
<400> 94
Met Gln Lys Tyr Ile Ser Glu Ala Arg Leu Leu Leu Ala Leu Ala Ile
1 5 10 15
Pro Val Ile Leu Ala Gln Ile Ala Gln Thr Ala Met Gly Phe Val Ser
20 25 30
Thr Val Met Ala Gly Gly Tyr Ser Ala Thr Asp Met Ala Ala Val Ala
35 40 45
Ile Gly Thr Ser Ile Trp Leu Pro Ala Ile Leu Phe Gly His Gly Leu
50 55 60
Leu Leu Ala Leu Thr Pro Val Ile Ala Gln Leu Asn Gly Ser Gly Arg
65 70 75 80
Arg Glu Arg Ile Ala His Gln Val Arg Gln Gly Phe Trp Leu Ala Gly
85 90 95
Phe Val Ser Val Leu Ile Met Leu Val Leu Trp Asn Ala Gly Tyr Ile
100 105 110
Ile Arg Ser Met Glu Asn Ile Asp Pro Ala Leu Ala Asp Lys Ala Val
115 120 125
Gly Tyr Leu Arg Ala Leu Leu Trp Gly Ala Pro Gly Tyr Leu Phe Phe
130 135 140
Gln Val Ala Arg Asn Gln Cys Glu Gly Leu Ala Lys Thr Lys Pro Gly
145 150 155 160
Met Val Met Gly Phe Ile Gly Leu Leu Val Asn Ile Pro Val Asn Tyr
165 170 175
Ile Phe Ile Tyr Gly His Phe Gly Met Pro Glu Leu Gly Gly Val Gly
180 185 190
Cys Gly Val Ala Thr Ala Ala Val Tyr Trp Val Met Phe Leu Ala Met
195 200 205
Val Ser Tyr Ile Lys Arg Ala Arg Ser Met Arg Asp Ile Arg Asn Glu
210 215 220
Lys Gly Thr Ala Lys Pro Asp Pro Ala Val Met Lys Arg Leu Ile Gln
225 230 235 240
Leu Gly Leu Pro Ile Ala Leu Ala Leu Phe Phe Glu Val Thr Leu Phe
245 250 255
Ala Val Val Ala Leu Leu Val Ser Pro Leu Gly Ile Val Asp Val Ala
260 265 270
Gly His Gln Ile Ala Leu Asn Phe Ser Ser Leu Met Phe Val Leu Pro
275 280 285
Met Ser Leu Ala Ala Ala Val Thr Ile Arg Val Gly Tyr Arg Leu Gly
290 295 300
Gln Gly Ser Thr Leu Asp Ala Gln Thr Ala Ala Arg Thr Gly Leu Met
305 310 315 320
Val Gly Val Cys Met Ala Thr Leu Thr Ala Ile Phe Thr Val Ser Leu
325 330 335
Arg Glu Gln Ile Ala Leu Leu Tyr Asn Asp Asn Pro Glu Val Val Thr
340 345 350
Leu Ala Ala His Leu Met Leu Leu Ala Ala Val Tyr Gln Ile Ser Asp
355 360 365
Ser Ile Gln Val Ile Gly Ser Gly Ile Leu Arg Gly Tyr Lys Asp Thr
370 375 380
Arg Ser Ile Phe Tyr Ile Thr Phe Thr Ala Tyr Trp Val Leu Gly Leu
385 390 395 400
Pro Ser Gly Tyr Ile Leu Ala Leu Thr Asp Leu Val Val Glu Pro Met
405 410 415
Gly Pro Ala Gly Phe Trp Ile Gly Phe Ile Ile Gly Leu Thr Ser Ala
420 425 430
Ala Ile Met Met Met Leu Arg Met Arg Phe Leu Gln Arg Leu Pro Ser
435 440 445
Ala Ile Ile Leu Gln Arg Ala Ser Arg
450 455
<210> 95
<211> 2358
<212> DNA
<213> Arabidopsis thaliana
<400> 95
atgtctatta atttgagatc ttccggttgt agctccccaa taagcgcaac tttggaaagg 60
ggtctagact ctgaagttca aacaagagca aacaatgtat cttttgagca gaccaaagag 120
aagatcagga aaatgcttga gaaggtcgag ttgagcgtga gtgcctatga cactagttgg 180
gtagctatgg tcccatcacc atccagtcaa aacgcacctc ttttcccaca gtgcgtcaaa 240
tggctacttg ataatcaaca tgaggacggc tcttggggat tggataacca cgaccatcag 300
agcttaaaga aagatgtgtt gtcatccaca ttagcctcta tcctagctct taagaaatgg 360
ggaataggcg aaagacagat caataagggt ctacagttca ttgaattaaa ctctgcacta 420
gttaccgatg aaactataca aaaacctaca ggtttcgaca tcatttttcc aggaatgatt 480
aagtacgcca gggaccttaa tttgaccata cctcttggct cagaagtagt cgacgatatg 540
atcaggaaaa gagatctaga cttaaagtgt gatagcgaga aattcagcaa aggtagagag 600
gcttatcttg cctatgttct tgaaggaact aggaacttga aggactggga cttaattgtg 660
aaatatcaga gaaagaacgg tagtctattt gatagtccag ctacaaccgc cgcagctttc 720
actcaatttg gcaatgacgg ttgcttgagg tacttatgtt cacttttaca gaaattcgag 780
gccgcagtgc ctagtgtata tccatttgat caatacgcta gattaagcat aatcgtcact 840
ttagaatcat tgggaattga cagagatttc aagactgaga taaaaagcat attggatgag 900
acctataggt actggcttag aggtgacgaa gaaatttgcc tagatttggc cacatgtgca 960
cttgctttta ggttgctttt agcccacggc tatgacgtgt catacgatcc tctaaagcca 1020
tttgcagagg aatctggttt cagcgatacc cttgagggat atgttaaaaa caccttttcc 1080
gtattagagc ttttcaaggc tgcccaaagt taccctcatg agagtgcttt gaaaaagcag 1140
tgttgctgga caaaacaata tctagaaatg gaactaagtt catgggttaa aacaagcgtt 1200
agggacaagt acttgaaaaa ggaagtggag gatgctttgg catttccatc atatgcctct 1260
ttagaaagaa gtgaccacag aaggaaaatt cttaatggct cagcagttga aaacacaaga 1320
gtaaccaaga cctcttacag gttgcataat atatgtacat cagatatctt aaaacttgct 1380
gtcgacgatt tcaacttttg ccaatctatt catagagagg aaatggaaag attggataga 1440
tggatagtgg agaatagact acaggaatta aagttcgcca gacaaaaatt ggcttactgt 1500
tactttagtg gcgctgccac actattctct ccagaattgt ctgacgcaag gatctcatgg 1560
gctaagggag gtgttctaac cacagtagtc gatgactttt ttgatgttgg cggtagtaaa 1620
gaagagcttg agaacttaat tcacttggtg gaaaagtggg atcttaatgg agttcctgaa 1680
tactcttcag agcatgtaga aataattttc tctgtcctaa gagacactat cttagaaacc 1740
ggtgataaag cctttacata tcagggcaga aacgttactc accatattgt gaaaatatgg 1800
ttggacttac ttaagagcat gctaagggag gctgaatggt ccagtgacaa atcaacccca 1860
tctttggaag attacatgga gaatgcctat atcagcttcg cattaggtcc tattgtattg 1920
ccagctacat accttatagg acctccacta cctgaaaaga ctgtcgactc ccaccaatat 1980
aatcaattat acaaattggt tagtaccatg ggtagactat taaacgatat ccagggcttt 2040
aagagggaat cagccgaggg aaaacttaat gcagtgtctc tacatatgaa gcatgaaaga 2100
gacaacagaa gcaaagaggt tattatagaa tccatgaaag gattggctga aaggaaaaga 2160
gaggaattac acaaacttgt actagaagag aaaggtagtg tcgttccaag agaatgcaag 2220
gaagccttct taaaaatgtc aaaagtgttg aacctttttt ataggaagga tgatggcttc 2280
acatctaacg acttgatgag ccttgtgaaa tccgtcatct acgagcctgt ttcacttcaa 2340
aaggagagtc taacttga 2358
<210> 96
<211> 894
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon-optimized nucleotide sequence encoding Synechococcus sp.
GGPPS
<400> 96
atggtcgcac aaactttcaa cctggatacc tacttatccc aaagacaaca acaagttgaa 60
gaggccctaa gtgctgctct tgtgccagct tatcctgaga gaatatacga agctatgaga 120
tactccctcc tggcaggtgg caaaagatta agacctatct tatgtttagc tgcttgcgaa 180
ttggcaggtg gttctgttga acaagccatg ccaactgcgt gtgcacttga aatgatccat 240
acaatgtcac taattcatga tgacctgcca gccatggata acgatgattt cagaagagga 300
aagccaacta atcacaaggt gttcggggaa gatatagcca tcttagcggg tgatgcgctt 360
ttagcttacg cttttgaaca tattgcttct caaacaagag gagtaccacc tcaattggtg 420
ctacaagtta ttgctagaat cggacacgcc gttgctgcaa caggcctcgt tggaggccaa 480
gtcgtagacc ttgaatctga aggtaaagct atttccttag aaacattgga gtatattcac 540
tcacataaga ctggagcctt gctggaagca tcagttgtct caggcggtat tctcgcaggg 600
gcagatgaag agcttttggc cagattgtct cattacgcta gagatatagg cttggctttt 660
caaatcgtcg atgatatcct ggatgttact gctacatctg aacagttggg gaaaaccgct 720
ggtaaagacc aggcagccgc aaaggcaact tatccaagtc tattgggttt agaagcctct 780
agacagaaag cggaagagtt gattcaatct gctaaggaag ccttaagacc ttacggttca 840
caagcagagc cactcctagc gctggcagac ttcatcacac gtcgtcagca ttaa 894
<210> 97
<211> 1542
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon-optimized nucleotide sequence encoding S. rebaudiana KO-1
<400> 97
atggatgctg tgacgggttt gttaactgtc ccagcaaccg ctataactat tggtggaact 60
gctgtagcat tggcggtagc gctaatcttt tggtacctga aatcctacac atcagctaga 120
agatcccaat caaatcatct tccaagagtg cctgaagtcc caggtgttcc attgttagga 180
aatctgttac aattgaagga gaaaaagcca tacatgactt ttacgagatg ggcagcgaca 240
tatggaccta tctatagtat caaaactggg gctacaagta tggttgtggt atcatctaat 300
gagatagcca aggaggcatt ggtgaccaga ttccaatcca tatctacaag gaacttatct 360
aaagccctga aagtacttac agcagataag acaatggtcg caatgtcaga ttatgatgat 420
tatcataaaa cagttaagag acacatactg accgccgtct tgggtcctaa tgcacagaaa 480
aagcatagaa ttcacagaga tatcatgatg gataacatat ctactcaact tcatgaattc 540
gtgaaaaaca acccagaaca ggaagaggta gaccttagaa aaatctttca atctgagtta 600
ttcggcttag ctatgagaca agccttagga aaggatgttg aaagtttgta cgttgaagac 660
ctgaaaatca ctatgaatag agacgaaatc tttcaagtcc ttgttgttga tccaatgatg 720
ggagcaatcg atgttgattg gagagacttc tttccatacc taaagtgggt cccaaacaaa 780
aagttcgaaa atactattca acaaatgtac atcagaagag aagctgttat gaaatcttta 840
atcaaagagc acaaaaagag aatagcgtca ggcgaaaagc taaatagtta tatcgattac 900
cttttatctg aagctcaaac tttaaccgat cagcaactat tgatgtcctt gtgggaacca 960
atcattgaat cttcagatac aacaatggtc acaacagaat gggcaatgta cgaattagct 1020
aaaaacccta aattgcaaga taggttgtac agagacatta agtccgtctg tggatctgaa 1080
aagataaccg aagagcatct atcacagctg ccttacatta cagctatttt ccacgaaaca 1140
ctgagaagac actcaccagt tcctatcatt cctctaagac atgtacatga agataccgtt 1200
ctaggcggct accatgttcc tgctggcaca gaacttgccg ttaacatcta cggttgcaac 1260
atggacaaaa acgtttggga aaatccagag gaatggaacc cagaaagatt catgaaagag 1320
aatgagacaa ttgattttca aaagacgatg gccttcggtg gtggtaagag agtttgtgct 1380
ggttccttgc aagccctttt aactgcatct attgggattg ggagaatggt tcaagagttc 1440
gaatggaaac tgaaggatat gactcaagag gaagtgaaca cgataggcct aactacacaa 1500
atgttaagac cattgagagc tattatcaaa cctaggatct aa 1542
<210> 98
<211> 2139
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized nucleotide seqeunce encoding A. thaliana ATR2
<400> 98
atgtcttcct cttcctcttc cagtacctct atgattgatt tgatggctgc tattattaaa 60
ggtgaaccag ttatcgtctc cgacccagca aatgcctctg cttatgaatc agttgctgca 120
gaattgtctt caatgttgat cgaaaacaga caattcgcca tgatcgtaac tacatcaatc 180
gctgttttga tcggttgtat tgtcatgttg gtatggagaa gatccggtag tggtaattct 240
aaaagagtcg aacctttgaa accattagta attaagccaa gagaagaaga aatagatgac 300
ggtagaaaga aagttacaat atttttcggt acccaaactg gtacagctga aggttttgca 360
aaagccttag gtgaagaagc taaggcaaga tacgaaaaga ctagattcaa gatagtcgat 420
ttggatgact atgccgctga tgacgatgaa tacgaagaaa agttgaagaa agaagatgtt 480
gcatttttct ttttggcaac ctatggtgac ggtgaaccaa ctgacaatgc agccagattc 540
tacaaatggt ttacagaggg taatgatcgt ggtgaatggt tgaaaaactt aaagtacggt 600
gttttcggtt tgggtaacag acaatacgaa catttcaaca aagttgcaaa ggttgtcgac 660
gatattttgg tcgaacaagg tgctcaaaga ttagtccaag taggtttggg tgacgatgac 720
caatgtatag aagatgactt tactgcctgg agagaagctt tgtggcctga attagacaca 780
atcttgagag aagaaggtga caccgccgtt gctaccccat atactgctgc agtattagaa 840
tacagagttt ccatccatga tagtgaagac gcaaagttta atgatatcac tttggccaat 900
ggtaacggtt atacagtttt cgatgcacaa cacccttaca aagctaacgt tgcagtcaag 960
agagaattac atacaccaga atccgacaga agttgtatac acttggaatt tgatatcgct 1020
ggttccggtt taaccatgaa gttgggtgac catgtaggtg ttttatgcga caatttgtct 1080
gaaactgttg atgaagcatt gagattgttg gatatgtccc ctgacactta ttttagtttg 1140
cacgctgaaa aagaagatgg tacaccaatt tccagttctt taccacctcc attccctcca 1200
tgtaacttaa gaacagcctt gaccagatac gcttgcttgt tatcatcccc taaaaagtcc 1260
gccttggttg ctttagccgc tcatgctagt gatcctactg aagcagaaag attgaaacac 1320
ttagcatctc cagccggtaa agatgaatat tcaaagtggg tagttgaatc tcaaagatca 1380
ttgttagaag ttatggcaga atttccatct gccaagcctc cattaggtgt cttctttgct 1440
ggtgtagcac ctagattgca accaagattc tactcaatca gttcttcacc taagatcgct 1500
gaaactagaa ttcatgttac atgtgcatta gtctacgaaa agatgccaac cggtagaatt 1560
cacaagggtg tatgctctac ttggatgaaa aatgctgttc cttacgaaaa atcagaaaag 1620
ttgttcttag gtagaccaat cttcgtaaga caatcaaact tcaagttgcc ttctgattca 1680
aaggttccaa taatcatgat aggtcctggt acaggtttag ccccattcag aggtttcttg 1740
caagaaagat tggctttagt tgaatctggt gtcgaattag gtccttcagt tttgttcttt 1800
ggttgtagaa acagaagaat ggatttcatc tatgaagaag aattgcaaag attcgtcgaa 1860
tctggtgcat tggccgaatt atctgtagct ttttcaagag aaggtccaac taaggaatac 1920
gttcaacata agatgatgga taaggcatcc gacatatgga acatgatcag tcaaggtgct 1980
tatttgtacg tttgcggtga cgcaaagggt atggccagag atgtccatag atctttgcac 2040
acaattgctc aagaacaagg ttccatggat agtaccaaag ctgaaggttt cgtaaagaac 2100
ttacaaactt ccggtagata cttgagagat gtctggtga 2139
<210> 99
<211> 1555
<212> DNA
<213> Stevia rebaudiana
<400> 99
atggcggaac aacaaaagat caagaaatca ccacacgttc tactcatccc attcccttta 60
caaggccata taaacccttt catccagttt ggcaaacgat taatctccaa aggtgtcaaa 120
acaacacttg ttaccaccat ccacacctta aactcaaccc taaaccacag taacaccacc 180
accacctcca tcgaaatcca agcaatttcc gatggttgtg atgaaggcgg ttttatgagt 240
gcaggagaat catatttgga aacattcaaa caagttgggt ctaaatcact agctgactta 300
atcaagaagc ttcaaagtga aggaaccaca attgatgcaa tcatttatga ttctatgact 360
gaatgggttt tagatgttgc aattgagttt ggaatcgatg gtggttcgtt tttcactcaa 420
gcttgtgttg taaacagctt atattatcat gttcataagg gtttgatttc tttgccattg 480
ggtgaaactg tttcggttcc tggatttcca gtgcttcaac ggtgggagac accgttaatt 540
ttgcagaatc atgagcaaat acagagccct tggtctcaga tgttgtttgg tcagtttgct 600
aatattgatc aagcacgttg ggtcttcaca aatagttttt acaagctcga ggaagaggta 660
atagagtgga cgagaaagat atggaacttg aaggtaatcg ggccaacact tccatccatg 720
taccttgaca aacgacttga tgatgataaa gataacggat ttaatctcta caaagcaaac 780
catcatgagt gcatgaactg gttagacgat aagccaaagg aatcagttgt ttacgtagca 840
tttggtagcc tggtgaaaca tggacccgaa caagtggaag aaatcacacg ggctttaata 900
gatagtgatg tcaacttctt gtgggttatc aaacataaag aagagggaaa gctcccagaa 960
aatctttcgg aagtaataaa aaccggaaag ggtttgattg tagcatggtg caaacaattg 1020
gatgtgttag cacacgaatc agtaggatgc tttgttacac attgtgggtt caactcaact 1080
cttgaagcaa taagtcttgg agtccccgtt gttgcaatgc ctcaattttc ggatcaaact 1140
acaaatgcca agcttctaga tgaaattttg ggtgttggag ttagagttaa ggctgatgag 1200
aatgggatag tgagaagagg aaatcttgcg tcatgtatta agatgattat ggaggaggaa 1260
agaggagtaa taatccgaaa gaatgcggta aaatggaagg atttggctaa agtagccgtt 1320
catgaaggtg gtagctcaga caatgatatt gtcgaatttg taagtgagct aattaaggct 1380
taaatttttg ttgctttgta ttttatgtgt tatggttttt tgatttagat gtattcaatt 1440
aatattgaat cataactaaa ttcaagatta ttgtttgtaa tattctttgt cctaaaattt 1500
tgcgacttaa aacctttagt ttataaaaag aaattagaaa atactattgc acgga 1555
<210> 100
<211> 1377
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon-optimized S. rebaudiana UGT76G1
<400> 100
atggaaaaca agaccgaaac aacagttaga cgtaggcgta gaatcattct gtttccagta 60
ccttttcaag ggcacatcaa tccaatacta caactagcca acgttttgta ctctaaaggt 120
ttttctatta caatctttca caccaatttc aacaaaccaa aaacatccaa ttacccacat 180
ttcacattca gattcatact tgataatgat ccacaagatg aacgtatttc aaacttacct 240
acccacggtc ctttagctgg aatgagaatt ccaatcatca atgaacatgg tgccgatgag 300
cttagaagag aattagagtt acttatgttg gcatccgaag aggacgagga agtctcttgt 360
ctgattactg acgctctatg gtactttgcc caatctgtgg ctgatagttt gaatttgagg 420
agattggtac taatgacatc cagtctgttt aactttcacg ctcatgttag tttaccacaa 480
tttgacgaat tgggatactt ggaccctgat gacaagacta ggttagagga acaggcctct 540
ggttttccta tgttgaaagt caaagatatc aagtctgcct attctaattg gcaaatcttg 600
aaagagatct taggaaagat gatcaaacag acaaaggctt catctggagt gatttggaac 660
agtttcaaag agttagaaga gtctgaattg gagactgtaa tcagagaaat tccagcacct 720
tcattcctga taccattacc aaaacatttg actgcttcct cttcctcttt gttggatcat 780
gacagaacag tttttcaatg gttggaccaa caaccaccta gttctgtttt gtacgtgtca 840
tttggtagta cttctgaagt cgatgaaaag gacttccttg aaatcgcaag aggcttagtc 900
gatagtaagc agtcattcct ttgggtcgtg cgtccaggtt tcgtgaaagg ctcaacatgg 960
gtcgaaccac ttccagatgg ttttctaggc gaaagaggta gaatagtcaa atgggttcct 1020
caacaggaag ttttagctca tggcgctatt ggggcattct ggactcattc cggatggaat 1080
tcaactttag aatcagtatg cgaaggggta cctatgatct tttcagattt tggtcttgat 1140
caaccactga acgcaagata catgtctgat gttttgaaag tgggtgtata tctagaaaat 1200
ggctgggaaa ggggtgaaat agctaatgca ataagacgtg ttatggttga tgaagagggg 1260
gagtatatca gacaaaacgc aagagtgctg aagcaaaagg ccgacgtttc tctaatgaag 1320
ggaggctctt catacgaatc cttagaatct cttgtttcct acatttcatc actgtaa 1377
<210> 101
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon-optimized nucleotide sequence encoding S. rebaudiana
UGT91D2e-b
<400> 101
atggctactt ctgattccat cgttgacgat agaaagcaat tgcatgttgc tacttttcca 60
tggttggctt tcggtcatat tttgccatac ttgcaattgt ccaagttgat tgctgaaaag 120
ggtcacaagg tttcattctt gtctaccacc agaaacatcc aaagattgtc ctctcatatc 180
tccccattga tcaacgttgt tcaattgact ttgccaagag tccaagaatt gccagaagat 240
gctgaagcta ctactgatgt tcatccagaa gatatccctt acttgaaaaa ggcttccgat 300
ggtttacaac cagaagttac tagattcttg gaacaacatt ccccagattg gatcatctac 360
gattatactc attactggtt gccatccatt gctgcttcat tgggtatttc tagagcccat 420
ttctctgtta ctactccatg ggctattgct tatatgggtc catctgctga tgctatgatt 480
aacggttctg atggtagaac taccgttgaa gatttgacta ctccaccaaa gtggtttcca 540
tttccaacaa aagtctgttg gagaaaacac gatttggcta gattggttcc atacaaagct 600
ccaggtattt ctgatggtta cagaatgggt atggttttga aaggttccga ttgcttgttg 660
tctaagtgct atcatgaatt cggtactcaa tggttgcctt tgttggaaac attgcatcaa 720
gttccagttg ttccagtagg tttgttgcca ccagaaattc caggtgacga aaaagacgaa 780
acttgggttt ccatcaaaaa gtggttggat ggtaagcaaa agggttctgt tgtttatgtt 840
gctttgggtt ccgaagcttt ggtttctcaa accgaagttg ttgaattggc tttgggtttg 900
gaattgtctg gtttgccatt tgtttgggct tacagaaaac ctaaaggtcc agctaagtct 960
gattctgttg aattgccaga tggtttcgtt gaaagaacta gagatagagg tttggtttgg 1020
acttcttggg ctccacaatt gagaattttg tctcatgaat ccgtctgtgg tttcttgact 1080
cattgtggtt ctggttctat cgttgaaggt ttgatgtttg gtcacccatt gattatgttg 1140
ccaatctttg gtgaccaacc attgaacgct agattattgg aagataagca agtcggtatc 1200
gaaatcccaa gaaatgaaga agatggttgc ttgaccaaag aatctgttgc tagatctttg 1260
agatccgttg tcgttgaaaa agaaggtgaa atctacaagg ctaacgctag agaattgtcc 1320
aagatctaca acgataccaa ggtcgaaaaa gaatacgttt cccaattcgt tgactacttg 1380
gaaaagaatg ctagagctgt tgccattgat catgaatctt ga 1422
<210> 102
<211> 2343
<212> DNA
<213> Artificial Sequence
<220>
<223> Truncated CDPS from Zea mays
<400> 102
atggcacagc acacatcaga atccgcagct gtcgcaaagg gcagcagttt gacccctata 60
gtgagaactg acgctgagtc aaggagaaca agatggccaa ccgatgacga tgacgccgaa 120
cctttagtgg atgagatcag ggcaatgctt acttccatgt ctgatggtga catttccgtg 180
agcgcatacg atacagcctg ggtcggattg gttccaagat tagacggcgg tgaaggtcct 240
caatttccag cagctgtgag atggataaga aataaccagt tgcctgacgg aagttggggc 300
gatgccgcat tattctctgc ctatgacagg cttatcaata cccttgcctg cgttgtaact 360
ttgacaaggt ggtccctaga accagagatg agaggtagag gactatcttt tttgggtagg 420
aacatgtgga aattagcaac tgaagatgaa gagtcaatgc ctattggctt cgaattagca 480
tttccatctt tgatagagct tgctaagagc ctaggtgtcc atgacttccc ttatgatcac 540
caggccctac aaggaatcta ctcttcaaga gagatcaaaa tgaagaggat tccaaaagaa 600
gtgatgcata ccgttccaac atcaatattg cacagtttgg agggtatgcc tggcctagat 660
tgggctaaac tacttaaact acagagcagc gacggaagtt ttttgttctc accagctgcc 720
actgcatatg ctttaatgaa taccggagat gacaggtgtt ttagctacat cgatagaaca 780
gtaaagaaat tcaacggcgg cgtccctaat gtttatccag tggatctatt tgaacatatt 840
tgggccgttg atagacttga aagattagga atctccaggt acttccaaaa ggagatcgaa 900
caatgcatgg attatgtaaa caggcattgg actgaggacg gtatttgttg ggcaaggaac 960
tctgatgtca aagaggtgga cgacacagct atggccttta gacttcttag gttgcacggc 1020
tacagcgtca gtcctgatgt gtttaaaaac ttcgaaaagg acggtgaatt tttcgcattt 1080
gtcggacagt ctaatcaagc tgttaccggt atgtacaact taaacagagc aagccagata 1140
tccttcccag gcgaggatgt gcttcataga gctggtgcct tctcatatga gttcttgagg 1200
agaaaagaag cagagggagc tttgagggac aagtggatca tttctaaaga tctacctggt 1260
gaagttgtgt atactttgga ttttccatgg tacggcaact tacctagagt cgaggccaga 1320
gactacctag agcaatacgg aggtggtgat gacgtttgga ttggcaagac attgtatagg 1380
atgccacttg taaacaatga tgtatatttg gaattggcaa gaatggattt caaccactgc 1440
caggctttgc atcagttaga gtggcaagga ctaaaaagat ggtatactga aaataggttg 1500
atggactttg gtgtcgccca agaagatgcc cttagagctt attttcttgc agccgcatct 1560
gtttacgagc cttgtagagc tgccgagagg cttgcatggg ctagagccgc aatactagct 1620
aacgccgtga gcacccactt aagaaatagc ccatcattca gagaaaggtt agagcattct 1680
cttaggtgta gacctagtga agagacagat ggctcctggt ttaactcctc aagtggctct 1740
gatgcagttt tagtaaaggc tgtcttaaga cttactgatt cattagccag ggaagcacag 1800
ccaatccatg gaggtgaccc agaagatatt atacacaagt tgttaagatc tgcttgggcc 1860
gagtgggtta gggaaaaggc agacgctgcc gatagcgtgt gcaatggtag ttctgcagta 1920
gaacaagagg gatcaagaat ggtccatgat aaacagacct gtctattatt ggctagaatg 1980
atcgaaattt ctgccggtag ggcagctggt gaagcagcca gtgaggacgg cgatagaaga 2040
ataattcaat taacaggctc catctgcgac agtcttaagc aaaaaatgct agtttcacag 2100
gaccctgaaa aaaatgaaga gatgatgtct cacgtggatg acgaattgaa gttgaggatt 2160
agagagttcg ttcaatattt gcttagacta ggtgaaaaaa agactggatc tagcgaaacc 2220
aggcaaacat ttttaagtat agtgaaatca tgttactatg ctgctcattg cccacctcat 2280
gtcgttgata gacacattag tagagtgatt ttcgagccag taagtgccgc aaagtaaccg 2340
cgg 2343
<210> 103
<211> 1068
<212> PRT
<213> Saccharomyces cerevisiae
<400> 103
Met Arg Gly Leu Thr Pro Lys Asn Gly Val His Ile Glu Thr Gly Pro
1 5 10 15
Asp Thr Glu Ser Ser Ala Asp Ser Ser Asn Phe Ser Thr Gly Phe Ser
20 25 30
Gly Lys Ile Arg Lys Pro Arg Ser Lys Val Ser Lys Ala Cys Asp Asn
35 40 45
Cys Arg Lys Arg Lys Ile Lys Cys Asn Gly Lys Phe Pro Cys Ala Ser
50 55 60
Cys Glu Ile Tyr Ser Cys Glu Cys Thr Phe Ser Thr Arg Gln Gly Gly
65 70 75 80
Ala Arg Ile Lys Asn Leu His Lys Thr Ser Leu Glu Gly Thr Thr Val
85 90 95
Gln Val Lys Glu Glu Thr Asp Ser Ser Ser Thr Ser Phe Ser Asn Pro
100 105 110
Gln Arg Cys Thr Asp Gly Pro Cys Ala Val Glu Gln Pro Thr Lys Phe
115 120 125
Phe Glu Asn Phe Lys Leu Gly Gly Arg Ser Ser Gly Asp Asn Ser Gly
130 135 140
Ser Asp Gly Lys Asn Asp Asp Asp Val Asn Arg Asn Gly Phe Tyr Glu
145 150 155 160
Asp Asp Ser Glu Ser Gln Ala Thr Leu Thr Ser Leu Gln Thr Thr Leu
165 170 175
Lys Asn Leu Lys Glu Met Ala His Leu Gly Thr His Val Thr Ser Ala
180 185 190
Ile Glu Ser Ile Glu Leu Gln Ile Ser Asp Leu Leu Lys Arg Trp Glu
195 200 205
Pro Lys Val Arg Thr Lys Glu Leu Ala Thr Thr Lys Phe Tyr Pro Asn
210 215 220
Lys Ser Ile Glu Thr Gln Leu Met Lys Asn Lys Tyr Cys Asp Val Val
225 230 235 240
His Leu Thr Arg Tyr Ala Ala Trp Ser Asn Asn Lys Lys Asp Gln Asp
245 250 255
Thr Ser Ser Gln Pro Leu Ile Asp Glu Ile Phe Gly Leu Tyr Ser Pro
260 265 270
Phe Gln Phe Leu Ser Leu Gln Gly Ile Gly Lys Cys Phe Gln Asn Tyr
275 280 285
Arg Ser Lys Ser Lys Cys Glu Ile Phe Pro Arg Thr Ala Lys Glu Thr
290 295 300
Ile Tyr Ile Met Leu Arg Phe Phe Asp Val Cys Phe His His Ile Asn
305 310 315 320
Gln Gly Cys Val Ser Ile Ala Asn Pro Leu Glu Asn Tyr Leu Gln Lys
325 330 335
Met Asn Leu Leu Pro Ser Thr Pro Ser Ser Ile Ser Ser Ala Gly Ser
340 345 350
Pro Asn Thr Ala His Thr Lys Ser His Val Ala Leu Val Ile Asn His
355 360 365
Leu Pro Gln Pro Phe Val Arg Asn Ile Thr Gly Ile Ser Asn Ser Glu
370 375 380
Leu Leu Ser Glu Met Asn Asn Asp Ile Ser Met Phe Gly Ile Leu Leu
385 390 395 400
Lys Met Leu Asp Met His Lys Asn Ser Tyr Gln Asn Phe Leu Met Glu
405 410 415
Ile Thr Ser Asn Pro Ser Val Ala Lys Asn Thr Gln Ser Ile Asp Val
420 425 430
Leu Gln Glu Phe Ile His Tyr Cys Gln Ala Gly Glu Ala Leu Ile Ala
435 440 445
Leu Cys Tyr Ser Tyr Tyr Asn Ser Thr Leu Tyr Asn Tyr Val Asp Phe
450 455 460
Thr Cys Asp Ile Thr His Leu Glu Gln Leu Leu Tyr Phe Leu Asp Leu
465 470 475 480
Leu Phe Trp Leu Ser Glu Ile Tyr Gly Phe Glu Lys Val Leu Asn Val
485 490 495
Ala Val His Phe Val Ser Arg Val Gly Leu Ser Arg Trp Glu Phe Tyr
500 505 510
Val Gly Leu Asp Glu Asn Phe Ala Glu Arg Arg Arg Asn Leu Trp Trp
515 520 525
Lys Ala Phe Tyr Phe Glu Lys Thr Leu Ala Ser Lys Leu Gly Tyr Pro
530 535 540
Ser Asn Ile Asp Asp Ser Lys Ile Asn Cys Leu Leu Pro Lys Asn Phe
545 550 555 560
Arg Asp Val Gly Phe Leu Asp Asn Arg Asp Phe Ile Glu Asn Val His
565 570 575
Leu Val Arg Arg Ser Glu Ala Phe Asp Asn Met Cys Ile Ser Asp Leu
580 585 590
Lys Tyr Tyr Gly Glu Leu Ala Val Leu Gln Ile Val Ser His Phe Ser
595 600 605
Ser Ser Val Leu Phe Asn Glu Lys Phe Thr Ser Ile Arg Asn Thr Ser
610 615 620
Lys Pro Ser Val Val Arg Glu Lys Leu Leu Phe Glu Val Leu Glu Ile
625 630 635 640
Phe Asn Glu Thr Glu Met Lys Tyr Asp Ala Ile Lys Glu Gln Thr Gly
645 650 655
Lys Leu Phe Asp Ile Ala Phe Ser Lys Asp Ser Thr Glu Leu Lys Val
660 665 670
Ser Arg Glu Asp Lys Ile Met Ala Ser Lys Phe Val Leu Phe Tyr Glu
675 680 685
His His Phe Cys Arg Met Val Asn Glu Ser Asp Asn Ile Val Ala Arg
690 695 700
Leu Cys Val His Arg Arg Pro Ser Ile Leu Ile Glu Asn Leu Lys Ile
705 710 715 720
Tyr Leu His Lys Ile Tyr Lys Ser Trp Thr Asp Met Asn Lys Ile Leu
725 730 735
Leu Asp Phe Asp Asn Asp Tyr Ser Val Tyr Arg Ser Phe Ala His Tyr
740 745 750
Ser Ile Ser Cys Ile Ile Leu Val Ser Gln Ala Phe Ser Val Ala Glu
755 760 765
Phe Ile Lys Val Asn Asp Val Val Asn Met Ile Arg Val Phe Lys Arg
770 775 780
Phe Leu Asp Ile Lys Ile Phe Ser Glu Asn Glu Thr Asn Glu His Val
785 790 795 800
Phe Asn Ser Gln Ser Phe Lys Asp Tyr Thr Arg Ala Phe Ser Phe Leu
805 810 815
Thr Ile Val Thr Arg Ile Met Leu Leu Ala Tyr Gly Glu Ser Ser Ser
820 825 830
Thr Asn Leu Asp Val Ile Ser Lys Tyr Ile Asp Glu Asn Ala Pro Asp
835 840 845
Leu Lys Gly Ile Ile Glu Leu Val Leu Asp Thr Asn Ser Cys Ala Tyr
850 855 860
Arg Phe Leu Leu Glu Pro Val Gln Lys Ser Gly Phe His Leu Thr Val
865 870 875 880
Ser Gln Met Leu Lys Asn Arg Lys Phe Gln Glu Pro Leu Met Ser Asn
885 890 895
Glu Asp Asn Lys Gln Met Lys His Asn Ser Gly Lys Asn Leu Asn Pro
900 905 910
Asp Leu Pro Ser Leu Lys Thr Gly Thr Ser Cys Leu Leu Asn Gly Ile
915 920 925
Glu Ser Pro Gln Leu Pro Phe Asn Gly Arg Ser Ala Pro Ser Pro Val
930 935 940
Arg Asn Asn Ser Leu Pro Glu Phe Ala Gln Leu Pro Ser Phe Arg Ser
945 950 955 960
Leu Ser Val Ser Asp Met Ile Asn Pro Asp Tyr Ala Gln Pro Thr Asn
965 970 975
Gly Gln Asn Asn Thr Gln Val Gln Ser Asn Lys Pro Ile Asn Ala Gln
980 985 990
Gln Gln Ile Pro Thr Ser Val Gln Val Pro Phe Met Asn Thr Asn Glu
995 1000 1005
Ile Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Lys Asn Asn Ile
1010 1015 1020
Asn Asn Ile Asn Asn Asn Asn Ser Asn Asn Phe Ser Ala Thr Ser
1025 1030 1035
Phe Asn Leu Gly Thr Leu Asp Glu Phe Val Asn Asn Gly Asp Leu
1040 1045 1050
Glu Asp Leu Tyr Ser Ile Leu Trp Ser Asp Val Tyr Pro Asp Ser
1055 1060 1065
<210> 104
<211> 976
<212> PRT
<213> Saccharomyces cerevisiae
<400> 104
Met Lys Val Lys Lys Ser Thr Arg Ser Lys Val Ser Thr Ala Cys Val
1 5 10 15
Asn Cys Arg Lys Arg Lys Ile Lys Cys Thr Gly Lys Tyr Pro Cys Thr
20 25 30
Asn Cys Ile Ser Tyr Asp Cys Thr Cys Val Phe Leu Lys Lys His Leu
35 40 45
Pro Gln Lys Glu Asp Ser Ser Gln Ser Leu Pro Thr Thr Ala Val Ala
50 55 60
Pro Pro Ser Ser His Ala Asn Val Glu Ala Ser Ala Asp Val Gln His
65 70 75 80
Leu Asp Thr Ala Ile Lys Leu Asp Asn Gln Tyr Tyr Phe Lys Leu Met
85 90 95
Asn Asp Leu Ile Gln Thr Pro Val Ser Pro Ser Ala Thr His Ala Pro
100 105 110
Asp Thr Ser Asn Asn Pro Thr Asn Asp Asn Asn Ile Leu Phe Lys Asp
115 120 125
Asp Ser Lys Tyr Gln Asn Gln Leu Val Thr Tyr Gln Asn Ile Leu Thr
130 135 140
Asn Leu Tyr Ala Leu Pro Pro Cys Asp Asp Thr Gln Leu Leu Ile Asp
145 150 155 160
Lys Thr Lys Ser Gln Leu Asn Asn Leu Ile Asn Ser Trp Asn Pro Glu
165 170 175
Ile Asn Tyr Pro Lys Leu Ser Ser Phe Ser Pro Arg Pro Gln Arg Ser
180 185 190
Ile Glu Thr Tyr Leu Leu Thr Asn Lys Tyr Arg Asn Lys Ile His Met
195 200 205
Thr Arg Phe Ser Phe Trp Thr Asp Gln Met Val Lys Ser Gln Ser Pro
210 215 220
Asp Ser Phe Leu Ala Thr Thr Pro Leu Val Asp Glu Val Phe Gly Leu
225 230 235 240
Phe Ser Pro Ile Gln Ala Phe Ser Leu Arg Gly Ile Gly Tyr Leu Ile
245 250 255
Lys Lys Asn Ile Glu Asn Thr Gly Ser Ser Met Leu Ile Asp Thr Lys
260 265 270
Glu Thr Ile Tyr Leu Ile Leu Arg Leu Phe Asp Leu Cys Tyr Glu His
275 280 285
Leu Ile Gln Gly Cys Ile Ser Ile Ser Asn Pro Leu Glu Asn Tyr Leu
290 295 300
Gln Lys Ile Lys Gln Thr Pro Thr Thr Thr Ala Ser Ala Ser Leu Pro
305 310 315 320
Thr Ser Pro Ala Pro Leu Ser Asn Asp Leu Val Ile Ser Val Ile His
325 330 335
Gln Leu Pro Gln Pro Phe Ile Gln Ser Ile Thr Gly Phe Thr Thr Thr
340 345 350
Gln Leu Ile Glu Asn Leu His Asp Ser Phe Ser Met Phe Arg Ile Val
355 360 365
Thr Gln Met Tyr Ala Gln His Arg Lys Arg Phe Ala Glu Phe Leu Asn
370 375 380
Gln Ala Phe Ser Leu Pro His Gln Glu Lys Ser Val Leu Phe Ser Ser
385 390 395 400
Phe Cys Ser Ser Glu Tyr Leu Leu Ser Thr Leu Cys Tyr Ala Tyr Tyr
405 410 415
Asn Val Thr Leu Tyr His Met Leu Asp Ile Asn Thr Leu Asp Tyr Leu
420 425 430
Glu Ile Leu Val Ser Leu Leu Glu Ile Gln Asn Glu Ile Asp Glu Arg
435 440 445
Phe Gly Phe Glu Lys Met Leu Glu Val Ala Val Thr Cys Ser Thr Lys
450 455 460
Met Gly Leu Ser Arg Trp Glu Tyr Tyr Val Gly Ile Asp Glu Asn Thr
465 470 475 480
Ala Glu Arg Arg Arg Lys Ile Trp Trp Lys Ile Tyr Ser Leu Glu Lys
485 490 495
Arg Phe Leu Thr Asp Leu Gly Asp Leu Ser Leu Ile Asn Glu His Gln
500 505 510
Met Asn Cys Leu Leu Pro Lys Asp Phe Arg Asp Met Gly Phe Ile Asn
515 520 525
His Lys Glu Phe Leu Thr Lys Ile Gly Thr Ser Ser Leu Ser Pro Ser
530 535 540
Ser Pro Lys Leu Lys Asn Leu Ser Leu Ser Arg Leu Ile Glu Tyr Gly
545 550 555 560
Glu Leu Ala Ile Ala Gln Ile Val Gly Asp Phe Phe Ser Glu Thr Leu
565 570 575
Tyr Asn Glu Lys Phe Thr Ser Leu Glu Val Ser Val Lys Pro Thr Ile
580 585 590
Ile Arg Gln Lys Leu Leu Glu Lys Val Phe Glu Asp Ile Glu Ser Phe
595 600 605
Arg Leu Lys Leu Ala Lys Ile Lys Leu His Thr Ser Arg Val Phe Gln
610 615 620
Val Ala His Cys Lys Tyr Pro Glu Tyr Pro Lys Asn Asp Leu Ile Glu
625 630 635 640
Ala Ala Lys Phe Val Ser Tyr His Lys Asn Thr Trp Phe Ser Ile Leu
645 650 655
Gly Ala Val Asn Asn Leu Ile Ala Arg Leu Ser Glu Asp Pro Glu Val
660 665 670
Ile Thr Glu Gln Ser Met Lys Tyr Ala Asn Glu Met Phe Gln Glu Trp
675 680 685
Arg Glu Ile Asn Gln Phe Leu Ile Gln Val Asp Thr Asp Phe Ile Val
690 695 700
Trp Ala Cys Leu Asp Phe Tyr Glu Leu Ile Phe Phe Val Met Ala Ser
705 710 715 720
Lys Phe Tyr Val Glu Asp Pro His Ile Thr Leu Glu Asp Val Ile Asn
725 730 735
Thr Leu Lys Val Phe Lys Arg Ile Thr Asn Ile Ile Ser Phe Phe Asn
740 745 750
Asn Asn Leu Asp Glu Lys Asp Tyr Asp Cys Gln Thr Phe Arg Glu Phe
755 760 765
Ser Arg Ser Ser Ser Leu Val Ala Ile Ser Ile Arg Ile Ile Phe Leu
770 775 780
Lys Tyr Cys Tyr Ala Glu Gln Ile Asp Arg Ala Glu Phe Ile Glu Arg
785 790 795 800
Leu Lys Glu Val Glu Pro Gly Leu Ser Asp Leu Leu Arg Glu Phe Phe
805 810 815
Asp Thr Arg Ser Phe Ile Tyr Arg Tyr Met Leu Lys Ser Val Glu Lys
820 825 830
Ser Gly Phe His Leu Ile Ile Arg Lys Met Leu Glu Ser Asp Tyr Lys
835 840 845
Phe Leu Tyr Arg Asp Lys Leu Ala Thr Gly Asn Ile Pro Asp Gln Gly
850 855 860
Asn Ser Ser Gln Ile Ser Gln Leu Tyr Asp Ser Thr Ala Pro Ser Tyr
865 870 875 880
Asn Asn Ala Ser Ala Ser Ala Ala Asn Ser Pro Leu Lys Leu Ser Ser
885 890 895
Leu Leu Asn Ser Gly Glu Glu Ser Tyr Thr Gln Asp Ala Ser Glu Asn
900 905 910
Val Pro Cys Asn Leu Arg His Gln Asp Arg Ser Leu Gln Gln Thr Lys
915 920 925
Arg Gln His Ser Ala Pro Ser Gln Ile Ser Ala Asn Glu Asn Asn Ile
930 935 940
Tyr Asn Leu Gly Thr Leu Glu Glu Phe Val Ser Ser Gly Asp Leu Thr
945 950 955 960
Asp Leu Tyr His Thr Leu Trp Asn Asp Asn Thr Ser Tyr Pro Phe Leu
965 970 975
<210> 105
<211> 701
<212> PRT
<213> Saccharomyces cerevisiae
<400> 105
Met Asp Gly Ser His Phe Pro Met Lys Ser Thr Thr Gly Glu Pro Val
1 5 10 15
Ser Ser Gly Lys Lys Gly Lys Arg Arg Lys Val Ile Lys Ser Cys Ala
20 25 30
Phe Cys Arg Lys Arg Lys Leu Lys Cys Ser Gln Ala Arg Pro Met Cys
35 40 45
Gln Gln Cys Val Ile Arg Lys Leu Pro Gln Cys Val Tyr Thr Glu Glu
50 55 60
Phe Asn Tyr Pro Leu Ser Asn Thr Glu Leu Phe Glu Gln Val Pro Asn
65 70 75 80
Val Ala Leu Val Gln Lys Ile Glu Asn Leu Gln Thr Leu Leu Lys Glu
85 90 95
Asn Asp Asn Asn Asn Ala Lys Pro Val Tyr Cys Arg Ser Ser Glu Asn
100 105 110
Pro Leu Arg Ser Leu Arg Thr Ser Val Leu Gly Asp Asn Gly Ser Arg
115 120 125
Tyr Val Phe Gly Pro Thr Ser Trp Lys Thr Leu Ser Leu Phe Glu Gln
130 135 140
Asn Lys Phe Gln Thr Glu Phe Gln Asn Leu Trp Lys Val Leu Lys Pro
145 150 155 160
Leu Pro Glu Cys Thr Lys Ser Gln Leu Asn Glu Asn Asp Val Val Ala
165 170 175
Asp Leu Pro Ser Phe Pro Gln Met Glu Ser Cys Ile Lys Ser Phe Phe
180 185 190
Ala Gly Pro Leu Phe Gly Ile Leu His Ile Phe Asn Gln Asp Asp Ile
195 200 205
Leu Ser Leu Leu Asp Arg Leu Phe Ile Arg Asp Thr Thr Asp Lys Asn
210 215 220
Leu Val Ile Leu Leu Asp Leu Gln Gly Asn Ala Lys Asp Lys Tyr Asn
225 230 235 240
Leu Gly Ile Val Leu Gln Ile Leu Cys Leu Gly Tyr Tyr Asn Gln Asp
245 250 255
Ile Pro Ser Ser Val Ser His Phe Leu His Thr Leu Ser Ala Ala Ser
260 265 270
Leu Ser Ser Ser Ser Ser Asn Phe Val Glu Lys Leu Gln Phe Phe Leu
275 280 285
Leu Ser Tyr Ile Ser Val Met Ile Asn Cys Thr Asp Gly Val Trp Asp
290 295 300
Ala Thr Gln Gly Val Asp Leu Ile Asn Glu Leu Cys Gln Gly Cys Ile
305 310 315 320
Ser Leu Gly Leu Asn Asp Ile Asp Lys Trp Tyr Leu Asn Glu Ser Glu
325 330 335
Glu Thr Lys Gln Asn Leu Arg Cys Ile Trp Phe Trp Ala Leu Phe Leu
340 345 350
Asp Val Ser Thr Ser Tyr Asp Ile Gly Asn Pro Pro Ser Ile Ser Asp
355 360 365
Asp Leu Leu Asp Leu Ser Ile Phe Thr Ala Gln Asn Phe Gln Ser Pro
370 375 380
Ser Ile Asp Phe Arg Arg Val Lys Leu Met His Asp Phe Leu Asp Val
385 390 395 400
Ser Arg Phe Thr Thr Arg Glu Ile His Lys Arg Glu Met Asn Glu Lys
405 410 415
Leu Thr Thr Phe Ser Leu Arg Leu Ile Glu Phe Ile Gln Ser Asn Phe
420 425 430
Ser Pro Ile Glu His Tyr Thr Asn Ser Val Tyr Tyr Ser Asp Ile Asp
435 440 445
Pro Phe Asp Ile Leu Ile Leu Ser Arg Ser Leu Ser Ile Val Ala Ser
450 455 460
Ile Tyr Asn Ile Glu Met Ile Ile Ala Gln Gln Ser Arg Ile Ile Asp
465 470 475 480
Lys Asn Arg Met Val Gln Phe Leu Leu Ile Ser Ile Ser Val Cys Val
485 490 495
Asn Thr Met Val Phe His Phe Lys Glu Pro Ile Asn Asp Gln Glu Asn
500 505 510
Val Leu Thr Glu Gly Leu Lys Leu Ser Ile Ile Leu Ile Asn Pro Leu
515 520 525
Leu Ile Arg Ile Val Ser Gln Val Tyr Ser Leu Ala Phe Asn Arg Leu
530 535 540
Ile Phe Arg Glu Lys Ala Phe Leu Phe Leu Ile Asp Leu Asp Thr Gly
545 550 555 560
Lys Lys Ile Gln Phe Ile Lys Tyr Glu Glu Glu Asn Phe Asp Glu Leu
565 570 575
Leu Thr Gly Phe Asp Val Arg Thr Asp Lys Phe Leu Ser Phe Ser Gly
580 585 590
Thr Ile Ile Arg Phe Tyr Glu Ile Ile Asp Ser Ile Phe Ala Val Asn
595 600 605
Glu Arg Asn Lys Arg Leu Leu Lys Ala Val Ser Asn Phe Tyr Gln Leu
610 615 620
Thr Ser Thr Leu Ala Phe Glu Arg Val Ser Arg Val Leu Phe Asp Lys
625 630 635 640
Ala Ser Gln Ala Arg Ile Glu Thr Glu Lys Ile Trp Leu Lys Lys Gly
645 650 655
Ile Asn Met Glu His Phe Ser Asp Leu Met Ile Glu Asp Phe Ile Asn
660 665 670
Asp Val Trp Lys Thr Phe Lys Glu Ile Ser Lys Asp Leu Trp Ser Ile
675 680 685
Asp Lys Lys Lys Phe Tyr Lys Gln Tyr His Phe Asp Leu
690 695 700
<210> 106
<211> 1511
<212> PRT
<213> Saccharomyces cerevisiae
<400> 106
Met Pro Glu Ala Lys Leu Asn Asn Asn Val Asn Asp Val Thr Ser Tyr
1 5 10 15
Ser Ser Ala Ser Ser Ser Thr Glu Asn Ala Ala Asp Leu His Asn Tyr
20 25 30
Asn Gly Phe Asp Glu His Thr Glu Ala Arg Ile Gln Lys Leu Ala Arg
35 40 45
Thr Leu Thr Ala Gln Ser Met Gln Asn Ser Thr Gln Ser Ala Pro Asn
50 55 60
Lys Ser Asp Ala Gln Ser Ile Phe Ser Ser Gly Val Glu Gly Val Asn
65 70 75 80
Pro Ile Phe Ser Asp Pro Glu Ala Pro Gly Tyr Asp Pro Lys Leu Asp
85 90 95
Pro Asn Ser Glu Asn Phe Ser Ser Ala Ala Trp Val Lys Asn Met Ala
100 105 110
His Leu Ser Ala Ala Asp Pro Asp Phe Tyr Lys Pro Tyr Ser Leu Gly
115 120 125
Cys Ala Trp Lys Asn Leu Ser Ala Ser Gly Ala Ser Ala Asp Val Ala
130 135 140
Tyr Gln Ser Thr Val Val Asn Ile Pro Tyr Lys Ile Leu Lys Ser Gly
145 150 155 160
Leu Arg Lys Phe Gln Arg Ser Lys Glu Thr Asn Thr Phe Gln Ile Leu
165 170 175
Lys Pro Met Asp Gly Cys Leu Asn Pro Gly Glu Leu Leu Val Val Leu
180 185 190
Gly Arg Pro Gly Ser Gly Cys Thr Thr Leu Leu Lys Ser Ile Ser Ser
195 200 205
Asn Thr His Gly Phe Asp Leu Gly Ala Asp Thr Lys Ile Ser Tyr Ser
210 215 220
Gly Tyr Ser Gly Asp Asp Ile Lys Lys His Phe Arg Gly Glu Val Val
225 230 235 240
Tyr Asn Ala Glu Ala Asp Val His Leu Pro His Leu Thr Val Phe Glu
245 250 255
Thr Leu Val Thr Val Ala Arg Leu Lys Thr Pro Gln Asn Arg Ile Lys
260 265 270
Gly Val Asp Arg Glu Ser Tyr Ala Asn His Leu Ala Glu Val Ala Met
275 280 285
Ala Thr Tyr Gly Leu Ser His Thr Arg Asn Thr Lys Val Gly Asn Asp
290 295 300
Ile Val Arg Gly Val Ser Gly Gly Glu Arg Lys Arg Val Ser Ile Ala
305 310 315 320
Glu Val Ser Ile Cys Gly Ser Lys Phe Gln Cys Trp Asp Asn Ala Thr
325 330 335
Arg Gly Leu Asp Ser Ala Thr Ala Leu Glu Phe Ile Arg Ala Leu Lys
340 345 350
Thr Gln Ala Asp Ile Ser Asn Thr Ser Ala Thr Val Ala Ile Tyr Gln
355 360 365
Cys Ser Gln Asp Ala Tyr Asp Leu Phe Asn Lys Val Cys Val Leu Asp
370 375 380
Asp Gly Tyr Gln Ile Tyr Tyr Gly Pro Ala Asp Lys Ala Lys Lys Tyr
385 390 395 400
Phe Glu Asp Met Gly Tyr Val Cys Pro Ser Arg Gln Thr Thr Ala Asp
405 410 415
Phe Leu Thr Ser Val Thr Ser Pro Ser Glu Arg Thr Leu Asn Lys Asp
420 425 430
Met Leu Lys Lys Gly Ile His Ile Pro Gln Thr Pro Lys Glu Met Asn
435 440 445
Asp Tyr Trp Val Lys Ser Pro Asn Tyr Lys Glu Leu Met Lys Glu Val
450 455 460
Asp Gln Arg Leu Leu Asn Asp Asp Glu Ala Ser Arg Glu Ala Ile Lys
465 470 475 480
Glu Ala His Ile Ala Lys Gln Ser Lys Arg Ala Arg Pro Ser Ser Pro
485 490 495
Tyr Thr Val Ser Tyr Met Met Gln Val Lys Tyr Leu Leu Ile Arg Asn
500 505 510
Met Trp Arg Leu Arg Asn Asn Ile Gly Phe Thr Leu Phe Met Ile Leu
515 520 525
Gly Asn Cys Ser Met Ala Leu Ile Leu Gly Ser Met Phe Phe Lys Ile
530 535 540
Met Lys Lys Gly Asp Thr Ser Thr Phe Tyr Phe Arg Gly Ser Ala Met
545 550 555 560
Phe Phe Ala Ile Leu Phe Asn Ala Phe Ser Ser Leu Leu Glu Ile Phe
565 570 575
Ser Leu Tyr Glu Ala Arg Pro Ile Thr Glu Lys His Arg Thr Tyr Ser
580 585 590
Leu Tyr His Pro Ser Ala Asp Ala Phe Ala Ser Val Leu Ser Glu Ile
595 600 605
Pro Ser Lys Leu Ile Ile Ala Val Cys Phe Asn Ile Ile Phe Tyr Phe
610 615 620
Leu Val Asp Phe Arg Arg Asn Gly Gly Val Phe Phe Phe Tyr Leu Leu
625 630 635 640
Ile Asn Ile Val Ala Val Phe Ser Met Ser His Leu Phe Arg Cys Val
645 650 655
Gly Ser Leu Thr Lys Thr Leu Ser Glu Ala Met Val Pro Ala Ser Met
660 665 670
Leu Leu Leu Ala Leu Ser Met Tyr Thr Gly Phe Ala Ile Pro Lys Lys
675 680 685
Lys Ile Leu Arg Trp Ser Lys Trp Ile Trp Tyr Ile Asn Pro Leu Ala
690 695 700
Tyr Leu Phe Glu Ser Leu Leu Ile Asn Glu Phe His Gly Ile Lys Phe
705 710 715 720
Pro Cys Ala Glu Tyr Val Pro Arg Gly Pro Ala Tyr Ala Asn Ile Ser
725 730 735
Ser Thr Glu Ser Val Cys Thr Val Val Gly Ala Val Pro Gly Gln Asp
740 745 750
Tyr Val Leu Gly Asp Asp Phe Ile Arg Gly Thr Tyr Gln Tyr Tyr His
755 760 765
Lys Asp Lys Trp Arg Gly Phe Gly Ile Gly Met Ala Tyr Val Val Phe
770 775 780
Phe Phe Phe Val Tyr Leu Phe Leu Cys Glu Tyr Asn Glu Gly Ala Lys
785 790 795 800
Gln Lys Gly Glu Ile Leu Val Phe Pro Arg Ser Ile Val Lys Arg Met
805 810 815
Lys Lys Arg Gly Val Leu Thr Glu Lys Asn Ala Asn Asp Pro Glu Asn
820 825 830
Val Gly Glu Arg Ser Asp Leu Ser Ser Asp Arg Lys Met Leu Gln Glu
835 840 845
Ser Ser Glu Glu Glu Ser Asp Thr Tyr Gly Glu Ile Gly Leu Ser Lys
850 855 860
Ser Glu Ala Ile Phe His Trp Arg Asn Leu Cys Tyr Glu Val Gln Ile
865 870 875 880
Lys Ala Glu Thr Arg Arg Ile Leu Asn Asn Val Asp Gly Trp Val Lys
885 890 895
Pro Gly Thr Leu Thr Ala Leu Met Gly Ala Ser Gly Ala Gly Lys Thr
900 905 910
Thr Leu Leu Asp Cys Leu Ala Glu Arg Val Thr Met Gly Val Ile Thr
915 920 925
Gly Asp Ile Leu Val Asn Gly Ile Pro Arg Asp Lys Ser Phe Pro Arg
930 935 940
Ser Ile Gly Tyr Cys Gln Gln Gln Asp Leu His Leu Lys Thr Ala Thr
945 950 955 960
Val Arg Glu Ser Leu Arg Phe Ser Ala Tyr Leu Arg Gln Pro Ala Glu
965 970 975
Val Ser Ile Glu Glu Lys Asn Arg Tyr Val Glu Glu Val Ile Lys Ile
980 985 990
Leu Glu Met Glu Lys Tyr Ala Asp Ala Val Val Gly Val Ala Gly Glu
995 1000 1005
Gly Leu Asn Val Glu Gln Arg Lys Arg Leu Thr Ile Gly Val Glu
1010 1015 1020
Leu Thr Ala Lys Pro Lys Leu Leu Val Phe Leu Asp Glu Pro Thr
1025 1030 1035
Ser Gly Leu Asp Ser Gln Thr Ala Trp Ser Ile Cys Gln Leu Met
1040 1045 1050
Lys Lys Leu Ala Asn His Gly Gln Ala Ile Leu Cys Thr Ile His
1055 1060 1065
Gln Pro Ser Ala Ile Leu Met Gln Glu Phe Asp Arg Leu Leu Phe
1070 1075 1080
Met Gln Arg Gly Gly Lys Thr Val Tyr Phe Gly Asp Leu Gly Glu
1085 1090 1095
Gly Cys Lys Thr Met Ile Asp Tyr Phe Glu Ser His Gly Ala His
1100 1105 1110
Lys Cys Pro Ala Asp Ala Asn Pro Ala Glu Trp Met Leu Glu Val
1115 1120 1125
Val Gly Ala Ala Pro Gly Ser His Ala Asn Gln Asp Tyr Tyr Glu
1130 1135 1140
Val Trp Arg Asn Ser Glu Glu Tyr Arg Ala Val Gln Ser Glu Leu
1145 1150 1155
Asp Trp Met Glu Arg Glu Leu Pro Lys Lys Gly Ser Ile Thr Ala
1160 1165 1170
Ala Glu Asp Lys His Glu Phe Ser Gln Ser Ile Ile Tyr Gln Thr
1175 1180 1185
Lys Leu Val Ser Ile Arg Leu Phe Gln Gln Tyr Trp Arg Ser Pro
1190 1195 1200
Asp Tyr Leu Trp Ser Lys Phe Ile Leu Thr Ile Phe Asn Gln Leu
1205 1210 1215
Phe Ile Gly Phe Thr Phe Phe Lys Ala Gly Thr Ser Leu Gln Gly
1220 1225 1230
Leu Gln Asn Gln Met Leu Ala Val Phe Met Phe Thr Val Ile Phe
1235 1240 1245
Asn Pro Ile Leu Gln Gln Tyr Leu Pro Ser Phe Val Gln Gln Arg
1250 1255 1260
Asp Leu Tyr Glu Ala Arg Glu Arg Pro Ser Arg Thr Phe Ser Trp
1265 1270 1275
Ile Ser Phe Ile Phe Ala Gln Ile Phe Val Glu Val Pro Trp Asn
1280 1285 1290
Ile Leu Ala Gly Thr Ile Ala Tyr Phe Ile Tyr Tyr Tyr Pro Ile
1295 1300 1305
Gly Phe Tyr Ser Asn Ala Ser Ala Ala Gly Gln Leu His Glu Arg
1310 1315 1320
Gly Ala Leu Phe Trp Leu Phe Ser Cys Ala Phe Tyr Val Tyr Val
1325 1330 1335
Gly Ser Met Gly Leu Leu Val Ile Ser Phe Asn Gln Val Ala Glu
1340 1345 1350
Ser Ala Ala Asn Leu Ala Ser Leu Leu Phe Thr Met Ser Leu Ser
1355 1360 1365
Phe Cys Gly Val Met Thr Thr Pro Ser Ala Met Pro Arg Phe Trp
1370 1375 1380
Ile Phe Met Tyr Arg Val Ser Pro Leu Thr Tyr Phe Ile Gln Ala
1385 1390 1395
Leu Leu Ala Val Gly Val Ala Asn Val Asp Val Lys Cys Ala Asp
1400 1405 1410
Tyr Glu Leu Leu Glu Phe Thr Pro Pro Ser Gly Met Thr Cys Gly
1415 1420 1425
Gln Tyr Met Glu Pro Tyr Leu Gln Leu Ala Lys Thr Gly Tyr Leu
1430 1435 1440
Thr Asp Glu Asn Ala Thr Asp Thr Cys Ser Phe Cys Gln Ile Ser
1445 1450 1455
Thr Thr Asn Asp Tyr Leu Ala Asn Val Asn Ser Phe Tyr Ser Glu
1460 1465 1470
Arg Trp Arg Asn Tyr Gly Ile Phe Ile Cys Tyr Ile Ala Phe Asn
1475 1480 1485
Tyr Ile Ala Gly Val Phe Phe Tyr Trp Leu Ala Arg Val Pro Lys
1490 1495 1500
Lys Asn Gly Lys Leu Ser Lys Lys
1505 1510
<210> 107
<211> 1564
<212> PRT
<213> Saccharomyces cerevisiae
<400> 107
Met Leu Gln Ala Pro Ser Ser Ser Asn Ser Gly Leu Asn Gln Gly Asn
1 5 10 15
Ala Ala Pro Asp Gly Pro Pro Asn Glu Thr Gln Pro Tyr Glu Gly Leu
20 25 30
Asp Ala Ala Ala Gln Glu Glu Ile Lys Glu Leu Ala Arg Thr Leu Thr
35 40 45
Ser Gln Ser Ser Leu Leu Ser Gln Glu Lys Arg Ile Thr Gly Thr Gly
50 55 60
Asp Pro Asn Thr Leu Thr Ala Ala Ser Ser Ser Ser Leu Ser Arg Ser
65 70 75 80
Ile Phe Ala Ser Asp Ile Lys Gly Val Asn Pro Ile Leu Leu Asp Val
85 90 95
Asn Asp Pro Asp Tyr Asp Glu Thr Leu Asp Pro Arg Ser Glu Asn Phe
100 105 110
Ser Ser Val Arg Trp Val Arg Asn Met Ala Gln Ile Cys Glu Asn Asp
115 120 125
Ser Asp Phe Tyr Lys Pro Phe Ser Leu Gly Cys Ala Trp Lys Asp Leu
130 135 140
Ser Ala Ser Gly Asp Ser Ala Asp Ile Thr Tyr Gln Gly Thr Phe Gly
145 150 155 160
Asn Met Pro Ile Lys Tyr Leu Lys Met Ser Trp Arg Cys Ile Ser Arg
165 170 175
Arg Leu Phe His Arg Thr His Gly Lys Ser Glu Asp Asn Asp Ser Gly
180 185 190
Phe Gln Ile Leu Lys Pro Met Asp Gly Cys Ile Asn Pro Gly Glu Leu
195 200 205
Leu Val Val Leu Gly Arg Pro Gly Ala Gly Cys Thr Thr Leu Leu Lys
210 215 220
Ser Ile Ser Val Asn Thr His Gly Phe Lys Ile Ser Pro Asp Thr Ile
225 230 235 240
Ile Thr Tyr Asn Gly Phe Ser Asn Lys Glu Ile Lys Asn His Tyr Arg
245 250 255
Gly Glu Val Val Tyr Asn Ala Glu Ser Asp Ile His Ile Pro His Leu
260 265 270
Thr Val Phe Gln Thr Leu Tyr Thr Val Ala Arg Leu Lys Thr Pro Arg
275 280 285
Asn Arg Ile Lys Gly Val Asp Arg Asp Thr Phe Ala Lys His Met Thr
290 295 300
Glu Val Ala Met Ala Thr Tyr Gly Leu Ser His Thr Ala Asp Thr Lys
305 310 315 320
Val Gly Asn Asp Phe Val Arg Gly Val Ser Gly Gly Glu Arg Lys Arg
325 330 335
Val Ser Ile Ala Glu Val Ser Ile Cys Gly Ser Lys Phe Gln Cys Trp
340 345 350
Asp Asn Ala Thr Arg Gly Leu Asp Ser Ala Thr Ala Leu Glu Phe Ile
355 360 365
Lys Ala Leu Lys Thr Gln Ala Thr Ile Thr Lys Ser Ala Ala Thr Val
370 375 380
Ala Ile Tyr Gln Cys Ser Lys Asp Ala Tyr Asp Leu Phe Asp Lys Val
385 390 395 400
Cys Val Leu Tyr Asp Gly Tyr Gln Ile Phe Phe Gly Pro Ser Lys Gln
405 410 415
Ala Lys Lys Tyr Phe Gln Arg Met Gly Tyr Val Cys Pro Glu Arg Gln
420 425 430
Thr Thr Ala Asp Tyr Leu Thr Ser Ile Thr Ser Pro Ser Glu Arg Ile
435 440 445
Lys Asp Lys Asp Met Val Lys His Gly Ile Met Ile Pro Gln Thr Ala
450 455 460
Tyr Glu Met Asn Gln Tyr Trp Ile Gln Ser Glu Glu Tyr Lys Gln Leu
465 470 475 480
Gln Val Gln Val Asn Lys His Leu Asp Thr Asp Ser Ser Gln Gln Arg
485 490 495
Glu Gln Ile Lys Asn Ala His Ile Ala Lys Gln Ser Lys Arg Ala Arg
500 505 510
Pro Ser Ser Pro Tyr Thr Val Ser Phe Phe Leu Gln Val Lys Tyr Ile
515 520 525
Leu Ile Arg Asp Ile Trp Arg Ile Lys Asn Asp Pro Ser Ile Gln Leu
530 535 540
Phe Thr Val Leu Ser His Ala Ala Met Ala Leu Ile Leu Gly Ser Met
545 550 555 560
Phe Tyr Glu Val Met Leu Ser Thr Thr Thr Thr Thr Phe Tyr Tyr Arg
565 570 575
Gly Ala Ala Ile Phe Phe Ala Ile Leu Phe Asn Ala Phe Ser Ser Leu
580 585 590
Leu Glu Ile Phe Ser Leu Tyr Glu Thr Arg Pro Ile Thr Glu Lys His
595 600 605
Lys Thr Tyr Ser Leu Tyr Arg Pro Ser Ala Asp Ala Phe Ala Ser Thr
610 615 620
Phe Ser Asp Val Pro Thr Lys Leu Ala Thr Ala Val Thr Phe Asn Ile
625 630 635 640
Pro Tyr Tyr Phe Leu Ile Asn Leu Lys Arg Asp Ala Gly Ala Phe Phe
645 650 655
Phe Tyr Phe Leu Ile Asn Ile Ile Thr Val Phe Ala Met Ser His Leu
660 665 670
Phe Arg Cys Ile Gly Ser Val Ser Lys Thr Leu Pro Gln Ala Met Val
675 680 685
Pro Ala Ser Val Leu Leu Leu Ala Phe Ala Met Tyr Thr Gly Phe Ala
690 695 700
Ile Pro Arg Val Gln Met Leu Gly Trp Ser Lys Trp Ile Ser Tyr Ile
705 710 715 720
Asn Pro Leu Ser Tyr Leu Phe Glu Ser Leu Met Ile Asn Glu Phe His
725 730 735
Gly Arg Asn Phe Pro Cys Ala Gln Tyr Ile Pro Ser Gly Pro Asn Tyr
740 745 750
Val Asn Ala Thr Gly Asp Glu Val Thr Cys Ser Ala Leu Gly Ser Ile
755 760 765
Pro Gly Asn Asn Tyr Val Ser Gly Asp Asp Phe Ile Gln Thr Asn Tyr
770 775 780
Gly Tyr Arg His Lys Asn Lys Trp Arg Ser Val Gly Ile Gly Leu Ala
785 790 795 800
Tyr Ile Ile Phe Phe Leu Phe Leu Tyr Leu Phe Phe Cys Glu Tyr Asn
805 810 815
Glu Gly Ala Lys Gln Asn Gly Glu Met Leu Val Phe Pro His Ser Val
820 825 830
Val Lys Lys Met Lys Lys Lys Gly Ile Val Ser Glu Lys Lys Lys Lys
835 840 845
Asn Gln Pro Thr Leu Ser Thr Ser Asp Ala Glu Lys Asp Val Glu Met
850 855 860
Asn Asn Asn Ser Ser Ala Thr Asp Ser Arg Phe Leu Arg Asp Ser Asp
865 870 875 880
Ala Ala Ile Met Gly Asn Asp Lys Thr Val Ala Lys Glu His Tyr Ser
885 890 895
Ser Pro Ser Ser Ser Ala Ser Gln Ser Asn Ser Phe Ser Lys Ser Asp
900 905 910
Asp Ile Glu Leu Ser Lys Ser Gln Ala Ile Phe His Trp Lys Asn Leu
915 920 925
Cys Tyr Asp Ile Pro Ile Lys Asn Gly Lys Arg Arg Ile Leu Asp Asn
930 935 940
Val Asp Gly Trp Val Lys Pro Gly Thr Leu Thr Ala Leu Ile Gly Ala
945 950 955 960
Ser Gly Ala Gly Lys Thr Thr Leu Leu Asp Cys Leu Ala Glu Arg Thr
965 970 975
Thr Met Gly Leu Ile Thr Gly Asp Val Phe Val Asp Gly Arg Pro Arg
980 985 990
Asp Gln Ser Phe Pro Arg Ser Ile Gly Tyr Cys Gln Gln Gln Asp Leu
995 1000 1005
His Leu Lys Thr Ala Thr Val Arg Glu Ser Leu Arg Phe Ser Ala
1010 1015 1020
Tyr Leu Arg Gln Ala Asp Asp Val Ser Ile Glu Glu Lys Asp Lys
1025 1030 1035
Tyr Val Glu Glu Val Ile Glu Val Leu Glu Met Lys Leu Tyr Ala
1040 1045 1050
Asp Ala Ile Val Gly Val Pro Gly Glu Gly Leu Asn Val Glu Gln
1055 1060 1065
Arg Lys Arg Leu Thr Ile Gly Val Glu Leu Ala Ala Lys Pro Lys
1070 1075 1080
Leu Leu Val Phe Leu Asp Glu Pro Thr Ser Gly Leu Asp Ser Gln
1085 1090 1095
Thr Ala Trp Ser Thr Cys Gln Leu Met Lys Lys Leu Ala Ser Arg
1100 1105 1110
Gly Gln Ala Ile Leu Cys Thr Ile His Gln Pro Ser Ala Leu Leu
1115 1120 1125
Met Gln Glu Phe Asp Arg Leu Leu Phe Leu Gln Glu Gly Gly Gln
1130 1135 1140
Thr Val Tyr Phe Gly Glu Leu Gly Lys Gly Cys Lys Thr Met Ile
1145 1150 1155
Asn Tyr Phe Glu Ala His Gly Ala His Lys Cys Pro Pro Asp Ala
1160 1165 1170
Asn Pro Ala Glu Trp Met Leu Glu Ile Val Gly Ala Ala Pro Gly
1175 1180 1185
Thr His Ala Ser Gln Asp Tyr Phe Ala Ile Trp Arg Asp Ser Glu
1190 1195 1200
Glu Tyr Arg Glu Met Gln Lys Glu Leu Asp Trp Met Glu Arg Glu
1205 1210 1215
Leu Pro Lys Arg Thr Glu Gly Ser Ser Asn Glu Glu Gln Lys Glu
1220 1225 1230
Phe Ala Thr Ser Thr Leu Tyr Gln Ile Lys Leu Val Ser Tyr Arg
1235 1240 1245
Leu Phe His Gln Tyr Trp Arg Thr Pro Phe Tyr Leu Trp Ser Lys
1250 1255 1260
Phe Phe Ser Thr Ile Val Ser Glu Leu Phe Ile Gly Phe Thr Phe
1265 1270 1275
Phe Lys Ala Asn Thr Ser Leu Gln Gly Leu Gln Asn Gln Met Leu
1280 1285 1290
Ala Ile Phe Met Phe Thr Val Val Phe Asn Pro Ile Leu Gln Gln
1295 1300 1305
Tyr Leu Pro Leu Phe Val Gln Gln Arg Glu Leu Tyr Glu Ala Arg
1310 1315 1320
Glu Arg Pro Ser Arg Thr Phe Ser Trp Lys Ala Phe Ile Val Ser
1325 1330 1335
Gln Ile Leu Val Glu Ile Pro Trp Asn Leu Leu Ala Gly Thr Ile
1340 1345 1350
Ala Phe Phe Val Tyr Tyr Tyr Pro Val Gly Phe Tyr Arg Asn Ala
1355 1360 1365
Ser Tyr Ala Asn Gln Leu His Glu Arg Gly Ala Leu Phe Trp Leu
1370 1375 1380
Phe Ala Cys Ala Phe Tyr Val Tyr Ile Ser Ser Met Gly Val Leu
1385 1390 1395
Val Ile Ser Cys Ile Glu Ile Ala Glu Asn Ala Ala Asn Leu Ala
1400 1405 1410
Ser Leu Phe Phe Ile Met Ser Leu Ser Phe Cys Gly Val Leu Ala
1415 1420 1425
Thr Pro Asn Ile Leu Pro Arg Phe Trp Ile Phe Met Tyr Arg Val
1430 1435 1440
Ser Pro Leu Thr Tyr Leu Ile Asp Ala Leu Leu Ser Val Gly Leu
1445 1450 1455
Ala Asn Ala Ser Val Val Cys Ser Ser Asn Glu Leu Leu Lys Ile
1460 1465 1470
Val Pro Pro Ser Gly Met Thr Cys Ser Glu Tyr Met Glu Pro Tyr
1475 1480 1485
Met Gln Ser Thr Gly Thr Gly Tyr Leu Leu Asp Gly Ser Ser Glu
1490 1495 1500
Thr Glu Cys His Phe Cys Gln Phe Ser Ser Thr Asn Asp Tyr Leu
1505 1510 1515
Ala Thr Val Ser Ser Ser Tyr Ser Arg Arg Trp Met Asn Tyr Gly
1520 1525 1530
Ile Phe Ser Ala Tyr Ile Val Phe Asp Tyr Cys Ala Ala Ile Phe
1535 1540 1545
Leu Tyr Trp Leu Val Arg Val Pro Lys Lys Ser Lys Lys Leu Lys
1550 1555 1560
Lys
<210> 108
<211> 1411
<212> PRT
<213> Saccharomyces cerevisiae
<400> 108
Met Ser Leu Ser Lys Tyr Phe Asn Pro Ile Pro Asp Ala Ser Val Thr
1 5 10 15
Phe Asp Gly Ala Thr Val Gln Leu Glu Glu Ser Leu Gly Ala Val Gln
20 25 30
Asn Asp Glu Glu Ser Ala Ser Glu Phe Lys Asn Val Gly His Leu Glu
35 40 45
Ile Ser Asp Ile Thr Phe Arg Ala Asn Glu Gly Glu Val Val Leu Val
50 55 60
Leu Gly Asn Pro Thr Ser Ala Leu Phe Lys Gly Leu Phe His Gly His
65 70 75 80
Lys His Leu Lys Tyr Ser Pro Glu Gly Ser Ile Arg Phe Lys Asp Asn
85 90 95
Glu Tyr Lys Gln Phe Ala Ser Lys Cys Pro His Gln Ile Ile Tyr Asn
100 105 110
Asn Glu Gln Asp Ile His Phe Pro Tyr Leu Thr Val Glu Gln Thr Ile
115 120 125
Asp Phe Ala Leu Ser Cys Lys Phe His Ile Pro Lys Gln Glu Arg Ile
130 135 140
Glu Met Arg Asp Glu Leu Leu Lys Glu Phe Gly Leu Ser His Val Lys
145 150 155 160
Lys Thr Tyr Val Gly Asn Asp Tyr Val Arg Gly Val Ser Gly Gly Glu
165 170 175
Arg Lys Arg Ile Ser Ile Ile Glu Thr Phe Ile Ala Asn Gly Ser Val
180 185 190
Tyr Leu Trp Asp Asn Ser Thr Lys Gly Leu Asp Ser Ala Thr Ala Leu
195 200 205
Glu Phe Leu Ser Ile Thr Gln Lys Met Ala Lys Ala Thr Arg Ser Val
210 215 220
Asn Phe Val Lys Ile Ser Gln Ala Ser Asp Lys Ile Val Ser Lys Phe
225 230 235 240
Asp Lys Ile Leu Met Leu Gly Asp Ser Phe Gln Val Phe Tyr Gly Thr
245 250 255
Met Glu Glu Cys Leu Thr His Phe His Asp Thr Leu Gln Ile Lys Lys
260 265 270
Asn Pro Asn Asp Cys Ile Ile Glu Tyr Leu Thr Ser Ile Leu Asn Phe
275 280 285
Lys Phe Lys Glu Thr Ser Asn Ser Ile Val Gly Leu Asp Thr Pro Ser
290 295 300
Val Val Ser Glu Glu Asn Gln Ala Leu Asn Ile Asn Asn Glu Thr Asp
305 310 315 320
Leu His Thr Leu Trp Ile Gln Ser Pro Tyr Tyr Lys His Trp Lys Ala
325 330 335
Ile Thr Ser Lys Thr Val Gln Glu Cys Thr Arg Lys Asp Val Asn Pro
340 345 350
Asp Asp Ile Ser Pro Ile Phe Ser Ile Pro Leu Lys Thr Gln Leu Lys
355 360 365
Thr Cys Thr Val Arg Ala Phe Glu Arg Ile Ile Gly Asp Arg Asn Tyr
370 375 380
Leu Ile Ser Gln Phe Val Ser Val Val Val Gln Ser Leu Val Ile Gly
385 390 395 400
Ser Leu Phe Tyr Asn Ile Pro Leu Thr Thr Ile Gly Ser Phe Ser Arg
405 410 415
Gly Ser Leu Thr Phe Phe Ser Ile Leu Phe Phe Thr Phe Leu Ser Leu
420 425 430
Ala Asp Met Pro Ala Ser Phe Gln Arg Gln Pro Val Val Arg Lys His
435 440 445
Val Gln Leu His Phe Tyr Tyr Asn Trp Val Glu Thr Leu Ala Thr Asn
450 455 460
Phe Phe Asp Cys Cys Ser Lys Phe Ile Leu Val Val Ile Phe Thr Ile
465 470 475 480
Ile Leu Tyr Phe Leu Ala His Leu Gln Tyr Asn Ala Ala Arg Phe Phe
485 490 495
Ile Phe Leu Leu Phe Leu Ser Val Tyr Asn Phe Cys Met Val Ser Leu
500 505 510
Phe Ala Leu Thr Ala Leu Ile Ala Pro Thr Leu Ser Met Ala Asn Leu
515 520 525
Leu Ala Gly Ile Leu Leu Leu Ala Ile Ala Met Tyr Ala Ser Tyr Val
530 535 540
Ile Tyr Met Lys Asp Met His Pro Trp Phe Ile Trp Ile Ala Tyr Leu
545 550 555 560
Asn Pro Ala Met Phe Ala Met Glu Ala Ile Leu Ser Asn Glu Leu Phe
565 570 575
Asn Leu Lys Leu Asp Cys His Glu Ser Ile Ile Pro Arg Gly Glu Tyr
580 585 590
Tyr Asp Asn Ile Ser Phe Ser His Lys Ala Cys Ala Trp Gln Gly Ala
595 600 605
Thr Leu Gly Asn Asp Tyr Val Arg Gly Arg Asp Tyr Leu Lys Ser Gly
610 615 620
Leu Lys Tyr Thr Tyr His His Val Trp Arg Asn Phe Gly Ile Ile Ile
625 630 635 640
Gly Phe Leu Cys Phe Phe Leu Phe Cys Ser Leu Leu Ala Ala Glu Tyr
645 650 655
Ile Thr Pro Leu Phe Thr Arg Glu Asn Leu Leu Arg Trp Asn Asn Tyr
660 665 670
Leu Lys Arg Tyr Cys Pro Phe Leu Asn Ser Gln Lys Lys Asn Asn Lys
675 680 685
Ser Ala Ile Thr Asn Asn Asp Gly Val Cys Thr Pro Lys Thr Pro Ile
690 695 700
Ala Asn Phe Ser Thr Ser Ser Ser Ser Val Pro Ser Val Ser His Gln
705 710 715 720
Tyr Asp Thr Asp Tyr Asn Ile Lys His Pro Asp Glu Thr Val Asn Asn
725 730 735
His Thr Lys Glu Ser Val Ala Met Glu Thr Gln Lys His Val Ile Ser
740 745 750
Trp Lys Asn Ile Asn Tyr Thr Ile Gly Asp Lys Lys Leu Ile Asn Asp
755 760 765
Ala Ser Gly Tyr Ile Ser Ser Gly Leu Thr Ala Leu Met Gly Glu Ser
770 775 780
Gly Ala Gly Lys Thr Thr Leu Leu Asn Val Leu Ser Gln Arg Thr Glu
785 790 795 800
Ser Gly Val Val Thr Gly Glu Leu Leu Ile Asp Gly Gln Pro Leu Thr
805 810 815
Asn Ile Asp Ala Phe Arg Arg Ser Ile Gly Phe Val Gln Gln Gln Asp
820 825 830
Val His Leu Glu Leu Leu Thr Val Arg Glu Ser Leu Glu Ile Ser Cys
835 840 845
Val Leu Arg Gly Asp Gly Asp Arg Asp Tyr Leu Gly Val Val Ser Asn
850 855 860
Leu Leu Arg Leu Pro Ser Glu Lys Leu Val Ala Asp Leu Ser Pro Thr
865 870 875 880
Gln Arg Lys Leu Leu Ser Ile Gly Val Glu Leu Val Thr Lys Pro Ser
885 890 895
Leu Leu Leu Phe Leu Asp Glu Pro Thr Ser Gly Leu Asp Ala Glu Ala
900 905 910
Ala Leu Thr Ile Val Gln Phe Leu Lys Lys Leu Ser Met Gln Gly Gln
915 920 925
Ala Ile Leu Cys Thr Ile His Gln Pro Ser Lys Ser Val Ile Ser Tyr
930 935 940
Phe Asp Asn Ile Tyr Leu Leu Lys Arg Gly Gly Glu Cys Val Tyr Phe
945 950 955 960
Gly Ser Leu Pro Asn Ala Cys Asp Tyr Phe Val Ala His Asp Arg Arg
965 970 975
Leu Thr Phe Asp Arg Glu Met Asp Asn Pro Ala Asp Phe Val Ile Asp
980 985 990
Val Val Gly Ser Gly Ser Thr Asn Ile Pro Met Asp Asp Ala Glu Lys
995 1000 1005
Pro Thr Ser Ser Lys Ile Asp Glu Pro Val Ser Tyr His Lys Gln
1010 1015 1020
Ser Asp Ser Ile Asn Trp Ala Glu Leu Trp Gln Ser Ser Pro Glu
1025 1030 1035
Lys Val Arg Val Ala Asp Asp Leu Leu Leu Leu Glu Glu Glu Ala
1040 1045 1050
Arg Lys Ser Gly Val Asp Phe Thr Thr Ser Val Trp Ser Pro Pro
1055 1060 1065
Ser Tyr Met Glu Gln Ile Lys Leu Ile Thr Lys Arg Gln Tyr Ile
1070 1075 1080
Cys Thr Lys Arg Asp Met Thr Tyr Val Phe Ala Lys Tyr Ala Leu
1085 1090 1095
Asn Ala Gly Ala Gly Leu Phe Ile Gly Phe Ser Phe Trp Arg Thr
1100 1105 1110
Lys His Asn Ile Asn Gly Leu Gln Asp Ala Ile Phe Leu Cys Phe
1115 1120 1125
Met Met Leu Cys Val Ser Ser Pro Leu Ile Asn Gln Val Gln Asp
1130 1135 1140
Lys Ala Leu Gln Ser Lys Glu Val Tyr Ile Ala Arg Glu Ala Arg
1145 1150 1155
Ser Asn Thr Tyr His Trp Thr Val Leu Leu Ile Ala Gln Thr Ile
1160 1165 1170
Val Glu Leu Pro Leu Ala Ile Ser Ser Ser Thr Leu Phe Phe Leu
1175 1180 1185
Cys Cys Tyr Phe Cys Cys Gly Phe Glu Thr Ser Ala Arg Val Ala
1190 1195 1200
Gly Val Phe Tyr Leu Asn Tyr Ile Leu Phe Ser Met Tyr Tyr Leu
1205 1210 1215
Ser Phe Gly Leu Trp Leu Leu Tyr Ser Ala Pro Asp Leu Gln Thr
1220 1225 1230
Ala Ala Val Phe Val Ala Phe Leu Tyr Ser Phe Thr Ala Ser Phe
1235 1240 1245
Cys Gly Val Met Gln Pro Tyr Ser Leu Phe Pro Arg Phe Trp Thr
1250 1255 1260
Phe Met Tyr Arg Val Ser Pro Tyr Thr Tyr Phe Ile Glu Thr Phe
1265 1270 1275
Val Ser Leu Leu Leu His Asp Arg Glu Val Asn Cys Ser Thr Ser
1280 1285 1290
Glu Met Val Pro Ser Gln Pro Val Met Gly Gln Thr Cys Gly Gln
1295 1300 1305
Phe Met Lys Pro Phe Ile Asp Glu Phe Gly Gly Lys Leu His Ile
1310 1315 1320
Asn Asn Thr Tyr Thr Val Cys Ala Tyr Cys Met Tyr Thr Val Gly
1325 1330 1335
Asp Asp Phe Leu Ala Gln Glu Asn Met Ser Tyr His His Arg Trp
1340 1345 1350
Arg Asn Phe Gly Phe Glu Trp Val Phe Val Cys Phe Asn Ile Ala
1355 1360 1365
Ala Met Phe Val Gly Phe Tyr Leu Thr Tyr Ile Lys Lys Ile Trp
1370 1375 1380
Pro Ser Val Ile Asp Gly Ile Lys Lys Cys Ile Pro Ser Met Arg
1385 1390 1395
Arg Ser Lys Thr Ser His Asn Pro Asn Glu Gln Ser Val
1400 1405 1410
<210> 109
<211> 1511
<212> PRT
<213> Saccharomyces cerevisiae
<400> 109
Met Ser Ser Thr Asp Glu His Ile Glu Lys Asp Ile Ser Ser Arg Ser
1 5 10 15
Asn His Asp Asp Asp Tyr Ala Asn Ser Val Gln Ser Tyr Ala Ala Ser
20 25 30
Glu Gly Gln Val Asp Asn Glu Asp Leu Ala Ala Thr Ser Gln Leu Ser
35 40 45
Arg His Leu Ser Asn Ile Leu Ser Asn Glu Glu Gly Ile Glu Arg Leu
50 55 60
Glu Ser Met Ala Arg Val Ile Ser His Lys Thr Lys Lys Glu Met Asp
65 70 75 80
Ser Phe Glu Ile Asn Asp Leu Asp Phe Asp Leu Arg Ser Leu Leu His
85 90 95
Tyr Leu Arg Ser Arg Gln Leu Glu Gln Gly Ile Glu Pro Gly Asp Ser
100 105 110
Gly Ile Ala Phe Lys Asn Leu Thr Ala Val Gly Val Asp Ala Ser Ala
115 120 125
Ala Tyr Gly Pro Ser Val Glu Glu Met Phe Arg Asn Ile Ala Ser Ile
130 135 140
Pro Ala His Leu Ile Ser Lys Phe Thr Lys Lys Ser Asp Val Pro Leu
145 150 155 160
Arg Asn Ile Ile Gln Asn Cys Thr Gly Val Val Glu Ser Gly Glu Met
165 170 175
Leu Phe Val Val Gly Arg Pro Gly Ala Gly Cys Ser Thr Phe Leu Lys
180 185 190
Cys Leu Ser Gly Glu Thr Ser Glu Leu Val Asp Val Gln Gly Glu Phe
195 200 205
Ser Tyr Asp Gly Leu Asp Gln Ser Glu Met Met Ser Lys Tyr Lys Gly
210 215 220
Tyr Val Ile Tyr Cys Pro Glu Leu Asp Phe His Phe Pro Lys Ile Thr
225 230 235 240
Val Lys Glu Thr Ile Asp Phe Ala Leu Lys Cys Lys Thr Pro Arg Val
245 250 255
Arg Ile Asp Lys Met Thr Arg Lys Gln Tyr Val Asp Asn Ile Arg Asp
260 265 270
Met Trp Cys Thr Val Phe Gly Leu Arg His Thr Tyr Ala Thr Lys Val
275 280 285
Gly Asn Asp Phe Val Arg Gly Val Ser Gly Gly Glu Arg Lys Arg Val
290 295 300
Ser Leu Val Glu Ala Gln Ala Met Asn Ala Ser Ile Tyr Ser Trp Asp
305 310 315 320
Asn Ala Thr Arg Gly Leu Asp Ala Ser Thr Ala Leu Glu Phe Ala Gln
325 330 335
Ala Ile Arg Thr Ala Thr Asn Met Val Asn Asn Ser Ala Ile Val Ala
340 345 350
Ile Tyr Gln Ala Gly Glu Asn Ile Tyr Glu Leu Phe Asp Lys Thr Thr
355 360 365
Val Leu Tyr Asn Gly Arg Gln Ile Tyr Phe Gly Pro Ala Asp Lys Ala
370 375 380
Val Gly Tyr Phe Gln Arg Met Gly Trp Val Lys Pro Asn Arg Met Thr
385 390 395 400
Ser Ala Glu Phe Leu Thr Ser Val Thr Val Asp Phe Glu Asn Arg Thr
405 410 415
Leu Asp Ile Lys Pro Gly Tyr Glu Asp Lys Val Pro Lys Ser Ser Ser
420 425 430
Glu Phe Glu Glu Tyr Trp Leu Asn Ser Glu Asp Tyr Gln Glu Leu Leu
435 440 445
Arg Thr Tyr Asp Asp Tyr Gln Ser Arg His Pro Val Asn Glu Thr Arg
450 455 460
Asp Arg Leu Asp Val Ala Lys Lys Gln Arg Leu Gln Gln Gly Gln Arg
465 470 475 480
Glu Asn Ser Gln Tyr Val Val Asn Tyr Trp Thr Gln Val Tyr Tyr Cys
485 490 495
Met Ile Arg Gly Phe Gln Arg Val Lys Gly Asp Ser Thr Tyr Thr Lys
500 505 510
Val Tyr Leu Ser Ser Phe Leu Ile Lys Ala Leu Ile Ile Gly Ser Met
515 520 525
Phe His Lys Ile Asp Asp Lys Ser Gln Ser Thr Thr Ala Gly Ala Tyr
530 535 540
Ser Arg Gly Gly Met Leu Phe Tyr Val Leu Leu Phe Ala Ser Val Thr
545 550 555 560
Ser Leu Ala Glu Ile Gly Asn Ser Phe Ser Ser Arg Pro Val Ile Val
565 570 575
Lys His Lys Ser Tyr Ser Met Tyr His Leu Ser Ala Glu Ser Leu Gln
580 585 590
Glu Ile Ile Thr Glu Phe Pro Thr Lys Phe Val Ala Ile Val Ile Leu
595 600 605
Cys Leu Ile Thr Tyr Trp Ile Pro Phe Met Lys Tyr Glu Ala Gly Ala
610 615 620
Phe Phe Gln Tyr Ile Leu Tyr Leu Leu Thr Val Gln Gln Cys Thr Ser
625 630 635 640
Phe Ile Phe Lys Phe Val Ala Thr Met Ser Lys Ser Gly Val Asp Ala
645 650 655
His Ala Val Gly Gly Leu Trp Val Leu Met Leu Cys Val Tyr Ala Gly
660 665 670
Phe Val Leu Pro Ile Gly Glu Met His His Trp Ile Arg Trp Leu His
675 680 685
Phe Ile Asn Pro Leu Thr Tyr Ala Phe Glu Ser Leu Val Ser Thr Glu
690 695 700
Phe His His Arg Glu Met Leu Cys Ser Ala Leu Val Pro Ser Gly Pro
705 710 715 720
Gly Tyr Glu Gly Ile Ser Ile Ala Asn Gln Val Cys Asp Ala Ala Gly
725 730 735
Ala Val Lys Gly Asn Leu Tyr Val Ser Gly Asp Ser Tyr Ile Leu His
740 745 750
Gln Tyr His Phe Ala Tyr Lys His Ala Trp Arg Asn Trp Gly Val Asn
755 760 765
Ile Val Trp Thr Phe Gly Tyr Ile Val Phe Asn Val Ile Leu Ser Glu
770 775 780
Tyr Leu Lys Pro Val Glu Gly Gly Gly Asp Leu Leu Leu Tyr Lys Arg
785 790 795 800
Gly His Met Pro Glu Leu Gly Thr Glu Asn Ala Asp Ala Arg Thr Ala
805 810 815
Ser Arg Glu Glu Met Met Glu Ala Leu Asn Gly Pro Asn Val Asp Leu
820 825 830
Glu Lys Val Ile Ala Glu Lys Asp Val Phe Thr Trp Asn His Leu Asp
835 840 845
Tyr Thr Ile Pro Tyr Asp Gly Ala Thr Arg Lys Leu Leu Ser Asp Val
850 855 860
Phe Gly Tyr Val Lys Pro Gly Lys Met Thr Ala Leu Met Gly Glu Ser
865 870 875 880
Gly Ala Gly Lys Thr Thr Leu Leu Asn Val Leu Ala Gln Arg Ile Asn
885 890 895
Met Gly Val Ile Thr Gly Asp Met Leu Val Asn Ala Lys Pro Leu Pro
900 905 910
Ala Ser Phe Asn Arg Ser Cys Gly Tyr Val Ala Gln Ala Asp Asn His
915 920 925
Met Ala Glu Leu Ser Val Arg Glu Ser Leu Arg Phe Ala Ala Glu Leu
930 935 940
Arg Gln Gln Ser Ser Val Pro Leu Glu Glu Lys Tyr Glu Tyr Val Glu
945 950 955 960
Lys Ile Ile Thr Leu Leu Gly Met Gln Asn Tyr Ala Glu Ala Leu Val
965 970 975
Gly Lys Thr Gly Arg Gly Leu Asn Val Glu Gln Arg Lys Lys Leu Ser
980 985 990
Ile Gly Val Glu Leu Val Ala Lys Pro Ser Leu Leu Leu Phe Leu Asp
995 1000 1005
Glu Pro Thr Ser Gly Leu Asp Ser Gln Ser Ala Trp Ser Ile Val
1010 1015 1020
Gln Phe Met Arg Ala Leu Ala Asp Ser Gly Gln Ser Ile Leu Cys
1025 1030 1035
Thr Ile His Gln Pro Ser Ala Thr Leu Phe Glu Gln Phe Asp Arg
1040 1045 1050
Leu Leu Leu Leu Lys Lys Gly Gly Lys Met Val Tyr Phe Gly Asp
1055 1060 1065
Ile Gly Pro Asn Ser Glu Thr Leu Leu Lys Tyr Phe Glu Arg Gln
1070 1075 1080
Ser Gly Met Lys Cys Gly Val Ser Glu Asn Pro Ala Glu Tyr Ile
1085 1090 1095
Leu Asn Cys Ile Gly Ala Gly Ala Thr Ala Ser Val Asn Ser Asp
1100 1105 1110
Trp His Asp Leu Trp Leu Ala Ser Pro Glu Cys Ala Ala Ala Arg
1115 1120 1125
Ala Glu Val Glu Glu Leu His Arg Thr Leu Pro Gly Arg Ala Val
1130 1135 1140
Asn Asp Asp Pro Glu Leu Ala Thr Arg Phe Ala Ala Ser Tyr Met
1145 1150 1155
Thr Gln Ile Lys Cys Val Leu Arg Arg Thr Ala Leu Gln Phe Trp
1160 1165 1170
Arg Ser Pro Val Tyr Ile Arg Ala Lys Phe Phe Glu Cys Val Ala
1175 1180 1185
Cys Ala Leu Phe Val Gly Leu Ser Tyr Val Gly Val Asn His Ser
1190 1195 1200
Val Gly Gly Ala Ile Glu Ala Phe Ser Ser Ile Phe Met Leu Leu
1205 1210 1215
Leu Ile Ala Leu Ala Met Ile Asn Gln Leu His Val Phe Ala Tyr
1220 1225 1230
Asp Ser Arg Glu Leu Tyr Glu Val Arg Glu Ala Ala Ser Asn Thr
1235 1240 1245
Phe His Trp Ser Val Leu Leu Leu Cys His Ala Ala Val Glu Asn
1250 1255 1260
Phe Trp Ser Thr Leu Cys Gln Phe Met Cys Phe Ile Cys Tyr Tyr
1265 1270 1275
Trp Pro Ala Gln Phe Ser Gly Arg Ala Ser His Ala Gly Phe Phe
1280 1285 1290
Phe Phe Phe Tyr Val Leu Ile Phe Pro Leu Tyr Phe Val Thr Tyr
1295 1300 1305
Gly Leu Trp Ile Leu Tyr Met Ser Pro Asp Val Pro Ser Ala Ser
1310 1315 1320
Met Ile Asn Ser Asn Leu Phe Ala Ala Met Leu Leu Phe Cys Gly
1325 1330 1335
Ile Leu Gln Pro Arg Glu Lys Met Pro Ala Phe Trp Arg Arg Leu
1340 1345 1350
Met Tyr Asn Val Ser Pro Phe Thr Tyr Val Val Gln Ala Leu Val
1355 1360 1365
Thr Pro Leu Val His Asn Lys Lys Val Val Cys Asn Pro His Glu
1370 1375 1380
Tyr Asn Ile Met Asp Pro Pro Ser Gly Lys Thr Cys Gly Glu Phe
1385 1390 1395
Leu Ser Thr Tyr Met Asp Asn Asn Thr Gly Tyr Leu Val Asn Pro
1400 1405 1410
Thr Ala Thr Glu Asn Cys Gln Tyr Cys Pro Tyr Thr Val Gln Asp
1415 1420 1425
Gln Val Val Ala Lys Tyr Asn Val Lys Trp Asp His Arg Trp Arg
1430 1435 1440
Asn Phe Gly Phe Met Trp Ala Tyr Ile Cys Phe Asn Ile Ala Ala
1445 1450 1455
Met Leu Ile Cys Tyr Tyr Val Val Arg Val Lys Val Trp Ser Leu
1460 1465 1470
Lys Ser Val Leu Asn Phe Lys Lys Trp Phe Asn Gly Pro Arg Lys
1475 1480 1485
Glu Arg His Glu Lys Asp Thr Asn Ile Phe Gln Thr Val Pro Gly
1490 1495 1500
Asp Glu Asn Lys Ile Thr Lys Lys
1505 1510
<210> 110
<211> 1529
<212> PRT
<213> Saccharomyces cerevisiae
<400> 110
Met Ser Ser Asp Ile Arg Asp Val Glu Glu Arg Asn Ser Arg Ser Ser
1 5 10 15
Ser Ser Ser Ser Ser Ser Asn Ser Ala Ala Gln Ser Ile Gly Gln His
20 25 30
Pro Tyr Arg Gly Phe Asp Ser Glu Ala Ala Glu Arg Val His Glu Leu
35 40 45
Ala Arg Thr Leu Thr Ser Gln Ser Leu Leu Tyr Thr Ala Asn Ser Asn
50 55 60
Asn Ser Ser Ser Ser Asn His Asn Ala His Asn Ala Asp Ser Arg Ser
65 70 75 80
Val Phe Ser Thr Asp Met Glu Gly Val Asn Pro Val Phe Thr Asn Pro
85 90 95
Asp Thr Pro Gly Tyr Asn Pro Lys Leu Asp Pro Asn Ser Asp Gln Phe
100 105 110
Ser Ser Thr Ala Trp Val Gln Asn Met Ala Asn Ile Cys Thr Ser Asp
115 120 125
Pro Asp Phe Tyr Lys Pro Tyr Ser Leu Gly Cys Val Trp Lys Asn Leu
130 135 140
Ser Ala Ser Gly Asp Ser Ala Asp Val Ser Tyr Gln Ser Thr Phe Ala
145 150 155 160
Asn Ile Val Pro Lys Leu Leu Thr Lys Gly Leu Arg Leu Leu Lys Pro
165 170 175
Ser Lys Glu Glu Asp Thr Phe Gln Ile Leu Lys Pro Met Asp Gly Cys
180 185 190
Leu Asn Pro Gly Glu Leu Leu Val Val Leu Gly Arg Pro Gly Ser Gly
195 200 205
Cys Thr Thr Leu Leu Lys Ser Ile Ser Ser Asn Ser His Gly Phe Lys
210 215 220
Ile Ala Lys Asp Ser Ile Val Ser Tyr Asn Gly Leu Ser Ser Ser Asp
225 230 235 240
Ile Arg Lys His Tyr Arg Gly Glu Val Val Tyr Asn Ala Glu Ser Asp
245 250 255
Ile His Leu Pro His Leu Thr Val Tyr Gln Thr Leu Phe Thr Val Ala
260 265 270
Arg Met Lys Thr Pro Gln Asn Arg Ile Lys Gly Val Asp Arg Glu Ala
275 280 285
Tyr Ala Asn His Val Thr Glu Val Ala Met Ala Thr Tyr Gly Leu Ser
290 295 300
His Thr Arg Asp Thr Lys Val Gly Asn Asp Leu Val Arg Gly Val Ser
305 310 315 320
Gly Gly Glu Arg Lys Arg Val Ser Ile Ala Glu Val Ala Ile Cys Gly
325 330 335
Ala Arg Phe Gln Cys Trp Asp Asn Ala Thr Arg Gly Leu Asp Ser Ala
340 345 350
Thr Ala Leu Glu Phe Ile Arg Ala Leu Lys Thr Gln Ala Asp Ile Gly
355 360 365
Lys Thr Ala Ala Thr Val Ala Ile Tyr Gln Cys Ser Gln Asp Ala Tyr
370 375 380
Asp Leu Phe Asp Lys Val Cys Val Leu Asp Asp Gly Tyr Gln Leu Tyr
385 390 395 400
Phe Gly Pro Ala Lys Asp Ala Lys Lys Tyr Phe Gln Asp Met Gly Tyr
405 410 415
Tyr Cys Pro Pro Arg Gln Thr Thr Ala Asp Phe Leu Thr Ser Ile Thr
420 425 430
Ser Pro Thr Glu Arg Ile Ile Ser Lys Glu Phe Ile Glu Lys Gly Thr
435 440 445
Arg Val Pro Gln Thr Pro Lys Asp Met Ala Glu Tyr Trp Leu Gln Ser
450 455 460
Glu Ser Tyr Lys Asn Leu Ile Lys Asp Ile Asp Ser Thr Leu Glu Lys
465 470 475 480
Asn Thr Asp Glu Ala Arg Asn Ile Ile Arg Asp Ala His His Ala Lys
485 490 495
Gln Ala Lys Arg Ala Pro Pro Ser Ser Pro Tyr Val Val Asn Tyr Gly
500 505 510
Met Gln Val Lys Tyr Leu Leu Ile Arg Asn Phe Trp Arg Met Lys Gln
515 520 525
Ser Ala Ser Val Thr Leu Trp Gln Val Ile Gly Asn Ser Val Met Ala
530 535 540
Phe Ile Leu Gly Ser Met Phe Tyr Lys Val Met Lys Lys Asn Asp Thr
545 550 555 560
Ser Thr Phe Tyr Phe Arg Gly Ala Ala Met Phe Phe Ala Ile Leu Phe
565 570 575
Asn Ala Phe Ser Cys Leu Leu Glu Ile Phe Ser Leu Tyr Glu Thr Arg
580 585 590
Pro Ile Thr Glu Lys His Arg Thr Tyr Ser Leu Tyr His Pro Ser Ala
595 600 605
Asp Ala Phe Ala Ser Val Leu Ser Glu Met Pro Pro Lys Leu Ile Thr
610 615 620
Ala Val Cys Phe Asn Ile Ile Phe Tyr Phe Leu Val Asp Phe Arg Arg
625 630 635 640
Asn Gly Gly Val Phe Phe Phe Tyr Phe Leu Ile Asn Val Ile Ala Thr
645 650 655
Phe Thr Leu Ser His Leu Phe Arg Cys Val Gly Ser Leu Thr Lys Thr
660 665 670
Leu Gln Glu Ala Met Val Pro Ala Ser Met Leu Leu Leu Ala Ile Ser
675 680 685
Met Tyr Thr Gly Phe Ala Ile Pro Lys Thr Lys Ile Leu Gly Trp Ser
690 695 700
Ile Trp Ile Trp Tyr Ile Asn Pro Leu Ala Tyr Leu Phe Glu Ser Leu
705 710 715 720
Met Ile Asn Glu Phe His Asp Arg Arg Phe Pro Cys Ala Gln Tyr Ile
725 730 735
Pro Ala Gly Pro Ala Tyr Gln Asn Ile Thr Gly Thr Gln Arg Val Cys
740 745 750
Ser Ala Val Gly Ala Tyr Pro Gly Asn Asp Tyr Val Leu Gly Asp Asp
755 760 765
Phe Leu Lys Glu Ser Tyr Asp Tyr Glu His Lys His Lys Trp Arg Gly
770 775 780
Phe Gly Ile Gly Met Ala Tyr Val Val Phe Phe Phe Phe Val Tyr Leu
785 790 795 800
Ile Leu Cys Glu Tyr Asn Glu Gly Ala Lys Gln Lys Gly Glu Met Val
805 810 815
Val Phe Leu Arg Ser Lys Ile Lys Gln Leu Lys Lys Glu Gly Lys Leu
820 825 830
Gln Glu Lys His Arg Pro Gly Asp Ile Glu Asn Asn Ala Gly Ser Ser
835 840 845
Pro Asp Ser Ala Thr Thr Glu Lys Lys Ile Leu Asp Asp Ser Ser Glu
850 855 860
Gly Ser Asp Ser Ser Ser Asp Asn Ala Gly Leu Gly Leu Ser Lys Ser
865 870 875 880
Glu Ala Ile Phe His Trp Arg Asp Leu Cys Tyr Asp Val Pro Ile Lys
885 890 895
Gly Gly Gln Arg Arg Ile Leu Asn Asn Val Asp Gly Trp Val Lys Pro
900 905 910
Gly Thr Leu Thr Ala Leu Met Gly Ala Ser Gly Ala Gly Lys Thr Thr
915 920 925
Leu Leu Asp Cys Leu Ala Glu Arg Val Thr Met Gly Val Ile Thr Gly
930 935 940
Asn Ile Phe Val Asp Gly Arg Leu Arg Asp Glu Ser Phe Pro Arg Ser
945 950 955 960
Ile Gly Tyr Cys Gln Gln Gln Asp Leu His Leu Lys Thr Ala Thr Val
965 970 975
Arg Glu Ser Leu Arg Phe Ser Ala Tyr Leu Arg Gln Pro Ser Ser Val
980 985 990
Ser Ile Glu Glu Lys Asn Arg Tyr Val Glu Glu Val Ile Lys Ile Leu
995 1000 1005
Glu Met Gln Gln Tyr Ser Asp Ala Val Val Gly Val Ala Gly Glu
1010 1015 1020
Gly Leu Asn Val Glu Gln Arg Lys Arg Leu Thr Ile Gly Val Glu
1025 1030 1035
Leu Ala Ala Arg Pro Lys Leu Leu Val Phe Leu Asp Glu Pro Thr
1040 1045 1050
Ser Gly Leu Asp Ser Gln Thr Ala Trp Asp Thr Cys Gln Leu Met
1055 1060 1065
Arg Lys Leu Ala Thr His Gly Gln Ala Ile Leu Cys Thr Ile His
1070 1075 1080
Gln Pro Ser Ala Ile Leu Met Gln Gln Phe Asp Arg Leu Leu Phe
1085 1090 1095
Leu Gln Lys Gly Gly Gln Thr Val Tyr Phe Gly Asp Leu Gly Glu
1100 1105 1110
Gly Cys Lys Thr Met Ile Asp Tyr Phe Glu Ser Lys Gly Ala His
1115 1120 1125
Lys Cys Pro Pro Asp Ala Asn Pro Ala Glu Trp Met Leu Glu Val
1130 1135 1140
Val Gly Ala Ala Pro Gly Ser His Ala Thr Gln Asp Tyr Asn Glu
1145 1150 1155
Val Trp Arg Asn Ser Asp Glu Tyr Lys Ala Val Gln Glu Glu Leu
1160 1165 1170
Asp Trp Met Glu Lys Asn Leu Pro Gly Arg Ser Lys Glu Pro Thr
1175 1180 1185
Ala Glu Glu His Lys Pro Phe Ala Ala Ser Leu Tyr Tyr Gln Phe
1190 1195 1200
Lys Met Val Thr Ile Arg Leu Phe Gln Gln Tyr Trp Arg Ser Pro
1205 1210 1215
Asp Tyr Leu Trp Ser Lys Phe Ile Leu Thr Ile Phe Asn Gln Val
1220 1225 1230
Phe Ile Gly Phe Thr Phe Phe Lys Ala Asp Arg Ser Leu Gln Gly
1235 1240 1245
Leu Gln Asn Gln Met Leu Ser Ile Phe Met Tyr Thr Val Ile Phe
1250 1255 1260
Asn Pro Ile Leu Gln Gln Tyr Leu Pro Ser Phe Val Gln Gln Arg
1265 1270 1275
Asp Leu Tyr Glu Ala Arg Glu Arg Pro Ser Arg Thr Phe Ser Trp
1280 1285 1290
Leu Ala Phe Phe Leu Ser Gln Ile Ile Val Glu Ile Pro Trp Asn
1295 1300 1305
Ile Leu Ala Gly Thr Ile Ala Tyr Cys Ile Tyr Tyr Tyr Ala Val
1310 1315 1320
Gly Phe Tyr Ala Asn Ala Ser Ala Ala Gly Gln Leu His Glu Arg
1325 1330 1335
Gly Ala Leu Phe Trp Leu Phe Ser Ile Ala Phe Tyr Val Tyr Ile
1340 1345 1350
Gly Ser Met Gly Leu Leu Met Ile Ser Phe Asn Glu Val Ala Glu
1355 1360 1365
Thr Ala Ala His Met Gly Thr Leu Leu Phe Thr Met Ala Leu Ser
1370 1375 1380
Phe Cys Gly Val Met Ala Thr Pro Lys Val Met Pro Arg Phe Trp
1385 1390 1395
Ile Phe Met Tyr Arg Val Ser Pro Leu Thr Tyr Met Ile Asp Ala
1400 1405 1410
Leu Leu Ala Leu Gly Val Ala Asn Val Asp Val Lys Cys Ser Asn
1415 1420 1425
Tyr Glu Met Val Lys Phe Thr Pro Pro Ser Gly Thr Thr Cys Gly
1430 1435 1440
Asp Tyr Met Ala Ser Tyr Ile Lys Leu Ala Gly Thr Gly Tyr Leu
1445 1450 1455
Ser Asp Pro Ser Ala Thr Asp Ile Cys Ser Phe Cys Ala Val Ser
1460 1465 1470
Thr Thr Asn Ala Phe Leu Ala Thr Phe Ser Ser His Tyr Tyr Arg
1475 1480 1485
Arg Trp Arg Asn Tyr Gly Ile Phe Ile Cys Tyr Ile Ala Phe Asp
1490 1495 1500
Tyr Ile Ala Ala Thr Phe Leu Tyr Trp Leu Ser Arg Val Pro Lys
1505 1510 1515
Lys Asn Gly Lys Ile Ser Glu Lys Pro Lys Lys
1520 1525
<210> 111
<211> 1333
<212> PRT
<213> Saccharomyces cerevisiae
<400> 111
Met Glu Cys Val Ser Val Glu Gly Leu Asp Ser Ser Phe Leu Glu Gly
1 5 10 15
Gln Thr Phe Gly Asp Ile Leu Cys Leu Pro Trp Thr Ile Ile Lys Gly
20 25 30
Ile Arg Glu Arg Lys Asn Arg Asn Lys Met Lys Ile Ile Leu Lys Asn
35 40 45
Val Ser Leu Leu Ala Lys Ser Gly Glu Met Val Leu Val Leu Gly Arg
50 55 60
Pro Gly Ala Gly Cys Thr Ser Phe Leu Lys Ser Ala Ala Gly Glu Thr
65 70 75 80
Ser Gln Phe Ala Gly Gly Val Thr Thr Gly His Ile Ser Tyr Asp Gly
85 90 95
Ile Pro Gln Lys Glu Met Met Gln His Tyr Lys Pro Asp Val Ile Tyr
100 105 110
Asn Gly Glu Gln Asp Val His Phe Pro His Leu Thr Val Lys Gln Thr
115 120 125
Leu Asp Phe Ala Ile Ser Cys Lys Met Pro Ala Lys Arg Val Asn Asn
130 135 140
Val Thr Lys Glu Glu Tyr Ile Thr Ala Asn Arg Glu Phe Tyr Ala Lys
145 150 155 160
Ile Phe Gly Leu Thr His Thr Phe Asp Thr Lys Val Gly Asn Asp Phe
165 170 175
Ile Ser Gly Val Ser Gly Gly Glu Arg Lys Arg Val Ser Ile Ala Glu
180 185 190
Ala Leu Ala Ala Lys Gly Ser Ile Tyr Cys Trp Asp Asn Ala Thr Arg
195 200 205
Gly Leu Asp Ser Ser Thr Ala Leu Glu Phe Ala Arg Ala Ile Arg Thr
210 215 220
Met Thr Asn Leu Leu Gly Thr Thr Ala Leu Val Thr Val Tyr Gln Ala
225 230 235 240
Ser Glu Asn Ile Tyr Glu Thr Phe Asp Lys Val Thr Val Leu Tyr Ala
245 250 255
Gly Arg Gln Ile Phe Cys Gly Lys Thr Thr Glu Ala Lys Asp Tyr Phe
260 265 270
Glu Asn Met Gly Tyr Leu Cys Pro Pro Arg Gln Ser Thr Ala Glu Tyr
275 280 285
Leu Thr Ala Ile Thr Asp Pro Asn Gly Leu His Glu Ile Lys Pro Gly
290 295 300
Phe Glu Tyr Gln Val Pro His Thr Ala Asp Glu Phe Glu Lys Tyr Trp
305 310 315 320
Leu Asp Ser Pro Glu Tyr Ala Arg Leu Lys Gly Glu Ile Gln Lys Tyr
325 330 335
Lys His Glu Val Asn Thr Glu Trp Thr Lys Lys Thr Tyr Asn Glu Ser
340 345 350
Met Ala Gln Glu Lys Ser Lys Gly Thr Arg Lys Lys Ser Tyr Tyr Thr
355 360 365
Val Ser Tyr Trp Glu Gln Ile Arg Leu Cys Thr Ile Arg Gly Phe Leu
370 375 380
Arg Ile Tyr Gly Asp Lys Ser Tyr Thr Val Ile Asn Thr Cys Ala Ala
385 390 395 400
Ile Ala Gln Ala Phe Ile Thr Gly Ser Leu Phe Tyr Gln Ala Pro Ser
405 410 415
Ser Thr Leu Gly Ala Phe Ser Arg Ser Gly Val Leu Phe Phe Ser Leu
420 425 430
Leu Tyr Tyr Ser Leu Met Gly Leu Ala Asn Ile Ser Phe Glu His Arg
435 440 445
Pro Ile Leu Gln Lys His Lys Val Tyr Ser Leu Tyr His Pro Ser Ala
450 455 460
Glu Ala Leu Ala Ser Thr Ile Ser Ser Phe Pro Phe Arg Met Ile Gly
465 470 475 480
Leu Thr Phe Phe Ile Ile Ile Leu Tyr Phe Leu Ala Gly Leu His Arg
485 490 495
Ser Ala Gly Ala Phe Phe Thr Met Tyr Leu Leu Leu Thr Met Cys Ser
500 505 510
Glu Ala Ile Thr Ser Leu Phe Gln Met Val Ser Ser Leu Cys Asp Thr
515 520 525
Leu Ser Gln Ala Asn Ser Ile Ala Gly Val Val Met Leu Ser Ile Ala
530 535 540
Met Tyr Ser Thr Tyr Met Ile Gln Leu Pro Ser Met His Pro Trp Phe
545 550 555 560
Lys Trp Ile Ser Tyr Ile Leu Pro Ile Arg Tyr Ala Phe Glu Ser Met
565 570 575
Leu Asn Ala Glu Phe His Gly Arg His Met Asp Cys Gly Gly Thr Leu
580 585 590
Val Pro Ser Gly Pro Gly Phe Glu Asn Ile Leu Pro Glu Asn Gln Val
595 600 605
Cys Ala Phe Val Gly Ser Arg Pro Gly Gln Ser Trp Val Leu Gly Asp
610 615 620
Asp Tyr Leu Arg Ala Gln Tyr Gln Tyr Glu Tyr Lys Asn Thr Trp Arg
625 630 635 640
Asn Phe Gly Ile Met Trp Cys Phe Leu Ile Gly Tyr Ile Val Leu Arg
645 650 655
Ala Val Phe Thr Glu Tyr Lys Ser Pro Val Lys Ser Gly Gly Asp Ala
660 665 670
Leu Val Val Lys Lys Gly Thr Lys Asn Ala Ile Gln Arg Ser Trp Ser
675 680 685
Ser Lys Asn Asp Glu Glu Asn Leu Asn Ala Ser Ile Ala Thr Gln Asp
690 695 700
Met Lys Glu Ile Ala Ser Ser Asn Asp Asp Ser Thr Ser Ala Asp Phe
705 710 715 720
Glu Gly Leu Glu Ser Thr Gly Val Phe Ile Trp Lys Asn Val Ser Phe
725 730 735
Thr Ile Pro His Ser Ser Gly Gln Arg Lys Leu Leu Asp Ser Val Ser
740 745 750
Gly Tyr Cys Val Pro Gly Thr Leu Thr Ala Leu Ile Gly Glu Ser Gly
755 760 765
Ala Gly Lys Thr Thr Leu Leu Asn Thr Leu Ala Gln Arg Asn Val Gly
770 775 780
Thr Ile Thr Gly Asp Met Leu Val Asp Gly Leu Pro Met Asp Ala Ser
785 790 795 800
Phe Lys Arg Arg Thr Gly Tyr Val Gln Gln Gln Asp Leu His Val Ala
805 810 815
Glu Leu Thr Val Lys Glu Ser Leu Gln Phe Ser Ala Arg Met Arg Arg
820 825 830
Pro Gln Ser Ile Pro Asp Ala Glu Lys Met Glu Tyr Val Glu Lys Ile
835 840 845
Ile Ser Ile Leu Glu Met Gln Glu Phe Ser Glu Ala Leu Val Gly Glu
850 855 860
Ile Gly Tyr Gly Leu Asn Val Glu Gln Arg Lys Lys Leu Ser Ile Gly
865 870 875 880
Val Glu Leu Val Gly Lys Pro Asp Leu Leu Leu Phe Leu Asp Glu Pro
885 890 895
Thr Ser Gly Leu Asp Ser Gln Ser Ala Trp Ala Val Val Lys Met Leu
900 905 910
Lys Arg Leu Ala Leu Ala Gly Gln Ser Ile Leu Cys Thr Ile His Gln
915 920 925
Pro Ser Ala Thr Leu Phe Glu Gln Phe Asp Arg Leu Leu Leu Leu Gly
930 935 940
Lys Gly Gly Gln Thr Ile Tyr Phe Gly Glu Ile Gly Lys Asn Ser Ser
945 950 955 960
Ser Val Ile Lys Tyr Phe Glu Lys Asn Gly Ala Arg Lys Cys Gln Gln
965 970 975
Asn Glu Asn Pro Ala Glu Tyr Ile Leu Glu Ala Ile Gly Ala Gly Ala
980 985 990
Thr Ala Ser Val Gln Gln Asn Trp Pro Asp Ile Trp Gln Lys Ser His
995 1000 1005
Glu Tyr Ala Asn Ile Asn Glu Lys Ile Asn Asp Met Ile Lys Asp
1010 1015 1020
Leu Ser Ser Thr Thr Leu His Lys Thr Ala Thr Arg Ala Ser Lys
1025 1030 1035
Tyr Ala Thr Ser Tyr Ser Tyr Gln Phe His His Val Leu Lys Arg
1040 1045 1050
Ser Ser Leu Thr Phe Trp Arg Asn Leu Asn Tyr Ile Met Ala Lys
1055 1060 1065
Met Met Leu Leu Met Ile Ser Gly Leu Phe Ile Gly Phe Thr Phe
1070 1075 1080
Phe His Val Gly Val Asn Ala Ile Gly Leu Gln Asn Ser Leu Phe
1085 1090 1095
Ala Cys Phe Met Ala Ile Val Ile Ser Ala Pro Ala Thr Asn Gln
1100 1105 1110
Ile Gln Glu Arg Ala Thr Val Ala Lys Glu Leu Tyr Glu Val Arg
1115 1120 1125
Glu Ser Lys Ser Asn Met Phe His Trp Ser Leu Leu Leu Ile Thr
1130 1135 1140
His Tyr Leu Asn Glu Leu Pro Tyr His Leu Leu Phe Ser Thr Ile
1145 1150 1155
Phe Phe Val Ser Ser Tyr Phe Pro Leu Gly Val Phe Thr Glu Ala
1160 1165 1170
Ser Arg Ser Ser Val Phe Tyr Leu Asn Tyr Ala Ile Leu Phe Gln
1175 1180 1185
Leu Tyr Tyr Ile Gly Leu Ala Leu Met Ile Leu Tyr Met Ser Pro
1190 1195 1200
Asn Leu Gln Ser Ala Asn Val Ile Val Gly Phe Ile Leu Ser Phe
1205 1210 1215
Leu Leu Ser Phe Cys Gly Ala Val Gln Pro Ala Ser Leu Met Pro
1220 1225 1230
Gly Phe Trp Thr Phe Met Trp Lys Leu Ser Pro Tyr Thr Tyr Phe
1235 1240 1245
Leu Gln Asn Leu Val Gly Leu Leu Met His Asp Lys Pro Val Arg
1250 1255 1260
Cys Ser Lys Lys Glu Leu Ser Leu Phe Asn Pro Pro Val Gly Gln
1265 1270 1275
Thr Cys Gly Glu Phe Thr Lys Pro Phe Phe Glu Phe Gly Thr Gly
1280 1285 1290
Tyr Ile Ala Asn Pro Asp Ala Thr Ala Asp Cys Ala Tyr Cys Gln
1295 1300 1305
Tyr Lys Val Gly Asp Glu Tyr Leu Ala Arg Ile Asn Ala Ser Phe
1310 1315 1320
Ser Tyr Leu Trp Arg Asn Phe Gly Phe Ile
1325 1330
<210> 112
<211> 1501
<212> PRT
<213> Saccharomyces cerevisiae
<400> 112
Met Ser Asn Ile Lys Ser Thr Gln Asp Ser Ser His Asn Ala Val Ala
1 5 10 15
Arg Ser Ser Ser Ala Ser Phe Ala Ala Ser Glu Glu Ser Phe Thr Gly
20 25 30
Ile Thr His Asp Lys Asp Glu Gln Ser Asp Thr Pro Ala Asp Lys Leu
35 40 45
Thr Lys Met Leu Thr Gly Pro Ala Arg Asp Thr Ala Ser Gln Ile Ser
50 55 60
Ala Thr Val Ser Glu Met Ala Pro Asp Val Val Ser Lys Val Glu Ser
65 70 75 80
Phe Ala Asp Ala Leu Ser Arg His Thr Thr Arg Ser Gly Ala Phe Asn
85 90 95
Met Asp Ser Asp Ser Asp Asp Gly Phe Asp Ala His Ala Ile Phe Glu
100 105 110
Ser Phe Val Arg Asp Ala Asp Glu Gln Gly Ile His Ile Arg Lys Ala
115 120 125
Gly Val Thr Ile Glu Asp Val Ser Ala Lys Gly Val Asp Ala Ser Ala
130 135 140
Leu Glu Gly Ala Thr Phe Gly Asn Ile Leu Cys Leu Pro Leu Thr Ile
145 150 155 160
Phe Lys Gly Ile Lys Ala Lys Arg His Gln Lys Met Arg Gln Ile Ile
165 170 175
Ser Asn Val Asn Ala Leu Ala Glu Ala Gly Glu Met Ile Leu Val Leu
180 185 190
Gly Arg Pro Gly Ala Gly Cys Ser Ser Phe Leu Lys Val Thr Ala Gly
195 200 205
Glu Ile Asp Gln Phe Ala Gly Gly Val Ser Gly Glu Val Ala Tyr Asp
210 215 220
Gly Ile Pro Gln Glu Glu Met Met Lys Arg Tyr Lys Ala Asp Val Ile
225 230 235 240
Tyr Asn Gly Glu Leu Asp Val His Phe Pro Tyr Leu Thr Val Lys Gln
245 250 255
Thr Leu Asp Phe Ala Ile Ala Cys Lys Thr Pro Ala Leu Arg Val Asn
260 265 270
Asn Val Ser Lys Lys Glu Tyr Ile Ala Ser Arg Arg Asp Leu Tyr Ala
275 280 285
Thr Ile Phe Gly Leu Arg His Thr Tyr Asn Thr Lys Val Gly Asn Asp
290 295 300
Phe Val Arg Gly Val Ser Gly Gly Glu Arg Lys Arg Val Ser Ile Ala
305 310 315 320
Glu Ala Leu Ala Ala Lys Gly Ser Ile Tyr Cys Trp Asp Asn Ala Thr
325 330 335
Arg Gly Leu Asp Ala Ser Thr Ala Leu Glu Tyr Ala Lys Ala Ile Arg
340 345 350
Ile Met Thr Asn Leu Leu Lys Ser Thr Ala Phe Val Thr Ile Tyr Gln
355 360 365
Ala Ser Glu Asn Ile Tyr Glu Thr Phe Asp Lys Val Thr Val Leu Tyr
370 375 380
Ser Gly Lys Gln Ile Tyr Phe Gly Leu Ile His Glu Ala Lys Pro Tyr
385 390 395 400
Phe Ala Lys Met Gly Tyr Leu Cys Pro Pro Arg Gln Ala Thr Ala Glu
405 410 415
Phe Leu Thr Ala Leu Thr Asp Pro Asn Gly Phe His Leu Ile Lys Pro
420 425 430
Gly Tyr Glu Asn Lys Val Pro Arg Thr Ala Glu Glu Phe Glu Thr Tyr
435 440 445
Trp Leu Asn Ser Pro Glu Phe Ala Gln Met Lys Lys Asp Ile Ala Ala
450 455 460
Tyr Lys Glu Lys Val Asn Thr Glu Lys Thr Lys Glu Val Tyr Asp Glu
465 470 475 480
Ser Met Ala Gln Glu Lys Ser Lys Tyr Thr Arg Lys Lys Ser Tyr Tyr
485 490 495
Thr Val Ser Tyr Trp Glu Gln Val Lys Leu Cys Thr Gln Arg Gly Phe
500 505 510
Gln Arg Ile Tyr Gly Asn Lys Ser Tyr Thr Val Ile Asn Val Cys Ser
515 520 525
Ala Ile Ile Gln Ser Phe Ile Thr Gly Ser Leu Phe Tyr Asn Thr Pro
530 535 540
Ser Ser Thr Ser Gly Ala Phe Ser Arg Gly Gly Val Leu Tyr Phe Ala
545 550 555 560
Leu Leu Tyr Tyr Ser Leu Met Gly Leu Ala Asn Ile Ser Phe Glu His
565 570 575
Arg Pro Ile Leu Gln Lys His Lys Gly Tyr Ser Leu Tyr His Pro Ser
580 585 590
Ala Glu Ala Ile Gly Ser Thr Leu Ala Ser Phe Pro Phe Arg Met Ile
595 600 605
Gly Leu Thr Cys Phe Phe Ile Ile Leu Phe Phe Leu Ser Gly Leu His
610 615 620
Arg Thr Ala Gly Ser Phe Phe Thr Ile Tyr Leu Phe Leu Thr Met Cys
625 630 635 640
Ser Glu Ala Ile Asn Gly Leu Phe Glu Met Val Ser Ser Val Cys Asp
645 650 655
Thr Leu Ser Gln Ala Asn Ser Ile Ser Gly Ile Leu Met Met Ser Ile
660 665 670
Ser Met Tyr Ser Thr Tyr Met Ile Gln Leu Pro Ser Met His Pro Trp
675 680 685
Phe Lys Trp Ile Ser Tyr Val Leu Pro Ile Arg Tyr Ala Phe Glu Ser
690 695 700
Met Leu Asn Ala Glu Phe His Gly Arg His Met Asp Cys Ala Asn Thr
705 710 715 720
Leu Val Pro Ser Gly Gly Asp Tyr Asp Asn Leu Ser Asp Asp Tyr Lys
725 730 735
Val Cys Ala Phe Val Gly Ser Lys Pro Gly Gln Ser Tyr Val Leu Gly
740 745 750
Asp Asp Tyr Leu Lys Asn Gln Phe Gln Tyr Val Tyr Lys His Thr Trp
755 760 765
Arg Asn Phe Gly Ile Leu Trp Cys Phe Leu Leu Gly Tyr Val Val Leu
770 775 780
Lys Val Ile Phe Thr Glu Tyr Lys Arg Pro Val Lys Gly Gly Gly Asp
785 790 795 800
Ala Leu Ile Phe Lys Lys Gly Ser Lys Arg Phe Ile Ala His Ala Asp
805 810 815
Glu Glu Ser Pro Asp Asn Val Asn Asp Ile Asp Ala Lys Glu Gln Phe
820 825 830
Ser Ser Glu Ser Ser Gly Ala Asn Asp Glu Val Phe Asp Asp Leu Glu
835 840 845
Ala Lys Gly Val Phe Ile Trp Lys Asp Val Cys Phe Thr Ile Pro Tyr
850 855 860
Glu Gly Gly Lys Arg Met Leu Leu Asp Asn Val Ser Gly Tyr Cys Ile
865 870 875 880
Pro Gly Thr Met Thr Ala Leu Met Gly Glu Ser Gly Ala Gly Lys Thr
885 890 895
Thr Leu Leu Asn Thr Leu Ala Gln Arg Asn Val Gly Ile Ile Thr Gly
900 905 910
Asp Met Leu Val Asn Gly Arg Pro Ile Asp Ala Ser Phe Glu Arg Arg
915 920 925
Thr Gly Tyr Val Gln Gln Gln Asp Ile His Ile Ala Glu Leu Thr Val
930 935 940
Arg Glu Ser Leu Gln Phe Ser Ala Arg Met Arg Arg Pro Gln His Leu
945 950 955 960
Pro Asp Ser Glu Lys Met Asp Tyr Val Glu Lys Ile Ile Arg Val Leu
965 970 975
Gly Met Glu Glu Tyr Ala Glu Ala Leu Val Gly Glu Val Gly Cys Gly
980 985 990
Leu Asn Val Glu Gln Arg Lys Lys Leu Ser Ile Gly Val Glu Leu Val
995 1000 1005
Ala Lys Pro Asp Leu Leu Leu Phe Leu Asp Glu Pro Thr Ser Gly
1010 1015 1020
Leu Asp Ser Gln Ser Ser Trp Ala Ile Ile Gln Leu Leu Arg Lys
1025 1030 1035
Leu Ser Lys Ala Gly Gln Ser Ile Leu Cys Thr Ile His Gln Pro
1040 1045 1050
Ser Ala Thr Leu Phe Glu Glu Phe Asp Arg Leu Leu Leu Leu Arg
1055 1060 1065
Lys Gly Gly Gln Thr Val Tyr Phe Gly Asp Ile Gly Lys Asn Ser
1070 1075 1080
Ala Thr Ile Leu Asn Tyr Phe Glu Arg Asn Gly Ala Arg Lys Cys
1085 1090 1095
Asp Ser Ser Glu Asn Pro Ala Glu Tyr Ile Leu Glu Ala Ile Gly
1100 1105 1110
Ala Gly Ala Thr Ala Ser Val Lys Glu Asp Trp His Glu Lys Trp
1115 1120 1125
Leu Asn Ser Val Glu Phe Glu Gln Thr Lys Glu Lys Val Gln Asp
1130 1135 1140
Leu Ile Asn Asp Leu Ser Lys Gln Glu Thr Lys Ser Glu Val Gly
1145 1150 1155
Asp Lys Pro Ser Lys Tyr Ala Thr Ser Tyr Ala Tyr Gln Phe Arg
1160 1165 1170
Tyr Val Leu Ile Arg Thr Ser Thr Ser Phe Trp Arg Ser Leu Asn
1175 1180 1185
Tyr Ile Met Ser Lys Met Met Leu Met Leu Val Gly Gly Leu Tyr
1190 1195 1200
Ile Gly Phe Thr Phe Phe Asn Val Gly Lys Ser Tyr Val Gly Leu
1205 1210 1215
Gln Asn Ala Met Phe Ala Ala Phe Ile Ser Ile Ile Leu Ser Ala
1220 1225 1230
Pro Ala Met Asn Gln Ile Gln Gly Arg Ala Ile Ala Ser Arg Glu
1235 1240 1245
Leu Phe Glu Val Arg Glu Ser Gln Ser Asn Met Phe His Trp Ser
1250 1255 1260
Leu Val Leu Ile Thr Gln Tyr Leu Ser Glu Leu Pro Tyr His Leu
1265 1270 1275
Phe Phe Ser Thr Ile Phe Phe Val Ser Ser Tyr Phe Pro Leu Arg
1280 1285 1290
Ile Phe Phe Glu Ala Ser Arg Ser Ala Val Tyr Phe Leu Asn Tyr
1295 1300 1305
Cys Ile Met Phe Gln Leu Tyr Tyr Val Gly Leu Gly Leu Met Ile
1310 1315 1320
Leu Tyr Met Ser Pro Asn Leu Pro Ser Ala Asn Val Ile Leu Gly
1325 1330 1335
Leu Cys Leu Ser Phe Met Leu Ser Phe Cys Gly Val Thr Gln Pro
1340 1345 1350
Val Ser Leu Met Pro Gly Phe Trp Thr Phe Met Trp Lys Ala Ser
1355 1360 1365
Pro Tyr Thr Tyr Phe Val Gln Asn Leu Val Gly Ile Met Leu His
1370 1375 1380
Lys Lys Pro Val Val Cys Lys Lys Lys Glu Leu Asn Tyr Phe Asn
1385 1390 1395
Pro Pro Asn Gly Ser Thr Cys Gly Glu Tyr Met Lys Pro Phe Leu
1400 1405 1410
Glu Lys Ala Thr Gly Tyr Ile Glu Asn Pro Asp Ala Thr Ser Asp
1415 1420 1425
Cys Ala Tyr Cys Ile Tyr Glu Val Gly Asp Asn Tyr Leu Thr His
1430 1435 1440
Ile Ser Ser Lys Tyr Ser Tyr Leu Trp Arg Asn Phe Gly Ile Phe
1445 1450 1455
Trp Ile Tyr Ile Phe Phe Asn Ile Ile Ala Met Val Cys Val Tyr
1460 1465 1470
Tyr Leu Phe His Val Arg Gln Ser Ser Phe Leu Ser Pro Val Ser
1475 1480 1485
Ile Leu Asn Lys Ile Lys Asn Ile Arg Lys Lys Lys Gln
1490 1495 1500
<210> 113
<211> 1290
<212> PRT
<213> Saccharomyces cerevisiae
<400> 113
Met Asn Phe Leu Ser Phe Lys Thr Thr Lys His Tyr His Ile Phe Arg
1 5 10 15
Tyr Val Asn Ile Arg Asn Asp Tyr Arg Leu Leu Met Ile Met Ile Ile
20 25 30
Gly Thr Val Ala Thr Gly Leu Val Pro Ala Ile Thr Ser Ile Leu Thr
35 40 45
Gly Arg Val Phe Asp Leu Leu Ser Val Phe Val Ala Asn Gly Ser His
50 55 60
Gln Gly Leu Tyr Ser Gln Leu Val Gln Arg Ser Met Ala Val Met Ala
65 70 75 80
Leu Gly Ala Ala Ser Val Pro Val Met Trp Leu Ser Leu Thr Ser Trp
85 90 95
Met His Ile Gly Glu Arg Gln Gly Phe Arg Ile Arg Ser Gln Ile Leu
100 105 110
Glu Ala Tyr Leu Glu Glu Lys Pro Met Glu Trp Tyr Asp Asn Asn Glu
115 120 125
Lys Leu Leu Gly Asp Phe Thr Gln Ile Asn Arg Cys Val Glu Glu Leu
130 135 140
Arg Ser Ser Ser Ala Glu Ala Ser Ala Ile Thr Phe Gln Asn Leu Val
145 150 155 160
Ala Ile Cys Ala Leu Leu Gly Thr Ser Phe Tyr Tyr Ser Trp Ser Leu
165 170 175
Thr Leu Ile Ile Leu Cys Ser Ser Pro Ile Ile Thr Phe Phe Ala Val
180 185 190
Val Phe Ser Arg Met Ile His Val Tyr Ser Glu Lys Glu Asn Ser Glu
195 200 205
Thr Ser Lys Ala Ala Gln Leu Leu Thr Trp Ser Met Asn Ala Ala Gln
210 215 220
Leu Val Arg Leu Tyr Cys Thr Gln Arg Leu Glu Arg Lys Lys Phe Lys
225 230 235 240
Glu Ile Ile Leu Asn Cys Asn Thr Phe Phe Ile Lys Ser Cys Phe Phe
245 250 255
Val Ala Ala Asn Ala Gly Ile Leu Arg Phe Leu Thr Leu Thr Met Phe
260 265 270
Val Gln Gly Phe Trp Phe Gly Ser Ala Met Ile Lys Lys Gly Lys Leu
275 280 285
Asn Ile Asn Asp Val Ile Thr Cys Phe His Ser Cys Ile Met Leu Gly
290 295 300
Ser Thr Leu Asn Asn Thr Leu His Gln Ile Val Val Leu Gln Lys Gly
305 310 315 320
Gly Val Ala Met Glu Lys Ile Met Thr Leu Leu Lys Asp Gly Ser Lys
325 330 335
Arg Asn Pro Leu Asn Lys Thr Val Ala His Gln Phe Pro Leu Asp Tyr
340 345 350
Ala Thr Ser Asp Leu Thr Phe Ala Asn Val Ser Phe Ser Tyr Pro Ser
355 360 365
Arg Pro Ser Glu Ala Val Leu Lys Asn Val Ser Leu Asn Phe Ser Ala
370 375 380
Gly Gln Phe Thr Phe Ile Val Gly Lys Ser Gly Ser Gly Lys Ser Thr
385 390 395 400
Leu Ser Asn Leu Leu Leu Arg Phe Tyr Asp Gly Tyr Asn Gly Ser Ile
405 410 415
Ser Ile Asn Gly His Asn Ile Gln Thr Ile Asp Gln Lys Leu Leu Ile
420 425 430
Glu Asn Ile Thr Val Val Glu Gln Arg Cys Thr Leu Phe Asn Asp Thr
435 440 445
Leu Arg Lys Asn Ile Leu Leu Gly Ser Thr Asp Ser Val Arg Asn Ala
450 455 460
Asp Cys Ser Thr Asn Glu Asn Arg His Leu Ile Lys Asp Ala Cys Gln
465 470 475 480
Met Ala Leu Leu Asp Arg Phe Ile Leu Asp Leu Pro Asp Gly Leu Glu
485 490 495
Thr Leu Ile Gly Thr Gly Gly Val Thr Leu Ser Gly Gly Gln Gln Gln
500 505 510
Arg Val Ala Ile Ala Arg Ala Phe Ile Arg Asp Thr Pro Ile Leu Phe
515 520 525
Leu Asp Glu Ala Val Ser Ala Leu Asp Ile Val His Arg Asn Leu Leu
530 535 540
Met Lys Ala Ile Arg His Trp Arg Lys Gly Lys Thr Thr Ile Ile Leu
545 550 555 560
Thr His Glu Leu Ser Gln Ile Glu Ser Asp Asp Tyr Leu Tyr Leu Met
565 570 575
Lys Glu Gly Glu Val Val Glu Ser Gly Thr Gln Ser Glu Leu Leu Ala
580 585 590
Asp Pro Thr Thr Thr Phe Ser Thr Trp Tyr His Leu Gln Asn Asp Tyr
595 600 605
Ser Asp Ala Lys Thr Ile Val Asp Thr Glu Thr Glu Glu Lys Ser Ile
610 615 620
His Thr Val Glu Ser Phe Asn Ser Gln Leu Glu Thr Pro Lys Leu Gly
625 630 635 640
Ser Cys Leu Ser Asn Leu Gly Tyr Asp Glu Thr Asp Gln Leu Ser Phe
645 650 655
Tyr Glu Ala Ile Tyr Gln Lys Arg Ser Asn Val Arg Thr Arg Arg Val
660 665 670
Lys Val Glu Glu Glu Asn Ile Gly Tyr Ala Leu Lys Gln Gln Lys Asn
675 680 685
Thr Glu Ser Ser Thr Gly Pro Gln Leu Leu Ser Ile Ile Gln Ile Ile
690 695 700
Lys Arg Met Ile Lys Ser Ile Arg Tyr Lys Lys Ile Leu Ile Leu Gly
705 710 715 720
Leu Leu Cys Ser Leu Ile Ala Gly Ala Thr Asn Pro Val Phe Ser Tyr
725 730 735
Thr Phe Ser Phe Leu Leu Glu Gly Ile Val Pro Ser Thr Asp Gly Lys
740 745 750
Thr Gly Ser Ser His Tyr Leu Ala Lys Trp Ser Leu Leu Val Leu Gly
755 760 765
Val Ala Ala Ala Asp Gly Ile Phe Asn Phe Ala Lys Gly Phe Leu Leu
770 775 780
Asp Cys Cys Ser Glu Tyr Trp Val Met Asp Leu Arg Asn Glu Val Met
785 790 795 800
Glu Lys Leu Thr Arg Lys Asn Met Asp Trp Phe Ser Gly Glu Asn Asn
805 810 815
Lys Ala Ser Glu Ile Ser Ala Leu Val Leu Asn Asp Leu Arg Asp Leu
820 825 830
Arg Ser Leu Val Ser Glu Phe Leu Ser Ala Met Thr Ser Phe Val Thr
835 840 845
Val Ser Thr Ile Gly Leu Ile Trp Ala Leu Val Ser Gly Trp Lys Leu
850 855 860
Ser Leu Val Cys Ile Ser Met Phe Pro Leu Ile Ile Ile Phe Ser Ala
865 870 875 880
Ile Tyr Gly Gly Ile Leu Gln Lys Cys Glu Thr Asp Tyr Lys Thr Ser
885 890 895
Val Ala Gln Leu Glu Asn Cys Leu Tyr Gln Ile Val Thr Asn Ile Lys
900 905 910
Thr Ile Lys Cys Leu Gln Ala Glu Phe His Phe Gln Leu Thr Tyr His
915 920 925
Asp Leu Lys Ile Lys Met Gln Gln Ile Ala Ser Lys Arg Ala Ile Ala
930 935 940
Thr Gly Phe Gly Ile Ser Met Thr Asn Met Ile Val Met Cys Ile Gln
945 950 955 960
Ala Ile Ile Tyr Tyr Tyr Gly Leu Lys Leu Val Met Ile His Glu Tyr
965 970 975
Thr Ser Lys Glu Met Phe Thr Thr Phe Thr Leu Leu Leu Phe Thr Ile
980 985 990
Met Ser Cys Thr Ser Leu Val Ser Gln Ile Pro Asp Ile Ser Arg Gly
995 1000 1005
Gln Arg Ala Ala Ser Trp Ile Tyr Arg Ile Leu Asp Glu Lys His
1010 1015 1020
Asn Thr Leu Glu Val Glu Asn Asn Asn Ala Arg Thr Val Gly Ile
1025 1030 1035
Ala Gly His Thr Tyr His Gly Lys Glu Lys Lys Pro Ile Val Ser
1040 1045 1050
Ile Gln Asn Leu Thr Phe Ala Tyr Pro Ser Ala Pro Thr Ala Phe
1055 1060 1065
Val Tyr Lys Asn Met Asn Phe Asp Met Phe Cys Gly Gln Thr Leu
1070 1075 1080
Gly Ile Ile Gly Glu Ser Gly Thr Gly Lys Ser Thr Leu Val Leu
1085 1090 1095
Leu Leu Thr Lys Leu Tyr Asn Cys Glu Val Gly Lys Ile Lys Ile
1100 1105 1110
Asp Gly Thr Asp Val Asn Asp Trp Asn Leu Thr Ser Leu Arg Lys
1115 1120 1125
Glu Ile Ser Val Val Glu Gln Lys Pro Leu Leu Phe Asn Gly Thr
1130 1135 1140
Ile Arg Asp Asn Leu Thr Tyr Gly Leu Gln Asp Glu Ile Leu Glu
1145 1150 1155
Ile Glu Met Tyr Asp Ala Leu Lys Tyr Val Gly Ile His Asp Phe
1160 1165 1170
Val Ile Ser Ser Pro Gln Gly Leu Asp Thr Arg Ile Asp Thr Thr
1175 1180 1185
Leu Leu Ser Gly Gly Gln Ala Gln Arg Leu Cys Ile Ala Arg Ala
1190 1195 1200
Leu Leu Arg Lys Ser Lys Ile Leu Ile Leu Asp Glu Cys Thr Ser
1205 1210 1215
Ala Leu Asp Ser Val Ser Ser Ser Ile Ile Asn Glu Ile Val Lys
1220 1225 1230
Lys Gly Pro Pro Ala Leu Leu Thr Met Val Ile Thr His Ser Glu
1235 1240 1245
Gln Met Met Arg Ser Cys Asn Ser Ile Ala Val Leu Lys Asp Gly
1250 1255 1260
Lys Val Val Glu Arg Gly Asn Phe Asp Thr Leu Tyr Asn Asn Arg
1265 1270 1275
Gly Glu Leu Phe Gln Ile Val Ser Asn Gln Ser Ser
1280 1285 1290
<210> 114
<211> 1477
<212> PRT
<213> Saccharomyces cerevisiae
<400> 114
Met Thr Ile Thr Val Gly Asp Ala Val Ser Glu Thr Glu Leu Glu Asn
1 5 10 15
Lys Ser Gln Asn Val Val Leu Ser Pro Lys Ala Ser Ala Ser Ser Asp
20 25 30
Ile Ser Thr Asp Val Asp Lys Asp Thr Ser Ser Ser Trp Asp Asp Lys
35 40 45
Ser Leu Leu Pro Thr Gly Glu Tyr Ile Val Asp Arg Asn Lys Pro Gln
50 55 60
Thr Tyr Leu Asn Ser Asp Asp Ile Glu Lys Val Thr Glu Ser Asp Ile
65 70 75 80
Phe Pro Gln Lys Arg Leu Phe Ser Phe Leu His Ser Lys Lys Ile Pro
85 90 95
Glu Val Pro Gln Thr Asp Asp Glu Arg Lys Ile Tyr Pro Leu Phe His
100 105 110
Thr Asn Ile Ile Ser Asn Met Phe Phe Trp Trp Val Leu Pro Ile Leu
115 120 125
Arg Val Gly Tyr Lys Arg Thr Ile Gln Pro Asn Asp Leu Phe Lys Met
130 135 140
Asp Pro Arg Met Ser Ile Glu Thr Leu Tyr Asp Asp Phe Glu Lys Asn
145 150 155 160
Met Ile Tyr Tyr Phe Glu Lys Thr Arg Lys Lys Tyr Arg Lys Arg His
165 170 175
Pro Glu Ala Thr Glu Glu Glu Val Met Glu Asn Ala Lys Leu Pro Lys
180 185 190
His Thr Val Leu Arg Ala Leu Leu Phe Thr Phe Lys Lys Gln Tyr Phe
195 200 205
Met Ser Ile Val Phe Ala Ile Leu Ala Asn Cys Thr Ser Gly Phe Asn
210 215 220
Pro Met Ile Thr Lys Arg Leu Ile Glu Phe Val Glu Glu Lys Ala Ile
225 230 235 240
Phe His Ser Met His Val Asn Lys Gly Ile Gly Tyr Ala Ile Gly Ala
245 250 255
Cys Leu Met Met Phe Val Asn Gly Leu Thr Phe Asn His Phe Phe His
260 265 270
Thr Ser Gln Leu Thr Gly Val Gln Ala Lys Ser Ile Leu Thr Lys Ala
275 280 285
Ala Met Lys Lys Met Phe Asn Ala Ser Asn Tyr Ala Arg His Cys Phe
290 295 300
Pro Asn Gly Lys Val Thr Ser Phe Val Thr Thr Asp Leu Ala Arg Ile
305 310 315 320
Glu Phe Ala Leu Ser Phe Gln Pro Phe Leu Ala Gly Phe Pro Ala Ile
325 330 335
Leu Ala Ile Cys Ile Val Leu Leu Ile Val Asn Leu Gly Pro Ile Ala
340 345 350
Leu Val Gly Ile Gly Ile Phe Phe Gly Gly Phe Phe Ile Ser Leu Phe
355 360 365
Ala Phe Lys Leu Ile Leu Gly Phe Arg Ile Ala Ala Asn Ile Phe Thr
370 375 380
Asp Ala Arg Val Thr Met Met Arg Glu Val Leu Asn Asn Ile Lys Met
385 390 395 400
Ile Lys Tyr Tyr Thr Trp Glu Asp Ala Tyr Glu Lys Asn Ile Gln Asp
405 410 415
Ile Arg Thr Lys Glu Ile Ser Lys Val Arg Lys Met Gln Leu Ser Arg
420 425 430
Asn Phe Leu Ile Ala Met Ala Met Ser Leu Pro Ser Ile Ala Ser Leu
435 440 445
Val Thr Phe Leu Ala Met Tyr Lys Val Asn Lys Gly Gly Arg Gln Pro
450 455 460
Gly Asn Ile Phe Ala Ser Leu Ser Leu Phe Gln Val Leu Ser Leu Gln
465 470 475 480
Met Phe Phe Leu Pro Ile Ala Ile Gly Thr Gly Ile Asp Met Ile Ile
485 490 495
Gly Leu Gly Arg Leu Gln Ser Leu Leu Glu Ala Pro Glu Asp Asp Pro
500 505 510
Asn Gln Met Ile Glu Met Lys Pro Ser Pro Gly Phe Asp Pro Lys Leu
515 520 525
Ala Leu Lys Met Thr His Cys Ser Phe Glu Trp Glu Asp Tyr Glu Leu
530 535 540
Asn Asp Ala Ile Glu Glu Ala Lys Gly Glu Ala Lys Asp Glu Gly Lys
545 550 555 560
Lys Asn Lys Lys Lys Arg Lys Asp Thr Trp Gly Lys Pro Ser Ala Ser
565 570 575
Thr Asn Lys Ala Lys Arg Leu Asp Asn Met Leu Lys Asp Arg Asp Gly
580 585 590
Pro Glu Asp Leu Glu Lys Thr Ser Phe Arg Gly Phe Lys Asp Leu Asn
595 600 605
Phe Asp Ile Lys Lys Gly Glu Phe Ile Met Ile Thr Gly Pro Ile Gly
610 615 620
Thr Gly Lys Ser Ser Leu Leu Asn Ala Met Ala Gly Ser Met Arg Lys
625 630 635 640
Thr Asp Gly Lys Val Glu Val Asn Gly Asp Leu Leu Met Cys Gly Tyr
645 650 655
Pro Trp Ile Gln Asn Ala Ser Val Arg Asp Asn Ile Ile Phe Gly Ser
660 665 670
Pro Phe Asn Lys Glu Lys Tyr Asp Glu Val Val Arg Val Cys Ser Leu
675 680 685
Lys Ala Asp Leu Asp Ile Leu Pro Ala Gly Asp Met Thr Glu Ile Gly
690 695 700
Glu Arg Gly Ile Thr Leu Ser Gly Gly Gln Lys Ala Arg Ile Asn Leu
705 710 715 720
Ala Arg Ser Val Tyr Lys Lys Lys Asp Ile Tyr Leu Phe Asp Asp Val
725 730 735
Leu Ser Ala Val Asp Ser Arg Val Gly Lys His Ile Met Asp Glu Cys
740 745 750
Leu Thr Gly Met Leu Ala Asn Lys Thr Arg Ile Leu Ala Thr His Gln
755 760 765
Leu Ser Leu Ile Glu Arg Ala Ser Arg Val Ile Val Leu Gly Thr Asp
770 775 780
Gly Gln Val Asp Ile Gly Thr Val Asp Glu Leu Lys Ala Arg Asn Gln
785 790 795 800
Thr Leu Ile Asn Leu Leu Gln Phe Ser Ser Gln Asn Ser Glu Lys Glu
805 810 815
Asp Glu Glu Gln Glu Ala Val Val Ala Gly Glu Leu Gly Gln Leu Lys
820 825 830
Tyr Glu Ser Glu Val Lys Glu Leu Thr Glu Leu Lys Lys Lys Ala Thr
835 840 845
Glu Met Ser Gln Thr Ala Asn Ser Gly Lys Ile Val Ala Asp Gly His
850 855 860
Thr Ser Ser Lys Glu Glu Arg Ala Val Asn Ser Ile Ser Leu Lys Ile
865 870 875 880
Tyr Arg Glu Tyr Ile Lys Ala Ala Val Gly Lys Trp Gly Phe Ile Ala
885 890 895
Leu Pro Leu Tyr Ala Ile Leu Val Val Gly Thr Thr Phe Cys Ser Leu
900 905 910
Phe Ser Ser Val Trp Leu Ser Tyr Trp Thr Glu Asn Lys Phe Lys Asn
915 920 925
Arg Pro Pro Ser Phe Tyr Met Gly Leu Tyr Ser Phe Phe Val Phe Ala
930 935 940
Ala Phe Ile Phe Met Asn Gly Gln Phe Thr Ile Leu Cys Ala Met Gly
945 950 955 960
Ile Met Ala Ser Lys Trp Leu Asn Leu Arg Ala Val Lys Arg Ile Leu
965 970 975
His Thr Pro Met Ser Tyr Ile Asp Thr Thr Pro Leu Gly Arg Ile Leu
980 985 990
Asn Arg Phe Thr Lys Asp Thr Asp Ser Leu Asp Asn Glu Leu Thr Glu
995 1000 1005
Ser Leu Arg Leu Met Thr Ser Gln Phe Ala Asn Ile Val Gly Val
1010 1015 1020
Cys Val Met Cys Ile Val Tyr Leu Pro Trp Phe Ala Ile Ala Ile
1025 1030 1035
Pro Phe Leu Leu Val Ile Phe Val Leu Ile Ala Asp His Tyr Gln
1040 1045 1050
Ser Ser Gly Arg Glu Ile Lys Arg Leu Glu Ala Val Gln Arg Ser
1055 1060 1065
Phe Val Tyr Asn Asn Leu Asn Glu Val Leu Gly Gly Met Asp Thr
1070 1075 1080
Ile Lys Ala Tyr Arg Ser Gln Glu Arg Phe Leu Ala Lys Ser Asp
1085 1090 1095
Phe Leu Ile Asn Lys Met Asn Glu Ala Gly Tyr Leu Val Val Val
1100 1105 1110
Leu Gln Arg Trp Val Gly Ile Phe Leu Asp Met Val Ala Ile Ala
1115 1120 1125
Phe Ala Leu Ile Ile Thr Leu Leu Cys Val Thr Arg Ala Phe Pro
1130 1135 1140
Ile Ser Ala Ala Ser Val Gly Val Leu Leu Thr Tyr Val Leu Gln
1145 1150 1155
Leu Pro Gly Leu Leu Asn Thr Ile Leu Arg Ala Met Thr Gln Thr
1160 1165 1170
Glu Asn Asp Met Asn Ser Ala Glu Arg Leu Val Thr Tyr Ala Thr
1175 1180 1185
Glu Leu Pro Leu Glu Ala Ser Tyr Arg Lys Pro Glu Met Thr Pro
1190 1195 1200
Pro Glu Ser Trp Pro Ser Met Gly Glu Ile Ile Phe Glu Asn Val
1205 1210 1215
Asp Phe Ala Tyr Arg Pro Gly Leu Pro Ile Val Leu Lys Asn Leu
1220 1225 1230
Asn Leu Asn Ile Lys Ser Gly Glu Lys Ile Gly Ile Cys Gly Arg
1235 1240 1245
Thr Gly Ala Gly Lys Ser Thr Ile Met Ser Ala Leu Tyr Arg Leu
1250 1255 1260
Asn Glu Leu Thr Ala Gly Lys Ile Leu Ile Asp Asn Val Asp Ile
1265 1270 1275
Ser Gln Leu Gly Leu Phe Asp Leu Arg Arg Lys Leu Ala Ile Ile
1280 1285 1290
Pro Gln Asp Pro Val Leu Phe Arg Gly Thr Ile Arg Lys Asn Leu
1295 1300 1305
Asp Pro Phe Asn Glu Arg Thr Asp Asp Glu Leu Trp Asp Ala Leu
1310 1315 1320
Val Arg Gly Gly Ala Ile Ala Lys Asp Asp Leu Pro Glu Val Lys
1325 1330 1335
Leu Gln Lys Pro Asp Glu Asn Gly Thr His Gly Lys Met His Lys
1340 1345 1350
Phe His Leu Asp Gln Ala Val Glu Glu Glu Gly Ser Asn Phe Ser
1355 1360 1365
Leu Gly Glu Arg Gln Leu Leu Ala Leu Thr Arg Ala Leu Val Arg
1370 1375 1380
Gln Ser Lys Ile Leu Ile Leu Asp Glu Ala Thr Ser Ser Val Asp
1385 1390 1395
Tyr Glu Thr Asp Gly Lys Ile Gln Thr Arg Ile Val Glu Glu Phe
1400 1405 1410
Gly Asp Cys Thr Ile Leu Cys Ile Ala His Arg Leu Lys Thr Ile
1415 1420 1425
Val Asn Tyr Asp Arg Ile Leu Val Leu Glu Lys Gly Glu Val Ala
1430 1435 1440
Glu Phe Asp Thr Pro Trp Thr Leu Phe Ser Gln Glu Asp Ser Ile
1445 1450 1455
Phe Arg Ser Met Cys Ser Arg Ser Gly Ile Val Glu Asn Asp Phe
1460 1465 1470
Glu Asn Arg Ser
1475
<210> 115
<211> 1394
<212> PRT
<213> Saccharomyces cerevisiae
<400> 115
Met Ser Ile Ser Lys Tyr Phe Thr Pro Val Ala Asp Gly Ser Leu Thr
1 5 10 15
Phe Asn Gly Ala Asn Ile Gln Phe Gly Ala Asp Ala Gln Gly Glu Ser
20 25 30
Lys Lys Ser Tyr Asp Ala Glu Asp Ser Met Pro Asn Pro Ala Asn Gln
35 40 45
Leu Asn Asp Ile Thr Phe Gln Ala Glu Ala Gly Glu Met Val Leu Val
50 55 60
Leu Gly Tyr Pro Thr Ser Thr Leu Phe Lys Thr Leu Phe His Gly Lys
65 70 75 80
Thr Ser Leu Ser Tyr Ser Pro Pro Gly Ser Ile Lys Phe Lys Asn Asn
85 90 95
Glu Phe Lys Ser Phe Ser Glu Lys Cys Pro His Gln Ile Ile Tyr Asn
100 105 110
Asn Glu Gln Asp Val His Phe Pro Phe Leu Thr Val Glu Gln Thr Ile
115 120 125
Asp Phe Ala Leu Ser Cys Lys Phe Asp Ile Pro Lys Gly Glu Arg Asp
130 135 140
Gln Ile Arg Asn Glu Leu Leu Arg Glu Phe Gly Leu Ser His Val Leu
145 150 155 160
Lys Thr Ile Val Gly Asn Asp Phe Phe Arg Gly Val Ser Gly Gly Glu
165 170 175
Arg Lys Arg Ile Ser Ile Ile Glu Thr Phe Ile Ala Asn Gly Ser Val
180 185 190
Tyr Leu Trp Asp Asn Ser Thr Lys Gly Leu Asp Ser Ala Thr Ala Leu
195 200 205
Asp Phe Leu Glu Ile Leu Arg Lys Met Ala Lys Ala Thr Arg Ser Val
210 215 220
Asn Leu Val Arg Ile Ser Gln Ala Ser Asp Lys Ile Val Asp Lys Phe
225 230 235 240
Asp Lys Ile Leu Met Leu Ser Asp Ser Tyr Gln Leu Phe Tyr Gly Thr
245 250 255
Val Asp Glu Cys Leu Thr Tyr Phe Arg Asp Thr Leu Gly Ile Glu Lys
260 265 270
Asp Pro Asn Asp Cys Ile Ile Glu Tyr Leu Thr Ser Ile Leu Asn Phe
275 280 285
Gln Phe Lys Asn Lys Asn Leu Gly Asn Leu Ser Asn Ser Ser Ser Ala
290 295 300
Ser Val Leu Lys Thr Ala Thr Gly Glu Val Thr Lys Tyr Thr Tyr Asn
305 310 315 320
Ser Asp Phe Asp Leu Tyr Asp Gln Trp Lys His Ser Ser Tyr Tyr Arg
325 330 335
Asn Ile Lys Gln Gln Ile Gln Gly Ser Ser Ile Asp Asp Ser Ile Lys
340 345 350
Glu Val Asp Pro Ser Asp Val Ser Pro Ile Phe Asn Ile Pro Leu Lys
355 360 365
Lys Gln Leu Leu Phe Cys Thr Lys Arg Ala Phe Gln Arg Ser Leu Gly
370 375 380
Asp Lys Ala Tyr Met Thr Ala Gln Phe Ile Ser Val Val Ile Gln Ser
385 390 395 400
Leu Val Ile Gly Ser Leu Phe Tyr Glu Ile Pro Leu Thr Thr Ile Gly
405 410 415
Ser Tyr Ser Arg Gly Ser Leu Thr Phe Phe Ser Ile Leu Phe Phe Thr
420 425 430
Phe Leu Ser Leu Ala Asp Met Pro Ile Ala Phe Gln Arg Gln Pro Val
435 440 445
Val Lys Lys Gln Ser Gln Leu His Phe Tyr Thr Asn Trp Val Glu Thr
450 455 460
Leu Ser Thr Thr Val Phe Asp Tyr Cys Phe Lys Leu Cys Leu Val Ile
465 470 475 480
Val Phe Ser Ile Ile Leu Tyr Phe Leu Ala His Leu Gln Tyr Lys Ala
485 490 495
Ala Arg Phe Phe Ile Phe Leu Leu Phe Leu Ser Phe Tyr Asn Phe Cys
500 505 510
Met Val Ser Leu Phe Ala Leu Thr Thr Leu Val Ala Pro Thr Ile Ser
515 520 525
Val Ala Asn Leu Phe Ala Gly Ile Leu Leu Leu Ala Ile Ala Met Tyr
530 535 540
Ala Ser Tyr Val Ile Tyr Leu Lys Asn Met His Pro Trp Phe Val Trp
545 550 555 560
Ile Ala Tyr Leu Asn Pro Ala Met Tyr Ala Met Glu Ala Ile Leu Ser
565 570 575
Asn Glu Leu Tyr Asn Leu Lys Leu Asp Cys Ser Glu Thr Ile Val Pro
580 585 590
Arg Gly Pro Thr Tyr Asn Asp Val Pro Phe Ser His Lys Ala Cys Ala
595 600 605
Trp Gln Gly Ala Thr Leu Gly Asn Asp Tyr Val Arg Gly Arg Asp Tyr
610 615 620
Leu Lys Gln Gly Leu Ser Tyr Thr Tyr His His Val Trp Arg Asn Phe
625 630 635 640
Gly Ile Ile Ile Gly Phe Leu Val Phe Phe Ile Ala Cys Thr Leu Phe
645 650 655
Ala Ser Gln Tyr Ile Lys Pro Tyr Phe Asn Lys Asp Glu Ile Glu Arg
660 665 670
Asn Asn Ser Arg Leu Thr Arg Trp Leu Pro Phe Leu Asn Lys Lys Arg
675 680 685
Gly Thr Arg Ser Ser Ala Arg Asn Asp Ser Lys Tyr Val Gly Ile Pro
690 695 700
Lys Ser His Ser Val Ser Ser Ser Ser Ser Ser Leu Ser Ala Val Pro
705 710 715 720
Tyr Gln Ile Ser Pro Ser Asn Lys Glu Met Ala Leu Asn Asp Tyr Asn
725 730 735
Glu Gln Pro Ile Thr Glu Thr Val Glu Thr Gln Lys His Ile Ile Ser
740 745 750
Trp Lys Asn Ile Asn Tyr Thr Val Gly Thr Lys Lys Leu Ile Asn Asn
755 760 765
Ala Ser Gly Phe Ile Ser Ser Gly Leu Thr Ala Leu Met Gly Glu Ser
770 775 780
Gly Ala Gly Lys Thr Thr Leu Leu Asn Val Leu Ser Gln Arg Val Glu
785 790 795 800
Thr Gly Val Val Ser Gly Glu Ile Leu Ile Asp Gly His Pro Leu Thr
805 810 815
Asp Glu Asp Ala Phe Lys Arg Ser Ile Gly Phe Val Gln Gln Gln Asp
820 825 830
Leu His Leu Asp Leu Leu Ser Val Lys Glu Ser Leu Glu Ile Ser Cys
835 840 845
Leu Leu Arg Gly Asp Gly Asp Arg Ala Tyr Leu Asp Thr Val Ser Asn
850 855 860
Leu Leu Lys Leu Pro Ser Asp Ile Leu Val Ala Asp Leu Asn Pro Thr
865 870 875 880
Gln Arg Lys Leu Leu Ser Ile Gly Val Glu Leu Val Thr Lys Pro Ser
885 890 895
Leu Leu Leu Phe Leu Asp Glu Pro Thr Ser Gly Leu Asp Ala Glu Ala
900 905 910
Ala Leu Thr Ile Val Lys Phe Leu Lys Gln Leu Ser Leu Gln Gly Gln
915 920 925
Ala Ile Phe Cys Thr Ile His Gln Pro Ser Lys Ser Val Ile Ser His
930 935 940
Phe Asp Asn Ile Phe Leu Leu Lys Arg Gly Gly Glu Cys Val Phe Phe
945 950 955 960
Gly Pro Met Asp Asp Ala Cys Gly Tyr Phe Met Ser His Asp Asn Thr
965 970 975
Leu Val Tyr Asp Lys Glu His Asp Asn Pro Ala Asp Phe Val Ile Asp
980 985 990
Ala Val Gly Asn Ser Asn Ser Ser Ala Gly Lys Asp Thr Ala Glu Glu
995 1000 1005
Ala Leu Thr Leu Asn Lys Glu Ala Ile Asp Trp Ser Ala Leu Trp
1010 1015 1020
Glu Ser Ser Val Glu Lys Lys Leu Val Lys Lys Glu Thr Ala Arg
1025 1030 1035
Leu Glu Asp Asp Ala Arg Ala Ser Gly Val Asp Tyr Thr Thr Ser
1040 1045 1050
Leu Trp Lys Gln Pro Ser Tyr Leu Gln Gln Leu Ala Leu Ile Thr
1055 1060 1065
Arg Arg Gln Tyr Ile Cys Thr Lys Arg Asp Met Thr Tyr Val Met
1070 1075 1080
Ala Lys Tyr Cys Leu Asn Gly Gly Ala Gly Leu Phe Ile Gly Phe
1085 1090 1095
Ser Phe Trp His Ile Lys His Asn Ile Ile Gly Leu Gln Asp Ser
1100 1105 1110
Ile Phe Phe Cys Phe Met Ala Leu Cys Val Ser Ser Pro Leu Ile
1115 1120 1125
Asn Gln Ile Gln Asp Lys Ala Leu Lys Thr Lys Glu Val Tyr Val
1130 1135 1140
Ala Arg Glu Ala Arg Ser Asn Thr Tyr His Trp Thr Val Leu Leu
1145 1150 1155
Leu Ser Gln Ser Ile Ile Glu Leu Pro Leu Ala Leu Thr Ser Ser
1160 1165 1170
Thr Leu Phe Phe Val Cys Ala Phe Phe Ser Cys Gly Phe Asn Asn
1175 1180 1185
Ala Gly Trp Ser Ala Gly Val Phe Phe Leu Asn Tyr Met Leu Phe
1190 1195 1200
Ala Ala Tyr Tyr Ser Thr Leu Gly Leu Trp Leu Ile Tyr Thr Ala
1205 1210 1215
Pro Asn Leu Gln Thr Ala Ala Val Phe Val Ala Phe Ile Tyr Ser
1220 1225 1230
Phe Thr Ala Ser Phe Cys Gly Val Met Gln Pro Tyr Ser Leu Phe
1235 1240 1245
Pro Thr Phe Trp Lys Phe Met Tyr Arg Val Ser Pro Tyr Thr Tyr
1250 1255 1260
Phe Val Glu Thr Phe Val Ser Ile Leu Leu His Asn Trp Glu Ile
1265 1270 1275
Lys Cys Asp Met Ser Glu Met Val Pro Gly Gln Pro Leu Thr Gly
1280 1285 1290
Gln Ser Cys Gly Gln Phe Met Glu Ala Phe Ile Glu Glu Tyr Gly
1295 1300 1305
Gly Tyr Leu His Asn Lys Asn Thr Phe Thr Val Cys Ala Tyr Cys
1310 1315 1320
Thr Tyr Thr Val Gly Asp Asp Phe Leu Lys Asn Glu Asn Met Ser
1325 1330 1335
Tyr Asp His Val Trp Arg Asn Phe Gly Ile Glu Trp Ala Phe Val
1340 1345 1350
Gly Phe Asn Phe Phe Ala Met Phe Ala Gly Tyr Tyr Leu Thr Tyr
1355 1360 1365
Val Ala Arg Ile Trp Pro Lys Val Phe Lys Ile Ile Thr Lys Val
1370 1375 1380
Ile Pro His Arg Gly Lys Lys Pro Val Gln Asn
1385 1390
<210> 116
<211> 1294
<212> PRT
<213> Saccharomyces cerevisiae
<400> 116
Met Ser Gln Gln Glu Asn Gly Asp Val Ala Thr Glu Leu Ile Glu Asn
1 5 10 15
Arg Leu Ser Phe Ser Arg Ile Pro Arg Ile Ser Leu His Val Arg Asp
20 25 30
Leu Ser Ile Val Ala Ser Lys Thr Asn Thr Thr Leu Val Asn Thr Phe
35 40 45
Ser Met Asp Leu Pro Ser Gly Ser Val Met Ala Val Met Gly Gly Ser
50 55 60
Gly Ser Gly Lys Thr Thr Leu Leu Asn Val Leu Ala Ser Lys Ile Ser
65 70 75 80
Gly Gly Leu Thr His Asn Gly Ser Ile Arg Tyr Val Leu Glu Asp Thr
85 90 95
Gly Ser Glu Pro Asn Glu Thr Glu Pro Lys Arg Ala His Leu Asp Gly
100 105 110
Gln Asp His Pro Ile Gln Lys His Val Ile Met Ala Tyr Leu Pro Gln
115 120 125
Gln Asp Val Leu Ser Pro Arg Leu Thr Cys Arg Glu Thr Leu Lys Phe
130 135 140
Ala Ala Asp Leu Lys Leu Asn Ser Ser Glu Arg Thr Lys Lys Leu Met
145 150 155 160
Val Glu Gln Leu Ile Glu Glu Leu Gly Leu Lys Asp Cys Ala Asp Thr
165 170 175
Leu Val Gly Asp Asn Ser His Arg Gly Leu Ser Gly Gly Glu Lys Arg
180 185 190
Arg Leu Ser Ile Gly Thr Gln Met Ile Ser Asn Pro Ser Ile Met Phe
195 200 205
Leu Asp Glu Pro Thr Thr Gly Leu Asp Ala Tyr Ser Ala Phe Leu Val
210 215 220
Ile Lys Thr Leu Lys Lys Leu Ala Lys Glu Asp Gly Arg Thr Phe Ile
225 230 235 240
Met Ser Ile His Gln Pro Arg Ser Asp Ile Leu Phe Leu Leu Asp Gln
245 250 255
Val Cys Ile Leu Ser Lys Gly Asn Val Val Tyr Cys Asp Lys Met Asp
260 265 270
Asn Thr Ile Pro Tyr Phe Glu Ser Ile Gly Tyr His Val Pro Gln Leu
275 280 285
Val Asn Pro Ala Asp Tyr Phe Ile Asp Leu Ser Ser Val Asp Ser Arg
290 295 300
Ser Asp Lys Glu Glu Ala Ala Thr Gln Ser Arg Leu Asn Ser Leu Ile
305 310 315 320
Asp His Trp His Asp Tyr Glu Arg Thr His Leu Gln Leu Gln Ala Glu
325 330 335
Ser Tyr Ile Ser Asn Ala Thr Glu Ile Gln Ile Gln Asn Met Thr Thr
340 345 350
Arg Leu Pro Phe Trp Lys Gln Val Thr Val Leu Thr Arg Arg Asn Phe
355 360 365
Lys Leu Asn Phe Ser Asp Tyr Val Thr Leu Ile Ser Thr Phe Ala Glu
370 375 380
Pro Leu Ile Ile Gly Thr Val Cys Gly Trp Ile Tyr Tyr Lys Pro Asp
385 390 395 400
Lys Ser Ser Ile Gly Gly Leu Arg Thr Thr Thr Ala Cys Leu Tyr Ala
405 410 415
Ser Thr Ile Leu Gln Cys Tyr Leu Tyr Leu Leu Phe Asp Thr Tyr Arg
420 425 430
Leu Cys Glu Gln Asp Ile Ala Leu Tyr Asp Arg Glu Arg Ala Glu Gly
435 440 445
Ser Val Thr Pro Leu Ala Phe Ile Val Ala Arg Lys Ile Ser Leu Phe
450 455 460
Leu Ser Asp Asp Phe Ala Met Thr Met Ile Phe Val Ser Ile Thr Tyr
465 470 475 480
Phe Met Phe Gly Leu Glu Ala Asp Ala Arg Lys Phe Phe Tyr Gln Phe
485 490 495
Ala Val Val Phe Leu Cys Gln Leu Ser Cys Ser Gly Leu Ser Met Leu
500 505 510
Ser Val Ala Val Ser Arg Asp Phe Ser Lys Ala Ser Leu Val Gly Asn
515 520 525
Met Thr Phe Thr Val Leu Ser Met Gly Cys Gly Phe Phe Val Asn Ala
530 535 540
Lys Val Met Pro Val Tyr Val Arg Trp Ile Lys Tyr Ile Ala Phe Thr
545 550 555 560
Trp Tyr Ser Phe Gly Thr Leu Met Ser Ser Thr Phe Thr Asn Ser Tyr
565 570 575
Cys Thr Thr Asp Asn Leu Asp Glu Cys Leu Gly Asn Gln Ile Leu Glu
580 585 590
Val Tyr Gly Phe Pro Arg Asn Trp Ile Thr Val Pro Ala Val Val Leu
595 600 605
Leu Cys Trp Ser Val Gly Tyr Phe Val Val Gly Ala Ile Ile Leu Tyr
610 615 620
Leu His Lys Ile Asp Ile Thr Leu Gln Asn Glu Val Lys Ser Lys Gln
625 630 635 640
Lys Lys Ile Lys Lys Lys Ser Pro Thr Gly Met Lys Pro Glu Ile Gln
645 650 655
Leu Leu Asp Asp Val Tyr His Gln Lys Asp Leu Glu Ala Glu Lys Gly
660 665 670
Lys Asn Ile His Ile Thr Ile Lys Leu Glu Asp Ile Asp Leu Arg Val
675 680 685
Ile Phe Ser Ala Pro Phe Ser Asn Trp Lys Glu Gly Asn Phe His His
690 695 700
Glu Thr Lys Glu Ile Leu Gln Ser Val Asn Ala Ile Phe Lys Pro Gly
705 710 715 720
Met Ile Asn Ala Ile Met Gly Pro Ser Gly Ser Gly Lys Ser Ser Leu
725 730 735
Leu Asn Leu Ile Ser Gly Arg Leu Lys Ser Ser Val Phe Ala Lys Phe
740 745 750
Asp Thr Ser Gly Ser Ile Met Phe Asn Asp Ile Gln Val Ser Glu Leu
755 760 765
Met Phe Lys Asn Val Cys Ser Tyr Val Ser Gln Asp Asp Asp His Leu
770 775 780
Leu Ala Ala Leu Thr Val Lys Glu Thr Leu Lys Tyr Ala Ala Ala Leu
785 790 795 800
Arg Leu His His Leu Thr Glu Ala Glu Arg Met Glu Arg Thr Asp Asn
805 810 815
Leu Ile Arg Ser Leu Gly Leu Lys His Cys Glu Asn Asn Ile Ile Gly
820 825 830
Asn Glu Phe Val Lys Gly Ile Ser Gly Gly Glu Lys Arg Arg Val Thr
835 840 845
Met Gly Val Gln Leu Leu Asn Asp Pro Pro Ile Leu Leu Leu Asp Glu
850 855 860
Pro Thr Ser Gly Leu Asp Ser Phe Thr Ser Ala Thr Ile Leu Glu Ile
865 870 875 880
Leu Glu Lys Leu Cys Arg Glu Gln Gly Lys Thr Ile Ile Ile Thr Ile
885 890 895
His Gln Pro Arg Ser Glu Leu Phe Lys Arg Phe Gly Asn Val Leu Leu
900 905 910
Leu Ala Lys Ser Gly Arg Thr Ala Phe Asn Gly Ser Pro Asp Glu Met
915 920 925
Ile Ala Tyr Phe Thr Glu Leu Gly Tyr Asn Cys Pro Ser Phe Thr Asn
930 935 940
Val Ala Asp Phe Phe Leu Asp Leu Ile Ser Val Asn Thr Gln Asn Glu
945 950 955 960
Gln Asn Glu Ile Ser Ser Arg Ala Arg Val Glu Lys Ile Leu Ser Ala
965 970 975
Trp Lys Ala Asn Met Asp Asn Glu Ser Leu Ser Pro Thr Pro Ile Ser
980 985 990
Glu Lys Gln Gln Tyr Ser Gln Glu Ser Phe Phe Thr Glu Tyr Ser Glu
995 1000 1005
Phe Val Arg Lys Pro Ala Asn Leu Val Leu Ala Tyr Ile Val Asn
1010 1015 1020
Val Lys Arg Gln Phe Thr Thr Thr Arg Arg Ser Phe Asp Ser Leu
1025 1030 1035
Met Ala Arg Ile Ala Gln Ile Pro Gly Leu Gly Val Ile Phe Ala
1040 1045 1050
Leu Phe Phe Ala Pro Val Lys His Asn Tyr Thr Ser Ile Ser Asn
1055 1060 1065
Arg Leu Gly Leu Ala Gln Glu Ser Thr Ala Leu Tyr Phe Val Gly
1070 1075 1080
Met Leu Gly Asn Leu Ala Cys Tyr Pro Thr Glu Arg Asp Tyr Phe
1085 1090 1095
Tyr Glu Glu Tyr Asn Asp Asn Val Tyr Gly Ile Ala Pro Phe Phe
1100 1105 1110
Leu Ala Tyr Met Thr Leu Glu Leu Pro Leu Ser Ala Leu Ala Ser
1115 1120 1125
Val Leu Tyr Ala Val Phe Thr Val Leu Ala Cys Gly Leu Pro Arg
1130 1135 1140
Thr Ala Gly Asn Phe Phe Ala Thr Val Tyr Cys Ser Phe Ile Val
1145 1150 1155
Thr Cys Cys Gly Glu Ala Leu Gly Ile Met Thr Asn Thr Phe Phe
1160 1165 1170
Glu Arg Pro Gly Phe Val Val Asn Cys Ile Ser Ile Ile Leu Ser
1175 1180 1185
Ile Gly Thr Gln Met Ser Gly Leu Met Ser Leu Gly Met Ser Arg
1190 1195 1200
Val Leu Lys Gly Phe Asn Tyr Leu Asn Pro Val Gly Tyr Thr Ser
1205 1210 1215
Met Ile Ile Ile Asn Phe Ala Phe Pro Gly Asn Leu Lys Leu Thr
1220 1225 1230
Cys Glu Asp Gly Gly Lys Asn Ser Asp Gly Thr Cys Glu Phe Ala
1235 1240 1245
Asn Gly His Asp Val Leu Val Ser Tyr Gly Leu Val Arg Asn Thr
1250 1255 1260
Gln Lys Tyr Leu Gly Ile Ile Val Cys Val Ala Ile Ile Tyr Arg
1265 1270 1275
Leu Ile Ala Phe Phe Ile Leu Lys Ala Lys Leu Glu Trp Ile Lys
1280 1285 1290
Trp
<210> 117
<211> 542
<212> PRT
<213> Saccharomyces cerevisiae
<400> 117
Met Ser Val Gln Lys Glu Glu Tyr Asp Ile Val Glu Lys Ala Gln Leu
1 5 10 15
Ser Val Ser Ala Glu Ser Leu Thr Ser Asp Ser Glu Ser Ile Ser His
20 25 30
Asn Pro Phe Asp Asp Phe His Lys Ala Glu Arg Trp Arg Lys Val Tyr
35 40 45
Glu Ser Ser Gly Tyr Glu Gly Leu Ser Lys Phe Asp Pro Glu Phe Thr
50 55 60
Trp Thr Lys Asp Glu Glu Lys Lys Leu Val Arg Lys Met Asp Leu Lys
65 70 75 80
Ile Phe Leu Trp Val Phe Ile Met Phe Ala Phe Leu Asp Leu Ile Arg
85 90 95
Lys Asn Ile Ala Arg Ala Val Ser Asp Asn Phe Ile Val Asp Leu Lys
100 105 110
Met Asn Thr Asn Asp Tyr Asn Leu Gly Gln Thr Val Tyr Leu Val Ile
115 120 125
Phe Leu Ala Ser Glu Leu Pro Gly Asn Leu Leu Ser Lys Arg Phe Gly
130 135 140
Pro Glu Arg Val Ile Pro Val Gln Ile Val Leu Trp Ser Val Ile Cys
145 150 155 160
Ile Thr Gln Ala Gly Leu Lys Asn Arg Gly Gln Phe Ile Ala Thr Arg
165 170 175
Cys Leu Leu Gly Met Val Gln Gly Gly Phe Ile Pro Asp Asn Ile Leu
180 185 190
Tyr Leu Ser Tyr Tyr Tyr Thr Gly Ala Glu Leu Thr Phe Arg Leu Ser
195 200 205
Phe Phe Trp Cys Ala Ile Pro Leu Phe Gln Ile Leu Gly Ser Leu Leu
210 215 220
Ala Ser Gly Ile Ile Glu Met Arg Gly Ile His Asn Leu Ala Gly Trp
225 230 235 240
Gln Tyr Leu Phe Ile Ile Glu Gly Phe Leu Ser Leu Ser Val Gly Val
245 250 255
Ala Ser Phe Tyr Leu Met Arg Arg Gly Pro Thr Gln Thr Gly Glu Ser
260 265 270
Ala Phe His Lys Gly Lys Ser Leu Phe Thr Glu Tyr Glu Glu Lys Ile
275 280 285
Met Val Asn Arg Ile Leu Arg Asp Asp Pro Ser Lys Gly Asp Met Ser
290 295 300
Asn Arg Gln Pro Val Thr Phe Lys Glu Ile Leu Tyr Thr Leu Thr Glu
305 310 315 320
Phe Asp Leu Trp Pro Leu Phe Ile Gln Gly Ile Thr Ala Phe Ile Ser
325 330 335
Leu Gln Thr Val Gly Ser Tyr Leu Ser Leu Ile Leu Lys Ser Leu Asn
340 345 350
Tyr Ser Thr Phe Leu Ser Asn Ile Leu Ala Ile Pro Gly Gln Ala Leu
355 360 365
Leu Leu Ile Asn Leu Pro Leu Ala Ala Leu Leu Ser Arg Lys Leu Lys
370 375 380
Glu Lys Ser Leu Cys Val Gly Ile Ala Asn Val Trp Val Leu Pro Phe
385 390 395 400
Ile Val Ser Leu Val Ala Leu Pro Thr Asp Thr Asn Pro Trp Ile Lys
405 410 415
Tyr Ile Leu Leu Thr Gly Ile Leu Gly Leu Pro Tyr Thr His Ser Ile
420 425 430
Leu Ala Gly Trp Val Ser Glu Ile Ser Asn Ser Val Arg Ser Arg Thr
435 440 445
Val Gly Thr Ala Leu Tyr Asn Met Ser Ala Gln Val Gly Ala Ile Ile
450 455 460
Ala Ser Asn Met Tyr Arg Asn Asp Asp Lys Pro Tyr Tyr Thr Arg Gly
465 470 475 480
Asn Lys Ile Leu Leu Gly Phe Thr Cys Phe Asn Ile Cys Met Ala Val
485 490 495
Ala Thr Lys Phe Tyr Tyr Ile Ser Arg Asn Lys Tyr Lys Asp Arg Lys
500 505 510
Trp Asn Ser Met Thr Lys Glu Glu Gln Ile Asn Tyr Leu Asp Thr Thr
515 520 525
Lys Asp Lys Gly Met Lys Arg Leu Asp Tyr Arg Phe Ile His
530 535 540
<210> 118
<211> 523
<212> PRT
<213> Saccharomyces cerevisiae
<400> 118
Met Lys Asn Met Ser Gln Arg Ser Met Asp Val Glu Lys Lys Ala Ala
1 5 10 15
Asn Ala Asp Ser Cys Ser Val Ser Thr Ser Ser Ile Asn Val Asp Asp
20 25 30
Ala Asp Val Ala Leu Arg Phe Leu Lys Gln Asn Gly Leu Asp Glu Ser
35 40 45
Ser Thr Ala Asn Glu Asp Asp Val Val Ala Gly Glu Glu Ala Asn Phe
50 55 60
Tyr Gly Ser His Glu Leu Ser Pro Lys Val Leu Arg Lys Val Asp Leu
65 70 75 80
Phe Ile Leu Pro Phe Leu Cys Cys Thr Tyr Leu Leu Met Phe Leu Asp
85 90 95
Lys Ala Leu Leu Asn Tyr Ala Ala Ser Met Gly Ile Lys Asp His Leu
100 105 110
Lys Gly Asn Glu Phe Ser Asn Leu Gly Thr Ile Phe Ser Ala Ala Tyr
115 120 125
Ile Phe Met Glu Pro Val Val Thr Tyr Leu Ile Gln Lys Phe Pro Ile
130 135 140
Ser Lys Ile Leu Gly Thr Phe Ile Thr Val Trp Gly Ile Val Leu Ala
145 150 155 160
Cys His Ala Ala Cys Lys Thr Tyr Ala Ser Leu Met Val Val Arg Thr
165 170 175
Leu Leu Gly Leu Phe Glu Ser Ser Ser Ala Val Gly Cys Ile Ala Ile
180 185 190
Ser Gly Met Tyr Tyr Thr Lys Ser Glu Gln Ser Ala Arg Ile Gly Phe
195 200 205
Trp Ala Thr Gln Ala Gly Thr Gly Tyr Ile Val Gly Gly Leu Ile Ser
210 215 220
Phe Gly Phe Leu His Tyr His Gly Thr Ala Phe Thr Ser Trp Gln Ile
225 230 235 240
Met Phe Leu Val Val Gly Leu Val Thr Val Ala Phe Gly Val Leu Thr
245 250 255
Phe Leu Tyr Leu Pro Asp Asn Val Thr Asn Ala Trp Phe Leu Asn Lys
260 265 270
Glu Glu Lys Ile Gln Val Val Glu His Ile Arg Ala Asn Gln Thr Gly
275 280 285
Leu Glu Thr Lys Lys Phe Lys Lys Gln Gln Val Lys Glu Leu Phe Leu
290 295 300
His Asp Lys Phe Thr Trp Pro Met Leu Leu Leu Thr Ala Cys Ser Gln
305 310 315 320
Ile Ser Thr Gly Ala Ile Gly Thr Phe Ser Val Thr Ile Thr Gly Thr
325 330 335
Phe Gly Phe Asp Lys Tyr Glu Thr Ala Leu Leu Gln Leu Pro Ile Gly
340 345 350
Ala Ile Thr Ala Met Ile Ile Leu Ile Thr Thr Gln Met Leu Ser Arg
355 360 365
Trp Gly His Ile Thr Leu Ile Thr Thr Ser Met Tyr Ile Pro Ala Ile
370 375 380
Ile Gly Cys Ile Val Leu Ile Ser Leu Pro Leu Ser His Lys Ile Gly
385 390 395 400
Asn Leu Phe Ser Leu Tyr Leu Leu Tyr Ser Gly Ser Cys Val Ile Thr
405 410 415
Asn Ile Tyr Ile Trp Asn Ser Cys Asn Thr Ser Gly Tyr Thr Lys Arg
420 425 430
Val Phe Arg Asn Ala Ile Thr Met Ile Val Tyr Asn Val Ser Cys Ile
435 440 445
Ile Ala Pro Gln Met Phe Arg Ala Tyr Ser Ala Pro Arg Tyr Ile Pro
450 455 460
Ala Lys Ile Ala Leu Leu Val Thr Gln Cys Val Cys Val Pro Leu Gln
465 470 475 480
Leu Tyr Ile Gly Tyr Ile Cys Lys Lys Glu Asn Glu Lys Arg Asp Lys
485 490 495
Glu Gln Glu Gly Gln Glu Arg Lys Lys Tyr Gln Phe Leu Asp Leu Thr
500 505 510
Asp Ile Glu Asn Arg Asn Phe Arg Tyr Ile Tyr
515 520
<210> 119
<211> 1218
<212> PRT
<213> Saccharomyces cerevisiae
<400> 119
Met Ile Lys Asn Gly Thr Cys Pro Tyr Trp Glu Arg Asp Asp Leu Ser
1 5 10 15
Glu Cys Ala Arg Arg Glu Tyr Ile Glu Phe Lys Phe Pro Leu Phe Ile
20 25 30
Leu Leu Thr Gly Met Ile Tyr Ala Phe Cys Lys Val Phe Arg Ala Phe
35 40 45
Tyr Leu Arg Gly Lys Asn His Thr Asn Glu Ala Pro Glu Phe Glu Glu
50 55 60
Gln Gly Asn Gly Asn His Glu Tyr Ala Arg Phe Ser Val Leu Arg Leu
65 70 75 80
Lys Ser Ala Trp Glu Ser Arg Ser Phe Cys Asn Val Asn Asn Arg Ser
85 90 95
Thr Phe Asp Lys Phe Lys Lys Phe Ile Glu Gly Ala Phe Ile Val Leu
100 105 110
Gln Leu Thr Ile His Leu Tyr Ile Leu Ser Ser Met Pro Met Asp Asn
115 120 125
Lys Lys Phe Phe His Gln Gly Phe Leu Val Gln Met Phe Leu Trp Ile
130 135 140
Leu Leu Leu Val Val Ile Thr Leu Arg Leu Ile Ser Ala Ser Gln Ser
145 150 155 160
Phe Arg Trp Val Leu Ala Cys Lys Arg Asp Leu Trp Ala Val Ser Phe
165 170 175
Tyr Ser Tyr Ala Ser Leu Phe Thr Leu Ser Ile Leu Pro Leu Arg Ser
180 185 190
Val Phe Ile Gly Lys Ile Lys Asp Lys Ile Met Val Lys Tyr Ile Ile
195 200 205
Ser Glu Thr Phe Ile Asp Leu Ala Leu Leu Leu Leu Leu Ser Thr Ser
210 215 220
Ser Ile Glu Gly Thr Arg Tyr Ser Phe Leu Val Glu Asn Glu Asn Lys
225 230 235 240
Lys Leu Pro Pro Ala Pro Thr Val Phe Gly Leu Leu Thr Phe Ser Arg
245 250 255
Ile Asp Arg Leu Ile Trp Lys Ala Tyr Lys His Cys Leu Gly Asn Ala
260 265 270
Asp Ile Trp Asp Leu Asp Ile Asn Asn Lys Ser Ile Ala Ile Leu Ala
275 280 285
Asn Phe Glu Met Ser Ser Lys Lys Gly Arg Leu Leu Pro Asn Ile Ile
290 295 300
Cys Tyr Phe Lys Ala Val Phe Ile Ser Gln Leu Phe Leu Ala Phe Val
305 310 315 320
Ser Ser Phe Leu Asn Phe Val Pro Ser Leu Leu Met Pro Arg Ile Leu
325 330 335
Ser Tyr Val Asn Asp Pro Lys Ser Lys Ser Trp Asn Leu Val Ser Leu
340 345 350
Tyr Val Ser Ser Met Leu Val Ser Lys Ile Ile Ala Thr Thr Cys Arg
355 360 365
Gly Gln Gly Leu Phe Leu Gly Glu Lys Gly Thr Met Gln Leu Arg Thr
370 375 380
Val Leu Ile Ser Asn Ile Tyr Ser Lys Thr Leu Arg Arg Thr Ile Leu
385 390 395 400
Lys Asp Ser Thr Thr Ser Leu Gln Lys Asn Ala Ser Thr Ser Phe Glu
405 410 415
Glu Asn Pro Asp Ser Ser Glu Ala Glu Pro Arg Lys Lys Ser Ser Arg
420 425 430
Lys Asp Asn Ser Val Asn Asn Val Met Ser Ile Asp Ala Phe Lys Val
435 440 445
Ser Glu Ala Met Asn Thr Phe Tyr Leu Ala Cys Glu Ala Val Phe Met
450 455 460
Thr Val Thr Ala Leu Met Ile Leu Tyr Ser Leu Leu Gly Trp Ser Ala
465 470 475 480
Phe Ala Gly Thr Phe Ala Leu Leu Ala Met Ile Pro Leu Asn Phe Trp
485 490 495
Cys Ala Thr Phe Tyr Gly Asn Tyr Gln Ala Asp Gln Leu Ile Leu Thr
500 505 510
Asp Lys Arg Thr Ser Gly Ile Ser Glu Ala Leu Asn Ser Ile Arg Val
515 520 525
Ile Lys Leu Leu Ala Trp Glu Asn Leu Phe Tyr Gln Lys Ile Ile Asn
530 535 540
Val Arg Asp Gly Glu Ile Arg Leu Leu Lys Lys Lys Ala Thr Ile Phe
545 550 555 560
Phe Leu Asn His Leu Ile Trp Phe Phe Gly Pro Thr Leu Val Ser Ala
565 570 575
Ile Thr Phe Ser Val Phe Ile Lys Phe Gln Asn Gln Thr Leu Thr Pro
580 585 590
Thr Ile Ala Phe Thr Ala Leu Ser Leu Phe Ala Ile Leu Arg Thr Pro
595 600 605
Met Asp Gln Ile Ala Ser Thr Val Ser Leu Leu Ile Gln Ser Phe Ile
610 615 620
Ser Leu Glu Arg Ile Gln Asp Tyr Leu Asn Glu Ser Glu Thr Arg Lys
625 630 635 640
Tyr Glu Ile Leu Glu Gln Ser Asn Thr Lys Phe Gly Phe Glu Asp Ala
645 650 655
Ser Met Glu Trp Glu Ala Ala Glu Thr Ser Phe Lys Leu Lys Asn Ile
660 665 670
Ser Ile Asp Phe Lys Leu Asn Ser Leu Asn Ala Ile Ile Gly Pro Thr
675 680 685
Gly Ser Gly Lys Ser Ser Leu Leu Leu Gly Leu Leu Gly Glu Leu Asn
690 695 700
Leu Leu Ser Gly Lys Ile Tyr Val Pro Thr Val Glu Ser Arg Asp Asp
705 710 715 720
Leu Glu Ile Gly Lys Asp Gly Met Thr Asn Ser Met Ala Tyr Cys Ser
725 730 735
Gln Thr Pro Trp Leu Ile Ser Gly Thr Ile Lys Asp Asn Val Val Phe
740 745 750
Gly Glu Ile Phe Asn Lys Gln Lys Phe Asp Asp Val Met Lys Ser Cys
755 760 765
Cys Leu Asp Lys Asp Ile Lys Ala Met Thr Ala Gly Ile Arg Thr Asp
770 775 780
Val Gly Asp Gly Gly Phe Ser Leu Ser Gly Gly Gln Gln Gln Arg Ile
785 790 795 800
Ala Leu Ala Arg Ala Ile Tyr Ser Ser Ser Arg Tyr Leu Ile Leu Asp
805 810 815
Asp Cys Leu Ser Ala Val Asp Pro Glu Thr Ala Leu Tyr Ile Tyr Glu
820 825 830
Glu Cys Leu Cys Gly Pro Met Met Lys Gly Arg Thr Cys Ile Ile Thr
835 840 845
Ser His Asn Ile Ser Leu Val Thr Lys Arg Ala Asp Trp Leu Val Ile
850 855 860
Leu Asp Arg Gly Glu Val Lys Ser Gln Gly Lys Pro Ser Asp Leu Ile
865 870 875 880
Lys Ser Asn Glu Phe Leu Arg Glu Ser Ile Asn Asn Asp Ser Lys Asn
885 890 895
Thr Thr His Asn Gln Ile Asp Leu Lys Arg Ser Thr Thr Ser Lys Lys
900 905 910
Thr Lys Asn Gly Asp Pro Glu Gly Gly Asn Ser Gln Asp Glu Val Cys
915 920 925
Ala Glu Val Glu Asn Phe Glu Glu Thr Lys Met Glu Gly Ser Val Lys
930 935 940
Phe Ser Ala Tyr Lys Trp Leu Ala Asp Tyr Phe Gly Gly Leu Gly Val
945 950 955 960
Val Phe Val Phe Thr Ser Ser Ser Ile Leu Ile His Gly Ile Thr Leu
965 970 975
Ser Gln Gly Phe Trp Leu Arg Tyr Trp Leu Asp Thr Gly Ser Ser Gly
980 985 990
Ser Lys Ser Thr Trp Leu Tyr Arg Ile Val Glu Gly His Ser Asn Ile
995 1000 1005
Tyr Phe Leu Leu Thr Tyr Ile Ile Ile Gly Leu Val Ser Ser Phe
1010 1015 1020
Leu Thr Ser Gly Lys Val Trp Ile Ala Ile Ile Ser Gly Thr Asn
1025 1030 1035
Val Thr Lys Lys Ile Phe Ala Lys Leu Leu Ser Ser Ile Leu Tyr
1040 1045 1050
Ala Lys Leu Arg Phe His Asn Val Thr Pro Thr Gly Arg Ile Met
1055 1060 1065
Asn Arg Phe Ser Lys Asp Met Asp Ile Ile Asp Gln Gln Leu Ile
1070 1075 1080
Pro Asn Phe Glu Gly Leu Ser Tyr Ser Val Val Val Cys Leu Trp
1085 1090 1095
Ile Ile Leu Leu Ile Gly Tyr Val Thr Pro Gln Phe Leu Leu Phe
1100 1105 1110
Ala Ile Pro Leu Cys Ala Leu Tyr Tyr Thr Val Cys Thr Leu Tyr
1115 1120 1125
Leu Arg Ala Ser Arg Glu Leu Lys Arg Ile Asp Asn Ile Asn Ile
1130 1135 1140
Ser Pro Ile His Gln Leu Phe Ala Glu Ala Ile Lys Gly Val Thr
1145 1150 1155
Thr Ile Arg Ala Leu Ala Asp Glu Arg Arg Phe Ile Thr Gln Ser
1160 1165 1170
Leu Val Ala Ile Asp Arg Ser Asn Ala Pro Phe Phe Tyr Leu Asn
1175 1180 1185
Met Ala Thr Glu Trp Ile Thr Tyr Arg Val Asp Ile Ile Gly Thr
1190 1195 1200
Leu Val Leu Phe Ser Ser Ser Val Met Ile Ile Met Lys Ala Ser
1205 1210 1215
<210> 120
<211> 1049
<212> PRT
<213> Saccharomyces cerevisiae
<400> 120
Met Gly Ser His Arg Arg Tyr Leu Tyr Tyr Ser Ile Leu Ser Phe Leu
1 5 10 15
Leu Leu Ser Cys Ser Val Val Leu Ala Lys Gln Asp Lys Thr Pro Phe
20 25 30
Phe Glu Gly Thr Ser Ser Lys Asn Ser Arg Leu Thr Ala Gln Asp Lys
35 40 45
Gly Asn Asp Thr Cys Pro Pro Cys Phe Asn Cys Met Leu Pro Ile Phe
50 55 60
Glu Cys Lys Gln Phe Ser Glu Cys Asn Ser Tyr Thr Gly Arg Cys Glu
65 70 75 80
Cys Ile Glu Gly Phe Ala Gly Asp Asp Cys Ser Leu Pro Leu Cys Gly
85 90 95
Gly Leu Ser Pro Asp Glu Ser Gly Asn Lys Asp Arg Pro Ile Arg Ala
100 105 110
Gln Asn Asp Thr Cys His Cys Asp Asn Gly Trp Gly Gly Ile Asn Cys
115 120 125
Asp Val Cys Gln Glu Asp Phe Val Cys Asp Ala Phe Met Pro Asp Pro
130 135 140
Ser Ile Lys Gly Thr Cys Tyr Lys Asn Gly Met Ile Val Asp Lys Val
145 150 155 160
Phe Ser Gly Cys Asn Val Thr Asn Glu Lys Ile Leu Gln Ile Leu Asn
165 170 175
Gly Lys Ile Pro Gln Ile Thr Phe Ala Cys Asp Lys Pro Asn Gln Glu
180 185 190
Cys Asn Phe Gln Phe Trp Ile Asp Gln Leu Glu Ser Phe Tyr Cys Gly
195 200 205
Leu Ser Asp Cys Ala Phe Glu Tyr Asp Leu Glu Gln Asn Thr Ser His
210 215 220
Tyr Lys Cys Asn Asp Val Gln Cys Lys Cys Val Pro Asp Thr Val Leu
225 230 235 240
Cys Gly Ala Lys Gly Ser Ile Asp Ile Ser Asp Phe Leu Thr Glu Thr
245 250 255
Ile Lys Gly Pro Gly Asp Phe Ser Cys Asp Leu Glu Thr Arg Gln Cys
260 265 270
Lys Phe Ser Glu Pro Ser Met Asn Asp Leu Ile Leu Thr Val Phe Gly
275 280 285
Asp Pro Tyr Ile Thr Leu Lys Cys Glu Ser Gly Glu Cys Val His Tyr
290 295 300
Ser Glu Ile Pro Gly Tyr Lys Ser Pro Ser Lys Asp Pro Thr Val Ser
305 310 315 320
Trp Gln Gly Lys Leu Val Leu Ala Leu Thr Ala Val Met Val Leu Ala
325 330 335
Leu Phe Thr Phe Ala Thr Phe Tyr Ile Ser Lys Ser Pro Leu Phe Arg
340 345 350
Asn Gly Leu Gly Ser Ser Lys Ser Pro Ile Arg Leu Pro Asp Glu Asp
355 360 365
Ala Val Asn Asn Phe Leu Gln Asn Glu Asp Asp Thr Leu Ala Thr Leu
370 375 380
Ser Phe Glu Asn Ile Thr Tyr Ser Val Pro Ser Ile Asn Ser Asp Gly
385 390 395 400
Val Glu Glu Thr Val Leu Asn Glu Ile Ser Gly Ile Val Lys Pro Gly
405 410 415
Gln Ile Leu Ala Ile Met Gly Gly Ser Gly Ala Gly Lys Thr Thr Leu
420 425 430
Leu Asp Ile Leu Ala Met Lys Arg Lys Thr Gly His Val Ser Gly Ser
435 440 445
Ile Lys Val Asn Gly Ile Ser Met Asp Arg Lys Ser Phe Ser Lys Ile
450 455 460
Ile Gly Phe Val Asp Gln Asp Asp Phe Leu Leu Pro Thr Leu Thr Val
465 470 475 480
Phe Glu Thr Val Leu Asn Ser Ala Leu Leu Arg Leu Pro Lys Ala Leu
485 490 495
Ser Phe Glu Ala Lys Lys Ala Arg Val Tyr Lys Val Leu Glu Glu Leu
500 505 510
Arg Ile Ile Asp Ile Lys Asp Arg Ile Ile Gly Asn Glu Phe Asp Arg
515 520 525
Gly Ile Ser Gly Gly Glu Lys Arg Arg Val Ser Ile Ala Cys Glu Leu
530 535 540
Val Thr Ser Pro Leu Val Leu Phe Leu Asp Glu Pro Thr Ser Gly Leu
545 550 555 560
Asp Ala Ser Asn Ala Asn Asn Val Ile Glu Cys Leu Val Arg Leu Ser
565 570 575
Ser Asp Tyr Asn Arg Thr Leu Val Leu Ser Ile His Gln Pro Arg Ser
580 585 590
Asn Ile Phe Tyr Leu Phe Asp Lys Leu Val Leu Leu Ser Lys Gly Glu
595 600 605
Met Val Tyr Ser Gly Asn Ala Lys Lys Val Ser Glu Phe Leu Arg Asn
610 615 620
Glu Gly Tyr Ile Cys Pro Asp Asn Tyr Asn Ile Ala Asp Tyr Leu Ile
625 630 635 640
Asp Ile Thr Phe Glu Ala Gly Pro Gln Gly Lys Arg Arg Arg Ile Arg
645 650 655
Asn Ile Ser Asp Leu Glu Ala Gly Thr Asp Thr Asn Asp Ile Asp Asn
660 665 670
Thr Ile His Gln Thr Thr Phe Thr Ser Ser Asp Gly Thr Thr Gln Arg
675 680 685
Glu Trp Ala His Leu Ala Ala His Arg Asp Glu Ile Arg Ser Leu Leu
690 695 700
Arg Asp Glu Glu Asp Val Glu Gly Thr Asp Gly Arg Arg Gly Ala Thr
705 710 715 720
Glu Ile Asp Leu Asn Thr Lys Leu Leu His Asp Lys Tyr Lys Asp Ser
725 730 735
Val Tyr Tyr Ala Glu Leu Ser Gln Glu Ile Glu Glu Val Leu Ser Glu
740 745 750
Gly Asp Glu Glu Ser Asn Val Leu Asn Gly Asp Leu Pro Thr Gly Gln
755 760 765
Gln Ser Ala Gly Phe Leu Gln Gln Leu Ser Ile Leu Asn Ser Arg Ser
770 775 780
Phe Lys Asn Met Tyr Arg Asn Pro Lys Leu Leu Leu Gly Asn Tyr Leu
785 790 795 800
Leu Thr Ile Leu Leu Ser Leu Phe Leu Gly Thr Leu Tyr Tyr Asn Val
805 810 815
Ser Asn Asp Ile Ser Gly Phe Gln Asn Arg Met Gly Leu Phe Phe Phe
820 825 830
Ile Leu Thr Tyr Phe Gly Phe Val Thr Phe Thr Gly Leu Ser Ser Phe
835 840 845
Ala Leu Glu Arg Ile Ile Phe Ile Lys Glu Arg Ser Asn Asn Tyr Tyr
850 855 860
Ser Pro Leu Ala Tyr Tyr Ile Ser Lys Ile Met Ser Glu Val Val Pro
865 870 875 880
Leu Arg Val Val Pro Pro Ile Leu Leu Ser Leu Ile Val Tyr Pro Met
885 890 895
Thr Gly Leu Asn Met Lys Asp Asn Ala Phe Phe Lys Cys Ile Gly Ile
900 905 910
Leu Ile Leu Phe Asn Leu Gly Ile Ser Leu Glu Ile Leu Thr Ile Gly
915 920 925
Ile Ile Phe Glu Asp Leu Asn Asn Ser Ile Ile Leu Ser Val Leu Val
930 935 940
Leu Leu Gly Ser Leu Leu Phe Ser Gly Leu Phe Ile Asn Thr Lys Asn
945 950 955 960
Ile Thr Asn Val Ala Phe Lys Tyr Leu Lys Asn Phe Ser Val Phe Tyr
965 970 975
Tyr Ala Tyr Glu Ser Leu Leu Ile Asn Glu Val Lys Thr Leu Met Leu
980 985 990
Lys Glu Arg Lys Tyr Gly Leu Asn Ile Glu Val Pro Gly Ala Thr Ile
995 1000 1005
Leu Ser Thr Phe Gly Phe Val Val Gln Asn Leu Val Phe Asp Ile
1010 1015 1020
Lys Ile Leu Ala Leu Phe Asn Val Val Phe Leu Ile Met Gly Tyr
1025 1030 1035
Leu Ala Leu Lys Trp Ile Val Val Glu Gln Lys
1040 1045
<210> 121
<211> 548
<212> PRT
<213> Saccharomyces cerevisiae
<400> 121
Met Val Tyr Thr Ser Thr Tyr Arg His Thr Ile Val Val Asp Leu Leu
1 5 10 15
Glu Tyr Leu Gly Ile Val Ser Asn Leu Glu Thr Leu Gln Ser Ala Arg
20 25 30
Glu Asp Glu Thr Arg Lys Pro Glu Asn Thr Asp Lys Lys Glu Cys Lys
35 40 45
Pro Asp Tyr Asp Ile Glu Cys Gly Pro Asn Arg Ser Cys Ser Glu Ser
50 55 60
Ser Thr Asp Ser Asp Ser Ser Gly Ser Gln Ile Glu Lys Asn Asp Pro
65 70 75 80
Phe Arg Val Asp Trp Asn Gly Pro Ser Asp Pro Glu Asn Pro Gln Asn
85 90 95
Trp Pro Leu Leu Lys Lys Ser Leu Val Val Phe Gln Ile Met Leu Leu
100 105 110
Thr Cys Val Thr Tyr Met Gly Ser Ser Ile Tyr Thr Pro Gly Gln Glu
115 120 125
Tyr Ile Gln Glu Glu Phe His Val Gly His Val Val Ala Thr Leu Asn
130 135 140
Leu Ser Leu Tyr Val Leu Gly Tyr Gly Leu Gly Pro Ile Ile Phe Ser
145 150 155 160
Pro Leu Ser Glu Thr Ala Arg Tyr Gly Arg Leu Asn Leu Tyr Met Val
165 170 175
Thr Leu Phe Phe Phe Met Ile Phe Gln Val Gly Cys Ala Thr Val His
180 185 190
Asn Ile Gly Gly Leu Ile Val Met Arg Phe Ile Ser Gly Ile Leu Cys
195 200 205
Ser Pro Ser Leu Ala Thr Gly Gly Gly Thr Val Ala Asp Ile Ile Ser
210 215 220
Pro Glu Met Val Pro Leu Val Leu Gly Met Trp Ser Ala Gly Ala Val
225 230 235 240
Ala Ala Pro Val Leu Ala Pro Leu Leu Gly Ala Ala Met Val Asp Ala
245 250 255
Lys Asn Trp Arg Phe Ile Phe Trp Leu Leu Met Trp Leu Ser Ala Ala
260 265 270
Thr Phe Ile Leu Leu Ala Phe Phe Phe Pro Glu Thr Gln His His Asn
275 280 285
Ile Leu Tyr Arg Arg Ala Leu Lys Leu Arg Lys Glu Thr Gly Asp Asp
290 295 300
Arg Tyr Tyr Thr Glu Gln Asp Lys Leu Asp Arg Glu Val Asp Ala Arg
305 310 315 320
Thr Phe Leu Ile Asn Thr Leu Tyr Arg Pro Leu Lys Met Ile Ile Lys
325 330 335
Glu Pro Ala Ile Leu Ala Phe Asp Leu Tyr Ile Ala Val Ala Tyr Gly
340 345 350
Cys Phe Tyr Leu Phe Phe Glu Ala Phe Pro Ile Val Phe Val Gly Ile
355 360 365
Tyr His Phe Ser Leu Val Glu Val Gly Leu Ala Tyr Met Gly Phe Cys
370 375 380
Val Gly Cys Val Leu Ala Tyr Gly Leu Phe Gly Ile Leu Asn Met Arg
385 390 395 400
Ile Ile Val Pro Arg Phe Arg Asn Gly Thr Phe Thr Pro Glu Ala Phe
405 410 415
Leu Ile Val Ala Met Cys Val Cys Trp Cys Leu Pro Leu Ser Leu Phe
420 425 430
Leu Phe Gly Trp Thr Ala Arg Val His Trp Ile Leu Pro Val Ile Ser
435 440 445
Glu Val Phe Phe Val Leu Ala Val Phe Asn Ile Phe Gln Ala Thr Phe
450 455 460
Ala Tyr Leu Ala Thr Cys Tyr Pro Lys Tyr Val Ala Ser Val Phe Ala
465 470 475 480
Gly Asn Gly Phe Cys Arg Ala Ser Phe Ala Cys Ala Phe Pro Leu Phe
485 490 495
Gly Arg Ala Met Tyr Asp Asn Leu Ala Thr Lys Asn Tyr Pro Val Ala
500 505 510
Trp Gly Ser Ser Leu Val Gly Phe Leu Thr Leu Gly Leu Ala Ile Ile
515 520 525
Pro Phe Ile Leu Tyr Lys Tyr Gly Pro Ser Leu Arg Thr Arg Ser Ser
530 535 540
Tyr Thr Glu Glu
545
<210> 122
<211> 563
<212> PRT
<213> Saccharomyces cerevisiae
<400> 122
Met Thr Lys Gln Gln Thr Ser Val Met Arg Asn Ala Ser Ile Ala Lys
1 5 10 15
Glu Glu Arg Glu Gly Ser Asp Asn Asn Asn Val Asp Arg Ser Ser Ser
20 25 30
Asp Ala Ile Ser Asp Asn Asp Ala Glu Arg Ser Asn Ser His Ser Glu
35 40 45
Ile Asp Asn Glu Ser Asn Phe Asp Met Val Pro Tyr Ser Arg Phe Ser
50 55 60
His Lys Gln Lys Met Leu Leu Val Val Gln Cys Ala Phe Thr Gly Phe
65 70 75 80
Phe Ser Thr Val Ala Gly Ser Ile Tyr Tyr Pro Val Leu Thr Ile Ile
85 90 95
Glu Arg Lys Phe Asn Ile Thr Glu Glu Leu Ala Asn Val Thr Ile Val
100 105 110
Val Tyr Phe Ile Phe Gln Gly Val Ala Pro Ser Ile Met Gly Gly Leu
115 120 125
Ala Asp Thr Phe Gly Arg Arg Pro Ile Val Leu Trp Ala Ile Leu Ala
130 135 140
Tyr Phe Cys Ala Cys Ile Gly Leu Ala Cys Ala His Asn Tyr Ala Gln
145 150 155 160
Ile Leu Ala Leu Arg Cys Leu Gln Ala Ala Gly Ile Ser Pro Val Ile
165 170 175
Ala Ile Asn Ser Gly Ile Met Gly Asp Val Thr Thr Lys Val Glu Arg
180 185 190
Gly Gly Tyr Val Gly Leu Val Ala Gly Phe Gln Val Val Gly Thr Ala
195 200 205
Phe Gly Ala Leu Ile Gly Ala Gly Leu Ser Ser Lys Trp Gly Trp Arg
210 215 220
Ala Ile Phe Trp Phe Leu Ala Ile Gly Ser Gly Ile Cys Leu Val Phe
225 230 235 240
Ser Thr Leu Leu Met Pro Glu Thr Lys Arg Thr Leu Val Gly Asn Gly
245 250 255
Ser Val Thr Pro Arg Ser Phe Leu Asn Arg Ser Leu Ile Leu His Val
260 265 270
Gly Ser Val Lys Lys Thr Leu His Leu Asp Asp Pro Asp Pro Glu Thr
275 280 285
Leu Glu Pro Arg Thr Ser Val Asp Phe Leu Ala Pro Leu Lys Ile Leu
290 295 300
His Ile Arg Glu Ile Asp Ile Leu Leu Ser Ile Ala Gly Leu Gln Phe
305 310 315 320
Ser Thr Trp Thr Thr His Gln Thr Ala Leu Thr Ile Val Leu Ser Lys
325 330 335
Lys Tyr Asn Leu Ser Val Ala Lys Ile Gly Leu Cys Phe Leu Pro Ala
340 345 350
Gly Ile Ser Thr Leu Thr Ser Ile Ile Ser Ala Gly Arg Tyr Leu Asn
355 360 365
Trp Ser Tyr Arg Thr Arg Lys Val Lys Tyr Asn Arg Trp Ile Lys Glu
370 375 380
Gln Glu Leu Gln Leu Met Glu Lys Tyr Lys Gly Asp Lys Asn Lys Val
385 390 395 400
Ala Glu Leu Ile His Ser Asn Ser His Tyr Ala Phe Asn Leu Val Glu
405 410 415
Ala Arg Leu His Pro Ala Phe Val Thr Leu Leu Leu Ser Ser Ile Gly
420 425 430
Phe Thr Ala Phe Gly Trp Cys Ile Ser Val Lys Thr Pro Leu Ala Ala
435 440 445
Val Leu Cys Thr Ser Ala Phe Ala Ser Leu Phe Ser Asn Cys Ile Leu
450 455 460
Thr Phe Ser Thr Thr Leu Ile Val Asp Leu Phe Pro Ser Lys Ala Ser
465 470 475 480
Thr Ala Thr Gly Cys Leu Asn Leu Phe Arg Cys Leu Leu Ser Ala Ile
485 490 495
Phe Ile Ala Ala Leu Thr Lys Met Val Glu Lys Met Arg Tyr Gly Gly
500 505 510
Val Phe Thr Phe Leu Ser Ala Ile Thr Ser Ser Ser Ser Leu Leu Leu
515 520 525
Phe Tyr Leu Leu Lys Asn Gly Lys Gln Leu Ser Phe Asp Arg Ile Arg
530 535 540
Ala Asn Asp Lys Ser Ala Gly Arg Ser Val Gly Lys Asn Ser Glu Lys
545 550 555 560
Val Ser Thr
<210> 123
<211> 542
<212> PRT
<213> Saccharomyces cerevisiae
<400> 123
Met Ala Gly Ala Thr Ser Ser Ile Ile Arg Glu Asn Asp Phe Glu Asp
1 5 10 15
Glu Leu Ala Glu Ser Met Gln Ser Tyr Asn Arg Glu Thr Ala Asp Lys
20 25 30
Leu Ala Leu Thr Arg Thr Glu Ser Val Lys Pro Glu Pro Glu Ile Thr
35 40 45
Ala Pro Pro His Ser Arg Phe Ser Arg Ser Phe Lys Thr Val Leu Ile
50 55 60
Ala Gln Cys Ala Phe Thr Gly Phe Phe Ser Thr Ile Ala Gly Ala Ile
65 70 75 80
Tyr Tyr Pro Val Leu Ser Val Ile Glu Arg Lys Phe Asp Ile Asp Glu
85 90 95
Glu Leu Val Asn Val Thr Val Val Val Tyr Phe Val Phe Gln Gly Leu
100 105 110
Ala Pro Thr Phe Met Gly Gly Phe Ala Asp Ser Leu Gly Arg Arg Pro
115 120 125
Val Val Leu Val Ala Ile Val Ile Tyr Phe Gly Ala Cys Ile Gly Leu
130 135 140
Ala Cys Ala Gln Thr Tyr Ala Gln Ile Ile Val Leu Arg Cys Leu Gln
145 150 155 160
Ala Ala Gly Ile Ser Pro Val Ile Ala Ile Asn Ser Gly Ile Met Gly
165 170 175
Asp Val Thr Thr Arg Ala Glu Arg Gly Gly Tyr Val Gly Tyr Val Ala
180 185 190
Gly Phe Gln Val Leu Gly Ser Ala Phe Gly Ala Leu Ile Gly Ala Gly
195 200 205
Leu Ser Ser Arg Trp Gly Trp Arg Ala Ile Phe Trp Phe Leu Ala Ile
210 215 220
Gly Ser Gly Ile Cys Phe Leu Ala Ser Phe Leu Ile Leu Pro Glu Thr
225 230 235 240
Lys Arg Asn Ile Ser Gly Asn Gly Ser Val Thr Pro Lys Ser Tyr Leu
245 250 255
Asn Arg Ala Pro Ile Leu Val Leu Pro Thr Val Arg Lys Ser Leu His
260 265 270
Leu Asp Asn Pro Asp Tyr Glu Thr Leu Glu Leu Pro Thr Gln Leu Asn
275 280 285
Leu Leu Ala Pro Phe Lys Ile Leu Lys Ala Tyr Glu Ile Cys Ile Leu
290 295 300
Met Leu Val Ala Gly Leu Gln Phe Ala Met Tyr Thr Thr His Leu Thr
305 310 315 320
Ala Leu Ser Thr Ala Leu Ser Lys Gln Tyr His Leu Thr Val Ala Lys
325 330 335
Val Gly Leu Cys Tyr Leu Pro Ser Gly Ile Cys Thr Leu Cys Ser Ile
340 345 350
Val Ile Ala Gly Arg Tyr Leu Asn Trp Asn Tyr Arg Arg Arg Leu Lys
355 360 365
Tyr Tyr Gln Asn Trp Leu Gly Lys Lys Arg Ser Lys Leu Leu Glu Glu
370 375 380
His Asp Asn Asp Leu Asn Leu Val Gln Arg Ile Ile Glu Asn Asp Pro
385 390 395 400
Lys Tyr Thr Phe Asn Ile Phe Lys Ala Arg Leu Gln Pro Ala Phe Val
405 410 415
Thr Leu Leu Leu Ser Ser Ser Gly Phe Cys Ala Tyr Gly Trp Cys Ile
420 425 430
Thr Val Lys Ala Pro Leu Ala Ala Val Leu Cys Met Ser Gly Phe Ala
435 440 445
Ser Leu Phe Ser Asn Cys Ile Leu Thr Phe Ser Thr Thr Leu Ile Val
450 455 460
Asp Leu Phe Pro Thr Lys Thr Ser Thr Ala Thr Gly Cys Leu Asn Leu
465 470 475 480
Phe Arg Cys Ile Leu Ser Ala Val Phe Ile Ala Ala Leu Ser Lys Met
485 490 495
Val Glu Lys Met Lys Phe Gly Gly Val Phe Thr Phe Leu Gly Ala Leu
500 505 510
Thr Ser Ser Ser Ser Ile Leu Leu Phe Ile Leu Leu Arg Lys Gly Lys
515 520 525
Glu Leu Ala Phe Lys Arg Lys Lys Gln Glu Leu Gly Val Asn
530 535 540
<210> 124
<211> 689
<212> PRT
<213> Saccharomyces cerevisiae
<400> 124
Met Gln Ala Gln Gly Ser Gln Ser Asn Val Gly Ser Leu Arg Ser Asn
1 5 10 15
Cys Ser Asp Asn Ser Leu Pro Asn Asn His Val Met Met His Cys Asp
20 25 30
Glu Ser Ser Gly Ser Pro His Ser Glu His Asn Asp Tyr Ser Tyr Glu
35 40 45
Lys Thr Asn Leu Glu Ser Thr Ala Ser Asn Ser Arg Glu His Arg Asp
50 55 60
Asn Gln Leu Ser Arg Leu Lys Ser Glu Glu Tyr Val Val Pro Lys Asn
65 70 75 80
Gln Arg Arg Gly Leu Leu Pro Gln Leu Ala Ile Ile Pro Glu Phe Lys
85 90 95
Asp Ala Arg Asp Tyr Pro Pro Met Met Lys Lys Met Ile Val Phe Leu
100 105 110
Ile Ala Phe Ser Ser Met Met Gly Pro Met Gly Thr Ser Ile Ile Phe
115 120 125
Pro Ala Ile Asn Ser Ile Thr Thr Glu Phe Lys Thr Ser Val Ile Met
130 135 140
Val Asn Val Ser Ile Gly Val Tyr Leu Leu Ser Leu Gly Val Phe Pro
145 150 155 160
Leu Trp Trp Ser Ser Leu Ser Glu Leu Glu Gly Arg Arg Thr Thr Tyr
165 170 175
Ile Thr Ser Phe Ala Leu Leu Phe Ala Phe Asn Ile Gly Ser Ala Leu
180 185 190
Ala Pro Asp Ile Asn Ser Phe Ile Ala Leu Arg Met Leu Cys Gly Ala
195 200 205
Ala Ser Ala Ser Val Gln Ser Val Gly Ala Gly Thr Val Ala Asp Leu
210 215 220
Tyr Ile Ser Glu Asp Arg Gly Lys Asn Leu Ser Tyr Tyr Tyr Leu Gly
225 230 235 240
Pro Leu Leu Ala Pro Leu Leu Ser Pro Ile Phe Gly Ser Leu Leu Val
245 250 255
Asn Arg Trp Pro Trp Arg Ser Thr Gln Trp Phe Met Val Ile Leu Ser
260 265 270
Gly Cys Asn Val Ile Leu Leu Thr Val Leu Leu Pro Glu Thr Leu Arg
275 280 285
Lys Gln Asp Ser Lys Gly Ala Ile Ala Gln Ile Leu Ala Glu Arg Arg
290 295 300
Ile Gln Val Asp Asn Asn Glu Arg Gly Glu Ile Gln Glu Asp Tyr Gln
305 310 315 320
Arg Gly Glu Asp Glu Thr Asp Arg Ile Glu Asn Gln Val Ala Thr Leu
325 330 335
Ser Thr Glu Lys His Asn Tyr Val Gly Glu Val Arg Asp Gln Asp Ser
340 345 350
Leu Asp Leu Glu Ser His Ser Ser Pro Asn Thr Tyr Asp Gly Arg Ala
355 360 365
Gly Glu Thr Gln Leu Gln Arg Ile Tyr Thr Glu Ala Ser Arg Ser Leu
370 375 380
Tyr Glu Tyr Gln Leu Asp Asp Ser Gly Ile Asp Ala Thr Thr Ala Gln
385 390 395 400
Val Thr Arg Ile Arg Ser Thr Asp Pro Lys Leu Ala Arg Ser Ile Arg
405 410 415
Glu Asn Ser Leu Arg Lys Leu Gln Thr Asn Leu Glu Glu Gln Val Lys
420 425 430
Lys Val Leu Ser Ser Asn Gly Gly Glu Ile Ala Pro Lys Gln Val Ser
435 440 445
Ala Val Arg Lys Val Trp Asp Thr Phe Phe Val Tyr Phe Ile Lys Pro
450 455 460
Leu Lys Ser Leu His Phe Leu Glu Tyr Pro Pro Val Ala Leu Ala Ile
465 470 475 480
Thr Phe Ser Ala Ile Ser Phe Ser Thr Val Tyr Phe Val Asn Met Thr
485 490 495
Val Glu Tyr Lys Tyr Ser Arg Pro Pro Tyr Asn Phe Lys Pro Leu Tyr
500 505 510
Ile Gly Leu Leu Tyr Ile Pro Asn Ser Val Thr Tyr Phe Phe Ala Ser
515 520 525
Ile Tyr Gly Gly Arg Trp Val Asp Met Leu Leu Lys Arg Tyr Lys Glu
530 535 540
Lys Tyr Gly Ile Leu Ala Pro Glu Ala Arg Ile Ser Trp Asn Val Val
545 550 555 560
Thr Ser Val Ile Ser Phe Pro Ile Ala Leu Leu Ile Phe Gly Trp Cys
565 570 575
Leu Asp Lys Lys Cys His Trp Val Thr Pro Leu Ile Gly Thr Ala Leu
580 585 590
Phe Gly Tyr Ala Ala Met Met Thr Ile Gly Ala Thr Leu Ser Tyr Leu
595 600 605
Val Asp Ser Leu Pro Gly Lys Gly Ala Thr Gly Val Ala Leu Asn Asn
610 615 620
Leu Ile Arg Gln Ile Leu Ala Ala Thr Ala Val Phe Val Thr Thr Pro
625 630 635 640
Met Leu Asn Gly Met Gly Thr Gly Trp Ala Phe Thr Met Leu Ala Phe
645 650 655
Ile Val Leu Gly Ala Ser Ser Val Leu Ile Ile Leu Lys Lys His Gly
660 665 670
Asp Tyr Trp Arg Glu Asn Tyr Asp Leu Gln Lys Leu Tyr Asp Lys Ile
675 680 685
Asp
<210> 125
<211> 586
<212> PRT
<213> Saccharomyces cerevisiae
<400> 125
Met Ser Asp His Ser Pro Ile Ser Asn Lys Glu Asn His Leu Leu Pro
1 5 10 15
Ser Asp Ser Ser Arg Ser Ser Ser Ser Asp Met His Ser Thr Gly Thr
20 25 30
Thr Gly Thr Thr Gly Val Glu Pro Val Asp Phe Thr Gly Glu Gly Ala
35 40 45
Lys Tyr Thr Thr Ala Thr Glu Gly Asn Gly Gly Ala Asp Leu Ala Ile
50 55 60
Gln Arg Thr Thr Thr Met Asn Ser Ala Ala Glu Ser Glu Val Asn Ile
65 70 75 80
Thr Arg Arg Leu Thr Lys Ile Leu Thr Gly Ser Val Asn Glu Pro Asp
85 90 95
Arg Val Glu Val Asp Tyr Thr Asn Cys Ala Pro Met Gly Gly Asp Arg
100 105 110
Pro Tyr Pro Pro Ser Leu Pro Ser Arg Asp Leu Tyr Glu Val Thr Phe
115 120 125
Asp Gly Pro Asn Asp Pro Leu His Pro Phe Asn Trp Pro Met Lys Lys
130 135 140
Lys Val Leu Leu Cys Leu Val Leu Cys Leu Asp Ser Ile Ala Ile Ala
145 150 155 160
Met Cys Ser Ser Ile Phe Ala Ser Ala Val Pro Gln Ile Cys Glu Ile
165 170 175
Tyr His Val Ile Glu Val Val Ala Ile Leu Gly Ile Thr Leu Phe Val
180 185 190
Leu Gly Phe Ala Ala Ser Pro Val Ile Tyr Ala Pro Leu Ser Glu Leu
195 200 205
Tyr Gly Arg Lys Gly Val Leu Val Leu Ser Ala Phe Gly Phe Ala Leu
210 215 220
Phe Gln Phe Ala Val Ala Thr Ala Glu Asn Leu Gln Thr Ile Phe Ile
225 230 235 240
Cys Arg Phe Phe Gly Gly Phe Ile Gly Ala Ala Pro Met Ala Val Val
245 250 255
Pro Ala Ala Phe Ala Asp Met Phe Asp Thr Asn Val Arg Gly Lys Ala
260 265 270
Ile Ala Leu Phe Ser Leu Gly Val Phe Val Gly Pro Ile Leu Ser Pro
275 280 285
Val Met Gly Ser Tyr Ile Ala Gln Arg Thr Thr Trp Arg Trp Leu Glu
290 295 300
Tyr Val Val Gly Cys Phe Ala Ser Ala Val Phe Val Ala Ile Val Leu
305 310 315 320
Phe Phe Glu Glu Thr His His Pro Thr Ile Leu Val Asn Lys Ala Lys
325 330 335
Gln Met Arg Lys Gln Ser Asn Asn Trp Gly Ile His Ala Ala His Glu
340 345 350
Asp Val Glu Leu Ser Ile Lys Asp Ile Val Gln Lys Thr Val Thr Arg
355 360 365
Pro Ile Ile Met Leu Phe Val Glu Pro Leu Leu Leu Phe Val Thr Ile
370 375 380
Tyr Asn Ser Phe Val Tyr Gly Ile Leu Tyr Leu Leu Leu Glu Ala Tyr
385 390 395 400
Pro Leu Val Phe Val Glu Gly Tyr Gly Phe Thr Glu Asn Gly Glu Leu
405 410 415
Pro Tyr Ile Ala Leu Ile Ile Gly Met Met Val Cys Ala Ala Phe Ile
420 425 430
Trp Tyr Met Asp Asn Asp Tyr Leu Lys Arg Cys Arg Ala Lys Gly Lys
435 440 445
Leu Val Pro Glu Ala Arg Leu Tyr Ala Met Val Ile Ala Gly Thr Val
450 455 460
Phe Pro Ile Gly Ile Leu Trp Phe Cys Trp Thr Gly Tyr Tyr Pro His
465 470 475 480
Lys Ile His Trp Met Val Pro Thr Val Gly Gly Ala Phe Ile Gly Phe
485 490 495
Gly Leu Met Gly Ile Phe Leu Pro Cys Leu Asn Tyr Ile Ile Glu Ser
500 505 510
Tyr Leu Leu Leu Ala Ala Ser Ala Val Ala Ala Asn Thr Phe Met Arg
515 520 525
Ser Ala Phe Gly Ala Cys Phe Pro Leu Phe Ala Gly Tyr Met Phe Arg
530 535 540
Gly Met Gly Ile Gly Trp Ala Gly Leu Leu Leu Gly Leu Phe Ala Ala
545 550 555 560
Ala Met Ile Pro Val Pro Leu Leu Phe Leu Lys Tyr Gly Glu Ser Ile
565 570 575
Arg Lys Lys Ser Lys Tyr Ala Tyr Ala Ala
580 585
<210> 126
<211> 614
<212> PRT
<213> Saccharomyces cerevisiae
<400> 126
Met Ser Asp Gln Glu Ser Val Val Ser Phe Asn Ser Gln Asn Thr Ser
1 5 10 15
Met Val Asp Val Glu Gly Gln Gln Pro Gln Gln Tyr Val Pro Ser Lys
20 25 30
Thr Asn Ser Arg Ala Asn Gln Leu Lys Leu Thr Lys Thr Glu Thr Val
35 40 45
Lys Ser Leu Gln Asp Leu Gly Val Thr Ser Ala Ala Pro Val Pro Asp
50 55 60
Ile Asn Ala Pro Gln Thr Ala Lys Asn Asn Ile Phe Pro Glu Glu Tyr
65 70 75 80
Thr Met Glu Thr Pro Ser Gly Leu Val Pro Val Ala Thr Leu Gln Ser
85 90 95
Met Gly Arg Thr Ala Ser Ala Leu Ser Arg Thr Arg Thr Lys Gln Leu
100 105 110
Asn Arg Thr Ala Thr Asn Ser Ser Ser Thr Gly Lys Glu Glu Met Glu
115 120 125
Glu Glu Glu Thr Glu Glu Arg Glu Asp Gln Ser Gly Glu Asn Glu Leu
130 135 140
Asp Pro Glu Ile Glu Phe Val Thr Phe Val Thr Gly Asp Pro Glu Asn
145 150 155 160
Pro His Asn Trp Pro Ser Trp Val Arg Trp Ser Tyr Thr Val Leu Leu
165 170 175
Ser Ile Leu Val Ile Cys Val Ala Tyr Gly Ser Ala Cys Ile Ser Gly
180 185 190
Gly Leu Gly Thr Val Glu Lys Lys Tyr His Val Gly Met Glu Ala Ala
195 200 205
Ile Leu Ser Cys Ser Leu Met Val Ile Gly Phe Ser Leu Gly Pro Leu
210 215 220
Ile Trp Ser Pro Val Ser Asp Leu Tyr Gly Arg Arg Val Ala Tyr Phe
225 230 235 240
Val Ser Met Gly Leu Tyr Val Ile Phe Asn Ile Pro Cys Ala Leu Ala
245 250 255
Pro Asn Leu Gly Cys Leu Leu Ala Cys Arg Phe Leu Cys Gly Val Trp
260 265 270
Ser Ser Ser Gly Leu Cys Leu Val Gly Gly Ser Ile Ala Asp Met Phe
275 280 285
Pro Ser Glu Thr Arg Gly Lys Ala Ile Ala Phe Phe Ala Phe Ala Pro
290 295 300
Tyr Val Gly Pro Val Val Gly Pro Leu Val Asn Gly Phe Ile Ser Val
305 310 315 320
Ser Thr Gly Arg Met Asp Leu Ile Phe Trp Val Asn Met Ala Phe Ala
325 330 335
Gly Val Met Trp Ile Ile Ser Ser Ala Ile Pro Glu Thr Tyr Ala Pro
340 345 350
Val Ile Leu Lys Arg Lys Ala Ala Arg Leu Arg Lys Glu Thr Gly Asn
355 360 365
Pro Lys Ile Met Thr Glu Gln Glu Ala Gln Gly Val Ser Met Ser Glu
370 375 380
Met Met Arg Ala Cys Leu Leu Arg Pro Leu Tyr Phe Ala Val Thr Glu
385 390 395 400
Pro Val Leu Val Ala Thr Cys Phe Tyr Val Cys Leu Ile Tyr Ser Leu
405 410 415
Leu Tyr Ala Phe Phe Phe Ala Phe Pro Val Ile Phe Gly Glu Leu Tyr
420 425 430
Gly Tyr Lys Asp Asn Leu Val Gly Leu Met Phe Ile Pro Ile Val Ile
435 440 445
Gly Ala Leu Trp Ala Leu Ala Thr Thr Phe Tyr Cys Glu Asn Lys Tyr
450 455 460
Leu Gln Ile Val Lys Gln Arg Lys Pro Thr Pro Glu Asp Arg Leu Leu
465 470 475 480
Gly Ala Lys Ile Gly Ala Pro Phe Ala Ala Ile Ala Leu Trp Ile Leu
485 490 495
Gly Ala Thr Ala Tyr Lys His Ile Ile Trp Val Gly Pro Ala Ser Ala
500 505 510
Gly Leu Ala Phe Gly Phe Gly Met Val Leu Ile Tyr Tyr Ser Leu Asn
515 520 525
Asn Tyr Ile Ile Asp Cys Tyr Val Gln Tyr Ala Ser Ser Ala Leu Ala
530 535 540
Thr Lys Val Phe Leu Arg Ser Ala Gly Gly Ala Ala Phe Pro Leu Phe
545 550 555 560
Thr Ile Gln Met Tyr His Lys Leu Asn Leu His Trp Gly Ser Trp Leu
565 570 575
Leu Ala Phe Ile Ser Thr Ala Met Ile Ala Leu Pro Phe Ala Phe Ser
580 585 590
Tyr Trp Gly Lys Gly Leu Arg His Lys Leu Ser Lys Lys Asp Tyr Ser
595 600 605
Ile Asp Ser Val Glu Met
610
<210> 127
<211> 622
<212> PRT
<213> Saccharomyces cerevisiae
<400> 127
Met Asn Arg Gln Glu Ser Ile Asn Ser Phe Asn Ser Asp Glu Thr Ser
1 5 10 15
Ser Leu Ser Asp Val Glu Ser Gln Gln Pro Gln Gln Tyr Ile Pro Ser
20 25 30
Glu Ser Gly Ser Lys Ser Asn Met Ala Pro Asn Gln Leu Lys Leu Thr
35 40 45
Arg Thr Glu Thr Val Lys Ser Leu Gln Asp Met Gly Val Ser Ser Lys
50 55 60
Ala Pro Val Pro Asp Val Asn Ala Pro Gln Ser Ser Lys Asn Lys Ile
65 70 75 80
Phe Pro Glu Glu Tyr Thr Leu Glu Thr Pro Thr Gly Leu Val Pro Val
85 90 95
Ala Thr Leu His Ser Ile Gly Arg Thr Ser Thr Ala Ile Ser Arg Thr
100 105 110
Arg Thr Arg Gln Ile Asp Gly Ala Ser Ser Pro Ser Ser Asn Glu Asp
115 120 125
Ala Leu Glu Ser Asp Asn Asn Glu Lys Gly Lys Glu Gly Asp Ser Ser
130 135 140
Gly Ala Asn Asp Glu Ala Pro Asp Leu Asp Pro Glu Ile Glu Phe Val
145 150 155 160
Thr Phe Val Thr Gly Asp Pro Glu Asn Pro His Asn Trp Pro Ala Trp
165 170 175
Ile Arg Trp Ser Tyr Thr Val Leu Leu Ser Ile Leu Val Ile Cys Val
180 185 190
Ala Tyr Gly Ser Ala Cys Ile Ser Gly Gly Leu Gly Thr Val Glu Lys
195 200 205
Lys Tyr His Val Gly Met Glu Ala Ala Ile Leu Ser Val Ser Leu Met
210 215 220
Val Ile Gly Phe Ser Leu Gly Pro Leu Ile Trp Ser Pro Val Ser Asp
225 230 235 240
Leu Tyr Gly Arg Arg Val Ala Tyr Phe Val Ser Met Gly Leu Tyr Val
245 250 255
Ile Phe Asn Ile Pro Cys Ala Leu Ala Pro Asn Leu Gly Ser Leu Leu
260 265 270
Ala Cys Arg Phe Leu Cys Gly Val Trp Ser Ser Ser Gly Leu Cys Leu
275 280 285
Val Gly Gly Ser Ile Ala Asp Met Phe Pro Ser Glu Thr Arg Gly Lys
290 295 300
Ala Ile Ala Phe Phe Ala Phe Ala Pro Tyr Val Gly Pro Val Val Gly
305 310 315 320
Pro Leu Val Asn Gly Phe Ile Ser Val Ser Thr Gly Arg Met Asp Leu
325 330 335
Ile Phe Trp Val Asn Met Ala Phe Ala Gly Val Met Trp Ile Ile Ser
340 345 350
Ser Ala Ile Pro Glu Thr Tyr Ala Pro Val Ile Leu Lys Arg Lys Ala
355 360 365
Ala Arg Leu Arg Lys Glu Thr Gly Asn Pro Lys Ile Met Thr Glu Gln
370 375 380
Glu Ala Gln Gly Val Ser Met Gly Glu Met Met Arg Ala Cys Leu Leu
385 390 395 400
Arg Pro Leu Tyr Phe Ser Val Thr Glu Pro Val Leu Val Ala Thr Cys
405 410 415
Phe Tyr Val Cys Leu Ile Tyr Ser Leu Leu Tyr Ala Phe Phe Phe Ala
420 425 430
Phe Pro Val Ile Phe Gly Glu Leu Tyr Gly Tyr Lys Asp Asn Leu Val
435 440 445
Gly Leu Met Phe Ile Pro Ile Val Ile Gly Ala Leu Trp Ala Leu Ala
450 455 460
Thr Thr Phe Tyr Cys Glu Asn Lys Tyr Leu Gln Ile Val Lys Gln Arg
465 470 475 480
Lys Pro Thr Pro Glu Asp Arg Leu Leu Gly Ala Lys Ile Gly Ala Pro
485 490 495
Phe Ala Ala Ile Ala Leu Trp Ile Leu Gly Ala Thr Ala Tyr Lys His
500 505 510
Ile Ile Trp Val Gly Pro Ala Ser Ala Gly Leu Ala Phe Gly Phe Gly
515 520 525
Met Val Leu Ile Tyr Tyr Ser Leu Asn Asn Tyr Ile Ile Asp Cys Tyr
530 535 540
Val Gln Tyr Ala Ser Ser Ala Leu Ala Thr Lys Val Phe Leu Arg Ser
545 550 555 560
Ala Gly Gly Ala Ala Phe Pro Leu Phe Thr Ile Gln Met Tyr His Lys
565 570 575
Leu Asn Leu His Trp Gly Ser Trp Leu Leu Ala Phe Ile Ser Thr Ala
580 585 590
Met Ile Ala Leu Pro Phe Ala Phe Ser Tyr Trp Gly Lys Gly Leu Arg
595 600 605
His Lys Leu Ser Lys Lys Asp Tyr Ser Ile Asp Ser Ile Glu
610 615 620
<210> 128
<211> 659
<212> PRT
<213> Saccharomyces cerevisiae
<400> 128
Met Pro Ser Ser Leu Thr Lys Thr Glu Ser Asn Ser Asp Pro Arg Thr
1 5 10 15
Asn Ile Gln Gln Val Pro Lys Ala Leu Asp Lys Asn Val Thr Asn Ser
20 25 30
Gly Asn Leu Asp Ser Thr Ser Ser Ser Thr Gly Ser Ile Thr Glu Asp
35 40 45
Glu Lys Arg Ser Glu Pro Asn Ala Asp Ser Asn Asn Met Thr Gly Gly
50 55 60
Glu Pro Ile Asp Pro Arg Asp Leu Asp Trp Asp Gly Pro Asp Asp Pro
65 70 75 80
Asp Asn Pro His Asn Trp Ser Ser Leu Lys Lys Trp Tyr Thr Thr Met
85 90 95
Thr Ser Ala Phe Leu Cys Leu Val Val Thr Met Gly Ser Ser Leu Tyr
100 105 110
Val Ser Ser Val Pro Glu Leu Val Glu Arg Tyr His Val Ser Gln Thr
115 120 125
Leu Ala Leu Ala Gly Leu Thr Phe Tyr Leu Leu Gly Leu Ser Thr Val
130 135 140
Ile Gly Ala Pro Leu Ser Glu Val Phe Gly Arg Lys Pro Val Tyr Leu
145 150 155 160
Phe Ser Leu Pro Val Ser Met Leu Phe Thr Met Gly Val Gly Leu Ser
165 170 175
Asn Gly His Met Arg Ile Ile Leu Pro Leu Arg Phe Leu Ser Gly Val
180 185 190
Phe Ala Ser Pro Ala Leu Ser Val Gly Ser Gly Thr Ile Leu Asp Ile
195 200 205
Phe Asp Val Asp Gln Val Ser Val Ala Met Thr Tyr Phe Val Leu Ser
210 215 220
Pro Phe Leu Gly Pro Val Leu Ser Pro Ile Met Ala Gly Phe Ala Thr
225 230 235 240
Glu Ala Lys Gly Trp Arg Trp Ser Glu Trp Ile Gln Leu Ile Ala Gly
245 250 255
Gly Leu Ile Leu Pro Phe Ile Ala Leu Met Pro Glu Thr His Lys Gly
260 265 270
Ile Ile Leu Arg Lys Arg Ala Lys Lys Arg Asn Ile Ala Leu Lys Lys
275 280 285
Phe Ser Arg Glu Ala Gln Lys Glu Phe Leu Lys Thr Thr Val Thr Ile
290 295 300
Thr Ile Leu Arg Pro Leu Lys Met Leu Val Val Glu Pro Ile Val Phe
305 310 315 320
Val Phe Ser Val Tyr Val Ala Phe Ile Phe Ala Ile Leu Phe Gly Phe
325 330 335
Phe Glu Ala Tyr Ala Val Ile Tyr Arg Gly Val Tyr His Met Ser Met
340 345 350
Gly Ile Ser Gly Leu Pro Phe Ile Gly Ile Gly Val Gly Leu Trp Ile
355 360 365
Gly Ala Phe Phe Tyr Leu Tyr Ile Asp Arg Lys Tyr Leu Phe Pro Lys
370 375 380
Pro Pro Ala Gly Thr Gln Pro Leu Thr Glu Lys Glu Arg Thr Ser Lys
385 390 395 400
Arg Thr Thr Pro Tyr Arg Gly Ala Arg Asp Ala Glu Thr Gly Glu Leu
405 410 415
Leu Pro Val Val Pro Glu Lys Phe Leu Ile Ala Cys Lys Phe Gly Ser
420 425 430
Val Ala Leu Pro Ile Gly Leu Phe Trp Gln Ala Trp Thr Ala Arg Ser
435 440 445
Asp Val His Trp Met Ala Pro Val Ala Ala Gly Val Pro Phe Gly Phe
450 455 460
Gly Leu Ile Leu Ile Phe Phe Ser Val Leu Met Tyr Phe Ser Thr Cys
465 470 475 480
Tyr Pro Pro Leu Thr Val Ala Ser Cys Leu Ala Ala Asn Asn Leu Leu
485 490 495
Arg Tyr Val Met Ser Ser Val Phe Pro Leu Phe Thr Ile Gln Met Tyr
500 505 510
Thr Lys Met Lys Ile Lys Trp Ala Ser Thr Leu Phe Ala Leu Val Cys
515 520 525
Val Val Met Ile Pro Ile Pro Trp Val Phe Glu Lys Trp Gly Ser Lys
530 535 540
Leu Arg His Lys Ser Gln Phe Gly Tyr Ala Ala Met Glu Lys Glu Ala
545 550 555 560
Glu Thr Glu Gly Gly Ile Asp Asp Val Asn Ala Val Asp Gly Glu Leu
565 570 575
Asn Leu Thr Arg Met Thr Thr Leu Arg Thr Met Glu Thr Asp Pro Ser
580 585 590
Thr Arg Glu Lys Pro Gly Glu Arg Leu Ser Leu Arg Arg Thr His Thr
595 600 605
Gln Pro Val Pro Ala Ser Phe Asp Arg Glu Asp Gly Gln His Ala Gln
610 615 620
Asn Arg Asn Glu Pro Ile Ser Asn Ser Leu Tyr Ser Ala Ile Lys Asp
625 630 635 640
Asn Glu Asp Gly Tyr Ser Tyr Thr Glu Met Ala Thr Asp Ala Ser Ala
645 650 655
Arg Met Val
<210> 129
<211> 586
<212> PRT
<213> Saccharomyces cerevisiae
<400> 129
Met Ser Arg Ser Asn Ser Ile Tyr Thr Glu Asp Ile Glu Met Tyr Pro
1 5 10 15
Thr His Asn Glu Gln His Leu Thr Arg Glu Tyr Thr Lys Pro Asp Gly
20 25 30
Gln Thr Lys Ser Glu Lys Leu Asn Phe Glu Gly Ala Tyr Ile Asn Ser
35 40 45
His Gly Thr Leu Ser Lys Thr Thr Thr Arg Glu Ile Glu Gly Asp Leu
50 55 60
Asp Ser Glu Thr Ser Ser His Ser Ser Asp Asp Lys Val Asp Pro Thr
65 70 75 80
Gln Gln Ile Thr Ala Glu Thr Lys Ala Pro Tyr Thr Leu Leu Ser Tyr
85 90 95
Gly Gln Lys Trp Gly Met Val Ala Ile Leu Thr Met Cys Gly Phe Trp
100 105 110
Ser Ser Leu Gly Ser Pro Ile Tyr Tyr Pro Ala Leu Arg Gln Leu Glu
115 120 125
Lys Gln Phe Asn Val Asp Glu Asn Met Val Asn Val Thr Val Val Val
130 135 140
Tyr Leu Leu Phe Gln Gly Ile Ser Pro Thr Val Ser Gly Gly Leu Ala
145 150 155 160
Asp Cys Phe Gly Arg Arg Pro Ile Ile Leu Ala Gly Met Leu Ile Tyr
165 170 175
Val Ile Ala Ser Ile Gly Leu Ala Cys Ala Pro Ser Tyr Gly Val Ile
180 185 190
Ile Phe Leu Arg Cys Ile Gln Ser Ile Gly Ile Ser Pro Thr Ile Ala
195 200 205
Ile Ser Ser Gly Val Val Gly Asp Phe Thr Leu Lys His Glu Arg Gly
210 215 220
Thr Phe Val Gly Ala Thr Ser Gly Phe Val Leu Leu Gly Gln Cys Phe
225 230 235 240
Gly Ser Leu Ile Gly Ala Val Leu Thr Ala Arg Trp Asp Trp Arg Ala
245 250 255
Ile Phe Trp Phe Leu Thr Ile Gly Cys Gly Ser Cys Phe Leu Ile Ala
260 265 270
Phe Leu Ile Leu Pro Glu Thr Lys Arg Thr Ile Ala Gly Asn Leu Ser
275 280 285
Ile Lys Pro Lys Arg Phe Ile Asn Arg Ala Pro Ile Phe Leu Leu Gly
290 295 300
Pro Val Arg Arg Arg Phe Lys Tyr Asp Asn Pro Asp Tyr Glu Thr Leu
305 310 315 320
Asp Pro Thr Ile Pro Lys Leu Asp Leu Ser Ser Ala Gly Lys Ile Leu
325 330 335
Val Leu Pro Glu Ile Ile Leu Ser Leu Phe Pro Ser Gly Leu Leu Phe
340 345 350
Ala Met Trp Thr Leu Met Leu Ser Ser Ile Ser Ser Gly Leu Ser Val
355 360 365
Ala Pro Tyr Asn Tyr His Leu Val Ile Ile Gly Val Cys Tyr Leu Pro
370 375 380
Gly Gly Ile Gly Gly Leu Met Gly Ser Phe Phe Thr Gly Arg Ile Ile
385 390 395 400
Asp Met Tyr Phe Lys Arg Lys Ile Lys Lys Phe Glu Gln Asp Lys Ala
405 410 415
Asn Gly Leu Ile Pro Gln Asp Ala Glu Ile Asn Met Phe Lys Val Arg
420 425 430
Leu Val Cys Leu Leu Pro Gln Asn Phe Leu Ala Val Val Ala Tyr Leu
435 440 445
Leu Phe Gly Trp Ser Ile Asp Lys Gly Trp Arg Ile Glu Ser Ile Leu
450 455 460
Ile Thr Ser Phe Val Cys Ser Tyr Cys Ala Met Ser Thr Leu Ser Thr
465 470 475 480
Ser Thr Thr Leu Leu Val Asp Leu Tyr Pro Thr Lys Ser Ser Thr Ala
485 490 495
Ser Ser Cys Phe Asn Phe Val Arg Cys Ser Leu Ser Thr Ile Phe Met
500 505 510
Gly Cys Phe Ala Lys Met Lys Ala Ala Met Thr Val Gly Gly Thr Phe
515 520 525
Thr Phe Leu Cys Ala Leu Val Phe Phe Phe Asn Phe Leu Met Phe Ile
530 535 540
Pro Met Lys Tyr Gly Met Lys Trp Arg Glu Asp Arg Leu Leu Lys Gln
545 550 555 560
Gln Arg Gln Ser Trp Leu Asn Thr Leu Ala Val Lys Ala Lys Lys Gly
565 570 575
Thr Lys Arg Asp Gln Asn Asp Asn His Asn
580 585
<210> 130
<211> 613
<212> PRT
<213> Saccharomyces cerevisiae
<400> 130
Met Lys Gly Glu Pro Lys Thr Tyr Ser Met Ser Asp Leu Ser Tyr Tyr
1 5 10 15
Gly Glu Lys Ala Gln Gln Gln Asn Glu Lys Gln Gln Lys Gln Tyr Val
20 25 30
Val Arg Arg Asn Ser Thr Gln Ser Thr Ser Lys Gln Asn Val Ser Val
35 40 45
Val Leu Glu Asp Asn Ala Ser Glu Ser Asn Glu Leu Pro Lys Gly Phe
50 55 60
Ile Leu Tyr Ala Ser Leu Ile Ala Leu Ala Leu Ser Leu Phe Leu Ala
65 70 75 80
Ala Leu Asp Ile Met Ile Val Ser Thr Ile Ile Glu Glu Val Ala Lys
85 90 95
Gln Phe Gly Ser Tyr Ser Glu Ile Gly Trp Leu Phe Thr Gly Tyr Ser
100 105 110
Leu Pro Asn Ala Leu Leu Ala Leu Ile Trp Gly Arg Ile Ala Thr Pro
115 120 125
Ile Gly Phe Lys Glu Thr Met Leu Phe Ala Ile Val Ile Phe Glu Ile
130 135 140
Gly Ser Leu Ile Ser Ala Leu Ala Asn Ser Met Ser Met Leu Ile Gly
145 150 155 160
Gly Arg Val Ile Ala Gly Val Gly Gly Cys Gly Ile Gln Ser Leu Ser
165 170 175
Phe Val Ile Gly Ser Thr Leu Val Glu Glu Ser Gln Arg Gly Ile Leu
180 185 190
Ile Ala Val Leu Ser Cys Ser Phe Ala Ile Ala Ser Val Val Gly Pro
195 200 205
Phe Leu Gly Gly Val Phe Thr Ser Ser Val Thr Trp Arg Trp Cys Phe
210 215 220
Tyr Val Asn Leu Pro Ile Gly Gly Leu Ala Phe Phe Leu Phe Leu Phe
225 230 235 240
Phe Tyr Asn Pro Gly Leu Ser Thr Phe Gln Glu Thr Met Asp Asn Ile
245 250 255
Arg Lys Phe Pro Ser Gln Phe Ile Glu Ile Val Arg Asn Val Ala Tyr
260 265 270
His Leu Leu Lys Ile Lys Gly Phe Ser Lys Leu Asn Gly Trp Arg Lys
275 280 285
Pro Phe Met Glu Leu Ile Phe Met Tyr Asp Ile Ile Glu Phe Val Phe
290 295 300
Cys Ser Ala Gly Phe Thr Cys Ile Leu Leu Ala Phe Thr Phe Gly Gly
305 310 315 320
Asn Arg Tyr Ala Trp Asn Ser Ala Ser Ile Ile Ile Leu Phe Ile Ile
325 330 335
Gly Ile Val Leu Val Val Leu Ala Gly Ile Tyr Asp Phe Leu Val Phe
340 345 350
Pro Lys Phe Asn Ile Val Lys Ala Thr Pro His Tyr Gln Pro Leu Met
355 360 365
Ser Trp Thr Asn Ile Lys Lys Pro Gly Ile Phe Thr Val Asn Ile Ala
370 375 380
Leu Phe Leu Thr Cys Ala Gly Tyr Ile Ser Gln Phe Thr Tyr Ile Val
385 390 395 400
Gln Tyr Phe Gln Leu Ile Tyr Asn Asp Ser Ala Trp Arg Ala Ala Val
405 410 415
His Leu Val Ala Cys Ile Ile Ser Thr Val Val Thr Ala Ile Leu Cys
420 425 430
Gly Ala Ile Thr Asp Lys Thr Arg Gln Ile Lys Pro Ile Ile Val Ile
435 440 445
Ser Ser Ile Phe Gly Val Val Gly Ala Gly Ile Leu Thr Leu Leu Asn
450 455 460
Asn Asn Ala Asn Asn Ser Ala His Ile Gly Leu Leu Ile Leu Pro Gly
465 470 475 480
Val Ala Phe Gly Gly Leu Ala Gln Ser Ser Met Leu Ala Ser Gln Ile
485 490 495
Gln Leu Asp Lys Lys Ser Pro Thr Phe Arg Ser Asp Phe Val Ser Ile
500 505 510
Thr Thr Phe Asn Thr Phe Cys Lys Asn Leu Gly Gln Ala Leu Gly Gly
515 520 525
Val Ile Ser Asn Thr Val Phe Ser Ala Ala Ala Ile Lys Lys Leu Thr
530 535 540
Lys Ala Asn Ile Gln Leu Pro Asp Gly Thr Thr Val Asp Asn Leu Val
545 550 555 560
Ile Tyr Arg Gln Thr Asn Phe Asp Gly Ser His Ser Lys Leu Gly Asn
565 570 575
Ile Ile Ser Glu Ser Leu Thr Asp Val Phe Tyr Met Ala Leu Gly Phe
580 585 590
Tyr Ala Leu Ser Leu Ile Phe Ala Val Phe Ala Ser Asn Lys Lys Val
595 600 605
Thr Ala Ser Leu Arg
610
<210> 131
<211> 543
<212> PRT
<213> Saccharomyces cerevisiae
<400> 131
Met Lys Ser Thr Leu Ser Leu Thr Leu Cys Val Ile Ser Leu Leu Leu
1 5 10 15
Thr Leu Phe Leu Ala Ala Leu Asp Ile Val Ile Val Val Thr Leu Tyr
20 25 30
Asp Thr Ile Gly Ile Lys Phe His Asp Phe Gly Asn Ile Gly Trp Leu
35 40 45
Val Thr Gly Tyr Ala Leu Ser Asn Ala Val Phe Met Leu Leu Trp Gly
50 55 60
Arg Leu Ala Glu Ile Leu Gly Thr Lys Glu Cys Leu Met Ile Ser Val
65 70 75 80
Ile Val Phe Glu Ile Gly Ser Leu Ile Ser Ala Leu Ser Asn Ser Met
85 90 95
Ala Thr Leu Ile Ser Gly Arg Val Val Ala Gly Phe Gly Gly Ser Gly
100 105 110
Ile Glu Ser Leu Ala Phe Val Val Gly Thr Ser Ile Val Arg Glu Asn
115 120 125
His Arg Gly Ile Met Ile Thr Ala Leu Ala Ile Ser Tyr Val Ile Ala
130 135 140
Glu Gly Val Gly Pro Phe Ile Gly Gly Ala Phe Asn Glu His Leu Ser
145 150 155 160
Trp Arg Trp Cys Phe Tyr Ile Asn Leu Pro Ile Gly Ala Phe Ala Phe
165 170 175
Ile Ile Leu Ala Phe Cys Asn Thr Ser Gly Glu Pro His Gln Lys Met
180 185 190
Trp Leu Pro Ser Lys Ile Lys Lys Ile Met Asn Tyr Asp Tyr Gly Glu
195 200 205
Leu Leu Lys Ala Ser Phe Trp Lys Asn Thr Phe Glu Val Leu Val Phe
210 215 220
Lys Leu Asp Met Val Gly Ile Ile Leu Ser Ser Ala Gly Phe Thr Leu
225 230 235 240
Leu Met Leu Gly Leu Ser Phe Gly Gly Asn Asn Phe Pro Trp Asn Ser
245 250 255
Gly Ile Ile Ile Cys Phe Phe Thr Val Gly Pro Ile Leu Leu Leu Leu
260 265 270
Phe Cys Ala Tyr Asp Phe His Phe Leu Ser Leu Ser Gly Leu His Tyr
275 280 285
Asp Asn Lys Arg Ile Lys Pro Leu Leu Thr Trp Asn Ile Ala Ser Asn
290 295 300
Cys Gly Ile Phe Thr Ser Ser Ile Thr Gly Phe Leu Ser Cys Phe Ala
305 310 315 320
Tyr Glu Leu Gln Ser Ala Tyr Leu Val Gln Leu Tyr Gln Leu Val Phe
325 330 335
Lys Lys Lys Pro Thr Leu Ala Ser Ile His Leu Trp Glu Leu Ser Ile
340 345 350
Pro Ala Met Ile Ala Thr Met Ala Ile Ala Tyr Leu Asn Ser Lys Tyr
355 360 365
Gly Ile Ile Lys Pro Ala Ile Val Phe Gly Val Leu Cys Gly Ile Val
370 375 380
Gly Ser Gly Leu Phe Thr Leu Ile Asn Gly Glu Leu Ser Gln Ser Ile
385 390 395 400
Gly Tyr Ser Ile Leu Pro Gly Ile Ala Phe Gly Ser Ile Phe Gln Ala
405 410 415
Thr Leu Leu Ser Ser Gln Val Gln Ile Thr Ser Asp Asp Pro Asp Phe
420 425 430
Gln Asn Lys Phe Ile Glu Val Thr Ala Phe Asn Ser Phe Ala Lys Ser
435 440 445
Leu Gly Phe Ala Phe Gly Gly Asn Met Gly Ala Met Ile Phe Thr Ala
450 455 460
Ser Leu Lys Asn Gln Met Arg Ser Ser Gln Leu Asn Ile Pro Gln Phe
465 470 475 480
Thr Ser Val Glu Thr Leu Leu Ala Tyr Ser Thr Glu His Tyr Asp Gly
485 490 495
Pro Gln Ser Ser Leu Ser Lys Phe Ile Asn Thr Ala Ile His Asp Val
500 505 510
Phe Tyr Cys Ala Leu Gly Cys Tyr Ala Leu Ser Phe Phe Phe Gly Ile
515 520 525
Phe Thr Ser Ser Lys Lys Thr Thr Ile Ser Ala Lys Lys Gln Gln
530 535 540
<210> 132
<211> 514
<212> PRT
<213> Saccharomyces cerevisiae
<400> 132
Met Val Ala Glu Phe Gln Ile Ala Ser Ala Gln Ser Ser Ala Leu Thr
1 5 10 15
Ser Thr Glu Glu Glu His Cys Ser Ile Asn Ser Asp Lys Ala Ala Lys
20 25 30
Leu Asp Leu Glu Leu Thr Ser Glu Arg Lys Asn Asp Gly Lys Gln Ser
35 40 45
His Glu Val Thr Phe Asn Glu Asp Ile Ala Asp Pro Glu Asp Ile Ala
50 55 60
Arg His Met Ser Thr Ala Arg Arg Tyr Tyr Ile Ser Ser Leu Ile Thr
65 70 75 80
Phe Thr Ser Met Val Ile Thr Met Ile Ser Ser Ser Trp Thr Leu Pro
85 90 95
Ser Thr His Ile Ile Glu His Phe His Ile Ser His Glu Val Ser Thr
100 105 110
Leu Gly Ile Thr Leu Tyr Val Phe Gly Leu Gly Ile Gly Pro Leu Phe
115 120 125
Leu Ser Pro Leu Ser Glu Leu Tyr Gly Arg Arg Ile Thr Phe Leu Tyr
130 135 140
Ala Leu Thr Leu Ser Ile Ile Trp Gln Cys Leu Thr Ile Trp Ser Lys
145 150 155 160
Thr Ile Thr Gly Val Met Phe Gly Arg Phe Leu Ser Gly Phe Phe Gly
165 170 175
Ser Ala Phe Leu Ser Val Ala Gly Gly Ala Ile Ala Asp Ile Phe Asp
180 185 190
Lys Asp Gln Ile Gly Ile Pro Met Ala Ile Tyr Thr Thr Ser Ala Phe
195 200 205
Leu Gly Pro Ser Leu Gly Pro Ile Ile Gly Gly Ala Leu Tyr His Gln
210 215 220
Ser Tyr Lys Trp Thr Phe Ile Thr Leu Leu Ile Thr Ser Gly Cys Cys
225 230 235 240
Leu Val Met Ile Ile Phe Thr Ile Pro Glu Thr Tyr Lys Pro Met Leu
245 250 255
Leu Ile Arg Lys Ala Lys Arg Leu Arg Lys Glu Lys Asn Asp Gln Arg
260 265 270
Tyr Tyr Ala Val Leu Glu Val Thr Arg Glu Gln Thr Ser Leu Leu Ser
275 280 285
Ala Ile Phe Leu Ser Thr Lys Arg Pro Phe Gly Leu Leu Leu Arg Asp
290 295 300
Arg Met Met Gly Val Leu Cys Phe Tyr Thr Gly Leu Glu Leu Ala Ile
305 310 315 320
Ile Tyr Leu Tyr Phe Val Ala Phe Pro Tyr Val Phe Lys Lys Leu Tyr
325 330 335
Asn Phe Gly Pro Met Glu Ile Ala Cys Ser Tyr Ile Gly Ile Met Val
340 345 350
Gly Met Ile Leu Ser Ala Pro Thr Cys Leu Leu Phe Gln Lys Thr Phe
355 360 365
Glu Trp Arg Val Lys Arg Asn Asn Gly Val Lys Thr Pro Glu Met Arg
370 375 380
Phe Glu Pro Leu Phe Tyr Gly Ala Phe Leu Thr Pro Val Gly Leu Phe
385 390 395 400
Ile Phe Ala Phe Thr Cys Tyr Lys His Val His Trp Ile Ala Pro Ile
405 410 415
Ile Gly Ser Ala Ile Phe Gly Ser Gly Val Tyr Phe Val Phe Thr Gly
420 425 430
Val Phe Ala Tyr Thr Val Asp Ala Tyr Arg Arg Tyr Ala Ala Ser Gly
435 440 445
Met Ala Cys Asn Thr Phe Val Arg Cys Ile Met Ala Gly Val Phe Pro
450 455 460
Leu Phe Gly Leu Gln Met Tyr Lys Ser Met Gly Val Asn Trp Ala Gly
465 470 475 480
Phe Leu Leu Ala Met Val Thr Val Ala Met Ile Pro Val Pro Phe Leu
485 490 495
Phe Thr Lys Tyr Gly Ala Arg Leu Arg Ala Lys Ser Pro Tyr Ala Trp
500 505 510
Asp Asp
<210> 133
<211> 542
<212> PRT
<213> Saccharomyces cerevisiae
<400> 133
Met Gly Asn Gln Ser Leu Val Val Leu Thr Glu Ser Lys Gly Glu Tyr
1 5 10 15
Glu Asn Glu Thr Glu Leu Pro Val Lys Lys Ser Ser Arg Asp Asn Asn
20 25 30
Ile Gly Glu Ser Leu Thr Ala Thr Ala Phe Thr Gln Ser Glu Asp Glu
35 40 45
Met Val Asp Ser Asn Gln Lys Trp Gln Asn Pro Asn Tyr Phe Lys Tyr
50 55 60
Ala Trp Gln Glu Tyr Leu Phe Ile Phe Thr Cys Met Ile Ser Gln Leu
65 70 75 80
Leu Asn Gln Ala Gly Thr Thr Gln Thr Leu Ser Ile Met Asn Ile Leu
85 90 95
Ser Asp Ser Phe Gly Ser Glu Gly Asn Ser Lys Ser Trp Leu Met Ala
100 105 110
Ser Phe Pro Leu Val Ser Gly Ser Phe Ile Leu Ile Ser Gly Arg Leu
115 120 125
Gly Asp Ile Tyr Gly Leu Lys Lys Met Leu Leu Val Gly Tyr Val Leu
130 135 140
Val Ile Ile Trp Ser Leu Ile Cys Gly Ile Thr Lys Tyr Ser Gly Ser
145 150 155 160
Asp Thr Phe Phe Ile Ile Ser Arg Ala Phe Gln Gly Leu Gly Ile Ala
165 170 175
Phe Val Leu Pro Asn Val Leu Gly Ile Ile Gly Asn Ile Tyr Val Gly
180 185 190
Gly Thr Phe Arg Lys Asn Ile Val Ile Ser Phe Val Gly Ala Met Ala
195 200 205
Pro Ile Gly Ala Thr Leu Gly Cys Leu Phe Ala Gly Leu Ile Gly Thr
210 215 220
Glu Asp Pro Lys Gln Trp Pro Trp Ala Phe Tyr Ala Tyr Ser Ile Ala
225 230 235 240
Ala Phe Ile Asn Phe Val Leu Ser Ile Tyr Ala Ile Pro Ser Thr Ile
245 250 255
Pro Thr Asn Ile His His Phe Ser Met Asp Trp Ile Gly Ser Val Leu
260 265 270
Gly Val Ile Gly Leu Ile Leu Leu Asn Phe Val Trp Asn Gln Ala Pro
275 280 285
Ile Ser Gly Trp Asn Gln Ala Tyr Ile Ile Val Ile Leu Ile Ile Ser
290 295 300
Val Ile Phe Leu Val Val Phe Ile Ile Tyr Glu Ile Arg Phe Ala Lys
305 310 315 320
Thr Pro Leu Leu Pro Arg Ala Val Ile Lys Asp Arg His Met Ile Gln
325 330 335
Ile Met Leu Ala Leu Phe Phe Gly Trp Gly Ser Phe Gly Ile Phe Thr
340 345 350
Phe Tyr Tyr Phe Gln Phe Gln Leu Asn Ile Arg Gln Tyr Thr Ala Leu
355 360 365
Trp Ala Gly Gly Thr Tyr Phe Met Phe Leu Ile Trp Gly Ile Ile Ala
370 375 380
Ala Leu Leu Val Gly Phe Thr Ile Lys Asn Val Ser Pro Ser Val Phe
385 390 395 400
Leu Phe Phe Ser Met Val Ala Phe Asn Val Gly Ser Ile Met Ala Ser
405 410 415
Val Thr Pro Val His Glu Thr Tyr Phe Arg Thr Gln Leu Gly Thr Met
420 425 430
Ile Ile Leu Ser Phe Gly Met Asp Leu Ser Phe Pro Ala Ser Ser Ile
435 440 445
Ile Phe Ser Asp Asn Leu Pro Met Glu Tyr Gln Gly Met Ala Gly Ser
450 455 460
Leu Val Asn Thr Val Val Asn Tyr Ser Met Ser Leu Cys Leu Gly Met
465 470 475 480
Gly Ala Thr Val Glu Thr Gln Val Asn Ser Asp Gly Lys His Leu Leu
485 490 495
Lys Gly Tyr Arg Gly Ala Gln Tyr Leu Gly Ile Gly Leu Ala Ser Leu
500 505 510
Ala Cys Met Ile Ser Gly Leu Tyr Met Val Glu Ser Phe Ile Lys Gly
515 520 525
Arg Arg Ala Arg Ala Ala Ala Glu Tyr Asp Cys Thr Val Ala
530 535 540
<210> 134
<211> 615
<212> PRT
<213> Saccharomyces cerevisiae
<400> 134
Met Ser Ser Ser Val Val Gly Ala Ser Ser Asn Lys Lys Ser Gly Ile
1 5 10 15
Arg Gln Ser Cys Glu Ile Ile Glu Arg Glu Arg His Ser Asn Asp Asp
20 25 30
Thr Tyr Ser Met Thr Ser Thr Phe Phe Lys Leu Lys Glu Asn Glu Ile
35 40 45
Met Ser Ala Gln Phe Asp Ser Leu Lys Tyr Lys Ile Leu Leu Ile Ser
50 55 60
Thr Ala Phe Val Cys Gly Phe Gly Ile Ser Leu Asp Tyr Thr Leu Arg
65 70 75 80
Ser Thr Tyr Thr Gly Tyr Ala Thr Asn Ser Tyr Ser Glu His Ser Leu
85 90 95
Leu Ser Thr Val Gln Val Ile Asn Ala Val Val Ser Val Gly Ser Gln
100 105 110
Val Val Tyr Ser Arg Leu Ser Asp His Phe Gly Arg Leu Arg Leu Phe
115 120 125
Leu Val Ala Thr Ile Phe Tyr Ile Met Gly Thr Ile Ile Gln Ser Gln
130 135 140
Ala Thr Arg Leu Thr Met Tyr Ala Ala Gly Ser Val Phe Tyr Asn Cys
145 150 155 160
Gly Tyr Val Gly Thr Asn Leu Leu Leu Thr Leu Ile Leu Ser Asp Phe
165 170 175
Ser Ser Leu Lys Trp Arg Met Phe Tyr Gln Tyr Ala Ser Tyr Trp Pro
180 185 190
Tyr Ile Ile Ile Pro Trp Ile Ser Gly Asn Ile Ile Thr Ala Ala Asn
195 200 205
Pro Gln Lys Asn Trp Ser Trp Asn Ile Ala Met Trp Ala Phe Ile Tyr
210 215 220
Pro Leu Ser Thr Leu Pro Ile Ile Phe Leu Ile Leu Tyr Met Lys Tyr
225 230 235 240
Lys Ser Ser Lys Thr Ala Glu Trp Arg Ser Leu Lys Glu Gln Ala Arg
245 250 255
Lys Glu Arg Thr Gly Gly Leu Phe Glu Asn Leu Val Phe Leu Phe Trp
260 265 270
Lys Leu Asp Ile Val Gly Ile Leu Leu Ile Thr Val Ser Leu Gly Cys
275 280 285
Ile Leu Val Pro Leu Thr Leu Ala Asn Glu Thr Ser Gln Lys Trp His
290 295 300
Asn Ser Lys Ile Ile Ala Thr Leu Val Ser Gly Gly Cys Leu Phe Phe
305 310 315 320
Ile Phe Leu Tyr Trp Glu Ala Lys Phe Ala Lys Ser Pro Leu Leu Pro
325 330 335
Phe Lys Leu Leu Ser Asp Arg Gly Ile Trp Ala Pro Leu Gly Val Thr
340 345 350
Phe Phe Asn Phe Phe Thr Phe Phe Ile Ser Cys Asp Tyr Leu Tyr Pro
355 360 365
Val Leu Leu Val Ser Met Lys Glu Ser Ser Thr Ser Ala Ala Arg Ile
370 375 380
Val Asn Leu Pro Asp Phe Val Ala Ala Thr Ala Ser Pro Phe Tyr Ser
385 390 395 400
Leu Leu Val Ala Lys Thr Arg Lys Leu Lys Leu Ser Val Ile Gly Gly
405 410 415
Cys Ala Ala Trp Met Val Cys Met Gly Leu Phe Tyr Lys Tyr Arg Gly
420 425 430
Gly Ser Gly Ser His Glu Gly Val Ile Ala Ala Ser Val Ile Met Gly
435 440 445
Leu Ser Gly Leu Leu Cys Ser Asn Ser Val Ile Val Ile Leu Gln Ala
450 455 460
Met Thr Thr His Ser Arg Met Ala Val Ile Thr Gly Ile Gln Tyr Thr
465 470 475 480
Phe Ser Lys Leu Gly Ala Ala Ile Gly Ala Ser Val Ser Gly Ala Ile
485 490 495
Trp Thr Gln Thr Met Pro Asn Gln Leu Tyr Lys Asn Leu Gly Asn Asp
500 505 510
Thr Leu Ala Glu Ile Ala Tyr Ala Ser Pro Tyr Thr Phe Ile Ser Asp
515 520 525
Tyr Pro Trp Gly Ser Pro Glu Arg Asp Ala Val Val Glu Ser Tyr Arg
530 535 540
Tyr Val Gln Arg Ile Ile Met Thr Val Gly Leu Ala Cys Thr Val Pro
545 550 555 560
Phe Phe Thr Phe Thr Met Phe Met Arg Asn Pro Glu Leu Ile Asp Lys
565 570 575
Ala Thr His Glu Glu Phe Thr Glu Asp Gly Leu Val Val Leu Pro Asp
580 585 590
Glu Glu Asn Ile Phe Ser Gln Ile Lys Ala Leu Phe Arg His Asn Arg
595 600 605
Ser Asn Lys Lys Ser Gly Cys
610 615
<210> 135
<211> 586
<212> PRT
<213> Saccharomyces cerevisiae
<400> 135
Met Asp Lys Tyr Thr Asn Arg Asp His Pro Asp Tyr Ile Pro Gly Thr
1 5 10 15
Phe Asn Ile Tyr Ser Ser Gln Asn Leu Glu Asn Gly Ile Ile Tyr Glu
20 25 30
Ser Lys Leu Lys Lys Thr Ser Ser Gly Val Val Leu Ile Pro Gln Pro
35 40 45
Ser Tyr Ser Pro Asn Asp Pro Leu Asn Trp Ser Ser Trp Arg Lys Leu
50 55 60
Ala His Phe Gly Leu Met Ala Phe Ile Thr Ala Phe Thr Ala Ala Thr
65 70 75 80
Ser Asn Asp Ala Gly Ala Ala Gln Asp Ser Leu Asn Glu Ile Tyr Gly
85 90 95
Ile Ser Tyr Asp Ser Met Asn Thr Gly Ala Gly Val Leu Phe Leu Gly
100 105 110
Ile Gly Trp Ser Thr Leu Phe Leu Ala Pro Phe Ala Asn Leu Tyr Gly
115 120 125
Arg Lys Ile Thr Tyr Ile Val Cys Thr Thr Leu Gly Leu Phe Gly Ala
130 135 140
Leu Trp Phe Ala Leu Ala Lys Arg Thr Ser Asp Thr Ile Trp Ser Gln
145 150 155 160
Leu Phe Val Gly Ile Ser Glu Ser Cys Ala Glu Ala Gln Val Gln Leu
165 170 175
Ser Leu Ser Asp Ile Phe Phe Gln His Gln Leu Gly Ser Val Leu Thr
180 185 190
Val Tyr Ile Met Cys Thr Ser Ile Gly Thr Phe Leu Gly Pro Leu Ile
195 200 205
Ala Gly Tyr Ile Ser Ala Phe Thr Asn Phe Arg Trp Val Gly Trp Val
210 215 220
Ala Val Ile Ile Ser Gly Gly Leu Leu Ile Thr Ile Ile Phe Gly Cys
225 230 235 240
Glu Glu Thr Tyr Phe Asp Arg Gly Gln Tyr Met Thr Pro Leu Thr Ser
245 250 255
Cys Gln Ser Gly Tyr Glu Asp Gly Thr Thr Leu Gln Asn Ser Asp Asn
260 265 270
Thr Ala Val Ser Arg Arg Lys Arg His Leu Asp Ala Lys Leu Ser Thr
275 280 285
Pro Gly Ala Met Gly Glu Lys Gly Val Asp Leu Ser Glu Thr Ala Glu
290 295 300
Phe Glu Val Asn Asn Glu Glu Glu Val Thr Ile Pro Glu Thr Arg Glu
305 310 315 320
Leu Ile Asp Gly Ser Lys Glu His Leu Lys Pro Tyr Pro Lys Arg Val
325 330 335
Ala Ile Leu Thr Lys Ala Thr Asn Leu Lys Gly Tyr Gly Phe Lys Gln
340 345 350
Tyr Phe Lys Tyr Leu Lys Ile Asn Leu Arg Met Phe Leu Phe Pro Pro
355 360 365
Val Trp Leu Ser Gly Met Phe Trp Gly Ile Gln Asp Val Phe Leu Thr
370 375 380
Phe Tyr Leu Thr Thr Gln Glu Ser Ala Tyr Tyr Glu Pro Pro Trp Asn
385 390 395 400
Tyr Ser Asp Phe Gly Val Ala Ile Met Asn Val Pro Thr Leu Ile Gly
405 410 415
Ala Val Ile Gly Cys Ile Cys Ala Gly Ile Val Ser Asp Tyr Phe Val
420 425 430
Leu Trp Met Ala Arg His Asn Arg Gly Ile Leu Glu Ala Glu Phe Arg
435 440 445
Leu Tyr Phe Ser Ile Ala Thr Ala Ile Ile Gly Pro Ala Gly Leu Leu
450 455 460
Met Phe Gly Ile Gly Thr Ala Arg Gln Trp Pro Trp Gln Ala Ile Tyr
465 470 475 480
Val Gly Leu Gly Phe Val Gly Phe Ala Trp Gly Cys Ser Gly Asp Ile
485 490 495
Ala Met Ala Tyr Leu Met Asp Cys Tyr Pro Asp Met Val Leu Glu Gly
500 505 510
Met Val Cys Thr Ala Ile Ile Asn Asn Thr Ile Ser Cys Ile Phe Thr
515 520 525
Phe Thr Cys Ser Asp Trp Leu Ala Ala Ser Gly Thr Glu Asn Thr Tyr
530 535 540
Ile Ala Leu Ala Val Ile Asn Phe Gly Ile Thr Ala Phe Ala Leu Pro
545 550 555 560
Met Tyr Tyr Tyr Gly Lys Arg Ile Arg Leu Trp Thr Lys Arg Trp Tyr
565 570 575
Leu Gln Ser Val Asn Leu Arg Asp Gly Val
580 585
<210> 136
<211> 515
<212> PRT
<213> Saccharomyces cerevisiae
<400> 136
Met Ser Thr Ser Ser Ser Val Thr Gln Lys Asn Leu Asp Thr Asn Ala
1 5 10 15
Glu Ala Leu Lys Lys Glu Asp Lys Val Leu Ser Glu Phe Asp Ile Gln
20 25 30
Asp Glu Arg Pro Lys Ser Leu Leu Trp Glu Ser Ala Phe Val Gly Val
35 40 45
Leu Cys Ser Ala Gln Leu Met Thr Gln Ala Gly Leu Gly Gln Ser Leu
50 55 60
Ala Pro Leu His Ile Ile Gly Asn Ser Phe Gly Thr Thr Asn Ala Gly
65 70 75 80
Gln Leu Ser Trp Phe Ala Ser Ala Tyr Ser Leu Thr Val Gly Thr Phe
85 90 95
Ile Leu Ile Ala Gly Arg Leu Gly Asp Ile Phe Gly His Lys Lys Phe
100 105 110
Phe Val Leu Gly Phe Phe Trp Tyr Ala Leu Trp Ser Leu Leu Ala Gly
115 120 125
Phe Ser Val Tyr Ser Asn Gln Ile Phe Phe Asp Cys Cys Arg Ala Phe
130 135 140
Gln Gly Met Gly Pro Ala Phe Leu Leu Pro Asn Ala Ile Ala Ile Leu
145 150 155 160
Gly Arg Thr Tyr Lys Pro Gly Arg Arg Lys Asn Met Val Phe Ser Leu
165 170 175
Phe Gly Ala Ser Ala Pro Gly Gly Phe Phe Leu Gly Ala Val Phe Ser
180 185 190
Ser Met Leu Gly Gln Leu Ala Trp Trp Pro Trp Ala Tyr Trp Ile Met
195 200 205
Gly Ile Ala Cys Phe Val Leu Ala Val Ala Gly Tyr Phe Val Ile Pro
210 215 220
His Thr Pro Met Pro Ser Arg Asp Ala Ser Ser Phe Lys Leu Leu Glu
225 230 235 240
Arg Ile Asp Phe Ala Gly Ser Val Thr Gly Val Val Gly Leu Ile Leu
245 250 255
Phe Asn Phe Ala Trp Asn Gln Gly Pro Val Val Gly Trp Gln Thr Pro
260 265 270
Tyr Thr Tyr Ala Leu Leu Ile Val Gly Thr Phe Phe Leu Val Ile Phe
275 280 285
Ala Tyr Ile Glu Ser Arg Ala Ala Phe Pro Leu Leu Pro Phe Ala Ala
290 295 300
Leu Ser Ser Asp Thr Ala Phe Val Leu Ser Cys Ile Ala Ala Gly Trp
305 310 315 320
Ala Ser Phe Gly Ile Trp Ile Phe Tyr Thr Trp Gln Phe Met Glu Asp
325 330 335
Ser Arg Gly Gln Thr Pro Leu Leu Ser Ser Ala Gln Phe Ser Pro Val
340 345 350
Ala Ile Ser Gly Phe Cys Ala Ala Val Thr Thr Gly Phe Leu Leu Ser
355 360 365
His Thr Pro Pro Ser Thr Val Met Leu Phe Ala Met Thr Ala Phe Thr
370 375 380
Val Gly Thr Ile Leu Ile Ala Thr Ala Pro Val His Gln Thr Tyr Trp
385 390 395 400
Ala Gln Thr Phe Val Ser Ile Ile Val Met Pro Trp Gly Met Asp Met
405 410 415
Ser Phe Pro Ala Ala Thr Ile Met Leu Ser Asp Ser Met Pro His Glu
420 425 430
His Gln Gly Leu Ala Ala Ser Leu Val Asn Thr Val Val Asn Tyr Ser
435 440 445
Ile Ser Ile Gly Leu Gly Ile Ala Gly Thr Ile Glu Ser Arg Val Asn
450 455 460
Asp Gly Gly Ala Lys Pro Leu Lys Gly Tyr Arg Cys Ser Trp Tyr Met
465 470 475 480
Gly Ile Gly Leu Ser Gly Leu Gly Ile Phe Val Ala Ala Thr Tyr Ala
485 490 495
Trp Ser Thr Phe Met Lys Ser Lys Lys Arg Ile Ser Glu Lys Gln His
500 505 510
Phe Ile Glu
515
<210> 137
<211> 540
<212> PRT
<213> Saccharomyces cerevisiae
<400> 137
Met Phe Ser Ile Phe Lys Lys Lys Thr Ser Val Gln Gly Thr Asp Ser
1 5 10 15
Glu Ile Asp Glu Lys Ile Thr Val Lys Ala Lys Asp Lys Val Val Val
20 25 30
Ser Thr Glu Asp Glu Glu Val Thr Thr Ile Val Ser Ser Thr Lys Ser
35 40 45
Thr Gln Val Thr Asn Asp Ser Pro Trp Gln Asp Pro Thr Tyr Phe Ser
50 55 60
Ser Phe Gly Lys Glu Leu Met Phe Ile Ala Thr Cys Met Leu Ala Gln
65 70 75 80
Leu Leu Asn Gln Ala Gly Gln Thr His Ala Leu Cys Ile Met Asn Val
85 90 95
Leu Ser Lys Ser Phe Asn Ser Glu Ala Asn Asn Gln Ala Trp Leu Met
100 105 110
Ala Ser Phe Pro Leu Ala Ala Gly Ser Phe Ile Leu Ile Ser Gly Arg
115 120 125
Leu Gly Asp Ile Tyr Gly Leu Lys Lys Met Leu Ile Val Gly Tyr Val
130 135 140
Ile Val Ile Val Trp Ser Ile Ile Ser Gly Leu Ser Lys Tyr Ser Asn
145 150 155 160
Ser Asp Ala Phe Phe Ile Thr Ser Arg Ala Phe Gln Gly Val Gly Ile
165 170 175
Ala Phe Ile Leu Pro Asn Ile Met Gly Leu Val Gly His Val Tyr Lys
180 185 190
Val Gly Ser Phe Arg Lys Asn Ile Val Ile Ser Phe Ile Gly Ala Cys
195 200 205
Ala Pro Thr Gly Gly Met Phe Gly Gly Leu Phe Gly Gly Leu Ile Val
210 215 220
Thr Glu Asp Pro Asn Gln Trp Pro Trp Val Phe Tyr Ala Phe Gly Ile
225 230 235 240
Ala Thr Phe Leu Ser Leu Leu Met Ala Trp Tyr Ser Ile Pro Asn Asn
245 250 255
Val Pro Thr Asn Ile His Gly Leu Ser Met Asp Trp Thr Gly Ser Ala
260 265 270
Leu Ala Ile Ile Gly Leu Ile Leu Phe Asn Phe Val Trp Asn Gln Ala
275 280 285
Pro Ile Val Gly Trp Asp Lys Pro Tyr Ile Ile Val Leu Leu Ile Ile
290 295 300
Ser Val Ile Phe Leu Val Ala Phe Phe Val Tyr Glu Ser Lys Tyr Ala
305 310 315 320
Glu Val Pro Leu Leu Pro Arg Ala Met Thr Lys Asn Arg His Met Ile
325 330 335
Met Ile Leu Leu Ala Val Phe Leu Gly Trp Gly Ser Phe Gly Ile Trp
340 345 350
Thr Phe Tyr Tyr Val Ser Phe Gln Leu Asn Leu Arg His Tyr Ser Pro
355 360 365
Val Trp Thr Gly Gly Thr Tyr Phe Val Phe Val Ile Phe Gly Ser Met
370 375 380
Ala Ala Phe Phe Val Ala Phe Ser Ile Lys Arg Leu Gly Pro Ala Leu
385 390 395 400
Leu Leu Cys Phe Ser Leu Met Ala Phe Asp Ala Gly Ser Ile Met Phe
405 410 415
Ser Val Leu Pro Val Glu Gln Ser Tyr Trp Lys Leu Asn Phe Ala Met
420 425 430
Gln Ala Ile Leu Cys Phe Gly Met Asp Leu Ser Phe Pro Ala Ser Ser
435 440 445
Ile Ile Leu Ser Asp Gly Leu Pro Met Gln Tyr Gln Gly Met Ala Gly
450 455 460
Ser Leu Val Asn Thr Val Ile Asn Tyr Ser Ala Ser Leu Cys Leu Gly
465 470 475 480
Met Gly Gly Thr Val Glu His Gln Ile Asn Lys Ser Gly Asn Asp Leu
485 490 495
Leu Lys Gly Tyr Arg Ala Ala Val Tyr Leu Gly Val Gly Leu Ala Ser
500 505 510
Leu Gly Val Val Ile Ser Val Thr Tyr Met Leu Glu Asn Leu Trp Asn
515 520 525
Arg His Arg Lys Ser Glu Asp Arg Ser Leu Glu Ala
530 535 540
<210> 138
<211> 606
<212> PRT
<213> Saccharomyces cerevisiae
<400> 138
Met Leu Glu Thr Asp His Ser Arg Asn Asp Asn Leu Asp Asp Lys Ser
1 5 10 15
Thr Val Cys Tyr Ser Glu Lys Thr Asp Ser Asn Val Glu Lys Ser Thr
20 25 30
Thr Ser Gly Leu Arg Arg Ile Asp Ala Val Asn Lys Val Leu Ser Asp
35 40 45
Tyr Ser Ser Phe Thr Ala Phe Gly Val Thr Phe Ser Ser Leu Lys Thr
50 55 60
Ala Leu Leu Val Ala Leu Phe Leu Gln Gly Tyr Cys Thr Gly Leu Gly
65 70 75 80
Gly Gln Ile Ser Gln Ser Ile Gln Thr Tyr Ala Ala Asn Ser Phe Gly
85 90 95
Lys His Ser Gln Val Gly Ser Ile Asn Thr Val Lys Ser Ile Val Ala
100 105 110
Ser Val Val Ala Val Pro Tyr Ala Arg Ile Ser Asp Arg Phe Gly Arg
115 120 125
Ile Glu Cys Trp Ile Phe Ala Leu Val Leu Tyr Thr Ile Gly Glu Ile
130 135 140
Ile Ser Ala Ala Thr Pro Thr Phe Ser Gly Leu Phe Ala Gly Ile Val
145 150 155 160
Ile Gln Gln Phe Gly Tyr Ser Gly Phe Arg Leu Leu Ala Thr Ala Leu
165 170 175
Thr Gly Asp Leu Ser Gly Leu Arg Asp Arg Thr Phe Ala Met Asn Ile
180 185 190
Phe Leu Ile Pro Val Ile Ile Asn Thr Trp Val Ser Gly Asn Ile Val
195 200 205
Ser Ser Val Ala Gly Asn Val Ala Pro Tyr Lys Trp Arg Trp Gly Tyr
210 215 220
Gly Ile Phe Cys Ile Ile Val Pro Ile Ser Thr Leu Ile Leu Val Leu
225 230 235 240
Pro Tyr Val Tyr Ala Gln Tyr Ile Ser Trp Arg Ser Gly Lys Leu Pro
245 250 255
Pro Leu Lys Leu Lys Glu Lys Gly Gln Thr Leu Arg Gln Thr Leu Trp
260 265 270
Lys Phe Ala Asp Asp Ile Asn Leu Ile Gly Val Ile Leu Phe Thr Ala
275 280 285
Phe Leu Val Leu Val Leu Leu Pro Leu Thr Ile Ala Gly Gly Ala Thr
290 295 300
Ser Lys Trp Arg Glu Gly His Ile Ile Ala Met Ile Val Val Gly Gly
305 310 315 320
Cys Leu Gly Phe Ile Phe Leu Ile Trp Glu Leu Lys Phe Ala Lys Asn
325 330 335
Pro Phe Ile Pro Arg Val Tyr Leu Gly Asp Pro Thr Ile Tyr Val Ala
340 345 350
Leu Leu Met Glu Phe Val Trp Arg Leu Gly Leu Gln Ile Glu Leu Glu
355 360 365
Tyr Leu Val Thr Val Leu Met Val Ala Phe Gly Glu Ser Thr Leu Ser
370 375 380
Ala Gln Arg Ile Ala Gln Leu Tyr Asn Phe Leu Gln Ser Cys Thr Asn
385 390 395 400
Ile Val Val Gly Ile Met Leu His Phe Tyr Pro His Pro Lys Val Phe
405 410 415
Val Val Ala Gly Ser Leu Leu Gly Val Ile Gly Met Gly Leu Leu Tyr
420 425 430
Lys Tyr Arg Val Val Tyr Asp Gly Ile Ser Gly Leu Ile Gly Ala Glu
435 440 445
Ile Val Val Gly Ile Ala Gly Gly Met Ile Arg Phe Pro Met Trp Thr
450 455 460
Leu Val His Ala Ser Thr Thr His Asn Glu Met Ala Thr Val Thr Gly
465 470 475 480
Leu Leu Met Ser Val Tyr Gln Ile Gly Asp Ala Val Gly Ala Ser Ile
485 490 495
Ala Gly Ala Ile Trp Thr Gln Arg Leu Ala Lys Glu Leu Ile Gln Arg
500 505 510
Leu Gly Ser Ser Leu Gly Met Ala Ile Tyr Lys Ser Pro Leu Asn Tyr
515 520 525
Leu Lys Lys Tyr Pro Ile Gly Ser Glu Val Arg Val Gln Met Ile Glu
530 535 540
Ser Tyr Ser Lys Ile Gln Arg Leu Leu Ile Ile Val Ser Ile Ser Phe
545 550 555 560
Ala Ala Phe Asn Ala Val Leu Cys Phe Phe Leu Arg Gly Phe Thr Val
565 570 575
Asn Lys Lys Gln Ser Leu Ser Ala Glu Glu Arg Glu Lys Glu Lys Leu
580 585 590
Lys Ile Lys Gln Gln Ser Trp Leu Arg Arg Val Ile Gly Tyr
595 600 605
<210> 139
<211> 627
<212> PRT
<213> Saccharomyces cerevisiae
<400> 139
Met Glu Ser Val His Ser Arg Asp Pro Val Lys Glu Glu Lys Lys His
1 5 10 15
Val Phe Met Gly Met Glu His Glu Leu Asn Pro Glu Thr His Asn Asp
20 25 30
Ser Asn Ser Asp Ser Tyr Gly Leu Pro Gln Leu Ser Glu Lys Tyr Asn
35 40 45
Ala Leu Arg Gln Asn Arg Ser Leu Ile Ile Gln Gln Thr Glu Ile Ile
50 55 60
Gly Ser Ala Tyr Asn Lys Trp Tyr Leu Gln Ala Ile Leu Leu Leu Ser
65 70 75 80
Ala Phe Ile Cys Gly Tyr Gly Tyr Gly Leu Asp Gly Asn Ile Arg Tyr
85 90 95
Ile Tyr Thr Gly Tyr Ala Thr Ser Ser Tyr Ser Glu His Ser Leu Leu
100 105 110
Ser Thr Ile Asn Val Ile Asn Ala Val Val Ser Ala Ala Ser Gln Ile
115 120 125
Ile Tyr Ala Arg Leu Ser Asp Val Phe Gly Arg Leu Tyr Leu Phe Ile
130 135 140
Ser Ala Val Ile Leu Tyr Val Val Gly Thr Ile Ile Gln Ser Gln Ala
145 150 155 160
Tyr Asp Val Gln Arg Tyr Ala Ala Gly Ala Ile Phe Tyr Asn Ala Gly
165 170 175
Tyr Val Gly Val Ile Leu Ile Leu Leu Ile Ile Leu Ser Asp Phe Ser
180 185 190
Ser Leu Lys Trp Arg Leu Leu Tyr Gln Phe Val Pro Thr Trp Pro Phe
195 200 205
Ile Ile Asn Thr Trp Ile Ala Gly Asn Ile Thr Ser Arg Ala Asn Pro
210 215 220
Val Val Asn Trp Ser Trp Asp Val Gly Met Trp Ala Phe Ile Phe Pro
225 230 235 240
Leu Ser Cys Val Pro Ile Val Leu Cys Met Leu His Met Gln Trp Arg
245 250 255
Ala Arg Lys Thr Pro Glu Trp His Ala Leu Lys Gly Gln Lys Ser Tyr
260 265 270
Tyr Gln Glu His Gly Phe Ile Lys Ile Leu Lys Gln Leu Phe Trp Met
275 280 285
Leu Asp Val Val Gly Val Leu Leu Met Gly Cys Ser Leu Gly Cys Ile
290 295 300
Leu Val Pro Leu Thr Leu Ala Gly Gly Val Lys Thr Thr Trp Asn Asp
305 310 315 320
Ser Arg Leu Ile Gly Pro Phe Val Leu Gly Phe Val Leu Ile Pro Ile
325 330 335
Leu Trp Ile Trp Glu Tyr Arg Phe Ala Arg Asp Pro Ile Leu Pro Tyr
340 345 350
Arg Leu Val Lys Asp Arg Ala Val Trp Ser Ser Met Gly Ile Ser Phe
355 360 365
Leu Ile Asp Phe Ile Tyr Tyr Met Ala Ala Asp Tyr Leu Tyr Thr Val
370 375 380
Met Ile Val Ala Val Asn Glu Ser Val Lys Ser Ala Thr Arg Ile Ala
385 390 395 400
Thr Leu Ser Ser Phe Val Ser Thr Val Ala Ser Pro Phe Phe Ala Leu
405 410 415
Leu Val Thr Arg Cys Thr Arg Leu Lys Pro Phe Ile Met Phe Gly Cys
420 425 430
Ala Leu Trp Met Val Ala Met Gly Leu Leu Tyr His Phe Arg Gly Gly
435 440 445
Ser Gln Ser His Ser Gly Ile Ile Gly Ala Leu Cys Val Trp Gly Val
450 455 460
Gly Thr Thr Leu Phe Thr Tyr Pro Val Thr Val Ser Val Gln Ser Ala
465 470 475 480
Val Ser His Glu Asn Met Ala Thr Val Thr Ala Leu Asn Tyr Thr Leu
485 490 495
Tyr Arg Ile Gly Ser Ala Val Gly Ser Ala Val Ser Gly Ala Ile Trp
500 505 510
Thr Gln Thr Leu Tyr Lys Gln Ile Leu Lys Arg Met Gly Asp Val Ala
515 520 525
Leu Ala Thr Thr Ala Tyr Glu Ser Pro Tyr Thr Phe Ile Glu Thr Tyr
530 535 540
Thr Trp Gly Thr Pro Gln Arg Asn Ala Leu Met Asn Ala Tyr Lys Tyr
545 550 555 560
Val Gln Arg Leu Glu Thr Ile Val Ala Leu Val Phe Cys Val Pro Leu
565 570 575
Ile Ala Phe Ser Leu Cys Leu Arg Asp Pro Lys Leu Thr Asp Thr Val
580 585 590
Ala Val Glu Tyr Ile Glu Asp Gly Glu Tyr Val Asp Thr Lys Asp Asn
595 600 605
Asp Pro Ile Leu Asp Trp Phe Glu Lys Leu Pro Ser Lys Phe Thr Phe
610 615 620
Lys Arg Glu
625
<210> 140
<211> 620
<212> PRT
<213> Saccharomyces cerevisiae
<400> 140
Met Ile Glu Val Pro Glu Asp Asn Arg Ser Ser Gln Thr Lys Arg Lys
1 5 10 15
Asn Thr Glu Lys Asn Cys Asn Glu Leu Met Val Asp Glu Lys Met Asp
20 25 30
Asp Asp Ser Ser Pro Arg Asp Glu Met Lys Asp Lys Leu Lys Gly Thr
35 40 45
Lys Ser Leu Ile Ile Arg Lys Ser Glu Leu Met Ala Lys Lys Tyr Asp
50 55 60
Thr Trp Gln Leu Lys Ala Ile Phe Leu Phe Ser Ala Phe Ile Cys Thr
65 70 75 80
Phe Ala Tyr Gly Leu Asp Ser Ser Ile Arg Gly Thr Tyr Met Thr Tyr
85 90 95
Ala Met Asn Ser Tyr Ser Ala His Ser Leu Ile Ser Thr Val Ser Val
100 105 110
Ile Val Leu Met Ile Ser Ala Val Ser Gln Val Ile Phe Gly Gly Leu
115 120 125
Ser Asp Ile Phe Gly Arg Leu Thr Leu Phe Leu Val Ser Ile Val Leu
130 135 140
Tyr Ile Val Gly Thr Ile Ile Gln Ser Gln Ala Tyr Asp Val Gln Arg
145 150 155 160
Tyr Ala Ala Gly Ala Val Phe Tyr Tyr Val Gly Leu Val Gly Val Met
165 170 175
Leu Gln Val Val Leu Met Leu Ser Asp Asn Ser Ser Leu Lys Trp Arg
180 185 190
Leu Phe Tyr Thr Leu Ile Pro Ser Trp Pro Ser Ile Ile Thr Thr Trp
195 200 205
Val Ser Gly Ser Val Val Glu Ala Ala Asn Pro Leu Glu Asn Trp Ser
210 215 220
Trp Asn Ile Ala Met Trp Ala Phe Ile Phe Pro Leu Cys Cys Ile Pro
225 230 235 240
Leu Ile Leu Cys Met Leu His Met Arg Trp Lys Val Arg Asn Asp Val
245 250 255
Glu Trp Lys Glu Leu Gln Asp Glu Lys Ser Tyr Tyr Gln Thr His Gly
260 265 270
Leu Val Gln Met Leu Val Gln Leu Phe Trp Lys Leu Asp Val Val Gly
275 280 285
Val Leu Leu Phe Thr Ala Gly Val Gly Cys Ile Leu Val Pro Leu Thr
290 295 300
Leu Ala Gly Gly Val Ser Thr Asn Trp Arg Asn Ser Lys Ile Ile Gly
305 310 315 320
Pro Phe Val Leu Gly Phe Val Leu Val Pro Gly Phe Ile Tyr Trp Glu
325 330 335
Ser Arg Leu Ala Leu Val Pro Phe Ala Pro Phe Lys Leu Leu Lys Asp
340 345 350
Arg Gly Val Trp Ala Pro Leu Gly Ile Met Phe Phe Ile Cys Phe Val
355 360 365
Tyr Gln Met Ala Ala Gly Tyr Leu Tyr Thr Ile Leu Val Val Ala Val
370 375 380
Asp Glu Ser Ala Ser Ser Ala Thr Arg Ile Ile Asn Leu Tyr Ser Phe
385 390 395 400
Val Thr Ala Val Val Ala Pro Phe Leu Gly Leu Ile Val Thr Arg Ser
405 410 415
Ser Arg Leu Lys Ser Tyr Ile Ile Phe Gly Gly Ser Leu Tyr Phe Ile
420 425 430
Thr Met Gly Leu Phe Tyr Arg Tyr Arg Ser Gly Gln Asp Ala Asp Gly
435 440 445
Gly Ile Ile Ala Gly Met Val Ile Trp Gly Leu Ser Ser Cys Leu Phe
450 455 460
Asp Tyr Pro Thr Ile Val Ser Ile Gln Ser Val Thr Ser His Glu Asn
465 470 475 480
Met Ala Thr Val Thr Ala Leu Asn Tyr Thr Val Phe Arg Ile Gly Gly
485 490 495
Ala Val Ala Ala Ala Ile Ser Gly Ala Ile Trp Thr Gln Ser Leu Tyr
500 505 510
Pro Lys Leu Leu His Tyr Met Gly Asp Ala Asp Leu Ala Thr Ala Ala
515 520 525
Tyr Gly Ser Pro Leu Thr Phe Ile Leu Ser Asn Pro Trp Gly Thr Pro
530 535 540
Val Arg Ser Ala Met Val Glu Ala Tyr Arg His Val Gln Lys Tyr Glu
545 550 555 560
Val Ile Val Ala Leu Val Phe Ser Ala Pro Met Phe Leu Leu Thr Phe
565 570 575
Cys Val Arg Asp Pro Arg Leu Thr Glu Asp Phe Ala Gln Lys Leu Pro
580 585 590
Asp Arg Glu Tyr Val Gln Thr Lys Glu Asp Asp Pro Ile Asn Asp Trp
595 600 605
Ile Ala Lys Arg Phe Ala Lys Ala Leu Gly Arg Ser
610 615 620
<210> 141
<211> 458
<212> PRT
<213> Saccharomyces cerevisiae
<400> 141
Met Val Ala Asn Trp Val Leu Ala Leu Thr Arg Gln Phe Asp Pro Phe
1 5 10 15
Met Phe Met Met Val Met Gly Val Gly Ile Ser Ser Asn Ile Leu Tyr
20 25 30
Ser Phe Pro Tyr Pro Ala Arg Trp Leu Arg Ile Cys Ser Tyr Ile Met
35 40 45
Phe Ala Ile Ala Cys Leu Ile Phe Ile Ala Val Gln Ala Leu Gln Ile
50 55 60
Leu His Leu Ile Val Tyr Ile Lys Glu Lys Ser Phe Arg Glu Tyr Phe
65 70 75 80
Asn Asp Phe Phe Arg Asn Met Lys His Asn Leu Phe Trp Gly Thr Tyr
85 90 95
Pro Met Gly Leu Val Thr Ile Ile Asn Phe Leu Gly Ala Leu Ser Lys
100 105 110
Ala Asn Thr Thr Lys Ser Pro Thr Asn Ala Arg Asn Leu Met Ile Phe
115 120 125
Val Tyr Val Leu Trp Trp Tyr Asp Leu Ala Val Cys Leu Val Ile Ala
130 135 140
Trp Gly Ile Ser Phe Leu Ile Trp His Asp Tyr Tyr Pro Leu Glu Gly
145 150 155 160
Ile Gly Asn Tyr Pro Ser Tyr Asn Ile Lys Met Ala Ser Glu Asn Met
165 170 175
Lys Ser Val Leu Leu Leu Asp Ile Ile Pro Leu Val Val Val Ala Ser
180 185 190
Ser Cys Gly Thr Phe Thr Met Ser Glu Ile Phe Phe His Ala Phe Asn
195 200 205
Arg Asn Ile Gln Leu Ile Thr Leu Val Ile Cys Ala Leu Thr Trp Leu
210 215 220
His Ala Ile Ile Phe Val Phe Ile Leu Ile Ala Ile Tyr Phe Trp Ser
225 230 235 240
Leu Tyr Ile Asn Lys Ile Pro Pro Met Thr Gln Val Phe Thr Leu Phe
245 250 255
Leu Leu Leu Gly Pro Met Gly Gln Gly Ser Phe Gly Val Leu Leu Leu
260 265 270
Thr Asp Asn Ile Lys Lys Tyr Ala Gly Lys Tyr Tyr Pro Thr Asp Asn
275 280 285
Ile Thr Arg Glu Gln Glu Ile Leu Thr Ile Ala Val Pro Trp Cys Phe
290 295 300
Lys Ile Leu Gly Met Val Ser Ala Met Ala Leu Leu Ala Met Gly Tyr
305 310 315 320
Phe Phe Thr Val Ile Ser Val Val Ser Ile Leu Ser Tyr Tyr Asn Lys
325 330 335
Lys Glu Ile Glu Asn Glu Thr Gly Lys Val Lys Arg Val Tyr Thr Phe
340 345 350
His Lys Gly Phe Trp Gly Met Thr Phe Pro Met Gly Thr Met Ser Leu
355 360 365
Gly Asn Glu Glu Leu Tyr Val Gln Tyr Asn Gln Tyr Val Pro Leu Tyr
370 375 380
Ala Phe Arg Val Leu Gly Thr Ile Tyr Gly Gly Val Cys Val Cys Trp
385 390 395 400
Ser Ile Leu Cys Leu Leu Cys Thr Leu His Glu Tyr Ser Lys Lys Met
405 410 415
Leu His Ala Ala Arg Lys Ser Ser Leu Phe Ser Glu Ser Gly Thr Glu
420 425 430
Lys Thr Thr Val Ser Pro Tyr Asn Ser Ile Glu Ser Val Glu Glu Ser
435 440 445
Asn Ser Ala Leu Asp Phe Thr Arg Leu Ala
450 455
<210> 142
<211> 598
<212> PRT
<213> Saccharomyces cerevisiae
<400> 142
Met Ser Phe Gly Ser Lys Val Ser Arg Ala Leu Arg Phe Leu Glu Ile
1 5 10 15
Pro Val Lys Asp Arg Ala Ser Val Ser Phe Leu Lys Asn Pro Asp Leu
20 25 30
Gln Pro Ile Lys Ser Ala Asn Gln Thr Trp Gly Phe Trp Ser Asn Phe
35 40 45
Ala Tyr Trp Gly Val Met Ser Phe Ser Val Gly Thr Trp Met Ser Ala
50 55 60
Ser Ser Ala Leu Gly Val Gly Leu Ser Tyr Pro Glu Thr Ile Gly Thr
65 70 75 80
Phe Ile Val Gly Asp Val Leu Thr Ile Ile Phe Thr Leu Ala Asn Ser
85 90 95
Cys Pro Gly Tyr Asp Trp Lys Val Gly Phe Thr Leu Ala Gln Arg Phe
100 105 110
Val Phe Gly Ile Tyr Gly Ser Ala Phe Gly Ile Ile Ile Arg Ile Leu
115 120 125
Met Ser Ile Val Asn Tyr Gly Ser Asn Ala Trp Val Gly Gly Leu Cys
130 135 140
Ile Asn Met Ile Leu Asp Ser Trp Ser His His Tyr Leu His Leu Pro
145 150 155 160
Asn Thr Leu Ser Ser Lys Val Ala Met Thr Thr Lys Glu Leu Ile Gly
165 170 175
Phe Ile Ile Phe His Val Leu Thr Ala Phe Cys Tyr Leu Met Lys Pro
180 185 190
Tyr His Met Asn Tyr Ile Leu Ile Trp Ser Cys Val Ala Thr Phe Phe
195 200 205
Ser Met Leu Gly Met Val Ile Tyr Leu Ala Lys Gln Ala His Gly Val
210 215 220
Gly Glu Leu Phe Thr Ser Thr Lys Ser Thr Ala Thr Gly Ser Thr Lys
225 230 235 240
Ala Trp Ala Trp Val Tyr Met Ile Ser Tyr Trp Phe Gly Ser Val Ser
245 250 255
Pro Gly Ser Thr Asn Gln Ser Asp Tyr Ser Arg Phe Gly Ser Ser Asn
260 265 270
Trp Ala Ile Trp Ala Gly Thr Ile Cys Ala Leu Leu Ile Pro Thr Thr
275 280 285
Leu Ile Pro Val Phe Gly Val Ile Gly Ala Ser Thr Cys Asp Lys Leu
290 295 300
Tyr Gly Glu Gln Tyr Trp Met Pro Met Asp Ile Phe Asn His Trp Leu
305 310 315 320
Thr Thr Asn Tyr Ser Ala Gly Ala Arg Ala Gly Ala Phe Phe Cys Gly
325 330 335
Leu Ser Phe Val Leu Ser Gln Met Ser Tyr Thr Ile Ser Asn Cys Gly
340 345 350
Phe Ala Ser Gly Met Asp Leu Ala Gly Leu Leu Pro Lys Tyr Val Asp
355 360 365
Ile Lys Arg Gly Ala Leu Phe Ala Ala Cys Val Ser Trp Ala Cys Leu
370 375 380
Pro Trp Asn Phe Tyr Asn Ser Ser Ser Thr Phe Leu Thr Val Met Ser
385 390 395 400
Ser Phe Gly Val Val Met Thr Pro Ile Ile Ser Val Met Ile Cys Asp
405 410 415
Asn Phe Leu Ile Arg Lys Arg Gln Tyr Ser Ile Thr Asn Ala Phe Ile
420 425 430
Leu Lys Gly Glu Tyr Tyr Phe Thr Lys Gly Val Asn Trp Arg Ala Ile
435 440 445
Val Ala Trp Val Cys Gly Met Thr Pro Gly Leu Pro Gly Ile Ala Trp
450 455 460
Glu Val Asn Asn Asp Tyr Phe His Asn Thr Gly Ile Val Asn Phe Phe
465 470 475 480
Tyr Gly Asp Ser Phe Phe Ser Phe Leu Ile Ser Phe Phe Val Tyr Trp
485 490 495
Gly Leu Cys Leu Leu Phe Pro Phe Lys Ile Thr Val Lys His Asp Asp
500 505 510
Lys Asp Tyr Tyr Gly Ala Phe Thr Asp Glu Glu Ala Arg Lys Lys Gly
515 520 525
Met Val Pro Tyr Ser Glu Ile Ser Glu Glu Glu Ile Arg Ala Tyr Thr
530 535 540
Leu Gly Glu Gly Tyr Thr Thr Gly His Glu Tyr Arg Pro Glu Gly Ser
545 550 555 560
Asp Asp Glu Ile Pro Glu Leu Val Lys Thr Ser Ser Glu Asn Thr Asn
565 570 575
Glu Phe Glu Ile Val His His Lys Asn Asn Glu Lys Gln Ser Ser Thr
580 585 590
Ala Ser Glu Lys Ala Ala
595
<210> 143
<211> 579
<212> PRT
<213> Saccharomyces cerevisiae
<400> 143
Met Asn Arg Asp Asn Met Asp Thr Thr Lys Arg Lys Glu Asp His Thr
1 5 10 15
Lys His Thr Thr Asp Val Ile Glu Phe Tyr Glu Glu Gly Thr Ala Ala
20 25 30
Ser Ser Leu Asn Ile Ala Thr Glu Lys Ala Asn Ser Ser Pro Ser Ile
35 40 45
Leu Arg Arg Ile Ile Asn Arg Ala Ala Trp Leu Ser Lys Lys Val Asp
50 55 60
Ala Met Gly Val Glu Ser Thr Gly Ile Gln Arg Ile Ser Pro Tyr Glu
65 70 75 80
Arg Gly Thr Ser Lys Lys Gln Phe Leu His Val Ala Gly Leu Trp Leu
85 90 95
Ser Ala Thr Gly Gly Leu Ser Ser Met Ser Ser Phe Leu Leu Gly Pro
100 105 110
Leu Leu Phe Gly Leu Ser Phe Arg Glu Ser Val Ala Ser Ser Leu Ile
115 120 125
Ser Val Thr Ile Gly Cys Leu Ile Ala Ala Tyr Cys Ser Ile Met Gly
130 135 140
Pro Gln Ser Gly Cys Arg Gln Met Val Thr Ala Arg Tyr Leu Phe Gly
145 150 155 160
Trp Trp Phe Val Lys Leu Val Ala Leu Ala Ser Ile Ile Gly Val Met
165 170 175
Gly Trp Ser Val Val Asn Ser Val Val Gly Gly Glu Met Leu Ala Ala
180 185 190
Ile Ser Asn Asp Lys Val Pro Leu Trp Val Gly Ile Val Ile Val Thr
195 200 205
Val Cys Ser Phe Leu Val Ala Ile Phe Gly Ile Lys Gln Val Ile Lys
210 215 220
Val Glu Thr Tyr Leu Ser Val Pro Val Leu Thr Ala Phe Leu Leu Leu
225 230 235 240
Tyr Ile Ser Ser Ser Asp Lys Tyr Ser Phe Val Asn Ala Tyr Val Ser
245 250 255
Lys Gly Asn Leu Asp Ser Ser Thr Arg Lys Gly Asn Trp Met Ser Phe
260 265 270
Phe Ser Leu Cys Tyr Ser Ile Thr Ala Thr Trp Gly Ser Ile Thr Ala
275 280 285
Asp Tyr Tyr Ile Leu Phe Pro Glu Asp Thr Pro Tyr Ile Gln Ile Phe
290 295 300
Cys Leu Thr Phe Phe Gly Thr Phe Leu Pro Thr Cys Phe Val Gly Ile
305 310 315 320
Leu Gly Leu Leu Leu Ala Ser Val Ala Met Ser Tyr Lys Pro Trp Ser
325 330 335
Val Glu Tyr Asp Ser His Gly Met Gly Gly Leu Leu Trp Ala Gly Phe
340 345 350
Gln Arg Trp Asn Gly Phe Gly Lys Phe Cys Val Val Val Leu Val Phe
355 360 365
Ser Leu Val Ser Asn Asn Ile Ile Asn Thr Tyr Ser Ala Ala Phe Ser
370 375 380
Ile Gln Leu Ser Ser Val Phe Cys Ala Lys Ile Pro Arg Trp Phe Trp
385 390 395 400
Ser Ile Val Cys Thr Ile Ile Cys Leu Val Cys Ala Leu Ile Gly Arg
405 410 415
Asn His Phe Ser Thr Ile Leu Gly Asn Phe Leu Pro Met Ile Gly Tyr
420 425 430
Trp Ile Ser Met Tyr Phe Ile Leu Leu Phe Glu Glu Asn Leu Val Phe
435 440 445
Arg Arg Phe Phe Leu His Leu Tyr Thr Lys Glu Phe Pro Thr Val Thr
450 455 460
Gly Glu Ile Asn Gly Pro Glu Leu Val Gly Ser Ser Lys Glu Val Glu
465 470 475 480
Lys Asp Ala Val Thr Asn Ile His Leu Leu Lys Arg Lys His Lys Val
485 490 495
Thr Lys His Arg Tyr Asn Trp Asp Lys Trp Glu Asp Tyr Glu Val Leu
500 505 510
Thr His Gly Tyr Ala Ala Thr Phe Ala Phe Ile Val Gly Val Ala Gly
515 520 525
Val Val Val Gly Met Ala Gln Ala Tyr Trp Ile Gly Pro Ile Ala Ala
530 535 540
Lys Phe Gly Glu Tyr Gly Gly Asp Val Ala Met Trp Leu Ser Met Ala
545 550 555 560
Phe Ser Gly Val Val Tyr Pro Pro Cys Arg Tyr Leu Glu Leu Arg Lys
565 570 575
Phe Gly Arg
<210> 144
<211> 593
<212> PRT
<213> Saccharomyces cerevisiae
<400> 144
Met Tyr Ser Ile Val Lys Glu Ile Ile Val Asp Pro Tyr Lys Arg Leu
1 5 10 15
Lys Trp Gly Phe Ile Pro Val Lys Arg Gln Val Glu Asp Leu Pro Asp
20 25 30
Asp Leu Asn Ser Thr Glu Ile Val Thr Ile Ser Asn Ser Ile Gln Ser
35 40 45
His Glu Thr Ala Glu Asn Phe Ile Thr Thr Thr Ser Glu Lys Asp Gln
50 55 60
Leu His Phe Glu Thr Ser Ser Tyr Ser Glu His Lys Asp Asn Val Asn
65 70 75 80
Val Thr Arg Ser Tyr Glu Tyr Arg Asp Glu Ala Asp Arg Pro Trp Trp
85 90 95
Arg Phe Phe Asp Glu Gln Glu Tyr Arg Ile Asn Glu Lys Glu Arg Ser
100 105 110
His Asn Lys Trp Tyr Ser Trp Phe Lys Gln Gly Thr Ser Phe Lys Glu
115 120 125
Lys Lys Leu Leu Ile Lys Leu Asp Val Leu Leu Ala Phe Tyr Ser Cys
130 135 140
Ile Ala Tyr Trp Val Lys Tyr Leu Asp Thr Val Asn Ile Asn Asn Ala
145 150 155 160
Tyr Val Ser Gly Met Lys Glu Asp Leu Gly Phe Gln Gly Asn Asp Leu
165 170 175
Val His Thr Gln Val Met Tyr Thr Val Gly Asn Ile Ile Phe Gln Leu
180 185 190
Pro Phe Leu Ile Tyr Leu Asn Lys Leu Pro Leu Asn Tyr Val Leu Pro
195 200 205
Ser Leu Asp Leu Cys Trp Ser Leu Leu Thr Val Gly Ala Ala Tyr Val
210 215 220
Asn Ser Val Pro His Leu Lys Ala Ile Arg Phe Phe Ile Gly Ala Phe
225 230 235 240
Glu Ala Pro Ser Tyr Leu Ala Tyr Gln Tyr Leu Phe Gly Ser Phe Tyr
245 250 255
Lys His Asp Glu Met Val Arg Arg Ser Ala Phe Tyr Tyr Leu Gly Gln
260 265 270
Tyr Ile Gly Ile Leu Ser Ala Gly Gly Ile Gln Ser Ala Val Tyr Ser
275 280 285
Ser Leu Asn Gly Val Asn Gly Leu Glu Gly Trp Arg Trp Asn Phe Ile
290 295 300
Ile Asp Ala Ile Val Ser Val Val Val Gly Leu Ile Gly Phe Tyr Ser
305 310 315 320
Leu Pro Gly Asp Pro Tyr Asn Cys Tyr Ser Ile Phe Leu Thr Asp Asp
325 330 335
Glu Ile Arg Leu Ala Arg Lys Arg Leu Lys Glu Asn Gln Thr Gly Lys
340 345 350
Ser Asp Phe Glu Thr Lys Val Phe Asp Ile Lys Leu Trp Lys Thr Ile
355 360 365
Phe Ser Asp Trp Lys Ile Tyr Ile Leu Thr Leu Trp Asn Ile Phe Cys
370 375 380
Trp Asn Asp Ser Asn Val Ser Ser Gly Ala Tyr Leu Leu Trp Leu Lys
385 390 395 400
Ser Leu Lys Arg Tyr Ser Ile Pro Lys Leu Asn Gln Leu Ser Met Ile
405 410 415
Thr Pro Gly Leu Gly Met Val Tyr Leu Met Leu Thr Gly Ile Ile Ala
420 425 430
Asp Lys Leu His Ser Arg Trp Phe Ala Ile Ile Phe Thr Gln Val Phe
435 440 445
Asn Ile Ile Gly Asn Ser Ile Leu Ala Ala Trp Asp Val Ala Glu Gly
450 455 460
Ala Lys Trp Phe Ala Phe Met Leu Gln Cys Phe Gly Trp Ala Met Ala
465 470 475 480
Pro Val Leu Tyr Ser Trp Gln Asn Asp Ile Cys Arg Arg Asp Ala Gln
485 490 495
Thr Arg Ala Ile Thr Leu Val Thr Met Asn Ile Met Ala Gln Ser Ser
500 505 510
Thr Ala Trp Ile Ser Val Leu Val Trp Lys Thr Glu Glu Ala Pro Arg
515 520 525
Tyr Leu Lys Gly Phe Thr Phe Thr Ala Cys Ser Ala Phe Cys Leu Ser
530 535 540
Ile Trp Thr Phe Val Val Leu Tyr Phe Tyr Lys Arg Asp Glu Arg Asn
545 550 555 560
Asn Ala Lys Lys Asn Gly Ile Val Leu Tyr Asn Ser Lys His Gly Val
565 570 575
Glu Lys Pro Thr Ser Lys Asp Val Glu Thr Leu Ser Val Ser Asp Glu
580 585 590
Lys
<210> 145
<211> 628
<212> PRT
<213> Saccharomyces cerevisiae
<400> 145
Met Asp Pro Gly Ile Ala Asn His Thr Leu Pro Glu Glu Phe Glu Glu
1 5 10 15
Val Val Val Pro Glu Met Leu Glu Lys Glu Val Gly Ala Lys Val Asp
20 25 30
Val Lys Pro Thr Leu Thr Thr Ser Ser Pro Ala Pro Ser Tyr Ile Glu
35 40 45
Leu Ile Asp Pro Gly Val His Asn Ile Glu Ile Tyr Ala Glu Met Tyr
50 55 60
Asn Arg Pro Ile Tyr Arg Val Ala Leu Phe Phe Ser Leu Phe Leu Ile
65 70 75 80
Ala Tyr Ala Tyr Gly Leu Asp Gly Asn Ile Arg Tyr Thr Phe Gln Ala
85 90 95
Tyr Ala Thr Ser Ser Tyr Ser Gln His Ser Leu Leu Ser Thr Val Asn
100 105 110
Cys Ile Lys Thr Val Ile Ala Ala Val Gly Gln Ile Phe Phe Ala Arg
115 120 125
Leu Ser Asp Ile Phe Gly Arg Phe Ser Ile Met Ile Val Ser Ile Ile
130 135 140
Phe Tyr Ser Met Gly Thr Ile Ile Glu Ser Gln Ala Val Asn Ile Thr
145 150 155 160
Arg Phe Ala Val Gly Gly Cys Phe Tyr Gln Leu Gly Leu Thr Gly Ile
165 170 175
Ile Leu Ile Leu Glu Val Ile Ala Ser Asp Phe Ser Asn Leu Asn Trp
180 185 190
Arg Leu Leu Ala Leu Phe Ile Pro Ala Leu Pro Phe Ile Ile Asn Thr
195 200 205
Trp Ile Ser Gly Asn Val Thr Ser Ala Ile Asp Ala Asn Trp Lys Trp
210 215 220
Gly Ile Gly Met Trp Ala Phe Ile Leu Pro Leu Ala Cys Ile Pro Leu
225 230 235 240
Gly Ile Cys Met Leu His Met Arg Tyr Leu Ala Arg Lys His Ala Lys
245 250 255
Asp Arg Leu Lys Pro Glu Phe Glu Ala Leu Asn Lys Leu Lys Trp Lys
260 265 270
Ser Phe Cys Ile Asp Ile Ala Phe Trp Lys Leu Asp Ile Ile Gly Met
275 280 285
Leu Leu Ile Thr Val Phe Phe Gly Cys Val Leu Val Pro Phe Thr Leu
290 295 300
Ala Gly Gly Leu Lys Glu Glu Trp Lys Thr Ala His Ile Ile Val Pro
305 310 315 320
Glu Val Ile Gly Trp Val Val Val Leu Pro Leu Tyr Met Leu Trp Glu
325 330 335
Ile Lys Tyr Ser Arg His Pro Leu Thr Pro Trp Asp Leu Ile Gln Asp
340 345 350
Arg Gly Ile Phe Phe Ala Leu Leu Ile Ala Phe Phe Ile Asn Phe Asn
355 360 365
Trp Tyr Met Gln Gly Asp Tyr Met Tyr Thr Val Leu Val Val Ala Val
370 375 380
His Glu Ser Ile Lys Ser Ala Thr Arg Ile Thr Ser Leu Tyr Ser Phe
385 390 395 400
Val Ser Val Ile Val Gly Thr Ile Leu Gly Phe Ile Leu Ile Lys Val
405 410 415
Arg Arg Thr Lys Pro Phe Ile Ile Phe Gly Ile Ser Cys Trp Ile Val
420 425 430
Ser Phe Gly Leu Leu Val His Tyr Arg Gly Asp Ser Gly Ala His Ser
435 440 445
Gly Ile Ile Gly Ser Leu Cys Leu Leu Gly Phe Gly Ala Gly Ser Phe
450 455 460
Thr Tyr Val Thr Gln Ala Ser Ile Gln Ala Ser Ala Lys Thr His Ala
465 470 475 480
Arg Met Ala Val Val Thr Ser Leu Tyr Leu Ala Thr Tyr Asn Ile Gly
485 490 495
Ser Ala Phe Gly Ser Ser Val Ser Gly Ala Val Trp Thr Asn Ile Leu
500 505 510
Pro Lys Glu Ile Ser Lys Arg Ile Ser Asp Pro Thr Leu Ala Ala Gln
515 520 525
Ala Tyr Gly Ser Pro Phe Thr Phe Ile Thr Thr Tyr Thr Trp Gly Thr
530 535 540
Pro Glu Arg Ile Ala Leu Val Met Ser Tyr Arg Tyr Val Gln Lys Ile
545 550 555 560
Leu Cys Ile Ile Gly Leu Val Phe Cys Phe Pro Leu Leu Gly Cys Ala
565 570 575
Phe Met Leu Arg Asn His Lys Leu Thr Asp Ser Ile Ala Leu Glu Gly
580 585 590
Asn Asp His Leu Glu Ser Lys Asn Thr Phe Glu Ile Glu Glu Lys Glu
595 600 605
Glu Ser Phe Leu Lys Asn Lys Phe Phe Thr His Phe Thr Ser Ser Lys
610 615 620
Asp Arg Lys Asp
625
<210> 146
<211> 572
<212> PRT
<213> Saccharomyces cerevisiae
<400> 146
Met Gly Ser Glu Pro Phe Gln Lys Lys Asn Leu Gly Leu Gln Ile Asn
1 5 10 15
Ser Gln Glu Ser Gly Thr Thr Arg Ser Thr Phe His Ser Leu Glu Asp
20 25 30
Leu Gly Asp Asp Val Ile Asn Glu Ser Trp Asp Gln Val Asn Gln Lys
35 40 45
Arg Ala Asn Ile Asp His Asp Val Phe His Glu His Pro Asp Ser Ser
50 55 60
Pro Ser Leu Ser Ala Gln Lys Ala Lys Thr Lys Glu Glu Glu Val Ala
65 70 75 80
Val Lys Ser Ser Asn Ser Gln Ser Arg Asp Pro Ser Pro Asp Thr Gln
85 90 95
Ala His Ile Pro Tyr Thr Tyr Phe Ser Lys Asp Gln Arg Leu Ile Ile
100 105 110
Phe Gly Ile Ile Ile Phe Ile Gly Phe Leu Gly Pro Met Ser Gly Asn
115 120 125
Ile Tyr Ile Pro Ala Leu Pro Leu Leu Gln Arg Glu Tyr Asp Val Ser
130 135 140
Ala Thr Thr Ile Asn Ala Thr Val Ser Val Phe Met Ala Val Phe Ser
145 150 155 160
Val Gly Pro Leu Phe Trp Gly Ala Leu Ala Asp Phe Gly Gly Arg Lys
165 170 175
Phe Leu Tyr Met Val Ser Leu Ser Leu Met Leu Ile Val Asn Ile Leu
180 185 190
Leu Ala Ala Val Pro Val Asn Ile Ala Ala Leu Phe Val Leu Arg Ile
195 200 205
Phe Gln Ala Phe Ala Ser Ser Ser Val Ile Ser Leu Gly Ala Gly Thr
210 215 220
Val Thr Asp Val Val Pro Pro Lys His Arg Gly Lys Ala Ile Ala Tyr
225 230 235 240
Phe Met Met Gly Pro Asn Met Gly Pro Ile Ile Ala Pro Ile Val Ala
245 250 255
Gly Leu Ile Leu Met Lys Gly Asn Tyr Trp Arg Trp Leu Phe Gly Phe
260 265 270
Thr Ser Ile Met Thr Gly Ile Ala Leu Ile Leu Val Thr Ala Leu Leu
275 280 285
Pro Glu Thr Leu Arg Cys Ile Val Gly Asn Gly Asp Pro Lys Trp Gly
290 295 300
Asp Lys Lys Asp Glu Arg Glu Asn Asn Glu Ser Pro Phe Phe Glu Gly
305 310 315 320
Asn Lys Ile Ser His Arg Arg Leu Phe Pro Asp Ile Gly Ile Arg Lys
325 330 335
Pro Val Asn Asn Asp Ala Phe Phe Gln Glu Asn Phe Pro Lys Pro Pro
340 345 350
Lys Ala Gly Leu Thr Leu Tyr Trp Lys Met Ile Lys Cys Pro Pro Ile
355 360 365
Ile Ile Thr Ser Val Ser Thr Ala Leu Leu Phe Ser Ser Tyr Tyr Ala
370 375 380
Phe Ser Val Thr Phe Ser Tyr Tyr Leu Glu His Asp Tyr Arg Phe Thr
385 390 395 400
Met Leu Glu Ile Gly Ala Ala Tyr Val Cys Pro Gly Val Ala Met Leu
405 410 415
Leu Gly Ser Gln Ser Gly Gly His Leu Ser Asp Tyr Leu Arg Ser Arg
420 425 430
Trp Ile Lys Ser His Pro Lys Lys Lys Phe Pro Ala Glu Phe Arg Leu
435 440 445
Leu Leu Asn Leu Ile Gly Ile Leu Leu Thr Ile Cys Gly Thr Ile Gly
450 455 460
Tyr Gly Trp Ala Ile Phe Phe His Tyr His Phe Val Val Leu Leu Val
465 470 475 480
Phe Ser Ala Leu Thr Ala Phe Gly Met Thr Trp Cys Ser Asn Thr Ser
485 490 495
Met Thr Tyr Leu Thr Glu Leu Phe Pro Lys Arg Ala Ala Gly Thr Val
500 505 510
Ala Val Ser Ser Phe Phe Arg Asn Val Gly Ala Ala Ile Ser Ser Ala
515 520 525
Ile Ile Leu Gln Leu Cys Asn Ala Met Gly Ile Gly Trp Cys Phe Thr
530 535 540
Gly Leu Gly Leu Cys Ser Ser Ile Ser Leu Ile Gly Ile Leu Tyr Leu
545 550 555 560
Leu Ile Phe Gln Arg Lys Tyr Thr Ala Lys Glu Phe
565 570
<210> 147
<211> 4434
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic YOR1_BY nucleotide sequence
<400> 147
atgacgatta ccgtggggga tgcagtttcg gagacggagc tggaaaacaa aagtcaaaac 60
gtggtactat ctcccaaggc atctgcttct tcagacataa gcacagatgt tgataaggac 120
acatcgtctt cttgggatga caaatctttg ctgcctacag gtgaatatat tgtggacaga 180
aataagcccc aaacctactt gaatagcgat gatatcgaaa aagtgacaga atctgatatt 240
ttccctcaga aacgtctgtt ttcattcttg cactctaaga aaattccaga agtaccacaa 300
accgatgacg agaggaagat atatcctctg ttccatacaa atattatctc taacatgttt 360
ttttggtggg ttctacccat cctgcgagtt ggttataaga gaacgataca gccgaacgat 420
ctcttcaaaa tggatccgag gatgtctata gagacccttt atgacgactt tgaaaaaaac 480
atgatttact attttgagaa gacgaggaaa aaataccgta aaagacatcc agaagcgaca 540
gaagaagagg ttatggaaaa tgccaaacta cctaaacata cagttctgag agctttatta 600
ttcactttta agaaacagta cttcatgtcg atagtgtttg caattctcgc taattgtaca 660
tccggtttta accccatgat taccaagagg ctaattgagt ttgtcgaaga aaaggctatt 720
tttcatagca tgcatgttaa caaaggtatt ggttacgcta ttggtgcatg tttgatgatg 780
ttcgttaacg ggttgacgtt caaccatttc tttcatacat cccaactgac tggtgtgcaa 840
gctaagtcta ttcttactaa agctgccatg aagaaaatgt ttaatgcatc taattatgcg 900
agacattgtt ttcctaacgg taaagtgact tcttttgtaa caacagatct cgctagaatt 960
gaatttgcct tatcttttca gccgtttttg gctgggttcc ctgcaatttt ggctatttgc 1020
attgttttat tgatcgttaa ccttggaccc attgccttag ttgggattgg tatttttttc 1080
ggtgggtttt tcatatcctt atttgcattt aagttaattc tgggctttag aattgctgcg 1140
aacatcttca ctgatgctag agttaccatg atgagagaag tgctgaataa tataaaaatg 1200
attaaatatt atacgtggga ggatgcgtat gaaaaaaata ttcaagatat taggaccaaa 1260
gagatttcta aagttagaaa aatgcaacta tcaagaaatt tcttgattgc tatggccatg 1320
tctttgccta gtattgcttc attggtcact ttccttgcaa tgtacaaagt taataaagga 1380
ggcaggcaac ctggtaatat ttttgcctct ttatctttat ttcaggtctt gagtttgcaa 1440
atgtttttct tacctattgc tattggtact ggaattgaca tgatcattgg attgggccgt 1500
ttgcaaagct tattggaggc tccagaagat gatccaaatc agatgattga aatgaagcct 1560
tctcctggct ttgatccaaa attggcttta aaaatgacac attgctcatt tgagtgggaa 1620
gattatgaat taaacgacgc tattgaagaa gcaaaaggag aagctaaaga tgaaggtaaa 1680
aagaacaaaa aaaagcgtaa ggatacatgg ggtaagccat ctgcaagtac taataaggcg 1740
aaaagattgg acaatatgtt gaaagacaga gacggcccgg aagatttaga aaaaacttcg 1800
tttaggggtt tcaaggactt gaacttcgat attaaaaagg gcgaatttat tatgattacg 1860
ggacctattg gtactggtaa atcttcatta ttgaatgcga tggcaggatc aatgagaaaa 1920
actgatggta aggttgaagt caacggggac ttattaatgt gtggttatcc atggattcaa 1980
aatgcatctg taagagataa catcatattc ggttcaccat tcaataaaga aaagtatgat 2040
gaagtagttc gtgtttgctc tttgaaagct gatctggata ttttaccggc aggcgatatg 2100
accgaaattg gggaacgtgg tattacttta tctggtggtc aaaaggcacg tatcaattta 2160
gccaggtctg tttataagaa gaaggatatt tatctattcg acgatgtcct aagtgctgtc 2220
gattctcgtg ttggtaaaca catcatggat gaatgtctaa ccggaatgct tgctaataaa 2280
accagaattt tagcaacgca tcaattgtca ctgattgaga gagcttctag agtcatcgtt 2340
ttaggtactg atggccaagt cgatattggt actgttgatg agctaaaagc tcgtaatcaa 2400
actttgataa atcttttaca attctcttct caaaattcgg agaaagagga tgaagaacag 2460
gaagcggttg ttgccggtga attgggacaa ctaaaatatg aatcagaggt aaaggaattg 2520
actgaactga agaaaaaggc tacagaaatg tcacaaactg caaatagtgg taaaattgta 2580
gcggatggtc atactagtag taaagaagaa agagcagtca atagtatcag tctgaaaata 2640
taccgtgaat acattaaagc tgcagtaggt aagtggggtt ttatcgcact accgttgtat 2700
gcaattttag tcgttggaac cacattctgc tcactttttt cttccgtttg gttatcttac 2760
tggactgaga ataaattcaa aaacagacca cccagttttt atatgggtct ttactccttc 2820
tttgtgtttg ctgctttcat attcatgaat ggccagttca ccatactttg cgcaatgggt 2880
attatggcat cgaaatggtt aaatttgagg gctgtgaaaa gaattttaca cactccaatg 2940
tcatacatag ataccacacc tttgggacgt attctgaaca gattcacaaa agatacagat 3000
agcttagata atgagttaac cgaaagttta cggttgatga catctcaatt tgctaatatt 3060
gtaggtgttt gcgtcatgtg tattgtttac ttgccgtggt ttgctatcgc aattccgttt 3120
cttttggtca tctttgttct gattgctgat cattatcaga gttctggtag agaaattaaa 3180
agacttgaag ctgtgcaacg gtcttttgtt tacaataatt taaatgaagt tttgggtggg 3240
atggatacaa tcaaagcata ccgaagtcag gaacgatttt tggcgaaatc agattttttg 3300
atcaacaaga tgaatgaggc gggatacctt gtagttgtcc tgcaaagatg ggtaggtatt 3360
ttccttgata tggttgctat cgcatttgca ctaattatta cgttattgtg tgttacgaga 3420
gcctttccta tttccgcggc ttcagttggt gttttgttga cttatgtatt acaattgcct 3480
ggtctattaa ataccatttt aagggcaatg actcaaacag agaatgacat gaatagtgcc 3540
gaaagattgg taacatatgc aactgaacta ccactagagg catcctatag aaagcccgaa 3600
atgacacctc cagagtcatg gccctcaatg ggcgaaataa tttttgaaaa tgttgatttt 3660
gcctatagac ctggtttacc tatagtttta aaaaatctta acttgaatat caagagtggg 3720
gaaaaaattg gtatctgtgg tcgtacaggt gctggtaagt ccactattat gagtgccctt 3780
tacaggttga atgaattgac cgcaggtaaa attttaattg acaatgttga tataagtcag 3840
ctgggacttt tcgatttaag aagaaaatta gccatcattc cacaagatcc agtattattt 3900
aggggtacga ttcgcaagaa cttagatcca tttaatgagc gtacagatga cgaattatgg 3960
gatgcattgg tgagaggtgg tgctatcgcc aaggatgact tgccggaagt gaaattgcaa 4020
aaacctgatg aaaatggtac tcatggtaaa atgcataagt tccatttaga tcaagcagtg 4080
gaagaagagg gctccaattt ctccttaggt gagagacaac tattagcatt aacaagggca 4140
ttggtccgcc aatcaaaaat attgattttg gatgaggcta catcctcagt ggactacgaa 4200
acggatggca aaatccaaac acgtattgtt gaggaatttg gagattgtac aattttgtgt 4260
attgctcaca gactgaagac cattgtaaat tatgatcgta ttcttgtttt agagaagggt 4320
gaagtcgcag aattcgatac accatggacg ttgtttagtc aagaagatag tattttcaga 4380
agcatgtgtt ctagatctgg tattgtggaa aatgatttcg agaacagaag ttaa 4434
<210> 148
<211> 4434
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic YOR1-IS1 nucleotide sequence
<400> 148
atgacgatta ccgtggggga tgcagtttcg gagacggagc tggaaaacaa aagtcaaaac 60
gtggtactat ctcccaaggc atctgcttct tcagacataa gcacagatgt tgataaagac 120
acatcgtctt cttgggatga caaatctttg ctgcctacag gtgaatatat tgtggacaga 180
aataagcccc aaacctactt gaatagcgat gatatcgaaa aagtgacaga atctgatatt 240
ttccctcaga aacgtctgtt ttcattcttg cactctaaga aaattccaga agtaccacaa 300
accgatgacg agaggaagat atatcctctg ttccatacaa atattatctc taacatgctt 360
ttttggtggg ttctacccat cctgcgagtt ggttataaga gaacgataca gccgaacgat 420
ctcttcaaaa tggatccgag gatgtctata gagacccttt atgacgactt tgaaaaaaac 480
atgatttact attttgagaa gacgaggaaa aaataccgta aaagacatcc agaagcgaca 540
gaagaagagg ttatggaaaa tgccaaacta cctaaacata cagttctgag agctttatta 600
ttcactttta agaaacagta cttcatgtcg atagtgtttg caattctcgc taattgtaca 660
tccggtttta accccatgat taccaagagg ctaattgagt ttgtcgaaga aaaggctatt 720
tttcatagca tgcatgttaa caaaggtatt ggttacgcta ttggtgcatg tttgatgatg 780
ttcgttaacg ggttgacgtt caatcatttc tttcatacat cccaactgac tggtgtgcaa 840
gctaagtcta ttcttactaa agctgccatg aagaaaatgt ttaatgcatc taattatgcg 900
agacattgtt ttcctaacgg taaagtgact tcttttgtaa caacagatct cgctagaatt 960
gaatttgcct tatcttttca gccgtttttg gctgggttcc ctgcaatttt ggctatttgc 1020
attgttttat tgatcgttaa ccttggaccc attgccttag ttgggattgg tatttttttc 1080
ggtgggtttt tcatatcctt atttgcattt aagttaattc tgggctttag aattgctgcg 1140
aacatcttca ctgatgctag agttaccatg atgagagaag tgctgaataa tataaaaatg 1200
attaaatatt atacgtggga ggatgcgtat gaaaaaaata ttcaagatat taggaccaaa 1260
gagatttcta aagttagaaa aatgaaacta tcaagaaatt tcttgattgc tatggccatg 1320
tctttgccta gtattgcttc attggtcact ttccttgcaa tgtacaaagt taataaagga 1380
ggcaggcaac ctggtaatat ttttgcctct ttatctttat ttcaggtctt gagtttgcaa 1440
atgtttttct tacctattgc tattggtact ggaattgaca tgatcattgg attgggccgt 1500
ttgcaaagct tattggaggc tccagaagat gatccaaatc agatgattga aatgaagccc 1560
tctcctggct ttgatccaaa attggctcta aaaatgacac attgctcatt tgagtgggaa 1620
gattatgaat taaacgacgc tattgaagaa gcaaaaggag aagctaaaga tgaaggtaaa 1680
aagaacaaaa aaaagcgtaa ggatacatgg ggtaagccat ctgcaagtac taataaggcg 1740
aaaagattgg acaatatgtt gaaagacaga gacggcccgg aagatttaga aaaaacttcg 1800
tttaggggtt tcaaggactt gaacttcgat attaaaaagg gcgaatttat tatgattacg 1860
ggacctattg gtactggtaa atcttcatta ttgaatgcga tggcaggatc aatgagaaaa 1920
attgatggta aggttgaagt caacggggac ttattaatgt gtggttatcc atggattcaa 1980
aatgcatctg taagagataa catcatattc ggttcaccat tcaataaaga aaagtatgat 2040
gaagtagttc gtgtttgctc tttgaaagct gatctggata ttttaccggc aggcgatatg 2100
accgaaattg gggaacgtgg tattacttta tctggtggtc aaaaggcacg tatcaattta 2160
gccaggtctg tttataagaa gaaggatatt tatgtattcg acgatgtcct aagtgctgtc 2220
gattctcgtg ttggtaaaca catcatggat gaatgtctaa ccggaatgct tgctaataaa 2280
accagaattt tagcaacgca tcagttgtca ctgattgaga gagcttctag agtcatcgtt 2340
ttaggtactg atggccaagt cgatattggt actgttgatg agctaaaagc tcgtaatcaa 2400
actttgataa atcttttaca attctcttct caaaattcgg agaaagagga tgaagaacag 2460
gaagcggttg tttccggtga attgggacaa ctaaaatatg aatcagaggt aaaggaattg 2520
actgaactga agaaaaaggc tacagaaatg tcacaaactg caaatagtgg taaaattgta 2580
gcggatggtc atactagtag taaagaagaa agagcagtca atagtatcag tctgaaaata 2640
taccgtgaat acattaaagc tgcagtaggt aagtggggtt ttatcgcact accgttgtat 2700
gcaattttag tcgttggaac cacattctgc tcactttttt cttccgtttg gttatcttac 2760
tggactgaga ataaattcaa aaacagacca cccagttttt atatgggtct ttactccttc 2820
tttgtgtttg ctgctttcat attcatgaat ggccagttca ccatactttg cgcaatgggt 2880
attatggcat cgaaatggtt aaatttgagg gctgtgaaaa gaattttaca cactccaatg 2940
tcatacatag ataccacacc tttgggacgt attctgaaca gattcacaaa agatacagat 3000
agcttagata atgagttaac cgaaagttta cggttgatga catctcaatt tgctaatatt 3060
gtaggtgttt gcgtcatgtg tattgtttac ttgccgtggt ttgctatcgc aattccgttt 3120
cttttggtca tctttgttct gattgctgat cattatcaga gttctggtag agaaattaaa 3180
agacttgaag ctgtgcaacg gtcttttgtt tacaataatt taaatgaagt tttgggtggg 3240
atggatacaa tcaaagcata ccgaagtcag gaacgatttt tggcgaaatc agattttttg 3300
atcaacaaga tgaatgaggc gggatacctt gtagttgtcc tgcaaagatg ggtaggtatt 3360
ttccttgata tggttgctat cgcatttgca ctaattatta cgttattgtg tgttacgaga 3420
gcctttccta tttccgcggc ttcagttggt gttttgttga cttatgtatt acaattgcct 3480
ggtctattaa ataccatttt aagggcaatg actcaaacag agaatgacat gaatagtgcc 3540
gaaagattgg taacatatgc aactgaacta ccactagagg catcctatag aaagcccgaa 3600
atgacacctc cagagtcatg gccctcaatg ggcgaaataa tttttgaaaa tgttgatttt 3660
gcctatagac ctggtttacc tatagtttta aaaaatctta acttgaatat caagagtggg 3720
gaaaaaattg gtatctgtgg tcgtacaggt gctggtaagt ccactattat gagtgccctt 3780
tacaggttga atgaattgac cgcaggtaaa attttaattg acaatgttga tataagtcag 3840
ctgggacttt tcgatttaag aagaaaatta gccatcattc cacaagatcc agtattattt 3900
aggggtacga ttcgcaagaa cttagatcca tttaatgagc gtacagatga cgaattatgg 3960
gatgcattgg tgagaggtgg tgctatcgcc aaggatgact tgccggaagt gaaattgcaa 4020
aaacctgatg aaaatggtac tcatggtaaa atgcataagt tccatttaga tcaagcagtg 4080
gaagaagagg gctccaattt ctccttaggt gagagacaac tattagcatt aacaagggca 4140
ttggtccgcc aatcaaaaat attgattttg gatgaggcta catcctcagt ggactacgaa 4200
acggatggca aaatccaaac acgtattgtt gaggaatttg gagattgtac aattttgtgt 4260
attgctcaca gactgaagac cattgtaaat tatgatcgta ttcttgtttt agagaagggt 4320
gaagtcgcag aattcgatac accatggacg ttgtttagtc aagaagatag tattttcaga 4380
agcatgtgtt ctagatctgg tattgtggaa aatgatttcg agaacagaag ttaa 4434
<210> 149
<211> 1675
<212> DNA
<213> Stevia rebaudiana
<400> 149
gtcaaacgca tacctaccca gttagctcta tatatcaaaa cacctccaca tctccccttt 60
ttccaccctc tgccaccgtc ttccacccaa acgttgactc tgctctccgg cgtccggcgg 120
ctgctccggc gactgtggtg aagttacaaa tggataatgg acttgaaacg aagctactcc 180
gtcatgaaga agaagaggtc gaaggttctt tgacagagag ggtatggacc gaatccaaaa 240
agatatggag ggtcgcatta cccggtgtta tatcaagagt ttgcgcgttt ggaaccatcg 300
ttgtcactca atcattcgtc ggccatatta gcgaaatgga tcttgcaggt tacgcacttg 360
ttcagacact aagtgtccga ttcgtcaatg gaattcttct ggggatgtca agtgcaaccg 420
agacgctatg tggccaagca tttggggccg ggcaaaacca tatgatgggg atttacctgc 480
aacgatcttg gatcgttgat ctgatcactt taaccgtttt gctcccgatt ttcatcttcg 540
ggacacaagt atacaaacta cttggtgaag atgaggccat agctgagagt ggtggataca 600
tatcactttg gttcatcccg ttcatctata acttcgtctt tagcttgacc atacaaatgt 660
ttctacaagc acagttaaag aatatggtca ttgcgtggct ttctatcttt cagttcggca 720
tccacatccc gttgtcgtgg cttttggttt ataaattggg atatggggtg ccgggtgcca 780
tgatcgcgtt atcggcgtcg tcatggtttc ttgtgattgg agaatttatt tacatttttg 840
gtggttggtg tccttattct tggaaaggat ttacagttgc tgcatttaaa gacttgattc 900
ctgttgtgaa gctttcgata tcatctggtg ttatggtctg cttggagtta tggtacaacg 960
cggtgctggt cttgcttgct ggatacatgg caaatgctga agttgccatt tctgcctttt 1020
ccatatgctt gaacattaac gcatgggagt ttatgataag ccttggcttc ttaggcgctg 1080
catgtgtacg ggttgcaaat gaacttggaa gaggaaatgc taaagctgca aaattctcaa 1140
ttaaagtttt gttggggact tcaatcgcga taggaacatt tttctttgtt ctttgcttgg 1200
tgtttggcag aagaattgct tatttgttta caaatgatga acgagttgcg gatactgtat 1260
cagaactttc cgtattactt tcgttttctg tcttgctcaa cagcatttat cccgttctct 1320
caggtgtggc ggttggagca ggtttacaag gcattgtagc agttgttaac ctcgtttgct 1380
attacttgat cggtattcca acaggagcat tgcttggata tttgacaagt ctccaagtaa 1440
agggtatatg gattggaatg attggtggca tcgttgctca aacggttgcg ctcgtgtact 1500
tgacatggcg aacagattgg gatgatcagg tcaaaaggtc gttggaacgg ctcaatcggt 1560
tttatgtgaa aacctctgaa gagactgatg aaatttcgaa ctgatgatca tgttcatgtt 1620
catgtcaaat gattgaattt tcataaaaag tgtaacaagt ttttgtagta ttttt 1675
<210> 150
<211> 4419
<212> DNA
<213> Stevia rebaudiana
<400> 150
atggaggaat acaactcaat gacgtcattc atcttcttat ctccatatcc acaaacacta 60
ctcttggctt ccattgatac cgtatttcta ctcatcctct ttgttttcgt catccaaaag 120
ctatattcaa agttcagatc acacaacaat ggcggatcca ccattaacga acctctaatc 180
gctaaaacct taggttctgt caaaatcaat ctctggttct atttgtcact tacagtttcc 240
gtgattctag cagttttagc cattgtttca tcagttttag gattcacaca gaacacgcag 300
actcaatgga agtcaatcga cggaatttgc tggttgattc aagcgatttc gtttatcgta 360
atcactgttg taatcattca cgagaagaga tttcaatcag taactcatcc gatttctgtt 420
cgtgtgttct ggatattcaa tttcatcgtc attgcactaa ttgcgttttc gagtatttct 480
cgtctggttt ccaacacttc atcatcaaaa tccgatgact tgatttcatc gatttcacta 540
ccgttttcag ctttcttgct aattgcatca gtaatcggat caactggaat cacaataaca 600
ccagaatcaa aacctgatga actggagaaa tcggtaaacg taagtggatg ggcatctgct 660
tcaattctat ccaaaacatt ctggttttgg atgaatccgt tgctaaaaaa gggctacaaa 720
accgtgttaa caatcgaaga tatcccgacg ctttcacccg aacaccgagc cgaacaattg 780
acactaatct tcgaacaaaa ctggcccaaa cctgaagaga actcgaacca tccggttcga 840
accaccctca ttcggtgttt ctggaaacaa actgcattca ctggcttctt agcgaccgcg 900
aagctttgtg tcgggtatgt cggaccgttg ttgatacaac ggttcgttga tttcacatca 960
ggaaagagga gttctccgta cgaaggatat tatttggtac tgattctcct cgtcgctaag 1020
tttatcgaag ctttaacgtc gcatcaattc aatttccact cgcagaagct cgggatgatg 1080
attagatcaa gtttgataac atgtttatac aaaaaggggt tgaaactctc gtgttcggct 1140
cgacaatcgc atggtgtagg tcaaatcgtg aactatatgg cggtcgatgc gcaacagttg 1200
tcggatatta tgtctcagtt gcacgcgatc tggctcatgc cggttcaagt gaccgtggcg 1260
atggtgattc tttatgctta tctcggtgca tcgacggcgg ttacattgat cgcggttttg 1320
gtgattctag tgttcgtcta tttgggtact aaactaaaca accggtacca gtttaacata 1380
atgtcgagtc gtgatttgcg gttgaaagcg atgaatgaga tgttgagtta catgagggtg 1440
attaagtttc aagcttggga agaacatttc aacgatcgga ttcagtcgtt tcgtgactcg 1500
gaatacggtt ggctttgtaa gttcatgtac tctatcggtt cgaacatgat catcttatgg 1560
tgcacacctt tgttaatctc cactgtcacg ttcgggagcg ggattttgct cggtgttaaa 1620
tttgacgcgg ggaccgtttt taccgcgact tcgttgttca agaacttgca agaaccgctt 1680
tggagttttc ctcaatcgat gatctcgctc tctcaagcga tgatctcgtt ggggcggttg 1740
gatgagtata tgatgagtaa tgagttggaa gagggttccg ttgaaagaca tgaaaacagc 1800
gacggtgaag gtaccgtcgc tgttgaggta caagacgggt cgttcagctg gcatgacgac 1860
ccgtcagaag gtgaaacgat aaaaaatata aactttgaag taaaaaaagg tgaactcgcg 1920
gtcattgttg ggacagttgg ttcaggaaag tcgtctttac ttgcatcggt tattggcgag 1980
atgcacaaaa cctctggtaa ggtgaaaatt ttcgggagca ccgcgtatgt tgcacaaacc 2040
tcatggatcc aaaacaagac gatacaagaa aacattttgt tcggtttgcc tatggataga 2100
cgtaagtaca agaatgtaat aagaacttgt tgtttggaga aagatttaga aatgatggaa 2160
ttcggagatc aaaccgagat cggggagcgt gggatcaatc ttagcggggg ccaaaagcag 2220
cggattcaac tcgcgcgagc agtttatcaa gattccgaca catatcttct cgatgatgtg 2280
tttagtgctg ttgatgctca tacgggttca ctaatattca aggaatgtgt taggggagtc 2340
cttagagaca agacgatctt acttgttacc catcaagtag acttcctcca tgacgtcgat 2400
cttatactcg tgatgcgcga tggaatgatc gttcaatcag gaaaatacga cgaactactt 2460
caatcaggac tcgatttcaa atcattagta tccgctcacg aatcctcaat gcaattagta 2520
caatcagaat caaccgaatc aaaagcccta acaaaatctc acagcaccaa ttccaacgaa 2580
cacaacgact acgagagtca aaaacctctc gaacgatcgc catcaagctc cattacagga 2640
acatcaaaat tgattgaaga tgaagaacga gaaacgggaa gagtgagcct acatgtctac 2700
aaagtgtacg taaccgaggc tttcggatgg ttcggtgcgg ttctggttgt gttgttatcg 2760
gttctatggc aagcggtgca aatggctagc gattactggt tatcttatga aacttcagca 2820
gatcgagctg cttcgtttga tccatcggtg tttatcggag tttatgcgat tattgcaggg 2880
attggttttg ttttgatctt tggaagaact gttttctcta tgtttctagg gcttgaaact 2940
gctcaaaggt tttttagtca gattcttcat agcatacttc atgctccaat gtcgtttttt 3000
gataccacac cttctggaag aattcttagt cgggcatcaa gtgatcaaac caacatcgac 3060
attcttcttc cgttcatgat gaatctaagt atcgctttgt acatgtcggt tattagcgtt 3120
atcatcataa cctgtcaata cgcttggcct acggtcttcc tactcgttcc actcggttgg 3180
ctcaatttct ggtatcgggg gtattacctt gcaacatctc gtgaaataac ccgacttgac 3240
tcgattacaa aagcacccgt tattcaccac ttctcagaga gcatctctgg ggttatgacg 3300
atccggtgtt ttagaaaaca agtcgagttt gttcaagaaa acgttgaccg cgttgacgga 3360
aatctacgga tggattttca taataatgca tcacaaggat ggttagggtt tcgtatggag 3420
tttcttggaa gtttgtttct ttgtgcctca actattttca tgatcatttt accgagcaac 3480
attattaaac ccgaggacgt tggattgtca ctctcatacg ggttatcact caatggtctg 3540
ttattttggg cgttatgcac gagttgtttc gttgaaaacc gaatggtttc ggttgagaga 3600
ataaaacaat ttactaatat accctcagaa gcagaatggg tgaagaaaga taaacctcca 3660
cctccaaatt ggcctactca tggcagattg gagctaaaaa atttgcaggt tagatatcgt 3720
ccaaacacgc ctcttgtgct aaaagggatc actttaaaca tcgaaggtgg tcaaaagatc 3780
ggtgttgttg gtagaacagg tggcgggaag tcaactttga tccaagtttt gtttcggctg 3840
gtggagccca ctggcggaag tattattatt gatggtattg atatatcgac actcgggtta 3900
catgatcttc ggtcccgatt tggtatcatt ccacaagaac cgatcctttt tgaaggaacc 3960
gttagaagta acattgaccc gattggtcaa cattctgatg atgagatttg gcggagtctc 4020
gaacgctgcc aactcagcga tgttgtcgct gcaaaacctg gaaaacttga ttccgcagtt 4080
gttgataatg gagataactg gagtgttgga caaagacaac tactttgttt aggaagggtg 4140
ttgttgaaac aaagcagatt attattcatg gatgaagcaa ctgcttctgt tgattcacaa 4200
acagattctg taattcagaa aatcattcga gaagattttg ctgactgtac aattgttagc 4260
attgctcata ggatacctac tgtcatggat tgtgatcgcg ttctagttat tgatgcagga 4320
tatgcaaaag aatttgatga accgtcacgt ttgattcaaa gaccctcact ttttggtgcg 4380
ttggttcagg aatacgcgaa tcgatcatcg ggcatatga 4419
<210> 151
<211> 4296
<212> DNA
<213> Stevia rebaudiana
<400> 151
atggatggaa ctgatatata taaagcaact agtagtatac ggttaggtag tttacgagca 60
agtggaagaa catcaagtat aagatctgta agtgcttctg tatggaggaa ttctggaaat 120
gatgtttttt caagatcttc gcgtgaagaa gatgatgaag aagctcttaa atgggcttca 180
cttgagaagt taccgacgtt tgatcggttg aaaaagggtt tgttgtttgg atcaacggga 240
ccgtcgaacg aaattgatgt tgataatctt ggatttgatc agagaaagca tttgcttgat 300
agacttgtga aggttgctga tgaagataat gaaaagtttt tgttgaaact caggaacaga 360
attgacagag ttgggatcga tttaccaaca attgaagtca gatttgaaca tttgactgtg 420
gaggcagata ttaacacagg aagcagagct ttgccaagtt tcatcaattt tcacattgat 480
gcttttgagg ggctcttgag tatgttgaat ctgcttccaa attcaaagag gcatataact 540
atccttgatg atgttagtgg tgttattaaa cctagcagaa tgacattact attgggtcct 600
ccaagttctg gtaagacctc actattgtta gccttagctg ggaagctagc aaaggagctt 660
aagtgttcgg ggaaggtgac atacaacggc catgaattga acgagtttgt accggaaaga 720
acatccgctt atattagcca aaacgatgtt catatcggag aattgacagt cagagaaacc 780
ctagctttct cagctcgatg tcaaggggtt ggatcacgtt acgaaatgtt ggccgagtta 840
gcacgaaggg agaaaaatgc aaacatcaaa cccgatcctg atatcgatgt ctacatgaag 900
gctgcagcat cagcaggaca agaagctagt gtcgtcacag attatactct caagttactc 960
ggtttggaca tctgtgctga taccatggtt ggtgatcaaa tgatacgtgg tatttccggt 1020
ggtcaaaaga aacgtgtgac caccggtgaa atgattgtgg gaccctcaaa ggttcttctc 1080
atggacgaaa tatcaactgg tctagatagt tccacaactt tccaaatcgt gaaatcactt 1140
aagcagtttc ttcatattct tgaaggaact gctgttattt ctctcctcca acccgcaccc 1200
gaaacgtatg atctgtttga tgacatcatc cttttaaccg acgggaggat cgtttatcag 1260
ggcccacgtg aaaatgttct tgagtttttt gaatctatgg gatttaaatg ccctgatagg 1320
aaaggtgttg ctgatttctt gcaagaagtt acatcaaaga aagatcaaca acaatattgg 1380
atgagaagag atatgcctta tagatttgtg acatcaaaag aatttgcgga tgcatatcaa 1440
tcatttcatg ttggaagaaa attagcaaat gatttatcgt taccttatga taaaaccaaa 1500
agtcatcctg ctgcacttac aaccgaaaaa tacggtttag ataacaaagg attgttaaaa 1560
gcttgtacgg atagagagat attgctcatg aaaagaaact cttttgttta tatcttcaaa 1620
ttgttccaat tgacggtgat agggttcatc gctttgacgg tgttccttag aactgagatg 1680
catgaaagag ttccagaaga tggtgcgatt tacgtagggg ctcttttctt cggtgttgtt 1740
atgctcatgt ttaacgggat gtctgaaatc tcaatgacga ttgcgaagct tccagtgttt 1800
tataaacaaa gggatttctt gttttttcca tcgtgggcgt acgcgttacc atcatggatc 1860
atcaaaattc ccatttcgtt tcttgaagct gctgtttgga ccgttttgac ttattatact 1920
ataggatttg atcctaatgt gacaagattc ttgaagcatt atcttctgct tttccttgtg 1980
aaccaaatgg cttctgcatt atttcggttc attggtgcaa tgggtagaaa catgattgtt 2040
gcaaacactt ttggctcatt cgcacttttg ttagttttcg ctttgggtgg atttattctt 2100
gttagagatg atgtaaagaa gtggtggttg tggggatact ggtcatctcc tctcatgtac 2160
gccatgaatg gaattactgt gaacgagttt cttggtcatc aatggagaac tccatgggac 2220
aacactacac ttggaagatc aacaatcaca tctgtagggt tctttgcaga aagttattgg 2280
tattggatat cagttgcagc attagttgga ttcattcttg ttttcaacgc gtgttttgct 2340
ttatctctcg cttttctcaa cccttacggg aaatcacaag gtagtgtatc gaacgaagat 2400
gaaagtgata ctgttgaatt gacacccgta acacgtgatg gcaatcaaag caacaaaaag 2460
ggaatgattc ttccatttga accgcattcg attaccttca atgatgtcaa gtactcagtt 2520
gatatgccac aggaaatgaa agaacaaggt gtgactgaag atagattact gttacttaag 2580
ggtgtgagtg gagcttttag acccggtatt cttacagctc tcatgggtgt aagtggggcc 2640
ggaaaaacaa cattgatgga tgtgttagcg ggtcgaaaaa cgggtggata cattgaaggt 2700
gatgttaggg tttccgggta tcctaaaaaa caagaaacat ttgctcgggt ttctggatac 2760
tgtgagcaaa acgatatcca ctctcctcat gttaccatat acgagtcttt gctttactca 2820
gcttggttga ggttagccac agatgttgac gaaaaaaccc gaaagagttt tgttgatgag 2880
gttatggacc tggtggagtt gaacccgtta aaggatgcat tagttgggtt gccaggtgtc 2940
aatgggctct caactgaaca aagaaagagg ttaaccatag ccgtggaact tgttgccaac 3000
ccgtctatta tctttatgga tgagcccacc tcggggctag atgcacgtgc agctgctatt 3060
gtgatgagaa ctgttagaaa cactgtggac acgggacgaa ctgtcgtgtg caccattcat 3120
caacctagca ttgatatctt tgaagctttt gatgagttgt tcttgatgaa acgtggagga 3180
caagagttgt atgttggacc cgtgggtcgg cattcttgcg agctaatcaa gtattttgag 3240
gctataaatg gtgtaagcaa gattaaagaa ggatataatc ccgcaacatg gatgttggaa 3300
gtcagcactt ctgctcaaga aatggcttta ggggtcgatt ttaccgaaat ctacagaaac 3360
tccgatcttt acaggagaaa caaagcctta atcgccgaat tgagcgtgcc ccgacccgga 3420
acaaaagacc tctatttccc gacccaatac tcccaaccgt tcatcgttca atgcatcgct 3480
tgcctgtgga aacaacggaa gtcatactgg cggaatccgc cgtacacggc ggtccgattc 3540
gtcttcacca ccttcatcgc cgtcatattc ggtaccatgt tttgggatct cggcagcaaa 3600
aaatcgacga ctcgtgatct gacgaacgca atgggatcca tgtatgcagc ggttctgttt 3660
cttggaatcc aaaactcgat gtcggtgcaa ccagtggttg atgttgaacg caccgtcttt 3720
tatagagaac gagccgccgg aatgtattcc gcactaccat acgcctttgc tcagattcta 3780
gtcgaaatac cgtatattct ttcacaaaca ggtgtataca ctgtcatagt gtacgcgatg 3840
atcgggttcg actggacggt agctaaattc ttctggtact tgttctacca attttgttgc 3900
ttactctaca tgacatatta cggtatgatg accgtcgctc ttacaccaaa cgccaacatc 3960
gccgccatca ttgccgcctc attttacgga atcttcaatc tattctccgg tttcatcgtt 4020
ccacgaccca ggattccggt ctggtggagg tggtactact gggctaaccc attagcgtgg 4080
accctttacg gtatggctgt atcacagttc ggtgaatttg atgatgtgct cacgaataca 4140
aatcctccag agaccatcag acgttacttg gaccgctatt acgggttcaa acattctttc 4200
cttcctgcgg ttgcaggggt acatgtcggg ttggttatgt ttttcgggtt tatatttgcg 4260
tattgcattc ggtctttcaa tttccagaaa agataa 4296
<210> 152
<211> 4842
<212> DNA
<213> Stevia rebaudiana
<400> 152
atgactttta agcccttagt ttcatattgt catcctgtgg aaaatggtgt ttgggcaaca 60
gcagttgaaa atgaatttgg gccttataca ccctgtgcaa cagattcttt ggttactgga 120
atttctcatt tggttctttt gggagcttgc atatacagga tatatgtcac aaaaaagaat 180
tttaaagtag aaaagtttaa attgaggtca aacatctaca actattggtt ggggttattg 240
gctttatact ctactgttga gcctttgtgt agattgataa tgggaatttc agcttttaat 300
gttgatggag agacttctct tgctccatat gagattatga ccttagttat taaggcactt 360
gcatggtgtt gtatgttggt catgatcgga ctcgaaacca gagtttatgt ttatgaagtt 420
cgttggtttg taaggtttgc agtcgtttat gcgttgcttg gtgatgcagt gttgctcaat 480
cttgtgcttt ctgtgagcaa atattacacg agatatgtgt tgtatctctt tgtcagtgag 540
atttccatac aggttctgtt tgggttatgc ttgcttgtct atcttcctac tttggatcct 600
tatccgggtt atactccaat acgggccgaa tctttggatg atgctgaata tgaagaactt 660
gcaggtggag aggaaatctg tcctgaaagg cgtacaaaca ttatttctag tattttcttc 720
tcttggatga atcccctcat ggttttggga tataaaagac ctcttacaga gaaggacata 780
tggaaactgg acacatggga tcagaccgaa acactacaca gcaaatttga aatatattgg 840
gcagaagaga tccgtaaacc taaaccatgg cttttaaggg ctttacatcg tagccttggt 900
ggaaggtttt ggtggggagg cttttggaag attggcaatg atctttctca gtttgttgga 960
ccgctgattt tgaaccagct attactgtct atgcaagaac gcggtcccgc taagatcggt 1020
tacatctatg cattctcaat tttcgtcgga gtggtacttg gtgtgctgtg tgaggctcaa 1080
tattttcaga atgtcatgcg tgttggttac cgccttcgtt caactctgat tgctgcagtc 1140
ttccggaaga ctttaaagct aactaacgag agtcgcagaa atattgcatc tgggaaaata 1200
actaacttga tgacaaccga ttctgaatca ctccagcaag taactcagtc acttcacact 1260
ttgtggtctg ctccttttcg tatcattatc tctttggttc ttctttacca acaattaggc 1320
gttgcttcaa tccttggtgc attattgcta gttttcatgt tccctataca gacttttgtt 1380
attagtagaa tgcaaaaaat gtccaaagaa ggattgcaga ggactgacaa gagaattggg 1440
ctcatgaatg aaatcttagc agccatggac actgtcaaat gctatgcttg ggagaatagt 1500
tttcaagaca aagtccagag tattcgatca gacgagttat catggtttcg gaaagtacaa 1560
atgctaggag cgttgaatac atttatatta aacagtattc cagtggtagt aattgtggtt 1620
tcatttgggt tgtttacttt acttggagga gaattgacac ctgctagagc cttcacgtca 1680
ctctctttgt ttgctgtact tcgttttcca cttttcatgc ttccaaatat gatcacacag 1740
gttgtaaatg caaatgtgtc tttgaaacgt ttggaagatt tacttttaga gagagacttc 1800
ttcttccaaa tccacctctt gaaccaggac ttccagctgt ctcaattaga aatggattct 1860
tttcatggga ttcaaagtca gataaaccaa cattgtcaaa tattaatttc agatatacaa 1920
acgggtagtt tggtggcgat tgttggaagt acaggagagg gaaaaacatc agttgtatct 1980
gctatgcttg gagaacttcc tccagttagt gatgcggaag ttgttattcg aggaacagtt 2040
gcttatgttc cacaagtctc atggattttc aatgcaacgg tacgcgacaa catattgttt 2100
ggatccccct ttgattctgc aaagtatgag aagacactag atgtaactgc actgcaccat 2160
gacctagaat tgcttccggg tggtgatctt actgagattg gtgaaagagg agtgaatatt 2220
agtggaggtc aaaaacaaag agtttccatg gctagagctg tatactctga ctcagatgta 2280
tatgtgtttg atgatccctt aagtgctctt gatgctcacg tgggcagaca ggtttttgaa 2340
aaatgtatca aagaagaatt aagaggaaaa acgcgagtac tagttacaaa tcagttgcat 2400
tttctttcac aagttgatag gatcctattg gttcatgaag gcatggtgaa agaggaggga 2460
tcttacgagg aactatcaca aaacggtgta ctttttcaga aattaatgga gaatgcagga 2520
aaaatggaag aatatgttga agaacaagaa gaatcaggag attcagattc gaagacatca 2580
acacctgtta ctaatggtga gttagttaaa gattctgcta aaaagaaaga aatcaaatct 2640
gttcttatca agcaagagga acgggaaacg ggtgttgtca gtttcaatgt tttgaagagg 2700
tataaagatg cattaggagg gtggtgggtt gttagtatac tgttcgggtg ttatgcagca 2760
acagaaactt taagaatact aagtagcaca tggttaagta tttggaccga tgaaagcact 2820
ccaaagatct acagcccgtt attctataat attatctatg cacttctatc acttggtcaa 2880
gttcttgtga cattgggaaa ctcttattgg ttaatcatgg cgagtcttta tgcagctaga 2940
aagttgcaca acgcgatgct taactccata ttaagggctc ctatggtctt ttttcacacc 3000
aacccacttg gacgtattat taatagattt gcaaaagatc ttggtgatat agatcgcaac 3060
gttgcgccat ttgtcaacat gtttttgggc caagtgtcac aacttttgtc aacctttgtt 3120
ctcattggat tattgagcac catgtctctt tgggccatct tgccactttt gttgcttttc 3180
tatgcagctt atttgtatta tcagagcact gcgcgcgagg taaagcgaat ggattccatc 3240
acaagatctc cggtgtacgc gcaatttggt gaagcattaa acggtctctc caccatccgt 3300
gcatacaaag cgtatgatcg tatggccaag attaacggga attcaatgga caacaacatc 3360
cggttcacat tagtcaacat gagcgcgaac cgttggctcg caatccgact agaaacggtt 3420
ggaggtctca tgatatggtt aaccgcaact ttcgcagtca tgcaaaacgg caaagcaaga 3480
aaccaagaag catttgcatc caccatgggt ctacttctaa gttatgcatt aaacatcaca 3540
agtttactga cagctgtcct tagactcgcg agtttagctg aaaatagttt aaacgcggtt 3600
gaacgcgttg gtacttatat tgaattgcct tctgaggctc cacctgtaat cgaagataac 3660
cgcccgccac ctggctggcc ttcatccgga tctataaagt ttgaagatgt tgttttgcgg 3720
tatcgacctg aactgccacc tgtcctccat ggtttgactt tttttattcc tccaagtgat 3780
aagattggaa ttgttggaag aactggtgct ggaaaatcta gcatgttaaa tgctttgttt 3840
aggattgttg aattggaaag aggaagaatt ataattgata attgtgatat ttcaaagttt 3900
gggttgaccg atcttcgcaa ggttcttggt attattcctc aagcacccgt tctcttctca 3960
gggactgtaa gattcaacct ggatcctttt aacgagcaca atgatccgga tctttgggaa 4020
tctttagaga gggcccactt aaaggatgtt atcaggagga atccattggg tttagatgct 4080
gaggtttcag aggctggaga gaatttcagt gttggacaaa gacagttatt aagtctttca 4140
cgtgcattac ttaggagatc aaagattctt gttcttgatg aagcaactgc tgctgttgat 4200
gttagaacag atgcacttat ccaaaagacc attcgtgaag aattcaagtc ttgtactatg 4260
attattattg ctcatcgtct taatactatt attgattgtg accgtattct tctcctcgat 4320
gccggtcagg ttgttgagta tgatgctccg gtaaaacttc tccaagacga acaaaccgca 4380
ttctcaaaaa tggttcaaag tacaggggct gcaaatgcac aatacttacg taacttagca 4440
tttggagcag aagaagagaa ggtggagaag gtgacggtta atggtgagaa gtggcggctt 4500
gcctccactc ggtgggcggc tgccgcccgg tttgcacttg cttctagcct cactccgtca 4560
caaaacgacc tcacgcagtt agaaaacgaa gatgataaca acatcttaaa gaaaacaaaa 4620
gatgcagttc tcacacttca aggtgttttg aaaggcgaac atgataaaga tattgaagag 4680
tcgcttgaac gggcccacgt cccgagggat agatggtggt cagctcttta caaagtagtc 4740
gaaggtcttt cggtgatgag caagttgggt cgtaacaagc tccagctatc agaatacggg 4800
gtaaatgacg aaccgattga ttgggaccat gttcagatgt aa 4842
<210> 153
<211> 4521
<212> DNA
<213> Stevia rebaudiana
<220>
<221> misc_feature
<222> (26)..(26)
<223> n is a, c, g, or t
<400> 153
atgttcttca acctctgttg tttgcngaaa acgacttcag gagcttcact tgtgcttcaa 60
tggctgacgt tcatcttcct ctctccatgc cctcaaagag cacttctatc tgccattgat 120
gtcatcttct tgttcaatat ccttttcgtt ttttgtctgc tcaaaagact ctattcaagg 180
ttcagttcga ccaacaatgg cgactttaac acatccgcca ttgatgaacc tctgatttct 240
aaatctagaa ctgttgtcaa taccaatctt tggttcaagt tatctctgct cgtgaccgcc 300
gttttaacag ttttgtcaat tgtttcttca attttggcat tcacacaaca tacccagatg 360
tcatggaagc tgataaatgg aatctcttgg ttgattcaag ctctatcttt ccttgtgatc 420
acagttttaa tcatccatga aaaaagattt caagctgcaa ctcatccatt aactcttcgt 480
gtattcttag tagtaaattt catcttcatt gctttgttag cttcttcggg tatcatccgg 540
ctagtttccg gtaccggaaa cacttcaatt ttgaaatccg gcgacataat ttcactcata 600
tctctaccgt tttcagcttt tttattgttt gtatccgtaa ccggatcaac cggaattata 660
gtgaccatag aatctgaacc acttaatggt aatgctaatg ctaatggtca cggtaaacta 720
tcagatgctt acgagttgaa caaatcttca aacgtgagcg catgggcgat cggcttcgat 780
cccatcaaag atatttggtt gtggatgaac ccattgttga agaaagggta taaaaaacga 840
cctctaaaac tcgaggacat cccgacactt tcacccgaac atcgggccga gaaaatgtca 900
aaactttttg aagaaaactg gccgaaacca ctcgagaatt ccaaacatcc ggttcgagtc 960
acgttaatcc gttgtttttg gaaacatatc gcgttcaccg cactcctcgc gatcataagg 1020
ctatgtgtta tgtatgtcgg gccattattg atccaacggt tcgttgactt cacttccgga 1080
agagatcatc accgtacgag gggtaactta cttgatactt tatccttttt gtcggctaaa 1140
ttcgttgaag ttttgtcatc ccaccagttc aatttcaact cccagaagct tggaatgttg 1200
atccgatcga cattgattac atcgctgtat aaaaaggggt tacggttatc gtgttcggct 1260
cgacaatcgc atggtgttgg acaaatagtt aactacatgg ctgttgatgc tcaacaactt 1320
ggtgatatga tgcttcaact tcatgctatt tggctcatgc cggttcaagt gacggttgcg 1380
ttaggtattc tttacgggta tctcggtgtg cccgcgttgg tagctttggt cgggatcatg 1440
gcggttttgt tgtatgtgat atttggtgct aaaagaaaca acaggtttca gtttagtata 1500
atgcaaaacc gcgatttaag gatgaaagca gttaatgaga tgcttaatta catgagggtg 1560
attaagttcc aagcatggga agaacacttc aacaagagga tacaagcgtt tcgcgagtct 1620
gaatacgggt ggcttacgaa attcatgttt tcaataggtg gaaacttgat tgtgttatgg 1680
agcgcgcctt tgttcgtctc gtcactcact tttggaagcg cgattctgct cgggatcccg 1740
ctggatgcag ccacggtgtt cactgccaca tcgttgttca agaacttgca agagccgatt 1800
cgcacgttcc cgcagtcaat gatctctctt tctcaggcca tgatatcact gggaagattg 1860
gacgctttca tgttgagtaa agagttggat gagcgggcgg ttgagaggcg tgagggttgc 1920
ggtgatggga ccgcggttga ggtcagcaac gggtctttta gctgggatga tgaagctgct 1980
gatggtgctg tagttaagaa tttgagtttt gagatcaaga aaggtgaact tgcagctatt 2040
gttgggaccg tggggtccgg taaatcgtcg cttctttcgt ccgttatagg cgagatgcac 2100
aaaatctccg gaaaggtgag ggtatgtggg agtactgcat atgttgcaca aacagcatgg 2160
attcaaaacg ggacgattca agagaacatt ttgtttggtt tgccaatgga tcgacagaaa 2220
tacaaggaag ttatcaaaac ctgttgtttg gagaaagatt tagaaatgat ggaatatgga 2280
gaccaaactg agatcggaga gcgcggaatt aatctcagtg gtggtcagaa gcaaaggatt 2340
caacttgcac gcgctgttta tcaagattgt gacatttatc ttcttgatga tgtttttagc 2400
gcggttgatg ctcacaccgg ttcagaaata ttcaaggaat gtgtaagggg ggctctacgg 2460
aacaaaacaa tcttactcgt cacacaccaa gttgatttcc tccataatgt cgatcaaatc 2520
ctagttatgc gcgatggaat gattgttcaa tcaggaaagt acgacgaact actagaatcc 2580
ggtatggatt tcaaagcttt agtttccgcg cacgaaacct ctatgcaact agttgaaatg 2640
gaacccacca catcagatca cacctctcct agacctcttc aaaaatcccc aagcttaaac 2700
cctagagaag aggcattaga acgatcaaaa tcaagttcta taatcggtac atcaaaacta 2760
attgaagaag aagagaggga aacaggaaga atcagtttag gtgtttataa ggtttatgtg 2820
accgaagctt tcggatggtg gggtgtgatt gttgttttaa tgttttcaat cttgtggcaa 2880
gggtcacaga tggcgagtga ttactggttg gcatatgaaa cttctgatga acacattttc 2940
aacccttcgt tgtttataca agtgtataca gctatagcgg gtctttcgtt gcttttggta 3000
tttggtagga ttatttcttc gacgttcctt gggcttaaaa cttcccagat attttttaac 3060
cagattcttc acagcatcct tcatgctcca atgtcgtttt ttgacactac accttctgga 3120
agaattctta gcagggcatc aagtgatcaa acaaacctcg atgtcttcct tccattcatg 3180
atgaacttga cggttgcgat gtacataaca gtgatcggta ttgtaatcat cacttgtcag 3240
tatgcttggc caactgtctt cctattaatt cctcttggtt ggctcaattt ttggtttcgg 3300
ggatactatc tggcaacatc ccgtgaaata actagactcg actcgattac aaaagcaccc 3360
gttattcacc atttttcgga gagcatctcg ggggttatga caattcggtg ttttaagaag 3420
caagacaggt ttgttgaaga aaatgttaac cgcgtgaacg caaacctgag aatggatttt 3480
cataataacg ggtctaacgg gtggttaggt ttccggttgg agtttcttgg aagtttattt 3540
ctatgtattt ccactgtgtt catgatcatt ttacctagca gcattgttaa accagaaaac 3600
gttggattat cactctcgta tggattgtca ctcaacggag tgctgttttg ggctttatat 3660
atgagctgtt ttgttgaaaa ccgaatggtt tcggttgaaa ggattaaaca attcattaga 3720
ataccgtcgg aagccgaatg ggtgaaaaaa gataatcttc caccatcaaa ctggcctgat 3780
catggaaatg tagagcttaa agatttgcag gttagatatc gtccaaatac gcctttagtg 3840
atcaaaggga ttactctaag tatcaatgga ggtgaaaaga tcggtgtggt tggtagaacc 3900
ggtggcggga aatcaacttt gatccaggtt ctgtttaggt tggtggagcc atctggcgga 3960
agtataacca ttgatgggat caacatctcg acccttggat tacatgatct aaggtcaaga 4020
tttgggatca ttcctcaaga accaattctt tttgaaggaa ctgttagaag caatattgac 4080
cccattggtc aacattctga tgaagagatc tggaggagtc ttgaacgatg ccaacttaat 4140
gatgttgtag ctgcaaaacc tggaaaactt gattctgcag ttgttgataa tggtgataat 4200
tggagtgttg gtcaaagaca acttctatgt ttgggaagag tgatgttgaa acacagtaaa 4260
ctgttgttca tggatgaagc aacagcttca gttgattcac aaacagatgc ggtgattcag 4320
aaaatcatac gcgaggagtt tgctgactgt accatcatta gcattgctca cagaatacct 4380
actgtcatgg actgtgatcg cgttctcgtc atcgatgctg gttacgcgaa agaatttgat 4440
aaaccgtcac ggttgattga gagaccttca ttatttgggg ctttggttca agagtatgca 4500
aaccggtctt ctggtctatg a 4521
<210> 154
<211> 4560
<212> DNA
<213> Stevia rebaudiana
<400> 154
atgacatctg attcattttg gatcacttct gtttcatgtt cttcaacctc tgttattgca 60
gaaaacgcat caggagcttc actcatactt caatggctga aattcatctt tctctctcca 120
tgccctcaaa gggtactttt atccgccatt gacgtcatct tcttattcat cctcttcgtt 180
ttcgctgttc aaaagctcta ttcaaaattc acctccagca aatccgccat taacgaacct 240
ctgattacta aaaacagatc tatcgtcaac accaatctct ggttcaaatc atctctggta 300
gtgacaaccg ttttaacggt tttgtcgatt gcttcttcag ttttggcatt cacacagaat 360
actcaggtac catggaaact gattaatgga ttctgttggt taattcaagc tttatctttc 420
cttgtaatca cggttttgat tatccatgaa aaaagatttc aagctgcaac tcatccatta 480
actcttcgtg tattcttgat agtgaatttc atcttcatcg ctctattggc ttcttcgggt 540
atcatccggt taacttccga tacccgaaac acttcatttt tcaaatccgg tgacataatt 600
tcgttactat ctctaccgtt ttcggttttc ttattggttg tatcgataac cggatcaacc 660
ggaatcttag tgattctaga ttctgaatca ccgaacatca gcagtagcag taatagtaat 720
agtaatggta atggtcatag taaagtatca gatgctgatg agttgaacat caactcatca 780
gaactgagcg gatgggcatc cgcttcgatc atttcaaaag tcttttggtt atggatcaac 840
ccgttgttga aaaaagggta cgaaacccct ttaaagctag aggacgtccc gacgctttca 900
cccgaccatc gcgcagaaaa aatgtcgaaa cgtttcaaag aaaactggcc taagcctcaa 960
gaaaactgta aacatcctgt tcgtgtcacg ttgattcgtt gtttctggaa agacgtcgcc 1020
ttcacagcgt ttctagcgat gatacgcttg tgtgtaatgt acgtcgggcc attgttgatc 1080
caacggtttg ttgattacac ttccgggaaa cgaacgtcac catacgaggg gtattatttg 1140
atatcagtcc ttttggtggc taaatttgtt gaagttttat catcccatca gttcaatttc 1200
cattcccaaa agcttggaat gttgatccga tcaacgttga ttacatcatt gtataaaaaa 1260
gggttacggt tatcgtgttc gggtcgacaa tcgcatggtg ttggacaaat agttaactac 1320
atgtctgttg atactcaaca acttggtgat atgatgtttc aattgcatgc tatttggtta 1380
atgccgcttc aagtgacgat tgcgttagtc attctctaca tgtaccttgg accgtcgagt 1440
ttagtagcat taatcgggat cttgttgatc atgttgtata ctattttggg tactaaaagg 1500
aacaataagt ttcaatatag tataatgcaa agtcgtgatt cgaggatgaa agcaactaat 1560
gagatgctta attacatgag ggtgattaag tttcaagcat gggaagaaca cttcaacaag 1620
aggatacaat cgtttcgcga gtctgaatac gggtggctta cgaaattcat gctctcaatc 1680
ggtggaaaca tgattgtgtt atggagcgcg ccattgttta cctctgtact cacctttgga 1740
agcgcgatat tgtttggagt cccgcttgat gcgggcaccg tgtttactgc tacctcgttg 1800
tttaagaact tgcaagagcc aattcgcacg ttccctcaat cgatgattca aatttctcag 1860
gctatgatct cattgggaag attggacgcg ttcatgttga ctaaagagtt ggatgacgag 1920
gcggttgaga ggcgcgaggg ttgcggtggt gggaccgcgg ttgaggtcag caacgggtct 1980
tttagctggg atgatgaagc tgctgatggt gctgtagtta agaatttgaa ttttgagatc 2040
aagaaaggtg aacttgcagc aattgttggg accgtggggt ccggtaaatc gtcgcttctt 2100
tcgtccgtta taggcgagat gcacaaaatc tccggaaagg tgagggtatg tggaagcact 2160
gcatatgttg cacaaacagc atggattcaa aatgggacga ttcaagaaaa cattttgttt 2220
ggtttaccaa tggatagaca gaaatacaaa gaagttatca agagctgctg tttggaaaaa 2280
gatatagaaa tgatggaatt cggagaccaa acagagatcg gagaacgtgg gattaatctc 2340
agtggtggtc agaagcaaag gattcaactt gcacgcgctg tttatcaaga ttgtgacatt 2400
tatcttcttg atgatgtttt tagcgcggtt gatgctcaca ctggttcaga tatattcaag 2460
gagtgtgtca gggggatcct tcgagacaag acaatcttac tcgtcacaca ccaagttgat 2520
ttccttcata atgtcgattt gatcttagtg atgcgagacg gggagattgt ccaatcagga 2580
aagtatgatg aactactaga atcgggttta gattttcaat cgttagtttc cgcccacgag 2640
aactctatgc aactagttga aatggaacca accacatcgg ataaaaactc ccgtaaagct 2700
cttaataaat ctcctagcat acatcctcaa gaagaagata agaaggttct agaaaaatcc 2760
ggatctagtt ctaacattgg aacatcaaag ttaatcaaag aagaggagag ggaaacagga 2820
agaatcggtt taggtgttta taaggtttat gtaaccgaag cgttcggatg gtggggtgtg 2880
cttattgtgt tgttgttttc agtcttgtgg caagcgacac agatggcaag tgattactgg 2940
ttgtcgtatg aaactgctga tgaacgcgcc gcctctttta atccttcgct atttatagaa 3000
gtttatgcag ctattgccgg tgtttctttc cttatggtgt ttagtagagt catttcttca 3060
acggtccttg ggcttcaaac ttgtcagatt ttctttaagc agattcttca tagcatgctt 3120
catgctccaa tgtcattttt cgacactaca ccttccggac gtgttcttag tagggcatca 3180
agtgatcaag caaacattga tcttctgctt ccatttatga cgagtatgac tcttacgatg 3240
tacatatcag tgattgccac tatcatcatc atttgtcagt acgcttggcc aacggtgttt 3300
ctactaattc ctcttggttg gctcaacttt tggtaccgcg gatactatct tgcagcatct 3360
cgtgaaatca cacggctcga ttcaattaca aaagcacccg ttattcacca tttctcggaa 3420
agcatcgcag gggtgatgac aattcggtgt tttaagaagc aagaaggctt tattcatgaa 3480
aaccttgatc gtgtgaacgg aaacttgaga atggatttcc acaactgggg agcgactgag 3540
tggttaggtt tccgtttgga gtttctcgga agcttattta tgtgtgtttc aactgtgttc 3600
atgatcatct tacctagtac cattgtcaaa ccagagaatg ttggattatc actctcatat 3660
gggttaacac tcaacgggat attgtttttt gctgtatata tgagttgtat ggtagaaaac 3720
agaatggttt ctgttgaaag gattaaacag ttctccaaaa taccatcaga agccgaatgg 3780
gttaaaaaag ataatcctcc accatcaaac tggcctaatc atggaaatgt agagctcaaa 3840
gatttgcagg ttagatatcg tccaaatacg cctttggtga tcaaagggat tactctaagt 3900
attaaaggag gtgaaaagat cggtgtggtt ggtagaaccg gtggcggtaa atcaactctg 3960
attcaagtta tgtttaggtt ggtggagcca tctggcggaa gtataaccgt tgatggtatc 4020
gatatcacaa ctctcggact acatgatctc agatcaagat tcgggatcat tcctcaagaa 4080
ccaatcctat ttgaaggcac cgtgagaagt aatattgacc ccattggtca acattctgat 4140
gaagaaatct ggaggagtct tgaacgatgc cagctttatg atgttgtatc tgcgaaacct 4200
ggtaaactag attctgcagt tgttgataat ggtgataact ggagtgtggg acaaagacaa 4260
cttctatgtt tgggaagagt gatgttgaaa cacagcaaac tgttgttcat ggatgaagca 4320
acagcttcag ttgattcaca aacagatgcg gtgattcaaa aaatcatacg cgaggatttt 4380
gctgactgta ccatcatcag cattgctcac agaataccaa ctgtcatgga ctgtgatcgc 4440
gttcttgtca tcgatgctgg ttacgcgaaa gaatttgata aaccttcacg gttgatagag 4500
agaccttcgt tgtttggtgc attggttcag gagtacgcaa acaggtcatc gggattatga 4560
<210> 155
<211> 567
<212> PRT
<213> Saccharomyces cerevisiae
<400> 155
Met Ser Gly Val Asn Asn Thr Ser Ala Asn Glu Leu Ser Thr Thr Met
1 5 10 15
Ser Asn Ser Asn Ser Ala Val Gly Ala Pro Ser Val Lys Thr Glu His
20 25 30
Gly Asp Ser Lys Asn Ser Leu Asn Leu Asp Ala Asn Glu Pro Pro Ile
35 40 45
Asp Leu Pro Gln Lys Pro Leu Ser Ala Tyr Thr Thr Val Ala Ile Leu
50 55 60
Cys Leu Met Ile Ala Phe Gly Gly Phe Ile Phe Gly Trp Asp Thr Gly
65 70 75 80
Thr Ile Ser Gly Phe Val Asn Leu Ser Asp Phe Ile Arg Arg Phe Gly
85 90 95
Gln Lys Asn Asp Lys Gly Thr Tyr Tyr Leu Ser Lys Val Arg Met Gly
100 105 110
Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Ile Gly Gly Ile Val
115 120 125
Leu Ser Lys Val Gly Asp Ile Tyr Gly Arg Arg Ile Gly Leu Ile Thr
130 135 140
Val Thr Ala Ile Tyr Val Val Gly Ile Leu Ile Gln Ile Thr Ser Ile
145 150 155 160
Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly
165 170 175
Val Gly Gly Ile Ala Val Leu Ser Pro Met Leu Ile Ser Glu Val Ala
180 185 190
Pro Lys His Ile Arg Gly Thr Leu Val Gln Leu Tyr Gln Leu Met Gly
195 200 205
Thr Met Gly Ile Phe Leu Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Asn
210 215 220
Tyr His Asn Ala Thr Gln Trp Arg Val Gly Leu Gly Leu Cys Phe Ala
225 230 235 240
Trp Ala Thr Phe Met Val Ser Gly Met Met Phe Val Pro Glu Ser Pro
245 250 255
Arg Tyr Leu Ile Glu Val Gly Lys Asp Glu Glu Ala Lys Arg Ser Leu
260 265 270
Ser Lys Ser Asn Lys Val Ser Val Asp Asp Pro Ala Leu Leu Val Glu
275 280 285
Tyr Asp Thr Ile Lys Ala Gly Ile Glu Leu Glu Lys Leu Ala Gly Asn
290 295 300
Ala Ser Trp Ser Glu Leu Leu Ser Thr Lys Thr Lys Val Phe Gln Arg
305 310 315 320
Val Leu Met Gly Val Met Ile Gln Ser Leu Gln Gln Leu Thr Gly Asp
325 330 335
Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Lys Ser Val Gly Leu
340 345 350
Lys Asp Ser Phe Gln Thr Ser Ile Ile Ile Gly Val Val Asn Phe Phe
355 360 365
Ser Ser Phe Ile Ala Val Tyr Thr Ile Glu Arg Phe Gly Arg Arg Thr
370 375 380
Cys Leu Leu Trp Gly Ala Ala Ser Met Leu Cys Cys Phe Ala Val Phe
385 390 395 400
Ala Ser Val Gly Val Thr Lys Leu Trp Pro Gln Gly Ser Ser His Gln
405 410 415
Asp Ile Thr Ser Gln Gly Ala Gly Asn Cys Met Ile Val Phe Thr Met
420 425 430
Phe Phe Ile Phe Ser Phe Ala Thr Thr Trp Ala Gly Gly Cys Tyr Val
435 440 445
Ile Val Ser Glu Thr Phe Pro Leu Arg Val Lys Ser Arg Gly Met Ala
450 455 460
Ile Ala Thr Ala Ala Asn Trp Met Trp Gly Phe Leu Ile Ser Phe Phe
465 470 475 480
Thr Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr Val Phe
485 490 495
Leu Gly Cys Leu Val Phe Ala Tyr Phe Tyr Val Phe Phe Phe Val Pro
500 505 510
Glu Thr Lys Gly Leu Thr Leu Glu Glu Val Asn Thr Met Trp Leu Glu
515 520 525
Gly Val Pro Ala Trp Lys Ser Ala Ser Trp Val Pro Pro Glu Arg Arg
530 535 540
Thr Ala Asp Tyr Asp Ala Asp Ala Ile Asp His Asp Asn Arg Pro Ile
545 550 555 560
Tyr Lys Arg Phe Phe Ser Ser
565
<210> 156
<211> 1527
<212> DNA
<213> Escherichia coli
<400> 156
gagatgacgt tggaggggca aggtcgcgct gattgctggg gcaacacgtg gagcggatcg 60
gggattgtct ttcttcagct cgctgatgat atgctgacgc caatgccgtt tggcctccga 120
ctaacgaaaa tcccgcattt ggacggctga tccgattggc acggcggacg gcgaatggcg 180
gagcagacgc tcgtccgggg gcaatgagat atgaaaaagc ctgaactcac cgcgacgtct 240
gtcgagaagt ttctgatcga aaagttcgac agcgtctccg acctgatgca gctctcggag 300
ggcgaagaat ctcgtgcttt cagcttcgat gtaggagggc gtggatatgt cctgcgggta 360
aatagctgcg ccgatggttt ctacaaagat cgttatgttt atcggcactt tgcatcggcc 420
gcgctcccga ttccggaagt gcttgacatt ggggaattca gcgagagcct gacctattgc 480
atctcccgcc gtgcacaggg tgtcacgttg caagacctgc ctgaaaccga actgcccgct 540
gttctgcagc cggtcgcgga ggccatggat gcgatcgctg cggccgatct tagccagacg 600
agcgggttcg gcccattcgg accgcaagga atcggtcaat acactacatg gcgtgatttc 660
atatgcgcga ttgctgatcc ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc 720
agtgcgtccg tcgcgcaggc tctcgatgag ctgatgcttt gggccgagga ctgccccgaa 780
gtccggcacc tcgtgcacgc ggatttcggc tccaacaatg tcctgacgga caatggccgc 840
ataacagcgg tcattgactg gagcgaggcg atgttcgggg attcccaata cgaggtcgcc 900
aacatcttct tctggaggcc gtggttggct tgtatggagc agcagacgcg ctacttcgag 960
cggaggcatc cggagcttgc aggatcgccg cggctccggg cgtatatgct ccgcattggt 1020
cttgaccaac tctatcagag cttggttgac ggcaatttcg atgatgcagc ttgggcgcag 1080
ggtcgatgcg acgcaatcgt ccgatccgga gccgggactg tcgggcgtac acaaatcgcc 1140
cgcagaagcg cggccgtctg gaccgatggc tgtgtagaag tactcgccga tagtggaaac 1200
cgacgcccca gcactcgtcc gagggcaaag gaatagagta gatgccgacc gaacaagagc 1260
tgatttcgag aacgcctcag ccagcaactc gcgcgagcct agcaaggcaa atgcgagaga 1320
acggccttac gcttggtggc acagttctcg tccacagttc gctaagctcg ctcggctggg 1380
tcgcgggagg gccggtcgca gtgattcagg cccttctgga ttgtgttggt ccccagggca 1440
cgattgtcat gcccacgcac tcgggtgatc tgactgatcc cgcagattgg agatcgccgc 1500
ccgtgcctgc cgattgggtg cagatct 1527
<210> 157
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon-optimized UGT91D2e nucleotide sequence
<400> 157
atggctacat ctgattctat tgttgatgac aggaagcagt tgcatgtggc tactttccct 60
tggcttgctt tcggtcatat actgccttac ctacaactat caaaactgat agctgaaaaa 120
ggacataaag tgtcattcct ttcaacaact agaaacattc aaagattatc ttcccacata 180
tcaccattga ttaacgtcgt tcaattgaca cttccaagag tacaggaatt accagaagat 240
gctgaagcta caacagatgt gcatcctgaa gatatccctt acttgaaaaa ggcatccgat 300
ggattacagc ctgaggtcac tagattcctt gagcaacaca gtccagattg gatcatatac 360
gactacactc actattggtt gccttcaatt gcagcatcac taggcatttc tagggcacat 420
ttcagtgtaa ccacaccttg ggccattgct tacatgggtc catccgctga tgctatgatt 480
aacggcagtg atggtagaac taccgttgaa gatttgacaa ccccaccaaa gtggtttcca 540
tttccaacta aagtctgttg gagaaaacac gacttagcaa gactggttcc atacaaggca 600
ccaggaatct cagacggcta tagaatgggt ttagtcctta aagggtctga ctgcctattg 660
tctaagtgtt accatgagtt tgggacacaa tggctaccac ttttggaaac attacaccaa 720
gttcctgtcg taccagttgg tctattacct ccagaaatcc ctggtgatga gaaggacgag 780
acttgggttt caatcaaaaa gtggttagac gggaagcaaa aaggctcagt ggtatatgtg 840
gcactgggtt ccgaagtttt agtatctcaa acagaagttg tggaacttgc cttaggtttg 900
gaactatctg gattgccatt tgtctgggcc tacagaaaac caaaaggccc tgcaaagtcc 960
gattcagttg aattgccaga cggctttgtc gagagaacta gagatagagg gttggtatgg 1020
acttcatggg ctccacaatt gagaatcctg agtcacgaat ctgtgtgcgg tttcctaaca 1080
cattgtggtt ctggttctat agttgaagga ctgatgtttg gtcatccact tatcatgttg 1140
ccaatctttg gtgaccagcc tttgaatgca cgtctgttag aagataaaca agttggaatt 1200
gaaatcccac gtaatgagga agatggatgt ttaaccaagg agtctgtggc cagatcatta 1260
cgttccgttg tcgttgaaaa ggaaggcgaa atctacaagg ccaatgcccg tgaactttca 1320
aagatctaca atgacacaaa agtagagaag gaatatgttt ctcaatttgt agattaccta 1380
gagaaaaacg ctagagccgt agctattgat catgaatcct aa 1422
<210> 158
<211> 2079
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon-optimized A. thaliana ATR1 nucleotide sequence
<400> 158
atgacttctg cactttatgc ctccgatctt ttcaaacaat tgaaaagtat catgggaacg 60
gattctttgt ccgatgatgt tgtattagtt attgctacaa cttctctggc actggttgct 120
ggtttcgttg tcttattgtg gaaaaagacc acggcagatc gttccggcga gctaaagcca 180
ctaatgatcc ctaagtctct gatggcgaaa gatgaggatg atgacttaga tctaggttct 240
ggaaaaacga gagtctctat cttcttcggc acacaaaccg gaacagccga aggattcgct 300
aaagcacttt cagaagagat caaagcaaga tacgaaaagg cggctgtaaa agtaatcgat 360
ttggatgatt acgctgccga tgatgaccaa tatgaggaaa agttgaaaaa ggaaacattg 420
gctttctttt gtgtagccac gtatggtgat ggtgaaccaa ccgataacgc cgcaagattc 480
tacaagtggt ttactgaaga gaacgaaaga gatatcaagt tgcagcaact tgcttacggc 540
gtttttgcct taggtaacag acaatacgag cactttaaca agataggtat tgtcttagat 600
gaagagttat gcaaaaaggg tgcgaagaga ttgattgaag tcggtttagg agatgatgat 660
caatctatcg aggatgactt taatgcatgg aaggaatctt tgtggtctga attagataag 720
ttacttaagg acgaagatga taaatccgtt gccactccat acacagccgt cattccagaa 780
tatagagtag ttactcatga tccaagattc acaacacaga aatcaatgga aagtaatgtg 840
gctaatggta atactaccat cgatattcat catccatgta gagtagacgt tgcagttcaa 900
aaggaattgc acactcatga atcagacaga tcttgcatac atcttgaatt tgatatatca 960
cgtactggta tcacttacga aacaggtgat cacgtgggtg tctacgctga aaaccatgtt 1020
gaaattgtag aggaagctgg aaagttgttg ggccatagtt tagatcttgt tttctcaatt 1080
catgccgata aagaggatgg ctcaccacta gaaagtgcag tgcctccacc atttccagga 1140
ccatgcaccc taggtaccgg tttagctcgt tacgcggatc tgttaaatcc tccacgtaaa 1200
tcagctctag tggccttggc tgcgtacgcc acagaacctt ctgaggcaga aaaactgaaa 1260
catctaactt caccagatgg taaggatgaa tactcacaat ggatagtagc tagtcaacgt 1320
tctttactag aagttatggc tgctttccca tccgctaaac ctcctttggg tgttttcttc 1380
gccgcaatag cgcctagact gcaaccaaga tactattcaa tttcatcctc acctagactg 1440
gcaccatcaa gagttcatgt cacatccgct ttagtgtacg gtccaactcc tactggtaga 1500
atccataagg gcgtttgttc aacatggatg aaaaacgcgg ttccagcaga gaagtctcac 1560
gaatgttctg gtgctccaat ctttatcaga gcctccaact tcaaactgcc ttccaatcct 1620
tctactccta ttgtcatggt cggtcctggt acaggtcttg ctccattcag aggtttctta 1680
caagagagaa tggccttaaa ggaggatggt gaagagttgg gatcttcttt gttgtttttc 1740
ggctgtagaa acagacaaat ggatttcatc tacgaagatg aactgaataa ctttgtagat 1800
caaggagtta tttcagagtt gataatggct ttttctagag aaggtgctca gaaggagtac 1860
gtccaacaca aaatgatgga aaaggccgca caagtttggg acttaatcaa agaggaaggc 1920
tatctatatg tctgtggtga tgcaaagggt atggcaagag atgttcacag aacacttcat 1980
actatagtcc aggaacagga aggcgttagt tcttctgaag cggaagcaat tgtgaaaaag 2040
ttacaaacag agggaagata cttgagagat gtgtggtaa 2079
Claims (36)
- 트랜스포터 유전자, 적어도 하나의 트랜스포터 유전자의 발현을 조절하는 전사 인자 유전자, 또는 이 둘 모두인 적어도 하나의 유전자의 변형된 발현을 포함하는 적어도 하나의 스테비올 글리코시드를 합성할 수 있는 재조합 미생물.
- 제 1항에 있어서, 트랜스포터 유전자가 내인성 트랜스포터 유전자 또는 이종성 트랜스포터 유전자인 재조합 미생물.
- 제 1항 또는 제 2항에 있어서, 트랜스포터 유전자가 ABC 트랜스포터 또는 MFS 트랜스포터를 인코딩하는 재조합 미생물.
- 제 1항 내지 제 3항 중의 어느 한 항에 있어서, 내인성 트랜스포터 유전자 또는 전사 인자 유전자가 PDR1, PDR3, PDR5, PDR8, PDR10, PDR11, PDR12, PDR15, PDR18, YOR1, AUS1, SNQ2, PDR12, STE6, THI73, NFT1, ADP1, FLR1, QDR1, QDR2, QDR3, DTR1, TPO1, TPO2, TPO4, TPO3, AQR1, AZR1, ENB1, SGE1, YHK8, GEX2, HOL1, ATR1, HXT11, ENB1, ARN1, ARN2, SSU1, THI7, TPN1, SEO1, SIT1 또는 DTR1인 재조합 미생물.
- 제 1항 내지 제 4항 중의 어느 한 항에 있어서, 변형된 발현이 트랜스포터 유전자 또는 전사 인자 유전자를 과다발현하거나 발현 감소시키는 것을 포함하는 재조합 미생물.
- 제 1항 내지 제 5항 중의 어느 한 항에 있어서, 복수의 내인성 트랜스포터 유전자 또는 전사 인자 유전자를 과다발현하거나 발현 감소시키는 것을 포함하는 재조합 미생물.
- 제 1항 내지 제 6항 중의 어느 한 항에 있어서, YOR1, SNQ2, PDR1 또는 FLR1을 과다발현하는 것을 포함하는 재조합 미생물.
- 제 6항에 있어서, 2, 3, 4, 5, 6, 7 또는 8개의 내인성 트랜스포터 유전자 또는 전사 인자 유전자를 과다발현하거나 발현 감소시키는 것을 포함하는 재조합 미생물.
- 제 6항에 있어서, 각 유전자 로커스를 파괴함으로써 PDR5, PDR10, PDR15 및 SNQ2 유전자의 발현을 감소시키는 것을 포함하는 재조합 미생물.
- 제 6항에 있어서, 각 유전자 로커스를 파괴함으로써 PDR1, PDR3, PDR5, PDR10, PDR15, SNQ2 및 TPO1 유전자의 발현을 감소시키는 것을 포함하는 재조합 미생물.
- 제 2항에 있어서, 이종성 트랜스포터가 스테비아 트랜스포터 유전자인 재조합 미생물.
- 제 1항 내지 제 11항 중의 어느 한 항에 있어서, 재조합 미생물이 사카로미케스강인 재조합 미생물.
- 제 1항 내지 제 12항 중의 어느 한 항에 있어서, 재조합 미생물이 아가리쿠스 (Agaricus), 아스퍼길루스 (Aspergillus), 바실루스 (Bacillus), 캔디다 (Candida), 코리네박테리움 (Corynebacterium), 에스체리치아 (Escherichia), 푸사리움/깁베렐라 (Fusarium / Gibberella), 클루이베로마이세스 (Kluyveromyces), 래티포루스 (Laetiporus), 렌티누스 (Lentinus), 파피아 (Phaffia), 파네로새테 (Phanerochaete), 피치아 (Pichia), 피스코미트렐라 (Physcomitrella), 로도투룰라 (Rhodoturula), 사카로마이세스 (Saccharomyces), 쉬조사카로마이세스 (Schizosaccharomyces), 스파셀로마 (Sphaceloma), 잔토필로마이세스 (Xanthophyllomyces) 및 야로위아 (Yarrowia) 속으로부터 선택되는 재조합 미생물.
- 제 1항 내지 제 13항 중의 어느 한 항에 있어서, 재조합 미생물이 사카로마이세스 세레비시애 (Saccharomyces cerevisiae), 쉬조사카로마이세스 폼베 (Schizosaccharomyces pombe), 야로위아 리폴리티카 (Yarrowia lipolytica), 캔디다 글라브라타 (Candida glabrata), 아쉬비아 고스시피 (Ashbya gossypii), 사이버린드네라 자디니 (Cyberlindnera jadinii), 피치아 파스토리스 (Pichia pastoris), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 한세눌라 폴리모르파 (Hansenula polymorpha), 캔디다 보이디니 (Candida boidinii), 아르술라 아데니니보란스 (Arxula adeninivorans), 잔토필로마이세스 덴드로로우스 (Xanthophyllomyces dendrorhous) 또는 캔디다 알비칸스 (Candida albicans) 종으로부터 선택되는 재조합 미생물.
- 제 1항 내지 제 14항 중의 어느 한 항에 있어서, 미생물이 사카로마이세스 속으로부터 비롯되는 재조합 미생물.
- 제 1항 내지 제 15항 중의 어느 한 항에 있어서, 미생물이 사카로마이세스 세레비시애인 재조합 미생물.
- 제 1항 내지 제 16항 중의 어느 한 항에 있어서, 미생물이 외인성 핵산에 의해 인코딩되는 하기 유전자 중 하나 이상을 포함하는 재조합 미생물:
(a) 수크로스 트랜스포터 및 수크로스 신타제를 인코딩하는 하나 이상의 재조합 유전자;
(b) GGPPS 폴리펩티드를 인코딩하는 핵산;
(c) ent-코팔릴 디포스페이트 신타제 폴리펩티드를 인코딩하는 핵산;
(d) 카우렌 신타제 (KS) 폴리펩티드를 인코딩하는 핵산;
(e) 카우렌 옥시다제 (KO) 폴리펩티드를 인코딩하는 핵산;
(f) 스테비올 신타제 (KAH) 폴리펩티드를 인코딩하는 핵산;
(g) 사이토크롬 P450 리덕타제 (CPR) 폴리펩티드를 인코딩하는 핵산; 및 또한 적절한 조합의;
(h) UGT85C2 폴리펩티드를 인코딩하는 핵산;
(i) UGT76G1 폴리펩티드를 인코딩하는 핵산;
(j) UGT74G1 폴리펩티드를 인코딩하는 핵산;
(k) UGT91D2 폴리펩티드를 인코딩하는 핵산; 또는
(l) EUGT11 폴리펩티드를 인코딩하는 핵산. - 제 17항에 있어서, 수크로스 트랜스포터가 아라비돕시스 탈리아나 (Arabidopsis thaliana)로부터의 SUC1이며; 수크로스 신타제가 코페아 아라비카 (Coffea arabica), 아라비돕시스 탈리아나, 또는 스테비아 레바우디아나 ( Stevia rebaudiana)로부터의 SUC1이며; 카우렌 신타제가 A. 탈리아나로부터 비롯되며; 카우렌 옥시다제가 S. 레바우디아나로부터 비롯되는 재조합 미생물.
- 제 17항 또는 제 18항에 있어서, 외인성 핵산이 코돈 최적화된 것인 재조합 미생물.
- 제 19항에 있어서, 외인성 핵산이 사카로마이세스 세레비시애에서의 발현을 위해 코돈 최적화된 것인 재조합 미생물.
- 제 17항 내지 제 20항 중의 어느 한 항에 있어서, UGT85C2, UGT76G1 및 UGT91D2 폴리펩티드를 인코딩하는 외인성 핵산을 포함하는 재조합 미생물.
- 제 17항 내지 제 20항 중의 어느 한 항에 있어서, UGT85C2, UGT76G1, UGT74G1, 및 UGT91D2 폴리펩티드를 인코딩하는 외인성 핵산을 포함하는 재조합 미생물.
- 제 17항 내지 제 20항 중의 어느 한 항에 있어서, UGT85C2, UGT76G1, UGT74G1, 및 EUGT11 폴리펩티드를 인코딩하는 외인성 핵산을 포함하는 재조합 미생물.
- 제 17항 내지 제 20항 중의 어느 한 항에 있어서, UGT85C2, UGT76G1, UGT74G1, UGT91D2 및 EUGT11 폴리펩티드를 인코딩하는 외인성 핵산을 포함하는 재조합 미생물.
- (a) GGPPS; ent-코팔릴 디포스페이트 신타제 (CDPS) 폴리펩티드; 카우렌 옥시다제 (KO) 폴리펩티드; 카우렌 신타제 (KS) 폴리펩티드; 스테비올 신타제 (KAH) 폴리펩티드; 사이토크롬 P450 리덕타제 (CPR) 폴리펩티드; 및 또한, 적절한 조합의 UGT85C2 폴리펩티드; UGT74G1 폴리펩티드; UGT76G1 폴리펩티드; UGT91D2 폴리펩티드; 또는 EUGT11 폴리펩티드를 인코딩하는 유전자의 유도성 발현 또는 항시성 발현을 포함하여 상기 유전자가 발현되는 조건하에 배양 배지에서 청구항 제 1항 내지 제 24항 중의 어느 한 항에 따른 재조합 미생물을 배양하는 단계;
(b) 재조합 미생물에서 레바우디오시드를 포함하는 화합물 중 하나 이상을 합성하는 단계; 및
(c) 레바우디오시드를 포함하는 화합물 중 하나 이상을 분리하는 단계를 포함하여, 레바우디오시드를 생성하는 방법. - 제 25항에 있어서, 레바우디오시드가 레바우디오시드 A, 레바우디오시드 B, 레바우디오시드 D, 레바우디오시드 E, 또는 레바우디오시드 M이며,
(a) 레바우디오시드 A는 UGT85C2, UGT76G1, UGT74G1 및 UGT91D2를 발현하는 재조합 미생물에서 합성될 수 있으며;
(b) 레바우디오시드 B는 UGT85C2, UGT76G1, 및 UGT91D2 또는 EUGT11을 발현하는 재조합 미생물에서 합성될 수 있으며;
(c) 레바우디오시드 D는 UGT85C2, UGT76G1 UGT74G1, UGT91D2 및 EUGT11을 발현하는 재조합 미생물에서 합성될 수 있으며;
(d) 레바우디오시드 E는 UGT85C2, UGT74G1, UGT91D2 및 EUGT11을 발현하는 재조합 미생물에서 합성될 수 있으며;
(e) 레바우디오시드 M은 UGT85C2, UGT76G1, UGT74G1, UGT91D2 및 EUGT11을 발현하는 재조합 미생물에서 합성될 수 있는 방법. - 제 25항 또는 제 26항에 있어서, 재조합 미생물이 YOR1, SNQ2, PDR1 또는 FLR1을 과다발현하는 방법.
- 제 25항 또는 제 26항에 있어서, 재조합 미생물이 2, 3, 4, 5, 6, 7 또는 8개의 내인성 트랜스포터 유전자 또는 전사 인자 유전자의 감소된 발현을 갖는 방법.
- 제 25항 내지 제 28항 중의 어느 한 항에 있어서, 재조합 미생물이 원핵 생물 또는 진핵 생물인 방법.
- 제 25항 내지 제 29항 중의 어느 한 항에 있어서, 재조합 미생물이 사카로미케스강인 방법.
- 제 25항 내지 제 30항 중의 어느 한 항에 있어서, 재조합 미생물이 아가리쿠스, 아스퍼길루스, 바실루스, 캔디다, 코리네박테리움, 에스체리치아, 푸사리움/깁베렐라, 클루이베로마이세스, 래티포루스, 렌티누스, 파피아, 파네로새테, 피치아, 피스코미트렐라, 로도투룰라, 사카로마이세스, 쉬조사카로마이세스, 스파셀로마, 잔토필로마이세스 및 야로위아 속으로부터 선택되는 방법.
- 제 25항 내지 제 31항 중의 어느 한 항에 있어서, 재조합 미생물이 사카로마이세스 세레비시애, 쉬조사카로마이세스 폼베, 야로위아 리폴리티카, 캔디다 글라브라타, 아쉬비아 고스시피, 사이버린드네라 자디니, 피치아 파스토리스, 클루이베로마이세스 락티스, 한세눌라 폴리모르파, 캔디다 보이디니, 아르술라 아데니니보란스, 잔토필로마이세스 덴드로로우스 또는 캔디다 알비칸스 종으로부터 선택되는 방법.
- 제 25항 내지 제 32항 중의 어느 한 항에 있어서, 미생물이 사카로마이세스 속으로부터 비롯되는 방법.
- 제 25항 내지 제 33항 중의 어느 한 항에 있어서, 미생물이 사카로마이세스 세레비시애인 방법.
- 제 25항 내지 제 34항 중의 어느 한 항에 있어서, 레바우디오시드가 약 500 mg/L 내지 약 3,000 mg/L의 농도로 생성되는 방법.
- 스테비올 글리코시드의 분비에 영향을 끼치는 방법으로서,
(a) 제 1항 내지 제 24항 중의 어느 한 항에 따른 재조합 미생물을 사용하여 스테비올 글리코시드를 생성하는 단계로서, 적어도 하나의 재조합 유전자가 발현되는 단계,
(b) 스테비올 글리코시드가 합성되는 조건하에 배지에서 단계 (a)의 재조합 미생물을 배양하고, 트랜스포터 유전자, 적어도 하나의 트랜스포터 유전자의 발현을 조절하는 전사 인자 유전자, 또는 이 둘 모두인 적어도 하나의 유전자를 발현시키는 단계,
(c) 배양 단계 동안 생성된 스테비올 글리코시드를 분리하는 단계를 포함하는 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361763290P | 2013-02-11 | 2013-02-11 | |
US201361763308P | 2013-02-11 | 2013-02-11 | |
US61/763,290 | 2013-02-11 | ||
US61/763,308 | 2013-02-11 | ||
PCT/EP2014/052675 WO2014122328A1 (en) | 2013-02-11 | 2014-02-11 | Efficient production of steviol glycosides in recombinant hosts |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20150128705A true KR20150128705A (ko) | 2015-11-18 |
Family
ID=50112893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157024717A KR20150128705A (ko) | 2013-02-11 | 2014-02-11 | 재조합 숙주에서 스테비올 글리코시드의 효율적인 생성 |
Country Status (12)
Country | Link |
---|---|
US (3) | US10017804B2 (ko) |
EP (1) | EP2954061B1 (ko) |
JP (2) | JP6576247B2 (ko) |
KR (1) | KR20150128705A (ko) |
CN (1) | CN105189771B (ko) |
AU (2) | AU2014213918B2 (ko) |
BR (1) | BR112015019160A2 (ko) |
CA (1) | CA2900882A1 (ko) |
MX (1) | MX2015010098A (ko) |
MY (1) | MY184253A (ko) |
SG (2) | SG11201506127WA (ko) |
WO (1) | WO2014122328A1 (ko) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9107436B2 (en) | 2011-02-17 | 2015-08-18 | Purecircle Sdn Bhd | Glucosylated steviol glycoside as a flavor modifier |
US10696706B2 (en) | 2010-03-12 | 2020-06-30 | Purecircle Usa Inc. | Methods of preparing steviol glycosides and uses of the same |
BR122021005304B1 (pt) | 2010-06-02 | 2022-02-22 | Evolva, Inc | Hospedeiro recombinante que compreende genes recombinantes para produção de esteviol ou glicosídeo de esteviol, ácido nucleico, método para produzir esteviol, glicosídeo de esteviol ou composição de glicosídeo de esteviol e método para sintetizar esteviol ou glicosídeo de esteviol |
US11690391B2 (en) | 2011-02-17 | 2023-07-04 | Purecircle Sdn Bhd | Glucosylated steviol glycoside as a flavor modifier |
US9771434B2 (en) | 2011-06-23 | 2017-09-26 | Purecircle Sdn Bhd | Products from stevia rebaudiana |
CN103732753B (zh) | 2011-08-08 | 2018-03-30 | 埃沃尔瓦公司 | 甜菊醇糖苷类的重组生产 |
CN103974628B (zh) * | 2012-05-22 | 2019-04-05 | 谱赛科有限责任公司 | 高纯度的甜菊醇糖苷 |
US9752174B2 (en) | 2013-05-28 | 2017-09-05 | Purecircle Sdn Bhd | High-purity steviol glycosides |
CA3171770A1 (en) | 2013-02-06 | 2014-08-14 | Evolva Sa | Methods for improved production of rebaudioside d and rebaudioside m |
DK3004366T3 (da) * | 2013-05-31 | 2019-05-20 | Dsm Ip Assets Bv | Mikroorganismer til diterpenproduktion |
US10952458B2 (en) | 2013-06-07 | 2021-03-23 | Purecircle Usa Inc | Stevia extract containing selected steviol glycosides as flavor, salty and sweetness profile modifier |
DK3003058T4 (da) | 2013-06-07 | 2023-07-24 | Purecircle Usa Inc | Stevia-ekstrakt indeholdende udvalgte steviolglycosider som aroma-, salt- og sødmeprofilmodifikator |
BR112016000745B1 (pt) * | 2013-07-15 | 2021-01-05 | Dsm Ip Assets B.V. | processo para a preparação de rebaudiosídeo m |
US10370418B2 (en) * | 2014-05-20 | 2019-08-06 | Lawrence Livermore National Security, Llc | Engineered microorganisms having resistance to ionic liquids |
MX2017001859A (es) | 2014-08-11 | 2017-04-11 | Evolva Sa | Produccion de glicosidos de esteviol en hospederos recombinantes. |
CN107072237B (zh) | 2014-09-02 | 2021-12-14 | 谱赛科有限责任公司 | 甜菊提取物 |
SG11201701677UA (en) * | 2014-09-09 | 2017-04-27 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
HUE045992T2 (hu) * | 2014-10-03 | 2020-01-28 | Conagen Inc | Kalóriamentes édesítõszerek és szintézismódszereik |
WO2016055578A1 (en) * | 2014-10-08 | 2016-04-14 | Dsm Ip Assets B.V. | Steviol glycoside production |
AU2015353735A1 (en) * | 2014-11-24 | 2017-06-08 | Cargill, Incorporated | Glycoside compositions |
MX2017008043A (es) | 2014-12-17 | 2017-12-11 | Cargill Inc | Compuestos de glicósido de esteviol, composiciones para ingesta por vía oral o uso oral y metodo para mejorar la solubilidad del glicósido de esteviol. |
CA2973674A1 (en) * | 2015-01-30 | 2016-08-04 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
BR112017017207B1 (pt) * | 2015-02-10 | 2022-10-18 | Purecircle Usa Inc. | Processo para produzir um glicosídeo terpenoide, composição de sabor, ingrediente alimentício, alimento, bebida ou outro produto consumível, cosmético e produto farmacêutico que compreende o dito glicosídeo terpenoide |
US10604743B2 (en) | 2015-03-16 | 2020-03-31 | Dsm Ip Assets B.V. | UDP-glycosyltransferases |
US11344051B2 (en) | 2015-04-03 | 2022-05-31 | Dsm Ip Assets B.V. | Steviol glycosides |
BR112017025709B1 (pt) | 2015-05-29 | 2024-03-05 | Cargill, Incorporated | Método para produzir glicosídeos de esteviol |
CN107949632B (zh) | 2015-05-29 | 2021-06-01 | 嘉吉公司 | 用于使用高pH生产甜菊醇糖苷的发酵方法和由此获得的组合物 |
CN107613786A (zh) | 2015-05-29 | 2018-01-19 | 嘉吉公司 | 产生糖苷的热处理 |
CN105154348B (zh) * | 2015-08-05 | 2018-05-04 | 大连理工大学 | 一种提高酿酒酵母对纤维素水解液抑制物耐受性的方法 |
CN107920548A (zh) | 2015-08-06 | 2018-04-17 | 嘉吉公司 | 用于产生甜菊醇糖苷的发酵方法 |
WO2017025362A1 (en) * | 2015-08-07 | 2017-02-16 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
WO2017025648A1 (en) * | 2015-08-13 | 2017-02-16 | Dsm Ip Assets B.V. | Steviol glycoside transport |
CA2993744A1 (en) | 2015-08-13 | 2017-02-16 | Dsm Ip Assets B.V. | Steviol glycoside transport |
ES2959560T3 (es) | 2015-08-21 | 2024-02-27 | Manus Bio Inc | Aumento de la productividad de células hospedadoras de E. coli que expresan funcionalmente enzimas P450 |
US9765117B2 (en) | 2015-08-24 | 2017-09-19 | Romek Figa | Peptides for treating cancer |
EP3141610A1 (en) * | 2015-09-12 | 2017-03-15 | Jennewein Biotechnologie GmbH | Production of human milk oligosaccharides in microbial hosts with engineered import / export |
BR122020008481B1 (pt) | 2015-10-26 | 2022-10-18 | Purecircle Usa Inc | Composição de glicosídeo de esteviol contendo rebaudiosídeo q glicosilado e rebaudiosídeo r glicosilado e método para melhorar o perfil de doçura de um adoçante de estévia |
WO2017106577A1 (en) | 2015-12-15 | 2017-06-22 | Purecircle Usa Inc. | Steviol glycoside compositions |
CN109154010A (zh) | 2016-03-11 | 2019-01-04 | 埃沃尔瓦公司 | 在重组宿主中生产甜菊醇糖苷 |
CA3020671A1 (en) | 2016-04-13 | 2017-10-19 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
EP3458599A1 (en) | 2016-05-16 | 2019-03-27 | Evolva SA | Production of steviol glycosides in recombinant hosts |
WO2017218325A1 (en) | 2016-06-15 | 2017-12-21 | Codexis, Inc. | Engineered beta-glucosidases and glucosylation methods |
US20190127772A1 (en) * | 2016-06-15 | 2019-05-02 | Codexis, Inc. | Enzymatic glycosylation of steviol glycosides and other compounds with glucose-1-phosphate |
EP3471559A4 (en) * | 2016-06-17 | 2020-04-08 | Cargill, Incorporated | STEVIOL GLYCOSIDE COMPOSITIONS FOR ORAL USE OR USE |
MX2019001631A (es) | 2016-08-12 | 2019-08-05 | Amyris Inc | Glicosiltransferasa dependiente de uridina difosfato para la produccion de alta eficiencia de rebaudiosidos. |
EP3535406A1 (en) | 2016-11-07 | 2019-09-11 | Evolva SA | Production of steviol glycosides in recombinant hosts |
CN108085262B (zh) * | 2016-11-23 | 2022-08-05 | 中国科学院天津工业生物技术研究所 | 对萜类或含萜精油耐受性提高或萜类产量提高的重组宿主细胞、其产生方法及其用途 |
WO2018124141A1 (ja) | 2016-12-27 | 2018-07-05 | サントリーホールディングス株式会社 | ステビオール配糖体ヘキソース転移酵素およびそれをコードする遺伝子 |
AU2018211953A1 (en) | 2017-01-26 | 2019-08-15 | Manus Bio, Inc. | Metabolic engineering for microbial production of terpenoid products |
EP3577229A4 (en) | 2017-02-03 | 2020-12-23 | Codexis, Inc. | MANIPULATED GLYCOSYL TRANSFERASES AND METHOD FOR STEVIOL GLYCOSIDE GLUCOSYLATION |
EP3611265A4 (en) | 2017-04-12 | 2021-09-01 | Suntory Holdings Limited | RHAMNOSE SYNTHASE FROM STEVIA AND GEN |
WO2018211032A1 (en) | 2017-05-17 | 2018-11-22 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
JP2020530271A (ja) * | 2017-06-30 | 2020-10-22 | ピーティーティー グローバル ケミカル パブリック カンパニー リミテッド | 安定化されたコピー数の機能性dna配列を有する微生物及び関連方法 |
US11365417B2 (en) | 2017-09-12 | 2022-06-21 | Bio Capital Holdings, LLC | Biological devices and methods of use thereof to produce steviol glycosides |
WO2019099649A1 (en) * | 2017-11-20 | 2019-05-23 | Manus Bio, Inc. | Microbial host cells for production of steviol glycosides |
CN111566222A (zh) | 2017-12-05 | 2020-08-21 | 埃沃尔瓦公司 | 在重组宿主中产生甜菊醇糖苷 |
CN108070602B (zh) * | 2017-12-12 | 2020-11-06 | 山东隆科特酶制剂有限公司 | 一种减少及推迟芽孢杆菌芽孢生成的分子改造方法 |
US11608364B2 (en) | 2018-04-30 | 2023-03-21 | Dsm Ip Assets B.V. | Steviol glycoside transport |
KR101929158B1 (ko) * | 2018-06-07 | 2018-12-13 | 씨제이제일제당 (주) | 5'-크산틸산을 생산하는 미생물 및 이를 이용한 5'-크산틸산의 제조방법 |
US20220106619A1 (en) * | 2019-01-24 | 2022-04-07 | Amyris, Inc. | Abc transporters for the high efficiency production of rebaudiosides |
CN112322648A (zh) * | 2019-07-30 | 2021-02-05 | 上海市农业科学院 | 一种abc转运蛋白基因mrp1s及其制备方法和应用 |
WO2021076924A1 (en) * | 2019-10-16 | 2021-04-22 | Sweegen, Inc. | Steviol glycoside formulations for food and beverages |
CN110846363B (zh) * | 2019-11-11 | 2023-02-17 | 天津大学 | 一锅法生产莱鲍迪苷d的方法 |
US20230183302A1 (en) * | 2020-04-27 | 2023-06-15 | Université Libre de Bruxelles | Yeast strains for reducing contamination by lactic acid bacteria |
CN114214378A (zh) * | 2021-11-23 | 2022-03-22 | 安徽金禾实业股份有限公司 | 一种利用枯草芽孢杆菌发酵催化制备莱鲍迪苷m的方法 |
WO2023122801A2 (en) * | 2021-12-24 | 2023-06-29 | The Regents Of The University Of California | Saponin production in yeast |
CN114561310B (zh) * | 2022-03-17 | 2022-12-02 | 江南大学 | 一种生产甜茶苷的酿酒酵母及其应用 |
Family Cites Families (142)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58149697A (ja) | 1982-02-27 | 1983-09-06 | Dainippon Ink & Chem Inc | β−1,3グリコシルステビオシドの製造方法 |
JPS591408A (ja) | 1982-06-28 | 1984-01-06 | Fukue Ito | ヘヤ−トニツクの製造方法 |
JPS59101408A (ja) | 1982-12-02 | 1984-06-12 | Junichi Iwamura | 植物生長調整剤 |
US5484956A (en) | 1990-01-22 | 1996-01-16 | Dekalb Genetics Corporation | Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin |
US6946587B1 (en) | 1990-01-22 | 2005-09-20 | Dekalb Genetics Corporation | Method for preparing fertile transgenic corn plants |
JPH03277275A (ja) | 1990-03-28 | 1991-12-09 | Dainippon Ink & Chem Inc | 新規酵素及びその酵素を用いた配糖体の製造方法 |
US5204253A (en) | 1990-05-29 | 1993-04-20 | E. I. Du Pont De Nemours And Company | Method and apparatus for introducing biological substances into living cells |
US5306862A (en) | 1990-10-12 | 1994-04-26 | Amoco Corporation | Method and composition for increasing sterol accumulation in higher plants |
US5460949A (en) | 1990-11-15 | 1995-10-24 | Amoco Corporation | Method and composition for increasing the accumulation of squalene and specific sterols in yeast |
US5712112A (en) | 1992-11-04 | 1998-01-27 | National Science Council Of R.O.C. | Gene expression system comprising the promoter region of the alpha-amylase genes |
WO1995002683A1 (en) | 1993-07-15 | 1995-01-26 | Neose Pharmaceuticals | Method of synthesizing saccharide compositions |
US7186891B1 (en) | 1996-04-12 | 2007-03-06 | University Of Kentucky, Research Foundation | Plant cells and plants expressing chimeric isoprenoid synthases |
JPH10117776A (ja) | 1996-10-22 | 1998-05-12 | Japan Tobacco Inc | インディカイネの形質転換方法 |
CA2309791A1 (en) | 1997-10-06 | 1999-04-15 | The Centre National De Recherche Scientifique | Plant fatty acid hydroxylase genes |
US6255557B1 (en) | 1998-03-31 | 2001-07-03 | Her Majesty The Queen In Right Of Canada As Represented By The Ministerof Agriculture And Agri-Food Canada | Stevia rebaudiana with altered steviol glycoside composition |
US6806076B1 (en) | 1998-04-14 | 2004-10-19 | Kyowa Hakko Kogyo Co., Ltd. | Process for producing isoprenoid compounds by microorganisms and a method for screening compounds with antibiotic or weeding activity |
TWI250210B (en) | 1998-05-06 | 2006-03-01 | Dsm Ip Assets Bv | An isolated DNA sequence coding for an enzyme involved in the mevalonate pathway or the pathway from isopentenyl pyrophosphate to farnesyl pyrophosphate |
EP0955363A3 (en) | 1998-05-06 | 2004-01-28 | F. Hoffmann-La Roche Ag | Dna sequences encoding enzymes involved in production of isoprenoids |
AU4863099A (en) | 1998-07-06 | 2000-01-24 | Dcv, Inc. Doing Business As Bio-Technical Resources | Method of vitamin production |
EP2305825B1 (en) | 1998-07-06 | 2015-01-14 | DCV Inc. doing business as Bio-Technical Resourses | Method of vitamin production |
AR021636A1 (es) | 1998-12-17 | 2002-07-31 | Rubicon Forests Holdings Ltd | Materiales y metodos para la modificacion del contenido, la composicion y el metabolismo de los isoprenoides |
CA2352488A1 (en) | 1998-12-23 | 2000-06-29 | The Samuel Roberts Noble Foundation, Inc. | Plant transformation process |
JP2002541851A (ja) | 1999-04-15 | 2002-12-10 | カルジーン エルエルシー | イソプレノイド合成に関与するタンパク質の核酸配列 |
NZ513993A (en) | 1999-04-21 | 2001-09-28 | Samuel Roberts Noble Found Inc | Plant transformation process |
DE60036477T2 (de) | 1999-08-04 | 2008-06-12 | Bacher, Adelbert, Prof. Dr.med. Dr.rer.nat. | Isoprenoid biosynthese |
AU6780700A (en) | 1999-08-18 | 2001-03-13 | Paradigm Genetics, Inc. | Methods and apparatus for transformation of monocotyledenous plants using agrobacterium in combination with vacuum filtration |
WO2001083769A2 (en) | 2000-05-03 | 2001-11-08 | The Salk Institute For Biological Studies | Crystallization of 4-diphosphocytidyl-2-c-methylerythritol synthesis |
DE10027821A1 (de) | 2000-06-05 | 2001-12-06 | Adelbert Bacher | Der Mevalonat-unabhängige Isoprenoidbiosyntheseweg |
US20030033626A1 (en) | 2000-07-31 | 2003-02-13 | Hahn Frederick M. | Manipulation of genes of the mevalonate and isoprenoid pathways to create novel traits in transgenic organisms |
EP1313867A2 (en) | 2000-08-24 | 2003-05-28 | The Scripps Research Institute | Stress-regulated genes of plants, transgenic plants containing same, and methods of use |
US6689601B2 (en) | 2000-09-01 | 2004-02-10 | E. I. Du Pont De Nemours And Company | High growth methanotropic bacterial strain |
US6660507B2 (en) | 2000-09-01 | 2003-12-09 | E. I. Du Pont De Nemours And Company | Genes involved in isoprenoid compound production |
US6818424B2 (en) | 2000-09-01 | 2004-11-16 | E. I. Du Pont De Nemours And Company | Production of cyclic terpenoids |
US7229784B2 (en) * | 2000-09-19 | 2007-06-12 | Microbia, Inc. | Modulation of secondary metabolite production by zinc binuclear cluster proteins |
WO2002026933A2 (en) | 2000-09-29 | 2002-04-04 | Cargill Incorporated | Isoprenoid production |
US6949362B2 (en) | 2000-12-12 | 2005-09-27 | E. I. Du Pont De Nemours And Company | Rhodococcus cloning and expression vectors |
WO2002059297A2 (en) | 2001-01-25 | 2002-08-01 | Evolva Biotech A/S | A library of a collection of cells |
US20050003474A1 (en) | 2001-01-26 | 2005-01-06 | Desouza Mervyn L. | Carotenoid biosynthesis |
US20040078846A1 (en) | 2002-01-25 | 2004-04-22 | Desouza Mervyn L. | Carotenoid biosynthesis |
DE10201458A1 (de) | 2001-04-11 | 2002-10-17 | Adelbert Bacher | Intermediate und Enzyme des Mevalonat-unabhängigen Isoprenoidbiosyntheseweg |
US7034140B2 (en) | 2001-04-24 | 2006-04-25 | E.I. Du Pont De Nemours And Company | Genes involved in isoprenoid compound production |
CA2449885A1 (en) | 2001-06-06 | 2002-12-12 | Roche Vitamins Ag | Improved isoprenoid production |
AU2002341541A1 (en) | 2001-06-22 | 2003-03-03 | Syngenta Participations Ag | Abiotic stress responsive polynucleotides and polypeptides |
NZ513755A (en) * | 2001-08-24 | 2001-09-28 | Ann Rachel Holmes | Protein expression system in yeast comprising a vector encoding a heterologous membrane protein and its application in screening for drugs |
US20040072311A1 (en) | 2001-08-28 | 2004-04-15 | Dicosimo Deana J. | Production of cyclic terpenoids |
US20040010815A1 (en) | 2001-09-26 | 2004-01-15 | Lange B. Markus | Identification and characterization of plant genes |
US7172886B2 (en) | 2001-12-06 | 2007-02-06 | The Regents Of The University Of California | Biosynthesis of isopentenyl pyrophosphate |
EP1544300B1 (en) | 2002-08-20 | 2009-09-30 | Suntory Holdings Limited | Novel glycosyltransferase genes |
CN100467593C (zh) | 2002-09-27 | 2009-03-11 | Dsmip资产公司 | Sqs基因 |
US7098000B2 (en) | 2003-06-04 | 2006-08-29 | E. I. Du Pont De Nemoure And Company | Method for production of C30-aldehyde carotenoids |
US7422884B2 (en) | 2003-06-12 | 2008-09-09 | Dsm Ip Assetts B.V. | Feedback-resistant mevalonate kinases |
US7569389B2 (en) | 2004-09-30 | 2009-08-04 | Ceres, Inc. | Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics |
ES2379368T3 (es) | 2004-05-21 | 2012-04-25 | The Regents Of The University Of California | Método para aumentar la producción de compuestos isoprenoides |
AU2005321630A1 (en) | 2004-07-02 | 2006-07-06 | Metanomics Gmbh | Process for the production of fine chemicals |
US20060014264A1 (en) | 2004-07-13 | 2006-01-19 | Stowers Institute For Medical Research | Cre/lox system with lox sites having an extended spacer region |
JPWO2006016395A1 (ja) | 2004-08-09 | 2008-05-01 | 国立大学法人東北大学 | Udp−グルクロニル基転移酵素およびその遺伝子 |
CN101044243B (zh) | 2004-08-19 | 2011-12-28 | 帝斯曼知识产权资产管理有限公司 | 类异戊二烯的生产方法 |
US7923552B2 (en) | 2004-10-18 | 2011-04-12 | SGF Holdings, LLC | High yield method of producing pure rebaudioside A |
US8338155B2 (en) | 2004-12-14 | 2012-12-25 | Dsm Ip Assets B.V. | Modified mevalonate kinase with reduced feedback inhibition |
CA2598792A1 (en) | 2005-03-02 | 2006-09-08 | Metanomics Gmbh | Process for the production of fine chemicals |
WO2006096392A2 (en) | 2005-03-04 | 2006-09-14 | Diversa Corporation | Enzymes involved in astaxanthin, carotenoid and isoprenoid biosynthetic pathways, genes encoding them and methods of making and using them |
JP4284562B2 (ja) | 2005-03-04 | 2009-06-24 | 独立行政法人産業技術総合研究所 | Udp−キシロースの製造方法 |
US7989677B2 (en) | 2005-08-17 | 2011-08-02 | Nestec S. A. | Nucleic acids and proteins associated with sucrose accumulation in coffee |
US8293307B2 (en) | 2005-10-11 | 2012-10-23 | Purecircle Sdn Bhd | Process for manufacturing a sweetener and use thereof |
KR101374346B1 (ko) | 2005-11-23 | 2014-03-14 | 더 코카콜라 컴파니 | 시간 특성 및/또는 향미 특성이 개선된 천연 고효능 감미료조성물, 그 제제 방법 및 용도 |
KR100784261B1 (ko) | 2006-01-02 | 2007-12-11 | 한국과학기술원 | 탄저균의 포자외막 단백질을 이용한 목적단백질의 미생물표면발현방법 |
US7927851B2 (en) | 2006-03-21 | 2011-04-19 | Vineland Research And Innovation Centre | Compositions having ent-kaurenoic acid 13-hydroxylase activity and methods for producing same |
CA2644273A1 (en) | 2006-04-05 | 2008-03-27 | Metanomics Gmbh | Process for the production of a fine chemical |
US8114645B2 (en) | 2006-05-19 | 2012-02-14 | The Regents Of The University Of California | Methods for increasing isoprenoid and isoprenoid precursor production by modulating fatty acid levels |
JP5225986B2 (ja) | 2006-06-19 | 2013-07-03 | ジボダン エス エー | 核酸、ポリペプチドおよびその利用 |
WO2008008256A2 (en) | 2006-07-07 | 2008-01-17 | The Regents Of The University Of California | Methods for enhancing production of isoprenoid compounds by host cells |
BRPI0716954A2 (pt) | 2006-09-26 | 2013-10-29 | Univ California | Produção de isoprenóides e precursores de isoprenóides |
US7741119B2 (en) | 2006-09-28 | 2010-06-22 | E. I. Du Pont De Nemours And Company | Xylitol synthesis mutant of xylose-utilizing zymomonas for ethanol production |
US7629156B2 (en) | 2006-09-28 | 2009-12-08 | E.I. Du Pont De Nemours And Company | Ethanol production in fermentation of mixed sugars containing xylose |
CN101200480B (zh) | 2006-12-15 | 2011-03-30 | 成都华高药业有限公司 | 莱鲍迪甙a的提取方法 |
JP4915917B2 (ja) | 2006-12-22 | 2012-04-11 | 独立行政法人農業・食品産業技術総合研究機構 | ラクト−n−ビオースi及びガラクト−n−ビオースの製造方法 |
JP2008237110A (ja) | 2007-03-27 | 2008-10-09 | Institute Of Physical & Chemical Research | ステビオール合成酵素遺伝子及びステビオールの製造方法 |
EP2152852A2 (en) | 2007-05-17 | 2010-02-17 | Tetravitae Bioscience, Inc. | Methods and compositions for producing solvents |
US20080292775A1 (en) | 2007-05-22 | 2008-11-27 | The Coca-Cola Company | Delivery Systems for Natural High-Potency Sweetener Compositions, Methods for Their Formulation, and Uses |
WO2009005704A1 (en) | 2007-07-03 | 2009-01-08 | The Regents Of The University Of California | Methods of increasing isoprenoid or isoprenoid precursor production |
JP2009034080A (ja) | 2007-08-03 | 2009-02-19 | Sanei Gen Ffi Inc | 新規糖転移酵素、及びそれを利用した配糖体の製造 |
US7964232B2 (en) | 2007-09-17 | 2011-06-21 | Pepsico, Inc. | Steviol glycoside isomers |
DE112008002456T5 (de) | 2007-09-21 | 2011-01-13 | Basf Plant Science Gmbh | Pflanzen mit erhöhtem Ertrag |
US20110038957A1 (en) | 2007-12-03 | 2011-02-17 | Ann Fowler | Novel nutraceutical compositions containing stevia extract or stevia extract constituents and uses thereof |
WO2009086049A2 (en) | 2007-12-27 | 2009-07-09 | Mc Neil Nutritionals, Llc | Synergistic sweetening compositions |
CN102007214A (zh) | 2008-02-20 | 2011-04-06 | 塞瑞斯公司 | 赋予植物提高的氮利用效率特性的核苷酸序列和相应的多肽 |
TWI475963B (zh) | 2008-02-25 | 2015-03-11 | Coca Cola Co | 甜菊糖苷a衍生性產物以及製造彼的方法 |
CA2728285A1 (en) | 2008-03-03 | 2009-09-11 | Joule Unlimited, Inc. | Engineered co2 fixing microorganisms producing carbon-based products of interest |
WO2009140394A1 (en) | 2008-05-13 | 2009-11-19 | Cargill, Incorporated | Separation of rebaudioside a from stevia glycosides using chromatography |
WO2010021001A2 (en) | 2008-08-19 | 2010-02-25 | Kaushik Ramakrishnan S | Process for preparing sweetener from stevia rebaudiana |
PL2350110T3 (pl) | 2008-10-03 | 2016-12-30 | Nowe glikozydy stewiolowe | |
CN101720910B (zh) | 2008-10-23 | 2012-07-25 | 大闽食品(漳州)有限公司 | 一种甜菊糖甙的制备方法 |
US8614085B2 (en) * | 2009-02-27 | 2013-12-24 | Butamax(Tm) Advanced Biofuels Llc | Yeast with increased butanol tolerance involving a multidrug efflux pump gene |
US20100297722A1 (en) | 2009-05-20 | 2010-11-25 | Board Of Trustees Of Southern Illinois University | Transgenic moss producing terpenoids |
RU2517602C2 (ru) | 2009-06-08 | 2014-05-27 | Йенневайн Биотехнологи Гмбх | Синтез нмо |
US9131718B2 (en) | 2009-06-16 | 2015-09-15 | Epc (Beijing) Natural Products Co., Ltd. | Process for rebaudioside D |
WO2011028671A1 (en) | 2009-09-04 | 2011-03-10 | Redpoint Bio Corporation | Sweetness enhancers including rebaudioside a or d |
CN102595932B (zh) | 2009-09-22 | 2014-07-16 | 红点生物公司 | 莱苞迪苷c的新多晶型物及其制备和使用方法 |
JP5759998B2 (ja) | 2009-10-15 | 2015-08-05 | ピュアサークル スドゥン バハド | 高純度のレバウジオシドdとその適用 |
US8299224B2 (en) | 2009-10-15 | 2012-10-30 | Purecircle Sdn Bhd | High-purity Rebaudioside D |
US8703224B2 (en) | 2009-11-04 | 2014-04-22 | Pepsico, Inc. | Method to improve water solubility of Rebaudioside D |
SG181422A1 (en) | 2009-11-10 | 2012-07-30 | Massachusetts Inst Technology | Microbial engineering for the production of chemical and pharmaceutical products from the isoprenoid pathway |
CA2780527C (en) | 2009-11-23 | 2020-12-01 | E. I. Du Pont De Nemours And Company | Sucrose transporter genes for increasing plant seed lipids |
SG181601A1 (en) | 2009-12-10 | 2012-07-30 | Univ Minnesota | Tal effector-mediated dna modification |
WO2011090709A1 (en) | 2009-12-28 | 2011-07-28 | The Coca-Cola Company | Sweetness enhancers, compositions thereof, and methods for use |
KR101244315B1 (ko) | 2010-10-19 | 2013-03-14 | 이화여자대학교 산학협력단 | 에탄올―저항성 효모 유전자 및 이의 용도 |
WO2011140329A1 (en) | 2010-05-06 | 2011-11-10 | Ceres, Inc. | Transgenic plants having increased biomass |
WO2011146833A1 (en) | 2010-05-20 | 2011-11-24 | Evolva Inc. | Method of producing isoprenoid compounds in yeast |
EP2575499A2 (en) | 2010-05-31 | 2013-04-10 | Vib Vzw | The use of transporters to modulate flavor production by yeast |
BR122021005304B1 (pt) | 2010-06-02 | 2022-02-22 | Evolva, Inc | Hospedeiro recombinante que compreende genes recombinantes para produção de esteviol ou glicosídeo de esteviol, ácido nucleico, método para produzir esteviol, glicosídeo de esteviol ou composição de glicosídeo de esteviol e método para sintetizar esteviol ou glicosídeo de esteviol |
US20120021111A1 (en) | 2010-07-23 | 2012-01-26 | Aexelon Therapeutics, Inc. | Natural Low Caloric Sweetener Compositions for Use in Beverages, Foods and Pharmaceuticals, and Their Methods of Manufacture |
US20120050021A1 (en) | 2010-08-27 | 2012-03-01 | Ford Global Technologies, Llc | Method and Apparatus for In-Vehicle Presence Detection and Driver Alerting |
US20120083593A1 (en) | 2010-10-01 | 2012-04-05 | Shanghai Yongyou Bioscience Inc. | Separation and Purification of Stevioside and Rebaudioside A |
CA2819253A1 (en) | 2010-11-30 | 2012-06-07 | Massachusetts Institute Of Technology | Microbial production of natural sweeteners, diterpenoid steviol glycosides |
KR20130014227A (ko) | 2011-07-29 | 2013-02-07 | 한국생명공학연구원 | 신규한 α-글루코실 스테비오사이드 및 이의 제조 방법 |
CA2843549A1 (en) | 2011-08-08 | 2013-02-14 | Shriram RAGHAVAN | Methods and materials for recombinant production of saffron compounds |
CN103732753B (zh) | 2011-08-08 | 2018-03-30 | 埃沃尔瓦公司 | 甜菊醇糖苷类的重组生产 |
SG11201401927PA (en) | 2011-11-23 | 2014-09-26 | Evolva Sa | Methods and materials for enzymatic synthesis of mogroside compounds |
CN103159808B (zh) | 2011-12-09 | 2017-03-29 | 上海泓博智源医药股份有限公司 | 一种制备天然甜味剂的工艺方法 |
RU2599166C2 (ru) * | 2011-12-19 | 2016-10-10 | Дзе Кока-Кола Компани | Способы очистки стевиоловых гликозидов и их применение |
AU2013211605B2 (en) | 2012-01-23 | 2017-04-06 | Dsm Ip Assets B.V. | Diterpene production |
JP6251669B2 (ja) | 2012-03-16 | 2017-12-20 | サントリーホールディングス株式会社 | ステビオール配糖体化酵素およびそれをコードする遺伝子 |
CN103974628B (zh) | 2012-05-22 | 2019-04-05 | 谱赛科有限责任公司 | 高纯度的甜菊醇糖苷 |
CA2886893C (en) | 2012-09-29 | 2019-05-07 | Yong Wang | Method for producing stevioside compounds by microorganism |
WO2014086890A1 (en) | 2012-12-05 | 2014-06-12 | Evolva Sa | Steviol glycoside compositions sensory properties |
CA3171770A1 (en) | 2013-02-06 | 2014-08-14 | Evolva Sa | Methods for improved production of rebaudioside d and rebaudioside m |
CA2912347A1 (en) | 2013-05-31 | 2014-12-04 | Dsm Ip Assets B.V. | Extracellular diterpene production |
DK3004366T3 (da) | 2013-05-31 | 2019-05-20 | Dsm Ip Assets Bv | Mikroorganismer til diterpenproduktion |
KR101559478B1 (ko) | 2013-06-24 | 2015-10-13 | 한국생명공학연구원 | 효소전환법을 이용한 천연 고감미료의 제조방법 |
BR112016000745B1 (pt) | 2013-07-15 | 2021-01-05 | Dsm Ip Assets B.V. | processo para a preparação de rebaudiosídeo m |
WO2015011209A1 (en) | 2013-07-23 | 2015-01-29 | Dsm Ip Assets B.V. | Diterpene production in yarrowia |
MX2016000825A (es) | 2013-07-31 | 2016-05-24 | Dsm Ip Assets Bv | Glicosidos de esteviol. |
EP3536697A1 (en) | 2013-07-31 | 2019-09-11 | DSM IP Assets B.V. | Recovery of steviol glycosides |
AU2014297224A1 (en) | 2013-08-02 | 2016-03-03 | Suntory Holdings Limited | Method for using hexenol glycosyl transferase |
CN103397064B (zh) | 2013-08-14 | 2015-04-15 | 苏州汉酶生物技术有限公司 | 一种酶法制备瑞鲍迪甙m的方法 |
EP3039132A2 (en) | 2013-08-30 | 2016-07-06 | Evolva SA | A method for producing modified resveratrol |
SG11201606673RA (en) | 2014-03-07 | 2016-09-29 | Evolva Sa | Methods for recombinant production of saffron compounds |
MX2017001859A (es) | 2014-08-11 | 2017-04-11 | Evolva Sa | Produccion de glicosidos de esteviol en hospederos recombinantes. |
SG11201701677UA (en) | 2014-09-09 | 2017-04-27 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
CA2973674A1 (en) | 2015-01-30 | 2016-08-04 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
CN104845990A (zh) | 2015-06-11 | 2015-08-19 | 山东大学 | 拟南芥糖基转移酶基因ugt73c7在提高植物抗病性中的应用 |
WO2017025362A1 (en) | 2015-08-07 | 2017-02-16 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
-
2014
- 2014-02-11 EP EP14704558.7A patent/EP2954061B1/en active Active
- 2014-02-11 SG SG11201506127WA patent/SG11201506127WA/en unknown
- 2014-02-11 MY MYPI2015001996A patent/MY184253A/en unknown
- 2014-02-11 BR BR112015019160A patent/BR112015019160A2/pt not_active Application Discontinuation
- 2014-02-11 AU AU2014213918A patent/AU2014213918B2/en active Active
- 2014-02-11 CA CA2900882A patent/CA2900882A1/en not_active Abandoned
- 2014-02-11 MX MX2015010098A patent/MX2015010098A/es unknown
- 2014-02-11 WO PCT/EP2014/052675 patent/WO2014122328A1/en active Application Filing
- 2014-02-11 JP JP2015556536A patent/JP6576247B2/ja not_active Expired - Fee Related
- 2014-02-11 CN CN201480008381.6A patent/CN105189771B/zh active Active
- 2014-02-11 KR KR1020157024717A patent/KR20150128705A/ko not_active Application Discontinuation
- 2014-02-11 US US14/764,898 patent/US10017804B2/en active Active
- 2014-02-11 SG SG10201705993YA patent/SG10201705993YA/en unknown
-
2018
- 2018-02-08 AU AU2018200950A patent/AU2018200950A1/en not_active Abandoned
- 2018-06-07 US US16/002,245 patent/US11021727B2/en active Active
-
2019
- 2019-04-05 JP JP2019072616A patent/JP2019162110A/ja not_active Withdrawn
-
2021
- 2021-04-29 US US17/244,089 patent/US20220017932A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
AU2014213918B2 (en) | 2017-11-09 |
JP2019162110A (ja) | 2019-09-26 |
CN105189771B (zh) | 2019-11-05 |
SG10201705993YA (en) | 2017-08-30 |
AU2018200950A1 (en) | 2018-03-01 |
SG11201506127WA (en) | 2015-09-29 |
US11021727B2 (en) | 2021-06-01 |
JP2016506743A (ja) | 2016-03-07 |
JP6576247B2 (ja) | 2019-09-18 |
WO2014122328A1 (en) | 2014-08-14 |
US20220017932A1 (en) | 2022-01-20 |
CA2900882A1 (en) | 2014-08-14 |
US20150361476A1 (en) | 2015-12-17 |
US20180371517A1 (en) | 2018-12-27 |
US10017804B2 (en) | 2018-07-10 |
BR112015019160A2 (pt) | 2017-08-22 |
CN105189771A (zh) | 2015-12-23 |
AU2014213918A1 (en) | 2015-08-20 |
EP2954061B1 (en) | 2023-11-22 |
WO2014122328A8 (en) | 2015-09-17 |
MY184253A (en) | 2021-03-29 |
MX2015010098A (es) | 2016-04-19 |
EP2954061A1 (en) | 2015-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020273296B2 (en) | Methods for improved production of rebaudioside D and rebaudioside M | |
KR20150128705A (ko) | 재조합 숙주에서 스테비올 글리코시드의 효율적인 생성 | |
US20240026409A1 (en) | Production of steviol glycoside in recombinant hosts | |
KR101971818B1 (ko) | 스테비올 글리코시드의 재조합 생산 | |
KR102114493B1 (ko) | 스테비올 글리코시드의 재조합 생산 | |
US20220195477A1 (en) | Production of steviol glycosides in recombinant hosts | |
US20220154234A1 (en) | Production of steviol glycosides in recombinant hosts | |
US20210155966A1 (en) | Production of steviol glycosides in recombinant hosts | |
KR20170052647A (ko) | 재조합 숙주에서 스테비올 글리코시드의 생성 | |
US20210403970A1 (en) | Production of Steviol Glycosides in Recombinant Hosts | |
US11396669B2 (en) | Production of steviol glycosides in recombinant hosts | |
WO2019110684A1 (en) | Production of steviol glycosides in recombinant hosts | |
WO2018211032A1 (en) | Production of steviol glycosides in recombinant hosts | |
AU2018200459A1 (en) | Recombinant production of steviol glycosides | |
US20190048356A1 (en) | Production of steviol glycosides in recombinant hosts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITB | Written withdrawal of application |