KR20230112673A - 글리코시드 생성물 생합성 및 회수 - Google Patents

글리코시드 생성물 생합성 및 회수 Download PDF

Info

Publication number
KR20230112673A
KR20230112673A KR1020237020932A KR20237020932A KR20230112673A KR 20230112673 A KR20230112673 A KR 20230112673A KR 1020237020932 A KR1020237020932 A KR 1020237020932A KR 20237020932 A KR20237020932 A KR 20237020932A KR 20230112673 A KR20230112673 A KR 20230112673A
Authority
KR
South Korea
Prior art keywords
leu
seq
glu
ala
val
Prior art date
Application number
KR1020237020932A
Other languages
English (en)
Inventor
아지쿠마르 파라일 쿠마란
크리스틴 니콜 에스. 산토스
제이슨 도널드
아론 러브
이잉 젱
아델 가데리
비니트 샤스트리
루 첸
크리스토퍼 투미
한나 린치
에릭 니에미넨
Original Assignee
마누스 바이오, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마누스 바이오, 인크. filed Critical 마누스 바이오, 인크.
Publication of KR20230112673A publication Critical patent/KR20230112673A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • C12N9/1062Sucrose synthase (2.4.1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01017Glucuronosyltransferase (2.4.1.17)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/01Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
    • C12Y503/01009Glucose-6-phosphate isomerase (5.3.1.9)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

다양한 양태 및 구현예에서, 본 개시 내용은 당화 생성물의 제조 방법, 뿐만 아니라 이에 유용한 박테리아 세포 및 우리딘 디포스페이트(UDP)-의존성 당전이(UGT) 효소를 제공한다. 다른 양태 및 구현예에서, 본 개시 내용은 미생물 배양물 또는 무세포 반응물로부터 이러한 글리코시드 생성물을 고수율 및/또는 고순도로 회수하는 방법을 제공한다. 다양한 양태 및 구현예에서, 본 개시 내용은 원하는 기질의 당화 및/또는 당화 생성물의 고수율 및/또는 고순도 회수와 관련된 전세포 생물전환 공정을 제공한다.

Description

글리코시드 생성물 생합성 및 회수
소분자의 당전이효소(Glycosyltransferase)는 식물계에서 큰 다중유전자 패밀리에 의해 암호화된다. 이 효소는 뉴클레오티드의 당으로부터 매우 다양한 2차 대사산물로 당을 전이시켜, 수용체 분자의 물리적 및 화학적 특성들을 변화시킨다. 예를 들어, 스테비올 글리코시드(steviol glycoside)는 남아메리카 특정 지역이 원산지인 엉거시과(Asteraceae)(국화과(Compositae))의 다년생 관목, 스테비아 레바우디아나 베르토니(Stevia Rebaudiana Bertoni)의 잎에서 발견된 화합물의 부류이다. 이들은 구조적으로 코어 테르페노이드(terpenoid), 스테비올을 갖는 특징이 있으며, 위치 C13 및 C19의 탄수화물 잔기의 존재에서 차이가 난다. 이들은 스테비아의 잎에 축적되며, 총 건조 중량의 대략 10% 내지 20%를 구성한다. 건조 중량 기준으로, 스테비아의 잎에서 발견된 4 개의 주요 글리코시드는 전형적으로 스테비오시드(stevioside), 레바우디오시드(rebaudioside) A, 레바우디오시드 C 및 둘코시드(dulcoside) A를 포함한다. 다른 스테비올 글리코시드들은 소량 또는 미량으로 존재하는데, 레바우디오시드 B, D, E, F, G, H, I, J, K, L, M 및 O, 둘코시드 B, 스테비올비오시드(steviolbioside) 및 루부소시드(rubusoside)를 포함한다.
소량의 당화 생성물(glycosylated product), 레바우디오시드 M(RebM)은 수크로스보다 약 200-350 배 더 강력한 것으로 추정되며, 뒷맛이 약간 쓰거나 감초(licorice)와 같은 가공된 깨끗한 단 맛으로 설명된다. 문헌[Prakash I. 등, Development of Next Generation Stevia Sweetener: Rebaudioside M, Foods 3(1), 162-175 (2014)]. RebM에 대해 전세계 식품 산업에서 큰 관심을 갖고 있지만, 스테비아 추출물 중 그 분포(prevalence)가 적어서 혁신적인 합성 공정이 필요하다.
다른 예로서, 모그로시드(mogroside)는 박과(Cucurbitaceae) 식물인 시라이티아 그로스베노리(Siraitia grosvenorii)(나한과 (monkfruit 또는 Luo Han Guo)로도 알려짐)의 과실에서 발견된 트리테르펜-계의 특수 2차 대사산물이다. 과실에서의 이들의 생합성은 아글리콘 모그롤(aglycone mogrol)의 수많은 연속 당화와 관련된다. 삭품 산업에서, 모그로시드 식물 추출물은 천연 비-당 식품 감미제로서 점점 더 많이 사용되고 있다. 예를 들어, 모그로시드 V(mog. V)는 수크로스의 ~250 배의 감미 능력을 갖는다(Kasai 등, Agric Biol Chem (1989)). 게다가, 모그로시드의 추가적인 건강상의 이점이 확인되기도 했었다(Li 등, Chin J Nat Med (2014)).
정제 Mog. V는 일본에서 고-강도 감미제로서 승인받았고, 그 추출물은 미국에서 비-영양성 감미제 및 향 개선제로서 GRAS 자격을 얻었다. 과일에서 모그로시드를 추출하면, 종종 원치않는 뒷맛을 수반한 순도한 다양한 생성물을 얻을 수 있다. 또한, 재배한 과실로부터의 모그로시드의 수율은, 낮은 식물 수율과 식물의 특정 재배 요건 때문에 제한된다. 모그로시드는 신선한 과일에는 약 1%로 존재하고, 건조 과일에는 약 4%로 존재한다. Mog. V는 건조 과일에서 0.5% 내지 1.4%의 함량을 갖는 주요 성분이다. 게다가, 정제의 어려움은 Mog. V의 순도에 제한을 두어, 식물 추출물로부터 얻은 상업적인 제품은 약 50%의 Mog. V를 갖도록 규격화된다. 순수한 Mog. V 제품은 블렌드보다 더 큰 상업적 성공을 거둘 것인데, 그 이유는 향이 날아갈 가능성이 낮고, 제품으로 제형화하기가 더 용이하며, 용해 가능성이 양호하기 때문이다. 따라서, 생물공학적 공정을 통해 달콤한 모그로시드 화합물을 생산하는 것이 유리하다.
천연 식물 추출물에서는 소량의 생성물인 것들을 포함한, 가치가 높은 글리코시드를 생산하기 위한 경제적 방법이 필요하다.
본 발명의 개요
다양한 양태 및 구현예에서, 본 개시 내용은 당화 생성물의 제조 방법, 뿐만 아니라 이에 유용한 박테리아 세포 및 우리딘 디포스페이트(UDP)-의존성 당전이(UGT) 효소를 제공한다. 다른 양태 및 구현예에서, 본 개시 내용은 미생물 배양물 또는 무세포 반응물로부터 글리코시드 생성물을 고수율 및/또는 고순도로 회수하는 방법을 제공한다. 다양한 양태 및 구현예에서, 본 개시 내용은 원하는 기질을 당화시킨 후, 당화 생성물을 고수율 및/또는 고순도로 회수하는 것과 관련된 전세포 생물전환(whole cell bioconsersion) 공정을 제공한다.
일 양태에서, 본 발명은 당화 생성물을 제조하기 위한 박테리아 세포 및 방법을 제공한다. 특히, 본 개시내용은 전세포의 생물전환 공정에 따라 원하는 기질을 당화시키기 위한 하나 이상의 UGT 효소를 발현하는 박테리아 세포를 제공한다. 일부 구현예에서, 박테리아 세포는 하나 이상의 재조합 수크로스 합성효소(synthase)를 발현한다. 수크로스 합성효소의 발현은 공급된 기질의 전세포 당화를 극적으로 향상시킬 수 있다. 대안적으로 또는 추가로, 미생물 세포에는 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형이 포함된다. 박테리아 세포는 당화용 기질(substrate for glycosylation)의 존재 하에서 배양되고, 당화 생성물은 선택적으로 본원에 기재된 회수 공정을 사용하여 회수된다.
전세포 생물전환 시스템은 세포가 UDP-당 보조인자를 재생하므로, 무-세포 시스템에 비해 유리하다. 본 발명의 구현예에서, 촉매화(당화)는 살아있는 박테리아 세포에서 수행되며, UDP-포도당 보조인자의 재활용은 UDP-포도당 재생을 위한 효소를 공급하거나 값비싼 기질을 공급할 필요없이 세포 대사를 사용하여 일어난다. E. 콜리(coli)를 포함한 다양한 박테리아 종들이 본 개시 내용에 사용된다.
일부 구현예에서, 박테리아 세포는 재조합 수크로스 합성효소를 발현하고, 박테리아 세포는 수크로스의 존재 하에서 배양될 수 있다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 1 내지 12로부터 선택된 아미노산 서열과 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 미생물 세포는 UDP-포도당의 이용가능성을 증가시키는 하나 이상의 유전자 변형, 예컨대 UDP-포도당을 소모하는 효소를 암호화하는 유전자의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 제거하거나 없앨 수 있는 다른 UDP-포도당 싱크(sink)는, 지질의 당화 및 LPS 생합성에 관여하는 유전자, 및 운데카프레닐-디포스페이트(UPP)를 당화시키는데 관여하는 유전자의 제거, 또는 활성 또는 발현의 감소를 포함한다. 이러한 구현예 및 다른 구현예에서, 박테리아 세포는 전구체를 UDP-포도당으로 소모하는 효소를 암호화하는 유전자의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 이러한 구현예 및 다른 구현예에서, 세포는 포도당-6-포스페이트를 UDP-포도당으로 전환시키는데 관여하는 효소를 암호화하는 하나 이상의 유전자의 과다 발현, 또는 이의 활성 증가를 갖는다. 대안적으로 또는 추가로, 미생물 세포에는 포도당의 수송을 증가시키는 유전자 변형이 하나 이상 있을 수 있다. 대안적으로 또는 추가로, 미생물 세포에는 UTP의 생산 및 재활용을 증가시키는 유전자 변형이 하나 이상 있을 수 있다. 대안적으로 또는 추가로, 미생물 세포에는 UDP 생산을 증가시키는 유전자 변형이 하나 이상 있다. 대안적으로 또는 추가로, 미생물 세포에는 포도당 흡수의 조절을 제거하거나 감소시키는 유전자 변형이 하나 이상 있다. 대안적으로 또는 추가로, 미생물 세포에는 포도당-1-포스페이트의 탈인산화를 감소시키는 유전자 변형이 하나 이상 있다. 대안적으로 또는 추가로, 미생물 세포에는 포도당-1-포스페이트의 TDP-포도당으로의 전환을 감소시키는 유전자 변형이 하나 이상 있다. 대안적으로 또는 추가로, 미생물 세포에는 포도당-1-포스페이트로부터 ADP-포도당으로의 전환을 감소시키는 유전자 변형이 하나 이상 있다.
다양한 구현예에서, 당화용 기질은 식물 추출물 또는 이의 분획으로 제공되거나, 합성이나 생합성 공정에 의해 생산된다. 예시적인 기질은 다양한 2차 대사산물, 예컨대 테르페노이드 또는 테르페노이드 글리코시드, 플라보노이드 또는 플라보노이드 글리코시드, 칸나비노이드 또는 칸나비노이드 글리코시드, 폴리케티드 또는 폴리케티드 글리코시드, 스틸베노이드 또는 스틸베노이드 글리코시드, 및 폴리페놀 또는 폴리페놀 글리코시드로부터 선택된 것들을 포함한다. 식물 추출물은 분획화되거나, 아니면 원하는 기질이 풍부할 수 있다. 일부 구현예에서, 기질은 테르페노이드 글리코시드, 예컨대 스테비올 또는 스테비올 글리코시드, 또는 모그롤 또는 모그롤 글리코시드를 포함한다. UGT 효소뿐만 아니라 (원하는 기질이 풍부한 분획으로 포함된) 관련 기질을 선택하여, 원하는 당화 생성물을 생산할 수 있다. 일부 구현예에서, 당화 생성물은 그 중에서도 하나 이상의 스테비올 글리코시드, 예컨대 RebM, RebE, RebD, RebB 및/또는 RebI, 또는 모그롤 글리코시드, 예컨대 mog. IV, mog. IVA, mog. V, mog. VI, isomog. V 및/또는 시아메노시드를 포함한다.
다른 양태 및 구현예에서, 본 발명은 테르페노이드 글리코시드 기질을 포함한, 본원에 기재된 박테리아 세포 및 방법과 관련된 기질의 당화 생산성이 높은 조작된 UDP-의존성 당전이(UGT) 효소를 제공한다. 일부 구현예에서, 상기 조작된 UGT 효소는 서열 번호: 13과 적어도 약 70%의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 치환을 하나 이상 갖는 아미노산 서열을 포함한다. 다른 구현예에서, 상기 UGT 효소는 서열 번호: 14와 적어도 약 70%의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 치환을 하나 이상 갖는 아미노산 서열을 포함한다. 또 다른 구현예에서, 상기 UGT 효소는 서열 번호: 15와 적어도 약 70%의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 치환을 하나 이상 갖는 아미노산 서열을 포함한다.
다른 양태 및 구현예에서, 본 발명은 모그롤 또는 모그롤 글리코시드 기질의 당화를 위한 UGT 효소(이를 발현하는 미생물 세포 포함)를 제공한다. 이러한 양태 및 구현예에서, 상기 방법은 기질을 UDP-당의 존재 하에 UGT 효소와 접촉시키는 단계를 포함한다. UGT 효소는 이하의 것들로부터 선택된 아미노산 서열과 적어도 약 80%의 서열 동일성을 갖는 아미노산 서열을 포함한다: 서열 번호: 84, 서열 번호: 80, 서열 번호: 46, 서열 번호: 83, 서열 번호: 82, 서열 번호: 73, 서열 번호: 72, 서열 번호: 78, 서열 번호: 54, 서열 번호: 74, 서열 번호: 75, 서열 번호: 76, 서열 번호: 13, 서열 번호: 14, 서열 번호: 15, 서열 번호: 16, 서열 번호: 29 및 서열 번호: 79. 이러한 구현예에서, 모그롤 또는 모그롤 글리코시드 기질은 식물 추출물 또는 이의 분획, 예컨대 나한과 추출물 또는 이의 분획으로 제공될 수 있다. 예를 들어, 기질은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 기질을 하나 이상 포함하거나, 또는 이것이 풍부할 수 있다. 일부 구현예에서, 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI, isomog V 및 시아메노시드 중 하나 이상을 포함할 수 있다. 다양한 구현예에서, UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능할 수 있다.
모그롤 글리코시드의 생산에 대한 일부 구현예에서, 기질은 UGT 효소를 발현하는 세포와 함께 배양된다. 예시적인 미생물 세포는 본원에 기재된 전세포 생물전환 공정에 맞게 조작된 박테리아 세포를 포함한다. 다른 구현예에서, 미생물 세포는 효모 세포이다. 그러나, 또 다른 구현예에서, 기질은 UGT 효소를 포함한 세포 용해물과 함께 인큐베이션되거나, 공지의 기술에 의해 정제된 재조합 UGT 효소와 함께 인큐베이션된다.
일부 양태에서, 본 발명은 글리코시드 생성물의 생산 및 회수 방법을 제공한다. 이러한 구현예에서, 상기 방법은 무-세포 반응물 또는 미생물 배양물에서, 하나 이상의 당 모이어티의 효소적 전이에 의해 당화용 기질을 목표 글리코시드 생성물로 전환시키는 단계를 포함하는데, 이는 선택적으로 본원에 기재된 방법, UGT 효소 및/또는 미생물 균주를 이용할 수 있다. 상기 방법은 반응 및 배양물으로부터 글리코시드 생성물을 회수하는 단계를 추가로 포함하되, 상기 회수 단계는 반응물 또는 배양물의 pH를 약 pH 5 미만으로 또는 pH 10 초과로 조절하는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 포함한다.
기존에, 바이오매스의 제거는 큰 세포 찌꺼기를 제거하고, 하류의 정제를 복잡하게 만들 세포의 파괴를 피하기 위한 회수의 제1 단계이다. 그러나, 본 발명의 구현예에 의하면, 배양 물질은 점도가 매우 높아서, 처리에 어려움이 있다. 바이오매스 또는 효소를 제거하기 전에 본원에 기재된 배양 물질을 처리함으로써, 고순도의 글리코시드 생성물, 매력적인 색상, 용이한 가용화, 무취 및/또는 높은 회수 수율을 포함한 바람직한 품질을 갖는 생성물을 생산하는 것이 가능하다. 예를 들어, 배양물에 대한 초기의 pH 및 온도 조절은 배지의 유체 특징을 변화시킬 수 있고, 디스크 스택 분리기(disc stack separator)의 바이오매스 제거 효율을 증가시킬 수 있다. 또한, 글리코시드 생성물의 용해도 및 나아가 수율은 pH 및/또는 온도 조절, 및/또는 글리코시드 가용화제의 첨가에 의해 실질적으로 증가할 수 있다.
본 발명의 다른 양태 및 구현예는 이하의 상세한 개시 내용과 실시예로부터 명백할 것이다.
도 1은 UGT 효소를 발현하는 조작된 E. 콜리 세포의 2 개의 염색체 변형 ((1) ΔotsA-otsB; (2) ΔotsA-otsB, ugpA의 삽입)에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다.
도 2는 UGT 효소를 발현하는 조작된 E. 콜리 세포에서, 과다 발현된 유전자에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 유전자는 플라스미드 상에서 보완되었다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 보완된 유전자는 좌측에서 우측으로 이하와 같다: (1) 대조군(빈 플라스미드), (2) pgm (서열 번호: 92) 및 galU (서열 번호: 93), (3) pgm (서열 번호: 92), (4) galU (서열 번호: 93), (5) ugpA (서열 번호: 95), (6) ycjU (서열 번호: 94), (7) adk(서열 번호: 96), (8) ndk(서열 번호: 97), (9) pyrH, (10) cmk(서열 번호: 98).
도 3은 UGT 효소를 발현하는 조작된 E. 콜리 세포와 과다 발현된 수크로스 합성효소에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 유전자는 플라스미드 상에서 보완되었다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 보완된 유전자는 좌측에서 우측으로 이하와 같다: (1) 대조군(빈 플라스미드), (2) StSus1(서열 번호: 1), (3) StSus2(서열 번호: 2), (4) StSus2_S11E(서열 번호: 3), (5) AcSuSy(서열 번호: 4), (6) AcSuSy_L637M-T640V(서열 번호: 5), (7) AtSus1(서열 번호: 6), (8) AtSus3(서열 번호: 7), (9) VrSS1(서열 번호: 8), (10) VrSS1_S11E(서열 번호: 9), (11) GmSS(서열 번호: 10), (12) GmSS_S11E(서열 번호: 11), (13) AtSusA(서열 번호: 12).
도 4는 UGT 효소를 발현하는 조작된 E. 콜리 세포와 다양한 유전자 녹아웃에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 결실은 (좌측에서 우측으로) 이하와 같다: (1) ΔotsA, (2) Δugd, (3) ΔrfaQPSBIJ, (4) ΔyfdGHI, (5) ΔwcaJ 및 (6) ΔglgC.
도 5은 서열 번호: 14 (MbUGT1,2.3)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 13)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 6은 서열 번호: 15 (MbUGT1,2.4)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 14)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 7은 서열 번호: 16 (MbUGT1,2.5)에 의해 정의된 UGT 효소를 발현하는 조작된 E. 콜리 세포에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 15)의 스테비올 글리코시드의 전환율 %에 대한 것이다.
도 8은 조작된 E. 콜리 생물전환 균주에서, 서열 번호: 15 (MbUGT1,2.4)의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 E와 레바우디오시드 D의 혼합물로의 생물전환, 및 서열 번호: 25 (MbUGT1-3.3)의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 I로의 생물전환을 나타낸다.
도 9는 조작된 E. 콜리 생물전환 균주에서, 서열 번호: 31 및 서열 번호: 99의 UGT 효소의 발현에 의한 스테비아 잎 추출물로부터 레바우디오시드 B와 스테비올비오시드의 혼합물로의 생물전환을 나타낸다.
도 10은 스테비올 글리코시드의 회수를 위한 종래의 공정을 나타내는 흐름도이다. 전형적으로, 먼저 바이오매스를 제거하여 큰 세포 찌꺼기, 효소 및 온전한 전세포를 제거하고, 원하는 생성물의 정제를 용이하게 한다.
도 11은 본 발명의 구현예에 의한 글리코시드 생성물의 회수에 대한 예시적인 공정을 나타내는 흐름도인데. 바이오매스를 제거하기에 앞서 pH 및/또는 온도의 조절 및/또는 가용화제의 첨가를 이용하여, 공정을 위한 배양 물질의 물리적 특성을 개선시킨 다음, 바이오매스의 제거는 용이하면서도 글리코시드 생성물의 수율을 증가시킨다.
도 12는 원심분리 후 수성 배지로부터의 바이오매스의 제거에 대한 다양한 처리의 효과를 나타낸다. 펠렛의 치밀도와 상청액의 투명도는 바이오매스의 제거의 용이함을 나타내는 지표로서 작용한다. 튜브는 좌측에서 우측으로 이하와 같다: (1) 22℃ (실온), pH 6.64; (2) 22℃ (실온), 에탄올; (3) 22℃ (실온), pH 3.78, + 에탄올; (4) 22℃ (실온), pH 3.78; (5) 70℃, pH 6.64; (6) 70℃, 에탄올; (7) 70℃, pH 3.78, + 에탄올; 및 (8) 70℃, pH 3.78.
도 13은 재결정화 전의 용액의 여과가 순도에 영향을 주고, 필터 물질의 선택이 최종 생성물의 품질에 유의한 영향을 미친다는 것을 나타낸다. 도 13은 재결정화 전에 용액을 여과하기 위한 폴리프로필렌(PP)(좌측) 및 폴리에테르술폰(PES)(우측) 물질의 사용을 비교한다. 고순도(>98%) RebM 최종 생성물은 프로필렌 글리콜에 10 wt%의 농도로 용해된다. PP 필터를 사용한 경우 매우 뿌연 용액을 얻지만, PES 필터 물질의 사용 시 투명한 용액을 얻는다.
도 14는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 물 중 RebM에 대해 결정할 때 준안정성 영역(metastable zone)의 너비를 정의하여 결정 성장을 조절할 수 있게 한다.
도 15a, 15b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 7의 67% 물/33% 에탄올에서 RebM에 대해 결정할 때, 준안정성 영역의 너비를 정의하여 용매계에서의 결정 성장을 조절할 수 있게 한다. 도 15a는 0% 글리세롤이나, 도 15b는 0.5% 글리세롤을 포함한다.
도 16a, 16b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 11의 67% 물/33% 에탄올 중 RebM에 대해 결정할 때, 준안정성 영역의 너비를 정의하여, 이 용매계에서의 결정 성장을 조절할 수 있게 한다. 도 16a는 0% 글리세롤이나, 도 16b는 0.5% 글리세롤을 포함한다.
도 17a는 효소 1(서열 번호: 71) 또는 효소 2(서열 번호: 33) 중 하나를 발현하는 조작된 E. 콜리 균주를 사용한, 모그롤로부터 모그로시드 화합물(mog IIE, mog-IE, 및 mog-IA)로의 생물전환을 나타낸다. 도 17b는 효소 1(서열 번호: 71), 효소 3(서열 번호: 81), 효소 4(서열 번호: 82) 및 효소 5(서열 번호: 83)를 발현하는 조작된 E. 콜리 균주를 사용한, 모그롤로부터 모그로시드-IA로의 생물전환을 나타낸다.
도 18a도 18b는 효소 1(서열 번호: 84), 효소 2(서열 번호: 71) 또는 효소 3(서열 번호: 33) 중 하나를 발현하는 조작된 E. 콜리 균주를 사용한, mog-IA(도 18a) 또는 mog-IE(도 18b)로부터 mog-IIE로의 생물전환을 나타낸다.
도 19는 효소 1(서열 번호: 72), 효소 2(서열 번호: 54) 또는 효소 3(서열 번호: 13)을 발현하는 조작된 E. 콜리 균주에 의한, Mog II-E로부터 Mog-III 또는 시아메노시드의 생산을 나타낸다.
도 20은 효소 1(서열 번호: 73)을 발현하는 E. 콜리 세포에 의한 MogII-A2의 시험관내 생산을 나타낸다.
도 21은 스테비올 및 스테비올 글리코시드 중간생성물에 대한 UGT 효소의 작용으로 생산된 당화 생성물을 나타낸다.
도 22는 Mog. V에 대한 당화 경로를 나타낸다. 버블 구조는 상이한 모그로시드들을 나타낸다. 백색의 4-환 코어는 모그롤을 나타낸다. 각 구조 아래의 숫자는 구체적인 당화 모그로시드를 가리킨다. 검정색 원은 C3 또는 C24 당화를 나타낸다. 암회색의 수직 원은 1,6-당화를 나타낸다. 담회색의 수평 원은 1,2-당화를 나타낸다. 약칭: Mog, 모그롤; sia, 시아메노시드.
상세한 설명
다양한 양태 및 구현예에서, 본 개시 내용은 당화 생성물의 제조 방법, 뿐만 아니라 이에 유용한 박테리아 세포 및 우리딘 디포스페이트(UDP)-의존성 당전이(UGT) 효소를 제공한다. 다른 양태 및 구현예에서, 본 개시 내용은 미생물 배양물 또는 무세포 반응물로부터 글리코시드 생성물을 고수율 및/또는 고순도로 회수하는 방법을 제공한다. 다양한 양태 및 구현예에서, 본 개시 내용은 원하는 기질을 당화시킨 후, 당화 생성물을 고수율 및/또는 고순도로 회수하는 것과 관련된 전세포 생물전환 공정을 제공한다.
일 양태에서, 본 발명은 당화 생성물을 제조하기 위한 박테리아 세포 및 방법을 제공한다. 상기 박테리아 세포는 원하는 기질을 당화시키기 위해 하나 이상의 UGT 효소를 발현한다. 일부 구현예에서, 상기 박테리아 세포는 하나 이상의 재조합 수크로스 합성효소를 추가로 발현한다. 수크로스 합성효소의 발현은 공급된 기질의 전세포 당화를 극적으로 향상시킬 수 있다(도 3 참고). 대안적으로 또는 추가로, 상기 박테리아 세포에는 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형이 포함된다. 상기 박테리아 세포는 당화용 기질의 존재 하에서 배양되고, 당화 생성물은 선택적으로 본원에 기재된 회수 공정을 사용하여 회수된다.
전세포 생물전환 시스템은 세포가 UDP-포도당 보조인자를 재생하므로 당화 반응에 대해 무-세포 시스템보다 유리하다. 이것은 세포 용해로부터 생성된 효소 또는 세포 외부로의 분비를 사용하는 공정과 반대인데, 이 공정은 외인성 UDP-포도당의 공급, 또는 UDP-포도당 전구체 또는 UDP-포도당의 재생 기작, 또는 UDP-포도당 재생 효소계가 필요하다. 본 발명의 구현예에서, 촉매화(당화)는 살아있는 박테리아 세포에서 수행되며, UDP-포도당 보조인자의 재활용은 UDP-포도당 재생을 위한 효소의 공급이나 값비싼 기질의 공급이 없이도 세포 대사를 사용하여 일어난다. 에스체리쉬아(Escherichia), 바실러스(Bacillus), 로도박터(Rhodobacter), 자이모모나스(Zymomonas) 또는 슈도모나스(Pseudomonas) 종을 포함한 다양한 박테리아 종이 본 개시 내용에서 사용될 수 있다. 일부 구현예에서, 박테리아 세포는 에스체리쉬아 콜리(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 로도박터 캅슐라투스(Rhodobacter capsulatus), 로도박터 스패로이데스(Rhodobacter sphaeroides), 자이모모나스 모빌리스(Zymomonas mobilis) 또는 슈도모나스 푸티다(Pseudomonas putida)이다. 예시적인 구현예에서, 박테리아 세포는 E. 콜리이다.
일부 구현예에서, 박테리아 세포는 재조합 수크로스 합성효소를 발현한다. 일부 구현예에서, 수크로스 합성효소를 발현하는 박테리아 세포는 수크로스의 존재 하에서 배양된다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 1 내지 12로부터 선택된 아미노산 서열과 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 도 3에 도시된 바와 같이, 박테리아 세포에서의 수크로스 합성효소의 발현은 전세포에 공급된 기질의 당화를 극적으로 개선시킨다. 다양한 구현예에서, 수크로스 합성효소는 서열 번호: 1 내지 12로부터 선택된 아미노산 서열과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 2와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 2에 대한 S11E 또는 S11D 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 3과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 3의 아미노산 서열에 대해, L637(예를 들어, (L637M) 및 T640(예를 들어, T640V, T640L, T640I, 또는 T640A) 중 하나 이상에서 아미노산 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 5와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 6과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 7과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 7에 대한 S11E 또는 S11D 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 8과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 8에 대한 S11E 또는 S11D 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 9와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 10과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 수크로스 합성효소는 서열 번호: 10에 대한 S11E 또는 S11D 치환을 포함한다.
일부 구현예에서, 수크로스 합성효소는 서열 번호: 11과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
효소의 3-차원 구조와, 관련 활성 부위, 기질-결합 부위 및 다른 상호작용 부위의 위치에 대한 지식이 있으면, 유도체를 합리적으로 설계하고, 특정 변화의 표현형에 대한 기계적인 퉁찰력을 제공할 수 있다. 식물의 수크로스 합성효소는 매우 보존된 S11 및 유사 위치가 인산화될 때, 활성이 증가하는 것으로 보였다. 일부 구현예에서, 수크로스 합성효소는 S11E 또는 S11D 돌연변이를 포함하는데, 이는 음전하의 포스페이트가 발견될 곳에 음전하를 위치시켜, 인산화를 모방한다. 수크로스 합성효소에 대한 다른 변형은 공공의 이용가능한 구조, 예컨대 문헌[Stein O. and Granot D., An Overview of Sucrose Synthases in Plants, Front Plant Sci. 2019; 10: 95]에 기재되거나, 이에 참조된 것들에 의해 안내될 수 있다.
대안적으로 또는 추가로, 박테리아 세포는 UDP-당(예를 들어, UDP-포도당)의 이용가능성을 개선시키는 유전자 변형을 하나 이상 포함하는데, 이는 도 1, 2 및 4에 나타난 바와 같이, 원하는 기질을 당화시키기 위한 전세포 생물전환을 개선시킨다. 대수 성장기의 E. 콜리에서 야생형 UDP-포도당의 수준은 약 2.5 mM이다 (Bennett BD, Kimball EH, Gao M, Osterhout R, Van dien SJ, Rabinowitz JD. Absolute metabolite concentrations and implied enzyme active site occupancy in Escherichia coli. Nat Chem Biol. 2009;5(8):593-9.). 일부 구현예에서, 숙주 세포에 대한 유전자 변형은 (예를 들어, UGT 효소의 재조합 발현이 없는) 대수 성장기의 세포에서 UDP-포도당을 예를 들어 적어도 약 5 mM, 또는 적어도 약 10 mM로 증가시키도록 조작된다.
일부 구현예에서, 미생물 세포는 UDP-포도당을 소모하는 효소를 암호화하는 유전자의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 예를 들어, 박테리아 세포는 ushA (UDP-당 하이드로라제(hydrolase) 및/또는 (UDP-포도당으로부터 UDP-갈락토스의 생합성에 관여하는) galE, galT, galK 및 galM 중 하나 이상, 또는 박테리아 종에서의 이의 병렬상동체(ortholog)의 결실, 불활성화, 또는 활성 또는 발현의 감소를 가질 수 있다. 일부 구현예에서, galETKM 유전자는 불활성화되거나, 결실되거나, 발현 또는 활성이 실질적으로 감소된다. 대안적으로 또는 추가로, 박테리아 세포는 E. 콜리 otsA (트레할로스-6-포스페이트 합성효소) 또는 박테리아 종에서의 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 대안적으로 또는 추가로, 미생물 세포는 E. 콜리 ugd (UDP-포도당 6-탈수소화효소(dehydrogenase)) 또는 박테리아 종에서의 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. otsA 및 ugd의 활성의 감소 또는 제거는 각각 트레할로스 또는 UDP-글루쿠로니데이트로의 UDP-포도당의 싱크를 없애거나, 감소시킬 수 있다.
제거하거나 없앨 수 있는 다른 UDP-포도당의 싱크는, 지질의 당화 및 LPS 생합성에 관여하는 유전자, 및 운데카프레닐-디포스페이트(UPP)을 당화하는데 관여하는 유전자의 제거, 또는 활성 또는 발현의 감소를 포함한다. 지질의 당화 또는 LPS 생합성에 관여하는 유전자는, E. 콜리 waaG (지질다당류 당전이효소 1), E. 콜리 waaO (UDP-D-포도당:(글리코실)LPS α-1,3-당전이효소)), 및 E. 콜리 waaJ (UDP-포도당:(글리코실)LPS α-1,2-당전이효소))를 포함한다. 운데카프레닐-디포스페이트 (UPP)의 당화에 관여하는 유전자는, E. 콜리 yfdG (잠정적인 박토프레놀-연결 포도당 트랜스로카제(translocase)), E. 콜리 yfdH (박토프레놀 당전이효소), E. 콜리 yfdI (혈청형 특이적인 당전이효소), 및 E. 콜리 wcaJ (운데카프레닐-포스페이트 포도당 포스포트랜스퍼라제(phosphotransferase))를 포함한다. 이러한 하나 이상의 유전자 산물 (또는 박테리아 세포에서의 상응하는 병렬상동체)의 결실, 불활성화, 또는 활성 또는 발현의 감소는, UDP-포도당의 이용가능성을 증가시킬 수 있다.
이러한 또는 다른 구현예에서, 박테리아 세포는 전구체를 UDP-포도당으로 소모하는 효소를 암호화하는 유전자의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 예를 들어, 일부 구현예에서, 박테리아 세포는 pgi (포도당-6 포스페이트 이소머라제), 또는 숙주 세포의 박테리아 종에서의 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다.
이러한 또는 다른 구현예에서, 세포는 포도당-6-포스페이트를 UDP-포도당으로 전환시키는데 관여하는 효소를 암호화하는 하나 이상의 유전자의 과다 발현, 또는 이의 활성 증가를 갖는다. 예를 들어, pgm (포스포글루코뮤타제(phosphoglucomutase)) 및/또는 galU (UTP-포도당-1-포스페이트 우리딜릴트랜스퍼라제(uridylyltransferase) (또는 이들의 병렬상동체나 유도체)는 과다 발현되거나, 효소의 생산성을 증가시키도록 변형될 수 있다. 대안적으로 또는 추가로, 포도당-6-포스페이트를 포도당-1-포스페이트로 전환시키는 E. 콜리 ycjU (β-포스포글루코뮤타제), 및 포도당-1-포스페이트를 UDP-포도당으로 전환시키는 비피도박테리움 비피둠(Bifidobacterium bifidum) ugpA, 또는 이 효소의 병렬상동체나 유도체는, 과다 발현되거나, 효소의 생산성을 증가시키도록 변형될 수 있다.
대안적으로 또는 추가로, 미생물 세포에는 포도당의 수송을 증가시키는 유전자 변형이 하나 이상 있다. 이러한 변형은 E. 콜리 galP (갈락토스:H+ 공동 수송체(symporter)) 및 E. 콜리 glk (글루코키나제(glucokinase))의 발현이나 활성의 증가, 또는 대안적으로 자이모모나스 모빌리스 glf 및 E. 콜리 glk, 또는 병렬상동체, 또는 이러한 유전자들의 조작된 유도체의 발현 증가를 포함한다.
대안적으로 또는 추가로, 미생물 세포에는 UTP 생산 및 재활용을 증가시키는 유전자 변형이 하나 이상 있다. 이러한 변형은 E. 콜리 adk (아데닐레이트 키나제), 또는 E. 콜리 ndk (뉴클레오시드 디포스페이트 키나제), 또는 이러한 효소의 병렬상동체, 또는 조작된 유도체의 발현 또는 활성의 증가를 포함한다.
대안적으로 또는 추가로, 미생물 세포에는 UDP 생산을 증가시키는 유전자 변형이 하나 이상 있다. 이러한 변형은 E. 콜리 upp (우라실 포스포리보실트랜스퍼라제(phosphoribosyltransferase)), E. 콜리 dctA (C4 디카르복실레이트/오로테이트:H+공동 수송체), E. 콜리 pyrE (오로테이트 포스포리보실트랜스퍼라제), E. 콜리 pyrF (오로티딘-5'-포스페이트 디카르복실라제), E. 콜리 pyrH (UMP 키나제), 및 E. 콜리 cmk (시티딜레이트 키나제) 중 하나 이상의 과다 발현 또는 활성의 증가를 포함하며, 여기에는 이들의 병렬상동체 또는 조작된 유도체도 포함된다. 예를 들어, 일부 구현예에서, 미생물 세포는 upp, pyrH 및 cmk, 또는 이들의 병렬상동체 또는 조작된 유도체를 과다 발현하거나, 또는 이의 활성을 증가시킨다. 대안적으로, 미생물 세포는 dctA, pyre, pyrH 및 cmk, 또는 이들의 병렬상동체 또는 조작된 유도체를 과다 발현하거나, 또는 이의 활성을 증가시킨다.
대안적으로 또는 추가로, 미생물 세포에는 포도당 흡수의 조절을 제거하거나 감소시키는 유전자 변형이 하나 이상 있다. 예를 들어, 미생물 세포는 E. 콜리의 작은 조절 RNA인 sgrS를 결실시키거나, 불활성화시키거나, 또는 이의 발현을 감소시킬 수 있다.
대안적으로 또는 추가로, 미생물 세포에는 포도당-1-포스페이트의 탈인산화를 감소시키는 유전자 변형이 하나 이상 있다. 예시적인 변형은 E. 콜리 agp (포도당-1-포스파타제), E. 콜리 yihX (α-D-포도당-1-포스페이트 포스파타제), E. 콜리 ybiV (당 포스파타제), E. 콜리 yidA (당 포스파타제), E. 콜리 yigL (인당(phosphosugar) 포스파타제) 및 E. 콜리 phoA (알칼라인 포스파타제) 중 하나 이상, 또는 박테리아 세포에서의 이들의 병렬상동체의 결실, 불활성화, 또는 발현이나 활성의 감소를 포함한다.
대안적으로 또는 추가로, 박테리아 세포는 포도당-1-포스페이트로부터 TDP-포도당으로의 전환을 감소시키는 하나 이상의 유전자 변형을 가질 수 있다. 예시적인 변형은 E. 콜리 rffH (dTDP-포도당 피로포스포릴라제(pyrophosphorylase)), 및 E. 콜리 rfbA (dTDP 포도당 피로포스포릴라제), 또는 박테리아 세포에서의 이들의 병렬상동체의 결실, 불활성화, 또는 발현이나 활성의 감소를 포함한다.
대안적으로 또는 추가로, 박테리아 세포는 포도당-1-포스페이트로부터 ADP-포도당으로의 전환을 감소시키는 유전자 변형을 하나 이상 가질 수 있다. 예시적인 변형은 E. 콜리 glgC (포도당-1-포스페이트 아데닐릴트랜스퍼라제 (adenylyltransferase)), 또는 박테리아 세포에서의 이의 병렬상동체의 결실, 불활성화, 또는 발현이나 활성의 감소를 포함한다.
예를 들어, 일부 구현예에서, ushA (UDP-당 디포스파타제) 및 galETKM 또는 이들의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소되고; pgi (포도당-6-포스페이트 이소머라제) 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소되고; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94) 또는 병렬상동체는 과다 발현되거나, 야생형 효소에 비해 활성이 증가된 이의 유도체가 발현되고; E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95) 또는 병렬상동체는 과다 발현되거나, 야생형 효소에 비해 활성이 증가된 이의 유도체가 발현된다.
박테리아 균주가 E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94) 또는 이들의 병렬상동체를 과다발현하거나, 또는 야생형 효소보다 활성이 높은 유도체를 발현하거나; 또는 E. 콜리 galU (서열 번호: 93)를 과다발현하거나, 또는 비피도박테리움 비피둠 ugpA (서열 번호: 95) 또는 이의 병렬상동체나 (예를 들어, 야생형 효소보다 활성이 높은) 유도체를 발현하는 다양한 구현예에서, 보완 유전자들은 각각 서열 번호: 92, 서열 번호: 94, 서열 번호: 93, 또는 서열 번호: 95와 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97% 동일한 아미노산 서열을 포함할 수 있다.
예를 들어, 일부 구현예에서, 박테리아 세포는 pgm 또는 이의 병렬상동체나 유도체(예를 들어, 야생형보다 활성이 높은 유도체), 및 선택적으로 galU 또는 이의 병렬상동체나 유도체(예를 들어, 야생형보다 활성이 높은 유도체)의 과다 발현을 포함한다. 다른 일부 구현예에서, 박테리아 세포는 ushA 또는 이의 병렬상동체, 및/또는 galE, galT, galK 및 galM 중 어느 하나, 또는 이들의 병렬상동체(들)의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다. 예를 들어, galETKM 또는 이의 병렬상동체는 불활성화되거나, 결실되거나, 발현 또는 활성이 감소될 수 있다. 일부 구현예에서, pgi (포도당-6-포스페이트 이소머라제) 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소된다.
대안적으로 또는 추가로, 박테리아 세포는 otsA (트레할로스-6-포스페이트 합성효소) 또는 이들의 병렬상동체 및/또는 otsB (트레할로스-포스페이트 포스파타제) 또는 이들의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다.
대안적으로 또는 추가로, 박테리아 세포는 ugd (UDP-포도당 6-탈수소화 효소) 또는 이의 병렬상동체; rfaQ-G-P-S-B-I-J 또는 이의 병렬상동체(들); yfdG-H-I 또는 이의 병렬상동체(들); wcaJ 또는 이의 병렬상동체; 및 glgC 또는 이의 병렬상동체 중 하나 이상의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는다.
예시적인 구현예에서, 박테리아 세포는 E. 콜리 ycjU (β-포스포글루코뮤타제)(서열 번호: 94) 또는 이의 병렬상동체 또는 유도체, 비피도박테리움 비피둠 ugpA (UTP-포도당-1-포스페이트 우리딜릴트랜스퍼라제)(서열 번호: 95) 또는 이의 병렬상동체 또는 유도체, E. 콜리 adk (아데닐레이트 키나제)(서열 번호: 96) 또는 이의 병렬상동체 또는 유도체, E. 콜리 ndk (뉴클레오시드 디포스페이트 키나제)(서열 번호: 97) 또는 이의 병렬상동체 또는 유도체, 및 E. 콜리 cmk (시티딘 모노포스페이트 키나제)(서열 번호: 98) 또는 이의 병렬상동체 또는 유도체 중 하나 이상의 과다 발현, 또는 활성 또는 발현의 증가를 갖는다. 다양한 구현예에서, 유도체 효소는 야생형 효소보다 활성이 더 높도록 조작될 수 있다. 보완 효소는 각각 서열 번호: 94, 서열 번호: 95, 서열 번호: 96, 서열 번호: 97, 또는 서열 번호: 98과 적어도 약 50%, 또는 적어도 약 60%, 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97% 동일한 아미노산 서열을 포함한다.
UDP-당의 이용가능성을 개선시키는 박테리아 세포에 대한 다른 변형은, US 2020/0087692에 기재되어 있으며, 상기 문헌은 전문이 본원에 참조로서 포함된다.
다양한 구현예에서, 당화용 기질은 식물 추출물 또는 이의 분획으로 제공되거나, 합성 또는 생합성 공정에 의해 생산된다. 예시적인 기질은 다양한 2차 대사산물, 예컨대 테르페노이드 또는 테르페노이드 글리코시드, 플라보노이드 또는 플라보노이드 글리코시드, 칸나비노이드 또는 칸나비노이드 글리코시드, 폴리케티드 또는 폴리케티드 글리코시드, 스틸베노이드 또는 스틸베노이드 글리코시드, 및 폴리페놀 또는 폴리페놀 글리코시드로부터 선택된 것들을 포함한다. 식물 추출물은 분획화되거나, 아니면 원하는 기질이 풍부할 수 있다.
일부 구현예에서, 기질은 테르페노이드 및/또는 테르페노이드 글리코시드, 예컨대 스테비올 또는 스테비올 글리코시드, 또는 모그롤 또는 모그롤 글리코시드("모그로시드")를 포함한다. 일부 구현예에서, 기질은 대개 0 내지 약 4 개의 글리코실 기를 가지며, 글루코실, 갈락토실, 만노실, 자일로실 및/또는 람노실 기를 포함할 수 있다. 다양한 구현예에서, 글리코실 기는 주로 글루코실이다. 전세포 생물전환 후, 다양한 구현예에서, 당화 생성물은 적어도 4 개, 적어도 5 개, 적어도 6 개, 또는 적어도 7 개의 글리코실 기(예를 들어, 글루코실 기)를 가질 것이다. 다양한 구현예에서, 전세포 생물전환은 박테리아 세포에 의한 기질의 적어도 2 회의 당화 반응에 관한 것이다. 일부 구현예에서는, (UGT에 의해 촉매화된 역반응의 경우) 전세포 생물전환으로 인해 기질이 단일 당화되거나 또는 탈당화된다.
다양한 구현예에서, 기질은 스테비아 추출물 또는 이의 분획으로 제공될 수 있는데, 이는 목표 기질이 풍부할 수 있다. 예를 들어, 스테비아 잎 추출물은 스테비올, 스테비오시드, 스테비올비오시드, 레바우디오시드 A, 둘코시드 A, 둘코시드 B, 레바우디오시드 C, 및 레바우디오시드 F 중 하나 이상을 포함하거나, 이들이 풍부할 수 있다. 일부 구현예에서, 상기 추출물 또는 이의 분획 내 스테비올 글리코시드의 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 75%는 스테비오시드, 스테비올비오시드 및 레바우디오시드 A 중 하나 이상을 포함한다.
UGT 효소뿐만 아니라 (원하는 기질이 풍부한 식물 추출물의 분획으로 포함된) 관련 기질을 선택하여, 원하는 당화 생성물을 생산할 수 있다. 일부 구현예에서, 적어도 하나의 UGT 효소는, 서열 번호: 13 내지 84, 및 99 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 다양한 구현예에서, 적어도 하나의 UGT 효소는 서열 번호: 13 내지 84, 99 중 어느 하나와 적어도 약 80%, 또는 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 본 개시 내용의 구현예에 의하면, UGT 효소는 분비 또는 수송 신호 없이 발현되고, 막 고정(anchoring) 도메인을 함유하지 않는다.
효소의 3-차원 구조와, 관련 활성 부위, 기질-결합 부위 및 다른 상호작용 부위의 위치에 대한 지식이 있으면, 유도체를 합리적으로 설계하고, 특정 변화의 표현형에 대한 기계적 통찰력을 제공할 수 있다. 식물 UGT는 매우 보존된 2 차 및 3차 구조를 공유하지만, 아미노산 서열의 동일성이 비교적 낮다. 문헌[Osmani 등, Substrate specificity of plant UDP-dependent glycosyltransferases predicted from crystal structures and homology modeling, Phytochemistry 70 (2009) 325-347]. UGT의 당 수용체 및 당 공여체는 N-말단 도메인과 C-말단 도메일 사이에 형성된 갈라진 틈(cleaft)에 수용된다. 1 차 서열의 몇몇 영역은 구조적으로 보존된 도메인뿐만 아니라 아미노산 서열 및 서열 길이가 둘 다 다른 루프 영역도 포함하는 기질 결합 포켓을 형성하는 데에도 기여한다.
일부 구현예에서, 기질은 테르페노이드 글리코시드이고, 일부 구현예에서는 스테비올 글리코시드 또는 모그로시드를 포함할 수 있다. 테르페노이드 또는 테르페노이드 글리코시드 스캐폴드에 대한 당전이효소 활성을 갖는 다양한 UGT 효소가 본원에 기재되어 있는데, 여기에는 서열 번호: 13 내지 39, 46, 54, 60, 71 내지 84, 및 99에 의해 정의된 UGT 효소가 포함된다. 표 1, 8 및 9를 참고한다.
예를 들어, 일부 구현예에서, 당화 생성물은 레바우디오시드 (스테비올 글리코시드)이다. 이러한 구현예에서, UGT 효소는 스테비올 코어의 C13 및/또는 C19 하이드록실에서의 1 차 당화; C13 및/또는 C19 1 차 글리코실 기의 1-2 분지형 당화; 및 C13 및/또는 C19 1 차 글리코실 기의 1-3 분지형 당화 중 하나 이상이 가능하다. 도 21를 참고한다. 일부 구현예에서, UGT 효소는 서열 번호: 13 내지 32 및 84 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 아미노산 서열을 포함하는 효소로부터 선택된다.
스테비올 및 스테비올 글리코시드의 당화(RebM의 생합성 포함)를 위한 UGT 효소는 US 2017/0332673 및 2020/0087692에 개시되어 있는데, 상기 문헌은 전문이 본원에 참고로서 포함된다. 예시적인 UGT 효소는 이하의 표 1에 나열되어 있다:
표 1: 스테비올 글리코시드 생산을 위한 예시적인 UGT 효소
일부 구현예에서, 당화 생성물은 모그로시드이다. 다양한 구현예에서, UGT 효소는 모그롤 코어의 C3 및/또는 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 분지형 당화; 및/또는 C3 및/또는 C24 1 차 글리코실 기의 1-6 분지형 당화가 가능하다. 이러한 구현예에 유용한 UGT 효소는 표 8 및 9에 나타나 있다. 일부 구현예에서, UGT 효소는 서열 번호: 13 내지 17, 29, 33 내지 39, 46, 54, 60, 71 내지 80, 및 82 내지 84 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 아미노산 서열을 포함하는 효소로부터 선택된다.
효소의 아미노산 서열이 변하면, 활성이 바뀌거나, 또는 측정가능한 효과가 없어질 수 있다. 측정가능한 효과가 없는 침묵적인 변화(Silent change)는 종종 활성 부위 및 기질-결합 부위로부터 떨어진 위치에 있는 용매-노출 표면의 보존적 치환, 및 작은 삽입 또는 결실이다. 반대로, 효소 활성은 비-보존적 치환, 큰 삽입 또는 결실, 및 활성 부위, 기질-결합 부위, 및 단백질의 폴딩 또는 형태(conformation)에 중요한 파묻힌 위치(buried position) 내의 변화에 의해 영향을 받을 가능성이 더욱 크다. 효소 활성을 바꾸는 변화는 반응 속도를 증가시키거나, 감소시킬 수 있으며, 또는 특정 기질에 대한 친화성 또는 특이성을 증가시키거나 감소시킬 수 있다. 예를 들어, 기질-결합 부위의 크기를 증가시키는 변화로 인해 효소가 더 큰 기질에서도 작용할 수 있게 되고, 촉매적 아미노산 측쇄를 기질의 표적 부위에 더욱 가까이 두는 변화로 인해 효소의 속도가 증가할 수 있다.
일부 구현예에서, "합리적인 설계"는 효소에 대한 특정 돌연변이를 구축하는 것에 관한 것이다. 합리적인 설계라는 것은, 효소 또는 관련 효소에 대한 지식, 예컨대 이의 반응 열역학 및 속도론, 3-차원 구조, 활성 부위(들), 기질(들) 및/또는 효소와 기질 간의 상호작용을 특정 돌연변이의 설계에 도입하는 것을 말한다. 합리적인 설계의 접근에 기초하여, 효소에 돌연변이를 생성할 수 있으며, 이후 이를 대조 수준에 비해 테르펜 또는 테르페노이드의 생산이 증가되었는지에 대해 스크리닝할 수 있다. 일부 구현예에서, 돌연변이는 상동성 모델링에 기초하여 합리적으로 설계될 수 있다. 본원에 사용된 "상동성 모델링"이라는 것은, 관련된 상동성 단백질의 아미노산 서열과 3-차원 구조로부터 하나의 단백질의 원자 분해능 모델(atomic resolution model)을 구축하는 공정을 말한다.
아미노산 서열의 동일성, 즉 서열 동일성의 백분율은 서열 정렬을 통해 결정될 수 있다. 이러한 정렬은 문헌[Karlin and Altschul (Karlin & Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5877)]에 기재된 것과 같은 몇몇 공지의 알고리즘, hmmalign (HMMER 패키지), 또는 CLUSTAL 알고리즘 (Thompson, J. D., Higgins, D. G. & Gibson, T. J. (1994) Nucleic Acids Res. 22, 4673-80)에 의해 수행될 수 있다. 서열 동일성(서열 매칭)의 등급은 예를 들어, BLAST, BLAT 또는 BlastZ (또는 BlastX)을 사용하여 계산할 수 있다. 유사한 알고리즘은 문헌[Altschul 등 (1990) J. Mol. Biol. 215: 403-410]의 BLASTN 및 BLASTP 프로그램에 포함되어 있다. BLAST 단백질 정렬은 BLASTP 프로그램에서 스코어 = 50, 워드 길이(word length) = 3으로 수행할 수 있다. 비교의 목적으로 갭을 둔 채로 정렬을 하기 위해, 문헌[Altschul 등 (1997) Nucleic Acids Res. 25: 3389-3402]에 기재된 바와 같은 갭(Gapped) BLAST를 이용한다. BLAST 및 갭 BLAST 프로그램을 이용할 때, 각 프로그램의 디폴트 변수가 사용된다.
UGT 효소 또는 다른 발현된 효소는 미생물 세포의 염색체로 통합될 수 있거나, 또는 대안적으로 염색체 외에서 발현된다. 예를 들어, UGT 효소는 박테리아 인공 염색체(BAC) 또는 효모 인공 염색체(YAC)로부터 발현될 수 있다.
하나 이상의 UGT 효소 (또는 다른 발현된 효소)의 아미노산 서열에서, 선택적으로 위치 2에 알라닌이 삽입되거나 또는 치환되어, 세포의 교체율(turnover)을 감소시킬 수 있다. 다양한 구현예에서, 하나 이상의 UGT 효소는 위치 2에서 알라닌 잔기가 삽입되거나 또는 치환되어, 생체 내의 추가 안정성을 제공한다.
효소의 발현은 예를 들어 유전자 모듈(예를 들어, 오페론) 또는 효소의 독립적인 발현을 사용하여, 최적 활성을 얻도록 조정될 수 있다. 예를 들어, 유전자 또는 오페론의 발현은 강도가 다른(예를 들어, 강한, 중간, 약한) 프로모터, 예컨대 유도성 또는 항시성 프로모터의 선택을 통하여 조절될 수 있다. 강도가 다른 프로모터의 몇몇 비-제한적인 예는, Trc, T5 및 T7을 포함한다. 추가로, 유전자 또는 오페론의 발현은 세포 내 유전자 또는 오페론의 카피수를 조작함으로써 조절될 수도 있다. 일부 구현예에서, 세포는 단일 카피의 각 UGT 효소를 발현한다. 일부 구현예에서, 유전자 또는 오페론의 발현은 한 모듈 내에서 유전자들의 순서를 조작하여 조절될 수 있는데, 일반적으로 먼저 전사된 유전자가 더 많이 발현된다. 일부 구현예에서, 유전자 또는 오페론의 발현은 하나 이상의 유전자 또는 오페론을 염색체에 통합시켜 조절된다.
발현의 최적화는 또한 적절한 프로모터와 리보솜 결합 부위를 선택하여 이루어질 수도 있다. 일부 구현예에서, 이는 높은-카피수의 플라스미드, 또는 단일-, 저- 또는 중간-카피수의 플라스미드의 선택을 포함할 수 있다. 전사 종결의 단계는 또한 스템-루프와 같은 구조의 도입이나 제거를 통해, 유전자 발현을 조절하는 것을 목적으로 할 수도 있다.
발현에 대한 모든 필수 요소를 함유한 발현 벡터는 시판되고 있으며, 당업계의 숙련자들에게 알려져 있다. 예를 들어, 문헌[Sambrook 등, Molecular Cloning: A Laboratory Manual, 2판, Cold Spring Harbor Laboratory Press, 1989]를 참고한다. 이종 DNA를 세포로 도입하여, 세포를 유전자 조작한다. 이종 DNA는 전사 요소의 작용가능한 조절을 받으므로, 숙주 세포에서 이종 DNA의 발현이 가능해진다.
일부 구현예에서, 내인성 유전자는 유전자 상보성과는 반대로 편집된다. 편집(Editing)은 내인성 프로모터, 리보솜 결합 부위 서열 또는 다른 발현 조절 서열을 변형시킬 수 있고/거나, 일부 구현예에서는 유전자 조절 시 트랜스(trans)-작용 및/또는 시스(cis)-작용 인자를 변형시킨다. 게놈 편집은 CRISPR/Cas 게놈 편집 기술, 또는 아연 핑거 뉴클레아제 및 TALEN을 이용한 유사 기술을 사용하여 실시될 수 있다. 일부 구현예에서, 내인성 유전자는 상동 재조합에 의해 대체된다.
일부 구현예에서, 편리하게는 유전자는 적어도 부분적으로는 유전자 카피수를 조절함으로써 과다발현된다. 유전자 카피 수는 다양한 카피 수를 갖는 플라스미드를 사용하여 조절할 수 있으나, 유전자 중복(gene duplication) 및 염색체 통합도 또한 이용할 수 있다. 예를 들어, 유전적으로 안정한 텐덤 유전자(tandem) 중복을 위한 공정은 US 2011/0236927에 기재되어 있는데, 상기 문헌은 전문이 본원에 참조로서 포함된다.
일부 구현예에서, 당화 생성물은 RebM을 포함한다. 이러한 구현예에서, UGT 효소는 스테비올 코어의 C13 및 C19 하이드록실에서의 1 차 당화; C13 및 C19 1 차 글리코실 기의 1-2 분지형 당화; 및 C13 및 C19 1 차 글리코실 기의 1-3 분지형 당화가 가능하다. 도 21를 참고한다. 일부 구현예에서, UGT 효소는 서열 번호: 13 내지 32, 및 84 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 아미노산 서열을 포함하는 효소로부터 선택된다. 일부 구현예에서, 본 개시 내용에 의해 회수된 당화 생성물은 총 스테비올 글리코시드 성분에 대해 적어도 약 50%의 RebM, 또는 적어도 약 75%의 RebM, 또는 적어도 약 85%의 RebM, 또는 적어도 약 90%의 RebM, 또는 적어도 약 95%의 RebM이다.
일부 구현예에서, 당화 생성물은 RebE 및/또는 RebD를 포함한다. 이러한 구현예에서, 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-2 당화가 가능한 하나 이상의 UGT 효소를 발현할 수 있다. 일부 구현예에서, 당화용 기질은 RebA 및 스테비오시드를 주요 성분으로 포함한다 (예를 들어, 기질의 스테비올 글리코시드 조성의 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 50%, 또는 적어도 약 70%). 일부 구현예에서, UGT 효소는 서열 번호: 13 내지 16, 및 26 내지 29 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 효소로부터 선택된다. 일부 구현예에서, 본 개시 내용에 의해 회수된 당화 생성물은 총 스테비올 글리코시드 성분에 대해 적어도 약 50%의 RebE 및/또는 RebD, 또는 적어도 약 75%의 RebE 및/또는 RebD, 또는 적어도 약 85%의 RebE 및/또는 RebD, 또는 적어도 약 90%의 RebE 및/또는 RebD, 또는 적어도 약 95%의 RebE 및/또는 RebD이다.
일부 구현예에서, 당화 생성물은 RebB를 포함한다. 이러한 구현예에서, 박테리아 세포는 스테비올 C19 1 차 글리코실 기를 탈당화시킬 수 있는 하나 이상의 UGT 효소를 발현한다. 일부 구현예에서, 당화용 기질은 RebA를 주요 성분으로 포함한다 (기질의 레바우디오시드 조성의 예를 들어, 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 50%, 또는 적어도 약 70%). 일부 구현예에서, UGT 효소는 서열 번호: 18, 30, 31 및 99 중 하나와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 효소로부터 선택된다. 일부 구현예에서, 박테리아 세포는 서열 번호: 31 또는 서열 번호: 99와 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖는 UGT 효소를 발현한다. 이러한 구현예에서, 본 개시 내용에 의해 회수된 당화 생성물은 총 스테비올 글리코시드 성분에 대해 적어도 약 50%의 RebB, 또는 적어도 약 75%의 RebB, 또는 적어도 약 85%의 RebB, 또는 적어도 약 90%의 RebB, 또는 적어도 약 95%의 RebB이다.
일부 구현예에서, 당화 생성물은 RebI를 포함한다. 이러한 구현예에서, 박테리아 세포는 스테비올 C19 1 차 글리코실 기의 1-3 당화가 가능한 하나 이상의 UGT 효소를 발현한다. 일부 구현예에서, 당화용 기질은 RebA를 주요 성분으로 포함한다 (기질의 스테비올 글리코시드 조성의 예를 들어, 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 50%, 또는 적어도 약 70%, 또는 적어도 약 80%). 일부 구현예에서, UGT 효소는 서열 번호: 19 내지 25 중 하나와 적어도 약 70% (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%)의 서열 동일성을 갖는 효소로부터 선택된다. 이러한 구현예에서, 본 개시 내용에 의해 회수된 당화 생성물은 총 스테비올 글리코시드 성분에 대해 적어도 약 50%의 RebI, 또는 적어도 약 75%의 RebI, 또는 적어도 약 85%의 RebI, 또는 적어도 약 90%의 RebI, 또는 적어도 약 95%의 RebI이다.
일부 구현예에서, 기질은 나한과 추출물 또는 이의 분획으로, 또는 생합성에 의해 생산된 모그롤 또는 모그롤 글리코시드로서 제공된다. 예를 들어, 기질은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 기질을 하나 이상 포함한다. 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI, isomog. V 및 시아메노시드 중 하나 이상을 포함할 수 있다. 도 18를 참고한다. 다양한 구현예에서, UGT 효소는 모그롤 코어의 C3 및/또는 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 분지형 당화; C3 및/또는 C24 1 차 글리코실 기의 1-6 분지형 당화 중 하나 이상이 가능하다. 일부 구현예에서, 당화 생성물은 mog. V 또는 시아메노시드이다. 다양한 구현예에서, UGT 효소는 서열 번호: 13 내지 17, 29, 33 내지 39, 46, 54, 60, 71 내지 80, 및 82 내지 84 중 하나와 적어도 약 70% (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%)의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택된다. 표 8 및 9를 참고한다. 다양한 구현예에서, 상기 방법에 의해 기질이 당화 생성물로 (회수된 조성물의 총 모그롤 글리코시드 성분에 대해) 적어도 약 40% 전환되거나, 기질이 당화 생성물로 적어도 약 50% 전환되거나, 기질이 당화 생성물로 적어도 약 75% 전환되거나, 기질이 당화 생성물로 적어도 약 90% 전환되거나, 기질이 당화 생성물로 적어도 약 95% 전환된다.
다양한 구현예에서, 복합 배지 또는 최소 배지에서의 성장에 의해 박테리아 세포의 바이오매스가 생성된다. 이후, 박테리아 세포는 하나 이상의 탄소원을 갖는 당화용 기질의 존재 하에서 배양된다. 일부 구현예에서, 상기 탄소원은 포도당, 수크로스, 과당, 자일로스 및 글리세롤 중 하나 이상을 포함한다. 일부 구현예에서, 상기 탄소원은 수크로스와, 글리세롤 및 포도당 중 하나 이상을 포함한다. 일반적으로, 적합한 탄소원은 C1 내지 C6의 탄소원을 포함한다. 배양 조건은 호기성, 미세호기성 및 혐기성으로부터 선택될 수 있다. 배양은 배치, 연속 또는 반-연속 공정으로 수행될 수 있다. 예를 들어, 일부 구현예에서, 상기 방법은 유가(fed batch) 공정으로 수행된다.
일부 구현예에서, 기질은 박테리아 세포와 함께 약 72 시간 이하, 또는 약 48 시간 이하 동안 인큐베이션된다. 특정 구현예에서, 기질은 박테리아 세포와 함께 1 내지 3 시간 동안, 예를 들어 교반 탱크 발효기를 사용하여 인큐베이션된다. 다양한 구현예에서, 글리코시드 생성물은 본원의 다른 부분에 기재된 것과 같이 회수된다. 예를 들어, 회수는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 또는 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제의 첨가 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 포함할 수 있다.
다른 양태 및 구현예에서, 본 발명은 테르페노이드 글리코시드 기질을 포함하는 기질의 당화 생산성이 높은 조작된 UDP-의존성 당전이(UGT) 효소를 제공하며, 이는 본원에 기재된 박테리아 세포 및 방법과 관련된다. 일부 구현예에서, 조작된 UGT 효소는 서열 번호: 13과 적어도 약 70%의 서열 동일성 (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%의 서열 동일성)을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 서열을 포함한다. 일부 구현예에서, 아미노산 변형은 서열 번호: 13에 대해 V397S, V397C, G5N, S20E, S23D, R45Y, H59P, G94S, K97E, M150L, I185F, A206P, G210E, Q237R, M250K, A251E, C252L, G259E, Q263Y, I287M, C288F, V336I, F338L, D351E, F186I, F186M, F186T, L418F, A451T, A451L, T453K, T453R, V456S, V456W, V456T, V456M로부터 선택된 하나 이상 (예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10 개)의 아미노산 치환을 포함한다. 표 2를 참고한다. 대안적으로 또는 추가로, 아미노산 변형은 서열 번호: 13의 잔기 270 내지 281이, 주로 글리신과 세린 아미노산으로 구성된 5 내지 15 개의 아미노산으로 치환된 것을 포함한다. 대안적으로 또는 추가로, 아미노산 변형은 서열 번호: 13에 대한 위치 3에 1 개 또는 2 개의 아미노산이 삽입되고/거나, 서열 번호: 13의 C-말단에 하나의 아미노산이 첨가된 것을 포함한다.
일부 구현예에서, UGT 효소는 서열 번호: 13의 아미노산 270 내지 281이 서열 GGSGGS(서열 번호: 85)로 대체된다. 이러한 구현예 또는 다른 구현예에서, UGT 효소는 서열 번호: 13의 위치 3에 Arg이 삽입되거나, 위치 2와 3 사이에 Ile-Arg이 삽입된다. 이러한 구현예 또는 다른 구현예에서, UGT 효소는 서열 번호: 13에 대해 G5N, F186T 및 V397S로부터 선택된 하나 이상의 (또는 모든) 치환을 포함한다. 이 양태의 예시적인 UGT 효소는 서열 번호: 14의 아미노산 서열을 포함한다. 도 5를 참고한다.
또 다른 구현예에서, UGT 효소는 서열 번호: 14와 적어도 약 70% (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%)의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 서열을 포함한다. 예를 들어, 아미노산 변성은 이하의 것들로부터 선택된 하나 이상(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10 개)의 아미노산 치환을 포함할 수 있다: 서열 번호: 14에 대한 V395A, Q263Y, D269R, K97E, Q262E, H59P, G259E, M150L, Y267H, T3R, V95Q, A238E, S308Q, Q237R, R45Y, E254D, L203I, S151R, S123D, D351E, T453M, G94T, T186M, V336I, L58S, F338L, F51W, C252L, M250D, A251E, C252V, A79P, W401F, S323A, A251E, A130D, S42E, H400Y, S266R, S23D, P56A, A206P, M250K, A143W, V456T, G94S, I427F, T186I, T453F, C252R, V38F, R45F, T37S, Q244K, L11I, I287M, V31P, T43D 및 P39T. 표 3을 참고한다. 대안적으로 또는 추가로, 아미노산 변형은 주로 글리신과 세린 아미노산으로 구성된 5 내지 15 개의 아미노산의 링커에 의한 서열 번호: 14의 잔기 270 내지 281의 결실을 포함한다. 대안적으로 또는 추가로, UGT 효소는 서열 번호: 14에 대한 위치 3에 1 개 또는 2 개의 아미노산이 삽입되고, 서열 번호: 14의 C-말단에 하나의 아미노산이 첨가된 것을 포함한다.
일부 구현예에서, UGT 효소는 서열 번호: 14의 아미노산 270 내지 281이, 주로 Ser 및 Gly로 구성된 6 내지 12 개의 아미노산의 링커 서열로 치환된다. 이 구현예 또는 다른 구현예에서, UGT 효소는 서열 번호: 14에 대해 H59P, A238E 및 L417F로부터 선택된 하나 이상의 치환 (또는 모든 치환)을 포함한다. 이러한 구현예 또는 다른 구현예에서, UGT 효소는 서열 번호: 14의 A2와 T3 사이에 삽입 또는 Arg-Arg를 포함한다. 이 구현예에 의한 예시적인 UGT 효소는 서열 번호: 15의 아미노산 서열을 포함한다. 도 9를 참고한다.
또 다른 구현예에서, UGT 효소는 서열 번호: 15와 적어도 약 70% (또는 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%)의 서열 동일성을 갖고, 테르페노이드 글리코시드 기질(예를 들어, 스테비올 글리코시드 기질)에 대한 당화 활성을 개선시키는 아미노산 치환을 하나 이상 갖는 아미노산 서열을 포함한다. 이러한 아미노산 치환은 서열 번호: 15에 대한 위치 125, 152, 153 및 442로부터 선택된 위치에 있을 수 있다. 일부 구현예에서, UGT 효소는 서열 번호: 15에 대해 M152A, S153A, P442D 및 S125V로부터 선택된 하나 이상의 (또는 모든) 아미노산 치환을 포함한다. 표 4를 참고한다. 이 구현예에 의한 예시적인 UGT 효소는 서열 번호: 16의 아미노산 서열을 포함한다. 도 7를 참고한다.
다른 양태 및 구현예에서, 본 발명은 모그롤 또는 모그롤 글리코시드 기질의 당화를 위한 UGT 효소(이를 발현하는 박테리아 세포 포함)를 제공한다. 이러한 구현예에서, 상기 방법은 기질을 UDP-당(예를 들어, UDP-포도당)의 존재 하에 UGT 효소와 접촉시키는 단계를 포함한다. UGT 효소는 이하의 것들로부터 선택된 아미노산 서열과 적어도 약 80% (또는 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%)의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다: 서열 번호: 84, 서열 번호: 80, 서열 번호: 46, 서열 번호: 83, 서열 번호: 82, 서열 번호: 73, 서열 번호: 72, 서열 번호: 78, 서열 번호: 54, 서열 번호: 74, 서열 번호: 75, 서열 번호: 76, 서열 번호: 13, 서열 번호: 14, 서열 번호: 15, 서열 번호: 16, 서열 번호: 29, 및 서열 번호: 79. 표 8 및 9를 참고한다.
다양한 구현예에서, 기질은 서열 번호: 84, 서열 번호: 80, 서열 번호: 83, 서열 번호: 73, 서열 번호: 72, 서열 번호: 54, 및 서열 번호: 13과 적어도 약 80% (또는 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%)의 서열 동일성을 갖는 아미노산 서열을 포함하는 UGT 효소와 접촉된다.
이러한 구현예에서, 모그롤 또는 모그롤 글리코시드 기질은 식물 추출물 또는 이의 분획, 예컨대 나한과 추출물 또는 이의 분획으로 제공될 수 있다. 예를 들어, 기질은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 기질을 하나 이상 포함하거나, 또는 이것이 풍부할 수 있다. 이러한 구현예에서, 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI, isomog V 및 시아메노시드 중 하나 이상을 포함할 수 있다. 예를 들어, UGT 효소는 모그롤 코어의 C3 및/또는 C24 하이드록실에서의 1 차 당화, 및/또는 C3 및/또는 C24 1 차 글리코실 기의 1-2 및/또는 1-6 분지형 당화 중 하나 이상이 가능하다. 본 구현예에 의한 예시적인 생성물은 mog. V이다. (mog. IV, mog. VI, 및 시아메노시드를 포함하는) 다른 모그로시드 생성물이 제조될 수 있으며, UGT 효소는 당화 활성에 의해 선택될 수 있다.
모그롤 글리코시드의 생산에 대한 일부 구현예에서, 기질은 UGT 효소를 발현하는 세포와 함께 배양된다. 예시적인 미생물 세포는 박테리아 세포, 예컨대 에스체리쉬아, 바실러스, 로도박터, 자이모모나스 또는 슈도모나스 종을 포함한다. 예시적인 박테리아 세포는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 스패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다이다. 일부 구현예에서, 박테리아 세포는 E. 콜리이다. 다양한 구현예에서, 박테리아 세포는 본원에 기재된 전세포 생물전환 공정을 위해, 예를 들어 UDP-당의 이용가능성을 증가시키는 유전자 변형을 하나 이상 갖고/거나 본원의 다른 부분에 기재된 수크로스 합성효소를 발현하도록 조작된다.
다른 구현예에서, 미생물 세포는 선택적으로 사카로마이세스 세르비시애, 피키아 파스토리스야로우위아 리포리티카를 포함하는, 사카로마이세스, 피키아 또는 야로우위아로부터 선택된 효모 세포이다.
그러나, 또 다른 구현예에서, 기질은 UGT 효소를 포함한 세포 용해물과 함께 인큐베이션되거나, 공지의 기술에 의해 정제된 재조합 UGT 효소와 함께 인큐베이션된다. 당화 반응을 지원하기 위한 UDP-당은 외부에서 첨가될 수 있다.
다양한 구현예에서, 당화 생성물은 이하에 기재된 방법에 의해 회수된다. 이러한 방법은 반응 및 배양물의 pH를 약 pH 5 미만까지 낮추거나, 또는 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 포함할 수 있다.
일부 양태에서, 본 발명은 글리코시드 생성물의 생산 및 회수 방법을 제공한다. 이러한 구현예에서, 상기 방법은 무-세포 반응물 또는 미생물 배양물에서, 하나 이상의 당 모이어티의 효소적 전이에 의해 당화용 기질을 목표 글리코시드 생성물로 전환시키는 단계를 포함하는데, 이는 선택적으로 본원에 기재된 방법, UGT 효소 및/또는 박테리아 세포를 이용할 수 있다. 상기 방법은 반응 및 배양물으로부터 당화 생성물을 회수하되, 상기 회수는 반응물 또는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 추가로 포함한다.
종래에, 바이오매스의 제거는 큰 세포 찌꺼기를 제거하고, 하류에서 정제를 복잡하게 만들 세포의 추가 파괴를 피하기 위한 회수의 제1 단계이다. 그러나, 본 발명의 일부 구현예에 의하면, 배양 물질은 매우 점도가 높아서, 처리에 어려움이 있다. 예를 들어, 원심분리에 의한 바이오매스 제거의 효율은 수확된 배양 물질의 물리적 성질에 의해 제한될 수 있다. 바이오매스 또는 효소를 제거하기 전에 본원에 기재된 배양 물질을 처리함으로써, 고순도의 글리코시드 생성물, 백색 색상, 용이한 가용화, 무취 및 높은 회수 수율을 포함한 바람직한 품질을 갖는 생성물을 생산할 수 있다. 특히, 배양물에 대한 초기의 pH 및 온도 조절은 배지의 유체 특징을 변화시키고, 디스크 스택 분리기의 바이오매스 제거의 효율을 증가시킬 수 있다. 또한, 글리코시드 생성물의 용해도 및 이에 의한 수율은 pH 및 온도의 조절에 의해 실질적으로 증가하여, 고체 상의 글리코시드 생성물의 유의한 손실을 피한다.
다양한 구현예에서, 당화 생성물은 테르페노이드 글리코시드, 예컨대 (예를 들어, 본원에서 논의된 바와 같은) RebM, RebE, RebD, RebB 및 RebI 중 하나 이상이다. 일부 구현예에서, 당화 생성물은 RebM이다. 다른 구현예에서, 당화 생성물은 (상기에 기재된 바와 같이) mog. IV, mog. IVA, mog. V, mog. VI, isomog. V 및 시아메노시드 중 하나 이상을 포함한다. 예시적인 모그로시드 생성물은 mog. V이다.
일부 구현예에서, 효소적 전이는 미생물 배양물에서 일어나는데, 상기 미생물 배양물은 하나 이상의 UGT 효소를 발현하는 미생물 균주를 포함한다(예를 들어, 공급된 기질을 사용한 전세포 생물전환). 다른 구현예에서, 미생물 균주는 당화용 기질(예를 들어, 스테비올 또는 모그롤)을 생산하는 생합성 경로를 추가로 발현하고, 기질의 당화를 위한 하나 이상의 UGT 효소를 발현한다. 예를 들어, 미국 특허 제10,463,062호 및 WO 2019/169027를 참고하는데, 상기 문헌은 전문이 본원에 전문이 참조로서 포함된다. 다양한 구현예에서, 효소적 전이는 효모 균주, 예컨대 사카로마이세스 세레비시애, 피키아 파스토리스야로우 리포라이티카를 포함하는 사카로마이세스, 피키아 또는 야로우로부터 선택된 것들의 미생물 배양에 의한다. 다른 구현예에서, 효소적 전이는 본원에 기재된 박테리아 세포의 미생물 배양에 의하며, 여기에는 일부 구현예에서 전세포 생물전환을 위해 조작된 (예를 들어, 기재한 바와 같이, 하나 이상의 수크로스 합성효소를 발현하고/거나, UDP-당의 이용가능성을 개선시키는 본원에 기재된 하나 이상의 유전자 변형을 포함하는) E. 콜리 세포가 포함된다. 예를 들어, 박테리아 세포는 이하의 유전자 변형을 포함할 수 있는데: ushA 및 galETKM, 또는 이들의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; pgi 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94), 또는 이들의 병렬상동체 또는 유도체(예를 들어, 야생형 효소보다 활성이 높은 유도체)는 과다 발현됨; 및/또는 E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95), 또는 이들의 병렬상동체 또는 유도체(예를 들어, 야생형 효소보다 활성이 높은 유도체)는 과다 발현됨.
일부 구현예에서, 효소적 전이는 부피가 적어도 약 10,000 L, 또는 적어도 약 50,000 L, 또는 적어도 약 100,000 L, 또는 적어도 약 150,000 L, 또는 적어도 약 200,000 L, 또는 적어도 약 500,000 L인 생물반응기에서 일어난다. 다양한 구현예에서, 배양 물질은 글리코시드 회수를 위해 배치, 연속 또는 반-연속 방식으로 수확될 수 있다.
일부 구현예에서, 수확된 배양 물질은 pH가 예를 들어 약 pH 2 내지 약 pH 5의 범위 내로 조절된다. 일부 구현예에서, pH는 약 2 내지 약 4 범위의 pH, 또는 약 2 내지 약 3.5 범위의 pH, 또는 약 2.5 내지 약 4 범위의 pH로 조절된다. 특정 구현예에서, pH는 약 2.5, 약 3.0 또는 약 3.5로 조절된다. 또 다른 구현예에서, pH는 염기성 pH 범위, 예컨대 약 9 내지 약 12의 범위 내, 또는 약 9.5 내지 약 12, 또는 약 10 내지 12의 범위 내(예를 들어, 약 11, 약 11.5 또는 약 12)의 pH로 조절된다. 다양한 구현예에서, pH 조절은 글리코시드 용해도를 개선시키고/거나, 수확된 물질의 물리적 특성을 개선시켜서, 생성물의 큰 손실없이도 바이오매스 및/또는 효소가 더욱 용이하게 제거된다. pH 조절은 공지의 방법에 의하면, 유기산이나 무기산, 또는 하이드록시드 이온의 첨가 또는 적정에 의할 수 있다.
대안적으로 또는 추가로, 수확된 배양 물질의 온도는 약 50℃ 내지 약 90℃, 예컨대 약 50℃ 내지 약 80℃의 온도로 조절된다. 예를 들어, 일부 구현예에서, 온도는 약 55℃ 내지 약 75℃ 범위의 온도, 또는 약 65℃ 내지 약 75℃ 범위의 온도로 조절된다. 일부 구현예에서, 온도는 약 70℃로 조절된다. 다양한 구현예에서, 온도 조절은 글리코시드 용해도를 개선시키고/거나, 수확된 물질의 물리적 특성을 개선시켜, 바이오매스 및/또는 효소가 생성물의 큰 손실없이도 더욱 용이하게 제거된다. 일부 구현예에서, 온도 조절은 반응 배지 또는 배양물을 예열된 하베스트 탱크로 전달함으로써 일어난다. 일부 구현예에서, 온도 조절은 직렬로, 예를 들어, 보유 루프(retention loop)를 통과하여 다음 유닛 가동으로 보냄으로써 일어난다.
일부 구현예에서, 수확된 반응물 또는 배양 배지는 pH 및/또는 온도 조절을 위해 반응 탱크로부터 하베스트 탱크로 전달되며, 이는 동일한 하베스트 탱크 또는 상이한 하베스트 탱크에서 일어날 수 있다. 일부 구현예에서. pH 및/또는 온도 조절은 연속 유닛 가동에서와 같이 직렬로 일어난다. 온도 및 pH 조절은 임의의 순서로 또는 동시에 일어날 수 있다. 일부 구현예에서, pH 조절은 온도 조절에 앞서 일어난다. 다른 구현예에서, 온도 조절은 pH 조절에 앞서 일어난다. 또 다른 구현예에서, pH 조절과 온도 조절은 실질적으로 동시에 일어난다.
대안적으로 또는 추가로, 상기 방법은 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계를 포함한다. 예시적인 용해도 개선제는 (유기산 및 중합체를 포함하는) 알콜 관능기가 있는 화학 시약 및/또는 (에테르, 에스테르, 알데히드 및 케톤 관능기가 있는 것들을 포함하는) 극성 시약을 포함하며, 여기에는 다른 것들 중에서도 글리세롤, 1,3-프로판디올, 폴리비닐 알콜, 폴리에틸렌 글리콜이 포함된다. 다른 예시적인 용해도 개선제는 유기산, 단당류 및 다당류를 포함한다. 다른 용해도 개선제는, US 2020/0268026에 기재되어 있으며, 상기 문헌은 전문이 본원에 참조로서 포함된다. 글리코시드 용해도가 개선되면, 생성물의 큰 손실없이도 용이하게 바이오매스 및/또는 효소를 제거할 수 있다. 일반적으로, 용해도 개선제는 수확된 배양 물질에 약 0.1 wt% 내지 약 2 wt%의 범위, 예컨대 약 0.1 wt% 내지 약 1 wt%의 범위(예를 들어, 약 0.5 wt%)로 첨가될 수 있다.
이후, 바이오매스 및/또는 효소가 원심분리에 의해 제거되어, 정화된 배지가 제조된다. 바이오매스의 제거를 위한 예시적인 공정은 디스크 스택 원심분리를 이용하여, 액체 상과 고체 상을 분리한다. 정화된 배지(액체 상)는 글리코시드 생성물의 정화를 위한 추가 공정에 사용하기 위해 회수된다. 분리된 바이오매스(고체 상)은 추가 글리코시드 생성물의 회수를 위해 재가공될 수 있거나, 또는 대안적으로 폐기물로 처리된다.
일부 구현예에서, 글리코시드는 정화된 배지로부터 결정화된다. 일부 구현예에서, 상기 공정은 1 개, 2 개 또는 3 개의 결정화 단계를 포함한다. 일부 구현예에서, 글리코시드 생성물은 여과, 이온 교환, 활성탄, 벤토나이트, 친화성 크로마토그래피 및 소화로부터 선택된 하나 이상의 공정을 사용하여 정화된 배지로부터 정제되며, 이는 선택적으로 결정화 이전 및/또는 재결정화 이전에 수행될 수 있다. 이 공정은 고순도의 생성물, 매력적인 색상(RebM의 경우, 백색), 손쉬운 용해, 무취 및 높은 회수 수율을 얻도록 선택될 수 있다. 일부 구현예에서, 상기 방법은 친화성 크로마토그래피, 예컨대 스티렌-디비닐벤젠 흡착성 수지, 강산성 양이온 교환 수지, 약산성 양이온 교환 수지, 강염기성 음이온 교환 수지, 약염기성 음이온 교환 수지 및 소수성 상호작용 수지 중 하나 이상에 의한 것을 이용한다. 다른 구현예에서, 상기 공정은 미국 특허 제10,213,707호에 기재된 시뮬레이션 이동층 크로마토그래피를 이용하며, 상기 문헌은 전문이 본원에 참조로서 포함된다. 또 다른 구현예에서, 회수 공정은 비-크로마토그래피성이어서(즉, 크로마토그래피 단계가 없어서), 상당한 비용적인 장점을 제공한다. 예를 들어, 바이오매스 제거 후의 회수 공정은 여과 및 결정화 단계를 본질적으로 포함하거나, 또는 이로서 이루어질 수 있다. 일부 구현예에서, 회수 공정은 유기 용매(예를 들어, 에탄올)를 이용하나, 다른 구현예에서, 상기 공정은 전적으로 수성 용매에 의한다. 일부 구현예에서, 2 개의 결정화 단계가 이용된다.
일부 구현예에서, 회수 공정은 하나 이상의 접선 유동 여과(TFF) 단계를 포함할 것이다. 예를 들어, 약 5 kD의 기공 크기를 갖는 필터에 의한 TFF에 의해, 내독소, 큰 단백질 및 다른 세포 찌꺼기를 제거할 수 있으며, 최종 분말 생성물의 용해도도 개선시킬 수 있다. 일부 구현예에서, 글리코시드 생성물은 초기 결정화에 앞서, 선택적으로 약 5 kD의 막 기공 크기를 갖는 접선 유동 여과에 의해 정제된다. 또한, 하류에서 기공 크기가 약 0.5 kD인 필터에 의한 TFF를 이용하여, 소분자의 불순물 및 염을 제거하고/거나, 재결정화를 위한 모액(mother liquor)을 농축할 수도 있다. 일부 구현예에서, 재결정화에 앞서, 약 0.5 kD의 기공 크기에 의한 TFF를 이용한다.
각각의 경우, 결정화 단계는 정적 결정화, 교반 결정화 및 증발 결정화 중 하나 이상의 상을 포함할 수 있다. 예를 들어, 결정화 단계는 정지 상 및 이후의 교반 상을 포함하여, 결정의 형태를 조절할 수 있다. 정지 상은 결정성 도메인의 정도가 심한 큰 결정으로 자랄 수 있다. 결정화 공정은 결정을 분주하는 공정을 포함할 수 있거나, 또는 일부 구현예에서는 결정의 분주 공정과 관계 없다(즉, 결정은 자발적으로 형성된다). 다양한 구현예에서, 결정화 용매는 물 또는 물/에탄올을 포함한다. 예시적인 결정화 용매는 물과 함께, 선택적으로 약 5 부피% 내지 약 50 부피%의 에탄올, 또는 약 25 부피% 내지 약 50 부피%의 에탄올(예를 들어, 약 30 부피% 내지 약 40 부피%의 에탄올)을 포함한다. 일부 구현예에서, 정지 상 동안 결정을 분주한 후, 교반 상에서는 결정이 신속히 자라서, 무정형 도메인의 정도가 높아질 것이다. 이 공정을 이용하면, 생성된 결정의 최종 용해도가 더욱 양호해지고, 고순도의 글리코시드 생성물을 가질 수 있으며, 회수 및 세척이 더욱 용이해질 수 있다.
다양한 구현예에서, 글리코시드 생성물은 재결정화에 앞서, 용매(예컨대, 물 및/또는 에탄올이나, 이에 제한되지 않음)에 재가용화되며; 이는 용매 및 글리코시드 생성물의 용액 또는 현탁액의 pH를 약 pH 5 미만으로 낮추거나, 또는 용액 또는 현탁액의 pH를 약 pH 9 초과까지 상승시키는 단계, 적어도 약 50℃까지 가열하는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계 중 하나 이상을 이용할 수 있다. pH, 온도, 글리코시드 가용화제 농도에 대한 목표 값은 대안적으로 바이오매스의 제거에 이용된 것과 같을 수 있다. 예를 들어, 글리코시드 생성물의 용액 또는 현탁액은 pH가 약 2 내지 약 5의 범위 내로 조절될 수 있다. 다른 구현예에서, pH는 염기성 pH 범위, 예컨대 약 9 내지 약 12의 범위 내, 또는 약 9.5 또는 약 10 내지 약 12의 범위 내의 pH로 조절된다. pH 조절은 공지의 방법에 따라 유기산 또는 무기산 또는 하이드록시드 이온의 첨가 또는 적정에 의할 수 있다. 또 다른 구현예에서, 재결정화는 약 4 내지 약 12의 pH에서 수행된다. 대안적으로 또는 추가로, 용액 또는 현탁액의 온도는 약 50℃ 내지 약 90℃, 예컨대 약 50℃ 내지 약 80℃의 온도로 조절된다. 예시적인 재결정화 용매는 물과 함께, 선택적으로 약 5 부피% 내지 약 50 부피%의 에탄올, 또는 약 25 부피% 내지 약 50 부피%의 에탄올(예를 들어, 약 30 부피% 내지 약 40 부피%의 에탄올)을 포함한다. 대안적으로 또는 추가로, 용해도 개선제는 기재한 바와 같이, 용액/현탁액에 약 0.1 wt% 내지 약 2 wt%의 범위, 예컨대 약 0.1 wt% 내지 약 1 wt%의 범위(예를 들어, 약 0.5 wt%)로 첨가될 수 있다. 예시적인 용해도 개선제는 글리세롤을 포함한다.
일부 구현예에서, 결정화 이후, 생성된 결정을 예를 들어 바스켓 원심분리 또는 벨트 필터를 사용하여 단리함으로써, 글리코시드의 습윤 케이크(예를 들어, 스테비올 글리코시드 또는 모그롤 글리코시드의 습윤 케이크)가 단리된다. 바스켓 원심분리 단계에서, 세척은 물에 의한 세척을 이용할 수 있거나, 또는 대안적으로 다른 헹굼(예를 들어, 냉수/에탄올)을 이용할 수 있다. 일부 구현예에서, 케이크는 용해되거나, 재결정화된다. 재결정화에 의한 습윤 케이크는 선택적으로 벨트 건조기, 패들 건조기 또는 스프레이 건조기를 사용하여 이후 건조될 수 있다. 건조된 케이크는 분쇄되어, 포장될 수 있다.
재결정화에 앞서, 글리코시드 용액(예를 들어, RebM 및 다른 스테비올 글리코시드)를 여과하여, 불순물을 제거할 수 있다. 필터는 약 0.2 마이크론의 필터일 수 있다. 대안적으로, 다른 기공 크기, 예컨대 약 0.45 마이크론의 필터 및 약 1.2 마이크론의 필터도 이용할 수 있다. 구현예에 의하면, 필터의 물질은 불순물을 예컨대 흡착에 의해 추가로 제거하도록 선택될 수 있다. 예를 들어, 친수성 물질, 예컨대 폴리에테르술폰(PES)은 폴리프로필렌과 같은 더욱 소수성인 물질에 비해 유의한 장점이 있다. 다른 예시적인 친수성 필터 물질은, 나일론, 셀룰로스 아세테이트, 셀룰로스 니트레이트, 및 통상 친수성 물질을 생성하도록 기능화된 소수성 물질(예컨대, 플루오로알킬 말단 폴리에틸렌 글리콜에 의해 코팅된 PTFE 또는 PVDF)을 포함한다.
다양한 구현예에서, 회수 공정에서 목표 글리코시드의 고순도 조성물이 생성된다. 예를 들어, 일부 구현예에서, 목표 글리코시드 생성물은 회수된 조성물의 적어도 약 75 중량%이다. 일부 구현예에서, 목표 글리코시드 생성물은 회수된 조성물의 적어도 약 80 중량%, 또는 적어도 약 90 중량%, 또는 적어도 약 95 중량%이다. 예시적인 구현예에서, 당화 생성물의 수율은 배양물 또는 반응물의 리터당 적어도 약 25 그램의 생성물(g/L), 또는 적어도 약 50 g/L, 또는 적어도 약 75 g/L, 또는 적어도 약 100 g/L, 또는 적어도 약 125 g/L, 또는 적어도 약 150 g/L, 또는 적어도 약 200 g/L이다.
일부 양태에서, 본 발명은 당화 생성물, 예컨대 스테비올 글리코시드 또는 모그롤 글리코시드를 포함하는 생성물(예를 들어, RebM 또는 mog. V)의 제조 방법을 제공한다. 상기 방법은 (본 개시 내용에 의해 생산된) 글리코시드 생성물을 식품, 음료, 구강 케어 제품, 감미료, 착향제와 같은 제품 또는 다른 제품에 혼입시키는 단계를 포함한다. 본 발명에 의해 제조된 정제 글리코시드는 식품, 음료, 결착제(texturant)(예를 들어, 전분, 섬유, 검, 지방 및 지방 모사체 및 유화제), 약학적 조성물, 담배 제품, 영양 조성물, 구강 위생 조성물, 및 화장품 조성물을 포함하나, 이에 제한되지 않는 다양한 제품들에서 사용될 수 있다. 글리코시드들의 조합이 이용될 수 있는 향의 비-제한적인 예로는, 라임, 레몬, 오렌지, 과일, 바나나, 포도, 배, 파인애플, 망고, 쓴 편도(bitter almond), 콜라, 시나몬, 설탕, 솜사탕 및 바닐라 향을 포함한다. 다른 식품 성분의 비-제한적인 예는, 향, 산미료, 및 아미노산, 착색제, 증량제, 변형 전분, 검, 텍스처화제(texturizer), 보존제, 항산화제, 유화제, 안정화제, 증점제 및 겔화제를 포함한다.
일부 양태에서, 본 발명은 여러가지 고-강도 감미료들을 포함한 감미료 제품의 제조 방법을 제공하는데, 상기 여러가지 감미료는 스테비올 글리코시드(예를 들어, RebM, RebE, RebD, RebI 또는 RebB), 모그로시드(예를 들어, mog. IV, mog. IVA, mog. V, mog. VI 또는 isomog. V), 수크랄로스, 아스파르탐(aspartame), 네오탐(neotame), 아드반탐(advantame), 아세술팜(acesulfame) 포타슘, 사카린, 당 알콜(예를 들어, 에리트리톨 또는 자일리톨), 타가토스(tagatose), 사이클라메이트(cyclamate), 네오헤스페리딘 디하이드로칼콘(neohesperidin dihydrochalcone), 네티폴린(gnetifolin) E 및/또는 피세아탄놀(piceatannol) 4'-O-β-D-글루코피라노시드 중 둘 이상을 포함한다. 상기 방법은 감미료 제품을 식품, 음료, 구강 케어 제품, 감미료, 착향제, 또는 상기 기재된 것들을 포함하는 다른 제품에 혼입시키는 단계를 추가로 포함할 수 있다.
목표 글리코시드(들), 예컨대 RebM 또는 mog. V, 및 이를 포함하는 감미료 조성물은, 다양한 생리 활성 물질 또는 기능성 성분과 조합하여 사용될 수 있다. 기능성 성분은 일반적으로 카로테노이드, 식이 섬유, 지방산, 사포닌(saponin), 항산화제, 건강기능성 식품(nutraceutical), 플라보노이드, 이소티오시아네이트, 페놀, 식물 스테롤 및 스타놀(stanol)(파이토스테롤(phytosterol) 및 파이토스타놀(phytotsAnol)); 폴리올; 프리바이오틱스(prebiotics), 프로바이오틱스(probiotics); 파이토에스트로겐(phytoestrogen); 대두 단백질; 술파이드/티올; 아미노산; 단백질; 비타민; 및 미네랄과 같은 카테고리로 분류된다. 기능성 성분은 또한 건강적인 이점에 기초하여 심혈관성, 콜레스테롤-감소성 및 항염증성으로 분류될 수도 있다.
추가로, 목표 글리코시드(들), 예컨대 RebM 및 mog. V와 본 발명에 의해 얻은 감미료 조성물은, 고-강도 감미료로서 적용되어, 맛 특징이 개선된 제로 칼로리, 칼로리 감소 또는 다이어트 식음료 제품을 생산할 수 있다. 이는 또한 드링크, 식품류(foodstuff), 약, 및 설탕을 사용할 수 없는 다른 제품들에도 사용될 수 있다. 추가로, 감미료 조성물은 드링크, 식품류, 및 다른 인간 전용 제품뿐만 아니라 맛 특징이 개선된 동물의 먹이 및 사료를 위한 감미료로 사용될 수 있다.
목표 글리코시드(들)과 감미료 조성물이 사용될 수 있는 제품의 예에는, 보드카, 와인, 맥주, 독주(liquor) 및 사케 등과 같은 알콜 음료; 천연 주스; 청량 음료; 탄산 소프트 드링크; 다이어트 드링크; 제로 칼로리 드링크; 칼로리 감소 드링크 및 식품; 요거트 드링크; 인스턴트 주스; 인스턴트 커피; 분말형 인스턴트 음료; 통조림 제품; 시럽; 된장; 간장; 식초; 드레싱; 마요네즈; 케첩; 카레; 수프; 인스턴트 부용(bouillon); 간장 분말; 식초 분말; 비스킷류; 쌀 비스킷; 크래커; 빵; 초콜릿; 카라멜; 사탕; 추잉검; 젤리; 푸딩; 보존처리된 과채류; 생크림; 잼; 마말레이드; 꽃 향; 분유; 아이스크림; 셔벳; 채소 및 과일 병조림; 삶은 콩 통조림; 달콤한 소스를 넣고 조린 고기와 식품; 농산가공 채소 식품; 해산물; 햄; 소시지; 어묵; 어육 소시지; 생선 페이스트; 바싹 튀긴 생선 제품; 분말 해산물 제품; 냉동 식품 제품; 보존처리된 해초; 보존처리된 고기; 담배; 의료 제품; 및 많은 기타 제품이 포함되나, 이에 제한되지 않는다.
식품류, 드링크, 약, 화장료, 테이블탑 제품(tabletop product) 및 추잉검과 같은 제품을 제조하는 동안, 종래의 방법, 예컨대 혼합, 반죽, 용해, 절임(pickling), 침투, 삼출, 살포, 분무, 주입 및 다른 방법들이 사용될 수 있다.
본원에 사용된 "약(about)"이라는 용어는, 관련 수치값의 ±10%를 의미한다.
본 발명의 다른 양태 및 구현예는 이하의 실시예로부터 명백할 것이다.
실시예
실시예 1: 생물전환 샤시 균주(chassis strain)의 조작
UGT 효소를 발현하는 조작된 E. 콜리 균주를 사용한 스테비올 글리코시드 중간물질의 생물전환(당화)이 US 2020/0087692에 기재되어 있는데, 상기 문헌은 본원에 참조로서 포함된다. US 2020/0087692는 UGT 효소에 대한 중요 기질인 UDP-포도당으로의 자연적인 유입을 증가시키는 박테리아 유전자 변형에 대해 기재한다. UDP-포도당으로의 자연적인 유입이 많을수록, UGT에 이용가능한 기질의 양을 증가시킴으로써 UGT 성능이 더욱 커진다. 상기 유전자 변형에 의해, 공급 기질을 레바우디오시드 및 모그로시드와 같지만, 이에 제한되지 않는 당화 생성물로 전환시키는 세포의 능력이 발생된다. 당화를 위한 다른 기질은 본원에 기재되어 있다. 유전자 변형은 이하의 것들을 포함한다: UDP-포도당을 소모하는 효소의 결실 또는 불활성화(ushA, galETKM); UDP-포도당의 전구체인 포도당-6-포스페이트(G6P)를 소모하는 효소의 결실 또는 불활성화(예를 들어, pgi); 및 G6P를 포도당-1-포스페이트(G1P)를 통해 UDP-포도당으로 전환시키는 효소의 과다 발현(예를 들어, pgm, galU). 변형 ΔushA, ΔgalETKM, Δpgi 및 pgm과 galU의 보완을 받는 E. 콜리 균주를, 아래에서 "샤시 균주"라고 한다
추가 염색체 변형들에 대해, 생물전환이 샤시 균주에 비해 개선되었는지 시험하였다. 도 1은 2 개의 추가 염색체 변형에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 스테비아 잎 추출물, 수크로스 및 포도당을, 서열 번호: 15 및 25의 UGT 효소 및 서열 번호: 11의 수크로스 합성효소를 발현하는 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다. 도 1에서 1로 나타난 바와 같이, otsA 및 otsB의 결실 시, 스테비올 글리코시드의 생물전환이 샤시 균주에 비해 개선된 것으로 나타났다. 또한, (도 1에서 2로 나타난) ugpA의 과다 발현은, 전체 스테비올 글리코시드의 생물전환을 추가로 개선시켰다.
다른 박테리아 유전자들도 과다 발현되었고, 서열 번호: 14 및 24의 UGT 효소를 발현하는 샤시 균주와 비교하여 생물전환을 시험하였다. 도 2는 플라스미드에서 보완된 일련의 과다 발현 유전자들에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다. 나타난 바와 같이, E. 콜리 pgm (서열 번호: 92), galU (서열 번호: 93), pgm-galU (서열 번호: 92 및 93), ugpA (서열 번호: 95), ycjU (서열 번호: 94), adk (서열 번호: 96), ndk (서열 번호: 97) 및 cmk (서열 번호: 98)에 의한 보완을 포함한 몇몇 유전자 보완은 전체 당화를 개선시켰다.
후보 수크로스 합성효소를 발현하는 균주가 생성되었는데, 이는 수크로스를 공급할 때 UDP-포도당의 이용가능성을 개선시킬 수 있다. 수크로스 합성효소가 발현되면, 수크로스가 과당과 포도당으로 분리된다. 포도당은 UDP-포도당 생합성 쪽으로 갈 수 있다. 그러나, 세포가 탄소원으로서의 글리세롤 또는 포도당에서 성장할 때에도, 유사한 성장 및 UDP-포도당의 이용가능성을 보인다. 도 3은 서열 번호: 15 및 25의 UGT 효소를 발현하는 생물전환 샤시 균주에서 보완된 수크로스 합성효소에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 유전자는 플라스미드 상에서 보완되었다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 스테비아 잎 추출물, 수크로스 및 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다. 서열 번호: 2, 3, 5, 6, 7, 8, 9, 10 및 11에 의해 나타난 효소를 포함한 몇몇 수크로스 합성효소는 당화를 극적으로 개선시켰다.
도 4는 서열 번호: 14 및 서열 번호: 24의 UGT 효소를 발현하는 생물전환 샤시 균주와 다양한 유전자 녹아웃에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 전체 스테비올 글리코시드의 전환율에 대한 것이다. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다. 몇몇 유전자 녹아웃에 의해 생물전환의 개선을 확인하였다.
실시예 2: UGT 조작 및 표적 스테비올 글리코시드의 생산
MbUGT1,2라고 지칭된 UGT 효소는 미국 특허 제10,743,567호에 기재되어 있으며, 상기 문헌은 본원에 전문이 참조로서 포함된다. MbUGT1,2의 조작된 버전(서열 번호: 13)은 US 2020/0087692에 기재되어 있으며, 상기 문헌은 전문이 본원에 참조로서 포함된다. 서열 번호: 13의 UGT 효소는 스테비올 글리코시드의 생물전환의 활성을 개선시키도록 추가로 조작되었다. 도 5는 서열 번호: 14의 조작된 버전에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 모 UGT 효소(서열 번호: 13)의 스테비올 글리코시드의 전환율 %에 대한 것이다. 서열 번호: 14는 서열 번호: 13에 대해 이하의 돌연변이를 갖는다: G5N, F186T, V397S. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
표 2는 개별 돌연변이로부터 서열 번호: 13의 UGT 효소로의 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수(FI)는 스테비올 글리코시드의 전환율 %에 대한 것이다.
표 2
*l6은 GGSGGS 링커(서열 번호: 85)를 갖는다. 링커는 서열 번호: 13의 잔기 270-281를 대체한다.
도 6은 추가 조작 버전인 서열 번호: 15에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 서열 번호: 14의 모 UGT 효소의 스테비올 글리코시드의 전환율 %에 대한 것이다. 서열 번호: 15의 UGT 효소는 서열 번호: 14로부터 이하의 돌연변이를 갖는다: ins_A2_T3_RR, H59P, A238E, L417F. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
표 3는 개별 돌연변이에 의한 서열 번호: 14의 UGT 효소로의 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수(FI)는 스테비올 글리코시드의 전환율 %에 대한 것이다.
표 3
도 7은 추가 조작 버전인 서열 번호: 16에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수는 서열 번호: 15의 모 UGT 효소의 스테비올 글리코시드의 전환율 %에 대한 것이다. 서열 번호: 16은 서열 번호: 15로부터의 이하의 돌연변이를 갖는다: M152A, S153A. 스테비아 잎 추출물과 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
표 4는 서열 번호: 15에 대한 개별 돌연변이에 의한 스테비올 글리코시드 생물전환의 개선을 나타낸다. 개선 배수(FI)는 스테비올 글리코시드의 전환율 %에 대한 것이다.
표 4
다양한 구현예에서, 4 개의 UGT 효소(도 21 참고)의 공동-발현에 의한 RebM의 생산 외에도, 더 적은 UGT의 발현에 의해 및/또는 기질로서 특정 레바우디오시드를 이용함으로써, 다른 목표 스테비올 글리코시드도 생산할 수 있다. 예를 들어, 특정 스테비아 잎의 추출물은 다량의 RebA 및 스테비오시드를 함유할 수 있다. 1-2 분지화 UGT 효소(예를 들어, 서열 번호: 13-16 중 하나)가 발현되면, 추출물의 레바우디오시드 함량에 따라, RebE와 RebD의 혼합물이 생산될 것이다. 1-3 분지화 UGT 효소(예를 들어, 서열 번호: 19-25)가 발현되면, 실질적으로 RebI가 생산될 것이다. 또한, UGTC19의 발현은 스테비올비오시드 및 RebB에 대한 탈당화에 유리하다.
8는 서열 번호: 15의 UGT 효소를 사용한 스테비아 잎 추출물로부터 RebE와 RebD의 혼합물로의 생물전환, 및 서열 번호: 25의 UGT 효소를 사용한 스테비아 잎 추출물로부터 RebI으로의 전환을 나타낸다. (주로 스테비오시드와 RebA를 함유한) 스테비아 잎 추출물, 수크로스 및 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
9는 서열 번호: 31 및 서열 번호: 99의 UGT 효소를 사용한, 스테비아 잎 추출물로부터 RebB와 스테비올비오시드의 혼합물로의 생물전환을 나타낸다. 스테비아 잎 추출물, UDP 및 포도당을 생물전환 균주에 공급하였다. 생물전환은 37℃에서 48 시간 동안 일어났다. 역상 LC DAD에 의해 데이터를 정량화하여, 스테비올 글리코시드의 전환을 정량화하였다.
실시예 3: 스테비올 글리코시드의 회수
종래에, (발효 또는 전세포/용해물 생물전환 공정의 경우) 바이오매스 또는 (정제 효소에 의한 생물전환의 경우) 효소를 먼저 배양물에서 제거하여, 스테비올 글리코시드 (또는 다른 글리코시드 생성물)을 회수 및 정제할 것이다. 종래에는 회수의 초기 단계로서 미생물 세포의 파괴를 최소화하기 위해 바이오매스를 제거하는 것이 선호되는데, 그렇게 하지 않으면 세포 찌꺼기 (크고 작은 분자 모두)로 인해 정제 공정이 복잡해질 것이다. 스테비올 글리코시드의 회수를 위한 종래의 공정은 도 10에 요약되어 있다. 그러나, 본 발명의 구현예에 의하면, 생물전환 균주에 의해 생산된 배지는 점도가 매우 높을 것이며, 이는 바이오매스를 제거하고 스테비올 글리코시드를 회수하는데 어려움이 있다는 것을 나타낸다.
바이오매스의 제거에 앞서, 온도, pH 조절 및/또는 글리코시드 용해도 개선제의 첨가는, 이러한 어려움을 실질적으로 감소시킨다. 예를 들어, 이러한 처리로 인해 배양 물질의 점도를 낮출 수 있어서, 단백질의 침전뿐만 아니라 글리코시드의 가용화가 가능하여, 이후 바이오매스의 제거 및 회수가 용이해진다. 도 11에 개략된 공정에서, ≥95%의 스테비올 글리코시드를 갖는 최종 생성물(예를 들어, RebM)이 생성될 수 있다. 예를 들어, pH를 (시작 시 약 pH 7에서) 약 pH 2 내지 4의 범위로 낮추면, RebM의 용해도가 상당히 향상된다. 대안적으로, (처음에 약 pH 7에서) > pH 11로 pH를 증가시켜도, 용해도를 향상시킬 수 있다. 본 개시 내용에 의하면, pH 조절 및 용해도 개선제에 의해 >100 g/L 또는 >150 g/L 농도의 고순도 스테비올 글리코시드를 얻는 것이 가능하다. 예시적인 용해도 개선제는 글리세롤(예를 들어, 약 0.5 wt%) 및 1,3-프로판디올(예를 들어, 약 0.5 wt%)을 포함한다. 다른 용해도 개선제는 본원에 기재된 다른 것들 외에도, 폴리비닐 알콜, 폴리에틸렌 글리콜 및 폴리프로필렌 글리콜을 포함한다.
도 12는 원심분리 후 수성 배지로부터 바이오매스를 제거하는데 대한 다양한 처리의 효과를 나타낸다. 펠렛의 치밀도와 상청액의 투명도는 바이오매스 제거의 용이함을 나타내는 지표로서 작용한다. 간략히, 30 ml의 발효 배지에 이하의 처리를 단독으로 또는 조합하여 실시하였다: 30 분간 70℃로 가열, pH 3.78으로 산성화, 또는 15% v/v 에탄올의 첨가. 이후, 배지를 3000 rpm으로 5분 동안 원심분리하여, 분리 효율을 결정하였다. 그 결과, 분리에 대한 가열 및 산성화의 긍정적인 효과가 나타난다. 8 번 튜브는 가장 분리가 잘 되었다고 나타나는데, 70℃로 가열하고, pH를 3.78로 조절하였다. 7 번 튜브는 에탄올을 추가하여 pH를 3.78로 조절하였는데, 이 또한 분리가 양호한 것으로 나타났다.
표 5는 가열(70℃, 30 분) 및 산성화(pH 3.6)가 바이오매스의 제거에 필요한 공정 시간에 미치는 영향을 나타낸다. 간략히, 처리 및 비처리된 발효 배지를 GEA Westfalia SB7 분리기를 통과시켜, 바이오매스가 제거되었는지 시험한다. 비처리된 배지에 대해, 각각 L당 0.44 분의 공정 시간으로 SB7를 개별적으로 3 회 통과시킨 후, L당 2.2 분의 공정 시간으로 접선 유동 여과(TFF)를 실시하여, 하류 단계에서 바이오매스를 충분히 제거할 필요가 있다. 가열 및 산성화 처리를 하면, SB7를 단 1 회의 통과하는 것만으로도 충분한 바이오매스의 분리가 가능하여, 공정 시간이 8-배 넘게 빨라진다.
표 5
표 6은 RebM의 정량화 및 회수에 대한 가열과 산성화의 영향을 나타낸다. 간략히, 수성 배지 중의 RebM 농도는 가열(70℃, 15 분)과 산성화(pH 2.5)를 둘 다 처리하기 전과 후에 측정하였다. 처리 시, RebM 회수율이 비처리 조건에 비해 120 - 173% 개선되었다(7 개의 개별 샘플에서 평균 140% 개선됨).
표 6
표 7은 가열과 산 또는 염기 첨가의 조합, 및/또는 소분자 개선제의 첨가가 RebM의 용해도에 미치는 영향을 나타낸다. 발효 배지를 70℃의 일정한 온도로 유지하고, 여기에 표 7에 기재된 바와 같이 처리를 달리 하였다. RebM을 일정하게 교반하면서 천천히 첨가하여, RebM의 최대 용해도를 결정하였다. 배지의 산성화는 RebM 용해도를 증가시켰고, 소분자 개선제(글리세롤, 1,3-프로판디올)의 첨가도 마찬가지였다. 일부 경우, 개선제의 첨가에 더하여 pH의 변화(염기 첨가)로 인해, RebM 용해도가 추가로 증가하였다.
표 7
여기에 기재된 공정은 이하의 것들을 포함하는 바람직한 품질의 생성물을 생산할 수 있다: ≥95%의 글리코시드(예를 들어, RebM 또는 mog.V) 순도, 매력적인 백색 색상, 용이한 가용화, 무취 및 높은 회수 수율. 특히, 배양물에 대해 pH 및 온도를 먼저 조절하면, 배지의 유체 특징을 변화시킬 수 있고, 디스크 스택 분리기의 바이오매스 제거 효율도 증가시킬 수 있다. 또한, 글리코시드의 용해도 및 나아가 수율은 pH 및 온도 조절에 의해 실질적으로 증가하여, (고체 상의 글리코시드 생성물의 실질적인 손실을 피한다).
상기 공정은 하나 이상의 결정화 단계를 이용할 수 있다. 결정화 공정은 정지 상 후, 교반 상, 및 선택적으로 증발상을 포함하여, 결정의 형태를 조절할 수 있다. 정지상은 결정성 도메인의 정도가 심한 큰 결정으로 자랄 수 있다. 결정화는 결정을 분주하는 공정을 포함하거나, 또는 걸정의 분주와 관계없는 시스템을 사용할 수 있다(즉, 결정은 자발적으로 형성된다). 예를 들어, 결정의 분주 공정을 사용하는 경우, 정지 상에서 결정을 분주한 후, 교반 상에서 결정이 신속하게 성장하여, 무정형 도메인의 정도가 커질 것이다. 이 공정을 사용하면, 생성된 결정은 최종 용해도가 양호해질 수 있다. 생성된 결정은 고순도의 스테비올 글리코시드(예를 들어, RebM)를 가질 것이고, 회수와 세척이 더욱 용이할 것이다. 재결정화에서, 에시적인 재결정화 용액계는 물을 포함할 수 있거나, 또는 일부 구현예에서는 에탄올(예를 들어, 1:2 EtOH:H2O)를 포함한다. 일부 구현예에서, 재결정화 용액은 (예를 들어, 최대 2%의) 글리세롤을 추가로 포함한다. 재결정화를 위한 용액의 pH는 예컨대 약 4.0에서 약 12.0으로 달라질 수 있다.
재결정화에 앞서, 용액을 여과할 수 있다. 추가로, 필터 물질의 선택은 최종 생성물의 품질에 유의한 영향을 미칠 수 있다. 예를 들어, 도 13은 재결정화에 앞서 용액을 여과하기 위한 소수성 필터 물질, 예컨대 폴리프로필렌(PP) 및 비교적 친수성인 물질, 예컨대 폴리에테르술폰(PES)의 이용을 비교한다(둘 다 0.2-마이크론의 기공 크기를 갖는다). RebM 최종 생성물(>98%)을 프로필렌 글리콜에 10 wt%의 농도로 용해한다. 도 13에 도시된 바와 같이, PP 필터를 사용한 경우 매우 뿌연 용액이 생성되지만(좌측), PES 필터 물질을 사용할 때에는 투명한 용액이 생성된다(우측). 따라서, PES 필터 물질 및 유사한 친수성 물질은 아마도 불순물을 흡착함으로써 유의한 장점을 제공한다.
결정화 시스템의 열역학과 속도론을 이해하는 것이 산업 공정을 적절히 설계하는데 매우 중요하다. 예를 들어, 열역학적 용해도는 소정의 온도에서 용매가 도달할 수 있는 최대 농도(포화도 또는 용해도)를 나타낸다. 이 용해도 곡선 위의 영역(예를 들어, 도 14 참고)은 과포화 상태이고, 아래의 영역은 불포화상태이다. 결정화가 진행되려면, 용액이 과포화되어야 한다. 과포화를 이루는 한 가지 방법은, 포화 용액의 온도를 감소시키는 것이다. 그러나, 이 맥락에서 결정화는 바로 개시되지 않으며; 오히려, 시스템은 특정 너비를 갖는 과포화 공간의 준안정성 구역으로 들어간다. 이 구역에서는, 자발적인 핵화가 없으나, 시드 결정을 첨가함으로써 결정화가 시작될 수 있다. 냉각 중에 시드를 첨가하지 않은 경우, 시스템은 준안정성 구역의 가장자리에 도달하여, 자발적 점 핵화가 일어날 지점을 지나친다. 과포화 정도가 클수록 핵화 속도가 빨라질 것이어서, 입자 크기 및 결정 성장률에 유의한 영향을 미칠 것이다. 또한, 용해도 및 준안정성 구역의 너비에 대한 지식이 있다면, 바람직한 결정 크기 분포(CSD)를 갖고, 또한 실용적인 속도로 진행하는 산업적 결정화 공정을 설계할 수 있다. 비분주형 결정화의 경우, (예를 들어, 매우 작은 결정을 생산하는) 과다한 자발적 핵화의 부정적인 영향 없이 결정화가 시작되려면, 준안정성 구역의 가장자리에 도달하여 이를 약간 넘어서야 한다. 공정이 진행함에 따라, 농도가 떨어져서 준안정성 구역으로 돌아가며, 이후 전체 결정화 기간 동안 (냉각, 증발 등에 의해) 과포화를 유지할 필요가 있다. 분주형 결정화의 경우, 자발적인 핵화를 피하기 위해 준안정성 구역을 넘지 않는 것이 중요하고, 시드는 용액이 포화된 후에 첨가되어야 하며, 따라서 시드 결정이 용해되지 않고 핵화를 개시한다. 분주형 및 비분주형 결정화의 경우 둘 다에서, 시스템의 열역학과 속도론을 이해하면, 결정화 공정의 상승 속도 (또는 증발 속도) 뿐만 아니라 핵화점을 설계할 수 있다.
상이한 용매계에서 RebM의 용해도를 이해하고, 용해도 향상의 효과를 탐구하는 연구에 착수하여, 결정 형성 및 성장을 위한 분주 및 온도 경사의 하강 전략을 수립하였다. 이러한 연구에서, Technobis Crystallization system의 Crystal 16 시스템(Crystalline Series)을 사용하여, (용해도에 대한 대용물로서) 온도 경사가 상승하는 동안의 투명점(Clear Point)과, (준안정성 구역의 너비에 대한 대용물로서) 경사가 감소하는 동안의 혼탁점(Cloud Point)을 생성하였다. 다양한 용매계들을 평가하였다.
표 8: 재결정화 단계에 대한 실험 설계
도 14는 용해도 (아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 물 중 RebM (pH 7.0, 0% 글리세롤)에서 결정할 때, 준안정성 영역의 너비를 지정하여 이 용매계에서의 결정 성장을 조절할 수 있게 한다.
도 15a, 15b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 7의 67% 물/33% 에탄올 중 RebM에 대해 결정할 때, 준안정성 영역의 너비를 지정하여 결정 성장을 조절할 수 있게 한다. 도 15a는 0% 글리세롤이나, 도 15b는 0.5% 글리세롤을 포함한다.
도 16a, 16b는 용해도(아래 곡선) 및 준안정성 제한 곡선(윗쪽 곡선)을 나타내는데, 이는 pH 11의 67% 물/33% 에탄올 중 RebM에서 결정할 때, 준안정성 영역의 너비를 지정하여, 이 용매계에서 결정 성장을 조절할 수 있게 한다. 도 16a는 0% 글리세롤이나, 도 16b는 0.5% 글리세롤을 포함한다.
일부 구현예에서, 회수 공정은 하나 이상의 접선 유동 여과(TFF) 단계를 포함할 것이다. 예를 들어, 약 5 kD의 기공 크기를 갖는 필터에 의한 TFF는 내독소, 큰 단백질 및 다른 세포 찌꺼기를 제거할 수 있으나, 최종 분말 생성물의 용해도도 개선시킬 수 있다. 또한, 기공 크기가 약 0.5 kD인 필터에 의한 TFF를 하류에서 이용하여, 소분자의 불순물 및 염을 제거하고/거나, 재결정화를 위한 모액을 농축할 수도 있다.
바스켓 원심분리 단계에서, 세척은 물에 의한 세척을 이용할 수 있거나, 대안적으로 다른 헹굼을 이용할 수 있다. 예를 들어, 냉수/에탄올(예를 들어, 15% 에탄올)은 케이크의 품질을 개선시킬 수 있다. 모액은 세척수로 이용될 수 있거나, 또는 재활용할 수 있다.
이용할 수 있는 다른 공정은, 활성탄 처리, 벤토나이트 처리, 이온 교환 크로마토그래피 및 증발에 의한 농축을 포함한다. 특히, 습윤된 케이크를 EtOH:H2O에 용해시킨 후 활성탄을 처리하면, 최종 생성물의 색상이 개선될 수 있다.
실시예 4: 모그롤 또는 모그롤 글리코시드 전구체의 생물전환
본원에 기재된 조작된 박테리아 균주는, 테르페노이드 글리코시드를 포함하나 이에 제한되지 않는 다양한 기질들의 당화에 사용될 수 있다. 일부 양태에서, 본 발명은 모그롤 또는 모그로시드 스캐폴드에 대해 활성을 갖는 UGT 효소를 식별한다. 다양한 모그로시드들의 생산을 위한 당화 경로는 도 22에 제공되어 있다. 도 17a b는 모그롤로부터 모그로시드 중간물질로의 생물전환을 나타낸다. UGT 효소를 발현하는 조작된 E. 콜리 균주(샤시 균주)를 96-웰에서 모그롤과 함께 인큐베이션하였다. 생성물의 형성은 48 시간 후에 평가하였다. 기록된 값은 과잉의 빈 벡터 대조군에서의 값이다. 생성물은 LC-MS/MS에서 인증 기준에 의해 측정하였다. 도 17a에 나타난 바와 같이, 효소 1(서열 번호: 71) 및 효소 2(서열 번호: 33)의 UGT 효소는 둘 다 주로 모그롤로부터 Mog.IA를 생산하며, Mog.IE 및/또는 Mog.IIE는 더욱 소량으로 형성한다. 도 17b는 효소 1(서열 번호: 71), 효소 3(서열 번호: 33), 효소 4(서열 번호: 82) 및 효소 5(서열 번호: 83)를 발현하는 조작된 E. 콜리 균주를 사용한, 모그롤로부터 모그로시드-IA로의 생물전환을 나타낸다.
도 18a 도 18b는 Mog. IA(도 18a) 또는 Mog. IE(도 18b)로부터 Mog. IIE로의 생물전환을 나타낸다. 실험에서, UGT 효소인 서열 번호: 84, 서열 번호: 71 또는 서열 번호: 33을 발현하는 조작된 E. 콜리 샤시 균주를, 37℃에서 96-웰 플레이트 내의 Mog. IA(도 18a) 또는 Mog. IE(도 18b)를 함유한 발효액에서 인큐베이션하였다. 생성물의 형성은 48 시간 후에 평가하였다. 생성물은 LC-MS/MS에서 인증 기준에 의해 측정하였다. 과잉의 빈 벡터 대조군에서 Mog.IIE 수준의 값을 계산하였다. 도 18a에 나타난 바와 같이, 서열 번호: 84 및 서열 번호: 71은 Mog.IA로부터 Mog.IIE로의 생물전환을 촉매화할 수 있다. 유사하게, 도 18b에 나타난 바와 같이, 서열 번호: 84, 서열 번호: 71 및 서열 번호: 33은 Mog.IE로부터 Mog.IIE로의 생물전환을 촉매화할 수 있다.
도 19는 Mog.II-E로부터 Mog.III 또는 시아메노시드의 생산을 나타낸다. 실험에서, UGT 효소인 서열 번호: 72, 서열 번호: 54 또는 서열 번호: 13을 발현하는 조작된 E. 콜리 균주를, 37℃에서 48 시간 동안 Mog.II-E를 함유한 발효액에서 키웠다. 생성물은 LCMS/MS에서 각 화합물의 인증 기준에 의해 정량화하였다. 도 19에 나타난 바와 같이, 모든 균주들은 Mog. IIE로부터 Mog.III로의 생물전환을 촉매화할 수 있다. 또한, 서열 번호: 13의 효소는 상당한 양의 시아메노시드도 생산하는 것으로 나타났다.
도 20은 Mog. II-A2의 생산을 나타낸다. Mog. I-E를 시험관 내에서 공급하였다. 실험에서, UGT 효소인 서열 번호: 73을 발현하는 조작된 E. 콜리 균주(샤시 균주)를, 37℃에서 48 시간 동안 인큐베이션하였다. 생성물은 LC-MS/MS에서 각 화합물의 인증 기준에 의해 정량화하였다. 도 20에 나타난 바와 같이, 서열 번호: 73은 Mog. IE로부터 Mog. II-A2로의 생물전환을 촉매화할 수 있다.
모그롤의 C3 및 C24 하이드록실에서 관찰된 1 차 당화 반응에 대한 요약은 표 8에 제공되어 있다. 특히, 다양한 UGT 효소를 발현하는 세포에 모그롤을 공급하였다. 반응물을 37℃에서 48 시간 동안 인큐베이션하였다. 생성물을 LCMS/MS에서 각 화합물의 인증 기준에 의해 정량화하였다.
표 8
분지형 당화 반응에 대한 요약은 표 9에 제공되어 있다. Mog. IIE 또는 Mog. IE를, 다양한 UGT 효소를 발현하는 세포에 공급하였다. 반응물을 37℃에서 48 시간 동안 인큐베이션하였다. 생성물은 LC-MS/MS에서 각 화합물의 인증 기준에 의해 정량화되었다. "간접" 증거는 기질의 소모가 관찰된다는 것을 의미한다.
표 9
본 발명의 구현예는 지금부터 첨부된 청구 범위에 대해 정의될 것이다.
서열
수크로스 합성효소
서열 번호: 1: 감자( Solanum tuberosum ) (StSus1)
MAERVLTRVHSLRERVDATLAAHRNEILLFLSRIESHGKGILKPHELLAEFDAIRQDDKNKLNEHAFEELLKSTQEAIVLPPWVALAIRLRPGVWEYIRVNVNALVVEELSVPEYLQFKEELVDGASNGNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRAHHYKGKTMMLNDRIQNSNTLQNVLRKAEEYLIMLPPETPYFEFEHKFQEIGLEKGWGDTAERVLEMVCMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIIPRILIVTRLLPDAVGTTCGQRIEKVYGAEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFIEDVAKEISAELQAKPDLIIGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYWKKFDEKYHFSSQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGINVFDPKFNIVSPGADINLYFSYSETEKRLTAFHPEIDELLYSDVENDEHLCVLKDRTKPILFTMARLDRVKNLTGLVEWYAKNPRLRGLVNLVVVGGDRRKESKDLEEQAEMKKMYELIETHNLNGQFRWISSQMNRVRNGELYRYIADTKGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVHGKSGFHIDPYHGEQAADLLADFFEKCKKDPSHWETISMGGLKRIEEKYTWQIYSESLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKYRKMAEAVPLAAE
서열 번호: 2: 감자 (StSus2)
MAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFESIHKEDKDKLNDHAFEEVLKSTQEAIVLPPWVALAIRLRPGVWEYVRVNVNALIVEELTVPEFLQFKEELVNGTSNDNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHYKGKTMMLNDRIQNLYTLQKVLRKAEEYLTTLSPETSYSAFEHKFQEIGLERGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIKPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFIEDVGKEITAELQAKPDLIIGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYLNKFDEKYHFSAQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKFNIVSPGADVNLYFPYSEKEKRLTTFHPEIEDLLFSDVENEEHLCVLKDRNKPIIFTMARLDRVKNLTGLVEWYAKNPRLRELVNLVVVGGDRRKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMSCGLPTFATNQGGPAEIIVHGKSGFQIDPYHGEQAADLLADFFEKCKVDPSHWEAISEGGLKRIQEKYTWQIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLAQLVPLAVE
서열 번호: 3: 감자 (StSus2_S11E)
MAERVLTRVHELRERLDATLAAHRNEILLFLSRIESHGKGILKPHQLLAEFESIHKEDKDKLNDHAFEEVLKSTQEAIVLPPWVALAIRLRPGVWEYVRVNVNALIVEELTVPEFLQFKEELVNGTSNDNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHYKGKTMMLNDRIQNLYTLQKVLRKAEEYLTTLSPETSYSAFEHKFQEIGLERGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDIKPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFIEDVGKEITAELQAKPDLIIGNYSEGNLAASLLAHKLGVTQCTIAHALEKTKYPDSDIYLNKFDEKYHFSAQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKFNIVSPGADVNLYFPYSEKEKRLTTFHPEIEDLLFSDVENEEHLCVLKDRNKPIIFTMARLDRVKNLTGLVEWYAKNPRLRELVNLVVVGGDRRKESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMSCGLPTFATNQGGPAEIIVHGKSGFQIDPYHGEQAADLLADFFEKCKVDPSHWEAISEGGLKRIQEKYTWQIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLAQLVPLAVE
서열 번호: 4: 아시디티오바실러스 칼두스( Acidithiobacillus caldus )(AcSuSy)
MAIEALRQQLLDDPRSWYAFLRHLVASQRDSWLYTDLQRACADFREQLPEGYAEGIGPLEDFVAHTQEVIFRDPWMVFAWRPRPGRWIYVRIHREQLALEELSTDAYLQAKEGIVGLGAEGEAVLTVDFRDFRPVSRRLRDESTIGDGLTHLNRRLAGRIFSDLAAGRSQILEFLSLHRLDGQNLMLSNGNTDFDSLRQTVQYLGTLPRETPWAEIREDMRRRGFAPGWGNTAGRVRETMRLLMDLLDSPSPAALESFLDRIPMISRILIVSIHGWFAQDKVLGRPDTGGQVVYILDQARALEREMRNRLRQQGVDVEPRILIATRLIPESDGTTCDQRLEPVVGAENVQILRVPFRYPDGRIHPHWISRFKIWPWLERYAQDLEREVLAELGSRPDLIIGNYSDGNLVATLLSERLGVTQCNIAHALEKSKYLYSDLHWRDHEQDHHFACQFTADLIAMNAADIIVTSTYQEIAGNDREIGQYEGHQDYTLPGLYRVENGIDVFDSKFNIVSPGADPRFYFSYARTEERPSFLEPEIESLLFGREPGADRRGVLEDRQKPLLLSMARMDRIKNLSGLAELYGRSSRLRGLANLVIIGGHVDVGNSRDAEEREEIRRMHEIMDHYQLDGQLRWVGALLDKTVAGELYRVVADGRGVFVQPALFEAFGLTVIEAMSSGLPVFATRFGGPLEIIEDGVSGFHIDPNDHEATAERLADFLEAARERPKYWLEISDAALARVAERYTWERYAERLMTIARIFGFWRFVLDRESQVMERYLQMFRHLQWRPLAHAVPME
서열 번호: 5: 아시디티오바실러스 칼두스 (AcSuSy_L637M-T640V)
MAIEALRQQLLDDPRSWYAFLRHLVASQRDSWLYTDLQRACADFREQLPEGYAEGIGPLEDFVAHTQEVIFRDPWMVFAWRPRPGRWIYVRIHREQLALEELSTDAYLQAKEGIVGLGAEGEAVLTVDFRDFRPVSRRLRDESTIGDGLTHLNRRLAGRIFSDLAAGRSQILEFLSLHRLDGQNLMLSNGNTDFDSLRQTVQYLGTLPRETPWAEIREDMRRRGFAPGWGNTAGRVRETMRLLMDLLDSPSPAALESFLDRIPMISRILIVSIHGWFAQDKVLGRPDTGGQVVYILDQARALEREMRNRLRQQGVDVEPRILIATRLIPESDGTTCDQRLEPVVGAENVQILRVPFRYPDGRIHPHWISRFKIWPWLERYAQDLEREVLAELGSRPDLIIGNYSDGNLVATLLSERLGVTQCNIAHALEKSKYLYSDLHWRDHEQDHHFACQFTADLIAMNAADIIVTSTYQEIAGNDREIGQYEGHQDYTLPGLYRVENGIDVFDSKFNIVSPGADPRFYFSYARTEERPSFLEPEIESLLFGREPGADRRGVLEDRQKPLLLSMARMDRIKNLSGLAELYGRSSRLRGLANLVIIGGHVDVGNSRDAEEREEIRRMHEIMDHYQLDGQLRWVGALMDKVVAGELYRVVADGRGVFVQPALFEAFGLTVIEAMSSGLPVFATRFGGPLEIIEDGVSGFHIDPNDHEATAERLADFLEAARERPKYWLEISDAALARVAERYTWERYAERLMTIARIFGFWRFVLDRESQVMERYLQMFRHLQWRPLAHAVPME
서열 번호: 6: 애기 장대( Arabidopsis thaliana ) (AtSus1)
MANAERMITRVHSQRERLNETLVSERNEVLALLSRVEAKGKGILQQNQIIAEFEALPEQTRKKLEGGPFFDLLKSTQEAIVLPPWVALAVRPRPGVWEYLRVNLHALVVEELQPAEFLHFKEELVDGVKNGNFTLELDFEPFNASIPRPTLHKYIGNGVDFLNRHLSAKLFHDKESLLPLLKFLRLHSHQGKNLMLSEKIQNLNTLQHTLRKAEEYLAELKSETLYEEFEAKFEEIGLERGWGDNAERVLDMIRLLLDLLEAPDPCTLETFLGRVPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALEIEMLQRIKQQGLNIKPRILILTRLLPDAVGTTCGERLERVYDSEYCDILRVPFRTEKGIVRKWISRFEVWPYLETYTEDAAVELSKELNGKPDLIIGNYSDGNLVASLLAHKLGVTQCTIAHALEKTKYPDSDIYWKKLDDKYHFSCQFTADIFAMNHTDFIITSTFQEIAGSKETVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADMSIYFPYTEEKRRLTKFHSEIEELLYSDVENKEHLCVLKDKKKPILFTMARLDRVKNLSGLVEWYGKNTRLRELANLVVVGGDRRKESKDNEEKAEMKKMYDLIEEYKLNGQFRWISSQMDRVRNGELYRYICDTKGAFVQPALYEAFGLTVVEAMTCGLPTFATCKGGPAEIIVHGKSGFHIDPYHGDQAADTLADFFTKCKEDPSHWDEISKGGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRLEARRYLEMFYALKYRPLAQAVPLAQDD
서열 번호: 7: 애기 장대 (AtSus3)
MANPKLTRVLSTRDRVQDTLSAHRNELVALLSRYVDQGKGILQPHNLIDELESVIGDDETKKSLSDGPFGEILKSAMEAIVVPPFVALAVRPRPGVWEYVRVNVFELSVEQLTVSEYLRFKEELVDGPNSDPFCLELDFEPFNANVPRPSRSSSIGNGVQFLNRHLSSVMFRNKDCLEPLLDFLRVHKYKGHPLMLNDRIQSISRLQIQLSKAEDHISKLSQETPFSEFEYALQGMGFEKGWGDTAGRVLEMMHLLSDILQAPDPSSLEKFLGMVPMVFNVVILSPHGYFGQANVLGLPDTGGQVVYILDQVRALETEMLLRIKRQGLDISPSILIVTRLIPDAKGTTCNQRLERVSGTEHTHILRVPFRSEKGILRKWISRFDVWPYLENYAQDAASEIVGELQGVPDFIIGNYSDGNLVASLMAHRMGVTQCTIAHALEKTKYPDSDIYWKDFDNKYHFSCQFTADLIAMNNADFIITSTYQEIAGTKNTVGQYESHGAFTLPGLYRVVHGIDVFDPKFNIVSPGADMTIYFPYSEETRRLTALHGSIEEMLYSPDQTDEHVGTLSDRSKPILFSMARLDKVKNISGLVEMYSKNTKLRELVNLVVIAGNIDVNKSKDREEIVEIEKMHNLMKNYKLDGQFRWITAQTNRARNGELYRYIADTRGAFAQPAFYEAFGLTVVEAMTCGLPTFATCHGGPAEIIEHGLSGFHIDPYHPEQAGNIMADFFERCKEDPNHWKKVSDAGLQRIYERYTWKIYSERLMTLAGVYGFWKYVSKLERRETRRYLEMFYILKFRDLVKTVPSTADD
서열 번호: 8: 녹두( Vigna radiate ) (VrSS1)
MATDRLTRVHSLRERLDETLSANRNEILALLSRIEGKGKGILQHHQVIAEFEEIPEESRQKLTDGAFGEVLRSTQEAIVLPPWVALAVRPRPGVWEYLRVNVHALVVEVLQPAEYLRFKEELVDGSSNGNFVLELDFEPFTASFPRPTLNKSIGNGVQFLNRHLSAKLFHDKESLHPLLEFLRLHSVKGKTLMLNDRIQNPDALQHVLRKAEEYLGTVPPETPYSAFEHKFQEIGLERGWGDNAERVLESIQLLLDLLEAPDPCTLETFLGRIPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALENEMLHRIKQQGLDIVPRILIITRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTENGIVRKWISRFEVWPYLETYTEDVAHELAKELQGKPDLIVGNYSDGNIVASLLAHKLGVTQCTIAHALEKTKYPESDIYWKKLEERYHFSCQFTADLFAMNHTDFIITSTFQEIAGSKDTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADQTIYFPHTETSRRLTSFHTEIEELLYSSVENEEHICVLKDRSKPIIFTMARLDRVKNITGLVEWYGKNAKLRELVNLVVVAGDRRKESKDLEEKAEMKKMYSLIETYKLNGQFRWISSQMNRVRNGELYRVIADTKGAFVQPAVYEAFGLTVVEAMTCGLPTFATCNGGPAEIIVHGKSGFHIDPYHGDRAADLLVEFFEKVKVDPSHWDKISQAGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRRESRRYLEMFYALKYRKLAESVPLAVE
서열 번호: 9: 녹두 (VrSS1_S11E)
MATDRLTRVHELRERLDETLSANRNEILALLSRIEGKGKGILQHHQVIAEFEEIPEESRQKLTDGAFGEVLRSTQEAIVLPPWVALAVRPRPGVWEYLRVNVHALVVEVLQPAEYLRFKEELVDGSSNGNFVLELDFEPFTASFPRPTLNKSIGNGVQFLNRHLSAKLFHDKESLHPLLEFLRLHSVKGKTLMLNDRIQNPDALQHVLRKAEEYLGTVPPETPYSAFEHKFQEIGLERGWGDNAERVLESIQLLLDLLEAPDPCTLETFLGRIPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALENEMLHRIKQQGLDIVPRILIITRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTENGIVRKWISRFEVWPYLETYTEDVAHELAKELQGKPDLIVGNYSDGNIVASLLAHKLGVTQCTIAHALEKTKYPESDIYWKKLEERYHFSCQFTADLFAMNHTDFIITSTFQEIAGSKDTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADQTIYFPHTETSRRLTSFHTEIEELLYSSVENEEHICVLKDRSKPIIFTMARLDRVKNITGLVEWYGKNAKLRELVNLVVVAGDRRKESKDLEEKAEMKKMYSLIETYKLNGQFRWISSQMNRVRNGELYRVIADTKGAFVQPAVYEAFGLTVVEAMTCGLPTFATCNGGPAEIIVHGKSGFHIDPYHGDRAADLLVEFFEKVKVDPSHWDKISQAGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRRESRRYLEMFYALKYRKLAESVPLAVE
서열 번호: 10: 대두( Glycine Max ) (GmSS)
MATDRLTRVHSLRERLDETLTANRNEILALLSRIEAKGKGILQHHQVIAEFEEIPEENRQKLTDGAFGEVLRSTQEAIVLPPWVALAVRPRPGVWEYLRVNVHALVVEELQPAEYLHFKEELVDGSSNGNFVLELDFEPFNAAFPRPTLNKSIGNGVQFLNRHLSAKLFHDKESLHPLLEFLRLHSVKGKTLMLNDRIQNPDALQHVLRKAEEYLGTVPPETPYSEFEHKFQEIGLERGWGDNAERVLESIQLLLDLLEAPDPCTLETFLGRIPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALENEMLHRIKQQGLDIVPRILIITRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYLETYTEDVAHELAKELQGKPDLIVGNYSDGNIVASLLAHKLGVTQCTIAHALEKTKYPESDIYWKKLEERYHFSCQFTADLFAMNHTDFIITSTFQEIAGSKDTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADQTIYFPHTETSRRLTSFHPEIEELLYSSVENEEHICVLKDRSKPIIFTMARLDRVKNITGLVEWYGKNAKLRELVNLVVVAGDRRKESKDLEEKAEMKKMYGLIETYKLNGQFRWISSQMNRVRNGELYRVICDTRGAFVQPAVYEAFGLTVVEAMTCGLPTFATCNGGPAEIIVHGKSGFHIDPYHGDRAADLLVDFFEKCKLDPTHWDKISKAGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRRESRRYLEMFYALKYRKLAESVPLAAE
서열 번호: 11: 대두 (GmSS_S11E)
MATDRLTRVHELRERLDETLTANRNEILALLSRIEAKGKGILQHHQVIAEFEEIPEENRQKLTDGAFGEVLRSTQEAIVLPPWVALAVRPRPGVWEYLRVNVHALVVEELQPAEYLHFKEELVDGSSNGNFVLELDFEPFNAAFPRPTLNKSIGNGVQFLNRHLSAKLFHDKESLHPLLEFLRLHSVKGKTLMLNDRIQNPDALQHVLRKAEEYLGTVPPETPYSEFEHKFQEIGLERGWGDNAERVLESIQLLLDLLEAPDPCTLETFLGRIPMVFNVVILSPHGYFAQDNVLGYPDTGGQVVYILDQVRALENEMLHRIKQQGLDIVPRILIITRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRKWISRFEVWPYLETYTEDVAHELAKELQGKPDLIVGNYSDGNIVASLLAHKLGVTQCTIAHALEKTKYPESDIYWKKLEERYHFSCQFTADLFAMNHTDFIITSTFQEIAGSKDTVGQYESHTAFTLPGLYRVVHGIDVFDPKFNIVSPGADQTIYFPHTETSRRLTSFHPEIEELLYSSVENEEHICVLKDRSKPIIFTMARLDRVKNITGLVEWYGKNAKLRELVNLVVVAGDRRKESKDLEEKAEMKKMYGLIETYKLNGQFRWISSQMNRVRNGELYRVICDTRGAFVQPAVYEAFGLTVVEAMTCGLPTFATCNGGPAEIIVHGKSGFHIDPYHGDRAADLLVDFFEKCKLDPTHWDKISKAGLQRIEEKYTWQIYSQRLLTLTGVYGFWKHVSNLDRRESRRYLEMFYALKYRKLAESVPLAAE
서열 번호: 12: 아나베나 종 ( Anabaena sp. ) (AsSusA)
MASELMQAILDSEEKHDLRGFISELRQQDKNYLLRNDILNVYAEYCSKCQKPETSYKFSNLSKLIYYTQEIIPEDSNFCFIIRPKIAAQEVYRLTADLDVEPMTVQELLDLRDRLVNKFHPYEGDILELDFGPFYDYTPTIRDPKNIGKGVQYLNRYLSSKLFQDSQQWLESLFNFLRLHNYNGIQLLINHQIQSQQQLSQQVKNALNFVSDRPNDEPYEQFRLQLQTMGFEPGWGNTASRVRDTLNILDELIDSPDPQTLEAFISRIPMIFRIVLVSAHGWFGQEGVLGRPDTGGQVVYVLDQAKNLEKQLQEDAILAGLEVLNVQPKVIILTRLIPNSDGTLCNQRLEKVYGTENAWILRVPLREFNPKMTQNWISRFEFWPYLETFAIDSERELLAEFQGRPDLIVGNYTDGNLVAFLLTRRMKVTQCNIAHALEKSKYLFSNLYWQDLEEKYHFSLQFTADLIAMNAANFVISSTYQEIVGTPDSIGQYESYKCFTMPELYHVVNGIELFSPKFNVVPPGVNENSYFPYTQTQNRIESDRDRLEEMLFTLEDSSQIFGKLDDPNKRPIFSMARLDRIKNLTGLAECFGQSQELQERCNLILVAGKLRIEESEDNEEKDEIVKLYRIIDEYNLHGKIRWLGVRLSKNDSGEIYRVICDRQGIFVQPALFEAFGLTILESMISGLPTFATQFGGPLEIIQDKINGFYINPTHLEETATKILDFVTKCEQNPNYWNIISEKAIDRVYSTYTWKIHTTKLLTLARIYGFWNFTSKEKREDLLRYLESLFYLIYKPRAQQLLEQHKYR
우리딘 디포스페이트-의존성 당전이효소(UGT)
서열 번호: 13: 합성 서열 (MbUGT1,2.2)
MATKGSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAEMIASIADERLEHAETESPAAAGQGRPAAAPTFEVARMKLIR
서열 번호: 14: 합성 서열 (MbUGT1,2.3)
MATKNSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPITGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDSFHHWAAAAALEHKVPCAMMLLGSAEMIASIADERLEHAETESPAAAGQGRPAAAPTFEVARMKLIR
서열 번호: 15: 합성 서열 (MbUGT1,2.4)
MARRTKNSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLPEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPITGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQEKAKKLQEIVADMACHERYIDGFIQQLRSYKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDSFHHWAAAAALEHKVPCAMMFLGSAEMIASIADERLEHAETESPAAAGQGRPAAAPTFEVARMKLIR
서열 번호: 16: 합성 서열 (MbUGT1,2.5)
MARRTKNSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLPEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQAAILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPITGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQEKAKKLQEIVADMACHERYIDGFIQQLRSYKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDSFHHWAAAAALEHKVPCAMMFLGSAEMIASIADERLEHAETESPAAAGQGRPAAAPTFEVARMKLIR
서열 번호: 17: SrUGT85C2 ( 스테비아 레바우디아나 )
MDAMATTEKKPHVIFIPFPAQSHIKAMLKLAQLLHHKGLQITFVNTDFIHNQFLESSGPHCLDGAPGFRFETIPDGVSHSPEASIPIRESLLRSIETNFLDRFIDLVTKLPDPPTCIISDGFLSVFTIDAAKKLGIPVMMYWTLAACGFMGFYHIHSLIEKGFAPLKDASYLTNGYLDTVIDWVPGMEGIRLKDFPLDWSTDLNDKVLMFTTEAPQRSHKVSHHIFHTFDELEPSIIKTLSLRYNHIYTIGPLQLLLDQIPEEKKQTGITSLHGYSLVKEEPECFQWLQSKEPNSVVYVNFGSTTVMSLEDMTEFGWGLANSNHYFLWIIRSNLVIGENAVLPPELEEHIKKRGFIASWCSQEKVLKHPSVGGFLTHCGWGSTIESLSAGVPMICWPYSWDQLTNCRYICKEWEVGLEMGTKVKRDEVKRLVQELMGEGGHKMRNKAKDWKEKARIAIAPNGSSSLNIDKMVKEITVLARN
서열 번호: 18: SrUGT74G1 ( 스테비아 레바우디아나 )
MAEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLNHSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTTIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKANHHECMNWLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKLPENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVVAMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGVIIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKA
서열 번호: 19: SrUGT76G1 ( 스테비아 레바우디아나 )
MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSL
서열 번호: 20: 합성 서열 (MbUGT1-3)
MANWQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYS
서열 번호: 21: UGT76G1_L200A ( 스테비아 레바우디아나 , L200A)
MAENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSL
서열 번호: 22: 합성 서열 (MbUGT1-3_0)
MAKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDS
서열 번호: 23: 합성 서열 (MbUGT1-3_1)
MAFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHGGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRLMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLGSGGSGGSGRRRRIILFPVPFQGHINPMLQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSQS
서열 번호: 24: 합성 서열 (MbUGT1-3_2)
MAFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHGGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRLMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLGSGGSGRRRRIILFPVPFQGHINPMLQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELQMLASEEDEEVSCLITDALWYFAQSVADSLNLPRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLEHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSQS
서열 번호: 25: 합성 서열 (MbUGT1-3_3)
MAFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHGGWNSTLESVCEGVPMIFQDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRLMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLGSGGSGRRRRIILFPVPFQGHINPMLQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDHGPLAGMRIPIINEHGADELRRELELQMLASEEDEEVSCLITDALWYFAQSVADSLNLPRLVLMTSSLFNFHCHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAFSNWQIAKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLEHDRTVFQWLDQQPPSSVIYVSFGSTSEVDEKDFLEIARGLVDSQS
서열 번호: 26: SrUGT91D1 ( 스테비아 레바우디아나 )
MYNVTYHQNSKAMATSDSIVDDRKQLHVATFPWLAFGHILPFLQLSKLIAEKGHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIQYLKKAVDGLQPEVTRFLEQHSPDWIIYDFTHYWLPSIAASLGISRAYFCVITPWTIAYLAPSSDAMINDSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARMEPYEAPGISDGYRMGMVFKGSDCLLFKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDETWVSIKKWLDGKQKGSVVYVALGSEALVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIMLPIFCDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVENEGEIYKANARALSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES
서열 번호: 27: SrUGT91D2 ( 스테비아 레바우디아나 )
MATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTRFLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMINGSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVLKGSDCLLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEVPGDEKDETWVSIKKWLDGKQKGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIMLPIFGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVEKEGEIYKANARELSKIYNDTKVEKEYVSQFVDYLEKNTRAVAIDHES
서열 번호: 28: SrUGT91D2e ( 스테비아 레바우디아나 )
MATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTRFLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMINGSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVLKGSDCLLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDETWVSIKKWLDGKQKGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIMLPIFGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVEKEGEIYKANARELSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES
서열 번호: 29: OsUGT1-2 (벼 ( Oryza sativa ))
MDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGMSLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKD
서열 번호: 30: 합성 서열 (MbUGTC19)
MAECMNWLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKLPENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVVAMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGVIIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKAGSGEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLNHSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTTIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKANHH
서열 번호: 31: 합성 서열 (MbUGTC19-2)
MANHHECMNWLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKLPENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVVAMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGVIIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKAGSGEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLNHSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTTIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKA
서열 번호: 32: MbUGTC13 ( 스테비아 레바우디아나 UGT85C2, P215T)
MADAMATTEKKPHVIFIPFPAQSHIKAMLKLAQLLHHKGLQITFVNTDFIHNQFLESSGPHCLDGAPGFRFETIPDGVSHSPEASIPIRESLLRSIETNFLDRFIDLVTKLPDPPTCIISDGFLSVFTIDAAKKLGIPVMMYWTLAACGFMGFYHIHSLIEKGFAPLKDASYLTNGYLDTVIDWVPGMEGIRLKDFPLDWSTDLNDKVLMFTTEATQRSHKVSHHIFHTFDELEPSIIKTLSLRYNHIYTIGPLQLLLDQIPEEKKQTGITSLHGYSLVKEEPECFQWLQSKEPNSVVYVNFGSTTVMSLEDMTEFGWGLANSNHYFLWIIRSNLVIGENAVLPPELEEHIKKRGFIASWCSQEKVLKHPSVGGFLTHCGWGSTIESLSAGVPMICWPYSWDQLTNCRYICKEWEVGLEMGTKVKRDEVKRLVQELMGEGGHKMRNKAKDWKEKARIAIAPNGSSSLNIDKMVKEITVLARN
서열 번호: 33: SgUGT720-269-1 ( 시라이티아 그로스베노리 )
MEDRNAMDMSRIKYRPQPLRPASMVQPRVLLFPFPALGHVKPFLSLAELLSDAGIDVVFLSTEYNHRRISNTEALASRFPTLHFETIPDGLPPNESRALADGPLYFSMREGTKPRFRQLIQSLNDGRWPITCIITDIMLSSPIEVAEEFGIPVIAFCPCSARYLSIHFFIPKLVEEGQIPYADDDPIGEIQGVPLFEGLLRRNHLPGSWSDKSADISFSHGLINQTLAAGRASALILNTFDELEAPFLTHLSSIFNKIYTIGPLHALSKSRLGDSSSSASALSGFWKEDRACMSWLDCQPPRSVVFVSFGSTMKMKADELREFWYGLVSSGKPFLCVLRSDVVSGGEAAELIEQMAEEEGAGGKLGMVVEWAAQEKVLSHPAVGGFLTHCGWNSTVESIAAGVPMMCWPILGDQPSNATWIDRVWKIGVERNNREWDRLTVEKMVRALMEGQKRVEIQRSMEKLSKLANEKVVRGINLHPTISLKKDTPTTSEHPRHEFENMRGMNYEMLVGNAIKSPTLTKK
서열 번호: 34: SgUGT94-289-3 ( 시라이티아 그로스베노리 )
MTIFFSVEILVLGIAEFAAIAMDAAQQGDTTTILMLPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAIKPKLPSSFSDSIQFVELHLPSSPEFPPHLHTTNGLPPTLMPALHQAFSMAAQHFESILQTLAPHLLIYDSLQPWAPRVASSLKIPAINFNTTGVFVISQGLHPIHYPHSKFPFSEFVLHNHWKAMYSTADGASTERTRKRGEAFLYCLHASCSVILINSFRELEGKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVNFIWVVRFPQGDNTSGIEDALPKGFLERAGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHVDQPFNAGLVEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKGEEKFDEMVAEISLLLKI
서열 번호: 35: SgUGT74-345-2 ( 시라이티아 그로스베노리 )
MDETTVNGGRRASDVVVFAFPRHGHMSPMLQFSKRLVSKGLRVTFLITTSATESLRLNLPPSSSLDLQVISDVPESNDIATLEGYLRSFKATVSKTLADFIDGIGNPPKFIVYDSVMPWVQEVARGRGLDAAPFFTQSSAVNHILNHVYGGSLSIPAPENTAVSLPSMPVLQAEDLPAFPDDPEVVMNFMTSQFSNFQDAKWIFFNTFDQLECKKQSQVVNWMADRWPIKTVGPTIPSAYLDDGRLEDDRAFGLNLLKPEDGKNTRQWQWLDSKDTASVLYISFGSLAILQEEQVKELAYFLKDTNLSFLWVLRDSELQKLPHNFVQETSHRGLVVNWCSQLQVLSHRAVSCFVTHCGWNSTLEALSLGVPMVAIPQWVDQTTNAKFVADVWRVGVRVKKKDERIVTKEELEASIRQVVQGEGRNEFKHNAIKWKKLAKEAVDEGGSSDKNIEEFVKTIA
서열 번호: 36: SgUGT75-281-2 ( 시라이티아 그로스베노리 )
MGDNGDGGEKKELKENVKKGKELGRQAIGEGYINPSLQLARRLISLGVNVTFATTVLAGRRMKNKTHQTATTPGLSFATFSDGFDDETLKPNGDLTHYFSELRRCGSESLTHLITSAANEGRPITFVIYSLLLSWAADIASTYDIPSALFFAQPATVLALYFYYFHGYGDTICSKLQDPSSYIELPGLPLLTSQDMPSFFSPSGPHAFILPPMREQAEFLGRQSQPKVLVNTFDALEADALRAIDKLKMLAIGPLIPSALLGGNDSSDASFCGDLFQVSSEDYIEWLNSKPDSSVVYISVGSICVLSDEQEDELVHALLNSGHTFLWVKRSKENNEGVKQETDEEKLKKLEEQGKMVSWCRQVEVLKHPALGCFLTHCGWNSTIESLVSGLPVVAFPQQIDQATNAKLIEDVWKTGVRVKANTEGIVEREEIRRCLDLVMGSRDGQKEEIERNAKKWKELARQAIGEGGSSDSNLKTFLWEIDLEI
서열 번호: 37: SgUGT720-269-4 ( 시라이티아 그로스베노리 )
MAEQAHDLLHVLLFPFPAEGHIKPFLCLAELLCNAGFHVTFLNTDYNHRRLHNLHLLAARFPSLHFESISDGLPPDQPRDILDPKFFISICQVTKPLFRELLLSYKRISSVQTGRPPITCVITDVIFRFPIDVAEELDIPVFSFCTFSARFMFLYFWIPKLIEDGQLPYPNGNINQKLYGVAPEAEGLLRCKDLPGHWAFADELKDDQLNFVDQTTASSRSSGLILNTFDDLEAPFLGRLSTIFKKIYAVGPIHSLLNSHHCGLWKEDHSCLAWLDSRAAKSVVFVSFGSLVKITSRQLMEFWHGLLNSGKSFLFVLRSDVVEGDDEKQVVKEIYETKAEGKWLVVGWAPQEKVLAHEAVGGFLTHSGWNSILESIAAGVPMISCPKIGDQSSNCTWISKVWKIGLEMEDRYDRVSVETMVRSIMEQEGEKMQKTIAELAKQAKYKVSKDGTSYQNLECLIQDIKKLNQIEGFINNPNFSDLLRV
서열 번호: 38: SgUGT94-289-2 ( 시라이티아 그로스베노리 )
MDAQQGHTTTILMLPWVGYGHLLPFLELAKSLSRRKLFHIYFCSTSVSLDAIKPKLPPSISSDDSIQLVELRLPSSPELPPHLHTTNGLPSHLMPALHQAFVMAAQHFQVILQTLAPHLLIYDILQPWAPQVASSLNIPAINFSTTGASMLSRTLHPTHYPSSKFPISEFVLHNHWRAMYTTADGALTEEGHKIEETLANCLHTSCGVVLVNSFRELETKYIDYLSVLLNKKVVPVGPLVYEPNQEGEDEGYSSIKNWLDKKEPSSTVFVSFGTEYFPSKEEMEEIAYGLELSEVNFIWVLRFPQGDSTSTIEDALPKGFLERAGERAMVVKGWAPQAKILKHWSTGGLVSHCGWNSMMEGMMFGVPIIAVPMHLDQPFNAGLVEEAGVGVEAKRDSDGKIQREEVAKSIKEVVIEKTREDVRKKAREMDTKHGPTYFSRSKVSSFGRLYKINRPTTLTVGRFWSKQIKMKRE
서열 번호: 39: SgUGT94-289-1 ( 시라이티아 그로스베노리 )
MDAQRGHTTTILMFPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAIKPKLPSSSSSDSIQLVELCLPSSPDQLPPHLHTTNALPPHLMPTLHQAFSMAAQHFAAILHTLAPHLLIYDSFQPWAPQLASSLNIPAINFNTTGASVLTRMLHATHYPSSKFPISEFVLHDYWKAMYSAAGGAVTKKDHKIGETLANCLHASCSVILINSFRELEEKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVHFIWVVRFPQGDNTSAIEDALPKGFLERVGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHLDQPFNAGLAEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKGEEKMDEMVAAISLFLKI
서열 번호: 40: McUGT1 (여주 ( Momordica charantia ))
MAQPQTQARVLVFPYPTVGHIKPFLSLAELLADGGLDVVFLSTEYNHRRIPNLEALASRFPTLHFDTIPDGLPIDKPRVIIGGELYTSMRDGVKQRLRQVLQSYNDGSSPITCVICDVMLSGPIEAAEELGIPVVTFCPYSARYLCAHFVMPKLIEEGQIPFTDGNLAGEIQGVPLFGGLLRRDHLPGFWFVKSLSDEVWSHAFLNQTLAVGRTSALIINTLDELEAPFLAHLSSTFDKIYPIGPLDALSKSRLGDSSSSSTVLTAFWKEDQACMSWLDSQPPKSVIFVSFGSTMRMTADKLVEFWHGLVNSGTRFLCVLRSDIVEGGGAADLIKQVGETGNGIVVEWAAQEKVLAHRAVGGFLTHCGWNSTMESIAAGVPMMCWQIYGDQMINATWIGKVWKIGIERDDKWDRSTVEKMIKELMEGEKGAEIQRSMEKFSKLANDKVVKGGTSFENLELIVEYLKKLKPSN
서열 번호: 41: McUGT2 (여주)
MAQPRVLLFPFPAMGHVKPFLSLAELLSDAGVEVVFLSTEYNHRRIPDIGALAARFPTLHFETIPDGLPPDQPRVLADGHLYFSMLDGTKPRFRQLIQSLNGNPRPITCIINDVMLSSPIEVAEEFGIPVIAFCPCSARFLSVHFFMPNFIEEAQIPYTDENPMGKIEEATVFEGLLRRKDLPGLWCAKSSNISFSHRFINQTIAAGRASALILNTFDELESPFLNHLSSIFPKIYCIGPLNALSRSRLGKSSSSSSALAGFWKEDQAYMSWLESQPPRSVIFVSFGSTMKMEAWKLAEFWYGLVNSGSPFLFVFRPDCVINSGDAAEVMEGRGRGMVVEWASQEKVLAHPAVGGFLTHCGWNSTVESIVAGVPMMCCPIVADQLSNATWIHKVWKIGIEGDEKWDRSTVEMMIKELMESQKGTEIRTSIEMLSKLANEKVVKGGTSLNNFELLVEDIKTLRRPYT
서열 번호: 42: McUGT3 (여주)
MEQSDSNSDDHQHHVLLFPFPAKGHIKPFLCLAQLLCGAGLQVTFLNTDHNHRRIDDRHRRLLATQFPMLHFKSISDGLPPDHPRDLLDGKLIASMRRVTESLFRQLLLSYNGYGNGTNNVSNSGRRPPISCVITDVIFSFPVEVAEELGIPVFSFATFSARFLFLYFWIPKLIQEGQLPFPDGKTNQELYGVPGAEGIIRCKDLPGSWSVEAVAKNDPMNFVKQTLASSRSSGLILNTFEDLEAPFVTHLSNTFDKIYTIGPIHSLLGTSHCGLWKEDYACLAWLDARPRKSVVFVSFGSLVKTTSRELMELWHGLVSSGKSFLLVLRSDVVEGEDEEQVVKEILESNGEGKWLVVGWAPQEEVLAHEAIGGFLTHSGWNSTMESIAAGVPMVCWPKIGDQPSNCTWVSRVWKVGLEMEERYDRSTVARMARSMMEQEGKEMERRIAELAKRVKYRVGKDGESYRNLESLIRDIKITKSSN
서열 번호: 43: McUGT4 (여주)
MDAHQQAEHTTTILMLPWVGYGHLTAYLELAKALSRRNFHIYYCSTPVNIESIKPKLTIPCSSIQFVELHLPSSDDLPPNLHTTNGLPSHLMPTLHQAFSAAAPLFEEILQTLCPHLLIYDSLQPWAPKIASSLKIPALNFNTSGVSVIAQALHAIHHPDSKFPLSDFILHNYWKSTYTTADGGASEKTRRAREAFLYCLNSSGNAILINTFRELEGEYIDYLSLLLNKKVIPIGPLVYEPNQDEDQDEEYRSIKNWLDKKEPCSTVFVSFGSEYFPSNEEMEEIAPGLEESGANFIWVVRFPKLENRNGIIEEGLLERAGERGMVIKEWAPQARILRHGSIGGFVSHCGWNSVMESIICGVPVIGVPMRVDQPYNAGLVEEAGVGVEAKRDPDGKIQRHEVSKLIKQVVVEKTRDDVRKKVAQMSEILRRKGDEKIDEMVALISLLPKG
서열 번호: 44: McUGT5 (여주)
MDARQQAEHTTTILMLPWVGYGHLSAYLELAKALSRRNFHIYYCSTPVNIESIKPKLTIPCSSIQFVELHLPFSDDLPPNLHTTNGLPSHLMPALHQAFSAAAPLFEAILQTLCPHLLIYDSLQPWAPQIASSLKIPALNFNTTGVSVIARALHTIHHPDSKFPLSEIVLHNYWKATHATADGANPEKFRRDLEALLCCLHSSCNAILINTFRELEGEYIDYLSLLLNKKVTPIGPLVYEPNQDEEQDEEYRSIKNWLDKKEPYSTIFVSFGSEYFPSNEEMEEIARGLEESGANFIWVVRFHKLENGNGITEEGLLERAGERGMVIQGWAPQARILRHGSIGGFVSHCGWNSVMESIICGVPVIGVPMGLDQPYNAGLVEEAGVGVEAKRDPDGKIQRHEVSKLIKQVVVEKTRDDVRKKVAQMSEILRRKGDEKIDEMVALISLLLKG
서열 번호: 45 (오이 ( Cucumis sativus ))
MGLSPTDHVLLFPFPAKGHIKPFFCLAHLLCNAGLRVTFLSTEHHHQKLHNLTHLAAQIPSLHFQSISDGLSLDHPRNLLDGQLFKSMPQVTKPLFRQLLLSYKDGTSPITCVITDLILRFPMDVAQELDIPVFCFSTFSARFLFLYFSIPKLLEDGQIPYPEGNSNQVLHGIPGAEGLLRCKDLPGYWSVEAVANYNPMNFVNQTIATSKSHGLILNTFDELEVPFITNLSKIYKKVYTIGPIHSLLKKSVQTQYEFWKEDHSCLAWLDSQPPRSVMFVSFGSIVKLKSSQLKEFWNGLVDSGKAFLLVLRSDALVEETGEEDEKQKELVIKEIMETKEEGRWVIVNWAPQEKVLEHKAIGGFLTHSGWNSTLESVAVGVPMVSWPQIGDQPSNATWLSKVWKIGVEMEDSYDRSTVESKVRSIMEHEDKKMENAIVELAKRVDDRVSKEGTSYQNLQRLIEDIEGFKLN
서열 번호: 46: CmaUGT1 (서양 호박 ( Cucurbita maxima ))
MELSHTHHVLLFPFPAKGHIKPFFSLAQLLCNAGLRVTFLNTDHHHRRIHDLNRLAAQLPTLHFDSVSDGLPPDEPRNVFDGKLYESIRQVTSSLFRELLVSYNNGTSSGRPPITCVITDVMFRFPIDIAEELGIPVFTFSTFSARFLFLIFWIPKLLEDGQLRYPEQELHGVPGAEGLIRWKDLPGFWSVEDVADWDPMNFVNQTLATSRSSGLILNTFDELEAPFLTSLSKIYKKIYSLGPINSLLKNFQSQPQYNLWKEDHSCMAWLDSQPRKSVVFVSFGSVVKLTSRQLMEFWNGLVNSGMPFLLVLRSDVIEAGEEVVREIMERKAEGRWVIVSWAPQEEVLAHDAVGGFLTHSGWNSTLESLAAGVPMISWPQIGDQTSNSTWISKVWRIGLQLEDGFDSSTIETMVRSIMDQTMEKTVAELAERAKNRASKNGTSYRNFQTLIQDITNIIETHI
서열 번호: 47: (복숭아 ( Prunus persica ))
MAMKQPHVIIFPFPLQGHMKPLLCLAELLCHAGLHVTYVNTHHNHQRLANRQALSTHFPTLHFESISDGLPEDDPRTLNSQLLIALKTSIRPHFRELLKTISLKAESNDTLVPPPSCIMTDGLVTFAFDVAEELGLPILSFNVPCPRYLWTCLCLPKLIENGQLPFQDDDMNVEITGVPGMEGLLHRQDLPGFCRVKQADHPSLQFAINETQTLKRASALILDTVYELDAPCISHMALMFPKIYTLGPLHALLNSQIGDMSRGLASHGSLWKSDLNCMTWLDSQPSKSIIYVSFGTLVHLTRAQVIEFWYGLVNSGHPFLWVMRSDITSGDHQIPAELENGTKERGCIVDWVSQEEVLAHKSVGGFLTHSGWNSTLESIVAGLPMICWPKLGDHYIISSTVCRQWKIGLQLNENCDRSNIESMVQTLMGSKREEIQSSMDAISKLSRDSVAEGGSSHNNLEQLIEYIRNLQHQN
서열 번호: 48: (카카오 ( Theobroma cacao ))
MRQPHVLVLPFPAQGHIKPMLCLAELLCQAGLRVTFLNTHHSHRRLNNLQDLSTRFPTLHFESVSDGLPEDHPRNLVHFMHLVHSIKNVTKPLLRDLLTSLSLKTDIPPVSCIIADGILSFAIDVAEELQIKVIIFRTISSCCLWSYLCVPKLIQQGELQFSDSDMGQKVSSVPEMKGSLRLHDRPYSFGLKQLEDPNFQFFVSETQAMTRASAVIFNTFDSLEAPVLSQMIPLLPKVYTIGPLHALRKARLGDLSQHSSFNGNLREADHNCITWLDSQPLRSVVYVSFGSHVVLTSEELLEFWHGLVNSGKRFLWVLRPDIIAGEKDHNQIIAREPDLGTKEKGLLVDWAPQEEVLAHPSVGGFLTHCGWNSTLESMVAGVPMLCWPKLPDQLVNSSCVSEVWKIGLDLKDMCDRSTVEKMVRALMEDRREEVMRSVDGISKLARESVSHGGSSSSNLEMLIQELET
서열 번호: 49: CmaUGT2 (서양 호박)
MDAQKAVDTPPTTVLMLPWIGYGHLSAYLELAKALSRRNFHVYFCSTPVNLDSIKPNLIPPPSSIQFVDLHLPSSPELPPHLHTTNGLPSHLKPTLHQAFSAAAQHFEAILQTLSPHLLIYDSLQPWAPRIASSLNIPAINFNTTAVSIIAHALHSVHYPDSKFPFSDFVLHDYWKAKYTTADGATSEKIRRGAEAFLYCLNASCDVVLVNSFRELEGEYMDYLSVLLKKKVVSVGPLVYEPSEGEEDEEYWRIKKWLDEKEALSTVLVSFGSEYFPSKEEMEEIAHGLEESEANFIWVVRFPKGEESCRGIEEALPKGFVERAGERAMVVKKWAPQGKILKHGSIGGFVSHCGWNSVLESIRFGVPVIGVPMHLDQPYNAGLLEEAGIGVEAKRDADGKIQRDQVASLIKRVVVEKTREDIWKTVREMREVLRRRDDDMIDEMVAEISVVLKI
서열 번호: 50: CmoUGT2 (서양 호박)
MDAQKAVDTPPTTVLMLPWIGYGHLSAYLELAKALSRRNFHVYFCSTPVNLDSIKPNLIPPPPSIQFVDLHLPSSPELPPHLHTTNGLPSHLKPTLHQAFSAAAQHFEAILQTLSPHLLIYDSLQPWAPRIASSLNIPAINFNTTAVSIIAHALHSVHYPDSKFPFSDFVLHDYWKAKYTTADGATSEKTRRGVEAFLYCLNASCDVVLVNSFRELEGEYMDYLSVLLKKKVVSVGPLVYEPSEGEEDEEYWRIKKWLDEKEALSTVLVSFGSEYFPPKEEMEEIAHGLEESEANFIWVVRFPKGEESSSRGIEEALPKGFVERAGERAMVVKKWAPQGKILKHGSIGGFVSHCGWNSVLESIRFGVPVIGAPMHLDQPYNAGLLEEAGIGVEAKRDADGKIQRDQVASLIKQVVVEKTREDIWKKVREMREVLRRRDDDDMMIDEMVAVISVVLKI
서열 번호: 51: CmaUGT3 (서양 호박)
MSSNLFLKISIPFGRLRDSALNCSVFHCKLHLAIAIAMDAQQAANKSPTATTIFMLPWAGYGHLSAYLELAKALSTRNFHIYFCSTPVSLASIKPRLIPSCSSIQFVELHLPSSDEFPPHLHTTNGLPSRLVPTFHQAFSEAAQTFEAFLQTLRPHLLIYDSLQPWAPRIASSLNIPAINFFTAGAFAVSHVLRAFHYPDSQFPSSDFVLHSRWKIKNTTAESPTQAKLPKIGEAIGYCLNASRGVILTNSFRELEGKYIDYLSVILKKRVFPIGPLVYQPNQDEEDEDYSRIKNWLDRKEASSTVLVSFGSEFFLSKEETEAIAHGLEQSEANFIWGIRFPKGAKKNAIEEALPEGFLERAGGRAMVVEEWVPQGKILKHGSIGGFVSHCGWNSAMESIVCGVPIIGIPMQVDQPFNAGILEEAGVGVEAKRDSDGKIQRDEVAKLIKEVVVERTREDIRNKLEKINEILRSRREEKLDELATEISLLSRN
서열 번호: 52: CmoUGT3 (서양 호박)
MDAQQAANKSPTASTIFMLPWVGYGHLSAYLELAKALSTRNFHVYFCSTPVSLASIKPRLIPSCSSIQFVELHLPSSDEFPPHLHTTNGLPAHLVPTIHQAFAAAAQTFEAFLQTLRPHLLIYDSLQPWAPRIASSLNIPAINFFTAGAFAVSHVLRAFHYPDSQFPSSDFVLHSRWKIKNTTAESPTQVKIPKIGEAIGYCLNASRGVILTNSFRELEGKYIDYLSVILKKRVLPIGPLVYQPNQDEEDEDYSRIKNWLDRKEASSTVLVSFGSEFFLSKEETEAIAHGLEQSEANFIWGIRFPKGAKKNAIEEALPEGFLERVGGRAMVVEEWVPQGKILKHGNIGGFVSHCGWNSAMESIMCGVPVIGIPMQVDQPFNAGILEEAGVGVEAKRDSDGKIQRDEVAKLIKEVVVERTREDIRNKLEEINEILRTRREEKLDELATEISLLCKN
서열 번호: 53: (황마 ( Crchorus capsularis ))
MDSKQKKMSVLMFPWLAYGHISPFLELAKKLSKRNFHTFFFSTPINLNSIKSKLSPKYAQSIQFVELHLPSLPDLPPHYHTTNGLPPHLMNTLKKAFDMSSLQFSKILKTLNPDLLVYDFIQPWAPLLALSNKIPAVHFLCTSAAMSSFSVHAFKKPCEDFPFPNIYVHGNFMNAKFNNMENCSSDDSISDQDRVLQCFERSTKIILVKTFEELEGKFMDYLSVLLNKKIVPTGPLTQDPNEDEGDDDERTKLLLEWLNKKSKSSTVFVSFGSEYFLSKEEREEIAYGLELSKVNFIWVIRFPLGENKTNLEEALPQGFLQRVSERGLVVENWAPQAKILQHSSIGGFVSHCGWSSVMESLKFGVPIIAIPMHLDQPLNARLVVDVGVGLEVIRNHGSLEREEIAKLIKEVVLGNGNDGEIVRRKAREMSNHIKKKGEKDMDELVEELMLICKMKPNSCHLS
서열 번호: 54: (대추 ( Ziziphus jujube ))
MMERQRSIKVLMFPWLAHGHISPFLELAKRLTDRNFQIYFCSTPVNLTSVKPKLSQKYSSSIKLVELHLPSLPDLPPHYHTTNGLALNLIPTLKKAFDMSSSSFSTILSTIKPDLLIYDFLQPWAPQLASCMNIPAVNFLSAGASMVSFVLHSIKYNGDDHDDEFLTTELHLSDSMEAKFAEMTESSPDEHIDRAVTCLERSNSLILIKSFRELEGKYLDYLSLSFAKKVVPIGPLVAQDTNPEDDSMDIINWLDKKEKSSTVFVSFGSEYYLTNEEMEEIAYGLELSKVNFIWVVRFPLGQKMAVEEALPKGFLERVGEKGMVVEDWAPQMKILGHSSIGGFVSHCGWSSLMESLKLGVPIIAMPMQLDQPINAKLVERSGVGLEVKRDKNGRIEREYLAKVIREIVVEKARQDIEKKAREMSNIITEKGEEEIDNVVEELAKLCGM
서열 번호: 55: (흑자색 포도 ( Vitis vinifera ))
MDARQSDGISVLMFPWLAHGHISPFLQLAKKLSKRNFSIYFCSTPVNLDPIKGKLSESYSLSIQLVKLHLPSLPELPPQYHTTNGLPPHLMPTLKMAFDMASPNFSNILKTLHPDLLIYDFLQPWAPAAASSLNIPAVQFLSTGATLQSFLAHRHRKPGIEFPFQEIHLPDYEIGRLNRFLEPSAGRISDRDRANQCLERSSRFSLIKTFREIEAKYLDYVSDLTKKKMVTVGPLLQDPEDEDEATDIVEWLNKKCEASAVFVSFGSEYFVSKEEMEEIAHGLELSNVDFIWVVRFPMGEKIRLEDALPPGFLHRLGDRGMVVEGWAPQRKILGHSSIGGFVSHCGWSSVMEGMKFGVPIIAMPMHLDQPINAKLVEAVGVGREVKRDENRKLEREEIAKVIKEVVGEKNGENVRRKARELSETLRKKGDEEIDVVVEELKQLCSY
서열 번호: 56: (호두 나무 ( Juglans regia ))
MDTARKRIRVVMLPWLAHGHISPFLELSKKLAKRNFHIYFCSTPVNLSSIKPKLSGKYSRSIQLVELHLPSLPELPPQYHTTKGLPPHLNATLKRAFDMAGPHFSNILKTLSPDLLIYDFLQPWAPAIAASQNIPAINFLSTGAAMTSFVLHAMKKPGDEFPFPEIHLDECMKTRFVDLPEDHSPSDDHNHISDKDRALKCFERSSGFVMMKTFEELEGKYINFLSHLMQKKIVPVGPLVQNPVRGDHEKAKTLEWLDKRKQSSAVFVSFGTEYFLSKEEMEEIAYGLELSNVNFIWVVRFPEGEKVKLEEALPEGFLQRVGEKGMVVEGWAPQAKILMHPSIGGFVSHCGWSSVMESIDFGVPIVAIPMQLDQPVNAKVVEQAGVGVEVKRDRDGKLEREEVATVIREVVMGNIGESVRKKEREMRDNIRKKGEEKMDGVAQELVQLYGNGIKNV
서열 번호: 57: (파라 고무 나무 ( Hevea brasiliensis ))
METLQRRKISVLMFPWLAHGHLSPFLELSKKLNKRNFHVYFCSTPVNLDSIKPKLSAEYSFSIQLVELHLPSSPELPLHYHTTNGLPPHLMKNLKNAFDMASSSFFNILKTLKPDLLIYDFIQPWAPALASSLNIPAVNFLCTSMAMSCFGLHLNNQEAKFPFPGIYPRDYMRMKVFGALESSSNDIKDGERAGRCMDQSFHLILAKTFRELEGKYIDYLSVKLMKKIVPVGPLVQDPIFEDDEKIMDHHQVIKWLEKKERLSTVFVSFGTEYFLSTEEMEEIAYGLELSKAHFIWVVRFPTGEKINLEESLPKRYLERVQERGKIVEGWAPQQKILRHSSIGGFVSHCGWSSIMESMKFGVPIIAMPMNLDQPVNSRIVEDAGVGIEVRRNKSGELEREEIAKTIRKVVVEKDGKNVSRKAREMSDTIRKKGEEEIDGVVDELLQLCDVKTNYLQ
서열 번호: 58: (카사바 ( Manihot esculenta ))
MATAQTRKISVLMFPWLAHGHLSPFLELSKKLANRNFHVYFCSTPVNLDSIKPKLSPEYHFSIQFVELHLPSSPELPSHYHTTNGLPPHLMKTLKKAFDMASSSFFNILKTLNPDLLIYDFLQPWAPALASSLNIPAVNFLCSSMAMSCFGLNLNKNKEIKFLFPEIYPRDYMEMKLFRVFESSSNQIKDGERAGRCIDQSFHVILAKTFRELEGKYIDYVSVKCNKKIVPVGPLVEDTIHEDDEKTMDHHHHHHDEVIKWLEKKERSTTVFVSFGSEYFLSKEEMEEIAHGLELSKVNFIWVVRFPKGEKINLEESLPEGYLERIQERGKIVEGWAPQRKILGHSSIGGFVSHCGWSSIMESMKLGVPIIAMPMNLDQPINSRIVEAAGVGIEVSRNQSGELEREEMAKTIRKVVVEREGVYVRRKAREMSDVLRKKGEEEIDGVVDELVQLCDMKTNYL
서열 번호: 59: (세팔로투스 ( Cephalotus follicularis ))
MDLKRRSIRVLMLPWLAHGHISPFLELAKKLTNRNFLIYFCSTPINLNSIKPKLSSKYSFSIQLVELHLPSLPELPPHYHTTNGLPLHLMNTLKTAFDMASPSFLNILKTLKPDLLICDHLQPWAPSLASSLNIPAIIFPTNSAIMMAFSLHHAKNPGEEFPFPSININDDMVKSINFLHSASNGLTDMDRVLQCLERSSNTMLLKTFRQLEAKYVDYSSALLKKKIVLAGPLVQVPDNEDEKIEIIKWLDSRGQSSTVFVSFGSEYFLSKEEREDIAHGLELSKVNFIWVVRFPVGEKVKLEEALPNGFAERIGERGLVVEGWAPQAMILSHSSIGGFVSHCGWSSMMESMKFGVPIIAMPMHIDQPLNARLVEDVGVGLEIKRNKDGRFEREELARVIKEVLVYKNGDAVRSKAREMSEHIKKNGDQEIDGVADALVKLCEMKTNSLNQD
서열 번호: 60: UGT_1,6 (코페아 아라비카 ( Coffea Arabica ))
MENHATFNVLMLPWLAHGHVSPYLELAKKLTARNFNVYLCSSPATLSSVRSKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAKPNFCNVLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYPYGNAIFYRDYESVFVENLTRRDRDTYRVINCMERSSKIILIKGFNEIEGKYFDYFSCLTGKKVVPVGPLVQDPVLDDEDCRIMQWLNKKEKGSTVFVSFGSEYFLSKKDMEEIAHGLEVSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKILTHPNVGGFVSHCGWNSVMESMKFGLPIIAMPMHLDQPINARLIEEVGAGVEVLRDSKGKLHRERMAETINKVMKEASGESVRKKARELQEKLELKGDEEIDDVVKELVQLCATKNKRNGLHYY
서열 번호: 61: CmoUGT1 (서양 호박)
MELSPTHHLLLFPFPAKGHIKPFFSLAQLLCNAGARVTFLNTDHHHRRIHDLDRLAAQLPTLHFDSVSDGLPPDESRNVFDGKLYESIRQVTSSLFRELLVSYNNGTSSGRPPITCVITDCMFRFPIDIAEELGIPVFTFSTFSARFLFLFFWIPKLLEDGQLRYPEQELHGVPGAEGLIRCKDLPGFLSDEDVAHWKPINFVNQILATSRSSGLILNTFDELEAPFLTSLSKIYKKIYSLGPINSLLKNFQSQPQYNLWKEDHSCMAWLDSQPPKSVVFVSFGSVVKLTNRQLVEFWNGLVNSGKPFLLVLRSDVIEAGEEVVRENMERKAEGRWMIVSWAPQEEVLAHDAVGGFLTHSGWNSTLESLAAGVPMISWTQIGDQTSNSTWVSKVWRIGLQLEDGFDSFTIETMVRSVMDQTMEKTVAELAERAKNRASKNGTSYRNFQTLIQDITNIIETH
서열 번호: 62: (애기 장대)
MGSISEMVFETCPSPNPIHVMLVSFQGQGHVNPLLRLGKLIASKGLLVTFVTTELWGKKMRQANKIVDGELKPVGSGSIRFEFFDEEWAEDDDRRADFSLYIAHLESVGIREVSKLVRRYEEANEPVSCLINNPFIPWVCHVAEEFNIPCAVLWVQSCACFSAYYHYQDGSVSFPTETEPELDVKLPCVPVLKNDEIPSFLHPSSRFTGFRQAILGQFKNLSKSFCVLIDSFDSLEREVIDYMSSLCPVKTVGPLFKVARTVTSDVSGDICKSTDKCLEWLDSRPKSSVVYISFGTVAYLKQEQIEEIAHGVLKSGLSFLWVIRPPPHDLKVETHVLPQELKESSAKGKGMIVDWCPQEQVLSHPSVACFVTHCGWNSTMESLSSGVPVVCCPQWGDQVTDAVYLIDVFKTGVRLGRGATEERVVPREEVAEKLLEATVGEKAEELRKNALKWKAEAEAAVAPGGSSDKNFREFVEKLGAGVTKTKDNGY
서열 번호: 63: (애기 장대)
MGSHVAQKQHVVCVPYPAQGHINPMMKVAKLLYAKGFHITFVNTVYNHNRLLRSRGPNAVDGLPSFRFESIPDGLPETDVDVTQDIPTLCESTMKHCLAPFKELLRQINARDDVPPVSCIVSDGCMSFTLDAAEELGVPEVLFWTTSACGFLAYLYYYRFIEKGLSPIKDESYLTKEHLDTKIDWIPSMKNLRLKDIPSFIRTTNPDDIMLNFIIREADRAKRASAIILNTFDDLEHDVIQSMKSIVPPVYSIGPLHLLEKQESGEYSEIGRTGSNLWREETECLDWLNTKARNSVVYVNFGSITVLSAKQLVEFAWGLAATGKEFLWVIRPDLVAGDEAMVPPEFLTATADRRMLASWCPQEKVLSHPAIGGFLTHCGWNSTLESLCGGVPMVCWPFFAEQQTNCKFSRDEWEVGIEIGGDVKREEVEAVVRELMDEEKGKNMREKAEEWRRLANEATEHKHGSSKLNFEMLVNKVLLGE
서열 번호: 64: ClUGT1 (바위 비둘기 ( Columba livia ))
MIHCGKKHICAFVTCILISASILMYSWKDPQLQNNITRKIFQATSALPASQLCRGKPAQNVITALEDNRTFIISPYFDDRESKVTRVIGIVHHEDVKQLYCWFCCQPDGKIYVARAKIDVHSDRFGFPYGAADIVCLEPENCNPTHVSIHQSPHANIDQLPSFKIKNRKSETFSVDFTVCISAMFGNYNNVLQFIQSVEMYKILGVQKVVIYKNNCSQLMEKVLKFYMEEGTVEIIPWPINSHLKVSTKWHFSMDAKDIGYYGQITALNDCIYRNMQRSKFVVLNDADEIILPLKHLDWKAMMSSLQEQNPGAGIFLFENHIFPKTVSTPVFNISSWNRVPGVNILQHVHREPDRKEVFNPKKMIIDPRQVVQTSVHSVLRAYGNSVNVPADVALVYHCRVPLQEELPRESLIRDTALWRYNSSLITNVNKVLHQTVL
서열 번호: 65: (헤모필루스 듀크레이 ( Haemophilus ducreyi ))
MPTLTVAMIVKNEAQDLAECLKTVDGWVDEIVIVDSGSTDDTLKIATQFNAKVYVNSDWQGFGPQRQFAQQYVTSDYVLWLDADERVTPELKASILQAVQHNQKNTVYKVSRLSEIFGKEIRYSGWYPDYVVRLYPTYLAKYGDELVHEKVHYPADSRVEKLQGDLLHFTYKNIHHYLVKSASYAKAWAMQRAKAGKKASLLDGVTHAIACFLKMYLFKAGFLDGKQGFLLAVLSAHSTFVKYADLWDRTRS
서열 번호: 66: (임질균 ( Neisseria gonorrhoeae ))
MKKVSVLIVAKNEANHIRECIESCRFDKEVIVIDDHSADNTAEIAEGLGAKVFRRHLNGDFGAQKTFAIEQAGGEWVFLIDADERCTPELSDEISKIVRTGDYAAYFVERRNLFPNHPATHGAMRPDSVCRLMPKKGGSVQGKVHETVQTPYPERRLKHFMYHYTYDNWEQYFNKFNKYTSISAEKYREQGKPVSFVRDIILRPIWGFFKIYILNKGFLDGKMGWIMSVNHSYYTMIKYVKLYYLYKSGGKF
서열 번호: 67: (리조비움 멜리로티 ( Rhizobium meliloti ), 균주 1021)
MPNETLHIDIGVCTYRRPELAETLRSLAAMNVPERARLRVIVADNDAEPSARALVEGLRPEMPFDILYVHCPHSNISIARNCCLDNSTGDFLAFLDDDETVSGDWLTRLLETARTTGAAAVLGPVRAHYGPTAPRWMRSGDFHSTLPVWAKGEIRTGYTCNALLRRDAASLLGRRFKLSLGKSGGEDTDFFTGMHCAGGTIAFSPEAWVHEPVPENRASLAWLAKRRFRSGQTHGRLLAEKAHGLRQAWNIALAGAKSGFCATAAVLCFPSAARRNRFALRAVLHAGVISGLLGLKEIEQYGAREVTSA
서열 번호: 68: (리조비움 라디오박터 ( Rhizobium radiobacter ))
MCRCGRAVRSRPVCRPGQLVVRRSPRPRSRNHSRCRPLRLSVFPRPHRRVRHHCQRDLRWEPGRWIAVRWKAARSHRRFRRCPFPRQLVWPVRERHRDAGDRRNQRERRRRDAYHEISEPKFRTRKRTESFWMNKAITVIVWLLVSLCVLAIITMPVSLQTHLVATAISLILLATIKSFNGQGAWRLVALGFGTAIVLRYVYWRTTSTLPPVNQLENFIPGFLLYLAEMYSVVMLGLSLVIVSMPLPSRKTRPGSPDYRPTVDVFVPSYNEDAELLANTLAAAKNMDYPADRFTVWLLDDGGSVQKRNAANIVEAQAAQRRHEELKKLCEDLDVRYLTRERNVHAKAGNLNNGLAHSTGELVTVFDADHAPARDFLLETVGYFDEDPRLFLVQTPHFFVNPDPIERNLRTFETMPSENEMFYGIIQRGLDKWNGAFFCGSAAVLRREALQDSDGFSGVSITEDCETALALHSRGWNSVYVDKPLIAGLQPATFASFIGQRSRWAQGMMQILIFRQPLFKRGLSFTQRLCYMSSTLFWLFPFPRTIFLFAPLFYLFFDLQIFVASGGEFLAYTAAYMLVNLMMQNYLYGSFRWPWISELYEYVQTVHLLPAVVSVIFNPGKPTFKVTAKDESIAEARLSEISRPFFVIFALLLVAMAFAVWRIYSEPYKADVTLVVGGWNLLNLIFAGCALGVVSERGDKSASRRITVKRRCEVQLGGSDTWVPASIDNVSVHGLLINIFDSATNIEKGATAIVKVKPHSEGVPETMPLNVVRTVRGEGFVSIGCTFSPQRAVDHRLIADLIFANSEQWSEFQRVRRKKPGLIRGTAIFLAIALFQTQRGLYYLVRARRPAPKSAKPVGAVK
서열 번호: 69: (스트렙토코쿠스 아갈락티애 ( Streptococcus agalactiae ))
MIKKIEKDLISVIVPIYNVEDYLVECIESLIVQTYRNIEILLINDGSTDNCATIAKEFSERDCRVIYIEKSNGGLSEARNYGIYHSKGKYLTFVDSDDKVSSDYIANLYNAIQKHDSSIAIGGYLEFYERHNSIRNYEYLDKVIPVEEALLNMYDIKTYGSIFITAWGKLFHKSIFNDLEFALNKYHEDEFFNYKAYLKANSITYIDKPLYHYRIRVGSIMNNSDNVIIARKKLDVLSALDERIKLITSLRKYSVFLQKTEIFYVNQYFRTKKFLKQQSVMFKEDNYIDAYRMYGRLLRKVKLVDKLKLIKNRFF
서열 번호: 70 (스트렙토코쿠스 뉴모니아 ( Streptococcus pneumonia ))
MYTFILMLLDFFQNHDFHFFMLFFVFILIRWAVIYFHAVRYKSYSCSVSDEKLFSSVIIPVVDEPLNLFESVLNRISRHKPSEIIVVINGPKNERLVKLCHDFNEKLENNMTPIQCYYTPVPGKRNAIRVGLEHVDSQSDITVLVDSDTVWTPRTLSELLKPFVCDKKIGGVTTRQKILDPERNLVTMFANLLEEIRAEGTMKAMSVTGKVGCLPGRTIAFRNIVERVYTKFIEETFMGFHKEVSDDRSLTNLTLKKGYKTVMQDTSVVYTDAPTSWKKFIRQQLRWAEGSQYNNLKMTPWMIRNAPLMFFIYFTDMILPMLLISFGVNIFLLKILNITTIVYTASWWEIILYVLLGMIFSFGGRNFKAMSRMKWYYVFLIPVFIIVLSIIMCPIRLLGLMRCSDDLGWGTRNLTE
서열 번호: 71: AtUGT73C3 (애기 장대)
MATEKTHQFHPSLHFVLFPFMAQGHMIPMIDIARLLAQRGVTITIVTTPHNAARFKNVLNRAIESGLAINILHVKFPYQEFGLPEGKENIDSLDSTELMVPFFKAVNLLEDPVMKLMEEMKPRPSCLISDWCLPYTSIIAKNFNIPKIVFHGMGCFNLLCMHVLRRNLEILENVKSDEEYFLVPSFPDRVEFTKLQLPVKANASGDWKEIMDEMVKAEYTSYGVIVNTFQELEPPYVKDYKEAMDGKVWSIGPVSLCNKAGADKAERGSKAAIDQDECLQWLDSKEEGSVLYVCLGSICNLPLSQLKELGLGLEESRRSFIWVIRGSEKYKELFEWMLESGFEERIKERGLLIKGWAPQVLILSHPSVGGFLTHCGWNSTLEGITSGIPLITWPLFGDQFCNQKLVVQVLKAGVSAGVEEVMKWGEEDKIGVLVDKEGVKKAVEELMGDSDDAKERRRRVKELGELAHKAVEKGGSSHSNITLLLQDIMQLAQFKN
서열 번호: 72: HvUGT B1 (재배 보리 ( Hordeum vulgare subsp. Vulgare ))
MAQAESERMRVVMFPWLAHGHINPYLELAKRLIASASGDHHLDVVVHLVSTPANLAPLAHHQTDRLRLVELHLPSLPDLPPALHTTKGLPARLMPVLKRACDLAAPRFGALLDELCPDILVYDFIQPWAPLEAEARGVPAFHFATCGAAATAFFIHCLKTDRPPSAFPFESISLGGVDEDAKYTALVTVREDSTALVAERDRLPLSLERSSGFVAVKSSADIERKYMEYLSQLLGKEIIPTGPLLVDSGGSEEQRDGGRIMRWLDGEEPGSVVFVSFGSEYFMSEHQMAQMARGLELSGVPFLWVVRFPNAEDDARGAARSMPPGFEPELGLVVEGWAPQRRILSHPSCGAFLTHCGWSSVLESMAAGVPMVALPLHIDQPLNANLAVELGAAAARVKQERFGEFTAEEVARAVRAAVKGKEGEAARRRARELQEVVARNNGNDGQIATLLQRMARLCGKDQAVPN
서열 번호: 73: HvUGT_B3 (재배 보리)
MAEANDGGKMHVVMLPWLAFGHVLPFTEFAKRVARQGHRVTLLSAPRNTRRLIDIPPGLAGLIRVVHVPLPRVDGLPEHAEATIDLPSDHLRPCLRRAFDAAFERELSRLLQEEAKPDWVLVDYASYWAPTAAARHGVPCAFLSLFGAAALSFFGTPETLLGIGRHAKTEPAHLTVVPEYVPFPTTVAYRGYEARELFEPGMVPDDSGVSEGYRFAKTIEGCQLVGIRSSSEFEPEWLRLLGELYRKPVIPVGLFPPAPQDDVAGHEATLRWLDGQAPSSVVYAAFGSEVKLTGAQLQRIALGLEASGLPFIWAFRAPTSTETGAASGGLPEGFEERLAGRGVVCRGWVPQVKFLAHASVGGFLTHAGWNSIAEGLAHGVRLVLLPLVFEQGLNARNIVDKNIGVEVARDEQDGSFAAGDIAAALRRVMVEDEGEGFGAKVKELAKVFGDDEVNDQCVREFLMHLSDHSKKNQGQD
서열 번호: 74: CcUGT_1,6 (코페아 카네포라 ( Coffea canephora ))
MAENHATFNVLMLPWLAHGHVSPYLELAMKLTARNFNVYLCSSPATLSSVRSKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAKPNFCNVLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYPYGNTIFYRDYESVFVENLKKRDRDTYRVVNCMERSSKIILIKGFKEIEGKYFDYFSCLTGKKVVPVGPLVQDPVLDDEDCRIMQWLNKKEKGSTVFVSFGSEYFLSKEDMEEIAHGLELSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKILTHPNVGGFVSHCGWNSVMESMKFGLPIVAMPMHLDQPINARLIEEVGAGVEVLRDSKGKLHRERMAETINKVTKEASGEPARKKARELQEKLELKGDEEIDDVVKELVQLCATKNKRNGLHCYN
서열 번호: 75: CeUGT_1,6 (코페아 유게니오이데스 ( Coffea eugenioides ))
MAENHATFNVLMLPWLAHGHVSPYLELAKKLTARNFNVYLCSSPATLSSVRSKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAEPNFCNVLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYPYGNTIFYRDYESVFVENLKRRDRDTYRVVNCMERSSKIILIKGFKEIEGKYFDYFSCLTGKKVVPVGPLVQDPVLDDEDCRIMQWLNKKEKGSTVFVSFGSEYFLSKEDMEEIAHGLELSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKILTHPNVGGFVSHCGWNSVMESMKFGLPIIAMPMHLDQPINARLIEEVGAGVEVLRDSKGKLHRERMAETINKVTKEASGESVRKKARELQEKLELKGDEEIDDVVKELVQLCATKNKRNGLHYN
서열 번호: 76: CeUGT_1,6.2 ( 코페아 유게니오이데스 )
MAENHATFNVLMLPWLAHGHVSPYLELAKKLTARNFNVYLCSSPATLSSVRSKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAKPNFCNVLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYPYGNAIFYRDYESVFVENLTRRDRDTYRVINCMERSSKIILIKGFNEIEGKYFDYFSCLTGKKVVPVGPLVQDPVLDDEDCEIMQWLNKKEKVSTVFVSFGSEYFLSKKDMEEIAHGLELSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKILTHPNVGGFVSHCGWNSVMESMKFGLPIIAMPMHLDQPINARLIEEVGAGVEVLRDSKGKLHRERMAETINKVMKEASGESVRKKARELQEKMDLKGDEEIDDVVKELVQLCATKNKRNGLHYY
서열 번호: 77: SgUGT94-289-3.2 ( 시라이티아 그로스베노리 )
MADAAQQGDTTTILMLPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAIKPKLPSSFSDSIQFVELHLPSSPEFPPHLHTTNGLPPTLMPALHQAFSMAAQHFESILQTLAPHLLIYDSLQPWAPRVASSLKIPAINFNTTGVFVISQGLHPIHYPHSKFPFSEFVLHNHWKAMYSTADGASTERTRKRGEAFLYCLHASCSVILINSFRELEGKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVNFIWVVRFPQGDNTSGIEDALPKGFLERAGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHVDQPFNAGLVEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKGEEKFDEMVAEISLLLKI
서열 번호: 78: OsJUGT_1, 6 (벼) (OsJUGT_1, 6)
MAQAERERLRVLMFPWLAHGHINPYLELATRLTTTSSSQIDVVVHLVSTPVNLAAVAHRRTDRISLVELHLPELPGLPPALHTTKHLPPRLMPALKRACDLAAPAFGALLDELSPDVVLYDFIQPWAPLEAAARGVPAVHFSTCSAAATAFFLHFLDGGGGGGGRGAFPFEAISLGGAEEDARYTMLTCRDDGTALLPKGERLPLSFARSSEFVAVKTCVEIESKYMDYLSKLVGKEIIPCGPLLVDSGDVSAGSEADGVMRWLDGQEPGSVVLVSFGSEYFMTEKQLAEMARGLELSGAAFVWVVRFPQQSPDGDEDDHGAAAARAMPPGFAPARGLVVEGWAPQRRVLSHRSCGAFLTHCGWSSVMESMSAGVPMVALPLHIDQPVGANLAAELGVAARVRQERFGEFEAEEVARAVRAVMRGGEALRRRATELREVVARRDAECDEQIGALLHRMARLCGKGTGRAAQLGH
서열 번호: 79: PgUGT94_B1 (인삼 ( Panax ginseng ))
MADNQNGRISIALLPFLAHGHISPFFELAKQLAKRNCNVFLCSTPINLSSIKDKDSSASIKLVELHLPSSPDLPPHYHTTNGLPSHLMLPLRNAFETAGPTFSEILKTLNPDLLIYDFNPSWAPEIASSHNIPAVYFLTTAAASSSIGLHAFKNPGEKYPFPDFYDNSNITPEPPSADNMKLLHDFIACFERSCDIILIKSFRELEGKYIDLLSTLSDKTLVPVGPLVQDPMGHNEDPKTEQIINWLDKRAESTVVFVCFGSEYFLSNEELEEVAIGLEISTVNFIWAVRLIEGEKKGILPEGFVQRVGDRGLVVEGWAPQARILGHSSTGGFVSHCGWSSIAESMKFGVPVIAMARHLDQPLNGKLAAEVGVGMEVVRDENGKYKREGIAEVIRKVVVEKSGEVIRRKARELSEKMKEKGEQEIDRALEELVQICKKKKDEQ
서열 번호: 80: 선택적인 His 태그를 갖는 SrUGT73E1 (스테비아 레바우디아나)
MAHHHHHHVGTGSNDDDDKSPDPNWASTSELVFIPSPGAGHLPPTVELAKLLLHRDQRLSVTIIVMNLWLGPKHNTEARPCVPSLRFVDIPCDESTMALISPNTFISAFVEHHKPRVRDIVRGIIESDSVRLAGFVLDMFCMPMSDVANEFGVPSYNYFTSGAATLGLMFHLQWKRDHEGYDATELKNSDTELSVPSYVNPVPAKVLPEVVLDKEGGSKMFLDLAERIRESKGIIVNSCQAIERHALEYLSSNNNGIPPVFPVGPILNLENKKDDAKTDEIMRWLNEQPESSVVFLCFGSMGSFNEKQVKEIAVAIERSGHRFLWSLRRPTPKEKIEFPKEYENLEEVLPEGFLKRTSSIGKVIGWAPQMAVLSHPSVGGFVSHCGWNSTLESMWCGVPMAAWPLYAEQTLNAFLLVVELGLAAEIRMDYRTDTKAGYDGGMEVTVEEIEDGIRKLMSDGEIRNKVKDVKEKSRAAVVEGGSSYASIGKFIEHVSNVTI
서열 번호: 81: (양구슬냉이 ( Camelina sativa ))
MASEKTLQVHPPLHFVLFPFMAQGHMIPMVDIARLLAQRGATVTIVTTRYNAGRFENVLSRAVESGLPINIVHVKFPYEEVGLPKGKENIDSLDSMELMVPFFKAVNMLQDPVVKLMEEMESRPSCIISDLLLPYTSKIAKKFNIPKIVFHGISCFCLLCVHVLRRNLEILTNLKSDKEYFLVPSFPDRVEFTKPQVTVETNASGDWKEFLDEMVEAEDTSYGVIINTFEELEPAYVKDYKDARAGNVWSIGPVSLCNKAGVDKAERGNKATIDQDECLKWLDSKEEGSVLYVCLGSICNLPLVQLKELGLGLEESQRPFIWVIRGWEKYNELSEWMVESGFEERIRERGLLIRGWAPQVLILSHPSVGGFLTHCGWNSTVEGITSGVPLITWPLFGDQFCNQTLVVQVLKAGVSVGVEEVMKWGEEEKIGVLVDKEGVKKAVEDLMGESDDAKERTKRVKELGGLAHKAVEEGGSSHSNITLFLQDIRQVQSV
서열 번호: 82: UGT73F24 (감초 ( Glycyrrhiza uralensis )(UGT73F24)
MADVAEEQPLKIYFIPYLAAGHMIPLCDIATLFASRGHHVTIITTPSNAQTLRESHHFRVQTIQFPSQEVGLPAGVQNLTAVTNLDDSYKIYHATMLLRKHIEDFVERDPPDCIVADFLFPWVDDVATKLHIPRLVFNGFTLFTICAMESHKAHPLPVDAASGSFVIPDFPHHVTINSTPPKRTKEFVDPLLTEAFKSHGFLINSFVELDGEECVEHYERITGGHKAWHLGPAFLVHRTAQDRGEKSVVSTQECLSWLDSKRDNSVLYICFGTICYFPDKQLYEIASAIEASGHEFIWVVPEKRGNADESEEEKEKWLPKGFEERNNGKKGMIIRGWAPQVAILGHPAVGGFLTHCGWNSTVEAVSAGVPMITWPVHSDQYFNEKLITQVRGIGVEVGAEEWIVTAFRETEKLVGRDRIERAVRRVMDGGDEAVQIRRRARELGEMARQAVQEGGSSHTNLTALINDLKRWRDSKQLN
서열 번호: 83: UGT73C33 (감초)
MAVFQANQPHFVLFPLMAQGHIIPMIDIARLLAQRGAIVTIFTTPKNASRFTSVLSRAVSSGLQIRLVHLHFPSKEAGLPEGCENLDMVASHDMICNIFQAIRMLQKQAEELFETLTPKPSCIISDFCIPWTTQVAEKHHIPRISFHGFSCFCLHCMLKIHTSKVLEGITSESEYFTVPGIPDQIQVTKQQVPGPMIDEMKEFGEQMRDAEIRSYGVIINTFEELEKAYVNDYKKERNGKVWCIGPVSLCNKDGLDKAQRGNKASISEHHCLEWLDLQQPNSVIYVCLGSLCNLTPPQLMELALGLEATKRPFIWVIREGNKFEELEKWISEEGFEERIKGRGLIIRGWAPQVLILSHPSIGGFLTHCGWNSTLEGVTAGVPMVTWPLFADQFLNEKLVTQVLRIGVSLGVDVPLKWGEEEKVGVQVKKEGIEKAICMVMDEGEESKERRERAKELSEMAKRAVEKDGSSHLNMTMLIQDIMQQSSSKVET
서열 번호: 84: UGT85C1 ( 스테비아 레바우디아나 )
MDQMAKIDEKKPHVVFIPFPAQSHIKCMLKLARILHQKGLYITFINTDTNHERLVASGGTQWLENAPGFWFKTVPDGFGSAKDDGVKPTDALRELMDYLKTNFFDLFLDLVLKLEVPATCIICDGCMTFANTIRAAEKLNIPVILFWTMAACGFMAFYQAKVLKEKEIVPVKDETYLTNGYLDMEIDWIPGMKRIRLRDLPEFILATKQNYFAFEFLFETAQLADKVSHMIIHTFEELEASLVSEIKSIFPNVYTIGPLQLLLNKITQKETNNDSYSLWKEEPECVEWLNSKEPNSVVYVNFGSLAVMSLQDLVEFGWGLVNSNHYFLWIIRANLIDGKPAVMPQELKEAMNEKGFVGSWCSQEEVLNHPAVGGFLTHCGWGSIIESLSAGVPMLGWPSIGDQRANCRQMCKEWEVGMEIGKNVKRDEVEKLVRMLMEGLEGERMRKKALEWKKSATLATCCNGSSSLDVEKLANEIKKLSRN
서열 번호: 99: At75D1 (애기 장대)
MANNNSNSPTGPHFLFVTFPAQGHINPSLELAKRLAGTISGARVTFAASISAYNRRMFSTENVPETLIFATYSDGHDDGFKSSAYSDKSRQDATGNFMSEMRRRGKETLTELIEDNRKQNRPFTCVVYTILLTWVAELAREFHLPSALLWVQPVTVFSIFYHYFNGYEDAISEMANTPSSSIKLPSLPLLTVRDIPSFIVSSNVYAFLLPAFREQIDSLKEEINPKILINTFQELEPEAMSSVPDNFKIVPVGPLLTLRTDFSSRGEYIEWLDTKADSSVLYVSFGTLAVLSKKQLVELCKALIQSRRPFLWVITDKSYRNKEDEQEKEEDCISSFREELDEIGMVVSWCDQFRVLNHRSIGCFVTHCGWNSTLESLVSGVPVVAFPQWNDQMMNAKLLEDCWKTGVRVMEKKEEEGVVVVDSEEIRRCIEEVMEDKAEEFRGNATRWKDLAAEAVREGGSSFNHLKAFVDEHM
링커
서열 번호: 85: GGSGGS (L6)
서열 번호: 86: GGSGGSG (L7)
서열 번호: 87: GGSGGSGG (L8)
서열 번호: 88: GGSGGSGGS (L9)
서열 번호: 89: GGSGGSGGSG (L10)
서열 번호: 90: GGSGGSGGSGG (L11)
서열 번호: 91: GGSGGSGGSGGS (L12)
보완 효소
서열 번호: 92: E. 콜리 pgm
MAIHNRAGQPAQQSDLINVAQLTAQYYVLKPEAGNAEHAVKFGTSGHRGSAARHSFNEPHILAIAQAIAEERAKNGITGPCYVGKDTHALSEPAFISVLEVLAANGVDVIVQENNGFTPTPAVSNAILVHNKKGGPLADGIVITPSHNPPEDGGIKYNPPNGGPADTNVTKVVEDRANALLADGLKGVKRISLDEAMASGHVKEQDLVQPFVEGLADIVDMAAIQKAGLTLGVDPLGGSGIEYWKRIGEYYNLNLTIVNDQVDQTFRFMHLDKDGAIRMDCSSECAMAGLLALRDKFDLAFANDPDYDRHGIVTPAGLMNPNHYLAVAINYLFQHRPQWGKDVAVGKTLVSSAMIDRVVNDLGRKLVEVPVGFKWFVDGLFDGSFGFGGEESAGASFLRFDGTPWSTDKDGIIMCLLAAEITAVTGKNPQEHYNELAKRFGAPSYNRLQAAATSAQKAALSKLSPEMVSASTLAGDPITARLTAAPGNGASIGGLKVMTDNGWFAARPSGTEDAYKIYCESFLGEEHRKQIEKEAVEIVSEVLKNA
서열 번호: 93: E. 콜리 galU
MAAINTKVKKAVIPVAGLGTRMLPATKAIPKEMLPLVDKPLIQYVVNECIAAGITEIVLVTHSSKNSIENHFDTSFELEAMLEKRVKRQLLDEVQSICPPHVTIMQVRQGLAKGLGHAVLCAHPVVGDEPVAVILPDVILDEYESDLSQDNLAEMIRRFDETGHSQIMVEPVADVTAYGVVDCKGVELAPGESVPMVGVVEKPKADVAPSNLAIVGRYVLSADIWPLLAKTPPGAGDEIQLTDAIDMLIEKETVEAYHMKGKSHDCGNKLGYMQAFVEYGIRHNTLGTEFKAWLEEEMGIKK
서열 번호: 94: E. 콜리 ycjU
MKLQGVIFDLDGVITDTAHLHFQAWQQIAAEIGISIDAQFNESLKGISRDESLRRILQHGGKEGDFNSQERAQLAYRKNLLYVHSLRELTVNAVLPGIRSLLADLRAQQISVGLASVSLNAPTILAALELREFFTFCADASQLKNSKPDPEIFLAACAGLGVPPQACIGIEDAQAGIDAINASGMRSVGIGAGLTGAQLLLPSTESLTWPRLSAFWQNV
서열 번호: 95: 비피도박테리움 비피둠 ugpA
MAFAEDLKRTEKMTVDDVFEQSAQKMREQGMSEIAISQFRHAYHVWASEKESAWIREDTVEPLHGVRSFHDVYKTIDHDKAVHAFAKTAFLKLNGGLGTSMGLQCAKSLLPVRRHKARQMRFLDIILGQVLTARTRLNVPLPVTFMNSFRTSDDTMKALRHQRKFKQTDIPLEIIQHQEPKIDAATGAPASWPANPDLEWCPPGHGDLFSTLRESGLLDTLLEHGFEYLFISNSDNLGARPSRTLAQYFEDTGAPFMVEVANRTYADRKGGHIVRDTATGRLILREMSQVHPDDKDAAQDIAKHPYFNTNNIWVRIDVLRDMLAEHDGVLPLPVIINNKTVDPIDPQSPAVVQLETAMGAAIGLFEGAICVQVDRMRFLPVKTTNDLFIMRSDRFHLTDSYEMEDGNYIFPNVDLDPRYYKNIEDFNERFPYNVPSLAAANSVSIKGDWTFGRDVIMFADARLEDRNEPSYVPNGEYVGPMGIEPGDWV
서열 번호: 96: E. 콜리 adk
MRIILLGAPGAGKGTQAQFIMEKYGIPQISTGDMLRAAVKSGSELGKQAKDIMDAGKLVTDELVIALVKERIAQEDCRNGFLLDGFPRTIPQADAMKEAGINVDYVLEFDVPDELIVDRIVGRRVHAPSGRVYHVKFNPPKVEGKDDVTGEELTTRKDDQEETVRKRLVEYHQMTAPLIGYYSKEAEAGNTKYAKVDGTKPVAEVRADLEKILG
서열 번호: 97: E. 콜리 ndk
MAIERTFSIIKPNAVAKNVIGNIFARFEAAGFKIVGTKMLHLTVEQARGFYAEHDGKPFFDGLVEFMTSGPIVVSVLEGENAVQRHRDLLGATNPANALAGTLRADYADSLTENGTHGSDSVESAAREIAYFFGEGEVCPRTR
서열 번호: 98: E. 콜리 cmk
MTAIAPVITIDGPSGAGKGTLCKAMAEALQWHLLDSGAIYRVLALAALHHHVDVASEDALVPLASHLDVRFVSTNGNLEVILEGEDVSGEIRTQEVANAASQVAAFPRVREALLRRQRAFRELPGLIADGRDMGTVVFPDAPVKIFLDASSEERAHRRMLQLQEKGFSVNFERLLAEIKERDDRDRNRAVAPLVPAADALVLDSTTLSIEQVIEKALQYARQKLALA
SEQUENCE LISTING <110> Manus Bio Inc. KUMARAN, Ajikumar Parayil Santos, Christine Nicole Donald, Jason Love, Aaron ZHENG, Yiying GHADERI, Adel SHASTRY, Vineet Chen, Lu Toomey, Christopher LYNCH, Hannah NIEMINEN, Eric <120> GLYCOSIDE PRODUCT BIOSYNTHESIS AND RECOVERY <130> MAN-027PC/107590-5026 <140> PCT/US21/60722 <141> 2021-11-24 <160> 99 <170> PatentIn version 3.5 <210> 1 <211> 805 <212> PRT <213> Solanum tuberosum <400> 1 Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Val 1 5 10 15 Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser 20 25 30 Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Glu Leu Leu 35 40 45 Ala Glu Phe Asp Ala Ile Arg Gln Asp Asp Lys Asn Lys Leu Asn Glu 50 55 60 His Ala Phe Glu Glu Leu Leu Lys Ser Thr Gln Glu Ala Ile Val Leu 65 70 75 80 Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu 85 90 95 Tyr Ile Arg Val Asn Val Asn Ala Leu Val Val Glu Glu Leu Ser Val 100 105 110 Pro Glu Tyr Leu Gln Phe Lys Glu Glu Leu Val Asp Gly Ala Ser Asn 115 120 125 Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe 130 135 140 Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu 145 150 155 160 Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr 165 170 175 Pro Leu Leu Glu Phe Leu Arg Ala His His Tyr Lys Gly Lys Thr Met 180 185 190 Met Leu Asn Asp Arg Ile Gln Asn Ser Asn Thr Leu Gln Asn Val Leu 195 200 205 Arg Lys Ala Glu Glu Tyr Leu Ile Met Leu Pro Pro Glu Thr Pro Tyr 210 215 220 Phe Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Lys Gly Trp 225 230 235 240 Gly Asp Thr Ala Glu Arg Val Leu Glu Met Val Cys Met Leu Leu Asp 245 250 255 Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg 260 265 270 Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe 275 280 285 Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val 290 295 300 Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg 305 310 315 320 Ile Lys Glu Gln Gly Leu Asp Ile Ile Pro Arg Ile Leu Ile Val Thr 325 330 335 Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Ile Glu 340 345 350 Lys Val Tyr Gly Ala Glu His Ser His Ile Leu Arg Val Pro Phe Arg 355 360 365 Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp 370 375 380 Pro Tyr Met Glu Thr Phe Ile Glu Asp Val Ala Lys Glu Ile Ser Ala 385 390 395 400 Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly 405 410 415 Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys 420 425 430 Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile 435 440 445 Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ser Gln Phe Thr 450 455 460 Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr 465 470 475 480 Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser 485 490 495 His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile 500 505 510 Asn Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Ile 515 520 525 Asn Leu Tyr Phe Ser Tyr Ser Glu Thr Glu Lys Arg Leu Thr Ala Phe 530 535 540 His Pro Glu Ile Asp Glu Leu Leu Tyr Ser Asp Val Glu Asn Asp Glu 545 550 555 560 His Leu Cys Val Leu Lys Asp Arg Thr Lys Pro Ile Leu Phe Thr Met 565 570 575 Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr 580 585 590 Ala Lys Asn Pro Arg Leu Arg Gly Leu Val Asn Leu Val Val Val Gly 595 600 605 Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met 610 615 620 Lys Lys Met Tyr Glu Leu Ile Glu Thr His Asn Leu Asn Gly Gln Phe 625 630 635 640 Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr 645 650 655 Arg Tyr Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Phe Tyr 660 665 670 Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro 675 680 685 Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val His Gly 690 695 700 Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp 705 710 715 720 Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Lys Asp Pro Ser His Trp 725 730 735 Glu Thr Ile Ser Met Gly Gly Leu Lys Arg Ile Glu Glu Lys Tyr Thr 740 745 750 Trp Gln Ile Tyr Ser Glu Ser Leu Leu Thr Leu Ala Ala Val Tyr Gly 755 760 765 Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr 770 775 780 Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Met Ala Glu Ala Val 785 790 795 800 Pro Leu Ala Ala Glu 805 <210> 2 <211> 805 <212> PRT <213> Solanum tuberosum <400> 2 Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu 1 5 10 15 Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser 20 25 30 Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu 35 40 45 Ala Glu Phe Glu Ser Ile His Lys Glu Asp Lys Asp Lys Leu Asn Asp 50 55 60 His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu 65 70 75 80 Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu 85 90 95 Tyr Val Arg Val Asn Val Asn Ala Leu Ile Val Glu Glu Leu Thr Val 100 105 110 Pro Glu Phe Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn 115 120 125 Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe 130 135 140 Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu 145 150 155 160 Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr 165 170 175 Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met 180 185 190 Met Leu Asn Asp Arg Ile Gln Asn Leu Tyr Thr Leu Gln Lys Val Leu 195 200 205 Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr 210 215 220 Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp 225 230 235 240 Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp 245 250 255 Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg 260 265 270 Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe 275 280 285 Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val 290 295 300 Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg 305 310 315 320 Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr 325 330 335 Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu 340 345 350 Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg 355 360 365 Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp 370 375 380 Pro Tyr Met Glu Thr Phe Ile Glu Asp Val Gly Lys Glu Ile Thr Ala 385 390 395 400 Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly 405 410 415 Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys 420 425 430 Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile 435 440 445 Tyr Leu Asn Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr 450 455 460 Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr 465 470 475 480 Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser 485 490 495 His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile 500 505 510 Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Val 515 520 525 Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg Leu Thr Thr Phe 530 535 540 His Pro Glu Ile Glu Asp Leu Leu Phe Ser Asp Val Glu Asn Glu Glu 545 550 555 560 His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Ile Phe Thr Met 565 570 575 Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr 580 585 590 Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly 595 600 605 Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met 610 615 620 Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe 625 630 635 640 Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr 645 650 655 Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr 660 665 670 Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Ser Cys Gly Leu Pro 675 680 685 Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val His Gly 690 695 700 Lys Ser Gly Phe Gln Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp 705 710 715 720 Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Pro Ser His Trp 725 730 735 Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr 740 745 750 Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly 755 760 765 Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr 770 775 780 Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Ala Gln Leu Val 785 790 795 800 Pro Leu Ala Val Glu 805 <210> 3 <211> 805 <212> PRT <213> Solanum tuberosum <400> 3 Met Ala Glu Arg Val Leu Thr Arg Val His Glu Leu Arg Glu Arg Leu 1 5 10 15 Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser 20 25 30 Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu 35 40 45 Ala Glu Phe Glu Ser Ile His Lys Glu Asp Lys Asp Lys Leu Asn Asp 50 55 60 His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu 65 70 75 80 Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu 85 90 95 Tyr Val Arg Val Asn Val Asn Ala Leu Ile Val Glu Glu Leu Thr Val 100 105 110 Pro Glu Phe Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn 115 120 125 Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe 130 135 140 Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu 145 150 155 160 Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr 165 170 175 Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met 180 185 190 Met Leu Asn Asp Arg Ile Gln Asn Leu Tyr Thr Leu Gln Lys Val Leu 195 200 205 Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr 210 215 220 Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp 225 230 235 240 Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp 245 250 255 Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg 260 265 270 Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe 275 280 285 Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val 290 295 300 Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg 305 310 315 320 Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr 325 330 335 Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu 340 345 350 Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg 355 360 365 Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp 370 375 380 Pro Tyr Met Glu Thr Phe Ile Glu Asp Val Gly Lys Glu Ile Thr Ala 385 390 395 400 Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly 405 410 415 Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys 420 425 430 Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile 435 440 445 Tyr Leu Asn Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr 450 455 460 Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr 465 470 475 480 Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser 485 490 495 His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile 500 505 510 Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Val 515 520 525 Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg Leu Thr Thr Phe 530 535 540 His Pro Glu Ile Glu Asp Leu Leu Phe Ser Asp Val Glu Asn Glu Glu 545 550 555 560 His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Ile Phe Thr Met 565 570 575 Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr 580 585 590 Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly 595 600 605 Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met 610 615 620 Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe 625 630 635 640 Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr 645 650 655 Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr 660 665 670 Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Ser Cys Gly Leu Pro 675 680 685 Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val His Gly 690 695 700 Lys Ser Gly Phe Gln Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp 705 710 715 720 Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Pro Ser His Trp 725 730 735 Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr 740 745 750 Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly 755 760 765 Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr 770 775 780 Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Ala Gln Leu Val 785 790 795 800 Pro Leu Ala Val Glu 805 <210> 4 <211> 794 <212> PRT <213> Acidithiobacillus caldus <400> 4 Met Ala Ile Glu Ala Leu Arg Gln Gln Leu Leu Asp Asp Pro Arg Ser 1 5 10 15 Trp Tyr Ala Phe Leu Arg His Leu Val Ala Ser Gln Arg Asp Ser Trp 20 25 30 Leu Tyr Thr Asp Leu Gln Arg Ala Cys Ala Asp Phe Arg Glu Gln Leu 35 40 45 Pro Glu Gly Tyr Ala Glu Gly Ile Gly Pro Leu Glu Asp Phe Val Ala 50 55 60 His Thr Gln Glu Val Ile Phe Arg Asp Pro Trp Met Val Phe Ala Trp 65 70 75 80 Arg Pro Arg Pro Gly Arg Trp Ile Tyr Val Arg Ile His Arg Glu Gln 85 90 95 Leu Ala Leu Glu Glu Leu Ser Thr Asp Ala Tyr Leu Gln Ala Lys Glu 100 105 110 Gly Ile Val Gly Leu Gly Ala Glu Gly Glu Ala Val Leu Thr Val Asp 115 120 125 Phe Arg Asp Phe Arg Pro Val Ser Arg Arg Leu Arg Asp Glu Ser Thr 130 135 140 Ile Gly Asp Gly Leu Thr His Leu Asn Arg Arg Leu Ala Gly Arg Ile 145 150 155 160 Phe Ser Asp Leu Ala Ala Gly Arg Ser Gln Ile Leu Glu Phe Leu Ser 165 170 175 Leu His Arg Leu Asp Gly Gln Asn Leu Met Leu Ser Asn Gly Asn Thr 180 185 190 Asp Phe Asp Ser Leu Arg Gln Thr Val Gln Tyr Leu Gly Thr Leu Pro 195 200 205 Arg Glu Thr Pro Trp Ala Glu Ile Arg Glu Asp Met Arg Arg Arg Gly 210 215 220 Phe Ala Pro Gly Trp Gly Asn Thr Ala Gly Arg Val Arg Glu Thr Met 225 230 235 240 Arg Leu Leu Met Asp Leu Leu Asp Ser Pro Ser Pro Ala Ala Leu Glu 245 250 255 Ser Phe Leu Asp Arg Ile Pro Met Ile Ser Arg Ile Leu Ile Val Ser 260 265 270 Ile His Gly Trp Phe Ala Gln Asp Lys Val Leu Gly Arg Pro Asp Thr 275 280 285 Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Ala Arg Ala Leu Glu Arg 290 295 300 Glu Met Arg Asn Arg Leu Arg Gln Gln Gly Val Asp Val Glu Pro Arg 305 310 315 320 Ile Leu Ile Ala Thr Arg Leu Ile Pro Glu Ser Asp Gly Thr Thr Cys 325 330 335 Asp Gln Arg Leu Glu Pro Val Val Gly Ala Glu Asn Val Gln Ile Leu 340 345 350 Arg Val Pro Phe Arg Tyr Pro Asp Gly Arg Ile His Pro His Trp Ile 355 360 365 Ser Arg Phe Lys Ile Trp Pro Trp Leu Glu Arg Tyr Ala Gln Asp Leu 370 375 380 Glu Arg Glu Val Leu Ala Glu Leu Gly Ser Arg Pro Asp Leu Ile Ile 385 390 395 400 Gly Asn Tyr Ser Asp Gly Asn Leu Val Ala Thr Leu Leu Ser Glu Arg 405 410 415 Leu Gly Val Thr Gln Cys Asn Ile Ala His Ala Leu Glu Lys Ser Lys 420 425 430 Tyr Leu Tyr Ser Asp Leu His Trp Arg Asp His Glu Gln Asp His His 435 440 445 Phe Ala Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ala Ala Asp 450 455 460 Ile Ile Val Thr Ser Thr Tyr Gln Glu Ile Ala Gly Asn Asp Arg Glu 465 470 475 480 Ile Gly Gln Tyr Glu Gly His Gln Asp Tyr Thr Leu Pro Gly Leu Tyr 485 490 495 Arg Val Glu Asn Gly Ile Asp Val Phe Asp Ser Lys Phe Asn Ile Val 500 505 510 Ser Pro Gly Ala Asp Pro Arg Phe Tyr Phe Ser Tyr Ala Arg Thr Glu 515 520 525 Glu Arg Pro Ser Phe Leu Glu Pro Glu Ile Glu Ser Leu Leu Phe Gly 530 535 540 Arg Glu Pro Gly Ala Asp Arg Arg Gly Val Leu Glu Asp Arg Gln Lys 545 550 555 560 Pro Leu Leu Leu Ser Met Ala Arg Met Asp Arg Ile Lys Asn Leu Ser 565 570 575 Gly Leu Ala Glu Leu Tyr Gly Arg Ser Ser Arg Leu Arg Gly Leu Ala 580 585 590 Asn Leu Val Ile Ile Gly Gly His Val Asp Val Gly Asn Ser Arg Asp 595 600 605 Ala Glu Glu Arg Glu Glu Ile Arg Arg Met His Glu Ile Met Asp His 610 615 620 Tyr Gln Leu Asp Gly Gln Leu Arg Trp Val Gly Ala Leu Leu Asp Lys 625 630 635 640 Thr Val Ala Gly Glu Leu Tyr Arg Val Val Ala Asp Gly Arg Gly Val 645 650 655 Phe Val Gln Pro Ala Leu Phe Glu Ala Phe Gly Leu Thr Val Ile Glu 660 665 670 Ala Met Ser Ser Gly Leu Pro Val Phe Ala Thr Arg Phe Gly Gly Pro 675 680 685 Leu Glu Ile Ile Glu Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn 690 695 700 Asp His Glu Ala Thr Ala Glu Arg Leu Ala Asp Phe Leu Glu Ala Ala 705 710 715 720 Arg Glu Arg Pro Lys Tyr Trp Leu Glu Ile Ser Asp Ala Ala Leu Ala 725 730 735 Arg Val Ala Glu Arg Tyr Thr Trp Glu Arg Tyr Ala Glu Arg Leu Met 740 745 750 Thr Ile Ala Arg Ile Phe Gly Phe Trp Arg Phe Val Leu Asp Arg Glu 755 760 765 Ser Gln Val Met Glu Arg Tyr Leu Gln Met Phe Arg His Leu Gln Trp 770 775 780 Arg Pro Leu Ala His Ala Val Pro Met Glu 785 790 <210> 5 <211> 794 <212> PRT <213> Acidithiobacillus caldus <400> 5 Met Ala Ile Glu Ala Leu Arg Gln Gln Leu Leu Asp Asp Pro Arg Ser 1 5 10 15 Trp Tyr Ala Phe Leu Arg His Leu Val Ala Ser Gln Arg Asp Ser Trp 20 25 30 Leu Tyr Thr Asp Leu Gln Arg Ala Cys Ala Asp Phe Arg Glu Gln Leu 35 40 45 Pro Glu Gly Tyr Ala Glu Gly Ile Gly Pro Leu Glu Asp Phe Val Ala 50 55 60 His Thr Gln Glu Val Ile Phe Arg Asp Pro Trp Met Val Phe Ala Trp 65 70 75 80 Arg Pro Arg Pro Gly Arg Trp Ile Tyr Val Arg Ile His Arg Glu Gln 85 90 95 Leu Ala Leu Glu Glu Leu Ser Thr Asp Ala Tyr Leu Gln Ala Lys Glu 100 105 110 Gly Ile Val Gly Leu Gly Ala Glu Gly Glu Ala Val Leu Thr Val Asp 115 120 125 Phe Arg Asp Phe Arg Pro Val Ser Arg Arg Leu Arg Asp Glu Ser Thr 130 135 140 Ile Gly Asp Gly Leu Thr His Leu Asn Arg Arg Leu Ala Gly Arg Ile 145 150 155 160 Phe Ser Asp Leu Ala Ala Gly Arg Ser Gln Ile Leu Glu Phe Leu Ser 165 170 175 Leu His Arg Leu Asp Gly Gln Asn Leu Met Leu Ser Asn Gly Asn Thr 180 185 190 Asp Phe Asp Ser Leu Arg Gln Thr Val Gln Tyr Leu Gly Thr Leu Pro 195 200 205 Arg Glu Thr Pro Trp Ala Glu Ile Arg Glu Asp Met Arg Arg Arg Gly 210 215 220 Phe Ala Pro Gly Trp Gly Asn Thr Ala Gly Arg Val Arg Glu Thr Met 225 230 235 240 Arg Leu Leu Met Asp Leu Leu Asp Ser Pro Ser Pro Ala Ala Leu Glu 245 250 255 Ser Phe Leu Asp Arg Ile Pro Met Ile Ser Arg Ile Leu Ile Val Ser 260 265 270 Ile His Gly Trp Phe Ala Gln Asp Lys Val Leu Gly Arg Pro Asp Thr 275 280 285 Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Ala Arg Ala Leu Glu Arg 290 295 300 Glu Met Arg Asn Arg Leu Arg Gln Gln Gly Val Asp Val Glu Pro Arg 305 310 315 320 Ile Leu Ile Ala Thr Arg Leu Ile Pro Glu Ser Asp Gly Thr Thr Cys 325 330 335 Asp Gln Arg Leu Glu Pro Val Val Gly Ala Glu Asn Val Gln Ile Leu 340 345 350 Arg Val Pro Phe Arg Tyr Pro Asp Gly Arg Ile His Pro His Trp Ile 355 360 365 Ser Arg Phe Lys Ile Trp Pro Trp Leu Glu Arg Tyr Ala Gln Asp Leu 370 375 380 Glu Arg Glu Val Leu Ala Glu Leu Gly Ser Arg Pro Asp Leu Ile Ile 385 390 395 400 Gly Asn Tyr Ser Asp Gly Asn Leu Val Ala Thr Leu Leu Ser Glu Arg 405 410 415 Leu Gly Val Thr Gln Cys Asn Ile Ala His Ala Leu Glu Lys Ser Lys 420 425 430 Tyr Leu Tyr Ser Asp Leu His Trp Arg Asp His Glu Gln Asp His His 435 440 445 Phe Ala Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ala Ala Asp 450 455 460 Ile Ile Val Thr Ser Thr Tyr Gln Glu Ile Ala Gly Asn Asp Arg Glu 465 470 475 480 Ile Gly Gln Tyr Glu Gly His Gln Asp Tyr Thr Leu Pro Gly Leu Tyr 485 490 495 Arg Val Glu Asn Gly Ile Asp Val Phe Asp Ser Lys Phe Asn Ile Val 500 505 510 Ser Pro Gly Ala Asp Pro Arg Phe Tyr Phe Ser Tyr Ala Arg Thr Glu 515 520 525 Glu Arg Pro Ser Phe Leu Glu Pro Glu Ile Glu Ser Leu Leu Phe Gly 530 535 540 Arg Glu Pro Gly Ala Asp Arg Arg Gly Val Leu Glu Asp Arg Gln Lys 545 550 555 560 Pro Leu Leu Leu Ser Met Ala Arg Met Asp Arg Ile Lys Asn Leu Ser 565 570 575 Gly Leu Ala Glu Leu Tyr Gly Arg Ser Ser Arg Leu Arg Gly Leu Ala 580 585 590 Asn Leu Val Ile Ile Gly Gly His Val Asp Val Gly Asn Ser Arg Asp 595 600 605 Ala Glu Glu Arg Glu Glu Ile Arg Arg Met His Glu Ile Met Asp His 610 615 620 Tyr Gln Leu Asp Gly Gln Leu Arg Trp Val Gly Ala Leu Met Asp Lys 625 630 635 640 Val Val Ala Gly Glu Leu Tyr Arg Val Val Ala Asp Gly Arg Gly Val 645 650 655 Phe Val Gln Pro Ala Leu Phe Glu Ala Phe Gly Leu Thr Val Ile Glu 660 665 670 Ala Met Ser Ser Gly Leu Pro Val Phe Ala Thr Arg Phe Gly Gly Pro 675 680 685 Leu Glu Ile Ile Glu Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn 690 695 700 Asp His Glu Ala Thr Ala Glu Arg Leu Ala Asp Phe Leu Glu Ala Ala 705 710 715 720 Arg Glu Arg Pro Lys Tyr Trp Leu Glu Ile Ser Asp Ala Ala Leu Ala 725 730 735 Arg Val Ala Glu Arg Tyr Thr Trp Glu Arg Tyr Ala Glu Arg Leu Met 740 745 750 Thr Ile Ala Arg Ile Phe Gly Phe Trp Arg Phe Val Leu Asp Arg Glu 755 760 765 Ser Gln Val Met Glu Arg Tyr Leu Gln Met Phe Arg His Leu Gln Trp 770 775 780 Arg Pro Leu Ala His Ala Val Pro Met Glu 785 790 <210> 6 <211> 808 <212> PRT <213> Arabidopsis thaliana <400> 6 Met Ala Asn Ala Glu Arg Met Ile Thr Arg Val His Ser Gln Arg Glu 1 5 10 15 Arg Leu Asn Glu Thr Leu Val Ser Glu Arg Asn Glu Val Leu Ala Leu 20 25 30 Leu Ser Arg Val Glu Ala Lys Gly Lys Gly Ile Leu Gln Gln Asn Gln 35 40 45 Ile Ile Ala Glu Phe Glu Ala Leu Pro Glu Gln Thr Arg Lys Lys Leu 50 55 60 Glu Gly Gly Pro Phe Phe Asp Leu Leu Lys Ser Thr Gln Glu Ala Ile 65 70 75 80 Val Leu Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val 85 90 95 Trp Glu Tyr Leu Arg Val Asn Leu His Ala Leu Val Val Glu Glu Leu 100 105 110 Gln Pro Ala Glu Phe Leu His Phe Lys Glu Glu Leu Val Asp Gly Val 115 120 125 Lys Asn Gly Asn Phe Thr Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala 130 135 140 Ser Ile Pro Arg Pro Thr Leu His Lys Tyr Ile Gly Asn Gly Val Asp 145 150 155 160 Phe Leu Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser 165 170 175 Leu Leu Pro Leu Leu Lys Phe Leu Arg Leu His Ser His Gln Gly Lys 180 185 190 Asn Leu Met Leu Ser Glu Lys Ile Gln Asn Leu Asn Thr Leu Gln His 195 200 205 Thr Leu Arg Lys Ala Glu Glu Tyr Leu Ala Glu Leu Lys Ser Glu Thr 210 215 220 Leu Tyr Glu Glu Phe Glu Ala Lys Phe Glu Glu Ile Gly Leu Glu Arg 225 230 235 240 Gly Trp Gly Asp Asn Ala Glu Arg Val Leu Asp Met Ile Arg Leu Leu 245 250 255 Leu Asp Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu 260 265 270 Gly Arg Val Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly 275 280 285 Tyr Phe Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln 290 295 300 Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Ile Glu Met Leu 305 310 315 320 Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Arg Ile Leu Ile 325 330 335 Leu Thr Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Glu Arg 340 345 350 Leu Glu Arg Val Tyr Asp Ser Glu Tyr Cys Asp Ile Leu Arg Val Pro 355 360 365 Phe Arg Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu 370 375 380 Val Trp Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Ala Ala Val Glu Leu 385 390 395 400 Ser Lys Glu Leu Asn Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser 405 410 415 Asp Gly Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr 420 425 430 Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser 435 440 445 Asp Ile Tyr Trp Lys Lys Leu Asp Asp Lys Tyr His Phe Ser Cys Gln 450 455 460 Phe Thr Ala Asp Ile Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr 465 470 475 480 Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Glu Thr Val Gly Gln Tyr 485 490 495 Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His 500 505 510 Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala 515 520 525 Asp Met Ser Ile Tyr Phe Pro Tyr Thr Glu Glu Lys Arg Arg Leu Thr 530 535 540 Lys Phe His Ser Glu Ile Glu Glu Leu Leu Tyr Ser Asp Val Glu Asn 545 550 555 560 Lys Glu His Leu Cys Val Leu Lys Asp Lys Lys Lys Pro Ile Leu Phe 565 570 575 Thr Met Ala Arg Leu Asp Arg Val Lys Asn Leu Ser Gly Leu Val Glu 580 585 590 Trp Tyr Gly Lys Asn Thr Arg Leu Arg Glu Leu Ala Asn Leu Val Val 595 600 605 Val Gly Gly Asp Arg Arg Lys Glu Ser Lys Asp Asn Glu Glu Lys Ala 610 615 620 Glu Met Lys Lys Met Tyr Asp Leu Ile Glu Glu Tyr Lys Leu Asn Gly 625 630 635 640 Gln Phe Arg Trp Ile Ser Ser Gln Met Asp Arg Val Arg Asn Gly Glu 645 650 655 Leu Tyr Arg Tyr Ile Cys Asp Thr Lys Gly Ala Phe Val Gln Pro Ala 660 665 670 Leu Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly 675 680 685 Leu Pro Thr Phe Ala Thr Cys Lys Gly Gly Pro Ala Glu Ile Ile Val 690 695 700 His Gly Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Gln Ala 705 710 715 720 Ala Asp Thr Leu Ala Asp Phe Phe Thr Lys Cys Lys Glu Asp Pro Ser 725 730 735 His Trp Asp Glu Ile Ser Lys Gly Gly Leu Gln Arg Ile Glu Glu Lys 740 745 750 Tyr Thr Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val 755 760 765 Tyr Gly Phe Trp Lys His Val Ser Asn Leu Asp Arg Leu Glu Ala Arg 770 775 780 Arg Tyr Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Pro Leu Ala Gln 785 790 795 800 Ala Val Pro Leu Ala Gln Asp Asp 805 <210> 7 <211> 809 <212> PRT <213> Arabidopsis thaliana <400> 7 Met Ala Asn Pro Lys Leu Thr Arg Val Leu Ser Thr Arg Asp Arg Val 1 5 10 15 Gln Asp Thr Leu Ser Ala His Arg Asn Glu Leu Val Ala Leu Leu Ser 20 25 30 Arg Tyr Val Asp Gln Gly Lys Gly Ile Leu Gln Pro His Asn Leu Ile 35 40 45 Asp Glu Leu Glu Ser Val Ile Gly Asp Asp Glu Thr Lys Lys Ser Leu 50 55 60 Ser Asp Gly Pro Phe Gly Glu Ile Leu Lys Ser Ala Met Glu Ala Ile 65 70 75 80 Val Val Pro Pro Phe Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val 85 90 95 Trp Glu Tyr Val Arg Val Asn Val Phe Glu Leu Ser Val Glu Gln Leu 100 105 110 Thr Val Ser Glu Tyr Leu Arg Phe Lys Glu Glu Leu Val Asp Gly Pro 115 120 125 Asn Ser Asp Pro Phe Cys Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala 130 135 140 Asn Val Pro Arg Pro Ser Arg Ser Ser Ser Ile Gly Asn Gly Val Gln 145 150 155 160 Phe Leu Asn Arg His Leu Ser Ser Val Met Phe Arg Asn Lys Asp Cys 165 170 175 Leu Glu Pro Leu Leu Asp Phe Leu Arg Val His Lys Tyr Lys Gly His 180 185 190 Pro Leu Met Leu Asn Asp Arg Ile Gln Ser Ile Ser Arg Leu Gln Ile 195 200 205 Gln Leu Ser Lys Ala Glu Asp His Ile Ser Lys Leu Ser Gln Glu Thr 210 215 220 Pro Phe Ser Glu Phe Glu Tyr Ala Leu Gln Gly Met Gly Phe Glu Lys 225 230 235 240 Gly Trp Gly Asp Thr Ala Gly Arg Val Leu Glu Met Met His Leu Leu 245 250 255 Ser Asp Ile Leu Gln Ala Pro Asp Pro Ser Ser Leu Glu Lys Phe Leu 260 265 270 Gly Met Val Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly 275 280 285 Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln 290 295 300 Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Thr Glu Met Leu 305 310 315 320 Leu Arg Ile Lys Arg Gln Gly Leu Asp Ile Ser Pro Ser Ile Leu Ile 325 330 335 Val Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Thr Cys Asn Gln Arg 340 345 350 Leu Glu Arg Val Ser Gly Thr Glu His Thr His Ile Leu Arg Val Pro 355 360 365 Phe Arg Ser Glu Lys Gly Ile Leu Arg Lys Trp Ile Ser Arg Phe Asp 370 375 380 Val Trp Pro Tyr Leu Glu Asn Tyr Ala Gln Asp Ala Ala Ser Glu Ile 385 390 395 400 Val Gly Glu Leu Gln Gly Val Pro Asp Phe Ile Ile Gly Asn Tyr Ser 405 410 415 Asp Gly Asn Leu Val Ala Ser Leu Met Ala His Arg Met Gly Val Thr 420 425 430 Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser 435 440 445 Asp Ile Tyr Trp Lys Asp Phe Asp Asn Lys Tyr His Phe Ser Cys Gln 450 455 460 Phe Thr Ala Asp Leu Ile Ala Met Asn Asn Ala Asp Phe Ile Ile Thr 465 470 475 480 Ser Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr 485 490 495 Glu Ser His Gly Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His 500 505 510 Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala 515 520 525 Asp Met Thr Ile Tyr Phe Pro Tyr Ser Glu Glu Thr Arg Arg Leu Thr 530 535 540 Ala Leu His Gly Ser Ile Glu Glu Met Leu Tyr Ser Pro Asp Gln Thr 545 550 555 560 Asp Glu His Val Gly Thr Leu Ser Asp Arg Ser Lys Pro Ile Leu Phe 565 570 575 Ser Met Ala Arg Leu Asp Lys Val Lys Asn Ile Ser Gly Leu Val Glu 580 585 590 Met Tyr Ser Lys Asn Thr Lys Leu Arg Glu Leu Val Asn Leu Val Val 595 600 605 Ile Ala Gly Asn Ile Asp Val Asn Lys Ser Lys Asp Arg Glu Glu Ile 610 615 620 Val Glu Ile Glu Lys Met His Asn Leu Met Lys Asn Tyr Lys Leu Asp 625 630 635 640 Gly Gln Phe Arg Trp Ile Thr Ala Gln Thr Asn Arg Ala Arg Asn Gly 645 650 655 Glu Leu Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Ala Gln Pro 660 665 670 Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys 675 680 685 Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Ala Glu Ile Ile 690 695 700 Glu His Gly Leu Ser Gly Phe His Ile Asp Pro Tyr His Pro Glu Gln 705 710 715 720 Ala Gly Asn Ile Met Ala Asp Phe Phe Glu Arg Cys Lys Glu Asp Pro 725 730 735 Asn His Trp Lys Lys Val Ser Asp Ala Gly Leu Gln Arg Ile Tyr Glu 740 745 750 Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ala Gly 755 760 765 Val Tyr Gly Phe Trp Lys Tyr Val Ser Lys Leu Glu Arg Arg Glu Thr 770 775 780 Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Asp Leu Val 785 790 795 800 Lys Thr Val Pro Ser Thr Ala Asp Asp 805 <210> 8 <211> 805 <212> PRT <213> Vigna radiata <400> 8 Met Ala Thr Asp Arg Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu 1 5 10 15 Asp Glu Thr Leu Ser Ala Asn Arg Asn Glu Ile Leu Ala Leu Leu Ser 20 25 30 Arg Ile Glu Gly Lys Gly Lys Gly Ile Leu Gln His His Gln Val Ile 35 40 45 Ala Glu Phe Glu Glu Ile Pro Glu Glu Ser Arg Gln Lys Leu Thr Asp 50 55 60 Gly Ala Phe Gly Glu Val Leu Arg Ser Thr Gln Glu Ala Ile Val Leu 65 70 75 80 Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu 85 90 95 Tyr Leu Arg Val Asn Val His Ala Leu Val Val Glu Val Leu Gln Pro 100 105 110 Ala Glu Tyr Leu Arg Phe Lys Glu Glu Leu Val Asp Gly Ser Ser Asn 115 120 125 Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe 130 135 140 Pro Arg Pro Thr Leu Asn Lys Ser Ile Gly Asn Gly Val Gln Phe Leu 145 150 155 160 Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu His 165 170 175 Pro Leu Leu Glu Phe Leu Arg Leu His Ser Val Lys Gly Lys Thr Leu 180 185 190 Met Leu Asn Asp Arg Ile Gln Asn Pro Asp Ala Leu Gln His Val Leu 195 200 205 Arg Lys Ala Glu Glu Tyr Leu Gly Thr Val Pro Pro Glu Thr Pro Tyr 210 215 220 Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp 225 230 235 240 Gly Asp Asn Ala Glu Arg Val Leu Glu Ser Ile Gln Leu Leu Leu Asp 245 250 255 Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg 260 265 270 Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe 275 280 285 Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val 290 295 300 Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu His Arg 305 310 315 320 Ile Lys Gln Gln Gly Leu Asp Ile Val Pro Arg Ile Leu Ile Ile Thr 325 330 335 Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu 340 345 350 Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg 355 360 365 Thr Glu Asn Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp 370 375 380 Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Val Ala His Glu Leu Ala Lys 385 390 395 400 Glu Leu Gln Gly Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly 405 410 415 Asn Ile Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys 420 425 430 Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Glu Ser Asp Ile 435 440 445 Tyr Trp Lys Lys Leu Glu Glu Arg Tyr His Phe Ser Cys Gln Phe Thr 450 455 460 Ala Asp Leu Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr 465 470 475 480 Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser 485 490 495 His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile 500 505 510 Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Gln 515 520 525 Thr Ile Tyr Phe Pro His Thr Glu Thr Ser Arg Arg Leu Thr Ser Phe 530 535 540 His Thr Glu Ile Glu Glu Leu Leu Tyr Ser Ser Val Glu Asn Glu Glu 545 550 555 560 His Ile Cys Val Leu Lys Asp Arg Ser Lys Pro Ile Ile Phe Thr Met 565 570 575 Ala Arg Leu Asp Arg Val Lys Asn Ile Thr Gly Leu Val Glu Trp Tyr 580 585 590 Gly Lys Asn Ala Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Ala 595 600 605 Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Lys Ala Glu Met 610 615 620 Lys Lys Met Tyr Ser Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe 625 630 635 640 Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr 645 650 655 Arg Val Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Val Tyr 660 665 670 Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro 675 680 685 Thr Phe Ala Thr Cys Asn Gly Gly Pro Ala Glu Ile Ile Val His Gly 690 695 700 Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Arg Ala Ala Asp 705 710 715 720 Leu Leu Val Glu Phe Phe Glu Lys Val Lys Val Asp Pro Ser His Trp 725 730 735 Asp Lys Ile Ser Gln Ala Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr 740 745 750 Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly 755 760 765 Phe Trp Lys His Val Ser Asn Leu Asp Arg Arg Glu Ser Arg Arg Tyr 770 775 780 Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val 785 790 795 800 Pro Leu Ala Val Glu 805 <210> 9 <211> 805 <212> PRT <213> Vigna radiata <400> 9 Met Ala Thr Asp Arg Leu Thr Arg Val His Glu Leu Arg Glu Arg Leu 1 5 10 15 Asp Glu Thr Leu Ser Ala Asn Arg Asn Glu Ile Leu Ala Leu Leu Ser 20 25 30 Arg Ile Glu Gly Lys Gly Lys Gly Ile Leu Gln His His Gln Val Ile 35 40 45 Ala Glu Phe Glu Glu Ile Pro Glu Glu Ser Arg Gln Lys Leu Thr Asp 50 55 60 Gly Ala Phe Gly Glu Val Leu Arg Ser Thr Gln Glu Ala Ile Val Leu 65 70 75 80 Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu 85 90 95 Tyr Leu Arg Val Asn Val His Ala Leu Val Val Glu Val Leu Gln Pro 100 105 110 Ala Glu Tyr Leu Arg Phe Lys Glu Glu Leu Val Asp Gly Ser Ser Asn 115 120 125 Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe 130 135 140 Pro Arg Pro Thr Leu Asn Lys Ser Ile Gly Asn Gly Val Gln Phe Leu 145 150 155 160 Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu His 165 170 175 Pro Leu Leu Glu Phe Leu Arg Leu His Ser Val Lys Gly Lys Thr Leu 180 185 190 Met Leu Asn Asp Arg Ile Gln Asn Pro Asp Ala Leu Gln His Val Leu 195 200 205 Arg Lys Ala Glu Glu Tyr Leu Gly Thr Val Pro Pro Glu Thr Pro Tyr 210 215 220 Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp 225 230 235 240 Gly Asp Asn Ala Glu Arg Val Leu Glu Ser Ile Gln Leu Leu Leu Asp 245 250 255 Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg 260 265 270 Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe 275 280 285 Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val 290 295 300 Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu His Arg 305 310 315 320 Ile Lys Gln Gln Gly Leu Asp Ile Val Pro Arg Ile Leu Ile Ile Thr 325 330 335 Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu 340 345 350 Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg 355 360 365 Thr Glu Asn Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp 370 375 380 Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Val Ala His Glu Leu Ala Lys 385 390 395 400 Glu Leu Gln Gly Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly 405 410 415 Asn Ile Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys 420 425 430 Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Glu Ser Asp Ile 435 440 445 Tyr Trp Lys Lys Leu Glu Glu Arg Tyr His Phe Ser Cys Gln Phe Thr 450 455 460 Ala Asp Leu Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr 465 470 475 480 Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser 485 490 495 His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile 500 505 510 Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Gln 515 520 525 Thr Ile Tyr Phe Pro His Thr Glu Thr Ser Arg Arg Leu Thr Ser Phe 530 535 540 His Thr Glu Ile Glu Glu Leu Leu Tyr Ser Ser Val Glu Asn Glu Glu 545 550 555 560 His Ile Cys Val Leu Lys Asp Arg Ser Lys Pro Ile Ile Phe Thr Met 565 570 575 Ala Arg Leu Asp Arg Val Lys Asn Ile Thr Gly Leu Val Glu Trp Tyr 580 585 590 Gly Lys Asn Ala Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Ala 595 600 605 Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Lys Ala Glu Met 610 615 620 Lys Lys Met Tyr Ser Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe 625 630 635 640 Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr 645 650 655 Arg Val Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Val Tyr 660 665 670 Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro 675 680 685 Thr Phe Ala Thr Cys Asn Gly Gly Pro Ala Glu Ile Ile Val His Gly 690 695 700 Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Arg Ala Ala Asp 705 710 715 720 Leu Leu Val Glu Phe Phe Glu Lys Val Lys Val Asp Pro Ser His Trp 725 730 735 Asp Lys Ile Ser Gln Ala Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr 740 745 750 Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly 755 760 765 Phe Trp Lys His Val Ser Asn Leu Asp Arg Arg Glu Ser Arg Arg Tyr 770 775 780 Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val 785 790 795 800 Pro Leu Ala Val Glu 805 <210> 10 <211> 805 <212> PRT <213> Glycine max <400> 10 Met Ala Thr Asp Arg Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu 1 5 10 15 Asp Glu Thr Leu Thr Ala Asn Arg Asn Glu Ile Leu Ala Leu Leu Ser 20 25 30 Arg Ile Glu Ala Lys Gly Lys Gly Ile Leu Gln His His Gln Val Ile 35 40 45 Ala Glu Phe Glu Glu Ile Pro Glu Glu Asn Arg Gln Lys Leu Thr Asp 50 55 60 Gly Ala Phe Gly Glu Val Leu Arg Ser Thr Gln Glu Ala Ile Val Leu 65 70 75 80 Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu 85 90 95 Tyr Leu Arg Val Asn Val His Ala Leu Val Val Glu Glu Leu Gln Pro 100 105 110 Ala Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Ser Ser Asn 115 120 125 Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ala Phe 130 135 140 Pro Arg Pro Thr Leu Asn Lys Ser Ile Gly Asn Gly Val Gln Phe Leu 145 150 155 160 Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu His 165 170 175 Pro Leu Leu Glu Phe Leu Arg Leu His Ser Val Lys Gly Lys Thr Leu 180 185 190 Met Leu Asn Asp Arg Ile Gln Asn Pro Asp Ala Leu Gln His Val Leu 195 200 205 Arg Lys Ala Glu Glu Tyr Leu Gly Thr Val Pro Pro Glu Thr Pro Tyr 210 215 220 Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp 225 230 235 240 Gly Asp Asn Ala Glu Arg Val Leu Glu Ser Ile Gln Leu Leu Leu Asp 245 250 255 Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg 260 265 270 Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe 275 280 285 Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val 290 295 300 Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu His Arg 305 310 315 320 Ile Lys Gln Gln Gly Leu Asp Ile Val Pro Arg Ile Leu Ile Ile Thr 325 330 335 Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu 340 345 350 Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg 355 360 365 Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp 370 375 380 Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Val Ala His Glu Leu Ala Lys 385 390 395 400 Glu Leu Gln Gly Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly 405 410 415 Asn Ile Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys 420 425 430 Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Glu Ser Asp Ile 435 440 445 Tyr Trp Lys Lys Leu Glu Glu Arg Tyr His Phe Ser Cys Gln Phe Thr 450 455 460 Ala Asp Leu Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr 465 470 475 480 Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser 485 490 495 His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile 500 505 510 Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Gln 515 520 525 Thr Ile Tyr Phe Pro His Thr Glu Thr Ser Arg Arg Leu Thr Ser Phe 530 535 540 His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Ser Val Glu Asn Glu Glu 545 550 555 560 His Ile Cys Val Leu Lys Asp Arg Ser Lys Pro Ile Ile Phe Thr Met 565 570 575 Ala Arg Leu Asp Arg Val Lys Asn Ile Thr Gly Leu Val Glu Trp Tyr 580 585 590 Gly Lys Asn Ala Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Ala 595 600 605 Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Lys Ala Glu Met 610 615 620 Lys Lys Met Tyr Gly Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe 625 630 635 640 Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr 645 650 655 Arg Val Ile Cys Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Val Tyr 660 665 670 Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro 675 680 685 Thr Phe Ala Thr Cys Asn Gly Gly Pro Ala Glu Ile Ile Val His Gly 690 695 700 Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Arg Ala Ala Asp 705 710 715 720 Leu Leu Val Asp Phe Phe Glu Lys Cys Lys Leu Asp Pro Thr His Trp 725 730 735 Asp Lys Ile Ser Lys Ala Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr 740 745 750 Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly 755 760 765 Phe Trp Lys His Val Ser Asn Leu Asp Arg Arg Glu Ser Arg Arg Tyr 770 775 780 Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val 785 790 795 800 Pro Leu Ala Ala Glu 805 <210> 11 <211> 805 <212> PRT <213> Glycine max <400> 11 Met Ala Thr Asp Arg Leu Thr Arg Val His Glu Leu Arg Glu Arg Leu 1 5 10 15 Asp Glu Thr Leu Thr Ala Asn Arg Asn Glu Ile Leu Ala Leu Leu Ser 20 25 30 Arg Ile Glu Ala Lys Gly Lys Gly Ile Leu Gln His His Gln Val Ile 35 40 45 Ala Glu Phe Glu Glu Ile Pro Glu Glu Asn Arg Gln Lys Leu Thr Asp 50 55 60 Gly Ala Phe Gly Glu Val Leu Arg Ser Thr Gln Glu Ala Ile Val Leu 65 70 75 80 Pro Pro Trp Val Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu 85 90 95 Tyr Leu Arg Val Asn Val His Ala Leu Val Val Glu Glu Leu Gln Pro 100 105 110 Ala Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Ser Ser Asn 115 120 125 Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala Ala Phe 130 135 140 Pro Arg Pro Thr Leu Asn Lys Ser Ile Gly Asn Gly Val Gln Phe Leu 145 150 155 160 Asn Arg His Leu Ser Ala Lys Leu Phe His Asp Lys Glu Ser Leu His 165 170 175 Pro Leu Leu Glu Phe Leu Arg Leu His Ser Val Lys Gly Lys Thr Leu 180 185 190 Met Leu Asn Asp Arg Ile Gln Asn Pro Asp Ala Leu Gln His Val Leu 195 200 205 Arg Lys Ala Glu Glu Tyr Leu Gly Thr Val Pro Pro Glu Thr Pro Tyr 210 215 220 Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp 225 230 235 240 Gly Asp Asn Ala Glu Arg Val Leu Glu Ser Ile Gln Leu Leu Leu Asp 245 250 255 Leu Leu Glu Ala Pro Asp Pro Cys Thr Leu Glu Thr Phe Leu Gly Arg 260 265 270 Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe 275 280 285 Ala Gln Asp Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val 290 295 300 Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Asn Glu Met Leu His Arg 305 310 315 320 Ile Lys Gln Gln Gly Leu Asp Ile Val Pro Arg Ile Leu Ile Ile Thr 325 330 335 Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu 340 345 350 Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg 355 360 365 Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp 370 375 380 Pro Tyr Leu Glu Thr Tyr Thr Glu Asp Val Ala His Glu Leu Ala Lys 385 390 395 400 Glu Leu Gln Gly Lys Pro Asp Leu Ile Val Gly Asn Tyr Ser Asp Gly 405 410 415 Asn Ile Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys 420 425 430 Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Glu Ser Asp Ile 435 440 445 Tyr Trp Lys Lys Leu Glu Glu Arg Tyr His Phe Ser Cys Gln Phe Thr 450 455 460 Ala Asp Leu Phe Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr 465 470 475 480 Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser 485 490 495 His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His Gly Ile 500 505 510 Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Gln 515 520 525 Thr Ile Tyr Phe Pro His Thr Glu Thr Ser Arg Arg Leu Thr Ser Phe 530 535 540 His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Ser Val Glu Asn Glu Glu 545 550 555 560 His Ile Cys Val Leu Lys Asp Arg Ser Lys Pro Ile Ile Phe Thr Met 565 570 575 Ala Arg Leu Asp Arg Val Lys Asn Ile Thr Gly Leu Val Glu Trp Tyr 580 585 590 Gly Lys Asn Ala Lys Leu Arg Glu Leu Val Asn Leu Val Val Val Ala 595 600 605 Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Lys Ala Glu Met 610 615 620 Lys Lys Met Tyr Gly Leu Ile Glu Thr Tyr Lys Leu Asn Gly Gln Phe 625 630 635 640 Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr 645 650 655 Arg Val Ile Cys Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Val Tyr 660 665 670 Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro 675 680 685 Thr Phe Ala Thr Cys Asn Gly Gly Pro Ala Glu Ile Ile Val His Gly 690 695 700 Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Arg Ala Ala Asp 705 710 715 720 Leu Leu Val Asp Phe Phe Glu Lys Cys Lys Leu Asp Pro Thr His Trp 725 730 735 Asp Lys Ile Ser Lys Ala Gly Leu Gln Arg Ile Glu Glu Lys Tyr Thr 740 745 750 Trp Gln Ile Tyr Ser Gln Arg Leu Leu Thr Leu Thr Gly Val Tyr Gly 755 760 765 Phe Trp Lys His Val Ser Asn Leu Asp Arg Arg Glu Ser Arg Arg Tyr 770 775 780 Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Leu Ala Glu Ser Val 785 790 795 800 Pro Leu Ala Ala Glu 805 <210> 12 <211> 807 <212> PRT <213> Anabaena sp. 54 <400> 12 Met Ala Ser Glu Leu Met Gln Ala Ile Leu Asp Ser Glu Glu Lys His 1 5 10 15 Asp Leu Arg Gly Phe Ile Ser Glu Leu Arg Gln Gln Asp Lys Asn Tyr 20 25 30 Leu Leu Arg Asn Asp Ile Leu Asn Val Tyr Ala Glu Tyr Cys Ser Lys 35 40 45 Cys Gln Lys Pro Glu Thr Ser Tyr Lys Phe Ser Asn Leu Ser Lys Leu 50 55 60 Ile Tyr Tyr Thr Gln Glu Ile Ile Pro Glu Asp Ser Asn Phe Cys Phe 65 70 75 80 Ile Ile Arg Pro Lys Ile Ala Ala Gln Glu Val Tyr Arg Leu Thr Ala 85 90 95 Asp Leu Asp Val Glu Pro Met Thr Val Gln Glu Leu Leu Asp Leu Arg 100 105 110 Asp Arg Leu Val Asn Lys Phe His Pro Tyr Glu Gly Asp Ile Leu Glu 115 120 125 Leu Asp Phe Gly Pro Phe Tyr Asp Tyr Thr Pro Thr Ile Arg Asp Pro 130 135 140 Lys Asn Ile Gly Lys Gly Val Gln Tyr Leu Asn Arg Tyr Leu Ser Ser 145 150 155 160 Lys Leu Phe Gln Asp Ser Gln Gln Trp Leu Glu Ser Leu Phe Asn Phe 165 170 175 Leu Arg Leu His Asn Tyr Asn Gly Ile Gln Leu Leu Ile Asn His Gln 180 185 190 Ile Gln Ser Gln Gln Gln Leu Ser Gln Gln Val Lys Asn Ala Leu Asn 195 200 205 Phe Val Ser Asp Arg Pro Asn Asp Glu Pro Tyr Glu Gln Phe Arg Leu 210 215 220 Gln Leu Gln Thr Met Gly Phe Glu Pro Gly Trp Gly Asn Thr Ala Ser 225 230 235 240 Arg Val Arg Asp Thr Leu Asn Ile Leu Asp Glu Leu Ile Asp Ser Pro 245 250 255 Asp Pro Gln Thr Leu Glu Ala Phe Ile Ser Arg Ile Pro Met Ile Phe 260 265 270 Arg Ile Val Leu Val Ser Ala His Gly Trp Phe Gly Gln Glu Gly Val 275 280 285 Leu Gly Arg Pro Asp Thr Gly Gly Gln Val Val Tyr Val Leu Asp Gln 290 295 300 Ala Lys Asn Leu Glu Lys Gln Leu Gln Glu Asp Ala Ile Leu Ala Gly 305 310 315 320 Leu Glu Val Leu Asn Val Gln Pro Lys Val Ile Ile Leu Thr Arg Leu 325 330 335 Ile Pro Asn Ser Asp Gly Thr Leu Cys Asn Gln Arg Leu Glu Lys Val 340 345 350 Tyr Gly Thr Glu Asn Ala Trp Ile Leu Arg Val Pro Leu Arg Glu Phe 355 360 365 Asn Pro Lys Met Thr Gln Asn Trp Ile Ser Arg Phe Glu Phe Trp Pro 370 375 380 Tyr Leu Glu Thr Phe Ala Ile Asp Ser Glu Arg Glu Leu Leu Ala Glu 385 390 395 400 Phe Gln Gly Arg Pro Asp Leu Ile Val Gly Asn Tyr Thr Asp Gly Asn 405 410 415 Leu Val Ala Phe Leu Leu Thr Arg Arg Met Lys Val Thr Gln Cys Asn 420 425 430 Ile Ala His Ala Leu Glu Lys Ser Lys Tyr Leu Phe Ser Asn Leu Tyr 435 440 445 Trp Gln Asp Leu Glu Glu Lys Tyr His Phe Ser Leu Gln Phe Thr Ala 450 455 460 Asp Leu Ile Ala Met Asn Ala Ala Asn Phe Val Ile Ser Ser Thr Tyr 465 470 475 480 Gln Glu Ile Val Gly Thr Pro Asp Ser Ile Gly Gln Tyr Glu Ser Tyr 485 490 495 Lys Cys Phe Thr Met Pro Glu Leu Tyr His Val Val Asn Gly Ile Glu 500 505 510 Leu Phe Ser Pro Lys Phe Asn Val Val Pro Pro Gly Val Asn Glu Asn 515 520 525 Ser Tyr Phe Pro Tyr Thr Gln Thr Gln Asn Arg Ile Glu Ser Asp Arg 530 535 540 Asp Arg Leu Glu Glu Met Leu Phe Thr Leu Glu Asp Ser Ser Gln Ile 545 550 555 560 Phe Gly Lys Leu Asp Asp Pro Asn Lys Arg Pro Ile Phe Ser Met Ala 565 570 575 Arg Leu Asp Arg Ile Lys Asn Leu Thr Gly Leu Ala Glu Cys Phe Gly 580 585 590 Gln Ser Gln Glu Leu Gln Glu Arg Cys Asn Leu Ile Leu Val Ala Gly 595 600 605 Lys Leu Arg Ile Glu Glu Ser Glu Asp Asn Glu Glu Lys Asp Glu Ile 610 615 620 Val Lys Leu Tyr Arg Ile Ile Asp Glu Tyr Asn Leu His Gly Lys Ile 625 630 635 640 Arg Trp Leu Gly Val Arg Leu Ser Lys Asn Asp Ser Gly Glu Ile Tyr 645 650 655 Arg Val Ile Cys Asp Arg Gln Gly Ile Phe Val Gln Pro Ala Leu Phe 660 665 670 Glu Ala Phe Gly Leu Thr Ile Leu Glu Ser Met Ile Ser Gly Leu Pro 675 680 685 Thr Phe Ala Thr Gln Phe Gly Gly Pro Leu Glu Ile Ile Gln Asp Lys 690 695 700 Ile Asn Gly Phe Tyr Ile Asn Pro Thr His Leu Glu Glu Thr Ala Thr 705 710 715 720 Lys Ile Leu Asp Phe Val Thr Lys Cys Glu Gln Asn Pro Asn Tyr Trp 725 730 735 Asn Ile Ile Ser Glu Lys Ala Ile Asp Arg Val Tyr Ser Thr Tyr Thr 740 745 750 Trp Lys Ile His Thr Thr Lys Leu Leu Thr Leu Ala Arg Ile Tyr Gly 755 760 765 Phe Trp Asn Phe Thr Ser Lys Glu Lys Arg Glu Asp Leu Leu Arg Tyr 770 775 780 Leu Glu Ser Leu Phe Tyr Leu Ile Tyr Lys Pro Arg Ala Gln Gln Leu 785 790 795 800 Leu Glu Gln His Lys Tyr Arg 805 <210> 13 <211> 463 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 13 Met Ala Thr Lys Gly Ser Ser Gly Met Ser Leu Ala Glu Arg Phe Trp 1 5 10 15 Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val Glu 20 25 30 Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys Pro 35 40 45 Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg Glu 50 55 60 Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala Lys 65 70 75 80 Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val Glu 85 90 95 Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg Phe 100 105 110 Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu Leu 115 120 125 Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala Thr 130 135 140 Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly Ala 145 150 155 160 Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met Phe 165 170 175 Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Gly Pro Asn 180 185 190 Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg Asn 195 200 205 Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile Arg 210 215 220 Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys Ala 225 230 235 240 Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg Tyr 245 250 255 Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp Asp Ser Gly 260 265 270 Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val Ile Cys 275 280 285 Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu Ala Gln 290 295 300 Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg 305 310 315 320 Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro Leu Val 325 330 335 Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro Asp Gly 340 345 350 Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met Val Glu 355 360 365 Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser Glu Phe 370 375 380 Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Val Phe His His 385 390 395 400 Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala Met Met 405 410 415 Leu Leu Gly Ser Ala Glu Met Ile Ala Ser Ile Ala Asp Glu Arg Leu 420 425 430 Glu His Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly Arg Pro 435 440 445 Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile Arg 450 455 460 <210> 14 <211> 463 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 14 Met Ala Thr Lys Asn Ser Ser Gly Met Ser Leu Ala Glu Arg Phe Trp 1 5 10 15 Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val Glu 20 25 30 Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys Pro 35 40 45 Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg Glu 50 55 60 Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala Lys 65 70 75 80 Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val Glu 85 90 95 Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg Phe 100 105 110 Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu Leu 115 120 125 Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala Thr 130 135 140 Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly Ala 145 150 155 160 Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met Phe 165 170 175 Gly His Pro Leu Ile Met Leu Pro Ile Thr Gly Asp Gln Gly Pro Asn 180 185 190 Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg Asn 195 200 205 Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile Arg 210 215 220 Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys Ala 225 230 235 240 Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg Tyr 245 250 255 Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp Asp Ser Gly 260 265 270 Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val Ile Cys 275 280 285 Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu Ala Gln 290 295 300 Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr Pro Arg 305 310 315 320 Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro Leu Val 325 330 335 Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro Asp Gly 340 345 350 Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met Val Glu 355 360 365 Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser Glu Phe 370 375 380 Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Ser Phe His His 385 390 395 400 Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala Met Met 405 410 415 Leu Leu Gly Ser Ala Glu Met Ile Ala Ser Ile Ala Asp Glu Arg Leu 420 425 430 Glu His Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly Arg Pro 435 440 445 Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile Arg 450 455 460 <210> 15 <211> 465 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 15 Met Ala Arg Arg Thr Lys Asn Ser Ser Gly Met Ser Leu Ala Glu Arg 1 5 10 15 Phe Trp Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys 20 25 30 Val Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly 35 40 45 Lys Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu Pro Glu Gly Arg 50 55 60 Arg Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro 65 70 75 80 Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly 85 90 95 Val Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr 100 105 110 Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp 115 120 125 Leu Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val 130 135 140 Ala Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val 145 150 155 160 Gly Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu 165 170 175 Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Thr Gly Asp Gln Gly 180 185 190 Pro Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala 195 200 205 Arg Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala 210 215 220 Ile Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Glu 225 230 235 240 Lys Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu 245 250 255 Arg Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp Asp 260 265 270 Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val 275 280 285 Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu 290 295 300 Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr 305 310 315 320 Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro 325 330 335 Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro 340 345 350 Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met 355 360 365 Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser 370 375 380 Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Ser Phe 385 390 395 400 His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala 405 410 415 Met Met Phe Leu Gly Ser Ala Glu Met Ile Ala Ser Ile Ala Asp Glu 420 425 430 Arg Leu Glu His Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly 435 440 445 Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile 450 455 460 Arg 465 <210> 16 <211> 465 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 16 Met Ala Arg Arg Thr Lys Asn Ser Ser Gly Met Ser Leu Ala Glu Arg 1 5 10 15 Phe Trp Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys 20 25 30 Val Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly 35 40 45 Lys Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu Pro Glu Gly Arg 50 55 60 Arg Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro 65 70 75 80 Ala Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly 85 90 95 Val Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr 100 105 110 Arg Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp 115 120 125 Leu Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val 130 135 140 Ala Thr Arg Trp Val Pro Gln Ala Ala Ile Leu Ala His Ala Ala Val 145 150 155 160 Gly Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu 165 170 175 Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Thr Gly Asp Gln Gly 180 185 190 Pro Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala 195 200 205 Arg Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala 210 215 220 Ile Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Glu 225 230 235 240 Lys Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu 245 250 255 Arg Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp Asp 260 265 270 Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His Val Val 275 280 285 Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu Asp Leu 290 295 300 Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val Ser Thr 305 310 315 320 Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu Ala Pro 325 330 335 Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly Leu Pro 340 345 350 Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro Asp Met 355 360 365 Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro Phe Ser 370 375 380 Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp Ser Phe 385 390 395 400 His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro Cys Ala 405 410 415 Met Met Phe Leu Gly Ser Ala Glu Met Ile Ala Ser Ile Ala Asp Glu 420 425 430 Arg Leu Glu His Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly Gln Gly 435 440 445 Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys Leu Ile 450 455 460 Arg 465 <210> 17 <211> 481 <212> PRT <213> Stevia rebaudiana <400> 17 Met Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe Ile 1 5 10 15 Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala Gln 20 25 30 Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp Phe 35 40 45 Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp Gly 50 55 60 Ala Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His Ser 65 70 75 80 Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile Glu 85 90 95 Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro Asp 100 105 110 Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr Ile 115 120 125 Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr Leu 130 135 140 Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile Glu 145 150 155 160 Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly Tyr 165 170 175 Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg Leu 180 185 190 Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val Leu 195 200 205 Met Phe Thr Thr Glu Ala Pro Gln Arg Ser His Lys Val Ser His His 210 215 220 Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr Leu 225 230 235 240 Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu Leu 245 250 255 Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser Leu 260 265 270 His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp Leu 275 280 285 Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser Thr 290 295 300 Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu Ala 305 310 315 320 Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val Ile 325 330 335 Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys Lys 340 345 350 Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys His 355 360 365 Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr Ile 370 375 380 Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser Trp 385 390 395 400 Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val Gly 405 410 415 Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu Val 420 425 430 Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala Lys 435 440 445 Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser Ser 450 455 460 Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala Arg 465 470 475 480 Asn <210> 18 <211> 460 <212> PRT <213> Stevia rebaudiana <400> 18 Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile 1 5 10 15 Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys 20 25 30 Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His 35 40 45 Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile 50 55 60 Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser 65 70 75 80 Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser 85 90 95 Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp 100 105 110 Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile 115 120 125 Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val 130 135 140 Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu 145 150 155 160 Gly Glu Thr Val Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu 165 170 175 Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser 180 185 190 Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val 195 200 205 Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr 210 215 220 Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met 225 230 235 240 Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu 245 250 255 Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro 260 265 270 Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly 275 280 285 Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val 290 295 300 Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu 305 310 315 320 Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp 325 330 335 Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val 340 345 350 Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val 355 360 365 Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys 370 375 380 Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu 385 390 395 400 Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile 405 410 415 Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp 420 425 430 Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn 435 440 445 Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala 450 455 460 <210> 19 <211> 458 <212> PRT <213> Stevia rebaudiana <400> 19 Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile 1 5 10 15 Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu 20 25 30 Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr 35 40 45 Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg 50 55 60 Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro 65 70 75 80 Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His 85 90 95 Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser 100 105 110 Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr 115 120 125 Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu 130 135 140 Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln 145 150 155 160 Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu 165 170 175 Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser 180 185 190 Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile 195 200 205 Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu 210 215 220 Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro 225 230 235 240 Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser 245 250 255 Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro 260 265 270 Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp 275 280 285 Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln 290 295 300 Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp 305 310 315 320 Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val 325 330 335 Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala 340 345 350 Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu 355 360 365 Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn 370 375 380 Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn 385 390 395 400 Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val 405 410 415 Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln 420 425 430 Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu 435 440 445 Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu 450 455 <210> 20 <211> 459 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 20 Met Ala Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile Lys 1 5 10 15 Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu 20 25 30 Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser 35 40 45 Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu 50 55 60 Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro 65 70 75 80 Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu 85 90 95 Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln Ser 100 105 110 Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp Val 115 120 125 Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val Lys 130 135 140 Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala Phe 145 150 155 160 Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu Gly 165 170 175 Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn Ala 180 185 190 Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn Gly 195 200 205 Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val Asp 210 215 220 Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln Lys 225 230 235 240 Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu Glu 245 250 255 Ser Leu Val Ser Tyr Ile Ser Ser Leu Glu Asn Lys Thr Glu Thr Thr 260 265 270 Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln Gly 275 280 285 His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys Gly 290 295 300 Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr Ser 305 310 315 320 Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro Gln 325 330 335 Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala Gly Met 340 345 350 Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg Arg Glu 355 360 365 Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val Ser Cys 370 375 380 Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala Asp Ser 385 390 395 400 Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe Asn Phe 405 410 415 His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr Leu Asp 420 425 430 Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe Pro Met 435 440 445 Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser 450 455 <210> 21 <211> 459 <212> PRT <213> Stevia rebaudiana <400> 21 Met Ala Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile 1 5 10 15 Ile Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln 20 25 30 Leu Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His 35 40 45 Thr Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe 50 55 60 Arg Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu 65 70 75 80 Pro Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu 85 90 95 His Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala 100 105 110 Ser Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp 115 120 125 Tyr Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val 130 135 140 Leu Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro 145 150 155 160 Gln Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu 165 170 175 Glu Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys 180 185 190 Ser Ala Tyr Ser Asn Trp Gln Ile Ala Lys Glu Ile Leu Gly Lys Met 195 200 205 Ile Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys 210 215 220 Glu Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala 225 230 235 240 Pro Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser 245 250 255 Ser Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln 260 265 270 Pro Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val 275 280 285 Asp Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys 290 295 300 Gln Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr 305 310 315 320 Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile 325 330 335 Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly 340 345 350 Ala Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys 355 360 365 Glu Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu 370 375 380 Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu 385 390 395 400 Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met 405 410 415 Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys 420 425 430 Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser 435 440 445 Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu 450 455 <210> 22 <211> 459 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 22 Met Ala Lys Gln Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys 1 5 10 15 Gly Ser Thr Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg 20 25 30 Gly Arg Ile Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly 35 40 45 Ala Ile Gly Ala Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu 50 55 60 Ser Val Cys Glu Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp 65 70 75 80 Gln Pro Leu Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val 85 90 95 Tyr Leu Glu Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg 100 105 110 Arg Val Met Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg 115 120 125 Val Leu Lys Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser 130 135 140 Tyr Glu Ser Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Glu Asn 145 150 155 160 Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile Leu Phe Pro 165 170 175 Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu Ala Asn Val 180 185 190 Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn 195 200 205 Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu 210 215 220 Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly 225 230 235 240 Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp 245 250 255 Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp 260 265 270 Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln 275 280 285 Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser 290 295 300 Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu 305 310 315 320 Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala 325 330 335 Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser 340 345 350 Asn Trp Gln Ile Ala Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr 355 360 365 Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu 370 375 380 Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu 385 390 395 400 Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp 405 410 415 His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser 420 425 430 Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp 435 440 445 Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser 450 455 <210> 23 <211> 458 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 23 Met Ala Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr 1 5 10 15 Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile 20 25 30 Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly 35 40 45 Ala Phe Trp Thr His Gly Gly Trp Asn Ser Thr Leu Glu Ser Val Cys 50 55 60 Glu Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu 65 70 75 80 Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu 85 90 95 Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Leu Met 100 105 110 Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys 115 120 125 Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser 130 135 140 Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser Gly Gly Ser 145 150 155 160 Gly Gly Ser Gly Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe 165 170 175 Gln Gly His Ile Asn Pro Met Leu Gln Leu Ala Asn Val Leu Tyr Ser 180 185 190 Lys Gly Phe Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys 195 200 205 Thr Ser Asn Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp 210 215 220 Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala 225 230 235 240 Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg 245 250 255 Arg Glu Leu Glu Leu Leu Met Leu Ala Ser Glu Glu Asp Glu Glu Val 260 265 270 Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala 275 280 285 Asp Ser Leu Asn Leu Arg Arg Leu Val Leu Met Thr Ser Ser Leu Phe 290 295 300 Asn Phe His Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr 305 310 315 320 Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe 325 330 335 Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln 340 345 350 Ile Ala Lys Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser 355 360 365 Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu 370 375 380 Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu 385 390 395 400 Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu Leu Asp His Asp Arg 405 410 415 Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr 420 425 430 Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu 435 440 445 Ile Ala Arg Gly Leu Val Asp Ser Gln Ser 450 455 <210> 24 <211> 455 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 24 Met Ala Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr 1 5 10 15 Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile 20 25 30 Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly 35 40 45 Ala Phe Trp Thr His Gly Gly Trp Asn Ser Thr Leu Glu Ser Val Cys 50 55 60 Glu Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu 65 70 75 80 Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu 85 90 95 Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Leu Met 100 105 110 Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys 115 120 125 Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser 130 135 140 Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser Gly Gly Ser 145 150 155 160 Gly Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln Gly His 165 170 175 Ile Asn Pro Met Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys Gly Phe 180 185 190 Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr Ser Asn 195 200 205 Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro Gln Asp 210 215 220 Glu Arg Ile Ser Asn Leu Pro Thr His Gly Pro Leu Ala Gly Met Arg 225 230 235 240 Ile Pro Ile Ile Asn Glu His Gly Ala Asp Glu Leu Arg Arg Glu Leu 245 250 255 Glu Leu Gln Met Leu Ala Ser Glu Glu Asp Glu Glu Val Ser Cys Leu 260 265 270 Ile Thr Asp Ala Leu Trp Tyr Phe Ala Gln Ser Val Ala Asp Ser Leu 275 280 285 Asn Leu Pro Arg Leu Val Leu Met Thr Ser Ser Leu Phe Asn Phe His 290 295 300 Ala His Val Ser Leu Pro Gln Phe Asp Glu Leu Gly Tyr Leu Asp Pro 305 310 315 320 Asp Asp Lys Thr Arg Leu Glu Glu Gln Ala Ser Gly Phe Pro Met Leu 325 330 335 Lys Val Lys Asp Ile Lys Ser Ala Tyr Ser Asn Trp Gln Ile Ala Lys 340 345 350 Glu Ile Leu Gly Lys Met Ile Lys Gln Thr Lys Ala Ser Ser Gly Val 355 360 365 Ile Trp Asn Ser Phe Lys Glu Leu Glu Glu Ser Glu Leu Glu Thr Val 370 375 380 Ile Arg Glu Ile Pro Ala Pro Ser Phe Leu Ile Pro Leu Pro Lys His 385 390 395 400 Leu Thr Ala Ser Ser Ser Ser Leu Leu Glu His Asp Arg Thr Val Phe 405 410 415 Gln Trp Leu Asp Gln Gln Pro Pro Ser Ser Val Leu Tyr Val Ser Phe 420 425 430 Gly Ser Thr Ser Glu Val Asp Glu Lys Asp Phe Leu Glu Ile Ala Arg 435 440 445 Gly Leu Val Asp Ser Gln Ser 450 455 <210> 25 <211> 447 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 25 Met Ala Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr 1 5 10 15 Trp Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile 20 25 30 Val Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly 35 40 45 Ala Phe Trp Thr His Gly Gly Trp Asn Ser Thr Leu Glu Ser Val Cys 50 55 60 Glu Gly Val Pro Met Ile Phe Gln Asp Phe Gly Leu Asp Gln Pro Leu 65 70 75 80 Asn Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu 85 90 95 Asn Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Leu Met 100 105 110 Val Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys 115 120 125 Gln Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser 130 135 140 Leu Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu Gly Ser Gly Gly Ser 145 150 155 160 Gly Arg Arg Arg Arg Ile Ile Leu Phe Pro Val Pro Phe Gln Gly His 165 170 175 Ile Asn Pro Met Leu Gln Leu Ala Asn Val Leu Tyr Ser Lys Gly Phe 180 185 190 Ser Ile Thr Ile Phe His Thr Asn Phe Asn Lys Pro Lys Thr Ser Asn 195 200 205 Tyr Pro His Phe Thr Phe Arg Phe Ile Leu Asp Asn Asp Pro Gln Asp 210 215 220 His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His Gly 225 230 235 240 Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Gln Met Leu Ala Ser Glu 245 250 255 Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr Phe 260 265 270 Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Pro Arg Leu Val Leu Met 275 280 285 Thr Ser Ser Leu Phe Asn Phe His Cys His Val Ser Leu Pro Gln Phe 290 295 300 Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu Glu 305 310 315 320 Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser Ala 325 330 335 Phe Ser Asn Trp Gln Ile Ala Lys Glu Ile Leu Gly Lys Met Ile Lys 340 345 350 Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu Leu 355 360 365 Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro Ser 370 375 380 Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser Leu 385 390 395 400 Leu Glu His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro Pro 405 410 415 Ser Ser Val Ile Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp Glu 420 425 430 Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Gln Ser 435 440 445 <210> 26 <211> 485 <212> PRT <213> Stevia rebaudiana <400> 26 Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser 1 5 10 15 Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro 20 25 30 Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Gln Leu Ser Lys Leu 35 40 45 Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn 50 55 60 Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln 65 70 75 80 Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr 85 90 95 Thr Asp Val His Pro Glu Asp Ile Gln Tyr Leu Lys Lys Ala Val Asp 100 105 110 Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp 115 120 125 Trp Ile Ile Tyr Asp Phe Thr His Tyr Trp Leu Pro Ser Ile Ala Ala 130 135 140 Ser Leu Gly Ile Ser Arg Ala Tyr Phe Cys Val Ile Thr Pro Trp Thr 145 150 155 160 Ile Ala Tyr Leu Ala Pro Ser Ser Asp Ala Met Ile Asn Asp Ser Asp 165 170 175 Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro 180 185 190 Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Met Glu 195 200 205 Pro Tyr Glu Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Met Val 210 215 220 Phe Lys Gly Ser Asp Cys Leu Leu Phe Lys Cys Tyr His Glu Phe Gly 225 230 235 240 Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val 245 250 255 Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu 260 265 270 Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser 275 280 285 Val Val Tyr Val Ala Leu Gly Ser Glu Ala Leu Val Ser Gln Thr Glu 290 295 300 Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val 305 310 315 320 Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu 325 330 335 Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp 340 345 350 Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys 355 360 365 Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met 370 375 380 Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Cys Asp Gln Pro Leu 385 390 395 400 Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg 405 410 415 Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu 420 425 430 Arg Ser Val Val Val Glu Asn Glu Gly Glu Ile Tyr Lys Ala Asn Ala 435 440 445 Arg Ala Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr 450 455 460 Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala 465 470 475 480 Ile Asp His Glu Ser 485 <210> 27 <211> 473 <212> PRT <213> Stevia rebaudiana <400> 27 Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val 1 5 10 15 Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln 20 25 30 Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser 35 40 45 Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile 50 55 60 Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp 65 70 75 80 Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys 85 90 95 Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln 100 105 110 His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro 115 120 125 Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr 130 135 140 Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile 145 150 155 160 Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro 165 170 175 Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu 180 185 190 Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg 195 200 205 Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr 210 215 220 His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln 225 230 235 240 Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Val Pro Gly Asp 245 250 255 Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys 260 265 270 Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val 275 280 285 Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly 290 295 300 Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser 305 310 315 320 Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg 325 330 335 Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His 340 345 350 Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val 355 360 365 Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly 370 375 380 Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile 385 390 395 400 Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val 405 410 415 Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr 420 425 430 Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val 435 440 445 Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Thr 450 455 460 Arg Ala Val Ala Ile Asp His Glu Ser 465 470 <210> 28 <211> 473 <212> PRT <213> Stevia rebaudiana <400> 28 Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val 1 5 10 15 Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln 20 25 30 Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser 35 40 45 Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile 50 55 60 Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp 65 70 75 80 Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys 85 90 95 Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln 100 105 110 His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro 115 120 125 Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr 130 135 140 Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile 145 150 155 160 Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro 165 170 175 Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu 180 185 190 Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg 195 200 205 Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr 210 215 220 His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln 225 230 235 240 Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp 245 250 255 Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys 260 265 270 Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val 275 280 285 Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly 290 295 300 Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser 305 310 315 320 Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg 325 330 335 Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His 340 345 350 Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val 355 360 365 Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly 370 375 380 Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile 385 390 395 400 Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val 405 410 415 Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr 420 425 430 Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val 435 440 445 Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala 450 455 460 Arg Ala Val Ala Ile Asp His Glu Ser 465 470 <210> 29 <211> 462 <212> PRT <213> Oryza sativa <400> 29 Met Asp Ser Gly Tyr Ser Ser Ser Tyr Ala Ala Ala Ala Gly Met His 1 5 10 15 Val Val Ile Cys Pro Trp Leu Ala Phe Gly His Leu Leu Pro Cys Leu 20 25 30 Asp Leu Ala Gln Arg Leu Ala Ser Arg Gly His Arg Val Ser Phe Val 35 40 45 Ser Thr Pro Arg Asn Ile Ser Arg Leu Pro Pro Val Arg Pro Ala Leu 50 55 60 Ala Pro Leu Val Ala Phe Val Ala Leu Pro Leu Pro Arg Val Glu Gly 65 70 75 80 Leu Pro Asp Gly Ala Glu Ser Thr Asn Asp Val Pro His Asp Arg Pro 85 90 95 Asp Met Val Glu Leu His Arg Arg Ala Phe Asp Gly Leu Ala Ala Pro 100 105 110 Phe Ser Glu Phe Leu Gly Thr Ala Cys Ala Asp Trp Val Ile Val Asp 115 120 125 Val Phe His His Trp Ala Ala Ala Ala Ala Leu Glu His Lys Val Pro 130 135 140 Cys Ala Met Met Leu Leu Gly Ser Ala His Met Ile Ala Ser Ile Ala 145 150 155 160 Asp Arg Arg Leu Glu Arg Ala Glu Thr Glu Ser Pro Ala Ala Ala Gly 165 170 175 Gln Gly Arg Pro Ala Ala Ala Pro Thr Phe Glu Val Ala Arg Met Lys 180 185 190 Leu Ile Arg Thr Lys Gly Ser Ser Gly Met Ser Leu Ala Glu Arg Phe 195 200 205 Ser Leu Thr Leu Ser Arg Ser Ser Leu Val Val Gly Arg Ser Cys Val 210 215 220 Glu Phe Glu Pro Glu Thr Val Pro Leu Leu Ser Thr Leu Arg Gly Lys 225 230 235 240 Pro Ile Thr Phe Leu Gly Leu Met Pro Pro Leu His Glu Gly Arg Arg 245 250 255 Glu Asp Gly Glu Asp Ala Thr Val Arg Trp Leu Asp Ala Gln Pro Ala 260 265 270 Lys Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Pro Leu Gly Val 275 280 285 Glu Lys Val His Glu Leu Ala Leu Gly Leu Glu Leu Ala Gly Thr Arg 290 295 300 Phe Leu Trp Ala Leu Arg Lys Pro Thr Gly Val Ser Asp Ala Asp Leu 305 310 315 320 Leu Pro Ala Gly Phe Glu Glu Arg Thr Arg Gly Arg Gly Val Val Ala 325 330 335 Thr Arg Trp Val Pro Gln Met Ser Ile Leu Ala His Ala Ala Val Gly 340 345 350 Ala Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile Glu Gly Leu Met 355 360 365 Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Gly Pro 370 375 380 Asn Ala Arg Leu Ile Glu Ala Lys Asn Ala Gly Leu Gln Val Ala Arg 385 390 395 400 Asn Asp Gly Asp Gly Ser Phe Asp Arg Glu Gly Val Ala Ala Ala Ile 405 410 415 Arg Ala Val Ala Val Glu Glu Glu Ser Ser Lys Val Phe Gln Ala Lys 420 425 430 Ala Lys Lys Leu Gln Glu Ile Val Ala Asp Met Ala Cys His Glu Arg 435 440 445 Tyr Ile Asp Gly Phe Ile Gln Gln Leu Arg Ser Tyr Lys Asp 450 455 460 <210> 30 <211> 463 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 30 Met Ala Glu Cys Met Asn Trp Leu Asp Asp Lys Pro Lys Glu Ser Val 1 5 10 15 Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly Pro Glu Gln Val 20 25 30 Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val Asn Phe Leu Trp 35 40 45 Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu Asn Leu Ser Glu 50 55 60 Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp Cys Lys Gln Leu 65 70 75 80 Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val Thr His Cys Gly 85 90 95 Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val Pro Val Val Ala 100 105 110 Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys Leu Leu Asp Glu 115 120 125 Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu Asn Gly Ile Val 130 135 140 Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile Met Glu Glu Glu 145 150 155 160 Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp Lys Asp Leu Ala 165 170 175 Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn Asp Ile Val Glu 180 185 190 Phe Val Ser Glu Leu Ile Lys Ala Gly Ser Gly Glu Gln Gln Lys Ile 195 200 205 Lys Lys Ser Pro His Val Leu Leu Ile Pro Phe Pro Leu Gln Gly His 210 215 220 Ile Asn Pro Phe Ile Gln Phe Gly Lys Arg Leu Ile Ser Lys Gly Val 225 230 235 240 Lys Thr Thr Leu Val Thr Thr Ile His Thr Leu Asn Ser Thr Leu Asn 245 250 255 His Ser Asn Thr Thr Thr Thr Ser Ile Glu Ile Gln Ala Ile Ser Asp 260 265 270 Gly Cys Asp Glu Gly Gly Phe Met Ser Ala Gly Glu Ser Tyr Leu Glu 275 280 285 Thr Phe Lys Gln Val Gly Ser Lys Ser Leu Ala Asp Leu Ile Lys Lys 290 295 300 Leu Gln Ser Glu Gly Thr Thr Ile Asp Ala Ile Ile Tyr Asp Ser Met 305 310 315 320 Thr Glu Trp Val Leu Asp Val Ala Ile Glu Phe Gly Ile Asp Gly Gly 325 330 335 Ser Phe Phe Thr Gln Ala Cys Val Val Asn Ser Leu Tyr Tyr His Val 340 345 350 His Lys Gly Leu Ile Ser Leu Pro Leu Gly Glu Thr Val Ser Val Pro 355 360 365 Gly Phe Pro Val Leu Gln Arg Trp Glu Thr Pro Leu Ile Leu Gln Asn 370 375 380 His Glu Gln Ile Gln Ser Pro Trp Ser Gln Met Leu Phe Gly Gln Phe 385 390 395 400 Ala Asn Ile Asp Gln Ala Arg Trp Val Phe Thr Asn Ser Phe Tyr Lys 405 410 415 Leu Glu Glu Glu Val Ile Glu Trp Thr Arg Lys Ile Trp Asn Leu Lys 420 425 430 Val Ile Gly Pro Thr Leu Pro Ser Met Tyr Leu Asp Lys Arg Leu Asp 435 440 445 Asp Asp Lys Asp Asn Gly Phe Asn Leu Tyr Lys Ala Asn His His 450 455 460 <210> 31 <211> 463 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 31 Met Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro Lys 1 5 10 15 Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly Pro 20 25 30 Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val Asn 35 40 45 Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu Asn 50 55 60 Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp Cys 65 70 75 80 Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val Thr 85 90 95 His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val Pro 100 105 110 Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys Leu 115 120 125 Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu Asn 130 135 140 Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile Met 145 150 155 160 Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp Lys 165 170 175 Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn Asp 180 185 190 Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala Gly Ser Gly Glu Gln 195 200 205 Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile Pro Phe Pro Leu 210 215 220 Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys Arg Leu Ile Ser 225 230 235 240 Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His Thr Leu Asn Ser 245 250 255 Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile Glu Ile Gln Ala 260 265 270 Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser Ala Gly Glu Ser 275 280 285 Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser Leu Ala Asp Leu 290 295 300 Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp Ala Ile Ile Tyr 305 310 315 320 Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile Glu Phe Gly Ile 325 330 335 Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val Asn Ser Leu Tyr 340 345 350 Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu Gly Glu Thr Val 355 360 365 Ser Val Pro Gly Phe Pro Val Leu Gln Arg Trp Glu Thr Pro Leu Ile 370 375 380 Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser Gln Met Leu Phe 385 390 395 400 Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val Phe Thr Asn Ser 405 410 415 Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr Arg Lys Ile Trp 420 425 430 Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met Tyr Leu Asp Lys 435 440 445 Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu Tyr Lys Ala 450 455 460 <210> 32 <211> 482 <212> PRT <213> Stevia rebaudiana <400> 32 Met Ala Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe 1 5 10 15 Ile Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala 20 25 30 Gln Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp 35 40 45 Phe Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp 50 55 60 Gly Ala Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His 65 70 75 80 Ser Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile 85 90 95 Glu Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro 100 105 110 Asp Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr 115 120 125 Ile Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr 130 135 140 Leu Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile 145 150 155 160 Glu Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly 165 170 175 Tyr Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg 180 185 190 Leu Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val 195 200 205 Leu Met Phe Thr Thr Glu Ala Thr Gln Arg Ser His Lys Val Ser His 210 215 220 His Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr 225 230 235 240 Leu Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu 245 250 255 Leu Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser 260 265 270 Leu His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp 275 280 285 Leu Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser 290 295 300 Thr Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu 305 310 315 320 Ala Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val 325 330 335 Ile Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys 340 345 350 Lys Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys 355 360 365 His Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr 370 375 380 Ile Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser 385 390 395 400 Trp Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val 405 410 415 Gly Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu 420 425 430 Val Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala 435 440 445 Lys Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser 450 455 460 Ser Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala 465 470 475 480 Arg Asn <210> 33 <211> 523 <212> PRT <213> Siraitia grosvenorii <400> 33 Met Glu Asp Arg Asn Ala Met Asp Met Ser Arg Ile Lys Tyr Arg Pro 1 5 10 15 Gln Pro Leu Arg Pro Ala Ser Met Val Gln Pro Arg Val Leu Leu Phe 20 25 30 Pro Phe Pro Ala Leu Gly His Val Lys Pro Phe Leu Ser Leu Ala Glu 35 40 45 Leu Leu Ser Asp Ala Gly Ile Asp Val Val Phe Leu Ser Thr Glu Tyr 50 55 60 Asn His Arg Arg Ile Ser Asn Thr Glu Ala Leu Ala Ser Arg Phe Pro 65 70 75 80 Thr Leu His Phe Glu Thr Ile Pro Asp Gly Leu Pro Pro Asn Glu Ser 85 90 95 Arg Ala Leu Ala Asp Gly Pro Leu Tyr Phe Ser Met Arg Glu Gly Thr 100 105 110 Lys Pro Arg Phe Arg Gln Leu Ile Gln Ser Leu Asn Asp Gly Arg Trp 115 120 125 Pro Ile Thr Cys Ile Ile Thr Asp Ile Met Leu Ser Ser Pro Ile Glu 130 135 140 Val Ala Glu Glu Phe Gly Ile Pro Val Ile Ala Phe Cys Pro Cys Ser 145 150 155 160 Ala Arg Tyr Leu Ser Ile His Phe Phe Ile Pro Lys Leu Val Glu Glu 165 170 175 Gly Gln Ile Pro Tyr Ala Asp Asp Asp Pro Ile Gly Glu Ile Gln Gly 180 185 190 Val Pro Leu Phe Glu Gly Leu Leu Arg Arg Asn His Leu Pro Gly Ser 195 200 205 Trp Ser Asp Lys Ser Ala Asp Ile Ser Phe Ser His Gly Leu Ile Asn 210 215 220 Gln Thr Leu Ala Ala Gly Arg Ala Ser Ala Leu Ile Leu Asn Thr Phe 225 230 235 240 Asp Glu Leu Glu Ala Pro Phe Leu Thr His Leu Ser Ser Ile Phe Asn 245 250 255 Lys Ile Tyr Thr Ile Gly Pro Leu His Ala Leu Ser Lys Ser Arg Leu 260 265 270 Gly Asp Ser Ser Ser Ser Ala Ser Ala Leu Ser Gly Phe Trp Lys Glu 275 280 285 Asp Arg Ala Cys Met Ser Trp Leu Asp Cys Gln Pro Pro Arg Ser Val 290 295 300 Val Phe Val Ser Phe Gly Ser Thr Met Lys Met Lys Ala Asp Glu Leu 305 310 315 320 Arg Glu Phe Trp Tyr Gly Leu Val Ser Ser Gly Lys Pro Phe Leu Cys 325 330 335 Val Leu Arg Ser Asp Val Val Ser Gly Gly Glu Ala Ala Glu Leu Ile 340 345 350 Glu Gln Met Ala Glu Glu Glu Gly Ala Gly Gly Lys Leu Gly Met Val 355 360 365 Val Glu Trp Ala Ala Gln Glu Lys Val Leu Ser His Pro Ala Val Gly 370 375 380 Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Ser Ile Ala 385 390 395 400 Ala Gly Val Pro Met Met Cys Trp Pro Ile Leu Gly Asp Gln Pro Ser 405 410 415 Asn Ala Thr Trp Ile Asp Arg Val Trp Lys Ile Gly Val Glu Arg Asn 420 425 430 Asn Arg Glu Trp Asp Arg Leu Thr Val Glu Lys Met Val Arg Ala Leu 435 440 445 Met Glu Gly Gln Lys Arg Val Glu Ile Gln Arg Ser Met Glu Lys Leu 450 455 460 Ser Lys Leu Ala Asn Glu Lys Val Val Arg Gly Ile Asn Leu His Pro 465 470 475 480 Thr Ile Ser Leu Lys Lys Asp Thr Pro Thr Thr Ser Glu His Pro Arg 485 490 495 His Glu Phe Glu Asn Met Arg Gly Met Asn Tyr Glu Met Leu Val Gly 500 505 510 Asn Ala Ile Lys Ser Pro Thr Leu Thr Lys Lys 515 520 <210> 34 <211> 473 <212> PRT <213> Siraitia grosvenorii <400> 34 Met Thr Ile Phe Phe Ser Val Glu Ile Leu Val Leu Gly Ile Ala Glu 1 5 10 15 Phe Ala Ala Ile Ala Met Asp Ala Ala Gln Gln Gly Asp Thr Thr Thr 20 25 30 Ile Leu Met Leu Pro Trp Leu Gly Tyr Gly His Leu Ser Ala Phe Leu 35 40 45 Glu Leu Ala Lys Ser Leu Ser Arg Arg Asn Phe His Ile Tyr Phe Cys 50 55 60 Ser Thr Ser Val Asn Leu Asp Ala Ile Lys Pro Lys Leu Pro Ser Ser 65 70 75 80 Phe Ser Asp Ser Ile Gln Phe Val Glu Leu His Leu Pro Ser Ser Pro 85 90 95 Glu Phe Pro Pro His Leu His Thr Thr Asn Gly Leu Pro Pro Thr Leu 100 105 110 Met Pro Ala Leu His Gln Ala Phe Ser Met Ala Ala Gln His Phe Glu 115 120 125 Ser Ile Leu Gln Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ser Leu 130 135 140 Gln Pro Trp Ala Pro Arg Val Ala Ser Ser Leu Lys Ile Pro Ala Ile 145 150 155 160 Asn Phe Asn Thr Thr Gly Val Phe Val Ile Ser Gln Gly Leu His Pro 165 170 175 Ile His Tyr Pro His Ser Lys Phe Pro Phe Ser Glu Phe Val Leu His 180 185 190 Asn His Trp Lys Ala Met Tyr Ser Thr Ala Asp Gly Ala Ser Thr Glu 195 200 205 Arg Thr Arg Lys Arg Gly Glu Ala Phe Leu Tyr Cys Leu His Ala Ser 210 215 220 Cys Ser Val Ile Leu Ile Asn Ser Phe Arg Glu Leu Glu Gly Lys Tyr 225 230 235 240 Met Asp Tyr Leu Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly 245 250 255 Pro Leu Val Tyr Glu Pro Asn Gln Asp Gly Glu Asp Glu Gly Tyr Ser 260 265 270 Ser Ile Lys Asn Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe 275 280 285 Val Ser Phe Gly Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu 290 295 300 Ile Ala His Gly Leu Glu Ala Ser Glu Val Asn Phe Ile Trp Val Val 305 310 315 320 Arg Phe Pro Gln Gly Asp Asn Thr Ser Gly Ile Glu Asp Ala Leu Pro 325 330 335 Lys Gly Phe Leu Glu Arg Ala Gly Glu Arg Gly Met Val Val Lys Gly 340 345 350 Trp Ala Pro Gln Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Phe 355 360 365 Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Met Phe Gly 370 375 380 Val Pro Ile Ile Gly Val Pro Met His Val Asp Gln Pro Phe Asn Ala 385 390 395 400 Gly Leu Val Glu Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Pro 405 410 415 Asp Gly Lys Ile Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val 420 425 430 Val Val Glu Lys Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met 435 440 445 Ser Glu Ile Leu Arg Ser Lys Gly Glu Glu Lys Phe Asp Glu Met Val 450 455 460 Ala Glu Ile Ser Leu Leu Leu Lys Ile 465 470 <210> 35 <211> 460 <212> PRT <213> Siraitia grosvenorii <400> 35 Met Asp Glu Thr Thr Val Asn Gly Gly Arg Arg Ala Ser Asp Val Val 1 5 10 15 Val Phe Ala Phe Pro Arg His Gly His Met Ser Pro Met Leu Gln Phe 20 25 30 Ser Lys Arg Leu Val Ser Lys Gly Leu Arg Val Thr Phe Leu Ile Thr 35 40 45 Thr Ser Ala Thr Glu Ser Leu Arg Leu Asn Leu Pro Pro Ser Ser Ser 50 55 60 Leu Asp Leu Gln Val Ile Ser Asp Val Pro Glu Ser Asn Asp Ile Ala 65 70 75 80 Thr Leu Glu Gly Tyr Leu Arg Ser Phe Lys Ala Thr Val Ser Lys Thr 85 90 95 Leu Ala Asp Phe Ile Asp Gly Ile Gly Asn Pro Pro Lys Phe Ile Val 100 105 110 Tyr Asp Ser Val Met Pro Trp Val Gln Glu Val Ala Arg Gly Arg Gly 115 120 125 Leu Asp Ala Ala Pro Phe Phe Thr Gln Ser Ser Ala Val Asn His Ile 130 135 140 Leu Asn His Val Tyr Gly Gly Ser Leu Ser Ile Pro Ala Pro Glu Asn 145 150 155 160 Thr Ala Val Ser Leu Pro Ser Met Pro Val Leu Gln Ala Glu Asp Leu 165 170 175 Pro Ala Phe Pro Asp Asp Pro Glu Val Val Met Asn Phe Met Thr Ser 180 185 190 Gln Phe Ser Asn Phe Gln Asp Ala Lys Trp Ile Phe Phe Asn Thr Phe 195 200 205 Asp Gln Leu Glu Cys Lys Lys Gln Ser Gln Val Val Asn Trp Met Ala 210 215 220 Asp Arg Trp Pro Ile Lys Thr Val Gly Pro Thr Ile Pro Ser Ala Tyr 225 230 235 240 Leu Asp Asp Gly Arg Leu Glu Asp Asp Arg Ala Phe Gly Leu Asn Leu 245 250 255 Leu Lys Pro Glu Asp Gly Lys Asn Thr Arg Gln Trp Gln Trp Leu Asp 260 265 270 Ser Lys Asp Thr Ala Ser Val Leu Tyr Ile Ser Phe Gly Ser Leu Ala 275 280 285 Ile Leu Gln Glu Glu Gln Val Lys Glu Leu Ala Tyr Phe Leu Lys Asp 290 295 300 Thr Asn Leu Ser Phe Leu Trp Val Leu Arg Asp Ser Glu Leu Gln Lys 305 310 315 320 Leu Pro His Asn Phe Val Gln Glu Thr Ser His Arg Gly Leu Val Val 325 330 335 Asn Trp Cys Ser Gln Leu Gln Val Leu Ser His Arg Ala Val Ser Cys 340 345 350 Phe Val Thr His Cys Gly Trp Asn Ser Thr Leu Glu Ala Leu Ser Leu 355 360 365 Gly Val Pro Met Val Ala Ile Pro Gln Trp Val Asp Gln Thr Thr Asn 370 375 380 Ala Lys Phe Val Ala Asp Val Trp Arg Val Gly Val Arg Val Lys Lys 385 390 395 400 Lys Asp Glu Arg Ile Val Thr Lys Glu Glu Leu Glu Ala Ser Ile Arg 405 410 415 Gln Val Val Gln Gly Glu Gly Arg Asn Glu Phe Lys His Asn Ala Ile 420 425 430 Lys Trp Lys Lys Leu Ala Lys Glu Ala Val Asp Glu Gly Gly Ser Ser 435 440 445 Asp Lys Asn Ile Glu Glu Phe Val Lys Thr Ile Ala 450 455 460 <210> 36 <211> 486 <212> PRT <213> Siraitia grosvenorii <400> 36 Met Gly Asp Asn Gly Asp Gly Gly Glu Lys Lys Glu Leu Lys Glu Asn 1 5 10 15 Val Lys Lys Gly Lys Glu Leu Gly Arg Gln Ala Ile Gly Glu Gly Tyr 20 25 30 Ile Asn Pro Ser Leu Gln Leu Ala Arg Arg Leu Ile Ser Leu Gly Val 35 40 45 Asn Val Thr Phe Ala Thr Thr Val Leu Ala Gly Arg Arg Met Lys Asn 50 55 60 Lys Thr His Gln Thr Ala Thr Thr Pro Gly Leu Ser Phe Ala Thr Phe 65 70 75 80 Ser Asp Gly Phe Asp Asp Glu Thr Leu Lys Pro Asn Gly Asp Leu Thr 85 90 95 His Tyr Phe Ser Glu Leu Arg Arg Cys Gly Ser Glu Ser Leu Thr His 100 105 110 Leu Ile Thr Ser Ala Ala Asn Glu Gly Arg Pro Ile Thr Phe Val Ile 115 120 125 Tyr Ser Leu Leu Leu Ser Trp Ala Ala Asp Ile Ala Ser Thr Tyr Asp 130 135 140 Ile Pro Ser Ala Leu Phe Phe Ala Gln Pro Ala Thr Val Leu Ala Leu 145 150 155 160 Tyr Phe Tyr Tyr Phe His Gly Tyr Gly Asp Thr Ile Cys Ser Lys Leu 165 170 175 Gln Asp Pro Ser Ser Tyr Ile Glu Leu Pro Gly Leu Pro Leu Leu Thr 180 185 190 Ser Gln Asp Met Pro Ser Phe Phe Ser Pro Ser Gly Pro His Ala Phe 195 200 205 Ile Leu Pro Pro Met Arg Glu Gln Ala Glu Phe Leu Gly Arg Gln Ser 210 215 220 Gln Pro Lys Val Leu Val Asn Thr Phe Asp Ala Leu Glu Ala Asp Ala 225 230 235 240 Leu Arg Ala Ile Asp Lys Leu Lys Met Leu Ala Ile Gly Pro Leu Ile 245 250 255 Pro Ser Ala Leu Leu Gly Gly Asn Asp Ser Ser Asp Ala Ser Phe Cys 260 265 270 Gly Asp Leu Phe Gln Val Ser Ser Glu Asp Tyr Ile Glu Trp Leu Asn 275 280 285 Ser Lys Pro Asp Ser Ser Val Val Tyr Ile Ser Val Gly Ser Ile Cys 290 295 300 Val Leu Ser Asp Glu Gln Glu Asp Glu Leu Val His Ala Leu Leu Asn 305 310 315 320 Ser Gly His Thr Phe Leu Trp Val Lys Arg Ser Lys Glu Asn Asn Glu 325 330 335 Gly Val Lys Gln Glu Thr Asp Glu Glu Lys Leu Lys Lys Leu Glu Glu 340 345 350 Gln Gly Lys Met Val Ser Trp Cys Arg Gln Val Glu Val Leu Lys His 355 360 365 Pro Ala Leu Gly Cys Phe Leu Thr His Cys Gly Trp Asn Ser Thr Ile 370 375 380 Glu Ser Leu Val Ser Gly Leu Pro Val Val Ala Phe Pro Gln Gln Ile 385 390 395 400 Asp Gln Ala Thr Asn Ala Lys Leu Ile Glu Asp Val Trp Lys Thr Gly 405 410 415 Val Arg Val Lys Ala Asn Thr Glu Gly Ile Val Glu Arg Glu Glu Ile 420 425 430 Arg Arg Cys Leu Asp Leu Val Met Gly Ser Arg Asp Gly Gln Lys Glu 435 440 445 Glu Ile Glu Arg Asn Ala Lys Lys Trp Lys Glu Leu Ala Arg Gln Ala 450 455 460 Ile Gly Glu Gly Gly Ser Ser Asp Ser Asn Leu Lys Thr Phe Leu Trp 465 470 475 480 Glu Ile Asp Leu Glu Ile 485 <210> 37 <211> 485 <212> PRT <213> Siraitia grosvenorii <400> 37 Met Ala Glu Gln Ala His Asp Leu Leu His Val Leu Leu Phe Pro Phe 1 5 10 15 Pro Ala Glu Gly His Ile Lys Pro Phe Leu Cys Leu Ala Glu Leu Leu 20 25 30 Cys Asn Ala Gly Phe His Val Thr Phe Leu Asn Thr Asp Tyr Asn His 35 40 45 Arg Arg Leu His Asn Leu His Leu Leu Ala Ala Arg Phe Pro Ser Leu 50 55 60 His Phe Glu Ser Ile Ser Asp Gly Leu Pro Pro Asp Gln Pro Arg Asp 65 70 75 80 Ile Leu Asp Pro Lys Phe Phe Ile Ser Ile Cys Gln Val Thr Lys Pro 85 90 95 Leu Phe Arg Glu Leu Leu Leu Ser Tyr Lys Arg Ile Ser Ser Val Gln 100 105 110 Thr Gly Arg Pro Pro Ile Thr Cys Val Ile Thr Asp Val Ile Phe Arg 115 120 125 Phe Pro Ile Asp Val Ala Glu Glu Leu Asp Ile Pro Val Phe Ser Phe 130 135 140 Cys Thr Phe Ser Ala Arg Phe Met Phe Leu Tyr Phe Trp Ile Pro Lys 145 150 155 160 Leu Ile Glu Asp Gly Gln Leu Pro Tyr Pro Asn Gly Asn Ile Asn Gln 165 170 175 Lys Leu Tyr Gly Val Ala Pro Glu Ala Glu Gly Leu Leu Arg Cys Lys 180 185 190 Asp Leu Pro Gly His Trp Ala Phe Ala Asp Glu Leu Lys Asp Asp Gln 195 200 205 Leu Asn Phe Val Asp Gln Thr Thr Ala Ser Ser Arg Ser Ser Gly Leu 210 215 220 Ile Leu Asn Thr Phe Asp Asp Leu Glu Ala Pro Phe Leu Gly Arg Leu 225 230 235 240 Ser Thr Ile Phe Lys Lys Ile Tyr Ala Val Gly Pro Ile His Ser Leu 245 250 255 Leu Asn Ser His His Cys Gly Leu Trp Lys Glu Asp His Ser Cys Leu 260 265 270 Ala Trp Leu Asp Ser Arg Ala Ala Lys Ser Val Val Phe Val Ser Phe 275 280 285 Gly Ser Leu Val Lys Ile Thr Ser Arg Gln Leu Met Glu Phe Trp His 290 295 300 Gly Leu Leu Asn Ser Gly Lys Ser Phe Leu Phe Val Leu Arg Ser Asp 305 310 315 320 Val Val Glu Gly Asp Asp Glu Lys Gln Val Val Lys Glu Ile Tyr Glu 325 330 335 Thr Lys Ala Glu Gly Lys Trp Leu Val Val Gly Trp Ala Pro Gln Glu 340 345 350 Lys Val Leu Ala His Glu Ala Val Gly Gly Phe Leu Thr His Ser Gly 355 360 365 Trp Asn Ser Ile Leu Glu Ser Ile Ala Ala Gly Val Pro Met Ile Ser 370 375 380 Cys Pro Lys Ile Gly Asp Gln Ser Ser Asn Cys Thr Trp Ile Ser Lys 385 390 395 400 Val Trp Lys Ile Gly Leu Glu Met Glu Asp Arg Tyr Asp Arg Val Ser 405 410 415 Val Glu Thr Met Val Arg Ser Ile Met Glu Gln Glu Gly Glu Lys Met 420 425 430 Gln Lys Thr Ile Ala Glu Leu Ala Lys Gln Ala Lys Tyr Lys Val Ser 435 440 445 Lys Asp Gly Thr Ser Tyr Gln Asn Leu Glu Cys Leu Ile Gln Asp Ile 450 455 460 Lys Lys Leu Asn Gln Ile Glu Gly Phe Ile Asn Asn Pro Asn Phe Ser 465 470 475 480 Asp Leu Leu Arg Val 485 <210> 38 <211> 473 <212> PRT <213> Siraitia grosvenorii <400> 38 Met Asp Ala Gln Gln Gly His Thr Thr Thr Ile Leu Met Leu Pro Trp 1 5 10 15 Val Gly Tyr Gly His Leu Leu Pro Phe Leu Glu Leu Ala Lys Ser Leu 20 25 30 Ser Arg Arg Lys Leu Phe His Ile Tyr Phe Cys Ser Thr Ser Val Ser 35 40 45 Leu Asp Ala Ile Lys Pro Lys Leu Pro Pro Ser Ile Ser Ser Asp Asp 50 55 60 Ser Ile Gln Leu Val Glu Leu Arg Leu Pro Ser Ser Pro Glu Leu Pro 65 70 75 80 Pro His Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Met Pro Ala 85 90 95 Leu His Gln Ala Phe Val Met Ala Ala Gln His Phe Gln Val Ile Leu 100 105 110 Gln Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ile Leu Gln Pro Trp 115 120 125 Ala Pro Gln Val Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Ser 130 135 140 Thr Thr Gly Ala Ser Met Leu Ser Arg Thr Leu His Pro Thr His Tyr 145 150 155 160 Pro Ser Ser Lys Phe Pro Ile Ser Glu Phe Val Leu His Asn His Trp 165 170 175 Arg Ala Met Tyr Thr Thr Ala Asp Gly Ala Leu Thr Glu Glu Gly His 180 185 190 Lys Ile Glu Glu Thr Leu Ala Asn Cys Leu His Thr Ser Cys Gly Val 195 200 205 Val Leu Val Asn Ser Phe Arg Glu Leu Glu Thr Lys Tyr Ile Asp Tyr 210 215 220 Leu Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val 225 230 235 240 Tyr Glu Pro Asn Gln Glu Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys 245 250 255 Asn Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe 260 265 270 Gly Thr Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala Tyr 275 280 285 Gly Leu Glu Leu Ser Glu Val Asn Phe Ile Trp Val Leu Arg Phe Pro 290 295 300 Gln Gly Asp Ser Thr Ser Thr Ile Glu Asp Ala Leu Pro Lys Gly Phe 305 310 315 320 Leu Glu Arg Ala Gly Glu Arg Ala Met Val Val Lys Gly Trp Ala Pro 325 330 335 Gln Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Leu Val Ser His 340 345 350 Cys Gly Trp Asn Ser Met Met Glu Gly Met Met Phe Gly Val Pro Ile 355 360 365 Ile Ala Val Pro Met His Leu Asp Gln Pro Phe Asn Ala Gly Leu Val 370 375 380 Glu Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Ser Asp Gly Lys 385 390 395 400 Ile Gln Arg Glu Glu Val Ala Lys Ser Ile Lys Glu Val Val Ile Glu 405 410 415 Lys Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Asp Thr Lys 420 425 430 His Gly Pro Thr Tyr Phe Ser Arg Ser Lys Val Ser Ser Phe Gly Arg 435 440 445 Leu Tyr Lys Ile Asn Arg Pro Thr Thr Leu Thr Val Gly Arg Phe Trp 450 455 460 Ser Lys Gln Ile Lys Met Lys Arg Glu 465 470 <210> 39 <211> 453 <212> PRT <213> Siraitia grosvenorii <400> 39 Met Asp Ala Gln Arg Gly His Thr Thr Thr Ile Leu Met Phe Pro Trp 1 5 10 15 Leu Gly Tyr Gly His Leu Ser Ala Phe Leu Glu Leu Ala Lys Ser Leu 20 25 30 Ser Arg Arg Asn Phe His Ile Tyr Phe Cys Ser Thr Ser Val Asn Leu 35 40 45 Asp Ala Ile Lys Pro Lys Leu Pro Ser Ser Ser Ser Ser Asp Ser Ile 50 55 60 Gln Leu Val Glu Leu Cys Leu Pro Ser Ser Pro Asp Gln Leu Pro Pro 65 70 75 80 His Leu His Thr Thr Asn Ala Leu Pro Pro His Leu Met Pro Thr Leu 85 90 95 His Gln Ala Phe Ser Met Ala Ala Gln His Phe Ala Ala Ile Leu His 100 105 110 Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ser Phe Gln Pro Trp Ala 115 120 125 Pro Gln Leu Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Asn Thr 130 135 140 Thr Gly Ala Ser Val Leu Thr Arg Met Leu His Ala Thr His Tyr Pro 145 150 155 160 Ser Ser Lys Phe Pro Ile Ser Glu Phe Val Leu His Asp Tyr Trp Lys 165 170 175 Ala Met Tyr Ser Ala Ala Gly Gly Ala Val Thr Lys Lys Asp His Lys 180 185 190 Ile Gly Glu Thr Leu Ala Asn Cys Leu His Ala Ser Cys Ser Val Ile 195 200 205 Leu Ile Asn Ser Phe Arg Glu Leu Glu Glu Lys Tyr Met Asp Tyr Leu 210 215 220 Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val Tyr 225 230 235 240 Glu Pro Asn Gln Asp Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys Asn 245 250 255 Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe Gly 260 265 270 Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala His Gly 275 280 285 Leu Glu Ala Ser Glu Val His Phe Ile Trp Val Val Arg Phe Pro Gln 290 295 300 Gly Asp Asn Thr Ser Ala Ile Glu Asp Ala Leu Pro Lys Gly Phe Leu 305 310 315 320 Glu Arg Val Gly Glu Arg Gly Met Val Val Lys Gly Trp Ala Pro Gln 325 330 335 Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Phe Val Ser His Cys 340 345 350 Gly Trp Asn Ser Val Met Glu Ser Met Met Phe Gly Val Pro Ile Ile 355 360 365 Gly Val Pro Met His Leu Asp Gln Pro Phe Asn Ala Gly Leu Ala Glu 370 375 380 Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile 385 390 395 400 Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val Val Val Glu Lys 405 410 415 Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Ser Glu Ile Leu 420 425 430 Arg Ser Lys Gly Glu Glu Lys Met Asp Glu Met Val Ala Ala Ile Ser 435 440 445 Leu Phe Leu Lys Ile 450 <210> 40 <211> 472 <212> PRT <213> Momordica charantia <400> 40 Met Ala Gln Pro Gln Thr Gln Ala Arg Val Leu Val Phe Pro Tyr Pro 1 5 10 15 Thr Val Gly His Ile Lys Pro Phe Leu Ser Leu Ala Glu Leu Leu Ala 20 25 30 Asp Gly Gly Leu Asp Val Val Phe Leu Ser Thr Glu Tyr Asn His Arg 35 40 45 Arg Ile Pro Asn Leu Glu Ala Leu Ala Ser Arg Phe Pro Thr Leu His 50 55 60 Phe Asp Thr Ile Pro Asp Gly Leu Pro Ile Asp Lys Pro Arg Val Ile 65 70 75 80 Ile Gly Gly Glu Leu Tyr Thr Ser Met Arg Asp Gly Val Lys Gln Arg 85 90 95 Leu Arg Gln Val Leu Gln Ser Tyr Asn Asp Gly Ser Ser Pro Ile Thr 100 105 110 Cys Val Ile Cys Asp Val Met Leu Ser Gly Pro Ile Glu Ala Ala Glu 115 120 125 Glu Leu Gly Ile Pro Val Val Thr Phe Cys Pro Tyr Ser Ala Arg Tyr 130 135 140 Leu Cys Ala His Phe Val Met Pro Lys Leu Ile Glu Glu Gly Gln Ile 145 150 155 160 Pro Phe Thr Asp Gly Asn Leu Ala Gly Glu Ile Gln Gly Val Pro Leu 165 170 175 Phe Gly Gly Leu Leu Arg Arg Asp His Leu Pro Gly Phe Trp Phe Val 180 185 190 Lys Ser Leu Ser Asp Glu Val Trp Ser His Ala Phe Leu Asn Gln Thr 195 200 205 Leu Ala Val Gly Arg Thr Ser Ala Leu Ile Ile Asn Thr Leu Asp Glu 210 215 220 Leu Glu Ala Pro Phe Leu Ala His Leu Ser Ser Thr Phe Asp Lys Ile 225 230 235 240 Tyr Pro Ile Gly Pro Leu Asp Ala Leu Ser Lys Ser Arg Leu Gly Asp 245 250 255 Ser Ser Ser Ser Ser Thr Val Leu Thr Ala Phe Trp Lys Glu Asp Gln 260 265 270 Ala Cys Met Ser Trp Leu Asp Ser Gln Pro Pro Lys Ser Val Ile Phe 275 280 285 Val Ser Phe Gly Ser Thr Met Arg Met Thr Ala Asp Lys Leu Val Glu 290 295 300 Phe Trp His Gly Leu Val Asn Ser Gly Thr Arg Phe Leu Cys Val Leu 305 310 315 320 Arg Ser Asp Ile Val Glu Gly Gly Gly Ala Ala Asp Leu Ile Lys Gln 325 330 335 Val Gly Glu Thr Gly Asn Gly Ile Val Val Glu Trp Ala Ala Gln Glu 340 345 350 Lys Val Leu Ala His Arg Ala Val Gly Gly Phe Leu Thr His Cys Gly 355 360 365 Trp Asn Ser Thr Met Glu Ser Ile Ala Ala Gly Val Pro Met Met Cys 370 375 380 Trp Gln Ile Tyr Gly Asp Gln Met Ile Asn Ala Thr Trp Ile Gly Lys 385 390 395 400 Val Trp Lys Ile Gly Ile Glu Arg Asp Asp Lys Trp Asp Arg Ser Thr 405 410 415 Val Glu Lys Met Ile Lys Glu Leu Met Glu Gly Glu Lys Gly Ala Glu 420 425 430 Ile Gln Arg Ser Met Glu Lys Phe Ser Lys Leu Ala Asn Asp Lys Val 435 440 445 Val Lys Gly Gly Thr Ser Phe Glu Asn Leu Glu Leu Ile Val Glu Tyr 450 455 460 Leu Lys Lys Leu Lys Pro Ser Asn 465 470 <210> 41 <211> 466 <212> PRT <213> Momordica charantia <400> 41 Met Ala Gln Pro Arg Val Leu Leu Phe Pro Phe Pro Ala Met Gly His 1 5 10 15 Val Lys Pro Phe Leu Ser Leu Ala Glu Leu Leu Ser Asp Ala Gly Val 20 25 30 Glu Val Val Phe Leu Ser Thr Glu Tyr Asn His Arg Arg Ile Pro Asp 35 40 45 Ile Gly Ala Leu Ala Ala Arg Phe Pro Thr Leu His Phe Glu Thr Ile 50 55 60 Pro Asp Gly Leu Pro Pro Asp Gln Pro Arg Val Leu Ala Asp Gly His 65 70 75 80 Leu Tyr Phe Ser Met Leu Asp Gly Thr Lys Pro Arg Phe Arg Gln Leu 85 90 95 Ile Gln Ser Leu Asn Gly Asn Pro Arg Pro Ile Thr Cys Ile Ile Asn 100 105 110 Asp Val Met Leu Ser Ser Pro Ile Glu Val Ala Glu Glu Phe Gly Ile 115 120 125 Pro Val Ile Ala Phe Cys Pro Cys Ser Ala Arg Phe Leu Ser Val His 130 135 140 Phe Phe Met Pro Asn Phe Ile Glu Glu Ala Gln Ile Pro Tyr Thr Asp 145 150 155 160 Glu Asn Pro Met Gly Lys Ile Glu Glu Ala Thr Val Phe Glu Gly Leu 165 170 175 Leu Arg Arg Lys Asp Leu Pro Gly Leu Trp Cys Ala Lys Ser Ser Asn 180 185 190 Ile Ser Phe Ser His Arg Phe Ile Asn Gln Thr Ile Ala Ala Gly Arg 195 200 205 Ala Ser Ala Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu Ser Pro Phe 210 215 220 Leu Asn His Leu Ser Ser Ile Phe Pro Lys Ile Tyr Cys Ile Gly Pro 225 230 235 240 Leu Asn Ala Leu Ser Arg Ser Arg Leu Gly Lys Ser Ser Ser Ser Ser 245 250 255 Ser Ala Leu Ala Gly Phe Trp Lys Glu Asp Gln Ala Tyr Met Ser Trp 260 265 270 Leu Glu Ser Gln Pro Pro Arg Ser Val Ile Phe Val Ser Phe Gly Ser 275 280 285 Thr Met Lys Met Glu Ala Trp Lys Leu Ala Glu Phe Trp Tyr Gly Leu 290 295 300 Val Asn Ser Gly Ser Pro Phe Leu Phe Val Phe Arg Pro Asp Cys Val 305 310 315 320 Ile Asn Ser Gly Asp Ala Ala Glu Val Met Glu Gly Arg Gly Arg Gly 325 330 335 Met Val Val Glu Trp Ala Ser Gln Glu Lys Val Leu Ala His Pro Ala 340 345 350 Val Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Ser 355 360 365 Ile Val Ala Gly Val Pro Met Met Cys Cys Pro Ile Val Ala Asp Gln 370 375 380 Leu Ser Asn Ala Thr Trp Ile His Lys Val Trp Lys Ile Gly Ile Glu 385 390 395 400 Gly Asp Glu Lys Trp Asp Arg Ser Thr Val Glu Met Met Ile Lys Glu 405 410 415 Leu Met Glu Ser Gln Lys Gly Thr Glu Ile Arg Thr Ser Ile Glu Met 420 425 430 Leu Ser Lys Leu Ala Asn Glu Lys Val Val Lys Gly Gly Thr Ser Leu 435 440 445 Asn Asn Phe Glu Leu Leu Val Glu Asp Ile Lys Thr Leu Arg Arg Pro 450 455 460 Tyr Thr 465 <210> 42 <211> 482 <212> PRT <213> Momordica charantia <400> 42 Met Glu Gln Ser Asp Ser Asn Ser Asp Asp His Gln His His Val Leu 1 5 10 15 Leu Phe Pro Phe Pro Ala Lys Gly His Ile Lys Pro Phe Leu Cys Leu 20 25 30 Ala Gln Leu Leu Cys Gly Ala Gly Leu Gln Val Thr Phe Leu Asn Thr 35 40 45 Asp His Asn His Arg Arg Ile Asp Asp Arg His Arg Arg Leu Leu Ala 50 55 60 Thr Gln Phe Pro Met Leu His Phe Lys Ser Ile Ser Asp Gly Leu Pro 65 70 75 80 Pro Asp His Pro Arg Asp Leu Leu Asp Gly Lys Leu Ile Ala Ser Met 85 90 95 Arg Arg Val Thr Glu Ser Leu Phe Arg Gln Leu Leu Leu Ser Tyr Asn 100 105 110 Gly Tyr Gly Asn Gly Thr Asn Asn Val Ser Asn Ser Gly Arg Arg Pro 115 120 125 Pro Ile Ser Cys Val Ile Thr Asp Val Ile Phe Ser Phe Pro Val Glu 130 135 140 Val Ala Glu Glu Leu Gly Ile Pro Val Phe Ser Phe Ala Thr Phe Ser 145 150 155 160 Ala Arg Phe Leu Phe Leu Tyr Phe Trp Ile Pro Lys Leu Ile Gln Glu 165 170 175 Gly Gln Leu Pro Phe Pro Asp Gly Lys Thr Asn Gln Glu Leu Tyr Gly 180 185 190 Val Pro Gly Ala Glu Gly Ile Ile Arg Cys Lys Asp Leu Pro Gly Ser 195 200 205 Trp Ser Val Glu Ala Val Ala Lys Asn Asp Pro Met Asn Phe Val Lys 210 215 220 Gln Thr Leu Ala Ser Ser Arg Ser Ser Gly Leu Ile Leu Asn Thr Phe 225 230 235 240 Glu Asp Leu Glu Ala Pro Phe Val Thr His Leu Ser Asn Thr Phe Asp 245 250 255 Lys Ile Tyr Thr Ile Gly Pro Ile His Ser Leu Leu Gly Thr Ser His 260 265 270 Cys Gly Leu Trp Lys Glu Asp Tyr Ala Cys Leu Ala Trp Leu Asp Ala 275 280 285 Arg Pro Arg Lys Ser Val Val Phe Val Ser Phe Gly Ser Leu Val Lys 290 295 300 Thr Thr Ser Arg Glu Leu Met Glu Leu Trp His Gly Leu Val Ser Ser 305 310 315 320 Gly Lys Ser Phe Leu Leu Val Leu Arg Ser Asp Val Val Glu Gly Glu 325 330 335 Asp Glu Glu Gln Val Val Lys Glu Ile Leu Glu Ser Asn Gly Glu Gly 340 345 350 Lys Trp Leu Val Val Gly Trp Ala Pro Gln Glu Glu Val Leu Ala His 355 360 365 Glu Ala Ile Gly Gly Phe Leu Thr His Ser Gly Trp Asn Ser Thr Met 370 375 380 Glu Ser Ile Ala Ala Gly Val Pro Met Val Cys Trp Pro Lys Ile Gly 385 390 395 400 Asp Gln Pro Ser Asn Cys Thr Trp Val Ser Arg Val Trp Lys Val Gly 405 410 415 Leu Glu Met Glu Glu Arg Tyr Asp Arg Ser Thr Val Ala Arg Met Ala 420 425 430 Arg Ser Met Met Glu Gln Glu Gly Lys Glu Met Glu Arg Arg Ile Ala 435 440 445 Glu Leu Ala Lys Arg Val Lys Tyr Arg Val Gly Lys Asp Gly Glu Ser 450 455 460 Tyr Arg Asn Leu Glu Ser Leu Ile Arg Asp Ile Lys Ile Thr Lys Ser 465 470 475 480 Ser Asn <210> 43 <211> 450 <212> PRT <213> Momordica charantia <400> 43 Met Asp Ala His Gln Gln Ala Glu His Thr Thr Thr Ile Leu Met Leu 1 5 10 15 Pro Trp Val Gly Tyr Gly His Leu Thr Ala Tyr Leu Glu Leu Ala Lys 20 25 30 Ala Leu Ser Arg Arg Asn Phe His Ile Tyr Tyr Cys Ser Thr Pro Val 35 40 45 Asn Ile Glu Ser Ile Lys Pro Lys Leu Thr Ile Pro Cys Ser Ser Ile 50 55 60 Gln Phe Val Glu Leu His Leu Pro Ser Ser Asp Asp Leu Pro Pro Asn 65 70 75 80 Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Met Pro Thr Leu His 85 90 95 Gln Ala Phe Ser Ala Ala Ala Pro Leu Phe Glu Glu Ile Leu Gln Thr 100 105 110 Leu Cys Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala Pro 115 120 125 Lys Ile Ala Ser Ser Leu Lys Ile Pro Ala Leu Asn Phe Asn Thr Ser 130 135 140 Gly Val Ser Val Ile Ala Gln Ala Leu His Ala Ile His His Pro Asp 145 150 155 160 Ser Lys Phe Pro Leu Ser Asp Phe Ile Leu His Asn Tyr Trp Lys Ser 165 170 175 Thr Tyr Thr Thr Ala Asp Gly Gly Ala Ser Glu Lys Thr Arg Arg Ala 180 185 190 Arg Glu Ala Phe Leu Tyr Cys Leu Asn Ser Ser Gly Asn Ala Ile Leu 195 200 205 Ile Asn Thr Phe Arg Glu Leu Glu Gly Glu Tyr Ile Asp Tyr Leu Ser 210 215 220 Leu Leu Leu Asn Lys Lys Val Ile Pro Ile Gly Pro Leu Val Tyr Glu 225 230 235 240 Pro Asn Gln Asp Glu Asp Gln Asp Glu Glu Tyr Arg Ser Ile Lys Asn 245 250 255 Trp Leu Asp Lys Lys Glu Pro Cys Ser Thr Val Phe Val Ser Phe Gly 260 265 270 Ser Glu Tyr Phe Pro Ser Asn Glu Glu Met Glu Glu Ile Ala Pro Gly 275 280 285 Leu Glu Glu Ser Gly Ala Asn Phe Ile Trp Val Val Arg Phe Pro Lys 290 295 300 Leu Glu Asn Arg Asn Gly Ile Ile Glu Glu Gly Leu Leu Glu Arg Ala 305 310 315 320 Gly Glu Arg Gly Met Val Ile Lys Glu Trp Ala Pro Gln Ala Arg Ile 325 330 335 Leu Arg His Gly Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Asn 340 345 350 Ser Val Met Glu Ser Ile Ile Cys Gly Val Pro Val Ile Gly Val Pro 355 360 365 Met Arg Val Asp Gln Pro Tyr Asn Ala Gly Leu Val Glu Glu Ala Gly 370 375 380 Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile Gln Arg His 385 390 395 400 Glu Val Ser Lys Leu Ile Lys Gln Val Val Val Glu Lys Thr Arg Asp 405 410 415 Asp Val Arg Lys Lys Val Ala Gln Met Ser Glu Ile Leu Arg Arg Lys 420 425 430 Gly Asp Glu Lys Ile Asp Glu Met Val Ala Leu Ile Ser Leu Leu Pro 435 440 445 Lys Gly 450 <210> 44 <211> 450 <212> PRT <213> Momordica charantia <400> 44 Met Asp Ala Arg Gln Gln Ala Glu His Thr Thr Thr Ile Leu Met Leu 1 5 10 15 Pro Trp Val Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu Leu Ala Lys 20 25 30 Ala Leu Ser Arg Arg Asn Phe His Ile Tyr Tyr Cys Ser Thr Pro Val 35 40 45 Asn Ile Glu Ser Ile Lys Pro Lys Leu Thr Ile Pro Cys Ser Ser Ile 50 55 60 Gln Phe Val Glu Leu His Leu Pro Phe Ser Asp Asp Leu Pro Pro Asn 65 70 75 80 Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Met Pro Ala Leu His 85 90 95 Gln Ala Phe Ser Ala Ala Ala Pro Leu Phe Glu Ala Ile Leu Gln Thr 100 105 110 Leu Cys Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala Pro 115 120 125 Gln Ile Ala Ser Ser Leu Lys Ile Pro Ala Leu Asn Phe Asn Thr Thr 130 135 140 Gly Val Ser Val Ile Ala Arg Ala Leu His Thr Ile His His Pro Asp 145 150 155 160 Ser Lys Phe Pro Leu Ser Glu Ile Val Leu His Asn Tyr Trp Lys Ala 165 170 175 Thr His Ala Thr Ala Asp Gly Ala Asn Pro Glu Lys Phe Arg Arg Asp 180 185 190 Leu Glu Ala Leu Leu Cys Cys Leu His Ser Ser Cys Asn Ala Ile Leu 195 200 205 Ile Asn Thr Phe Arg Glu Leu Glu Gly Glu Tyr Ile Asp Tyr Leu Ser 210 215 220 Leu Leu Leu Asn Lys Lys Val Thr Pro Ile Gly Pro Leu Val Tyr Glu 225 230 235 240 Pro Asn Gln Asp Glu Glu Gln Asp Glu Glu Tyr Arg Ser Ile Lys Asn 245 250 255 Trp Leu Asp Lys Lys Glu Pro Tyr Ser Thr Ile Phe Val Ser Phe Gly 260 265 270 Ser Glu Tyr Phe Pro Ser Asn Glu Glu Met Glu Glu Ile Ala Arg Gly 275 280 285 Leu Glu Glu Ser Gly Ala Asn Phe Ile Trp Val Val Arg Phe His Lys 290 295 300 Leu Glu Asn Gly Asn Gly Ile Thr Glu Glu Gly Leu Leu Glu Arg Ala 305 310 315 320 Gly Glu Arg Gly Met Val Ile Gln Gly Trp Ala Pro Gln Ala Arg Ile 325 330 335 Leu Arg His Gly Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Asn 340 345 350 Ser Val Met Glu Ser Ile Ile Cys Gly Val Pro Val Ile Gly Val Pro 355 360 365 Met Gly Leu Asp Gln Pro Tyr Asn Ala Gly Leu Val Glu Glu Ala Gly 370 375 380 Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile Gln Arg His 385 390 395 400 Glu Val Ser Lys Leu Ile Lys Gln Val Val Val Glu Lys Thr Arg Asp 405 410 415 Asp Val Arg Lys Lys Val Ala Gln Met Ser Glu Ile Leu Arg Arg Lys 420 425 430 Gly Asp Glu Lys Ile Asp Glu Met Val Ala Leu Ile Ser Leu Leu Leu 435 440 445 Lys Gly 450 <210> 45 <211> 471 <212> PRT <213> Cucumis sativus <400> 45 Met Gly Leu Ser Pro Thr Asp His Val Leu Leu Phe Pro Phe Pro Ala 1 5 10 15 Lys Gly His Ile Lys Pro Phe Phe Cys Leu Ala His Leu Leu Cys Asn 20 25 30 Ala Gly Leu Arg Val Thr Phe Leu Ser Thr Glu His His His Gln Lys 35 40 45 Leu His Asn Leu Thr His Leu Ala Ala Gln Ile Pro Ser Leu His Phe 50 55 60 Gln Ser Ile Ser Asp Gly Leu Ser Leu Asp His Pro Arg Asn Leu Leu 65 70 75 80 Asp Gly Gln Leu Phe Lys Ser Met Pro Gln Val Thr Lys Pro Leu Phe 85 90 95 Arg Gln Leu Leu Leu Ser Tyr Lys Asp Gly Thr Ser Pro Ile Thr Cys 100 105 110 Val Ile Thr Asp Leu Ile Leu Arg Phe Pro Met Asp Val Ala Gln Glu 115 120 125 Leu Asp Ile Pro Val Phe Cys Phe Ser Thr Phe Ser Ala Arg Phe Leu 130 135 140 Phe Leu Tyr Phe Ser Ile Pro Lys Leu Leu Glu Asp Gly Gln Ile Pro 145 150 155 160 Tyr Pro Glu Gly Asn Ser Asn Gln Val Leu His Gly Ile Pro Gly Ala 165 170 175 Glu Gly Leu Leu Arg Cys Lys Asp Leu Pro Gly Tyr Trp Ser Val Glu 180 185 190 Ala Val Ala Asn Tyr Asn Pro Met Asn Phe Val Asn Gln Thr Ile Ala 195 200 205 Thr Ser Lys Ser His Gly Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu 210 215 220 Val Pro Phe Ile Thr Asn Leu Ser Lys Ile Tyr Lys Lys Val Tyr Thr 225 230 235 240 Ile Gly Pro Ile His Ser Leu Leu Lys Lys Ser Val Gln Thr Gln Tyr 245 250 255 Glu Phe Trp Lys Glu Asp His Ser Cys Leu Ala Trp Leu Asp Ser Gln 260 265 270 Pro Pro Arg Ser Val Met Phe Val Ser Phe Gly Ser Ile Val Lys Leu 275 280 285 Lys Ser Ser Gln Leu Lys Glu Phe Trp Asn Gly Leu Val Asp Ser Gly 290 295 300 Lys Ala Phe Leu Leu Val Leu Arg Ser Asp Ala Leu Val Glu Glu Thr 305 310 315 320 Gly Glu Glu Asp Glu Lys Gln Lys Glu Leu Val Ile Lys Glu Ile Met 325 330 335 Glu Thr Lys Glu Glu Gly Arg Trp Val Ile Val Asn Trp Ala Pro Gln 340 345 350 Glu Lys Val Leu Glu His Lys Ala Ile Gly Gly Phe Leu Thr His Ser 355 360 365 Gly Trp Asn Ser Thr Leu Glu Ser Val Ala Val Gly Val Pro Met Val 370 375 380 Ser Trp Pro Gln Ile Gly Asp Gln Pro Ser Asn Ala Thr Trp Leu Ser 385 390 395 400 Lys Val Trp Lys Ile Gly Val Glu Met Glu Asp Ser Tyr Asp Arg Ser 405 410 415 Thr Val Glu Ser Lys Val Arg Ser Ile Met Glu His Glu Asp Lys Lys 420 425 430 Met Glu Asn Ala Ile Val Glu Leu Ala Lys Arg Val Asp Asp Arg Val 435 440 445 Ser Lys Glu Gly Thr Ser Tyr Gln Asn Leu Gln Arg Leu Ile Glu Asp 450 455 460 Ile Glu Gly Phe Lys Leu Asn 465 470 <210> 46 <211> 462 <212> PRT <213> Cucurbita maxima <400> 46 Met Glu Leu Ser His Thr His His Val Leu Leu Phe Pro Phe Pro Ala 1 5 10 15 Lys Gly His Ile Lys Pro Phe Phe Ser Leu Ala Gln Leu Leu Cys Asn 20 25 30 Ala Gly Leu Arg Val Thr Phe Leu Asn Thr Asp His His His Arg Arg 35 40 45 Ile His Asp Leu Asn Arg Leu Ala Ala Gln Leu Pro Thr Leu His Phe 50 55 60 Asp Ser Val Ser Asp Gly Leu Pro Pro Asp Glu Pro Arg Asn Val Phe 65 70 75 80 Asp Gly Lys Leu Tyr Glu Ser Ile Arg Gln Val Thr Ser Ser Leu Phe 85 90 95 Arg Glu Leu Leu Val Ser Tyr Asn Asn Gly Thr Ser Ser Gly Arg Pro 100 105 110 Pro Ile Thr Cys Val Ile Thr Asp Val Met Phe Arg Phe Pro Ile Asp 115 120 125 Ile Ala Glu Glu Leu Gly Ile Pro Val Phe Thr Phe Ser Thr Phe Ser 130 135 140 Ala Arg Phe Leu Phe Leu Ile Phe Trp Ile Pro Lys Leu Leu Glu Asp 145 150 155 160 Gly Gln Leu Arg Tyr Pro Glu Gln Glu Leu His Gly Val Pro Gly Ala 165 170 175 Glu Gly Leu Ile Arg Trp Lys Asp Leu Pro Gly Phe Trp Ser Val Glu 180 185 190 Asp Val Ala Asp Trp Asp Pro Met Asn Phe Val Asn Gln Thr Leu Ala 195 200 205 Thr Ser Arg Ser Ser Gly Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu 210 215 220 Ala Pro Phe Leu Thr Ser Leu Ser Lys Ile Tyr Lys Lys Ile Tyr Ser 225 230 235 240 Leu Gly Pro Ile Asn Ser Leu Leu Lys Asn Phe Gln Ser Gln Pro Gln 245 250 255 Tyr Asn Leu Trp Lys Glu Asp His Ser Cys Met Ala Trp Leu Asp Ser 260 265 270 Gln Pro Arg Lys Ser Val Val Phe Val Ser Phe Gly Ser Val Val Lys 275 280 285 Leu Thr Ser Arg Gln Leu Met Glu Phe Trp Asn Gly Leu Val Asn Ser 290 295 300 Gly Met Pro Phe Leu Leu Val Leu Arg Ser Asp Val Ile Glu Ala Gly 305 310 315 320 Glu Glu Val Val Arg Glu Ile Met Glu Arg Lys Ala Glu Gly Arg Trp 325 330 335 Val Ile Val Ser Trp Ala Pro Gln Glu Glu Val Leu Ala His Asp Ala 340 345 350 Val Gly Gly Phe Leu Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser 355 360 365 Leu Ala Ala Gly Val Pro Met Ile Ser Trp Pro Gln Ile Gly Asp Gln 370 375 380 Thr Ser Asn Ser Thr Trp Ile Ser Lys Val Trp Arg Ile Gly Leu Gln 385 390 395 400 Leu Glu Asp Gly Phe Asp Ser Ser Thr Ile Glu Thr Met Val Arg Ser 405 410 415 Ile Met Asp Gln Thr Met Glu Lys Thr Val Ala Glu Leu Ala Glu Arg 420 425 430 Ala Lys Asn Arg Ala Ser Lys Asn Gly Thr Ser Tyr Arg Asn Phe Gln 435 440 445 Thr Leu Ile Gln Asp Ile Thr Asn Ile Ile Glu Thr His Ile 450 455 460 <210> 47 <211> 474 <212> PRT <213> Prunus persica <400> 47 Met Ala Met Lys Gln Pro His Val Ile Ile Phe Pro Phe Pro Leu Gln 1 5 10 15 Gly His Met Lys Pro Leu Leu Cys Leu Ala Glu Leu Leu Cys His Ala 20 25 30 Gly Leu His Val Thr Tyr Val Asn Thr His His Asn His Gln Arg Leu 35 40 45 Ala Asn Arg Gln Ala Leu Ser Thr His Phe Pro Thr Leu His Phe Glu 50 55 60 Ser Ile Ser Asp Gly Leu Pro Glu Asp Asp Pro Arg Thr Leu Asn Ser 65 70 75 80 Gln Leu Leu Ile Ala Leu Lys Thr Ser Ile Arg Pro His Phe Arg Glu 85 90 95 Leu Leu Lys Thr Ile Ser Leu Lys Ala Glu Ser Asn Asp Thr Leu Val 100 105 110 Pro Pro Pro Ser Cys Ile Met Thr Asp Gly Leu Val Thr Phe Ala Phe 115 120 125 Asp Val Ala Glu Glu Leu Gly Leu Pro Ile Leu Ser Phe Asn Val Pro 130 135 140 Cys Pro Arg Tyr Leu Trp Thr Cys Leu Cys Leu Pro Lys Leu Ile Glu 145 150 155 160 Asn Gly Gln Leu Pro Phe Gln Asp Asp Asp Met Asn Val Glu Ile Thr 165 170 175 Gly Val Pro Gly Met Glu Gly Leu Leu His Arg Gln Asp Leu Pro Gly 180 185 190 Phe Cys Arg Val Lys Gln Ala Asp His Pro Ser Leu Gln Phe Ala Ile 195 200 205 Asn Glu Thr Gln Thr Leu Lys Arg Ala Ser Ala Leu Ile Leu Asp Thr 210 215 220 Val Tyr Glu Leu Asp Ala Pro Cys Ile Ser His Met Ala Leu Met Phe 225 230 235 240 Pro Lys Ile Tyr Thr Leu Gly Pro Leu His Ala Leu Leu Asn Ser Gln 245 250 255 Ile Gly Asp Met Ser Arg Gly Leu Ala Ser His Gly Ser Leu Trp Lys 260 265 270 Ser Asp Leu Asn Cys Met Thr Trp Leu Asp Ser Gln Pro Ser Lys Ser 275 280 285 Ile Ile Tyr Val Ser Phe Gly Thr Leu Val His Leu Thr Arg Ala Gln 290 295 300 Val Ile Glu Phe Trp Tyr Gly Leu Val Asn Ser Gly His Pro Phe Leu 305 310 315 320 Trp Val Met Arg Ser Asp Ile Thr Ser Gly Asp His Gln Ile Pro Ala 325 330 335 Glu Leu Glu Asn Gly Thr Lys Glu Arg Gly Cys Ile Val Asp Trp Val 340 345 350 Ser Gln Glu Glu Val Leu Ala His Lys Ser Val Gly Gly Phe Leu Thr 355 360 365 His Ser Gly Trp Asn Ser Thr Leu Glu Ser Ile Val Ala Gly Leu Pro 370 375 380 Met Ile Cys Trp Pro Lys Leu Gly Asp His Tyr Ile Ile Ser Ser Thr 385 390 395 400 Val Cys Arg Gln Trp Lys Ile Gly Leu Gln Leu Asn Glu Asn Cys Asp 405 410 415 Arg Ser Asn Ile Glu Ser Met Val Gln Thr Leu Met Gly Ser Lys Arg 420 425 430 Glu Glu Ile Gln Ser Ser Met Asp Ala Ile Ser Lys Leu Ser Arg Asp 435 440 445 Ser Val Ala Glu Gly Gly Ser Ser His Asn Asn Leu Glu Gln Leu Ile 450 455 460 Glu Tyr Ile Arg Asn Leu Gln His Gln Asn 465 470 <210> 48 <211> 468 <212> PRT <213> Theobroma cacao <400> 48 Met Arg Gln Pro His Val Leu Val Leu Pro Phe Pro Ala Gln Gly His 1 5 10 15 Ile Lys Pro Met Leu Cys Leu Ala Glu Leu Leu Cys Gln Ala Gly Leu 20 25 30 Arg Val Thr Phe Leu Asn Thr His His Ser His Arg Arg Leu Asn Asn 35 40 45 Leu Gln Asp Leu Ser Thr Arg Phe Pro Thr Leu His Phe Glu Ser Val 50 55 60 Ser Asp Gly Leu Pro Glu Asp His Pro Arg Asn Leu Val His Phe Met 65 70 75 80 His Leu Val His Ser Ile Lys Asn Val Thr Lys Pro Leu Leu Arg Asp 85 90 95 Leu Leu Thr Ser Leu Ser Leu Lys Thr Asp Ile Pro Pro Val Ser Cys 100 105 110 Ile Ile Ala Asp Gly Ile Leu Ser Phe Ala Ile Asp Val Ala Glu Glu 115 120 125 Leu Gln Ile Lys Val Ile Ile Phe Arg Thr Ile Ser Ser Cys Cys Leu 130 135 140 Trp Ser Tyr Leu Cys Val Pro Lys Leu Ile Gln Gln Gly Glu Leu Gln 145 150 155 160 Phe Ser Asp Ser Asp Met Gly Gln Lys Val Ser Ser Val Pro Glu Met 165 170 175 Lys Gly Ser Leu Arg Leu His Asp Arg Pro Tyr Ser Phe Gly Leu Lys 180 185 190 Gln Leu Glu Asp Pro Asn Phe Gln Phe Phe Val Ser Glu Thr Gln Ala 195 200 205 Met Thr Arg Ala Ser Ala Val Ile Phe Asn Thr Phe Asp Ser Leu Glu 210 215 220 Ala Pro Val Leu Ser Gln Met Ile Pro Leu Leu Pro Lys Val Tyr Thr 225 230 235 240 Ile Gly Pro Leu His Ala Leu Arg Lys Ala Arg Leu Gly Asp Leu Ser 245 250 255 Gln His Ser Ser Phe Asn Gly Asn Leu Arg Glu Ala Asp His Asn Cys 260 265 270 Ile Thr Trp Leu Asp Ser Gln Pro Leu Arg Ser Val Val Tyr Val Ser 275 280 285 Phe Gly Ser His Val Val Leu Thr Ser Glu Glu Leu Leu Glu Phe Trp 290 295 300 His Gly Leu Val Asn Ser Gly Lys Arg Phe Leu Trp Val Leu Arg Pro 305 310 315 320 Asp Ile Ile Ala Gly Glu Lys Asp His Asn Gln Ile Ile Ala Arg Glu 325 330 335 Pro Asp Leu Gly Thr Lys Glu Lys Gly Leu Leu Val Asp Trp Ala Pro 340 345 350 Gln Glu Glu Val Leu Ala His Pro Ser Val Gly Gly Phe Leu Thr His 355 360 365 Cys Gly Trp Asn Ser Thr Leu Glu Ser Met Val Ala Gly Val Pro Met 370 375 380 Leu Cys Trp Pro Lys Leu Pro Asp Gln Leu Val Asn Ser Ser Cys Val 385 390 395 400 Ser Glu Val Trp Lys Ile Gly Leu Asp Leu Lys Asp Met Cys Asp Arg 405 410 415 Ser Thr Val Glu Lys Met Val Arg Ala Leu Met Glu Asp Arg Arg Glu 420 425 430 Glu Val Met Arg Ser Val Asp Gly Ile Ser Lys Leu Ala Arg Glu Ser 435 440 445 Val Ser His Gly Gly Ser Ser Ser Ser Asn Leu Glu Met Leu Ile Gln 450 455 460 Glu Leu Glu Thr 465 <210> 49 <211> 454 <212> PRT <213> Cucurbita maxima <400> 49 Met Asp Ala Gln Lys Ala Val Asp Thr Pro Pro Thr Thr Val Leu Met 1 5 10 15 Leu Pro Trp Ile Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu Leu Ala 20 25 30 Lys Ala Leu Ser Arg Arg Asn Phe His Val Tyr Phe Cys Ser Thr Pro 35 40 45 Val Asn Leu Asp Ser Ile Lys Pro Asn Leu Ile Pro Pro Pro Ser Ser 50 55 60 Ile Gln Phe Val Asp Leu His Leu Pro Ser Ser Pro Glu Leu Pro Pro 65 70 75 80 His Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Lys Pro Thr Leu 85 90 95 His Gln Ala Phe Ser Ala Ala Ala Gln His Phe Glu Ala Ile Leu Gln 100 105 110 Thr Leu Ser Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala 115 120 125 Pro Arg Ile Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Asn Thr 130 135 140 Thr Ala Val Ser Ile Ile Ala His Ala Leu His Ser Val His Tyr Pro 145 150 155 160 Asp Ser Lys Phe Pro Phe Ser Asp Phe Val Leu His Asp Tyr Trp Lys 165 170 175 Ala Lys Tyr Thr Thr Ala Asp Gly Ala Thr Ser Glu Lys Ile Arg Arg 180 185 190 Gly Ala Glu Ala Phe Leu Tyr Cys Leu Asn Ala Ser Cys Asp Val Val 195 200 205 Leu Val Asn Ser Phe Arg Glu Leu Glu Gly Glu Tyr Met Asp Tyr Leu 210 215 220 Ser Val Leu Leu Lys Lys Lys Val Val Ser Val Gly Pro Leu Val Tyr 225 230 235 240 Glu Pro Ser Glu Gly Glu Glu Asp Glu Glu Tyr Trp Arg Ile Lys Lys 245 250 255 Trp Leu Asp Glu Lys Glu Ala Leu Ser Thr Val Leu Val Ser Phe Gly 260 265 270 Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala His Gly 275 280 285 Leu Glu Glu Ser Glu Ala Asn Phe Ile Trp Val Val Arg Phe Pro Lys 290 295 300 Gly Glu Glu Ser Cys Arg Gly Ile Glu Glu Ala Leu Pro Lys Gly Phe 305 310 315 320 Val Glu Arg Ala Gly Glu Arg Ala Met Val Val Lys Lys Trp Ala Pro 325 330 335 Gln Gly Lys Ile Leu Lys His Gly Ser Ile Gly Gly Phe Val Ser His 340 345 350 Cys Gly Trp Asn Ser Val Leu Glu Ser Ile Arg Phe Gly Val Pro Val 355 360 365 Ile Gly Val Pro Met His Leu Asp Gln Pro Tyr Asn Ala Gly Leu Leu 370 375 380 Glu Glu Ala Gly Ile Gly Val Glu Ala Lys Arg Asp Ala Asp Gly Lys 385 390 395 400 Ile Gln Arg Asp Gln Val Ala Ser Leu Ile Lys Arg Val Val Val Glu 405 410 415 Lys Thr Arg Glu Asp Ile Trp Lys Thr Val Arg Glu Met Arg Glu Val 420 425 430 Leu Arg Arg Arg Asp Asp Asp Met Ile Asp Glu Met Val Ala Glu Ile 435 440 445 Ser Val Val Leu Lys Ile 450 <210> 50 <211> 457 <212> PRT <213> Cucurbita moschata <400> 50 Met Asp Ala Gln Lys Ala Val Asp Thr Pro Pro Thr Thr Val Leu Met 1 5 10 15 Leu Pro Trp Ile Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu Leu Ala 20 25 30 Lys Ala Leu Ser Arg Arg Asn Phe His Val Tyr Phe Cys Ser Thr Pro 35 40 45 Val Asn Leu Asp Ser Ile Lys Pro Asn Leu Ile Pro Pro Pro Pro Ser 50 55 60 Ile Gln Phe Val Asp Leu His Leu Pro Ser Ser Pro Glu Leu Pro Pro 65 70 75 80 His Leu His Thr Thr Asn Gly Leu Pro Ser His Leu Lys Pro Thr Leu 85 90 95 His Gln Ala Phe Ser Ala Ala Ala Gln His Phe Glu Ala Ile Leu Gln 100 105 110 Thr Leu Ser Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala 115 120 125 Pro Arg Ile Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe Asn Thr 130 135 140 Thr Ala Val Ser Ile Ile Ala His Ala Leu His Ser Val His Tyr Pro 145 150 155 160 Asp Ser Lys Phe Pro Phe Ser Asp Phe Val Leu His Asp Tyr Trp Lys 165 170 175 Ala Lys Tyr Thr Thr Ala Asp Gly Ala Thr Ser Glu Lys Thr Arg Arg 180 185 190 Gly Val Glu Ala Phe Leu Tyr Cys Leu Asn Ala Ser Cys Asp Val Val 195 200 205 Leu Val Asn Ser Phe Arg Glu Leu Glu Gly Glu Tyr Met Asp Tyr Leu 210 215 220 Ser Val Leu Leu Lys Lys Lys Val Val Ser Val Gly Pro Leu Val Tyr 225 230 235 240 Glu Pro Ser Glu Gly Glu Glu Asp Glu Glu Tyr Trp Arg Ile Lys Lys 245 250 255 Trp Leu Asp Glu Lys Glu Ala Leu Ser Thr Val Leu Val Ser Phe Gly 260 265 270 Ser Glu Tyr Phe Pro Pro Lys Glu Glu Met Glu Glu Ile Ala His Gly 275 280 285 Leu Glu Glu Ser Glu Ala Asn Phe Ile Trp Val Val Arg Phe Pro Lys 290 295 300 Gly Glu Glu Ser Ser Ser Arg Gly Ile Glu Glu Ala Leu Pro Lys Gly 305 310 315 320 Phe Val Glu Arg Ala Gly Glu Arg Ala Met Val Val Lys Lys Trp Ala 325 330 335 Pro Gln Gly Lys Ile Leu Lys His Gly Ser Ile Gly Gly Phe Val Ser 340 345 350 His Cys Gly Trp Asn Ser Val Leu Glu Ser Ile Arg Phe Gly Val Pro 355 360 365 Val Ile Gly Ala Pro Met His Leu Asp Gln Pro Tyr Asn Ala Gly Leu 370 375 380 Leu Glu Glu Ala Gly Ile Gly Val Glu Ala Lys Arg Asp Ala Asp Gly 385 390 395 400 Lys Ile Gln Arg Asp Gln Val Ala Ser Leu Ile Lys Gln Val Val Val 405 410 415 Glu Lys Thr Arg Glu Asp Ile Trp Lys Lys Val Arg Glu Met Arg Glu 420 425 430 Val Leu Arg Arg Arg Asp Asp Asp Asp Met Met Ile Asp Glu Met Val 435 440 445 Ala Val Ile Ser Val Val Leu Lys Ile 450 455 <210> 51 <211> 492 <212> PRT <213> Cucurbita maxima <400> 51 Met Ser Ser Asn Leu Phe Leu Lys Ile Ser Ile Pro Phe Gly Arg Leu 1 5 10 15 Arg Asp Ser Ala Leu Asn Cys Ser Val Phe His Cys Lys Leu His Leu 20 25 30 Ala Ile Ala Ile Ala Met Asp Ala Gln Gln Ala Ala Asn Lys Ser Pro 35 40 45 Thr Ala Thr Thr Ile Phe Met Leu Pro Trp Ala Gly Tyr Gly His Leu 50 55 60 Ser Ala Tyr Leu Glu Leu Ala Lys Ala Leu Ser Thr Arg Asn Phe His 65 70 75 80 Ile Tyr Phe Cys Ser Thr Pro Val Ser Leu Ala Ser Ile Lys Pro Arg 85 90 95 Leu Ile Pro Ser Cys Ser Ser Ile Gln Phe Val Glu Leu His Leu Pro 100 105 110 Ser Ser Asp Glu Phe Pro Pro His Leu His Thr Thr Asn Gly Leu Pro 115 120 125 Ser Arg Leu Val Pro Thr Phe His Gln Ala Phe Ser Glu Ala Ala Gln 130 135 140 Thr Phe Glu Ala Phe Leu Gln Thr Leu Arg Pro His Leu Leu Ile Tyr 145 150 155 160 Asp Ser Leu Gln Pro Trp Ala Pro Arg Ile Ala Ser Ser Leu Asn Ile 165 170 175 Pro Ala Ile Asn Phe Phe Thr Ala Gly Ala Phe Ala Val Ser His Val 180 185 190 Leu Arg Ala Phe His Tyr Pro Asp Ser Gln Phe Pro Ser Ser Asp Phe 195 200 205 Val Leu His Ser Arg Trp Lys Ile Lys Asn Thr Thr Ala Glu Ser Pro 210 215 220 Thr Gln Ala Lys Leu Pro Lys Ile Gly Glu Ala Ile Gly Tyr Cys Leu 225 230 235 240 Asn Ala Ser Arg Gly Val Ile Leu Thr Asn Ser Phe Arg Glu Leu Glu 245 250 255 Gly Lys Tyr Ile Asp Tyr Leu Ser Val Ile Leu Lys Lys Arg Val Phe 260 265 270 Pro Ile Gly Pro Leu Val Tyr Gln Pro Asn Gln Asp Glu Glu Asp Glu 275 280 285 Asp Tyr Ser Arg Ile Lys Asn Trp Leu Asp Arg Lys Glu Ala Ser Ser 290 295 300 Thr Val Leu Val Ser Phe Gly Ser Glu Phe Phe Leu Ser Lys Glu Glu 305 310 315 320 Thr Glu Ala Ile Ala His Gly Leu Glu Gln Ser Glu Ala Asn Phe Ile 325 330 335 Trp Gly Ile Arg Phe Pro Lys Gly Ala Lys Lys Asn Ala Ile Glu Glu 340 345 350 Ala Leu Pro Glu Gly Phe Leu Glu Arg Ala Gly Gly Arg Ala Met Val 355 360 365 Val Glu Glu Trp Val Pro Gln Gly Lys Ile Leu Lys His Gly Ser Ile 370 375 380 Gly Gly Phe Val Ser His Cys Gly Trp Asn Ser Ala Met Glu Ser Ile 385 390 395 400 Val Cys Gly Val Pro Ile Ile Gly Ile Pro Met Gln Val Asp Gln Pro 405 410 415 Phe Asn Ala Gly Ile Leu Glu Glu Ala Gly Val Gly Val Glu Ala Lys 420 425 430 Arg Asp Ser Asp Gly Lys Ile Gln Arg Asp Glu Val Ala Lys Leu Ile 435 440 445 Lys Glu Val Val Val Glu Arg Thr Arg Glu Asp Ile Arg Asn Lys Leu 450 455 460 Glu Lys Ile Asn Glu Ile Leu Arg Ser Arg Arg Glu Glu Lys Leu Asp 465 470 475 480 Glu Leu Ala Thr Glu Ile Ser Leu Leu Ser Arg Asn 485 490 <210> 52 <211> 455 <212> PRT <213> Cucurbita moschata <400> 52 Met Asp Ala Gln Gln Ala Ala Asn Lys Ser Pro Thr Ala Ser Thr Ile 1 5 10 15 Phe Met Leu Pro Trp Val Gly Tyr Gly His Leu Ser Ala Tyr Leu Glu 20 25 30 Leu Ala Lys Ala Leu Ser Thr Arg Asn Phe His Val Tyr Phe Cys Ser 35 40 45 Thr Pro Val Ser Leu Ala Ser Ile Lys Pro Arg Leu Ile Pro Ser Cys 50 55 60 Ser Ser Ile Gln Phe Val Glu Leu His Leu Pro Ser Ser Asp Glu Phe 65 70 75 80 Pro Pro His Leu His Thr Thr Asn Gly Leu Pro Ala His Leu Val Pro 85 90 95 Thr Ile His Gln Ala Phe Ala Ala Ala Ala Gln Thr Phe Glu Ala Phe 100 105 110 Leu Gln Thr Leu Arg Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro 115 120 125 Trp Ala Pro Arg Ile Ala Ser Ser Leu Asn Ile Pro Ala Ile Asn Phe 130 135 140 Phe Thr Ala Gly Ala Phe Ala Val Ser His Val Leu Arg Ala Phe His 145 150 155 160 Tyr Pro Asp Ser Gln Phe Pro Ser Ser Asp Phe Val Leu His Ser Arg 165 170 175 Trp Lys Ile Lys Asn Thr Thr Ala Glu Ser Pro Thr Gln Val Lys Ile 180 185 190 Pro Lys Ile Gly Glu Ala Ile Gly Tyr Cys Leu Asn Ala Ser Arg Gly 195 200 205 Val Ile Leu Thr Asn Ser Phe Arg Glu Leu Glu Gly Lys Tyr Ile Asp 210 215 220 Tyr Leu Ser Val Ile Leu Lys Lys Arg Val Leu Pro Ile Gly Pro Leu 225 230 235 240 Val Tyr Gln Pro Asn Gln Asp Glu Glu Asp Glu Asp Tyr Ser Arg Ile 245 250 255 Lys Asn Trp Leu Asp Arg Lys Glu Ala Ser Ser Thr Val Leu Val Ser 260 265 270 Phe Gly Ser Glu Phe Phe Leu Ser Lys Glu Glu Thr Glu Ala Ile Ala 275 280 285 His Gly Leu Glu Gln Ser Glu Ala Asn Phe Ile Trp Gly Ile Arg Phe 290 295 300 Pro Lys Gly Ala Lys Lys Asn Ala Ile Glu Glu Ala Leu Pro Glu Gly 305 310 315 320 Phe Leu Glu Arg Val Gly Gly Arg Ala Met Val Val Glu Glu Trp Val 325 330 335 Pro Gln Gly Lys Ile Leu Lys His Gly Asn Ile Gly Gly Phe Val Ser 340 345 350 His Cys Gly Trp Asn Ser Ala Met Glu Ser Ile Met Cys Gly Val Pro 355 360 365 Val Ile Gly Ile Pro Met Gln Val Asp Gln Pro Phe Asn Ala Gly Ile 370 375 380 Leu Glu Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Ser Asp Gly 385 390 395 400 Lys Ile Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val Val Val 405 410 415 Glu Arg Thr Arg Glu Asp Ile Arg Asn Lys Leu Glu Glu Ile Asn Glu 420 425 430 Ile Leu Arg Thr Arg Arg Glu Glu Lys Leu Asp Glu Leu Ala Thr Glu 435 440 445 Ile Ser Leu Leu Cys Lys Asn 450 455 <210> 53 <211> 462 <212> PRT <213> Corchorus capsularis <400> 53 Met Asp Ser Lys Gln Lys Lys Met Ser Val Leu Met Phe Pro Trp Leu 1 5 10 15 Ala Tyr Gly His Ile Ser Pro Phe Leu Glu Leu Ala Lys Lys Leu Ser 20 25 30 Lys Arg Asn Phe His Thr Phe Phe Phe Ser Thr Pro Ile Asn Leu Asn 35 40 45 Ser Ile Lys Ser Lys Leu Ser Pro Lys Tyr Ala Gln Ser Ile Gln Phe 50 55 60 Val Glu Leu His Leu Pro Ser Leu Pro Asp Leu Pro Pro His Tyr His 65 70 75 80 Thr Thr Asn Gly Leu Pro Pro His Leu Met Asn Thr Leu Lys Lys Ala 85 90 95 Phe Asp Met Ser Ser Leu Gln Phe Ser Lys Ile Leu Lys Thr Leu Asn 100 105 110 Pro Asp Leu Leu Val Tyr Asp Phe Ile Gln Pro Trp Ala Pro Leu Leu 115 120 125 Ala Leu Ser Asn Lys Ile Pro Ala Val His Phe Leu Cys Thr Ser Ala 130 135 140 Ala Met Ser Ser Phe Ser Val His Ala Phe Lys Lys Pro Cys Glu Asp 145 150 155 160 Phe Pro Phe Pro Asn Ile Tyr Val His Gly Asn Phe Met Asn Ala Lys 165 170 175 Phe Asn Asn Met Glu Asn Cys Ser Ser Asp Asp Ser Ile Ser Asp Gln 180 185 190 Asp Arg Val Leu Gln Cys Phe Glu Arg Ser Thr Lys Ile Ile Leu Val 195 200 205 Lys Thr Phe Glu Glu Leu Glu Gly Lys Phe Met Asp Tyr Leu Ser Val 210 215 220 Leu Leu Asn Lys Lys Ile Val Pro Thr Gly Pro Leu Thr Gln Asp Pro 225 230 235 240 Asn Glu Asp Glu Gly Asp Asp Asp Glu Arg Thr Lys Leu Leu Leu Glu 245 250 255 Trp Leu Asn Lys Lys Ser Lys Ser Ser Thr Val Phe Val Ser Phe Gly 260 265 270 Ser Glu Tyr Phe Leu Ser Lys Glu Glu Arg Glu Glu Ile Ala Tyr Gly 275 280 285 Leu Glu Leu Ser Lys Val Asn Phe Ile Trp Val Ile Arg Phe Pro Leu 290 295 300 Gly Glu Asn Lys Thr Asn Leu Glu Glu Ala Leu Pro Gln Gly Phe Leu 305 310 315 320 Gln Arg Val Ser Glu Arg Gly Leu Val Val Glu Asn Trp Ala Pro Gln 325 330 335 Ala Lys Ile Leu Gln His Ser Ser Ile Gly Gly Phe Val Ser His Cys 340 345 350 Gly Trp Ser Ser Val Met Glu Ser Leu Lys Phe Gly Val Pro Ile Ile 355 360 365 Ala Ile Pro Met His Leu Asp Gln Pro Leu Asn Ala Arg Leu Val Val 370 375 380 Asp Val Gly Val Gly Leu Glu Val Ile Arg Asn His Gly Ser Leu Glu 385 390 395 400 Arg Glu Glu Ile Ala Lys Leu Ile Lys Glu Val Val Leu Gly Asn Gly 405 410 415 Asn Asp Gly Glu Ile Val Arg Arg Lys Ala Arg Glu Met Ser Asn His 420 425 430 Ile Lys Lys Lys Gly Glu Lys Asp Met Asp Glu Leu Val Glu Glu Leu 435 440 445 Met Leu Ile Cys Lys Met Lys Pro Asn Ser Cys His Leu Ser 450 455 460 <210> 54 <211> 448 <212> PRT <213> Ziziphus jujube <400> 54 Met Met Glu Arg Gln Arg Ser Ile Lys Val Leu Met Phe Pro Trp Leu 1 5 10 15 Ala His Gly His Ile Ser Pro Phe Leu Glu Leu Ala Lys Arg Leu Thr 20 25 30 Asp Arg Asn Phe Gln Ile Tyr Phe Cys Ser Thr Pro Val Asn Leu Thr 35 40 45 Ser Val Lys Pro Lys Leu Ser Gln Lys Tyr Ser Ser Ser Ile Lys Leu 50 55 60 Val Glu Leu His Leu Pro Ser Leu Pro Asp Leu Pro Pro His Tyr His 65 70 75 80 Thr Thr Asn Gly Leu Ala Leu Asn Leu Ile Pro Thr Leu Lys Lys Ala 85 90 95 Phe Asp Met Ser Ser Ser Ser Phe Ser Thr Ile Leu Ser Thr Ile Lys 100 105 110 Pro Asp Leu Leu Ile Tyr Asp Phe Leu Gln Pro Trp Ala Pro Gln Leu 115 120 125 Ala Ser Cys Met Asn Ile Pro Ala Val Asn Phe Leu Ser Ala Gly Ala 130 135 140 Ser Met Val Ser Phe Val Leu His Ser Ile Lys Tyr Asn Gly Asp Asp 145 150 155 160 His Asp Asp Glu Phe Leu Thr Thr Glu Leu His Leu Ser Asp Ser Met 165 170 175 Glu Ala Lys Phe Ala Glu Met Thr Glu Ser Ser Pro Asp Glu His Ile 180 185 190 Asp Arg Ala Val Thr Cys Leu Glu Arg Ser Asn Ser Leu Ile Leu Ile 195 200 205 Lys Ser Phe Arg Glu Leu Glu Gly Lys Tyr Leu Asp Tyr Leu Ser Leu 210 215 220 Ser Phe Ala Lys Lys Val Val Pro Ile Gly Pro Leu Val Ala Gln Asp 225 230 235 240 Thr Asn Pro Glu Asp Asp Ser Met Asp Ile Ile Asn Trp Leu Asp Lys 245 250 255 Lys Glu Lys Ser Ser Thr Val Phe Val Ser Phe Gly Ser Glu Tyr Tyr 260 265 270 Leu Thr Asn Glu Glu Met Glu Glu Ile Ala Tyr Gly Leu Glu Leu Ser 275 280 285 Lys Val Asn Phe Ile Trp Val Val Arg Phe Pro Leu Gly Gln Lys Met 290 295 300 Ala Val Glu Glu Ala Leu Pro Lys Gly Phe Leu Glu Arg Val Gly Glu 305 310 315 320 Lys Gly Met Val Val Glu Asp Trp Ala Pro Gln Met Lys Ile Leu Gly 325 330 335 His Ser Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Ser Ser Leu 340 345 350 Met Glu Ser Leu Lys Leu Gly Val Pro Ile Ile Ala Met Pro Met Gln 355 360 365 Leu Asp Gln Pro Ile Asn Ala Lys Leu Val Glu Arg Ser Gly Val Gly 370 375 380 Leu Glu Val Lys Arg Asp Lys Asn Gly Arg Ile Glu Arg Glu Tyr Leu 385 390 395 400 Ala Lys Val Ile Arg Glu Ile Val Val Glu Lys Ala Arg Gln Asp Ile 405 410 415 Glu Lys Lys Ala Arg Glu Met Ser Asn Ile Ile Thr Glu Lys Gly Glu 420 425 430 Glu Glu Ile Asp Asn Val Val Glu Glu Leu Ala Lys Leu Cys Gly Met 435 440 445 <210> 55 <211> 446 <212> PRT <213> Vitis vinifera <400> 55 Met Asp Ala Arg Gln Ser Asp Gly Ile Ser Val Leu Met Phe Pro Trp 1 5 10 15 Leu Ala His Gly His Ile Ser Pro Phe Leu Gln Leu Ala Lys Lys Leu 20 25 30 Ser Lys Arg Asn Phe Ser Ile Tyr Phe Cys Ser Thr Pro Val Asn Leu 35 40 45 Asp Pro Ile Lys Gly Lys Leu Ser Glu Ser Tyr Ser Leu Ser Ile Gln 50 55 60 Leu Val Lys Leu His Leu Pro Ser Leu Pro Glu Leu Pro Pro Gln Tyr 65 70 75 80 His Thr Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Met 85 90 95 Ala Phe Asp Met Ala Ser Pro Asn Phe Ser Asn Ile Leu Lys Thr Leu 100 105 110 His Pro Asp Leu Leu Ile Tyr Asp Phe Leu Gln Pro Trp Ala Pro Ala 115 120 125 Ala Ala Ser Ser Leu Asn Ile Pro Ala Val Gln Phe Leu Ser Thr Gly 130 135 140 Ala Thr Leu Gln Ser Phe Leu Ala His Arg His Arg Lys Pro Gly Ile 145 150 155 160 Glu Phe Pro Phe Gln Glu Ile His Leu Pro Asp Tyr Glu Ile Gly Arg 165 170 175 Leu Asn Arg Phe Leu Glu Pro Ser Ala Gly Arg Ile Ser Asp Arg Asp 180 185 190 Arg Ala Asn Gln Cys Leu Glu Arg Ser Ser Arg Phe Ser Leu Ile Lys 195 200 205 Thr Phe Arg Glu Ile Glu Ala Lys Tyr Leu Asp Tyr Val Ser Asp Leu 210 215 220 Thr Lys Lys Lys Met Val Thr Val Gly Pro Leu Leu Gln Asp Pro Glu 225 230 235 240 Asp Glu Asp Glu Ala Thr Asp Ile Val Glu Trp Leu Asn Lys Lys Cys 245 250 255 Glu Ala Ser Ala Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Val Ser 260 265 270 Lys Glu Glu Met Glu Glu Ile Ala His Gly Leu Glu Leu Ser Asn Val 275 280 285 Asp Phe Ile Trp Val Val Arg Phe Pro Met Gly Glu Lys Ile Arg Leu 290 295 300 Glu Asp Ala Leu Pro Pro Gly Phe Leu His Arg Leu Gly Asp Arg Gly 305 310 315 320 Met Val Val Glu Gly Trp Ala Pro Gln Arg Lys Ile Leu Gly His Ser 325 330 335 Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Ser Ser Val Met Glu 340 345 350 Gly Met Lys Phe Gly Val Pro Ile Ile Ala Met Pro Met His Leu Asp 355 360 365 Gln Pro Ile Asn Ala Lys Leu Val Glu Ala Val Gly Val Gly Arg Glu 370 375 380 Val Lys Arg Asp Glu Asn Arg Lys Leu Glu Arg Glu Glu Ile Ala Lys 385 390 395 400 Val Ile Lys Glu Val Val Gly Glu Lys Asn Gly Glu Asn Val Arg Arg 405 410 415 Lys Ala Arg Glu Leu Ser Glu Thr Leu Arg Lys Lys Gly Asp Glu Glu 420 425 430 Ile Asp Val Val Val Glu Glu Leu Lys Gln Leu Cys Ser Tyr 435 440 445 <210> 56 <211> 456 <212> PRT <213> Juglans regia <400> 56 Met Asp Thr Ala Arg Lys Arg Ile Arg Val Val Met Leu Pro Trp Leu 1 5 10 15 Ala His Gly His Ile Ser Pro Phe Leu Glu Leu Ser Lys Lys Leu Ala 20 25 30 Lys Arg Asn Phe His Ile Tyr Phe Cys Ser Thr Pro Val Asn Leu Ser 35 40 45 Ser Ile Lys Pro Lys Leu Ser Gly Lys Tyr Ser Arg Ser Ile Gln Leu 50 55 60 Val Glu Leu His Leu Pro Ser Leu Pro Glu Leu Pro Pro Gln Tyr His 65 70 75 80 Thr Thr Lys Gly Leu Pro Pro His Leu Asn Ala Thr Leu Lys Arg Ala 85 90 95 Phe Asp Met Ala Gly Pro His Phe Ser Asn Ile Leu Lys Thr Leu Ser 100 105 110 Pro Asp Leu Leu Ile Tyr Asp Phe Leu Gln Pro Trp Ala Pro Ala Ile 115 120 125 Ala Ala Ser Gln Asn Ile Pro Ala Ile Asn Phe Leu Ser Thr Gly Ala 130 135 140 Ala Met Thr Ser Phe Val Leu His Ala Met Lys Lys Pro Gly Asp Glu 145 150 155 160 Phe Pro Phe Pro Glu Ile His Leu Asp Glu Cys Met Lys Thr Arg Phe 165 170 175 Val Asp Leu Pro Glu Asp His Ser Pro Ser Asp Asp His Asn His Ile 180 185 190 Ser Asp Lys Asp Arg Ala Leu Lys Cys Phe Glu Arg Ser Ser Gly Phe 195 200 205 Val Met Met Lys Thr Phe Glu Glu Leu Glu Gly Lys Tyr Ile Asn Phe 210 215 220 Leu Ser His Leu Met Gln Lys Lys Ile Val Pro Val Gly Pro Leu Val 225 230 235 240 Gln Asn Pro Val Arg Gly Asp His Glu Lys Ala Lys Thr Leu Glu Trp 245 250 255 Leu Asp Lys Arg Lys Gln Ser Ser Ala Val Phe Val Ser Phe Gly Thr 260 265 270 Glu Tyr Phe Leu Ser Lys Glu Glu Met Glu Glu Ile Ala Tyr Gly Leu 275 280 285 Glu Leu Ser Asn Val Asn Phe Ile Trp Val Val Arg Phe Pro Glu Gly 290 295 300 Glu Lys Val Lys Leu Glu Glu Ala Leu Pro Glu Gly Phe Leu Gln Arg 305 310 315 320 Val Gly Glu Lys Gly Met Val Val Glu Gly Trp Ala Pro Gln Ala Lys 325 330 335 Ile Leu Met His Pro Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp 340 345 350 Ser Ser Val Met Glu Ser Ile Asp Phe Gly Val Pro Ile Val Ala Ile 355 360 365 Pro Met Gln Leu Asp Gln Pro Val Asn Ala Lys Val Val Glu Gln Ala 370 375 380 Gly Val Gly Val Glu Val Lys Arg Asp Arg Asp Gly Lys Leu Glu Arg 385 390 395 400 Glu Glu Val Ala Thr Val Ile Arg Glu Val Val Met Gly Asn Ile Gly 405 410 415 Glu Ser Val Arg Lys Lys Glu Arg Glu Met Arg Asp Asn Ile Arg Lys 420 425 430 Lys Gly Glu Glu Lys Met Asp Gly Val Ala Gln Glu Leu Val Gln Leu 435 440 445 Tyr Gly Asn Gly Ile Lys Asn Val 450 455 <210> 57 <211> 456 <212> PRT <213> Hevea brasiliensis <400> 57 Met Glu Thr Leu Gln Arg Arg Lys Ile Ser Val Leu Met Phe Pro Trp 1 5 10 15 Leu Ala His Gly His Leu Ser Pro Phe Leu Glu Leu Ser Lys Lys Leu 20 25 30 Asn Lys Arg Asn Phe His Val Tyr Phe Cys Ser Thr Pro Val Asn Leu 35 40 45 Asp Ser Ile Lys Pro Lys Leu Ser Ala Glu Tyr Ser Phe Ser Ile Gln 50 55 60 Leu Val Glu Leu His Leu Pro Ser Ser Pro Glu Leu Pro Leu His Tyr 65 70 75 80 His Thr Thr Asn Gly Leu Pro Pro His Leu Met Lys Asn Leu Lys Asn 85 90 95 Ala Phe Asp Met Ala Ser Ser Ser Phe Phe Asn Ile Leu Lys Thr Leu 100 105 110 Lys Pro Asp Leu Leu Ile Tyr Asp Phe Ile Gln Pro Trp Ala Pro Ala 115 120 125 Leu Ala Ser Ser Leu Asn Ile Pro Ala Val Asn Phe Leu Cys Thr Ser 130 135 140 Met Ala Met Ser Cys Phe Gly Leu His Leu Asn Asn Gln Glu Ala Lys 145 150 155 160 Phe Pro Phe Pro Gly Ile Tyr Pro Arg Asp Tyr Met Arg Met Lys Val 165 170 175 Phe Gly Ala Leu Glu Ser Ser Ser Asn Asp Ile Lys Asp Gly Glu Arg 180 185 190 Ala Gly Arg Cys Met Asp Gln Ser Phe His Leu Ile Leu Ala Lys Thr 195 200 205 Phe Arg Glu Leu Glu Gly Lys Tyr Ile Asp Tyr Leu Ser Val Lys Leu 210 215 220 Met Lys Lys Ile Val Pro Val Gly Pro Leu Val Gln Asp Pro Ile Phe 225 230 235 240 Glu Asp Asp Glu Lys Ile Met Asp His His Gln Val Ile Lys Trp Leu 245 250 255 Glu Lys Lys Glu Arg Leu Ser Thr Val Phe Val Ser Phe Gly Thr Glu 260 265 270 Tyr Phe Leu Ser Thr Glu Glu Met Glu Glu Ile Ala Tyr Gly Leu Glu 275 280 285 Leu Ser Lys Ala His Phe Ile Trp Val Val Arg Phe Pro Thr Gly Glu 290 295 300 Lys Ile Asn Leu Glu Glu Ser Leu Pro Lys Arg Tyr Leu Glu Arg Val 305 310 315 320 Gln Glu Arg Gly Lys Ile Val Glu Gly Trp Ala Pro Gln Gln Lys Ile 325 330 335 Leu Arg His Ser Ser Ile Gly Gly Phe Val Ser His Cys Gly Trp Ser 340 345 350 Ser Ile Met Glu Ser Met Lys Phe Gly Val Pro Ile Ile Ala Met Pro 355 360 365 Met Asn Leu Asp Gln Pro Val Asn Ser Arg Ile Val Glu Asp Ala Gly 370 375 380 Val Gly Ile Glu Val Arg Arg Asn Lys Ser Gly Glu Leu Glu Arg Glu 385 390 395 400 Glu Ile Ala Lys Thr Ile Arg Lys Val Val Val Glu Lys Asp Gly Lys 405 410 415 Asn Val Ser Arg Lys Ala Arg Glu Met Ser Asp Thr Ile Arg Lys Lys 420 425 430 Gly Glu Glu Glu Ile Asp Gly Val Val Asp Glu Leu Leu Gln Leu Cys 435 440 445 Asp Val Lys Thr Asn Tyr Leu Gln 450 455 <210> 58 <211> 461 <212> PRT <213> Manihot esculenta <400> 58 Met Ala Thr Ala Gln Thr Arg Lys Ile Ser Val Leu Met Phe Pro Trp 1 5 10 15 Leu Ala His Gly His Leu Ser Pro Phe Leu Glu Leu Ser Lys Lys Leu 20 25 30 Ala Asn Arg Asn Phe His Val Tyr Phe Cys Ser Thr Pro Val Asn Leu 35 40 45 Asp Ser Ile Lys Pro Lys Leu Ser Pro Glu Tyr His Phe Ser Ile Gln 50 55 60 Phe Val Glu Leu His Leu Pro Ser Ser Pro Glu Leu Pro Ser His Tyr 65 70 75 80 His Thr Thr Asn Gly Leu Pro Pro His Leu Met Lys Thr Leu Lys Lys 85 90 95 Ala Phe Asp Met Ala Ser Ser Ser Phe Phe Asn Ile Leu Lys Thr Leu 100 105 110 Asn Pro Asp Leu Leu Ile Tyr Asp Phe Leu Gln Pro Trp Ala Pro Ala 115 120 125 Leu Ala Ser Ser Leu Asn Ile Pro Ala Val Asn Phe Leu Cys Ser Ser 130 135 140 Met Ala Met Ser Cys Phe Gly Leu Asn Leu Asn Lys Asn Lys Glu Ile 145 150 155 160 Lys Phe Leu Phe Pro Glu Ile Tyr Pro Arg Asp Tyr Met Glu Met Lys 165 170 175 Leu Phe Arg Val Phe Glu Ser Ser Ser Asn Gln Ile Lys Asp Gly Glu 180 185 190 Arg Ala Gly Arg Cys Ile Asp Gln Ser Phe His Val Ile Leu Ala Lys 195 200 205 Thr Phe Arg Glu Leu Glu Gly Lys Tyr Ile Asp Tyr Val Ser Val Lys 210 215 220 Cys Asn Lys Lys Ile Val Pro Val Gly Pro Leu Val Glu Asp Thr Ile 225 230 235 240 His Glu Asp Asp Glu Lys Thr Met Asp His His His His His His Asp 245 250 255 Glu Val Ile Lys Trp Leu Glu Lys Lys Glu Arg Ser Thr Thr Val Phe 260 265 270 Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Glu Glu Met Glu Glu 275 280 285 Ile Ala His Gly Leu Glu Leu Ser Lys Val Asn Phe Ile Trp Val Val 290 295 300 Arg Phe Pro Lys Gly Glu Lys Ile Asn Leu Glu Glu Ser Leu Pro Glu 305 310 315 320 Gly Tyr Leu Glu Arg Ile Gln Glu Arg Gly Lys Ile Val Glu Gly Trp 325 330 335 Ala Pro Gln Arg Lys Ile Leu Gly His Ser Ser Ile Gly Gly Phe Val 340 345 350 Ser His Cys Gly Trp Ser Ser Ile Met Glu Ser Met Lys Leu Gly Val 355 360 365 Pro Ile Ile Ala Met Pro Met Asn Leu Asp Gln Pro Ile Asn Ser Arg 370 375 380 Ile Val Glu Ala Ala Gly Val Gly Ile Glu Val Ser Arg Asn Gln Ser 385 390 395 400 Gly Glu Leu Glu Arg Glu Glu Met Ala Lys Thr Ile Arg Lys Val Val 405 410 415 Val Glu Arg Glu Gly Val Tyr Val Arg Arg Lys Ala Arg Glu Met Ser 420 425 430 Asp Val Leu Arg Lys Lys Gly Glu Glu Glu Ile Asp Gly Val Val Asp 435 440 445 Glu Leu Val Gln Leu Cys Asp Met Lys Thr Asn Tyr Leu 450 455 460 <210> 59 <211> 452 <212> PRT <213> Cephalotus follicularis <400> 59 Met Asp Leu Lys Arg Arg Ser Ile Arg Val Leu Met Leu Pro Trp Leu 1 5 10 15 Ala His Gly His Ile Ser Pro Phe Leu Glu Leu Ala Lys Lys Leu Thr 20 25 30 Asn Arg Asn Phe Leu Ile Tyr Phe Cys Ser Thr Pro Ile Asn Leu Asn 35 40 45 Ser Ile Lys Pro Lys Leu Ser Ser Lys Tyr Ser Phe Ser Ile Gln Leu 50 55 60 Val Glu Leu His Leu Pro Ser Leu Pro Glu Leu Pro Pro His Tyr His 65 70 75 80 Thr Thr Asn Gly Leu Pro Leu His Leu Met Asn Thr Leu Lys Thr Ala 85 90 95 Phe Asp Met Ala Ser Pro Ser Phe Leu Asn Ile Leu Lys Thr Leu Lys 100 105 110 Pro Asp Leu Leu Ile Cys Asp His Leu Gln Pro Trp Ala Pro Ser Leu 115 120 125 Ala Ser Ser Leu Asn Ile Pro Ala Ile Ile Phe Pro Thr Asn Ser Ala 130 135 140 Ile Met Met Ala Phe Ser Leu His His Ala Lys Asn Pro Gly Glu Glu 145 150 155 160 Phe Pro Phe Pro Ser Ile Asn Ile Asn Asp Asp Met Val Lys Ser Ile 165 170 175 Asn Phe Leu His Ser Ala Ser Asn Gly Leu Thr Asp Met Asp Arg Val 180 185 190 Leu Gln Cys Leu Glu Arg Ser Ser Asn Thr Met Leu Leu Lys Thr Phe 195 200 205 Arg Gln Leu Glu Ala Lys Tyr Val Asp Tyr Ser Ser Ala Leu Leu Lys 210 215 220 Lys Lys Ile Val Leu Ala Gly Pro Leu Val Gln Val Pro Asp Asn Glu 225 230 235 240 Asp Glu Lys Ile Glu Ile Ile Lys Trp Leu Asp Ser Arg Gly Gln Ser 245 250 255 Ser Thr Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Glu 260 265 270 Glu Arg Glu Asp Ile Ala His Gly Leu Glu Leu Ser Lys Val Asn Phe 275 280 285 Ile Trp Val Val Arg Phe Pro Val Gly Glu Lys Val Lys Leu Glu Glu 290 295 300 Ala Leu Pro Asn Gly Phe Ala Glu Arg Ile Gly Glu Arg Gly Leu Val 305 310 315 320 Val Glu Gly Trp Ala Pro Gln Ala Met Ile Leu Ser His Ser Ser Ile 325 330 335 Gly Gly Phe Val Ser His Cys Gly Trp Ser Ser Met Met Glu Ser Met 340 345 350 Lys Phe Gly Val Pro Ile Ile Ala Met Pro Met His Ile Asp Gln Pro 355 360 365 Leu Asn Ala Arg Leu Val Glu Asp Val Gly Val Gly Leu Glu Ile Lys 370 375 380 Arg Asn Lys Asp Gly Arg Phe Glu Arg Glu Glu Leu Ala Arg Val Ile 385 390 395 400 Lys Glu Val Leu Val Tyr Lys Asn Gly Asp Ala Val Arg Ser Lys Ala 405 410 415 Arg Glu Met Ser Glu His Ile Lys Lys Asn Gly Asp Gln Glu Ile Asp 420 425 430 Gly Val Ala Asp Ala Leu Val Lys Leu Cys Glu Met Lys Thr Asn Ser 435 440 445 Leu Asn Gln Asp 450 <210> 60 <211> 451 <212> PRT <213> Coffea arabica <400> 60 Met Glu Asn His Ala Thr Phe Asn Val Leu Met Leu Pro Trp Leu Ala 1 5 10 15 His Gly His Val Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu Thr Ala 20 25 30 Arg Asn Phe Asn Val Tyr Leu Cys Ser Ser Pro Ala Thr Leu Ser Ser 35 40 45 Val Arg Ser Lys Leu Thr Glu Lys Phe Ser Gln Ser Ile His Leu Val 50 55 60 Glu Leu His Leu Pro Lys Leu Pro Glu Leu Pro Ala Glu Tyr His Thr 65 70 75 80 Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Asp Ala Phe 85 90 95 Asp Met Ala Lys Pro Asn Phe Cys Asn Val Leu Lys Ser Leu Lys Pro 100 105 110 Asp Leu Leu Ile Tyr Asp Leu Leu Gln Pro Trp Ala Pro Glu Ala Ala 115 120 125 Ser Ala Phe Asn Ile Pro Ala Val Val Phe Ile Ser Ser Ser Ala Thr 130 135 140 Met Thr Ser Phe Gly Leu His Phe Phe Lys Asn Pro Gly Thr Lys Tyr 145 150 155 160 Pro Tyr Gly Asn Ala Ile Phe Tyr Arg Asp Tyr Glu Ser Val Phe Val 165 170 175 Glu Asn Leu Thr Arg Arg Asp Arg Asp Thr Tyr Arg Val Ile Asn Cys 180 185 190 Met Glu Arg Ser Ser Lys Ile Ile Leu Ile Lys Gly Phe Asn Glu Ile 195 200 205 Glu Gly Lys Tyr Phe Asp Tyr Phe Ser Cys Leu Thr Gly Lys Lys Val 210 215 220 Val Pro Val Gly Pro Leu Val Gln Asp Pro Val Leu Asp Asp Glu Asp 225 230 235 240 Cys Arg Ile Met Gln Trp Leu Asn Lys Lys Glu Lys Gly Ser Thr Val 245 250 255 Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Lys Asp Met Glu 260 265 270 Glu Ile Ala His Gly Leu Glu Val Ser Asn Val Asp Phe Ile Trp Val 275 280 285 Val Arg Phe Pro Lys Gly Glu Asn Ile Val Ile Glu Glu Thr Leu Pro 290 295 300 Lys Gly Phe Phe Glu Arg Val Gly Glu Arg Gly Leu Val Val Asn Gly 305 310 315 320 Trp Ala Pro Gln Ala Lys Ile Leu Thr His Pro Asn Val Gly Gly Phe 325 330 335 Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Lys Phe Gly 340 345 350 Leu Pro Ile Ile Ala Met Pro Met His Leu Asp Gln Pro Ile Asn Ala 355 360 365 Arg Leu Ile Glu Glu Val Gly Ala Gly Val Glu Val Leu Arg Asp Ser 370 375 380 Lys Gly Lys Leu His Arg Glu Arg Met Ala Glu Thr Ile Asn Lys Val 385 390 395 400 Met Lys Glu Ala Ser Gly Glu Ser Val Arg Lys Lys Ala Arg Glu Leu 405 410 415 Gln Glu Lys Leu Glu Leu Lys Gly Asp Glu Glu Ile Asp Asp Val Val 420 425 430 Lys Glu Leu Val Gln Leu Cys Ala Thr Lys Asn Lys Arg Asn Gly Leu 435 440 445 His Tyr Tyr 450 <210> 61 <211> 461 <212> PRT <213> Cucurbita moschata <400> 61 Met Glu Leu Ser Pro Thr His His Leu Leu Leu Phe Pro Phe Pro Ala 1 5 10 15 Lys Gly His Ile Lys Pro Phe Phe Ser Leu Ala Gln Leu Leu Cys Asn 20 25 30 Ala Gly Ala Arg Val Thr Phe Leu Asn Thr Asp His His His Arg Arg 35 40 45 Ile His Asp Leu Asp Arg Leu Ala Ala Gln Leu Pro Thr Leu His Phe 50 55 60 Asp Ser Val Ser Asp Gly Leu Pro Pro Asp Glu Ser Arg Asn Val Phe 65 70 75 80 Asp Gly Lys Leu Tyr Glu Ser Ile Arg Gln Val Thr Ser Ser Leu Phe 85 90 95 Arg Glu Leu Leu Val Ser Tyr Asn Asn Gly Thr Ser Ser Gly Arg Pro 100 105 110 Pro Ile Thr Cys Val Ile Thr Asp Cys Met Phe Arg Phe Pro Ile Asp 115 120 125 Ile Ala Glu Glu Leu Gly Ile Pro Val Phe Thr Phe Ser Thr Phe Ser 130 135 140 Ala Arg Phe Leu Phe Leu Phe Phe Trp Ile Pro Lys Leu Leu Glu Asp 145 150 155 160 Gly Gln Leu Arg Tyr Pro Glu Gln Glu Leu His Gly Val Pro Gly Ala 165 170 175 Glu Gly Leu Ile Arg Cys Lys Asp Leu Pro Gly Phe Leu Ser Asp Glu 180 185 190 Asp Val Ala His Trp Lys Pro Ile Asn Phe Val Asn Gln Ile Leu Ala 195 200 205 Thr Ser Arg Ser Ser Gly Leu Ile Leu Asn Thr Phe Asp Glu Leu Glu 210 215 220 Ala Pro Phe Leu Thr Ser Leu Ser Lys Ile Tyr Lys Lys Ile Tyr Ser 225 230 235 240 Leu Gly Pro Ile Asn Ser Leu Leu Lys Asn Phe Gln Ser Gln Pro Gln 245 250 255 Tyr Asn Leu Trp Lys Glu Asp His Ser Cys Met Ala Trp Leu Asp Ser 260 265 270 Gln Pro Pro Lys Ser Val Val Phe Val Ser Phe Gly Ser Val Val Lys 275 280 285 Leu Thr Asn Arg Gln Leu Val Glu Phe Trp Asn Gly Leu Val Asn Ser 290 295 300 Gly Lys Pro Phe Leu Leu Val Leu Arg Ser Asp Val Ile Glu Ala Gly 305 310 315 320 Glu Glu Val Val Arg Glu Asn Met Glu Arg Lys Ala Glu Gly Arg Trp 325 330 335 Met Ile Val Ser Trp Ala Pro Gln Glu Glu Val Leu Ala His Asp Ala 340 345 350 Val Gly Gly Phe Leu Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser 355 360 365 Leu Ala Ala Gly Val Pro Met Ile Ser Trp Thr Gln Ile Gly Asp Gln 370 375 380 Thr Ser Asn Ser Thr Trp Val Ser Lys Val Trp Arg Ile Gly Leu Gln 385 390 395 400 Leu Glu Asp Gly Phe Asp Ser Phe Thr Ile Glu Thr Met Val Arg Ser 405 410 415 Val Met Asp Gln Thr Met Glu Lys Thr Val Ala Glu Leu Ala Glu Arg 420 425 430 Ala Lys Asn Arg Ala Ser Lys Asn Gly Thr Ser Tyr Arg Asn Phe Gln 435 440 445 Thr Leu Ile Gln Asp Ile Thr Asn Ile Ile Glu Thr His 450 455 460 <210> 62 <211> 490 <212> PRT <213> Arabidopsis thaliana <400> 62 Met Gly Ser Ile Ser Glu Met Val Phe Glu Thr Cys Pro Ser Pro Asn 1 5 10 15 Pro Ile His Val Met Leu Val Ser Phe Gln Gly Gln Gly His Val Asn 20 25 30 Pro Leu Leu Arg Leu Gly Lys Leu Ile Ala Ser Lys Gly Leu Leu Val 35 40 45 Thr Phe Val Thr Thr Glu Leu Trp Gly Lys Lys Met Arg Gln Ala Asn 50 55 60 Lys Ile Val Asp Gly Glu Leu Lys Pro Val Gly Ser Gly Ser Ile Arg 65 70 75 80 Phe Glu Phe Phe Asp Glu Glu Trp Ala Glu Asp Asp Asp Arg Arg Ala 85 90 95 Asp Phe Ser Leu Tyr Ile Ala His Leu Glu Ser Val Gly Ile Arg Glu 100 105 110 Val Ser Lys Leu Val Arg Arg Tyr Glu Glu Ala Asn Glu Pro Val Ser 115 120 125 Cys Leu Ile Asn Asn Pro Phe Ile Pro Trp Val Cys His Val Ala Glu 130 135 140 Glu Phe Asn Ile Pro Cys Ala Val Leu Trp Val Gln Ser Cys Ala Cys 145 150 155 160 Phe Ser Ala Tyr Tyr His Tyr Gln Asp Gly Ser Val Ser Phe Pro Thr 165 170 175 Glu Thr Glu Pro Glu Leu Asp Val Lys Leu Pro Cys Val Pro Val Leu 180 185 190 Lys Asn Asp Glu Ile Pro Ser Phe Leu His Pro Ser Ser Arg Phe Thr 195 200 205 Gly Phe Arg Gln Ala Ile Leu Gly Gln Phe Lys Asn Leu Ser Lys Ser 210 215 220 Phe Cys Val Leu Ile Asp Ser Phe Asp Ser Leu Glu Arg Glu Val Ile 225 230 235 240 Asp Tyr Met Ser Ser Leu Cys Pro Val Lys Thr Val Gly Pro Leu Phe 245 250 255 Lys Val Ala Arg Thr Val Thr Ser Asp Val Ser Gly Asp Ile Cys Lys 260 265 270 Ser Thr Asp Lys Cys Leu Glu Trp Leu Asp Ser Arg Pro Lys Ser Ser 275 280 285 Val Val Tyr Ile Ser Phe Gly Thr Val Ala Tyr Leu Lys Gln Glu Gln 290 295 300 Ile Glu Glu Ile Ala His Gly Val Leu Lys Ser Gly Leu Ser Phe Leu 305 310 315 320 Trp Val Ile Arg Pro Pro Pro His Asp Leu Lys Val Glu Thr His Val 325 330 335 Leu Pro Gln Glu Leu Lys Glu Ser Ser Ala Lys Gly Lys Gly Met Ile 340 345 350 Val Asp Trp Cys Pro Gln Glu Gln Val Leu Ser His Pro Ser Val Ala 355 360 365 Cys Phe Val Thr His Cys Gly Trp Asn Ser Thr Met Glu Ser Leu Ser 370 375 380 Ser Gly Val Pro Val Val Cys Cys Pro Gln Trp Gly Asp Gln Val Thr 385 390 395 400 Asp Ala Val Tyr Leu Ile Asp Val Phe Lys Thr Gly Val Arg Leu Gly 405 410 415 Arg Gly Ala Thr Glu Glu Arg Val Val Pro Arg Glu Glu Val Ala Glu 420 425 430 Lys Leu Leu Glu Ala Thr Val Gly Glu Lys Ala Glu Glu Leu Arg Lys 435 440 445 Asn Ala Leu Lys Trp Lys Ala Glu Ala Glu Ala Ala Val Ala Pro Gly 450 455 460 Gly Ser Ser Asp Lys Asn Phe Arg Glu Phe Val Glu Lys Leu Gly Ala 465 470 475 480 Gly Val Thr Lys Thr Lys Asp Asn Gly Tyr 485 490 <210> 63 <211> 481 <212> PRT <213> Arabidopsis thaliana <400> 63 Met Gly Ser His Val Ala Gln Lys Gln His Val Val Cys Val Pro Tyr 1 5 10 15 Pro Ala Gln Gly His Ile Asn Pro Met Met Lys Val Ala Lys Leu Leu 20 25 30 Tyr Ala Lys Gly Phe His Ile Thr Phe Val Asn Thr Val Tyr Asn His 35 40 45 Asn Arg Leu Leu Arg Ser Arg Gly Pro Asn Ala Val Asp Gly Leu Pro 50 55 60 Ser Phe Arg Phe Glu Ser Ile Pro Asp Gly Leu Pro Glu Thr Asp Val 65 70 75 80 Asp Val Thr Gln Asp Ile Pro Thr Leu Cys Glu Ser Thr Met Lys His 85 90 95 Cys Leu Ala Pro Phe Lys Glu Leu Leu Arg Gln Ile Asn Ala Arg Asp 100 105 110 Asp Val Pro Pro Val Ser Cys Ile Val Ser Asp Gly Cys Met Ser Phe 115 120 125 Thr Leu Asp Ala Ala Glu Glu Leu Gly Val Pro Glu Val Leu Phe Trp 130 135 140 Thr Thr Ser Ala Cys Gly Phe Leu Ala Tyr Leu Tyr Tyr Tyr Arg Phe 145 150 155 160 Ile Glu Lys Gly Leu Ser Pro Ile Lys Asp Glu Ser Tyr Leu Thr Lys 165 170 175 Glu His Leu Asp Thr Lys Ile Asp Trp Ile Pro Ser Met Lys Asn Leu 180 185 190 Arg Leu Lys Asp Ile Pro Ser Phe Ile Arg Thr Thr Asn Pro Asp Asp 195 200 205 Ile Met Leu Asn Phe Ile Ile Arg Glu Ala Asp Arg Ala Lys Arg Ala 210 215 220 Ser Ala Ile Ile Leu Asn Thr Phe Asp Asp Leu Glu His Asp Val Ile 225 230 235 240 Gln Ser Met Lys Ser Ile Val Pro Pro Val Tyr Ser Ile Gly Pro Leu 245 250 255 His Leu Leu Glu Lys Gln Glu Ser Gly Glu Tyr Ser Glu Ile Gly Arg 260 265 270 Thr Gly Ser Asn Leu Trp Arg Glu Glu Thr Glu Cys Leu Asp Trp Leu 275 280 285 Asn Thr Lys Ala Arg Asn Ser Val Val Tyr Val Asn Phe Gly Ser Ile 290 295 300 Thr Val Leu Ser Ala Lys Gln Leu Val Glu Phe Ala Trp Gly Leu Ala 305 310 315 320 Ala Thr Gly Lys Glu Phe Leu Trp Val Ile Arg Pro Asp Leu Val Ala 325 330 335 Gly Asp Glu Ala Met Val Pro Pro Glu Phe Leu Thr Ala Thr Ala Asp 340 345 350 Arg Arg Met Leu Ala Ser Trp Cys Pro Gln Glu Lys Val Leu Ser His 355 360 365 Pro Ala Ile Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Leu 370 375 380 Glu Ser Leu Cys Gly Gly Val Pro Met Val Cys Trp Pro Phe Phe Ala 385 390 395 400 Glu Gln Gln Thr Asn Cys Lys Phe Ser Arg Asp Glu Trp Glu Val Gly 405 410 415 Ile Glu Ile Gly Gly Asp Val Lys Arg Glu Glu Val Glu Ala Val Val 420 425 430 Arg Glu Leu Met Asp Glu Glu Lys Gly Lys Asn Met Arg Glu Lys Ala 435 440 445 Glu Glu Trp Arg Arg Leu Ala Asn Glu Ala Thr Glu His Lys His Gly 450 455 460 Ser Ser Lys Leu Asn Phe Glu Met Leu Val Asn Lys Val Leu Leu Gly 465 470 475 480 Glu <210> 64 <211> 438 <212> PRT <213> Columba livia <400> 64 Met Ile His Cys Gly Lys Lys His Ile Cys Ala Phe Val Thr Cys Ile 1 5 10 15 Leu Ile Ser Ala Ser Ile Leu Met Tyr Ser Trp Lys Asp Pro Gln Leu 20 25 30 Gln Asn Asn Ile Thr Arg Lys Ile Phe Gln Ala Thr Ser Ala Leu Pro 35 40 45 Ala Ser Gln Leu Cys Arg Gly Lys Pro Ala Gln Asn Val Ile Thr Ala 50 55 60 Leu Glu Asp Asn Arg Thr Phe Ile Ile Ser Pro Tyr Phe Asp Asp Arg 65 70 75 80 Glu Ser Lys Val Thr Arg Val Ile Gly Ile Val His His Glu Asp Val 85 90 95 Lys Gln Leu Tyr Cys Trp Phe Cys Cys Gln Pro Asp Gly Lys Ile Tyr 100 105 110 Val Ala Arg Ala Lys Ile Asp Val His Ser Asp Arg Phe Gly Phe Pro 115 120 125 Tyr Gly Ala Ala Asp Ile Val Cys Leu Glu Pro Glu Asn Cys Asn Pro 130 135 140 Thr His Val Ser Ile His Gln Ser Pro His Ala Asn Ile Asp Gln Leu 145 150 155 160 Pro Ser Phe Lys Ile Lys Asn Arg Lys Ser Glu Thr Phe Ser Val Asp 165 170 175 Phe Thr Val Cys Ile Ser Ala Met Phe Gly Asn Tyr Asn Asn Val Leu 180 185 190 Gln Phe Ile Gln Ser Val Glu Met Tyr Lys Ile Leu Gly Val Gln Lys 195 200 205 Val Val Ile Tyr Lys Asn Asn Cys Ser Gln Leu Met Glu Lys Val Leu 210 215 220 Lys Phe Tyr Met Glu Glu Gly Thr Val Glu Ile Ile Pro Trp Pro Ile 225 230 235 240 Asn Ser His Leu Lys Val Ser Thr Lys Trp His Phe Ser Met Asp Ala 245 250 255 Lys Asp Ile Gly Tyr Tyr Gly Gln Ile Thr Ala Leu Asn Asp Cys Ile 260 265 270 Tyr Arg Asn Met Gln Arg Ser Lys Phe Val Val Leu Asn Asp Ala Asp 275 280 285 Glu Ile Ile Leu Pro Leu Lys His Leu Asp Trp Lys Ala Met Met Ser 290 295 300 Ser Leu Gln Glu Gln Asn Pro Gly Ala Gly Ile Phe Leu Phe Glu Asn 305 310 315 320 His Ile Phe Pro Lys Thr Val Ser Thr Pro Val Phe Asn Ile Ser Ser 325 330 335 Trp Asn Arg Val Pro Gly Val Asn Ile Leu Gln His Val His Arg Glu 340 345 350 Pro Asp Arg Lys Glu Val Phe Asn Pro Lys Lys Met Ile Ile Asp Pro 355 360 365 Arg Gln Val Val Gln Thr Ser Val His Ser Val Leu Arg Ala Tyr Gly 370 375 380 Asn Ser Val Asn Val Pro Ala Asp Val Ala Leu Val Tyr His Cys Arg 385 390 395 400 Val Pro Leu Gln Glu Glu Leu Pro Arg Glu Ser Leu Ile Arg Asp Thr 405 410 415 Ala Leu Trp Arg Tyr Asn Ser Ser Leu Ile Thr Asn Val Asn Lys Val 420 425 430 Leu His Gln Thr Val Leu 435 <210> 65 <211> 252 <212> PRT <213> Haemophilus ducreyi <400> 65 Met Pro Thr Leu Thr Val Ala Met Ile Val Lys Asn Glu Ala Gln Asp 1 5 10 15 Leu Ala Glu Cys Leu Lys Thr Val Asp Gly Trp Val Asp Glu Ile Val 20 25 30 Ile Val Asp Ser Gly Ser Thr Asp Asp Thr Leu Lys Ile Ala Thr Gln 35 40 45 Phe Asn Ala Lys Val Tyr Val Asn Ser Asp Trp Gln Gly Phe Gly Pro 50 55 60 Gln Arg Gln Phe Ala Gln Gln Tyr Val Thr Ser Asp Tyr Val Leu Trp 65 70 75 80 Leu Asp Ala Asp Glu Arg Val Thr Pro Glu Leu Lys Ala Ser Ile Leu 85 90 95 Gln Ala Val Gln His Asn Gln Lys Asn Thr Val Tyr Lys Val Ser Arg 100 105 110 Leu Ser Glu Ile Phe Gly Lys Glu Ile Arg Tyr Ser Gly Trp Tyr Pro 115 120 125 Asp Tyr Val Val Arg Leu Tyr Pro Thr Tyr Leu Ala Lys Tyr Gly Asp 130 135 140 Glu Leu Val His Glu Lys Val His Tyr Pro Ala Asp Ser Arg Val Glu 145 150 155 160 Lys Leu Gln Gly Asp Leu Leu His Phe Thr Tyr Lys Asn Ile His His 165 170 175 Tyr Leu Val Lys Ser Ala Ser Tyr Ala Lys Ala Trp Ala Met Gln Arg 180 185 190 Ala Lys Ala Gly Lys Lys Ala Ser Leu Leu Asp Gly Val Thr His Ala 195 200 205 Ile Ala Cys Phe Leu Lys Met Tyr Leu Phe Lys Ala Gly Phe Leu Asp 210 215 220 Gly Lys Gln Gly Phe Leu Leu Ala Val Leu Ser Ala His Ser Thr Phe 225 230 235 240 Val Lys Tyr Ala Asp Leu Trp Asp Arg Thr Arg Ser 245 250 <210> 66 <211> 252 <212> PRT <213> Neisseria gonorrhoeae <400> 66 Met Lys Lys Val Ser Val Leu Ile Val Ala Lys Asn Glu Ala Asn His 1 5 10 15 Ile Arg Glu Cys Ile Glu Ser Cys Arg Phe Asp Lys Glu Val Ile Val 20 25 30 Ile Asp Asp His Ser Ala Asp Asn Thr Ala Glu Ile Ala Glu Gly Leu 35 40 45 Gly Ala Lys Val Phe Arg Arg His Leu Asn Gly Asp Phe Gly Ala Gln 50 55 60 Lys Thr Phe Ala Ile Glu Gln Ala Gly Gly Glu Trp Val Phe Leu Ile 65 70 75 80 Asp Ala Asp Glu Arg Cys Thr Pro Glu Leu Ser Asp Glu Ile Ser Lys 85 90 95 Ile Val Arg Thr Gly Asp Tyr Ala Ala Tyr Phe Val Glu Arg Arg Asn 100 105 110 Leu Phe Pro Asn His Pro Ala Thr His Gly Ala Met Arg Pro Asp Ser 115 120 125 Val Cys Arg Leu Met Pro Lys Lys Gly Gly Ser Val Gln Gly Lys Val 130 135 140 His Glu Thr Val Gln Thr Pro Tyr Pro Glu Arg Arg Leu Lys His Phe 145 150 155 160 Met Tyr His Tyr Thr Tyr Asp Asn Trp Glu Gln Tyr Phe Asn Lys Phe 165 170 175 Asn Lys Tyr Thr Ser Ile Ser Ala Glu Lys Tyr Arg Glu Gln Gly Lys 180 185 190 Pro Val Ser Phe Val Arg Asp Ile Ile Leu Arg Pro Ile Trp Gly Phe 195 200 205 Phe Lys Ile Tyr Ile Leu Asn Lys Gly Phe Leu Asp Gly Lys Met Gly 210 215 220 Trp Ile Met Ser Val Asn His Ser Tyr Tyr Thr Met Ile Lys Tyr Val 225 230 235 240 Lys Leu Tyr Tyr Leu Tyr Lys Ser Gly Gly Lys Phe 245 250 <210> 67 <211> 309 <212> PRT <213> Rhizobium meliloti <400> 67 Met Pro Asn Glu Thr Leu His Ile Asp Ile Gly Val Cys Thr Tyr Arg 1 5 10 15 Arg Pro Glu Leu Ala Glu Thr Leu Arg Ser Leu Ala Ala Met Asn Val 20 25 30 Pro Glu Arg Ala Arg Leu Arg Val Ile Val Ala Asp Asn Asp Ala Glu 35 40 45 Pro Ser Ala Arg Ala Leu Val Glu Gly Leu Arg Pro Glu Met Pro Phe 50 55 60 Asp Ile Leu Tyr Val His Cys Pro His Ser Asn Ile Ser Ile Ala Arg 65 70 75 80 Asn Cys Cys Leu Asp Asn Ser Thr Gly Asp Phe Leu Ala Phe Leu Asp 85 90 95 Asp Asp Glu Thr Val Ser Gly Asp Trp Leu Thr Arg Leu Leu Glu Thr 100 105 110 Ala Arg Thr Thr Gly Ala Ala Ala Val Leu Gly Pro Val Arg Ala His 115 120 125 Tyr Gly Pro Thr Ala Pro Arg Trp Met Arg Ser Gly Asp Phe His Ser 130 135 140 Thr Leu Pro Val Trp Ala Lys Gly Glu Ile Arg Thr Gly Tyr Thr Cys 145 150 155 160 Asn Ala Leu Leu Arg Arg Asp Ala Ala Ser Leu Leu Gly Arg Arg Phe 165 170 175 Lys Leu Ser Leu Gly Lys Ser Gly Gly Glu Asp Thr Asp Phe Phe Thr 180 185 190 Gly Met His Cys Ala Gly Gly Thr Ile Ala Phe Ser Pro Glu Ala Trp 195 200 205 Val His Glu Pro Val Pro Glu Asn Arg Ala Ser Leu Ala Trp Leu Ala 210 215 220 Lys Arg Arg Phe Arg Ser Gly Gln Thr His Gly Arg Leu Leu Ala Glu 225 230 235 240 Lys Ala His Gly Leu Arg Gln Ala Trp Asn Ile Ala Leu Ala Gly Ala 245 250 255 Lys Ser Gly Phe Cys Ala Thr Ala Ala Val Leu Cys Phe Pro Ser Ala 260 265 270 Ala Arg Arg Asn Arg Phe Ala Leu Arg Ala Val Leu His Ala Gly Val 275 280 285 Ile Ser Gly Leu Leu Gly Leu Lys Glu Ile Glu Gln Tyr Gly Ala Arg 290 295 300 Glu Val Thr Ser Ala 305 <210> 68 <211> 861 <212> PRT <213> Rhizobium radiobacter <400> 68 Met Cys Arg Cys Gly Arg Ala Val Arg Ser Arg Pro Val Cys Arg Pro 1 5 10 15 Gly Gln Leu Val Val Arg Arg Ser Pro Arg Pro Arg Ser Arg Asn His 20 25 30 Ser Arg Cys Arg Pro Leu Arg Leu Ser Val Phe Pro Arg Pro His Arg 35 40 45 Arg Val Arg His His Cys Gln Arg Asp Leu Arg Trp Glu Pro Gly Arg 50 55 60 Trp Ile Ala Val Arg Trp Lys Ala Ala Arg Ser His Arg Arg Phe Arg 65 70 75 80 Arg Cys Pro Phe Pro Arg Gln Leu Val Trp Pro Val Arg Glu Arg His 85 90 95 Arg Asp Ala Gly Asp Arg Arg Asn Gln Arg Glu Arg Arg Arg Arg Asp 100 105 110 Ala Tyr His Glu Ile Ser Glu Pro Lys Phe Arg Thr Arg Lys Arg Thr 115 120 125 Glu Ser Phe Trp Met Asn Lys Ala Ile Thr Val Ile Val Trp Leu Leu 130 135 140 Val Ser Leu Cys Val Leu Ala Ile Ile Thr Met Pro Val Ser Leu Gln 145 150 155 160 Thr His Leu Val Ala Thr Ala Ile Ser Leu Ile Leu Leu Ala Thr Ile 165 170 175 Lys Ser Phe Asn Gly Gln Gly Ala Trp Arg Leu Val Ala Leu Gly Phe 180 185 190 Gly Thr Ala Ile Val Leu Arg Tyr Val Tyr Trp Arg Thr Thr Ser Thr 195 200 205 Leu Pro Pro Val Asn Gln Leu Glu Asn Phe Ile Pro Gly Phe Leu Leu 210 215 220 Tyr Leu Ala Glu Met Tyr Ser Val Val Met Leu Gly Leu Ser Leu Val 225 230 235 240 Ile Val Ser Met Pro Leu Pro Ser Arg Lys Thr Arg Pro Gly Ser Pro 245 250 255 Asp Tyr Arg Pro Thr Val Asp Val Phe Val Pro Ser Tyr Asn Glu Asp 260 265 270 Ala Glu Leu Leu Ala Asn Thr Leu Ala Ala Ala Lys Asn Met Asp Tyr 275 280 285 Pro Ala Asp Arg Phe Thr Val Trp Leu Leu Asp Asp Gly Gly Ser Val 290 295 300 Gln Lys Arg Asn Ala Ala Asn Ile Val Glu Ala Gln Ala Ala Gln Arg 305 310 315 320 Arg His Glu Glu Leu Lys Lys Leu Cys Glu Asp Leu Asp Val Arg Tyr 325 330 335 Leu Thr Arg Glu Arg Asn Val His Ala Lys Ala Gly Asn Leu Asn Asn 340 345 350 Gly Leu Ala His Ser Thr Gly Glu Leu Val Thr Val Phe Asp Ala Asp 355 360 365 His Ala Pro Ala Arg Asp Phe Leu Leu Glu Thr Val Gly Tyr Phe Asp 370 375 380 Glu Asp Pro Arg Leu Phe Leu Val Gln Thr Pro His Phe Phe Val Asn 385 390 395 400 Pro Asp Pro Ile Glu Arg Asn Leu Arg Thr Phe Glu Thr Met Pro Ser 405 410 415 Glu Asn Glu Met Phe Tyr Gly Ile Ile Gln Arg Gly Leu Asp Lys Trp 420 425 430 Asn Gly Ala Phe Phe Cys Gly Ser Ala Ala Val Leu Arg Arg Glu Ala 435 440 445 Leu Gln Asp Ser Asp Gly Phe Ser Gly Val Ser Ile Thr Glu Asp Cys 450 455 460 Glu Thr Ala Leu Ala Leu His Ser Arg Gly Trp Asn Ser Val Tyr Val 465 470 475 480 Asp Lys Pro Leu Ile Ala Gly Leu Gln Pro Ala Thr Phe Ala Ser Phe 485 490 495 Ile Gly Gln Arg Ser Arg Trp Ala Gln Gly Met Met Gln Ile Leu Ile 500 505 510 Phe Arg Gln Pro Leu Phe Lys Arg Gly Leu Ser Phe Thr Gln Arg Leu 515 520 525 Cys Tyr Met Ser Ser Thr Leu Phe Trp Leu Phe Pro Phe Pro Arg Thr 530 535 540 Ile Phe Leu Phe Ala Pro Leu Phe Tyr Leu Phe Phe Asp Leu Gln Ile 545 550 555 560 Phe Val Ala Ser Gly Gly Glu Phe Leu Ala Tyr Thr Ala Ala Tyr Met 565 570 575 Leu Val Asn Leu Met Met Gln Asn Tyr Leu Tyr Gly Ser Phe Arg Trp 580 585 590 Pro Trp Ile Ser Glu Leu Tyr Glu Tyr Val Gln Thr Val His Leu Leu 595 600 605 Pro Ala Val Val Ser Val Ile Phe Asn Pro Gly Lys Pro Thr Phe Lys 610 615 620 Val Thr Ala Lys Asp Glu Ser Ile Ala Glu Ala Arg Leu Ser Glu Ile 625 630 635 640 Ser Arg Pro Phe Phe Val Ile Phe Ala Leu Leu Leu Val Ala Met Ala 645 650 655 Phe Ala Val Trp Arg Ile Tyr Ser Glu Pro Tyr Lys Ala Asp Val Thr 660 665 670 Leu Val Val Gly Gly Trp Asn Leu Leu Asn Leu Ile Phe Ala Gly Cys 675 680 685 Ala Leu Gly Val Val Ser Glu Arg Gly Asp Lys Ser Ala Ser Arg Arg 690 695 700 Ile Thr Val Lys Arg Arg Cys Glu Val Gln Leu Gly Gly Ser Asp Thr 705 710 715 720 Trp Val Pro Ala Ser Ile Asp Asn Val Ser Val His Gly Leu Leu Ile 725 730 735 Asn Ile Phe Asp Ser Ala Thr Asn Ile Glu Lys Gly Ala Thr Ala Ile 740 745 750 Val Lys Val Lys Pro His Ser Glu Gly Val Pro Glu Thr Met Pro Leu 755 760 765 Asn Val Val Arg Thr Val Arg Gly Glu Gly Phe Val Ser Ile Gly Cys 770 775 780 Thr Phe Ser Pro Gln Arg Ala Val Asp His Arg Leu Ile Ala Asp Leu 785 790 795 800 Ile Phe Ala Asn Ser Glu Gln Trp Ser Glu Phe Gln Arg Val Arg Arg 805 810 815 Lys Lys Pro Gly Leu Ile Arg Gly Thr Ala Ile Phe Leu Ala Ile Ala 820 825 830 Leu Phe Gln Thr Gln Arg Gly Leu Tyr Tyr Leu Val Arg Ala Arg Arg 835 840 845 Pro Ala Pro Lys Ser Ala Lys Pro Val Gly Ala Val Lys 850 855 860 <210> 69 <211> 315 <212> PRT <213> Streptococcus agalactiae <400> 69 Met Ile Lys Lys Ile Glu Lys Asp Leu Ile Ser Val Ile Val Pro Ile 1 5 10 15 Tyr Asn Val Glu Asp Tyr Leu Val Glu Cys Ile Glu Ser Leu Ile Val 20 25 30 Gln Thr Tyr Arg Asn Ile Glu Ile Leu Leu Ile Asn Asp Gly Ser Thr 35 40 45 Asp Asn Cys Ala Thr Ile Ala Lys Glu Phe Ser Glu Arg Asp Cys Arg 50 55 60 Val Ile Tyr Ile Glu Lys Ser Asn Gly Gly Leu Ser Glu Ala Arg Asn 65 70 75 80 Tyr Gly Ile Tyr His Ser Lys Gly Lys Tyr Leu Thr Phe Val Asp Ser 85 90 95 Asp Asp Lys Val Ser Ser Asp Tyr Ile Ala Asn Leu Tyr Asn Ala Ile 100 105 110 Gln Lys His Asp Ser Ser Ile Ala Ile Gly Gly Tyr Leu Glu Phe Tyr 115 120 125 Glu Arg His Asn Ser Ile Arg Asn Tyr Glu Tyr Leu Asp Lys Val Ile 130 135 140 Pro Val Glu Glu Ala Leu Leu Asn Met Tyr Asp Ile Lys Thr Tyr Gly 145 150 155 160 Ser Ile Phe Ile Thr Ala Trp Gly Lys Leu Phe His Lys Ser Ile Phe 165 170 175 Asn Asp Leu Glu Phe Ala Leu Asn Lys Tyr His Glu Asp Glu Phe Phe 180 185 190 Asn Tyr Lys Ala Tyr Leu Lys Ala Asn Ser Ile Thr Tyr Ile Asp Lys 195 200 205 Pro Leu Tyr His Tyr Arg Ile Arg Val Gly Ser Ile Met Asn Asn Ser 210 215 220 Asp Asn Val Ile Ile Ala Arg Lys Lys Leu Asp Val Leu Ser Ala Leu 225 230 235 240 Asp Glu Arg Ile Lys Leu Ile Thr Ser Leu Arg Lys Tyr Ser Val Phe 245 250 255 Leu Gln Lys Thr Glu Ile Phe Tyr Val Asn Gln Tyr Phe Arg Thr Lys 260 265 270 Lys Phe Leu Lys Gln Gln Ser Val Met Phe Lys Glu Asp Asn Tyr Ile 275 280 285 Asp Ala Tyr Arg Met Tyr Gly Arg Leu Leu Arg Lys Val Lys Leu Val 290 295 300 Asp Lys Leu Lys Leu Ile Lys Asn Arg Phe Phe 305 310 315 <210> 70 <211> 416 <212> PRT <213> Streptococcus pneumoniae <400> 70 Met Tyr Thr Phe Ile Leu Met Leu Leu Asp Phe Phe Gln Asn His Asp 1 5 10 15 Phe His Phe Phe Met Leu Phe Phe Val Phe Ile Leu Ile Arg Trp Ala 20 25 30 Val Ile Tyr Phe His Ala Val Arg Tyr Lys Ser Tyr Ser Cys Ser Val 35 40 45 Ser Asp Glu Lys Leu Phe Ser Ser Val Ile Ile Pro Val Val Asp Glu 50 55 60 Pro Leu Asn Leu Phe Glu Ser Val Leu Asn Arg Ile Ser Arg His Lys 65 70 75 80 Pro Ser Glu Ile Ile Val Val Ile Asn Gly Pro Lys Asn Glu Arg Leu 85 90 95 Val Lys Leu Cys His Asp Phe Asn Glu Lys Leu Glu Asn Asn Met Thr 100 105 110 Pro Ile Gln Cys Tyr Tyr Thr Pro Val Pro Gly Lys Arg Asn Ala Ile 115 120 125 Arg Val Gly Leu Glu His Val Asp Ser Gln Ser Asp Ile Thr Val Leu 130 135 140 Val Asp Ser Asp Thr Val Trp Thr Pro Arg Thr Leu Ser Glu Leu Leu 145 150 155 160 Lys Pro Phe Val Cys Asp Lys Lys Ile Gly Gly Val Thr Thr Arg Gln 165 170 175 Lys Ile Leu Asp Pro Glu Arg Asn Leu Val Thr Met Phe Ala Asn Leu 180 185 190 Leu Glu Glu Ile Arg Ala Glu Gly Thr Met Lys Ala Met Ser Val Thr 195 200 205 Gly Lys Val Gly Cys Leu Pro Gly Arg Thr Ile Ala Phe Arg Asn Ile 210 215 220 Val Glu Arg Val Tyr Thr Lys Phe Ile Glu Glu Thr Phe Met Gly Phe 225 230 235 240 His Lys Glu Val Ser Asp Asp Arg Ser Leu Thr Asn Leu Thr Leu Lys 245 250 255 Lys Gly Tyr Lys Thr Val Met Gln Asp Thr Ser Val Val Tyr Thr Asp 260 265 270 Ala Pro Thr Ser Trp Lys Lys Phe Ile Arg Gln Gln Leu Arg Trp Ala 275 280 285 Glu Gly Ser Gln Tyr Asn Asn Leu Lys Met Thr Pro Trp Met Ile Arg 290 295 300 Asn Ala Pro Leu Met Phe Phe Ile Tyr Phe Thr Asp Met Ile Leu Pro 305 310 315 320 Met Leu Leu Ile Ser Phe Gly Val Asn Ile Phe Leu Leu Lys Ile Leu 325 330 335 Asn Ile Thr Thr Ile Val Tyr Thr Ala Ser Trp Trp Glu Ile Ile Leu 340 345 350 Tyr Val Leu Leu Gly Met Ile Phe Ser Phe Gly Gly Arg Asn Phe Lys 355 360 365 Ala Met Ser Arg Met Lys Trp Tyr Tyr Val Phe Leu Ile Pro Val Phe 370 375 380 Ile Ile Val Leu Ser Ile Ile Met Cys Pro Ile Arg Leu Leu Gly Leu 385 390 395 400 Met Arg Cys Ser Asp Asp Leu Gly Trp Gly Thr Arg Asn Leu Thr Glu 405 410 415 <210> 71 <211> 496 <212> PRT <213> Arabidopsis thaliana <400> 71 Met Ala Thr Glu Lys Thr His Gln Phe His Pro Ser Leu His Phe Val 1 5 10 15 Leu Phe Pro Phe Met Ala Gln Gly His Met Ile Pro Met Ile Asp Ile 20 25 30 Ala Arg Leu Leu Ala Gln Arg Gly Val Thr Ile Thr Ile Val Thr Thr 35 40 45 Pro His Asn Ala Ala Arg Phe Lys Asn Val Leu Asn Arg Ala Ile Glu 50 55 60 Ser Gly Leu Ala Ile Asn Ile Leu His Val Lys Phe Pro Tyr Gln Glu 65 70 75 80 Phe Gly Leu Pro Glu Gly Lys Glu Asn Ile Asp Ser Leu Asp Ser Thr 85 90 95 Glu Leu Met Val Pro Phe Phe Lys Ala Val Asn Leu Leu Glu Asp Pro 100 105 110 Val Met Lys Leu Met Glu Glu Met Lys Pro Arg Pro Ser Cys Leu Ile 115 120 125 Ser Asp Trp Cys Leu Pro Tyr Thr Ser Ile Ile Ala Lys Asn Phe Asn 130 135 140 Ile Pro Lys Ile Val Phe His Gly Met Gly Cys Phe Asn Leu Leu Cys 145 150 155 160 Met His Val Leu Arg Arg Asn Leu Glu Ile Leu Glu Asn Val Lys Ser 165 170 175 Asp Glu Glu Tyr Phe Leu Val Pro Ser Phe Pro Asp Arg Val Glu Phe 180 185 190 Thr Lys Leu Gln Leu Pro Val Lys Ala Asn Ala Ser Gly Asp Trp Lys 195 200 205 Glu Ile Met Asp Glu Met Val Lys Ala Glu Tyr Thr Ser Tyr Gly Val 210 215 220 Ile Val Asn Thr Phe Gln Glu Leu Glu Pro Pro Tyr Val Lys Asp Tyr 225 230 235 240 Lys Glu Ala Met Asp Gly Lys Val Trp Ser Ile Gly Pro Val Ser Leu 245 250 255 Cys Asn Lys Ala Gly Ala Asp Lys Ala Glu Arg Gly Ser Lys Ala Ala 260 265 270 Ile Asp Gln Asp Glu Cys Leu Gln Trp Leu Asp Ser Lys Glu Glu Gly 275 280 285 Ser Val Leu Tyr Val Cys Leu Gly Ser Ile Cys Asn Leu Pro Leu Ser 290 295 300 Gln Leu Lys Glu Leu Gly Leu Gly Leu Glu Glu Ser Arg Arg Ser Phe 305 310 315 320 Ile Trp Val Ile Arg Gly Ser Glu Lys Tyr Lys Glu Leu Phe Glu Trp 325 330 335 Met Leu Glu Ser Gly Phe Glu Glu Arg Ile Lys Glu Arg Gly Leu Leu 340 345 350 Ile Lys Gly Trp Ala Pro Gln Val Leu Ile Leu Ser His Pro Ser Val 355 360 365 Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Leu Glu Gly Ile 370 375 380 Thr Ser Gly Ile Pro Leu Ile Thr Trp Pro Leu Phe Gly Asp Gln Phe 385 390 395 400 Cys Asn Gln Lys Leu Val Val Gln Val Leu Lys Ala Gly Val Ser Ala 405 410 415 Gly Val Glu Glu Val Met Lys Trp Gly Glu Glu Asp Lys Ile Gly Val 420 425 430 Leu Val Asp Lys Glu Gly Val Lys Lys Ala Val Glu Glu Leu Met Gly 435 440 445 Asp Ser Asp Asp Ala Lys Glu Arg Arg Arg Arg Val Lys Glu Leu Gly 450 455 460 Glu Leu Ala His Lys Ala Val Glu Lys Gly Gly Ser Ser His Ser Asn 465 470 475 480 Ile Thr Leu Leu Leu Gln Asp Ile Met Gln Leu Ala Gln Phe Lys Asn 485 490 495 <210> 72 <211> 466 <212> PRT <213> Hordeum vulgare <400> 72 Met Ala Gln Ala Glu Ser Glu Arg Met Arg Val Val Met Phe Pro Trp 1 5 10 15 Leu Ala His Gly His Ile Asn Pro Tyr Leu Glu Leu Ala Lys Arg Leu 20 25 30 Ile Ala Ser Ala Ser Gly Asp His His Leu Asp Val Val Val His Leu 35 40 45 Val Ser Thr Pro Ala Asn Leu Ala Pro Leu Ala His His Gln Thr Asp 50 55 60 Arg Leu Arg Leu Val Glu Leu His Leu Pro Ser Leu Pro Asp Leu Pro 65 70 75 80 Pro Ala Leu His Thr Thr Lys Gly Leu Pro Ala Arg Leu Met Pro Val 85 90 95 Leu Lys Arg Ala Cys Asp Leu Ala Ala Pro Arg Phe Gly Ala Leu Leu 100 105 110 Asp Glu Leu Cys Pro Asp Ile Leu Val Tyr Asp Phe Ile Gln Pro Trp 115 120 125 Ala Pro Leu Glu Ala Glu Ala Arg Gly Val Pro Ala Phe His Phe Ala 130 135 140 Thr Cys Gly Ala Ala Ala Thr Ala Phe Phe Ile His Cys Leu Lys Thr 145 150 155 160 Asp Arg Pro Pro Ser Ala Phe Pro Phe Glu Ser Ile Ser Leu Gly Gly 165 170 175 Val Asp Glu Asp Ala Lys Tyr Thr Ala Leu Val Thr Val Arg Glu Asp 180 185 190 Ser Thr Ala Leu Val Ala Glu Arg Asp Arg Leu Pro Leu Ser Leu Glu 195 200 205 Arg Ser Ser Gly Phe Val Ala Val Lys Ser Ser Ala Asp Ile Glu Arg 210 215 220 Lys Tyr Met Glu Tyr Leu Ser Gln Leu Leu Gly Lys Glu Ile Ile Pro 225 230 235 240 Thr Gly Pro Leu Leu Val Asp Ser Gly Gly Ser Glu Glu Gln Arg Asp 245 250 255 Gly Gly Arg Ile Met Arg Trp Leu Asp Gly Glu Glu Pro Gly Ser Val 260 265 270 Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Met Ser Glu His Gln Met 275 280 285 Ala Gln Met Ala Arg Gly Leu Glu Leu Ser Gly Val Pro Phe Leu Trp 290 295 300 Val Val Arg Phe Pro Asn Ala Glu Asp Asp Ala Arg Gly Ala Ala Arg 305 310 315 320 Ser Met Pro Pro Gly Phe Glu Pro Glu Leu Gly Leu Val Val Glu Gly 325 330 335 Trp Ala Pro Gln Arg Arg Ile Leu Ser His Pro Ser Cys Gly Ala Phe 340 345 350 Leu Thr His Cys Gly Trp Ser Ser Val Leu Glu Ser Met Ala Ala Gly 355 360 365 Val Pro Met Val Ala Leu Pro Leu His Ile Asp Gln Pro Leu Asn Ala 370 375 380 Asn Leu Ala Val Glu Leu Gly Ala Ala Ala Ala Arg Val Lys Gln Glu 385 390 395 400 Arg Phe Gly Glu Phe Thr Ala Glu Glu Val Ala Arg Ala Val Arg Ala 405 410 415 Ala Val Lys Gly Lys Glu Gly Glu Ala Ala Arg Arg Arg Ala Arg Glu 420 425 430 Leu Gln Glu Val Val Ala Arg Asn Asn Gly Asn Asp Gly Gln Ile Ala 435 440 445 Thr Leu Leu Gln Arg Met Ala Arg Leu Cys Gly Lys Asp Gln Ala Val 450 455 460 Pro Asn 465 <210> 73 <211> 476 <212> PRT <213> Hordeum vulgare <400> 73 Met Ala Glu Ala Asn Asp Gly Gly Lys Met His Val Val Met Leu Pro 1 5 10 15 Trp Leu Ala Phe Gly His Val Leu Pro Phe Thr Glu Phe Ala Lys Arg 20 25 30 Val Ala Arg Gln Gly His Arg Val Thr Leu Leu Ser Ala Pro Arg Asn 35 40 45 Thr Arg Arg Leu Ile Asp Ile Pro Pro Gly Leu Ala Gly Leu Ile Arg 50 55 60 Val Val His Val Pro Leu Pro Arg Val Asp Gly Leu Pro Glu His Ala 65 70 75 80 Glu Ala Thr Ile Asp Leu Pro Ser Asp His Leu Arg Pro Cys Leu Arg 85 90 95 Arg Ala Phe Asp Ala Ala Phe Glu Arg Glu Leu Ser Arg Leu Leu Gln 100 105 110 Glu Glu Ala Lys Pro Asp Trp Val Leu Val Asp Tyr Ala Ser Tyr Trp 115 120 125 Ala Pro Thr Ala Ala Ala Arg His Gly Val Pro Cys Ala Phe Leu Ser 130 135 140 Leu Phe Gly Ala Ala Ala Leu Ser Phe Phe Gly Thr Pro Glu Thr Leu 145 150 155 160 Leu Gly Ile Gly Arg His Ala Lys Thr Glu Pro Ala His Leu Thr Val 165 170 175 Val Pro Glu Tyr Val Pro Phe Pro Thr Thr Val Ala Tyr Arg Gly Tyr 180 185 190 Glu Ala Arg Glu Leu Phe Glu Pro Gly Met Val Pro Asp Asp Ser Gly 195 200 205 Val Ser Glu Gly Tyr Arg Phe Ala Lys Thr Ile Glu Gly Cys Gln Leu 210 215 220 Val Gly Ile Arg Ser Ser Ser Glu Phe Glu Pro Glu Trp Leu Arg Leu 225 230 235 240 Leu Gly Glu Leu Tyr Arg Lys Pro Val Ile Pro Val Gly Leu Phe Pro 245 250 255 Pro Ala Pro Gln Asp Asp Val Ala Gly His Glu Ala Thr Leu Arg Trp 260 265 270 Leu Asp Gly Gln Ala Pro Ser Ser Val Val Tyr Ala Ala Phe Gly Ser 275 280 285 Glu Val Lys Leu Thr Gly Ala Gln Leu Gln Arg Ile Ala Leu Gly Leu 290 295 300 Glu Ala Ser Gly Leu Pro Phe Ile Trp Ala Phe Arg Ala Pro Thr Ser 305 310 315 320 Thr Glu Thr Gly Ala Ala Ser Gly Gly Leu Pro Glu Gly Phe Glu Glu 325 330 335 Arg Leu Ala Gly Arg Gly Val Val Cys Arg Gly Trp Val Pro Gln Val 340 345 350 Lys Phe Leu Ala His Ala Ser Val Gly Gly Phe Leu Thr His Ala Gly 355 360 365 Trp Asn Ser Ile Ala Glu Gly Leu Ala His Gly Val Arg Leu Val Leu 370 375 380 Leu Pro Leu Val Phe Glu Gln Gly Leu Asn Ala Arg Asn Ile Val Asp 385 390 395 400 Lys Asn Ile Gly Val Glu Val Ala Arg Asp Glu Gln Asp Gly Ser Phe 405 410 415 Ala Ala Gly Asp Ile Ala Ala Ala Leu Arg Arg Val Met Val Glu Asp 420 425 430 Glu Gly Glu Gly Phe Gly Ala Lys Val Lys Glu Leu Ala Lys Val Phe 435 440 445 Gly Asp Asp Glu Val Asn Asp Gln Cys Val Arg Glu Phe Leu Met His 450 455 460 Leu Ser Asp His Ser Lys Lys Asn Gln Gly Gln Asp 465 470 475 <210> 74 <211> 453 <212> PRT <213> Coffea canephora <400> 74 Met Ala Glu Asn His Ala Thr Phe Asn Val Leu Met Leu Pro Trp Leu 1 5 10 15 Ala His Gly His Val Ser Pro Tyr Leu Glu Leu Ala Met Lys Leu Thr 20 25 30 Ala Arg Asn Phe Asn Val Tyr Leu Cys Ser Ser Pro Ala Thr Leu Ser 35 40 45 Ser Val Arg Ser Lys Leu Thr Glu Lys Phe Ser Gln Ser Ile His Leu 50 55 60 Val Glu Leu His Leu Pro Lys Leu Pro Glu Leu Pro Ala Glu Tyr His 65 70 75 80 Thr Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Asp Ala 85 90 95 Phe Asp Met Ala Lys Pro Asn Phe Cys Asn Val Leu Lys Ser Leu Lys 100 105 110 Pro Asp Leu Leu Ile Tyr Asp Leu Leu Gln Pro Trp Ala Pro Glu Ala 115 120 125 Ala Ser Ala Phe Asn Ile Pro Ala Val Val Phe Ile Ser Ser Ser Ala 130 135 140 Thr Met Thr Ser Phe Gly Leu His Phe Phe Lys Asn Pro Gly Thr Lys 145 150 155 160 Tyr Pro Tyr Gly Asn Thr Ile Phe Tyr Arg Asp Tyr Glu Ser Val Phe 165 170 175 Val Glu Asn Leu Lys Lys Arg Asp Arg Asp Thr Tyr Arg Val Val Asn 180 185 190 Cys Met Glu Arg Ser Ser Lys Ile Ile Leu Ile Lys Gly Phe Lys Glu 195 200 205 Ile Glu Gly Lys Tyr Phe Asp Tyr Phe Ser Cys Leu Thr Gly Lys Lys 210 215 220 Val Val Pro Val Gly Pro Leu Val Gln Asp Pro Val Leu Asp Asp Glu 225 230 235 240 Asp Cys Arg Ile Met Gln Trp Leu Asn Lys Lys Glu Lys Gly Ser Thr 245 250 255 Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Glu Asp Met 260 265 270 Glu Glu Ile Ala His Gly Leu Glu Leu Ser Asn Val Asp Phe Ile Trp 275 280 285 Val Val Arg Phe Pro Lys Gly Glu Asn Ile Val Ile Glu Glu Thr Leu 290 295 300 Pro Lys Gly Phe Phe Glu Arg Val Gly Glu Arg Gly Leu Val Val Asn 305 310 315 320 Gly Trp Ala Pro Gln Ala Lys Ile Leu Thr His Pro Asn Val Gly Gly 325 330 335 Phe Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Lys Phe 340 345 350 Gly Leu Pro Ile Val Ala Met Pro Met His Leu Asp Gln Pro Ile Asn 355 360 365 Ala Arg Leu Ile Glu Glu Val Gly Ala Gly Val Glu Val Leu Arg Asp 370 375 380 Ser Lys Gly Lys Leu His Arg Glu Arg Met Ala Glu Thr Ile Asn Lys 385 390 395 400 Val Thr Lys Glu Ala Ser Gly Glu Pro Ala Arg Lys Lys Ala Arg Glu 405 410 415 Leu Gln Glu Lys Leu Glu Leu Lys Gly Asp Glu Glu Ile Asp Asp Val 420 425 430 Val Lys Glu Leu Val Gln Leu Cys Ala Thr Lys Asn Lys Arg Asn Gly 435 440 445 Leu His Cys Tyr Asn 450 <210> 75 <211> 452 <212> PRT <213> Coffea eugenioides <400> 75 Met Ala Glu Asn His Ala Thr Phe Asn Val Leu Met Leu Pro Trp Leu 1 5 10 15 Ala His Gly His Val Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu Thr 20 25 30 Ala Arg Asn Phe Asn Val Tyr Leu Cys Ser Ser Pro Ala Thr Leu Ser 35 40 45 Ser Val Arg Ser Lys Leu Thr Glu Lys Phe Ser Gln Ser Ile His Leu 50 55 60 Val Glu Leu His Leu Pro Lys Leu Pro Glu Leu Pro Ala Glu Tyr His 65 70 75 80 Thr Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Asp Ala 85 90 95 Phe Asp Met Ala Glu Pro Asn Phe Cys Asn Val Leu Lys Ser Leu Lys 100 105 110 Pro Asp Leu Leu Ile Tyr Asp Leu Leu Gln Pro Trp Ala Pro Glu Ala 115 120 125 Ala Ser Ala Phe Asn Ile Pro Ala Val Val Phe Ile Ser Ser Ser Ala 130 135 140 Thr Met Thr Ser Phe Gly Leu His Phe Phe Lys Asn Pro Gly Thr Lys 145 150 155 160 Tyr Pro Tyr Gly Asn Thr Ile Phe Tyr Arg Asp Tyr Glu Ser Val Phe 165 170 175 Val Glu Asn Leu Lys Arg Arg Asp Arg Asp Thr Tyr Arg Val Val Asn 180 185 190 Cys Met Glu Arg Ser Ser Lys Ile Ile Leu Ile Lys Gly Phe Lys Glu 195 200 205 Ile Glu Gly Lys Tyr Phe Asp Tyr Phe Ser Cys Leu Thr Gly Lys Lys 210 215 220 Val Val Pro Val Gly Pro Leu Val Gln Asp Pro Val Leu Asp Asp Glu 225 230 235 240 Asp Cys Arg Ile Met Gln Trp Leu Asn Lys Lys Glu Lys Gly Ser Thr 245 250 255 Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Glu Asp Met 260 265 270 Glu Glu Ile Ala His Gly Leu Glu Leu Ser Asn Val Asp Phe Ile Trp 275 280 285 Val Val Arg Phe Pro Lys Gly Glu Asn Ile Val Ile Glu Glu Thr Leu 290 295 300 Pro Lys Gly Phe Phe Glu Arg Val Gly Glu Arg Gly Leu Val Val Asn 305 310 315 320 Gly Trp Ala Pro Gln Ala Lys Ile Leu Thr His Pro Asn Val Gly Gly 325 330 335 Phe Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Lys Phe 340 345 350 Gly Leu Pro Ile Ile Ala Met Pro Met His Leu Asp Gln Pro Ile Asn 355 360 365 Ala Arg Leu Ile Glu Glu Val Gly Ala Gly Val Glu Val Leu Arg Asp 370 375 380 Ser Lys Gly Lys Leu His Arg Glu Arg Met Ala Glu Thr Ile Asn Lys 385 390 395 400 Val Thr Lys Glu Ala Ser Gly Glu Ser Val Arg Lys Lys Ala Arg Glu 405 410 415 Leu Gln Glu Lys Leu Glu Leu Lys Gly Asp Glu Glu Ile Asp Asp Val 420 425 430 Val Lys Glu Leu Val Gln Leu Cys Ala Thr Lys Asn Lys Arg Asn Gly 435 440 445 Leu His Tyr Asn 450 <210> 76 <211> 452 <212> PRT <213> Coffea eugenioides <400> 76 Met Ala Glu Asn His Ala Thr Phe Asn Val Leu Met Leu Pro Trp Leu 1 5 10 15 Ala His Gly His Val Ser Pro Tyr Leu Glu Leu Ala Lys Lys Leu Thr 20 25 30 Ala Arg Asn Phe Asn Val Tyr Leu Cys Ser Ser Pro Ala Thr Leu Ser 35 40 45 Ser Val Arg Ser Lys Leu Thr Glu Lys Phe Ser Gln Ser Ile His Leu 50 55 60 Val Glu Leu His Leu Pro Lys Leu Pro Glu Leu Pro Ala Glu Tyr His 65 70 75 80 Thr Thr Asn Gly Leu Pro Pro His Leu Met Pro Thr Leu Lys Asp Ala 85 90 95 Phe Asp Met Ala Lys Pro Asn Phe Cys Asn Val Leu Lys Ser Leu Lys 100 105 110 Pro Asp Leu Leu Ile Tyr Asp Leu Leu Gln Pro Trp Ala Pro Glu Ala 115 120 125 Ala Ser Ala Phe Asn Ile Pro Ala Val Val Phe Ile Ser Ser Ser Ala 130 135 140 Thr Met Thr Ser Phe Gly Leu His Phe Phe Lys Asn Pro Gly Thr Lys 145 150 155 160 Tyr Pro Tyr Gly Asn Ala Ile Phe Tyr Arg Asp Tyr Glu Ser Val Phe 165 170 175 Val Glu Asn Leu Thr Arg Arg Asp Arg Asp Thr Tyr Arg Val Ile Asn 180 185 190 Cys Met Glu Arg Ser Ser Lys Ile Ile Leu Ile Lys Gly Phe Asn Glu 195 200 205 Ile Glu Gly Lys Tyr Phe Asp Tyr Phe Ser Cys Leu Thr Gly Lys Lys 210 215 220 Val Val Pro Val Gly Pro Leu Val Gln Asp Pro Val Leu Asp Asp Glu 225 230 235 240 Asp Cys Glu Ile Met Gln Trp Leu Asn Lys Lys Glu Lys Val Ser Thr 245 250 255 Val Phe Val Ser Phe Gly Ser Glu Tyr Phe Leu Ser Lys Lys Asp Met 260 265 270 Glu Glu Ile Ala His Gly Leu Glu Leu Ser Asn Val Asp Phe Ile Trp 275 280 285 Val Val Arg Phe Pro Lys Gly Glu Asn Ile Val Ile Glu Glu Thr Leu 290 295 300 Pro Lys Gly Phe Phe Glu Arg Val Gly Glu Arg Gly Leu Val Val Asn 305 310 315 320 Gly Trp Ala Pro Gln Ala Lys Ile Leu Thr His Pro Asn Val Gly Gly 325 330 335 Phe Val Ser His Cys Gly Trp Asn Ser Val Met Glu Ser Met Lys Phe 340 345 350 Gly Leu Pro Ile Ile Ala Met Pro Met His Leu Asp Gln Pro Ile Asn 355 360 365 Ala Arg Leu Ile Glu Glu Val Gly Ala Gly Val Glu Val Leu Arg Asp 370 375 380 Ser Lys Gly Lys Leu His Arg Glu Arg Met Ala Glu Thr Ile Asn Lys 385 390 395 400 Val Met Lys Glu Ala Ser Gly Glu Ser Val Arg Lys Lys Ala Arg Glu 405 410 415 Leu Gln Glu Lys Met Asp Leu Lys Gly Asp Glu Glu Ile Asp Asp Val 420 425 430 Val Lys Glu Leu Val Gln Leu Cys Ala Thr Lys Asn Lys Arg Asn Gly 435 440 445 Leu His Tyr Tyr 450 <210> 77 <211> 453 <212> PRT <213> Siraitia grosvenorii <400> 77 Met Ala Asp Ala Ala Gln Gln Gly Asp Thr Thr Thr Ile Leu Met Leu 1 5 10 15 Pro Trp Leu Gly Tyr Gly His Leu Ser Ala Phe Leu Glu Leu Ala Lys 20 25 30 Ser Leu Ser Arg Arg Asn Phe His Ile Tyr Phe Cys Ser Thr Ser Val 35 40 45 Asn Leu Asp Ala Ile Lys Pro Lys Leu Pro Ser Ser Phe Ser Asp Ser 50 55 60 Ile Gln Phe Val Glu Leu His Leu Pro Ser Ser Pro Glu Phe Pro Pro 65 70 75 80 His Leu His Thr Thr Asn Gly Leu Pro Pro Thr Leu Met Pro Ala Leu 85 90 95 His Gln Ala Phe Ser Met Ala Ala Gln His Phe Glu Ser Ile Leu Gln 100 105 110 Thr Leu Ala Pro His Leu Leu Ile Tyr Asp Ser Leu Gln Pro Trp Ala 115 120 125 Pro Arg Val Ala Ser Ser Leu Lys Ile Pro Ala Ile Asn Phe Asn Thr 130 135 140 Thr Gly Val Phe Val Ile Ser Gln Gly Leu His Pro Ile His Tyr Pro 145 150 155 160 His Ser Lys Phe Pro Phe Ser Glu Phe Val Leu His Asn His Trp Lys 165 170 175 Ala Met Tyr Ser Thr Ala Asp Gly Ala Ser Thr Glu Arg Thr Arg Lys 180 185 190 Arg Gly Glu Ala Phe Leu Tyr Cys Leu His Ala Ser Cys Ser Val Ile 195 200 205 Leu Ile Asn Ser Phe Arg Glu Leu Glu Gly Lys Tyr Met Asp Tyr Leu 210 215 220 Ser Val Leu Leu Asn Lys Lys Val Val Pro Val Gly Pro Leu Val Tyr 225 230 235 240 Glu Pro Asn Gln Asp Gly Glu Asp Glu Gly Tyr Ser Ser Ile Lys Asn 245 250 255 Trp Leu Asp Lys Lys Glu Pro Ser Ser Thr Val Phe Val Ser Phe Gly 260 265 270 Ser Glu Tyr Phe Pro Ser Lys Glu Glu Met Glu Glu Ile Ala His Gly 275 280 285 Leu Glu Ala Ser Glu Val Asn Phe Ile Trp Val Val Arg Phe Pro Gln 290 295 300 Gly Asp Asn Thr Ser Gly Ile Glu Asp Ala Leu Pro Lys Gly Phe Leu 305 310 315 320 Glu Arg Ala Gly Glu Arg Gly Met Val Val Lys Gly Trp Ala Pro Gln 325 330 335 Ala Lys Ile Leu Lys His Trp Ser Thr Gly Gly Phe Val Ser His Cys 340 345 350 Gly Trp Asn Ser Val Met Glu Ser Met Met Phe Gly Val Pro Ile Ile 355 360 365 Gly Val Pro Met His Val Asp Gln Pro Phe Asn Ala Gly Leu Val Glu 370 375 380 Glu Ala Gly Val Gly Val Glu Ala Lys Arg Asp Pro Asp Gly Lys Ile 385 390 395 400 Gln Arg Asp Glu Val Ala Lys Leu Ile Lys Glu Val Val Val Glu Lys 405 410 415 Thr Arg Glu Asp Val Arg Lys Lys Ala Arg Glu Met Ser Glu Ile Leu 420 425 430 Arg Ser Lys Gly Glu Glu Lys Phe Asp Glu Met Val Ala Glu Ile Ser 435 440 445 Leu Leu Leu Lys Ile 450 <210> 78 <211> 474 <212> PRT <213> Oryza sativa <400> 78 Met Ala Gln Ala Glu Arg Glu Arg Leu Arg Val Leu Met Phe Pro Trp 1 5 10 15 Leu Ala His Gly His Ile Asn Pro Tyr Leu Glu Leu Ala Thr Arg Leu 20 25 30 Thr Thr Thr Ser Ser Ser Gln Ile Asp Val Val Val His Leu Val Ser 35 40 45 Thr Pro Val Asn Leu Ala Ala Val Ala His Arg Arg Thr Asp Arg Ile 50 55 60 Ser Leu Val Glu Leu His Leu Pro Glu Leu Pro Gly Leu Pro Pro Ala 65 70 75 80 Leu His Thr Thr Lys His Leu Pro Pro Arg Leu Met Pro Ala Leu Lys 85 90 95 Arg Ala Cys Asp Leu Ala Ala Pro Ala Phe Gly Ala Leu Leu Asp Glu 100 105 110 Leu Ser Pro Asp Val Val Leu Tyr Asp Phe Ile Gln Pro Trp Ala Pro 115 120 125 Leu Glu Ala Ala Ala Arg Gly Val Pro Ala Val His Phe Ser Thr Cys 130 135 140 Ser Ala Ala Ala Thr Ala Phe Phe Leu His Phe Leu Asp Gly Gly Gly 145 150 155 160 Gly Gly Gly Gly Arg Gly Ala Phe Pro Phe Glu Ala Ile Ser Leu Gly 165 170 175 Gly Ala Glu Glu Asp Ala Arg Tyr Thr Met Leu Thr Cys Arg Asp Asp 180 185 190 Gly Thr Ala Leu Leu Pro Lys Gly Glu Arg Leu Pro Leu Ser Phe Ala 195 200 205 Arg Ser Ser Glu Phe Val Ala Val Lys Thr Cys Val Glu Ile Glu Ser 210 215 220 Lys Tyr Met Asp Tyr Leu Ser Lys Leu Val Gly Lys Glu Ile Ile Pro 225 230 235 240 Cys Gly Pro Leu Leu Val Asp Ser Gly Asp Val Ser Ala Gly Ser Glu 245 250 255 Ala Asp Gly Val Met Arg Trp Leu Asp Gly Gln Glu Pro Gly Ser Val 260 265 270 Val Leu Val Ser Phe Gly Ser Glu Tyr Phe Met Thr Glu Lys Gln Leu 275 280 285 Ala Glu Met Ala Arg Gly Leu Glu Leu Ser Gly Ala Ala Phe Val Trp 290 295 300 Val Val Arg Phe Pro Gln Gln Ser Pro Asp Gly Asp Glu Asp Asp His 305 310 315 320 Gly Ala Ala Ala Ala Arg Ala Met Pro Pro Gly Phe Ala Pro Ala Arg 325 330 335 Gly Leu Val Val Glu Gly Trp Ala Pro Gln Arg Arg Val Leu Ser His 340 345 350 Arg Ser Cys Gly Ala Phe Leu Thr His Cys Gly Trp Ser Ser Val Met 355 360 365 Glu Ser Met Ser Ala Gly Val Pro Met Val Ala Leu Pro Leu His Ile 370 375 380 Asp Gln Pro Val Gly Ala Asn Leu Ala Ala Glu Leu Gly Val Ala Ala 385 390 395 400 Arg Val Arg Gln Glu Arg Phe Gly Glu Phe Glu Ala Glu Glu Val Ala 405 410 415 Arg Ala Val Arg Ala Val Met Arg Gly Gly Glu Ala Leu Arg Arg Arg 420 425 430 Ala Thr Glu Leu Arg Glu Val Val Ala Arg Arg Asp Ala Glu Cys Asp 435 440 445 Glu Gln Ile Gly Ala Leu Leu His Arg Met Ala Arg Leu Cys Gly Lys 450 455 460 Gly Thr Gly Arg Ala Ala Gln Leu Gly His 465 470 <210> 79 <211> 443 <212> PRT <213> Panax ginseng <400> 79 Met Ala Asp Asn Gln Asn Gly Arg Ile Ser Ile Ala Leu Leu Pro Phe 1 5 10 15 Leu Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys Gln Leu 20 25 30 Ala Lys Arg Asn Cys Asn Val Phe Leu Cys Ser Thr Pro Ile Asn Leu 35 40 45 Ser Ser Ile Lys Asp Lys Asp Ser Ser Ala Ser Ile Lys Leu Val Glu 50 55 60 Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro His Tyr His Thr Thr 65 70 75 80 Asn Gly Leu Pro Ser His Leu Met Leu Pro Leu Arg Asn Ala Phe Glu 85 90 95 Thr Ala Gly Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu Asn Pro Asp 100 105 110 Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu Ile Ala Ser 115 120 125 Ser His Asn Ile Pro Ala Val Tyr Phe Leu Thr Thr Ala Ala Ala Ser 130 135 140 Ser Ser Ile Gly Leu His Ala Phe Lys Asn Pro Gly Glu Lys Tyr Pro 145 150 155 160 Phe Pro Asp Phe Tyr Asp Asn Ser Asn Ile Thr Pro Glu Pro Pro Ser 165 170 175 Ala Asp Asn Met Lys Leu Leu His Asp Phe Ile Ala Cys Phe Glu Arg 180 185 190 Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu Glu Gly Lys 195 200 205 Tyr Ile Asp Leu Leu Ser Thr Leu Ser Asp Lys Thr Leu Val Pro Val 210 215 220 Gly Pro Leu Val Gln Asp Pro Met Gly His Asn Glu Asp Pro Lys Thr 225 230 235 240 Glu Gln Ile Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser Thr Val Val 245 250 255 Phe Val Cys Phe Gly Ser Glu Tyr Phe Leu Ser Asn Glu Glu Leu Glu 260 265 270 Glu Val Ala Ile Gly Leu Glu Ile Ser Thr Val Asn Phe Ile Trp Ala 275 280 285 Val Arg Leu Ile Glu Gly Glu Lys Lys Gly Ile Leu Pro Glu Gly Phe 290 295 300 Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly Trp Ala Pro 305 310 315 320 Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe Val Ser His 325 330 335 Cys Gly Trp Ser Ser Ile Ala Glu Ser Met Lys Phe Gly Val Pro Val 340 345 350 Ile Ala Met Ala Arg His Leu Asp Gln Pro Leu Asn Gly Lys Leu Ala 355 360 365 Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu Asn Gly Lys 370 375 380 Tyr Lys Arg Glu Gly Ile Ala Glu Val Ile Arg Lys Val Val Val Glu 385 390 395 400 Lys Ser Gly Glu Val Ile Arg Arg Lys Ala Arg Glu Leu Ser Glu Lys 405 410 415 Met Lys Glu Lys Gly Glu Gln Glu Ile Asp Arg Ala Leu Glu Glu Leu 420 425 430 Val Gln Ile Cys Lys Lys Lys Lys Asp Glu Gln 435 440 <210> 80 <211> 499 <212> PRT <213> Stevia rebaudiana <400> 80 Met Ala His His His His His His Val Gly Thr Gly Ser Asn Asp Asp 1 5 10 15 Asp Asp Lys Ser Pro Asp Pro Asn Trp Ala Ser Thr Ser Glu Leu Val 20 25 30 Phe Ile Pro Ser Pro Gly Ala Gly His Leu Pro Pro Thr Val Glu Leu 35 40 45 Ala Lys Leu Leu Leu His Arg Asp Gln Arg Leu Ser Val Thr Ile Ile 50 55 60 Val Met Asn Leu Trp Leu Gly Pro Lys His Asn Thr Glu Ala Arg Pro 65 70 75 80 Cys Val Pro Ser Leu Arg Phe Val Asp Ile Pro Cys Asp Glu Ser Thr 85 90 95 Met Ala Leu Ile Ser Pro Asn Thr Phe Ile Ser Ala Phe Val Glu His 100 105 110 His Lys Pro Arg Val Arg Asp Ile Val Arg Gly Ile Ile Glu Ser Asp 115 120 125 Ser Val Arg Leu Ala Gly Phe Val Leu Asp Met Phe Cys Met Pro Met 130 135 140 Ser Asp Val Ala Asn Glu Phe Gly Val Pro Ser Tyr Asn Tyr Phe Thr 145 150 155 160 Ser Gly Ala Ala Thr Leu Gly Leu Met Phe His Leu Gln Trp Lys Arg 165 170 175 Asp His Glu Gly Tyr Asp Ala Thr Glu Leu Lys Asn Ser Asp Thr Glu 180 185 190 Leu Ser Val Pro Ser Tyr Val Asn Pro Val Pro Ala Lys Val Leu Pro 195 200 205 Glu Val Val Leu Asp Lys Glu Gly Gly Ser Lys Met Phe Leu Asp Leu 210 215 220 Ala Glu Arg Ile Arg Glu Ser Lys Gly Ile Ile Val Asn Ser Cys Gln 225 230 235 240 Ala Ile Glu Arg His Ala Leu Glu Tyr Leu Ser Ser Asn Asn Asn Gly 245 250 255 Ile Pro Pro Val Phe Pro Val Gly Pro Ile Leu Asn Leu Glu Asn Lys 260 265 270 Lys Asp Asp Ala Lys Thr Asp Glu Ile Met Arg Trp Leu Asn Glu Gln 275 280 285 Pro Glu Ser Ser Val Val Phe Leu Cys Phe Gly Ser Met Gly Ser Phe 290 295 300 Asn Glu Lys Gln Val Lys Glu Ile Ala Val Ala Ile Glu Arg Ser Gly 305 310 315 320 His Arg Phe Leu Trp Ser Leu Arg Arg Pro Thr Pro Lys Glu Lys Ile 325 330 335 Glu Phe Pro Lys Glu Tyr Glu Asn Leu Glu Glu Val Leu Pro Glu Gly 340 345 350 Phe Leu Lys Arg Thr Ser Ser Ile Gly Lys Val Ile Gly Trp Ala Pro 355 360 365 Gln Met Ala Val Leu Ser His Pro Ser Val Gly Gly Phe Val Ser His 370 375 380 Cys Gly Trp Asn Ser Thr Leu Glu Ser Met Trp Cys Gly Val Pro Met 385 390 395 400 Ala Ala Trp Pro Leu Tyr Ala Glu Gln Thr Leu Asn Ala Phe Leu Leu 405 410 415 Val Val Glu Leu Gly Leu Ala Ala Glu Ile Arg Met Asp Tyr Arg Thr 420 425 430 Asp Thr Lys Ala Gly Tyr Asp Gly Gly Met Glu Val Thr Val Glu Glu 435 440 445 Ile Glu Asp Gly Ile Arg Lys Leu Met Ser Asp Gly Glu Ile Arg Asn 450 455 460 Lys Val Lys Asp Val Lys Glu Lys Ser Arg Ala Ala Val Val Glu Gly 465 470 475 480 Gly Ser Ser Tyr Ala Ser Ile Gly Lys Phe Ile Glu His Val Ser Asn 485 490 495 Val Thr Ile <210> 81 <211> 494 <212> PRT <213> Camelina sativa <400> 81 Met Ala Ser Glu Lys Thr Leu Gln Val His Pro Pro Leu His Phe Val 1 5 10 15 Leu Phe Pro Phe Met Ala Gln Gly His Met Ile Pro Met Val Asp Ile 20 25 30 Ala Arg Leu Leu Ala Gln Arg Gly Ala Thr Val Thr Ile Val Thr Thr 35 40 45 Arg Tyr Asn Ala Gly Arg Phe Glu Asn Val Leu Ser Arg Ala Val Glu 50 55 60 Ser Gly Leu Pro Ile Asn Ile Val His Val Lys Phe Pro Tyr Glu Glu 65 70 75 80 Val Gly Leu Pro Lys Gly Lys Glu Asn Ile Asp Ser Leu Asp Ser Met 85 90 95 Glu Leu Met Val Pro Phe Phe Lys Ala Val Asn Met Leu Gln Asp Pro 100 105 110 Val Val Lys Leu Met Glu Glu Met Glu Ser Arg Pro Ser Cys Ile Ile 115 120 125 Ser Asp Leu Leu Leu Pro Tyr Thr Ser Lys Ile Ala Lys Lys Phe Asn 130 135 140 Ile Pro Lys Ile Val Phe His Gly Ile Ser Cys Phe Cys Leu Leu Cys 145 150 155 160 Val His Val Leu Arg Arg Asn Leu Glu Ile Leu Thr Asn Leu Lys Ser 165 170 175 Asp Lys Glu Tyr Phe Leu Val Pro Ser Phe Pro Asp Arg Val Glu Phe 180 185 190 Thr Lys Pro Gln Val Thr Val Glu Thr Asn Ala Ser Gly Asp Trp Lys 195 200 205 Glu Phe Leu Asp Glu Met Val Glu Ala Glu Asp Thr Ser Tyr Gly Val 210 215 220 Ile Ile Asn Thr Phe Glu Glu Leu Glu Pro Ala Tyr Val Lys Asp Tyr 225 230 235 240 Lys Asp Ala Arg Ala Gly Asn Val Trp Ser Ile Gly Pro Val Ser Leu 245 250 255 Cys Asn Lys Ala Gly Val Asp Lys Ala Glu Arg Gly Asn Lys Ala Thr 260 265 270 Ile Asp Gln Asp Glu Cys Leu Lys Trp Leu Asp Ser Lys Glu Glu Gly 275 280 285 Ser Val Leu Tyr Val Cys Leu Gly Ser Ile Cys Asn Leu Pro Leu Val 290 295 300 Gln Leu Lys Glu Leu Gly Leu Gly Leu Glu Glu Ser Gln Arg Pro Phe 305 310 315 320 Ile Trp Val Ile Arg Gly Trp Glu Lys Tyr Asn Glu Leu Ser Glu Trp 325 330 335 Met Val Glu Ser Gly Phe Glu Glu Arg Ile Arg Glu Arg Gly Leu Leu 340 345 350 Ile Arg Gly Trp Ala Pro Gln Val Leu Ile Leu Ser His Pro Ser Val 355 360 365 Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Gly Ile 370 375 380 Thr Ser Gly Val Pro Leu Ile Thr Trp Pro Leu Phe Gly Asp Gln Phe 385 390 395 400 Cys Asn Gln Thr Leu Val Val Gln Val Leu Lys Ala Gly Val Ser Val 405 410 415 Gly Val Glu Glu Val Met Lys Trp Gly Glu Glu Glu Lys Ile Gly Val 420 425 430 Leu Val Asp Lys Glu Gly Val Lys Lys Ala Val Glu Asp Leu Met Gly 435 440 445 Glu Ser Asp Asp Ala Lys Glu Arg Thr Lys Arg Val Lys Glu Leu Gly 450 455 460 Gly Leu Ala His Lys Ala Val Glu Glu Gly Gly Ser Ser His Ser Asn 465 470 475 480 Ile Thr Leu Phe Leu Gln Asp Ile Arg Gln Val Gln Ser Val 485 490 <210> 82 <211> 478 <212> PRT <213> Glycyrrhiza uralensis <400> 82 Met Ala Asp Val Ala Glu Glu Gln Pro Leu Lys Ile Tyr Phe Ile Pro 1 5 10 15 Tyr Leu Ala Ala Gly His Met Ile Pro Leu Cys Asp Ile Ala Thr Leu 20 25 30 Phe Ala Ser Arg Gly His His Val Thr Ile Ile Thr Thr Pro Ser Asn 35 40 45 Ala Gln Thr Leu Arg Glu Ser His His Phe Arg Val Gln Thr Ile Gln 50 55 60 Phe Pro Ser Gln Glu Val Gly Leu Pro Ala Gly Val Gln Asn Leu Thr 65 70 75 80 Ala Val Thr Asn Leu Asp Asp Ser Tyr Lys Ile Tyr His Ala Thr Met 85 90 95 Leu Leu Arg Lys His Ile Glu Asp Phe Val Glu Arg Asp Pro Pro Asp 100 105 110 Cys Ile Val Ala Asp Phe Leu Phe Pro Trp Val Asp Asp Val Ala Thr 115 120 125 Lys Leu His Ile Pro Arg Leu Val Phe Asn Gly Phe Thr Leu Phe Thr 130 135 140 Ile Cys Ala Met Glu Ser His Lys Ala His Pro Leu Pro Val Asp Ala 145 150 155 160 Ala Ser Gly Ser Phe Val Ile Pro Asp Phe Pro His His Val Thr Ile 165 170 175 Asn Ser Thr Pro Pro Lys Arg Thr Lys Glu Phe Val Asp Pro Leu Leu 180 185 190 Thr Glu Ala Phe Lys Ser His Gly Phe Leu Ile Asn Ser Phe Val Glu 195 200 205 Leu Asp Gly Glu Glu Cys Val Glu His Tyr Glu Arg Ile Thr Gly Gly 210 215 220 His Lys Ala Trp His Leu Gly Pro Ala Phe Leu Val His Arg Thr Ala 225 230 235 240 Gln Asp Arg Gly Glu Lys Ser Val Val Ser Thr Gln Glu Cys Leu Ser 245 250 255 Trp Leu Asp Ser Lys Arg Asp Asn Ser Val Leu Tyr Ile Cys Phe Gly 260 265 270 Thr Ile Cys Tyr Phe Pro Asp Lys Gln Leu Tyr Glu Ile Ala Ser Ala 275 280 285 Ile Glu Ala Ser Gly His Glu Phe Ile Trp Val Val Pro Glu Lys Arg 290 295 300 Gly Asn Ala Asp Glu Ser Glu Glu Glu Lys Glu Lys Trp Leu Pro Lys 305 310 315 320 Gly Phe Glu Glu Arg Asn Asn Gly Lys Lys Gly Met Ile Ile Arg Gly 325 330 335 Trp Ala Pro Gln Val Ala Ile Leu Gly His Pro Ala Val Gly Gly Phe 340 345 350 Leu Thr His Cys Gly Trp Asn Ser Thr Val Glu Ala Val Ser Ala Gly 355 360 365 Val Pro Met Ile Thr Trp Pro Val His Ser Asp Gln Tyr Phe Asn Glu 370 375 380 Lys Leu Ile Thr Gln Val Arg Gly Ile Gly Val Glu Val Gly Ala Glu 385 390 395 400 Glu Trp Ile Val Thr Ala Phe Arg Glu Thr Glu Lys Leu Val Gly Arg 405 410 415 Asp Arg Ile Glu Arg Ala Val Arg Arg Val Met Asp Gly Gly Asp Glu 420 425 430 Ala Val Gln Ile Arg Arg Arg Ala Arg Glu Leu Gly Glu Met Ala Arg 435 440 445 Gln Ala Val Gln Glu Gly Gly Ser Ser His Thr Asn Leu Thr Ala Leu 450 455 460 Ile Asn Asp Leu Lys Arg Trp Arg Asp Ser Lys Gln Leu Asn 465 470 475 <210> 83 <211> 491 <212> PRT <213> Glycyrrhiza uralensis <400> 83 Met Ala Val Phe Gln Ala Asn Gln Pro His Phe Val Leu Phe Pro Leu 1 5 10 15 Met Ala Gln Gly His Ile Ile Pro Met Ile Asp Ile Ala Arg Leu Leu 20 25 30 Ala Gln Arg Gly Ala Ile Val Thr Ile Phe Thr Thr Pro Lys Asn Ala 35 40 45 Ser Arg Phe Thr Ser Val Leu Ser Arg Ala Val Ser Ser Gly Leu Gln 50 55 60 Ile Arg Leu Val His Leu His Phe Pro Ser Lys Glu Ala Gly Leu Pro 65 70 75 80 Glu Gly Cys Glu Asn Leu Asp Met Val Ala Ser His Asp Met Ile Cys 85 90 95 Asn Ile Phe Gln Ala Ile Arg Met Leu Gln Lys Gln Ala Glu Glu Leu 100 105 110 Phe Glu Thr Leu Thr Pro Lys Pro Ser Cys Ile Ile Ser Asp Phe Cys 115 120 125 Ile Pro Trp Thr Thr Gln Val Ala Glu Lys His His Ile Pro Arg Ile 130 135 140 Ser Phe His Gly Phe Ser Cys Phe Cys Leu His Cys Met Leu Lys Ile 145 150 155 160 His Thr Ser Lys Val Leu Glu Gly Ile Thr Ser Glu Ser Glu Tyr Phe 165 170 175 Thr Val Pro Gly Ile Pro Asp Gln Ile Gln Val Thr Lys Gln Gln Val 180 185 190 Pro Gly Pro Met Ile Asp Glu Met Lys Glu Phe Gly Glu Gln Met Arg 195 200 205 Asp Ala Glu Ile Arg Ser Tyr Gly Val Ile Ile Asn Thr Phe Glu Glu 210 215 220 Leu Glu Lys Ala Tyr Val Asn Asp Tyr Lys Lys Glu Arg Asn Gly Lys 225 230 235 240 Val Trp Cys Ile Gly Pro Val Ser Leu Cys Asn Lys Asp Gly Leu Asp 245 250 255 Lys Ala Gln Arg Gly Asn Lys Ala Ser Ile Ser Glu His His Cys Leu 260 265 270 Glu Trp Leu Asp Leu Gln Gln Pro Asn Ser Val Ile Tyr Val Cys Leu 275 280 285 Gly Ser Leu Cys Asn Leu Thr Pro Pro Gln Leu Met Glu Leu Ala Leu 290 295 300 Gly Leu Glu Ala Thr Lys Arg Pro Phe Ile Trp Val Ile Arg Glu Gly 305 310 315 320 Asn Lys Phe Glu Glu Leu Glu Lys Trp Ile Ser Glu Glu Gly Phe Glu 325 330 335 Glu Arg Ile Lys Gly Arg Gly Leu Ile Ile Arg Gly Trp Ala Pro Gln 340 345 350 Val Leu Ile Leu Ser His Pro Ser Ile Gly Gly Phe Leu Thr His Cys 355 360 365 Gly Trp Asn Ser Thr Leu Glu Gly Val Thr Ala Gly Val Pro Met Val 370 375 380 Thr Trp Pro Leu Phe Ala Asp Gln Phe Leu Asn Glu Lys Leu Val Thr 385 390 395 400 Gln Val Leu Arg Ile Gly Val Ser Leu Gly Val Asp Val Pro Leu Lys 405 410 415 Trp Gly Glu Glu Glu Lys Val Gly Val Gln Val Lys Lys Glu Gly Ile 420 425 430 Glu Lys Ala Ile Cys Met Val Met Asp Glu Gly Glu Glu Ser Lys Glu 435 440 445 Arg Arg Glu Arg Ala Lys Glu Leu Ser Glu Met Ala Lys Arg Ala Val 450 455 460 Glu Lys Asp Gly Ser Ser His Leu Asn Met Thr Met Leu Ile Gln Asp 465 470 475 480 Ile Met Gln Gln Ser Ser Ser Lys Val Glu Thr 485 490 <210> 84 <211> 483 <212> PRT <213> Stevia rebaudiana <400> 84 Met Asp Gln Met Ala Lys Ile Asp Glu Lys Lys Pro His Val Val Phe 1 5 10 15 Ile Pro Phe Pro Ala Gln Ser His Ile Lys Cys Met Leu Lys Leu Ala 20 25 30 Arg Ile Leu His Gln Lys Gly Leu Tyr Ile Thr Phe Ile Asn Thr Asp 35 40 45 Thr Asn His Glu Arg Leu Val Ala Ser Gly Gly Thr Gln Trp Leu Glu 50 55 60 Asn Ala Pro Gly Phe Trp Phe Lys Thr Val Pro Asp Gly Phe Gly Ser 65 70 75 80 Ala Lys Asp Asp Gly Val Lys Pro Thr Asp Ala Leu Arg Glu Leu Met 85 90 95 Asp Tyr Leu Lys Thr Asn Phe Phe Asp Leu Phe Leu Asp Leu Val Leu 100 105 110 Lys Leu Glu Val Pro Ala Thr Cys Ile Ile Cys Asp Gly Cys Met Thr 115 120 125 Phe Ala Asn Thr Ile Arg Ala Ala Glu Lys Leu Asn Ile Pro Val Ile 130 135 140 Leu Phe Trp Thr Met Ala Ala Cys Gly Phe Met Ala Phe Tyr Gln Ala 145 150 155 160 Lys Val Leu Lys Glu Lys Glu Ile Val Pro Val Lys Asp Glu Thr Tyr 165 170 175 Leu Thr Asn Gly Tyr Leu Asp Met Glu Ile Asp Trp Ile Pro Gly Met 180 185 190 Lys Arg Ile Arg Leu Arg Asp Leu Pro Glu Phe Ile Leu Ala Thr Lys 195 200 205 Gln Asn Tyr Phe Ala Phe Glu Phe Leu Phe Glu Thr Ala Gln Leu Ala 210 215 220 Asp Lys Val Ser His Met Ile Ile His Thr Phe Glu Glu Leu Glu Ala 225 230 235 240 Ser Leu Val Ser Glu Ile Lys Ser Ile Phe Pro Asn Val Tyr Thr Ile 245 250 255 Gly Pro Leu Gln Leu Leu Leu Asn Lys Ile Thr Gln Lys Glu Thr Asn 260 265 270 Asn Asp Ser Tyr Ser Leu Trp Lys Glu Glu Pro Glu Cys Val Glu Trp 275 280 285 Leu Asn Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser 290 295 300 Leu Ala Val Met Ser Leu Gln Asp Leu Val Glu Phe Gly Trp Gly Leu 305 310 315 320 Val Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ala Asn Leu Ile 325 330 335 Asp Gly Lys Pro Ala Val Met Pro Gln Glu Leu Lys Glu Ala Met Asn 340 345 350 Glu Lys Gly Phe Val Gly Ser Trp Cys Ser Gln Glu Glu Val Leu Asn 355 360 365 His Pro Ala Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Ile 370 375 380 Ile Glu Ser Leu Ser Ala Gly Val Pro Met Leu Gly Trp Pro Ser Ile 385 390 395 400 Gly Asp Gln Arg Ala Asn Cys Arg Gln Met Cys Lys Glu Trp Glu Val 405 410 415 Gly Met Glu Ile Gly Lys Asn Val Lys Arg Asp Glu Val Glu Lys Leu 420 425 430 Val Arg Met Leu Met Glu Gly Leu Glu Gly Glu Arg Met Arg Lys Lys 435 440 445 Ala Leu Glu Trp Lys Lys Ser Ala Thr Leu Ala Thr Cys Cys Asn Gly 450 455 460 Ser Ser Ser Leu Asp Val Glu Lys Leu Ala Asn Glu Ile Lys Lys Leu 465 470 475 480 Ser Arg Asn <210> 85 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 85 Gly Gly Ser Gly Gly Ser 1 5 <210> 86 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 86 Gly Gly Ser Gly Gly Ser Gly 1 5 <210> 87 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 87 Gly Gly Ser Gly Gly Ser Gly Gly 1 5 <210> 88 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 88 Gly Gly Ser Gly Gly Ser Gly Gly Ser 1 5 <210> 89 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 89 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 1 5 10 <210> 90 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 90 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly 1 5 10 <210> 91 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 91 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 1 5 10 <210> 92 <211> 546 <212> PRT <213> Escherichia coli <400> 92 Met Ala Ile His Asn Arg Ala Gly Gln Pro Ala Gln Gln Ser Asp Leu 1 5 10 15 Ile Asn Val Ala Gln Leu Thr Ala Gln Tyr Tyr Val Leu Lys Pro Glu 20 25 30 Ala Gly Asn Ala Glu His Ala Val Lys Phe Gly Thr Ser Gly His Arg 35 40 45 Gly Ser Ala Ala Arg His Ser Phe Asn Glu Pro His Ile Leu Ala Ile 50 55 60 Ala Gln Ala Ile Ala Glu Glu Arg Ala Lys Asn Gly Ile Thr Gly Pro 65 70 75 80 Cys Tyr Val Gly Lys Asp Thr His Ala Leu Ser Glu Pro Ala Phe Ile 85 90 95 Ser Val Leu Glu Val Leu Ala Ala Asn Gly Val Asp Val Ile Val Gln 100 105 110 Glu Asn Asn Gly Phe Thr Pro Thr Pro Ala Val Ser Asn Ala Ile Leu 115 120 125 Val His Asn Lys Lys Gly Gly Pro Leu Ala Asp Gly Ile Val Ile Thr 130 135 140 Pro Ser His Asn Pro Pro Glu Asp Gly Gly Ile Lys Tyr Asn Pro Pro 145 150 155 160 Asn Gly Gly Pro Ala Asp Thr Asn Val Thr Lys Val Val Glu Asp Arg 165 170 175 Ala Asn Ala Leu Leu Ala Asp Gly Leu Lys Gly Val Lys Arg Ile Ser 180 185 190 Leu Asp Glu Ala Met Ala Ser Gly His Val Lys Glu Gln Asp Leu Val 195 200 205 Gln Pro Phe Val Glu Gly Leu Ala Asp Ile Val Asp Met Ala Ala Ile 210 215 220 Gln Lys Ala Gly Leu Thr Leu Gly Val Asp Pro Leu Gly Gly Ser Gly 225 230 235 240 Ile Glu Tyr Trp Lys Arg Ile Gly Glu Tyr Tyr Asn Leu Asn Leu Thr 245 250 255 Ile Val Asn Asp Gln Val Asp Gln Thr Phe Arg Phe Met His Leu Asp 260 265 270 Lys Asp Gly Ala Ile Arg Met Asp Cys Ser Ser Glu Cys Ala Met Ala 275 280 285 Gly Leu Leu Ala Leu Arg Asp Lys Phe Asp Leu Ala Phe Ala Asn Asp 290 295 300 Pro Asp Tyr Asp Arg His Gly Ile Val Thr Pro Ala Gly Leu Met Asn 305 310 315 320 Pro Asn His Tyr Leu Ala Val Ala Ile Asn Tyr Leu Phe Gln His Arg 325 330 335 Pro Gln Trp Gly Lys Asp Val Ala Val Gly Lys Thr Leu Val Ser Ser 340 345 350 Ala Met Ile Asp Arg Val Val Asn Asp Leu Gly Arg Lys Leu Val Glu 355 360 365 Val Pro Val Gly Phe Lys Trp Phe Val Asp Gly Leu Phe Asp Gly Ser 370 375 380 Phe Gly Phe Gly Gly Glu Glu Ser Ala Gly Ala Ser Phe Leu Arg Phe 385 390 395 400 Asp Gly Thr Pro Trp Ser Thr Asp Lys Asp Gly Ile Ile Met Cys Leu 405 410 415 Leu Ala Ala Glu Ile Thr Ala Val Thr Gly Lys Asn Pro Gln Glu His 420 425 430 Tyr Asn Glu Leu Ala Lys Arg Phe Gly Ala Pro Ser Tyr Asn Arg Leu 435 440 445 Gln Ala Ala Ala Thr Ser Ala Gln Lys Ala Ala Leu Ser Lys Leu Ser 450 455 460 Pro Glu Met Val Ser Ala Ser Thr Leu Ala Gly Asp Pro Ile Thr Ala 465 470 475 480 Arg Leu Thr Ala Ala Pro Gly Asn Gly Ala Ser Ile Gly Gly Leu Lys 485 490 495 Val Met Thr Asp Asn Gly Trp Phe Ala Ala Arg Pro Ser Gly Thr Glu 500 505 510 Asp Ala Tyr Lys Ile Tyr Cys Glu Ser Phe Leu Gly Glu Glu His Arg 515 520 525 Lys Gln Ile Glu Lys Glu Ala Val Glu Ile Val Ser Glu Val Leu Lys 530 535 540 Asn Ala 545 <210> 93 <211> 302 <212> PRT <213> Escherichia coli <400> 93 Met Ala Ala Ile Asn Thr Lys Val Lys Lys Ala Val Ile Pro Val Ala 1 5 10 15 Gly Leu Gly Thr Arg Met Leu Pro Ala Thr Lys Ala Ile Pro Lys Glu 20 25 30 Met Leu Pro Leu Val Asp Lys Pro Leu Ile Gln Tyr Val Val Asn Glu 35 40 45 Cys Ile Ala Ala Gly Ile Thr Glu Ile Val Leu Val Thr His Ser Ser 50 55 60 Lys Asn Ser Ile Glu Asn His Phe Asp Thr Ser Phe Glu Leu Glu Ala 65 70 75 80 Met Leu Glu Lys Arg Val Lys Arg Gln Leu Leu Asp Glu Val Gln Ser 85 90 95 Ile Cys Pro Pro His Val Thr Ile Met Gln Val Arg Gln Gly Leu Ala 100 105 110 Lys Gly Leu Gly His Ala Val Leu Cys Ala His Pro Val Val Gly Asp 115 120 125 Glu Pro Val Ala Val Ile Leu Pro Asp Val Ile Leu Asp Glu Tyr Glu 130 135 140 Ser Asp Leu Ser Gln Asp Asn Leu Ala Glu Met Ile Arg Arg Phe Asp 145 150 155 160 Glu Thr Gly His Ser Gln Ile Met Val Glu Pro Val Ala Asp Val Thr 165 170 175 Ala Tyr Gly Val Val Asp Cys Lys Gly Val Glu Leu Ala Pro Gly Glu 180 185 190 Ser Val Pro Met Val Gly Val Val Glu Lys Pro Lys Ala Asp Val Ala 195 200 205 Pro Ser Asn Leu Ala Ile Val Gly Arg Tyr Val Leu Ser Ala Asp Ile 210 215 220 Trp Pro Leu Leu Ala Lys Thr Pro Pro Gly Ala Gly Asp Glu Ile Gln 225 230 235 240 Leu Thr Asp Ala Ile Asp Met Leu Ile Glu Lys Glu Thr Val Glu Ala 245 250 255 Tyr His Met Lys Gly Lys Ser His Asp Cys Gly Asn Lys Leu Gly Tyr 260 265 270 Met Gln Ala Phe Val Glu Tyr Gly Ile Arg His Asn Thr Leu Gly Thr 275 280 285 Glu Phe Lys Ala Trp Leu Glu Glu Glu Met Gly Ile Lys Lys 290 295 300 <210> 94 <211> 219 <212> PRT <213> Escherichia coli <400> 94 Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp 1 5 10 15 Thr Ala His Leu His Phe Gln Ala Trp Gln Gln Ile Ala Ala Glu Ile 20 25 30 Gly Ile Ser Ile Asp Ala Gln Phe Asn Glu Ser Leu Lys Gly Ile Ser 35 40 45 Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly 50 55 60 Asp Phe Asn Ser Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu 65 70 75 80 Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro 85 90 95 Gly Ile Arg Ser Leu Leu Ala Asp Leu Arg Ala Gln Gln Ile Ser Val 100 105 110 Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu 115 120 125 Glu Leu Arg Glu Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys 130 135 140 Asn Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu 145 150 155 160 Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly 165 170 175 Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Ala 180 185 190 Gly Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Glu Ser Leu Thr 195 200 205 Trp Pro Arg Leu Ser Ala Phe Trp Gln Asn Val 210 215 <210> 95 <211> 489 <212> PRT <213> Bifidobacterium bifidum <400> 95 Met Ala Phe Ala Glu Asp Leu Lys Arg Thr Glu Lys Met Thr Val Asp 1 5 10 15 Asp Val Phe Glu Gln Ser Ala Gln Lys Met Arg Glu Gln Gly Met Ser 20 25 30 Glu Ile Ala Ile Ser Gln Phe Arg His Ala Tyr His Val Trp Ala Ser 35 40 45 Glu Lys Glu Ser Ala Trp Ile Arg Glu Asp Thr Val Glu Pro Leu His 50 55 60 Gly Val Arg Ser Phe His Asp Val Tyr Lys Thr Ile Asp His Asp Lys 65 70 75 80 Ala Val His Ala Phe Ala Lys Thr Ala Phe Leu Lys Leu Asn Gly Gly 85 90 95 Leu Gly Thr Ser Met Gly Leu Gln Cys Ala Lys Ser Leu Leu Pro Val 100 105 110 Arg Arg His Lys Ala Arg Gln Met Arg Phe Leu Asp Ile Ile Leu Gly 115 120 125 Gln Val Leu Thr Ala Arg Thr Arg Leu Asn Val Pro Leu Pro Val Thr 130 135 140 Phe Met Asn Ser Phe Arg Thr Ser Asp Asp Thr Met Lys Ala Leu Arg 145 150 155 160 His Gln Arg Lys Phe Lys Gln Thr Asp Ile Pro Leu Glu Ile Ile Gln 165 170 175 His Gln Glu Pro Lys Ile Asp Ala Ala Thr Gly Ala Pro Ala Ser Trp 180 185 190 Pro Ala Asn Pro Asp Leu Glu Trp Cys Pro Pro Gly His Gly Asp Leu 195 200 205 Phe Ser Thr Leu Arg Glu Ser Gly Leu Leu Asp Thr Leu Leu Glu His 210 215 220 Gly Phe Glu Tyr Leu Phe Ile Ser Asn Ser Asp Asn Leu Gly Ala Arg 225 230 235 240 Pro Ser Arg Thr Leu Ala Gln Tyr Phe Glu Asp Thr Gly Ala Pro Phe 245 250 255 Met Val Glu Val Ala Asn Arg Thr Tyr Ala Asp Arg Lys Gly Gly His 260 265 270 Ile Val Arg Asp Thr Ala Thr Gly Arg Leu Ile Leu Arg Glu Met Ser 275 280 285 Gln Val His Pro Asp Asp Lys Asp Ala Ala Gln Asp Ile Ala Lys His 290 295 300 Pro Tyr Phe Asn Thr Asn Asn Ile Trp Val Arg Ile Asp Val Leu Arg 305 310 315 320 Asp Met Leu Ala Glu His Asp Gly Val Leu Pro Leu Pro Val Ile Ile 325 330 335 Asn Asn Lys Thr Val Asp Pro Ile Asp Pro Gln Ser Pro Ala Val Val 340 345 350 Gln Leu Glu Thr Ala Met Gly Ala Ala Ile Gly Leu Phe Glu Gly Ala 355 360 365 Ile Cys Val Gln Val Asp Arg Met Arg Phe Leu Pro Val Lys Thr Thr 370 375 380 Asn Asp Leu Phe Ile Met Arg Ser Asp Arg Phe His Leu Thr Asp Ser 385 390 395 400 Tyr Glu Met Glu Asp Gly Asn Tyr Ile Phe Pro Asn Val Asp Leu Asp 405 410 415 Pro Arg Tyr Tyr Lys Asn Ile Glu Asp Phe Asn Glu Arg Phe Pro Tyr 420 425 430 Asn Val Pro Ser Leu Ala Ala Ala Asn Ser Val Ser Ile Lys Gly Asp 435 440 445 Trp Thr Phe Gly Arg Asp Val Ile Met Phe Ala Asp Ala Arg Leu Glu 450 455 460 Asp Arg Asn Glu Pro Ser Tyr Val Pro Asn Gly Glu Tyr Val Gly Pro 465 470 475 480 Met Gly Ile Glu Pro Gly Asp Trp Val 485 <210> 96 <211> 214 <212> PRT <213> Escherichia coli <400> 96 Met Arg Ile Ile Leu Leu Gly Ala Pro Gly Ala Gly Lys Gly Thr Gln 1 5 10 15 Ala Gln Phe Ile Met Glu Lys Tyr Gly Ile Pro Gln Ile Ser Thr Gly 20 25 30 Asp Met Leu Arg Ala Ala Val Lys Ser Gly Ser Glu Leu Gly Lys Gln 35 40 45 Ala Lys Asp Ile Met Asp Ala Gly Lys Leu Val Thr Asp Glu Leu Val 50 55 60 Ile Ala Leu Val Lys Glu Arg Ile Ala Gln Glu Asp Cys Arg Asn Gly 65 70 75 80 Phe Leu Leu Asp Gly Phe Pro Arg Thr Ile Pro Gln Ala Asp Ala Met 85 90 95 Lys Glu Ala Gly Ile Asn Val Asp Tyr Val Leu Glu Phe Asp Val Pro 100 105 110 Asp Glu Leu Ile Val Asp Arg Ile Val Gly Arg Arg Val His Ala Pro 115 120 125 Ser Gly Arg Val Tyr His Val Lys Phe Asn Pro Pro Lys Val Glu Gly 130 135 140 Lys Asp Asp Val Thr Gly Glu Glu Leu Thr Thr Arg Lys Asp Asp Gln 145 150 155 160 Glu Glu Thr Val Arg Lys Arg Leu Val Glu Tyr His Gln Met Thr Ala 165 170 175 Pro Leu Ile Gly Tyr Tyr Ser Lys Glu Ala Glu Ala Gly Asn Thr Lys 180 185 190 Tyr Ala Lys Val Asp Gly Thr Lys Pro Val Ala Glu Val Arg Ala Asp 195 200 205 Leu Glu Lys Ile Leu Gly 210 <210> 97 <211> 143 <212> PRT <213> Escherichia coli <400> 97 Met Ala Ile Glu Arg Thr Phe Ser Ile Ile Lys Pro Asn Ala Val Ala 1 5 10 15 Lys Asn Val Ile Gly Asn Ile Phe Ala Arg Phe Glu Ala Ala Gly Phe 20 25 30 Lys Ile Val Gly Thr Lys Met Leu His Leu Thr Val Glu Gln Ala Arg 35 40 45 Gly Phe Tyr Ala Glu His Asp Gly Lys Pro Phe Phe Asp Gly Leu Val 50 55 60 Glu Phe Met Thr Ser Gly Pro Ile Val Val Ser Val Leu Glu Gly Glu 65 70 75 80 Asn Ala Val Gln Arg His Arg Asp Leu Leu Gly Ala Thr Asn Pro Ala 85 90 95 Asn Ala Leu Ala Gly Thr Leu Arg Ala Asp Tyr Ala Asp Ser Leu Thr 100 105 110 Glu Asn Gly Thr His Gly Ser Asp Ser Val Glu Ser Ala Ala Arg Glu 115 120 125 Ile Ala Tyr Phe Phe Gly Glu Gly Glu Val Cys Pro Arg Thr Arg 130 135 140 <210> 98 <211> 227 <212> PRT <213> Escherichia coli <400> 98 Met Thr Ala Ile Ala Pro Val Ile Thr Ile Asp Gly Pro Ser Gly Ala 1 5 10 15 Gly Lys Gly Thr Leu Cys Lys Ala Met Ala Glu Ala Leu Gln Trp His 20 25 30 Leu Leu Asp Ser Gly Ala Ile Tyr Arg Val Leu Ala Leu Ala Ala Leu 35 40 45 His His His Val Asp Val Ala Ser Glu Asp Ala Leu Val Pro Leu Ala 50 55 60 Ser His Leu Asp Val Arg Phe Val Ser Thr Asn Gly Asn Leu Glu Val 65 70 75 80 Ile Leu Glu Gly Glu Asp Val Ser Gly Glu Ile Arg Thr Gln Glu Val 85 90 95 Ala Asn Ala Ala Ser Gln Val Ala Ala Phe Pro Arg Val Arg Glu Ala 100 105 110 Leu Leu Arg Arg Gln Arg Ala Phe Arg Glu Leu Pro Gly Leu Ile Ala 115 120 125 Asp Gly Arg Asp Met Gly Thr Val Val Phe Pro Asp Ala Pro Val Lys 130 135 140 Ile Phe Leu Asp Ala Ser Ser Glu Glu Arg Ala His Arg Arg Met Leu 145 150 155 160 Gln Leu Gln Glu Lys Gly Phe Ser Val Asn Phe Glu Arg Leu Leu Ala 165 170 175 Glu Ile Lys Glu Arg Asp Asp Arg Asp Arg Asn Arg Ala Val Ala Pro 180 185 190 Leu Val Pro Ala Ala Asp Ala Leu Val Leu Asp Ser Thr Thr Leu Ser 195 200 205 Ile Glu Gln Val Ile Glu Lys Ala Leu Gln Tyr Ala Arg Gln Lys Leu 210 215 220 Ala Leu Ala 225 <210> 99 <211> 474 <212> PRT <213> Arabidopsis thaliana <400> 99 Met Ala Asn Asn Asn Ser Asn Ser Pro Thr Gly Pro His Phe Leu Phe 1 5 10 15 Val Thr Phe Pro Ala Gln Gly His Ile Asn Pro Ser Leu Glu Leu Ala 20 25 30 Lys Arg Leu Ala Gly Thr Ile Ser Gly Ala Arg Val Thr Phe Ala Ala 35 40 45 Ser Ile Ser Ala Tyr Asn Arg Arg Met Phe Ser Thr Glu Asn Val Pro 50 55 60 Glu Thr Leu Ile Phe Ala Thr Tyr Ser Asp Gly His Asp Asp Gly Phe 65 70 75 80 Lys Ser Ser Ala Tyr Ser Asp Lys Ser Arg Gln Asp Ala Thr Gly Asn 85 90 95 Phe Met Ser Glu Met Arg Arg Arg Gly Lys Glu Thr Leu Thr Glu Leu 100 105 110 Ile Glu Asp Asn Arg Lys Gln Asn Arg Pro Phe Thr Cys Val Val Tyr 115 120 125 Thr Ile Leu Leu Thr Trp Val Ala Glu Leu Ala Arg Glu Phe His Leu 130 135 140 Pro Ser Ala Leu Leu Trp Val Gln Pro Val Thr Val Phe Ser Ile Phe 145 150 155 160 Tyr His Tyr Phe Asn Gly Tyr Glu Asp Ala Ile Ser Glu Met Ala Asn 165 170 175 Thr Pro Ser Ser Ser Ile Lys Leu Pro Ser Leu Pro Leu Leu Thr Val 180 185 190 Arg Asp Ile Pro Ser Phe Ile Val Ser Ser Asn Val Tyr Ala Phe Leu 195 200 205 Leu Pro Ala Phe Arg Glu Gln Ile Asp Ser Leu Lys Glu Glu Ile Asn 210 215 220 Pro Lys Ile Leu Ile Asn Thr Phe Gln Glu Leu Glu Pro Glu Ala Met 225 230 235 240 Ser Ser Val Pro Asp Asn Phe Lys Ile Val Pro Val Gly Pro Leu Leu 245 250 255 Thr Leu Arg Thr Asp Phe Ser Ser Arg Gly Glu Tyr Ile Glu Trp Leu 260 265 270 Asp Thr Lys Ala Asp Ser Ser Val Leu Tyr Val Ser Phe Gly Thr Leu 275 280 285 Ala Val Leu Ser Lys Lys Gln Leu Val Glu Leu Cys Lys Ala Leu Ile 290 295 300 Gln Ser Arg Arg Pro Phe Leu Trp Val Ile Thr Asp Lys Ser Tyr Arg 305 310 315 320 Asn Lys Glu Asp Glu Gln Glu Lys Glu Glu Asp Cys Ile Ser Ser Phe 325 330 335 Arg Glu Glu Leu Asp Glu Ile Gly Met Val Val Ser Trp Cys Asp Gln 340 345 350 Phe Arg Val Leu Asn His Arg Ser Ile Gly Cys Phe Val Thr His Cys 355 360 365 Gly Trp Asn Ser Thr Leu Glu Ser Leu Val Ser Gly Val Pro Val Val 370 375 380 Ala Phe Pro Gln Trp Asn Asp Gln Met Met Asn Ala Lys Leu Leu Glu 385 390 395 400 Asp Cys Trp Lys Thr Gly Val Arg Val Met Glu Lys Lys Glu Glu Glu 405 410 415 Gly Val Val Val Val Asp Ser Glu Glu Ile Arg Arg Cys Ile Glu Glu 420 425 430 Val Met Glu Asp Lys Ala Glu Glu Phe Arg Gly Asn Ala Thr Arg Trp 435 440 445 Lys Asp Leu Ala Ala Glu Ala Val Arg Glu Gly Gly Ser Ser Phe Asn 450 455 460 His Leu Lys Ala Phe Val Asp Glu His Met 465 470

Claims (229)

  1. 당화 생성물의 제조 방법으로서,
    하나 이상의 재조합 UDP-의존성 당전이(UGT) 효소를 발현하는 박테리아 세포를 제공하는 단계로서, 상기 박테리아 세포는 재조합 수크로스 합성효소의 발현, 및 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형 중 하나 이상을 갖는, 단계;
    당화용 기질의 존재 하에서 박테리아 세포를 배양하는 단계; 및
    당화 생성물을 회수하는 단계
    를 포함하는, 방법.
  2. 제1 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 종, 바실러스 종, 로도박터 종, 자이모모나스 종 또는 슈도모나스 종인, 방법.
  3. 제2 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다인, 방법.
  4. 제3항에 있어서, 상기 박테리아 균주는 E. 콜리인, 방법.
  5. 제1 항 내지 제4 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 서열 번호: 1 내지 12 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 재조합 수크로스 합성효소를 발현하는, 방법.
  6. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 1 내지 12 중 하나와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  7. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 2와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 2에 대해 S11E 치환을 갖는, 방법.
  8. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 3과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 3에 대해 L637M 및 T640V 치환을 갖는, 방법.
  9. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 5와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  10. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 6과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  11. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 7과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 7에 대해 S11E 치환을 갖는, 방법.
  12. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 8과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 8에 대해 S11E 치환을 갖는, 방법.
  13. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 9와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  14. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 10과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 10에 대해 S11E 치환을 갖는, 방법.
  15. 제5 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 11과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  16. 제1 항 내지 제15 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 수크로스의 존재 하에서 배양되는, 방법.
  17. 제1 항 내지 제16 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 이하의 유전자 변형을 포함하는, 방법: ushA 및 galETKM, 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; pgi 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가함; E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95), 또는 이의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가함.
  18. 제1 항 내지 제16 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 pgm 또는 이의 병렬상동체 또는 유도체, 및 선택적으로 galU 또는 이의 병렬상동체 또는 유도체의 과다 발현 또는 활성 증가를 포함하는, 방법.
  19. 제1 항 내지 제16 항 중 어느 한 항에 있어서, 상기 미생물 세포는 ushA 또는 이의 병렬상동체, 및/또는 galE, galT, galK 및 galM 또는 이의 병렬상동체(들)중 하나 이상의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 방법.
  20. 제19 항에 있어서, galETKM 유전자 또는 이의 병렬상동체는 불활성화되거나, 결실되거나, 발현 또는 활성이 감소되는, 방법.
  21. 제1 항 내지 제16 항 중 어느 한 항에 있어서, 상기 pgi (포도당-6-포스페이트 이소머라제) 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소되는, 방법.
  22. 제1 항 내지 제21 항 중 어느 한 항에 있어서, 상기 미생물 세포는 otsA(트레할로스-L-포스페이트 합성효소) 또는 이의 병렬상동체, 및/또는 otsB(트레할로스-L-포스페이트 포스파타제) 또는 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 방법.
  23. 제1 항 내지 제22 항 중 어느 한 항에 있어서, 상기 미생물 세포는 ugd(UDP-포도당 6-탈수소화 효소) 또는 이의 병렬상동체; rfaQ-G-P-S-B-I-J 또는 이의 병렬상동체(들); yfdG-H-I 또는 이의 병렬상동체(들); wcaJ 또는 이의 병렬상동체; 및 glgC 또는 이의 병렬상동체 중 하나 이상의 결실, 불활성화 또는 활성 또는 발현의 감소를 갖는, 방법.
  24. 제1 항 내지 제23 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 E. 콜리 ycjU (β-포스포글루코뮤타제)(서열 번호: 94) 또는 이의 병렬상동체 또는 유도체, 비피도박테리움 비피둠 ugpA (UTP-포도당-1-포스페이트 우리딜릴트랜스퍼라제)(서열 번호: 95) 또는 이의 병렬상동체 또는 유도체, E. 콜리 adk(아데닐레이트 키나제)(서열 번호: 96) 또는 이의 병렬상동체 또는 유도체, E. 콜리 ndk(뉴클레오시드 디포스페이트 키나제)(서열 번호: 97) 또는 이의 병렬상동체 또는 유도체, 및 E. 콜리 cmk(시티딘 모노포스페이트 키나제)(서열 번호: 98) 또는 이의 병렬상동체 또는 유도체 중 하나 이상의 과다 발현, 또는 활성 또는 발현의 증가를 갖는, 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 당화용 기질은 식물 추출물 또는 이의 분획으로 제공되거나, 합성이나 생합성 공정에 의해 생산되는, 방법.
  26. 제25 항에 있어서, 상기 기질은 테르페노이드 또는 테르페노이드 글리코시드, 플라보노이드 또는 플라보노이드 글리코시드, 칸나비노이드 또는 칸나비노이드 글리코시드, 폴리케티드 또는 폴리케티드 글리코시드, 스틸베노이드 또는 스틸베노이드 글리코시드, 및 폴리페놀 또는 폴리페놀 글리코시드로부터 선택된 2차 대사산물인, 방법.
  27. 제26 항에 있어서, 상기 기질은 테르페노이드 글리코시드를 포함하는, 방법.
  28. 제27 항에 있어서, 상기 테르페노이드 글리코시드는 스테비올 글리코시드, 또는 모그롤 글리코시드를 포함하는, 방법.
  29. 제25항 내지 제28항 중 어느 한 항에 있어서, 상기 기질은 0 개, 1 개, 2 개, 3 개 또는 4 개의 글리코실 기를 갖는, 방법.
  30. 제29 항에 있어서, 상기 글리코실 기는 글루코실, 갈락토실, 만노실, 자일로실 및 람노실 기로부터 독립적으로 선택되는, 방법.
  31. 제30 항에 있어서, 상기 글리코실 기는 글루코실인, 방법.
  32. 제30 항 또는 제31 항에 있어서, 상기 당화 생성물은 적어도 4 개, 적어도 5 개, 적어도 6 개, 또는 적어도 7 개의 글리코실 기를 갖는, 방법.
  33. 제29 항 내지 제32 항 중 어느 한 항에 있어서, 상기 생성물의 생합성은 박테리아 세포에 의한 적어도 2 번의 기질의 당화 반응을 수반하는, 방법.
  34. 제28 항에 있어서, 상기 기질은 스테비아 잎 추출물 또는 이의 분획으로 제공되는, 방법.
  35. 제34 항에 있어서, 상기 스테비아 잎 추출물은 스테비올, 스테비오시드, 스테비올비오시드, 레바우디오시드 A, 둘코시드 A, 둘코시드 B, 레바우디오시드 C 및 레바우디오시드 F 중 하나 이상을 포함하는, 방법.
  36. 제35 항에 있어서, 상기 추출물 또는 이의 분획 내 스테비올 글리코시드의 적어도 약 30%는 스테비오시드, 스테비올비오시드 및 레바우디오시드 A로부터 선택되는, 방법.
  37. 제35 항 또는 제36 항에 있어서, 상기 당화 생성물은 RebM을 포함하는, 방법.
  38. 제37 항에 있어서, 상기 UGT 효소는 스테비올 코어의 C13 및 C19 하이드록실에서의 1 차 당화, 및 C13 및 C19 1 차 글리코실 기의 1-2 및 1-3 분지형 당화가 가능한, 방법.
  39. 제38 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 32, 및 84 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택되는, 방법.
  40. 제36 항에 있어서, 상기 당화 생성물은 RebE 및/또는 RebD를 포함하는, 방법.
  41. 제40 항에 있어서, 상기 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-2 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 방법.
  42. 제41 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 16, 및 26 내지 29 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 방법.
  43. 제35 항 또는 제36 항에 있어서, 상기 당화 생성물은 RebB를 포함하는, 방법.
  44. 제43 항에 있어서, 상기 박테리아 세포는 스테비올 C19 1 차 글리코실 기의 탈당화가 가능한 하나 이상의 UGT 효소를 발현하는, 방법.
  45. 제44 항에 있어서, 상기 UGT 효소는 서열 번호: 18, 30, 31 및 99 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 방법.
  46. 제43 항 내지 제45 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 서열 번호: 31 또는 99와 적어도 약 70%의 서열 동일성을 갖는 UGT 효소를 발현하는, 방법.
  47. 제43항 내지 제46항 중 어느 한 항에 있어서, 상기 당화용 기질은 RebA를 포함하는, 방법.
  48. 제36 항에 있어서, 상기 당화 생성물은 RebI를 포함하는, 방법.
  49. 제48 항에 있어서, 상기 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-3 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 방법.
  50. 제49 항에 있어서, 상기 UGT 효소는 서열 번호: 19 내지 25 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 방법.
  51. 제28 항에 있어서, 상기 기질은 나한과 추출물 또는 이의 분획으로 제공되거나, 생합성으로 생산된 모그롤 또는 모그롤 글리코시드로서 제공되는, 방법.
  52. 제51 항에 있어서, 상기 기질은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 하나 이상의 기질을 포함하는, 방법.
  53. 제52항에 있어서, 상기 당화 생성물은 mog. IV, mog. IVA, mog. V, mog VI, isomog V 또는 시아메노시드를 포함하는, 방법.
  54. 제52 항 또는 제53 항에 있어서, 상기 UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화, 및 C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능한, 방법.
  55. 제54 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 17, 29, 33 내지 39, 46, 54, 60, 71 내지 80, 및 82 내지 84 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택되는, 방법.
  56. 제1 항 내지 제55 항 중 어느 한 항에 있어서, 상기 UGT 효소를 암호화하는 유전자는 미생물 세포의 염색체에 통합되거나, 염색체 외에서 발현되는, 방법.
  57. 제56 항에 있어서, 상기 방법은 기질을 당화 생성물로 적어도 40% 전환시키는, 방법.
  58. 제57 항에 있어서, 상기 방법은 기질을 당화 생성물로 적어도 75% 전환시키는, 방법.
  59. 제1 항 내지 제58 항 중 어느 한 항에 있어서, 복합 배지 또는 최소 배지에서의 성장에 의해 상기 박테리아 세포의 바이오매스가 생성되는, 방법.
  60. 제1 항 내지 제59 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 하나 이상의 탄소원을 갖는 당화용 기질의 존재 하에서 배양되는, 방법.
  61. 제60 항에 있어서, 상기 탄소원은 포도당, 수크로스, 과당, 자일로스 및 글리세롤 중 하나 이상을 포함하는, 방법.
  62. 제61 항에 있어서, 배양 조건은 호기성, 미세호기성 및 혐기성으로부터 선택되는, 방법.
  63. 제56 항 내지 제62 항 중 어느 한 항에 있어서, 상기 배양은 유가 공정에서 수행되는, 방법.
  64. 제63 항에 있어서, 상기 기질은 약 72 시간 이하 동안 박테리아 세포와 함께 인큐베이션되는, 방법.
  65. 제57 항 내지 제64 항 중 어느 한 항에 있어서, 회수는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계를 포함하는, 방법.
  66. 당화 생성물을 제조하기 위한 박테리아 세포로서, 상기 박테리아 세포는 하나 이상의 재조합 UDP-의존성 당전이(UGT) 효소를 발현하고 재조합 수크로스 합성효소의 발현, 및 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형 중 하나 이상을 갖는, 박테리아 세포.
  67. 제66 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 종, 바실러스 종, 로도박터 종, 자이모모나스 종 또는 슈도모나스 종인, 박테리아 세포.
  68. 제67 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 스패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다인, 박테리아 세포.
  69. 제67항에 있어서, 상기 박테리아 균주는 E. 콜리인, 박테리아 세포.
  70. 제66 항 내지 제69 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 서열 번호: 1 내지 12 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 재조합 수크로스 합성효소를 발현하는, 박테리아 세포.
  71. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 1 내지 12 중 하나와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
  72. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 2와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 2에 대해 S11E 치환을 갖는, 박테리아 세포.
  73. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 3과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 3에 대해 L637M 및 T640V 치환을 갖는, 박테리아 세포.
  74. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 5와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
  75. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 6과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
  76. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 7과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 7에 대해 S11E 치환을 갖는, 박테리아 세포.
  77. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 8과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 8에 대해 S11E 치환을 갖는, 박테리아 세포.
  78. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 9와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
  79. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 10과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 10에 대해 S11E 치환을 갖는, 박테리아 세포.
  80. 제70 항에 있어서, 상기 수크로스 합성효소는 서열 번호: 11과 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 박테리아 세포.
  81. 제66 항 내지 제80 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 이하의 유전자 변형을 포함하는, 박테리아 세포: ushA 및 galETKM, 또는 이들의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; pgi 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가함; E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가함.
  82. 제66 항 내지 제81 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 pgm 또는 이의 병렬상동체 또는 유도체, 및 선택적으로 galU 또는 이의 병렬상동체 또는 유도체의 과다 발현 또는 활성 증가를 포함하는, 박테리아 세포.
  83. 제66 항 내지 제81 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 ushA 또는 이의 병렬상동체, 및/또는 galE, galT, galK 및 galM 또는 이의 병렬상동체(들) 중 하나 이상의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 박테리아 세포.
  84. 제83 항에 있어서, 상기 galETKM 유전자 또는 이의 병렬상동체는 불활성화되거나, 결실되거나, 발현 또는 활성이 감소되는, 박테리아 세포.
  85. 제66 항 내지 제81 항 중 어느 한 항에 있어서, 상기 pgi (포도당-6-포스페이트 이소머라제) 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소되는, 박테리아 세포.
  86. 제66 항 내지 제85 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 otsA (트레할로스-6-포스페이트 합성효소) 또는 이의 병렬상동체, 및/또는 otsB (트레할로스-포스페이트 포스파타제) 또는 이의 병렬상동체의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 박테리아 세포.
  87. 제66 항 내지 제86 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 ugd (UDP-포도당 6-탈수소화 효소) 또는 이의 병렬상동체; rfaQ-G-P-S-B-I-J 또는 이의 병렬상동체(들); yfdG-H-I 또는 이의 병렬상동체(들); wcaJ 또는 이의 병렬상동체; 및 glgC 또는 이의 병렬상동체 중 하나 이상의 결실, 불활성화, 또는 활성 또는 발현의 감소를 갖는, 박테리아 세포.
  88. 제66 항 내지 제87 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 E. 콜리 ycjU (β-포스포글루코뮤타제)(서열 번호: 94) 또는 이의 병렬상동체 또는 유도체, 비피도박테리움 비피둠 ugpA (UTP-포도당-1-포스페이트 우리딜릴트랜스퍼라제)(서열 번호: 95) 또는 이의 병렬상동체 또는 유도체, E. 콜리 adk(아데닐레이트 키나제)(서열 번호: 96) 또는 이의 병렬상동체 또는 유도체, E. 콜리 ndk(뉴클레오시드 디포스페이트 키나제)(서열 번호: 97) 또는 이의 병렬상동체 또는 유도체, 및 E. 콜리 cmk(시티딘 모노포스페이트 키나제)(서열 번호: 98) 또는 이의 병렬상동체 또는 유도체 중 하나 이상의 과다 발현, 또는 활성 또는 발현의 증가를 갖는, 방법.
  89. 제66 항 내지 제88 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 서열 번호: 13 내지 84로부터 선택된 아미노산 서열과 적어도 약 70% 동일한 아미노산 서열을 포함하는 하나 이상의 UGT 효소를 발현하는, 박테리아 세포.
  90. 제89 항에 있어서, 상기 박테리아 세포는 테르페노이드 글리코시드 기질을 당화시키는, 박테리아 세포.
  91. 제90 항에 있어서, 상기 박테리아 세포는 스테비올 글리코시드 또는 모그롤 글리코시드 기질을 당화시키는, 박테리아 세포.
  92. 제91 항에 있어서, 상기 UGT 효소는 스테비올 코어의 C13 및 C19 하이드록실에서의 1 차 당화, 및 C13 및 C19 1 차 글리코실 기의 1-2 및 1-3 분지형 당화가 가능한, 박테리아 세포.
  93. 제92 항에 있어서, 상기 박테리아 세포는 스테비아 잎 추출물 또는 이의 분획으로부터 RebM을 생산하는, 박테리아 세포.
  94. 제92 항 또는 제93 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 32, 및 84 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택되는, 박테리아 세포.
  95. 제91 항에 있어서, 상기 박테리아 세포는 스테비아 잎 추출물 또는 이의 분획으로부터 RebE 및/또는 RebD을 생산하는, 박테리아 세포.
  96. 제95 항에 있어서, 상기 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-2 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 박테리아 세포.
  97. 제96 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 16, 및 26 내지 29 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 박테리아 세포.
  98. 제91 항에 있어서, 상기 박테리아 세포는 스테비아 잎 추출물 또는 이의 분획으로부터 RebB를 생산하는, 박테리아 세포.
  99. 제98 항에 있어서, 상기 박테리아 세포는 스테비올 C19 1 차 글리코실 기의 탈당화가 가능한 하나 이상의 UGT 효소를 발현하는, 박테리아 세포.
  100. 제99 항에 있어서, 상기 UGT 효소는 서열 번호: 18, 30, 31 및 99 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 박테리아 세포.
  101. 제100 항에 있어서, 상기 박테리아 세포는 서열 번호: 31 또는 99와 적어도 70%의 동일성을 갖는 UGT 효소를 발현하는, 방법.
  102. 제91 항에 있어서, 상기 박테리아 세포는 스테비아 잎 추출물 또는 이의 분획으로부터 RebI를 생산하는, 박테리아 세포.
  103. 제102 항에 있어서, 상기 박테리아 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-3 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 박테리아 세포.
  104. 제103 항에 있어서, 상기 UGT 효소는 서열 번호: 19 내지 25 중 하나와 적어도 약 70%의 서열 동일성을 갖는 효소로부터 선택되는, 박테리아 세포.
  105. 제91 항에 있어서, 상기 박테리아 세포는 나한과 추출물로부터 mog. V, mog VI, isomog. V 또는 시아메노시드를 생산하는, 박테리아 세포.
  106. 제105 항에 있어서, 상기 UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화, 및 C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능한, 박테리아 세포.
  107. 제106 항에 있어서, 상기 UGT 효소는 서열 번호: 13 내지 17, 29, 33 내지 39, 46, 54, 60, 71 내지 80, 및 82 내지 84 중 하나와 적어도 약 70%의 서열 동일성을 갖는 아미노산 서열을 포함하는 효소로부터 선택되는, 박테리아 세포.
  108. 제66 항 내지 제107 항 중 어느 한 항에 있어서, 상기 UGT 효소를 암호화하는 유전자는 미생물 세포의 염색체에 통합되거나, 염색체 외에서 발현되는, 박테리아 세포.
  109. 기질의 당화 방법으로서, 제66 항 내지 제108 항 중 어느 한 항의 세포를 당화용 기질의 존재 하에서 배양하는 단계, 및 당화 생성물을 회수하는 단계를 포함하는, 방법.
  110. 제109 항에 있어서, 상기 당화 생성물은 반응물 또는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계 중 하나 이상; 이후의 효소 또는 바이오매스의 제거 단계에 의해 회수되는, 방법.
  111. UDP-의존성 당전이(UGT) 효소로서, 서열 번호: 13과 적어도 약 70%의 서열 동일성을 갖고, 하기로부터 선택된 하나 이상의 변형을 갖는 아미노산 서열을 포함하는, UDP-의존성 당전이(UGT) 효소:
    V397S, V397C, G5N, S20E, S23D, R45Y, H59P, G94S, K97E, M150L, I185F, A206P, G210E, Q237R, M250K, A251E, C252L, G259E, Q263Y, I287M, C288F, V336I, F338L, D351E, F186I, F186M, F186T, L418F, A451T, A451L, T453K, T453R, V456S, V456W, V456T, V456M로부터 선택된 하나 이상의 아미노산 치환;
    주로 글리신 및 세린 아미노산으로 구성된 5 내지 15 개의 아미노산에 의한, 서열 번호: 13의 잔기 270 내지 281의 치환;
    서열 번호: 13에 대한 위치 3으로의 1 개 또는 2 개의 아미노산의 삽입, 및/또는 서열 번호: 13의 C-말단으로의 1 개의 아미노산의 첨가.
  112. 제111 항에 있어서, 상기 UGT 효소는 서열 번호: 13의 아미노산 270 내지 281이 서열 GGSGGS(서열 번호: 85)로 치환되는, UGT 효소.
  113. 제111 항 또는 제112 항에 있어서, 상기 UGT 효소는 서열 번호: 13의 위치 3에 Arg이 삽입되거나, 위치 2와 3 사이에 Ile-Arg이 삽입되는, UGT 효소.
  114. 제111 항에 있어서, 상기 효소는 서열 번호: 13에 대해 G5N, F186T 및 V397S로부터 선택된 하나 이상의 치환을 포함하는, UGT 효소.
  115. 제114 항에 있어서, 상기 효소는 서열 번호: 13에 대해 아미노산 치환 G5N, F186T 및 V397S를 포함하는, UGT 효소.
  116. 제111 항에 있어서, 서열 번호: 14의 아미노산 서열을 포함하는, UGT 효소.
  117. UDP-의존성 당전이(UGT) 효소로서, 서열 번호: 14와 적어도 약 70%의 서열 동일성을 갖고, 하기로부터 선택된 하나 이상의 변형을 갖는 아미노산 서열을 포함하는, UDP-의존성 당전이(UGT) 효소:
    V395A, Q263Y, D269R, K97E, Q262E, H59P, G259E, M150L, Y267H, T3R, V95Q, A238E, S308Q, Q237R, R45Y, E254D, L203I, S151R, S123D, D351E, T453M, G94T, T186M, V336I, L58S, F338L, F51W, C252L, M250D, A251E, C252V, A79P, W401F, S323A, A251E, A130D, S42E, H400Y, S266R, S23D, P56A, A206P, M250K, A143W, V456T, G94S, I427F, T186I, T453F, C252R, V38F, R45F, T37S, Q244K, L11I, I287M, V31P, T43D 및 P39T로부터 선택된 하나 이상의 아미노산 치환;
    주로 글리신 및 세린 아미노산으로 구성된 5 내지 15 개의 아미노산의 링커에 의한, 서열 번호: 2의 잔기 270 내지 281의 결실;
    서열 번호: 14에 대한 위치 3으로의 1 개 또는 2 개의 아미노산의 삽입, 및/또는 서열 번호: 14의 C-말단으로의 1 개의 아미노산의 첨가.
  118. 제117 항에 있어서, 상기 UGT 효소는 서열 번호: 14의 아미노산 270 내지 281이, 주로 Ser 및 Gly로 구성된 6 내지 12 개의 아미노산의 링커 서열에 의해 치환되는, UGT 효소.
  119. 제117 항 또는 제118 항에 있어서, 상기 효소는 서열 번호: 14에 대해 H59P, A238E 및 L417F로부터 선택된 하나 이상의 치환을 포함하는, UGT 효소.
  120. 제119 항에 있어서, 상기 효소는 서열 번호: 14에 대해 아미노산 치환 H59P, A238E 및 L417F를 포함하는, UGT 효소.
  121. 제120 항에 있어서, 상기 효소는 서열 번호: 14의 A2와 T3 사이에 삽입 또는 Arg-Arg를 포함하는, UGT 효소.
  122. 제120 항에 있어서, 서열 번호: 15의 아미노산 서열을 포함하는, UGT 효소.
  123. 서열 번호: 15와 적어도 약 70%의 서열 동일성을 갖고, 서열 번호: 15에 대해 125, 152, 153 및 442로부터 선택된 위치에 하나 이상의 아미노산 치환을 갖는 아미노산 서열을 포함하는, UDP-의존성 당전이(UGT) 효소.
  124. 제123 항에 있어서, 서열 번호: 15에 대해 M152A, S153A, P442D 및 S125V로부터 선택된 아미노산 치환을 포함하는, UGT 효소.
  125. 제124 항에 있어서, 서열 번호: 16의 아미노산 서열을 포함하는, UGT 효소.
  126. 모그롤 또는 모그롤 글리코시드 기질의 당화 방법으로서, 상기 방법은 상기 기질을 UDP-당의 존재 하에서 UDP-의존성 당전이(UGT) 효소와 접촉시키는 것을 포함하고, 상기 UGT 효소는 서열 번호: 84, 서열 번호: 80, 서열 번호: 46, 서열 번호: 83, 서열 번호: 82, 서열 번호: 73, 서열 번호: 72, 서열 번호: 78, 서열 번호: 54, 서열 번호: 74, 서열 번호: 75, 서열 번호: 76, 서열 번호: 13, 서열 번호: 14, 서열 번호: 15, 서열 번호: 16, 서열 번호: 29 및 서열 번호: 79로부터 선택된 아미노산 서열과 적어도 약 80%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  127. 제126 항에 있어서, 상기 기질은 서열 번호: 84, 서열 번호: 80, 서열 번호: 46, 서열 번호: 83, 서열 번호: 82, 서열 번호: 73, 서열 번호: 72, 서열 번호: 78, 서열 번호: 54, 서열 번호: 74, 서열 번호: 75, 서열 번호: 76, 서열 번호: 13, 서열 번호: 14, 서열 번호: 15, 서열 번호: 16, 서열 번호: 29 및 서열 번호: 79로부터 선택된 아미노산 서열과 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 UGT 효소와 접촉되는, 방법.
  128. 제126 항에 있어서, 상기 기질은 서열 번호: 84, 서열 번호: 80, 서열 번호: 83, 서열 번호: 73, 서열 번호: 72, 서열 번호: 54 및 서열 번호: 13으로부터 선택된 아미노산 서열과 적어도 약 80%의 서열 동일성을 갖는 아미노산 서열을 포함하는 UGT 효소와 접촉되는, 방법.
  129. 제128 항에 있어서, 상기 기질은 서열 번호: 84, 서열 번호: 80, 서열 번호: 83, 서열 번호: 73, 서열 번호: 72, 서열 번호: 54 및 서열 번호: 13으로부터 선택된 아미노산 서열과 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 UGT 효소와 접촉되는, 방법.
  130. 제126항 내지 제129항 중 어느 한 항에 있어서, 상기 기질은 식물 추출물 또는 이의 분획으로 제공되는, 방법.
  131. 제130 항에 있어서, 상기 식물 추출물은 나한과 추출물 또는 이의 분획인, 방법.
  132. 제130 항 또는 제131 항에 있어서, 상기 식물 추출물은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 하나 이상의 기질을 포함하는, 방법.
  133. 제132항에 있어서, 상기 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI 또는 시아메노시드를 포함하는, 방법.
  134. 제126항 내지 제133항 중 어느 한 항에 있어서, 상기 UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능한, 방법.
  135. 제126항 내지 제134항 중 어느 한 항에 있어서, 상기 기질이 UGT 효소를 발현하는 미생물 세포와 함께 배양되는, 방법.
  136. 제135항에 있어서, 상기 미생물 세포는 박테리아 세포인, 방법.
  137. 제136 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 종, 바실러스 종, 로도박터 종, 자이모모나스 종 또는 슈도모나스 종인, 방법.
  138. 제137 항에 있어서, 상기 박테리아 세포는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 스패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다인, 방법.
  139. 제138항에 있어서, 상기 박테리아 균주는 E. 콜리인, 방법.
  140. 제136 항 내지 제139 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형을 갖는, 방법.
  141. 제139 항 또는 제140 항에 있어서, 상기 박테리아 세포는 수크로스 합성효소를 발현하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 1 내지 12 중 하나와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  142. 제135 항에 있어서, 상기 미생물 세포는 선택적으로 사카로마이세스 세르비시애, 피키아 파스토리스야로우위아 리포리티카를 포함하는 사카로마이세스, 피키아 또는 야로우위아로부터 선택된 효모 세포인, 방법.
  143. 제126 항 내지 제134 항 중 어느 한 항에 있어서, 상기 기질이 UGT 효소를 포함하는 세포 용해물과 인큐베이션되거나, 정제된 재조합 UGT 효소와 인큐베이션되는, 방법.
  144. 제126 항 내지 제143 항 중 어느 한 항에 있어서, 상기 당화 생성물은 반응물 또는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 또는 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 용해도 개선제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계에 의해 회수되는, 방법.
  145. 글리코시드 생성물의 제조 방법으로서,
    무-세포 반응물 또는 미생물 배양물에서, 효소적 전이에 의해 하나 이상의 당 모이어티를 당화용 기질을 목표 글리코시드 생성물로 전환시키는 단계, 및
    당화 생성물을 반응물 또는 배양물으로부터 회수하는 단계로서, 상기 회수하는 단계는 반응물 또는 배양물의 pH를 약 pH 5 미만까지 낮추거나, 반응물 또는 배양물의 pH를 약 pH 9 초과까지 상승시키는 단계, 온도를 적어도 약 50℃까지 상승시키는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계 중 하나 이상; 및 이후의 효소 또는 바이오매스의 제거 단계
    를 포함하는, 방법.
  146. 제145 항에 있어서, 상기 당화용 기질은 식물 추출물 또는 이의 분획으로 제공되는, 방법.
  147. 제145 항 또는 146 항에 있어서, 상기 기질은 테르페노이드 또는 테르페노이드 글리코시드, 플라보노이드 또는 플라보노이드 글리코시드, 칸나비노이드 또는 칸나비노이드 글리코시드, 폴리케티드 또는 폴리케티드 글리코시드, 스틸베노이드 또는 스틸베노이드 글리코시드, 및 폴리페놀 또는 폴리페놀 글리코시드로부터 선택된 2차 대사산물인, 방법.
  148. 제147 항에 있어서, 상기 기질은 테르페노이드 글리코시드를 포함하는, 방법.
  149. 제148 항에 있어서, 상기 테르페노이드 글리코시드는 스테비올 글리코시드, 또는 모그롤 글리코시드를 포함하는, 방법.
  150. 제147 항 내지 제149 항 중 어느 한 항에 있어서, 상기 기질은 1 개, 2 개, 3 개 또는 4 개의 글리코실 기를 갖는, 방법.
  151. 제150 항에 있어서, 상기 글리코실 기는 글루코실, 갈락토실, 만노실, 자일로실 및 람노실 기로부터 독립적으로 선택되는, 방법.
  152. 제151 항에 있어서, 상기 당화 생성물은 적어도 5 개의 글리코실 기, 또는 적어도 6 개 또는 적어도 7 개의 글리코실 기를 갖는, 방법.
  153. 제145 항 내지 제152 항 중 어느 한 항에 있어서, 상기 생성물의 생합성은 기질에 대한 적어도 2 회의 당화 반응과 관련되는, 방법.
  154. 제145 항 내지 제153 항 중 어느 한 항에 있어서, 상기 식물 추출물은 스테비아 추출물 또는 이의 분획인, 방법.
  155. 제154 항에 있어서, 상기 스테비아 잎 추출물은 스테비오시드, 스테비올비오시드, 레바우디오시드 A, 둘코시드 A, 둘코시드 B, 레바우디오시드 C 및 레바우디오시드 F 중 하나 이상을 포함하는, 방법.
  156. 제155 항에 있어서, 상기 추출물 또는 이의 분획 내 스테비올 글리코시드의 적어도 약 30%는 스테비오시드, 스테비올비오시드 및 레바우디오시드 A로부터 선택되는, 방법.
  157. 제154 항 내지 제156 항 중 어느 한 항에 있어서, 상기 당화 생성물은 RebM을 포함하는, 방법.
  158. 제157 항에 있어서, 상기 UGT 효소는 스테비올 코어의 C13 및 C19 하이드록실에서의 1 차 당화, 및 C13 및 C19 1 차 글리코실 기의 1-2 및 1-3 분지형 당화가 가능한, 방법.
  159. 제154 항 내지 제156 항 중 어느 한 항에 있어서, 상기 당화 생성물은 RebE 및/또는 RebD를 포함하는, 방법.
  160. 제159 항에 있어서, 상기 미생물 세포는 스테비올 C13 및 C19 1 차 글리코실 기의 1-2 당화가 가능한 하나 이상의 UGT 효소를 발현하는, 방법.
  161. 제154 항 내지 제156 항 중 어느 한 항에 있어서, 상기 당화 생성물은 RebB를 포함하는, 방법.
  162. 제161 항에 있어서, 상기 UGT 효소는 스테비올 C19 1 차 글리코실 기의 탈당화가 가능한, 방법.
  163. 제154 항 내지 제156 항 중 어느 한 항에 있어서, 상기 당화 생성물은 RebI를 포함하는, 방법.
  164. 제163 항에 있어서, 상기 하나 이상의 UGT 효소는 스테비올 C13 및 C19 1 차 글리코실 기의 1-3 당화가 가능한, 방법.
  165. 제145 항 내지 제153 항 중 어느 한 항에 있어서, 상기 식물 추출물은 나한과 추출물 또는 이의 분획인, 방법.
  166. 제165 항에 있어서, 상기 나한과 추출물은 모그롤, mog. I-A, mog. I-E, mog. II-A, mog. II-E, mog III, mog IVA, mog. IV 및 시아메노시드로부터 선택된 하나 이상의 기질을 포함하는, 방법.
  167. 제165 항 또는 제166 항에 있어서, 상기 당화 생성물은 mog. IV, mog. IVA, mog. V, mog. VI 또는 시아메노시드를 포함하는, 방법.
  168. 제165 항 내지 제167 항 중 어느 한 항에 있어서, 상기 UGT 효소는 모그롤 코어의 C3 및 C24 하이드록실에서의 1 차 당화와, C3 및/또는 C24 1 차 글리코실 기의 1-2 및 1-6 분지형 당화가 가능한, 방법.
  169. 제145 항 내지 제168 항 중 어느 한 항에 있어서, 상기 효소적 전이는 미생물 배양물에서 일어나되, 상기 미생물 배양물은 하나 이상의 우리딘 디포스페이트-의존성 당전이(UGT) 효소를 발현하는 미생물 균주를 포함하는, 방법.
  170. 제169 항에 있어서, 상기 미생물 균주는 당화용 기질을 생산하는 생합성 경로를 발현하고, 하나 이상의 UGT 효소를 발현하는, 방법.
  171. 제169 항에 있어서, 상기 미생물 균주는 하나 이상의 UGT 효소를 발현하고, 상기 균주는 공급된 기질과 함께 배양되는, 방법.
  172. 제169 항 내지 제171 항 중 어느 한 항에 있어서, 상기 효소적 전이는 선택적으로 사카로마이세스 세르비시애, 피키아 파스토리스야로우위아 리포리티카를 포함하는, 사카로마이세스, 피키아 또는 야로우위아로부터 선택된 효모 균주의 미생물 배양에 의해 이루어지는, 방법.
  173. 제169 항 내지 제171 항 중 어느 한 항에 있어서, 상기 효소적 전이는 박테리아 균주의 미생물 배양에 의해 이루어지는, 방법.
  174. 제173 항에 있어서, 상기 박테리아 균주는 에스체리쉬아 종, 바실러스 종, 로도박터 종, 자이모모나스 종 또는 슈도모나스 종인, 방법.
  175. 제174 항에 있어서, 상기 박테리아 균주는 에스체리쉬아 콜리, 바실러스 서브틸리스, 로도박터 캅슐라투스, 로도박터 스패로이데스, 자이모모나스 모빌리스 또는 슈도모나스 푸티다인, 방법.
  176. 제175항에 있어서, 상기 박테리아 균주는 E. 콜리인, 방법.
  177. 제173 항 내지 제176 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 UDP-당의 이용가능성을 증가시키는 하나 이상의 유전자 변형을 갖는, 방법.
  178. 제173 항 내지 제177 항 중 어느 한 항에 있어서, 상기 박테리아 세포는 수크로스 합성효소를 발현하고, 상기 수크로스 합성효소는 선택적으로 서열 번호: 1 내지 12 중 하나와 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법.
  179. 제177 항 또는 제178 항에 있어서, 상기 박테리아 세포는 하기의 유전자 변형을 포함하는, 방법: ushA 및 galETKM, 또는 이들의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; pgi 또는 이의 병렬상동체는 결실되거나, 불활성화되거나, 발현 또는 활성이 감소됨; E. 콜리 pgm (서열 번호: 92) 및/또는 ycjU (서열 번호: 94), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가됨; E. 콜리 galU (서열 번호: 93) 및/또는 비피도박테리움 비피둠 ugpA (서열 번호: 95), 또는 이들의 병렬상동체 또는 유도체는 과다 발현되거나, 활성이 증가됨.
  180. 제145 항 내지 제179 항 중 어느 한 항에 있어서, 공정은 배치, 연속 또는 반-연속 방식으로 수행되는, 방법.
  181. 제180 항에 있어서, 상기 방법은 유가 연속 또는 반-연속 방식으로 공급되어 수행되는, 방법.
  182. 제180 항 또는 제181 항에 있어서, 상기 효소적 전이는 부피가 적어도 10,000 L, 또는 적어도 50,000 L, 또는 적어도 100,000 L, 또는 적어도 150,000 L, 또는 적어도 200,000 L, 또는 적어도 500,000 L인 생물반응기에서 일어나는, 방법.
  183. 제182 항에 있어서, 상기 글리코시드 중간생성물은 적어도 약 24 시간, 또는 적어도 약 48 시간, 또는 적어도 약 72 시간 동안 미생물 균주와 함께 인큐베이션되는, 방법.
  184. 제182 항 또는 제183 항에 있어서, 상기 글리코시드 중간생성물은 약 72 시간 이하 동안 미생물 균주와 함께 인큐베이션되는, 방법.
  185. 제145 항 내지 제184 항 중 어느 한 항에 있어서, 상기 pH는 약 2 내지 약 4의 범위 내의 pH, 및 선택적으로 약 pH 3.5로 조절되는, 방법.
  186. 제145 항 내지 제184 항 중 어느 한 항에 있어서, 상기 pH는 약 9 내지 약 12의 범위 내의 pH로 조절되는, 방법.
  187. 제145 항 내지 제186 항 중 어느 한 항에 있어서, 상기 온도는 약 50℃ 내지 약 90℃, 및 선택적으로 약 70℃ 또는 약 80℃의 온도로 조절되는, 방법.
  188. 제185 항 내지 제187 항 중 어느 한 항에 있어서, 반응물 또는 배양 배지는 pH 및/또는 온도 조절을 위해 반응 탱크로부터 하베스트 탱크로 옮겨지며, 선택적으로 상기 반응 탱크와 하베스트 탱크는 직렬 상태인, 방법.
  189. 제188 항에 있어서, 상기 pH 조절 및 상기 온도 조절은 동일한 하베스트 탱크에서 일어나는, 방법.
  190. 제188 항에 있어서, 상기 pH 조절 및 상기 온도 조절은 상이한 하베스트 탱크에서 일어나는, 방법.
  191. 제189 항 또는 제190 항에 있어서, 상기 pH 조절은 상기 온도 조절에 앞서 일어나는, 방법.
  192. 제189 항 또는 제190 항에 있어서, 상기 온도 조절은 상기 pH 조절에 앞서 일어나는, 방법.
  193. 제189 항에 있어서, 상기 pH 조절 및 상기 온도 조절은 실질적으로 동시에 일어나는, 방법.
  194. 제185 항 내지 제193 항 중 어느 한 항에 있어서, 상기 pH 조절은 유기산 또는 무기산의 첨가에 의해 일어나는, 방법.
  195. 제145 항 내지 제194 항 중 어느 한 항에 있어서, 하나 이상의 글리코시드 용해도 개선제를 첨가하는 것을 포함하는, 방법.
  196. 제187 항 내지 제195 항 중 어느 한 항에 있어서, 상기 온도 조절은 반응 배지 또는 배양물을 예열된 하베스트 탱크로 전달함으로써 일어나는, 방법.
  197. 제145 항 내지 제196 항 중 어느 한 항에 있어서, 바이오매스 및/또는 효소를 원심분리에 의해 제거하여, 정화된 배지를 제조하는, 방법.
  198. 제197 항에 있어서, 상기 공정은 디스크 스택 분리기에 의한 바이오매스의 제거를 포함하는, 방법.
  199. 제198 항에 있어서, 상기 바이오매스는 글리코시드 생성물의 회수를 위해 재가공되는, 방법.
  200. 제198 항에 있어서, 상기 바이오매스는 폐기물로 가공되는, 방법.
  201. 제197 항 내지 제200 항 중 어느 한 항에 있어서, 정화된 배지는 하나 이상의 결정화 용기에 직접 또는 간접적으로 전달되는, 방법.
  202. 제201 항에 있어서, 결정화에 앞서, 여과, 이온 교환, 활성탄, 벤토나이트, 친화성 크로마토그래피 및 소화로부터 선택된 하나 이상의 공정을 사용하여 상기 정화된 배지로부터 상기 글리코시드 생성물을 정제하는, 방법.
  203. 제202 항에 있어서, 상기 친화성 크로마토그래피는 스티렌-디비닐벤젠 흡착성 수지, 강산성 양이온 교환 수지, 약산성 양이온 교환 수지, 강염기성 음이온 교환 수지, 약염기성 음이온 교환 수지 및 소수성 상호작용 수지 중 하나 이상을 이용하는, 방법.
  204. 제202 항 또는 제203 항에 있어서, 상기 공정은 시뮬레이션 이동층 크로마토그래피를 이용하는, 방법.
  205. 제203 항에 있어서, 결정화에 앞서, 상기 글리코시드 생성물이 선택적으로 약 5 kD의 막 기공 크기를 갖는 접선 유동 여과(TFF)에 의해 정제되는, 방법.
  206. 제202 항 내지 제205 항 중 어느 한 항에 있어서, 상기 회수는 어떠한 유기 용매도 이용하지 않는, 방법.
  207. 제202 항 내지 제206 항 중 어느 한 항에 있어서, 적어도 2 개의 결정화 단계가 이용되는, 방법.
  208. 제207 항에 있어서, 재결정화 단계에 앞서, 상기 글리코시드 생성물은 용액 또는 현탁액의 pH를 pH 5 미만으로 낮추거나, 용액 또는 현탁액의 pH를 pH 9 초과까지 상승시키는 단계, 용액 또는 현탁액의 온도를 적어도 약 50℃로 올리는 단계, 및 하나 이상의 글리코시드 가용화제를 첨가하는 단계에 의해 재가용화되는, 방법.
  209. 제207 항에 있어서, 상기 재결정화는 약 4 내지 약 12의 pH에서 수행되는, 방법.
  210. 제208 항 또는 제209 항에 있어서, 상기 재결정화 용매는 선택적으로 약 5 부피% 내지 약 50 부피%의 에탄올, 또는 약 25 부피% 내지 약 50 부피%의 에탄올, 또는 약 30 부피% 내지 약 40 부피%의 에탄올과 물인, 방법.
  211. 제210 항에 있어서, 상기 재결정화는 약 0.1 wt% 내지 약 2 wt% 범위의 하나 이상의 용해도 개선제의 존재 하에서 수행되는, 방법.
  212. 제211 항에 있어서, 상기 용해도 개선제는 글리세롤인, 방법.
  213. 제202 항 내지 제212 항 중 어느 한 항에 있어서, 상기 결정화 단계는 정적 결정화, 교반 결정화 및 증발 결정화 중 하나 이상의 상을 포함하는, 방법.
  214. 제213 항에 있어서, 상기 결정화 단계는 정지 상 이후 교반 상을 포함하는, 방법.
  215. 제207 항 내지 제214 항 중 어느 한 항에 있어서, 결정은 바스켓 원심분리 또는 벨트 필터를 사용하여 단리됨으로써, 글리코시드의 습윤 케이크를 단리하는, 방법.
  216. 제215 항에 있어서, 스테비올 글리코시드의 습윤 케이크는 세척되는, 방법.
  217. 제216 항에 있어서, 상기 습윤 케이크는 선택적으로 에탄올을 포함한 수용액에 의해 세척되는, 방법.
  218. 제217 항에 있어서, 상기 케이크는 용해되고, 재결정화되는, 방법.
  219. 제218 항에 있어서, 재결정화에 앞서, 상기 생성물은 여과 및/또는 활성탄에 의해 정제되는, 방법.
  220. 제219 항에 있어서, 상기 필터 물질은 친수성이고, 선택적으로 폴리에테르술폰, 나일론, 셀룰로스 아세테이트, 셀룰로스 니트레이트, 및 플루오로알킬 말단 폴레에틸렌 글리콜에 의해 코팅된 PTFE 또는 PVDF인, 방법.
  221. 제219 항 또는 제220 항에 있어서, 상기 필터의 기공 크기는 약 0.2 마이크론인, 방법.
  222. 제219 항에 있어서, 상기 여과는 열 여과 및/또는 접선 유동 여과를 포함하는, 방법.
  223. 제222 항에 있어서, 상기 여과는 기공 크기가 약 0.5 kD인 막을 사용한 접선 유동 여과를 포함하는, 방법.
  224. 제145 항 내지 제223 항 중 어느 한 항에 있어서, 정화된 배지로부터의 회수 공정은 비-크로마토그래피성이며, 선택적으로 여과 및 결정화로 본질적으로 이루어진, 방법.
  225. 제211 항 내지 제224 항 중 어느 한 항에 있어서, 재결정화로부터 얻은 습윤 케이크는 선택적으로 벨트 건조기, 패들 건조기 또는 스프레이 건조기를 사용하여 건조되는, 방법.
  226. 제225 항에 있어서, 상기 건조된 케이크는 분쇄되고, 선택적으로 포장되는, 방법.
  227. 제145 항 내지 제226 항 중 어느 한 항에 있어서, 목표 글리코시드 생성물이 회수된 조성물의 적어도 약 75 중량%인, 방법.
  228. 제227 항에 있어서, 상기 목표 글리코시드 생성물이 회수된 조성물의 적어도 약 80 중량%, 또는 적어도 약 90 중량% 또는 적어도 약 95 중량%인, 방법.
  229. 제145 항 내지 제228 항 중 어느 한 항에 있어서, 상기 당화 생성물의 수율은 배양물 또는 반응물 부피에 대해 적어도 약 25 g/L, 또는 적어도 약 50 g/L, 또는 적어도 약 75 g/L, 또는 적어도 약 100 g/L, 또는 적어도 약 125 g/L, 또는 적어도 약 150 g/L, 또는 적어도 약 200 g/L인, 방법.
KR1020237020932A 2020-11-24 2021-11-24 글리코시드 생성물 생합성 및 회수 KR20230112673A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063117534P 2020-11-24 2020-11-24
US63/117,534 2020-11-24
PCT/US2021/060722 WO2022115527A1 (en) 2020-11-24 2021-11-24 Glycoside product biosynthesis and recovery

Publications (1)

Publication Number Publication Date
KR20230112673A true KR20230112673A (ko) 2023-07-27

Family

ID=81755020

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237020932A KR20230112673A (ko) 2020-11-24 2021-11-24 글리코시드 생성물 생합성 및 회수

Country Status (9)

Country Link
US (1) US20240093258A1 (ko)
EP (1) EP4251731A1 (ko)
JP (1) JP2023550496A (ko)
KR (1) KR20230112673A (ko)
CN (1) CN117203325A (ko)
AU (1) AU2021386386A1 (ko)
CA (1) CA3200689A1 (ko)
MX (1) MX2023006019A (ko)
WO (1) WO2022115527A1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007022318A2 (en) * 2005-08-17 2007-02-22 Cornell Research Foundation Nucleic acids and proteins associated with sucrose accumulation in coffee
DK2806754T3 (en) * 2012-01-23 2019-02-18 Dsm Ip Assets Bv Diterpene PREPARATION
WO2020096907A1 (en) * 2018-11-07 2020-05-14 Firmenich Incorporated Methods for making high intensity sweeteners
BR112021011419A2 (pt) * 2018-12-12 2021-09-08 Conagen Inc. Método de produção de rebaudiosídeo r6-2a e/ou r6-2b, r7-2, r6-1 e r6-4a e/ou r6-4b, rebaudiosídeo sintético e produto de consumo oral

Also Published As

Publication number Publication date
MX2023006019A (es) 2023-08-04
WO2022115527A1 (en) 2022-06-02
CA3200689A1 (en) 2022-06-02
EP4251731A1 (en) 2023-10-04
US20240093258A1 (en) 2024-03-21
AU2021386386A1 (en) 2023-06-22
JP2023550496A (ja) 2023-12-01
CN117203325A (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
KR102532079B1 (ko) 전체 세포 생체변환을 통한 스테비올 글리코시드의 생산
US10273519B2 (en) Diterpene production in Yarrowia
US11788070B2 (en) Uridine diphosphate-dependent glycosyltransferase enzyme
US11680281B2 (en) Biosynthetic production of steviol glycosides and processes therefore
CN113683712B (zh) 甜菊醇糖苷
BR112016002092B1 (pt) Recuperação de glicosídeos de esteviol
CN109563118A (zh) 甜菊醇糖苷的结晶
US20220042060A1 (en) Biosynthesis production of steviol glycosides and processes therefore
BR112018000298B1 (pt) Método para reduzir o teor de ácido caurenóico de uma composição de glicosídeo de esteviol
CN109563117A (zh) 甜菊醇糖苷的结晶
US20240093258A1 (en) Glycoside product biosynthesis and recovery