KR20210126061A - 미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법 - Google Patents

미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법 Download PDF

Info

Publication number
KR20210126061A
KR20210126061A KR1020217028541A KR20217028541A KR20210126061A KR 20210126061 A KR20210126061 A KR 20210126061A KR 1020217028541 A KR1020217028541 A KR 1020217028541A KR 20217028541 A KR20217028541 A KR 20217028541A KR 20210126061 A KR20210126061 A KR 20210126061A
Authority
KR
South Korea
Prior art keywords
sequence
seq
activity
polypeptide
nucleic acid
Prior art date
Application number
KR1020217028541A
Other languages
English (en)
Inventor
시릴 뽀테니에
앙드레 르 줜느
앙드레 르 ?K느
엘렌 쓰꼬르넥
쎌리아 루쎌
레티씨아 주베르
Original Assignee
르 라보레또레 쎄르비에르
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 르 라보레또레 쎄르비에르 filed Critical 르 라보레또레 쎄르비에르
Publication of KR20210126061A publication Critical patent/KR20210126061A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/445The saccharide radical is condensed with a heterocyclic radical, e.g. everninomycin, papulacandin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01133Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1) dTDP-4-dehydrorhamnose reductase (1.1.1.133)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • C12Y114/11022Flavone synthase (1.14.11.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/13Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
    • C12Y114/13011Trans-cinnamate 4-monooxygenase (1.14.13.11)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/14Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01159Flavonol-3-O-glucoside L-rhamnosyltransferase (2.4.1.159)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/0117Isoflavone 7-O-glucosyltransferase (2.4.1.170)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01185Flavanone 7-O-beta-glucosyltransferase (2.4.1.185)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01006Methionine adenosyltransferase (2.5.1.6), i.e. adenosylmethionine synthetase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/01076UDP-glucose 4,6-dehydratase (4.2.1.76)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01023Tyrosine ammonia-lyase (4.3.1.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01024Phenylalanine ammonia-lyase (4.3.1.24)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y501/00Racemaces and epimerases (5.1)
    • C12Y501/03Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
    • C12Y501/03013Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3) dTDP-4-dehydrorhamnose 3,5-epimerase (5.1.3.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01006Chalcone isomerase (5.5.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y602/00Ligases forming carbon-sulfur bonds (6.2)
    • C12Y602/01Acid-Thiol Ligases (6.2.1)
    • C12Y602/010124-Coumarate-CoA ligase (6.2.1.12)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 디오스민 및 헤스페리딘을 생산할 수 있도록 변형된 재조합 미생물 및 디오스민 및/또는 헤스페리딘을 생산하기 위한 이의 용도에 관한 것이다.

Description

미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법
본 발명은 디오스민 및 헤스페리딘의 생산 방법에 관한 것이다.
다플론은 혈관긴장 및 혈관 보호 효과를 지닌 플라보노이드의 혼합물이다. 당해 혼합물은 주로 ~85%의 디오스민, ~8%의 헤스페리딘 및 미량의 다양한 플라본 및 이의 각각의 산화된 형태로 구성된다.
의약을 생산하는 현재의 방법은, 작은 오렌지의 껍질로부터의, 헤스페리딘(94%) 및 이소나린긴(~3%), 네오폰시린(~2%) 및 헤스페레틴(<1%)을 주로 함유하는 플라보노이드의 혼합물의 산/염기 추출이다. 이후에 이러한 혼합물은 화학적 공정을 통해 제어된 산화를 겪고, 약 90%의 헤스페리딘을 디오스민, 및 이의 산화된 형태의 소량의 플라보노이드로 전환시킨다.
따라서, 다플론의 생산은 오렌지 플라보노이드의 정제된 추출물의 공급과 관련되어 있으며, 이는 기후 변화, 통화 이동의 변동 및 수개의 나라(주로, 멕시코, 지중해 분지의 국가 및 중국)의 수십개 지역으로부터의 공급 곤란성의 결과로 변할 수 있다.
따라서, 오렌지 플라보노이드의 정제된 추출물을 공급하는 날씨 변화(vagary)에 의존하지 않는 다플론의 대안적인 생산 방법이 이용가능하도록 하는 것이 가치있을 수 있다. 따라서, 디오스민 및 헤스페리딘의 생성성 공정에 대한 불만족스러운 요구가 존재한다.
발명의 요약
본 발명자는 재조합 미생물에서 디오스민 및 헤스페리딘의 생합성 방법을 개발하였다.
따라서, 본 발명은:
- 헤스페레틴 및/또는 디오스메틴의 7번 위치에서 글루코스를 첨가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열; 및
- 람노즈를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6번 위치내로 전달할 수 있는 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열; 및
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열을 포함하는 재조합 미생물에 관한 것이다.
바람직하게는, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)는 시트러스 시넨시스(Citrus sinensis), 시트러스 클레멘티나(Citrus clementina), 아라비돕시스 탈리아나(Arabidopsis thaliana), 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis) 또는 호모 사피엔스(Homo sapiens)로부터의 효소이다. 특히, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)는 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스, 바람직하게는 아라비돕시스 탈리아나(Arabidopsis thaliana) 또는 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis)로부터의 효소이다. 바람직하게는, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)는 시트러스 시넨시스 또는 스쿠텔라리아 바이칼렌시스로부터 유래된다.
플라보논 7-O-베타-D-글루코실트랜스퍼라제는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 폴리펩타이드로부터 선택될 수 있다. 특히, 이는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖는 서열을 포함하고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 폴리펩타이드로부터 선택될 수 있고, 바람직하게는 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 바람직하게는, 플라보논 7-O-베타-D-글루코실트랜스퍼라제는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직하게는, 6"-O-람노실트랜스퍼라제(RhaT)는 바람직하게는 시트러스 속(genus Citrus) 또는 페튜니아 하이브리다(Petunia hybrida), 바람직하게는 시트러스 시넨시스(Citrus sinensis), 시트러스 막시마(Citrus maxima), 또는 시트러스 클레멘티나(Citrus clementina), 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 식물 효소이다. 바람직하게는, 6"-O-람노실트랜스퍼라제는 서열 번호: 103, 105로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 보다 특히 바람직하게는, 6"-O-람노실트랜스퍼라제는 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직하게는, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)는 바람직하게는 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터 선택된 식물 효소이다. 바람직하게는, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 보다 특히 바람직하게는, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제는 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
일 구현예에서, 본 발명에 다른 미생물은 또한:
- 타이로신 암모니아 리아제(TAL)를 암호화하는 이종 핵산 서열; 및/또는 페닐알라닌 암모니아 리아제(PAL)를 암호화하는 이종 핵산 서열 및 신나메이트 4-하이드록실라제(C4H)를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 리가제(4CL)를 암호화하는 이종 핵산 서열;
- 나린게닌-찰콘 신타제(CHS)를 암호화하는 이종 핵산 서열;
- 찰콘 이소머라제(CHI)를 암호화하는 이종 핵산 서열;
- 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열;
- O-메틸-트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열을 포함하고, 및
- 임의로, 타이로신을 L-DOPA으로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있는 4-메톡시벤조에이트 O-데메틸라제를 암호화하는 이종 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있는 p-쿠마레이트 3-하이드록실라제를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은:
- 서열 번호: 41 및 39로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 123, 125, 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및 특히 서열 번호: 45로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 53, 51, 55 및 57로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53으로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 61 및 59로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은 칼리스테푸스 키넨시스(Callistephus chinensis), 페릴라 프루테스센스 바르. 크리스파(Perilla frutescens var. crispa), 페투니아 엑스 하이브리다(Petunia x hybrida), 게르베라 하이브리다(Gerbera hybrida), 시트러스 시넨시스(Citrus sinensis), 아라비돕시스 탈리아나(Arabidopsis thaliana), 피로셀라 오피시나룸(Pilosella officinarum), 오스테오스페르뭄 하이브리드 쿨티바르(Osteospermum hybrid cultivar), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 시트러스 클레멘티나 또는 스트렙토마이세스 아베르미틸리스(Streptomyces avermitilis)로부터, 특히 칼리스테푸스 키넨시스, 페릴라 프루테스센스 바르. 크리스파, 페튜니아 엑스 하이브리다, 헤르베라 하이브리다, 시트러스 시넨시스, 아라비돕시스 탈리아나 또는 피로셀라 오피시나룸으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 7, 1, 3, 5, 9, 11, 13, 15, 17, 19, 21 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 11, 17 및 121을 갖는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
보다 특히 바람직하게는, 미생물은 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제 (F3'H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은 시트러스, 특히 시트러스 클레멘티나 또는 시트러스 시넨시스로부터, 호모 사피엔스(Homo sapiens)로부터 또는 아라비돕시스 탈리아나로부터의 O-메틸-트랜스퍼라제(OMT), 바람직하게는 서열 번호: 119, 117, 87 및 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다. 보다 특히 바람직하게는, 이는 서열 번호: 119, 117 및 89로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 119 및 117로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은:
- 페닐알라닌 암모니아 리아제(PAL)를, 특히 서열 번호: 63, 65 및 77, 바람직하게는 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 PAL, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H), 특히 C4H, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드; 및 가장 특히 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
미생물은 또한 에리오딕티올로부터, 바람직하게는 아라비돕시스 탈리아나, 페트로셀리눔 크리스품(Petroselinum crispum), 제아 마이스(Zea mays), 로니세라 자포니카(Lonicera japonica), 로니세라 마크란토이데스(Lonicera macranthoides), 칼리스테푸스 키넨시스(Callistephus chinensis), 아피움 그라베올렌스(Apium graveolens), 메디카고 트룬카툴라(Medicago truncatula), 쿠미눔 시미눔(Cuminum cyminum), 아에투사 시나피움(Aethusa cynapium), 안젤리카 아르칸젤리카(Angelica archangelica), 코니움 마쿨라툼(Conium maculatum), 카멜리아 시넨시스(Camellia sinensis), 시나라 카르둔쿨루스 바르 시콜리무스(Cynara cardunculus var scolymus), 사우쑤레아 메두사(Saussurea medusa), 플렉트란투스 바르바투스(Plectranthus barbatus), 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis), 도르코세라스 하이그로메트리쿰(Dorcoceras hygrometricum), 안티리눔 마주스(Antirrhinum majus), 페릴라 프루테스센스 바르 크리스파(Perilla frutescens var crispa), 다흘리아 핀나타(Dahlia pinnata) 또는 에리트란테 레위시이(Erythranthe lewisii)로부터 루테올린을 생산할 수 있는 플라본 신타제(FNS), 특히 플라본 신타제를 암호화하는 이종 핵산 서열을 포함할 수 있다. 플라본 신타제(FNS)는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택될 수 있다. 특히, FNS는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드일 수 있다.
더욱이, 이는 또한:
- 시토크롬 P450 리덕타제(CPR)를 암호화하는 이종 핵산 서열; 및/또는
- S-아데노실메티오닌 신테타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
바람직하게는, CPR은 서열 번호: 25, 23, 27, 29 및 31로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
바람직하게는, 미생물은 효모 또는 세균, 바람직하게는 사카라마이세스 속(genus Saccharomyces), 특히 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 또는 세균, 예를 들면, 에스케리키아 콜라이(Escherichia coli)이다.
본 발명은 또한 디오스민 및/또는 헤스페리딘을 생산하기 위한 본 문서에 기술된 바와 같은 미생물의 용도에 관한 것이다.
또한, 본 발명은 본 문서에 기술된 바와 같은 미생물을을 배양하고, 임의로 디오스민 및/또는 헤스페리딘을 수거함을 포함하는 디오스민 및/또는 헤스페리딘의 생산 방법에 관한 것이다.
바람직하게는, 디오스민 및/또는 헤스페리딘을 생산하기 위한 본 발명에 따른 미생물의 사용 동안, 배양 배지에 공급된 나린게닌, 아피게닌, 에리도딕티올, 루테올린, 헤스페레틴 및/또는 디오스메틴은 존재하지 않는다.
발명의 상세한 설명
작은 오렌지의 껍질 속에서 헤스페레틴의 생합성을 위한 경로는 불완전하게 이해되어 있다. 따라서, 본 발명자는 수개의 생합성 경로를 탐구하고 재조합 미생물 속에서 디오스민 및 헤스페리딘의 생합성을 개발하는데 성공하였다.
정의
용어 "미생물"은 단세포 유기체를 지칭한다. 바람직하게는, 미생물은 세균 또는 효모이다.
용어 "재조합 미생물"은 천연에서 발견되지 않고 하나 이상의 이종 유전자 성분의 삽입, 변형 또는 결실 후 변형된 게놈을 함유하는 미생물을 지칭한다.
용어 "재조합 핵산"은 변형되지 않고 천연 미생물 속에 존재하지 않는 핵산을 지칭한다. 예를 들면, 당해 용어는 천연 프로모터가 아닌 프로모터에 작동적으로 연결된 암호화 서열 또는 유전자를 나타낼 수 있다. 이는 또한 인트론이 엑손 및 인트론을 포함하는 유전자에 대해 결실된 암호화 서열을 나타낼 수 있다.
용어 "이종"은 유전자가 유전 가공에 의해 세포내로 도입됨을 의미한다. 이는 세포내에서 에피소옴 또는 염색체 형태로 존재할 수 있다. 유전자의 기원은 이것이 도입된 세포의 것과는 상이할 수 있다. 그러나, 유전자는 또한 이것이 도입된 세포와 동일한 종으로부터 유래될 수 있지만, 이는 이의 비천연 환경을 고려할 때 이종으로 고려된다. 예를 들면, 유전자 또는 핵산 서열은 이의 천연 프로모터 이외의 프로모터의 제어 하게 있으므로 이종이며, 이는 이것이 천연적으로 위치하는 것과는 상이한 위치에 도입된다. 숙주 세포는 이종 유전자의 도입 전에 내인성 유전자의 카피(copy)를 함유할 수 있거나 내인성 카피를 함유하지 않을 수 있다. 더욱이, 핵산 서열은 암호화 서열이 숙주 미생물내 발현에 대해 최적화되었다는 의미에서 이종일 수 있다. 바람직하게는, 본 문서에서, 이종 핵산 서열은 숙주 세포에 대해 이종인, 즉, 효모내에 천연적으로 존재하지 않는 단백질을 암호화한다.
숙주 미생물과 관련하여, 본원에 사용된 바와 같은, 용어 "천연의" 또는 "내인성"은 상기 미생물 내에 천연적으로 존재하는 유전 성분 또는 단백질을 지칭한다.
용어 "유전자"는 단백질을 암호화하는 임의의 핵산을 나타낸다. 용어 "유전자"는 DNA, 예를 들면, cDNA 또는 gDNA, 및 또한 RNA를 포함한다. 유전자는 우선 재조합적, 효소적 및/또는 화학적 기술을 통해 제조할 수 있고, 후속적으로 시험관내에서 숙주 세포 또는 시스템 내에서 복제될 수 있다. 유전자는 전형적으로 목적한 단백질을 암호화하는 개방 판독 프레임을 포함한다. 유전자는 전사 종결인자 또는 신호 펩타이드와 같은 추가의 서열을 함유할 수 있다.
유전 코드의 축퇴(degeneracy)의 결과로서, 수개의 핵산은 특수한 폴리펩타이드를 암호화할 수 있다. 따라서, 주어진 폴리펩타이드에 대한 암호화 서열내 코돈을 변형시켜 특수한 미생물내 최적의 발현을 예를 들면, 이러한 미생물에 대해 적합한 코돈 해독 표를 사용하여 수득할 수 있다. 핵산은 또한 특수한 효모에 대해 바람직한 GC 함량에 따라서 및/또는 반복 서열의 수를 감소시키기 위해 최적화시킬 수 있다. 특정의 구현예에서, 이종 핵산은 관련된 미생물내 발현에 대해 코돈-최적화되었다. 코돈 최적화는 당해 분야에 공지된 통상의 공정을 통해 수행될 수 있다(참고: 예를 들면, Welch, M., et al. (2011), Methods in Enzymology 498: 43-66).
용어 "작동적으로 연결된"은 제어 서열이 암호화 서열에 대하여 적합한 위치에 위치함으로써, 제어 서열이 암호화 서열의 발현을 제어함을 나타낸다.
용어 "제어 서열"은 유전자의 발현에 필요한 핵산 서열을 나타낸다. 제어 서열은 천연 또는 이종일 수 있다. 당해 분야의 기술자에게 잘 공지되고 현재 사용된 제어 서열이 바람직할 것이다. 이러한 제어 서열은 리더(leader), 폴리아데닐화 서열, 프로펩타이드 서열, 프로모터, 신호 펩타이드 서열 및 전사 터미네이터를 포함하나, 이에 한정되지 않는다. 바람직하게는, 제어 서열을 프로모터 및 전사 터미네이터를 포함한다.
용어 "발현 카세트"는 암호화 영역, 즉, 유전자, 및 조절 영역, 즉, 작동적으로 연결된, 하나 이상의 제어 서열을 포함하는 영역을 포함하는 핵산 작제물을 나타낸다. 바람직하게는, 제어 서열은 숙주 미생물에서 사용하기에 적합하다.
본원에 사용된 바와 같은, 용어 "발현 벡터"는 발현 카세트를 포함하는 DNA 또는 RNA 분자를 나타낸다. 바람직하게는, 발현 벡터는 선형 또는 환형 이중 가닥 DNA 분자이다. 벡터는 또한 복제 오리진(origin of replication), 선택 마커 등을 포함할 수 있다.
본 발명의 목적을 위해서, 2개의 핵산 서열 또는 아미노산 서열 사이의 "동일성 퍼센트"라는 용어는 가장 우수한 정렬 후 수득된, 비교될 2개의 서열 사이에 동일한 뉴클레오타이드 또는 아미노산 잔기의 퍼센트를 나타내는 것으로 의도되고, 이러한 퍼센트는 순수하게 통계적이고 2개의 서열 사이의 차이는 무작위적으로 및 이의 전체 길이에 걸쳐 존재한다. 가장 우수한 정렬 또는 최적의 정렬은 하기 계산된 바와 같이, 비교될 2개의 서열 사이의 동일성 퍼센트가 가장 높은 정렬이다. 2개의 핵산 또는 아미노산 서열 사이의 서열 비교는 이들이 최적으로 정렬된 후 이러한 서열을 비교함으로써 편리하게 수행되며, 상기 비교는 분절(segment) 또는 비교 윈도우(window)에 의해 수행되어 서열 유사성을 지닌 국소 영역을 확인하고 비교한다. 아미노산 서열 동일성의 퍼센트를 측정할 목적의 정렬은 당해 분야에 잘 공지된 다양한 방식으로, 예를 들면, 인터넷, 예를 들면, http: //blast.ncbi.nlm. Nih.gov/ 또는 http://www.ebi.ac.uk/Tools/emboss/) 상에서 이용가능한 컴퓨터 소프트웨어를 사용함으로써 수행할 수 있다. 당해 분야의 기술자는 비교된 서열의 전체 길이에 걸쳐 최대의 정렬을 수득하는데 필요한 임의의 알고리즘을 포함한, 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 본 발명의 목적을 위해, 아미노산 서열 동일성의 퍼센트의 값은 Needleman-Wunsch 알고리즘의 수단으로 2개 서열의 최적의 정렬을 생성하는 EMBOSS Needle 쌍 서열 정렬을 사용하여 생성된 값을 지칭하며, 여기서 모든 조사 매개변수는 디폴트 표기 매트릭스(default Notation matrix) = BLOSUM62, 개방 갭(Open gap) = 10, 연장된 갭(Extended gap) = 0.5, 말단 갭 패널티(end gap penalty) = 거짓(false), 개방 말단 갭(open end gap) = 10 및 연장된 말단 갭(extended end gap) = 0.5로 정의된다. 특정의 구현예에서, 본 특허원에서 언급된 동일성의 퍼센트 모두는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 바람직하게는 적어도 90% 동일성, 보다 바람직하게는 적어도 95% 동일성으로 설정될 수 있다. 특히, 효소의 서열 동일성의 퍼센트 모두가 적어도 80% 또는 적어도 85%, 바람직하게는 적어도 90% 또는 적어도 95% 서열 동일성인 구현예가 기술된 바와 같이 고려된다.
일 구현예에서, 폴리펩타이드는 서열 번호에 기술된 서열과 관련하여 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 첨가, 치환 또는 결실을 함유할 수 있다. 특히 이러한 첨가, 치환 또는 결실은 N-말단 끝, C-말단 끝 또는 말단 둘 다에서 도입된다.
폴리펩타이드는 임의로 융합 단백질의 형태일 수 있다.
본원에 사용된 바와 같은 용어 "과발현" 및 "증가된 발현"은 상호교환적으로 사용되고 유전자 또는 효소의 발현은 변형되지 않은 미생물, 예를 들면, 야생형 미생물 또는 본원에 기술된 유전적 변형을 포함하지 않는 미생물과 관련하여 증가됨을 의미한다. 용어 "야생형"은 천연에 존재하는 변형되지 않은 미생물을 지칭한다. 효소의 증가된 발현은 일반적으로 상기 효소를 암호화하는 유전자의 발현을 증가시킴으로써 수득된다. 유전자 또는 효소가 본 발명의 미생물 속에 천연적으로 존재하지 않는 구현예, 즉 이종 유전자 또는 효소에서, 용어 "과발현" 및 "발현"은 상호교환적으로 사용될 수 있다. 유전자의 발현을 증가시키기 위해, 당해 분야의 기술자는 유전자의 고 수준의 발현을 유도하는 프로모터, 즉, 강력한 프로모터를 사용함으로써, 상응하는 전령 RNA를 안정화시키는 성분 또는 리보소옴 결합 부위(RBS)를 봉쇄하는 서열 및 이를 둘어싼 서열을 사용함으로써, 임의의 공지된 기술, 예를 들면, 미생물 속의 유전자의 카피의 수를 증가시키는 것을 사용할 수 있다. 특히, 과발현은 미생물 속의 유전자의 카피 수를 증가시킴으로써 수득할 수 있따. 유전자의 하나 이상의 카피는 당해 분야의 기술자에게 공지된 재조합 공정, 예를 들면, 유전자의 교체 또는 다중-카피 통합(참고: 예를 들면, 국제 특허원 제WO 2015/092013호)을 통해 게놈내로 도입시킬 수 있다. 바람직하게는, 바람직하게는 강력한 프로모터의 제어 하에 위치하는, 유전자는 포함하는 발현 카세트는 게놈내로 통합된다. 변이체로서, 유전자는 바람직하게는 강력한 프로모터의 제어 하에 위치한, 목적한 유전자를 지닌 발현 카세트를 포함하는, 발현 벡터, 바람직하게는 플라스미드에 의해 수반될 수 있다. 발현 벡터는 복제 오리진의 특성에 따라서, 하나 이상의 카피로 미생물 속에 존재할 수 있다. 유전자의 과발현은 유전자의 고 수준의 발현을 유도하는 프로모터를 사용하여 수득할 수 있다. 예를 들면, 내인성 유전자의 프로모터는 강력한 프로모터, 즉, 보다 높은 발현 수준을 유도하는 프로모터로 대체될 수 있다. 천연의 프로모터가 아닌 프로모터의 제어하에 내인성 유전자는 이종 핵산으로 명명된다. 본 발명에서 사용하기에 적합한 프로모터는 당해 분야의 기술자에게 공지되어 있고 구성적 또는 유도성일 수 있고, 내인성 또는 이종일 수 있다.
용어 "포함하는"은 또한 "로 이루어진" 또는 "로 필수적으로 이루어진"을 의미한다. 용어 "로 필수적으로 이루어진"은 서열이 서열 번호로 기술된 서열과 관련하여 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 첨가, 치환 또는 결실을 함유할 수 있다.
재조합 미생물
본 발명에 따른 미생물은 진핵 또는 원핵세포 미생물일 수 있다.
제1 구현예에서, 미생물은 진핵세포이다. 바람직하게는, 이는 사카로마이세테탈레스(Saccharomycetales), 스포리디오볼라레스(Sporidiobolales) 및 스키조사카로마이세탈레스(SchizoSaccharomycetales) 목의 효모이다. 효모는 예를 들면, 피키아(Pichia), 클루이베로마이세스(Kluyveromyces), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 칸디다(Candida), 피로마이세스(Lipomyces), 로도토룰라(Rhodotorula), 로도스포리디움(Rhodosporidium), 야로위아(Yarrowia), 또는 다바리오마이세스(Debaryomyces)로부터 선택될 수 있다. 일 구현예에서, 효모는 피키아 파스토리스(Pichia pastoris), 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 마륵시아누스(Kluyveromyces marxianus), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae),사카로마이세스 카를스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 도우글라시이(Saccharomyces douglasii), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 오비포르미스(Saccharomyces oviformis), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 칸디다 알비칸스(Candida albicans), 칸디다 트로피칼리스(Candida tropicalis), 로도토룰라 글루티니스(Rhodotorula glutinis), 로도스포리디움 토룰로이데스(Rhodosporidium toruloides), 야로위아 리폴리티카(Yarrowia lipolytica), 데바리오마이세스 한세니이(Debaryomyces hansenii) 및 리포마이세스 스타케이이(Lipomyces starkeyi)로부터 선택된다. 바람직한 구현예에서, 미생물은 사카로마이세스 효모, 바람직하게는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 효모이다. 대안적으로, 미생물은 진균, 바람직하게는 사상균(filamentous fungus)이다. 바람직하게는, 이는 아스퍼길러스(Aspergillus), 트리코데르마(Trichoderma), 뉴로스포라(Neurospora), 포도스포라(Podospora), 엔도티아(Endothia), 무코르(Mucor), 코키오볼루스(Cochiobolus) 또는 피리쿨라리아(Pyricularia)로부터 선택된다. 우선적으로, 진균은 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 나이거(Aspergillus niger), 아스퍼길러스 아와마리(Aspergillus awomari), 아스퍼길러스 오리자에(Aspergillus oryzae), 아스퍼길러스 테레우스(Aspergillus terreus), 뉴로스포라 크라싸(Neurospora crassa), 트리코데르마 레에세이(Trichoderma reesei) 및 트리코데르마 비리데(Trichoderma viride)로부터 선택된다.
제2의 구현예에서, 미생물은 원핵 세포이다. 바람직하게는, 이는 특히 필룸 악시도박테리아(phylum Acidobacteria), 악티노박테리아(Actinobacteria), 아퀴피카에(Aquificae), 박테리오이데테스(Bacterioidetes), 클라미디아에(Chlamydiae), 클로로비(Chlorobi), 클로로플렉시(Chloroflexi), 크리시오게네테스(Chrysiogenetes), 시아노박테리아(Cyanobacteria), 데페리박테레스(Deferribacteres), 데이노코쿠스-써무스(Deinococcus-Thermus), 딕티오글로미(Dictyoglomi), 피브로박테레스(Fibrobacteres), 피르미쿠테스(Firmicutes), 푸소박테리아(Fusobacteria), 겜마티모나데테스(Gemmatimonadetes), 니트로스피라에(Nitrospirae), 플란크토마이세테스(Planctomycetes), 프로테오박테리아(Proteobacteria), 스피로카에테스(Spirochaetes), 서모데설포박테리아(Thermodesulfobacteria), 서모미크로비아(Thermomicrobia), 써모토가에(Thermotogae) 또는 베루코미크로비아(Verrucomicrobia)로부터 선택된다. 바람직하게는, 세균은 아카리오클로리스(Acaryochloris), 아세토박터(Acetobacter), 악티노바실러스(Actinobacillus), 아그로박테리움(Agrobacterium), 알리사이클로바실러스(Alicyclobacillus), 아나바에나(Anabaena), 아나시스티스(Anacystis), 아나에로비오스피릴룸(Anaerobiospirillum), 아퀴펙스(Aquifex), 아르트로박터(Arthrobacter), 아르트로스피라(Arthrospira), 아조박터(Azobacter), 바실러스(Bacillus), 브레비박테리움(Brevibacterium), 브루콜데리아(Burkholderia), 클로로비움(Chlorobium), 크로마티움(Chromatium), 클로로바쿨룸(Chlorobaculum), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 쿠프리아비두스(Cupriavidus), 시아노테세(Cyanothece), 엔테로박터(Enterobacter), 데이노코쿠스(Deinococcus), 에르위니아(Erwinia), 에스케리키아(Escherichia), 게오박터(Geobacter), 글로에박터(Gloeobacter), 글루코노박터(Gluconobacter), 하이드로게노박터(Hydrogenobacter), 클렙시엘라(Klebsiella), 락토바실러스(Lactobacillus), 락토코쿠스(Lactococcus), 만하이미아(Mannheimia), 메소리조비움(Mesorhizobium) 메틸로박테리움(Methylobacterium), 마이크로박테리움(Microbacterium), 마이코시스티스(Microcystis), 니트로박터(Nitrobacter), 니트로소모나스(Nitrosomonas), 니트로스피나(Nitrospina), 니트로스피라(Nitrospira), 노스톡(Nostoc), 포르미디움(Phormidium), 프로클로로코쿠스(Prochlorococcus), 슈도모나스(Pseudomonas), 랄스토니아(Ralstonia), 리조비움(Rhizobium), 로도박터(Rhodobacter), 로도코쿠스(Rhodococcus), 로돕세우도모나스(Rhodopseudomonas), 로도스피릴룸(Rhodospirillum), 살모넬라(Salmonella), 스케네데스문(Scenedesmun), 세라티아(Serratia), 시겔라(Shigella), 스타필로코쿠스(Staphylococcus), 스트렙토마이세스(Streptomyces), 시네콕쿠스(Synechoccus), 시네코시스티스(Synechocystis), 써모시텍초코쿠스(Thermosynechococcus), 트리초데스미움(Trichodesmium) 또는 자이모모나스(Zymomonas) 속에 속한다. 보다 바람직하게는, 세균은 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens), 아나에로비오스피릴룸 석시니시프로두센스(Anaerobiospirillum succiniciproducens), 악티노바실러스 석시노게네스(Actinobacillus succinogenes), 아퀴펙스 아에올리쿠스(Aquifex aeolicus), 아퀴펙스 피로필루스(Aquifex pyrophilus), 바실러스 서브틸리스(Bacillus subtilis), 바실러스 아밀로리퀴파시네스(Bacillus amyloliquefacines), 브레비박테리움 암모니아게네스(Brevibacterium ammoniagenes), 브레비박테리움 임마리오필룸(Brevibacterium immariophilum), 클로스트리디움 파스테우리아눔(Clostridium pasteurianum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 클로스트리디움 베이게린키이(Clostridium beigerinckii), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 쿠프리아비두스 네카토르(Cupriavidus necator), 쿠프리아비두스 메탈리두란스(Cupriavidus metallidurans), 엔테로박터 사카자키이(Enterobacter sakazakii), 에스케리키아 콜라이(Escherichia coli), 클루코노박터 옥시단스(Gluconobacter oxydans), 하이드로게노박터 써모필루스(Hydrogenobacter thermophilus), 클렙시엘라 옥시토카(Klebsiella oxytoca), 락토코쿠스 락티스(Lactococcus lactis), 락토바실러스 플란타룸(Lactobacillus plantarum), 만하이미아 석시니키프로두센스(Mannheimia succiniciproducens), 메소리조비움 로티(Mesorhizobium loti), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 슈도모나스 메발로니이(Pseudomonas mevalonii), 슈도모나스 푸디카(Pseudomonas pudica), 슈도모나스 푸티다(Pseudomonas putida), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 리조비움 에틀리이(Rhizobium etli), 로도박터 캅술라투스(Rhodobacter capsulatus), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 로도스피릴룸 로브룸(Rhodospirillum rubrum), 살모넬라 엔테리카(Salmonella enterica), 살모넬라 파이피(Salmonella typhi), 살모넬라 타이피무리움(Salmonella typhimurium), 시겔라 다이센테리아데(Shigella dysenteriae), 시겔라 플렉스네리(Shigella flexneri), 시겔라 손네이(Shigella sonnei), 스타필로코쿠스 아우레우스(Staphylococcus aureus), 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor), 자이모모나스 모빌리스(Zymomonas mobilis), 아카리오클로리스 마리나(Acaryochloris marina), 아나바에나 바리아빌리스(Anabaena variabilis), 아르쓰로스피라 플라텐시스(Arthrospira platensis), 아르쓰로스피라 막시마(Arthrospira maxima), 클로로비움 테피둠(Chlorobium tepidum), 클로로바쿨룸 종(Chlorobaculum sp.), 시아노테세 종(Cyanothece sp.), 글로에오박터 비올라세우스(Gloeobacter violaceus), 미크로시스티스 아에루기노사(Microcystis aeruginosa), 노스톡 푼쿠티포르메(Nostoc punctiforme), 프로클로로코쿠스 마리누스(Prochlorococcus marinus), 시네초코쿠스 엘롱가투스(Synechococcus elongatus), 시네초시스티스 종(Synechocystis sp.), 써모시네초코쿠스 엘롱가투스(Thermosynechococcus elongatus), 트리초데스미움 에리쓰라에움(Trichodesmium erythraeum) 및 로돕세우도모나스 팔루스트리스(Rhodopseudomonas palustris) 종으로부터 선택된다. 바람직한 구현예에서, 미생물은 에스케리키아 콜라이(Escherichia coli) 세균, 예를 들면, 이. 콜라이(E. coli) BL21, 이. 콜라이 BL21(DE3), 이. 콜라이 MG1655 또는 이. 콜라이 W31 10 종 및 이의 유도체로부터 선택된다. 대안적인 구현예에서, 미생물은 스트렙토마이세스 속, 특히 스트렙토마이세스 베네주엘라에(Streptomyces venezuelae)이다.
미생물을 변형시켜 타이로신 및/또는 페닐알라닌, 바람직하게는 타이로신의 생산을 증가시킬 수 있다. 특히, 타이로신 및/또는 페닐알라닌, 바람직하게는 타이로신의 생산의 피드백 억제(feedback inhibition)에 관여하는 유전자는 불활성화될 수 있다. 대안적으로 또는 누적적으로, 타이로신 및/또는 페닐알라닌, 바람직하게는 타이로신의 생합성 경로는 타이로신 및/또는 페닐알라닌, 바람직하게는 타이로신에 경로를 향한 다른 대사 경로로부터 탄소의 유동을 재지시함으로써 최적화시킬 수 있다. 이러한 변형 및 이러한 유전자는 당해 분야의 기술자에게 잘 공지되어 있다(참고: US 8,809,028; Pandey et al., 2016, Biotechnol. Adv., 34, 634-662).
따라서, 일 구현예에서, 미생물은 특히 글루코스와 같은 단순한 탄소원으로부터 다량의 타이로신 및/또는 페닐알라닌을 생산한다.
헤스페리딘 및/또는 디오스민의 생산을 가능하도록 하는 변형
본 발명에 따른 재조합 미생물을 변형시켜 헤스페리딘 및/또는 디오스민을 생산하였다. 특히, 미생물이 헤스페레틴 및/또는 디오스메틴 각각으로부터 헤스페리딘 및/또는 디오스민을 생산하도록 하기 위하여, 미생물을 변형시켜 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 7번 위치에서 헤스페리틴 및/또는 디오스메틴의 글리코실화 및 6번 위치에서 람노스의 전달에 필요한 효소를 도입시켰다.
제1 구현에에서, 재조합 미생물은 헤스페레틴 및/또는 디오스메틴을 생산할 수 있고: 특히, 이는 이러한 목적으로 변형되었다. 대안의 구현예에서, 헤스페레틴 및/또는 디오스메틴은 예를 들면, 이러한 화합물을 배양 배지에 가함으로써, 미생물에 제공될 수 있다.
하나의 특수한 구현에에서, 미생물은 헤스페리딘을 생산한다. 이후에, 디오스민은 화학적 전환에 의해, 특히 산화에 의해 헤스페리딘으로부터 제조될 수 있다.
바람직한 구현예에서, 미생물은 헤스페리딘 및 디오스민을 생산한다.
따라서, 재조합 미생물은:
a. 헤스페레틴 및/또는 디오스메틴의 7번 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열;
b. 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6번 위치로 람노스를 전달할 수 있는 6-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열; 및
c. UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열을 포함한다.
일 구현예에서, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 6"-O-람노실트랜스퍼라제(RhaT) 및 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)는 미생물에 대해 이종인 효소이다.
UGT: 플라보논 7-O-베타-글루코실트랜스퍼라제
UGT는 헤스페레틴 및/또는 디오스메틴의 7번 위치로 글루코스의 전달을 수행하는 효소이다. UGT의 명칭은 UDP-글루코스: 플라보논 7-O-베타-D-글루코실트랜스퍼라제 또는 플라보논 7-O-베타-D-글루코실트랜스퍼라제이다. 다음의 명칭으로도 또한 지칭된다: 우리딘 디포스포글루코스-플라보논 7-O-글루코실트랜스퍼라제, 나린게닌 7-O-글루코실트랜스퍼라제, 및 헤스페레틴 7-O-글루코실-트랜스퍼라제. 당해 효소는 EC 2.4.1.185 부류에 속한다.
본 발명자는 기질로서 헤스페레틴 및/또는 디오스메틴을 수용할 수 있고 이러한 화합물의 7번 위치내에 글루코스를 가할 수 있는 효소를 확인하여 선택하였다. 바람직하게는, 헤스페레틴 및/또는 디오스메틴의 7번 위치에 글리코실화에 대한 선호도를 가지도록 효소를 선택하여야 했다. 바람직한 구현예에서, 효소는 헤스페레틴 및/또는 디오스메틴의 7번 위치에 대해 특이적이다.
따라서, 미생물은 헤스페레틴 및 디오스메틴의 7번 위치내에 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열을 포함한다.
용어 "7-O-베타-글리코실트랜스퍼라제 활성"은 플라보노이드의 7번 위치에 글루코스를 가할 수 있는 UGT 효소를 지칭한다. 7-O-베타-글리코실트랜스퍼라제 활성이 있는지를 측정하기 위하여, 플라보논 7-O-베타-D-글루코실트랜스퍼라제 효소를 NAD(P)H, O2, 및 플라보노이드의 존재하에, 최적의 조건(pH, 이온 등) 하에서 시험관내 항온처리하고, UPLC-MS로 관찰하고, 7번 위치에서 추가의 글루코스를 함유하는 플라보노이드의 출현에 대해 예측된 표준과 비교하는 것으로 이루어진 효소 시험을 수행할 수 있다. 바람직하게는, 플라보노이드는 헤스페레틴 또는 디오스메틴이고 7번 위치에서 추가의 글루코스를 함유하는 플라보노이드는 7번 위치에서 추가의 글루코스를 지닌 이의 형태, 즉, 헤스페레틴 7-O-글루코시드 및 디오스메틴 7-O-글루코시드이다.
당해 효소는 보다 고등의 진핵세포, 특히 식물에서만 존재한다. 예를 들면, 효소는 시트러스 속, 특히 시트러스 막시마(Citrus maxima), 시트러스 시넨시스(Citrus sinensis), 시트러스 클레멘티나(Citrus clementina), 시트러스 미티스(Citrus mitis) 및 시트러스 엑스 파라디시(Citrus x paradisi), 라이시움(Lysium), 특히 라이시움 바르바룸(Lysium barbarum), 페투니아(Petunia), 특히 페투니아 엑스 하이브리다(Petunia x hybrida), 아라비돕시스(Arabidopsis), 특히 아라비돕시스 탈리아나(Arabidopsis thaliana), 또는 스쿠텔라리아(Scutellaria), 특히 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis)로부터의 효소이다.
일 구현예에서, UGT는 아리비돕시스 탈리아나, 크쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터의 효소이다. 바람직하게는, UGT는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 효소이다.
바람직한 구현예에서, UGT는 시트러스 시넨시스, 시트러스 클레멘티나, 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 시트러스 시넨시스 또는 스쿠텔라리아 바이칼렌시스로부터의 효소이다.
특수한 구현예에서, UGT는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 특히 기질로서 헤스페레틴 및/또는 디오스메틴을 사용하여 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직한 구현예에서, UGT는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 보다 특히 바람직하게는, UGT는 서열 번호: 113, 115 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
따라서, UGT는 아라비돕시스 탈리아나로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NM_119576 및 NP_567995.1 하에 기술되어 있고, 보다 특히 서열 번호: 91에 기술되어 있다. 단백질은 또한 UniProtKB/Swiss Prot에 참고 번호 UGT73B1 하에 기술되어 있다.
대안적으로, UGT는 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis)로부터 유래된다. 제1 양태에서, 제1의 UGT 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KU712253 및 AMK52071.1 하에, 및 보다 특히 서열 번호: 93으로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140DPB7 하에 기술되어 있다. 제2 양태에서, 제2의 UGT 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KU712254 및 AMK52072.1 하에 기술되어 있고, 보다 특히 서열 번호: 95로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140DPB8 하에 기술되어 있다. 제3 양태에서, 제3의 UGT 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KU712255 및 AMK52073.1 하에 기술되어 있고, 보다 특히 서열 번호: 97로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140DPB9 하에 기술되어 있다.
더욱이, UGT는 호모 사피엔스로부터 유래될 수 있다. 제1 양태에서, UGT는 UGT1A6(UDP 글루쿠로노실트랜스퍼라제 계열 1 구성원 A6)이다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 P19224 하에 기술되어 있다. 컨센서스(consensus) 암호화 서열은 NCBI에 번호 CCDS2507.1 하에 기술되어 있다. 당해 효소의 서열은 서열 번호: 99로 기술되어 있다. 제2 양태에서, UGT는 UGT1A7(UDP 글루쿠로노실트랜스퍼라제 계열 1 구성원 A7)이다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9HAW7 하에 기술되어 있다. 컨센서스 암호화 서열은 NCBI에 번호 CCDS2506.1 하에 기술되어 있다. 당해 효소의 서열은 서열 번호: 101에 기술되어 있다.
UGT는 또한 시트러스, 특히 시트러스, 시넨시스 또는 시트러스 클레멘티나로부터 유래될 수 있다. 특히, 시트러스 시넨시스로부터의 UGT는 서열 번호: 113에 기술되어 있다. 당해 효소를 암호화하는 뉴클레오타이드 서열은 서열 번호: 114에 기술되어 있다. 시트러스 클레민티나로부터의 UGT는 서열 번호: 115에 기술되어 있다. 당해 효소를 암호화하는 뉴클레오타이드 서열은 서열 번호: 116에 기술되어 있다.
바람직한 구현예에서, UGT는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 당해 효소와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
RhaT: 6-O-람노실트랜스퍼라제
RhaT는 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6번 위치내로 람노스의 전달을 수행하는 효소이다. RhaT는 6-O-람노실트랜스퍼라제이다. 당해 효소는 EC 2.4.1.B53 부류에 속한다.
본 발명자는 기질로서 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드를 허용할 수 있고 이러한 화합물의 글루코스의 6번 위치에서 람노스를 첨가할 수 있는 효소를 확인하고 선택하여야 한다.
따라서, 미생물은 람노스를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6번 위치로 전달할 수 있는 6-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열을 포함한다. 이러한 효소는 보다 고등 진핵세포, 특히 식물에만 존재한다.
용어 "6-O-람노실트랜스퍼라제 활성"은 효소 RhaT에 의한 글루코스의 6번 위치에서 람노스의 첨가를 의미한다. 6-O-람노실트랜스퍼라제 활성이 존재하는지를 시험하기 위하여, 6-O-람노실트랜스퍼라제 효소를 NAD(P)H, O2, 및 플라보노이드의 존재 하에, 최적의 조건(pH, 이온 등)에서 시험관내(in vitro) 항온처리하고, UPLC-MS로 관찰하고 람노스가 글루코스의 6번 위치에 가해진 플라보노이드의 출현에 대해 예측된 표준과 비교하는 것으로 이루어진, 효소 시험을 수행할 수 있다. 바람직하게는, 플라보노이드는 헤스페레틴 7-O-글루코시드 또는 디오스메틴 7-O-글루코시드 및 람노스가 헤스페리딘 및 디오스민의 글루코스의 6번 위치에 가해진 플라보노이드이다.
바람직하게는, 당해 효소는 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나 종의 식물에 의해 생산된 효소이다. 바람직하게는, 효소는 시트러스 시넨시스 또는 시트러스 클레멘티나로부터 유래되는 효소이다.
특수한 구현예에서, 6-O-람노실트랜스퍼라제는 서열 번호: 103, 105로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
따라서, RhaT는 시트러스 클레멘티나로부터 유래될 수 있다. 이는 핵산 서열의 경우 NCBI로부터의 GenBank 데이타베이스에 번호 XM_006420965 및 단백질 서열의 경우 번호 XP_006421028 하에, 및 보다 특히 서열 번호: 103에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 V4RJL6 하에 기술되어 있다.
RhaT는 또한 시트러스 시넨시스로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 DQ119035 하에 및 단백질 서열의 경우 번호 ABA18631.1 하에, 및 보다 특히 서열 번호: 105로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A7ISD3 하에 기술되어 있다.
특수한 구현예에서, RhaT는 시트러스 시넨시스로부터 유래되고 서열 번호: 105의 서열 또는 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함하는 효소로부터 선택된다.
바람직한 구현예에서, RhaT는 서열 번호: 103로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
RHM: UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제
RHM은 삼기능성 효소 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제이다.이러한 효소는 UDP-글루코스로부터 UDP-람노스를 생산할 수 있다. 이러한 효소는 EC 4.2.1.76 부류에 속한다. UDP-람노스는 6-O-람노실트랜스퍼라제(RhaT) 활성에 필수적이다.
따라서, 미생물은 UDP-람노즈를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열을 포함한다. 이러한 효소는 보다 고등 진핵세포, 특히 식물에서만 존재한다.
용어 "UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성"은 UDP-람노스로 UDP-글루코스의 형질전환을 의미한다. UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성이 존재하는지를 측정하기 위하여, UDP-글루코스 효소, NAD(P)H 및 O2를 최적의 조건(pH, 이온 등) 하에서 시험관내 항온처리하고, UPLC-MS로 관찰하고 UDP-람노스의 출현에 대해 예측된 표준과 비교하는 것으로 이루어진 효소 시험을 수행할 수 있다.
바람직하게는, 이러한 효소는 시트러스 속의 식물, 특히 시트러스 시넨시스, 또는 아라비돕시스 탈리아나에 의해 생산된 효소이다.
특수한 구현예에서, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
RHM은 시트러스 시넨시스로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 XM_006477756 및 단백질 서열의 경우 번호 XP_006477819.1 하에, 및 보다 특히 서열 번호: 107로 기술되어 있다.
RHM은 또한 아라비돕시스 탈리아나로부터 유래될 수 있다. 제1 양태에서, 단백질은 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 AY081471 하에 및 단백질 서열의 경우 번호 AAM10033.1 하에, 및 보다 특히 서열 번호: 109로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9SYM5 하에 기술되어 있다. 제2 양태에서, 단백질은 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 AJ565874 하에 및 단백질 서열의 경우 번호 CAD92667.1 하에, 및 보다 특히 서열 번호: 111에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9LPG6 하에 기술되어 있다.
특수한 구현예에서, RHM은 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직한 구현예에서, RHM은 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
효소의 조합
특수한 구현예에서, 재조합 미생물은:
- 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 113, 115 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 6-O-람노실트랜스퍼라제(RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 103으로부터 선택된 서열을 포함하는 RhaT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 시트러스 시넨시스로부터 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 (RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 107로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 재조합 미생물은 6-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열 및 선행 구현예에서 정의된 바와 같은 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열 및 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비옵시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열, 바람직하게는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
바람직한 구현예에서, 미생물은:
- 서열 번호: 113, 115 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 바람직하게는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 보다 특히 바람직하게는 서열 번호: 113로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 103로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 6"-O-람노실트랜스퍼라제를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제를 암호화하는 이종 핵산 서열을 포함한다. 특수한 구현예에서, 상기 기술된 효소는 보다 높은 진핵 세포, 바람직하게는 식물 세포로부터의 효소이다. 특수한 구현예에서, 효소는 동일한 속, 예를 들면, 동일한 종의 식물로부터 유래된다.
헤스페레틴 및/또는 디오스메틴의 생산을 가능하도록 하는 변형
앞서 나타낸 바와 같이, 헤스페레틴 및/또는 디오스메틴은 미생물에 적용되거나, 미생물은 헤스페레틴 및/또는 디오스메틴을 생산할 수 있다. 특히, 미생물은 헤스페레틴 및/또는 디오스메틴을 생산할 수 있거나 생산할 수 있도록 변형되었다. 따라서, 본 발명자는 또한 미생물이 헤스페레틴 및/또는 디오스메틴을 생산하도록 하는 생합성 경로를 개발하였다.
나린게닌/아피게닌으로부터 헤스페레틴/디오스메틴까지
헤스페레틴 및/또는 디오스메틴은 나린게닌 및 아피게닌으로부터 수득될 수 있다.
수개의 생합성 전략이 가능하였다. 헤스페레틴 및/또는 디오스메틴을 제조하기 위하여, 2개의 변형: 4' 위치에서 하이드록실의 메틸화 및 3' 위치에서 하이드록실화를 만드는데 필수적이다. 따라서, 4' 위치에서 하이드록실의 메틸화의 특이성을 증가시키기 위하여, 이는 3' 위치에서 제2의 하이드록실 그룹을 가하기 전에 이미 존재하는 하이드록실 그룹의 메틸화를 우선 수행하는 것이 타당한 것으로 여겨진다. 대조적으로, 본 발명자는 제2의 하이드록실의 도입으로 인하여 메틸화 특이성 문제의 위험성에도 불구하고, 우선 하이드록실화에 이어 메틸화를 수행하는 것이 필수적이라는 결론에 도달하였다.
F3'H: 플라보노이드 3'-모노옥시게나제
플라보노이드 3'-모노옥시게나제(F3'H)는 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실 그룹의 첨가를 수행하는 효소이다. 당해 효소는 EC 1.14.14.82 부류에 속한다. 이는 또한 플라본 3'-하이드록실라제로서 공지되어 있다.
본 발명자는 기질로서 나린게닌 및/또는 아피게닌을 수용할 수 있고 이러한 화합물의 3' 위치에서 하이드록실 그룹을 가할 수 있는 효소를 확인하고 선택하였다. 바람직하게는, 효소는 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실화에 대한 선호도를 가지도록 선택된다. 바람직한 구현예에서, 효소는 나린게닌 및/또는 아피게닌의 3' 위치에 대해, 특히 5' 위치와 관련하여 특이적이어서 3' 및 5' 위치에서 이중 하이드록실화를 피하고, 바람직하게는 또한 5' 위치에서 하이드록실화를 피한다.
플라보노이드 3'-모노옥시게나제(F3'H)는 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실 그룹의 첨가를 수행하는 효소이다. 이러한 효소는 EC 1.14.14.82 부류에 속한다. 이는 또한 플라보노이드 3'-하이드록실라제로 공지되어 있다.
용어 "플라보노이드 3'-모노옥시게나제 활성"은 CPR-의존성 F3'H 효소에 의한 3'-하이드록실화된 플라보노이드로 플라보노이드의 형질전환을 의미한다. 플라보노이드 3'-모노옥시게나제 활성이 존재하는지를 측정하기 위해, 플라보노이드 3'-모노옥시게나제 효소를 NAD(P)H, O2, 및 플라보노이드의 존재하에, 최적 조건(pH, 이온 등) 하에 시험관내 항온처리하고, UPLC-MS로 관찰하고 3'-하이드록실화된 플라보노이드의 출현에 대해 예측된 표준물과 비교하는 것으로 이루어진 효소 시험을 수행할 수 있다. 바람직하게는, 플라보노이드는 나린게닌 또는 아피게닌이고 3'-하이드록실화된 플라보노이드는 이의 3'-하이드록실화된 형태, 즉, 에리오딕티올 또는 루테올린이다.
따라서, 미생물은 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실을 가할 수 있는 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 를 암호화하는 이종 핵산 서열을 포함한다.
일 구현예에서, F3'H는 알리움(Allium), 아라비돕시스, 브라씨카(Brassica), 칼리스테푸스(Callistephus), 콜룸네아(Columnea), 시트러스, 디안투스(Dianthus), 겐티아나(Gentiana), 게르베라(Gerbera), 글리시네(Glycine), 프라가리아(Fragaria), 이포모에아(Ipomoea), 말루스(Malus), 마티올라(Matthiola), 오스테오스페르뭄(Osteospermum), 오리자(Oryza), 파네로차에테(Phanerochaete), 페릴라(Perilla), 페트로셀리눔(Petroselinum), 펠라르고니움(Pelargonium), 피로셀라(Pilosella), 페투니아(Petunia), 신닌기아(Sinningia), 소르굼(Sorghum), 토레니아(Torenia), 비티스(Vitis) 또는 제아(Zea), 예를 들면 알리움 세파(Allium cepa), 아라비돕시스 탈리아나(Arabidopsis thaliana), 브라씨카 나푸스(Brassica napus), 콜룸네아 하이브리다(Columnea hybrida), 칼리스테푸스 키넨시스(Callistephus chinensis), 시트러스 신넨시스(Citrus sinensis), 시트러스 클레멘티나(Citrus clementina), 디안투스 카리오필루스(Dianthus caryophyllus), 프라가리아 베스카(Fragaria vesca), 프라가리아 엑스 아나나싸(Fragaria x ananassa), 게르베라 하이브리다(Gerbera hybrida), 글리신 막스(Glycine max), 겐티아나 트리플로라(Gentiana triflora), 이포모에아 닐(Ipomoea nil), 이포모에아 푸르푸레아(Ipomoea purpurea), 이포모에아 트리콜로르(Ipomoea tricolor), 마티올라 인카나(Matthiola incana), 말루스 도메스티카(Malus domestica), 오스테오스페르뭄 하이브리드 쿨티바르( Osteospermum hybrid cultivar), 오리자 사티바(Oryza sativa), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 피로셀라 오피시날룸(Pilosella officinarum), 페트로셀리눔 크리스품(Petroselinum crispum), 펠라르고니움 엑스 호르토룸(Pelargonium x hortorum), 페릴라 프루테스센스 바르. 크리스파(Perilla frutescens var. crispa), 페투니아 엑스 하이브리다(Petunia x hybrida), 신닌기아 카르디날리스(Sinningia cardinalis), 소르굼 비콜로르(Sorghum bicolor), 토레니아 종(Torenia sp), 토레니아 하이브리드 쿨티바르(Torenia hybrid cultivar), 비티스 비니페라(Vitis vinifera) 또는 제아 마이스(Zea mays) 속의 식물로부터의 식물 효소이다. 보다 특이적인 구현예에서, F3'H는 알리움, 브라씨카, 칼리스테푸스, 콜룸네아, 시트러스, 디안투스, 겐티아나, 게르베라, 글리시네, 프라가리아, 이포모에아, 말루스, 마티올라, 오스테오스페르뭄, 오리자, 파네로차에테, 페릴라, 페트로셀리눔, 펠라르고니움, 피로셀라, 페투니아, 신닌기아, 소르굼, 토레니아, 비티스 또는 제아, 예를 들면 알리움 세파, 브라씨카 나푸스, 콜룸네아 하이브리다, 칼리스테푸스 키넨시스, 시트러스 신넨시스, 시트러스 클레멘티나, 디안투스 카리오필루스, 프라가리아 베스카, 프라가리아 엑스 아나나싸, 게르베라 하이브리다, 글리신 막스, 겐티아나 트리플로라, 이포모에아 닐, 이포모에아 푸르푸레아, 이포모에아 트리콜로르, 마티올라 인카나, 말루스 도메스티카, 오스테오스페르뭄 하이브리드 쿨티바르, 오리자 사티바, 파네로차에테 크리소스포리움, 피로셀라 오피시날룸, 페트로셀리눔 크리스품, 펠라르고니움 엑스 호르토룸, 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 신닌기아 카르디날리스, 소르굼 비콜로르, 토레니아 종, 토레니아 하이브리드 쿨티바르, 비티스 비니페라 또는 제아 마이스 속의 식물로부터의 효소이다.
바람직하게는, F3'H는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르, 파네로차에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스, 시트러스 시넨시스, 아라비돕시스 탈리아나 또는 피로셀라 오피시나룸으로부터의 효소이다. 특히, F3'H는 페릴라 푸루테스센스 바르.(var.) 크리스파, 페투니아 엑스(x) 하이브리다, 칼리스테푸스 치넨시스, 게르베라 하이브리다, 시트루스 시넨시스 및 필로셀라 오피시아눔으로부터의 효소일 수 있다.
특수한 구현예에서, F3'H는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 및 121로부터, 특히 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 1, 5, 7, 11, 17, 19 및 121로부터, 특히 서열 번호: 1, 5, 7, 11, 17 및 19선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 특히 기질로서 나린게닌 및/또는 아피게닌을 사용하여 및 3' 위치에서 하이드록실화와 함께 플라보노이드 3'-모노옥시게나제 활성을 갖는, 서열을 포함하는 폴리펩타이드로부터 선택된다. 특수한 구현예에서, F3'H는 서열 번호: 5, 7 및 17로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
바람직한 구현예에서, F3'H는 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 75, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다. 가장 특히 바람직하게는, F3'H는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 75, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드일 수 있다.
따라서, F3'H는 페릴라 프루테스센스 바르. 크리스파로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB045593.1 및 BAB59005.1 하에, 및 보다 특히 서열 번호: 2 및 1로 기술되어 있다.
F3'H는 파네로차에테 크리소스포리움으로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB597870.1 및 BAL05157.1 하에, 및 보다 특히 서열 번호: 4 및 3에 기술되어 있다.
F3'H는 페투니아 엑스 하이브리다로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AF155332.1 및 AAD56282.1 하에, 및 보다 특히 서열 번호: 6 및 5로 기술되어 있다.
F3'H는 칼리스테푸스 키넨시스로부터 유래될 수 있다. 일 구현예에서, 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AF313488.1 및 AAG49298.1 하에, 및 보다 특히 서열 번호: 8 및 7로 기술되어 있다. 다른 구현예에서, 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AF313489.1 및 AAG49299.1 하에, 및 보다 특히 서열 번호: 10 및 9로 기술되어 있다.
F3'H는 게르베라 하이브리다로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 DQ218417.1 및 ABA64468.1 하에, 및 보다 특히 서열 번호: 12 및 11로 기술되어 있다.
F3'H는 오스테오스페르뭄 하이브리드 쿨티바르로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 DQ250711.1 및 ABB29899.1 하에, 및 보다 특히 서열 번호: 14 및 13로 기술되어 있다.
F3'H는 시트러스 클레멘티나로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 XM_006440673.1 및 XP_006440736.1 하에, 및 보다 특히 서열 번호: 16 및 15로 기술되어 있다.
F3'H는 시트러스 시넨시스로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 XM_006477592.2 및 XP_006477655.1 하에, 및 보다 특히 서열 번호: 18 및 17로 기술되어 있다.
F3'H는 피로셀라 오피시날룸로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 DQ319866.2 및 ABC47161.1 하에, 및 보다 특히 서열 번호: 20 및 19로 기술되어 있다.
F3'H는 스트렙토마이세스 아베르미틸리스로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 SAV_4539 및 WP_010985964.1 하에, 및 보다 특히 서열 번호: 22 및 21로 기술되어 있다.
F3'H는 아라비돕시스 탈리아나로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NM_120881.2 및 NP_196416.1 하에, 및 보다 특히 서열 번호: 122 및 121로 기술되어 있다.
바람직하게는, F3'H는 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다. 가장 특히 바람직하게는, F3'H는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
바람직한 구현예에 따라서, F3'H는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
다른 특수한 구현예에 따라서, F3'H는 서열 번호: 17로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
다른 특수한 구현예에 따라서, F3'H는 서열 번호: 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
다른 특수한 구현예에 따라서, F3'H는 서열 번호: 11로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
CPR: 시토크롬 P450 리덕타제
플라보노이드 3'-모노옥시게나제(F3'H)는 하이드록실 그룹의 첨가를 수행할 NADPH의 존재를 필요로 한다.
따라서, 바람직한 구현예에서, 미생물은 시토크롬 P450 리덕타제, NADPH-시토크롬 P450 리덕타제를 암호화하는 이종 핵산을 포함한다. 이러한 효소는 EC 1.6.2.4 부류에 속한다.
시토크롬 P450 리덕타제는 진핵세포로부터, 특히 효모로부터, 예를 들면, 사카로마이세테탈레스 속으로부터, 또는 아라비돕시스, 암미(Ammi), 아비센니아(Avicennia), 카멜리아(Camellia), 캄프토테카(Camptotheca), 카타란투스(Catharanthus), 시트러스(Citrus), 글리신(Glycine), 헬리안투스(Helianthus), 로투스(Lotus), 메셈브리안테뭄(Mesembryanthemum), 파세올루스(Phaseolus), 피스코미트렐라(Physcomitrella), 피누스(Pinus), 포풀루스(Populus), 루타(Ruta), 사카룸(Saccharum), 솔라눔(Solanum), 비그나(Vigna), 비티스(Vitis) 또는 제아(Zea) 속으로부터 유래된다.
바람직한 구현예에서, 시토크롬 P450 리덕타제는 진핵세포로부터, 예를 들면, 효모로부터, 특히 사카로마세스 세레비지아에로부터, 또는 식물, 예를 들면, 칸타란투스 로세우스(Catharanthus roseus) 또는 아라비돕시스 탈리아나로부터 유래된다.
특수한 구현예에서, 시토크롬 P450 리덕타제는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택될 수 있다. 매우 특수한 구현예에서, 시토크롬 P450 리덕타제는 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택될 수 있다.
예를 들면, 시토크롬 P450 리덕타제는 카타란투스 로세우스로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 X69791.1 하에 및 단백질 서열의 경우 번호 CAA49446.1 하에, 및 보다 특히 각각 서열 번호: 24 및 23으로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q05001 하에 기술되어 있다.
시토크롬 P450 리덕타제는 사카로마이세스 세레비지아에로부터 유래될 수 있는 이는 이는 NCBI로부터의 GenBank 데이타베이스에 핵선 서열의 경우 번호 NM_001179172.1 하에 및 단백질 서열의 경우 번호 NP_011908.1 하에, 및 보다 특히 각각 서열 번호: 26 및 25로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 P16603 하에 기술되어 있다.
시토크롬 P450 리덕타제는 키메라일 수 있다. 이는 아이그라인(Aigrain) 등의 문헌(2009, EMBO Reports, 10, 742-747)에 기술되어 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열는 각각 서열 번호: 28 및 27에 기술되어 있다.
더욱이, 시토크롬 P450 리덕타제는 아라비돕시스 탈리아나로부터 유래될 수 있다. 시토크롬 P450이 아라비돕시스 탈리아나로부터 유래된 경우, 이는 ATR로 명명될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 NM_118585.4 및 단백질 서열의 경우 번호 NP_194183.1 하에, 및 보다 특히 각각 서열 번호: 30 및 29로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9SB48 하에 기술되어 있다.
또한, 시토크롬 P450 리덕타제는 아라비돕시스 탈리아나로부터 유래될 수 있고, NCBI로부터의 GenBank에 핵산 서열의 경우 NM_179141.2 및 단백질 서열의 경우 번호 NP_849472.2 하에, 및 보다 특히 각각 서열 번호: 32 및 31로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9SUM3 하에 기술되어 있다.
일 구현예에서, 상술한 바와 같은 CRP을 암호화하는 서열의 신규 카피는 효모내로 도입된다. 다른 구현예에서, 효모가 사카로마이세스 세레비지아에이고 CPR이 동일한 효모로부터 유래된 경우, CPR을 암호화하는 내인성 유전자는 강력한 프로모터로 대체된다. 따라서, CPR의 발현은 야생형 효모와 관련하여 증가되며; 따라서 CPR은 변형된 효모내에서 과발현된다.
하나의 특수한 구현예에서, F3'H 및 CPR은 동일한 기원, 동일한 종으로부터 유래된다.
OMT: O-메틸트랜스퍼라제
O-메틸트랜스퍼라제(OMT)는 정의하기에 어려운 표적을 갖는 효소의 매우 큰 게열이다. 본 발명자는 4' 위치(파라 위치)에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제를 확인하고 선택하여야 한다.
바람직하게는, 효소는 에리오딕티올 및/또는 푸테올린의 4' 위치에서 메틸화에 대한 선호도를 갖도록 선택되었다. 바람직한 구현예에서, 효소는 에리오딕티올 및/또는 루테올린의 4' 위치에 대해 특이적이다. 용어 "특이적인"은 효소에 의해 에리오딕티올 및/또는 루테올린 상에 도입된 메틸 그룹이 경우들의 60%, 바람직하게는 경우의 70%, 및 심지어 보다 바람직하게는 경우의 80%는 4' 위치에서 발견되고, 나머지가 3' 위치내로 도입됨을 의미한다.
용어 "4'-O-메틸트랜스퍼라제 활성"은 4'-O-메틸트랜스퍼라제 효소에 의한 4'-하이드록시플라보노이드의 4'-메톡시플라보노이드로의 전환을 의미한다. 4'-O-메틸트랜스퍼라제 활성의 존재하는지의 여부를 측정하기 위하여, 4'-O-메틸트랜스퍼라제 효소, 4'-하이드록시플라보노이드 및 S-아데노실-L-메티오닌으로 구성된 혼합물을 최적의 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 4'-메톡시플라보노이드의 출현을 예측된 표준과 비교하여 UPLC-MS에서 관찰한다.
본 경우에, 4'-하이드록시플라보노이드는 에리오딕티올 또는 루테올린이며, 이는 각각 이의 4'-메톡시플라보노이드 형태, 즉, 헤스페레틴 또는 디오스메틴으로 전환된다.
따라서, 미생물은 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제를 암호화하는 이종 핵산 서열을 포함할 수 있다.
효소는 보다 고등 원핵세포, 특히 식물에만 존재한다.
일 구현예에서, O-메틸트랜스퍼라제(OMT)는 아라비돕시스 탈리아나로부터의 효소이다. 다른 구현예에서, O-메틸트랜스퍼라제(OMT)는 보다 고등 진핵세포, 바람직하게는 포유동물로부터 기원한다. 특히, O-메틸트랜스퍼라제(OMT)는 사람 기원(호모 사피엔스)이다.
특수한 구현예에서, OMT는 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
일 구현예에서, OMT는 서열 번호: 89 로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
다른 구현예에서, OMT는 서열 번호: 87로부터 선택된 서열을 포함하는 효소 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
따라서, OMT는 아라비돕시스 탈리아나로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NM_118755.4 및 NP_567739.1로 기술되어 있다. 단백질은 또한 UniProtKB/Swiss Prot에 참고 번호 Q9C5D7 하에, 및 보다 특히 서열 번호: 87로 기술되어 있다.
대안적으로, OMT는 호모 사피엔스로부터 유래된다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NM_007310.2 및 NP_009294.1로 기술되어 있다. 단백질은 또한 UniProtKB/Swiss Prot에 참고 번호 P21964 하에, 및 보다 특히 서열 번호: 89로 기술되어 있다.
호모 사피엔스로부터의 OMT는 메틸화용 기질로서 에리오딕티올 및 루테올린을 수용하는 장점을 갖는 반면, 아라비돕시스 탈리아나로부터의 OMT는 에리오딕티올에 대해 강한 선호도를 갖는다. 역으로, 헤스페레틴의 합성이 디오스메틴의 것과 비교하여 선호되어야 하는 경우, 아라비돕시스 탈리아나로부터의 OMT가 장점을 가질 수 있다.
바람직한 구현예에서, OMT는 시트러스, 특히 시트러스 클레멘티나 또는 시트러스 시넨시스로부터의 OMT이다. 특히 바람직한 구현예에서, OMT는 서열 번호 117 및 119로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직하게는, OMT는 서열 번호: 117로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
대안적으로, OMT는 서열 번호: 119로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
상술한 시트러스로부터 및 아라비돕시스 탈리아나로부터의 OMT는 4' 위치에서 에리오딕티올을 특이적으로 메틸화하는 장점을 갖는다.
미생물의 설계 동안에, 본 발명자는 이러한 메틸화 단계가 제한된 단계 중 하나로 구성됨을 관찰하였다. 놀랍게도, 미생물, 특히 효소에서 보조인자 S-아데노실-L-메티오닌의 존재에도 불구하고, 이러한 보조인자의 합성을 증가시키는 효소의 첨가는 당해 단계의 제한 양태를 없애는 것을 가능하도록 한다. 따라서, 바람직한 구현예에서, 미생물은 또한 S-아데노실-L-메티오닌을 합성하는 효소, S-아데노실메티오닌 신타제(SAMT)를 암호화하는 이종 또는 내인성 서열을 포함한다. 이러한 효소는 EC 2.5.1.6 부류에 속한다.
일 구현예에서, 미생물은 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 암호화할 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열 및 S-아데노실메티오닌 신테타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
일 구현예에서, SAMT는 가장 특히 미생물이 효소인 경우, 효모, 특히 사카로마이세스 세레비지아에로부터 유래된다.
특수한 구현예에서, S-아데노실메티오닌 신테타제는 서열 번호: 81로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드이다.
예를 들면, S-아데노실메티오닌 신타제는 사카로마이세스 세레비지아에로부터 유래될 수 있다. 이는 핵산 서열의 경우 NCBI로부터의 GenBank 데이타베이스에 NM_001180810.3 및 단백질 서열의 경우 번호 NP_010790.3에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 P19358로 기술되어 있다.
일 구현예에서, 상기 정의된 바와 같은 SMAT를 암호화하는 서열의 신규 카피가 미생물내로 도입된다. 다른 구현예에서, 미생물이 사카로마이세스 세레비지아에인 경우, SMAT를 암호화하는 내인성 유전자의 프로모터는 강한 프로모터로 대체된다. 따라서, SAMT의 발현은 야생형 미생물과 비교하여 증가되며; 따라서 SAMT는 변형된 미생물에서 과발현된다.
따라서, 바람직한 구현예에서, 미생물은 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제를 암호화하는 이종 핵산 서열 및 S-아데노실-L-메티오닌을 생산할 수 있는 S-아데노실메티오닌 신테타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
FNS: 플라본 신타제
디오스메틴은 루테올린으로부터 생산될 수 있다. 이는 또한 이를 루테올린 내로 형질전환시킨 다음 루테올린으로부터 디오스메틴을 제조하거나, 이를 헤스페레틴내로 형질전환시킨 다음 헤스페레틴으로부터 디오스메틴을 제조함으로써, 에리오딕티올로부터 수득할 수 있다. 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있는 효소는 플라본 신타제(FNS)이다. 특수한 구현예에서, 플라본 신타제는 또한 에리오딕티올을 루테올린으로 전환시킬 수 있다.
따라서, 미생물은 서열 플라본 신타제, 특히 에리오딕티올로부터 루테올린 및/또는 헤스페레틴으로부터 디오스메틴을 생산할 수 있는 플라본 신타제를 암호화하는 이종 핵산을 포함할 수 있다.
용어 "플라본 신타제 활성"은 FNSI 효소(CPR-독립적인) 또는 FNSII 효소(CPR-의존적인)에 의해 플라보논을 플라본으로 전환시킴을 의미한다.
플라본 신타제 활성이 존재하는지를 측정하기 위해, 플라본 신타제 효소(FNSI), 플라보논, 2-옥소글루타레이트 및 O2로 구성된 혼합물의 FNSI의 경우에 최적 조건(pH, 온도, 이온 등) 하에서 및 효소 FNSII, 플라보논, NAD(P)H 및 O2로 구성된 혼합물의 FNSII의 경우에 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 플라보논에 상응하는 플라본의 출현은 예측된 표준과 비교하여 UPLC-MS에서 관찰된다. 바람직하게는, 플라보논은 에리오딕티올 또는 헤스페레틴이고, 이는 각각 이의 플라본 형태, 즉, 루테올린 또는 디오스메틴으로 전환될 것이다.
따라서, 특수한 구현예에서, 미생물은 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열; 에리오딕티올으로부터 루테올린 및/또는 헤스페레틴으로부터 디오스메틴을 생산할 수 있는 플라본 신타제, 특히 플라본 신타제를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 플라본 신타제는 식물, 예를 들면, 아에투사(Aethusa), 안젤리카(Angelica), 안티리눔(Antirrhinum), 아피움(Apium), 아라비돕시스(Arabidopsis), 칼리스테푸스(Callistephus), 카멜리아(Camellia), 코니움(Conium), 쿠미눔(Cuminum), 시나라(Cynara), 다흘리아(Dahlia), 도르코세라스(Dorcoceras), 에리트란테(Erythranthe), 로이세라(Lonicera), 메디카고(Medicago), 오리자(Oryza), 페릴라(Perilla), 페트로셀리눔(Petroselinum), 플렉트란투스(Plectranthus), 포풀루스(Populus), 사우쑤레아(Saussurea), 스쿠텔라리아(Scutellaria) 또는 제아(Zea) 속, 특히 아라비돕시스, 로니세라, 메디카고(Medicago), 오리자, 페트로셀리눔, 포풀루스 또는 제아의 속, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸젤리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이, 특히, 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터 유래된 효소이다.
특수한 구현예에서, 플라본 신타제(FNS)는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택될 수 있다. 특히, 플라본 신타제(FNS)는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 바람직하게는 FNS는 서열 번호: 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
플라본 신타제(FNS)의 2개 유형: 플라본 신타제 1(FNSI) 및 플라본 신타제 2(FNSII)가 존재한다. 플라보논 및 2-옥소글루타레이트로부터 출발하여, FNSI는 상응하는 플라본을 생산할 수 있다. 효소 FNSI는 EC 1.14.11.22 부류에 속한다. FNSII는 P450 그룹에 속하고 시토크롬 P450 리덕타제의 존재를 필요로 한다. 효소 FNSII는 EC 1.14.13 부류에 속한다.
일 구현예에서, FNS는 제I형 플라본 신타제이다. 다른 구현예에서, FNS는 제II형 플라본 신타제이다. 추가의 구현예에서, 미생물은 제I형 플라본 신타제 및 제II형 플라본 신타제를 포함한다.
바람직한 구현예에서, 미생물은 제I형 플라본 신타제(FNSI)를 암호화하는 이종 핵산 서열을 포함한다. FNSI의 장점은 이것이 시토크롬 P450 리덕타제의 부재하에 기능한다는 것이다.
FNSI는 식물, 예를 들면, 페트로셀리눔 크리스품, 오리자 사티바, 포풀루스 델토이데스, 메디카고 트룬카툴라, 아피움 그라베올렌스, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸젤리카, 또는 코니움 마쿨라툼으로부터, 특히 페트로셀리눔 크리스품, 오리자 사티바, 포풀루스 델토이데스 또는 메디카고 트룬카툴라로부터, 바람직하게는 페트로셀리눔 크리스품으로부터의 플라본 신타제일 수 있다.
FNSI는 서열 번호: 37, 127, 137, 141, 143 및 145로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드일 수 있다. 특수한 양태에서, FNSI는 서열 번호: 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 폴리펩타이드일 수 있다.
예를 들면, FNSI는 페트로셀리눔 크리스품으로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 AY817680.1 및 단백질 서열의 경우 번호 AAX21541.1 하게 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q7XZQ8 하에 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 37 및 38로 기술되어 있다.
FNSI는 또한 안젤리카 아르칸젤리카로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 DQ683352.1 및 단백질 서열의 경우 번호 ABG78793.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 127 및 128로 기술되어 있다.
FNSI는 또한 아피움 그라베올렌스로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 AY817676.1 및 단백질 서열의 경우 번호 AAX21537.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 137 및 138로 기술되어 있다.
FNSI는 또한 쿠미눔 시미눔으로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 DQ683349.1 및 단백질 서열의 경우 번호 ABG78790.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 141 및 142로 기술되어 있다.
FNSI는 또한 아에투사 시나피움으로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 DQ683350.1 및 단백질 서열의 경우 번호 DQ683350.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 143 및 144로 기술되어 있다.
FNSI는 또한 코니움 마쿨라툼으로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 DQ683354.1 및 단백질 서열의 경우 번호 ABG78795.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 145 및 146로 기술되어 있다.
다른 구현예에서, 미생물은 제II형 플라본 신타제(FNSII)를 암호화하는 이종 핵산 서열을 포함한다.
FNSII는 식물, 예를 들면, 아라비돕시스 탈리아나, 제아 마이스, 예를 들면, 로니세라 속의 식물, 예를 들면, 로니세라 자포니카 및 로니세라 마크란토이데스, 칼리스테푸스 키넨시스, 메디카고 트루카툴라, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 스콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이드로메트리쿰, 안티리눔 마주스, 페릴라 플루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터의 플라본 신타제, 특히 아라비돕시스 탈리아나, 제아 마이스 또는 로니세라 속, 예를 들면, 로니세라 자포니카 및 로니세라 마크란토이데스로부터의 플라본 신타제일 수 있다.
특수한 구현예에서, 플라본 신타제(FNSII)는 서열 번호: 33, 35, 129, 131, 133, 135, 139, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33 및 35로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
일 구현예에서, 플라본 신타제 FNS는 로니세라 자포니카로부터 유래된 FNSII 이다. 당해 구현예에서, 효소는 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 KU127576.1 및 단백질 서열의 경우 번호 AMQ91109.1로, 및 보다 특히 각각 서열 번호: 34 및 33로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 로니세라 마크란토이데스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KU127580.1 및 AMQ91113.1로, 및 보다 특히 각각 서열 번호: 36 및 35로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 시나라 세르둔쿨루스 바르 스콜리무스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 JN825735.1 및 AFG31000.1로, 및 보다 특히 각각 서열 번호: 130 및 129로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 페릴라 프루테스센스 바르 크리스파로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB045592.1 및 BAB59004.1로, 및 보다 특히 각각 서열 번호: 132 및 131로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 다흘리아 핀나타로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB769842.1 및 BAM72335.1로, 및 보다 특히 각각 서열 번호: 134 및 133으로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 칼리스테푸스 키넨시스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AF188612.1 및 AAF04115.1로, 및 보다 특히 각각 서열 번호: 136 및 135로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 메디카고 트루카툴라로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 DQ354373.1 및 ABC86159.1로, 및 보다 특히 각각 서열 번호: 140 및 139로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 카멜리아 시넨시스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 FJ169499.1 및 ACH99109.1로, 및 보다 특히 각각 서열 번호: 148 및 147로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 사우싸레아 메두사로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KF170286.1 및 AGV40781.1로, 및 보다 특히 각각 서열 번호: 150 및 149로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 플렉트란투스 바르바투스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KF606861.1 및 AHJ89438.1로, 및 보다 특히 각각 서열 번호: 152 및 151로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 스쿠텔라리아 바이텔라리아 바이칼렌시스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KT963454.1 및 AMW91729.1로, 및 보다 특히 각각 서열 번호: 154 및 153으로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 도르코세라스 하이그로메트리쿰으로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KV013332.1 및 KZV23934.1로, 및 보다 특히 각각 서열 번호: 156 및 155로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 안티리눔 마주스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB028151.1 및 BAA84071.1로, 및 보다 특히 각각 서열 번호: 158 및 157로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 에리트란테 레위시이로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KX710102.1 및 AOR81894.1로, 및 보다 특히 각각 서열 번호: 160 및 159로 기술되어 있다.
특수한 구현예에서, 미생물은 제II형 플라본 신타제(FNSII) 및 제I형 플라본 신타제를 암호화하는 이종 핵산 서열, 예를 들면 서열 번호: 33, 35, 129, 131, 133, 135, 139, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 서열 번호: 37, 127, 137, 141, 143 및 145로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33 및 35로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드 및 서열 번호: 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
제II형 FNS, FNSII는 시토크롬 P450 리덕타제(CPR)의 존재를 필요로 한다. 미생물이 시토크롬 P450 리덕타제를 포함하지 않는 경우, 이는 따라서 이종 시토크롬 P450 리덕타제를 필수적으로 도입할 것이다. 미생물이 이를 이미 포함하는 경우, 내인성 시토크롬 P450 리덕타제의 과발현(예를 들면, 프로모터를 강한 프로모터로 대체하거나 암호화 서열의 하나 이상의 카피를 가함으로써) 또는 이종 시토크롬 P450 리덕타제를 도입하는 것을 계상하는 것이 가능하다.
특수한 구현예에서, 제II형 FNS 및 CPR는 동일한 기원, 동일한 종으로부터 유래된다.
효소의 조합
따라서, 헤스페레틴 및/또는 디오스메틴 각각으로부터 헤스페리딘 및/또는 디오스민의 생합성에 필요한 효소 외에, 미생물은 바람직하게는 나린게닌 및/또는 아피게닌으로부터 헤스페레틴 및/또는 디오스메틴을 생산하기 위한 효소를 포함한다.
제1의 특수한 구현예에서, 재조합 미생물은:
- 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 바람직하게는 아라비돕시스 탈리아나, 시트러스 시넨시스, 시트러스 클레멘티나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 시트러스 시넨시스 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 바람직하게는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 특히 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제 (UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 람노스를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치내로 전달할 수 있는 를 암호화하는 이종 핵산 서열 6-O-람노실트랜스퍼라제(RhaT); 바람직하게는 시트러스 또는 페투니아 하이브리다 속, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 RhaT, 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6-O-람노실트랜스퍼라제 (RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드;
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM); 바람직하게는 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터의 RHM, 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 특히 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스, 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르, 파네로카에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스 또는 피로셀라 오피시나룸으로부터 유래된 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 및 121로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17, 19 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터의 CPR, 또는 식물, 예를 들면 카타렌투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 117, 119, 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117, 119 및 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 임의로, 플라보논으로부터 플라본을 생산할 수 있고, 특히 나린게닌을 아피게닌으로, 및/또는 에리오딕티올을 루테올린으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스, 제아 마이스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸젤리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트루칸툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터, 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 재조합 미생물은:
- 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 바람직하게는 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 바람직하게는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 람노스를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치로 전달할 수 있는 6-O-람노실트랜스퍼라제(RhaT); 바람직하게는 시트러스 또는 페투니아 하이브리다 속, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 RhaT, 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM); 바람직하게는 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터의 RHM, 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 ㄱ자는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 특히 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스 및 피로셀라 오피시나룸으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖고, 바람직하게는 서열 번호: 1, 5, 7, 11, 17 및 19로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 5, 7 및 17로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터, 또는 식물로부터, 예를 들면, 카타란투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 서열 번호: 89를 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 OMT를 암호화하는 이종 핵산 서열; 및
- 임의로, 플라보논으로부터 플라본을 생산할 수 있고, 특히 나린게닌을 아피게닌으로, 및/또는 에리오딕티올을 루테올린으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬마툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터, 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직한 구현예에서, 미생물은:
- 효소 서열 번호: 113, 115 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 가장 특히 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제를 암호화하는 이종 핵산 서열;
- 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 6"-O-람노실트랜스퍼라제를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 당해 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있고, 서열 번호: 117, 119 및 89로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖고, 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 OMT를 암호화하는 이종 핵산 서열;
- 임의로, 플라보논으로부터 플라본을 생산할 수 있고, 특히 나린게닌을 아피게닌으로, 및/또는 에리오딕티올을 루테올린으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있고, 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은 각각의 이러한 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 재조합 미생물은:
- 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열;
- 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치로 람노스를 전달할 수 있는 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열;
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열;
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있는 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열;
- 시토크롬 P450 리덕타제를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제를 암호화하는 이종 핵산 서열; 및
- 플라보논으로부터 플라본을 생산할 수 있고, 특히 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전달할 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전달할 수 있는 플라본 신타제(FNS)를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 재조합 미생물은 또한 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
각각의 효소는 상술한 효소로부터 선택될 수 있다.
나린게닌 및 아피게닌까지
특히 글루코스, 타이로신 또는 페닐알라닌로부터 나린게닌 및 아피게닌의 생합성을 위한 다양한 경로는 식물에서 알려져 있다. 미생물, 특히, 이. 콜라이 및 사카로마이세스 세레비지아에는 변형되어 나린게닌 및/또는 아피게닌을 생산하여 왔다(Hwang EI, et al. 2003. Appl. Environ. Microbiol. 2003, 69(5): 2699-2706; Jiang H1, et al. 2005. Appl. Environ. Microbiol. 2005, 71(6): 2962-9; Pandey et al., 2016, Biotechnol. Adv., 34, 634-662).
예를 들면, 나린게닌 및 아피게닌의 생합성을 위한 경로는 도 1에 기술된 것일 수 있다.
제1 구현예에서, 미생물은 타이로신으로부터 나린게닌 및/또는 아피게닌의 합성에 필요한 효소를 포함한다.
제2 구현예에서, 미생물은 페닐알라닌으로부터 나린게닌 및/또는 아피게닌의 합성에 필요한 효소를 포함한다.
제3 구현예에서, 미생물은 타이로신 및 페닐알라닌으로부터 나린게닌 및/또는 아피게닌의 합성에 필요한 효소를 포함한다.
TAL: 타이로신 암모니아 리아제
TAL은 타이로신 암모니아 리아제이다. 이러한 효소는 타이로신으로부터 p-쿠마르산을 생산할 수 있다. 당해 효소는 EC 4.3.1.23 부류에 속한다.
용어 "페닐알라닌 암모니아 리아제 활성"은 효소 페닐알라닌 암모니아 리아제의 수단에 의하 트랜스-신남산으로 페닐알라닌의 전환을 의미한다. 페닐알라닌 암모니아 리아제 활성이 있는지의 여부를 측정하기 위해, 페닐알라닌 암모니아 리아제 효소 및 페닐알라닌으로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 트랜스-신남산의 출현이 예측된 표준과 비교하여 UPLC-MS에서 관찰된다.
타이로신 암모니아 리아제(TAL)는 또한 상기 정의된 바와 같은 페닐알라닌 암모니아 리아제(PAL) 활성 및/또는 디하이드록시페닐알라닌 암모니아-리아제 (DAL) 활성을 가질 수 있다.
따라서, 미생물은 타이로신 암모니아 리아제를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 이러한 효소는 로도박터(Rhodobacter) 속의 세균 또는 플라보박테리아세아에(Flavobacteriaceae) 속의 세균에 의해 생산된 효소이다. 특수한 구현예에서, 이러한 효소는 로도박터 캅술라투스(Rhodobacter capsulatus) 또는 로도박터 스파에로이데스(Rhodobacter sphaeroides) 세균으로부터 생산된다. 다른 특수한 구현예에서, 이러한 효소는 플리보박테리움 존소니아에(Flavobacterium johnsoniae) 세균에 의해 생산된다. 다른 구현예에서, 이러한 효소는 효모, 특히 로도토룰라(Rhodotorula) 속의 효소, 예를 들면, 로도토룰라 글루티니스(Rhodotorula glutinis)에 의해 생산된 효소이다. 다른 유기체, 예를 들면, 카멜리아 시넨시스, 프라가리아 엑스 아나나싸, 랄스토니아 메탈리두란스 또는 제아 마이스 또한 이러한 효소를 생산한다.
특수한 구현예에서, 타이로신 암모니아 리아제는 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
일 구현예에서, TAL은 플라보박테리움 존소니아에로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 KR095306.1 및 단백질 서열의 경우 번호 AKE50827.1로, 및 보다 특히 서열 번호: 40 및 39로 기술되어 있다.
특히 바람직한 구현예에서, TAL은 로도토룰라 글루티니스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 KF765779.1 및 단백질 서열의 경우 번호 AGZ04575.1로, 및 보다 특히 각각 서열 번호: 42 및 41로 기술되어 있다.
특히 바람직한 구현예에서, 타이로신 암모니아 리아제는 서열 번호: 41로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
4CL: 4-쿠마레이트-CoA 리가제
4CL은 4-쿠마레이트-CoA 리가제이다. 이러한 효소는 p-쿠마르산 및 조효소 A로부터 4-쿠마로일-CoA 및 카페산 및 조효소 A로부터 카페오일-CoA를 생산할 수 있다. 이러한 효소는 EC 6.2.1.12 부류에 속한다.
용어 "4-쿠마레이트-CoA 리가제 활성"는 효소 4-쿠마레이트 CoA 리가제에 의해 p-쿠마르산을 p-쿠마로일-CoA로 또는 카페산을 카페오일-CoA로의 전환시킴을 의미한다. 4-쿠마레이트 CoA 리가제 활성이 있는지를 측정하기 위해, 4-쿠마레이트 CoA 리가제 효소, p-쿠마르산 또는 카페산, ATP 및 CoA로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온 시간 후, p-쿠마로일-CoA 또는 카페오일-CoA의 출현을 UV 분광광도계로 각각 333 nm 및 346 nm의 파장에서 예측된 표준과 비교하여, 관찰한다.
따라서, 미생물은 4-쿠마레이트-CoA 리가제를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 이러한 효소는 식물, 예를 들면, 아비에스(Abies), 아라비돕시스, 아가스타케(Agastache), 아모르파(Amorpha), 브라씨카(Brassica), 시트러스, 카타야(Cathaya), 세드루스(Cedrus), 크로쿠스(Crocus), 라릭스(Larix), 페스투카(Festuca), 글리신(Glycine), 주글란스(Juglans), 케텔레에리아(Keteleeria), 리토스페르뭄(Lithospermum), 롤리움(Lolium), 로투스(Lotus), 라이코페르시콘(Lycopersicon), 말루스(Malus), 메디카고(Medicago), 메심브리안테뭄(Mesembryanthemum), 니코티아나(Nicotiana), 노토트수가(Nothotsuga), 오리자(Oryza), 파세올루스(Phaseolus), 펠라르고니움(Pelargonium), 페트로셀리눔(Petroselinum), 피스코미트렐라(Physcomitrella), 피세아(Picea), 프루누스(Prunus), 슈도라릭스(Pseudolarix), 슈도트수가(Pseudotsuga), 로사(Rosa), 로부스(Rubus), 리자(Ryza), 사카룸(Saccharum), 수아에다(Suaeda), 피누스(Pinus), 포풀루스(Populus), 솔라눔(Solanum), 텔룬기엘라(Thellungiella), 트리티쿰(Triticum), 쓰가(Tsuga), 비티스(Vitis) 또는 제아(Zea)로부터 생산된 효소이다. 대안적으로, 이러한 효소는 미생물, 예를 들면, 아스퍼길러스(Aspergillus), 마이코스파에렐라(Mycosphaerella), 마이코박테리움(Mycobacterium), 나이쎄리아(Neisseria), 뉴로스포라(Neurospora), 스트렙토마이세스(Streptomyces), 로도박터(Rhodobacter) 또는 야로위아(Yarrowia)에 의해 생산된 효소이다.
바람직한 구현예에서, 이러한 효소는 식물, 바람직하게는 아라비돕시스 탈리아나(Arabidopsis thaliana), 시트러스 클레멘티나 또는 페트로셀리눔 크리스품, 특히 아라비돕시스 탈리아나 또는 페트로셀리눔 크리스품에 의해, 또는 바람직하게는 스트렙토마이세스 속의 세균, 특히 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)에 의해 생산된 효소이다.
특수한 구현예에서, 4-쿠마레이트-CoA 리가제는 서열 번호: 43, 45, 47, 49, 123 및 125로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
다른 특수한 구현예에서, 4-쿠마레이트-CoA 리가제는 서열 번호: 43, 45, 47 및 49, 바람직하게는 서열 번호: 45 및 49로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
제1의 특수한 구현예에서, 4CL은 아라비돕시스 탈리아나로부터 유래된다. 이는 NCBI로부터의 핵산 서열의 경우 GenBank 데이타베이스에 AY099747.1 및 단백질 서열의 경우 번호 AAM20598.1로, 및 보다 특히 각각 서열 번호: 44 및 43으로 기술되어 있다.
제2의 특수한 구현예에서, 4CL은 페트로셀리눔 크리스품으로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 X13324.1 또는 X13325.1 및 단백질 서열의 경우 각각 번호 CAA31696.1 또는 CAA31697.1로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 핵산 서열의 경우 참고 번호 P14912 및 P14913로, 및 보다 특히 각각 서열 번호: 46 및 45, 48 및 47로 기술되어 있다. 바람직하게는, 4CL은 페트로셀리눔 크리스품으로부터 유래되고 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 X13324.1 및 단백질 서열의 경우 번호 CAA31696.1로, 및 UniProtKB/Swiss Prot에 참고 번호 P14912, 및 보다 특히 각각 서열 번호: 46 및 45로 기술되어 있다.
제3의 특수한 구현예에서, 4CL은 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 CP016559.1 및 단백질 서열의 경우 번호 ANW18832.1로, 및 보다 특히 각각 서열 번호: 50 및 49로 기술되어 있다.
제4의 특수한 구현예에서, 4CL은 아라비돕시스 탈리아나로부터 유래된다. 이러한 효소의 뉴클레오타이드 서열 및 단백질 서열은 각각 서열 번호: 124 및 123으로 기술되어 있다.
제5의 특수한 구현예에서, 4CL은 시트러스 클레멘티나로부터 유래되고 이러한 효소의 뉴클레오타이드 서열 및 단백질 서열은 각각 서열 번호: 126 및 125에 기술되어 있다.
바람직한 구현예에서, 4CL은 서열 번호: 45, 123 및 125, 바람직하게는 서열 번호: 123 및 45로부터 선택된 서열을 포함하는 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드이다. 가장 특히 바람직하게는, 4CL은 서열 번호: 45로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
CHS: 찰콘 신타제
CHS는 찰콘 신타제이다. 이러한 효소는 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 및 카페오일-CoA로부터 및 말로닐-CoA로부터 에리오딕티올-찰콘을 생산할 수 있다. 이러한 효소는 EC 2.3.1.74 부류에 속한다.
용어 "찰콘 신타제 활성"은 찰콘 신타제 효소의 수단에 의한 p-쿠마로일-CoA 및 말로닐-CoA의 나린게닌 찰콘으로의 또는 카페오일-CoA 및 말로닐-CoA의 에리오딕티올 찰콘으로의 전환을 의미한다. 찰콘 신타제 활성이 있는지를 시험하기 위하여, 찰콘 신타제 효소, 쿠마로일-CoA 또는 카페오일-CoA 및 말로닐-CoA로 구성된 혼합물을, 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 나린게닌 찰콘 또는 에리오딕티올 찰콘 각각의 출현은 HPLC-MS에서 예측된 표준과 비교하여 관찰한다.
미생물은 따라서 찰콘 신타제를 암호화하는 이종 핵산 서열을 포함한다.
이러한 효소는 식물, 특히 아라비돕시스, 아베나(Avena), 코스모스(Cosmos), 시트러스, 다우쿠스(Daucus), 파고피룸(Fagopyrum), 프레에시아(Freesia), 글리신(Glycine), 글리시리자(Glycyrrhiza), 후물루스(Humulus), 하이페리쿰(Hypericum), 호르데움(Hordeum), 주글란스(Juglans), 메디카고(Medicago), 파세올루스(Phaseolus), 피스코미트렐라(Physcomitrella), 플라기오차스마(Plagiochasma), 페트로셀리눔(Petroselinum), 푸에라리아(Pueraria), 루부스(Rubus), 세칼레(Secale), 스쿠텔라리아(Scutellaria), 실레네(Silene), 시나피스(Sinapis), 스피나시아(Spinacia), 스텔라리아(Stellaria), 트리티쿰(Triticum), 툴리파(Tulipa), 베르베나(Verbena), 비티스(Vitis) 또는 크산티스마(Xanthisma) 속, 예를 들면, 아라비돕시스 탈리아나(Arabidopsis thaliana), 아베나 사티바(Avena sativa), 코스모스 술푸레우스(Cosmos sulphureus), 시트러스 시넨시스, 다우쿠스 카로타(Daucus carota), 파고피룸 에스쿨렌툼(Fagopyrum esculentum), 프레레시아 하이브리드 쿨티바르(Freesia hybrid cultivar), 글리신 막스(Glycine max), 글리시리자 에키나타(Glycyrrhiza echinata), 후물루스 루풀루스(Humulus lupulus), 하이페리쿰 안드로사에뭄(Hypericum androsaemum), 호르데움 불가레(Hordeum vulgare), 주글란스 종(Juglans sp.), 메디카고 사티바(Medicago sativa), 파세올루스 불가리스(Phaseolus vulgaris), 피스코미트렐라 파텐스(Physcomitrella patens), 플라기오차스마 압펜디쿨라툼(Plagiochasma appendiculatum), 페트로셀리눔 크리스품(Petroselinum crispum), 푸에라리아 몬타나 바르. 로바타(Pueraria montana var. lobata), 루부스 이다에우스(Rubus idaeus), 세칼레 세레알레(Secale cereale), 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis), 실레네 종(Silene sp.), 시나피스 알바(Sinapis alba), 스피나시아 올레라세아(Spinacia oleracea), 스텔라리아 론기페스(Stellaria longipes), 트리티쿰 아에스티붐(Triticum aestivum), 툴리파 하이브리드 쿨티바르(Tulipa hybrid cultivar), 베르베나 종(Verbena sp.), 비티스 비니페라(Vitis vinifera) 또는 크산티스마 그라실레(Xanthisma gracile)에 의해 생산된 효소일 수 있다.
바람직하게는, 이러한 효소는 식물, 예를 들면 시트러스 속, 특히 시트러스 시넨시스, 또는 호르데움 불가레에 의해 또는 세균, 바람직하게는 스트렙토마이세스 속, 특히 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)에 의해 생산된 효소이다.
특수한 구현예에서, 찰콘 신타제는 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
특히 바람직한 구현예에서, 찰콘 신타제는 서열 번호: 53으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
제1의 특수한 구현예에서, CHS는 호르데움 불가레로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 Y09233.1 및 단백질 서열의 경우 번호 CAA70435.1로, 및 보다 특히 각각 서열 번호: 52 및 51로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q96562로 기술되어 있다.
제2의 특수한 구현예에서, CHS는 시트러스 시넨시스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 AB009351.1 및 단백질 서열의 경우 번호 BAA81664.1로, 및 보다 특히 각각 서열 번호: 54 및 53로 기술되어 있다.
제3의 특수한 구현예에서, CHS는 시트러스 시넨시스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 XM_006489733.1 및 단백질 서열의 경우 번호 XP_006489796.1로, 및 보다 특히 각각 서열 번호: 56 및 55로 기술되어 있다.
제4의 특수한 구현예에서, CHS는 스트렙토마이세스 클라불리게루스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 CP016559.1 및 단백질 서열의 경우 번호 ANW16917.1로, 및 보다 특히 각각 서열 번호: 58 및 57로 기술되어 있다.
찰콘 신타제에 의해 촉매된 반응은 말로닐-CoA의 존재를 필요로 하므로, 미생물을 변형시켜 말로닐-CoA의 합성을 증가시킬 수 있다.
CHI: 찰콘 이소머라제
CHI는 찰콘 이소머라제이다. 이는 나린게닌 찰콘으로부터 나린게닌을 및 에리오딕티올 찰콘으로부터 에리오딕티올을 생산할 수 있다. 이러한 효소는 EC 5.5.1.6 부류에 속한다.
용어 "찰콘 이소머라제 활성"은 찰콘 이소머라제 효소에 의한 나린게닌 찰콘 또는 에리오딕티올 찰콘의 나린게닌 또는 에리오딕티올로의 전환을 의미한다. 찰콘 이소머라제 활성이 있는지를 측정하기 위하여, 찰콘 이소머라제 효소, 나린게닌 찰콘 또는 에리오딕티올 찰콘으로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 나린게닌 또는 에리오딕티올 각각의 출현을 HPLC-MS에서 예측된 표준과 비교하여 관찰한다.
미생물은 따라서 찰콘 이소머라제를 암호화하는 이종 핵산 서열을 포함한다.
이러한 효소는 식물, 특히 아라비돕시스, 진코(Ginkgo), 온시디움(Oncidium), 페릴라(Perilla), 시트러스(Citrus) 또는 트리고넬라(Trigonella), 예를 들면, 아라비돕시스 탈리아나(Arabidopsis thaliana), 진코 빌로바(Ginkgo biloba), 온시디움 고워 람세이(Oncidium Gower Ramsey), 페릴라 프루테스센스(Perilla frutescens), 시트러스 시넨시스 또는 트리고넬라 포에눔-그라에쿰(Trigonella foenum-graecum)으로부터 기원한다.
바람직하게는, 이러한 효소는 식물, 예를 들면, 아라비돕시스 탈리아나에 의해 또는 세균, 바람직하게는 스트렙토마이세스 속, 특히 스트렙토마이세스 클라불리게루스에 의해 생산된 효소이다.
특수한 구현예에서, 찰콘 이소머라제는 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직한 구현예에서, 찰콘 이소머라제는 서열 번호: 61로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
제1의 특수한 구현예에서, CHI는 스트렙토마이세스 클라불리게루스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 CP016559.1 및 단백질 서열의 경우 번호 ANW16918.1로, 및 보다 특히 각각 서열 번호: 60 및 59로 기술되어 있다.
제2의 특수한 구현예에서, CHI는 아라비돕시스 탈리아나로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 NM_115370.4 및 단백질 서열의 경우 번호 NP_191072.1로, 및 보다 특히 각각 서열 번호: 62 및 61로 기술되어 있다.
FNS: 플라본 신타제
아피게닌은 나린게닌으로부터 플라본 신타제(FNS)를 사용하여 제조될 수 있다. 이는 나릴게닌으로부터 아피게닌을 생산할 수 있다.
미생물은 따라서 나린게닌으로부터 아피게닌을 생산할 수 있는 플라본 신타제를 암호화하는 이종 핵산 서열 및/또는 에리오딕티올로부터 루테올린을 생산할 수 있는 플라본 신타제를 암호화하는 이종 핵산 서열, 및/또는 헤스페리딘으로부터 디오스메틴을 생산할 수 있는 플라본 신타제를 암호화하는 이종 핵산 서열을 포함한다.
FNS는 앞서 기술한 것으로부터 선택될 수 있다.
페닐알라닌으로 출발
대안적으로 또는 추가로, 미생물은 또한 페닐알라닌으로부터 -쿠마르산의 합성에 필요한 효소를 포함할 수 있다.
이와 관련하여, 미생물은 페닐알라닌 암모니아 리아제(PAL)를 암호화하는 이종 핵산 서열 및 신나메이트 4-하이드록실라제(C4H)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
PAL은 EC 4.3.1.24 부류에 속한다. 이는 페닐알라닌으로부터 신남산을 생산할 수 있다.
용어 "페닐알라닌 암모니아 리아제 활성"은 효소 페닐알라닌 암모니아 리아제의 수단에 의한 페닐알라닌의 트랜스-신남산으로의 전환을 의미한다. 페닐알라닌 암모니아 리아제 활성이 있는지를 측정하기 위하여, 페닐알라닌 암모니아 리아제 효소 및 페닐알라닌으로 구성된 혼합물을, 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 트랜스-신남산의 출현이 UPLC-MS에서 예측된 표준과 비교하여 관찰된다.
수개의 효소가 이미 선행 분야에 기술되어 왔다. 바람직하게는, 효소는 식물, 예를 들면, 아라비돕시스, 아가스타체(Agastache), 아나나스(Ananas), 아스파라거스(Asparagus), 브라씨카(Brassica), 브롬헤아디아(Bromheadia), 밤부사(Bambusa), 베타(Beta), 베툴라(Betula), 시트러스(Citrus), 쿠쿠미스(Cucumis), 카멜리아(Camellia), 캅시쿰(Capsicum), 카씨아(Cassia), 카타란투스(Catharanthus), 시서(Cicer), 시트룰루스(Citrullus), 코페아(Coffea), 쿠쿠르비타(Cucurbita), 시노돈(Cynodon), 다우쿠스(Daucus), 덴드로비움(Dendrobium), 디안투스(Dianthus), 디기탈리스(Digitalis), 디오스코레아(Dioscorea), 에우칼립투스(Eucalyptus), 칼루스(Gallus), 진코, 글리신(Glycine), 호르데움(Hordeum), 헬리안투스(Helianthus), 이포모에아(Ipomoea), 락투카(Lactuca), 리토스페르뭄(Lithospermum), 로투스(Lotus), 라이코페르시콘(Lycopersicon), 메디카고(Medicago), 마루스(Malus), 마니호트(Manihot), 메디카고(Medicago), 메셈브리안테뭄(Mesembryanthemum), 니코티아나(Nicotiana), 올레아(Olea), 오리자(Oryza), 파세올루스(Phaseolus), 피누스(Pinus), 포풀루스(Populus), 피숨(Pisum), 페르세아(Persea), 페트로셀리눔(Petroselinum), 팔라에놉시스(Phalaenopsis), 필로스타키스(Phyllostachys), 피스코미트렐라(Physcomitrella), 피세아(Picea), 파이루스(Pyrus), 프루누스(Prunus), 쿼르쿠스(Quercus), 라파누스(Raphanus), 레흐만니아(Rehmannia), 루부스(Rubus), 솔라눔(Solanum), 소르굼(Sorghum), 스페노스틸리스(Sphenostylis), 스텔라리아(Stellaria), 스틸로산테스(Stylosanthes), 트리티쿰(Triticum), 트리폴리움(Trifolium), 박시니움(Vaccinium), 비그나(Vigna), 비티스(Vitis), 제아(Zea) 또는 진니아(Zinnia) 속으로부터 유래된다. 예를 들면, 아라비돕시스 탈리아나 또는 페트로셀리눔 크리스품으로부터의 것이 언급될 수 있다. 바람직한 구현예에서, PAL은 시트러스 시넨시스로부터 유래된다.
또한, 페닐알라닌 암모니아 리아제(PAL)는 또한 하기 정의된 바와 같은 타이로신 암모니아 리아제(TAL) 활성 및/또는 디하이드록시페닐알라닌 암모니아-리아제(DAL) 활성을 가질 수 있다.
특수한 구현예에서, 페닐알라닌 암모니아 리아제(PAL)는 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드ㄹ부터 선택된다.
바람직한 구현예에서, PAL은 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 가장 특히 바람직하게는, PAL은 서열 번호: 65로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
특수한 구현예에서, 시트러스 시넨시스로부터의 PAL은 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 XM_006481431.2 하에 및 단백질 서열의 경우 번호 XP_006481494.1로, 및 보다 특히 각각 서열 번호: 64 및 63에 기술되어 있다.
다른 특수한 구현예에서, 시트러스 시넨시스로부터의 PAL은 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 XM_006488000.2로 및 단백질 서열의 경우 번호 XP_006488063.1로, 및 보다 특히 각각 서열 번호: 66 및 65로 기술되어 있다.
다른 특수한 구현예에서, 아라비돕시스 탈리아나로부터의 PAL은 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 NM_115186.4 및 단백질 서열의 경우 번호 NP_190894.1로, 및 보다 특히 각각 서열 번호: 78 및 77로 기술되어 있다.
임의로, 타이로신 및 페닐알라닌으로부터 출발하는 생합성이 고려되며, PAL 및 TAL은 페닐알라닌/타이로신 암모니아 리아제(PTAL)로 대체되거나 보충된다. PTAL은 EC 4.3.1.25 부류에 속한다.
C4H는 EC 1.14.13.11 부류에 속한다. 이는 신남산으로부터 p-쿠마르산을 생산할 수 있다.
용어 "트랜스-신나메이트 4-모노옥시게나제 활성"은 트랜스-신나메이트 4-모노옥시게나제 효소(CPR-의존성)에 의한 트랜스-신남산의 p-쿠마르산으로의 전환을 의미한다. 트랜스-신나메이트 4-모노옥시게나제 활성이 존재하는지를 측정하기 위하여, 트랜스-신나메이트 4-모노옥시게나제 효소, 신남산, NADPH, H+ 및 O2로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 4-하이드록시신나메이트(p-쿠마르산)의 출현은 UPLC-MS에서 예측된 표준과 비교하여 관찰한다.
수개의 효소가 당해 분야에 이미 기술되어 왔다. 바람직하게는, 효소는 식물, 예를 들면 아라비돕시스, 암미(Ammi), 아비센니아(Avicennia), 카멜리아(Camellia), 캄프토테카(Camptotheca), 카타란투스(Catharanthus), 시트러스, 글리신, 헬리안투스, 로투스, 메셈브리안테뭄, 피스코미트레일라(Physcomitreila), 파세올루스, 피누스(Pinus), 포풀루스, 루타(Ruta), 사카룸(Saccharum), 솔라눔, 비티스, 비그나 또는 제아 속의 식물로부터 유래된다. 바람직한 구현예에서, 신나메이트 4-하이드록실라제(C4H)는 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터 유래된다.
특수한 구현예에서, 신나메이트 4-하이드록실라제(C4H)는 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직한 구현예에서, C4H는 서열 번호: 79로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
특수한 구현예에서, 시트러스 시넨시스로부터의 C4H는 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 NM_001288840.1 및 단백질 서열의 경우 번호 NP_001275769.1로, 및 보다 특히 각각 서열 번호: 68 및 67로 기술되어 있다.
다른 특수한 구현예에서, 시트러스 시넨시스로부터의 C4H는 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 NM_001288895.1 및 단백질 서열의 경우 번호 NP_001275824.1로, 및 보다 특히 각각 서열 번호: 70 및 69로 기술되어 있다.
다른 특수한 구현예에서, 아라비돕시스 탈리아나로부터의 C4H는 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 NM_128601.3 및 단백질 서열의 경우 번호 NP_180607.1로, 및 보다 특히 각각 서열 번호: 80 및 79로 기술되어 있다.
카페산을 통한 진행
추가의 구현예에서, 에리오딕티올의 생합성은 또한 타이로신으로부터 L-DOPA (3,4-디하이드록시-L-페닐알라닌) 및 이후 L-DOPA (3,4-디하이드록시-L-페닐알라닌)으로부터 카페산의 합성을 포함할 수 있다. 이를 수행하기 위해, 다음의 효소가 필수적이다. 타이로신을 L-DOPA (3,4-디하이드록시-L-페닐알라닌)으로 전환시키기 위해, 2개의 서브단위, HpaB 및 HpaC가 필수적이다.
HpaB는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB)이다.
바람직하게는, 이러한 효소는 세균, 바람직하게는 에스케리키아 콜라이에 의해 생산된다.
특수한 구현예에서, 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제(HpaB)는 서열 번호: 83로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
특수한 구현예에서, HpaB는 에스케리키아 콜라이로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 단백질 서열의 경우 CAQ34705.1로, 및 보다 특히 서열 번호: 83으로 기술되어 있다. 이러한 효소를 암호화하는 핵산 서열은 서열 번호: 84에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140NG21로 기술되어 있다.
HpaC는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위이다. 미생물은 따라서 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
용어 "p-쿠마레이트 3-하이드록실라제 활성"은 HpaB (4-하이드록시페닐아세테이트 3-하이드록실라제 옥시다제) 및 HpaC (4-하이드록시페닐아세테이트 3-하이드록실라제 리덕타제)로 구성된 효소 복합체를 사용한 p-쿠마르산의 카페산으로 및/또는 L-타이로신의 L-DOPA로의 전환을 의미한다. p-쿠마레이트 3-하이드록실라제 활성이 있는지를 측정하기 위해, 효소 HpaB, HpaC, p-쿠마르산 또는 L-타이로신, FAD 및 NADH로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 카페산 또는 L-DOPA의 출현을 HPLC-MS에서 예측된 표준과 비교하여 관찰된다.
바람직하게는, 이러한 효소는 세균, 바람직하게는 에스케리키아 콜라이에 의해 생산된 효소이다.
특수한 구현예에서, 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제(HpaC)는 서열 번호: 85로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
특수한 구현예에서, HpaC는 에스케리키아 콜라이로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 단백질 서열의 경우 CAQ34704.1로, 및 보다 특히 서열 번호: 85로 기술되어 있다. 이러한 효소를 암호화하는 핵산 서열은 서열 번호: 86에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140NG67 하에 기술되어 있다.
이와 함께, HpaB 및 HpaC는 타이로신으로부터 L-DOPA (3,4-디하이드록시-L-페닐알라닌)을 생산할 수 있다.
따라서, 미생물은 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 (HpaB)를 암호화하는 이종 핵산 서열 및 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제(HpaC)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
더욱이, 이러한 경로는 또한 L-DOPA (3,4-디하이드록시-L-페닐알라닌), 디하이드록시페닐알라닌 암모니아-리아제(DAL)로부터 카페산을 합성할 수 있는 효소의 존재를 필요로 한다. 이러한 효소는 EC 4.3.1.11 부류에 속한다.
용어 "디하이드록시페닐알라닌 암모니아 리아제 활성"은 디하이드록시페닐알라닌 암모니아 리아제 효소에 의해 L-DOPA의 트랜스-카페산의 전환을 의미한다. 디하이드록시페닐알라닌 암모니아 리아제 활성이 있는지를 측정하기 위하여, 디하이드록시페닐알라닌 암모니아 리아제 효소 및 L-DOPA(레보도파)로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 트랜스-카페산의 출현이 UPLC-MS에서 예측된 표준과 비교하여 관찰된다.
또한, 디하이드록시페닐알라닌 암모니아 리아제(DAL)는 또한 타이로신 암모니아 리아제(TAL) 활성 및/또는 페닐알라닌 암모니아-리아제(PAL) 활성을 가질 수 있다.
미생물은 따라서 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB)를 암호화하는 이종 핵산 서열, 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC)를 암호화하는 이종 핵산 서열 및 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
HpaB 및 HpaC의 사용에 대한 대안으로서 또는 이와 함께, 타이로신을 L-DOPA로 전환시키는 효소 및 p-쿠마르산을 카페산으로 전환시키는 효소를 사용하는 것이 가능하다.
이는 각각, L-타이로신 하이드록실라제 활성을 갖고, EC 1.14.99.15 부류에 속하는 4-메톡시벤조에이트 O-데메틸라제, 및 p-쿠마레이트 3-하이드록실라제 활성을 갖고, EC 1.14.13 부류에 속하는 p-쿠마레이트 3-하이드록실라제이다.
이러한 다양한 효소 둘 다는 시토크롬 P450(CYP) 계열의 부분을 형성한다.
용어 "L-타이로신 하이드록실라제 활성"은 p-쿠마레이트 3-하이드록실라제 효소(CPR-의존성)를 사용한 p-쿠마르산의 카페산으로 및/또는 L-타이로신의 L-DOPA로의 전환을 의미한다. L-타이로신 하이드록실라제 활성이 있는지를 측정하기 위하여, p-쿠마레이트 3-하이드록실라제 효소, p-쿠마르산 또는 L-타이로신 및 필수적인 보조인자로 구성된 혼합물을, 최적 조건(pH, 온도, 이온 등) 하에 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 카페산 또는 L-DOPA의 출현이 HPLC-MS에서 예측된 표준과 비교하여 관찰된다.
용어 "p-쿠마레이트 3-하이드록실라제 활성"은 p-쿠마레이트 3-하이드록실라제 효소(CPR-의존성)를 사용한 p-쿠마르산의 카페산으로 및/또는 L-타이로신의 L-DOPA로의 전환을 의미한다. p-쿠마레이트 3-하이드록실라제 활성이 있는지를 측정하기 위하여, p-쿠마레이트 3-하이드록실라제 효소, p-쿠마르산 또는 L-타이로신으로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등)하에 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 카페산 또는 L-DOPA의 출현이 HPLC-MS에서 예측된 표준과 비교하여 관찰된다.
따라서, 재조합 미생물은 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있는 4-메톡시벤조에이트 O-데메틸라제(CYP)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
일 구현예에서, 4-메톡시벤조에이트 O-데메틸라제는 특히 로돕세우도모나스 팔루스트리스(Rhodopseudomonas palustris), 슈도모나스 푸티다(Pseudomonas putida) 또는 에스케리키아 콜라이(Escherichia coli)로부터의 세균 효소, 특히 베타 불가리스로부터의 식물 효소, 특히 오릭톨라구스 쿠니쿨루스(Oryctolagus cuniculus)로부터의 포유동물 효소 또는 로도토룰라 글루티니스(Rhodotorula glutinis)로부터의 진균 효소이다. 특수한 구현예에서, 4-메톡시벤조에이트 O-데메틸라제는 로돕세우도모나스 팔루스트리스, 사카로트릭스 에스파나엔시스(Saccharothrix espanaensis) 또는 베타 불가리스로부터의 효소이다.
특수한 구현예에서, 4-메톡시벤조에이트 O-데메틸라제는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드롤라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
4-메톡시벤조에이트 O-데메틸라제는 또한 베타 불가리스로부터 유래될 수 있다. 이러한 효소를 암호화하는 핵산 서열 및 단백질 서열은 각각 서열 번호: 74 및 73에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 P0DKI2로 기술되어 있다.
또한, 4-메톡시벤조에이트 O-데메틸라제는 사카로트릭스 에스파나엔시스(Saccharothrix espanaensis)로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NC_005296.1 및 WP_011157377.1로, 및 보다 특히 각각 서열 번호: 76 및 75로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q6N8N2 하에 기술되어 있다.
일 구현예에서, 미생물은 4-메톡시벤조에이트 O-데메틸라제를 암호화하는 이종 핵산 서열 및 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
따라서, 재조합 미생물은 p-쿠마르산을 카페산으로 전환시킬 수 있는 쿠마레이트 3-하이드록실라제(Coum3H)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
일 구현예에서, 쿠마레이트 3-하이드록실라제는 특히 사카로트릭스로부터의 세균 효소이다.
특수한 구현예에서, 4-메톡시벤조에이트 O-데메틸라제는 서열 번호: 71로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
이러한 효소 및 단백질을 암호화하는 핵산 서열은 서열 NCBI에 각각 참고 번호 DQ357071.1 및 ABC88666.1 하에, 및 보다 특히 각각 서열 번호: 72 및 71로 기술되어 있다.
일 구현예에서, 미생물은 쿠마레이트 3-하이드록실라제를 암호화하는 이종 핵산 서열 및 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
효소의 추가의 조합
따라서, 앞서 기술한 바와 같이 나린게닌 및/또는 아피게닌으로부터 헤스페리딘 및/또는 디오스민의 생합성에 필요한 효소 외에, 미생물은 바람직하게는 타이로신 및/또는 페닐알라닌으로부터, 바람직하게는 타이로신으로부터 나린게닌 및/또는 아피게닌을 생산하기 위한 효소를 포함한다.
따라서, 특수한 구현예에 따라서, 미생물은
- 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열,
- 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치내로 람노스를 전달할 수 있는 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열,
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열,
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열,
- F3'H 효소를 암호화하는 이종 핵산 서열,
- 및 임의로 FNS 효소를 암호화하는 이종 핵산 서열 및 CPR 효소를 암호화하는 이종 핵산 서열을 포함하고,
또한
- 타이로신 암모니아 리아제(TAL)를 암호화하는 이종 핵산 서열, 4-쿠마로일-CoA 리가제(4CL)를 암호화하는 이종 핵산 서열, 찰콘 신타제(CHS)를 암호화하는 이종 핵산 서열 및 찰콘 이소머라제(CHI)를 암호화하는 이종 핵산 서열을 포함한다.
일 구현예에서, 미생물은:
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 암호화하는 O-메틸트랜스퍼라제(OMT); 바람직하게는 시트러스 클레멘티나, 시트러스 시넨시스, 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 서열 번호: 117, 119, 87 및 89로부터 선택된 서열을 포함하는 OMT 및 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화를 지닌, 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 임의로, 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 임의로, 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 로도토룰라 글루티니스(Rhodotorula glutinis) 또는 플라보박테리움 존소니아에(Flavobacterium johnsoniae)로부터의 타이로신 암모니아 리아제(TAL), 특히 서열 번호: 41 및 39로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 아라비돕시스 탈리아나, 시트러스 클레멘티나, 페트로셀리눔 크리스품 또는 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 4-쿠마로일-CoA 리가제(4CL), 특히 서열 번호: 123, 125, 45, 43, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드; 가장 특히 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열 및
- 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 찰콘 신타제(CHS) 특히 서열 번호: 53, 51, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터의 찰콘 이소머라제(CHI), 특히 서열 번호: 61 및 59로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 본 문서에서, 미생물은 상술한 효소 UGT, RhaT 및 RHM의 조합 중 하나, 특히
- 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제;
- 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 6"-O-람노실트랜스퍼라제; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제를 포함한다.
바람직하게는, 이러한 구현예에서, 미생물은 또한:
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77, 바람직하게는 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 신나메이트 4-하이드록실라제(C4H), 특히 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 및 가장 특히 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
다른 구현예에서, 미생물은:
- 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 암호화하는 이종 핵산 서열; 및
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 임의로, 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열 및
- 임의로, 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 보다 특히 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 53로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 이러한 구현예에서, 미생물은 상술한 효소 UGT, RhaT 및 RHM의 조합 중 하나, 특히
- 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 바람직하게는 서열 번호: 113로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제; 및
- 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 6"-O-람노실트랜스퍼라제; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제를 포함한다.
바람직하게는, 이러한 구현예에서, 미생물은 또한 선행 구현예에 기술된 바와 같은 페닐알라닌 암모니아 리아제(PAL)를 암호화하는 이종 핵산 서열 및 신나메이트 4-하이드록실라제(C4H)를 암호화하는 이종 핵산 서열을 포함한다.
임의로, 이러한 다양한 구현예에서, 미생물은 또한 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열, 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
다른 특수한 구현예에서, 미생물은:
- 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 특히 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 113로부터 선택된 서열을 포함하는 UGT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나로부터의 6"-O-람노실트랜스퍼라제 (RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 103로부터 선택된 서열을 포함하는 RhaT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 107로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화시킬 수 있는; 바람직하게는페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 엑스 하이브리다, 칼리스테푸스 키넨시스(Callistephus chinensis), 게르베라 하이브리다, 시트러스 시넨시스, 시트러스 클레멘티나, 오스테로스페르뭄 하이브리드 쿨티바르, 파네로차에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스 또는 피로셀라 오피시나룸으로부터, 특히 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스 또는 필로셀라 오피시날룸으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17 및 19로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 5, 7 및 17로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 보다 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터, 또는 식물로부터, 예를 들면, 카테란투스 로세우스 또는 아라비돕시스 탈리아나로부터 선택된 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 CPR 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열; 및
- 임의로, 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로, 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라(Medicago truncatula), 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스, 제아 마이스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 메디카고 트루카툴라, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸겔리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이로부터, 바람직하게는 로이세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있는 타이로신 암모니아 리아제(TAL); 특히 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된 TAL; 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- p-쿠마르산 및 조효소 A로부터 p-쿠마르산을 생산할 수 있는 4-쿠마레이트-CoA 리가제(4CL); 바람직하게는 아라비돕시스 탈리아나, 페트로셀눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터 유래된 4CL; 서열 번호: 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생산할 수 있는 찰콘 신타제(CHS), 바람직하게는 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHS; 특히 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 53로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있는 찰콘 이소머라제(CHI); 바람직하게는 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHI; 특히 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산을 포함한다.
다른 특수한 구현예에서, 미생물은 선행 구현예에 기술된 바와 같이, 효소 UGT, RhaT, RHM, F3'H, OMT, 4CL, CHS 및 CHI, 및 임의로 효소 CPR, FNS 및 SAMT를 암호화하는 이종 핵산 서열을 포함하고 또한:
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열 신나메이트 4-하이드록실라제(C4H), 특히 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
제3의 특수한 구현예에서, 미생물은 앞서의 구현예에서 기술된 바와 같은 효소 UGT, RhaT, RHM, F3'H, OMT, 4CL, CHS 및 CHI, 및 임의로 효소 CPR, FNS 및 SAMT를 암호화하는 이종 핵산 서열을 포함하고 또한:
- L-DOPA로부터 카페산을 생산할 수 있는, (3,4-디하이드록시-L-페닐알라닌)를 암호화하는 이종 핵산 서열;
- 바람직하게는 서열 번호: 83로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 또는 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 71로부터 선택된 서열을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 미생물은 앞서의 구현예에서 기술한 바와 같은, 효소 UGT, RhaT, RHM, F3'H, OMT, 4CL, CHS 및 CHI, 및 임의로 효소 CPR, FNS 및 SAMT를 암호화하는 이종 핵산 서열을 포함하고 또한:
- 타이로신으로부터 p-쿠마르산을 생산할 수 있고; 바람직하게는 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된, 타이로신 암모니아 리아제(TAL); 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 각조 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 신나메이트 4-하이드록실라제(C4H), 특히 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 바람직하게는 서열 번호: 83로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 또는 타이로신을 L-DOPA로 및/또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드롤라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 71로부터 선택된 서열을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, L-DOPA(3,4-디하이드록시-L-페닐알라닌)로부터 카페산을 생산할 수 있는 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 미생물은:
- 서열 번호: 113으로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 103으로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제 (TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 45 또는 123으로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 45로부터 선택된 서열 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 53으로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 7로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 서열 번호: 7 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 25로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있고 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은 또한 S-아데노실메티오닌 신테타제(SAMT), 특히 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
효소 또는 효소의 세트의 기원은 이러한 기원이 동일하거나 유사하도록 선택할 수 있다. 예를 들면, 효소 또는 효소의 세트는 세균, 예를 들면 동일한 속 또는 동일한 종의 세균으로부터 수득될 수 있다. 다른 예에서, 효소 또는 효소의 세트는 식물로부터, 예를 들면, 동일한 속 또는 동일한 종의 식물로부터 수득될 수 있다. 이에 대한 이유는 이러한 일반적인 기원이 효소가 최적으로 함께 기능하도록 할 수 있다는 것이다.
일 구현예에서, 미생물은 타이로신의 생합성을 위한 대사 경로를 포함한다. 특히, 미생물은 야생형 균주에 대해 타이로신의 생산이 증가되도록 변형되었다. 특히, 미생물은 탄소 유동이 타이로신 생합성에 대해 재시디되도록 변형될 수 있다. 또한, 미생물은 타이로신 생합성 피드백 억제를 감소시키거나 억제하도록 변형될 수 있다.
다른 구현예에서, 미생물은 페닐알라닌의 생합성을 위한 대사 경로를 포함한다. 특히, 미생물은 야생형 균주에 대해 페닐알라닌의 생산이 증가되도록 변형될 수 있다. 특히, 미생물은 탄소 유동이 페닐알라닌 생합성에 대해 재지시되도록 변형될 수 있다. 또한, 미생물은 페닐알라닌 생합성 피드백 억제를 감소시키거나 억제하도록 변형될 수 있다.
다른 구현예에서, 미생물은 페닐알라닌 및 타이로신의 생합성을 위한 대사 경로를 포함한다. 특히, 미생물은 야생형 균주에 대해 페닐알라닌 및 타이로신의 생산이 증가되도록 변형될 수 있다. 특히, 미생물은 탄소 유동이 페닐알라닌 및 타이로신 생합성에 대해 재지시되도록 변형될 수 있다. 또한, 미생물은 페닐알라닌 및 타이로신 생합성 피드백 억제를 감소시키거나 억제하도록 변형될 수 있다.
재조합 핵산 및 발현 카세트
앞서 기술된 바와 같은 효소를 암호화하는 각각의 핵산 서열이 발현 카세트내에 포함된다. 바람직하게는, 암호화 핵산 서열은 숙주 미생물내에서 발현을 위해 최적화된다. 암호화 핵산 서열은 유전자의 발현, 특히 전사 및 해독에 필요한 성분에 작동적으로 연결된다. 이러한 성분은 숙주 재조합 미생물에서 기능하도록 선택된다. 이러한 성분은, 예를 들면, 전사 프로모터, 전사 활성인자, 터미네이터 서열 및 종결 코돈을 포함할 수 있다. 발현이 요구되는 숙주 세포의 기능으로서 이러한 성분을 선택하는 방법은 당해 분야의 기술자에게 잘 공지되어 있다.
바람직하게는, 프로모터는 강한 프로모터이다. 프로모터는 임의로 유도성일 수 있다.
예를 들면, 미생물이 원핵세포인 경우, 프로모터는 다음의 프로모터로부터 선택될 수 있다: Lacl, LacZ, pLacT, ptac, pARA, pBAD, 박테리오파아지 T3 또는 T7의 RNA 폴리머라제 프로모터, 폴리헤드린 프로모터, 람다 파아지의 PR 또는 PL 프로모터. 하나의 특수한 구현예에서, 프로모터는 pLac이다. 미생물이 진핵세포 및 특히 효모인 경우, 프로모터는 다음의 프로모터로부터 선택될 수 있다: 프로모터 pTDH3, 프로모터 pTEF1, 프로모터 pTEF2, 프로모터 pCCW12, 프로모터 pHHF2, 프로모터 pHTB2 및 프로모터 pRPL18B. 효모에 사용될 수 있는 유도성 프로모터의 예는 프로모터 tetO-2, GAL10, GAL10-CYC1 및 PHO5이다.
기술된 바와 같은 또는 이중 일부의 조합을 암호화하는 핵산 서열을 포함하는 발현 카세트 중 모두 또는 부분은 일반적인 발현 벡터 또는 상이한 발현 벡터내에 포함될 수 있다.
따라서, 본 발명은 플라보논 7-O-베타-D-글루코실트랜스퍼라제 (UGT)를 암호화하는 이종 핵산 서열, 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열 및 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열로부터 선택된 2개의 핵산 서열을 포함하는 벡터에 관한 것이고; 바람직하게는, 벡터는 이러한 3개의 서열을 포함한다.
특히, 본 발명은 다음으로부터 선택된 2개의 핵산 서열을 포함하는 벡터에 관한 것이다:
(i) 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나로부터 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 113, 115, 91, 93, 95 및 97로부터 또는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
(ii) 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나로부터의 6"-O-람노실트랜스퍼라제(RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 103으로부터 선택된 서열을 포함하는 RhaT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
(iii) 시트러스 시넨시스로부터 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 107로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
특히, 벡터는 다음으로부터 선택된 2개의 핵산 서열을 포함할 수 있다:
(i) 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나로부터 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소인 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
(ii) 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나로부터의 6"-O-람노실트랜스퍼라제(RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
(iii) 시트러스 시넨시스로부터 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
바람직하게는, 벡터는 다음으로부터 선택된 2개의 핵산 서열을 포함한다:
(i) 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
(ii) 서열 번호: 103으로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
(iii) 서열 번호: 107로부터 선택된 서열을 포함하는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
바람직한 구현예에서, 미생물은 3개 모두를 포함한다.
암호화 핵산 서열 및 효소 서열은 상기 기술된 바와 같다. 용어 "핵산 서열을 포함하는"은 또한 핵산 서열을 포함하는 발현 카세트를 포함함을 의미한다.
임의로, 벡터는 또한 다음으로부터 선택된 하나 이상의 핵산 서열을 포함할 수 있다: 각각 상기 정의된 바와 같은, O-메틸트랜스퍼라제(OMT)를 암호화하는 핵산 서열, F3'H를 암호화하는 핵산 서열, CPR를 암호화하는 핵산 서열, FNS를 암호화하는 핵산 서열, SAMT를 암호화하는 핵산 서열, TAL를 암호화하는 핵산 서열, 4CL을 암호화하는 핵산 서열, CHS를 암호화하는 핵산 서열, CHI를 암호화하는 핵산 서열, PAL를 암호화하는 핵산 서열, C4H를 암호화하는 핵산 서열, HpaB를 암호화하는 핵산 서열, 및 DAL를 암호화하는 핵산 서열, 및 또한 이의 조합.
바람직하게는, 벡터는 또한 OMT를 암호화하는 핵산 서열, F3'H를 암호화하는 핵산 서열, CPR를 암호화하는 핵산 서열, FNS를 암호화하는 핵산 서열, TAL을 암호화하는 핵산 서열, 4CL을 암호화하는 핵산 서열, CHS를 암호화하는 핵산 서열, CHI를 암호화하는 핵산 서열, PAL을 암호화하는 핵산 서열 및 C4H를 암호화하는 핵산 서열로부터 선택된 하나 이상의 서열을 포함한다.
특히, 벡터는 또한 다음으로부터 선택된 하나 이상의 핵산 서열을 포함할 수 있다:
- 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스, 아라비돕시스 탈리아나, 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르, 파네로차에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스 또는 피로셀라 오피시나룸으로부터, 특히 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 케르베라 하이브리다, 시트러스 시넨시스 또는 피로셀라 오피시나룸으로부터 유래된, 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화하고 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 및 121로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17, 19 및 121로부터 선택된 서열을 포함하는 효소로부터 선택된 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 5, 7, 17 및 121로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시토크롬 P450 리덕타제 (CPR); 바람직하게는 사카로마이세스 세레비지아에로부터, 또는 식물로부터, 예를 들면 카타란투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 25로부터 선택된 서열을 포함하는 CPR 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 117, 119, 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117, 119 및 89로부터 선택된 서열을 포함하는 효소로부터 선택된 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로, 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있는, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스, 제아 마이스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 메티카고 트룬카툴라, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸젤리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트루칸툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터, 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 특히 사카로마이세스 세레비니자에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있고; 바람직하게는 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된 타이로신 암모니아 리아제(TAL); 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 바람직하게는 아라비돕시스 탈리아나, 페트로셀눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터, p-쿠마르산 및 조효소 A로부터 쿠마릴-CoA를 생산할 수 있는 4-쿠마레이트-CoA 리가제(4CL); 서열 번호: 43, 45, 47, 49, 123 및 125로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생산할 수 있는 찰콘 신타제(CHS), 바람직하게는 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHS; 특히 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 효소로부터의 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 53로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있는 찰콘 이소머라제(CHI); 바람직하게는 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHI; 특히 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 신나메이트 4-하이드록실라제(C4H), 특히 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드; 및 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 바람직하게는 서열 번호: 83으로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 71로부터 선택된 서열을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
특히, 벡터는 또한 다음으로부터 선택된 하나 이상의 핵산 서열을 포함할 수 있다:
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스 및 피로셀라 오피시나룸으로부터 유래된 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17 및 19로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 7, 11 및 17로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터의 CPR, 또는 식물, 예를 들면 카타렌투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터, 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있고; 바람직하게는 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된, 타이로신 암모니아 리아제(TAL), 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- p-쿠마르산 및 조효소 A로부터 쿠마릴-CoA를 생산할 수 있는 4-쿠마레이트-CoA 리가제(4CL); 바람직하게는 아라비돕시스 탈리아나, 페트로셀리눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터 유래된 4CL; 특히 서열 번호: 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생한할 수 있고; 바람직하게는 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터 유래된 찰콘 신타제(CHS), 특히 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있고; 바람직하게는 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터 유래된 찰콘 이소머라제(CHI), 특히 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드;
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 신나메이트 4-하이드록실라제(C4H), 특히 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 바람직하게는 서열 번호: 83으로부터 선택된 서열을 포함하는, 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드을 암호화하는 핵산 서열; 또는 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드롤라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 서열 번호: 71을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및
- 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 핵산 서열.
바람직하게는, 벡터는 또한 다음으로부터 선택된 하나 이상의 핵산 서열을 포함할 수 있다:
- 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 가진 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 F3'H, 및 가장 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터 선택된 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 5' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있고 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 효소로부터 선택된 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 81로부터 선택된 서열을 포함하는 S-아데노실메티오닌 신테타제(SAMT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있고 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- p-쿠마르산 및 조효소 A로부터 쿠마릴-CoA를 생산할 수 있고 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4-쿠마레이트-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생산할 수 있고 서열 번호: 53로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있고 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
특수한 구현예에서, 벡터는:
- 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제를 암호화하는 핵산 서열, 및 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실을 가할 수 있는, 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열; 또는
- 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 핵산 서열; 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실을 가할 수 있는, 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열; 및 시토크롬 P450 리덕타제를 암호화하는 이종 핵산 서열; 또는
- 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열; 및 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS)를 암호화하는 이종 핵산 서열; 또는
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제를 암호화하는 이종 핵산 서열; 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실화할 수 있는 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열; 시토크롬 P450 리덕타제를 암호화하는 이종 핵산 서열; 및 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS)를 암호화하는 이종 핵산 서열을 포함한다.
따라서, 벡터는 이로부터 선택된 수개의 핵산 서열, 특히 이로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵산 서열을 포함할 수 있다.
벡터는 특히 상술한 바와 같은 특수한 암호화 서열의 조합을 포함할 수 있다.
벡터는 암호화 서열이 숙주 미생물에 대해 최적화될 수 있고/있거나, 이종 프로모터의 제어 하에 있을 수 있고/있거나 동일한 기원의 미생물로부터 유래되지 않고/않거나 동일한 정렬로 존재하지 않는 암호화 서열과 조합될 수 있는 한 이종인 암호화 서열을 포함한다.
벡터는 임의의 DNA 서열일 수 있고 여기서 이는 외부 핵산, 즉, 숙주 미생물내로 외부 DNA를 도입시킬 수 있도록 하는 벡터를 삽입시키는 것이 가능하다. 예를 들면, 벡터는 플라스미드, 파지미드, 코스미드, 인공 염색체, 특히, YAC, 또는 BAC일 수 있다.
발현 벡터는 선택 마커를 암호화하는 핵산 서열을 포함할 수 있다. 선택 마커는 하나 이상의 항생제 또는 영양요구성 유전자에 대한 내성을 위한 유전자일 수 있다. 영양요구성 유전자는, 예를 들면, URA3, LEU2, HIS3 또는 TRP1일 수 있다. 항생제-내성 유전자는 바람직하게는, 예를 들면, 암피실린, 가나마이신, 하이그로마이신, 게네티신 및/또는 뉴로세트리신에 대한 내성을 위한 유전자일 수 있다.
숙주 미생물 내로의 벡터의 도입은 당해 분야의 기술자에게 널리 알려진 공정이다. 몇가지 방법이 특히 문헌: "Current Protocols in Molecular Biology", 13.7.1-13.7.10; 또는 in Ellis T. et al., Integrative Biology, 2011, 3(2), 109-118에 기술되어 있다.
숙주 미생물은 일시적으로 또는 안정하게 형질전환/형질감염될 수 있고 핵산, 카세트 또는 벡터가 에피소옴 형태 또는 숙주 미생물의 게놈내로 혼입된 형태로 내부에 함유될 수 있다.
발현 벡터는 또한 벡터, 발현 카세트 또는 핵산의 숙주 미생물 게놈내로의 표적화된 삽입을 허용하는 하나 이상의 서열을 포함할 수 있다.
상기 기술된 바와 같은 효소를 암호화하는 핵산 서열 또는 이들 중 일부의 조합을 포함하는 발현 카세트 모두 또는 부분은 재조합 미생물의 염색체내로 삽입될 수 있다.
역으로, 기술된 바와 같은 효소를 암호화하는 핵산 서열 또는 이들 중 일부의 조합을 포함하는 발현 카세트의 모두 또는 부분은 에피소옴 형태, 특히 플라스미드 형태로 보존될 수 있다.
임의로, 미생물은 앞서 기술한 바와 같은 효소를 암호화하는 핵산 서열의 수개의 카피를 포함할 수 있다. 특히, 이는 앞서 기술한 바와 같은 효소를 암호화하는 핵산 서열의 2 내지 10개의 카피, 예를 들면 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 카피를 포함할 수 있다.
본 발명은 특히 헤스페리틴 및 디오스페틴의 7 위치에서 글루코스를 가할 수 있는, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 특히 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 6 위치에서 람노스를 전환시킬 수 있는 6"-O-람노실트랜스퍼라제 (RhaT); 및 특히 미생물에서 UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 핵산 서열을 미생물내로 도입시키는 단계; 및 이러한 핵산 서열을 포함하는 미생물을 선택하는 단계를 포함하는, 본 발명에 따른 미생물의 제조 방법에 관한 것이다.
이러한 방법은 또한 다음 중에서 선택된 하나 이상의 핵산 서열을 도입시키는 단계를 포함할 수 있다:
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화시킬 수 있고; 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스, 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르, 파네로차에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스 또는 피로셀라 오피시나룸으로부터, 특히 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스 또는 피로셀라 오피시날룸으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17 및 19로부터 선택된 서열을 포함하는 효소로부터 선택된 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 5, 7 및 17로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터, 또는 식물로부터, 예를 들면 카타란투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 효소로부터 선택된 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 CPR 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4'에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85 eHSMS 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 89로부터 선택된 서열을 포함하는 효소로부터 선택된 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로, 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스, 제아 마이스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 메디카고 트루카툴라, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸겔리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이로부터, 바람직하게는 로이세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소로부터의 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있는 타이로신 암모니아 리아제 (TAL); 바람직하게는 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된 TAL; 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- p-쿠마르산 및 조효소 A로부터 쿠마릴-CoA를 생산할 수 있는 4-쿠마레이트-CoA 리가제(4CL); 바람직하게는 아라비돕시스 탈리아나, 페트로셀눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터 유래된 4CL; 서열 번호: 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생산할 수 있는 찰콘 신타제(CHS), 바람직하게는 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHS, 특히 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 효소로부터의 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 53로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있는 찰콘 이소머라제(CHI); 바람직하게는 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHI, 특히 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 신나메이트 4-하이드록실라제(C4H), 특히 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 바람직하게는 서열 번호: 83으로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 71로부터 선택된 서열을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및
- 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 핵산 서열을 포함한다.
바람직한 구현예에 따라서, 방법은:
(i) 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
(ii) 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 6"-O-람노실트랜스퍼라제(RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 103으로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
(iii) 시트러스 시넨시스로부터 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
다음으로부터 선택된 적어도 하나의 핵산 서열의 도입 단계를 포함한다:
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 시트러스 클레멘티나, 시트러스 시넨시스, 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 서열 번호: 117, 119, 87 및 89로부터 선택된 서열을 포함하는 OMT 및 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드 및 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- S-아데노실메티오닌 신테타제(SAMT); 특히 사카로마이세스 세레비니자에로부터의 SAMT, 예를 들면 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 핵산 서열; 및
- 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된 타이로신 암모니아 리아제(TAL); 특히 서열 번호: 41 및 39로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 아라비돕시스 탈리아나, 시트러스 크레멘티나, 페트로셀눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터의 4-쿠마레이트-CoA 리가제(4CL); 특히 서열 번호: 123, 125, 45, 43, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드; 가장 특히 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터의 찰콘 신타제(CHS); 특히 서열 번호: 53, 51, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53으로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터의 찰콘 이소머라제(CHI); 특히 서열 번호: 61 및 59로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
바람직하게는, 방법은 이러한 서열 모두의 도입 단계를 포함한다.
바람직하게는, 방법은 또한:
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77, 바람직하게는 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 신나메이트 4-하이드록실라제(C4H), 특히 서열 번호: 67, 69 및 79 및 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열의 도입 단계를 포함한다.
바람직하게는, 방법은 상술한 바와 같은 특수한 암호화 서열의 조합의 도입 단계를 포함한다.
디오스민 및/또는 헤스페리딘의 생산
본 발명은 디오스민 및/또는 헤스페리딘을 생산하기 위한 본 발명에 따른 미생물의 용도에 관한 것이다. 제1의 바람직한 구현예에서, 본 발명은 디오스민을 생산하기 위한 본 발명에 따른 미생물의 용도에 관한 것이다. 제2의 바람직한 구현예에서, 본 발명은 헤스페리딘을 생산하기 위한, 본 발명에 따른 미생물의 용도에 관한 것이다. 바람직한 구현예에서, 본 발명은 디오스민 및 헤스페리딘을 생산하기 위한 본 발명에 따른 미생물의 용도에 관한 것이다.
본 발명은 또한 특히 디오스민 및/또는 헤스페리딘의 생산을 허용하거나 이에 대해 유리한 조건 하에서, 본 발명에 따른 미생물의 배양 단계 및 임의로 생산된 디오스민 및/또는 헤스페리딘의 회수 및/또는 정제 단계를 포함하는 디오스민 및/또는 헤스페리딘의 생산 방법에 관한 것이다.
본 발명에 따른 미생물의 배양 조건은 당해 분야의 기술자에게 잘 공지된 통상의 기술에 따라 채택할 수 있다.
미생물은 적합한 배양 배지 속에서 배양된다. 용어 "적합한 배양 배지"는 일반적으로 상기 미생물의 유지 및/또는 성장에 필수적이거나 유리한 영양물, 예를 들면, 탄소원; 질소원, 예를 들면, 황산암모늄; 인원(phosphorus source), 예를 들면, 일염기성 인산칼륨; 미량 성분, 예를 들면, 구리, 요오드, 철, 마그네슘, 아연 또는 몰리브데이트 염; 비타민 및 다른 성장 인자, 예를 들면, 아미노산 또는 다른 성장 프로모터를 제공하는 배양 배지를 나타낸다. 소포제를 필요한 경우 가할 수 있다. 본 발명에 따라서, 이러한 적합한 배양 배지는 화학적으로 정의되거나 복잡할 수 있다. 따라서 배양 배지는 문헌: Verduyn et al., (Yeast. 1992. 8: 501-17)에 정의되거나, 비써(Visser) 등의 문헌(Biotechnology and Bioengineering. 2002. 79: 674-81)에 의해 채택된 합성 배지, 또는 상업적으로 이용가능한, 예를 들면, YNB 배지(Yeast Nitrogen Base, MP Biomedicals 또는 Sigma-Aldrich)와 동일하거나 유사할 수 있다. 특히, 배양 배지는 단순 탄소원, 예를 들면, 글루코스, 프럭토스, 크실로스, 에탄올, 글리세롤, 갈락토스, 슈크로스, 셀룰로스, 셀로비오스, 전분, 글루코스 중합체, 몰라세스, 또는 이러한 당의 부산물을 포함할 수 있다.
바람직하게는, 본 발명에 따른 미생물에 의한 디오스민 및/또는 헤스페리딘의 생산은 나린게닌, 아피게닌, 에리오딕티올, 루테올린, 헤스페레틴 및/또는 디오스메틴을 배지에 공급하지 않고, 바람직하게는 나린게닌, 아피게닌, 에리오딕티올, 루테올린, 헤스페레틴 및 디오스메틴을 배양 배지에 공급하지 않고 수득된다.
본 발명에 따라서, 목적한 분자의 산업 규모 생산을 위한 임의의 배양 방법이 고려될 수 있다. 유리하게는, 배양은 생물반응기, 특히, 배치(batch), 공급-배치(fed-batch), 케모스타트(chemostat) 및/또는 연속 배양 방식으로 수행된다. 공정 동안 비타민의 제어된 공급은 또한 생산성에 유리할 수 있다(Alfenore et al., Appl. Microbiol. Biotechnol. 2002. 60: 67-72).
배양은 일반적으로 생물반응기 속에서 적합한 배양 배지가 들어있는 에를렌마이어 플라스크(Erlenmeyer flask) 속에서 가능한 고체 및/또는 액체 예비배양 단계로 수행한다.
일반적으로, 본 발명에 따른 미생물의 배양 조건은 미생물의 기능으로서, 당해 분야의 기술자에 의해 용이하게 채택가능하다. 예를 들면, 배양 온도는 특히 효모의 경우 20℃ 내지 40℃, 바람직하게는 28 내지 35℃, 및 보다 특히 에스. 세레비지아에의 경우 약 30℃이다.
본 발명에 따른 미생물은 1 내지 30일, 및 바람직하게는 1 내지 10일 동안 배양될 수 있다.
본 발명에 따른 미생물은 디오스민 및/또는 헤스페리딘을 1 mg/l의 배양 배지, 바람직하게는 10, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100 mg/l의 배양 배지, 임의로 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 또는 1000 mg/l의 배양 배지의 최소량으로 생산할 수 있다.
도 1: 헤스페리딘 및 디오스민을 생산하기 위한 대사 경로의 설명.
도 2: 균주 FL_405 (F3'H4 + CPR2)에 의한 나린게닌으로부터 에리오딕티올의 생산. 대조군 균주: CF235. 균주 fl-405에서 나린게닌 피크의 사라짐 및 에리오딕티올 피크의 출현의 관찰.
도 3: 균주 FL_405 (F3'H4 + CPR2)에 의한 아피게닌으로부터 루테올린의 생산. 대조군 균주: CF235. 균주 FL-405에서 아피게닌 피크의 사라짐 및 루테올린 피크의 출현의 관찰.
도 4: 균주 SC744 (FNSII1 + CPR2)에 의한 나린게닌으로부터 아피게닌의 생산. 대조군 균주: CF234. 균주에서 나린게닌 피크의 사라짐 및 아피게닌 피크의 출현의 관찰.
도 5: 에리오딕티올 SC744(FNSII1 + CPR2)로부터 루테올린의 생산. 대조군 균주: CF234. 균주에서 에리오딕티올 피크의 사라짐 및 루테올린 피크의 출현의 관찰.
도 6: 균주 SC1500에 의한 에리오딕티올 및 루테올린의 생산. 대조군 균주: CF237. 에리오딕티올 및 루테올린 피크의 관찰.
도 7: 균주 SC 1612(MET + SAM) 및 SC 1614(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: CF235. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 8: 균주 SC 1612(MET + SAM) 및 SC 1614(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: CF235. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 9: 균주 SC744(FNSII + CPR)에 의한 헤스페레틴으로부터 디오스메틴의 생산. 대조군 균주: CF234. 균주에서 헤스페레틴 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 10: 이. 콜라이 EC26(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 11: 이. 콜라이 EC26(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 12: 이. 콜라이 EC30(FNSII)에 의한 헤스페레틴으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 헤스페레틴 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 13: 균주 SC1508에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 14: 균주 FL 547(GT + RHM + RHAT)에 의한 헤스페레틴으로부터 헤스페리딘의 생산. 대조군 균주: CF 233. 헤스페레틴 피크의 사라짐 및 헤스페리딘 피크의 출현의 관찰.
도 15: 균주 FL 547(GT + RHM + RHAT)에 의한 디오스메틴으로부터 디오스민의 생산. 대조군 균주: CF 233. 디오스메틴 피크의 사라짐 및 디오스민 피크의 출현의 관찰.
도 16: 이. 콜라이 EC38, EC45 및 EC47(GT + RHM + RHAT)에 의한 헤스페레틴으로부터 헤스페리딘의 생산. 대조군 균주: 이. 콜라이 MH1. 헤스페레틴 피크의 사라짐 및 헤스페리딘 피크의 출현의 관찰.
도 17: 이. 콜라이 EC38, EC45 및 EC47(GT + RHM + RHAT)에 의한 디오스메틴으로부터 디오스민의 생산. 대조군 균주: 이. 콜라이 MH1. 디오스메틴 피크의 사라짐 및 디오스민 피크의 출현의 관찰.
도 18: 균주 SC1509, SC1530, SC1529, SC1568 및 SC2410에 의한 헤스페리딘 및 디오스민의 생산. 대조군 균주: CF237. 헤스페리딘 및 디오스민 피크의 관찰.
도 19: 균주 SC2424, SC2425, SC2426, SC2427, SC2428 및 SC1500에 의한 에리오딕티올 및 루테올린의 생산. 대조군 균주: CF237.
도 20: 균주 SC2147, SC2151, SC1612 및 SC1614에 의한 헤스페레틴 및 호모에리오딕티올의 생산. 대조군 균주: CF235.
도 21: 균주 SC2147, SC2151, SC1612 및 SC1614에 의한 디오스메틴 및 크리소에리올의 생산. 대조군 균주: CF235.
도 22: 이. 콜라이 EC41(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 23: 이. 콜라이 EC43(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 24: 이. 콜라이 EC43(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 25: 균주 SC2408에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 26: 균주 SC2409에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 27: 균주 SC2408, SC2409 및 SC1508에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237.
도 28: 균주 SC1579, SC1584, SC1621 및 SC1626에 의한 헤스페리딘 및 디오스민의 생산.
도 29: 균주 SC2429 내지 SC2434, SC2436 내지 SC2444, SC2446 내지 SC2454, SC2456 내지 SC2464 및 SC2466에 의한 나린게닌으로부터 디오스메틴의 생산.
[표 1]
Figure pct00001

Figure pct00002

Figure pct00003

Figure pct00004

Figure pct00005

Figure pct00006
실시예
물질 및 방법
균주
실시예에 사용된 효모는 사카로마이세스 세레비지아에 FY1679-28A(Tettelin et al., 1995 https://doi.org/10.1016/S1067-2389(06)80008-7)로부터 수득하였다. 당해 효모는 우라실, 트립토판, 히스티딘 및 루이신에 대해 4배 영양요구성이었다. 실시예에 사용된 세균 균주는 에스케리키아 콜라이 MH1으로부터 수득하였다.
표준
표준은 프랑스 소재의 공급업자 Extrasynthese(나린게닌, 아피게닌, 에리오딕티올, 루테올린, 헤스페레틴, 헤스페리딘, 디오스메틴 및 디오스민)로부터 입수하였다.
유전자 클로닝
효모에서 발현하도록 최적화된 유전자는 독일 에베르스버그 소재의 Eurofins Genomics 또는 캐나다 캠프릿지 소재의 Biomatik 또는 미국 샌프란시스코주 소재의 Twist Biosciences 또는 영국 던디 소재의 DC Biosciences에 의해 합성되었다. PCR로, 에스. 세레비지아에로부터의 유전자 cpr2(서열 번호: 26)를 게놈 DNA로부터 증폭시켰다.
합성 또는 PCR에 의해 수득한 유전자는 5' 및 3' 말단에서 BbsI(GAAGAC) 또는 BsaI(GGTCTC) 제한 부위를 포함한다.
모든 유전자, 프로모터 및 터미네이터를 효모 또는 벡터내에서 발현의 경우 벡터 pSBK내에서 또는 이. 콜라이내에서 발현의 경우 벡터 pSB1K3 내에서 제한-클로닝하였다. 프로모터 및 터미네이터(Wargner et al., 2015 DOI: 10.1016/j.fgb.2015.12.001)는 PCR에 의해 효모 에스. 세리비지아에 또는 이. 콜라이의 게놈 DNA로부터 회수하였다.
벡터 pSBK는 효모의 경우 URA 또는 LEU 또는 TRP 또는 HIS 선택 마커를 포함하고 벡터 pSB1K3은 가나마이신-내성 마커를 포함한다.
배양 조건
균주를 효모의 경우 글루코스가 20 g/l에서 보충된 1 ml의 최소 질소 기본 배지(Dutscher, 프랑스 브루마쓰 소재) 및 이. 콜라이의 경우 글루코스가 4 g.l-1에서 보충된 1 ml의 M9 속에 배양하였다. 특정의 경우에, 나린게닌 또는 아피게닌을 100 mg.l-1이 농도에서 가하여 F3'Hs의 활성을 측정하고, 나린게닌 또는 에리오딕티올을 100 mg.l-1의 농도에서 가하여 FNSIIs의 활성을 측정하고, 에리오딕티올 또는 루테올린을 100 mg.l-1의 농도로 가하여 MET의 활성을 측정하고, 헤스페레틴 또는 디오스메틴을 100 mg.l-1의 농도에서 가하여 GT의 활성을 측정하고, 헤스페레틴 7-O-글루코시드 및/또는 디오스메틴 7-O-글루코시드를 가하야 RHM 및 RHAT의 활성을 측정하였다.
각각의 균주를 0.2의 OD에서 동일한 조건 하에 배양한 24-시간 예비 배양물을 사용하여 접종하였다.
분석 방법
샘플의 제조: 1 mL의 배양물을 -80℃에서 동결시키고 12시간 동안 0.10 mbar에서 동결건조시켰다. 이후에, 샘플을 1 mL의 디메틸설폭사이드(DMSO)에 넣고, 30초 동안 1000 rpm에서 교반한 다음 5분 동안 3000 rpm에서 실온에서 원심분리하였다. 원심분리 후, 공지된 용적의 상층액을 메탄올 속에 용해된 공지된 용적의 내부 표준의 혼합물에 가한다.
내부 표준의 최종 농도는 다음과 같다:
* 디오스민 C13 0.5 mg/L
* 디오스메틴 C13 0.015 mg/L
UHPLC-TQ에 의한 분석: 샘플을 Quantis triple-quadrupole MS(Thermo)에 커플링된 Vanquish-H UHPLC machine(Thermo)을 사용하여 분석하였다. 컬럼은 HSST3 1.8 μm 2.1 X 5 mm 예비컬럼과 결합된 Waters Acquity UPLC@ USST3 컬럼(8 μm 2.1 X 100 mm)이다.
이동상 A는 LC/MS-등급 수 중 포름산의 0.1% 용액이고 이동상 B는 순수한 LC/MS-등급 아세토니트릴 중 포름산의 0.1% 용액이다. 컬럼 온도는 50℃이고 샘플 교환기의 온도는 10℃이다.
2개의 크로마토그래피 조건을 목적한 플라보노이드를 검출하는데 사용하였다:
Figure pct00007
Figure pct00008
모니터링된 이온 및 목적한 분자에 대한 단편화 조건은 다음과 같다:
Figure pct00009
Figure pct00010
F3'H
각각의 F3'H에 대한 작제물을 URA 선택 마커를 지닌 벡터 내에서 제조하였다(표 6). 각각의 SAM2 및 다양한 CPR 중 하나 만을 포함하는 작제물을 LEU 선택 마커를 지닌 벡터내에서 생성시켰다(표 7). URA 또는 LEU 선택 마커 만을 포함하는 2개의 벡터를 또한 대조군으로서 생성시켰다. 마커 유전자는 혼입된 목적한 유전자를 갖는 세포를 검출 및 선택하는 것을 가능하도록 한다.
Figure pct00011
Figure pct00012
수개의 균주를 각각 표 6에 나타낸 모든 F3'H을 사용하여 생성시킴으로써 이들이 표 7의 작제물로 각각 시험될 수 있도록 하였다.
이러한 다양한 조립은 F3'H의 효소 활성을 점검하는 것을 가능하게 하고 또한 가장 효율적인 F3'H-CPR 쌍을 측정할 수 있도록 한다.
예를 들면, 균주 FL 405는 작제물 FL 26 및 FL 401을 함유한다.
작제물 TT URA 및 TT LEU를 함유하는 대조군 균주(유전자 부재)는 CF235로 불린다.
FNSII
다음의 FNSII 각각의 경우, TRP 벡터에서 작제물을 제조하였다(표 8). 각각 SAM2 및 상이한 CPR를 함유하는 LEU 선택 마커를 지닌 동일한 벡터를 사용하여 FNSII를 시험하였다(표 9).
Figure pct00013
Figure pct00014
Figure pct00015
수개의 균주를 표 8에서 나타낸 FNSII의 작제물 각각 및 표 9의 CPR의 작제물 각각을 사용하여 생성시켰다.
이러한 다양한 조립체는 FNSII의 효소 활성을 점검할 수 있도록 하고 또한 가장 효율적인 FNSII를 측정할 수 있도록 한다.
예를 들면, 균주 SC 744는 작제물 FL 620 및 FL 401을 함유한다.
작제물 TT TRP 및 TT LEU를 함유하는 대조군 균주(유전자 부재)는 CF234로 불린다.
유사한 작제물을 제조하여 서열 번호: 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159의 FNSII를 시험하였다.
에리오딕티올/루테올린까지의 효모
에리오딕티올 및 루테올린까지의 경로를 포함하는 균주를 또한 사용하였다:
- FL 26, FL 602, FL 808 및 FL 822를 포함하는 균주 SC1500 작제물;
- 작제물 FL 1031 + FL 602 + FL 822 + TT HIS를 포함하는 균주 SC2424;
- 작제물 FL 26 + FL 602 + FL 822 + TT HIS를 포함하는 균주 SC2425;
- 작제물 FL 31 + FL 602 + FL 822 + TT HIS를 포함하는 균주 SC2426;
- 작제물 FL 1031, FL 602, FL 808 및 FL 822를 포함하는 균주 SC2427; 및
- 작제물 FL 31 + FL 602 + FL 808 + FL 822를 포함하는 균주 SC2428.
Figure pct00016
작제물 TT URA, TT TRP, TT HIS 및 TT LEU를 함유하는 대조군 균주(유전자 부재)는 CF237로 불린다.
MET:
각각의 MET를 시험하기 위하여, 작제물을 제조하고 표 11에 나타낸다. 마커 유전자는 혼입된 목적한 유전자를 갖는 세포를 검출 및 선택할 수 있도록 한다.
Figure pct00017
에리오딕티올의 헤스페레틴으로부터 전환에 대해 SC1612의 경우 FL 121 및 FL 266, SC1614의 경우 FL 121 및 FL 268, SC2147 및 FL 469의 경우 FL 475 및 FL 121 및 SC2151의 경우 FL 121을 사용하여 4개의 균주 SC1612, SC1614, SC2147 및 SC2151을 생성시킴으로써 어느 MET가 가장 효율적인지를 측정하였다.
작제물 TT LEU 및 TT URA를 함유하는 대조군 균주(유전자 부재)는 CF235로 불린다.
F3'H, MET, FNS, CPR: 나린게닌으로부터 디오스메틴의 생산
Figure pct00018
Figure pct00019
다음의 균주를 작제하였다:
SC2429: FL 1111 + FL 1031 + FL 121
SC2430: FL 1112 + FL 1031 + FL 121
SC2431: FL 1113 + FL 1031 + FL 121
SC2432: FL 1114 + FL 1031 + FL 121
SC2433: FL 1115 + FL 1031 + FL 121
SC2439: FL 1111 + FL 1031 + TT LEU
SC2440: FL 1112 + FL 1031 + TT LEU
SC2441: FL 1113 + FL 1031 + TT LEU
SC2442: FL 1114 + FL 1031 + TT LEU
SC2443: FL 1115 + FL 1031 + TT LEU
SC2434: FL 1116 + FL 1031 + FL 121
SC2436: FL 1118 + FL 1031 + FL 121
SC2437: FL 1119 + FL 1031 + FL 121
SC2438: FL 1120+ FL 1031 + FL 121
SC2444: FL 1116 + FL 1031 + TT LEU
SC2446: FL 1118 + FL 1031 + TT LEU
SC2447: FL 1119 + FL 1031 + TT LEU
SC2448: FL 1120 + FL 1031 + TT LEU
SC2449: FL 1111 + FL 26 + FL 121
SC2450: FL 1112 + FL 26 + FL 121
SC2451: FL 1113 + FL 26 + FL 121
SC2452: FL 1114 + FL 26 + FL 121
SC2453: FL 1115 + FL 26 + FL 121
SC2459: FL 1111 + FL 26 + TT LEU
SC2460: FL 1112 + FL 26 + TT LEU
SC2461: FL 1113 + FL 26 + TT LEU
SC2462: FL 1114 + FL 26 + TT LEU
SC2463: FL 1115 + FL 26 + TT LEU
SC2454: FL 1116 + FL 26 + FL 121
SC2456: FL 1118 + FL 26 + FL 121
SC2457: FL 1119 + FL 26 + FL 121
SC2458: FL 1120+ FL 26 + FL 121
SC2464: FL 1116 + FL 26 + TT LEU
SC2466: FL 1118 + FL 26 + TT LEU
SC2467: FL 1119 + FL 26 + TT LEU
SC2468: FL 1120 + FL 26 + TT LEU
작제물 TT URA, TT TRP, TT HIS 및 TT LEU를 함유하는 대조군 균주(유전자 부재)는 CF237로 불린다.
헤스페레틴/디오스메틴까지의 이. 콜라이
Figure pct00020
헤스페레틴/디오스메틴까지의 효모
헤스페레틴/디오스메틴까지의 경로를 포함하는 3개의 균주를 또한 시험하였다. 균주 SC1508은 표 14의 작제물 FL 121 + FL 268 + FL 602 + FL 808을 포함한다. 균주 SC2408은 표 14의 작제물 FL 121 + FL 469 + FL 602 + FL 808을 포함한다. 균주 SC2409는 표 14의 작제물 FL 121 + FL 475 + FL 602 + FL 808을 포함한다.
Figure pct00021
Figure pct00022
작제물 TT LEU, TT URA, TT TRP 및 TT HIS를 함유하는 대조군 균주(유전자 부재)는 CF237로 불린다.
GT
각각의 GT를 시험하기 위하여, 작제물을 제조하고 표 15에 나타낸다. 마커 유전자는 혼입된 목적한 유전자를 갖는 세포를 검출 및 선택할 수 있도록 한다.
Figure pct00023
Figure pct00024
Figure pct00025
다양한 GT를 지닌 다양한 작제물은 GT의 효소 활성을 점검하는 것을 가능하도록 하고 또한 가장 효율적인 GT를 측정하는 것을 가능하도록 한다.
작제물 TT URA를 함유하는 대조군 균주(유전자 부재)는 CF233으로 불린다.
RHM
각각의 RHM을 시험하기 위하여, 작제물을 제조하고 표 16에 나타낸다.
Figure pct00026
다양한 RHM을 지닌 다양한 작제물은 RHM의 효소 활성을 점검하는 것을 가능하도록 하고 또한 가장 효율적인 RHM을 측정하는 것을 가능하도록 한다.
작제물 TT URA를 함유하는 대조군 균주(유전자 부재)는 CF233으로 불린다.
RHAT
각각의 RHAT를 시험하기 위하여, 작제물을 제조하고 표 17에 나타낸다.
Figure pct00027
다양한 RHAT를 사용하여 제조된 다양한 조립체는 RHAT의 효소 활성을 점검하는 것을 가능하도록 하고 또한 가장 효율적인 RHAT를 측정하는 것을 가능하도록 한다.
작제물 TT URA를 함유하는 대조군 균주(유전자 부재)는 CF233으로 불린다.
헤스페리딘/디오스민까지의 이. 콜라이
Figure pct00028
헤스페리딘/디오스민까지의 효모
전체 경로를 포함하는 9개의 균주를 또한 생성시켰다.
균주 SC1509는 작제물 FL 121 + FL 511 + FL 602 + FL 808을 포함한다.
균주 SC1530은 작제물 FL 121 + FL 603 + FL 602 + FL 808을 포함한다.
균주 SC1529는 작제물 FL 121 + FL 554 + FL 602 + FL 808을 포함한다.
균주 SC1568은 작제물 FL 121 + FL 556 + FL 602 + FL 808을 포함한다.
균주 SC2410은 작제물 FL 121 + FL 1100 + FL 602 + FL 808을 포함한다.
균주 SC1579는 작제물 FL 401 + FL 547 + FL 602 + FL 828을 포함한다.
균주 SC1584는 작제물 FL 401 + FL 554 + FL 602 + FL 828을 포함한다.
균주 SC1621은 작제물 FL 401 + FL 556 + FL 602 + FL 828을 포함한다.
균주 SC1626은 작제물 FL 401 + FL 603 + FL 602 + FL 828을 포함한다.
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
작제물 TT LEU, TT URA, TT TRP 및 TT HIS를 함유하는 대조군 균주(유전자 부재)는 CF237로 불린다.
결과
F3'H
하기 표 20 및 21은 표 6에 나타낸 F3'H 및 표 7의 작제물을 포함하는 균주를 나린게닌 및 아피게닌 각각의 존재하에 배양함으로써 수득된 에리오딕티올(표 20) 및 루테올린(표 21)의 생산을 나타낸다.
Figure pct00033
다양한 균주가 또한 사용된 F3'H 및 CPR에 따라 상이한 농도에서, 나린게닌으로부터 에리오딕티올을 생산할 수 있다.
Figure pct00034
다양한 균주가 또한 사용된 F3'H 및 CPR에 따라 상이한 농도에서, 아피게닌으로부터 루테올린을 생산할 수 있다(참고: 도 3).
FNS
하기 표 22 및 23운 표 8에 나타낸 FNSII 및 표 9의 작제물을 포함하는 균주를 나린게닌 및 에리오딕티올 각각의 존재하에서 배양함으로써 수득된 아피게닌(표 22) 및 루테올린(표 23)의 생산을 나타낸다.
Figure pct00035
Figure pct00036
다양한 균주가 또한 사용된 FNS에 따라 상이한 농도에서, 나린게닌 및 에리오딕티올로부터 아피게닌 및 루테올린을 생산할 수 있다(참고: 도 4 및 도 5).
유사한 결과가 서열 번호: 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159의 FNSII를 사용하여 수득되었다.
F3'H, MET, FNS, CPR: 나린게닌으로부터 디오스메틴의 생산
균주 SC2429 내지 SC2434, SC2436 내지 SC2444, SC2446 내지 SC2454, SC2456 내지 SC2464 및 SC2466 내지 SC2468에 의한 나린게닌으로부터 디오스메틴의 생산 결과를 도 29에 나타낸다.
모든 균주는 나린게닌으로부터 디오스메틴을 생산할 수 있다. 디오스메틴의 생산은 CPR를 첨가함에 의해 크게 증가된다.
에리오딕티올/루테올린까지의 효모
균주 SC2424, SC2425, SC2426, SC2427, SC1500 및 SC2428은 에리오딕티올 및 루테올린까지의 경로의 모든 효소를 함유하고 글루코스로부터 루테올린 및 에리오딕티올을 생산할 수 있다.
균주 SC1500에 대한 결과는 도 6에 상응하며, 여기서 에리오딕티올 및 루테올린 피크가 관찰된다. 유사한 결과가 균주 SC2424, SC2425, SC2426, SC2427 및 SC2428에 대해 관찰된다. 각각의 균주 SC2424, SC2425, SC2426, SC2427, SC1500 및 SC2428에 대한 에리오딕티올 및 루테올린의 생산은 도 19에 나타낸다.
생합성 경로에 효소 PAL 및 C4H의 첨가는 현저히 보다 높은 에리오딕티올 및 루테올린 농도를 수득하는 것을 가능하도록 함을 주목해야한다. 이러한 농도는 PAL 및 C4H를 제외한 동일한 효소를 함유하는 균주를 사용하여 수득된 농도보다 6배까지 더 높을 수 있다(참고: 도 19, 예를 들면 PAL/C4H가 없는 균주 SC2425 및 PAL/C4H를 지닌 균주 SC1500 또는 PAL/C4H이 없는 균주 SC2426 및 PAL/C4H를 지닌 균주 SC2428를 비교함으로써).
MET
균주 SC1612, SC1614, SC2147 및 SC2151에 의한 에리오딕티올 및 루테올린으로부터 헤스페레틴 및 디오스메틴의 생산을 각각 도 7, 8, 20 및 21에 나타낸다.
효모 균주 SC1612, SC1614, SC2147 및 SC2151은 실제로 헤스페레틴 및/또는 디오스메틴을 생산할 수 있다.
에리오딕티올로 출발하여, 균주 SC2147, SC2151 및 SC1612는 헤스페레틴을 에리오딕티올의 4' 위치에서 하이드록실을 특이적으로 메틸화시킬 수 있다(도 20). 균주 SC1614는 이의 일부의 경우 헤스페레틴 및 호모에리오딕티올의 혼합물을 생산한다.
주목할만한 방식으로, 균주 SC2151은 또한 약 40 mg/L의 헤스페레틴을 생산할 수 있다(도 20). 이의 부분에 대해 균주 SC2147, SC1612 및 SC1614는 루테올린으로부터 디오스메틴을 생산할 수 있다(도 21).
FNSII
균주 SC744에 의한 헤스페레틴으로부터 디오스메틴의 생산 결과를 도 9에 나타낸다.
효모 균주 SC744는 또한 헤스페레틴으로부터 디오스메틴을 생산할 수 있다.
헤스페레틴/디오스메틴까지의 이. 콜라이
균주 EC26, EC41 및 EC43에 의한 에리오딕티올로부터 헤스페레틴의 생산 결과는 도 10, 22 및 23에 나타내고 균주 EC26 및 EC43에 의한 루테올린으로부터 디오스메틴의 생산은 도 11 및 24에 나타낸다.
이. 콜라이 균주 EC26, EC41 및 EC43은 실제로 헤스페레틴 및/또는 디오스메틴을 생산할 수 있다.
균주 EC30에 의한 헤스페레틴으로부터 디오스메틴의 생산 결과는 도 12에 나타낸다.
이. 콜라이 균주 EC30은 실제로 헤스페레틴으로부터 디오스메틴을 생산할 수 있다.
헤스페레틴/디오스메틴까지의 효모
균주 SC1508, SC2408 및 SC2409에 의한 글루코스로부터 헤스페레틴 및 디오스메틴의 생산 결과는 도 13, 25 및 26에 나타낸다.
헤스페레틴 및 디오스메틴까지의 경로의 모든 효소를 함유하는 효모 균주 SC1508, SC2408 및 SC2409는 글루코스로부터 헤스페레틴 및/또는 디오스메틴을 생산할 수 있다(도 27). 주목할만한 방식으로, 균주 SC2408은 약 25 mg/L의 헤스페레틴 및 약 5 mg/L의 디오스메틴을 생산한다.
GT
Figure pct00037
Figure pct00038
다양한 균주가 실제로 헤스페레틴 및 디오스메틴으로부터 헤스페리딘 및/또는 디오스민을 사용된 GT에 따라 상이한 농도로 생산할 수 있다.
RHM
Figure pct00039
Figure pct00040
다양한 균주가 또한 헤스페레틴 및 디오스메틴으로부터 헤스페리딘 및 디오스민을 사용된 RHM에 따라 상이한 농도로 생산할 수 있다.
RHAT
Figure pct00041
Figure pct00042
다양한 균주가 실제로 헤스페레틴 및 디오스메틴으로부터 헤스페리딘 및 디오스민을 사용된 GT, RHM 및 RHAT에 따라 상이한 농도에서 생산할 수 있다.
균주 FL 547에 의한 헤스페레틴 및 디오스메틴으로부터 헤스페리딘 및 디오스민의 생산 결과는 도 14 및 15에 각각 나타낸다.
다양한 작제물로 시험된 효모가 실제로 헤스페리딘 및 디오스민을 생산할 수 있다.
헤스페리딘/디오스민까지의 이. 콜라이
균주 EC38, EC45 및 EC47에 의한 헤스페레틴으로부터 헤스페리딘의 생산 결과는 도 16에 나타낸다.
이러한 균주는 실제로 헤스페레틴으로부터 헤스페리딘을 생산할 수 있다.
균주 EC38, EC45 및 EC47에 의한 디오스메틴으로부터 디오스민의 생산 결과는 도 17에 나타낸다.
이러한 균주는 실제로 디오스메틴으로부터 디오스민을 생산할 수 있다.
헤스페리딘/디오스민까지의 효모
균주 SC1509, SC1530, SC1529, SC1568 및 SC2410에 의한 글루코스로부터 헤스페리딘 및 디오스민의 생산 결과는 도 18에 나타내다. 균주 SC1579, SC1584, SC1621 및 SC1626에 의한 디오스민으로부터 헤스페리딘의 생산 결과는 도 28에 나타낸다.
경로의 효소 모두를 함유하는 모든 균주는 헤스페리딘 및/또는 디오스민을 생산할 수 있다.
SEQUENCE LISTING <110> LES LABORATOIRES SERVIER <120> METHOD FOR THE BIOSYNTHESIS OF DIOSMIN AND/OR HESPERIDIN IN A MICROORGANISM <130> IP20214028/FR <160> 160 <170> KopatentIn 2.0 <210> 1 <211> 524 <212> PRT <213> Perilla frutescens <400> 1 Met Ser Ile Ser Ala Ala Val Ser Leu Ile Ile Cys Thr Ser Ile Leu 1 5 10 15 Gly Val Leu Val Tyr Phe Leu Phe Leu Arg Arg Gly Gly Gly Ser Asn 20 25 30 Gly Arg Pro Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Asn 35 40 45 Leu Pro Gln Leu Gly Pro Lys Pro His Gln Ser Met Ala Ala Leu Ala 50 55 60 Arg Val His Gly Pro Leu Met His Leu Lys Met Gly Phe Val His Val 65 70 75 80 Val Val Ala Ala Ser Ala Thr Val Ala Glu Lys Phe Leu Lys Val His 85 90 95 Asp Thr Asn Phe Leu Ser Arg Pro Pro Asn Ser Gly Ala Glu His Ile 100 105 110 Ala Tyr Asn Tyr Asn Asp Leu Val Phe Ala Pro His Gly Pro Arg Trp 115 120 125 Arg Leu Leu Arg Lys Ile Cys Ala Leu His Leu Phe Ser Ser Lys Ala 130 135 140 Leu Asp Asp Phe Arg His Val Arg Glu Glu Glu Val Gly Ile Leu Ile 145 150 155 160 Arg Asn Leu Ala Ser Val Gly Glu Met Pro Ala Ser Ile Gly Gln Met 165 170 175 Met Tyr Val Cys Ala Thr Asn Ala Ile Ser Arg Val Met Leu Gly Arg 180 185 190 His Val Leu Gly Asp Glu His Arg Gly Ala Ala Gly Gly Gly Asp Thr 195 200 205 Thr Ala Glu Glu Phe Lys Ala Met Val Val Glu Leu Met Ala Leu Ala 210 215 220 Gly Val Phe Asn Val Gly Asp Phe Ile Pro Pro Leu Lys Gly Leu Asp 225 230 235 240 Leu Gln Gly Val Val Ala Lys Met Lys Lys Leu His Gln Arg Phe Asp 245 250 255 Ala Phe Phe Ser Gly Ile Leu His Asp His Lys Ile Asn Gly Ser Asn 260 265 270 Ala Ala Glu Gly His Val Asp Leu Leu Thr Thr Leu Ile Ser Leu Lys 275 280 285 Asp Val Asp Asn Asn Gly Glu Gly Gly Lys Leu Thr Asp Thr Glu Ile 290 295 300 Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr Asp Thr Thr Ser 305 310 315 320 Ser Thr Val Glu Trp Ala Ile Thr Glu Leu Ile Arg Asn Pro Asn Ile 325 330 335 Leu Ala Arg Val Arg Lys Glu Leu Asp Leu Ile Val Gly Lys Asp Lys 340 345 350 Leu Val Lys Glu Ser Asp Leu Gly Gln Leu Thr Tyr Leu Gln Ala Val 355 360 365 Ile Lys Glu Asn Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro 370 375 380 Arg Val Ala Gln Glu Ser Cys Glu Ile Asn Gly Tyr Tyr Ile Pro Lys 385 390 395 400 Asp Ser Thr Leu Leu Val Asn Val Trp Ala Ile Gly Arg Asp Pro Asn 405 410 415 Val Trp Pro Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Met Gly 420 425 430 Gly Glu Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu Leu Ile 435 440 445 Pro Phe Gly Ser Gly Arg Arg Ile Cys Ala Gly Met Asn Leu Gly Ile 450 455 460 Arg Met Val Gln Leu Leu Ile Ala Thr Met Val His Ala Phe Asp Phe 465 470 475 480 Glu Leu Ala Asn Gly Gln Leu Ala Lys Asp Leu Asn Met Glu Glu Ala 485 490 495 Tyr Gly Ile Thr Leu Gln Arg Ala Asp Pro Leu Val Val His Pro Arg 500 505 510 Pro Arg Leu Ala Arg His Val Tyr Gln Ala Gln Val 515 520 <210> 2 <211> 1575 <212> DNA <213> artificial sequence <220> <223> coding sequence for SEQ ID NO: 1 <400> 2 atgtccatct ctgccgccgt ttctttgatc atctgtactt ccattttggg tgttttggtt 60 tacttcttgt tcttgagaag aggtggtggt tctaacggta gaccattgcc accaggtcca 120 agaccatggc caattgtcgg taacttgcca caattgggtc caaagccaca ccaatctatg 180 gctgccttgg ccagagttca cggtccattg atgcacttga agatgggttt cgttcacgtt 240 gttgttgccg cctccgccac cgttgctgaa aagttcttga aggttcacga caccaacttc 300 ttgtctagac caccaaactc cggtgccgaa cacattgctt acaactacaa cgacttggtt 360 ttcgctccac acggtccaag atggagattg ttgagaaaga tttgtgcctt gcacttgttc 420 tcctccaagg ccttggatga cttcagacac gttagagaag aagaagttgg tatcttgatt 480 agaaacttgg cttctgttgg tgaaatgcca gcttctatcg gtcaaatgat gtacgtttgt 540 gccactaacg ctatctctag agtcatgttg ggtagacacg ttttgggtga cgaacacaga 600 ggtgccgccg gtggtggtga taccactgct gaagaattca aggctatggt tgttgaattg 660 atggctttgg ccggtgtttt caacgttggt gatttcattc caccattgaa gggtttggac 720 ttgcaaggtg ttgttgctaa gatgaagaag ttgcaccaaa gattcgacgc tttcttctct 780 ggtatcttgc acgatcacaa gatcaacggt tctaacgccg ctgaaggtca cgttgacttg 840 ttgactactt tgatttcttt gaaggacgtt gacaacaacg gtgaaggtgg taagttgacc 900 gatactgaaa ttaaggcttt gttgttgaac ttgttcactg ctggtactga cactacttct 960 tctactgttg aatgggccat cactgaattg atcagaaacc caaacatttt ggctagagtt 1020 agaaaggaat tggacttgat cgttggtaag gataagttgg ttaaggaatc cgatttgggt 1080 caattgacct acttgcaagc cgttatcaag gaaaacttca gattgcaccc atctactcca 1140 ttgtctttgc caagagtcgc tcaagaatct tgtgaaatca acggttacta catcccaaag 1200 gattctacct tgttggtcaa cgtttgggcc atcggtagag atccaaacgt ttggccagat 1260 ccattggaat tcagaccaga aagattcttg atgggtggtg aaaagccaaa cgttgatgtt 1320 agaggtaacg atttcgaatt gattccattc ggttctggta gaagaatttg tgctggtatg 1380 aacttgggta ttagaatggt tcaattgttg attgctacta tggttcacgc tttcgatttc 1440 gaattggcta acggtcaatt ggccaaggac ttgaacatgg aagaagctta cggtattact 1500 ttgcaaagag ccgacccatt ggttgtccac ccaagaccaa gattggccag acacgtttac 1560 caagctcaag tttaa 1575 <210> 3 <211> 627 <212> PRT <213> Phanerochaete chrysosporium <400> 3 Met Ser Pro Leu Leu Ser Ala Val Pro Ala Ala Ala Leu Pro Leu Leu 1 5 10 15 Ala Ala Ala Met Tyr Val Leu Trp Thr Phe Leu Ala Leu Leu Val Arg 20 25 30 Gln Ala Arg Ser Pro Leu Arg His Leu Arg Gly Pro Pro Ser Pro Ser 35 40 45 Phe Leu Val Gly Asn Leu Arg Glu Met His Asp Gln Glu Asn Thr Ala 50 55 60 Leu Phe Ala Arg Trp Glu His Arg Tyr Gly Ser Thr Phe Val Tyr His 65 70 75 80 Gly Phe Leu Gly Gly Ala Arg Leu Leu Thr Thr Asp Pro Val Ala Val 85 90 95 Ala His Ile Leu Ala His Gly Tyr Asp Phe Pro Lys Pro Glu Phe Ile 100 105 110 Arg Asp Ala Leu Ala Ser Met Ala Ala Gly His Glu Gly Leu Leu Val 115 120 125 Val Glu Gly Asp Gly His Arg Arg Gln Arg Lys Ile Leu Ser Pro Ala 130 135 140 Phe Ala Thr Pro His Ile Lys Ser Leu Ser Pro Ile Ile Trp Ser Lys 145 150 155 160 Ala Thr Gln Leu Arg Asp Val Trp Ile Asp Leu Ala Ser Ser Pro Ser 165 170 175 Leu Thr Pro Ala Ala Thr Pro Ser Asp Pro Leu Ala His Ala Glu Glu 180 185 190 Gln Pro Ala Arg Ala Ser Gly Phe Leu Pro Asn Pro Phe Ser Ser Phe 195 200 205 Leu Ser Ser Lys Ala His Pro Arg Ser Ala Leu Pro Arg Ala Glu Ala 210 215 220 His Pro Glu Asp Arg Met Ser Ser Pro Gly Thr Lys Val Asp Val Leu 225 230 235 240 Ala Trp Leu Ala Arg Ala Thr Leu Asp Val Ile Gly Glu Ala Gly Phe 245 250 255 Gly Tyr Ala Phe Asn Ser Val Arg Ala Ala Ala Cys Pro Gly Asp Ala 260 265 270 Ala Glu Asp Glu Leu Ala Arg Ala Phe Ala Val Ile Phe Ser Thr Ala 275 280 285 Arg Lys Phe Arg Leu Ile Thr Val Leu Gln Val Trp Phe Pro Phe Leu 290 295 300 Arg Arg Phe Arg Arg Asn Ser Ala Ala Glu Asp His Ala Arg Ala Thr 305 310 315 320 Met Arg Arg Ile Gly Leu Ala Leu Ile Ala Glu Arg Arg Gln Glu Val 325 330 335 Leu Asp Asp Lys Ala His Ala Ser Gln Glu Ala Met Asp Gly Lys Asp 340 345 350 Leu Leu Thr Val Met Ile Lys Ser Ser Leu Ser Ser Asp Pro Ser Gln 355 360 365 Gln Leu Ser Thr Asn Glu Met Leu Cys Gln Ile Ala Thr Phe Leu Ala 370 375 380 Ala Gly His Glu Thr Ser Ala Ser Ala Leu Ser Trp Ala Leu Tyr Ala 385 390 395 400 Leu Ala Arg Ala Pro Ala Cys Gln His Thr Leu Arg Arg Glu Leu Arg 405 410 415 Ala Leu Thr Leu Pro Ala Asp Pro Ser Ala Ala Asp Leu Gln Ala Val 420 425 430 Leu Ala Leu Pro Tyr Leu Asp Ala Val Val Arg Glu Thr Leu Arg Val 435 440 445 His Ala Pro Val Thr Ser Thr Met Arg Val Ala Ala His Asp Ala Ala 450 455 460 Val Pro Val Gly Thr Pro Phe Arg Asp Ala His Gly Ala Gln His Ala 465 470 475 480 Ala Ile Arg Leu Arg Ala Gly Asp Val Val Thr Leu Pro Leu Gln Ala 485 490 495 Met Asn Lys Ala Arg Ala Leu Trp Gly Ala Asp Ala Ala Cys Phe Arg 500 505 510 Pro Glu Arg Trp Leu Ala His Gly Asp Ala Pro Arg Glu Pro Arg Gly 515 520 525 Leu Trp Gly Gly Val Met Thr Phe Gly Thr Gly Val Val Ala Asn Gly 530 535 540 Asn Arg Ser Cys Ile Gly Tyr Arg Phe Ala Val Asn Glu Ile Lys Leu 545 550 555 560 Phe Leu Tyr Ala Leu Val Arg Asp Ile Glu Phe Thr Ile Asp Pro Trp 565 570 575 Ile Glu Ile Glu Lys Arg Val Asn Val Val Thr Arg Pro Cys Val Lys 580 585 590 Ser Glu Pro His Leu Gly Asn Gln Met Pro Leu Arg Leu Arg Arg Val 595 600 605 Ala Val Glu Glu Thr Val Gly Asp Ser Ser Gly Asp Gly Ala Pro Arg 610 615 620 Thr Val Ser 625 <210> 4 <211> 1884 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 3 <400> 4 atgtccccat tgttgtctgc cgttccagcc gccgctttgc cattgttggc cgccgctatg 60 tacgttttgt ggactttctt ggctttgttg gttagacaag ccagatcccc attgagacac 120 ttgagaggtc caccatctcc atctttcttg gtcggtaact tgagagaaat gcacgaccaa 180 gaaaacaccg ctttgttcgc tagatgggaa cacagatacg gttctacctt cgtctaccac 240 ggtttcttgg gtggtgccag attgttgacc accgacccag tcgccgtcgc ccacatcttg 300 gcccacggtt acgacttccc aaagccagaa ttcatcagag atgccttggc ttctatggcc 360 gccggtcacg aaggtttgtt ggtcgtcgaa ggtgacggtc acaggagaca aagaaagatc 420 ttgtccccag ctttcgccac tccacacatc aagtctttgt ctccaatcat ctggtctaag 480 gctactcaat tgagagatgt ttggattgac ttggcctctt ctccatcctt gactccagct 540 gctaccccat ccgacccatt ggctcacgct gaagaacaac cagctagagc ttctggtttc 600 ttgccaaacc cattctcttc tttcttgtca tctaaggctc acccaagatc cgctttgcca 660 agagctgaag ctcacccaga agatagaatg tcctctccag gtaccaaggt cgacgttttg 720 gcttggttgg ctagagccac tttggacgtc atcggtgaag ccggtttcgg ttacgctttc 780 aactctgtca gagccgctgc ttgtccaggt gacgccgctg aagatgaatt ggctagagct 840 ttcgctgtca tcttctctac tgctagaaag ttcagattga tcactgtctt gcaagtttgg 900 ttcccattct tgagaagatt cagaagaaac tctgctgctg aagatcacgc tagagctact 960 atgagaagaa tcggtttggc tttgatcgct gaaaggagac aagaagtctt ggacgacaag 1020 gctcacgcct ctcaagaagc tatggatggt aaggacttgt tgactgtcat gatcaagtca 1080 tctttgtcat ccgatccatc tcaacaattg tctactaacg aaatgttgtg tcaaatcgct 1140 actttcttgg ctgctggtca cgaaacctct gcttctgctt tgtcttgggc cttgtacgcc 1200 ttggctagag ctccagcttg tcaacacact ttgagaagag aattgagagc tttgactttg 1260 ccagctgacc catctgccgc tgacttgcaa gctgttttgg ctttgccata cttggacgcc 1320 gtcgttagag aaactttgag agttcacgct ccagttactt ctactatgag agtcgctgct 1380 cacgacgccg ctgttccagt cggtactcca ttcagagatg ctcacggtgc tcaacacgcc 1440 gctatcagat tgagagctgg tgacgtcgtc actttgccat tgcaagctat gaacaaggcc 1500 agagctttgt ggggtgccga cgccgcttgt ttcagaccag aaagatggtt ggctcacggt 1560 gacgccccaa gagaaccaag aggtttgtgg ggtggtgtca tgactttcgg taccggtgtc 1620 gtcgctaacg gtaacagatc ttgtattggt tacagattcg ctgttaacga aatcaagttg 1680 ttcttgtacg ccttggttag agacatcgaa ttcactatcg acccatggat cgaaatcgaa 1740 aagagagtta acgtcgtcac cagaccatgt gtcaagtccg aaccacactt gggtaaccaa 1800 atgccattga gattgagaag agtcgctgtt gaagaaactg ttggtgattc ttctggtgac 1860 ggtgctccaa gaactgtttc ttaa 1884 <210> 5 <211> 513 <212> PRT <213> Petunia x hybrida <400> 5 Met Ser Glu Ile Leu Ser Leu Ile Leu Tyr Thr Val Ile Phe Ser Phe 1 5 10 15 Leu Leu Gln Phe Ile Leu Arg Ser Phe Phe Arg Lys Arg Tyr Pro Leu 20 25 30 Pro Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Ile Gly Asn Leu Val 35 40 45 His Leu Gly Pro Lys Pro His Gln Ser Thr Ala Ala Met Ala Gln Thr 50 55 60 Tyr Gly Pro Leu Met Tyr Leu Lys Met Gly Phe Val Asp Val Val Val 65 70 75 80 Ala Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala 85 90 95 Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Glu His Met Ala Tyr 100 105 110 Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met 115 120 125 Leu Arg Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp 130 135 140 Asp Phe Arg His Val Arg Gln Asp Glu Val Lys Thr Leu Thr Arg Ala 145 150 155 160 Leu Ala Ser Ala Gly Gln Lys Pro Val Lys Leu Gly Gln Leu Leu Asn 165 170 175 Val Cys Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val 180 185 190 Phe Ala Asp Gly Ser Gly Asp Val Asp Pro Gln Ala Ala Glu Phe Lys 195 200 205 Ser Met Val Val Glu Met Met Val Val Ala Gly Val Phe Asn Ile Gly 210 215 220 Asp Phe Ile Pro Gln Leu Asn Trp Leu Asp Ile Gln Gly Val Ala Ala 225 230 235 240 Lys Met Lys Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Asp Ile 245 250 255 Leu Glu Glu His Lys Gly Lys Ile Phe Gly Glu Met Lys Asp Leu Leu 260 265 270 Ser Thr Leu Ile Ser Leu Lys Asn Asp Asp Ala Asp Asn Asp Gly Gly 275 280 285 Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val 290 295 300 Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu 305 310 315 320 Leu Ile Arg Asn Pro Lys Ile Leu Ala Gln Ala Gln Gln Glu Ile Asp 325 330 335 Lys Val Val Gly Arg Asp Arg Leu Val Gly Glu Leu Asp Leu Ala Gln 340 345 350 Leu Thr Tyr Leu Glu Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro 355 360 365 Ser Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile 370 375 380 Asn Gly Tyr Phe Ile Pro Lys Gly Ser Thr Leu Leu Leu Asn Val Trp 385 390 395 400 Ala Ile Ala Arg Asp Pro Asn Ala Trp Ala Asp Pro Leu Glu Phe Arg 405 410 415 Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Lys Val Asp Val Arg 420 425 430 Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys 435 440 445 Ala Gly Met Asn Leu Gly Ile Arg Met Val Gln Leu Met Ile Ala Thr 450 455 460 Leu Ile His Ala Phe Asn Trp Asp Leu Val Ser Gly Gln Leu Pro Glu 465 470 475 480 Met Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp 485 490 495 Pro Leu Val Val His Pro Arg Pro Arg Leu Glu Ala Gln Ala Tyr Ile 500 505 510 Gly <210> 6 <211> 1542 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 5 <400> 6 atgtccgaaa tcttgtcttt gattttgtac accgtcattt tctctttctt gttgcaattc 60 attttgagat ctttcttcag aaagagatac ccattgccat tgccaccagg tccaaagcca 120 tggccaatta tcggtaactt ggtccacttg ggtccaaagc cacaccaatc tactgctgcc 180 atggctcaaa cttacggtcc attgatgtac ttgaagatgg gtttcgttga cgttgttgtt 240 gctgcctctg cttctgttgc tgctcaattc ttaaagactc acgatgctaa cttctcttct 300 agaccaccaa actctggtgc tgaacacatg gcttacaact accaagattt ggttttcgct 360 ccatacggtc caagatggag aatgttgaga aagatttgtt ctgttcactt gttctctacc 420 aaggctttgg atgacttcag acacgtcaga caagatgaag ttaagacttt gactagagct 480 ttggcttctg ctggtcaaaa gccagtcaag ttgggtcaat tgttgaacgt ttgtactact 540 aacgctttgg ctagagttat gttgggtaag agagttttcg ccgacggttc tggtgatgtt 600 gatccacaag ctgctgaatt caagtctatg gttgttgaaa tgatggttgt cgccggtgtt 660 ttcaacattg gtgatttcat tccacaattg aactggttgg atattcaagg tgttgccgct 720 aagatgaaga agttgcacgc tagattcgac gctttcttga ctgatatctt ggaagaacac 780 aagggtaaga ttttcggtga aatgaaggat ttgttgtcta ctttgatctc tttgaagaac 840 gatgatgctg ataacgatgg tggtaagttg actgatactg aaattaaggc tttgttgttg 900 aacttgttcg ttgctggtac tgacacttct tcttctactg ttgaatgggc cattgctgaa 960 ttgattagaa acccaaagat cttggcccaa gcccaacaag aaatcgacaa ggtcgttggt 1020 agagacagat tggttggtga attggacttg gcccaattga cttacttgga agctatcgtc 1080 aaggaaacct tcagattgca cccatctacc ccattgtctt tgccaagaat tgcttctgaa 1140 tcttgtgaaa tcaacggtta cttcattcca aagggttcta ctttgttgtt gaacgtttgg 1200 gccattgcta gagatccaaa cgcttgggct gatccattgg aattcagacc agaaagattc 1260 ttgccaggtg gtgaaaagcc aaaggttgat gtcagaggta acgacttcga agtcatccca 1320 ttcggtgctg gtagaagaat ttgtgctggt atgaacttgg gtatcagaat ggtccaattg 1380 atgattgcta ctttgatcca cgctttcaac tgggatttgg tatctggtca attgccagaa 1440 atgttgaaca tggaagaagc ttacggtttg accttgcaaa gagctgatcc attggttgtt 1500 cacccaagac caagattgga agcccaagct tacattggtt aa 1542 <210> 7 <211> 519 <212> PRT <213> Callistephus chinensis <400> 7 Met Ser Thr Ile Leu Pro Phe Ile Phe Tyr Thr Cys Ile Thr Ala Leu 1 5 10 15 Val Leu Tyr Val Leu Leu Asn Leu Leu Thr Arg Asn Pro Asn Arg Leu 20 25 30 Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu 35 40 45 Gly Met Ile Pro His His Ser Leu Ala Ala Leu Ala Gln Lys Tyr Gly 50 55 60 Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala 65 70 75 80 Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe 85 90 95 Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr 100 105 110 Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg 115 120 125 Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp Phe 130 135 140 Arg His Val Arg Glu Glu Glu Val Ala Ile Leu Thr Arg Val Leu Val 145 150 155 160 His Ala Gly Glu Ser Ala Val Lys Leu Gly Gln Leu Leu Asn Val Cys 165 170 175 Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Ala 180 185 190 Asp Gly Ser Glu Gly Arg Gly Val Asp Pro Lys Ala Asp Glu Phe Lys 195 200 205 Asp Met Val Val Glu Leu Met Glu Leu Ala Gly Glu Phe Asn Ile Gly 210 215 220 Asp Phe Ile Pro Pro Leu Asp Cys Leu Asp Leu Gln Gly Ile Thr Lys 225 230 235 240 Lys Met Lys Lys Leu His Ala Arg Phe Asp Lys Phe Leu Asn Ile Ile 245 250 255 Leu Asp Asp His Lys Ile Glu Lys Gly Ala Ala Gly Arg Arg His Ser 260 265 270 Asp Leu Leu Thr Thr Leu Ile Ser Leu Lys Asp Val Asp Ala Ala Asp 275 280 285 Asp Asp Glu Glu Gly Lys Leu Ser Asp Ile Glu Ile Lys Ala Leu Leu 290 295 300 Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu 305 310 315 320 Trp Ala Val Ala Glu Leu Ile Arg His Pro Glu Leu Leu Lys Gln Ala 325 330 335 Arg Glu Glu Met Asp Ile Val Val Gly Arg Asp Arg Leu Val Thr Glu 340 345 350 Leu Asp Leu Ser Arg Leu Thr Phe Leu Gln Ala Ile Val Lys Glu Thr 355 360 365 Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Met Ala Ser 370 375 380 Glu Ser Cys Glu Val Asp Gly Tyr Tyr Ile Pro Lys Gly Ser Thr Leu 385 390 395 400 Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro Lys Met Trp Thr Asn 405 410 415 Pro Leu Glu Phe Arg Pro Ser Arg Phe Leu Pro Gly Gly Glu Lys Pro 420 425 430 Asp Ala Asp Ile Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala 435 440 445 Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly Met Arg Met Val Gln 450 455 460 Leu Leu Ile Ala Thr Leu Val Gln Thr Phe Asp Trp Glu Leu Ala Asn 465 470 475 480 Gly Leu Asp Pro Glu Lys Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr 485 490 495 Leu Gln Arg Ala Glu Pro Leu Met Val His Pro Arg Pro Arg Leu Ser 500 505 510 Pro His Val Tyr Glu Ser Arg 515 <210> 8 <211> 1560 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 7 <400> 8 atgtccacca ttttgccatt cattttctac acttgtatca ctgccttggt tttgtacgtt 60 ttgttgaact tgttgaccag aaacccaaac agattgccac caggtccaac cccatggcca 120 atcgttggta acttgccaca cttgggtatg atcccacacc actctttggc tgccttggcc 180 caaaagtacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt cgttgccgct 240 tctgcttccg ttgctgctca attcttaaag actcacgacg ctaacttcgc ttctagacca 300 ccaaactctg gtgccaagca cattgcctac aactaccaag atttggtttt cgctccatac 360 ggtccaagat ggagaatgtt gagaaagatt tgttctgttc acttgttctc cactaaggct 420 ttggacgact tcagacacgt tagagaagaa gaagttgcta tcttgactag agttttggtc 480 cacgctggtg aatctgctgt taagttgggt caattgttga acgtttgtac cactaacgct 540 ttggctagag ttatgttggg tagaagagtt ttcgctgacg gttctgaagg tagaggtgtc 600 gacccaaagg ctgatgaatt caaggacatg gttgttgaat tgatggaatt ggccggtgaa 660 ttcaacatcg gtgacttcat cccaccattg gactgtttgg atttgcaagg tatcaccaag 720 aagatgaaga agttgcacgc tagattcgac aagttcttga acatcatctt ggacgaccac 780 aagatcgaaa agggtgctgc cggtagaagg cactctgact tgttgaccac tttgatttct 840 ttgaaggatg ttgatgctgc tgatgatgat gaagaaggta agttgtctga cattgaaatc 900 aaggctttgt tgttgaactt gttcgctgct ggtactgaca cttcttcttc taccgttgaa 960 tgggctgttg ccgaattgat tagacaccca gaattgttga agcaagctag agaagaaatg 1020 gatatcgttg ttggtagaga cagattggtt accgaattgg acttgtctag attgactttc 1080 ttgcaagcca ttgttaagga aaccttcaga ttgcacccat ctactccatt gtccttgcca 1140 agaatggctt ctgaatcttg tgaagttgat ggttactaca ttccaaaggg ttccactttg 1200 ttggttaacg tttgggccat cgccagagat ccaaagatgt ggactaaccc attggaattc 1260 agaccatcta gattcttgcc aggtggtgaa aagccagatg ctgatatcaa gggtaacgat 1320 ttcgaagtca tcccattcgg tgccggtaga agaatctgtg ctggtatgtc tttgggtatg 1380 agaatggtcc aattgttgat tgctactttg gtccaaacct tcgattggga attggctaac 1440 ggtttggacc cagaaaagtt gaacatggaa gaagcttacg gtttgacctt gcaaagagct 1500 gaaccattga tggttcaccc aagaccaaga ttgtctccac acgtttacga atctagataa 1560 <210> 9 <211> 511 <212> PRT <213> Callistephus chinensis <400> 9 Met Ser Ser Ile Leu Ser Leu Leu Val Tyr Phe Cys Ile Ser Leu Leu 1 5 10 15 Val Ile Ile Ala Leu Val Asn Met Phe Ile Thr Arg His Thr Asn Arg 20 25 30 Leu Pro Pro Gly Pro Ala Pro Trp Pro Val Val Gly Asn Leu Pro His 35 40 45 Leu Gly Ala Ile Pro His His Thr Leu Ala Ala Leu Ala Thr Lys Tyr 50 55 60 Gly Pro Leu Val Tyr Leu Arg Leu Gly Phe Val His Val Val Val Ala 65 70 75 80 Ser Ser Pro Ser Val Ala Ala Gln Phe Leu Lys Val His Asp Leu Lys 85 90 95 Phe Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn 100 105 110 Tyr Gln Asp Met Val Phe Ala Pro Tyr Gly Pro Gln Trp Thr Met Phe 115 120 125 Arg Lys Ile Cys Lys Asp His Leu Phe Ser Ser Lys Ala Leu Asp Asp 130 135 140 Phe Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Ala Arg Gly Leu 145 150 155 160 Ala Gly Ala Gly Arg Ser Lys Val Asn Leu Gly Gln Gln Leu Asn Met 165 170 175 Cys Thr Ala Asn Thr Leu Ala Arg Met Met Leu Asp Lys Arg Val Phe 180 185 190 Gly Asn Glu Ser Gly Gly Asp Asp Pro Lys Ala Asn Glu Phe Lys Glu 195 200 205 Met Ala Thr Glu Leu Met Phe Leu Ala Gly Gln Phe Asn Ile Gly Asp 210 215 220 Tyr Ile Pro Val Leu Asp Trp Leu Asp Leu Gln Gly Ile Val Lys Lys 225 230 235 240 Met Lys Lys Leu His Thr Arg Phe Asp Lys Phe Leu Asp Val Ile Leu 245 250 255 Asp Glu His Lys Val Ile Ala Ser Gly His Ile Asp Met Leu Ser Thr 260 265 270 Leu Ile Ser Leu Lys Asp Asp Thr Ser Val Asp Gly Arg Lys Pro Ser 275 280 285 Asp Ile Glu Ile Lys Ala Leu Leu Leu Glu Leu Phe Val Ala Gly Thr 290 295 300 Asp Thr Ser Ser Asn Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg 305 310 315 320 Gln Pro His Leu Leu Lys Arg Ala Gln Glu Glu Met Asp Ser Val Val 325 330 335 Gly Gln Asn Arg Leu Val Thr Glu Met Asp Leu Ser Gln Leu Thr Phe 340 345 350 Leu Gln Ala Ile Val Lys Glu Ala Phe Arg Leu His Pro Ser Thr Pro 355 360 365 Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Val Asp Gly Tyr 370 375 380 Tyr Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Ile Trp Ala Ile Gly 385 390 395 400 Arg His Pro Glu Val Trp Thr Asp Pro Leu Glu Phe Arg Pro Thr Arg 405 410 415 Phe Leu Pro Gly Gly Glu Lys Pro Gly Ile Val Val Lys Val Asn Asp 420 425 430 Phe Glu Val Leu Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met 435 440 445 Ser Leu Ala Leu Arg Thr Val Gln Leu Leu Met Gly Thr Leu Val Gln 450 455 460 Ala Phe Asp Trp Glu Leu Ala Asn Gly Ile Lys Pro Glu Lys Leu Asn 465 470 475 480 Met Asp Glu Ala Phe Gly Leu Ser Val Gln Arg Ala Glu Pro Leu Val 485 490 495 Val His Pro Arg Pro Arg Leu Pro Pro His Val Tyr Lys Ser Gly 500 505 510 <210> 10 <211> 1536 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 9 <400> 10 atgtcctcta ttttgtcttt gttggtctac ttctgtatct ctttgttggt tatcattgct 60 ttggttaaca tgttcatcac cagacacacc aacagattgc caccaggtcc agccccatgg 120 ccagtcgtcg gtaacttgcc acacttgggt gctattccac accacacttt ggctgctttg 180 gctactaagt acggtccatt ggtttacttg agattgggtt tcgttcacgt tgttgttgcc 240 tcttctccat ccgttgctgc tcaattcttg aaggttcacg acttgaagtt cgcctctaga 300 ccaccaaact ctggtgctaa gcacatcgct tacaactacc aagatatggt tttcgctcca 360 tacggtccac aatggactat gttcagaaag atttgtaagg atcacttgtt ctcttctaag 420 gctttggatg atttcagaca cgttagacaa gaagaagttg ctatcttggc tagaggtttg 480 gctggtgctg gtagatctaa ggttaacttg ggtcaacaat tgaacatgtg taccgctaac 540 actttggcta gaatgatgtt ggacaagaga gttttcggta acgaatctgg tggtgatgat 600 ccaaaggcta acgaattcaa ggaaatggct actgaattga tgttcttggc tggtcaattc 660 aacattggtg actacatccc agttttggac tggttggact tgcaaggtat tgttaagaag 720 atgaagaagt tgcacactag attcgataag ttcttggacg ttatcttgga tgaacacaag 780 gttatcgctt ctggtcacat cgacatgttg tctactttga tttctttgaa ggatgatacc 840 tctgttgacg gtagaaagcc atccgacatc gaaatcaagg ctttgttgtt ggaattgttc 900 gttgctggta ctgacacttc ttctaacacc gttgaatggg ctatcgctga attgattaga 960 caaccacact tgttgaagag agcccaagaa gaaatggact ctgttgttgg tcaaaacaga 1020 ttggttaccg aaatggactt gtctcaattg actttcttgc aagccattgt taaggaagcc 1080 ttcagattgc acccatctac tccattgtcc ttgccaagaa ttgcttccga atcttgtgaa 1140 gttgatggtt actacatccc aaagggttcc actttgttgg ttaacatctg ggccattggt 1200 agacacccag aagtttggac cgacccattg gaattcagac caactagatt cttgccaggt 1260 ggtgaaaagc caggtattgt cgtcaaggtt aacgatttcg aagtcttgcc attcggtgcc 1320 ggtagaagaa tctgtgctgg tatgtctttg gccttgagaa ctgtccaatt gttgatgggt 1380 actttggtcc aagccttcga ttgggaattg gctaacggta tcaagccaga aaagttgaac 1440 atggacgaag ccttcggttt gtctgttcaa agagctgaac cattggttgt tcacccaaga 1500 ccaagattgc caccacacgt ttacaagtct ggttaa 1536 <210> 11 <211> 513 <212> PRT <213> Gerbera hybrida <400> 11 Met Ser Thr Pro Leu Thr Leu Leu Ile Gly Thr Cys Val Thr Gly Leu 1 5 10 15 Phe Leu Tyr Val Leu Leu Asn Arg Cys Thr Arg Asn Pro Asn Arg Leu 20 25 30 Pro Pro Gly Pro Thr Pro Trp Pro Val Val Gly Asn Leu Pro His Leu 35 40 45 Gly Thr Ile Pro His His Ser Leu Ala Ala Met Ala Lys Lys Tyr Gly 50 55 60 Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala 65 70 75 80 Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe 85 90 95 Ala Asp Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr 100 105 110 Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg 115 120 125 Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp Phe 130 135 140 Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Ala Arg Ala Leu Val 145 150 155 160 Gly Ala Gly Lys Ser Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys 165 170 175 Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Asp 180 185 190 Ser Gly Asp Ala Gln Ala Asp Glu Phe Lys Asp Met Val Val Glu Leu 195 200 205 Met Val Leu Ala Gly Glu Phe Asn Ile Gly Asp Phe Ile Pro Val Leu 210 215 220 Asp Trp Leu Asp Leu Gln Gly Val Thr Lys Lys Met Lys Lys Leu His 225 230 235 240 Ala Lys Phe Asp Ser Phe Leu Asn Thr Ile Leu Glu Glu His Lys Thr 245 250 255 Gly Ala Gly Asp Gly Val Ala Ser Gly Lys Val Asp Leu Leu Ser Thr 260 265 270 Leu Ile Ser Leu Lys Asp Asp Ala Asp Gly Glu Gly Gly Lys Leu Ser 275 280 285 Asp Ile Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr 290 295 300 Asp Thr Ser Ser Ser Thr Ile Glu Trp Ala Ile Ala Glu Leu Ile Arg 305 310 315 320 Asn Pro Gln Leu Leu Asn Gln Ala Arg Lys Glu Met Asp Thr Ile Val 325 330 335 Gly Gln Asp Arg Leu Val Thr Glu Ser Asp Leu Gly Gln Leu Thr Phe 340 345 350 Leu Gln Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro 355 360 365 Leu Ser Leu Pro Arg Met Ala Leu Glu Ser Cys Glu Val Gly Gly Tyr 370 375 380 Tyr Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ser 385 390 395 400 Arg Asp Pro Lys Ile Trp Ala Asp Pro Leu Glu Phe Gln Pro Thr Arg 405 410 415 Phe Leu Pro Gly Gly Glu Lys Pro Asn Thr Asp Ile Lys Gly Asn Asp 420 425 430 Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Val Gly Met 435 440 445 Ser Leu Gly Leu Arg Met Val Gln Leu Leu Thr Ala Thr Leu Ile His 450 455 460 Ala Phe Asp Trp Glu Leu Ala Asp Gly Leu Asn Pro Lys Lys Leu Asn 465 470 475 480 Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Val 485 490 495 Val His Pro Arg Pro Arg Leu Ala Pro His Val Tyr Glu Thr Thr Lys 500 505 510 Val <210> 12 <211> 1542 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO:11 <400> 12 atgtccactc cattgacttt gttgatcggt acctgtgtca ctggtttgtt cttgtacgtt 60 ttgttgaaca gatgtaccag aaacccaaac agattgccac caggtccaac tccatggcca 120 gtcgtcggta acttgccaca cttgggtact atcccacacc actctttggc tgctatggct 180 aagaagtacg gtccattgat gcacttgaga ttgggtttcg tcgacgtcgt tgttgccgcc 240 tccgcctccg tcgccgctca attcttaaag actcacgacg ctaacttcgc cgatagacca 300 ccaaactccg gtgccaagca catcgcttac aactaccaag atttggtttt cgctccatac 360 ggtccaagat ggagaatgtt gagaaagatt tgttctgttc acttgttctc caccaaggct 420 ttggatgatt tcagacacgt cagacaagaa gaagttgcta tcttggctag agctttggtc 480 ggtgccggta agtctccagt taagttgggt caattgttga acgtttgtac cactaacgct 540 ttggctagag ttatgttggg tagaagagtt ttcgactccg gtgatgctca agctgatgaa 600 ttcaaggaca tggttgttga attgatggtt ttggccggtg aattcaacat cggtgacttc 660 atcccagttt tggactggtt ggacttgcaa ggtgttacta agaagatgaa gaagttgcac 720 gctaagttcg actctttctt gaacactatc ttggaagaac acaagaccgg tgccggtgac 780 ggtgtcgctt ctggtaaggt tgacttgttg tctactttga tttctttgaa ggatgacgct 840 gatggtgaag gtggtaagtt gtctgacatt gaaatcaagg ctttgttgtt gaacttgttc 900 actgctggta ctgacacttc ttcttctact attgaatggg ctatcgctga attgattaga 960 aacccacaat tgttgaacca agccagaaag gaaatggaca ccatcgttgg tcaagacaga 1020 ttggttaccg aatctgactt gggtcaattg actttcttgc aagccattat caaggaaact 1080 ttcagattgc acccatctac cccattgtct ttgccaagaa tggctttgga atcttgtgaa 1140 gttggtggtt actacatccc aaagggttcc actttgttgg ttaacgtttg ggccatttct 1200 agagatccaa agatttgggc cgatccattg gaattccaac caactagatt cttgccaggt 1260 ggtgaaaagc caaacactga tatcaagggt aacgatttcg aagtcatccc attcggtgcc 1320 ggtagaagaa tttgtgtcgg tatgtctttg ggtttgagaa tggtccaatt gttgactgct 1380 accttgatcc acgccttcga ttgggaattg gctgatggtt tgaacccaaa gaagttgaac 1440 atggaagaag cttacggttt gaccttgcaa agagccgctc cattggttgt tcacccaaga 1500 ccaagattgg ccccacacgt ttacgaaact actaaggtct aa 1542 <210> 13 <211> 515 <212> PRT <213> Osteospermum hybrid cultivar <400> 13 Met Ser Thr Ile Leu Pro Leu Val Leu Tyr Ser Cys Ile Thr Gly Leu 1 5 10 15 Val Ile Tyr Val Leu Leu Asn Leu Arg Thr Arg His Ser Asn Arg Leu 20 25 30 Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu 35 40 45 Gly Val Val Pro His His Ser Leu Ala Ala Met Ala Glu Lys Tyr Gly 50 55 60 Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala 65 70 75 80 Ser Ala Ala Val Ala Ala Gln Phe Leu Lys Val His Asp Ala Asn Phe 85 90 95 Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr 100 105 110 Gln Asp Leu Val Phe Ala Pro Tyr Tyr Gly Pro Arg Trp Arg Met Leu 115 120 125 Arg Lys Ile Cys Ser Val His Leu Phe Ser Ser Lys Ala Leu Asp Asp 130 135 140 Phe Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Thr Arg Ala Leu 145 150 155 160 Ile Gly Ala Gly Asp Ser Pro Val Lys Leu Gly Gln Leu Leu Asn Val 165 170 175 Cys Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val Phe 180 185 190 Gly Asp Arg Ser Gly Gly Gly Asp Pro Lys Ala Asp Glu Phe Lys Asp 195 200 205 Met Val Val Glu Val Met Glu Leu Ala Gly Glu Phe Asn Ile Gly Asp 210 215 220 Phe Ile Pro Val Leu Asp Ser Leu Asp Leu Gln Gly Ile Ala Lys Lys 225 230 235 240 Met Lys Glu Leu His Val Arg Phe Asp Ser Phe Leu Gly Lys Ile Leu 245 250 255 Glu Glu His Lys Thr Gly Asn Gly Gly Ala Ser Ser Gln His Thr Asp 260 265 270 Leu Leu Thr Thr Leu Ile Ser Leu Lys Asp Asp Thr Asp Glu Glu Gly 275 280 285 Gly Lys Leu Ser Asp Ile Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe 290 295 300 Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala 305 310 315 320 Glu Leu Ile Arg His Pro Gln Leu Leu Lys Gln Ala Gln Glu Glu Ile 325 330 335 Asp Asn Val Val Gly Arg Asp His Leu Val Thr Glu Leu Asp Leu Thr 340 345 350 Gln Leu Pro Phe Leu Gln Ala Ile Val Lys Glu Thr Phe Arg Leu His 355 360 365 Pro Ser Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu 370 375 380 Val Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val 385 390 395 400 Trp Ala Ile Ala Arg Asp Pro Lys Met Trp Ser Glu Pro Leu Glu Phe 405 410 415 Arg Pro Ala Arg Phe Leu Pro Gly Gly Glu Lys Pro Asp Ala Asp Val 420 425 430 Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ser 435 440 445 Cys Ala Gly Met Ser Leu Gly Leu Arg Met Val Gln Leu Leu Val Ala 450 455 460 Thr Leu Val Gln Thr Phe Asp Trp Glu Leu Ala Asn Gly Leu Lys Pro 465 470 475 480 Glu Lys Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala 485 490 495 Ala Pro Leu Leu Val His Pro Lys Pro Arg Leu Ala Pro His Val Tyr 500 505 510 Gly Ser Asn 515 <210> 14 <211> 1548 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 13 <400> 14 atgtccacca ttttgccatt ggttttgtac tcttgtatca ctggtttggt tatctacgtt 60 ttgttgaact tgagaaccag acactctaac agattgccac caggtccaac tccatggcca 120 atcgtcggta acttgccaca cttgggtgtt gttccacacc actctttggc tgctatggct 180 gaaaagtacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt tgttgctgct 240 tctgctgccg ttgctgctca attcttgaag gttcacgatg ctaacttcgc ttctagacca 300 ccaaactccg gtgctaagca catcgcttac aactaccaag acttggtttt cgctccatac 360 tacggtccaa gatggagaat gttgagaaag atttgttccg ttcacttgtt ctcttctaag 420 gctttggatg atttcagaca cgtcagacaa gaagaagttg ctatcttgac tagagctttg 480 atcggtgccg gtgactctcc agttaagttg ggtcaattgt tgaacgtttg tactactaac 540 gctttggcta gagttatgtt gggtaagaga gttttcggtg acagatctgg tggtggtgat 600 ccaaaggctg atgaattcaa ggatatggtt gttgaagtta tggaattggc cggtgaattc 660 aacatcggtg atttcatccc agttttggat tctttggatt tgcaaggtat cgctaagaag 720 atgaaggaat tgcacgttag attcgattct ttcttgggta agatcttgga agaacacaag 780 accggtaacg gtggtgcttc ttctcaacac actgacttgt tgactacctt gatttctttg 840 aaggatgata ctgatgaaga aggtggtaag ttgtctgaca ttgaaatcaa ggctttgttg 900 ttgaacttgt tcactgctgg tactgacact tcttcttcta ccgttgaatg ggctatcgcc 960 gaattgatta gacacccaca attgttgaag caagcccaag aagaaatcga caacgttgtt 1020 ggtagagatc acttggttac cgaattggac ttgacccaat tgccattctt gcaagccatt 1080 gttaaggaaa ccttcagatt gcacccatct actccattgt ctttgccaag aattgcttcc 1140 gaatcttgtg aagtcaacgg ttaccacatc ccaaagggtt ccactttgtt ggttaacgtt 1200 tgggccatcg ccagagatcc aaagatgtgg tccgaaccat tggaattcag accagccaga 1260 ttcttgccag gtggtgaaaa gccagatgct gatgttaagg gtaacgattt cgaagtcatc 1320 ccattcggtg ccggtagaag atcttgtgct ggtatgtctt tgggtttgag aatggttcaa 1380 ttgttggttg ctactttggt tcaaaccttc gactgggaat tggctaacgg tttgaagcca 1440 gaaaagttga acatggaaga agcttacggt ttgactttgc aaagagctgc tccattgttg 1500 gttcacccaa agccaagatt ggctccacac gtttacggtt ctaactaa 1548 <210> 15 <211> 539 <212> PRT <213> Citrus clementina <400> 15 Met Ser Gln Pro Leu Val Arg Leu Leu Val Pro Phe Leu Arg Phe Leu 1 5 10 15 Trp Glu Thr Lys Gln Arg Ala Met Ser Thr Leu Pro Leu Leu Ile Leu 20 25 30 Tyr Thr Ser Leu Leu Ala Ile Val Ile Ser Phe Leu Phe Ser Leu Leu 35 40 45 Arg Asn Arg Arg Arg His Ser Ser His Arg Leu Pro Pro Gly Pro Lys 50 55 60 Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu Gly Pro Met Pro His 65 70 75 80 Gln Ser Ile Ala Gly Leu Ala Arg Thr His Gly Pro Leu Met Tyr Leu 85 90 95 Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser Ala Ser Val Ala 100 105 110 Ala Gln Phe Leu Lys Ile His Asp Ser Asn Phe Ser Asn Arg Pro Pro 115 120 125 Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr Gln Asp Ile Val Phe 130 135 140 Arg Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys Ile Ser Ser Val 145 150 155 160 His Leu Phe Ser Gly Lys Ala Leu Asp Asp Tyr Arg His Val Arg Gln 165 170 175 Glu Glu Met Ala Val Leu Thr Arg Ala Leu Ala Ser Ala Gly Thr Glu 180 185 190 Pro Val Asn Leu Ala Gln Arg Leu Asn Leu Cys Val Val Asn Ala Leu 195 200 205 Gly Arg Val Met Leu Gly Phe Arg Val Phe Gly Asp Gly Thr Gly Gly 210 215 220 Ser Asp Pro Arg Ala Asp Glu Phe Lys Ser Met Val Val Glu Leu Met 225 230 235 240 Val Leu Ala Gly Val Phe Asn Val Gly Asp Phe Val Pro Ala Leu Glu 245 250 255 Arg Leu Asp Leu Gln Gly Val Ala Arg Lys Met Lys Lys Leu His Lys 260 265 270 Arg Phe Asp Val Phe Leu Ser Asp Ile Leu Glu Glu Arg Lys Met Asn 275 280 285 Gly Arg Asp Gly Gly Asn Lys Leu Thr Asp Leu Leu Gly Thr Leu Ile 290 295 300 Ser Leu Met Asp Asp Ala Asn Gly Glu Glu Lys Leu Thr Glu Thr Glu 305 310 315 320 Ile Lys Ala Leu Leu Leu Asn Met Phe Thr Ala Gly Thr Asp Thr Ser 325 330 335 Ser Ser Thr Ile Glu Trp Ala Ile Ala Glu Leu Ile Arg His Pro Lys 340 345 350 Val Trp Ala Gln Val Gln Gln Glu Leu Asp Ser Val Val Gly Arg Asp 355 360 365 Arg Leu Val Thr Glu Leu Asp Leu Pro Gln Leu Thr Tyr Leu Gln Ala 370 375 380 Val Ile Lys Glu Ile Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu 385 390 395 400 Pro Arg Ala Ala Ser Glu Ser Cys Lys Ile Asn Gly Tyr Asp Ile Pro 405 410 415 Lys Gly Ser Thr Leu Leu Val Asn Ile Trp Ala Ile Ala Arg Asp Pro 420 425 430 Asn Glu Trp Ala Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Pro 435 440 445 Gly Gly Glu Lys Tyr Asn Val Asp Val Lys Gly Asn Asp Tyr Glu Leu 450 455 460 Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Leu Ser Trp Gly 465 470 475 480 Leu Arg Met Val Gln Leu Gly Thr Ala Thr Leu Ala His Ala Phe Asn 485 490 495 Trp Glu Leu Pro Gly Gly Leu Lys Pro Glu Lys Leu Asn Met Asp Glu 500 505 510 Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Val Val His Pro 515 520 525 Arg Pro Arg Leu Ser Pro Asn Ala Tyr Gln Ala 530 535 <210> 16 <211> 1620 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 15 <400> 16 atgtcccaac cattggttag attgttggtt ccattcttga gattcttgtg ggaaactaag 60 caaagagcta tgtctacttt gccattgttg atcttgtaca cttctttgtt ggctattgtc 120 atttctttct tgttctcttt gttgagaaac agaaggagac actcctccca cagattgcca 180 ccaggtccaa agccatggcc aatcgtcggt aacttgccac acttgggtcc aatgccacac 240 caatccatcg ctggtttggc cagaacccac ggtccattga tgtacttgag attgggtttc 300 gttgacgtcg tcgttgccgc ttccgcttcc gttgctgccc aattcttgaa gatccacgat 360 tccaacttct ccaacagacc accaaactcc ggtgccaagc acatcgctta caactaccaa 420 gacatcgttt tcagaccata cggtccaaga tggagaatgt tgagaaagat ctcttccgtt 480 cacttgttct ccggtaaggc cttggatgac tacagacacg ttagacaaga agaaatggct 540 gttttgacta gagctttggc ttctgctggt actgaaccag ttaacttggc tcaaagattg 600 aacttgtgtg ttgttaacgc cttgggtaga gttatgttgg gtttcagagt tttcggtgac 660 ggtaccggtg gttctgaccc aagagctgac gaattcaagt ctatggttgt tgaattgatg 720 gttttggctg gtgttttcaa cgtcggtgat ttcgtcccag ccttggaaag attggacttg 780 caaggtgttg ctagaaagat gaagaagttg cacaagagat tcgatgtttt cttgtctgat 840 atcttggaag aaagaaagat gaacggtaga gatggtggta acaagttgac tgacttgttg 900 ggtaccttga tttctttgat ggatgatgct aacggtgaag aaaagttgac tgaaactgaa 960 atcaaggctt tgttgttgaa catgttcact gctggtaccg acacttcttc ttctactatc 1020 gaatgggcca ttgctgaatt gatcagacac ccaaaggtct gggcccaagt ccaacaagaa 1080 ttggattctg ttgttggtag agatagattg gtcaccgaat tggacttgcc acaattgact 1140 tacttgcaag ccgttatcaa ggaaatcttc agattgcacc catctactcc attgtctttg 1200 ccaagagctg cttccgaatc ttgtaagatc aacggttacg atattccaaa gggttccact 1260 ttgttggtca acatctgggc cattgctaga gatccaaacg aatgggccga cccattggaa 1320 ttcagaccag aaagattctt gccaggtggt gaaaagtaca acgttgatgt taagggtaac 1380 gattacgaat tgatcccatt cggtgccggt agaagaattt gtgctggttt gtcttggggt 1440 ttgagaatgg ttcaattggg tactgctact ttggcccacg ctttcaactg ggaattgcca 1500 ggtggtttga agccagaaaa gttgaacatg gacgaagctt acggtttgac cttgcaaaga 1560 gctgctccat tggttgttca cccaagacca agattgtctc caaacgctta ccaagcttaa 1620 <210> 17 <211> 517 <212> PRT <213> Citrus sinensis <400> 17 Met Ser Ser Thr Leu Pro Leu Leu Ile Leu Tyr Thr Ser Leu Leu Ala 1 5 10 15 Ile Val Ile Ser Phe Leu Phe Ser Leu Leu Arg Asn Arg Arg Arg His 20 25 30 Ser Ser His Arg Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Val Gly 35 40 45 Asn Leu Pro His Leu Gly Pro Met Pro His Gln Ser Ile Ala Gly Leu 50 55 60 Ala Arg Thr His Gly Pro Leu Met Tyr Leu Arg Leu Gly Phe Val Asp 65 70 75 80 Val Val Val Ala Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Ile 85 90 95 His Asp Ser Asn Phe Ser Asn Arg Pro Pro Asn Ser Gly Ala Lys His 100 105 110 Ile Ala Tyr Asn Tyr Gln Asp Ile Val Phe Arg Pro Tyr Gly Pro Arg 115 120 125 Trp Arg Met Leu Arg Lys Ile Ser Ser Val His Leu Phe Ser Gly Lys 130 135 140 Ala Leu Asp Asp Tyr Arg His Val Arg Gln Glu Glu Met Ala Val Leu 145 150 155 160 Ala Arg Ala Leu Ala Ser Ala Gly Thr Glu Pro Val Asn Leu Ala Gln 165 170 175 Arg Leu Asn Leu Cys Val Val Asn Ala Leu Gly Arg Val Met Leu Gly 180 185 190 Phe Arg Val Phe Gly Asp Gly Thr Gly Gly Ser Asp Pro Arg Ala Asp 195 200 205 Glu Phe Lys Ser Met Val Val Glu Leu Met Val Leu Ala Gly Val Phe 210 215 220 Asn Val Gly Asp Phe Val Pro Ala Leu Glu Arg Leu Asp Leu Gln Gly 225 230 235 240 Val Ala Arg Lys Met Lys Lys Leu His Lys Arg Phe Asp Val Phe Leu 245 250 255 Ser Asp Ile Leu Glu Glu Arg Lys Met Asn Gly Arg Asp Gly Gly Asn 260 265 270 Lys His Thr Asp Leu Leu Gly Thr Leu Ile Ser Leu Met Asp Asp Ala 275 280 285 Asn Gly Glu Glu Lys Leu Thr Glu Thr Glu Ile Lys Ala Leu Leu Leu 290 295 300 Asn Met Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Ile Glu Trp 305 310 315 320 Ala Ile Ala Glu Leu Ile Arg His Pro Lys Val Arg Ala Gln Val Gln 325 330 335 Gln Glu Leu Asp Ser Val Val Gly Arg Asp Arg Leu Val Thr Glu Leu 340 345 350 Asp Leu Pro Gln Leu Thr Tyr Leu Gln Ala Val Ile Lys Glu Ile Phe 355 360 365 Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Ala Ala Ser Glu 370 375 380 Ser Cys Lys Ile Asn Gly Tyr Asp Ile Pro Lys Gly Ser Thr Leu Leu 385 390 395 400 Val Asn Ile Trp Ala Ile Ala Arg Asp Pro Asn Glu Trp Ala Asp Pro 405 410 415 Leu Glu Phe Arg Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Tyr Asn 420 425 430 Val Asp Val Lys Gly Asn Asp Tyr Glu Leu Ile Pro Phe Gly Ala Gly 435 440 445 Arg Arg Ile Cys Ala Gly Leu Ser Trp Gly Leu Arg Met Val Gln Leu 450 455 460 Gly Thr Ala Thr Leu Ala His Ala Phe Asn Trp Glu Leu Pro Gly Gly 465 470 475 480 Leu Lys Pro Glu Lys Leu Ser Met Asp Glu Ala Tyr Gly Leu Thr Leu 485 490 495 Gln Arg Ala Ala Pro Leu Val Val His Pro Arg Pro Arg Leu Ser Pro 500 505 510 Asn Ala Tyr Gln Ala 515 <210> 18 <211> 1554 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 17 <400> 18 atgtcctcta ctttgccatt gttgatcttg tacacttctt tgttggctat tgtcatttct 60 ttcttgttct ctttgttgag aaacagaagg agacactcct cccacagatt gccaccaggt 120 ccaaagccat ggccaatcgt cggtaacttg ccacacttgg gtccaatgcc acaccaatcc 180 atcgctggtt tggccagaac ccacggtcca ttgatgtact tgagattggg tttcgttgac 240 gtcgtcgttg ccgcttctgc ttccgttgct gcccaattct tgaagatcca cgattccaac 300 ttctccaaca gaccaccaaa ctccggtgcc aagcacatcg cttacaacta ccaagacatc 360 gttttcagac catacggtcc aagatggaga atgttgagaa agatctcttc cgttcacttg 420 ttctccggta aggccttgga tgactacaga cacgttagac aagaagaaat ggctgttttg 480 gctagagctt tggcttctgc tggtactgaa ccagttaact tggctcaaag attgaacttg 540 tgtgttgtta acgccttggg tagagttatg ttgggtttca gagttttcgg tgacggtacc 600 ggtggttctg acccaagagc tgacgaattc aagtctatgg ttgttgaatt gatggttttg 660 gctggtgttt tcaacgtcgg tgacttcgtc ccagccttgg aaagattgga cttgcaaggt 720 gttgctagaa agatgaagaa gttgcacaag agattcgatg ttttcttgtc tgatatcttg 780 gaagaaagaa agatgaacgg tagagatggt ggtaacaagc acactgactt gttgggtacc 840 ttgatttctt tgatggatga tgctaacggt gaagaaaagt tgactgaaac tgaaatcaag 900 gctttgttgt tgaacatgtt cactgctggt accgacactt cttcttctac tatcgaatgg 960 gccattgctg aattgatcag acacccaaag gtcagagccc aagtccaaca agaattggat 1020 tctgttgttg gtagagatag attggtcacc gaattggact tgccacaatt gacttacttg 1080 caagccgtta tcaaggaaat cttcagattg cacccatcta ctccattgtc tttgccaaga 1140 gctgcttccg aatcttgtaa gatcaacggt tacgatattc caaagggttc cactttgttg 1200 gtcaacatct gggccattgc tagagatcca aacgaatggg ccgacccatt ggaattcaga 1260 ccagaaagat tcttgccagg tggtgaaaag tacaacgttg atgttaaggg taacgattac 1320 gaattgatcc cattcggtgc cggtagaaga atttgtgctg gtttgtcttg gggtttgaga 1380 atggttcaat tgggtactgc tactttggcc cacgctttca actgggaatt gccaggtggt 1440 ttgaagccag aaaagttgtc tatggacgaa gcttacggtt tgaccttgca aagagctgct 1500 ccattggttg ttcacccaag accaagattg tctccaaacg cttaccaagc ttaa 1554 <210> 19 <211> 513 <212> PRT <213> Pilosella officinarum <400> 19 Met Ser Thr Leu Leu Ser Leu Ile Ile Tyr Leu Cys Ile Thr Gly Val 1 5 10 15 Thr Ala Tyr Val Leu Val Asn Leu Arg Thr Arg Arg Ala Asn Arg Leu 20 25 30 Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu 35 40 45 Gly Thr Ile Pro His His Ser Leu Ala Asp Leu Ala Thr Arg Tyr Gly 50 55 60 Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala 65 70 75 80 Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe 85 90 95 Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Met Ala Tyr Asn Tyr 100 105 110 Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg 115 120 125 Lys Ile Cys Ser Val His Leu Phe Ser Ala Lys Ser Leu Asp Asp Phe 130 135 140 Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Thr Arg Ala Leu Val 145 150 155 160 Gly Ala Gly Lys Ser Thr Val Lys Leu Gly Gln Leu Leu His Val Cys 165 170 175 Thr Thr Asn Ala Leu Val Arg Val Met Leu Gly Arg Arg Val Phe Gly 180 185 190 Asp Gly Ser Gly Gly Gly Asp Pro Lys Ala Asp Glu Phe Lys Asn Met 195 200 205 Val Ile Glu Met Met Val Leu Ala Gly Glu Phe Asn Leu Gly Asp Phe 210 215 220 Ile Pro Val Leu Asp Leu Leu Asp Leu Gln Gly Val Thr Lys Lys Met 225 230 235 240 Lys Lys Leu His Thr Arg Phe Asp Ser Phe Leu Asn Ser Ile Leu Glu 245 250 255 Glu His Arg Thr Ser Ser Gly Gly Ala Ser Gly His Val Asp Leu Leu 260 265 270 Ser Thr Leu Ile Ser Leu Lys Asp Glu Ala Asp Gly Glu Gly Gly Lys 275 280 285 Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val Ala 290 295 300 Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu 305 310 315 320 Ile Arg Asn Pro Gln Leu Leu Lys Gln Ala Gln Gln Glu Leu Asp Thr 325 330 335 Val Val Gly Gln Gly Arg Leu Val Asn Glu Ser Asp Leu Ser Gln Leu 340 345 350 Thr Phe Leu Gln Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro Ser 355 360 365 Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile Asn 370 375 380 Gly Tyr Asn Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala 385 390 395 400 Ile Ala Arg Asp Pro Lys Met Trp Thr Glu Pro Leu Glu Phe Arg Pro 405 410 415 Ser Arg Phe Leu Pro Asp Gly Glu Lys Pro Asn Ala Asp Val Lys Gly 420 425 430 Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala 435 440 445 Gly Met Ser Leu Gly Leu Arg Met Val Gln Leu Leu Thr Ala Thr Leu 450 455 460 Ile Gln Ala Phe Asp Trp Glu Leu Ala Asn Gly Leu Glu Pro Arg Asn 465 470 475 480 Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Gln Pro 485 490 495 Leu Met Val His Pro Arg Pro Arg Leu Ala Pro His Val Tyr Gly Thr 500 505 510 Gly <210> 20 <211> 1542 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 19 <400> 20 atgtccacct tgttgtcctt gatcatctac ttgtgtatca ctggtgttac tgcctacgtt 60 ttggttaact tgagaactag aagagctaac agattgccac caggtccaac cccatggcca 120 atcgtcggta acttgccaca cttgggtact attccacacc actctttggc tgatttggct 180 actagatacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt tgttgccgcc 240 tctgcttccg tcgctgctca attcttaaag actcacgacg ctaacttcgc ttctagacca 300 ccaaactctg gtgctaagca catggcttac aactaccaag atttggtttt cgctccatac 360 ggtccaagat ggagaatgtt gagaaagatt tgttccgttc acttgttctc tgccaagtct 420 ttggatgatt tcagacacgt tagacaagaa gaagttgcta tcttgactag agctttggtc 480 ggtgccggta agtctactgt taagttgggt caattgttgc acgtttgtac cactaacgct 540 ttggttagag ttatgttggg tagaagagtt ttcggtgatg gttctggtgg tggtgatcca 600 aaggctgatg aattcaagaa catggttatt gaaatgatgg ttttggccgg tgaattcaac 660 ttgggtgatt tcatcccagt tttggatttg ttggacttgc aaggtgttac taagaagatg 720 aagaagttgc acactagatt cgattctttc ttgaactcta tcttggaaga acacagaact 780 tcttctggtg gtgcttctgg tcacgtcgat ttgttgtcta ctttgatttc tttgaaggat 840 gaagccgatg gtgaaggtgg taagttgact gacactgaaa ttaaggcttt gttgttgaac 900 ttgttcgttg ctggtactga cacttcttct tctaccgttg aatgggctat cgctgaattg 960 attagaaacc cacaattgtt gaagcaagcc caacaagaat tggacactgt tgttggtcaa 1020 ggtagattgg ttaacgaatc tgacttgtct caattgacct tcttgcaagc cattgttaag 1080 gaaactttca gattgcaccc atctactcca ttgtccttgc caagaatcgc ttccgaatct 1140 tgtgaaatca acggttacaa cattccaaag ggttccactt tgttggttaa cgtttgggcc 1200 atcgctagag atccaaagat gtggaccgaa ccattggaat tcagaccatc cagattcttg 1260 ccagacggtg aaaagccaaa cgctgatgtt aagggtaacg atttcgaagt catcccattc 1320 ggtgctggta gaagaatttg tgctggtatg tctttgggtt tgagaatggt ccaattgttg 1380 accgctactt tgattcaagc cttcgattgg gaattggcta acggtttgga accaagaaac 1440 ttgaacatgg aagaagccta cggtttgacc ttgcaaagag ctcaaccatt gatggttcac 1500 ccaagaccaa gattggcccc acacgtttac ggtactggtt aa 1542 <210> 21 <211> 406 <212> PRT <213> Streptomyces avermitilis <400> 21 Met Ser Ala Ala Ala Phe Asp Leu Ala Phe Asp Pro Trp Asp Pro Ala 1 5 10 15 Phe Leu Ala Asp Pro Tyr Pro Ala Tyr Ala Asp Leu Arg Ala Lys Gly 20 25 30 Arg Val His Tyr Tyr Glu Pro Thr Asn Gln Trp Leu Val Pro His His 35 40 45 Ala Asp Val Ser Ala Leu Leu Arg Asp Arg Arg Leu Gly Arg Ala Tyr 50 55 60 Gln His Arg Tyr Thr His Glu Asp Phe Gly Arg Thr Ala Pro Pro Ala 65 70 75 80 Glu His Glu Pro Phe His Thr Leu Asn Asp His Gly Met Leu Asp Leu 85 90 95 Glu Pro Pro Asp His Thr Arg Ile Arg Arg Leu Val Ser Lys Ala Phe 100 105 110 Thr Pro Arg Thr Val Glu Gln Leu Lys Pro Tyr Val Ala Lys Leu Ala 115 120 125 Gly Glu Leu Val Asp Arg Leu Val Ala Ala Gly Gly Gly Asp Leu Leu 130 135 140 Ala Asp Val Ala Glu Pro Leu Pro Val Ala Val Ile Ala Glu Met Leu 145 150 155 160 Gly Ile Pro Glu Ser Asp Arg Ala Pro Leu Arg Pro Trp Ser Ala Asp 165 170 175 Ile Cys Gly Met Tyr Glu Leu Asn Pro Pro Lys Asp Val Ala Ala Lys 180 185 190 Ala Val Arg Ala Ser Val Glu Phe Ser Asp Tyr Leu Arg Glu Leu Ile 195 200 205 Ala Glu Arg Arg Lys Glu Pro Gly Asp Asp Leu Ile Ser Gly Leu Ile 210 215 220 Ala Ala His Asp Glu Gly Asp Arg Leu Thr Glu Gln Glu Met Ile Ser 225 230 235 240 Thr Cys Val Leu Leu Leu Asn Ala Gly His Glu Ala Thr Val Asn Ala 245 250 255 Thr Val Asn Gly Trp Tyr Ala Leu Phe Arg Asn Pro Asp Gln Leu Ala 260 265 270 Ala Leu Arg Ala Asp His Ser Leu Val Pro Ala Ala Val Glu Glu Leu 275 280 285 Met Arg Tyr Asp Thr Pro Leu Gln Leu Phe Glu Arg Trp Val Leu Asp 290 295 300 Glu Ile Glu Ile Asp Gly Thr Thr Val Pro Arg Gly Ala Glu Ile Ala 305 310 315 320 Met Leu Phe Gly Ser Ala Asn His Asp Pro Glu Val Phe Arg Asn Pro 325 330 335 Glu Lys Leu Asp Leu Thr Arg Glu Asp Asn Pro His Ile Ser Phe Ser 340 345 350 Ala Gly Ile His Tyr Cys Ile Gly Ala Pro Leu Ala Arg Ile Glu Leu 355 360 365 Ala Ala Ser Met Thr Ala Leu Leu Glu Lys Ala Pro Thr Leu Gly Leu 370 375 380 Val Ala Glu Pro Lys Arg Lys Pro Asn Phe Val Ile Arg Gly Leu Glu 385 390 395 400 Gly Leu Ser Val Ala Val 405 <210> 22 <211> 1221 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 21 <400> 22 atgtccgctg ctgctttcga cttggccttc gacccatggg acccagcttt cttggccgac 60 ccatacccag cctacgccga tttgagagcc aagggtagag ttcactacta cgaaccaact 120 aaccaatggt tggttccaca ccacgctgac gtttctgctt tgttgagaga cagaagattg 180 ggtagagctt accaacacag atacactcac gaagatttcg gtagaaccgc tccaccagct 240 gaacacgaac cattccacac cttgaacgac cacggtatgt tggacttgga accaccagac 300 cacaccagaa tcagaagatt ggtttctaag gctttcactc caagaaccgt tgaacaattg 360 aagccatacg ttgccaagtt ggccggtgaa ttggttgaca gattggtcgc tgctggtggt 420 ggtgatttgt tggctgatgt cgccgaacca ttgccagttg ccgtcatcgc cgaaatgttg 480 ggtatcccag aatccgacag agccccatta agaccatggt ctgctgacat ctgtggtatg 540 tacgaattga acccaccaaa ggacgttgct gctaaggctg ttagagcttc tgttgaattc 600 tccgactact tgagagaatt gatcgccgaa agaagaaagg aaccaggtga cgatttgatc 660 tctggtttga tcgccgccca cgacgaaggt gacagattga ccgaacaaga aatgatctcc 720 acctgtgtct tgttgttgaa cgctggtcac gaagccaccg tcaacgccac tgtcaacggt 780 tggtacgcct tgttcagaaa cccagaccaa ttggccgcct tgagagccga ccactctttg 840 gttccagccg ccgttgaaga attgatgaga tacgacactc cattgcaatt gttcgaaaga 900 tgggtcttgg acgaaatcga aatcgacggt actactgtcc caagaggtgc tgaaatcgcc 960 atgttgttcg gttccgccaa ccacgaccca gaagttttca gaaacccaga aaagttggac 1020 ttgaccagag aagataaccc acacatttcc ttctctgctg gtatccacta ctgtatcggt 1080 gctccattgg ctagaatcga attggctgct tctatgactg ccttgttgga aaaggcccca 1140 actttgggtt tggttgctga accaaagaga aagccaaact tcgttatcag aggtttggaa 1200 ggtttgtctg tcgctgtcta a 1221 <210> 23 <211> 715 <212> PRT <213> Catharanthus roseus <400> 23 Met Ser Asp Ser Ser Ser Glu Lys Leu Ser Pro Phe Glu Leu Met Ser 1 5 10 15 Ala Ile Leu Lys Gly Ala Lys Leu Asp Gly Ser Asn Ser Ser Asp Ser 20 25 30 Gly Val Ala Val Ser Pro Ala Val Met Ala Met Leu Leu Glu Asn Lys 35 40 45 Glu Leu Val Met Ile Leu Thr Thr Ser Val Ala Val Leu Ile Gly Cys 50 55 60 Val Val Val Leu Ile Trp Arg Arg Ser Ser Gly Ser Gly Lys Lys Val 65 70 75 80 Val Glu Pro Pro Lys Leu Ile Val Pro Lys Ser Val Val Glu Pro Glu 85 90 95 Glu Ile Asp Glu Gly Lys Lys Lys Phe Thr Ile Phe Phe Gly Thr Gln 100 105 110 Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Ala Glu Glu Ala Lys 115 120 125 Ala Arg Tyr Glu Lys Ala Val Ile Lys Val Ile Asp Ile Asp Asp Tyr 130 135 140 Ala Ala Asp Asp Glu Glu Tyr Glu Glu Lys Phe Arg Lys Glu Thr Leu 145 150 155 160 Ala Phe Phe Ile Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn 165 170 175 Ala Ala Arg Phe Tyr Lys Trp Phe Val Glu Gly Asn Asp Arg Gly Asp 180 185 190 Trp Leu Lys Asn Leu Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln 195 200 205 Tyr Glu His Phe Asn Lys Ile Ala Lys Val Val Asp Glu Lys Val Ala 210 215 220 Glu Gln Gly Gly Lys Arg Ile Val Pro Leu Val Leu Gly Asp Asp Asp 225 230 235 240 Gln Cys Ile Glu Asp Asp Phe Ala Ala Trp Arg Glu Asn Val Trp Pro 245 250 255 Glu Leu Asp Asn Leu Leu Arg Asp Glu Asp Asp Thr Thr Val Ser Thr 260 265 270 Thr Tyr Thr Ala Ala Ile Pro Glu Tyr Arg Val Val Phe Pro Asp Lys 275 280 285 Ser Asp Ser Leu Ile Ser Glu Ala Asn Gly His Ala Asn Gly Tyr Ala 290 295 300 Asn Gly Asn Thr Val Tyr Asp Ala Gln His Pro Cys Arg Ser Asn Val 305 310 315 320 Ala Val Arg Lys Glu Leu His Thr Pro Ala Ser Asp Arg Ser Cys Thr 325 330 335 His Leu Asp Phe Asp Ile Ala Gly Thr Gly Leu Ser Tyr Gly Thr Gly 340 345 350 Asp His Val Gly Val Tyr Cys Asp Asn Leu Ser Glu Thr Val Glu Glu 355 360 365 Ala Glu Arg Leu Leu Asn Leu Pro Pro Glu Thr Tyr Phe Ser Leu His 370 375 380 Ala Asp Lys Glu Asp Gly Thr Pro Leu Ala Gly Ser Ser Leu Pro Pro 385 390 395 400 Pro Phe Pro Pro Cys Thr Leu Arg Thr Ala Leu Thr Arg Tyr Ala Asp 405 410 415 Leu Leu Asn Thr Pro Lys Lys Ser Ala Leu Leu Ala Leu Ala Ala Tyr 420 425 430 Ala Ser Asp Pro Asn Glu Ala Asp Arg Leu Lys Tyr Leu Ala Ser Pro 435 440 445 Ala Gly Lys Asp Glu Tyr Ala Gln Ser Leu Val Ala Asn Gln Arg Ser 450 455 460 Leu Leu Glu Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly 465 470 475 480 Val Phe Phe Ala Ala Ile Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser 485 490 495 Ile Ser Ser Ser Pro Arg Met Ala Pro Ser Arg Ile His Val Thr Cys 500 505 510 Ala Leu Val Tyr Glu Lys Thr Pro Gly Gly Arg Ile His Lys Gly Val 515 520 525 Cys Ser Thr Trp Met Lys Asn Ala Ile Pro Leu Glu Glu Ser Arg Asp 530 535 540 Cys Ser Trp Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro 545 550 555 560 Ala Asp Pro Lys Val Pro Val Ile Met Ile Gly Pro Gly Thr Gly Leu 565 570 575 Ala Pro Phe Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Lys Glu Glu 580 585 590 Gly Ala Glu Leu Gly Thr Ala Val Phe Phe Phe Gly Cys Arg Asn Arg 595 600 605 Lys Met Asp Tyr Ile Tyr Glu Asp Glu Leu Asn His Phe Leu Glu Ile 610 615 620 Gly Ala Leu Ser Glu Leu Leu Val Ala Phe Ser Arg Glu Gly Pro Thr 625 630 635 640 Lys Gln Tyr Val Gln His Lys Met Ala Glu Lys Ala Ser Asp Ile Trp 645 650 655 Arg Met Ile Ser Asp Gly Ala Tyr Val Tyr Val Cys Gly Asp Ala Lys 660 665 670 Gly Met Ala Arg Asp Val His Arg Thr Leu His Thr Ile Ala Gln Glu 675 680 685 Gln Gly Ser Met Asp Ser Thr Gln Ala Glu Gly Phe Val Lys Asn Leu 690 695 700 Gln Met Thr Gly Arg Tyr Leu Arg Asp Val Trp 705 710 715 <210> 24 <211> 2148 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 23 <400> 24 atgtccgatt cttcttctga aaagttgtct ccattcgaat tgatgtctgc tatcttgaag 60 ggtgctaagt tggatggttc taactcttct gattctggtg ttgctgtttc tccagctgtt 120 atggctatgt tgttggaaaa caaggaattg gttatgattt tgactacttc tgttgctgtt 180 ttgatcggtt gtgtcgttgt tttgatctgg agaagatctt ccggttctgg taagaaggtc 240 gttgaaccac caaagttgat cgttccaaag tctgttgttg aaccagaaga aattgatgaa 300 ggtaagaaga agttcaccat cttcttcggt actcaaactg gtactgctga aggtttcgct 360 aaggctttgg ctgaagaagc caaggctaga tacgaaaagg ctgttatcaa ggttattgat 420 atcgatgatt acgctgctga tgatgaagaa tacgaagaaa agttcagaaa ggaaaccttg 480 gctttcttca tcttggccac ttacggtgat ggtgaaccaa ccgacaacgc tgctagattc 540 tacaagtggt tcgttgaagg taacgataga ggtgactggt tgaagaactt gcaatacggt 600 gttttcggtt tgggtaacag acaatacgaa cacttcaaca agattgctaa ggttgttgat 660 gaaaaggttg ctgaacaagg tggtaagaga attgttccat tggttttggg tgacgatgac 720 caatgtattg aagatgactt cgctgcttgg agagaaaacg tttggccaga attggataac 780 ttgttgagag atgaagatga tactactgtt tctactacct acactgctgc tattccagaa 840 tacagagttg ttttcccaga caagtctgat tctttgattt ctgaagctaa cggtcacgcc 900 aacggttacg ctaacggtaa caccgtttac gatgcccaac acccatgtag atctaacgtt 960 gctgttagaa aggaattgca cactccagct tctgatagat cttgtaccca cttggatttc 1020 gacattgctg gtactggttt gtcttacggt actggtgatc acgttggtgt ttactgtgat 1080 aacttgtctg aaaccgttga agaagctgaa agattgttga acttgccacc agaaacttac 1140 ttctctttgc acgctgataa ggaagatggt accccattgg ctggttcttc tttgccacca 1200 ccattcccac catgtacttt gagaaccgcc ttgactagat acgctgattt gttgaacact 1260 ccaaagaagt ctgctttgtt ggctttggct gcttacgctt ctgatccaaa cgaagccgat 1320 agattgaagt acttggcttc tccagccggt aaggatgaat acgctcaatc tttggttgct 1380 aaccaaagat ctttgttgga agtcatggct gaattcccat ctgctaagcc accattgggt 1440 gttttcttcg ctgctattgc tccaagattg caaccaagat tctactctat ctcttcttct 1500 ccaagaatgg ctccatctag aattcacgtc acttgtgctt tggtttacga aaagactcca 1560 ggtggtagaa ttcacaaggg tgtttgttct acttggatga agaacgccat tccattggaa 1620 gaatctagag actgttcttg ggctccaatc ttcgtcagac aatctaactt caagttgcca 1680 gccgatccaa aggttccagt tatcatgatc ggtccaggta ctggtttggc tccattcaga 1740 ggtttcttgc aagaaagatt ggctttgaag gaagaaggtg ctgaattggg tactgctgtt 1800 ttcttcttcg gttgtagaaa cagaaagatg gattacatct acgaagatga attgaaccac 1860 ttcttggaaa ttggtgcttt gtccgaattg ttggttgctt tctctagaga aggtccaact 1920 aagcaatacg ttcaacacaa gatggctgaa aaggcttctg atatttggag aatgatttct 1980 gatggtgctt acgtttacgt ctgtggtgat gccaagggta tggccagaga tgtccacaga 2040 actttgcaca ccattgctca agaacaaggt tctatggatt ctactcaagc tgaaggtttc 2100 gttaagaact tgcaaatgac cggtagatac ttgagagatg tctggtaa 2148 <210> 25 <211> 692 <212> PRT <213> Saccharomyces cerevisiae <400> 25 Met Ser Pro Phe Gly Ile Asp Asn Thr Asp Phe Thr Val Leu Ala Gly 1 5 10 15 Leu Val Leu Ala Val Leu Leu Tyr Val Lys Arg Asn Ser Ile Lys Glu 20 25 30 Leu Leu Met Ser Asp Asp Gly Asp Ile Thr Ala Val Ser Ser Gly Asn 35 40 45 Arg Asp Ile Ala Gln Val Val Thr Glu Asn Asn Lys Asn Tyr Leu Val 50 55 60 Leu Tyr Ala Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala Lys Lys Phe 65 70 75 80 Ser Lys Glu Leu Val Ala Lys Phe Asn Leu Asn Val Met Cys Ala Asp 85 90 95 Val Glu Asn Tyr Asp Phe Glu Ser Leu Asn Asp Val Pro Val Ile Val 100 105 110 Ser Ile Phe Ile Ser Thr Tyr Gly Glu Gly Asp Phe Pro Asp Gly Ala 115 120 125 Val Asn Phe Glu Asp Phe Ile Cys Asn Ala Glu Ala Gly Ala Leu Ser 130 135 140 Asn Leu Arg Tyr Asn Met Phe Gly Leu Gly Asn Ser Thr Tyr Glu Phe 145 150 155 160 Phe Asn Gly Ala Ala Lys Lys Ala Glu Lys His Leu Ser Ala Ala Gly 165 170 175 Ala Ile Arg Leu Gly Lys Leu Gly Glu Ala Asp Asp Gly Ala Gly Thr 180 185 190 Thr Asp Glu Asp Tyr Met Ala Trp Lys Asp Ser Ile Leu Glu Val Leu 195 200 205 Lys Asp Glu Leu His Leu Asp Glu Gln Glu Ala Lys Phe Thr Ser Gln 210 215 220 Phe Gln Tyr Thr Val Leu Asn Glu Ile Thr Asp Ser Met Ser Leu Gly 225 230 235 240 Glu Pro Ser Ala His Tyr Leu Pro Ser His Gln Leu Asn Arg Asn Ala 245 250 255 Asp Gly Ile Gln Leu Gly Pro Phe Asp Leu Ser Gln Pro Tyr Ile Ala 260 265 270 Pro Ile Val Lys Ser Arg Glu Leu Phe Ser Ser Asn Asp Arg Asn Cys 275 280 285 Ile His Ser Glu Phe Asp Leu Ser Gly Ser Asn Ile Lys Tyr Ser Thr 290 295 300 Gly Asp His Leu Ala Val Trp Pro Ser Asn Pro Leu Glu Lys Val Glu 305 310 315 320 Gln Phe Leu Ser Ile Phe Asn Leu Asp Pro Glu Thr Ile Phe Asp Leu 325 330 335 Lys Pro Leu Asp Pro Thr Val Lys Val Pro Phe Pro Thr Pro Thr Thr 340 345 350 Ile Gly Ala Ala Ile Lys His Tyr Leu Glu Ile Thr Gly Pro Val Ser 355 360 365 Arg Gln Leu Phe Ser Ser Leu Ile Gln Phe Ala Pro Asn Ala Asp Val 370 375 380 Lys Glu Lys Leu Thr Leu Leu Ser Lys Asp Lys Asp Gln Phe Ala Val 385 390 395 400 Glu Ile Thr Ser Lys Tyr Phe Asn Ile Ala Asp Ala Leu Lys Tyr Leu 405 410 415 Ser Asp Gly Ala Lys Trp Asp Thr Val Pro Met Gln Phe Leu Val Glu 420 425 430 Ser Val Pro Gln Met Thr Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Ser 435 440 445 Leu Ser Glu Lys Gln Thr Val His Val Thr Ser Ile Val Glu Asn Phe 450 455 460 Pro Asn Pro Glu Leu Pro Asp Ala Pro Pro Val Val Gly Val Thr Thr 465 470 475 480 Asn Leu Leu Arg Asn Ile Gln Leu Ala Gln Asn Asn Val Asn Ile Ala 485 490 495 Glu Thr Asn Leu Pro Val His Tyr Asp Leu Asn Gly Pro Arg Lys Leu 500 505 510 Phe Ala Asn Tyr Lys Leu Pro Val His Val Arg Arg Ser Asn Phe Arg 515 520 525 Leu Pro Ser Asn Pro Ser Thr Pro Val Ile Met Ile Gly Pro Gly Thr 530 535 540 Gly Val Ala Pro Phe Arg Gly Phe Ile Arg Glu Arg Val Ala Phe Leu 545 550 555 560 Glu Ser Gln Lys Lys Gly Gly Asn Asn Val Ser Leu Gly Lys His Ile 565 570 575 Leu Phe Tyr Gly Ser Arg Asn Thr Asp Asp Phe Leu Tyr Gln Asp Glu 580 585 590 Trp Pro Glu Tyr Ala Lys Lys Leu Asp Gly Ser Phe Glu Met Val Val 595 600 605 Ala His Ser Arg Leu Pro Asn Thr Lys Lys Val Tyr Val Gln Asp Lys 610 615 620 Leu Lys Asp Tyr Glu Asp Gln Val Phe Glu Met Ile Asn Asn Gly Ala 625 630 635 640 Phe Ile Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Lys Gly Val Ser 645 650 655 Thr Ala Leu Val Gly Ile Leu Ser Arg Gly Lys Ser Ile Thr Thr Asp 660 665 670 Glu Ala Thr Glu Leu Ile Lys Met Leu Lys Thr Ser Gly Arg Tyr Gln 675 680 685 Glu Asp Val Trp 690 <210> 26 <211> 2079 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 25 <400> 26 atgtccccgt ttggaataga caacaccgac ttcactgtcc tggcggggct agtgcttgcc 60 gtgctactgt acgtaaagag aaactccatc aaggaactgc tgatgtccga tgacggagat 120 atcacagctg tcagctcggg caacagagac attgctcagg tggtgaccga aaacaacaag 180 aactacttgg tgttgtatgc gtcgcagact gggactgccg aggattacgc caaaaagttt 240 tccaaggagc tggtggccaa gttcaaccta aacgtgatgt gcgcagatgt tgagaactac 300 gactttgagt cgctaaacga tgtgcccgtc atagtctcga tttttatctc tacatatggt 360 gaaggagact tccccgacgg ggcggtcaac tttgaggact ttatttgtaa tgcggaagcg 420 ggtgcactat cgaacctgag gtataatatg tttggtctgg gaaattctac ttatgaattc 480 tttaatggtg ccgccaagaa ggccgagaag catctctccg ccgcgggcgc tatcagacta 540 ggcaagctcg gtgaagctga tgatggtgca ggaactacag acgaagatta catggcctgg 600 aaggactcca tcctggaggt tttgaaagac gaactgcatt tggacgaaca ggaagccaag 660 ttcacctctc aattccagta cactgtgttg aacgaaatca ctgactccat gtcgcttggt 720 gaaccctctg ctcactattt gccctcgcat cagttgaacc gcaacgcaga cggcatccaa 780 ttgggtccct tcgatttgtc tcaaccgtat attgcaccca tcgtgaaatc tcgcgaactg 840 ttctcttcca atgaccgtaa ttgcatccac tctgaatttg acttgtccgg ctctaacatc 900 aagtactcca ctggtgacca tcttgctgtt tggccttcca acccattgga aaaggtcgaa 960 cagttcttat ccatattcaa cctggaccct gaaaccattt ttgacttgaa gcccctggat 1020 cccaccgtca aagtgccctt cccaacgcca actactattg gcgctgctat taaacactat 1080 ttggaaatta caggacctgt ctccagacaa ttgttttcat ctttgattca gttcgccccc 1140 aacgctgacg tcaaggaaaa attgactctg ctttcgaaag acaaggacca attcgccgtc 1200 gagataacct ccaaatattt caacatcgca gatgctctga aatatttgtc tgatggcgcc 1260 aaatgggaca ccgtacccat gcaattcttg gtcgaatcag ttccccaaat gactcctcgt 1320 tactactcta tctcttcctc ttctctgtct gaaaagcaaa ccgtccatgt cacctccatt 1380 gtggaaaact ttcctaaccc agaattgcct gatgctcctc cagttgttgg tgttacgact 1440 aacttgttaa gaaacattca attggctcaa aacaatgtta acattgccga aactaaccta 1500 cctgttcact acgatttaaa tggcccacgt aaacttttcg ccaattacaa attgcccgtc 1560 cacgttcgtc gttctaactt cagattgcct tccaaccctt ccaccccagt tatcatgatc 1620 ggtccaggta ccggtgttgc cccattccgt gggtttatca gagagcgtgt cgcgttcctc 1680 gaatcacaaa agaagggcgg taacaacgtt tcgctaggta agcatatact gttttatgga 1740 tcccgtaaca ctgatgattt cttgtaccag gacgaatggc cagaatacgc caaaaaattg 1800 gatggttcgt tcgaaatggt cgtggcccat tccaggttgc caaacaccaa aaaagtttat 1860 gttcaagata aattaaagga ttacgaggac caagtatttg aaatgattaa caacggtgca 1920 tttatctacg tctgtggtga tgcaaagggt atggccaagg gtgtgtcaac cgcattggtt 1980 ggcatcttat cccgtggtaa atccattacc actgatgaag caacagagct aatcaagatg 2040 ctcaagactt caggtagata ccaagaagat gtctggtaa 2079 <210> 27 <211> 658 <212> PRT <213> artificial <220> <223> chimeric cytochrome P450 reductase <400> 27 Met Ser Pro Phe Gly Ile Asp Asn Thr Asp Phe Thr Val Leu Ala Gly 1 5 10 15 Leu Val Leu Ala Val Leu Leu Tyr Val Lys Arg Asn Ser Ile Lys Glu 20 25 30 Leu Leu Met Ser Asp Asp Gly Asp Ile Thr Ala Val Ser Ser Gly Asn 35 40 45 Arg Asp Ile Ala Gln Val Val Thr Glu Asn Asn Lys Asn Tyr Leu Val 50 55 60 Leu Tyr Ala Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala Lys Lys Phe 65 70 75 80 Ser Lys Glu Leu Val Ala Lys Phe Asn Leu Asn Val Met Cys Ala Asp 85 90 95 Val Glu Asn Tyr Asp Phe Glu Ser Leu Asn Asp Val Pro Val Ile Val 100 105 110 Ser Ile Phe Ile Ser Thr Tyr Gly Glu Gly Asp Phe Pro Asp Gly Ala 115 120 125 Val Asn Phe Glu Asp Phe Ile Cys Asn Ala Glu Ala Gly Ala Leu Ser 130 135 140 Asn Leu Arg Tyr Asn Met Phe Gly Leu Gly Asn Ser Thr Tyr Glu Phe 145 150 155 160 Phe Asn Gly Ala Ala Lys Lys Ala Glu Lys His Leu Ser Ala Ala Gly 165 170 175 Ala Ile Arg Leu Gly Lys Leu Gly Glu Ala Asp Asp Gly Ala Gly Thr 180 185 190 Thr Asp Glu Asp Tyr Met Ala Trp Lys Asp Ser Ile Leu Glu Val Leu 195 200 205 Lys Asp Glu Leu Gly Val Glu Ala Thr Gly Glu Glu Ser Ser Ile Arg 210 215 220 Gln Tyr Glu Leu Val Val His Thr Asp Ile Asp Ala Ala Lys Val Tyr 225 230 235 240 Met Gly Glu Met Gly Arg Leu Lys Ser Tyr Glu Asn Gln Lys Pro Pro 245 250 255 Phe Asp Ala Lys Asn Pro Phe Leu Ala Ala Val Thr Thr Asn Arg Lys 260 265 270 Leu Asn Gln Gly Thr Glu Arg His Leu Met His Leu Glu Leu Asp Ile 275 280 285 Ser Asp Ser Lys Ile Arg Tyr Glu Ser Gly Asp His Val Ala Val Tyr 290 295 300 Pro Ala Asn Asp Ser Ala Leu Val Asn Gln Leu Gly Lys Ile Leu Gly 305 310 315 320 Ala Asp Leu Asp Val Val Met Ser Leu Asn Asn Leu Asp Glu Glu Ser 325 330 335 Asn Lys Lys His Pro Phe Pro Cys Pro Thr Ser Tyr Arg Thr Ala Leu 340 345 350 Thr Tyr Tyr Leu Asp Ile Thr Asn Pro Pro Arg Thr Asn Val Leu Tyr 355 360 365 Glu Leu Ala Gln Tyr Ala Ser Glu Pro Ser Glu Gln Glu Leu Leu Arg 370 375 380 Lys Met Ala Ser Ser Ser Gly Glu Gly Lys Glu Leu Tyr Leu Ser Trp 385 390 395 400 Val Val Glu Ala Arg Arg His Ile Leu Ala Ile Leu Gln Asp Cys Pro 405 410 415 Ser Leu Arg Pro Pro Ile Asp His Leu Cys Glu Leu Leu Pro Arg Leu 420 425 430 Gln Ala Arg Tyr Tyr Ser Ile Ala Ser Ser Ser Lys Val His Pro Asn 435 440 445 Ser Val His Ile Cys Ala Val Val Val Glu Tyr Glu Thr Lys Ala Gly 450 455 460 Arg Ile Asn Lys Gly Val Ala Thr Asn Trp Leu Arg Ala Lys Glu Pro 465 470 475 480 Ala Gly Glu Asn Gly Gly Arg Ala Leu Val Pro Met Phe Val Arg Lys 485 490 495 Ser Gln Phe Arg Leu Pro Phe Lys Ala Thr Thr Pro Val Ile Met Val 500 505 510 Gly Pro Gly Thr Gly Val Ala Pro Phe Ile Gly Phe Ile Gln Glu Arg 515 520 525 Ala Trp Leu Arg Gln Gln Gly Lys Glu Val Gly Glu Thr Leu Leu Tyr 530 535 540 Tyr Gly Cys Arg Arg Ser Asp Glu Asp Tyr Leu Tyr Arg Glu Glu Leu 545 550 555 560 Ala Gln Phe His Arg Asp Gly Ala Leu Thr Gln Leu Asn Val Ala Phe 565 570 575 Ser Arg Glu Gln Ser His Lys Val Tyr Val Gln His Leu Leu Lys Gln 580 585 590 Asp Arg Glu His Leu Trp Lys Leu Ile Glu Gly Gly Ala His Ile Tyr 595 600 605 Val Cys Gly Asp Ala Arg Asn Met Ala Arg Asp Val Gln Asn Thr Phe 610 615 620 Tyr Asp Ile Val Ala Glu Leu Gly Ala Met Glu His Ala Gln Ala Val 625 630 635 640 Asp Tyr Ile Lys Lys Leu Met Thr Lys Gly Arg Tyr Ser Leu Asp Val 645 650 655 Trp Ser <210> 28 <211> 1977 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 27 <400> 28 atgtccccat tcggtatcga caacaccgac ttcactgtct tggctggttt ggttttggcc 60 gttttgttgt acgttaagag aaactccatc aaggaattgt tgatgtccga tgacggtgat 120 atcactgctg tctcttctgg taacagagac attgctcaag ttgttaccga aaacaacaag 180 aactacttgg ttttgtacgc ttctcaaact ggtactgccg aagattacgc caagaagttc 240 tccaaggaat tggttgccaa gttcaacttg aacgttatgt gtgctgatgt tgaaaactac 300 gacttcgaat ctttgaacga tgttccagtc atcgtatcta ttttcatctc tacttacggt 360 gaaggtgact tcccagacgg tgctgtcaac ttcgaagatt tcatttgtaa cgctgaagct 420 ggtgctttgt ctaacttgag atacaacatg ttcggtttgg gtaactctac ttacgaattc 480 ttcaacggtg ccgccaagaa ggccgaaaag cacttgtccg ccgctggtgc tatcagattg 540 ggtaagttgg gtgaagctga tgatggtgct ggtactactg acgaagatta catggcctgg 600 aaggactcca tcttggaagt tttgaaggac gaattgggtg ttgaagccac tggtgaagaa 660 tcctctatta gacaatacga attggttgtc cacaccgaca tcgatgctgc caaggtttac 720 atgggtgaaa tgggtagatt gaagtcttac gaaaaccaaa agccaccatt cgatgccaag 780 aacccattct tggctgctgt caccaccaac agaaagttga accaaggtac cgaaagacac 840 ttgatgcact tggaattgga catctctgac tccaagatca gatacgaatc tggtgaccac 900 gttgctgttt acccagccaa cgactctgct ttggtcaacc aattgggtaa gatcttgggt 960 gccgacttgg acgtcgtcat gtccttgaac aacttggatg aagaatccaa caagaagcac 1020 ccattcccat gtccaacttc ctacagaact gccttgacct actacttgga catcaccaac 1080 ccaccaagaa ccaacgtttt gtacgaattg gctcaatacg cctctgaacc atctgaacaa 1140 gaattgttga gaaagatggc ctcctcctcc ggtgaaggta aggaattgta cttgtcttgg 1200 gttgttgaag ccaggagaca catcttggcc atcttgcaag actgtccatc cttaagacca 1260 ccaatcgacc acttgtgtga attgttgcca agattgcaag ccagatacta ctccatcgcc 1320 tcttcctcca aggtccaccc aaactctgtt cacatctgtg ctgttgttgt tgaatacgaa 1380 accaaggctg gtagaatcaa caagggtgtt gccaccaact ggttgagagc caaggaacca 1440 gccggtgaaa acggtggtag agctttggtt ccaatgttcg ttagaaagtc ccaattcaga 1500 ttgccattca aggccaccac tccagtcatc atggttggtc caggtaccgg tgttgctcca 1560 ttcatcggtt tcatccaaga aagagcctgg ttgagacaac aaggtaagga agttggtgaa 1620 actttgttgt actacggttg tagaagatct gatgaagatt acttgtacag agaagaattg 1680 gctcaattcc acagagatgg tgctttgacc caattgaacg ttgccttctc cagagaacaa 1740 tcccacaagg tctacgtcca acacttgttg aagcaagaca gagaacactt gtggaagttg 1800 atcgaaggtg gtgcccacat ctacgtctgt ggtgatgcta gaaacatggc cagagatgtt 1860 caaaacacct tctacgacat cgttgctgaa ttgggtgcca tggaacacgc tcaagctgtt 1920 gactacatca agaagttgat gaccaagggt agatactcct tggacgtttg gtcttaa 1977 <210> 29 <211> 693 <212> PRT <213> Arabidopsis thaliana <400> 29 Met Ser Thr Ser Ala Leu Tyr Ala Ser Asp Leu Phe Lys Gln Leu Lys 1 5 10 15 Ser Ile Met Gly Thr Asp Ser Leu Ser Asp Asp Val Val Leu Val Ile 20 25 30 Ala Thr Thr Ser Leu Ala Leu Val Ala Gly Phe Val Val Leu Leu Trp 35 40 45 Lys Lys Thr Thr Ala Asp Arg Ser Gly Glu Leu Lys Pro Leu Met Ile 50 55 60 Pro Lys Ser Leu Met Ala Lys Asp Glu Asp Asp Asp Leu Asp Leu Gly 65 70 75 80 Ser Gly Lys Thr Arg Val Ser Ile Phe Phe Gly Thr Gln Thr Gly Thr 85 90 95 Ala Glu Gly Phe Ala Lys Ala Leu Ser Glu Glu Ile Lys Ala Arg Tyr 100 105 110 Glu Lys Ala Ala Val Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp 115 120 125 Asp Asp Gln Tyr Glu Glu Lys Leu Lys Lys Glu Thr Leu Ala Phe Phe 130 135 140 Cys Val Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg 145 150 155 160 Phe Tyr Lys Trp Phe Thr Glu Glu Asn Glu Arg Asp Ile Lys Leu Gln 165 170 175 Gln Leu Ala Tyr Gly Val Phe Ala Leu Gly Asn Arg Gln Tyr Glu His 180 185 190 Phe Asn Lys Ile Gly Ile Val Leu Asp Glu Glu Leu Cys Lys Lys Gly 195 200 205 Ala Lys Arg Leu Ile Glu Val Gly Leu Gly Asp Asp Asp Gln Ser Ile 210 215 220 Glu Asp Asp Phe Asn Ala Trp Lys Glu Ser Leu Trp Ser Glu Leu Asp 225 230 235 240 Lys Leu Leu Lys Asp Glu Asp Asp Lys Ser Val Ala Thr Pro Tyr Thr 245 250 255 Ala Val Ile Pro Glu Tyr Arg Val Val Thr His Asp Pro Arg Phe Thr 260 265 270 Thr Gln Lys Ser Met Glu Ser Asn Val Ala Asn Gly Asn Thr Thr Ile 275 280 285 Asp Ile His His Pro Cys Arg Val Asp Val Ala Val Gln Lys Glu Leu 290 295 300 His Thr His Glu Ser Asp Arg Ser Cys Ile His Leu Glu Phe Asp Ile 305 310 315 320 Ser Arg Thr Gly Ile Thr Tyr Glu Thr Gly Asp His Val Gly Val Tyr 325 330 335 Ala Glu Asn His Val Glu Ile Val Glu Glu Ala Gly Lys Leu Leu Gly 340 345 350 His Ser Leu Asp Leu Val Phe Ser Ile His Ala Asp Lys Glu Asp Gly 355 360 365 Ser Pro Leu Glu Ser Ala Val Pro Pro Pro Phe Pro Gly Pro Cys Thr 370 375 380 Leu Gly Thr Gly Leu Ala Arg Tyr Ala Asp Leu Leu Asn Pro Pro Arg 385 390 395 400 Lys Ser Ala Leu Val Ala Leu Ala Ala Tyr Ala Thr Glu Pro Ser Glu 405 410 415 Ala Glu Lys Leu Lys His Leu Thr Ser Pro Asp Gly Lys Asp Glu Tyr 420 425 430 Ser Gln Trp Ile Val Ala Ser Gln Arg Ser Leu Leu Glu Val Met Ala 435 440 445 Ala Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala Ile 450 455 460 Ala Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg 465 470 475 480 Leu Ala Pro Ser Arg Val His Val Thr Ser Ala Leu Val Tyr Gly Pro 485 490 495 Thr Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys 500 505 510 Asn Ala Val Pro Ala Glu Lys Ser His Glu Cys Ser Gly Ala Pro Ile 515 520 525 Phe Ile Arg Ala Ser Asn Phe Lys Leu Pro Ser Asn Pro Ser Thr Pro 530 535 540 Ile Val Met Val Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe 545 550 555 560 Leu Gln Glu Arg Met Ala Leu Lys Glu Asp Gly Glu Glu Leu Gly Ser 565 570 575 Ser Leu Leu Phe Phe Gly Cys Arg Asn Arg Gln Met Asp Phe Ile Tyr 580 585 590 Glu Asp Glu Leu Asn Asn Phe Val Asp Gln Gly Val Ile Ser Glu Leu 595 600 605 Ile Met Ala Phe Ser Arg Glu Gly Ala Gln Lys Glu Tyr Val Gln His 610 615 620 Lys Met Met Glu Lys Ala Ala Gln Val Trp Asp Leu Ile Lys Glu Glu 625 630 635 640 Gly Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val 645 650 655 His Arg Thr Leu His Thr Ile Val Gln Glu Gln Glu Gly Val Ser Ser 660 665 670 Ser Glu Ala Glu Ala Ile Val Lys Lys Leu Gln Thr Glu Gly Arg Tyr 675 680 685 Leu Arg Asp Val Trp 690 <210> 30 <211> 2082 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 29 <400> 30 atgtccactt ctgctttgta cgcttccgat ttgttcaagc aattgaagtc tattatgggt 60 actgattctt tgtccgacga tgttgttttg gttattgcta ctacttcttt ggctttggtt 120 gctggtttcg ttgttttgtt gtggaagaaa actactgctg atagatctgg tgaattgaag 180 ccattgatga tcccaaagtc tttgatggct aaggacgaag atgatgattt ggatttgggt 240 tccggtaaga ctagagtctc tatcttcttc ggtactcaaa ctggtactgc tgaaggtttc 300 gctaaggctt tgtccgaaga aatcaaggct agatacgaaa aggctgctgt caaggtcatt 360 gacttggatg actacgctgc cgatgatgac caatacgaag aaaagttgaa gaaggaaact 420 ttggctttct tctgtgttgc tacttacggt gatggtgaac caactgacaa cgctgccaga 480 ttctacaagt ggttcactga agaaaacgaa agagatatca agttgcaaca attggcttac 540 ggtgttttcg ctttgggtaa cagacaatac gaacacttca acaagatcgg tatcgttttg 600 gatgaagaat tgtgtaagaa gggtgctaag agattgattg aagtcggttt gggtgatgat 660 gatcaatcta ttgaagatga tttcaacgcc tggaaggaat ctttgtggtc tgaattggac 720 aagttgttga aggacgaaga tgataagtct gttgctactc catacactgc tgttattcca 780 gaatacagag ttgttactca cgatccaaga ttcactactc aaaagtctat ggaatctaac 840 gttgccaacg gtaacactac tattgacatt caccacccat gtagagttga tgttgctgtt 900 caaaaggaat tgcacactca cgaatctgat agatcttgta ttcacttgga attcgacatc 960 tccagaactg gtattactta cgaaactggt gaccacgttg gtgtttacgc tgaaaaccac 1020 gttgaaatcg ttgaagaagc tggtaagttg ttgggtcact ctttggattt ggttttctcc 1080 atccacgctg acaaggaaga tggttcccca ttggaatctg ctgttccacc accattccca 1140 ggtccatgta ctttgggtac tggtttggct agatacgctg acttgttgaa cccaccaaga 1200 aagtctgctt tggttgcctt ggctgcctac gccactgaac catctgaagc cgaaaagttg 1260 aagcacttga cttctccaga tggtaaggat gaatactctc aatggattgt tgcttctcaa 1320 agatctttgt tggaagttat ggctgctttc ccatctgcta agccaccatt gggtgttttc 1380 ttcgctgcta tcgctccaag attgcaacca agatactact ccatctcttc ctctccaaga 1440 ttggctccat ctagagttca cgttacttcc gctttggttt acggtccaac tccaactggt 1500 agaatccaca agggtgtttg ttctacttgg atgaagaacg ctgttccagc tgaaaagtct 1560 cacgaatgtt ctggtgcccc aatcttcatt agagcttcta acttcaagtt gccatccaac 1620 ccatctactc caatcgttat ggttggtcca ggtactggtt tggctccatt cagaggtttc 1680 ttgcaagaaa gaatggcttt gaaggaagat ggtgaagaat tgggttcttc tttgttgttc 1740 ttcggttgta gaaacagaca aatggacttc atctacgaag atgaattgaa caacttcgtt 1800 gatcaaggtg ttatctctga attgatcatg gctttctcca gagaaggtgc tcaaaaggaa 1860 tacgttcaac acaagatgat ggaaaaggct gctcaagttt gggatttgat caaggaagaa 1920 ggttacttgt acgtttgtgg tgatgctaag ggtatggcta gagatgtcca cagaactttg 1980 cacaccattg ttcaagaaca agaaggtgtt tcttcttctg aagctgaagc tatcgttaag 2040 aagttgcaaa ccgaaggtag atacttgaga gatgtctggt aa 2082 <210> 31 <211> 712 <212> PRT <213> Arabidopsis thaliana <400> 31 Met Ser Ser Ser Ser Ser Ser Ser Thr Ser Met Ile Asp Leu Met Ala 1 5 10 15 Ala Ile Ile Lys Gly Glu Pro Val Ile Val Ser Asp Pro Ala Asn Ala 20 25 30 Ser Ala Tyr Glu Ser Val Ala Ala Glu Leu Ser Ser Met Leu Ile Glu 35 40 45 Asn Arg Gln Phe Ala Met Ile Val Thr Thr Ser Ile Ala Val Leu Ile 50 55 60 Gly Cys Ile Val Met Leu Val Trp Arg Arg Ser Gly Ser Gly Asn Ser 65 70 75 80 Lys Arg Val Glu Pro Leu Lys Pro Leu Val Ile Lys Pro Arg Glu Glu 85 90 95 Glu Ile Asp Asp Gly Arg Lys Lys Val Thr Ile Phe Phe Gly Thr Gln 100 105 110 Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Gly Glu Glu Ala Lys 115 120 125 Ala Arg Tyr Glu Lys Thr Arg Phe Lys Ile Val Asp Leu Asp Asp Tyr 130 135 140 Ala Ala Asp Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asp Val 145 150 155 160 Ala Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn 165 170 175 Ala Ala Arg Phe Tyr Lys Trp Phe Thr Glu Gly Asn Asp Arg Gly Glu 180 185 190 Trp Leu Lys Asn Leu Lys Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln 195 200 205 Tyr Glu His Phe Asn Lys Val Ala Lys Val Val Asp Asp Ile Leu Val 210 215 220 Glu Gln Gly Ala Gln Arg Leu Val Gln Val Gly Leu Gly Asp Asp Asp 225 230 235 240 Gln Cys Ile Glu Asp Asp Phe Thr Ala Trp Arg Glu Ala Leu Trp Pro 245 250 255 Glu Leu Asp Thr Ile Leu Arg Glu Glu Gly Asp Thr Ala Val Ala Thr 260 265 270 Pro Tyr Thr Ala Ala Val Leu Glu Tyr Arg Val Ser Ile His Asp Ser 275 280 285 Glu Asp Ala Lys Phe Asn Asp Ile Asn Met Ala Asn Gly Asn Gly Tyr 290 295 300 Thr Val Phe Asp Ala Gln His Pro Tyr Lys Ala Asn Val Ala Val Lys 305 310 315 320 Arg Glu Leu His Thr Pro Glu Ser Asp Arg Ser Cys Ile His Leu Glu 325 330 335 Phe Asp Ile Ala Gly Ser Gly Leu Thr Tyr Glu Thr Gly Asp His Val 340 345 350 Gly Val Leu Cys Asp Asn Leu Ser Glu Thr Val Asp Glu Ala Leu Arg 355 360 365 Leu Leu Asp Met Ser Pro Asp Thr Tyr Phe Ser Leu His Ala Glu Lys 370 375 380 Glu Asp Gly Thr Pro Ile Ser Ser Ser Leu Pro Pro Pro Phe Pro Pro 385 390 395 400 Cys Asn Leu Arg Thr Ala Leu Thr Arg Tyr Ala Cys Leu Leu Ser Ser 405 410 415 Pro Lys Lys Ser Ala Leu Val Ala Leu Ala Ala His Ala Ser Asp Pro 420 425 430 Thr Glu Ala Glu Arg Leu Lys His Leu Ala Ser Pro Ala Gly Lys Val 435 440 445 Asp Glu Tyr Ser Lys Trp Val Val Glu Ser Gln Arg Ser Leu Leu Glu 450 455 460 Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe 465 470 475 480 Ala Gly Val Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser 485 490 495 Ser Pro Lys Ile Ala Glu Thr Arg Ile His Val Thr Cys Ala Leu Val 500 505 510 Tyr Glu Lys Met Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr 515 520 525 Trp Met Lys Asn Ala Val Pro Tyr Glu Lys Ser Glu Asn Cys Ser Ser 530 535 540 Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro Ser Asp Ser 545 550 555 560 Lys Val Pro Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe 565 570 575 Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Val Glu Ser Gly Val Glu 580 585 590 Leu Gly Pro Ser Val Leu Phe Phe Gly Cys Arg Asn Arg Arg Met Asp 595 600 605 Phe Ile Tyr Glu Glu Glu Leu Gln Arg Phe Val Glu Ser Gly Ala Leu 610 615 620 Ala Glu Leu Ser Val Ala Phe Ser Arg Glu Gly Pro Thr Lys Glu Tyr 625 630 635 640 Val Gln His Lys Met Met Asp Lys Ala Ser Asp Ile Trp Asn Met Ile 645 650 655 Ser Gln Gly Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala 660 665 670 Arg Asp Val His Arg Ser Leu His Thr Ile Ala Gln Glu Gln Gly Ser 675 680 685 Met Asp Ser Thr Lys Ala Glu Gly Phe Val Lys Asn Leu Gln Thr Ser 690 695 700 Gly Arg Tyr Leu Arg Asp Val Trp 705 710 <210> 32 <211> 2139 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 31 <400> 32 atgtcctctt cttcttcttc ttctacctcc atgatcgatt tgatggctgc tatcatcaag 60 ggtgaaccag ttattgtctc cgacccagct aacgcctccg cttacgaatc cgttgctgct 120 gaattgtcct ctatgttgat cgaaaacaga caattcgcca tgattgttac cacttccatt 180 gctgttttga ttggttgtat cgttatgttg gtttggagaa gatccggttc tggtaactct 240 aagagagtcg aaccattgaa gccattggtt attaagccaa gagaagaaga aattgatgat 300 ggtagaaaga aggttaccat cttcttcggt actcaaactg gtactgctga aggtttcgct 360 aaggctttgg gtgaagaagc taaggctaga tacgaaaaga ccagattcaa gatcgttgat 420 ttggatgatt acgctgctga tgatgatgaa tacgaagaaa agttgaagaa ggaagatgtt 480 gctttcttct tcttggccac ttacggtgat ggtgaaccaa ccgacaacgc tgctagattc 540 tacaagtggt tcaccgaagg taacgacaga ggtgaatggt tgaagaactt gaagtacggt 600 gttttcggtt tgggtaacag acaatacgaa cacttcaaca aggttgccaa ggttgttgat 660 gacattttgg tcgaacaagg tgctcaaaga ttggttcaag ttggtttggg tgatgatgac 720 caatgtattg aagatgactt caccgcttgg agagaagctt tgtggccaga attggatact 780 atcttgagag aagaaggtga tactgctgtt gccactccat acactgctgc tgttttggaa 840 tacagagttt ctattcacga ctctgaagat gccaagttca acgatatcaa catggctaac 900 ggtaacggtt acactgtttt cgatgctcaa cacccataca aggctaacgt cgctgttaag 960 agagaattgc acactccaga atctgataga tcttgtatcc acttggaatt cgacattgct 1020 ggttctggtt tgacttacga aactggtgat cacgttggtg ttttgtgtga taacttgtct 1080 gaaactgttg atgaagcttt gagattgttg gatatgtctc cagatactta cttctctttg 1140 cacgctgaaa aggaagatgg tactccaatc tcttcttctt tgccaccacc attcccacca 1200 tgtaacttga gaactgcttt gactagatac gcttgtttgt tgtcatctcc aaagaagtct 1260 gctttggttg ctttggctgc tcacgcttct gatccaaccg aagctgaaag attgaagcac 1320 ttggcttctc cagctggtaa ggttgatgaa tactctaagt gggttgttga atctcaaaga 1380 tctttgttgg aagttatggc cgaattccca tctgccaagc caccattggg tgttttcttc 1440 gctggtgttg ctccaagatt gcaaccaaga ttctactcta tctcttcttc tccaaagatt 1500 gctgaaacta gaattcacgt cacttgtgct ttggtttacg aaaagatgcc aactggtaga 1560 attcacaagg gtgtttgttc cacttggatg aagaacgctg ttccatacga aaagtctgaa 1620 aactgttcct ctgctccaat cttcgttaga caatccaact tcaagttgcc atctgattct 1680 aaggttccaa tcatcatgat cggtccaggt actggtttgg ctccattcag aggtttcttg 1740 caagaaagat tggctttggt tgaatctggt gttgaattgg gtccatctgt tttgttcttc 1800 ggttgtagaa acagaagaat ggatttcatc tacgaagaag aattgcaaag attcgttgaa 1860 tctggtgctt tggctgaatt gtctgtcgcc ttctctagag aaggtccaac caaggaatac 1920 gttcaacaca agatgatgga caaggcttct gatatctgga acatgatctc tcaaggtgct 1980 tacttgtacg tttgtggtga cgccaagggt atggctagag atgttcacag atctttgcac 2040 actatcgctc aagaacaagg ttctatggat tctactaagg ctgaaggttt cgttaagaac 2100 ttgcaaactt ctggtagata cttgagagat gtttggtaa 2139 <210> 33 <211> 522 <212> PRT <213> Lonicera japonica <400> 33 Met Ser Trp Ile Phe Asp Leu Thr Ile Ser Phe Thr Thr Leu Leu Phe 1 5 10 15 Leu Ile Phe Thr Thr Ala Leu Leu Leu Leu Leu Lys Val Phe Lys Lys 20 25 30 Asn His Lys Leu Arg Pro Pro Pro Ser Pro Phe Thr Leu Pro Ile Ile 35 40 45 Gly His Leu His Leu Leu Gly Pro Leu Ile His Gln Ser Phe His Arg 50 55 60 Leu Ser Thr Leu Tyr Gly Pro Leu Ile Gln Leu Lys Ile Gly Tyr Ile 65 70 75 80 Pro Cys Val Val Ala Ser Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys 85 90 95 Thr His Glu Leu Ala Phe Ser Ser Arg Lys His Ser Ala Ala Ile Lys 100 105 110 Leu Leu Thr Tyr Asp Val Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr 115 120 125 Trp Lys Phe Ile Lys Lys Thr Cys Thr Phe Glu Leu Leu Gly Thr Arg 130 135 140 Asn Met Asn His Phe Leu Pro Ile Arg Thr Asn Glu Ile Arg Arg Phe 145 150 155 160 Leu Gln Val Met Leu Glu Lys Ala Lys Ala Ser Glu Gly Val Asn Val 165 170 175 Thr Glu Glu Leu Ile Lys Leu Thr Asn Asn Val Ile Ser Gln Met Met 180 185 190 Phe Ser Thr Arg Ser Ser Gly Thr Glu Gly Glu Ala Glu Glu Met Arg 195 200 205 Thr Leu Val Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser 210 215 220 Asp Phe Ile Lys Leu Cys Lys Asn Ile Asp Ile Gly Gly Phe Lys Lys 225 230 235 240 Arg Ser Lys Asp Ile Gln Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile 245 250 255 Ile Ser Glu Arg Glu Ser Glu Arg Ala Arg Arg Gly Lys Asn Arg Glu 260 265 270 Thr Leu Gly Glu Glu Gly Gly Lys Asp Phe Leu Asp Met Met Leu Asp 275 280 285 Thr Met Glu Asp Gly Lys Cys Glu Val Glu Ile Thr Arg Asp His Ile 290 295 300 Lys Ala Leu Val Leu Asp Phe Leu Thr Ala Ala Thr Asp Thr Thr Ala 305 310 315 320 Ile Ala Val Glu Trp Thr Leu Ala Glu Leu Ile Ser Asn Pro Glu Val 325 330 335 Phe Asp Lys Ala Arg Glu Glu Ile Asp Lys Val Val Gly Lys His Arg 340 345 350 Leu Val Thr Glu Leu Asp Thr Pro Asn Leu Pro Tyr Ile His Ala Ile 355 360 365 Ile Lys Glu Ser Phe Arg Leu His Pro Pro Ile Pro Leu Leu Ile Arg 370 375 380 Lys Ser Val Gln Asp Cys Thr Val Gly Gly Tyr His Ile Ser Ala Asn 385 390 395 400 Thr Ile Leu Phe Val Asn Ile Trp Ala Ile Gly Arg Asn Pro Lys Tyr 405 410 415 Trp Glu Ser Pro Met Lys Phe Trp Pro Glu Arg Phe Leu Glu Ser Asn 420 425 430 Gly Pro Gly Pro Val Gly Ser Met Asp Ile Lys Gly His His Tyr Glu 435 440 445 Leu Leu Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Ala Leu 450 455 460 Ala Met Gln Glu Leu Pro Val Val Leu Ala Ala Met Ile Gln Cys Phe 465 470 475 480 Asn Trp Lys Pro Val Thr Leu Asp Gly Glu Glu Leu Asp Met Ser Glu 485 490 495 Arg Pro Gly Leu Thr Ala Pro Arg Ala His Asp Leu Val Cys Val Pro 500 505 510 Ser Ala Arg Ile Asn Ser Phe Asp Asn Phe 515 520 <210> 34 <211> 1569 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 33 <400> 34 atgtcctgga tcttcgactt gactatctct ttcaccactt tgttgttctt gatcttcacc 60 accgccttgt tgttgttgtt gaaggttttc aagaagaacc acaagttaag accaccacca 120 tctccattca ccttgccaat catcggtcac ttgcacttgt tgggtccatt gatccaccaa 180 tccttccaca gattgtccac cttgtacggt ccattgatcc aattgaagat cggttacatc 240 ccatgtgttg ttgcctctac tccagaattg gctaaggaat tcttaaagac tcacgaattg 300 gctttctcct ctagaaagca ctccgctgcc attaagttgt tgacctacga tgtttctttc 360 gctttctctc catacggtcc atactggaag ttcatcaaaa agacttgtac cttcgaattg 420 ttgggtacta gaaacatgaa ccacttcttg ccaattagaa ccaacgaaat tagaagattc 480 ttgcaagtta tgttggaaaa ggccaaggct tctgaaggtg ttaacgttac tgaagaattg 540 atcaagttga ctaacaacgt tatctctcaa atgatgttct ctactagatc ttctggtacc 600 gaaggtgaag ctgaagaaat gagaactttg gttagagaag ttactcaaat cttcggtgaa 660 ttcaacgttt ctgatttcat caagttgtgt aagaacattg atattggtgg tttcaagaag 720 agatctaagg atatccaaaa gagatacgat gctttgttgg aaaagatcat ctctgaaaga 780 gaatctgaaa gagctagaag aggtaagaac agagaaactt tgggtgaaga aggtggtaag 840 gatttcttgg atatgatgtt ggatactatg gaagatggta agtgtgaagt tgaaatcact 900 agagatcaca ttaaggcctt ggttttggat ttcttgactg ctgccactga tactactgct 960 attgctgttg aatggacttt ggccgaattg atctctaacc cagaagtttt cgataaggct 1020 agagaagaaa tcgataaggt cgttggtaag cacagattgg tcactgaatt ggacactcca 1080 aacttgccat acatccacgc tatcatcaag gaatctttca gattgcaccc accaattcca 1140 ttgttgatca gaaagtctgt ccaagattgt actgttggtg gttaccacat ctctgctaac 1200 accatcttgt tcgtcaacat ttgggccatc ggtagaaacc caaagtactg ggaatctcca 1260 atgaagttct ggccagaaag attcttggaa tccaacggtc caggtccagt tggttctatg 1320 gatattaagg gtcaccacta cgaattgttg ccattcggtt ctggtagaag aggttgtcca 1380 ggtatggctt tggccatgca agaattgcca gttgttttgg ccgccatgat ccaatgtttc 1440 aactggaagc cagttacttt ggacggtgaa gaattggata tgtctgaaag accaggtttg 1500 actgctccaa gagcccacga tttggtttgt gttccatccg ctagaattaa ctctttcgat 1560 aacttctaa 1569 <210> 35 <211> 520 <212> PRT <213> Lonicera macranthoides <400> 35 Met Ser Leu Ile Phe Asp Leu Thr Ile Ser Phe Thr Thr Leu Leu Phe 1 5 10 15 Leu Ile Phe Thr Thr Ala Leu Leu Leu Lys Val Phe Lys Lys Asn His 20 25 30 Lys Leu Gln Pro Pro Pro Ser Pro Phe Thr Leu Pro Ile Ile Gly His 35 40 45 Leu His Leu Leu Gly Pro Leu Ile His Gln Ser Phe His Arg Leu Ser 50 55 60 Thr Leu Tyr Gly Pro Leu Ile Gln Leu Lys Ile Gly Tyr Ile Pro Cys 65 70 75 80 Val Val Ala Ser Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys Thr His 85 90 95 Glu Leu Ala Phe Ser Ser Arg Lys His Ser Ala Ala Ile Lys Leu Leu 100 105 110 Thr Tyr Asp Val Ser Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys 115 120 125 Phe Ile Lys Lys Thr Cys Thr Phe Glu Leu Leu Gly Thr Arg Asn Met 130 135 140 Asn His Phe Leu Pro Ile Arg Thr Asn Glu Ile Arg Arg Phe Leu Gln 145 150 155 160 Val Met Leu Glu Lys Ala Lys Ala Ser Glu Gly Val Asn Val Thr Glu 165 170 175 Glu Leu Ile Lys Leu Thr Asn Asn Val Ile Ser Gln Met Met Phe Ser 180 185 190 Thr Arg Ser Ser Gly Thr Glu Gly Glu Ala Glu Glu Val Arg Thr Leu 195 200 205 Val Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe 210 215 220 Ile Lys Leu Cys Lys Asn Ile Asp Ile Gly Gly Phe Lys Lys Arg Ser 225 230 235 240 Glu Asp Ile Gln Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Ser 245 250 255 Glu Arg Glu Ser Glu Arg Ala Arg Arg Gly Lys Asn Arg Glu Thr Leu 260 265 270 Gly Glu Glu Gly Gly Lys Asp Phe Leu Asp Met Met Leu Asp Thr Met 275 280 285 Glu Asp Gly Lys Cys Glu Val Glu Ile Thr Arg Asp His Ile Lys Ala 290 295 300 Leu Val Leu Asp Phe Leu Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala 305 310 315 320 Val Glu Trp Thr Leu Ala Glu Leu Ile Ser Asn Pro Glu Val Phe Asp 325 330 335 Lys Ala Arg Glu Glu Ile Asp Lys Val Val Gly Lys His Arg Leu Val 340 345 350 Thr Glu Leu Asp Thr Pro Asn Leu Pro Tyr Ile His Ala Ile Ile Lys 355 360 365 Glu Ser Phe Arg Leu His Pro Pro Ile Pro Leu Val Ile Arg Lys Ser 370 375 380 Val Gln Asp Cys Thr Val Gly Gly Tyr His Ile Ser Ala Asn Thr Ile 385 390 395 400 Leu Phe Ile Asn Ile Trp Ala Ile Gly Arg Asn Pro Lys Tyr Trp Glu 405 410 415 Ser Pro Met Lys Phe Trp Pro Glu Arg Phe Leu Glu Ser Asn Glu Pro 420 425 430 Gly Ser Val Gly Ser Thr Asp Ile Lys Gly His His Tyr Glu Leu Leu 435 440 445 Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Ala Leu Ala Met 450 455 460 Gln Glu Leu Pro Val Val Leu Ala Ala Met Ile Gln Cys Phe Asn Trp 465 470 475 480 Lys Pro Val Thr Leu Asp Gly Glu Glu Leu Asp Met Ser Glu Arg Pro 485 490 495 Gly Leu Thr Ala Pro Arg Ala His Asp Leu Val Cys Val Pro Ser Ala 500 505 510 Arg Ile Asn Ser Phe Asp Asn Phe 515 520 <210> 36 <211> 1563 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 35 <400> 36 atgtccttga tcttcgactt gactatctct ttcaccactt tgttgttctt gatcttcacc 60 accgccttgt tgttgaaggt tttcaagaag aaccacaagt tgcaaccacc accatctcca 120 ttcaccttgc caatcatcgg tcacttgcac ttgttgggtc cattgatcca ccaatccttc 180 cacagattgt ccaccttgta cggtccattg atccaattga agatcggtta catcccatgt 240 gttgttgctt ctactccaga attggctaag gaattcttaa agactcacga attggctttc 300 tcctctagaa agcactccgc tgccattaag ttgttgacct acgatgtttc tttcgctttc 360 gctccatacg gtccatactg gaagttcatc aaaaagactt gtaccttcga attgttgggt 420 actagaaaca tgaaccactt cttgccaatt agaaccaacg aaattagaag attcttgcaa 480 gttatgttgg aaaaggccaa ggcttctgaa ggtgttaacg ttactgaaga attgatcaag 540 ttgactaaca acgttatctc tcaaatgatg ttctctacta gatcttctgg taccgaaggt 600 gaagctgaag aagttagaac tttggttaga gaagttactc aaatcttcgg tgaattcaac 660 gtttctgatt tcatcaagtt gtgtaagaac attgatattg gtggtttcaa gaagagatct 720 gaagatatcc aaaagagata cgatgctttg ttggaaaaga tcatctctga aagagaatct 780 gaaagagcta gaagaggtaa gaacagagaa actttgggtg aagaaggtgg taaggatttc 840 ttggacatga tgttggatac tatggaagat ggtaagtgtg aagttgaaat cactagagat 900 cacattaagg ccttggtttt ggatttcttg actgctgcca ctgatactac tgctattgct 960 gttgaatgga ctttggctga attgatctct aacccagaag ttttcgataa ggctagagaa 1020 gaaatcgata aggtcgttgg taagcacaga ttggtcactg aattggacac tccaaacttg 1080 ccatacatcc acgctatcat caaggaatct ttcagattgc acccaccaat tccattggtc 1140 atcagaaagt ctgtccaaga ttgtactgtt ggtggttacc acatctctgc taacactatc 1200 ttgttcatca acatttgggc catcggtaga aacccaaagt actgggaatc tccaatgaag 1260 ttctggccag aaagattctt ggaatccaac gaaccaggtt ctgttggttc tactgatatt 1320 aagggtcacc actacgaatt gttgccattc ggttctggta gaagaggttg tccaggtatg 1380 gctttggcca tgcaagaatt gccagttgtt ttggccgcca tgatccaatg tttcaactgg 1440 aagccagtta ctttggacgg tgaagaattg gatatgtctg aaagaccagg tttgactgct 1500 ccaagagccc acgatttggt ttgtgttcca tccgctagaa ttaactcttt cgataacttc 1560 taa 1563 <210> 37 <211> 366 <212> PRT <213> Petroselinum crispum <400> 37 Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Lys Glu Lys Thr Leu 1 5 10 15 Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr 20 25 30 Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Leu Asp 35 40 45 Asp Asp Ser Asp Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Lys 50 55 60 Ala Cys Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp 65 70 75 80 Ser Gly Leu Ile Ser Glu Met Thr Arg Leu Ser Arg Glu Phe Phe Ala 85 90 95 Leu Pro Ala Glu Glu Lys Leu Glu Tyr Asp Thr Thr Gly Gly Lys Arg 100 105 110 Gly Gly Phe Thr Ile Ser Thr Val Leu Gln Gly Asp Asp Ala Met Asp 115 120 125 Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asn Ala Arg Asp 130 135 140 Tyr Ser Arg Trp Pro Lys Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu 145 150 155 160 Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val 165 170 175 Leu Ser Glu Ala Met Gly Leu Glu Lys Gly Asp Leu Thr Lys Ala Cys 180 185 190 Val Asp Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro 195 200 205 Gln Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr 210 215 220 Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg 225 230 235 240 Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe 245 250 255 Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe 260 265 270 Arg Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu 275 280 285 Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro 290 295 300 Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr 305 310 315 320 Tyr Ala Glu Met Tyr Lys Lys Cys Met Thr Lys His Ile Glu Val Ala 325 330 335 Thr Arg Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala 340 345 350 Lys Leu Glu Met Lys Ser Lys Ser Ala Asp Glu Asn Leu Ala 355 360 365 <210> 38 <211> 1101 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 37 <400> 38 atgtccgctc caactactat caccgctttg gccaaggaaa agactttgaa cttggacttc 60 gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaattcca 120 attatttctt tggccggttt ggatgacgat tctgatggta gaaggccaga aatctgtaga 180 aagatcgtta aggcttgtga agattggggt attttccaag ttgttgatca cggtattgac 240 tctggtttga tttccgaaat gactagattg tctagagaat tcttcgcttt gccagctgaa 300 gaaaagttgg aatacgatac tactggtggt aagagaggtg gtttcactat ctccactgtt 360 ttgcaaggtg acgacgctat ggattggaga gaattcgtta cttacttctc ttacccaatc 420 aacgctagag actactctag atggccaaag aagccagaag gttggagatc taccactgaa 480 gtttactctg aaaagttgat ggttttgggt gccaagttgt tggaagtttt gtctgaagcc 540 atgggtttgg aaaagggtga tttgactaag gcttgtgttg atatggaaca aaaggttttg 600 attaactact acccaacttg tccacaacca gacttgactt tgggtgtcag gagacacact 660 gatccaggta ctattaccat tttgttgcaa gacatggttg gtggtttgca agccaccaga 720 gatggtggta agacttggat tactgttcaa ccagttgaag gtgctttcgt tgtcaacttg 780 ggtgatcacg gtcactactt gtctaacggt agattcagaa acgctgacca ccaagctgtt 840 gttaactcta cctcttctag attgtctatt gctactttcc aaaacccagc tcaaaacgct 900 atcgtttacc cattgaagat cagagaaggt gaaaaggcta ttttggatga agccatcacc 960 tacgctgaaa tgtacaagaa gtgtatgact aagcacattg aagttgctac tagaaagaag 1020 ttggccaagg aaaagagatt gcaagacgaa aaggccaagt tggaaatgaa gtccaagtct 1080 gctgatgaaa acttggctta a 1101 <210> 39 <211> 507 <212> PRT <213> Flavobacterium johnsoniae <400> 39 Met Ser Asn Thr Ile Asn Glu Tyr Leu Ser Leu Glu Glu Phe Glu Ala 1 5 10 15 Ile Ile Phe Gly Asn Gln Lys Val Thr Ile Ser Asp Val Val Val Asn 20 25 30 Arg Val Asn Glu Ser Phe Asn Phe Leu Lys Glu Phe Ser Gly Asn Lys 35 40 45 Val Ile Tyr Gly Val Asn Thr Gly Phe Gly Pro Met Ala Gln Tyr Arg 50 55 60 Ile Lys Glu Ser Asp Gln Ile Gln Leu Gln Tyr Asn Leu Ile Arg Ser 65 70 75 80 His Ser Ser Gly Thr Gly Lys Pro Leu Ser Pro Val Cys Ala Lys Ala 85 90 95 Ala Ile Leu Ala Arg Leu Asn Thr Leu Ser Leu Gly Asn Ser Gly Val 100 105 110 His Pro Ser Val Ile Asn Leu Met Ser Glu Leu Ile Asn Lys Asp Ile 115 120 125 Thr Pro Leu Ile Phe Glu His Gly Gly Val Gly Ala Ser Gly Asp Leu 130 135 140 Val Gln Leu Ser His Leu Ala Leu Val Leu Ile Gly Glu Gly Glu Val 145 150 155 160 Phe Tyr Lys Gly Glu Arg Arg Pro Thr Pro Glu Val Phe Glu Ile Glu 165 170 175 Gly Leu Lys Pro Ile Gln Val Glu Ile Arg Glu Gly Leu Ala Leu Ile 180 185 190 Asn Gly Thr Ser Val Met Thr Gly Ile Gly Val Val Asn Val Tyr His 195 200 205 Ala Lys Lys Leu Leu Asp Trp Ser Leu Lys Ser Ser Cys Ala Ile Asn 210 215 220 Glu Leu Val Gln Ala Tyr Asp Asp His Phe Ser Ala Glu Leu Asn Gln 225 230 235 240 Thr Lys Arg His Lys Gly Gln Gln Glu Ile Ala Leu Lys Met Arg Gln 245 250 255 Asn Leu Ser Asp Ser Thr Leu Ile Arg Lys Arg Glu Asp His Leu Tyr 260 265 270 Ser Gly Glu Asn Thr Glu Glu Ile Phe Lys Glu Lys Val Gln Glu Tyr 275 280 285 Tyr Ser Leu Arg Cys Val Pro Gln Ile Leu Gly Pro Val Leu Glu Thr 290 295 300 Ile Asn Asn Val Ala Ser Ile Leu Glu Asp Glu Phe Asn Ser Ala Asn 305 310 315 320 Asp Asn Pro Ile Ile Asp Val Lys Asn Gln His Val Tyr His Gly Gly 325 330 335 Asn Phe His Gly Asp Tyr Ile Ser Leu Glu Met Asp Lys Leu Lys Ile 340 345 350 Val Ile Thr Lys Leu Thr Met Leu Ala Glu Arg Gln Leu Asn Tyr Leu 355 360 365 Leu Asn Ser Lys Ile Asn Glu Leu Leu Pro Pro Phe Val Asn Leu Gly 370 375 380 Thr Leu Gly Phe Asn Phe Gly Met Gln Gly Val Gln Phe Thr Ala Thr 385 390 395 400 Ser Thr Thr Ala Glu Ser Gln Met Leu Ser Asn Pro Met Tyr Val His 405 410 415 Ser Ile Pro Asn Asn Asn Asp Asn Gln Asp Ile Val Ser Met Gly Thr 420 425 430 Asn Ser Ala Val Ile Thr Ser Lys Val Ile Glu Asn Ala Phe Glu Val 435 440 445 Leu Ala Ile Glu Met Ile Thr Ile Val Gln Ala Ile Asp Tyr Leu Gly 450 455 460 Gln Lys Asp Lys Ile Ser Ser Val Ser Lys Lys Trp Tyr Asp Glu Ile 465 470 475 480 Arg Asn Ile Ile Pro Thr Phe Lys Glu Asp Gln Val Met Tyr Pro Phe 485 490 495 Val Gln Lys Val Lys Asp His Leu Ile Asn Asn 500 505 <210> 40 <211> 1524 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 39 <400> 40 atgtccaaca ctattaacga atacttgtct ttggaagaat tcgaagccat catcttcggt 60 aaccaaaagg ttactatttc tgacgttgtc gttaacagag ttaacgaatc tttcaacttc 120 ttgaaggaat tctctggtaa caaggttatt tacggtgtta acactggttt cggtccaatg 180 gctcaataca gaattaagga atctgatcaa attcaattgc aatacaactt gattagatct 240 cactcttctg gtaccggtaa gccattgtct ccagtttgtg ctaaggctgc tattttggct 300 agattgaaca ctttgtcttt gggtaactct ggtgttcacc catctgttat caacttgatg 360 tctgaattga tcaacaagga tattacccca ttgatcttcg aacacggtgg tgttggtgcc 420 tctggtgact tggttcaatt gtctcacttg gctttggttt tgattggtga aggtgaagtt 480 ttctacaagg gtgaaagaag gccaactcca gaagttttcg aaattgaagg tttgaagcca 540 attcaagttg aaattagaga aggtttggct ttgattaacg gtacttctgt tatgactggt 600 attggtgttg ttaacgttta ccacgctaag aagttgttgg actggtcttt gaaatcttct 660 tgtgctatta acgaattggt tcaagcttac gacgatcact tctctgctga attgaaccaa 720 actaagagac acaagggtca acaagaaatt gctttgaaga tgagacaaaa cttgtctgac 780 tctactttga tcagaaagag agaagatcac ttgtactctg gtgaaaacac cgaagaaatc 840 ttcaaggaaa aggttcaaga atactactct ttgagatgtg ttccacaaat tttgggtcca 900 gttttggaaa ctattaacaa cgttgcttct attttggaag atgaattcaa ctctgctaac 960 gataacccaa ttatcgatgt taagaaccaa cacgtttacc acggtggtaa cttccacggt 1020 gattacattt ctttggaaat ggataagttg aagattgtta ttaccaagtt gactatgttg 1080 gctgaaagac aattgaacta cttgttgaac tctaagatca acgaattgtt gccaccattc 1140 gttaacttgg gtactttggg tttcaacttc ggtatgcaag gtgttcaatt cactgctact 1200 tctactactg ctgaatctca aatgttgtct aacccaatgt acgttcactc tattccaaac 1260 aacaacgaca accaagatat cgtttctatg ggtactaact ctgctgttat tacctctaag 1320 gttatcgaaa acgctttcga agttttggct atcgaaatga ttactatcgt tcaagctatt 1380 gattacttgg gtcaaaagga caagatttct tctgtttcta agaagtggta cgatgaaatt 1440 agaaacatca ttccaacttt caaggaagat caagttatgt acccattcgt tcaaaaggtt 1500 aaggatcact tgatcaacaa ctaa 1524 <210> 41 <211> 694 <212> PRT <213> Rhodotorula glutinis <400> 41 Met Ser Ala Pro Arg Pro Thr Ser Gln Ser Gln Ala Arg Thr Cys Pro 1 5 10 15 Thr Thr Gln Val Thr Gln Val Asp Ile Val Glu Lys Met Leu Ala Ala 20 25 30 Pro Thr Asp Ser Thr Leu Glu Leu Asp Gly Tyr Ser Leu Asn Leu Gly 35 40 45 Asp Val Val Ser Ala Ala Arg Lys Gly Arg Pro Val Arg Val Lys Asp 50 55 60 Ser Asp Glu Ile Arg Ser Lys Ile Asp Lys Ser Val Glu Phe Leu Arg 65 70 75 80 Ser Gln Leu Ser Met Ser Val Tyr Gly Val Thr Thr Gly Phe Gly Gly 85 90 95 Ser Ala Asp Thr Arg Thr Glu Asp Ala Ile Ser Leu Gln Lys Ala Leu 100 105 110 Leu Glu His Gln Leu Cys Gly Val Leu Pro Ser Ser Phe Asp Ser Phe 115 120 125 Arg Leu Gly Arg Gly Leu Glu Asn Ser Leu Pro Leu Glu Val Val Arg 130 135 140 Gly Ala Met Thr Ile Arg Val Asn Ser Leu Thr Arg Gly His Ser Ala 145 150 155 160 Val Arg Leu Val Val Leu Glu Ala Leu Thr Asn Phe Leu Asn His Gly 165 170 175 Ile Thr Pro Ile Val Pro Leu Arg Gly Thr Ile Ser Ala Ser Gly Asp 180 185 190 Leu Ser Pro Leu Ser Tyr Ile Ala Ala Ala Ile Ser Gly His Pro Asp 195 200 205 Ser Lys Val His Val Val His Glu Gly Lys Glu Lys Ile Leu Tyr Ala 210 215 220 Arg Glu Ala Met Ala Leu Phe Asn Leu Glu Pro Val Val Leu Gly Pro 225 230 235 240 Lys Glu Gly Leu Gly Leu Val Asn Gly Thr Ala Val Ser Ala Ser Met 245 250 255 Ala Thr Leu Ala Leu His Asp Ala His Met Leu Ser Leu Leu Ser Gln 260 265 270 Ser Leu Thr Ala Met Thr Val Glu Ala Met Val Gly His Ala Gly Ser 275 280 285 Phe His Pro Phe Leu His Asp Val Thr Arg Pro His Pro Thr Gln Ile 290 295 300 Glu Val Ala Gly Asn Ile Arg Lys Leu Leu Glu Gly Ser Arg Phe Ala 305 310 315 320 Val His His Glu Glu Glu Val Lys Val Lys Asp Asp Glu Gly Ile Leu 325 330 335 Arg Gln Asp Arg Tyr Pro Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro 340 345 350 Leu Val Ser Asp Leu Ile His Ala His Ala Val Leu Thr Ile Glu Ala 355 360 365 Gly Gln Ser Thr Thr Asp Asn Pro Leu Ile Asp Val Glu Asn Lys Thr 370 375 380 Ser His His Gly Gly Asn Phe Gln Ala Ala Ala Val Ala Asn Thr Met 385 390 395 400 Glu Lys Thr Arg Leu Gly Leu Ala Gln Ile Gly Lys Leu Asn Phe Thr 405 410 415 Gln Leu Thr Glu Met Leu Asn Ala Gly Met Asn Arg Gly Leu Pro Ser 420 425 430 Cys Leu Ala Ala Glu Asp Pro Ser Leu Ser Tyr His Cys Lys Gly Leu 435 440 445 Asp Ile Ala Ala Ala Ala Tyr Thr Ser Glu Leu Gly His Leu Ala Asn 450 455 460 Pro Val Thr Thr His Val Gln Pro Ala Glu Met Ala Asn Gln Ala Val 465 470 475 480 Asn Ser Leu Ala Leu Ile Ser Ala Arg Arg Thr Thr Glu Ser Asn Asp 485 490 495 Val Leu Ser Leu Leu Leu Ala Thr His Leu Tyr Cys Val Leu Gln Ala 500 505 510 Ile Asp Leu Arg Ala Ile Glu Phe Glu Phe Lys Lys Gln Phe Gly Pro 515 520 525 Ala Ile Val Ser Leu Ile Asp Gln His Phe Gly Ser Ala Met Thr Gly 530 535 540 Ser Asn Leu Arg Asp Glu Leu Val Glu Lys Val Asn Lys Thr Leu Ala 545 550 555 560 Lys Arg Leu Glu Gln Thr Asn Ser Tyr Asp Leu Val Pro Arg Trp His 565 570 575 Asp Ala Phe Ser Phe Ala Ala Gly Thr Val Val Glu Val Leu Ser Ser 580 585 590 Thr Ser Leu Ser Leu Ala Ala Val Asn Ala Trp Lys Val Ala Ala Ala 595 600 605 Glu Ser Ala Ile Ser Leu Thr Arg Gln Val Arg Glu Thr Phe Trp Ser 610 615 620 Ala Ala Ser Thr Ser Ser Pro Ala Leu Ser Tyr Leu Ser Pro Arg Thr 625 630 635 640 Gln Ile Leu Tyr Ala Phe Val Arg Glu Glu Leu Gly Val Lys Ala Arg 645 650 655 Arg Gly Asp Val Phe Leu Gly Lys Gln Glu Val Thr Ile Gly Ser Asn 660 665 670 Val Ser Lys Ile Tyr Glu Ala Ile Lys Ser Gly Arg Ile Asn Asn Val 675 680 685 Leu Leu Lys Met Leu Ala 690 <210> 42 <211> 2085 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 41 <400> 42 atgtccgctc caagaccaac ttctcaatct caagccagaa cttgtccaac cacccaagtt 60 acccaagttg atatcgttga aaagatgttg gctgctccaa ctgattctac cttggaattg 120 gacggttact ctttgaactt gggtgatgtt gtttctgctg ctagaaaggg tagaccagtt 180 agagttaagg attctgatga aatcagatct aagatcgaca agtctgttga attcttgaga 240 tctcaattgt ctatgtctgt ttacggtgtt accaccggtt tcggtggttc cgctgacacc 300 agaaccgaag atgctatttc tttgcaaaag gctttgttgg aacaccaatt gtgtggtgtt 360 ttgccatctt ctttcgactc tttcagattg ggtagaggtt tggaaaactc tttgccattg 420 gaagttgtta gaggtgctat gaccattaga gttaactctt tgaccagagg tcactctgct 480 gttagattgg ttgttttgga agctttgacc aacttcttga accacggtat taccccaatt 540 gttccattga gaggtaccat ctccgcttct ggtgatttgt ctccattgtc ttacattgct 600 gctgctattt ctggtcaccc agattctaag gttcacgttg ttcacgaagg taaggaaaag 660 atcttgtacg ctagagaagc tatggctttg ttcaacttgg aaccagttgt tttgggtcca 720 aaggaaggtt tgggtttggt taacggtacc gctgtttccg cttctatggc taccttggct 780 ttgcacgacg ctcacatgtt gtctttgttg tctcaatctt tgaccgctat gaccgttgaa 840 gctatggttg gtcacgctgg ttctttccac ccattcttgc acgatgttac cagaccacac 900 ccaacccaaa tcgaagttgc tggtaacatt agaaagttgt tggaaggttc tagattcgct 960 gttcaccacg aagaagaagt taaggttaag gatgatgaag gtattttgag acaagataga 1020 tacccattga gaacctctcc acaatggttg ggtccattgg tttccgactt gattcacgct 1080 cacgccgttt tgaccatcga agctggtcaa tctaccaccg ataacccatt gatcgatgtt 1140 gaaaacaaga cctctcacca cggtggtaac ttccaagctg ctgctgttgc caacactatg 1200 gaaaagacca gattgggttt ggcccaaatc ggtaagttga acttcaccca attgaccgaa 1260 atgttgaacg ctggtatgaa cagaggtttg ccatcttgtt tggctgctga agatccatcc 1320 ttgtcttacc actgtaaggg tttggacatt gctgctgctg cttacacctc tgaattgggt 1380 cacttggcta acccagttac cacccacgtt caaccagctg aaatggctaa ccaagctgtt 1440 aactctttgg ctttgatttc tgctagaaga accaccgaat ctaacgacgt tttgtccttg 1500 ttgttggcta cccacttgta ctgtgttttg caagctatcg acttgagagc tattgaattc 1560 gaattcaaga agcaattcgg tccagccatt gtttctttga tcgaccaaca cttcggttct 1620 gctatgaccg gttctaactt gagagatgaa ttggttgaaa aggttaacaa gactttggcc 1680 aagagattgg aacaaaccaa ctcttacgat ttggttccaa gatggcacga cgctttctct 1740 ttcgctgctg gtactgttgt tgaagttttg tcctctacct ctttgtcttt ggctgccgtt 1800 aacgcttgga aggttgctgc tgccgaatct gctatctcct tgaccagaca agttagagaa 1860 accttctggt ccgctgcttc tacctcctct ccagctttgt cttacttgtc tccaagaacc 1920 caaatcttgt acgctttcgt tagagaagaa ttgggtgtta aggccagaag aggtgacgtt 1980 ttcttgggta agcaagaagt taccatcggt tctaacgttt ctaagattta cgaagccatc 2040 aagtctggta gaatcaacaa cgttttgttg aagatgttgg cttaa 2085 <210> 43 <211> 562 <212> PRT <213> Arabidopsis thaliana <400> 43 Met Ser Ala Pro Gln Glu Gln Ala Val Ser Gln Val Met Glu Lys Gln 1 5 10 15 Ser Asn Asn Asn Asn Ser Asp Val Ile Phe Arg Ser Lys Leu Pro Asp 20 25 30 Ile Tyr Ile Pro Asn His Leu Ser Leu His Asp Tyr Ile Phe Gln Asn 35 40 45 Ile Ser Glu Phe Ala Thr Lys Pro Cys Leu Ile Asn Gly Pro Thr Gly 50 55 60 His Val Tyr Thr Tyr Ser Asp Val His Val Ile Ser Arg Gln Ile Ala 65 70 75 80 Ala Asn Phe His Lys Leu Gly Val Asn Gln Asn Asp Val Val Met Leu 85 90 95 Leu Leu Pro Asn Cys Pro Glu Phe Val Leu Ser Phe Leu Ala Ala Ser 100 105 110 Phe Arg Gly Ala Thr Ala Thr Ala Ala Asn Pro Phe Phe Thr Pro Ala 115 120 125 Glu Ile Ala Lys Gln Ala Lys Ala Ser Asn Thr Lys Leu Ile Ile Thr 130 135 140 Glu Ala Arg Tyr Val Asp Lys Ile Lys Pro Leu Gln Asn Asp Asp Gly 145 150 155 160 Val Val Ile Val Cys Ile Asp Asp Asn Glu Ser Val Pro Ile Pro Glu 165 170 175 Gly Cys Leu Arg Phe Thr Glu Leu Thr Gln Ser Thr Thr Glu Ala Ser 180 185 190 Glu Val Ile Asp Ser Val Glu Ile Ser Pro Asp Asp Val Val Ala Leu 195 200 205 Pro Tyr Ser Ser Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr 210 215 220 His Lys Gly Leu Val Thr Ser Val Ala Gln Gln Val Asp Gly Glu Asn 225 230 235 240 Pro Asn Leu Tyr Phe His Ser Asp Asp Val Ile Leu Cys Val Leu Pro 245 250 255 Met Phe His Ile Tyr Ala Leu Asn Ser Ile Met Leu Cys Gly Leu Arg 260 265 270 Val Gly Ala Ala Ile Leu Ile Met Pro Lys Phe Glu Ile Asn Leu Leu 275 280 285 Leu Glu Leu Ile Gln Arg Cys Lys Val Thr Val Ala Pro Met Val Pro 290 295 300 Pro Ile Val Leu Ala Ile Ala Lys Ser Ser Glu Thr Glu Lys Tyr Asp 305 310 315 320 Leu Ser Ser Ile Arg Val Val Lys Ser Gly Ala Ala Pro Leu Gly Lys 325 330 335 Glu Leu Glu Asp Ala Val Asn Ala Lys Phe Pro Asn Ala Lys Leu Gly 340 345 350 Gln Gly Tyr Gly Met Thr Glu Ala Gly Pro Val Leu Ala Met Ser Leu 355 360 365 Gly Phe Ala Lys Glu Pro Phe Pro Val Lys Ser Gly Ala Cys Gly Thr 370 375 380 Val Val Arg Asn Ala Glu Met Lys Ile Val Asp Pro Asp Thr Gly Asp 385 390 395 400 Ser Leu Ser Arg Asn Gln Pro Gly Glu Ile Cys Ile Arg Gly His Gln 405 410 415 Ile Met Lys Gly Tyr Leu Asn Asn Pro Ala Ala Thr Ala Glu Thr Ile 420 425 430 Asp Lys Asp Gly Trp Leu His Thr Gly Asp Ile Gly Leu Ile Asp Asp 435 440 445 Asp Asp Glu Leu Phe Ile Val Asp Arg Leu Lys Glu Leu Ile Lys Tyr 450 455 460 Lys Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Ile Gly 465 470 475 480 His Pro Asp Ile Thr Asp Val Ala Val Val Ala Met Lys Glu Glu Ala 485 490 495 Ala Gly Glu Val Pro Val Ala Phe Val Val Lys Ser Lys Asp Ser Glu 500 505 510 Leu Ser Glu Asp Asp Val Lys Gln Phe Val Ser Lys Gln Val Val Phe 515 520 525 Tyr Lys Arg Ile Asn Lys Val Phe Phe Thr Glu Ser Ile Pro Lys Ala 530 535 540 Pro Ser Gly Lys Ile Leu Arg Lys Asp Leu Arg Ala Lys Leu Ala Asn 545 550 555 560 Gly Leu <210> 44 <211> 1689 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 43 <400> 44 atgtccgctc cacaagaaca agctgtttct caagttatgg aaaagcaatc taacaacaac 60 aactctgacg tcattttcag atctaagttg ccagatattt acatcccaaa ccacttgtct 120 ttgcacgact acatcttcca aaacatctcc gaattcgcca ctaagccatg tttgatcaac 180 ggtccaaccg gtcacgttta cacttactcc gacgtccacg tcatctccag acaaatcgcc 240 gccaacttcc acaagttggg tgttaaccaa aacgacgtcg tcatgttgtt gttgccaaac 300 tgtccagaat tcgtcttgtc tttcttggcc gcctccttca gaggtgctac cgccaccgcc 360 gctaacccat tcttcactcc agctgaaatc gctaagcaag ccaaggcctc caacaccaag 420 ttgatcatca ccgaagctag atacgtcgac aagatcaagc cattgcaaaa cgacgacggt 480 gttgtcatcg tctgtatcga cgacaacgaa tccgttccaa tcccagaagg ttgtttgaga 540 ttcaccgaat tgactcaatc tactaccgaa gcttctgaag tcatcgactc tgttgaaatt 600 tctccagacg acgttgttgc tttgccatac tcctctggta ctactggttt gccaaagggt 660 gttatgttga ctcacaaggg tttggtcact tctgttgctc aacaagtcga cggtgaaaac 720 ccaaacttgt acttccactc tgatgacgtc atcttgtgtg ttttgccaat gttccacatc 780 tacgctttga actctatcat gttgtgtggt ttgagagttg gtgctgctat tttgatcatg 840 ccaaagttcg aaatcaactt gttgttggaa ttgatccaaa gatgtaaggt tactgttgct 900 ccaatggttc caccaattgt tttggccatt gctaaatctt ctgaaactga aaagtacgat 960 ttatcttcta tcagagttgt taagtctggt gctgctccat tgggtaagga attggaagat 1020 gccgttaacg ccaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1080 ggtccagttt tggctatgtc tttgggtttc gctaaggaac cattcccagt taagtctggt 1140 gcttgtggta ctgttgttag aaacgctgaa atgaagatcg ttgatccaga caccggtgat 1200 tctttgtcta gaaaccaacc aggtgaaatt tgtattagag gtcaccaaat catgaagggt 1260 tacttgaaca acccagctgc tactgctgaa accattgata aggacggttg gttgcacact 1320 ggtgatattg gtttgatcga tgacgatgac gaattgttca tcgttgatag attgaaggaa 1380 ttgatcaagt acaagggttt ccaagttgct ccagctgaat tggaagcttt gttgatcggt 1440 cacccagaca ttactgatgt tgctgttgtc gctatgaagg aagaagctgc tggtgaagtt 1500 ccagttgctt tcgttgttaa gtctaaggat tctgaattgt ctgaagatga tgttaagcaa 1560 ttcgtttcta agcaagttgt tttctacaag agaatcaaca aggttttctt cactgaatcc 1620 attccaaagg ctccatctgg taagatcttg agaaaggatt tgagagctaa gttggctaac 1680 ggtttgtaa 1689 <210> 45 <211> 545 <212> PRT <213> Petroselinum crispum <400> 45 Met Ser Gly Asp Cys Val Ala Pro Lys Glu Asp Leu Ile Phe Arg Ser 1 5 10 15 Lys Leu Pro Asp Ile Tyr Ile Pro Lys His Leu Pro Leu His Thr Tyr 20 25 30 Cys Phe Glu Asn Ile Ser Lys Val Gly Asp Lys Ser Cys Leu Ile Asn 35 40 45 Gly Ala Thr Gly Glu Thr Phe Thr Tyr Ser Gln Val Glu Leu Leu Ser 50 55 60 Arg Lys Val Ala Ser Gly Leu Asn Lys Leu Gly Ile Gln Gln Gly Asp 65 70 75 80 Thr Ile Met Leu Leu Leu Pro Asn Ser Pro Glu Tyr Phe Phe Ala Phe 85 90 95 Leu Gly Ala Ser Tyr Arg Gly Ala Ile Ser Thr Met Ala Asn Pro Phe 100 105 110 Phe Thr Ser Ala Glu Val Ile Lys Gln Leu Lys Ala Ser Gln Ala Lys 115 120 125 Leu Ile Ile Thr Gln Ala Cys Tyr Val Asp Lys Val Lys Asp Tyr Ala 130 135 140 Ala Glu Lys Asn Ile Gln Ile Ile Cys Ile Asp Asp Ala Pro Gln Asp 145 150 155 160 Cys Leu His Phe Ser Lys Leu Met Glu Ala Asp Glu Ser Glu Met Pro 165 170 175 Glu Val Val Ile Asn Ser Asp Asp Val Val Ala Leu Pro Tyr Ser Ser 180 185 190 Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr His Lys Gly Leu 195 200 205 Val Thr Ser Val Ala Gln Gln Val Asp Gly Asp Asn Pro Asn Leu Tyr 210 215 220 Met His Ser Glu Asp Val Met Ile Cys Ile Leu Pro Leu Phe His Ile 225 230 235 240 Tyr Ser Leu Asn Ala Val Leu Cys Cys Gly Leu Arg Ala Gly Val Thr 245 250 255 Ile Leu Ile Met Gln Lys Phe Asp Ile Val Pro Phe Leu Glu Leu Ile 260 265 270 Gln Lys Tyr Lys Val Thr Ile Gly Pro Phe Val Pro Pro Ile Val Leu 275 280 285 Ala Ile Ala Lys Ser Pro Val Val Asp Lys Tyr Asp Leu Ser Ser Val 290 295 300 Arg Thr Val Met Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp 305 310 315 320 Ala Val Arg Ala Lys Phe Pro Asn Ala Lys Leu Gly Gln Gly Tyr Gly 325 330 335 Met Thr Glu Ala Gly Pro Val Leu Ala Met Cys Leu Ala Phe Ala Lys 340 345 350 Glu Pro Tyr Glu Ile Lys Ser Gly Ala Cys Gly Thr Val Val Arg Asn 355 360 365 Ala Glu Met Lys Ile Val Asp Pro Glu Thr Asn Ala Ser Leu Pro Arg 370 375 380 Asn Gln Arg Gly Glu Ile Cys Ile Arg Gly Asp Gln Ile Met Lys Gly 385 390 395 400 Tyr Leu Asn Asp Pro Glu Ser Thr Arg Thr Thr Ile Asp Glu Glu Gly 405 410 415 Trp Leu His Thr Gly Asp Ile Gly Phe Ile Asp Asp Asp Asp Glu Leu 420 425 430 Phe Ile Val Asp Arg Leu Lys Glu Ile Ile Lys Tyr Lys Gly Phe Gln 435 440 445 Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His Pro Thr Ile 450 455 460 Ser Asp Ala Ala Val Val Pro Met Ile Asp Glu Lys Ala Gly Glu Val 465 470 475 480 Pro Val Ala Phe Val Val Arg Thr Asn Gly Phe Thr Thr Thr Glu Glu 485 490 495 Glu Ile Lys Gln Phe Val Ser Lys Gln Val Val Phe Tyr Lys Arg Ile 500 505 510 Phe Arg Val Phe Phe Val Asp Ala Ile Pro Lys Ser Pro Ser Gly Lys 515 520 525 Ile Leu Arg Lys Asp Leu Arg Ala Arg Ile Ala Ser Gly Asp Leu Pro 530 535 540 Lys 545 <210> 46 <211> 1638 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 45 <400> 46 atgtccggtg attgtgttgc tccaaaggaa gatttgattt tcagatctaa gttgccagat 60 atttacatcc caaagcactt gccattgcac acttactgtt tcgaaaacat ctctaaggtt 120 ggtgacaagt cctgtttgat caacggtgct actggtgaaa ctttcactta ctctcaagtt 180 gaattgttgt ccagaaaggt tgcttctggt ttgaacaagt tgggtattca acaaggtgat 240 accatcatgt tgttgttgcc aaactcccca gaatacttct tcgctttctt gggtgcttct 300 tacagaggtg ctatttctac tatggccaac ccattcttca cttctgctga agttatcaag 360 caattgaagg cttcccaagc taagttgatc attactcaag cttgttacgt tgacaaggtt 420 aaggactacg ctgctgaaaa gaacatccaa atcatttgta tcgatgatgc tccacaagat 480 tgtttgcact tctccaagtt gatggaagct gatgaatctg aaatgccaga agttgttatc 540 aactctgacg atgtcgtcgc tttgccatac tcttctggta ctactggttt gccaaagggt 600 gttatgttga ctcacaaggg tttggttact tctgttgctc aacaagttga tggtgacaac 660 ccaaacttgt acatgcactc tgaagatgtt atgatctgta tcttgccatt gttccacatt 720 tactctttga acgctgtttt gtgttgtggt ttgagagctg gtgttactat cttgattatg 780 caaaagttcg atattgttcc attcttggaa ttgatccaaa agtacaaggt tactattggt 840 ccattcgttc caccaattgt tttggctatt gctaagtctc cagttgttga taagtacgac 900 ttatcttctg ttagaactgt tatgtctggt gctgctccat tgggtaagga attggaagat 960 gctgttagag ctaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1020 ggtccagttt tggctatgtg tttggctttc gctaaggaac catacgaaat caagtctggt 1080 gcctgtggta ctgttgttag aaacgctgaa atgaagattg ttgatccaga aaccaacgcc 1140 tctttgccaa gaaaccaaag aggtgaaatt tgtattagag gtgaccaaat tatgaagggt 1200 tacttgaacg atccagaatc tactagaact actatcgacg aagaaggttg gttgcacact 1260 ggtgatatcg gtttcattga cgacgatgat gaattgttca ttgttgatag attgaaggaa 1320 atcatcaagt acaagggttt ccaagttgcc ccagctgaat tggaagcttt gttgttgact 1380 cacccaacca tttccgatgc tgctgttgtt ccaatgatcg atgaaaaggc tggtgaagtt 1440 ccagttgctt tcgttgttag aactaacggt ttcaccacca ctgaagaaga aatcaagcaa 1500 ttcgtttcta agcaagttgt tttctacaag agaatcttca gagttttctt cgttgatgct 1560 attccaaagt ctccatctgg taagattttg agaaaggact tgagagctag aatcgcttcc 1620 ggtgatttgc caaagtaa 1638 <210> 47 <211> 545 <212> PRT <213> Petroselinum crispum <400> 47 Met Ser Gly Asp Cys Val Ala Pro Lys Glu Asp Leu Ile Phe Arg Ser 1 5 10 15 Lys Leu Pro Asp Ile Tyr Ile Pro Lys His Leu Pro Leu His Thr Tyr 20 25 30 Cys Phe Glu Asn Ile Ser Lys Val Gly Asp Lys Ser Cys Leu Ile Asn 35 40 45 Gly Ala Thr Gly Glu Thr Phe Thr Tyr Ser Gln Val Glu Leu Leu Ser 50 55 60 Arg Lys Val Ala Ser Gly Leu Asn Lys Leu Gly Ile Gln Gln Gly Asp 65 70 75 80 Thr Ile Met Leu Leu Leu Pro Asn Ser Pro Glu Tyr Phe Phe Ala Phe 85 90 95 Leu Gly Ala Ser Tyr Arg Gly Ala Ile Ser Thr Met Ala Asn Pro Phe 100 105 110 Phe Thr Ser Ala Glu Val Ile Lys Gln Leu Lys Ala Ser Leu Ala Lys 115 120 125 Leu Ile Ile Thr Gln Ala Cys Tyr Val Asp Lys Val Lys Asp Tyr Ala 130 135 140 Ala Glu Lys Asn Ile Gln Ile Ile Cys Ile Asp Asp Ala Pro Gln Asp 145 150 155 160 Cys Leu His Phe Ser Lys Leu Met Glu Ala Asp Glu Ser Glu Met Pro 165 170 175 Glu Val Val Ile Asp Ser Asp Asp Val Val Ala Leu Pro Tyr Ser Ser 180 185 190 Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr His Lys Gly Leu 195 200 205 Val Thr Ser Val Ala Gln Gln Val Asp Gly Asp Asn Pro Asn Leu Tyr 210 215 220 Met His Ser Glu Asp Val Met Ile Cys Ile Leu Pro Leu Phe His Ile 225 230 235 240 Tyr Ser Leu Asn Ala Val Leu Cys Cys Gly Leu Arg Ala Gly Val Thr 245 250 255 Ile Leu Ile Met Gln Lys Phe Asp Ile Val Pro Phe Leu Glu Leu Ile 260 265 270 Gln Lys Tyr Lys Val Thr Ile Gly Pro Phe Val Pro Pro Ile Val Leu 275 280 285 Ala Ile Ala Lys Ser Pro Val Val Asp Lys Tyr Asp Leu Ser Ser Val 290 295 300 Arg Thr Val Met Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp 305 310 315 320 Ala Val Arg Ala Lys Phe Pro Asn Ala Lys Leu Gly Gln Gly Tyr Gly 325 330 335 Met Thr Glu Ala Gly Pro Val Leu Ala Met Cys Leu Ala Phe Ala Lys 340 345 350 Glu Pro Tyr Glu Ile Lys Ser Gly Ala Cys Gly Thr Val Val Arg Asn 355 360 365 Ala Glu Met Lys Ile Val Asp Pro Glu Thr Asn Ala Ser Leu Pro Arg 370 375 380 Asn Gln Arg Gly Glu Ile Cys Ile Arg Gly Asp Gln Ile Met Lys Gly 385 390 395 400 Tyr Leu Asn Asp Pro Glu Ser Thr Arg Thr Thr Ile Asp Glu Glu Gly 405 410 415 Trp Leu His Thr Gly Asp Ile Gly Phe Ile Asp Asp Asp Asp Glu Leu 420 425 430 Phe Ile Val Asp Arg Leu Lys Glu Ile Ile Lys Tyr Lys Gly Phe Gln 435 440 445 Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His Pro Thr Ile 450 455 460 Ser Asp Ala Ala Val Val Pro Met Ile Asp Glu Lys Ala Gly Glu Val 465 470 475 480 Pro Val Ala Phe Val Val Arg Thr Asn Gly Phe Thr Thr Thr Glu Glu 485 490 495 Glu Ile Lys Gln Phe Val Ser Lys Gln Val Val Phe Tyr Lys Arg Ile 500 505 510 Phe Arg Val Phe Phe Val Asp Ala Ile Pro Lys Ser Pro Ser Gly Lys 515 520 525 Ile Leu Arg Lys Asp Leu Arg Ala Lys Ile Ala Ser Gly Asp Leu Pro 530 535 540 Lys 545 <210> 48 <211> 1638 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 47 <400> 48 atgtccggtg actgtgttgc tccaaaggaa gatttgattt tcagatctaa gttgccagat 60 atttacatcc caaagcactt gccattgcac acttactgtt tcgaaaacat ctctaaggtt 120 ggtgacaagt cctgtttgat caacggtgct actggtgaaa ctttcactta ctctcaagtt 180 gaattgttgt ccagaaaggt tgcttctggt ttgaacaagt tgggtattca acaaggtgat 240 accatcatgt tgttgttgcc aaactcccca gaatacttct tcgctttctt gggtgcttct 300 tacagaggtg ctatttctac tatggccaac ccattcttca cttctgctga agttatcaag 360 caattgaagg cttccttggc taagttgatc attactcaag cttgttacgt tgacaaggtt 420 aaggactacg ctgctgaaaa gaacatccaa atcatttgta tcgatgatgc tccacaagat 480 tgtttgcact tctccaagtt gatggaagct gatgaatctg aaatgccaga agttgttatc 540 gattctgacg atgtcgtcgc tttgccatac tcttctggta ctactggttt gccaaagggt 600 gttatgttga cccacaaggg tttggttact tctgttgctc aacaagttga tggtgacaac 660 ccaaacttgt acatgcactc tgaagatgtt atgatctgta tcttgccatt gttccacatt 720 tactctttga acgctgtttt gtgttgtggt ttgagagctg gtgttactat cttgattatg 780 caaaagttcg atattgttcc attcttggaa ttgatccaaa agtacaaggt tactattggt 840 ccattcgttc caccaattgt tttggctatt gctaagtctc cagttgttga taagtacgac 900 ttatcttctg ttagaactgt tatgtctggt gctgctccat tgggtaagga attggaagat 960 gctgttagag ctaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1020 ggtccagttt tggctatgtg tttggctttc gctaaggaac catacgaaat caagtctggt 1080 gcctgtggta ctgttgttag aaacgctgaa atgaagattg ttgatccaga aaccaacgcc 1140 tctttgccaa gaaaccaaag aggtgaaatt tgtattagag gtgaccaaat tatgaagggt 1200 tacttgaacg atccagaatc tactagaact actatcgacg aagaaggttg gttgcacact 1260 ggtgatatcg gtttcattga cgacgatgat gaattgttca ttgttgatag attgaaggaa 1320 atcatcaagt acaagggttt ccaagttgcc ccagctgaat tggaagcttt gttgttgact 1380 cacccaacca tttccgatgc tgctgttgtt ccaatgatcg atgaaaaggc tggtgaagtt 1440 ccagttgctt tcgttgttag aactaacggt ttcaccacca ctgaagaaga aatcaagcaa 1500 ttcgtttcta agcaagttgt tttctacaag agaatcttca gagttttctt cgttgatgct 1560 attccaaagt ctccatctgg taagattttg agaaaggact tgagagctaa gatcgcttcc 1620 ggtgatttgc caaagtaa 1638 <210> 49 <211> 579 <212> PRT <213> Streptomyces clavuligerus <400> 49 Met Ser Ala Ser Thr Pro Ser Pro Gly Pro Ser Gly Thr Pro Ser Gly 1 5 10 15 Thr Pro Pro Ser Gly Pro Ser Gly Thr Pro Ser Pro Gly Pro Ala Gly 20 25 30 Ala Gly Thr Ala Pro Val Phe Arg Ser Arg Tyr Pro Asp Ile Glu Pro 35 40 45 Val Ser Glu Pro Leu His Glu Ala Val Leu Gly Arg Ala Ala Gly Tyr 50 55 60 Gly Ser Glu Pro Ala Leu Val Asp Gly Leu Thr Gly Ala Val Val Ser 65 70 75 80 Tyr Ala Arg Leu Asp Arg Asp His Arg Arg Ile Ala Ala Ala Leu Ala 85 90 95 Ala Ala Gly Val Arg Lys Gly Asp Val Val Ala Leu His Ser Pro Asn 100 105 110 Ser Thr Gly Tyr Pro Ala Val Leu Tyr Gly Ala Leu Arg Ala Gly Ala 115 120 125 Thr Val Thr Thr Ala His Pro Leu Ala Thr Ala Glu Glu Leu Ala Arg 130 135 140 Gln Leu Arg Asp Ser Ala Ala Arg Trp Ile Val Thr Ala Ala Pro Cys 145 150 155 160 Leu Glu Thr Ala Arg Arg Ala Ala Glu Leu Thr Pro Gly Ile Gly Glu 165 170 175 Ile Phe Val Phe Asp Arg Ala Glu Gly His Thr Gly Val Ala Ala Met 180 185 190 Leu Asp Ser Thr Ala Pro Glu Pro Ala Val Pro Val Asp Pro Asp Gln 195 200 205 Asp Val Ala Leu Leu Pro Tyr Ser Ser Gly Thr Thr Gly Thr Pro Lys 210 215 220 Gly Val Met Leu Thr His Arg Ser Leu Val Thr Asn Leu Val Gln Ala 225 230 235 240 His Arg Leu Ile Pro Leu Arg Pro Gly Asp Arg Val Leu Ala Val Leu 245 250 255 Pro Phe Phe His Ile Tyr Gly Leu Val Gly Leu Met Ser Ala Pro Leu 260 265 270 Arg Asn Gly Ala Thr Val Val Val Leu Pro Arg Phe Asp Leu Glu Gly 275 280 285 Phe Leu Ala Ala Val Glu Lys His Arg Val Thr Thr Leu Tyr Val Ala 290 295 300 Pro Pro Ile Val Leu Ala Leu Ala Lys His Pro Ala Val Ala Arg Tyr 305 310 315 320 Asp Leu Ser Ser Val Arg His Val Phe Ser Ala Ala Ala Pro Leu Asp 325 330 335 Ala Glu Ile Ala Ala Ala Cys Ala Ala Arg Val Gly Val Pro Leu Val 340 345 350 Arg Gln Ala Tyr Gly Met Thr Glu Leu Ser Pro Gly Cys Tyr Ala Val 355 360 365 Pro Leu Asp Glu Pro Ala Pro Pro Pro Gly Thr Val Gly Leu Leu Phe 370 375 380 Pro Ser Thr Glu Met Arg Leu Leu Arg Leu Asp Asp Pro Gly Arg Cys 385 390 395 400 Val Gly Pro Gly Glu Asp Gly Glu Ile Ala Ile Arg Gly Pro Gln Val 405 410 415 Met Lys Gly Tyr Leu Gly Arg Pro Glu Ala Thr Ala Glu Met Ile Asp 420 425 430 Ala Asp Gly Trp Leu Arg Thr Gly Asp Val Gly Arg Val Asp Ala Asp 435 440 445 Gly Trp Leu His Val Val Asp Arg Val Lys Glu Leu Ile Lys Tyr Lys 450 455 460 Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His 465 470 475 480 Gly Gly Ile Ala Asp Ala Ala Val Ile Gly Val Tyr Asp Glu Asp Glu 485 490 495 Gly Thr Glu Ile Pro His Ala Phe Val Val Arg Arg Pro Gly Gly Ala 500 505 510 Gly Asp Ser Leu Thr Ala Ala Asp Val Ala Ala His Val Ala Ala Arg 515 520 525 Val Ser Pro Tyr Lys Lys Val Arg Arg Val Ser Phe Val Ser Gly Val 530 535 540 Pro Arg Ala Ala Ser Gly Lys Ile Leu Arg Arg Glu Leu Arg Ala Ala 545 550 555 560 Arg Arg Ser Pro Arg Gly Thr Asp Pro Gly Asp Glu Asp Arg Glu Gly 565 570 575 Ala Thr Pro <210> 50 <211> 1740 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 49 <400> 50 atgtccgctt ctactccatc tccaggtcca tctggtaccc catccggtac tccaccatcc 60 ggtccatctg gtactccatc cccaggtcca gctggtgccg gtaccgctcc agtattcaga 120 tctagatacc cagacatcga accagtttct gaaccattgc acgaagctgt tttgggtaga 180 gccgccggtt acggttccga accagccttg gtcgacggtt tgaccggtgc cgtcgtatct 240 tacgctagat tggacagaga tcacagaaga atcgccgccg ccttggccgc cgctggtgtc 300 agaaagggtg acgtcgtcgc cttgcactct ccaaactcta ccggttaccc agccgtcttg 360 tacggtgcct tgagagccgg tgccaccgtt accactgctc acccattggc tactgctgaa 420 gaattggcca gacaattgag agactctgcc gccagatgga tcgttaccgc cgccccatgt 480 ttggaaaccg ccagaagagc cgccgaattg accccaggta tcggtgaaat cttcgtattc 540 gacagagccg aaggtcacac cggtgttgcc gctatgttgg actccaccgc tccagaacca 600 gccgtcccag tcgacccaga ccaagacgtc gctttgttgc catactcctc tggtaccacc 660 ggtaccccaa agggtgttat gttgactcac agatccttgg tcaccaactt ggtccaagcc 720 cacagattga tcccattgag gccaggtgac agagtcttgg ccgttttgcc attcttccac 780 atctacggtt tggtcggttt gatgtctgcc ccattgagaa acggtgctac cgtcgtcgtc 840 ttgccaagat tcgacttgga aggtttcttg gctgccgtcg aaaagcacag agtcaccact 900 ttgtacgttg ccccaccaat cgttttggct ttggccaagc acccagctgt tgccagatac 960 gacttgtcct ctgtcagaca cgtattctct gccgccgccc cattggacgc tgaaatcgct 1020 gctgcctgtg ccgccagagt cggtgttcca ttggtcagac aagcttacgg tatgaccgaa 1080 ttgtctccag gttgttacgc cgtcccattg gacgaaccag ccccaccacc aggtactgtc 1140 ggtttgttgt tcccatccac cgaaatgaga ttgttgagat tggacgaccc aggtagatgt 1200 gtcggtccag gtgaggacgg tgaaatcgcc atcagaggtc cacaagtcat gaagggttac 1260 ttgggtagac cagaagccac cgccgaaatg atcgacgctg atggttggtt gagaaccggt 1320 gacgtcggta gagtcgacgc tgacggttgg ttgcacgtcg ttgacagagt taaggaattg 1380 atcaagtaca agggtttcca agtcgctcca gccgaattgg aagctttgtt gttgacccac 1440 ggtggtatcg ctgacgccgc cgttatcggt gtttacgacg aggacgaagg tactgaaatc 1500 ccacacgctt tcgttgtcag aaggccaggt ggtgctggtg actccttgac cgccgccgac 1560 gtcgccgccc acgtcgccgc tagagtctcc ccatacaaga aggtcagaag agtctctttc 1620 gtatccggtg ttccaagagc cgcttctggt aagatcttga gaagagaatt gagagccgct 1680 agaagatccc caagaggtac tgacccaggt gacgaggaca gagaaggtgc cactccataa 1740 <210> 51 <211> 400 <212> PRT <213> Hordeum vulgare <400> 51 Met Ser Ala Ala Val Arg Leu Lys Glu Val Arg Met Ala Gln Arg Ala 1 5 10 15 Glu Gly Leu Ala Thr Val Leu Ala Ile Gly Thr Ala Val Pro Ala Asn 20 25 30 Cys Val Tyr Gln Ala Thr Tyr Pro Asp Tyr Tyr Phe Arg Val Thr Lys 35 40 45 Ser Glu His Leu Ala Asp Leu Lys Glu Lys Phe Gln Arg Met Cys Asp 50 55 60 Lys Ser Met Ile Arg Lys Arg His Met His Leu Thr Glu Glu Ile Leu 65 70 75 80 Ile Lys Asn Pro Lys Ile Cys Ala His Met Glu Thr Ser Leu Asp Ala 85 90 95 Arg His Ala Ile Ala Leu Val Glu Val Pro Lys Leu Gly Gln Gly Ala 100 105 110 Ala Glu Lys Ala Ile Lys Glu Trp Gly Gln Pro Leu Ser Lys Ile Thr 115 120 125 His Leu Val Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp 130 135 140 Tyr Gln Leu Thr Lys Leu Leu Gly Leu Ser Pro Thr Val Lys Arg Leu 145 150 155 160 Met Met Tyr Gln Gln Gly Cys Phe Gly Gly Ala Thr Val Leu Arg Leu 165 170 175 Ala Lys Asp Ile Ala Glu Asn Asn Arg Gly Ala Arg Val Leu Val Val 180 185 190 Cys Ser Glu Ile Thr Ala Met Ala Phe Arg Gly Pro Cys Lys Ser His 195 200 205 Leu Asp Ser Leu Val Gly His Ala Leu Phe Gly Asp Gly Ala Ala Ala 210 215 220 Ala Ile Ile Gly Ala Asp Pro Asp Gln Leu Asp Glu Gln Pro Val Phe 225 230 235 240 Gln Leu Val Ser Ala Ser Gln Thr Ile Leu Pro Glu Ser Glu Gly Ala 245 250 255 Ile Asp Gly His Leu Thr Glu Ala Gly Leu Thr Ile His Leu Leu Lys 260 265 270 Asp Val Pro Gly Leu Ile Ser Glu Asn Ile Glu Gln Ala Leu Glu Asp 275 280 285 Ala Phe Glu Pro Leu Gly Ile His Asn Trp Asn Ser Ile Phe Trp Ile 290 295 300 Ala His Pro Gly Gly Pro Ala Ile Leu Asp Arg Val Glu Asp Arg Val 305 310 315 320 Gly Leu Asp Lys Lys Arg Met Arg Ala Ser Arg Glu Val Leu Ser Glu 325 330 335 Tyr Gly Asn Met Ser Ser Ala Ser Val Leu Phe Val Leu Asp Val Met 340 345 350 Arg Lys Ser Ser Ala Lys Asp Gly Leu Ala Thr Thr Gly Glu Gly Lys 355 360 365 Asp Trp Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr 370 375 380 Leu Val Leu His Ser Val Pro Val Pro Val Pro Thr Ala Ala Ser Ala 385 390 395 400 <210> 52 <211> 1203 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 51 <400> 52 atgtccgctg ctgttagatt gaaggaagtt agaatggctc aaagagctga aggtttggct 60 actgttttgg ccattggtac cgccgttcca gccaactgtg tttaccaagc tacctaccca 120 gactactact tcagagtcac taagtctgaa cacttggctg acttgaagga aaagttccaa 180 agaatgtgtg acaagtccat gatcagaaag agacacatgc acttgaccga agaaatcttg 240 attaagaacc caaagatctg tgctcacatg gaaacctctt tggacgctag acacgccatt 300 gctttggtcg aagtcccaaa gttgggtcaa ggtgctgctg aaaaggctat caaggaatgg 360 ggtcaaccat tgtccaagat cacccacttg gttttctgta ctacctctgg tgtcgacatg 420 ccaggtgccg actaccaatt gaccaagttg ttgggtttgt ccccaactgt taagagattg 480 atgatgtacc aacaaggttg tttcggtggt gccactgttt tgagattggc caaggacatc 540 gctgaaaaca acagaggtgc tagagttttg gttgtctgtt ctgaaatcac cgccatggcc 600 ttcagaggtc catgtaagtc ccacttggac tctttggtcg gtcacgcttt gttcggtgat 660 ggtgctgctg ctgccatcat cggtgctgac ccagaccaat tggacgaaca accagttttc 720 caattggttt ctgcttctca aaccatcttg ccagaatctg aaggtgccat cgacggtcac 780 ttgactgaag ctggtttgac catccacttg ttgaaggacg ttccaggttt gatctctgaa 840 aacatcgaac aagctttgga agatgctttc gaaccattgg gtatccacaa ctggaactcc 900 atcttctgga ttgctcaccc aggtggtcca gccatcttgg acagagtcga agatagagtt 960 ggtttggaca agaagagaat gagagcttct agagaagttt tgtctgaata cggtaacatg 1020 tcctctgctt ctgttttgtt cgtcttggac gttatgagaa agtcatccgc caaggatggt 1080 ttggccacta ctggtgaagg taaggactgg ggtgtcttgt tcggtttcgg tccaggtttg 1140 accgtcgaaa ctttggtctt gcactctgtc ccagtcccag tcccaaccgc cgcttctgct 1200 taa 1203 <210> 53 <211> 392 <212> PRT <213> Citrus sinensis <400> 53 Met Ser Ala Thr Val Gln Glu Ile Arg Asn Ala Gln Arg Ala Asp Gly 1 5 10 15 Pro Ala Thr Val Leu Ala Ile Gly Thr Ala Thr Pro Ala His Ser Val 20 25 30 Asn Gln Ala Asp Tyr Pro Asp Tyr Tyr Phe Arg Ile Thr Lys Ser Glu 35 40 45 His Met Thr Glu Leu Lys Glu Lys Phe Lys Arg Met Cys Asp Lys Ser 50 55 60 Met Ile Lys Lys Arg Tyr Met Tyr Leu Thr Glu Glu Ile Leu Lys Glu 65 70 75 80 Asn Pro Asn Met Cys Ala Tyr Met Ala Pro Ser Leu Asp Ala Arg Gln 85 90 95 Asp Ile Val Val Val Glu Val Pro Lys Leu Gly Lys Glu Ala Ala Thr 100 105 110 Lys Ala Ile Lys Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu 115 120 125 Ile Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp Tyr Gln 130 135 140 Leu Thr Lys Leu Ile Gly Leu Arg Pro Ser Val Lys Arg Phe Met Met 145 150 155 160 Tyr Gln Gln Gly Cys Phe Ala Gly Gly Thr Val Leu Arg Leu Ala Lys 165 170 175 Asp Leu Ala Glu Asn Asn Lys Gly Ala Arg Val Leu Val Val Cys Ser 180 185 190 Glu Ile Thr Ala Val Thr Phe Arg Gly Pro Ala Asp Thr His Leu Asp 195 200 205 Ser Leu Val Gly Gln Ala Leu Phe Gly Asp Gly Ala Ala Ala Val Ile 210 215 220 Val Gly Ala Asp Pro Asp Thr Ser Val Glu Arg Pro Leu Tyr Gln Leu 225 230 235 240 Val Ser Thr Ser Gln Thr Ile Leu Pro Asp Ser Asp Gly Ala Ile Asp 245 250 255 Gly His Leu Arg Glu Val Gly Leu Thr Phe His Leu Leu Lys Asp Val 260 265 270 Pro Gly Leu Ile Ser Lys Asn Ile Glu Lys Ser Leu Ser Glu Ala Phe 275 280 285 Ala Pro Leu Gly Ile Ser Asp Trp Asn Ser Ile Phe Trp Ile Ala His 290 295 300 Pro Gly Gly Pro Ala Ile Leu Asp Gln Val Glu Ser Lys Leu Gly Leu 305 310 315 320 Lys Gly Glu Lys Leu Lys Ala Thr Arg Gln Val Leu Ser Glu Tyr Gly 325 330 335 Asn Met Ser Ser Ala Cys Val Leu Phe Ile Leu Asp Glu Met Arg Lys 340 345 350 Lys Ser Val Glu Glu Ala Lys Ala Thr Thr Gly Glu Gly Leu Asp Trp 355 360 365 Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr Val Val 370 375 380 Leu His Ser Val Pro Ile Lys Ala 385 390 <210> 54 <211> 1179 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 53 <400> 54 atgtccgcta ccgttcaaga aatcagaaac gctcaaagag ccgacggtcc agccaccgtc 60 ttggccatcg gtactgccac tccagcccac tctgtcaacc aagctgatta cccagactac 120 tacttcagaa tcactaagtc tgaacacatg actgaattga aggaaaagtt caagagaatg 180 tgtgacaagt ctatgattaa gaagagatac atgtacttga ctgaagaaat tttgaaggaa 240 aacccaaaca tgtgtgctta catggctcca tctttggacg ctagacaaga cattgttgtt 300 gtcgaagttc caaagttggg taaggaagct gctactaagg ccatcaagga atggggtcaa 360 ccaaagtcta agatcaccca cttgatcttc tgtaccacct ccggtgtcga catgccaggt 420 gccgactacc aattgaccaa gttgatcggt ttaagaccat ccgtcaagag attcatgatg 480 taccaacaag gttgtttcgc cggtggtact gttttgagat tggctaagga cttggctgaa 540 aacaacaagg gtgctagagt tttggttgtc tgttctgaaa tcactgctgt cactttcaga 600 ggtccagccg atactcactt ggattctttg gttggtcaag ctttgttcgg tgatggtgct 660 gctgctgtta tcgttggtgc cgatccagac acttctgtcg aaagaccatt gtaccaattg 720 gtttctactt ctcaaactat cttgccagac tctgacggtg ctattgacgg tcacttgaga 780 gaagtcggtt tgactttcca cttgttgaag gacgtcccag gtttgatctc taagaacatc 840 gaaaagtctt tgtctgaagc tttcgcccca ttgggtatct ctgactggaa ctctatcttc 900 tggatcgctc acccaggtgg tccagctatt ttggaccaag ttgaatctaa gttgggtttg 960 aagggtgaaa agttgaaggc cactagacaa gttttgtctg aatacggtaa catgtcatct 1020 gcttgtgtct tgttcatctt ggacgaaatg agaaagaagt ctgttgaaga agctaaggcc 1080 accaccggtg aaggtttgga ttggggtgtt ttgttcggtt tcggtccagg tttgaccgtc 1140 gaaaccgttg ttttgcactc tgtcccaatc aaggcttaa 1179 <210> 55 <211> 391 <212> PRT <213> Citrus sinensis <400> 55 Met Ser Leu Thr Val Asp Glu Val Arg Lys Ala Gln Arg Ala Glu Gly 1 5 10 15 Pro Ala Thr Ile Met Ala Ile Gly Thr Ala Thr Pro Pro Asn Cys Val 20 25 30 Asp Gln Ser Thr Tyr Pro Asp Tyr Tyr Phe Arg Ile Thr Asn Ser Glu 35 40 45 His Met Thr Asp Leu Lys Glu Lys Phe Lys Arg Met Cys Asp Lys Ser 50 55 60 Met Ile Lys Lys Arg Tyr Met Tyr Leu Thr Glu Glu Ile Leu Lys Glu 65 70 75 80 Asn Pro Asn Val Cys Ala Tyr Met Ala Pro Ser Leu Asp Thr Arg Gln 85 90 95 Asp Met Val Val Val Glu Val Pro Arg Leu Gly Lys Glu Ala Ala Thr 100 105 110 Lys Ala Ile Lys Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu 115 120 125 Val Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp Tyr Arg 130 135 140 Leu Thr Lys Leu Leu Gly Leu Arg Pro Ser Val Lys Arg Leu Met Met 145 150 155 160 Tyr Gln Gln Gly Cys Phe Ala Gly Gly Thr Val Leu Arg Leu Ala Lys 165 170 175 Asp Leu Ala Glu Asn Asn Lys Gly Ala Arg Val Leu Val Val Cys Ser 180 185 190 Glu Ile Thr Ala Val Thr Phe Arg Gly Pro Ser Asp Thr His Leu Asp 195 200 205 Ser Leu Val Gly Gln Ala Leu Phe Gly Asp Gly Ala Ala Ala Ile Ile 210 215 220 Ile Gly Ala Asp Pro Ile Pro Glu Ile Glu Lys Pro Met Phe Glu Leu 225 230 235 240 Val Ser Thr Ala Gln Thr Ile Leu Pro Asp Ser Asp Gly Ser Ile Asp 245 250 255 Gly His Leu Arg Glu Val Gly Leu Thr Phe His Leu Leu Lys Asp Val 260 265 270 Pro Gly Leu Ile Ser Lys Asn Ile Gln Lys Ser Leu Thr Glu Ala Phe 275 280 285 Lys Pro Leu Gly Ile Ser Asp Trp Asn Ser Ile Phe Trp Ile Ala His 290 295 300 Pro Gly Gly Pro Thr Ile Leu Asp Gln Val Glu Glu Lys Leu Gly Leu 305 310 315 320 Lys Pro Glu Lys Leu Arg Ala Thr Arg His Val Leu Ser Glu Tyr Gly 325 330 335 Asn Met Ser Ser Ala Cys Val Leu Phe Ile Leu Asp Glu Met Arg Lys 340 345 350 Lys Ser Ala Glu Asp Gly Leu Glu Thr Ala Gly Glu Gly Leu Glu Trp 355 360 365 Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr Val Val 370 375 380 Leu His Ser Val Ala Ala Ala 385 390 <210> 56 <211> 1176 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 55 <400> 56 atgtccttga ccgtcgatga agttagaaag gctcaaagag ccgaaggtcc agccactatc 60 atggccattg gtactgctac cccaccaaac tgtgttgatc aatctactta cccagattac 120 tacttcagaa tcactaactc tgaacacatg actgatttga aggaaaagtt caagagaatg 180 tgtgacaagt ccatgatcaa gaagagatac atgtacttga ctgaagaaat cttgaaggaa 240 aacccaaacg tttgtgctta catggctcca tctttggata ctagacaaga tatggttgtt 300 gttgaagttc caagattggg taaggaagct gccaccaagg ccattaagga atggggtcaa 360 ccaaagtcca agatcaccca cttggtattc tgtaccactt ctggtgttga catgccaggt 420 gccgattaca gattgactaa gttgttgggt ttaagaccat ccgtcaagag attgatgatg 480 taccaacaag gttgtttcgc cggtggtact gttttgagat tggccaagga cttggccgaa 540 aacaacaagg gtgctagagt cttggttgtt tgttccgaaa tcaccgctgt tactttcaga 600 ggtccatctg acacccactt ggattctttg gttggtcaag ccttgttcgg tgatggtgct 660 gctgctatta tcattggtgc cgacccaatc ccagaaatcg aaaagccaat gttcgaattg 720 gtatctactg cccaaactat cttgccagat tctgatggtt ctatcgacgg tcacttgaga 780 gaagttggtt tgaccttcca cttgttgaag gatgttccag gtttgatttc taagaacatc 840 caaaagtctt tgaccgaagc tttcaagcca ttgggtatct ctgactggaa ctctattttc 900 tggatcgctc acccaggtgg tccaactatt ttggaccaag tcgaagaaaa gttgggtttg 960 aagccagaaa agttgagagc cactagacac gttttgtctg aatacggtaa catgtcatct 1020 gcttgtgttt tgttcatttt ggacgaaatg agaaagaagt ctgctgaaga tggtttggaa 1080 accgctggtg aaggtttgga atggggtgtc ttgttcggtt tcggtccagg tttgactgtt 1140 gaaaccgttg tcttgcactc tgttgccgct gcttaa 1176 <210> 57 <211> 352 <212> PRT <213> Streptomyces clavuligerus <400> 57 Met Ser Ala Val Leu Cys Lys Pro Ala Ile Ala Val Pro Asp His Ile 1 5 10 15 Ile Thr Asn Glu Glu Thr Leu Glu Leu Ala Arg Arg Leu His Ser Asp 20 25 30 His Pro Gln Leu Ala Leu Ala Cys Arg Leu Ile Glu His Thr Gly Val 35 40 45 Arg Lys Arg His Leu Ile Gln Pro Ile Asp Glu Val Leu Lys His Pro 50 55 60 Gly Leu Asp Ala Arg Ser Ala Thr Tyr Glu Thr Glu Ser Lys Ala Arg 65 70 75 80 Val Pro Ser Val Val Arg Arg Ala Leu Asp Gln Ala Glu Leu Glu Pro 85 90 95 Asp Gln Ile Asp Leu Ile Ile Tyr Val Ser Cys Thr Gly Phe Met Met 100 105 110 Pro Ser Leu Ala Ser Trp Leu Val Asn Thr Met Gly Phe Arg Ala Asp 115 120 125 Thr Arg Gln Leu Pro Ile Ala Gln Leu Gly Cys Ala Ala Gly Gly Ala 130 135 140 Ala Val Asn Arg Ala His Asp Phe Cys Thr Ala Tyr Pro Gly Thr Asn 145 150 155 160 Val Leu Ile Val Ala Cys Glu Phe Cys Ser Leu Cys Tyr Gln Pro Thr 165 170 175 Asp Leu Gly Ile Gly Ser Leu Leu Ser Asn Gly Leu Phe Gly Asp Gly 180 185 190 Ile Ala Ala Ala Val Val Arg Gly Glu Glu Gly Thr Gly Met Arg Leu 195 200 205 Glu Arg Asn Gly Thr Tyr Leu Ile Pro His Thr Glu Glu Trp Ile Ser 210 215 220 Tyr Ala Val Arg Ser Thr Gly Phe His Phe Gln Leu Asp Lys Arg Val 225 230 235 240 Pro Gly Thr Met Glu Pro Leu Ser Pro Ala Leu Arg Ala Leu Ala Glu 245 250 255 Gln His Gln Trp Asn Ala Gly Lys Leu Asp Phe Tyr Ile Ile His Ala 260 265 270 Gly Gly Pro Arg Ile Leu Asp Asp Leu Ser Arg Phe Leu Asp Val Pro 275 280 285 Pro Gly Ala Phe Arg His Ser Arg Ala Thr Leu Thr Glu Tyr Gly Asn 290 295 300 Ile Ala Ser Ala Val Val Leu Asp Ala Leu Gly Arg Leu Phe Asp Glu 305 310 315 320 Gln Ser Ala Leu Asp Gly His His Gly Met Leu Ala Gly Phe Gly Pro 325 330 335 Gly Ile Ile Ala Glu Met Ser Leu Gly Thr Trp Val Ser Pro Glu Ser 340 345 350 <210> 58 <211> 1059 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 57 <400> 58 atgtccgctg ttttgtgtaa gccagccatc gccgttccag accacatcat caccaacgaa 60 gaaaccttgg aattggctag aagattgcac tctgaccacc cacaattggc tttggcttgt 120 agattgatcg aacacactgg tgttagaaag agacacttga tccaaccaat cgacgaagtt 180 ttgaagcacc caggtttgga cgctagatct gccacctacg aaaccgaatc caaggctaga 240 gttccatctg ttgttagaag agctttggac caagctgaat tggaaccaga tcaaatcgac 300 ttgatcatct acgtatcctg taccggtttc atgatgccat ccttggcctc ctggttggtc 360 aacaccatgg gtttcagagc tgacaccaga caattgccaa tcgcccaatt gggttgtgct 420 gctggtggtg ctgccgtcaa cagagcccac gacttctgta ccgcctaccc aggtaccaac 480 gtcttgatcg ttgcctgtga attctgttct ttgtgttacc aaccaaccga tttgggtatc 540 ggttctttgt tgtccaacgg tttgttcggt gacggtatcg ccgccgctgt tgtcagaggt 600 gaagaaggta ccggtatgag attggaaaga aacggtacct acttgatccc acacaccgaa 660 gaatggatct cctacgctgt tagatccacc ggtttccact tccaattgga caagagagtc 720 ccaggtacca tggaaccatt gtctccagct ttgagagcct tggccgaaca acaccaatgg 780 aacgccggta agttggactt ctacatcatc cacgctggtg gtccaagaat cttggacgat 840 ttgtctagat tcttggacgt tccaccaggt gccttcagac actctagagc cactttgacc 900 gaatacggta acatcgcctc tgccgtcgtt ttggacgcct tgggtagatt gttcgacgaa 960 caatccgcct tggacggtca ccacggtatg ttggctggtt tcggtccagg tatcatcgcc 1020 gaaatgtcct tgggtacctg ggtttctcca gaatcctaa 1059 <210> 59 <211> 401 <212> PRT <213> Streptomyces clavuligerus <400> 59 Met Ser Ser Thr Gly Ser Ser Ala His Tyr Cys Pro Phe Asp Tyr Ala 1 5 10 15 Glu Ala Leu Glu Phe Asp Pro Thr Leu Arg Arg Phe Met Arg Glu Glu 20 25 30 Pro Val Ala Arg Ile Arg Leu Pro His Gly Ala Gly Glu Ala Trp Leu 35 40 45 Val Thr Gly Tyr Asp Asp Val Arg Thr Val Thr Thr Asp Arg Arg Phe 50 55 60 Ser Arg His Ala Val Val Gly Arg Asp Phe Pro Arg Met Thr Pro Glu 65 70 75 80 Pro Ile Val Gln Asp Glu Ala Ile Asn Val Met Asp Pro Pro Ala Ser 85 90 95 Ser Arg Leu Arg Ser Leu Val Ser Lys Gly Phe Ala Pro Glu Gln Ile 100 105 110 Glu Arg Met Arg Pro Tyr Ile Gln Arg Ala Val Asp Asp Leu Leu Asp 115 120 125 Arg Met Ala Glu Asp Ser Ser Ala Asp Leu Met Arg His Leu Ala Gly 130 135 140 Pro Leu Pro Leu Ile Thr Ile Cys Glu Val Leu Glu Ile Pro Pro Ala 145 150 155 160 Asp Gln Glu Thr Leu Arg Gly His Ala Arg Thr Met Met Asn Ile Ser 165 170 175 Val Asp Asn Lys Ala Ala Ala Val Arg Ala Lys Ala Asp Leu Arg Ala 180 185 190 Tyr Phe Ala Asp Leu Thr Ala Arg Arg Arg Ala Asp Pro Gly Glu Asp 195 200 205 Leu Ile Ser Val Leu Ala Thr Ala Arg Asp Gly Asp Glu Leu Leu Asp 210 215 220 Asp Gln Glu Leu Thr Val Met Ala Met Val Leu Leu Ile Thr Gly Gln 225 230 235 240 Asp Thr Thr Thr Tyr Glu Leu Gly Asn Leu Ser Tyr Thr Leu Leu Thr 245 250 255 Arg Pro Asp Val Arg Asp Leu Leu Arg Asp Arg Pro Glu Arg Leu Ala 260 265 270 Gln Thr Ile Asn Glu Leu Leu Arg Phe Ile Pro Phe Arg Lys Gly Val 275 280 285 Gly Ile Pro Arg Val Ala Thr Glu Asp Val Glu Leu Ser Gly Val Thr 290 295 300 Ile Pro Ala Gly Asp Ile Val His Val Ser Tyr Leu Thr Ala Asn Arg 305 310 315 320 Asp Gly Arg Lys Phe Asp Arg Pro Asp Glu Leu Asp Phe Asp Arg Thr 325 330 335 Ala Pro Ser His Met Thr Phe Gly Trp Gly Ala His His Cys Leu Gly 340 345 350 Ala Pro Leu Ala Gln Ala Glu Met Glu Thr Ala Phe Arg Thr Leu Leu 355 360 365 Glu Arg Phe Pro Gly Ile Ala Leu Ala Lys Pro Ala Glu Asp Val Glu 370 375 380 Trp Asn Thr Thr Ser Ile Trp Arg Tyr Pro Leu Ala Leu Pro Val Thr 385 390 395 400 Trp <210> 60 <211> 1206 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 59 <400> 60 atgtcctcca ccggttcctc tgctcactac tgtccattcg actacgccga agccttggaa 60 ttcgacccaa ctttgagaag attcatgaga gaagaaccag tcgctagaat cagattgcca 120 cacggtgctg gtgaagcttg gttggtcacc ggttacgacg atgttagaac cgttaccacc 180 gacagaagat tctctagaca cgccgttgtc ggtagagact tcccaagaat gactccagaa 240 ccaatcgtcc aagacgaagc catcaacgtc atggacccac cagcttcttc tagattgaga 300 tctttggttt ccaagggttt cgccccagaa caaatcgaaa gaatgaggcc atacatccaa 360 agagccgttg acgacttgtt ggacagaatg gctgaggact cctccgccga cttgatgaga 420 cacttggctg gtccattgcc attgatcacc atctgtgaag tcttggaaat cccaccagcc 480 gaccaagaaa ccttgagagg tcacgccaga actatgatga acatctctgt tgacaacaag 540 gccgccgccg ttagagccaa ggccgatttg agagcctact tcgctgactt gactgccaga 600 agaagagctg acccaggtga ggacttgatc tctgttttgg ccactgccag ggacggtgac 660 gaattgttgg acgaccaaga attgaccgtc atggctatgg tcttgttgat caccggtcaa 720 gacaccacca cctacgaatt gggtaacttg tcctacacct tgttgaccag accagacgtc 780 agagatttgt tgagagacag accagaaaga ttggctcaaa ctatcaacga attgttgaga 840 ttcatcccat tcagaaaggg tgtcggtatc ccaagagttg ccaccgagga cgttgaattg 900 tctggtgtta ctatcccagc cggtgacatc gtccacgtat cctacttgac cgccaacaga 960 gatggtagaa agttcgacag accagacgaa ttggacttcg acagaaccgc cccatcccac 1020 atgaccttcg gttggggtgc tcaccactgt ttgggtgccc cattggctca agccgaaatg 1080 gaaaccgcct tcagaacttt gttggaaaga ttcccaggta tcgctttggc taagccagcc 1140 gaggacgttg aatggaacac cacctctatc tggagatacc cattggcttt gccagtcacc 1200 tggtaa 1206 <210> 61 <211> 246 <212> PRT <213> Arabidopsis thaliana <400> 61 Met Ser Ser Ser Asn Ala Cys Ala Ser Pro Ser Pro Phe Pro Ala Val 1 5 10 15 Thr Lys Leu His Val Asp Ser Val Thr Phe Val Pro Ser Val Lys Ser 20 25 30 Pro Ala Ser Ser Asn Pro Leu Phe Leu Gly Gly Ala Gly Val Arg Gly 35 40 45 Leu Asp Ile Gln Gly Lys Phe Val Ile Phe Thr Val Ile Gly Val Tyr 50 55 60 Leu Glu Gly Asn Ala Val Pro Ser Leu Ser Val Lys Trp Lys Gly Lys 65 70 75 80 Thr Thr Glu Glu Leu Thr Glu Ser Ile Pro Phe Phe Arg Glu Ile Val 85 90 95 Thr Gly Ala Phe Glu Lys Phe Ile Lys Val Thr Met Lys Leu Pro Leu 100 105 110 Thr Gly Gln Gln Tyr Ser Glu Lys Val Thr Glu Asn Cys Val Ala Ile 115 120 125 Trp Lys Gln Leu Gly Leu Tyr Thr Asp Cys Glu Ala Lys Ala Val Glu 130 135 140 Lys Phe Leu Glu Ile Phe Lys Glu Glu Thr Phe Pro Pro Gly Ser Ser 145 150 155 160 Ile Leu Phe Ala Leu Ser Pro Thr Gly Ser Leu Thr Val Ala Phe Ser 165 170 175 Lys Asp Asp Ser Ile Pro Glu Thr Gly Ile Ala Val Ile Glu Asn Lys 180 185 190 Leu Leu Ala Glu Ala Val Leu Glu Ser Ile Ile Gly Lys Asn Gly Val 195 200 205 Ser Pro Gly Thr Arg Leu Ser Val Ala Glu Arg Leu Ser Gln Leu Met 210 215 220 Met Lys Asn Lys Asp Glu Lys Glu Val Ser Asp His Ser Val Glu Glu 225 230 235 240 Lys Leu Ala Lys Glu Asn 245 <210> 62 <211> 741 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 61 <400> 62 atgtcctcta gcaatgcgtg tgcctccccg tccccgttcc cggctgttac gaagctgcat 60 gtcgattcag ttacctttgt cccgtccgtg aagtccccgg cgagcagcaa cccgctgttt 120 ctgggcggtg caggtgtccg tggtctggat attcagggca aatttgtgat tttcaccgtg 180 atcggcgttt atctggaagg caatgcggtc ccgtcactgt cggtgaaatg gaagggtaaa 240 accacggaag aactgaccga atctattccg tttttccgcg aaatcgttac gggcgcgttc 300 gaaaagttca tcaaggtcac catgaaactg ccgctgacgg gtcagcaata ttcagaaaag 360 gttaccgaaa actgcgtcgc catctggaaa caactgggcc tgtacacgga ctgtgaagcg 420 aaggccgtcg aaaagtttct ggaaattttc aaagaagaaa cctttccgcc gggcagttcc 480 atcctgttcg cactgagccc gaccggttct ctgacggttg ctttcagtaa agatgactcc 540 atcccggaaa ccggcattgc agtgatcgaa aacaagctgc tggcagaagc tgttctggaa 600 agcattatcg gcaaaaatgg tgtgtcaccg ggtacgcgtc tgtcggttgc ggaacgcctg 660 agccagctga tgatgaaaaa taaagatgaa aaggaagtgt cggaccacag cgttgaagaa 720 aaactggcaa aggaaaacta a 741 <210> 63 <211> 719 <212> PRT <213> Citrus sinensis <400> 63 Met Ser Glu Ile Gly Ala Thr Thr Glu Asn Gly His Gln Asn Gly Gly 1 5 10 15 Leu Glu Gly Leu Cys Lys Asn Asn Asn Tyr Asn Tyr Ser Ser Gly Asp 20 25 30 Ala Leu Asn Trp Gly Val Met Ala Glu Thr Leu Lys Gly Ser His Leu 35 40 45 Glu Glu Val Lys Arg Met Val Ala Glu Tyr Arg Lys Pro Val Val Asn 50 55 60 Leu Gly Gly Glu Thr Leu Thr Val Ala Gln Val Ala Ala Ile Ala Thr 65 70 75 80 Ser Ser Thr Asn Val Glu Leu Ser Glu Ser Ala Arg Glu Gly Val Lys 85 90 95 Ala Ser Ser Asp Trp Val Met Glu Ser Met Asn Lys Gly Thr Asp Ser 100 105 110 Tyr Gly Val Thr Thr Gly Phe Gly Ala Thr Ser His Arg Arg Thr Lys 115 120 125 Asn Gly Gly Ala Leu Gln Lys Glu Leu Ile Arg Phe Leu Asn Ala Gly 130 135 140 Ile Phe Gly Asn Gly Thr Glu Ser Ser His Thr Leu Pro His Ser Ala 145 150 155 160 Thr Arg Ala Ala Met Leu Val Arg Val Asn Thr Leu Leu Gln Gly Tyr 165 170 175 Ser Gly Ile Arg Phe Glu Ile Leu Glu Ala Ile Thr Lys Leu Leu Asn 180 185 190 His Asn Ile Thr Pro Cys Leu Pro Leu Arg Gly Thr Ile Thr Ala Ser 195 200 205 Gly Asp Leu Val Pro Leu Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg 210 215 220 Pro Asn Ser Lys Ala Thr Gly Pro Asn Gly Glu Ile Ile Asp Ala Gln 225 230 235 240 Glu Ala Ser Lys Gln Ala Gly Phe Gly Phe Phe Glu Leu Gln Pro Lys 245 250 255 Glu Gly Leu Ala Leu Val Asn Gly Thr Ala Val Gly Ser Gly Leu Ala 260 265 270 Ser Met Val Leu Phe Glu Ala Asn Asn Leu Ala Leu Leu Ser Glu Ile 275 280 285 Leu Ser Ala Ile Phe Ala Glu Val Met Gln Gly Lys Pro Glu Phe Thr 290 295 300 Asp His Leu Thr His Lys Leu Lys His His Pro Gly Gln Ile Glu Ala 305 310 315 320 Ala Ala Ile Met Glu His Ile Leu Asp Gly Ser Ser Tyr Val Asn Val 325 330 335 Ala Lys Lys Leu His Glu Ile Asp Pro Leu Gln Lys Pro Lys Gln Asp 340 345 350 Arg Tyr Ala Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ile Glu 355 360 365 Val Ile Arg Phe Ala Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val 370 375 380 Asn Asp Asn Pro Leu Ile Asp Val Ser Arg Asn Lys Ala Leu His Gly 385 390 395 400 Gly Asn Phe Gln Gly Thr Pro Ile Gly Val Ser Met Asp Asn Thr Arg 405 410 415 Leu Ala Ile Ala Ala Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu 420 425 430 Leu Val Asn Asp Phe Tyr Asn Asn Gly Leu Pro Ser Asn Leu Ser Gly 435 440 445 Gly Arg Asn Pro Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala 450 455 460 Met Ala Ser Tyr Cys Ser Glu Leu Gln Phe Leu Ala Asn Pro Val Thr 465 470 475 480 Asn His Val Gln Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu 485 490 495 Gly Leu Ile Ser Ser Arg Lys Thr Ala Glu Ala Val Asp Ile Leu Lys 500 505 510 Leu Met Ser Ser Thr Phe Leu Val Ala Leu Cys Gln Ala Ile Asp Leu 515 520 525 Arg His Leu Glu Glu Asn Leu Lys His Thr Val Lys Asn Thr Val Ser 530 535 540 Gln Val Ala Lys Lys Val Leu Thr Val Gly Ala Ser Gly Glu Leu His 545 550 555 560 Pro Ser Arg Phe Cys Glu Lys Asp Leu Leu Lys Ala Ala Asp Arg Glu 565 570 575 His Val Phe Ala Tyr Ile Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu 580 585 590 Met Gln Lys Leu Arg Gln Val Leu Val Glu His Ala Leu Asn Asn Gly 595 600 605 Glu Asn Glu Lys Thr Ala Asn Ser Ser Ile Phe Gln Lys Ile Ala Ala 610 615 620 Phe Glu Glu Glu Leu Lys Thr Val Leu Pro Lys Glu Val Glu Asn Ala 625 630 635 640 Arg Gln Thr Val Glu Asn Gly Ser Pro Thr Ile Pro Asn Arg Ile Lys 645 650 655 Glu Cys Arg Ser Tyr Pro Leu Tyr Arg Phe Val Arg Glu Gly Leu Gly 660 665 670 Ser Asn Phe Leu Thr Gly Glu Lys Val Thr Ser Pro Gly Glu Glu Phe 675 680 685 Asp Lys Val Phe Thr Ala Met Cys Gln Gly Lys Ile Ile Asp Pro Met 690 695 700 Leu Glu Cys Leu Arg Glu Trp Asn Gly Ala Pro Leu Pro Ile Cys 705 710 715 <210> 64 <211> 2160 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 63 <400> 64 atgtccgaaa tcggtgccac tactgaaaac ggtcaccaaa acggtggcct cgaaggcttg 60 tgtaagaaca ataactacaa ctactcttct ggtgatgctt tgaactgggg tgttatggct 120 gaaactttga agggttctca cttggaagaa gttaagagaa tggttgctga atacagaaag 180 ccagttgtca acttgggtgg tgaaactttg accgttgctc aagttgctgc cattgccact 240 tcctctacta acgttgaatt gtctgaatct gccagagaag gtgtcaaggc ctcttctgat 300 tgggttatgg aatctatgaa caagggtacc gactcttacg gtgttactac tggcttcggt 360 gccacttcgc acagaagaac caagaacggt ggtgctttgc aaaaggaatt gattagattc 420 ttgaacgctg gtatcttcgg taacggtact gaatcttctc acactttgcc acactctgct 480 actagagctg ccatgttggt tcgtgttaac acattgttgc aaggttactc cggtatcaga 540 ttcgaaatct tggaagctat cactaagttg ttgaaccaca acatcactcc atgtttgcca 600 ttgagaggta ctatcactgc ttctggtgat ttggttccat tgtcctacat agccggcttg 660 ttgaccggtc gtccaaactc taaggccacc ggtccaaacg gtgaaatcat tgatgcccaa 720 gaagcctcta agcaagctgg tttcggtttc ttcgaattgc aaccaaagga gggcttggct 780 ctcgtcaacg gtactgctgt tggttctggt ttggcttcta tggttttgtt cgaagctaac 840 aatctcgcgt tgttgtcgga aattttgtct gctattttcg ctgaagtcat gcaaggtaag 900 ccagaattca ccgatcactt gactcacaag ttgaagcacc acccaggtca aattgaagct 960 gctgctatca tggaacacat cttggatggt tcttcttacg ttaacgttgc taagaagttg 1020 cacgaaattg atccattgca aaagccaaag caagatagat acgccttgag aacttctcca 1080 caatggttgg gtccacaaat cgaagttatt agattcgcta ccaagtctat tgaaagagaa 1140 atcaactctg ttaacgacaa cccattgatc gacgtttcta gaaacaaggc cttgcacggt 1200 ggtaacttcc aaggtacccc aattggtgtc tctatggaca acaccagatt ggctattgct 1260 gctatcggta agttgatgtt cgcccaattc tctgaattgg tcaacgattt ctacaacaac 1320 ggtttgccat ctaacttgtc tggtggtaga aacccatctt tggattacgg tttcaagggt 1380 gctgaaattg ctatggcttc ctactgttct gaattgcaat tcttggccaa cccagttact 1440 aaccacgtcc aatctgctga acaacacaac caagatgtta actccttggg tttgatctct 1500 tccagaaaga ctgctgaagc tgtcgacatc ttgaagttga tgtcatccac tttcttggtt 1560 gctttgtgtc aagctattga tttgagacac ttggaagaaa acttgaagca cactgtcaag 1620 aacactgtct ctcaagttgc taagaaggtc ttgaccgtcg gtgcttctgg tgaattgcac 1680 ccatctagat tctgtgaaaa ggatttgttg aaggctgctg atagagaaca cgttttcgct 1740 tacattgatg acccatgttc tgctacctac ccattgatgc aaaagttgag acaagttttg 1800 gttgaacacg ctttgaacaa cggtgaaaac gaaaagactg ccaactcttc tatcttccaa 1860 aagattgctg ccttcgaaga agaattaaag accgttttgc caaaggaagt tgaaaacgcc 1920 agacaaactg ttgaaaacgg ttctccaact attccaaaca gaatcaagga atgtagatct 1980 tacccattgt acagattcgt tagagaaggt ttgggttcta acttcttgac tggtgaaaag 2040 gttacttctc caggtgaaga attcgacaag gttttcactg ctatgtgtca aggtaagatc 2100 attgatccaa tgttggaatg tttgagagaa tggaacggtg ccccattgcc aatttgttaa 2160 <210> 65 <211> 715 <212> PRT <213> Citrus sinensis <400> 65 Met Ser Glu Ala Ser His Glu Asn Gln Ser Gly Gly Asn Ile Pro Ser 1 5 10 15 Gly Lys Leu Cys Thr Asn Ile Asp Pro Leu Asn Trp Val Ser Ala Ser 20 25 30 Glu Ser Leu Lys Gly Ser His Leu Asp Glu Val Lys Arg Met Val Ser 35 40 45 Glu Tyr Arg Lys Gln Val Val Arg Leu Gly Gly Glu Thr Leu Thr Ile 50 55 60 Ala Gln Val Ala Ala Val Ala Ser Arg Asp Gly Gly Val Thr Val Glu 65 70 75 80 Leu Asn Glu Glu Ala Arg Ala Gly Val Lys Ala Ser Ser Asp Trp Val 85 90 95 Met Glu Ser Met Asn Lys Gly Thr Asp Ser Tyr Gly Ile Thr Thr Gly 100 105 110 Phe Gly Ala Thr Ser His Arg Arg Thr Lys Gln Gly Ala Ala Leu Gln 115 120 125 Lys Glu Leu Ile Arg Phe Leu Asn Ala Gly Ile Phe Gly Lys Gly Thr 130 135 140 Glu Ser Cys Gln Met Leu Pro His Thr Ala Thr Arg Ala Ala Met Leu 145 150 155 160 Val Arg Ile Asn Thr Leu Leu Gln Gly Tyr Ser Gly Ile Arg Phe Glu 165 170 175 Ile Leu Glu Ala Ile Thr Lys Phe Leu Asn Arg Asn Ile Thr Pro Cys 180 185 190 Leu Pro Leu Arg Ala Ser Ile Thr Ala Ser Gly Asp Leu Ile Pro Phe 195 200 205 Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg Leu Asn Ser Val Ala Val 210 215 220 Gly Pro Asn Gly Glu Ser Leu Asn Ala Ala Glu Ala Phe Ser Gln Ala 225 230 235 240 Gly Ile Asp Gly Gly Phe Phe Glu Leu Gln Pro Lys Glu Gly Leu Ala 245 250 255 Leu Val Asn Gly Thr Gly Val Gly Ala Gly Leu Ala Ser Ile Val Leu 260 265 270 Phe Glu Ala Asn Ile Leu Thr Val Leu Ser Glu Val Leu Ser Ala Ile 275 280 285 Phe Ala Glu Ala Met Leu Gly Lys Pro Glu Phe Thr Asp His Leu Thr 290 295 300 His Lys Leu Lys His His Pro Gly Gln Ile Glu Ala Ala Ala Ile Met 305 310 315 320 Glu His Ile Leu Asp Gly Ser Ser Tyr Val Lys Ala Ala Gln Lys Leu 325 330 335 His Glu Ile Asp Pro Leu Gln Lys Pro Lys Gln Asp Arg Tyr Ala Leu 340 345 350 Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ala Glu Val Ile Arg Ala 355 360 365 Ser Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val Asn Asp Asn Pro 370 375 380 Leu Ile Asp Val Ser Arg Asn Lys Ala Leu His Gly Gly Asn Phe Gln 385 390 395 400 Gly Thr Pro Ile Gly Val Ser Met Asp Asn Ser Arg Leu Ala Ile Ala 405 410 415 Ser Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu Leu Val Asn Asp 420 425 430 Phe Tyr Ser Asn Gly Leu Pro Ser Asn Leu Ser Gly Gly Arg Asn Pro 435 440 445 Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala Met Ala Ala Tyr 450 455 460 Cys Ser Glu Leu Gln Phe Leu Ala Asn Pro Val Thr Asn His Val Gln 465 470 475 480 Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu Gly Leu Ile Ser 485 490 495 Ala Arg Lys Thr Ala Glu Ala Val Asp Ile Leu Lys Leu Met Ser Ser 500 505 510 Thr Tyr Leu Ile Ala Leu Cys Gln Ala Ile Asp Leu Arg His Leu Glu 515 520 525 Glu Asn Leu Lys Ser Thr Val Lys Asn Thr Ile Ser Gln Val Val Lys 530 535 540 Lys Val Leu Thr Met Gly Val Asn Gly Glu Leu His Pro Ser Arg Phe 545 550 555 560 Cys Glu Lys Asp Leu Leu Lys Val Val Asp Arg Glu Tyr Val Phe Ser 565 570 575 Tyr Ala Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu Met Gln Lys Leu 580 585 590 Arg Gln Val Leu Val Asp His Ala Leu Thr Asn Asn Glu Asp Leu Lys 595 600 605 Asn Ala Asn Ala Ser Ile Phe Leu Lys Ile Gly Ala Phe Glu Glu Glu 610 615 620 Leu Lys Thr Leu Leu Pro Lys Glu Val Glu Ser Ala Arg Ser Ala Phe 625 630 635 640 Glu Ser Gly Asn Leu Glu Ile Pro Asn Arg Ile Lys Glu Cys Arg Ser 645 650 655 Tyr Pro Leu Tyr Arg Phe Val Arg Glu Glu Leu Gly Ala Arg Tyr Leu 660 665 670 Thr Gly Glu Lys Ala Ile Ser Pro Gly Glu Glu Cys Asp Lys Val Phe 675 680 685 Thr Ala Ile Cys Gln Gly Lys Ile Ile Asp Pro Leu Leu Glu Cys Leu 690 695 700 Lys Glu Trp Asp Gly Ser Pro Leu Pro Ile Cys 705 710 715 <210> 66 <211> 2148 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 65 <400> 66 atgtccgaag cttctcacga aaaccaatct ggtggtaaca ttccatctgg taagttgtgt 60 actaacattg atccattgaa ctgggtttct gcttctgaat ctttgaaggg ttctcacttg 120 gatgaagtta agagaatggt ttctgaatac agaaagcaag ttgttagatt gggtggtgaa 180 accttgacta tcgctcaagt tgctgctgtt gcttctagag atggtggtgt cactgttgaa 240 ttgaacgaag aagccagagc tggtgtcaag gcttcttctg attgggttat ggaatctatg 300 aacaagggta ctgattctta cggcatcact actggcttcg gtgctacttc gcacagaaga 360 accaagcaag gtgctgcctt gcaaaaggaa ttgattagat tcttgaacgc tggtatcttc 420 ggtaagggta ctgaatcctg tcaaatgttg ccacacactg ctactagagc tgctatgctc 480 gttcgtatca acacattgtt gcaaggttac tctggtatta gattcgaaat tttggaagct 540 atcactaagt tcttgaacag aaacattact ccatgtttgc cattgagagc ctccatcact 600 gcgtcgggtg atctcatccc attctcgtac atcgccggtt tgttgaccgg tagattgaac 660 tctgttgctg ttggtccaaa cggtgaatct ttgaacgctg ctgaagcttt ctctcaagct 720 ggtattgatg gtggtttctt cgaattgcaa ccaaaggagg gcttggcgtt ggttaacggt 780 actggtgttg gtgctggttt ggcttctatt gttttgttcg aagctaacat tttgactgtt 840 ttgtccgaag ttttgtctgc tattttcgct gaagctatgt tgggtaagcc agaattcact 900 gatcacttga ctcacaagtt gaagcaccac ccaggtcaaa ttgaagctgc tgctatcatg 960 gaacacatct tggatggttc ttcttacgtt aaggctgctc aaaagttgca cgaaattgac 1020 ccattgcaaa agccaaagca agatagatac gctttgagaa cttctccaca atggttgggt 1080 ccacaagctg aagttattag agcttctact aagtctattg aaagagaaat taactctgtt 1140 aacgataacc cattgattga tgtttctaga aacaaggctt tgcacggtgg taacttccaa 1200 ggtaccccaa ttggtgtctc tatggataac tctagattgg ctattgcttc tattggtaag 1260 ttgatgttcg ctcaattctc tgaattggtt aacgatttct actctaacgg tttgccatct 1320 aacttgtctg gtggtagaaa cccatctttg gattacggtt tcaagggtgc cgaaatcgct 1380 atggctgctt actgttccga attgcaattc ttggccaacc cagttactaa ccacgtccaa 1440 tctgctgaac aacacaacca agatgttaac tctttgggtt tgatctctgc cagaaagact 1500 gctgaagctg ttgatatctt gaagttgatg tcctctactt acttgattgc tttgtgtcaa 1560 gctatcgact tgagacactt ggaagaaaac ttgaagtcta ctgttaagaa cactatctct 1620 caagttgtta agaaggtctt gactatgggt gtcaacggtg aattgcaccc atctagattc 1680 tgtgaaaagg atttgttgaa ggttgttgat agagaatacg ttttctctta cgctgatgat 1740 ccatgttctg ctacttaccc attgatgcaa aagttgagac aagtcttggt tgatcacgct 1800 ttgactaaca acgaagattt gaagaacgct aacgcttcta tcttcttgaa aataggtgcg 1860 ttcgaagaag aactcaagac cttgttgcca aaggaagttg aatctgctag atctgctttc 1920 gaatctggta acttggaaat cccaaacaga attaaggaat gtagatccta cccattgtac 1980 agattcgtta gagaagaatt gggtgctaga tacttgactg gtgaaaaggc tatctctcca 2040 ggtgaagaat gtgataaggt tttcactgct atttgtcaag gtaagatcat tgatccattg 2100 ttggaatgtt tgaaggaatg ggatggttct ccattgccaa tttgttaa 2148 <210> 67 <211> 537 <212> PRT <213> Citrus sinensis <400> 67 Met Ser Ala Asn Leu Val Thr Ile Ser Phe Phe Ser Ile Leu Leu Thr 1 5 10 15 Ile Ser Leu Leu Ser Phe Asn Lys Ser Leu Asn Leu Ile Ser Ile Thr 20 25 30 Leu Pro Leu Val Pro Leu Ile Ala Tyr Val Leu Lys Ser Phe Leu Lys 35 40 45 Ser Ser Lys Ala Phe Tyr Pro Pro Thr Pro Ile Ser Ile Pro Ile Phe 50 55 60 Gly Asn Trp Leu Gln Val Gly Asn Asp Leu Asn His Arg Leu Leu Ala 65 70 75 80 Ser Met Ala Gln Ile Tyr Gly Pro Val Phe Arg Leu Lys Leu Gly Ser 85 90 95 Lys Asn Leu Ile Val Val Ser Glu Pro Asp Leu Ala Thr Gln Val Leu 100 105 110 His Thr Gln Gly Val Glu Phe Gly Ser Arg Pro Arg Asn Val Val Phe 115 120 125 Asp Ile Phe Thr Gly Asn Gly Gln Asp Met Val Phe Thr Val Tyr Gly 130 135 140 Glu His Trp Arg Lys Met Arg Arg Ile Met Thr Leu Pro Phe Phe Thr 145 150 155 160 Asn Lys Val Val His Asn Tyr Ser Asp Met Trp Glu Gln Glu Met Asp 165 170 175 Leu Val Val His Asp Leu Lys Asn Asp Tyr Glu Ser Val Ser Thr Lys 180 185 190 Gly Ile Val Ile Arg Lys Arg Leu Gln Leu Met Leu Tyr Asn Ile Met 195 200 205 Tyr Arg Met Met Phe Asp Ala Lys Phe Glu Ser Gln Glu Asp Pro Leu 210 215 220 Phe Ile Glu Ala Thr Arg Phe Asn Ser Glu Arg Ser Arg Leu Ala Gln 225 230 235 240 Ser Phe Glu Tyr Asn Tyr Gly Asp Phe Ile Pro Leu Leu Arg Pro Phe 245 250 255 Leu Arg Gly Tyr Leu Asn Lys Cys Arg Asp Leu Gln Cys Arg Arg Leu 260 265 270 Ala Phe Phe Asn Asn Asn Phe Val Glu Lys Arg Arg Lys Ile Met Ala 275 280 285 Ala Asn Gly Glu Lys His Lys Ile Ser Cys Ala Ile Asp His Ile Ile 290 295 300 Asp Ala Gln Met Lys Gly Glu Ile Thr Glu Glu Asn Val Ile Tyr Ile 305 310 315 320 Val Glu Asn Ile Asn Val Ala Ala Ile Glu Thr Thr Leu Trp Ser Met 325 330 335 Glu Trp Ala Ile Ala Glu Leu Val Asn His Pro Glu Val Gln Gln Lys 340 345 350 Ile Arg Arg Glu Ile Ser Thr Val Leu Lys Gly Asn Pro Val Thr Glu 355 360 365 Ser Asn Leu His Glu Leu Pro Tyr Leu Gln Ala Ala Val Lys Glu Val 370 375 380 Leu Arg Leu His Thr Pro Ile Pro Leu Leu Val Pro His Met Asn Leu 385 390 395 400 Glu Glu Ala Lys Leu Gly Gly Phe Thr Ile Pro Lys Glu Ser Lys Ile 405 410 415 Val Val Asn Ala Trp Trp Leu Ala Asn Asn Pro Lys Trp Trp Glu Lys 420 425 430 Pro Glu Glu Phe Arg Pro Glu Arg Phe Leu Glu Glu Glu Cys Asn Ile 435 440 445 Asp Ala Val Ala Gly Gly Gly Lys Val Asp Phe Arg Tyr Leu Pro Phe 450 455 460 Gly Val Gly Arg Arg Ser Cys Pro Gly Ile Ile Leu Ala Leu Pro Ile 465 470 475 480 Leu Gly Leu Val Ile Ala Lys Leu Val Thr Ser Phe Glu Met Lys Ala 485 490 495 Pro Gln Gly Ile Asp Lys Ile Asp Val Ser Glu Lys Gly Gly Gln Phe 500 505 510 Ser Leu His Ile Ala Asn His Ser Thr Val Val Phe Asp Pro Ile Met 515 520 525 Glu Ser Leu Ser Gln Pro Met Pro Gln 530 535 <210> 68 <211> 1614 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 67 <400> 68 atgtccgcta acttggttac tatttctttc ttctctatct tgttgactat ctctttgttg 60 tctttcaaca agtctttgaa cttgatctct atcactttgc cattggttcc attgattgct 120 tacgttttga agtccttctt gaagtcatct aaggccttct acccaccaac tccaatctct 180 atcccaatct tcggtaactg gttgcaagtt ggtaacgact tgaaccacag attgttggct 240 tctatggctc aaatttacgg tccagttttc agattgaagt tgggttctaa gaacttgatc 300 gttgtttctg aaccagacct cgctactcaa gtgctacaca ctcaaggtgt tgaattcggt 360 tccagaccaa gaaacgttgt tttcgatatt ttcactggta acggtcaaga catggtattt 420 actgtctacg gcgaacactg gagaaagatg agaagaatta tgactttgcc attcttcacc 480 aacaaggttg ttcacaacta ctctgacatg tgggaacaag aaatggactt ggttgttcac 540 gacttgaaga acgattacga gtctgtaagc actaagggta ttgttattag aaagagattg 600 caattgatgt tgtacaacat tatgtacaga atgatgttcg atgctaagtt cgaatctcaa 660 gaagatccat tgttcattga agctactaga ttcaactctg aaagatctag attggcgcag 720 agcttcgaat acaactacgg tgatttcatt ccattgttaa gaccattctt gagaggttac 780 ttgaacaagt gtagagactt gcaatgtaga agattggctt tcttcaacaa caacttcgtt 840 gaaaagagaa gaaagatcat ggctgccaac ggtgaaaagc acaagatctc ttgtgccatt 900 gatcacatca ttgatgctca aatgaagggt gaaatcactg aagaaaacgt tatttacatt 960 gttgaaaaca tcaacgttgc tgctatcgaa actactttgt ggtccatgga atgggctatc 1020 gctgaattgg tcaaccaccc agaagttcaa caaaagatca gaagagaaat ctctactgtc 1080 ttgaagggta acccagtcac tgaatctaac ttgcacgaat tgccatactt gcaagccgct 1140 gttaaggaag ttttgagatt gcacactcca attccattgt tggttccaca catgaacttg 1200 gaagaagcta agttgggtgg tttcactatt ccaaaggaat ccaagattgt tgttaacgct 1260 tggtggttgg ctaacaaccc aaagtggtgg gaaaagccag aagaattcag accagaaaga 1320 ttcttggaag aagaatgtaa cattgatgct gttgctggtg gtggtaaggt tgacttcaga 1380 tacttgccat tcggtgttgg tagaagatct tgtccaggta taatattggc tctcccaatc 1440 ttgggcttgg ttattgctaa gttggttact tctttcgaaa tgaaggctcc acaaggtatc 1500 gataagattg acgtttctga aaagggtggt caattctctt tgcacattgc taaccactct 1560 actgttgtct ttgatccaat catggaatct ttgtcccaac caatgccaca ataa 1614 <210> 69 <211> 520 <212> PRT <213> Citrus sinensis <400> 69 Met Ser Asp Leu Asn Gly Trp Cys Asn Ser Gly Asn Gln Asn Met Cys 1 5 10 15 Cys Cys Gln Ser Tyr Val Lys Arg Gly Tyr Asp Arg Val Leu Ser Phe 20 25 30 Asn Gly Leu Ile Thr Val Ser Lys Leu Arg Gly Lys Arg Phe Lys Leu 35 40 45 Pro Pro Gly Pro Leu Pro Val Pro Val Phe Gly Asn Trp Leu Gln Val 50 55 60 Gly Asp Asp Leu Asn His Arg Asn Leu Ser Asp Leu Ala Lys Lys Tyr 65 70 75 80 Gly Asp Val Leu Leu Leu Arg Met Gly Gln Arg Asn Leu Val Val Val 85 90 95 Ser Ser Pro Asp His Ala Lys Glu Val Leu His Thr Gln Gly Val Glu 100 105 110 Phe Gly Ser Arg Thr Arg Asn Val Val Phe Asp Ile Phe Thr Gly Lys 115 120 125 Gly Gln Asp Met Val Phe Thr Val Tyr Gly Glu His Trp Arg Lys Met 130 135 140 Arg Arg Ile Met Thr Val Pro Phe Phe Thr Asn Lys Val Val Gln Gln 145 150 155 160 Gln Arg Phe Asn Trp Glu Asp Glu Ala Ala Arg Val Val Glu Asp Val 165 170 175 Lys Lys Asp Pro Glu Ala Ala Thr Asn Gly Ile Val Leu Arg Arg Arg 180 185 190 Leu Gln Leu Met Met Tyr Asn Asn Met Tyr Arg Ile Met Phe Asp Arg 195 200 205 Arg Phe Glu Ser Gln Asp Asp Pro Leu Phe Asn Arg Leu Lys Ala Leu 210 215 220 Asn Gly Glu Arg Ser Arg Leu Ala Gln Ser Phe Glu Tyr Asn Tyr Gly 225 230 235 240 Asp Phe Ile Pro Ile Leu Arg Pro Phe Leu Arg Gly Tyr Leu Lys Ile 245 250 255 Cys Lys Glu Val Lys Glu Arg Arg Leu Gln Leu Phe Lys Asp Tyr Phe 260 265 270 Val Glu Glu Arg Lys Lys Leu Ala Ser Thr Lys Ser Met Ser Asn Glu 275 280 285 Ser Leu Lys Cys Ala Ile Asp His Ile Leu Asp Ala Gln Thr Lys Gly 290 295 300 Glu Ile Asn Glu Asp Asn Val Leu Tyr Ile Val Glu Asn Ile Asn Val 305 310 315 320 Ala Ala Ile Glu Thr Thr Leu Trp Ser Ile Glu Trp Gly Ile Ala Glu 325 330 335 Leu Val Asn His Pro Glu Ile Gln Lys Lys Leu Arg Asn Glu Leu Asp 340 345 350 Thr Val Leu Gly Pro Gly His Gln Ile Thr Glu Pro Asp Thr His Lys 355 360 365 Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Thr Leu Arg Leu Arg Met 370 375 380 Ala Ile Pro Leu Leu Val Pro His Met Asn Leu His Asp Ala Lys Leu 385 390 395 400 Gly Gly Tyr Asp Val Pro Ala Glu Ser Lys Ile Leu Val Asn Ala Trp 405 410 415 Trp Leu Ala Asn Asn Pro Ala Gln Trp Lys Lys Pro Glu Glu Phe Arg 420 425 430 Pro Glu Arg Phe Leu Glu Glu Glu Ser Lys Val Glu Ala Asn Gly Asn 435 440 445 Asp Phe Arg Tyr Leu Pro Phe Gly Val Gly Arg Arg Ser Cys Pro Gly 450 455 460 Ile Ile Leu Ala Leu Pro Ile Leu Gly Ile Thr Ile Gly Arg Leu Val 465 470 475 480 Gln Asn Phe Glu Leu Leu Pro Pro Pro Gly Gln Ser Lys Ile Asp Thr 485 490 495 Ala Glu Lys Gly Gly Gln Phe Ser Leu His Ile Leu Lys His Ser Thr 500 505 510 Ile Val Ala Lys Pro Arg Ser Phe 515 520 <210> 70 <211> 1563 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 69 <400> 70 atgtccgact tgaacggttg gtgtaactct ggtaaccaaa acatgtgttg ttgtcaatct 60 tacgttaaga gaggttacga tagagttttg tctttcaacg gtttgattac cgtttctaag 120 ttgagaggta agagattcaa gttgccacca ggtccattgc cagtcccagt tttcggtaac 180 tggttgcaag tcggtgatga cttgaaccac agaaacttgt ccgacttggc caagaagtac 240 ggtgatgtct tgttgttgag aatgggtcaa agaaacttgg tcgtcgtttc ttctccagac 300 cacgccaagg aagtcttgca cactcaaggt gttgaattcg gttctagaac tcgtaatgtc 360 gtgttcgaca tcttcactgg taagggtcaa gatatggttt tcactgtcta cggcgaacac 420 tggagaaaga tgagaagaat catgaccgtc ccattcttca ctaacaaggt tgttcaacaa 480 caaagattca actgggaaga tgaagccgct agagtcgttg aagatgttaa gaaggaccca 540 gaagctgcta ccaacggtat cgtcttgaga agaagattgc aattgatgat gtacaacaac 600 atgtacagaa ttatgttcga tagaagattc gaatctcaag atgatccatt gttcaacaga 660 ttgaaggctt tgaacggtga aagatctaga ttggcgcaga gcttcgaata caactacggt 720 gatttcattc caattttaag accattcttg agaggttact tgaagatttg taaggaagtt 780 aaggaaagaa gattgcaatt gttcaaggac tacttcgttg aagaaagaaa gaagttggct 840 tctactaagt ctatgtctaa cgaatctttg aagtgtgcta tcgatcacat tttggacgct 900 caaactaagg gtgaaatcaa cgaagataac gttttgtaca tcgttgaaaa catcaacgtt 960 gccgctatcg aaactacttt gtggtctatc gaatggggta ttgctgaatt ggttaaccac 1020 ccagaaatcc aaaagaagtt gagaaacgaa ttggacaccg ttttgggtcc aggtcaccaa 1080 atcactgaac cagacaccca caagttgcca tacttgcaag ccgttatcaa ggaaactttg 1140 agattgagaa tggctattcc attgttggtt ccacacatga acttgcacga cgccaagttg 1200 ggtggttacg acgtcccagc tgaatctaag atcttggtta acgcttggtg gttggccaac 1260 aacccagccc aatggaagaa gccagaagaa ttcagaccag aaagattctt ggaagaagaa 1320 tccaaggttg aagctaacgg taacgacttc agatacttgc cattcggtgt tggtagaaga 1380 tcttgtccag gtataatatt ggctctccca attttgggca tcactattgg tagattggtt 1440 caaaacttcg aattgttgcc accaccaggt caatctaaga ttgacactgc tgaaaagggt 1500 ggtcaattct ctttgcacat tttgaagcac tctaccattg ttgccaagcc aagatctttc 1560 taa 1563 <210> 71 <211> 513 <212> PRT <213> Saccharothrix espanaensis <400> 71 Met Ser Thr Ile Thr Ser Pro Ala Pro Ala Gly Arg Leu Asn Asn Val 1 5 10 15 Arg Pro Met Thr Gly Glu Glu Tyr Leu Glu Ser Leu Arg Asp Gly Arg 20 25 30 Glu Val Tyr Ile Tyr Gly Glu Arg Val Asp Asp Val Thr Thr His Leu 35 40 45 Ala Phe Arg Asn Ser Val Arg Ser Ile Ala Arg Leu Tyr Asp Val Leu 50 55 60 His Asp Pro Ala Ser Glu Gly Val Leu Arg Val Pro Thr Asp Thr Gly 65 70 75 80 Asn Gly Gly Phe Thr His Pro Phe Phe Lys Thr Ala Arg Ser Ser Glu 85 90 95 Asp Leu Val Ala Ala Arg Glu Ala Ile Val Gly Trp Gln Arg Leu Val 100 105 110 Tyr Gly Trp Met Gly Arg Thr Pro Asp Tyr Lys Ala Ala Phe Phe Gly 115 120 125 Thr Leu Asp Ala Asn Ala Glu Phe Tyr Gly Pro Phe Glu Ala Asn Ala 130 135 140 Arg Arg Trp Tyr Arg Asp Ala Gln Glu Arg Val Leu Tyr Phe Asn His 145 150 155 160 Ala Ile Val His Pro Pro Val Asp Arg Asp Arg Pro Ala Asp Arg Thr 165 170 175 Ala Asp Ile Cys Val His Val Glu Glu Glu Thr Asp Ser Gly Leu Ile 180 185 190 Val Ser Gly Ala Lys Val Val Ala Thr Gly Ser Ala Met Thr Asn Ala 195 200 205 Asn Leu Ile Ala His Tyr Gly Leu Pro Val Arg Asp Lys Lys Phe Gly 210 215 220 Leu Val Phe Thr Val Pro Met Asn Ser Pro Gly Leu Lys Leu Ile Cys 225 230 235 240 Arg Thr Ser Tyr Glu Leu Met Val Ala Thr Gln Gly Ser Pro Phe Asp 245 250 255 Tyr Pro Leu Ser Ser Arg Leu Asp Glu Asn Asp Ser Ile Met Ile Phe 260 265 270 Asp Arg Val Leu Val Pro Trp Glu Asn Val Phe Met Tyr Asp Ala Gly 275 280 285 Ala Ala Asn Ser Phe Ala Thr Gly Ser Gly Phe Leu Glu Arg Phe Thr 290 295 300 Phe His Gly Cys Thr Arg Leu Ala Val Lys Leu Asp Phe Ile Ala Gly 305 310 315 320 Cys Val Met Lys Ala Val Glu Val Thr Gly Thr Thr His Phe Arg Gly 325 330 335 Val Gln Ala Gln Val Gly Glu Val Leu Asn Trp Arg Asp Val Phe Trp 340 345 350 Gly Leu Ser Asp Ala Met Ala Lys Ser Pro Asn Ser Trp Val Gly Gly 355 360 365 Ser Val Gln Pro Asn Leu Asn Tyr Gly Leu Ala Tyr Arg Thr Phe Met 370 375 380 Gly Val Gly Tyr Pro Arg Ile Lys Glu Ile Ile Gln Gln Thr Leu Gly 385 390 395 400 Ser Gly Leu Ile Tyr Leu Asn Ser Ser Ala Ala Asp Trp Lys Asn Pro 405 410 415 Asp Val Arg Pro Tyr Leu Asp Arg Tyr Leu Arg Gly Ser Arg Gly Ile 420 425 430 Gln Ala Ile Asp Arg Val Lys Leu Leu Lys Leu Leu Trp Asp Ala Val 435 440 445 Gly Thr Glu Phe Ala Gly Arg His Glu Leu Tyr Glu Arg Asn Tyr Gly 450 455 460 Gly Asp His Glu Gly Ile Arg Val Gln Thr Leu Gln Ala Tyr Gln Ala 465 470 475 480 Asn Gly Gln Ala Ala Ala Leu Lys Gly Phe Ala Glu Gln Cys Met Ser 485 490 495 Glu Tyr Asp Leu Asp Gly Trp Thr Arg Pro Asp Leu Ile Asn Pro Gly 500 505 510 Thr <210> 72 <211> 1542 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 71 <400> 72 atgtccacca tcacttctcc agctccagct ggtagattga acaacgtcag accaatgact 60 ggtgaagaat acttggaatc tttgagagat ggtagagaag tctacatcta cggtgaaaga 120 gtcgacgacg tcaccactca cttggccttc agaaactctg ttagatccat cgctagattg 180 tacgacgttt tgcacgaccc agcttcggag ggtgtactaa gagttccaac cgacactggt 240 aatggtggct tcactcatcc attcttcaag accgcccgtt cttctgaaga tttggtcgcc 300 gctagagaag ccatcgtcgg ttggcaaaga ttggtttacg gttggatggg tagaacccca 360 gattacaagg ctgcgttctt cggtactctc gacgccaacg ccgaattcta cggtccattc 420 gaagccaacg ccagaagatg gtacagagat gcccaagaaa gagttttgta cttcaaccac 480 gctatcgttc acccaccagt cgacagagac agaccagccg acagaaccgc cgacatctgt 540 gttcacgttg aagaagaaac cgactctggt ttgatcgttt ccggtgccaa ggttgtcgct 600 accggttccg ctatgaccaa cgctaacttg atcgctcact acggtttgcc agttagagac 660 aagaagttcg gtttggtttt cactgtccca atgaactctc caggtttgaa gttgatctgt 720 agaacctcct acgaattgat ggtcgctact caaggttctc cattcgacta cccattatct 780 tctagattgg acgaaaacga ctctatcatg atcttcgaca gagttttggt tccatgggaa 840 aacgttttca tgtacgacgc tggtgctgcc aactccttcg ccaccggttc tggtttcttg 900 gaaagattca ccttccacgg ttgtaccaga ttggctgtca agttggactt catcgccggt 960 tgtgtcatga aggctgttga agtcaccggt accactcact tcagaggtgt tcaagctcaa 1020 gtcggtgaag ttttgaactg gagagatgtt ttctggggtt tgtccgacgc tatggccaag 1080 tctccaaact cttgggtcgg tggttctgtt caaccaaact tgaactacgg tttggcttac 1140 agaaccttca tgggtgttgg ttacccaaga atcaaggaaa tcatccaaca aaccttgggt 1200 tctggtttga tctacttgaa ctcctctgcc gccgactgga agaacccaga cgtcagacca 1260 tacttggaca gatacttgag aggttctaga ggtatccaag ctatcgacag agtcaagttg 1320 ttgaagttgt tgtgggacgc tgtcggtacc gaattcgccg gtagacacga attgtacgaa 1380 agaaactacg gtggtgacca cgaaggtatc agagttcaaa ccttgcaagc ttaccaagct 1440 aacggtcagg cggccgctct caagggtttc gcggaacaat gtatgtccga atacgacttg 1500 gacggttgga ctagaccaga cttgatcaac ccaggtacct aa 1542 <210> 73 <211> 498 <212> PRT <213> Beta vulgaris <400> 73 Met Ser Asp His Ala Thr Leu Ala Met Ile Leu Ala Ile Leu Phe Ile 1 5 10 15 Ser Phe His Phe Ile Lys Leu Leu Phe Ser Gln Gln Thr Thr Lys Leu 20 25 30 Leu Pro Pro Gly Pro Lys Pro Leu Pro Ile Ile Gly Asn Ile Leu Glu 35 40 45 Val Gly Lys Lys Pro His Arg Ser Phe Ala Asn Leu Ala Lys Ile His 50 55 60 Gly Pro Leu Ile Ser Leu Arg Leu Gly Ser Val Thr Thr Ile Val Val 65 70 75 80 Ser Ser Ala Asp Val Ala Lys Glu Met Phe Leu Lys Lys Asp His Pro 85 90 95 Leu Ser Asn Arg Thr Ile Pro Asn Ser Val Thr Ala Gly Asp His His 100 105 110 Lys Leu Thr Met Ser Trp Leu Pro Val Ser Pro Lys Trp Arg Asn Phe 115 120 125 Arg Lys Ile Thr Ala Val His Leu Leu Ser Pro Gln Arg Leu Asp Ala 130 135 140 Cys Gln Thr Phe Arg His Ala Lys Val Gln Gln Leu Tyr Glu Tyr Val 145 150 155 160 Gln Glu Cys Ala Gln Lys Gly Gln Ala Val Asp Ile Gly Lys Ala Ala 165 170 175 Phe Thr Thr Ser Leu Asn Leu Leu Ser Lys Leu Phe Phe Ser Val Glu 180 185 190 Leu Ala His His Lys Ser His Thr Ser Gln Glu Phe Lys Glu Leu Ile 195 200 205 Trp Asn Ile Met Glu Asp Ile Gly Lys Pro Asn Tyr Ala Asp Tyr Phe 210 215 220 Pro Ile Leu Gly Cys Val Asp Pro Ser Gly Ile Arg Arg Arg Leu Ala 225 230 235 240 Cys Ser Phe Asp Lys Leu Ile Ala Val Phe Gln Gly Ile Ile Cys Glu 245 250 255 Arg Leu Ala Pro Asp Ser Ser Thr Thr Thr Thr Thr Thr Thr Asp Asp 260 265 270 Val Leu Asp Val Leu Leu Gln Leu Phe Lys Gln Asn Glu Leu Thr Met 275 280 285 Gly Glu Ile Asn His Leu Leu Val Asp Ile Phe Asp Ala Gly Thr Asp 290 295 300 Thr Thr Ser Ser Thr Leu Glu Trp Val Met Thr Glu Leu Ile Arg Asn 305 310 315 320 Pro Glu Met Met Glu Lys Ala Gln Glu Glu Ile Lys Gln Val Leu Gly 325 330 335 Lys Asp Lys Gln Ile Gln Glu Ser Asp Ile Ile Asn Leu Pro Tyr Leu 340 345 350 Gln Ala Ile Ile Lys Glu Thr Leu Arg Leu His Pro Pro Thr Val Phe 355 360 365 Leu Leu Pro Arg Lys Ala Asp Thr Asp Val Glu Leu Tyr Gly Tyr Ile 370 375 380 Val Pro Lys Asp Ala Gln Ile Leu Val Asn Leu Trp Ala Ile Gly Arg 385 390 395 400 Asp Pro Asn Ala Trp Gln Asn Ala Asp Ile Phe Ser Pro Glu Arg Phe 405 410 415 Ile Gly Cys Glu Ile Asp Val Lys Gly Arg Asp Phe Gly Leu Leu Pro 420 425 430 Phe Gly Ala Gly Arg Arg Ile Cys Pro Gly Met Asn Leu Ala Ile Arg 435 440 445 Met Leu Thr Leu Met Leu Ala Thr Leu Leu Gln Phe Phe Asn Trp Lys 450 455 460 Leu Glu Gly Asp Ile Ser Pro Lys Asp Leu Asp Met Asp Glu Lys Phe 465 470 475 480 Gly Ile Ala Leu Gln Lys Thr Lys Pro Leu Lys Leu Ile Pro Ile Pro 485 490 495 Arg Tyr <210> 74 <211> 1497 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 73 <400> 74 atgtccgatc acgctacttt ggcgatgata ttggccatcc tattcatttc tttccacttc 60 atcaagttgt tgttctctca acaaactacc aagttgttgc caccaggtcc aaagccattg 120 ccaatcattg gtaacatctt ggaagttggt aagaagccac acagatcttt cgctaacttg 180 gctaagattc acggtccatt gatctctttg agattgggtt ctgttactac tattgttgtt 240 tcttctgctg atgttgctaa ggaaatgttc ttgaagaagg accacccatt gtctaacaga 300 actattccaa actctgtcac tgccggtgac caccacaagt tgaccatgtc ttggttgcca 360 gtttctccaa agtggagaaa cttcagaaag attactgccg tccacttgtt gtctccacaa 420 agattggatg cttgtcaaac cttcagacac gccaaggttc aacaattgta cgaatacgtt 480 caagaatgtg ctcaaaaggg tcaagctgtt gatattggta aggctgcttt cactacctcc 540 ttgaacttgt tgtctaagtt gttcttctct gttgaattgg cccaccacaa gtctcacact 600 tctcaagaat tcaaggaatt gatctggaac attatggaag atattggtaa gccaaactac 660 gctgattact tcccaatttt gggttgtgtt gatccatctg gtattagaag aagattggct 720 tgttctttcg acaagttgat tgctgttttc caaggtatca tctgtgaaag attggctcca 780 gattcttcta ctacaaccac tactaccact gatgatgttt tggacgtttt gttgcaattg 840 ttcaagcaaa acgaattgac tatgggtgaa attaaccact tgttggtcga cattttcgat 900 gctggtactg acactacttc ttctactttg gaatgggtca tgactgaatt gattagaaac 960 ccagaaatga tggaaaaggc tcaagaagaa attaagcaag ttttgggtaa ggataagcaa 1020 attcaagaat ctgacattat taacttgcca tacttgcaag ccattatcaa ggaaactttg 1080 agattgcacc caccaactgt tttcttgttg ccaagaaagg ccgacactga tgttgaattg 1140 tacggttaca ttgttccaaa ggatgctcaa atcttggtta acttgtgggc tattggtaga 1200 gatccaaacg cttggcaaaa cgctgatatt ttctctccag aaagattcat cggttgtgaa 1260 attgatgtca agggtagaga tttcggtttg ttgccattcg gtgccggtag aagaatctgt 1320 ccaggtatga acttggccat tagaatgttg actttgatgt tggctacttt gttgcaattc 1380 ttcaactgga agttggaagg tgacatctct ccaaaggact tggacatgga tgaaaagttc 1440 ggtattgctt tgcaaaagac taagccattg aagttgattc caatcccaag atactaa 1497 <210> 75 <211> 413 <212> PRT <213> Rhodopseudomonas palustris <400> 75 Met Ser Thr Thr Ala Pro Ser Leu Val Pro Val Thr Thr Pro Ser Gln 1 5 10 15 His Gly Ala Gly Val Pro His Leu Gly Ile Asp Pro Phe Ala Leu Asp 20 25 30 Tyr Phe Ala Asp Pro Tyr Pro Glu Gln Glu Thr Leu Arg Glu Ala Gly 35 40 45 Pro Val Val Tyr Leu Asp Lys Trp Asn Val Tyr Gly Val Ala Arg Tyr 50 55 60 Ala Glu Val Tyr Ala Val Leu Asn Asp Pro Leu Thr Phe Cys Ser Ser 65 70 75 80 Arg Gly Val Gly Leu Ser Asp Phe Lys Lys Glu Lys Pro Trp Arg Pro 85 90 95 Pro Ser Leu Ile Leu Glu Ala Asp Pro Pro Ala His Thr Arg Thr Arg 100 105 110 Ala Val Leu Ser Lys Val Leu Ser Pro Ala Thr Met Lys Arg Leu Arg 115 120 125 Asp Gly Phe Ala Ala Ala Ala Asp Ala Lys Ile Asp Glu Leu Leu Ala 130 135 140 Arg Gly Gly Asn Ile Asp Ala Ile Ala Asp Leu Ala Glu Ala Tyr Pro 145 150 155 160 Leu Ser Val Phe Pro Asp Ala Met Gly Leu Lys Gln Glu Gly Arg Glu 165 170 175 Asn Leu Leu Pro Tyr Ala Gly Leu Val Leu Asn Ala Phe Gly Pro Pro 180 185 190 Asn Glu Leu Arg Gln Ser Ala Ile Glu Arg Ser Ala Pro His Gln Ala 195 200 205 Tyr Val Ala Glu Gln Cys Gln Arg Pro Asn Leu Ala Pro Gly Gly Phe 210 215 220 Gly Ala Cys Ile His Ala Phe Ser Asp Thr Gly Glu Ile Thr Pro Glu 225 230 235 240 Glu Ala Pro Leu Leu Val Arg Ser Leu Leu Ser Ala Gly Leu Asp Thr 245 250 255 Thr Val Asn Gly Ile Ala Ala Ala Val Tyr Cys Leu Ala Arg Phe Pro 260 265 270 Asp Glu Phe Ala Arg Leu Arg Ala Asp Pro Ser Leu Ala Arg Asn Ala 275 280 285 Phe Glu Glu Ala Val Arg Phe Glu Ser Pro Val Gln Thr Phe Phe Arg 290 295 300 Thr Thr Thr Arg Asp Val Glu Leu Ala Gly Ala Thr Ile Gly Glu Gly 305 310 315 320 Glu Lys Val Leu Met Phe Leu Gly Ser Ala Asn Arg Asp Pro Arg Arg 325 330 335 Trp Asp Asp Pro Asp Arg Tyr Asp Ile Thr Arg Lys Thr Ser Gly His 340 345 350 Val Gly Phe Gly Ser Gly Val His Met Cys Val Gly Gln Leu Val Ala 355 360 365 Arg Leu Glu Gly Glu Val Val Leu Ala Ala Leu Ala Arg Lys Val Ala 370 375 380 Ala Ile Glu Ile Ala Gly Pro Leu Lys Arg Arg Phe Asn Asn Thr Leu 385 390 395 400 Arg Gly Leu Glu Ser Leu Pro Ile Gln Leu Thr Pro Ala 405 410 <210> 76 <211> 1242 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 75 <400> 76 atgtccacca ctgctccatc tttggttcca gttaccactc catcccaaca cggtgctggt 60 gttccacact tgggtatcga tccattcgct ttggactact tcgccgatcc atacccagaa 120 caagaaactt tgagagaagc tggtccagtt gtctacttgg acaagtggaa cgtctacggt 180 gtcgccagat acgctgaagt atacgccgta ctcaacgatc cattgacctt ctgttcctct 240 agaggtgttg gtttgtctga tttcaagaag gaaaagccat ggaggccacc atctttgatc 300 ttggaagccg acccaccagc tcacaccaga accagagctg ttttgtctaa ggttttgtct 360 ccagctacta tgaagagatt gagagatggt ttcgctgctg ctgctgacgc caagatcgat 420 gaattgttgg ccagaggtgg taacatcgat gctatcgccg acttggccga agcctaccca 480 ttgtctgttt tcccagatgc gatgggtttg aagcaagaag gcagagaaaa cttgttgcca 540 tacgcgggct tggttttgaa cgcattcggt ccaccaaacg aattgagaca atctgctatc 600 gaaagatctg ctccacacca agcctacgtt gccgaacaat gtcaaagacc aaacttggct 660 ccaggtggtt tcggtgcctg tatccacgcc ttctctgaca ccggtgaaat cactccagaa 720 gaagccccat tgttggttag atctttgttg tctgctggtt tggacactac cgtcaacggt 780 attgctgctg ctgtttactg tttggctaga ttcccagacg aattcgctag attgagagcc 840 gatccatctt tggccagaaa cgccttcgaa gaagctgtta gattcgaatc tccagttcaa 900 accttcttca gaaccaccac tagagatgtc gaattggctg gtgccactat cggtgaaggt 960 gaaaaggttt tgatgttctt gggttccgcc aacagagatc caagaagatg ggacgatcca 1020 gacagatacg acatcaccag aaagacctct gggcatgtcg gcttcggttc tggtgttcac 1080 atgtgtgtcg gtcaattggt cgccagattg gaaggtgaag ttgttttggc cgctttggct 1140 agaaaggttg ctgctatcga aatcgccggt ccattgaaga gaagattcaa caacactttg 1200 agaggtttgg aatctttgcc aatccaattg actccagctt aa 1242 <210> 77 <211> 718 <212> PRT <213> Arabidopsis thaliana <400> 77 Met Ser Asp Gln Ile Glu Ala Met Leu Cys Gly Gly Gly Glu Lys Thr 1 5 10 15 Lys Val Ala Val Thr Thr Lys Thr Leu Ala Asp Pro Leu Asn Trp Gly 20 25 30 Leu Ala Ala Asp Gln Met Lys Gly Ser His Leu Asp Glu Val Lys Lys 35 40 45 Met Val Glu Glu Tyr Arg Arg Pro Val Val Asn Leu Gly Gly Glu Thr 50 55 60 Leu Thr Ile Gly Gln Val Ala Ala Ile Ser Thr Val Gly Gly Ser Val 65 70 75 80 Lys Val Glu Leu Ala Glu Thr Ser Arg Ala Gly Val Lys Ala Ser Ser 85 90 95 Asp Trp Val Met Glu Ser Met Asn Lys Gly Thr Asp Ser Tyr Gly Val 100 105 110 Thr Thr Gly Phe Gly Ala Thr Ser His Arg Arg Thr Lys Asn Gly Thr 115 120 125 Ala Leu Gln Thr Glu Leu Ile Arg Phe Leu Asn Ala Gly Ile Phe Gly 130 135 140 Asn Thr Lys Glu Thr Cys His Thr Leu Pro Gln Ser Ala Thr Arg Ala 145 150 155 160 Ala Met Leu Val Arg Val Asn Thr Leu Leu Gln Gly Tyr Ser Gly Ile 165 170 175 Arg Phe Glu Ile Leu Glu Ala Ile Thr Ser Leu Leu Asn His Asn Ile 180 185 190 Ser Pro Ser Leu Pro Leu Arg Gly Thr Ile Thr Ala Ser Gly Asp Leu 195 200 205 Val Pro Leu Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg Pro Asn Ser 210 215 220 Lys Ala Thr Gly Pro Asp Gly Glu Ser Leu Thr Ala Lys Glu Ala Phe 225 230 235 240 Glu Lys Ala Gly Ile Ser Thr Gly Phe Phe Asp Leu Gln Pro Lys Glu 245 250 255 Gly Leu Ala Leu Val Asn Gly Thr Ala Val Gly Ser Gly Met Ala Ser 260 265 270 Met Val Leu Phe Glu Ala Asn Val Gln Ala Val Leu Ala Glu Val Leu 275 280 285 Ser Ala Ile Phe Ala Glu Val Met Ser Gly Lys Pro Glu Phe Thr Asp 290 295 300 His Leu Thr His Arg Leu Lys His His Pro Gly Gln Ile Glu Ala Ala 305 310 315 320 Ala Ile Met Glu His Ile Leu Asp Gly Ser Ser Tyr Met Lys Leu Ala 325 330 335 Gln Lys Val His Glu Met Asp Pro Leu Gln Lys Pro Lys Gln Asp Arg 340 345 350 Tyr Ala Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ile Glu Val 355 360 365 Ile Arg Gln Ala Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val Asn 370 375 380 Asp Asn Pro Leu Ile Asp Val Ser Arg Asn Lys Ala Ile His Gly Gly 385 390 395 400 Asn Phe Gln Gly Thr Pro Ile Gly Val Ser Met Asp Asn Thr Arg Leu 405 410 415 Ala Ile Ala Ala Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu Leu 420 425 430 Val Asn Asp Phe Tyr Asn Asn Gly Leu Pro Ser Asn Leu Thr Ala Ser 435 440 445 Ser Asn Pro Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala Met 450 455 460 Ala Ser Tyr Cys Ser Glu Leu Gln Tyr Leu Ala Asn Pro Val Thr Ser 465 470 475 480 His Val Gln Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu Gly 485 490 495 Leu Ile Ser Ser Arg Lys Thr Ser Glu Ala Val Asp Ile Leu Lys Leu 500 505 510 Met Ser Thr Thr Phe Leu Val Gly Ile Cys Gln Ala Val Asp Leu Arg 515 520 525 His Leu Glu Glu Asn Leu Arg Gln Thr Val Lys Asn Thr Val Ser Gln 530 535 540 Val Ala Lys Lys Val Leu Thr Thr Gly Ile Asn Gly Glu Leu His Pro 545 550 555 560 Ser Arg Phe Cys Glu Lys Asp Leu Leu Lys Val Val Asp Arg Glu Gln 565 570 575 Val Phe Thr Tyr Val Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu Met 580 585 590 Gln Arg Leu Arg Gln Val Ile Val Asp His Ala Leu Ser Asn Gly Glu 595 600 605 Thr Glu Lys Asn Ala Val Thr Ser Ile Phe Gln Lys Ile Gly Ala Phe 610 615 620 Glu Glu Glu Leu Lys Ala Val Leu Pro Lys Glu Val Glu Ala Ala Arg 625 630 635 640 Ala Ala Tyr Gly Asn Gly Thr Ala Pro Ile Pro Asn Arg Ile Lys Glu 645 650 655 Cys Arg Ser Tyr Pro Leu Tyr Arg Phe Val Arg Glu Glu Leu Gly Thr 660 665 670 Lys Leu Leu Thr Gly Glu Lys Val Val Ser Pro Gly Glu Glu Phe Asp 675 680 685 Lys Val Phe Thr Ala Met Cys Glu Gly Lys Leu Ile Asp Pro Leu Met 690 695 700 Asp Cys Leu Lys Glu Trp Asn Gly Ala Pro Ile Pro Ile Cys 705 710 715 <210> 78 <211> 2157 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 77 <400> 78 atgtccgatc aaatcgaagc tatgttgtgt ggtggtggtg aaaaaacaaa agttgctgtt 60 actactaaga ccttggccga tccattgaat tggggtttgg ctgctgatca aatgaagggt 120 tctcatttgg atgaagtcaa gaagatggtc gaagaataca gaaggccagt tgttaatttg 180 ggtggtgaaa ctttgactat tggtcaagtt gctgctattt ctactgttgg tggttctgtt 240 aaggttgaat tggctgaaac ttctagagct ggtgttaagg cttcttctga ttgggttatg 300 gaatctatga acaagggtac tgattcttac ggtgttacta caggttttgg tgctacttct 360 catagaagaa ctaagaatgg tactgccttg caaaccgaat tgatcagatt tttgaacgcc 420 ggtattttcg gtaacaccaa agaaacttgt cataccttgc cacaatctgc tactagagct 480 gctatgttgg ttagagttaa cactttgttg caaggttact ccggtatcag attcgaaatt 540 ttggaagcta tcacctcctt gttgaaccat aacatttctc catctttgcc attgagaggt 600 actattactg cttctggtga tttggttcca ttgtcttata ttgctggttt gttgactggt 660 agaccaaact ctaaagctac tggtccagat ggtgaatcat tgactgctaa agaagctttt 720 gaaaaggctg gtatctctac tggttttttc gacttgcaac ctaaagaagg tttggctttg 780 gttaatggta cagctgttgg ttctggtatg gcttctatgg ttttgtttga agctaacgtt 840 caagctgttt tggccgaagt tttgtctgct atttttgctg aagttatgtc cggtaagcca 900 gaattcactg atcatttgac ccatagattg aaacatcacc caggtcaaat tgaagctgct 960 gcaattatgg aacatatctt ggatggttcc tcttacatga agttggctca aaaagttcac 1020 gaaatggacc cattgcaaaa gccaaaacaa gatagatacg ctttgagaac ttctccacaa 1080 tggttgggtc cacaaataga agttattaga caagccacca agtccatcga aagagaaatc 1140 aattctgtta acgacaaccc attgatcgac gtcagtagaa acaaagctat tcatggtggt 1200 aacttccaag gtactccaat tggtgtttct atggacaaca ctagattggc tattgctgcc 1260 attggtaaat tgatgttcgc tcaattctcc gaattggtca acgattttta caacaacggt 1320 ttgccttcta acttgaccgc ttcttctaat ccatcattgg attacggttt taagggtgct 1380 gaaattgcta tggcttcata ctgttctgaa ttgcaatact tggctaaccc agttacctct 1440 catgttcaat ctgctgaaca acacaatcaa gacgttaact ccttgggttt gatctcttct 1500 agaaagactt ctgaagccgt tgacatcttg aagttgatgt ctactacatt cttggtcggt 1560 atttgccaag ctgttgattt gagacatttg gaagaaaact tgagacaaac cgtcaagaac 1620 accgtttcac aagttgctaa gaaagttttg accaccggta ttaacggtga attgcatcca 1680 tctagattct gcgaaaagga tttgttgaag gtcgttgata gagaacaagt tttcacctac 1740 gttgatgatc catgttctgc tacttatcca ttgatgcaaa gattgagaca agtcatcgtt 1800 gatcatgctt tgtctaatgg tgaaaccgaa aagaacgctg ttacctccat tttccaaaag 1860 attggtgctt tcgaagaaga attgaaggcc gttttgccaa aagaagttga agcagctaga 1920 gcagcttacg gtaacggtac tgctccaatt ccaaatagaa tcaaagaatg cagatcctac 1980 ccattataca gattcgttag agaagaatta ggtactaagt tgttgaccgg tgaaaaggtt 2040 gtttctccag gtgaagaatt cgataaggtt ttcactgcta tgtgcgaagg taaattgatc 2100 gatccattga tggactgctt gaaagaatgg aatggtgctc ctattcctat ctgctaa 2157 <210> 79 <211> 506 <212> PRT <213> Arabidopsis thaliana <400> 79 Met Ser Asp Leu Leu Leu Leu Glu Lys Ser Leu Ile Ala Val Phe Val 1 5 10 15 Ala Val Ile Leu Ala Thr Val Ile Ser Lys Leu Arg Gly Lys Lys Leu 20 25 30 Lys Leu Pro Pro Gly Pro Ile Pro Ile Pro Ile Phe Gly Asn Trp Leu 35 40 45 Gln Val Gly Asp Asp Leu Asn His Arg Asn Leu Val Asp Tyr Ala Lys 50 55 60 Lys Phe Gly Asp Leu Phe Leu Leu Arg Met Gly Gln Arg Asn Leu Val 65 70 75 80 Val Val Ser Ser Pro Asp Leu Thr Lys Glu Val Leu Leu Thr Gln Gly 85 90 95 Val Glu Phe Gly Ser Arg Thr Arg Asn Val Val Phe Asp Ile Phe Thr 100 105 110 Gly Lys Gly Gln Asp Met Val Phe Thr Val Tyr Gly Glu His Trp Arg 115 120 125 Lys Met Arg Arg Ile Met Thr Val Pro Phe Phe Thr Asn Lys Val Val 130 135 140 Gln Gln Asn Arg Glu Gly Trp Glu Phe Glu Ala Ala Ser Val Val Glu 145 150 155 160 Asp Val Lys Lys Asn Pro Asp Ser Ala Thr Lys Gly Ile Val Leu Arg 165 170 175 Lys Arg Leu Gln Leu Met Met Tyr Asn Asn Met Phe Arg Ile Met Phe 180 185 190 Asp Arg Arg Phe Glu Ser Glu Asp Asp Pro Leu Phe Leu Arg Leu Lys 195 200 205 Ala Leu Asn Gly Glu Arg Ser Arg Leu Ala Gln Ser Phe Glu Tyr Asn 210 215 220 Tyr Gly Asp Phe Ile Pro Ile Leu Arg Pro Phe Leu Arg Gly Tyr Leu 225 230 235 240 Lys Ile Cys Gln Asp Val Lys Asp Arg Arg Ile Ala Leu Phe Lys Lys 245 250 255 Tyr Phe Val Asp Glu Arg Lys Gln Ile Ala Ser Ser Lys Pro Thr Gly 260 265 270 Ser Glu Gly Leu Lys Cys Ala Ile Asp His Ile Leu Glu Ala Glu Gln 275 280 285 Lys Gly Glu Ile Asn Glu Asp Asn Val Leu Tyr Ile Val Glu Asn Ile 290 295 300 Asn Val Ala Ala Ile Glu Thr Thr Leu Trp Ser Ile Glu Trp Gly Ile 305 310 315 320 Ala Glu Leu Val Asn His Pro Glu Ile Gln Ser Lys Leu Arg Asn Glu 325 330 335 Leu Asp Thr Val Leu Gly Pro Gly Val Gln Val Thr Glu Pro Asp Leu 340 345 350 His Lys Leu Pro Tyr Leu Gln Ala Val Val Lys Glu Thr Leu Arg Leu 355 360 365 Arg Met Ala Ile Pro Leu Leu Val Pro His Met Asn Leu His Asp Ala 370 375 380 Lys Leu Ala Gly Tyr Asp Ile Pro Ala Glu Ser Lys Ile Leu Val Asn 385 390 395 400 Ala Trp Trp Leu Ala Asn Asn Pro Asn Ser Trp Lys Lys Pro Glu Glu 405 410 415 Phe Arg Pro Glu Arg Phe Phe Glu Glu Glu Ser His Val Glu Ala Asn 420 425 430 Gly Asn Asp Phe Arg Tyr Val Pro Phe Gly Val Gly Arg Arg Ser Cys 435 440 445 Pro Gly Ile Ile Leu Ala Leu Pro Ile Leu Gly Ile Thr Ile Gly Arg 450 455 460 Met Val Gln Asn Phe Glu Leu Leu Pro Pro Pro Gly Gln Ser Lys Val 465 470 475 480 Asp Thr Ser Glu Lys Gly Gly Gln Phe Ser Leu His Ile Leu Asn His 485 490 495 Ser Ile Ile Val Met Lys Pro Arg Asn Cys 500 505 <210> 80 <211> 1521 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 79 <400> 80 atgtccgact tgttgttgtt ggaaaagtcc ttgattgctg ttttcgttgc tgttattttg 60 gccaccgtta tctctaaatt gagaggtaag aaattgaagt tgccaccagg tccaattcca 120 atcccaattt ttggtaattg gttgcaagtt ggtgatgact tgaaccacag aaacttggtt 180 gattacgcta aaaagttcgg tgatttgttc ttgttgagaa tgggtcaaag aaatttggtc 240 gttgtttcct caccagactt gaccaaagaa gttttgttga ctcaaggtgt cgaattcggt 300 tccagaacta gaaatgttgt tttcgatatc ttcaccggta agggtcaaga tatggttttt 360 actgtttacg gtgaacattg gagaaagatg agaagaatta tgaccgttcc attcttcacc 420 aacaaggttg tccaacaaaa cagagaaggt tgggaatttg aagctgcttc tgttgttgaa 480 gatgtcaaga agaatccaga ttctgctact aagggtatcg ttttgagaaa aagattgcaa 540 ttgatgatgt acaacaacat gttcagaatc atgttcgaca gaagatttga atccgaagat 600 gaccctttgt ttttgagatt gaaggctttg aacggtgaaa gatctagatt ggctcaatcc 660 ttcgaataca actacggtga tttcatccca atcttaagac cattcttgag aggttacttg 720 aagatctgcc aagatgttaa ggatagaaga atcgccttgt tcaaaaagta cttcgttgac 780 gaaagaaagc aaatcgcttc ttctaaacct actggttctg aaggtttgaa gtgcgccatt 840 gatcatattt tggaagctga acaaaagggt gaaatcaacg aagataacgt cttgtacatc 900 gtcgaaaaca ttaacgttgc tgctattgaa actaccttgt ggtctattga atggggtatt 960 gctgaattgg ttaatcaccc agaaatccaa tccaagttga gaaacgaatt ggatactgtt 1020 ttgggtccag gtgttcaagt tactgaacct gacttgcata agttgccata cttgcaagct 1080 gttgtaaaag aaaccttgag attaagaatg gccatccctt tgttggttcc acatatgaac 1140 ttgcatgatg ctaaattggc cggttatgat attccagccg aatccaagat tttggttaat 1200 gcttggtggt tggctaacaa tccaaattct tggaaaaagc cagaagaatt cagaccagaa 1260 agatttttcg aagaagaaag tcacgttgaa gccaacggta atgattttag atacgttcca 1320 tttggtgttg gtagaagatc ttgtccaggt attatcttgg ctttgccaat tttgggtatt 1380 accatcggta gaatggtcca aaacttcgaa ttattgccac cacctggtca atctaaggtt 1440 gatacttctg aaaagggtgg tcaattctcc ttgcatattt tgaaccactc catcatcgtt 1500 atgaagccaa gaaactgtta a 1521 <210> 81 <211> 384 <212> PRT <213> Saccharomyces cerevisiae <400> 81 Met Ser Lys Ser Lys Thr Phe Leu Phe Thr Ser Glu Ser Val Gly Glu 1 5 10 15 Gly His Pro Asp Lys Ile Cys Asp Gln Val Ser Asp Ala Ile Leu Asp 20 25 30 Ala Cys Leu Glu Gln Asp Pro Phe Ser Lys Val Ala Cys Glu Thr Ala 35 40 45 Ala Lys Thr Gly Met Ile Met Val Phe Gly Glu Ile Thr Thr Lys Ala 50 55 60 Arg Leu Asp Tyr Gln Gln Ile Val Arg Asp Thr Ile Lys Lys Ile Gly 65 70 75 80 Tyr Asp Asp Ser Ala Lys Gly Phe Asp Tyr Lys Thr Cys Asn Val Leu 85 90 95 Val Ala Ile Glu Gln Gln Ser Pro Asp Ile Ala Gln Gly Leu His Tyr 100 105 110 Glu Lys Ser Leu Glu Asp Leu Gly Ala Gly Asp Gln Gly Ile Met Phe 115 120 125 Gly Tyr Ala Thr Asp Glu Thr Pro Glu Gly Leu Pro Leu Thr Ile Leu 130 135 140 Leu Ala His Lys Leu Asn Met Ala Met Ala Asp Ala Arg Arg Asp Gly 145 150 155 160 Ser Leu Pro Trp Leu Arg Pro Asp Thr Lys Thr Gln Val Thr Val Glu 165 170 175 Tyr Glu Asp Asp Asn Gly Arg Trp Val Pro Lys Arg Ile Asp Thr Val 180 185 190 Val Ile Ser Ala Gln His Ala Asp Glu Ile Ser Thr Ala Asp Leu Arg 195 200 205 Thr Gln Leu Gln Lys Asp Ile Val Glu Lys Val Ile Pro Lys Asp Met 210 215 220 Leu Asp Glu Asn Thr Lys Tyr Phe Ile Gln Pro Ser Gly Arg Phe Val 225 230 235 240 Ile Gly Gly Pro Gln Gly Asp Ala Gly Leu Thr Gly Arg Lys Ile Ile 245 250 255 Val Asp Ala Tyr Gly Gly Ala Ser Ser Val Gly Gly Gly Ala Phe Ser 260 265 270 Gly Lys Asp Tyr Ser Lys Val Asp Arg Ser Ala Ala Tyr Ala Ala Arg 275 280 285 Trp Val Ala Lys Ser Leu Val Ala Ala Gly Leu Cys Lys Arg Val Gln 290 295 300 Val Gln Phe Ser Tyr Ala Ile Gly Ile Ala Glu Pro Leu Ser Leu His 305 310 315 320 Val Asp Thr Tyr Gly Thr Ala Thr Lys Ser Asp Asp Glu Ile Ile Glu 325 330 335 Ile Ile Lys Lys Asn Phe Asp Leu Arg Pro Gly Val Leu Val Lys Glu 340 345 350 Leu Asp Leu Ala Arg Pro Ile Tyr Leu Pro Thr Ala Ser Tyr Gly His 355 360 365 Phe Thr Asn Gln Glu Tyr Ser Trp Glu Lys Pro Lys Lys Leu Glu Phe 370 375 380 <210> 82 <211> 1155 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 81 <400> 82 atgtccaaga gcaaaacttt cttatttacc tctgaatccg tcggtgaagg tcacccagac 60 aagatttgtg accaagtttc tgatgctatt ttggacgctt gtttagaaca agatccattc 120 tccaaggttg cctgtgaaac agctgccaaa actggtatga ttatggtttt cggtgaaatt 180 accaccaaag ctagacttga ctaccaacaa atagtaagag ataccatcaa gaagattggt 240 tatgacgatt ctgccaaggg tttcgactac aagacatgta atgttttagt agctatcgaa 300 caacaatctc cagatatcgc tcaaggtctg cactatgaaa agagcttaga agatttaggt 360 gctggtgacc aaggtataat gtttggttac gctacagacg aaactccaga agggttacca 420 ttgaccattc ttttggctca caaattgaac atggctatgg cagatgctag aagagatggt 480 tctctcccat ggttgaggcc agacacaaag actcaagtca ctgtcgaata cgaggacgac 540 aatggtagat gggttccaaa gaggatagat accgttgtta tttctgctca acatgctgat 600 gaaatttcca ccgctgactt gagaactcaa cttcaaaaag atattgttga aaaggtcata 660 ccaaaggata tgttagacga aaataccaaa tatttcatcc aaccatccgg tagattcgtc 720 atcggtggtc ctcaaggtga cgctggtttg accggtagaa agattattgt cgacgcttac 780 ggtggtgcct catccgtcgg tggtggtgcc ttctccggta aggactattc caaggtcgat 840 cgttccgctg cttacgctgc tagatgggtt gccaagtctc tagttgccgc tggtttgtgt 900 aagagagtcc aagtccaatt ttcatatgct attggtattg ctgaaccatt gtctttacat 960 gtggacacct atggtacagc tacaaaatca gatgacgaaa tcattgaaat tattaagaag 1020 aacttcgact tgaggccagg tgtgttagta aaggaattag atttggctag accaatttac 1080 ttaccaaccg cttcttatgg tcacttcact aatcaagagt actcatggga aaaaccaaag 1140 aaattggaat tttaa 1155 <210> 83 <211> 521 <212> PRT <213> Escherichia coli <400> 83 Met Ser Lys Pro Glu Asp Phe Arg Ala Ser Thr Gln Arg Pro Phe Thr 1 5 10 15 Gly Glu Glu Tyr Leu Lys Ser Leu Gln Asp Gly Arg Glu Ile Tyr Ile 20 25 30 Tyr Gly Glu Arg Val Lys Asp Val Thr Thr His Pro Ala Phe Arg Asn 35 40 45 Ala Ala Ala Ser Val Ala Gln Leu Tyr Asp Ala Leu His Lys Pro Glu 50 55 60 Met Gln Asp Ser Leu Cys Trp Asn Thr Asp Thr Gly Ser Gly Gly Tyr 65 70 75 80 Thr His Lys Phe Phe Arg Val Ala Lys Ser Ala Asp Asp Leu Arg Gln 85 90 95 Gln Arg Asp Ala Ile Ala Glu Trp Ser Arg Leu Ser Tyr Gly Trp Met 100 105 110 Gly Arg Thr Pro Asp Tyr Lys Ala Ala Phe Gly Cys Ala Leu Gly Ala 115 120 125 Asn Pro Gly Phe Tyr Gly Gln Phe Glu Gln Asn Ala Arg Asn Trp Tyr 130 135 140 Thr Arg Ile Gln Glu Thr Gly Leu Tyr Phe Asn His Ala Ile Val Asn 145 150 155 160 Pro Pro Ile Asp Arg His Leu Pro Thr Asp Lys Val Lys Asp Val Tyr 165 170 175 Ile Lys Leu Glu Lys Glu Thr Asp Ala Gly Ile Ile Val Ser Gly Ala 180 185 190 Lys Val Val Ala Thr Asn Ser Ala Leu Thr His Tyr Asn Met Ile Gly 195 200 205 Phe Gly Ser Ala Gln Val Met Gly Glu Asn Pro Asp Phe Ala Leu Met 210 215 220 Phe Val Ala Pro Met Asp Ala Asp Gly Val Lys Leu Ile Ser Arg Ala 225 230 235 240 Ser Tyr Glu Met Val Ala Gly Ala Thr Gly Ser Pro Tyr Asp Tyr Pro 245 250 255 Leu Ser Ser Arg Phe Asp Glu Asn Asp Ala Ile Leu Val Met Asp Asn 260 265 270 Val Leu Ile Pro Trp Glu Asn Val Leu Ile Tyr Arg Asp Phe Asp Arg 275 280 285 Cys Arg Arg Trp Thr Met Glu Gly Gly Phe Ala Arg Met Tyr Pro Leu 290 295 300 Gln Ala Cys Val Arg Leu Ala Val Lys Leu Asp Phe Ile Thr Ala Leu 305 310 315 320 Leu Lys Lys Ser Leu Glu Cys Thr Gly Thr Leu Glu Phe Arg Gly Val 325 330 335 Gln Ala Asp Leu Gly Glu Val Val Ala Trp Arg Asn Thr Phe Trp Ala 340 345 350 Leu Ser Asp Ser Met Cys Ser Glu Ala Thr Pro Trp Val Asn Gly Ala 355 360 365 Tyr Leu Pro Asp His Ala Ala Leu Gln Thr Tyr Arg Val Leu Ala Pro 370 375 380 Met Ala Tyr Ala Lys Ile Lys Asn Ile Ile Glu Arg Asn Val Thr Ser 385 390 395 400 Gly Leu Ile Tyr Leu Pro Ser Ser Ala Arg Asp Leu Asn Asn Pro Gln 405 410 415 Ile Asp Gln Tyr Leu Ala Lys Tyr Val Arg Gly Ser Asn Gly Met Asp 420 425 430 His Val Gln Arg Ile Lys Ile Leu Lys Leu Met Trp Asp Ala Ile Gly 435 440 445 Ser Glu Phe Gly Gly Arg His Glu Leu Tyr Glu Ile Asn Tyr Ser Gly 450 455 460 Ser Gln Asp Glu Ile Arg Leu Gln Cys Leu Arg Gln Ala Gln Asn Ser 465 470 475 480 Gly Asn Met Asp Lys Met Met Ala Met Val Asp Arg Cys Leu Ser Glu 485 490 495 Tyr Asp Gln Asp Gly Trp Thr Val Pro His Leu His Asn Asn Asp Asp 500 505 510 Ile Asn Met Leu Asp Lys Leu Leu Lys 515 520 <210> 84 <211> 1566 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 83 <400> 84 atgtccaaac cagaagattt ccgcgccagt acccaacgtc ctttcaccgg ggaagagtat 60 ctgaaaagcc tgcaggatgg tcgcgagatc tatatctatg gcgagcgagt gaaagacgtc 120 accactcatc cggcatttcg taatgcggca gcgtctgttg cccagctgta cgacgcactg 180 cacaaaccgg agatgcagga ctctctgtgt tggaacaccg acaccggcag cggcggctat 240 acccataaat tcttccgcgt ggcgaaaagt gccgacgacc tgcgccagca acgcgacgcc 300 atcgctgagt ggtcacgcct gagctatggc tggatgggcc gtaccccaga ctacaaagcc 360 gctttcggtt gcgcactggg cgcgaatccg ggcttttacg gtcagttcga gcagaacgcc 420 cgtaactggt acacccgtat tcaggaaact ggcctctact ttaaccacgc gattgttaac 480 ccaccgatcg atcgtcattt gccgaccgat aaagtgaaag acgtttacat caagctggaa 540 aaagagactg acgccgggat tatcgtcagc ggtgcgaaag tggttgccac caactcggcg 600 ctgactcact acaacatgat tggcttcggc tcggcacaag tgatgggcga aaacccggac 660 ttcgcactga tgttcgttgc gccaatggat gccgatggcg tgaaattaat ctcccgcgcc 720 tcttatgaga tggtcgcggg tgctaccggc tcgccatacg actacccgct ctccagccgc 780 ttcgatgaga acgatgcgat tctggtgatg gataacgtgc tgattccatg ggaaaacgtg 840 ctgatctacc gcgattttga tcgctgccgt cgctggacga tggaaggcgg ttttgcccgt 900 atgtatccgc tgcaagcctg tgtgcgcctg gcagtgaaat tagacttcat tacggcactg 960 ctgaaaaaat cactcgaatg taccggcacc ctggagttcc gtggtgtgca ggccgatctc 1020 ggtgaagtgg tagcgtggcg caacaccttc tgggcattga gtgactcgat gtgttcagaa 1080 gcaacgccgt gggtcaacgg ggcttattta ccggatcatg ccgcactgca aacctatcgc 1140 gtactggcac caatggccta cgcgaagatc aaaaacatta tcgaacgcaa cgttaccagt 1200 ggcctgatct atctcccttc cagtgcccgt gacctgaata atccgcagat cgaccagtat 1260 ctggcgaagt atgtgcgcgg ttcgaacggt atggatcacg tccagcgcat caagatcctc 1320 aaactgatgt gggatgctat tggcagcgaa tttggtggtc gtcacgaact gtatgaaatc 1380 aactactccg gtagccagga tgagattcgc ctgcagtgtc tgcgccaggc acaaaactcc 1440 ggcaatatgg acaagatgat ggcgatggtt gatcgctgcc tgtcggaata cgaccaggac 1500 ggctggactg tgccgcacct gcacaacaac gacgatatca acatgctgga taagctgctg 1560 aaataa 1566 <210> 85 <211> 171 <212> PRT <213> Escherichia coli <400> 85 Met Ser Gln Leu Asp Glu Gln Arg Leu Arg Phe Arg Asp Ala Met Ala 1 5 10 15 Ser Leu Ser Ala Ala Val Asn Ile Ile Thr Thr Glu Gly Asp Ala Gly 20 25 30 Gln Cys Gly Ile Thr Ala Thr Ala Val Cys Ser Val Thr Asp Thr Pro 35 40 45 Pro Ser Leu Met Val Cys Ile Asn Ala Asn Ser Ala Met Asn Pro Val 50 55 60 Phe Gln Gly Asn Gly Lys Leu Cys Val Asn Val Leu Asn His Glu Gln 65 70 75 80 Glu Leu Met Ala Arg His Phe Ala Gly Met Thr Gly Met Ala Met Glu 85 90 95 Glu Arg Phe Ser Leu Ser Cys Trp Gln Lys Gly Pro Leu Ala Gln Pro 100 105 110 Val Leu Lys Gly Ser Leu Ala Ser Leu Glu Gly Glu Ile Arg Asp Val 115 120 125 Gln Ala Ile Gly Thr His Leu Val Tyr Leu Val Glu Ile Lys Asn Ile 130 135 140 Ile Leu Ser Ala Glu Gly His Gly Leu Ile Tyr Phe Lys Arg Arg Phe 145 150 155 160 His Pro Val Met Leu Glu Met Glu Ala Ala Ile 165 170 <210> 86 <211> 516 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 85 <400> 86 atgtcccaat tagatgaaca acgcctgcgc tttcgtgacg cgatggccag cctgtcggca 60 gcggtaaata ttatcaccac cgagggcgac gccggacaat gcgggattac ggcaacggcc 120 gtctgctcgg tcacggatac accaccgtcg ctgatggtgt gcattaacgc caacagtgcg 180 atgaacccgg tttttcaggg caacggcaag ttgtgcgtca acgtcctcaa ccatgagcag 240 gaactgatgg cacgccactt cgcgggcatg acaggcatgg cgatggaaga gcgttttagc 300 ctctcatgct ggcaaaaagg tccgctggcg cagccggtgc taaaaggttc gctggccagt 360 cttgaaggtg agatccgcga tgtgcaggca attggcacac atctggtgta tctggtggag 420 attaaaaaca tcatcctcag tgcagaaggt catggactta tctactttaa acgccgtttc 480 catccggtga tgctggaaat ggaagctgcg atttaa 516 <210> 87 <211> 233 <212> PRT <213> Arabidopsis thaliana <400> 87 Met Ser Ala Lys Asp Glu Ala Lys Gly Leu Leu Lys Ser Glu Glu Leu 1 5 10 15 Tyr Lys Tyr Ile Leu Glu Thr Ser Val Tyr Pro Arg Glu Pro Glu Val 20 25 30 Leu Arg Glu Leu Arg Asn Ile Thr His Asn His Pro Gln Ala Gly Met 35 40 45 Ala Thr Ala Pro Asp Ala Gly Gln Leu Met Gly Met Leu Leu Asn Leu 50 55 60 Val Asn Ala Arg Lys Thr Ile Glu Val Gly Val Phe Thr Gly Tyr Ser 65 70 75 80 Leu Leu Leu Thr Ala Leu Thr Leu Pro Glu Asp Gly Lys Val Ile Ala 85 90 95 Ile Asp Met Asn Arg Asp Ser Tyr Glu Ile Gly Leu Pro Val Ile Lys 100 105 110 Lys Ala Gly Val Glu His Lys Ile Asp Phe Lys Glu Ser Glu Ala Leu 115 120 125 Pro Ala Leu Asp Glu Leu Leu Asn Asn Lys Val Asn Glu Gly Gly Phe 130 135 140 Asp Phe Ala Phe Val Asp Ala Asp Lys Leu Asn Tyr Trp Asn Tyr His 145 150 155 160 Glu Arg Leu Ile Arg Leu Ile Lys Val Gly Gly Ile Ile Val Tyr Asp 165 170 175 Asn Thr Leu Trp Gly Gly Ser Val Ala Glu Pro Asp Ser Ser Thr Pro 180 185 190 Glu Trp Arg Ile Glu Val Lys Lys Ala Thr Leu Glu Leu Asn Lys Lys 195 200 205 Leu Ser Ala Asp Gln Arg Val Gln Ile Ser Gln Ala Ala Leu Gly Asp 210 215 220 Gly Ile Thr Ile Cys Arg Arg Leu Tyr 225 230 <210> 88 <211> 702 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 87 <400> 88 atgtccgcta aggatgaagc caagggtttg ttgaagtctg aagaattgta caagtacatc 60 ttggaaactt ctgtttaccc aagagaacca gaagttttga gagaattgag aaacattact 120 cacaaccacc cacaagctgg tatggctact gctccagacg ctggtcaatt gatgggtatg 180 ttgttgaact tggttaacgc tagaaagact atcgaagttg gtgttttcac tggttactct 240 ttgttgttga ctgctttgac tttgccagaa gatggtaagg ttatcgccat tgacatgaac 300 agagactctt acgaaatcgg tttgccagtt atcaagaagg ctggtgttga acacaagatt 360 gatttcaagg aatctgaagc tttgccagcc ttggacgaat tgttgaacaa caaggttaac 420 gaaggtggtt tcgacttcgc tttcgttgat gctgacaagt tgaactactg gaactaccac 480 gaaagattga ttagattgat caaggttggt ggtatcatcg tttacgataa cactttgtgg 540 ggtggttctg ttgctgaacc agactcttcc actccagaat ggagaatcga agtcaagaag 600 gctaccttgg aattgaacaa gaagttgtct gctgatcaaa gagttcaaat ctctcaagct 660 gctttgggtg atggtatcac tatttgtaga agattgtact aa 702 <210> 89 <211> 222 <212> PRT <213> Homo sapiens <400> 89 Met Ser Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu Gln 1 5 10 15 His Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp Thr 20 25 30 Tyr Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys Gly 35 40 45 Lys Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu Leu 50 55 60 Glu Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg Leu 65 70 75 80 Leu Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp Cys 85 90 95 Ala Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp Lys 100 105 110 Val Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu Lys 115 120 125 Lys Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His Trp 130 135 140 Lys Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly Leu 145 150 155 160 Leu Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro Gly 165 170 175 Ala Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu Cys 180 185 190 Thr His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly Leu 195 200 205 Glu Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro 210 215 220 <210> 90 <211> 669 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 89 <400> 90 atgtccggtg acaccaagga acaaagaatc ttgaaccacg ttttgcaaca cgctgaacca 60 ggtaacgctc aatctgtttt ggaagccatt gacacctact gtgaacaaaa ggaatgggcc 120 atgaacgttg gtgacaagaa gggtaagatc gttgacgccg ttattcaaga acaccaacca 180 tccgttttgt tggaattggg tgcctactgt ggttactctg ctgttagaat ggccagattg 240 ttgtctccag gtgctagatt gatcaccatc gaaatcaacc cagactgtgc cgccatcacc 300 caaagaatgg ttgatttcgc tggtgttaag gacaaggtca ccttggttgt tggtgcttcc 360 caagacatca tcccacaatt gaagaagaag tacgatgttg acactttgga catggttttc 420 ttggaccact ggaaggacag atacttgcca gacactttgt tgttggaaga atgtggtttg 480 ttgagaaagg gtactgtttt gttggctgac aacgttatct gtccaggtgc tccagacttc 540 ttggctcacg ttagaggttc ttcttgtttc gaatgtactc actaccaatc tttcttggaa 600 tacagagaag ttgttgacgg tttggaaaag gccatctaca agggtccagg ttctgaagct 660 ggtccataa 669 <210> 91 <211> 489 <212> PRT <213> Arabidopsis thaliana <400> 91 Met Ser Gly Thr Pro Val Glu Val Ser Lys Leu His Phe Leu Leu Phe 1 5 10 15 Pro Phe Met Ala His Gly His Met Ile Pro Thr Leu Asp Met Ala Lys 20 25 30 Leu Phe Ala Thr Lys Gly Ala Lys Ser Thr Ile Leu Thr Thr Pro Leu 35 40 45 Asn Ala Lys Leu Phe Phe Glu Lys Pro Ile Lys Ser Phe Asn Gln Asp 50 55 60 Asn Pro Gly Leu Glu Asp Ile Thr Ile Gln Ile Leu Asn Phe Pro Cys 65 70 75 80 Thr Glu Leu Gly Leu Pro Asp Gly Cys Glu Asn Thr Asp Phe Ile Phe 85 90 95 Ser Thr Pro Asp Leu Asn Val Gly Asp Leu Ser Gln Lys Phe Leu Leu 100 105 110 Ala Met Lys Tyr Phe Glu Glu Pro Leu Glu Glu Leu Leu Val Thr Met 115 120 125 Arg Pro Asp Cys Leu Val Gly Asn Met Phe Phe Pro Trp Ser Thr Lys 130 135 140 Val Ala Glu Lys Phe Gly Val Pro Arg Leu Val Phe His Gly Thr Gly 145 150 155 160 Tyr Phe Ser Leu Cys Ala Ser His Cys Ile Arg Leu Pro Lys Asn Val 165 170 175 Ala Thr Ser Ser Glu Pro Phe Val Ile Pro Asp Leu Pro Gly Asp Ile 180 185 190 Leu Ile Thr Glu Glu Gln Val Met Glu Thr Glu Glu Glu Ser Val Met 195 200 205 Gly Arg Phe Met Lys Ala Ile Arg Asp Ser Glu Arg Asp Ser Phe Gly 210 215 220 Val Leu Val Asn Ser Phe Tyr Glu Leu Glu Gln Ala Tyr Ser Asp Tyr 225 230 235 240 Phe Lys Ser Phe Val Ala Lys Arg Ala Trp His Ile Gly Pro Leu Ser 245 250 255 Leu Gly Asn Arg Lys Phe Glu Glu Lys Ala Glu Arg Gly Lys Lys Ala 260 265 270 Ser Ile Asp Glu His Glu Cys Leu Lys Trp Leu Asp Ser Lys Lys Cys 275 280 285 Asp Ser Val Ile Tyr Met Ala Phe Gly Thr Met Ser Ser Phe Lys Asn 290 295 300 Glu Gln Leu Ile Glu Ile Ala Ala Gly Leu Asp Met Ser Gly His Asp 305 310 315 320 Phe Val Trp Val Val Asn Arg Lys Gly Ser Gln Val Glu Lys Glu Asp 325 330 335 Trp Leu Pro Glu Gly Phe Glu Glu Lys Thr Lys Gly Lys Gly Leu Ile 340 345 350 Ile Arg Gly Trp Ala Pro Gln Val Leu Ile Leu Glu His Lys Ala Ile 355 360 365 Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Leu Leu Glu Gly Val 370 375 380 Ala Ala Gly Leu Pro Met Val Thr Trp Pro Val Gly Ala Glu Gln Phe 385 390 395 400 Tyr Asn Glu Lys Leu Val Thr Gln Val Leu Lys Thr Gly Val Ser Val 405 410 415 Gly Val Lys Lys Met Met Gln Val Val Gly Asp Phe Ile Ser Arg Glu 420 425 430 Lys Val Glu Gly Ala Val Arg Glu Val Met Val Gly Glu Glu Arg Arg 435 440 445 Lys Arg Ala Lys Glu Leu Ala Glu Met Ala Lys Asn Ala Val Lys Glu 450 455 460 Gly Gly Ser Ser Asp Leu Glu Val Asp Arg Leu Met Glu Glu Leu Thr 465 470 475 480 Leu Val Lys Leu Gln Lys Glu Lys Val 485 <210> 92 <211> 1470 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 91 <400> 92 atgtccggta ctccagtcga agtctctaag ttgcacttct tgttgttccc attcatggct 60 cacggtcaca tgatcccaac tttggacatg gctaagttgt tcgccaccaa gggtgctaag 120 tccactatct tgactactcc attgaacgcc aagttgttct tcgaaaagcc aatcaagtct 180 ttcaaccaag acaacccagg tttggaagat atcaccatcc aaatcttgaa cttcccatgt 240 actgaattgg gtttgccaga tggttgtgaa aacactgatt tcatcttctc cactccagac 300 ttgaacgttg gtgacttgtc tcaaaagttc ttgttggcta tgaagtactt cgaagaacca 360 ttggaagaat tgttggttac tatgaggcca gactgtttgg tcggtaacat gttcttccca 420 tggtccacta aggttgctga aaagttcggt gttccaagat tggttttcca cggtactggt 480 tacttctctt tgtgtgcttc tcactgtatc agattgccaa agaacgttgc tacttcttct 540 gaaccattcg ttattccaga tttgccaggt gacattttga ttactgaaga acaagtcatg 600 gaaactgaag aagaatctgt tatgggtaga ttcatgaagg ctatcagaga ctctgaaaga 660 gattctttcg gtgttttggt taactctttc tacgaattgg aacaagctta ctctgattac 720 ttcaagtctt tcgttgctaa gagagcttgg cacatcggtc cattgtcctt gggtaacaga 780 aagttcgaag aaaaggctga aagaggtaag aaggcttcta ttgatgaaca cgaatgtttg 840 aagtggttgg actccaagaa gtgtgattct gttatttaca tggccttcgg taccatgtcc 900 tctttcaaga acgaacaatt gatcgaaatt gctgctggtt tggatatgtc tggtcacgat 960 ttcgtctggg ttgttaacag aaagggttct caagttgaaa aggaagattg gttgccagaa 1020 ggtttcgaag aaaagaccaa gggtaagggt ttgatcatca gaggttgggc tccacaagtt 1080 ttgatcttgg aacacaaggc tattggtggt ttcttgactc actgtggttg gaactctttg 1140 ttggaaggtg ttgctgctgg tttgccaatg gttacttggc cagttggtgc cgaacaattc 1200 tacaacgaaa agttggttac tcaagtttta aagactggtg tttctgttgg tgttaagaag 1260 atgatgcaag ttgttggtga cttcatttct agagaaaagg ttgaaggtgc tgttagagaa 1320 gttatggttg gtgaagaaag aagaaagaga gccaaggaat tggctgaaat ggctaagaac 1380 gctgttaagg aaggtggttc ttctgatttg gaagttgata gattgatgga agaattgact 1440 ttggttaagt tgcaaaagga aaaggtttaa 1470 <210> 93 <211> 470 <212> PRT <213> Scutellaria baicalensis <400> 93 Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly 1 5 10 15 His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly 20 25 30 Val Arg Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg 35 40 45 Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe 50 55 60 Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Leu Ser Leu Asp Gln 65 70 75 80 Val Thr His Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu 85 90 95 Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu 100 105 110 Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe 115 120 125 Gly Ile Pro Arg Leu Leu Phe His Gly Thr Ser Leu Phe Ala Arg Cys 130 135 140 Phe Ala Glu Gln Met Ser Leu Gln Lys Pro Tyr Lys Asn Val Ser Ser 145 150 155 160 Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe 165 170 175 Val Arg Thr Gln Ile Pro Gly Tyr Glu Leu Gln Glu Gly Gly Asp Asp 180 185 190 Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser 195 200 205 Tyr Gly Asp Val Ile Asn Ser Phe Glu Glu Leu Glu Ser Glu Tyr Val 210 215 220 Asp His Tyr Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro 225 230 235 240 Leu Ser Leu Cys Asn Asn Arg Ala Glu Gln Lys Ser Pro Ile Asp Asp 245 250 255 His Glu Cys Leu Ala Trp Leu Asn Ser Lys Lys Pro Asn Ser Val Val 260 265 270 Tyr Met Cys Phe Gly Ser Met Ala Thr Phe Ser Pro Ala Gln Leu His 275 280 285 Glu Thr Ala Val Gly Leu Glu Ser Ser Gly Gln Asp Phe Ile Trp Val 290 295 300 Val Arg Asn Gly Gly Glu Asn Glu Asp Trp Leu Pro Gln Gly Phe Glu 305 310 315 320 Glu Arg Ile Lys Gly Lys Gly Leu Met Ile Arg Gly Trp Ala Pro Gln 325 330 335 Val Val Ile Leu Asp His Pro Ser Thr Gly Ala Phe Val Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Leu Glu Gly Ile Cys Ala Gly Leu Pro Met Val 355 360 365 Thr Trp Pro Val Phe Ala Glu Gln Phe Tyr Asn Glu Lys Leu Val Thr 370 375 380 Glu Val Leu Lys Thr Gly Val Ser Val Gly Asn Lys Lys Trp Gln Arg 385 390 395 400 Val Gly Glu Trp Val Gly Ser Glu Ala Val Lys Glu Ala Val Glu Trp 405 410 415 Val Met Val Gly Asp Gly Ala Ala Glu Met Arg Ser Arg Ala Asn Tyr 420 425 430 Tyr Lys Glu Met Ala Arg Lys Ala Val Glu Asp Gly Gly Ser Ser Tyr 435 440 445 Asn Asn Leu Asn Ala Leu Ile Gln Glu Leu Ser Ala Tyr Val Pro Pro 450 455 460 Met Lys Gln Gly Leu Asn 465 470 <210> 94 <211> 1413 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 93 <400> 94 atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60 atgttggaca tggccaagtt gttctcttcc agaggtgtca gaaccaccat catcgccact 120 ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180 accaccaagt tcccaccaaa gggttcctct ttgccagaca acatcttgtc tttggatcaa 240 gttactcacg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300 gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360 actaccgact ctgctgccaa gttcggtatt ccaagattgt tgttccacgg tacctctttg 420 ttcgctagat gtttcgctga acaaatgtct ttgcaaaagc catacaagaa cgtttcttct 480 gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540 atcccaggtt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600 atgagagatg ctgataagaa gtcttacggt gacgttatca actctttcga agaattggaa 660 tctgaatacg ttgatcacta caagaacgtt ttcggtaaga aggcttggca catcggtcca 720 ttgtctttgt gtaacaacag agctgaacaa aagtctccaa tcgacgatca cgaatgtttg 780 gcttggttga actctaagaa gccaaactct gttgtttaca tgtgtttcgg ttctatggcc 840 actttctctc cagcccaatt gcacgaaact gctgtcggtt tggaatcctc tggtcaagat 900 ttcatctggg ttgttagaaa cggtggtgaa aacgaagatt ggttgccaca aggtttcgaa 960 gaaagaatca agggtaaggg tttgatgatc agaggttggg ccccacaagt tgttattttg 1020 gatcacccat ctactggtgc tttcgttact cactgtggtt ggaactctac tttggaaggt 1080 atctgtgctg gtttgccaat ggttacttgg ccagttttcg ctgaacaatt ctacaacgaa 1140 aagttggtta ctgaagtttt aaagactggt gtttctgttg gtaacaagaa gtggcaaaga 1200 gttggtgaat gggttggttc tgaagccgtt aaggaagctg ttgaatgggt catggtcggt 1260 gacggtgctg ctgaaatgag atctagagct aactactaca aggaaatggc tagaaaggct 1320 gttgaagatg gtggttcttc ttacaacaac ttgaacgctt tgatccaaga attgtctgcc 1380 tacgtcccac caatgaagca aggtttgaac taa 1413 <210> 95 <211> 470 <212> PRT <213> Scutellaria baicalensis <400> 95 Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly 1 5 10 15 His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly 20 25 30 Val Lys Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg 35 40 45 Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe 50 55 60 Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Trp Ser Leu Asp Gln 65 70 75 80 Val Thr Asp Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu 85 90 95 Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu 100 105 110 Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe 115 120 125 Gly Ile Pro Arg Leu Leu Phe His Gly Thr Ser Leu Phe Ala Arg Cys 130 135 140 Phe Ala Glu Gln Met Ser Leu Gln Lys Pro Tyr Lys Asn Val Ser Ser 145 150 155 160 Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe 165 170 175 Val Arg Thr Gln Ile Pro Gly Tyr Glu Leu Gln Glu Gly Gly Asp Asp 180 185 190 Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser 195 200 205 Tyr Gly Asp Val Ile Asn Asn Phe Glu Glu Leu Glu Ser Glu Tyr Val 210 215 220 Asp His Tyr Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro 225 230 235 240 Leu Ser Leu Cys Asn Asn Arg Ala Glu Gln Lys Ser Pro Ile Asp Asp 245 250 255 His Glu Cys Leu Ala Trp Leu Asn Ser Lys Lys Pro Asn Ser Val Val 260 265 270 Tyr Met Cys Phe Gly Ser Met Ala Thr Phe Thr Pro Ala Gln Leu His 275 280 285 Glu Thr Ala Val Gly Leu Glu Ser Ser Gly Gln Asp Phe Ile Trp Val 290 295 300 Val Arg Asn Gly Gly Glu Asn Glu Asp Trp Leu Pro Gln Gly Phe Glu 305 310 315 320 Glu Arg Ile Lys Gly Lys Gly Leu Met Ile Arg Gly Trp Ala Pro Gln 325 330 335 Val Met Ile Leu Asp His Pro Ser Thr Gly Ala Phe Val Thr His Cys 340 345 350 Gly Trp Asn Ser Thr Leu Glu Gly Ile Cys Ala Gly Leu Pro Met Val 355 360 365 Thr Trp Pro Val Phe Ala Glu Gln Phe Tyr Asn Glu Lys Leu Val Thr 370 375 380 Glu Val Leu Lys Thr Gly Val Ser Val Gly Asn Lys Lys Trp Gln Arg 385 390 395 400 Val Gly Glu Gly Val Gly Ser Glu Ala Val Lys Glu Ala Val Glu Arg 405 410 415 Val Met Val Gly Asp Gly Ala Ala Glu Met Arg Ser Arg Ala Ile Tyr 420 425 430 Tyr Lys Glu Met Ala Arg Lys Ala Val Glu Glu Gly Gly Ser Ser Tyr 435 440 445 Asn Asn Leu Asn Ala Leu Ile Glu Glu Leu Ser Ala Tyr Val Pro Pro 450 455 460 Met Lys Gln Gly Leu Asn 465 470 <210> 96 <211> 1413 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 95 <400> 96 atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60 atgttggaca tggccaagtt gttctcttcc agaggtgtca agaccaccat catcgccact 120 ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180 accaccaagt tcccaccaaa gggttcctct ttgccagaca acatctggtc tttggatcaa 240 gttactgatg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300 gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360 actaccgact ctgctgccaa gttcggtatt ccaagattgt tgttccacgg tacctctttg 420 ttcgctagat gtttcgctga acaaatgtct ttgcaaaagc catacaagaa cgtttcttct 480 gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540 atcccaggtt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600 atgagagatg ctgataagaa gtcttacggt gacgttatca acaacttcga agaattggaa 660 tctgaatacg ttgatcacta caagaacgtt ttcggtaaga aggcttggca catcggtcca 720 ttgtctttgt gtaacaacag agctgaacaa aagtctccaa tcgacgatca cgaatgtttg 780 gcttggttga actctaagaa gccaaactct gttgtttaca tgtgtttcgg ttctatggcc 840 actttcactc cagcccaatt gcacgaaact gctgtcggtt tggaatcctc tggtcaagat 900 ttcatctggg ttgttagaaa cggtggtgaa aacgaagatt ggttgccaca aggtttcgaa 960 gaaagaatca agggtaaggg tttgatgatc agaggttggg ccccacaagt tatgattttg 1020 gatcacccat ctactggtgc tttcgttact cactgtggtt ggaactctac tttggaaggt 1080 atctgtgctg gtttgccaat ggttacttgg ccagttttcg ctgaacaatt ctacaacgaa 1140 aagttggtta ctgaagtttt aaagactggt gtttctgttg gtaacaagaa gtggcaaaga 1200 gttggtgaag gtgttggttc tgaagctgtt aaggaagctg ttgaaagagt catggtcggt 1260 gacggtgctg ctgaaatgag atctagagct atctactaca aggaaatggc tagaaaggct 1320 gttgaagaag gtggttcttc ttacaacaac ttgaacgctt tgatcgaaga attgtctgcc 1380 tacgtcccac caatgaagca aggtttgaac taa 1413 <210> 97 <211> 477 <212> PRT <213> Scutellaria baicalensis <400> 97 Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly 1 5 10 15 His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly 20 25 30 Val Lys Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg 35 40 45 Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe 50 55 60 Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Arg Ser Leu Asp Gln 65 70 75 80 Val Thr Gly Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu 85 90 95 Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu 100 105 110 Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe 115 120 125 Gly Ile Pro Arg Leu Val Phe His Gly Thr Ser Leu Phe Ala Arg Cys 130 135 140 Phe Ser Glu Gln Met Ser Ile Gln Lys Pro Tyr Lys Asn Val Ser Ser 145 150 155 160 Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe 165 170 175 Val Arg Thr Gln Ile Pro Asp Tyr Glu Leu Gln Glu Gly Gly Asp Asp 180 185 190 Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser 195 200 205 Tyr Gly Asp Val Ile Asn Ser Phe Glu Glu Leu Glu Ser Glu Tyr Ala 210 215 220 Asp Tyr Asn Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro 225 230 235 240 Leu Lys Leu Phe Asn Asn Arg Ala Glu Gln Lys Ser Ser Gln Arg Gly 245 250 255 Lys Glu Ser Ala Ile Asp Asp His Glu Cys Leu Ala Trp Leu Asn Ser 260 265 270 Lys Lys Pro Asn Ser Val Val Tyr Met Cys Phe Gly Ser Met Ala Thr 275 280 285 Phe Thr Pro Ala Gln Leu His Glu Thr Ala Val Gly Leu Glu Ser Ser 290 295 300 Gly Gln Asp Phe Ile Trp Val Val Arg Asn Gly Gly Lys Asn Glu Asp 305 310 315 320 Trp Leu Pro Gln Gly Phe Glu Glu Arg Ile Lys Gly Lys Gly Leu Met 325 330 335 Ile Arg Gly Trp Ala Pro Gln Val Met Ile Leu Asp His Pro Ser Thr 340 345 350 Gly Ala Phe Val Thr His Cys Gly Trp Asn Ser Thr Leu Glu Gly Ile 355 360 365 Cys Ala Gly Leu Pro Met Val Thr Trp Pro Val Phe Ala Glu Gln Phe 370 375 380 Tyr Asn Glu Lys Leu Val Thr Glu Val Leu Lys Thr Gly Val Ser Val 385 390 395 400 Gly Asn Lys Lys Trp Gln Arg Val Gly Glu Gly Val Gly Ser Glu Ala 405 410 415 Val Lys Glu Ala Val Glu Arg Val Met Val Gly Asp Gly Ala Ala Glu 420 425 430 Met Arg Ser Arg Ala Val Tyr Tyr Lys Glu Met Ala Arg Lys Ala Val 435 440 445 Glu Glu Gly Gly Ser Ser Tyr Asn Asn Leu Asn Ala Leu Ile Gln Glu 450 455 460 Leu Ser Ala Tyr Val Pro Pro Met Lys Gln Gly Leu Asn 465 470 475 <210> 98 <211> 1434 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO:97 <400> 98 atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60 atgttggaca tggccaagtt gttctcttcc agaggtgtca agaccaccat catcgccact 120 ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180 accaccaagt tcccaccaaa gggttcctct ttgccagaca acatcagatc tttggatcaa 240 gttactggtg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300 gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360 actaccgact ctgctgccaa gttcggtatt ccaagattgg ttttccacgg tacctctttg 420 ttcgctagat gtttctctga acaaatgtct atccaaaagc catacaagaa cgtttcttct 480 gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540 atcccagatt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600 atgagagatg ctgataagaa gtcttacggt gacgttatca actctttcga agaattggaa 660 tctgaatacg ctgattacaa caagaacgtt ttcggtaaga aggcttggca catcggtcca 720 ttgaagttgt tcaacaacag agctgaacaa aagtcatctc aaagaggtaa ggaatctgcc 780 atcgacgatc acgaatgttt ggcttggttg aactctaaga agccaaactc tgttgtttac 840 atgtgtttcg gttctatggc cactttcact ccagcccaat tgcacgaaac tgctgtcggt 900 ttggaatcct ctggtcaaga tttcatctgg gttgttagaa acggtggtaa gaacgaagat 960 tggttgccac aaggtttcga agaaagaatc aagggtaagg gtttgatgat cagaggttgg 1020 gccccacaag ttatgatttt ggatcaccca tctactggtg ctttcgttac tcactgtggt 1080 tggaactcta ctttggaagg tatctgtgcc ggtttgccaa tggttacttg gccagttttc 1140 gctgaacaat tctacaacga aaagttggtt actgaagttt taaagactgg tgtttctgtt 1200 ggtaacaaga agtggcaaag agttggtgaa ggtgttggtt ctgaagctgt taaggaagct 1260 gttgaaagag tcatggtcgg tgacggtgct gctgaaatga gatctagagc tgtctactac 1320 aaggaaatgg ctagaaaggc tgttgaagaa ggtggttctt cttacaacaa cttgaacgct 1380 ttgatccaag aattgtctgc ctacgttcca ccaatgaagc aaggtttgaa ctaa 1434 <210> 99 <211> 533 <212> PRT <213> Homo sapiens <400> 99 Met Ser Ala Cys Leu Leu Arg Ser Phe Gln Arg Ile Ser Ala Gly Val 1 5 10 15 Phe Phe Leu Ala Leu Trp Gly Met Val Val Gly Asp Lys Leu Leu Val 20 25 30 Val Pro Gln Asp Gly Ser His Trp Leu Ser Met Lys Asp Ile Val Glu 35 40 45 Val Leu Ser Asp Arg Gly His Glu Ile Val Val Val Val Pro Glu Val 50 55 60 Asn Leu Leu Leu Lys Glu Ser Lys Tyr Tyr Thr Arg Lys Ile Tyr Pro 65 70 75 80 Val Pro Tyr Asp Gln Glu Glu Leu Lys Asn Arg Tyr Gln Ser Phe Gly 85 90 95 Asn Asn His Phe Ala Glu Arg Ser Phe Leu Thr Ala Pro Gln Thr Glu 100 105 110 Tyr Arg Asn Asn Met Ile Val Ile Gly Leu Tyr Phe Ile Asn Cys Gln 115 120 125 Ser Leu Leu Gln Asp Arg Asp Thr Leu Asn Phe Phe Lys Glu Ser Lys 130 135 140 Phe Asp Ala Leu Phe Thr Asp Pro Ala Leu Pro Cys Gly Val Ile Leu 145 150 155 160 Ala Glu Tyr Leu Gly Leu Pro Ser Val Tyr Leu Phe Arg Gly Phe Pro 165 170 175 Cys Ser Leu Glu His Thr Phe Ser Arg Ser Pro Asp Pro Val Ser Tyr 180 185 190 Ile Pro Arg Cys Tyr Thr Lys Phe Ser Asp His Met Thr Phe Ser Gln 195 200 205 Arg Val Ala Asn Phe Leu Val Asn Leu Leu Glu Pro Tyr Leu Phe Tyr 210 215 220 Cys Leu Phe Ser Lys Tyr Glu Glu Leu Ala Ser Ala Val Leu Lys Arg 225 230 235 240 Asp Val Asp Ile Ile Thr Leu Tyr Gln Lys Val Ser Val Trp Leu Leu 245 250 255 Arg Tyr Asp Phe Val Leu Glu Tyr Pro Arg Pro Val Met Pro Asn Met 260 265 270 Val Phe Ile Gly Gly Ile Asn Cys Lys Lys Arg Lys Asp Leu Ser Gln 275 280 285 Glu Phe Glu Ala Tyr Ile Asn Ala Ser Gly Glu His Gly Ile Val Val 290 295 300 Phe Ser Leu Gly Ser Met Val Ser Glu Ile Pro Glu Lys Lys Ala Met 305 310 315 320 Ala Ile Ala Asp Ala Leu Gly Lys Ile Pro Gln Thr Val Leu Trp Arg 325 330 335 Tyr Thr Gly Thr Arg Pro Ser Asn Leu Ala Asn Asn Thr Ile Leu Val 340 345 350 Lys Trp Leu Pro Gln Asn Asp Leu Leu Gly His Pro Met Thr Arg Ala 355 360 365 Phe Ile Thr His Ala Gly Ser His Gly Val Tyr Glu Ser Ile Cys Asn 370 375 380 Gly Val Pro Met Val Met Met Pro Leu Phe Gly Asp Gln Met Asp Asn 385 390 395 400 Ala Lys Arg Met Glu Thr Lys Gly Ala Gly Val Thr Leu Asn Val Leu 405 410 415 Glu Met Thr Ser Glu Asp Leu Glu Asn Ala Leu Lys Ala Val Ile Asn 420 425 430 Asp Lys Ser Tyr Lys Glu Asn Ile Met Arg Leu Ser Ser Leu His Lys 435 440 445 Asp Arg Pro Val Glu Pro Leu Asp Leu Ala Val Phe Trp Val Glu Phe 450 455 460 Val Met Arg His Lys Gly Ala Pro His Leu Arg Pro Ala Ala His Asp 465 470 475 480 Leu Thr Trp Tyr Gln Tyr His Ser Leu Asp Val Ile Gly Phe Leu Leu 485 490 495 Ala Val Val Leu Thr Val Ala Phe Ile Thr Phe Lys Cys Cys Ala Tyr 500 505 510 Gly Tyr Arg Lys Cys Leu Gly Lys Lys Gly Arg Val Lys Lys Ala His 515 520 525 Lys Ser Lys Thr His 530 <210> 100 <211> 1602 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 99 <400> 100 atgtccgcct gtttgttgag atctttccaa agaatttctg ctggtgtttt cttcttggct 60 ttgtggggta tggttgttgg tgacaagttg ttggttgtcc cacaagacgg ttctcactgg 120 ttgtctatga aggatatcgt tgaagttttg tctgacagag gtcacgaaat tgttgttgtt 180 gttccagaag ttaacttgtt gttgaaggaa tccaagtact acactagaaa gatctaccca 240 gttccatacg accaagaaga attgaagaac agataccaat ctttcggtaa caaccacttc 300 gctgaaagat ctttcttgac tgctccacaa actgaataca gaaacaacat gattgttatt 360 ggtttgtact tcatcaactg tcaatctttg ttgcaagaca gagacacctt gaacttcttc 420 aaggaatcta agttcgatgc tttgttcact gacccagcct tgccatgtgg tgttatcttg 480 gctgaatact tgggtttgcc atctgtttac ttgttcagag gtttcccatg ttccttggaa 540 cacactttct ctagatctcc agacccagtt tcctacattc caagatgtta cactaagttc 600 tctgaccaca tgactttctc ccaaagagtt gccaacttct tggttaactt gttggaacca 660 tacttgttct actgtttgtt ctctaagtac gaagaattgg cttctgctgt cttgaagaga 720 gatgttgata tcatcacctt gtaccaaaag gtatctgttt ggttgttgag atacgacttc 780 gttttggaat acccaagacc agtcatgcca aacatggtat tcattggtgg tatcaactgt 840 aagaagagaa aggacttgtc tcaagaattc gaagcctaca ttaacgcttc tggtgaacac 900 ggtattgttg ttttctcttt gggttctatg gtatctgaaa ttccagaaaa gaaggctatg 960 gctattgctg atgctttggg taagatccca caaactgtct tgtggagata cactggtacc 1020 agaccatcta acttggctaa caacactatc ttggttaagt ggttgccaca aaacgatttg 1080 ttgggtcacc caatgaccag agccttcatc acccacgctg gttcccacgg tgtttacgaa 1140 tctatctgta acggtgttcc aatggttatg atgccattgt tcggtgatca aatggacaac 1200 gctaagagaa tggaaactaa gggtgctggt gttaccttga acgttttgga aatgacttct 1260 gaagatttgg aaaacgcttt gaaggctgtc atcaacgaca agtcttacaa ggaaaacatc 1320 atgagattgt cctctttgca caaggacaga ccagttgaac cattggactt ggccgttttc 1380 tgggttgaat tcgttatgag acacaagggt gctccacact taagaccagc tgcccacgac 1440 ttgacctggt accaatacca ctccttggac gttattggtt tcttgttggc cgtcgttttg 1500 actgttgcct tcatcacctt caagtgttgt gcttacggtt acagaaagtg tttgggtaag 1560 aagggtagag ttaagaaggc ccacaagtcc aagacccact aa 1602 <210> 101 <211> 531 <212> PRT <213> Homo sapiens <400> 101 Met Val Ala Arg Ala Gly Trp Thr Gly Leu Leu Pro Leu Tyr Val Cys 1 5 10 15 Leu Leu Leu Thr Cys Gly Phe Ala Lys Ala Gly Lys Leu Leu Val Val 20 25 30 Pro Met Asp Gly Ser His Trp Phe Thr Met Gln Ser Val Val Glu Lys 35 40 45 Leu Ile Leu Arg Gly His Glu Val Val Val Val Met Pro Glu Val Ser 50 55 60 Trp Gln Leu Gly Arg Ser Leu Asn Cys Thr Val Lys Thr Tyr Ser Thr 65 70 75 80 Ser Tyr Thr Leu Glu Asp Gln Asp Arg Glu Phe Met Val Phe Ala Asp 85 90 95 Ala Arg Trp Thr Ala Pro Leu Arg Ser Ala Phe Ser Leu Leu Thr Ser 100 105 110 Ser Ser Asn Gly Ile Phe Asp Leu Phe Phe Ser Asn Cys Arg Ser Leu 115 120 125 Phe Asn Asp Arg Lys Leu Val Glu Tyr Leu Lys Glu Ser Cys Phe Asp 130 135 140 Ala Val Phe Leu Asp Pro Phe Asp Ala Cys Gly Leu Ile Val Ala Lys 145 150 155 160 Tyr Phe Ser Leu Pro Ser Val Val Phe Ala Arg Gly Ile Phe Cys His 165 170 175 Tyr Leu Glu Glu Gly Ala Gln Cys Pro Ala Pro Leu Ser Tyr Val Pro 180 185 190 Arg Leu Leu Leu Gly Phe Ser Asp Ala Met Thr Phe Lys Glu Arg Val 195 200 205 Trp Asn His Ile Met His Leu Glu Glu His Leu Phe Cys Pro Tyr Phe 210 215 220 Phe Lys Asn Val Leu Glu Ile Ala Ser Glu Ile Leu Gln Thr Pro Val 225 230 235 240 Thr Ala Tyr Asp Leu Tyr Ser His Thr Ser Ile Trp Leu Leu Arg Thr 245 250 255 Asp Phe Val Leu Glu Tyr Pro Lys Pro Val Met Pro Asn Met Ile Phe 260 265 270 Ile Gly Gly Ile Asn Cys His Gln Gly Lys Pro Val Pro Met Glu Phe 275 280 285 Glu Ala Tyr Ile Asn Ala Ser Gly Glu His Gly Ile Val Val Phe Ser 290 295 300 Leu Gly Ser Met Val Ser Glu Ile Pro Glu Lys Lys Ala Met Ala Ile 305 310 315 320 Ala Asp Ala Leu Gly Lys Ile Pro Gln Thr Val Leu Trp Arg Tyr Thr 325 330 335 Gly Thr Arg Pro Ser Asn Leu Ala Asn Asn Thr Ile Leu Val Lys Trp 340 345 350 Leu Pro Gln Asn Asp Leu Leu Gly His Pro Met Thr Arg Ala Phe Ile 355 360 365 Thr His Ala Gly Ser His Gly Val Tyr Glu Ser Ile Cys Asn Gly Val 370 375 380 Pro Met Val Met Met Pro Leu Phe Gly Asp Gln Met Asp Asn Ala Lys 385 390 395 400 Arg Met Glu Thr Lys Gly Ala Gly Val Thr Leu Asn Val Leu Glu Met 405 410 415 Thr Ser Glu Asp Leu Glu Asn Ala Leu Lys Ala Val Ile Asn Asp Lys 420 425 430 Ser Tyr Lys Glu Asn Ile Met Arg Leu Ser Ser Leu His Lys Asp Arg 435 440 445 Pro Val Glu Pro Leu Asp Leu Ala Val Phe Trp Val Glu Phe Val Met 450 455 460 Arg His Lys Gly Ala Pro His Leu Arg Pro Ala Ala His Asp Leu Thr 465 470 475 480 Trp Tyr Gln Tyr His Ser Leu Asp Val Ile Gly Phe Leu Leu Ala Val 485 490 495 Val Leu Thr Val Ala Phe Ile Thr Phe Lys Cys Cys Ala Tyr Gly Tyr 500 505 510 Arg Lys Cys Leu Gly Lys Lys Gly Arg Val Lys Lys Ala His Lys Ser 515 520 525 Lys Thr His 530 <210> 102 <211> 1596 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 101 <400> 102 atgtccgcta gagctggttg gactggtttg ttgccattgt acgtttgttt gttgttgacc 60 tgtggtttcg ccaaggctgg taagttgttg gttgttccaa tggatggttc tcactggttc 120 accatgcaat ctgttgttga aaagttgatc ttgagaggtc acgaagttgt cgttgtcatg 180 ccagaagttt cttggcaatt gggtagatct ttgaactgta ctgttaagac ttactctacc 240 tcttacactt tggaagatca agacagagaa ttcatggttt tcgccgatgc tagatggact 300 gctccattga gatctgcttt ctctttgttg acttcttctt ccaacggtat tttcgacttg 360 ttcttctcta actgtagatc tttgttcaac gacagaaagt tggttgaata cttgaaggaa 420 tcttgtttcg atgctgtttt cttggatcca ttcgatgcct gtggtttgat tgttgccaag 480 tacttctcct tgccatctgt tgtattcgcc agaggtatct tctgtcacta cttggaagaa 540 ggtgctcaat gtccagctcc attgtcctac gtcccaagat tgttgttggg tttctctgac 600 gccatgactt tcaaggaaag agtttggaac cacatcatgc acttggaaga acacttgttc 660 tgtccatact tcttcaagaa cgtcttggaa atcgcctctg aaattttgca aaccccagtc 720 actgcttacg atttgtactc tcacacttct atttggttgt tgagaactga cttcgttttg 780 gaatacccaa agccagttat gccaaacatg atcttcattg gtggtatcaa ctgtcaccaa 840 ggtaagccag ttccaatgga attcgaagcc tacattaacg cttctggtga acacggtatt 900 gttgttttct ctttgggttc tatggtatct gaaattccag aaaagaaggc tatggctatt 960 gctgatgctt tgggtaagat cccacaaact gtcttgtgga gatacactgg taccagacca 1020 tctaacttgg ctaacaacac tatcttggtt aagtggttgc cacaaaacga tttgttgggt 1080 cacccaatga ccagagcctt catcacccac gctggttccc acggtgttta cgaatctatc 1140 tgtaacggtg ttccaatggt tatgatgcca ttgttcggtg atcaaatgga caacgctaag 1200 agaatggaaa ctaagggtgc tggtgttacc ttgaacgttt tggaaatgac ttctgaagat 1260 ttggaaaacg ctttgaaggc tgtcatcaac gacaagtctt acaaggaaaa catcatgaga 1320 ttgtcctctt tgcacaagga cagaccagtt gaaccattgg acttggccgt tttctgggtt 1380 gaattcgtta tgagacacaa gggtgctcca cacttaagac cagctgccca cgacttgacc 1440 tggtaccaat accactcctt ggacgttatt ggtttcttgt tggccgtcgt tttgactgtt 1500 gccttcatca ccttcaagtg ttgtgcttac ggttacagaa agtgtttggg taagaagggt 1560 agagttaaga aggcccacaa gtccaagacc cactaa 1596 <210> 103 <211> 482 <212> PRT <213> Citrus clementina <400> 103 Met Ser His Ala Ser Ser Asn Met His Ala Pro Ser Asn Gln His His 1 5 10 15 Lys Met Gly Thr Glu Ser Ala Glu Ala Asp Gln Leu His Val Val Met 20 25 30 Phe Pro Trp Phe Ala Phe Gly His Ile Ser Pro Phe Val Gln Leu Ser 35 40 45 Asn Lys Leu Ser Leu His Gly Val Lys Val Ser Phe Phe Ser Ala Pro 50 55 60 Gly Asn Ile Pro Arg Ile Lys Ser Ser Leu Asn Leu Thr Pro Met Ala 65 70 75 80 Asp Ile Ile Pro Leu Gln Ile Pro His Val Asp Gly Leu Pro Pro Gly 85 90 95 Leu Asp Ser Thr Ser Glu Met Thr Pro His Met Ala Glu Leu Leu Lys 100 105 110 Gln Ala Leu Asp Leu Met Gln Pro Gln Ile Lys Thr Leu Leu Ser Gln 115 120 125 Leu Lys Pro His Phe Val Phe Phe Asp Phe Thr His Tyr Trp Leu Pro 130 135 140 Gly Leu Val Gly Ser Gln Leu Gly Ile Lys Thr Val Asn Phe Ser Val 145 150 155 160 Phe Ser Ala Ile Ser Gln Ala Tyr Leu Val Val Pro Ala Arg Lys Leu 165 170 175 Asn Asn Ser Leu Ala Asp Leu Met Lys Ser Pro Asp Gly Phe Pro Ala 180 185 190 Thr Ser Ile Thr Ser Leu Asp Glu Phe Val Ala Arg Asp Tyr Leu Tyr 195 200 205 Val Tyr Thr Lys Phe Asn Gly Gly Pro Ser Val Tyr Glu Arg Gly Ile 210 215 220 Gln Gly Val Asp Gly Cys Asp Val Leu Ala Ile Lys Thr Cys Asn Glu 225 230 235 240 Met Glu Gly Pro Tyr Leu Asp Phe Val Arg Thr Gln Phe Lys Lys Pro 245 250 255 Val Leu Leu Thr Gly Pro Leu Val Asn Pro Glu Pro Pro Ser Gly Glu 260 265 270 Leu Glu Glu Arg Trp Ala Lys Trp Leu Cys Lys Tyr Pro Pro Lys Ser 275 280 285 Val Ile Tyr Cys Ser Phe Gly Ser Glu Thr Phe Leu Thr Val Asp Gln 290 295 300 Ile Lys Glu Leu Ala Ile Gly Leu Glu Ile Thr Gly Leu Pro Phe Phe 305 310 315 320 Leu Val Leu Asn Phe Pro Pro Asn Val Asp Ala Gln Ser Glu Leu Val 325 330 335 Arg Thr Leu Pro Pro Gly Phe Met Asp Arg Val Lys Asp Arg Gly Val 340 345 350 Val His Thr Gly Trp Val Gln Gln Gln Leu Ile Leu Arg His Glu Ser 355 360 365 Val Gly Cys Tyr Val Cys His Ser Gly Phe Ser Ser Val Thr Glu Ala 370 375 380 Val Ile Ser Asp Cys Gln Leu Val Leu Leu Pro Leu Lys Gly Asp Gln 385 390 395 400 Phe Leu Asn Ser Lys Leu Val Ala Gly Asp Leu Lys Ala Gly Val Glu 405 410 415 Val Asn Arg Arg Asp His Asp Gly His Phe Gly Lys Glu Asp Ile Phe 420 425 430 Lys Ala Val Lys Thr Val Met Val Asp Val Asn Lys Glu Pro Gly Ala 435 440 445 Ser Ile Arg Ala Asn Gln Lys Trp Trp Arg Glu Phe Leu Leu Asn Gly 450 455 460 Gln Ile Gln Asp Lys Phe Ile Ala Asp Phe Val Lys Asp Leu Lys Thr 465 470 475 480 Leu Ala <210> 104 <211> 1449 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 103 <400> 104 atgtcccacg cctcttctaa catgcacgcc ccatctaacc aacaccacaa gatgggtact 60 gaatctgctg aagctgatca attgcacgtt gttatgttcc catggttcgc tttcggtcac 120 atctctccat tcgttcaatt gtccaacaag ttgtctttgc acggtgtcaa ggtatctttc 180 ttctctgctc caggtaacat tccaagaatc aagtcatctt tgaacttgac tccaatggcc 240 gacattatcc cattgcaaat cccacacgtc gatggtttgc caccaggttt ggattctacc 300 tctgaaatga ctccacacat ggctgaattg ttgaagcaag ccttggactt gatgcaacca 360 caaatcaaga ctttgttgtc tcaattgaag ccacacttcg ttttcttcga tttcacccac 420 tactggttgc caggtttggt tggttctcaa ttgggtatca agactgttaa cttctctgtt 480 ttctctgcca tttctcaagc ctacttggtt gttccagcca gaaagttgaa caactctttg 540 gctgatttga tgaagtctcc agatggtttc ccagctactt ccattacctc tttggatgaa 600 ttcgttgcta gagattactt gtacgtttac actaagttca acggtggtcc atctgtttac 660 gaaagaggta ttcaaggtgt tgatggttgt gatgttttgg ccatcaagac ttgtaacgaa 720 atggaaggtc catacttgga tttcgttaga acccaattca agaagccagt tttgttgacc 780 ggtccattgg ttaacccaga accaccatcc ggtgaattgg aagaaagatg ggctaagtgg 840 ttgtgtaagt acccaccaaa gtctgttatt tactgttcct tcggttctga aactttcttg 900 accgttgatc aaatcaagga attggccatt ggtttggaaa ttactggttt gccattcttc 960 ttggtcttga acttcccacc aaacgtcgat gctcaatctg aattggtcag aactttgcca 1020 ccaggtttca tggacagagt taaggacaga ggtgttgttc acactggttg ggttcaacaa 1080 caattgattt tgagacacga atctgttggt tgttacgttt gtcactctgg tttctcttct 1140 gttactgaag ctgttatttc tgattgtcaa ttggttttgt tgccattgaa gggtgaccaa 1200 ttcttgaact ccaagttggt tgctggtgac ttgaaggctg gtgttgaagt taacagaaga 1260 gatcacgatg gtcacttcgg taaggaagat attttcaagg ctgttaagac tgttatggtt 1320 gatgttaaca aggaaccagg tgcttctatc agagctaacc aaaagtggtg gagagaattc 1380 ttgttgaacg gtcaaattca agataagttc attgctgatt tcgtcaagga tttaaagacc 1440 ttggcttaa 1449 <210> 105 <211> 476 <212> PRT <213> Citrus sinensis <400> 105 Met Ser His Ala Pro Ser Asn Gln His His Lys Met Gly Thr Glu Ser 1 5 10 15 Ala Glu Ala Asp Gln Leu His Val Val Met Phe Pro Trp Phe Ala Ser 20 25 30 Gly His Ile Ser Pro Phe Val Gln Leu Ser Asn Lys Leu Ser Leu His 35 40 45 Gly Val Lys Val Ser Phe Phe Ser Ala Pro Gly Asn Ile Pro Arg Ile 50 55 60 Lys Ser Ser Leu Asn Leu Thr Pro Met Ala Asp Ile Ile Pro Leu Gln 65 70 75 80 Ile Pro His Val Asp Gly Leu Pro Pro Gly Leu Asp Ser Thr Ser Glu 85 90 95 Met Thr Pro His Met Ala Glu Leu Leu Lys Gln Ala Leu Asp Leu Met 100 105 110 Gln Pro Gln Ile Lys Thr Leu Leu Ser Gln Leu Lys Pro His Phe Val 115 120 125 Phe Phe Asp Phe Thr His Tyr Trp Leu Pro Gly Leu Val Gly Ser Gln 130 135 140 Leu Gly Ile Lys Thr Val Asn Phe Ser Val Phe Ser Ala Ile Ser Gln 145 150 155 160 Ala Tyr Leu Val Val Pro Ala Arg Lys Leu Asn Asn Ser Leu Ala Asp 165 170 175 Leu Met Lys Ser Pro Asp Gly Phe Pro Ala Thr Ser Ile Thr Ser Leu 180 185 190 Asp Glu Phe Val Ala Arg Asp Tyr Leu Tyr Val Tyr Thr Lys Phe Asn 195 200 205 Gly Gly Pro Ser Val Tyr Glu Arg Gly Ile Gln Gly Val Asp Gly Cys 210 215 220 Asp Val Leu Ala Ile Lys Thr Cys Asn Glu Met Glu Gly Pro Tyr Leu 225 230 235 240 Asp Phe Val Arg Thr Gln Phe Lys Lys Pro Val Leu Leu Thr Gly Pro 245 250 255 Leu Val Asn Pro Glu Pro Pro Ser Gly Glu Leu Glu Glu Arg Trp Ala 260 265 270 Asn Trp Leu Gly Lys Phe Pro Pro Lys Ser Val Ile Tyr Cys Ser Phe 275 280 285 Gly Ser Glu Thr Phe Leu Thr Val Asp Gln Ile Lys Glu Leu Ala Ile 290 295 300 Gly Leu Glu Ile Thr Gly Leu Pro Phe Phe Leu Val Leu Asn Phe Pro 305 310 315 320 Pro Asn Val Asp Gly Gln Ser Glu Leu Val Arg Thr Leu Pro Pro Gly 325 330 335 Phe Met Asp Arg Val Lys Asp Arg Gly Val Val His Thr Gly Trp Val 340 345 350 Gln Gln Gln Leu Ile Leu Arg His Glu Ser Val Gly Cys Tyr Val Cys 355 360 365 His Ser Gly Phe Ser Ser Val Thr Glu Ala Val Ile Ser Asp Cys Gln 370 375 380 Leu Val Leu Leu Pro Leu Lys Gly Asp Gln Phe Leu Asn Ser Lys Leu 385 390 395 400 Val Ala Gly Asp Leu Lys Ala Gly Val Glu Val Asn Arg Arg Asp His 405 410 415 Asp Gly His Phe Gly Lys Glu Asp Ile Phe Lys Ala Val Lys Thr Val 420 425 430 Met Val Asp Val Asn Lys Glu Pro Gly Ala Ser Ile Arg Ala Asn Gln 435 440 445 Lys Trp Trp Arg Glu Phe Leu Leu Asn Gly Gln Ile Gln Asp Lys Phe 450 455 460 Ile Ala Asp Phe Val Lys Asp Leu Lys Ala Leu Ala 465 470 475 <210> 106 <211> 1431 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 105 <400> 106 atgtcccacg ccccatctaa ccaacaccac aagatgggta ctgaatctgc tgaagctgat 60 caattgcacg ttgttatgtt cccatggttc gcttctggtc acatctctcc attcgttcaa 120 ttgtccaaca agttgtcttt gcacggtgtc aaggtatctt tcttctctgc tccaggtaac 180 attccaagaa tcaagtcatc tttgaacttg actccaatgg ccgacattat cccattgcaa 240 atcccacacg tcgatggttt gccaccaggt ttggattcta cctctgaaat gactccacac 300 atggctgaat tgttgaagca agccttggac ttgatgcaac cacaaatcaa gactttgttg 360 tctcaattga agccacactt cgttttcttc gatttcaccc actactggtt gccaggtttg 420 gttggttctc aattgggtat caagaccgtt aacttctctg ttttctctgc catttctcaa 480 gcctacttgg ttgtcccagc cagaaagttg aacaactctt tggctgattt gatgaagtct 540 ccagatggtt tcccagctac ttccattacc tctttggatg aattcgttgc tagagattac 600 ttgtacgttt acactaagtt caacggtggt ccatctgttt acgaaagagg tattcaaggt 660 gttgatggtt gtgatgtttt ggccatcaag acttgtaacg aaatggaagg tccatacttg 720 gatttcgtta gaacccaatt caagaagcca gttttgttga ccggtccatt ggttaaccca 780 gaaccaccat ccggtgaatt ggaagaaaga tgggctaact ggttgggtaa gttcccacca 840 aagtctgtca tttactgttc tttcggttct gaaactttct tgaccgttga tcaaatcaag 900 gaattggcca ttggtttgga aattactggt ttgccattct tcttggtctt gaacttccca 960 ccaaacgttg atggtcaatc tgaattggtc agaactttgc caccaggttt catggacaga 1020 gttaaggaca gaggtgttgt tcacactggt tgggttcaac aacaattgat tttgagacac 1080 gaatctgttg gttgttacgt ttgtcactct ggtttctctt ctgttactga agctgttatt 1140 tctgattgtc aattggtttt gttgccattg aagggtgacc aattcttgaa ctccaagttg 1200 gttgctggtg acttgaaggc tggtgttgaa gttaacagaa gagatcacga tggtcacttc 1260 ggtaaggaag atattttcaa ggctgttaag actgttatgg ttgatgttaa caaggaacca 1320 ggtgcttcta tcagagctaa ccaaaagtgg tggagagaat tcttgttgaa cggtcaaatt 1380 caagataagt tcattgctga tttcgtcaag gatttgaagg ccttggctta a 1431 <210> 107 <211> 669 <212> PRT <213> Citrus sinensis <400> 107 Met Ser Ala Thr Tyr Thr Pro Lys Asn Ile Leu Ile Thr Gly Ala Ala 1 5 10 15 Gly Phe Ile Ala Ser His Val Cys Asn Arg Leu Ile Arg Asn Tyr Pro 20 25 30 Glu Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser Asn Leu 35 40 45 Lys Asn Leu Ile Pro Ser Lys Ala Ser Ser Asn Phe Lys Phe Val Lys 50 55 60 Gly Asp Ile Ala Ser Ala Asp Leu Val Asn Phe Leu Leu Ile Thr Glu 65 70 75 80 Ser Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val Asp Asn 85 90 95 Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr Gly Thr 100 105 110 His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg Arg Phe 115 120 125 Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu Asp Ala 130 135 140 Val Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn Pro Tyr 145 150 155 160 Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr Gly Arg 165 170 175 Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val Tyr Gly 180 185 190 Pro Asn Gln Phe Pro Glu Lys Leu Ile Pro Lys Phe Ile Leu Leu Ala 195 200 205 Met Arg Gly Leu Pro Leu Pro Ile His Gly Asp Gly Ser Asn Val Arg 210 215 220 Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Cys Ile Leu 225 230 235 240 His Lys Gly Glu Val Gly His Val Tyr Asn Val Gly Thr Lys Lys Glu 245 250 255 Arg Arg Val Ile Asp Val Ala Lys Asp Ile Cys Lys Leu Phe Ser Met 260 265 270 Asp Pro Glu Thr Ser Ile Lys Phe Val Glu Asn Arg Pro Phe Asn Asp 275 280 285 Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Thr Ser Leu Gly Trp Ser 290 295 300 Glu Arg Thr Ile Trp Glu Glu Gly Leu Arg Lys Thr Ile Glu Trp Tyr 305 310 315 320 Thr Gln Asn Pro Asp Trp Trp Gly Asp Val Ser Gly Ala Leu Leu Pro 325 330 335 His Pro Arg Met Leu Met Met Pro Gly Gly Arg His Phe Asp Gly Ser 340 345 350 Glu Glu Asn Lys Ala Val Ser Ser Val Ser Thr Asn Asn Ile Gln Ser 355 360 365 Arg Met Val Val Pro Val Ser Lys Cys Ser Ser Pro Arg Lys Pro Ser 370 375 380 Met Lys Phe Leu Ile Tyr Gly Arg Thr Gly Trp Ile Gly Gly Leu Leu 385 390 395 400 Gly Lys Leu Cys Glu Lys Glu Gly Ile Pro Phe Glu Tyr Gly Lys Gly 405 410 415 Arg Leu Glu Asp Arg Ser Ser Leu Ile Ala Asp Val Gln Ser Val Lys 420 425 430 Pro Thr His Val Phe Asn Ala Ala Gly Val Thr Gly Arg Pro Asn Val 435 440 445 Asp Trp Cys Glu Ser His Lys Thr Asp Thr Ile Arg Thr Asn Val Ala 450 455 460 Gly Thr Leu Thr Leu Ala Asp Val Cys Arg Asp His Gly Ile Leu Met 465 470 475 480 Met Asn Tyr Ala Thr Gly Cys Ile Phe Glu Tyr Asp Ala Ala His Pro 485 490 495 Glu Gly Ser Gly Ile Gly Tyr Lys Glu Glu Asp Thr Pro Asn Phe Thr 500 505 510 Gly Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu Lys 515 520 525 Glu Tyr Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser Ser 530 535 540 Asp Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr Asn 545 550 555 560 Lys Val Val Asn Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu Leu 565 570 575 Pro Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Arg Gly Ile Trp Asn 580 585 590 Phe Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met Tyr 595 600 605 Lys Lys Tyr Ile Asn Pro Glu Phe Lys Trp Val Asn Phe Thr Leu Asp 610 615 620 Glu Gln Ala Lys Val Ile Val Ala Pro Arg Ser Asn Asn Glu Met Asp 625 630 635 640 Ala Ser Lys Leu Lys Lys Glu Phe Pro Glu Leu Leu Ser Ile Lys Asp 645 650 655 Ser Leu Ile Lys Tyr Val Phe Glu Pro Asn Lys Lys Thr 660 665 <210> 108 <211> 2010 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 107 <400> 108 atgtccgcta cttacacccc aaagaacatc ttgatcactg gtgctgctgg tttcattgct 60 tcccacgttt gtaacagatt gattagaaac tacccagaat acaagattgt tgttttggac 120 aagttggatt actgttctaa cttgaagaac ttgatcccat ccaaggcttc ctccaacttc 180 aagttcgtta agggtgacat tgcctctgct gacttggtca acttcttgtt gatcaccgaa 240 tccattgaca ctattatgca cttcgctgct caaactcacg ttgacaactc tttcggtaac 300 tctttcgaat tcaccaagaa caacatctac ggtactcacg tcttgttgga agcctgtaag 360 gttactggtc aaatcagaag attcatccac gtatctactg atgaagtcta cggtgaaact 420 gatgaagatg ctgttgttgg taaccacgaa gcttcccaat tgttgccaac taacccatac 480 tctgctacta aggctggtgc tgaaatgttg gttatggctt acggtagatc ttacggtttg 540 ccagttatta ctaccagagg taacaacgtt tacggtccaa accaattccc agaaaagttg 600 attccaaagt tcatcttgtt ggccatgaga ggtttgccat tgccaattca cggtgatggt 660 tctaacgtta gatcttactt gtactgtgaa gatgttgctg aagctttcga atgtattttg 720 cacaagggtg aagttggtca cgtttacaac gttggtacta agaaggaaag aagagttatt 780 gatgttgcta aggatatttg taagttgttc tctatggacc cagaaacttc tatcaagttc 840 gttgaaaaca gaccattcaa cgatcaaaga tacttcttgg atgatcaaaa gttgacttct 900 ttgggttggt ctgaaagaac catctgggaa gaaggtttga gaaagactat tgaatggtac 960 actcaaaacc cagattggtg gggtgatgtc tctggtgctt tgttgccaca cccaagaatg 1020 ttgatgatgc caggtggtag acacttcgat ggttctgaag aaaacaaggc tgtttcctct 1080 gtctctacta acaacattca atccagaatg gttgttccag tttccaagtg ttcttctcca 1140 agaaagccat ccatgaagtt cttgatctac ggtagaactg gttggattgg tggtttgttg 1200 ggtaagttgt gtgaaaagga aggtattcca ttcgaatacg gtaagggtag attggaagat 1260 agatcttctt tgattgctga tgttcaatct gttaagccaa ctcacgtttt caacgctgct 1320 ggtgttactg gtagaccaaa cgttgattgg tgtgaatctc acaagactga caccattaga 1380 accaacgttg ctggtacctt gaccttggct gatgtttgta gagatcacgg tatcttgatg 1440 atgaactacg ctaccggttg tatcttcgaa tacgatgctg ctcacccaga aggttctggt 1500 attggttaca aggaagaaga tactccaaac ttcactggtt ctttctactc taagaccaag 1560 gccatggttg aagaattgtt gaaggaatac gacaacgttt gtactttgag agtcagaatg 1620 ccaatctctt ctgacttgaa caacccaaga aacttcatta ccaagatttc tagatacaac 1680 aaggttgtca acattccaaa ctctatgact gttttggatg aattgttgcc aatttctatt 1740 gaaatggcta agagaaactt gagaggtatt tggaacttca ctaacccagg tgttgtttct 1800 cacaacgaaa ttttggaaat gtacaagaag tacattaacc cagaattcaa gtgggttaac 1860 ttcactttgg atgaacaagc taaggttatc gtcgccccaa gatctaacaa cgaaatggat 1920 gcttctaagt tgaagaagga attcccagaa ttgttgtcca tcaaggattc tttgatcaag 1980 tacgtattcg aaccaaacaa gaaaacctaa 2010 <210> 109 <211> 670 <212> PRT <213> Arabidopsis thaliana <400> 109 Met Ser Ala Ser Tyr Thr Pro Lys Asn Ile Leu Ile Thr Gly Ala Ala 1 5 10 15 Gly Phe Ile Ala Ser His Val Ala Asn Arg Leu Ile Arg Ser Tyr Pro 20 25 30 Asp Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser Asn Leu 35 40 45 Lys Asn Leu Asn Pro Ser Lys His Ser Pro Asn Phe Lys Phe Val Lys 50 55 60 Gly Asp Ile Ala Ser Ala Asp Leu Val Asn His Leu Leu Ile Thr Glu 65 70 75 80 Gly Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val Asp Asn 85 90 95 Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr Gly Thr 100 105 110 His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg Arg Phe 115 120 125 Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu Asp Ala 130 135 140 Leu Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn Pro Tyr 145 150 155 160 Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr Gly Arg 165 170 175 Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val Tyr Gly 180 185 190 Pro Asn Gln Phe Pro Glu Lys Leu Ile Pro Lys Phe Ile Leu Leu Ala 195 200 205 Met Arg Gly Gln Val Leu Pro Ile His Gly Asp Gly Ser Asn Val Arg 210 215 220 Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Val Val Leu 225 230 235 240 His Lys Gly Glu Val Gly His Val Tyr Asn Ile Gly Thr Lys Lys Glu 245 250 255 Arg Arg Val Asn Asp Val Ala Lys Asp Ile Cys Lys Leu Phe Asn Met 260 265 270 Asp Pro Glu Ala Asn Ile Lys Phe Val Asp Asn Arg Pro Phe Asn Asp 275 280 285 Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Lys Lys Leu Gly Trp Ser 290 295 300 Glu Arg Thr Thr Trp Glu Glu Gly Leu Lys Lys Thr Met Asp Trp Tyr 305 310 315 320 Thr Gln Asn Pro Glu Trp Trp Gly Asp Val Ser Gly Ala Leu Leu Pro 325 330 335 His Pro Arg Met Leu Met Met Pro Gly Gly Arg His Phe Asp Gly Ser 340 345 350 Glu Asp Asn Ser Leu Ala Ala Thr Leu Ser Glu Lys Pro Ser Gln Thr 355 360 365 His Met Val Val Pro Ser Gln Arg Ser Asn Gly Thr Pro Gln Lys Pro 370 375 380 Ser Leu Lys Phe Leu Ile Tyr Gly Lys Thr Gly Trp Ile Gly Gly Leu 385 390 395 400 Leu Gly Lys Ile Cys Asp Lys Gln Gly Ile Ala Tyr Glu Tyr Gly Lys 405 410 415 Gly Arg Leu Glu Asp Arg Ser Ser Leu Leu Gln Asp Ile Gln Ser Val 420 425 430 Lys Pro Thr His Val Phe Asn Ser Ala Gly Val Thr Gly Arg Pro Asn 435 440 445 Val Asp Trp Cys Glu Ser His Lys Thr Glu Thr Ile Arg Ala Asn Val 450 455 460 Ala Gly Thr Leu Thr Leu Ala Asp Val Cys Arg Glu His Gly Leu Leu 465 470 475 480 Met Met Asn Phe Ala Thr Gly Cys Ile Phe Glu Tyr Asp Asp Lys His 485 490 495 Pro Glu Gly Ser Gly Ile Gly Phe Lys Glu Glu Asp Thr Pro Asn Phe 500 505 510 Thr Gly Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu 515 520 525 Lys Glu Tyr Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser 530 535 540 Ser Asp Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr 545 550 555 560 Asn Lys Val Val Asn Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu 565 570 575 Leu Pro Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Lys Gly Ile Trp 580 585 590 Asn Phe Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met 595 600 605 Tyr Arg Asp Tyr Ile Asn Pro Glu Phe Lys Trp Ala Asn Phe Thr Leu 610 615 620 Glu Glu Gln Ala Lys Val Ile Val Ala Pro Arg Ser Asn Asn Glu Met 625 630 635 640 Asp Ala Ser Lys Leu Lys Lys Glu Phe Pro Glu Leu Leu Ser Ile Lys 645 650 655 Glu Ser Leu Ile Lys Tyr Ala Tyr Gly Pro Asn Lys Lys Thr 660 665 670 <210> 110 <211> 2013 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 109 <400> 110 atgtccgctt cttacactcc aaagaacatt ttgatcaccg gtgctgctgg tttcattgct 60 tctcacgtcg ccaacagatt gatcagatct tacccagatt acaagatcgt tgttttggac 120 aagttggatt actgttctaa cttgaagaac ttgaacccat ctaagcactc tccaaacttc 180 aagttcgtca agggtgatat cgcttctgct gacttggtta accacttgtt gatcactgaa 240 ggtattgaca ccatcatgca cttcgctgct caaactcacg tcgacaactc cttcggtaac 300 tctttcgaat tcactaagaa caacatctac ggtactcacg tcttgttgga agcttgtaag 360 gttactggtc aaattagaag attcattcac gtttctactg atgaagttta cggtgaaact 420 gatgaagatg ctttggttgg taaccacgaa gcttctcaat tgttgccaac taacccatac 480 tctgccacta aggctggtgc tgaaatgttg gttatggctt acggtagatc ttacggtttg 540 ccagttatta ccactagagg taacaacgtc tacggtccaa accaattccc agaaaagttg 600 attccaaagt tcattttgtt ggctatgaga ggtcaagttt tgccaattca cggtgatggt 660 tctaacgtca gatcttactt gtactgtgag gacgttgctg aagctttcga agttgttttg 720 cacaagggtg aagttggtca cgtttacaac attggtacta agaaggaaag aagagttaac 780 gatgttgcca aggacatctg taagttgttc aacatggacc cagaagctaa catcaagttc 840 gtcgacaaca gaccattcaa cgatcaaaga tacttcttgg acgatcaaaa gttgaagaag 900 ttgggttggt ctgaaagaac cacttgggaa gaaggtttga agaaaactat ggattggtac 960 actcaaaacc cagaatggtg gggtgatgtt tctggtgctt tgttgccaca cccaagaatg 1020 ttgatgatgc caggtggtag acacttcgat ggttccgaag ataactcttt ggctgctact 1080 ttgtctgaaa agccatctca aacccacatg gttgttccat ctcaaagatc taacggtact 1140 ccacaaaagc catctttgaa gttcttgatc tacggtaaga ccggttggat cggtggtttg 1200 ttgggtaaga tctgtgataa gcaaggtatt gcttacgaat acggtaaggg tagattggaa 1260 gatagatctt ctttgttgca agatattcaa tctgttaagc caacccacgt tttcaactcc 1320 gctggtgtta ctggtagacc aaacgttgac tggtgtgaat ctcacaagac cgaaactatc 1380 agagccaacg ttgctggtac tttgactttg gctgatgtct gtagagaaca cggtttgttg 1440 atgatgaact tcgctactgg ttgtatcttc gaatacgacg acaagcaccc agaaggttct 1500 ggtattggtt tcaaggaaga agatactcca aacttcactg gttctttcta ctctaagacc 1560 aaggccatgg tcgaagaatt gttgaaggaa tacgacaacg tttgtacttt gagagttaga 1620 atgccaatct cctctgattt gaacaaccca agaaacttca tcaccaagat ctccagatac 1680 aacaaggttg ttaacatccc aaactctatg actgttttgg acgaattgtt gccaatctcc 1740 atcgaaatgg ctaagagaaa cttgaagggt atctggaact tcactaaccc aggtgttgtt 1800 tctcacaacg aaatcttgga aatgtacaga gactacatca acccagaatt caagtgggct 1860 aacttcactt tggaagaaca agctaaggtc attgttgctc caagatctaa caacgaaatg 1920 gatgcttcca agttgaagaa ggaattccca gaattgttgt ctatcaagga atctttgatt 1980 aagtacgctt acggtccaaa caagaaaacc taa 2013 <210> 111 <211> 668 <212> PRT <213> Arabidopsis thaliana <400> 111 Met Ser Asp Asp Thr Thr Tyr Lys Pro Lys Asn Ile Leu Ile Thr Gly 1 5 10 15 Ala Ala Gly Phe Ile Ala Ser His Val Ala Asn Arg Leu Ile Arg Asn 20 25 30 Tyr Pro Asp Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser 35 40 45 Asp Leu Lys Asn Leu Asp Pro Ser Phe Ser Ser Pro Asn Phe Lys Phe 50 55 60 Val Lys Gly Asp Ile Ala Ser Asp Asp Leu Val Asn Tyr Leu Leu Ile 65 70 75 80 Thr Glu Asn Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val 85 90 95 Asp Asn Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr 100 105 110 Gly Thr His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg 115 120 125 Arg Phe Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu 130 135 140 Asp Ala Ala Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn 145 150 155 160 Pro Tyr Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr 165 170 175 Gly Arg Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val 180 185 190 Tyr Gly Pro Asn Gln Phe Pro Glu Lys Met Ile Pro Lys Phe Ile Leu 195 200 205 Leu Ala Met Ser Gly Lys Pro Leu Pro Ile His Gly Asp Gly Ser Asn 210 215 220 Val Arg Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Val 225 230 235 240 Val Leu His Lys Gly Glu Ile Gly His Val Tyr Asn Val Gly Thr Lys 245 250 255 Arg Glu Arg Arg Val Ile Asp Val Ala Arg Asp Ile Cys Lys Leu Phe 260 265 270 Gly Lys Asp Pro Glu Ser Ser Ile Gln Phe Val Glu Asn Arg Pro Phe 275 280 285 Asn Asp Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Lys Lys Leu Gly 290 295 300 Trp Gln Glu Arg Thr Asn Trp Glu Asp Gly Leu Lys Lys Thr Met Asp 305 310 315 320 Trp Tyr Thr Gln Asn Pro Glu Trp Trp Gly Asp Val Ser Gly Ala Leu 325 330 335 Leu Pro His Pro Arg Met Leu Met Met Pro Gly Gly Arg Leu Ser Asp 340 345 350 Gly Ser Ser Glu Lys Lys Asp Val Ser Ser Asn Thr Val Gln Thr Phe 355 360 365 Thr Val Val Thr Pro Lys Asn Gly Asp Ser Gly Asp Lys Ala Ser Leu 370 375 380 Lys Phe Leu Ile Tyr Gly Lys Thr Gly Trp Leu Gly Gly Leu Leu Gly 385 390 395 400 Lys Leu Cys Glu Lys Gln Gly Ile Thr Tyr Glu Tyr Gly Lys Gly Arg 405 410 415 Leu Glu Asp Arg Ala Ser Leu Val Ala Asp Ile Arg Ser Ile Lys Pro 420 425 430 Thr His Val Phe Asn Ala Ala Gly Leu Thr Gly Arg Pro Asn Val Asp 435 440 445 Trp Cys Glu Ser His Lys Pro Glu Thr Ile Arg Val Asn Val Ala Gly 450 455 460 Thr Leu Thr Leu Ala Asp Val Cys Arg Glu Asn Asp Leu Leu Met Met 465 470 475 480 Asn Phe Ala Thr Gly Cys Ile Phe Glu Tyr Asp Ala Thr His Pro Glu 485 490 495 Gly Ser Gly Ile Gly Phe Lys Glu Glu Asp Lys Pro Asn Phe Phe Gly 500 505 510 Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu Arg Glu 515 520 525 Phe Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser Ser Asp 530 535 540 Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr Asn Lys 545 550 555 560 Val Val Asp Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu Leu Pro 565 570 575 Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Arg Gly Ile Trp Asn Phe 580 585 590 Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met Tyr Lys 595 600 605 Asn Tyr Ile Glu Pro Gly Phe Lys Trp Ser Asn Phe Thr Val Glu Glu 610 615 620 Gln Ala Lys Val Ile Val Ala Ala Arg Ser Asn Asn Glu Met Asp Gly 625 630 635 640 Ser Lys Leu Ser Lys Glu Phe Pro Glu Met Leu Ser Ile Lys Glu Ser 645 650 655 Leu Leu Lys Tyr Val Phe Glu Pro Asn Lys Arg Thr 660 665 <210> 112 <211> 2007 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 111 <400> 112 atgtccgatg atactactta caagccaaag aacattttga ttactggtgc tgctggtttc 60 attgcttctc acgttgccaa cagattgatc agaaactacc cagattacaa gatcgttgtt 120 ttggacaagt tggattactg ttctgatttg aagaacttgg atccatcttt ctcttctcca 180 aacttcaagt tcgtcaaggg tgatatcgct tctgatgatt tggttaacta cttgttgatc 240 actgaaaaca ttgatactat catgcacttc gctgctcaaa ctcacgttga taactctttc 300 ggtaactctt tcgaattcac caagaacaac atttacggta ctcacgtttt gttggaagcc 360 tgtaaggtta ctggtcaaat cagaagattc atccacgttt ctaccgatga agtctacggt 420 gaaaccgatg aagatgctgc tgttggtaac cacgaagctt ctcaattgtt gccaactaac 480 ccatactctg ctactaaggc tggtgctgaa atgttggtta tggcttacgg tagatcttac 540 ggtttgccag ttattactac tagaggtaac aacgtttacg gtccaaacca attcccagaa 600 aagatgattc caaagttcat cttgttggct atgtctggta agccattgcc aatccacggt 660 gatggttcta acgtcagatc ttacttgtac tgtgaggacg ttgctgaagc tttcgaagtt 720 gttttgcaca agggtgaaat cggtcacgtc tacaacgtcg gtactaagag agaaagaaga 780 gttatcgatg ttgctagaga catctgtaag ttgttcggta aggacccaga atcttctatt 840 caattcgttg aaaacagacc attcaacgat caaagatact tcttggatga tcaaaagttg 900 aagaagttgg gttggcaaga aagaactaac tgggaagatg gtttgaagaa aactatggac 960 tggtacactc aaaacccaga atggtggggt gatgtttctg gtgctttgtt gccacaccca 1020 agaatgttga tgatgccagg tggtagattg tctgatggtt cttctgaaaa gaaggacgtt 1080 tcttctaaca ctgtccaaac tttcactgtt gttactccaa agaacggtga ttctggtgac 1140 aaggcttctt tgaagttctt gatctacggt aagactggtt ggttgggtgg tttgttgggt 1200 aagttgtgtg aaaagcaagg tattacttac gaatacggta agggtagatt ggaagataga 1260 gcttctttgg ttgctgatat tagatctatc aagccaactc acgttttcaa cgctgctggt 1320 ttgactggta gaccaaacgt tgactggtgt gaatctcaca agccagaaac cattagagtt 1380 aacgtcgctg gtactttgac tttggctgat gtttgtagag aaaacgattt gttgatgatg 1440 aacttcgcca ccggttgtat cttcgaatac gacgctactc acccagaagg ttctggtatc 1500 ggtttcaagg aagaagataa gccaaacttc ttcggttctt tctactctaa gaccaaggcc 1560 atggttgaag aattgttgag agaattcgac aacgtttgta ccttgagagt cagaatgcca 1620 atctcctctg acttgaacaa cccaagaaac ttcatcacta agatctctag atacaacaag 1680 gttgttgaca tcccaaactc tatgaccgtt ttggacgaat tgttgccaat ctctatcgaa 1740 atggctaaga gaaacttgag aggtatctgg aacttcacca acccaggtgt tgtttctcac 1800 aacgaaatct tggaaatgta caagaactac atcgaaccag gtttcaagtg gtccaacttc 1860 actgttgaag aacaagctaa ggtcattgtt gctgctagat ctaacaacga aatggatggt 1920 tctaagttgt ctaaggaatt cccagaaatg ttgtccatca aggaatcttt gttgaagtac 1980 gtattcgaac caaacaagag aacctaa 2007 <210> 113 <211> 482 <212> PRT <213> Citrus sinensis <400> 113 Met Ser Lys Asp Thr Ile Val Phe Tyr Thr Ser Pro Gly Arg Gly His 1 5 10 15 Leu Asn Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Tyr His Pro 20 25 30 Cys Phe Ser Ile Asp Ile Ile Ile Pro Thr Ala Pro Phe Val Ser Ser 35 40 45 Ala Gly Thr Asp Asp Tyr Ile Ala Ser Val Ser Ala Thr Ala Pro Ser 50 55 60 Val Thr Phe His Gln Leu Pro Pro Pro Val Ser Gly Leu Pro Asp Thr 65 70 75 80 Leu Arg Ser Pro Ala Asp Phe Pro Ala Leu Val Tyr Glu Leu Gly Glu 85 90 95 Leu Asn Asn Pro Asn Leu His Glu Thr Leu Ile Thr Ile Ser Lys Arg 100 105 110 Ser Asn Leu Lys Ala Phe Val Ile Asp Phe Leu Cys Asn Pro Ala Phe 115 120 125 Gln Val Ser Ser Ser Thr Leu Ser Ile Pro Thr Tyr Tyr Tyr Phe Thr 130 135 140 Thr Ala Gly Ser Val Leu Ala Ala Asn Leu Tyr Leu Pro Thr Leu His 145 150 155 160 Lys Asn Thr Thr Lys Ser Phe Arg Glu Leu Gly Ser Ala Leu Leu Asn 165 170 175 Phe Pro Gly Phe Pro Pro Phe Pro Ala Arg Asp Met Ala Leu Pro Met 180 185 190 His Asp Arg Glu Gly Lys Val Tyr Lys Gly Leu Val Asp Thr Gly Ile 195 200 205 Gln Met Ala Lys Ser Ala Gly Val Ile Val Asn Thr Phe Glu Leu Leu 210 215 220 Glu Glu Arg Ala Ile Lys Ala Met Leu Glu Gly Gln Cys Thr Pro Gly 225 230 235 240 Asp Thr Ser Pro Pro Leu Tyr Cys Ile Gly Pro Val Val Gly Arg Gly 245 250 255 Asn Gly Glu Asn Arg Gly Arg Asp Arg His Glu Cys Leu Ser Trp Leu 260 265 270 Asp Ser Lys Pro Ser Arg Ser Val Leu Phe Leu Cys Phe Gly Ser Leu 275 280 285 Gly Ser Phe Ser Cys Lys Gln Leu Lys Glu Met Ala Ile Gly Leu Glu 290 295 300 Arg Ser Gly Val Lys Phe Leu Trp Val Val Arg Ala Pro Ala Pro Asp 305 310 315 320 Ser Val Glu Asn Arg Ser Ser Leu Glu Ser Leu Leu Pro Glu Gly Phe 325 330 335 Leu Asp Arg Thr Lys Asp Arg Gly Leu Val Val Glu Ser Trp Ala Pro 340 345 350 Gln Val Glu Val Leu Asn His Glu Ser Val Gly Gly Phe Val Thr His 355 360 365 Cys Gly Trp Asn Ser Val Leu Glu Gly Val Cys Ala Gly Val Pro Met 370 375 380 Leu Ala Trp Pro Leu Tyr Ala Glu Gln Lys Met Ile Arg Ala Val Val 385 390 395 400 Val Glu Glu Met Lys Val Gly Leu Ala Val Thr Arg Ser Glu Glu Gly 405 410 415 Asp Gly Leu Val Ser Ser Ala Glu Leu Glu Gln Arg Val Ser Glu Leu 420 425 430 Met Asp Ser Glu Lys Gly Arg Ala Val Lys Glu Arg Ala Val Ala Met 435 440 445 Lys Glu Ala Ala Ala Ala Ala Met Arg Asp Gly Gly Ser Ser Arg Val 450 455 460 Ala Leu Asp Asn Leu Val Glu Ser Phe Lys Arg Gly Cys Ile Ala Pro 465 470 475 480 Phe Gly <210> 114 <211> 1449 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO: 113 <400> 114 atgtccaagg atactattgt tttctacact tctccaggta gaggtcactt gaactccatg 60 gttgaattgg gtaagttgat cttgacttac cacccatgtt tctccattga catcatcatc 120 ccaaccgccc cattcgtttc ttctgccggt accgatgatt acatcgcctc cgtttccgcc 180 actgctccat ccgttacctt ccaccaattg ccaccaccag ttagtggttt gccagacact 240 ctcagatctc cagctgactt cccagccttg gtttacgaat tgggtgaatt gaacaaccca 300 aacttgcacg aaaccttgat cactatttcc aagagatcta acttgaaggc cttcgttatc 360 gatttcttgt gtaacccagc tttccaagtt tcctcttcta ctttgtctat cccaacttac 420 tactacttca ccaccgctgg ttctgttttg gctgctaact tgtacttgcc aactttgcac 480 aagaacacca ctaagtcttt cagagaattg ggttctgctt tgttgaactt cccaggtttc 540 ccaccattcc cagctagaga catggctttg ccaatgcacg atagagaagg taaggtttac 600 aagggtttgg tcgacaccgg tatccaaatg gctaagtctg ctggtgtaat tgttaacaca 660 ttcgaattgt tggaggaaag agctatcaag gctatgttgg aaggtcaatg tactccaggt 720 gatacttctc caccattgta ctgtatcggt ccagttgttg gtagaggtaa cggtgaaaac 780 agaggtagag atagacacga atgtttgtct tggttggact ctaagccatc tagatctgtc 840 ttgttcttgt gtttcggttc tttgggttct ttctcttgta agcaattgaa ggaaatggcc 900 attggtttgg aaagatctgg tgttaagttc ttgtgggtcg ttagagctcc agctccagac 960 tctgtcgaaa acagatcttc tttggaatct ttgttgccag aaggtttctt ggatagaact 1020 aaggatagag gtttggttgt tgaatcttgg gctccacaag ttgaagtttt gaaccacgaa 1080 tctgttggcg gcttcgttac tcactgcggt tggaactctg ttttggaagg tgtttgtgcc 1140 ggtgttccaa tgttggcttg gccattgtac gccgaacaaa agatgattag agctgtcgtt 1200 gttgaagaaa tgaaggttgg tttggctgtt actagatctg aagaaggtga cggtttggtt 1260 tcttctgccg aattggaaca aagagtttct gaattgatgg actctgaaaa gggtagagct 1320 gttaaggaaa gagctgttgc tatgaaggaa gctgctgctg ctgctatgag agatggtggt 1380 tcttctagag ttgcgctcga caacttggtt gaaagcttta agagaggttg catcgctcca 1440 ttcggttaa 1449 <210> 115 <211> 477 <212> PRT <213> Citrus clementina <400> 115 Met Ser Glu Lys Gln Asp His Val His Val Ala Ile Leu Pro Leu Pro 1 5 10 15 Ala Val Gly His Val Asn Ser Met Leu Asn Leu Ala Glu Leu Leu Gly 20 25 30 His Ala Gly Ile Lys Ile Thr Phe Leu Asn Thr Glu His Tyr Tyr Asp 35 40 45 Arg Val Ile Arg His Ser Ser Asp Ala Phe Ser Arg Tyr Met Gln Ile 50 55 60 Pro Gly Phe Gln Phe Lys Thr Leu Thr Asp Gly Leu Pro Arg Asp His 65 70 75 80 Pro Arg Thr Pro Asp Lys Phe Pro Glu Leu Val Asp Ser Leu Asn Cys 85 90 95 Ala Thr Pro Pro Leu Leu Lys Glu Met Val Ser Asp Ser Lys Ser Pro 100 105 110 Val Asn Cys Ile Ile Thr Asp Gly Tyr Met Ser Arg Ala Ile Asp Ala 115 120 125 Ala Arg Glu Val Gly Val Ser Ile Ile Tyr Phe Arg Thr Ile Ser Ala 130 135 140 Cys Ala Phe Trp Ser Phe His Cys Ile Pro Asp Ile Ile Asp Ala Gly 145 150 155 160 Glu Leu Pro Ile Lys Gly Thr Glu Asp Met Asp Arg Leu Ile Thr Thr 165 170 175 Val Pro Gly Met Glu Gly Phe Leu Arg Cys Arg Asp Leu Pro Ser Phe 180 185 190 Cys Arg Val Asn Asp Pro Met Asp Pro His Leu Leu Leu Phe Ala Arg 195 200 205 Glu Thr Arg Leu Ser Ala His Ala Asp Gly Leu Ile Leu Asn Thr Phe 210 215 220 Glu Asp Leu Glu Gly Pro Ile Leu Ser Gln Ile Arg Asn His Ser Cys 225 230 235 240 Pro Asn Ile Tyr Ser Ile Gly Pro Leu Asn Ala His Leu Lys Val Arg 245 250 255 Ile Pro Glu Lys Thr Tyr Ser Ser Ser Ser Leu Trp Lys Ile Asp Arg 260 265 270 Ser Cys Met Ala Trp Leu Asp Lys Gln Pro Lys Gln Ser Val Ile Tyr 275 280 285 Val Ser Phe Gly Ser Ile Ala Val Met Ser Arg Asp Gln Leu Ile Glu 290 295 300 Phe Tyr Tyr Gly Leu Val His Ser Lys Lys Asn Phe Leu Trp Val Ile 305 310 315 320 Arg Pro Asp Leu Ile Ser Gly Lys Asp Gly Glu Asn Gln Ile Pro Glu 325 330 335 Glu Leu Leu Glu Ala Thr Lys Glu Arg Gly Cys Ile Ala Gly Trp Val 340 345 350 Pro Gln Glu Glu Val Leu Ala His Ser Ala Val Gly Gly Phe Leu Thr 355 360 365 His Cys Gly Trp Asn Ser Thr Leu Glu Ser Ile Val Ala Gly Met Pro 370 375 380 Met Ile Cys Trp Pro Ser Phe Ala Asp Gln Gln Ile Asn Ser Arg Phe 385 390 395 400 Val Gly Glu Val Trp Lys Leu Gly Leu Asp Ile Lys Asp Leu Cys Asp 405 410 415 Arg Asn Ile Val Glu Lys Thr Val Asn Asp Leu Met Val Glu Arg Lys 420 425 430 Glu Glu Phe Met Glu Ser Ala Asp Arg Met Ala Asn Leu Ala Lys Lys 435 440 445 Ser Val Asn Lys Gly Gly Ser Ser Tyr Cys Asn Leu Asp Arg Leu Val 450 455 460 Asn Asp Ile Lys Met Met Ser Ser Gln Pro Gln Asn Cys 465 470 475 <210> 116 <211> 1434 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO: 115 <400> 116 atgtccgaaa agcaagatca cgttcacgtt gctatcttgc cattgccagc cgttggtcac 60 gtcaactcca tgttgaactt ggctgaattg ttgggtcacg ccggtatcaa gattactttc 120 ttgaacaccg aacactacta cgatagagtc atcagacact cttctgatgc cttctctaga 180 tacatgcaaa ttccaggttt ccaattcaag accttgactg atggtttgcc aagagatcac 240 ccaagaactc cagataagtt cccagaattg gttgattctt tgaactgtgc cactccacca 300 ttgttgaagg aaatggtatc tgattctaag tctccagtta actgtattat cactgatggt 360 tacatgtcta gagctattga cgctgccaga gaagttggtg tttccattat ttacttcaga 420 actatttctg cttgtgcttt ctggtctttc cactgtatcc cagatatcat tgatgctggt 480 gaattgccaa tcaagggtac tgaagatatg gatagattga tcaccactgt tccaggtatg 540 gaaggtttct tgagatgtag agatttgcca tctttctgta gagttaacga cccaatggat 600 ccacacttgt tgttgttcgc tagagaaacc agattgagtg ctcatgctga cggcttgatc 660 ttgaacactt tcgaagattt ggaaggtcca atcttgtccc aaatcagaaa ccactcttgt 720 ccaaacatct actctattgg tccattgaac gctcacttga aggttagaat cccagaaaag 780 acttactcct cttcttcttt gtggaagatt gacagatctt gtatggcttg gttggacaag 840 caaccaaagc aatctgttat ctacgtatct ttcggttcta ttgctgttat gtctagagat 900 caattgatcg aattctacta cggtttggtt cactctaaga agaacttctt gtgggtcatc 960 agaccagact tgatttctgg taaggatggt gaaaaccaaa ttccagaaga attgttggaa 1020 gctaccaagg aaagaggttg tattgctggt tgggttccac aagaagaagt tttggcccac 1080 tctgctgttg gtggtttctt gacccactgt ggttggaact ctaccttgga atctatcgtt 1140 gctggtatgc caatgatttg ctggccaagc ttcgctgatc aacagatcaa ctctagattc 1200 gttggtgaag tttggaagtt gggtttggat atcaaggatt tgtgtgatag aaacattgtt 1260 gaaaagactg ttaacgattt gatggttgaa agaaaggaag aattcatgga atctgctgat 1320 agaatggcta acttggctaa gaagtctgtt aacaagggtg gttcctctta ctgtaacttg 1380 gacagattgg ttaacgatat caagatgatg tcctctcaac cacaaaactg ttaa 1434 <210> 117 <211> 354 <212> PRT <213> Citrus clementina <400> 117 Met Ser Gly Ser Ile Val Asp Gly Glu Arg Asp Gln Ser Phe Ala Tyr 1 5 10 15 Ala Asn Gln Leu Ala Met Gly Thr Val Leu Pro Met Ala Met Gln Ala 20 25 30 Val Tyr Glu Leu Gly Ile Phe Gln Ile Ile Asp Lys Ala Gly Pro Gly 35 40 45 Ala Lys Leu Ser Ala Ser Asp Ile Ala Ala Gln Leu Pro Thr Lys Asn 50 55 60 Lys Asp Ala Pro Thr Met Leu Asp Arg Ile Leu Arg Leu Leu Ala Ser 65 70 75 80 Tyr Ser Val Val Glu Cys Ser Leu Asp Gly Ser Gly Ala Arg Arg Arg 85 90 95 Tyr Ser Leu Asn Ser Val Ser Lys Tyr Tyr Val Pro Asn Lys Asp Gly 100 105 110 Val Ser Leu Gly Pro Ala Leu Gln Met Ile Gln Asp Lys Val Phe Leu 115 120 125 Glu Ser Trp Ser His Leu Lys Asp Ala Ile Leu Glu Gly Gly Ile Pro 130 135 140 Phe Asn Arg Ala His Gly Met His Ala Phe Glu Tyr Gly Arg Val Asp 145 150 155 160 Pro Arg Phe Asn Lys His Phe Asn Thr Ala Met Tyr Asn His Thr Ser 165 170 175 Leu Ile Met Ser Asn Ile Leu Glu Ser Tyr Lys Gly Phe Ala Asn Ile 180 185 190 Lys Gln Leu Val Asp Val Gly Gly Asn Leu Gly Val Thr Leu Gln Ala 195 200 205 Ile Thr Ser Lys Tyr Pro Tyr Ile Lys Gly Ile Asn Phe Asp Gln Pro 210 215 220 His Val Ile Glu His Ala Pro Leu His Pro His Ile Glu His Val Ala 225 230 235 240 Gly Asp Met Phe Gln Ser Val Pro Lys Gly Asp Ala Ile Phe Leu Lys 245 250 255 Trp Ile Leu His Asp Trp Asp Asp Glu His Cys Leu Lys Leu Leu Lys 260 265 270 Asn Cys Tyr Lys Ser Val Pro Glu Asp Gly Lys Val Ile Val Val Glu 275 280 285 Leu Met Leu Pro Glu Val Pro Asn Thr Ser Ile Glu Ser Lys Ser Asn 290 295 300 Ser His Ile Asp Val Leu Met Met Thr Gln Asn Pro Gly Gly Lys Glu 305 310 315 320 Arg Thr Lys His Glu Phe Met Thr Leu Ala Thr Gly Ala Gly Phe Ser 325 330 335 Gly Ile Arg Phe Asp Leu Val Thr Gly Asn Phe Trp Val Met Glu Phe 340 345 350 Tyr Lys <210> 118 <211> 1065 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:117 <400> 118 atgtccggtt ctatcgttga tggtgaaaga gatcaatctt tcgcttacgc taaccaattg 60 gctatgggta ctgttttgcc aatggccatg caagctgttt acgaattggg tattttccaa 120 atcatcgaca aggctggtcc aggtgctaag ttgtctgctt ctgatattgc tgcccaattg 180 ccaaccaaga acaaggacgc tccaactatg ctcgacagaa tactaagatt gttggcttct 240 tactctgttg ttgaatgttc tttggatggt tctggtgcca gaagaagata ctctttgaac 300 tctgtctcca agtactacgt tccaaacaag gatggtgtct ctttgggtcc agctttgcaa 360 atgattcaag acaaggtttt cttggaatct tggtcccact tgaaggatgc tattttggaa 420 ggtggtattc cattcaacag agcccacggt atgcacgctt tcgaatacgg tagagttgac 480 ccaagattca acaagcactt caacactgct atgtacaacc acacctcttt gattatgtct 540 aacattttgg aatcttacaa gggtttcgcc aacatcaagc aattggtcga tgttggtggt 600 aacttgggcg taactctcca agccatcact tccaagtacc catacattaa gggtatcaac 660 ttcgaccaac cacacgttat tgaacacgcc ccattgcacc cacacattga acacgttgct 720 ggtgatatgt tccaatctgt tccaaagggt gacgccattt tcttgaagtg gatcttgcac 780 gattgggacg atgaacactg tttgaagttg ttgaagaact gttacaagtc tgttccagaa 840 gatggtaagg ttatcgttgt tgaattgatg ttgccagaag ttccaaacac ttctattgaa 900 tctaagtcta actcccacat tgacgttttg atgatgactc aaaacccagg tggtaaggaa 960 agaactaagc acgaattcat gaccttggct actggtgctg gtttctctgg tatcagattc 1020 gatttggtta ctggtaactt ctgggttatg gaattctaca agtaa 1065 <210> 119 <211> 250 <212> PRT <213> Citrus sinensis <400> 119 Met Ser Ala Ala Asn Arg Glu Asp Gln Glu Glu Asn Lys Asp Arg Tyr 1 5 10 15 Phe Lys Ala Val His Gly Asn Lys Thr Leu Leu Gln Ser Glu Lys Leu 20 25 30 Tyr Glu Tyr Ile Leu Glu Thr Ser Val Tyr Pro Arg Glu Pro Gln Cys 35 40 45 Leu Lys Glu Ile Arg Glu Leu Thr Tyr Lys His Pro Leu Ser Pro Met 50 55 60 Met Thr Ser Pro Asp Glu Ala Gln Phe Phe Ser Met Leu Leu Lys Leu 65 70 75 80 Ile Asn Ala Lys Asn Thr Met Glu Ile Gly Val Phe Thr Gly Tyr Ser 85 90 95 Leu Leu Ala Thr Ala Leu Ala Ile Pro Asp Asp Gly Lys Ile Leu Ala 100 105 110 Leu Asp Ile Thr Lys Glu His Tyr Glu Lys Gly Leu Pro Ile Ile Gln 115 120 125 Lys Ala Gly Val Ala His Lys Ile Asp Phe Arg Glu Gly Pro Ala Leu 130 135 140 Pro Leu Leu Asp Gln Leu Ile Gln His Glu Lys Tyr His Gly Thr Phe 145 150 155 160 Asp Phe Val Phe Val Asp Ala Asp Lys Asp Asn Tyr Val Asn Tyr His 165 170 175 Lys Arg Leu Ile Glu Leu Val Lys Val Gly Gly Val Ile Gly Tyr Asp 180 185 190 Asn Thr Leu Trp Gly Gly Ser Val Val Ala Pro Pro Asp Ala Asp Leu 195 200 205 Asp Glu His Ile Leu Tyr Leu Arg Asp Phe Val Gln Glu Leu Asn Lys 210 215 220 Ala Leu Ala Val Asp Pro Arg Ile Glu Ile Cys Gln Leu Ser Ile Ala 225 230 235 240 Asp Gly Val Thr Leu Cys Arg Arg Ile Gly 245 250 <210> 120 <211> 753 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:119 <400> 120 atgtccgctg ctaacagaga agatcaagaa gaaaacaagg atagatactt caaggctgtt 60 cacggtaaca agaccttgtt gcaatctgaa aagttgtacg aatacatctt ggaaacctct 120 gtttacccaa gagaaccaca atgtttgaag gaaatcagag aattgactta caagcaccca 180 ttgtctccaa tgatgacttc tccagatgaa gctcaattct tctctatgtt gttgaagttg 240 atcaacgcca agaacaccat ggagataggt gtattcaccg gttactcttt gttggccact 300 gccttggcca ttccagacga tggtaagatt ttggccttgg acatcaccaa ggaacactac 360 gaaaagggtt tgccaatcat tcaaaaggct ggtgttgctc acaagattga cttcagagaa 420 ggtccagctt tgccattatt ggatcaatta atccaacacg aaaagtacca tggcacattc 480 gacttcgtct ttgttgatgc tgacaaggat aactacgtta actaccacaa gagattgatt 540 gaattggtta aggttggtgg tgttattggt tacgacaaca ccttgtgggg tggttctgtt 600 gttgctccac cagatgccga cttggatgaa cacatcttgt acttgagaga tttcgttcaa 660 gaattgaaca aggccttggc cgttgatcca agaatagaaa tttgtcaatt gtccattgct 720 gatggtgtta ctttgtgtag aagaattggt taa 753 <210> 121 <211> 514 <212> PRT <213> Arabidopsis thaliana <400> 121 Met Ser Ala Thr Leu Phe Leu Thr Ile Leu Leu Ala Thr Val Leu Phe 1 5 10 15 Leu Ile Leu Arg Ile Phe Ser His Arg Arg Asn Arg Ser His Asn Asn 20 25 30 Arg Leu Pro Pro Gly Pro Asn Pro Trp Pro Ile Ile Gly Asn Leu Pro 35 40 45 His Met Gly Thr Lys Pro His Arg Thr Leu Ser Ala Met Val Thr Thr 50 55 60 Tyr Gly Pro Ile Leu His Leu Arg Leu Gly Phe Val Asp Val Val Val 65 70 75 80 Ala Ala Ser Lys Ser Val Ala Glu Gln Phe Leu Lys Ile His Asp Ala 85 90 95 Asn Phe Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Met Ala Tyr 100 105 110 Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly His Arg Trp Arg Leu 115 120 125 Leu Arg Lys Ile Ser Ser Val His Leu Phe Ser Ala Lys Ala Leu Glu 130 135 140 Asp Phe Lys His Val Arg Gln Glu Glu Val Gly Thr Leu Thr Arg Glu 145 150 155 160 Leu Val Arg Val Gly Thr Lys Pro Val Asn Leu Gly Gln Leu Val Asn 165 170 175 Met Cys Val Val Asn Ala Leu Gly Arg Glu Met Ile Gly Arg Arg Leu 180 185 190 Phe Gly Ala Asp Ala Asp His Lys Ala Asp Glu Phe Arg Ser Met Val 195 200 205 Thr Glu Met Met Ala Leu Ala Gly Val Phe Asn Ile Gly Asp Phe Val 210 215 220 Pro Ser Leu Asp Trp Leu Asp Leu Gln Gly Val Ala Gly Lys Met Lys 225 230 235 240 Arg Leu His Lys Arg Phe Asp Ala Phe Leu Ser Ser Ile Leu Lys Glu 245 250 255 His Glu Met Asn Gly Gln Asp Gln Lys His Thr Asp Met Leu Ser Thr 260 265 270 Leu Ile Ser Leu Lys Gly Thr Asp Leu Asp Gly Asp Gly Gly Ser Leu 275 280 285 Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Met Phe Thr Ala Gly 290 295 300 Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala Ile Ala Glu Leu Ile 305 310 315 320 Arg His Pro Asp Ile Met Val Lys Ala Gln Glu Glu Leu Asp Ile Val 325 330 335 Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp Ile Ala Gln Leu Pro 340 345 350 Tyr Leu Gln Ala Val Ile Lys Glu Asn Phe Arg Leu His Pro Pro Thr 355 360 365 Pro Leu Ser Leu Pro His Ile Ala Ser Glu Ser Cys Glu Ile Asn Gly 370 375 380 Tyr His Ile Pro Lys Gly Ser Thr Leu Leu Thr Asn Ile Trp Ala Ile 385 390 395 400 Ala Arg Asp Pro Asp Gln Trp Ser Asp Pro Leu Ala Phe Lys Pro Glu 405 410 415 Arg Phe Leu Pro Gly Gly Glu Lys Ser Gly Val Asp Val Lys Gly Ser 420 425 430 Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly 435 440 445 Leu Ser Leu Gly Leu Arg Thr Ile Gln Phe Leu Thr Ala Thr Leu Val 450 455 460 Gln Gly Phe Asp Trp Glu Leu Ala Gly Gly Val Thr Pro Glu Lys Leu 465 470 475 480 Asn Met Glu Glu Ser Tyr Gly Leu Thr Leu Gln Arg Ala Val Pro Leu 485 490 495 Val Val His Pro Lys Pro Arg Leu Ala Pro Asn Val Tyr Gly Leu Gly 500 505 510 Ser Gly <210> 122 <211> 1545 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:121 <400> 122 atgtccgcta ctttgttctt gactatcttg ttggctactg ttttgttctt gatcttgaga 60 atcttctctc acagaagaaa cagatctcac aacaacagat tgccaccagg tccaaaccca 120 tggccaatca tcggtaactt gccacacatg ggtactaagc cacacagaac tttgtctgct 180 atggttacta cttacggtcc aatcttgcac ttgagattgg gtttcgttga cgttgttgtt 240 gctgcttcta agtctgttgc tgaacaattc ttgaagatcc acgacgctaa cttcgcttct 300 agaccaccaa actctggtgc taagcacatg gcttacaact accaagactt ggttttcgct 360 ccatacggtc acagatggag attgttgaga aagatctctt ctgttcactt gttctctgct 420 aaggctttgg aagatttcaa gcacgttaga caagaagaag ttggtacttt gactagagaa 480 ttggttagag ttggtactaa gccagttaac ttgggtcaat tggttaacat gtgtgttgtt 540 aacgctttgg gtagagaaat gatcggtaga agattgttcg gtgctgacgc tgaccacaag 600 gctgacgaat tcagatctat ggttactgaa atgatggctt tggctggtgt tttcaacatc 660 ggtgacttcg ttccatcttt ggactggttg gacttgcaag gtgttgctgg taagatgaag 720 agattgcaca agagattcga cgctttcttg tcatctatct tgaaggaaca cgaaatgaac 780 ggtcaagacc aaaagcacac tgacatgttg tctactttga tctctttgaa gggtactgac 840 ttggacggtg acggtggttc tttgactgac actgaaatca aggctttgtt gttgaacatg 900 ttcactgctg gtactgacac ttctgcttct actgttgact gggctatcgc tgaattgatc 960 agacacccag acatcatggt taaggctcaa gaagaattgg acatcgttgt tggtagagac 1020 agaccagtta acgaatctga catcgctcaa ttgccatact tgcaagctgt tatcaaggaa 1080 aacttcagat tgcacccacc aactccattg tctttgccac acatcgcttc tgaatcttgt 1140 gaaatcaacg gttaccacat cccaaagggt tctactttgt tgactaacat ctgggctatc 1200 gctagggacc cagaccaatg gtctgaccca ttggctttca agccagaaag attcttgcca 1260 ggtggtgaaa agtctggtgt tgacgttaag ggttctgact tcgaattgat cccattcggt 1320 gctggtagaa gaatctgtgc tggtttgtct ttgggtttga gaactatcca attcttgact 1380 gctactttgg ttcaaggttt cgactgggaa ttggctggtg gtgttactcc agaaaagttg 1440 aacatggaag aatcttacgg tttgactttg caaagagctg ttccattggt tgttcaccca 1500 aagccaagat tggctccaaa cgtttacggt ttgggttctg gttaa 1545 <210> 123 <211> 571 <212> PRT <213> Arabidopsis thaliana <400> 123 Met Ser Val Leu Gln Gln Gln Thr His Phe Leu Thr Lys Lys Ile Asp 1 5 10 15 Gln Glu Asp Glu Glu Glu Glu Pro Ser His Asp Phe Ile Phe Arg Ser 20 25 30 Lys Leu Pro Asp Ile Phe Ile Pro Asn His Leu Pro Leu Thr Asp Tyr 35 40 45 Val Phe Gln Arg Phe Ser Gly Asp Gly Asp Gly Asp Ser Ser Thr Thr 50 55 60 Cys Ile Ile Asp Gly Ala Thr Gly Arg Ile Leu Thr Tyr Ala Asp Val 65 70 75 80 Gln Ile Asn Met Arg Arg Ile Ala Thr Gly Ile His Arg Leu Gly Ile 85 90 95 Arg His Gly Asp Val Val Met Leu Leu Leu Pro Asn Ser Pro Glu Phe 100 105 110 Ala Leu Ser Phe Leu Ala Val Ala Tyr Leu Gly Ala Val Ser Thr Thr 115 120 125 Ala Asn Pro Phe Tyr Thr Gln Pro Glu Ile Ala Lys Gln Ala Lys Ala 130 135 140 Ser Ala Ala Lys Met Ile Ile Thr Lys Lys Cys Leu Val Asp Lys Leu 145 150 155 160 Thr Asn Leu Lys Asn Asp Gly Val Leu Ile Val Cys Leu Asp Asp Asp 165 170 175 Gly Asp Asn Gly Val Val Ser Ser Ser Asp Asp Gly Cys Val Ser Phe 180 185 190 Thr Glu Leu Thr Gln Ala Asp Glu Thr Glu Leu Leu Lys Pro Lys Ile 195 200 205 Ser Pro Glu Asp Thr Val Ala Met Pro Tyr Ser Ser Gly Thr Thr Gly 210 215 220 Leu Pro Lys Gly Val Met Ile Thr His Lys Gly Leu Val Thr Ser Ile 225 230 235 240 Ala Gln Lys Val Asp Gly Glu Asn Pro Asn Leu Asn Phe Thr Ala Asn 245 250 255 Asp Val Ile Leu Cys Phe Leu Pro Met Phe His Ile Tyr Ala Leu Asp 260 265 270 Ala Leu Met Leu Ser Ala Met Arg Thr Gly Ala Ala Leu Leu Ile Val 275 280 285 Pro Arg Phe Glu Leu Asn Leu Val Met Glu Leu Ile Gln Arg Tyr Lys 290 295 300 Val Thr Val Val Pro Val Ala Pro Pro Val Val Leu Ala Phe Ile Lys 305 310 315 320 Ser Pro Glu Thr Glu Arg Tyr Asp Leu Ser Ser Val Arg Ile Met Leu 325 330 335 Ser Gly Ala Ala Thr Leu Lys Lys Glu Leu Glu Asp Ala Val Arg Leu 340 345 350 Lys Phe Pro Asn Ala Ile Phe Gly Gln Gly Tyr Gly Met Thr Glu Ser 355 360 365 Gly Thr Val Ala Lys Ser Leu Ala Phe Ala Lys Asn Pro Phe Lys Thr 370 375 380 Lys Ser Gly Ala Cys Gly Thr Val Ile Arg Asn Ala Glu Met Lys Val 385 390 395 400 Val Asp Thr Glu Thr Gly Ile Ser Leu Pro Arg Asn Lys Ser Gly Glu 405 410 415 Ile Cys Val Arg Gly His Gln Leu Met Lys Gly Tyr Leu Asn Asp Pro 420 425 430 Glu Ala Thr Ala Arg Thr Ile Asp Lys Asp Gly Trp Leu His Thr Gly 435 440 445 Asp Ile Gly Phe Val Asp Asp Asp Asp Glu Ile Phe Ile Val Asp Arg 450 455 460 Leu Lys Glu Leu Ile Lys Phe Lys Gly Tyr Gln Val Ala Pro Ala Glu 465 470 475 480 Leu Glu Ala Leu Leu Ile Ser His Pro Ser Ile Asp Asp Ala Ala Val 485 490 495 Val Ala Met Lys Asp Glu Val Ala Asp Glu Val Pro Val Ala Phe Val 500 505 510 Ala Arg Ser Gln Gly Ser Gln Leu Thr Glu Asp Asp Val Lys Ser Tyr 515 520 525 Val Asn Lys Gln Val Val His Tyr Lys Arg Ile Lys Met Val Phe Phe 530 535 540 Ile Glu Val Ile Pro Lys Ala Val Ser Gly Lys Ile Leu Arg Lys Asp 545 550 555 560 Leu Arg Ala Lys Leu Glu Thr Met Cys Ser Lys 565 570 <210> 124 <211> 1716 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:123 <400> 124 atgtccgttt tgcaacaaca aactcacttc ttgactaaga agatcgatca agaagatgaa 60 gaagaagaac catctcacga tttcattttc agatctaagt tgccagatat cttcatccca 120 aaccacttgc cattgaccga ttacgtattc caaagattct ccggtgatgg tgacggtgat 180 tcctctacta cctgtatcat cgacggtgcc actggccgta tcctcaccta cgccgatgtt 240 caaatcaaca tgagaagaat cgctaccggt atccacagat tgggtatcag acacggtgac 300 gtcgttatgt tgttgttgcc aaactctcca gaattcgctt tgtctttctt ggccgttgct 360 tacttgggtg ccgtttccac taccgctaac ccattctaca ctcaaccaga aatcgctaag 420 caagctaagg cctccgccgc taagatgatc atcactaaga aatgcctggt cgataagttg 480 actaacttga agaacgacgg tgttttgatc gtttgtttgg acgatgacgg tgacaatggc 540 gttgtgagct cttctgatga tggttgtgtt tctttcactg aattgactca agctgacgaa 600 actgaattgt tgaagccaaa gatctctcca gaagatactg ttgctatgcc atactcttcc 660 ggcactactg gtttaccaaa gggtgttatg attactcaca agggtttggt tacttctatc 720 gctcaaaagg tcgacggtga aaacccaaac ttgaacttca ctgccaacga cgtcatcttg 780 tgtttcttgc caatgttcca catttacgct ttggacgctt tgatgttgtc tgctatgaga 840 accggtgctg ctttgttgat cgttccaaga ttcgaattga acttggttat ggaattgatt 900 caaagataca aggtcactgt tgttccagtt gctccaccag ttgttttggc tttcattaag 960 tccccagaaa ctgaaagata cgacttatct tctgttagaa ttatgttgtc tggtgctgct 1020 actttgaaga aggaattgga agatgccgtt agattgaagt tcccaaacgc cattttcggt 1080 caaggttacg gtatgaccga atccggtact gttgctaagt cgctcgcgtt cgctaagaac 1140 ccattcaaga ccaagtccgg tgcttgtggt actgttatca gaaacgccga aatgaaggtt 1200 gtcgataccg aaaccggtat ctccttgcca agaaacaagt ctggtgaaat ctgtgtcaga 1260 ggtcaccaat tgatgaaggg ttacttgaac gatccagaag ctactgctag aaccatcgac 1320 aaggacggtt ggttgcacac tggtgatatt ggtttcgttg atgatgatga tgaaatcttc 1380 attgttgata gattgaagga attgatcaag ttcaagggtt accaagttgc tccagctgaa 1440 ttggaagctt tgttgatttc tcacccatct atcgatgatg ccgctgttgt tgctatgaag 1500 gatgaagttg ctgatgaagt tccagttgct ttcgttgcta gatctcaagg ttctcaattg 1560 actgaagatg atgtcaagtc ttacgttaac aagcaagttg ttcactacaa gagaattaag 1620 atggttttct tcatcgaagt tatcccaaag gctgtttctg gtaagatttt gagaaaggat 1680 ttgagagcta agttggaaac catgtgttct aagtaa 1716 <210> 125 <211> 561 <212> PRT <213> Citrus clementina <400> 125 Met Ser Ile Ser Ile Ala Thr Lys Lys Pro Glu Leu Ser Leu Asp Ile 1 5 10 15 Ser Ser Pro Ala Pro Pro Ala Pro Ser Asn Glu Lys Ile Ala Thr His 20 25 30 Ile Phe Lys Ser Lys Leu Pro Asp Ile Pro Ile Ser Asn His Leu Pro 35 40 45 Leu His Thr Tyr Cys Phe Gln Asp Arg Leu Ser Asp Asp Pro Cys Leu 50 55 60 Ile Val Gly Leu Thr Gly Lys Thr Tyr Ser Tyr Ala Glu Thr His Leu 65 70 75 80 Ile Cys Arg Lys Thr Ala Ala Gly Leu Ser Asn Leu Gly Ile Lys Lys 85 90 95 Gly Asp Val Ile Met Ile Leu Leu Gln Asn Cys Ala Glu Phe Val Phe 100 105 110 Ser Phe Met Gly Ala Ser Met Ile Gly Ala Val Thr Thr Thr Ala Asn 115 120 125 Pro Phe Tyr Thr Ser Ala Glu Ile Leu Lys Gln Phe Arg Thr Ser Gly 130 135 140 Ala Lys Leu Ile Ile Thr Met Ser Gln Tyr Val Asp Arg Leu Pro Lys 145 150 155 160 Thr Asp Lys Asp Phe Thr Val Ile Thr Ile Asp Ala Pro Pro Glu Asn 165 170 175 Cys Leu His Phe Thr Val Leu Ser Glu Ala Asp Glu Asp Gln Ile Pro 180 185 190 Glu Val Ala Ile Glu Pro Asp Asp Pro Val Ala Leu Pro Phe Ser Ser 195 200 205 Gly Thr Thr Gly Leu Pro Lys Gly Val Val Leu Thr His Lys Ser Leu 210 215 220 Ile Thr Ser Val Ala Gln Gln Val Asp Gly Glu Asn Pro Asn Leu Tyr 225 230 235 240 Leu Thr Asn Gly Asp Val Val Leu Cys Val Leu Pro Leu Phe His Ile 245 250 255 Tyr Ser Leu Asn Ser Val Leu Leu Cys Ser Leu Arg Ala Gly Ala Gly 260 265 270 Val Leu Leu Met Gln Lys Phe Glu Ile Gly Ala Leu Leu Glu Leu Ile 275 280 285 Gln Arg His Arg Val Ser Val Ala Ala Val Val Pro Pro Leu Val Leu 290 295 300 Ala Leu Ala Lys Asn Pro Met Val Ala Asp Tyr Asp Leu Ser Ser Ile 305 310 315 320 Arg Val Val Leu Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp 325 330 335 Ala Leu Arg Ser Arg Val Pro Gln Ala Ile Leu Gly Gln Gly Tyr Gly 340 345 350 Met Thr Glu Ala Gly Pro Val Leu Ser Met Cys Leu Gly Phe Ala Lys 355 360 365 Gln Pro Phe Pro Thr Lys Ser Gly Ser Cys Gly Thr Val Val Arg Asn 370 375 380 Ala Glu Leu Lys Val Ile Asp Pro Glu Ile Gly Ala Ser Leu Pro His 385 390 395 400 Asn Gln Pro Gly Glu Ile Cys Ile Arg Gly Pro Gln Ile Met Lys Gly 405 410 415 Tyr Leu Asn Asp Pro Glu Ala Thr Ala Ala Thr Ile Asp Val Glu Gly 420 425 430 Trp Leu His Thr Gly Asp Ile Gly Tyr Val Asp Asp Asp Asp Glu Val 435 440 445 Phe Ile Val Asp Arg Val Lys Glu Ile Ile Lys Phe Lys Gly Phe Gln 450 455 460 Val Pro Pro Ala Glu Ile Glu Ala Leu Leu Leu Ser His Pro Ser Ile 465 470 475 480 Gly Asp Ala Ala Val Val Pro Gln Lys Asp Glu Val Ala Gly Glu Val 485 490 495 Pro Val Ala Phe Val Val Arg Ser Asn Gly Phe Glu Leu Thr Glu Glu 500 505 510 Ala Ile Lys Glu Tyr Ile Ala Lys Gln Val Val Phe Tyr Lys Arg Leu 515 520 525 His Lys Ile Tyr Phe Val His Ala Ile Pro Lys Ser Pro Ser Gly Lys 530 535 540 Ile Leu Arg Lys Asp Leu Arg Ala Lys Leu Ala Ser Ser Met Pro Leu 545 550 555 560 Asn <210> 126 <211> 1686 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:125 <400> 126 atgtccatct ctatcgccac taagaagcca gaattgtctt tggatatctc ttctccagct 60 ccaccagctc catccaacga aaagatcgcc acccacattt tcaagtctaa gttgccagat 120 atcccaatct ccaaccactt gccattgcac acttactgtt tccaagatag attgtctgac 180 gacccatgtt tgatcgttgg tttgactggt aagacttact cttacgccga aactcacttg 240 atctgtagaa agaccgctgc cggtttgtct aacttgggta tcaagaaggg tgacgttatc 300 atgatcttgt tgcaaaactg tgccgaattc gttttctctt tcatgggtgc ttccatgatc 360 ggtgctgtca ctactactgc caacccattc tacacttctg ctgaaatctt gaagcaattc 420 agaacctctg gtgccaagtt gattatcact atgtctcaat acgtcgacag attgccaaag 480 actgacaagg atttcactgt tatcactatc gatgccccac cagaaaactg tttgcacttc 540 actgttttgt ctgaagctga tgaagatcaa atcccagaag ttgccatcga accagacgat 600 ccagttgctt tgccattctc ttctggtacc actggtttgc caaagggtgt tgttttgact 660 cataagagct tgatcacctc tgttgctcaa caagttgacg gtgaaaaccc aaacttgtac 720 ttgactaacg gtgacgttgt tttgtgtgtt ttgccattgt tccacattta ctctttgaac 780 tctgttttgt tgtgttcttt gagagctggt gctggtgttt tgttgatgca aaagttcgaa 840 atcggtgctt tgttggaatt gatccaaaga cacagagttt ctgttgctgc tgttgttcca 900 ccattggttt tggctttggc caagaaccca atggttgctg attacgactt gtcatctatc 960 agagttgttt tgtccggtgc tgctccattg ggtaaggaat tggaagatgc tttgagatct 1020 agagtcccac aagctatctt gggtcaaggt tacggtatga ctgaagctgg tccagttttg 1080 tctatgtgtt tgggtttcgc taagcaacca ttcccaacta agtctggttc ttgtggtacc 1140 gttgttagaa acgctgaatt gaaggttatt gacccagaaa ttggtgcctc cttgccacac 1200 aaccaaccag gtgaaatttg tatcagaggt ccacaaatta tgaagggtta cttgaacgat 1260 ccagaagcta ctgctgctac tatcgacgtt gaaggttggt tgcacactgg tgacatcggt 1320 tacgttgatg atgatgatga agttttcatc gtcgatagag tcaaggaaat catcaagttc 1380 aagggtttcc aagttccacc agctgaaatt gaagccttgt tgttgtctca cccatctatt 1440 ggtgatgctg ctgttgttcc acaaaaggat gaagttgcgg gtgaagttcc agttgcgttc 1500 gttgttcgtt cgaacggctt cgaattgacc gaggaagcca ttaaggaata catcgctaag 1560 caagttgttt tctacaagag attgcacaag atttacttcg ttcacgctat tccaaagtct 1620 ccatccggta agattttgag aaaggatttg agagccaagt tggcctcttc tatgccattg 1680 aactaa 1686 <210> 127 <211> 365 <212> PRT <213> Angelica archangelica <400> 127 Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu 1 5 10 15 Asn Leu Ala Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr 20 25 30 Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Met Asp 35 40 45 Asp Asp Thr Gly Arg Arg Pro Gln Ile Cys Arg Lys Ile Val Glu Ala 50 55 60 Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp Gly 65 70 75 80 Thr Leu Ile Ser Glu Met Thr Arg Leu Ser Arg Glu Phe Phe Ala Leu 85 90 95 Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg Gly 100 105 110 Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Lys Asp Trp 115 120 125 Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asp Asp Arg Asp Tyr 130 135 140 Ser Arg Trp Pro Asp Lys Pro Gln Gly Trp Arg Ser Thr Thr Glu Val 145 150 155 160 Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val Leu 165 170 175 Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys Val 180 185 190 Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro Glu 195 200 205 Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr Ile 210 215 220 Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg Asp 225 230 235 240 Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe Val 245 250 255 Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe Lys 260 265 270 Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu Ser 275 280 285 Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro Leu 290 295 300 Arg Ile Arg Glu Gly Glu Lys Ala Val Leu Asp Glu Ala Ile Thr Tyr 305 310 315 320 Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala Thr 325 330 335 Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Glu Glu Lys Ala Lys 340 345 350 Leu Glu Thr Glu Ser Lys Ser Ala Asp Gly Ile Ser Ala 355 360 365 <210> 128 <211> 1098 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:127 <400> 128 atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa cttggctttc 60 gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaatccca 120 atcatctctt tggctggtat ggacgacgac actggtagga ggccacaaat ctgtagaaag 180 atcgttgaag ctttcgaaga ttggggtatc ttccaagttg ttgaccacgg tatcgacggt 240 actttgatct ctgaaatgac tagattgtct agagaattct tcgctttgcc agctgaagaa 300 aagttgagat acgacactac tggtggtaag agaggtggtt tcactatctc tactcacttg 360 caaggtgacg acgttaagga ctggagagaa ttcgttactt acttctctta cccaatcgac 420 gacagagact actctagatg gccagacaag ccacaaggtt ggagatctac tactgaagtt 480 tactctgaaa agttgatggt tttgggtgct aagttgttgg aagttttgtc tgaagctatg 540 ggtttggaaa aggaagcttt gactaaggct tgtgttaaca tggaacaaaa ggttttgatc 600 aactactacc caacttgtcc agaaccagac ttgactttgg gtgttaggag acacactgac 660 ccaggtacta tcactatctt gttgcaagac atggttggtg gtttgcaagc tactagagat 720 ggtggtaaga cttggatcac tgttcaacca gttgaaggtg ctttcgttgt taacttgggt 780 gaccacggtc actacttgtc taacggtaga ttcaagaacg ctgaccacca agctgttgtt 840 aactctactt cttctagatt gtctatcgct actttccaaa acccagctca aaacgctatc 900 gtttacccat tgagaatcag agaaggtgaa aaggctgttt tggacgaagc tatcacttac 960 gctgaaatgt acaagaagaa catgactaag cacatcgaag ttgctacttt gaagaagttg 1020 gctaaggaaa agagattgca agaagaaaag gctaagttgg aaactgaatc taagtctgct 1080 gacggtatct ctgcttaa 1098 <210> 129 <211> 514 <212> PRT <213> Cynara cardunculus var. scolymus <400> 129 Met Ser Gln Val His Glu Thr Leu Thr Pro Ala Val Ile Ala Ala Val 1 5 10 15 Val Leu Ser Ser Val Phe Leu Tyr Leu Leu Phe Lys Lys Lys Gln Asn 20 25 30 His Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu 35 40 45 His His Leu Gly Pro Leu Ile His Gln Ser Phe His His Leu Ser Thr 50 55 60 Arg Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Pro Cys Ile 65 70 75 80 Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu Lys Thr Asn Glu 85 90 95 Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile Asp His Ile Thr 100 105 110 Tyr Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe 115 120 125 Ile Lys Lys Met Ser Thr Val Glu Leu Leu Gly Asn Gln Asn Leu Gly 130 135 140 His Phe Leu Pro Ile Arg Thr His Glu Ile Gln Glu Leu Leu Gln Thr 145 150 155 160 Leu Thr Glu Lys Ala Lys Arg Arg Glu Ser Val Asn Leu Thr Glu Glu 165 170 175 Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met Met Met Ser Ile 180 185 190 Arg Cys Ser Gly Thr Asn Ser Glu Ala Asp Glu Ala Lys Asn Leu Val 195 200 205 Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile 210 215 220 Trp Phe Cys Lys Asn Ile Asp Leu Gln Gly Phe Lys Lys Arg Tyr Thr 225 230 235 240 Asp Thr His Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Phe Glu 245 250 255 Arg Glu Glu Lys Arg Arg Lys Glu Gly Lys Arg Glu Asp Gly Lys Gly 260 265 270 Lys Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Ala Lys Ala 275 280 285 Glu Ile Lys Ile Thr Arg Asp His Ile Lys Ala Leu Ile Leu Asp Phe 290 295 300 Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala Leu Glu Trp Met Leu 305 310 315 320 Val Glu Leu Ile Ser Asn Pro Lys Val Leu Glu Ile Ala Arg Glu Glu 325 330 335 Ile Asp Gln Val Val Gly Asn Glu Arg Leu Val Gln Glu Ser Asp Ala 340 345 350 Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Ala Leu Arg Leu 355 360 365 His Pro Pro Ile Pro Met Leu Ile Arg Lys Ser Ile Glu Asp Val Ser 370 375 380 Val Gln Gly Tyr Asp Ile Pro Ala Gly Thr Met Leu Phe Val Asn Ile 385 390 395 400 Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu Phe 405 410 415 Lys Pro His Arg Phe Leu Glu Asp Asp Pro Val Lys Lys Ser Leu Asp 420 425 430 Ile Lys Gly Gln Ser Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg Arg 435 440 445 Gly Cys Pro Gly Ile Asn Leu Ala Met Arg Glu Leu Pro Val Val Ile 450 455 460 Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Val Asn Gly Lys Gln Val 465 470 475 480 Leu Asp Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala Ala Asp 485 490 495 Phe Val Cys Val Pro Ser Val Arg Glu Asn Ser Pro Met Met Phe Thr 500 505 510 Ser Thr <210> 130 <211> 1545 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:129 <400> 130 atgtcccaag ttcacgaaac tttgactcca gctgttatcg ctgctgttgt tttgtcatct 60 gttttcttgt acttgttgtt caagaagaag caaaaccaca gattgccacc atctccacca 120 tctttgccaa tcatcggtca cttgcaccac ttgggtccat tgatccacca atctttccac 180 cacttgtcta ctagatacgg tccattgatc cacttgagat tgggttctgt tccatgtatc 240 gttgcttcta ctccagactt ggctagagac ttcttgaaaa ctaacgaatt ggctttctct 300 tctagaaagc actctttggc tatcgaccac atcacttacg gtgttgcttt cgctttcgct 360 ccatacggtc catactggaa gttcatcaag aagatgtcta ctgttgaatt gttgggtaac 420 caaaacttgg gtcacttctt gccaatcaga actcacgaaa tccaagaatt gttgcaaact 480 ttgactgaaa aggctaagag aagagaatct gttaacttga ctgaagaatt gttgaagttg 540 actaacaacg ttatctgtca aatgatgatg tctatcagat gttctggtac taactctgaa 600 gctgacgaag ctaagaactt ggttagagaa gttactcaaa tcttcggtga attcaacgtt 660 tctgacttca tctggttctg taagaacatc gacttgcaag gtttcaagaa gagatacact 720 gacactcaca agagatacga cgctttgttg gaaaagatca tcttcgaaag agaagaaaag 780 agaagaaagg aaggtaagag agaagatggt aagggtaagg acttcttgga catgttgttg 840 gacgttttgg aagatgctaa ggctgaaatc aagatcacta gagatcacat caaggctttg 900 atcttggact tcttcactgc tgctactgac actactgcta tcgctttgga atggatgttg 960 gttgaattga tctctaaccc aaaggttttg gaaatcgcta gagaagaaat cgaccaagtt 1020 gttggtaacg aaagattggt tcaagaatct gacgctccaa acttgccata catccaagct 1080 atcatcaagg aagctttgag attgcaccca ccaatcccaa tgttgatcag aaagtctatc 1140 gaagatgttt ctgttcaagg ttacgacatc ccagctggta ctatgttgtt cgttaacatc 1200 tggtctatcg gtagaaaccc aaagtactgg gaatctccat tggaattcaa gccacacaga 1260 ttcttggaag atgacccagt taagaagtct ttggacatca agggtcaatc tttccaattg 1320 ttgccattcg gtactggtag aagaggttgt ccaggtatca acttggctat gagagaattg 1380 ccagttgtta tcgctggttt gatccaatgt ttcgaatgga acgttaacgg taagcaagtt 1440 ttggacatgg acgaaagagc tggtttgact gctccaagag ctgctgactt cgtttgtgtt 1500 ccatctgtta gagaaaactc tccaatgatg ttcacttcta cttaa 1545 <210> 131 <211> 507 <212> PRT <213> Perilla frutescens var. crispa <400> 131 Met Ser Ala Leu Tyr Ala Ala Leu Phe Leu Leu Ser Ala Ala Val Val 1 5 10 15 Arg Ser Val Leu Asp Arg Lys Arg Gly Arg Pro Pro Tyr Pro Pro Gly 20 25 30 Pro Phe Pro Leu Pro Ile Ile Gly His Leu His Leu Leu Gly Pro Arg 35 40 45 Leu His Gln Thr Phe His Asp Leu Ser Gln Arg Tyr Gly Pro Leu Met 50 55 60 Gln Leu Arg Leu Gly Ser Ile Arg Cys Val Ile Ala Ala Ser Pro Glu 65 70 75 80 Leu Ala Lys Glu Cys Leu Lys Thr His Glu Leu Val Phe Ser Ser Arg 85 90 95 Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala 100 105 110 Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr 115 120 125 Tyr Glu Leu Leu Gly Ala Arg Asn Leu Ala His Phe Gln Pro Ile Arg 130 135 140 Thr Leu Glu Val Lys Ser Phe Leu Gln Ile Leu Met Arg Lys Gly Glu 145 150 155 160 Ser Gly Glu Ser Phe Asn Val Thr Glu Glu Leu Val Lys Leu Thr Ser 165 170 175 Asn Val Ile Ser His Met Met Leu Ser Ile Arg Cys Ser Glu Thr Glu 180 185 190 Ser Glu Ala Glu Ala Ala Arg Thr Val Ile Arg Glu Val Thr Gln Ile 195 200 205 Phe Gly Glu Phe Asp Val Ser Asp Ile Ile Trp Leu Cys Lys Asn Phe 210 215 220 Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile Gln Arg Arg Tyr 225 230 235 240 Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg Glu Lys Gln Arg Arg 245 250 255 Thr His Gly Gly Gly Gly Gly Gly Gly Glu Ala Lys Asp Phe Leu Asp 260 265 270 Met Phe Leu Asp Ile Met Glu Ser Gly Lys Ala Glu Val Lys Phe Thr 275 280 285 Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr 290 295 300 Asp Thr Thr Ala Ile Val Cys Glu Trp Ala Ile Ala Glu Val Ile Asn 305 310 315 320 Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Ile Ala Asn Ile Val 325 330 335 Gly Phe Asp Arg Ile Leu Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr 340 345 350 Leu Gln Ala Leu Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro 355 360 365 Met Leu Ala Arg Lys Ser Ile Ser Asp Cys Val Ile Asp Gly Tyr Met 370 375 380 Ile Pro Ala Asn Thr Leu Leu Phe Val Asn Leu Trp Ser Met Gly Arg 385 390 395 400 Asn Pro Lys Ile Trp Asp Tyr Pro Thr Ala Phe Gln Pro Glu Arg Phe 405 410 415 Leu Glu Lys Glu Lys Ala Ala Ile Asp Val Lys Gly Gln His Phe Glu 420 425 430 Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu Leu 435 440 445 Ala Ile Gln Glu Val Val Ile Ile Ile Gly Thr Met Ile Gln Cys Phe 450 455 460 Asp Trp Lys Leu Pro Asp Gly Ser Gly His Val Asp Met Ala Glu Arg 465 470 475 480 Pro Gly Leu Thr Ala Pro Arg Glu Thr Asp Leu Phe Cys Arg Val Val 485 490 495 Pro Arg Val Asp Pro Leu Val Val Ser Thr Gln 500 505 <210> 132 <211> 1524 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:131 <400> 132 atgtccgctt tgtacgctgc tttgttcttg ttgtctgctg ctgttgttag atctgttttg 60 gacagaaaga gaggtagacc accataccca ccaggtccat tcccattgcc aatcatcggt 120 cacttgcact tgttgggtcc aagattgcac caaactttcc acgacttgtc tcaaagatac 180 ggtccattga tgcaattgag attgggttct atcagatgtg ttatcgctgc ttctccagaa 240 ttggctaagg aatgtttgaa aactcacgaa ttggttttct cttctagaaa gcactctact 300 gctatcgaca tcgttactta cgactcttct ttcgctttct ctccatacgg tccatactgg 360 aagttcatca agaagttgtg tacttacgaa ttgttgggtg ctagaaactt ggctcacttc 420 caaccaatca gaactttgga agttaagtct ttcttgcaaa tcttgatgag aaagggtgaa 480 tctggtgaat ctttcaacgt tactgaagaa ttggttaagt tgacttctaa cgttatctct 540 cacatgatgt tgtctatcag atgttctgaa actgaatctg aagctgaagc tgctagaact 600 gttatcagag aagttactca aatcttcggt gaattcgacg tttctgacat catctggttg 660 tgtaagaact tcgacttcca aggtatcaga aagagatctg aagatatcca aagaagatac 720 gacgctttgt tggaaaagat catcactgac agagaaaagc aaagaagaac tcacggtggt 780 ggtggtggtg gtggtgaagc taaggacttc ttggacatgt tcttggacat catggaatct 840 ggtaaggctg aagttaagtt cactagagaa cacttgaagg ctttgatctt ggacttcttc 900 actgctggta ctgacactac tgctatcgtt tgtgaatggg ctatcgctga agttatcaac 960 aacccaaacg ttttgaagaa ggctcaagaa gaaatcgcta acatcgttgg tttcgacaga 1020 atcttgcaag aatctgacgc tccaaacttg ccatacttgc aagctttgat caaggaaact 1080 ttcagattgc acccaccaat cccaatgttg gctagaaagt ctatctctga ctgtgttatc 1140 gacggttaca tgatcccagc taacactttg ttgttcgtta acttgtggtc tatgggtaga 1200 aacccaaaga tctgggacta cccaactgct ttccaaccag aaagattctt ggaaaaggaa 1260 aaggctgcta tcgacgttaa gggtcaacac ttcgaattgt tgccattcgg tactggtaga 1320 agaggttgtc caggtatgtt gttggctatc caagaagttg ttatcatcat cggtactatg 1380 atccaatgtt tcgactggaa gttgccagac ggttctggtc acgttgacat ggctgaaaga 1440 ccaggtttga ctgctccaag agaaactgac ttgttctgta gagttgttcc aagagttgac 1500 ccattggttg tttctactca ataa 1524 <210> 133 <211> 515 <212> PRT <213> Dahlia pinnata <400> 133 Met Ser Asn Thr Leu Leu Val Leu Gln Met Val Ile Pro Ala Ile Ile 1 5 10 15 Ala Phe Val Ile Phe His Leu Leu Phe Phe Lys Ser Lys Pro Asn Arg 20 25 30 Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu His 35 40 45 His Leu Gly Pro Leu Ile His Gln Ser Phe Asn Arg Leu Ser Ala Arg 50 55 60 Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Ser Cys Val Val 65 70 75 80 Ala Asp Ala Pro Asp Leu Ala Gln Glu Leu Leu Gln Lys Asn Asp Leu 85 90 95 Ala Phe Ala Asn Arg Lys His Thr Leu Ala Ile Asp His Val Thr Tyr 100 105 110 Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Arg Phe Ile 115 120 125 Lys Lys Met Ser Thr Val Glu Leu Leu Gly Ile Gln Asn Leu Gly His 130 135 140 Phe Leu Pro Ile Arg Thr Gln Glu Ile His Gly Leu Leu Leu Thr Leu 145 150 155 160 Thr Glu Lys Ser Lys Gln Asn Glu Ser Val Asn Met Thr Asn Glu Leu 165 170 175 Leu Lys Leu Ser Asn Asn Ile Ile Cys Gln Met Met Met Gly Ile Arg 180 185 190 Cys Ser Gly Asn Lys Thr Glu Ala Glu Glu Ala Lys Asn Leu Val Arg 195 200 205 Glu Val Thr Thr Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile Trp 210 215 220 Phe Cys Lys Lys Leu Asp Leu Gln Gly Phe Lys Lys Arg Tyr Glu Asp 225 230 235 240 Ile Arg Thr Arg Tyr Asp Ala Leu Leu Glu Arg Ile Ile Phe Ala Arg 245 250 255 Glu Glu Met Arg Lys Glu Gly Lys Gly Met Glu Asp Gly Lys Gly Lys 260 265 270 Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Asp Lys Ala Glu 275 280 285 Ile Lys Ile Thr Arg Asn His Ile Lys Ala Leu Ile Leu Asp Phe Val 290 295 300 Thr Ala Gly Thr Asp Thr Thr Ala Val Ile Ile Glu Trp Thr Leu Val 305 310 315 320 Glu Leu Ile Lys Asn Pro Met Val Met Glu Lys Ala Lys Gln Glu Leu 325 330 335 Asp Glu Val Val Gly Asn Thr Arg Leu Val Glu Glu Ser Asp Ala Pro 340 345 350 Lys Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Ala Phe Arg Leu His 355 360 365 Pro Pro Ile Pro Met Ile Ile Arg Lys Ser Asn Glu Asn Val Ser Val 370 375 380 Lys Ser Gly Tyr Glu Ile Pro Ala Gly Ser Ile Leu Phe Val Asn Asn 385 390 395 400 Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu Phe 405 410 415 Lys Pro Asp Arg Phe Leu Lys Glu Gly Val Leu Lys Pro Ser Leu Asp 420 425 430 Ile Arg Gly Gln Asn Phe Gln Ile Leu Pro Phe Gly Thr Gly Arg Arg 435 440 445 Ser Cys Pro Gly Ile Asn Met Ala Met Arg Gln Leu Pro Val Val Val 450 455 460 Ala Ile Leu Ile Gln Cys Phe Glu Trp Thr Val Asn Asp Lys Gln Val 465 470 475 480 Leu Asn Met Asp Glu Arg Gly Gly Leu Thr Thr Pro Arg Ala Thr Asp 485 490 495 Leu Val Cys Phe Pro Leu Leu Arg Lys Asn Ser Pro His Ser Met Phe 500 505 510 Thr Ser Val 515 <210> 134 <211> 1548 <212> DNA <213> Artificial Sequence <220> <223> coding sequence for SEQ ID NO:133 <400> 134 atgtccaaca ctttgttggt tttgcaaatg gttatcccag ctatcatcgc tttcgttatc 60 ttccacttgt tgttcttcaa gtctaagcca aacagaagat tgccaccatc tccaccatct 120 ttgccaatca tcggtcactt gcaccacttg ggtccattga tccaccaatc tttcaacaga 180 ttgtctgcta gatacggtcc attgatccac ttgagattgg gttctgtttc ttgtgttgtt 240 gctgacgctc cagacttggc tcaagaattg ttgcaaaaga acgacttggc tttcgctaac 300 agaaagcaca ctttggctat cgaccacgtt acttacggtg ttgctttcgc tttcgctcca 360 tacggtccat actggagatt catcaagaag atgtctactg ttgaattgtt gggtatccaa 420 aacttgggtc acttcttgcc aatcagaact caagaaatcc acggtttgtt gttgactttg 480 actgaaaagt ctaagcaaaa cgaatctgtt aacatgacta acgaattgtt gaagttgtct 540 aacaacatca tctgtcaaat gatgatgggt atcagatgtt ctggtaacaa gactgaagct 600 gaagaagcta agaacttggt tagagaagtt actactatct tcggtgaatt caacgtttct 660 gacttcatct ggttctgtaa gaagttggac ttgcaaggtt tcaagaagag atacgaagat 720 atcagaacta gatacgacgc tttgttggaa agaatcatct tcgctagaga agaaatgaga 780 aaggaaggta agggtatgga agatggtaag ggtaaggact tcttggacat gttgttggac 840 gttttggaag atgacaaggc tgaaatcaag atcactagaa accacatcaa ggctttgatc 900 ttggacttcg ttactgctgg tactgacact actgctgtta tcatcgaatg gactttggtt 960 gaattgatca agaacccaat ggttatggaa aaggctaagc aagaattgga cgaagttgtt 1020 ggtaacacta gattggttga agaatctgac gctccaaagt tgccatacat ccaagctatc 1080 atcaaggaag ctttcagatt gcacccacca atcccaatga tcatcagaaa gtctaacgaa 1140 aacgtttctg ttaagtctgg ttacgaaatc ccagctggtt ctatcttgtt cgttaacaac 1200 tggtctatcg gtagaaaccc aaagtactgg gaatctccat tggaattcaa gccagacaga 1260 ttcttgaagg aaggtgtttt gaagccatct ttggacatca gaggtcaaaa cttccaaatc 1320 ttgccattcg gtactggtag aagatcttgt ccaggtatca acatggctat gagacaattg 1380 ccagttgttg ttgctatctt gatccaatgt ttcgaatgga ctgttaacga caagcaagtt 1440 ttgaacatgg acgaaagagg tggtttgact actccaagag ctactgactt ggtttgtttc 1500 ccattgttga gaaagaactc tccacactct atgttcactt ctgtttaa 1548 <210> 135 <211> 515 <212> PRT <213> Callistephus chinensis <400> 135 Met Ser Asn Ile Phe Glu Val Phe Gln Ser Val Ser Pro Ala Ile Ile 1 5 10 15 Ala Ile Phe Phe Ile Ser Ser Leu Phe Ile Tyr Leu Val Leu Ile Arg 20 25 30 Asn Gln Lys Ser Leu Ser Leu Pro Pro Ser Pro Pro Ala Leu Pro Ile 35 40 45 Ile Gly His Leu His His Leu Gly Pro Leu Ile His His Ser Phe His 50 55 60 Asp Leu Ser Thr Arg Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser 65 70 75 80 Val Pro Cys Val Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu 85 90 95 Lys Thr Asn Glu Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile 100 105 110 Asp His Val Thr Tyr Gly Val Ser Phe Ala Phe Ala Pro Tyr Gly Pro 115 120 125 Tyr Trp Lys Phe Ile Lys Lys Thr Ser Ile Val Glu Leu Leu Gly Asn 130 135 140 Gln Asn Leu Ser Asn Phe Leu Pro Ile Arg Thr Gln Glu Val His Glu 145 150 155 160 Leu Leu Gln Thr Leu Met Val Lys Ser Lys Lys Asn Glu Ser Val Asn 165 170 175 Leu Ser Glu Glu Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met 180 185 190 Met Met Ser Ile Arg Cys Ser Gly Thr Asn Asn Glu Ala Asp Glu Ala 195 200 205 Lys Asn Leu Val Arg Glu Val Thr Lys Ile Phe Gly Glu Phe Asn Ile 210 215 220 Ser Asp Phe Ile Cys Leu Phe Lys Asn Ile Asp Leu Gln Gly Phe Lys 225 230 235 240 Lys Arg Tyr Val Asp Thr His Thr Arg Tyr Asn Ala Leu Leu Glu Lys 245 250 255 Met Ile Phe Glu Arg Glu Glu Lys Arg Lys Gln Lys Lys Ser Glu Asp 260 265 270 Gly Lys Gly Lys Asp Phe Leu Asp Ile Leu Leu Asp Val Leu Glu Asp 275 280 285 Glu Asn Ala Glu Ile Lys Ile Thr Arg Asp His Ile Lys Ala Leu Ile 290 295 300 Leu Asp Phe Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ser Ile Glu 305 310 315 320 Trp Thr Leu Val Glu Leu Thr Asn Asn Pro Lys Val Leu Glu Asn Ala 325 330 335 Arg Lys Glu Ile Ala Glu Val Val Gly Asp Glu Arg Leu Val Gln Glu 340 345 350 Ser Asp Ile Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Thr 355 360 365 Leu Arg Met His Pro Pro Ile Pro Met Val Ile Arg Lys Ser Ile Asp 370 375 380 Asn Val Thr Val Gln Gly Tyr Asp Ile Arg Ala Gly Thr Met Leu Phe 385 390 395 400 Val Asn Ile Trp Ser Ile Gly Arg Asn Pro Leu Tyr Trp Glu Ser Pro 405 410 415 Leu Glu Phe Lys Pro His Arg Phe Leu Asp Gly His Ala Arg Asn Leu 420 425 430 Asp Val Lys Gly Gln Cys Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg 435 440 445 Arg Gly Cys Pro Gly Ile Ser Leu Ala Met Arg Glu Leu Pro Val Val 450 455 460 Ile Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Ala Asn Asp Lys Glu 465 470 475 480 Val Leu Ser Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala Val 485 490 495 Asp Leu Glu Phe Val Pro Leu Met Arg Gln Asn Cys Pro Asn Ile Phe 500 505 510 Val Ser Ala 515 <210> 136 <211> 1548 <212> DNA <213> artificial <220> <223> coding sequence for SEQ D NO 135 <400> 136 atgtccaaca tcttcgaagt tttccaatct gtttctccag ctatcatcgc tatcttcttc 60 atctcttctt tgttcatcta cttggttttg atcagaaacc aaaagtcttt gtctttgcca 120 ccatctccac cagctttgcc aatcatcggt cacttgcacc acttgggtcc attgatccac 180 cactctttcc acgacttgtc tactagatac ggtccattga tccacttgag attgggttct 240 gttccatgtg ttgttgcttc tactccagac ttggctagag acttcttgaa aactaacgaa 300 ttggctttct cttctagaaa gcactctttg gctatcgacc acgttactta cggtgtttct 360 ttcgctttcg ctccatacgg tccatactgg aagttcatca agaaaacttc tatcgttgaa 420 ttgttgggta accaaaactt gtctaacttc ttgccaatca gaactcaaga agttcacgaa 480 ttgttgcaaa ctttgatggt taagtctaag aagaacgaat ctgttaactt gtctgaagaa 540 ttgttgaagt tgactaacaa cgttatctgt caaatgatga tgtctatcag atgttctggt 600 actaacaacg aagctgacga agctaagaac ttggttagag aagttactaa gatcttcggt 660 gaattcaaca tctctgactt catctgtttg ttcaagaaca tcgacttgca aggtttcaag 720 aagagatacg ttgacactca cactagatac aacgctttgt tggaaaagat gatcttcgaa 780 agagaagaaa agagaaagca aaagaagtct gaagatggta agggtaagga cttcttggac 840 atcttgttgg acgttttgga agatgaaaac gctgaaatca agatcactag agatcacatc 900 aaggctttga tcttggactt cttcactgct gctactgaca ctactgctat ctctatcgaa 960 tggactttgg ttgaattgac taacaaccca aaggttttgg aaaacgctag aaaggaaatc 1020 gctgaagttg ttggtgacga aagattggtt caagaatctg acatcccaaa cttgccatac 1080 atccaagcta tcatcaagga aactttgaga atgcacccac caatcccaat ggttatcaga 1140 aagtctatcg acaacgttac tgttcaaggt tacgacatca gagctggtac tatgttgttc 1200 gttaacatct ggtctatcgg tagaaaccca ttgtactggg aatctccatt ggaattcaag 1260 ccacacagat tcttggacgg tcacgctaga aacttggacg ttaagggtca atgtttccaa 1320 ttgttgccat tcggtactgg tagaagaggt tgtccaggta tctctttggc tatgagagaa 1380 ttgccagttg ttatcgctgg tttgatccaa tgtttcgaat ggaacgctaa cgacaaggaa 1440 gttttgtcta tggacgaaag agctggtttg actgctccaa gagctgttga cttggaattc 1500 gttccattga tgagacaaaa ctgtccaaac atcttcgttt ctgcttaa 1548 <210> 137 <211> 356 <212> PRT <213> Apium graveolens <400> 137 Met Ser Ala Pro Ser Thr Ile Thr Ala Leu Ser Gln Glu Lys Thr Leu 1 5 10 15 Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr 20 25 30 Asn Gln Phe Ser Asn Glu Val Pro Ile Ile Ser Leu Ala Gly Leu Asp 35 40 45 Asp Asp Ser Asn Gly Arg Arg Ala Glu Ile Cys Arg Lys Ile Val Glu 50 55 60 Ala Phe Glu Glu Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp 65 70 75 80 Ser Gly Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala 85 90 95 Leu Pro Ala Glu Glu Lys Leu Val Tyr Asp Thr Thr Gly Glu Lys Lys 100 105 110 Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Arg Asp 115 120 125 Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Ser Ala Arg Asp 130 135 140 Tyr Ser Arg Trp Pro Lys Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu 145 150 155 160 Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val 165 170 175 Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys 180 185 190 Val Glu Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro 195 200 205 Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr 210 215 220 Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg 225 230 235 240 Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe 245 250 255 Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe 260 265 270 Arg Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Thr Arg Leu 275 280 285 Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro 290 295 300 Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr 305 310 315 320 Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Ala Val Ala 325 330 335 Thr Gln Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala 340 345 350 Lys Met Lys Ile 355 <210> 138 <211> 1071 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 137 <400> 138 atgtccgctc catctactat cactgctttg tctcaagaaa agactttgaa cttggacttc 60 gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaagttcca 120 atcatctctt tggctggttt ggacgacgac tctaacggta gaagagctga aatctgtaga 180 aagatcgttg aagctttcga agaatggggt atcttccaag ttgttgacca cggtatcgac 240 tctggtttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300 gaaaagttgg tttacgacac tactggtgaa aagaagggtg gtttcactat ctctactcac 360 ttgcaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccaatc 420 tctgctagag actactctag atggccaaag aagccagaag gttggagatc tactactgaa 480 gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540 atgggtttgg aaaaggaagc tttgactaag gcttgtgttg aaatggaaca aaaggttttg 600 atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660 gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactaga 720 gatggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780 ggtgaccacg gtcactactt gtctaacggt agattcagaa acgctgacca ccaagctgtt 840 gttaactcta cttctactag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900 atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960 tacgctgaaa tgtacaagaa gaacatgact aagcacatcg ctgttgctac tcaaaagaag 1020 ttggctaagg aaaagagatt gcaagacgaa aaggctaaga tgaagatcta a 1071 <210> 139 <211> 521 <212> PRT <213> Medicago truncatula <400> 139 Met Ser Glu Pro Leu Leu Leu Ala Phe Thr Leu Phe Leu Ser Ser Leu 1 5 10 15 Ile Cys Tyr Ile Ile Phe Gln Pro Ile Leu Asn Arg His Lys Asn Leu 20 25 30 Pro Pro Ser Pro Leu Phe Lys Leu Pro Ile Ile Gly His Met His Met 35 40 45 Leu Gly Pro Leu Leu His His Ser Phe Asp Arg Leu Ser Gln Lys Tyr 50 55 60 Gly Pro Ile Phe Ser Leu Asn Phe Gly Ser Val Leu Cys Val Val Ala 65 70 75 80 Ser Thr Pro His Tyr Ala Lys Gln Ile Leu Gln Ile Asn Glu His Ala 85 90 95 Phe Asn Cys Arg Asn Glu Ser Thr Ala Ile Lys Arg Leu Thr Tyr Glu 100 105 110 Ala Ser Leu Ala Phe Ala Pro Tyr Gly Glu Tyr Trp Arg Phe Ile Lys 115 120 125 Lys Leu Ser Met Asn Glu Leu Leu Gly Ser Arg Ser Ile Ser Ser Phe 130 135 140 Gln His Leu Arg Leu Gln Glu Thr His Asn Leu Leu Lys Leu Phe Ala 145 150 155 160 Asp Lys Ala Lys Asn Tyr Glu Ala Val Asn Val Thr Gln Glu Leu Leu 165 170 175 Lys Leu Ser Asn Asn Val Ile Ser Lys Met Met Leu Gly Glu Ala Glu 180 185 190 Glu Ala Arg Asp Val Val Arg Asp Val Thr Glu Ile Phe Gly Glu Phe 195 200 205 Asn Val Ser Asp Phe Ile Trp Leu Phe Lys Lys Leu Asp Leu Gln Gly 210 215 220 Phe Gly Lys Arg Ile Glu Asp Leu Phe Met Arg Phe Asp Thr Leu Val 225 230 235 240 Glu Arg Ile Ile Ser Lys Arg Glu Glu Leu Arg Lys Asn Lys Gly Arg 245 250 255 Lys Glu Asn Lys Gly Glu Gln Gly Ala Glu Phe Arg Asp Phe Leu Asp 260 265 270 Ile Leu Leu Asp Cys Ala Glu Asp Gln Asn Ser Glu Ile Lys Val Gln 275 280 285 Arg Val His Ile Lys Ala Leu Ile Met Asp Phe Phe Thr Ala Gly Thr 290 295 300 Asp Thr Thr Ser Ile Ser Thr Glu Trp Ala Leu Val Glu Leu Met Asn 305 310 315 320 Asn Pro Ser Leu Leu Gln Lys Ala Arg Glu Glu Ile Asp Asn Val Val 325 330 335 Gly Lys Asn Arg Leu Val Asp Glu Ser Asp Gly Pro Asn Leu Pro Tyr 340 345 350 Ile Gln Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Val Pro 355 360 365 Met Val Thr Arg Arg Cys Val Thr Gln Cys Lys Ile Glu Asn Tyr Val 370 375 380 Ile Pro Glu Asn Ser Leu Ile Phe Val Asn Asn Trp Ala Met Gly Arg 385 390 395 400 Asn Ser Ala Tyr Trp Asp Lys Pro Leu Glu Phe Asn Pro Glu Arg Phe 405 410 415 Leu Lys Asn Ser Thr Asn Ser Asn Gly Val Ile Asp Val Arg Gly Gln 420 425 430 Asn Phe Gln Ile Leu Pro Phe Gly Ser Gly Arg Arg Met Cys Pro Gly 435 440 445 Val Thr Leu Ala Met Gln Glu Val Pro Ala Leu Leu Gly Ala Ile Ile 450 455 460 Gln Cys Phe Asp Phe Asn Phe Val Gly Pro Lys Gly Glu Ile Leu Lys 465 470 475 480 Gly Gly Asp Ile Val Ile Asp Val Asn Glu Arg Pro Gly Leu Thr Ala 485 490 495 Pro Arg Val His Asp Leu Val Cys Val Pro Val Glu Arg Phe Ala Cys 500 505 510 Gly Gly Pro Leu Gln Ser Leu Gly Cys 515 520 <210> 140 <211> 1566 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 139 <400> 140 atgtccgaac cattgttgtt ggctttcact ttgttcttgt catctttgat ctgttacatc 60 atcttccaac caatcttgaa cagacacaag aacttgccac catctccatt gttcaagttg 120 ccaatcatcg gtcacatgca catgttgggt ccattgttgc accactcttt cgacagattg 180 tctcaaaagt acggtccaat cttctctttg aacttcggtt ctgttttgtg tgttgttgct 240 tctactccac actacgctaa gcaaatcttg caaatcaacg aacacgcttt caactgtaga 300 aacgaatcta ctgctatcaa gagattgact tacgaagctt ctttggcttt cgctccatac 360 ggtgaatact ggagattcat caagaagttg tctatgaacg aattgttggg ttctagatct 420 atctcttctt tccaacactt gagattgcaa gaaactcaca acttgttgaa gttgttcgct 480 gacaaggcta agaactacga agctgttaac gttactcaag aattgttgaa gttgtctaac 540 aacgttatct ctaagatgat gttgggtgaa gctgaagaag ctagagatgt tgttagagat 600 gttactgaaa tcttcggtga attcaacgtt tctgacttca tctggttgtt caagaagttg 660 gacttgcaag gtttcggtaa gagaatcgaa gatttgttca tgagattcga cactttggtt 720 gaaagaatca tctctaagag agaagaattg agaaagaaca agggtagaaa ggaaaacaag 780 ggtgaacaag gtgctgaatt cagagacttc ttggacatct tgttggactg tgctgaagat 840 caaaactctg aaatcaaggt tcaaagagtt cacatcaagg ctttgatcat ggacttcttc 900 actgctggta ctgacactac ttctatctct actgaatggg ctttggttga attgatgaac 960 aacccatctt tgttgcaaaa ggctagagaa gaaatcgaca acgttgttgg taagaacaga 1020 ttggttgacg aatctgacgg tccaaacttg ccatacatcc aagctatcat caaggaaact 1080 ttcagattgc acccaccagt tccaatggtt actagaagat gtgttactca atgtaagatc 1140 gaaaactacg ttatcccaga aaactctttg atcttcgtta acaactgggc tatgggtaga 1200 aactctgctt actgggacaa gccattggaa ttcaacccag aaagattctt gaagaactct 1260 actaactcta acggtgttat cgacgttaga ggtcaaaact tccaaatctt gccattcggt 1320 tctggtagaa gaatgtgtcc aggtgttact ttggctatgc aagaagttcc agctttgttg 1380 ggtgctatca tccaatgttt cgacttcaac ttcgttggtc caaagggtga aatcttgaag 1440 ggtggtgaca tcgttatcga cgttaacgaa agaccaggtt tgactgctcc aagagttcac 1500 gacttggttt gtgttccagt tgaaagattc gcttgtggtg gtccattgca atctttgggt 1560 tgttaa 1566 <210> 141 <211> 366 <212> PRT <213> Cuminum cyminum <400> 141 Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu 1 5 10 15 Asn Ser Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr 20 25 30 Asn Gln Phe Ser Thr Glu Ile Pro Ile Ile Ser Leu Ala Gly Ile Asp 35 40 45 Asp Asp Ser Lys Gly Arg Arg Pro Glu Val Cys Arg Lys Ile Val Glu 50 55 60 Ala Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Val Asp 65 70 75 80 Ser Ala Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala 85 90 95 Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg 100 105 110 Gly Gly Phe Thr Ile Ser Thr His Gln Gln Gly Asp Asp Val Arg Asp 115 120 125 Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Val Asp Ala Arg Asp 130 135 140 Tyr Ser Arg Trp Pro Glu Lys Pro Glu Gly Trp Arg Ser Val Thr Glu 145 150 155 160 Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val 165 170 175 Leu Ser Glu Ala Met Gly Leu Asp Lys Gly Ala Leu Thr Lys Ala Cys 180 185 190 Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro 195 200 205 Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr 210 215 220 Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg 225 230 235 240 Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Val Phe 245 250 255 Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe 260 265 270 Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu 275 280 285 Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro 290 295 300 Leu Lys Ile Arg Glu Gly Glu Lys Pro Ile Leu Glu Glu Ala Ile Thr 305 310 315 320 Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala 325 330 335 Thr Gln Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Glu Glu Lys Ala 340 345 350 Lys Leu Glu Thr Lys Thr Lys Ser Ala Asp Gly Ile Leu Ala 355 360 365 <210> 142 <211> 1101 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 141 <400> 142 atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa ctctgacttc 60 gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctac tgaaatccca 120 atcatctctt tggctggtat cgacgacgac tctaagggta ggaggccaga agtttgtaga 180 aagatcgttg aagctttcga agattggggt atcttccaag ttgttgacca cggtgttgac 240 tctgctttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300 gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360 caacaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccagtt 420 gacgctagag actactctag atggccagaa aagccagaag gttggagatc tgttactgaa 480 gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540 atgggtttgg acaagggtgc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600 atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660 gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactagg 720 gacggtggta agacttggat cactgttcaa ccagttgaag gtgttttcgt tgttaacttg 780 ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840 gttaactcta cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900 atcgtttacc cattgaagat cagagaaggt gaaaagccaa tcttggaaga agctatcact 960 tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctac tcaaaagaag 1020 ttggctaagg aaaagagatt gcaagaagaa aaggctaagt tggaaactaa gactaagtct 1080 gctgacggta tcttggctta a 1101 <210> 143 <211> 356 <212> PRT <213> Aethusa cynapium <400> 143 Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ser Gln Glu Lys Ser Leu 1 5 10 15 Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr 20 25 30 Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Met Asp 35 40 45 Asp Asp Ser Asn Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Glu 50 55 60 Ala Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp 65 70 75 80 Lys Gly Leu Ile Ser Gln Met Ser Arg Leu Ser Arg Glu Phe Phe Ala 85 90 95 Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg 100 105 110 Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Lys Asp 115 120 125 Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Glu Asp Arg Asp 130 135 140 Tyr Ser Arg Trp Pro Glu Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu 145 150 155 160 Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val 165 170 175 Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys 180 185 190 Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro 195 200 205 Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr 210 215 220 Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg 225 230 235 240 Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe 245 250 255 Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe 260 265 270 Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu 275 280 285 Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro 290 295 300 Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr 305 310 315 320 Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala 325 330 335 Ala Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala 340 345 350 Lys Leu Glu Met 355 <210> 144 <211> 1071 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 143 <400> 144 atgtccgctc caactactat cactgctttg tctcaagaaa agtctttgaa cttggacttc 60 gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaatccca 120 atcatctctt tggctggtat ggacgacgac tctaacggta ggaggccaga aatctgtaga 180 aagatcgttg aagctttcga agattggggt atcttccaag ttgttgacca cggtatcgac 240 aagggtttga tctctcaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300 gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360 ttgcaaggtg acgacgttaa ggactggaga gaattcgtta cttacttctc ttacccaatc 420 gaagatagag actactctag atggccagaa aagccagaag gttggagatc tactactgaa 480 gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540 atgggtttgg aaaaggaagc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600 atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660 gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactagg 720 gacggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780 ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840 gttaactcta cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900 atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960 tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctgc tttgaagaag 1020 ttggctaagg aaaagagatt gcaagacgaa aaggctaagt tggaaatgta a 1071 <210> 145 <211> 366 <212> PRT <213> Conium maculatum <400> 145 Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu 1 5 10 15 Asn Leu Ala Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr 20 25 30 Asn Glu Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Leu Glu 35 40 45 Asn Asp Ser Asp Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Glu 50 55 60 Ala Phe Glu Asn Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp 65 70 75 80 Ser Ala Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala 85 90 95 Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg 100 105 110 Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Arg Asp 115 120 125 Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asp Ala Arg Asp 130 135 140 Tyr Ser Arg Trp Pro Asp Lys Pro Glu Gly Trp Arg Ser Ile Thr Glu 145 150 155 160 Val Tyr Ser Glu Arg Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val 165 170 175 Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys 180 185 190 Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro 195 200 205 Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr 210 215 220 Ile Thr Val Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg 225 230 235 240 Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe 245 250 255 Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe 260 265 270 Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Ser Ser Ser Arg Leu 275 280 285 Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro 290 295 300 Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr 305 310 315 320 Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala 325 330 335 Thr Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala 340 345 350 Asn Met Glu Lys Lys Ser Lys Ser Ala His Gly Ile Ser Ala 355 360 365 <210> 146 <211> 1101 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 145 <400> 146 atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa cttggctttc 60 gttagagatg aagatgaaag accaaaggtt gcttacaacg aattctctaa cgaaatccca 120 atcatctctt tggctggttt ggaaaacgac tctgacggta gaaggccaga aatctgtaga 180 aagatcgttg aagctttcga aaactggggt atcttccaag ttgttgacca cggtatcgac 240 tctgctttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300 gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360 ttgcaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccaatc 420 gacgctagag actactctag atggccagac aagccagaag gttggagatc tatcactgaa 480 gtttactctg aaagattgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540 atgggtttgg aaaaggaagc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600 atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag aaggcacact 660 gacccaggta ctatcactgt tttgttgcaa gacatggttg gtggtttgca agctactaga 720 gatggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780 ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840 gttaactctt cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900 atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960 tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctac tttgaagaag 1020 ttggctaagg aaaagagatt gcaagacgaa aaggctaaca tggaaaagaa gtctaagtct 1080 gctcacggta tctctgctta a 1101 <210> 147 <211> 535 <212> PRT <213> Camellia sinensis <400> 147 Met Ser Phe Asp Leu Ile Ser Ile Ala Thr Leu Phe Phe Val Ile Ile 1 5 10 15 Ser Thr Thr Ile Leu Leu Leu Ser Ile Asn His Phe Lys Lys Pro Pro 20 25 30 His Leu Arg Arg Arg Leu Ser Leu Pro Pro Thr Pro Phe Ala Leu Pro 35 40 45 Ile Ile Gly His Leu His Leu Leu Gly Pro Ile Ile His Arg Ser Phe 50 55 60 His Asp Leu Ser Ser Arg Tyr Gly Pro Leu Phe His Leu Arg Leu Gly 65 70 75 80 Ser Val Pro Cys Phe Val Val Ser Thr Pro Glu Leu Ala Lys Glu Phe 85 90 95 Leu Leu Thr His Glu Leu Lys Phe Ser Ser Arg Arg Asp Ser Ile Ala 100 105 110 Ile Gln Arg Leu Thr Tyr Asp Ser Ala Phe Ala Phe Ala Pro Tyr Gly 115 120 125 Pro Tyr Trp Lys Phe Leu Lys Lys Leu Cys Thr Cys Asp Leu Leu Gly 130 135 140 Ala Arg Ser Ile Asn His Phe Leu Pro Thr Arg Thr Arg Glu Leu His 145 150 155 160 Cys Phe Val Arg Leu Leu Ile Asp Lys Ala Val Ala Cys Glu Pro Val 165 170 175 Asn Ile Thr Lys Glu Leu Ser Thr Leu Ala Asn Asn Ile Ile Ser Gln 180 185 190 Met Met Ile Gly Val Arg Cys Ser Gly Thr Thr Gly Glu Ala Glu Glu 195 200 205 Ala Thr Thr Leu Ala Arg Glu Val Thr Lys Ile Phe Gly Glu Phe Asn 210 215 220 Val Ser Asp Phe Met Trp Val Ile Arg Asn Phe Asp Leu Gln Gly Phe 225 230 235 240 Arg Lys Arg Val Glu Asp Ile Tyr Thr Arg Tyr Asp Ala Leu Leu Glu 245 250 255 Arg Ile Ile Thr Asn Arg Glu Glu Val Arg Glu Lys Asn Val Gln Glu 260 265 270 Arg Lys Leu Gly Val Gly Glu Gly His His Val Lys Asp Phe Leu Asp 275 280 285 Leu Leu Leu Asp Val Leu Glu Glu Asp His Ser Glu Ile Asn Phe Ser 290 295 300 Arg Asp Asn Ile Lys Gly Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr 305 310 315 320 Asp Thr Ser Ser Ile Ala Ile Glu Trp Ala Leu Ala Glu Leu Ile Asn 325 330 335 Asn Pro Arg Val Leu Gln Lys Ala Gln Glu Glu Ile Asp Asn Val Val 340 345 350 Gly Lys His Arg Leu Val Ser Glu Ser Asp Gly Pro Asn Leu Pro Tyr 355 360 365 Ile Gln Ala Ile Ile Arg Glu Ala Leu Arg Leu His Pro Pro Val Pro 370 375 380 Leu Ile Thr Arg Lys Ser Ile Glu Asp Cys Met Ile Gln Gly Tyr Asn 385 390 395 400 Ile Pro Ala Asn Ser Met Leu Phe Val Asn Val Trp Ser Leu Ala Arg 405 410 415 Asn Pro Lys Tyr Trp Asp Ser Pro Leu Asp Phe Leu Pro Glu Arg Phe 420 425 430 Leu Arg Pro Glu Lys Gly Gly Pro Val Gly Pro Thr Asp Val Lys Gly 435 440 445 Gln His Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro 450 455 460 Gly Thr Ser Leu Ala Met Gln Glu Leu Pro Ala Met Leu Ala Ala Met 465 470 475 480 Ile Gln Cys Phe Glu Trp Lys Val Val Asn Gln Ser Gly Asp Val Met 485 490 495 Asn Gly Asp Gly Ala Leu Asp Met Thr Glu Gln Pro Gly Met Thr Ala 500 505 510 Pro Arg Ala His Asp Leu Val Cys Met Pro Ile Pro Arg Ile Asp Gln 515 520 525 Leu Tyr Ala Leu Leu Asp Pro 530 535 <210> 148 <211> 1608 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO:147 <400> 148 atgtccttcg acttgatctc tatcgctact ttgttcttcg ttatcatctc tactactatc 60 ttgttgttgt ctatcaacca cttcaagaag ccaccacact tgagaagaag attgtctttg 120 ccaccaactc cattcgcttt gccaatcatc ggtcacttgc acttgttggg tccaatcatc 180 cacagatctt tccacgactt gtcatctaga tacggtccat tgttccactt gagattgggt 240 tctgttccat gtttcgttgt ttctactcca gaattggcta aggaattctt gttgactcac 300 gaattgaagt tctcttctag aagagactct atcgctatcc aaagattgac ttacgactct 360 gctttcgctt tcgctccata cggtccatac tggaagttct tgaagaagtt gtgtacttgt 420 gacttgttgg gtgctagatc tatcaaccac ttcttgccaa ctagaactag agaattgcac 480 tgtttcgtta gattgttgat cgacaaggct gttgcttgtg aaccagttaa catcactaag 540 gaattgtcta ctttggctaa caacatcatc tctcaaatga tgatcggtgt tagatgttct 600 ggtactactg gtgaagctga agaagctact actttggcta gagaagttac taagatcttc 660 ggtgaattca acgtttctga cttcatgtgg gttatcagaa acttcgactt gcaaggtttc 720 agaaagagag ttgaagatat ctacactaga tacgacgctt tgttggaaag aatcatcact 780 aacagagaag aagttagaga aaagaacgtt caagaaagaa agttgggtgt tggtgaaggt 840 caccacgtta aggacttctt ggacttgttg ttggacgttt tggaagaaga tcactctgaa 900 atcaacttct ctagagacaa catcaagggt ttgatcttgg acttcttcac tgctggtact 960 gacacttctt ctatcgctat cgaatgggct ttggctgaat tgatcaacaa cccaagagtt 1020 ttgcaaaagg ctcaagaaga aatcgacaac gttgttggta agcacagatt ggtttctgaa 1080 tctgacggtc caaacttgcc atacatccaa gctatcatca gagaagcttt gagattgcac 1140 ccaccagttc cattgatcac tagaaagtct atcgaagatt gtatgatcca aggttacaac 1200 atcccagcta actctatgtt gttcgttaac gtttggtctt tggctagaaa cccaaagtac 1260 tgggactctc cattggactt cttgccagaa agattcttga ggccagaaaa gggtggtcca 1320 gttggtccaa ctgacgttaa gggtcaacac ttccaattgt tgccattcgg tactggtaga 1380 agaggttgtc caggtacttc tttggctatg caagaattgc cagctatgtt ggctgctatg 1440 atccaatgtt tcgaatggaa ggttgttaac caatctggtg acgttatgaa cggtgacggt 1500 gctttggaca tgactgaaca accaggtatg actgctccaa gagctcacga cttggtttgt 1560 atgccaatcc caagaatcga ccaattgtac gctttgttgg acccataa 1608 <210> 149 <211> 517 <212> PRT <213> Saussurea medusa <400> 149 Met Ser Gln Val Leu Gln Thr Leu Thr Pro Ala Val Ile Ala Ala Val 1 5 10 15 Leu Leu Ser Ser Leu Phe Leu Tyr Leu Leu Ile Lys Lys Asn Gln Asn 20 25 30 His Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu 35 40 45 His His Leu Gly Pro Leu Ile His Gln Ser Phe His His Leu Ser Thr 50 55 60 Lys Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Thr Cys Val 65 70 75 80 Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu Lys Thr Asn Glu 85 90 95 Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile Asp His Ile Thr 100 105 110 Tyr Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe 115 120 125 Ile Lys Lys Met Ser Thr Val Glu Leu Leu Gly Asn Gln Asn Leu Gly 130 135 140 His Phe Leu Pro Ile Arg Thr Gln Glu Ile His Glu Leu Leu His Thr 145 150 155 160 Leu Met Asn Lys Ala Lys Lys Arg Glu Ser Val Asn Leu Thr Glu Glu 165 170 175 Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met Met Met Ser Ile 180 185 190 Arg Cys Ser Gly Thr Asn Ser Glu Ala Asp Glu Ala Lys Asn Leu Val 195 200 205 Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile 210 215 220 Trp Phe Cys Lys Asn Ile Asp Leu Gln Gly Phe Lys Lys Arg Tyr Glu 225 230 235 240 Asp Thr His Arg Arg Tyr Asp Val Leu Leu Glu Lys Ile Ile Leu Glu 245 250 255 Arg Glu Glu Glu Arg Arg Lys Glu Gly Lys Arg Glu Asp Gly Asn Lys 260 265 270 Gly Lys Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Gly Lys 275 280 285 Ala Glu Ile Gln Ile Thr Arg Asp His Ile Lys Ala Leu Ile Leu Asp 290 295 300 Phe Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala Leu Glu Trp Met 305 310 315 320 Leu Val Glu Leu Ile Arg Asn Pro Lys Val Leu Glu Ile Ala Arg Glu 325 330 335 Glu Ile Asp His Ile Ile Gly Asn Glu Arg Leu Val Gln Glu Ser Asp 340 345 350 Ile Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Thr Leu Arg 355 360 365 Leu His Pro Pro Ile Pro Met Leu Ile Arg Lys Ser Ile Glu Asn Val 370 375 380 Ser Val Gln Gly Tyr Asp Ile Pro Ala Gly Thr Met Leu Phe Val Asn 385 390 395 400 Ile Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu 405 410 415 Phe Lys Pro His Arg Phe Leu Glu Glu Asp Asn Ala Leu Lys Ser Ser 420 425 430 Phe Asp Ile Lys Gly Gln Asn Phe Gln Leu Leu Pro Phe Gly Thr Gly 435 440 445 Arg Arg Gly Cys Pro Gly Ile Asn Leu Ala Met Lys Glu Leu Pro Val 450 455 460 Val Ile Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Ile Asn Glu Lys 465 470 475 480 Gln Val Leu Asp Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala 485 490 495 Ala Asp Phe Val Cys Val Pro Ser Ile Arg Glu Asp Ser Pro Lys Ser 500 505 510 Phe Ile Thr Ser Thr 515 <210> 150 <211> 1554 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 149 <400> 150 atgtcccaag ttttgcaaac tttgactcca gctgttatcg ctgctgtttt gttgtcatct 60 ttgttcttgt acttgttgat caagaagaac caaaaccaca gattgccacc atctccacca 120 tctttgccaa tcatcggtca cttgcaccac ttgggtccat tgatccacca atctttccac 180 cacttgtcta ctaagtacgg tccattgatc cacttgagat tgggttctgt tacttgtgtt 240 gttgcttcta ctccagactt ggctagagac ttcttgaaaa ctaacgaatt ggctttctct 300 tctagaaagc actctttggc tatcgaccac atcacttacg gtgttgcttt cgctttcgct 360 ccatacggtc catactggaa gttcatcaag aagatgtcta ctgttgaatt gttgggtaac 420 caaaacttgg gtcacttctt gccaatcaga actcaagaaa tccacgaatt gttgcacact 480 ttgatgaaca aggctaagaa gagagaatct gttaacttga ctgaagaatt gttgaagttg 540 actaacaacg ttatctgtca aatgatgatg tctatcagat gttctggtac taactctgaa 600 gctgacgaag ctaagaactt ggttagagaa gttactcaaa tcttcggtga attcaacgtt 660 tctgacttca tctggttctg taagaacatc gacttgcaag gtttcaagaa gagatacgaa 720 gatactcaca gaagatacga cgttttgttg gaaaagatca tcttggaaag agaagaagaa 780 agaagaaagg aaggtaagag agaagatggt aacaagggta aggacttctt ggacatgttg 840 ttggacgttt tggaagatgg taaggctgaa atccaaatca ctagagatca catcaaggct 900 ttgatcttgg acttcttcac tgctgctact gacactactg ctatcgcttt ggaatggatg 960 ttggttgaat tgatcagaaa cccaaaggtt ttggaaatcg ctagagaaga aatcgaccac 1020 atcatcggta acgaaagatt ggttcaagaa tctgacatcc caaacttgcc atacatccaa 1080 gctatcatca aggaaacttt gagattgcac ccaccaatcc caatgttgat cagaaagtct 1140 atcgaaaacg tttctgttca aggttacgac atcccagctg gtactatgtt gttcgttaac 1200 atctggtcta tcggtagaaa cccaaagtac tgggaatctc cattggaatt caagccacac 1260 agattcttgg aagaagataa cgctttgaag tcatctttcg acatcaaggg tcaaaacttc 1320 caattgttgc cattcggtac tggtagaaga ggttgtccag gtatcaactt ggctatgaag 1380 gaattgccag ttgttatcgc tggtttgatc caatgtttcg aatggaacat caacgaaaag 1440 caagttttgg acatggacga aagagctggt ttgactgctc caagagctgc tgacttcgtt 1500 tgtgttccat ctatcagaga agattctcca aagtctttca tcacttctac ttaa 1554 <210> 151 <211> 510 <212> PRT <213> Plectranthus barbatus <400> 151 Met Ser Asp His Val Glu Ala Ala Leu Phe Ala Ala Ile Phe Leu Leu 1 5 10 15 Ser Ala Ala Leu Leu Asn His Leu Leu Thr Gly Lys Arg Arg Gln Asn 20 25 30 Ala Tyr Pro Pro Gly Pro Phe Pro Leu Pro Ile Ile Gly His Leu His 35 40 45 Leu Leu Gly Pro Arg Leu His His Thr Phe His Asp Leu Thr Gln Arg 50 55 60 Tyr Gly Pro Leu Met Gln Val Arg Leu Gly Ser Ile Arg Cys Val Ile 65 70 75 80 Ala Ala Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys Thr Ser Glu Leu 85 90 95 Val Phe Ser Ala Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr 100 105 110 Glu Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile 115 120 125 Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Asn His 130 135 140 Phe Leu Pro Ile Arg Thr Ile Glu Val Lys Thr Phe Leu Glu Ala Leu 145 150 155 160 Met Gln Lys Gly Lys Thr Gly Glu Arg Leu Asn Val Thr Glu Glu Leu 165 170 175 Val Lys Leu Thr Ser Asn Val Ile Ser Gln Met Met Leu Ser Ile Arg 180 185 190 Cys Ser Gly Thr Glu Gly Glu Thr Glu Ala Val Arg Thr Val Ile Arg 195 200 205 Glu Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ala Asp Ile Ile Trp 210 215 220 Phe Cys Lys Asn Phe Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp 225 230 235 240 Ile Gln Arg Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg 245 250 255 Glu Lys Gln Arg Arg Thr Gln His Gly Gly Glu Ala Lys Asp Phe Leu 260 265 270 Asp Met Phe Leu Asp Ile Met Lys Ser Gly Lys Ala Glu Val Asn Phe 275 280 285 Thr Arg Asp His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly 290 295 300 Thr Asp Thr Thr Ala Ile Val Val Gly Trp Ala Ile Ala Glu Leu Ile 305 310 315 320 Asn Asn Pro Asn Val Leu Lys Lys Ala Gln Ala Glu Ile Asp Lys Val 325 330 335 Val Gly Leu His Arg Ile Leu Gln Glu Ser Asp Gly Pro Asn Leu Pro 340 345 350 Tyr Leu Asn Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile 355 360 365 Pro Met Leu Ser Arg Lys Ser Ile Ser Asp Cys Val Ile Asp Gly Tyr 370 375 380 Thr Ile Pro Ala Asn Thr Leu Leu Phe Val Asn Ile Trp Ser Met Gly 385 390 395 400 Arg Asn Pro Lys Ile Trp Asp Asn Pro Met Ala Phe Arg Pro Glu Arg 405 410 415 Phe Leu Glu Lys Glu Lys Thr Gly Ile Asp Ile Lys Gly Gln His Phe 420 425 430 Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu 435 440 445 Leu Ala Ile Arg Glu Val Val Val Ile Ile Gly Thr Val Ile Gln Cys 450 455 460 Phe Asp Trp Lys Leu Pro Val Asp Asp Val Ser Gly Leu Val Asp Met 465 470 475 480 Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala Asp Asp Leu Ile Cys 485 490 495 Arg Val Val Pro Arg Val Asp Pro Leu Val Val Ser Gly His 500 505 510 <210> 152 <211> 1533 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 151 <400> 152 atgtccgacc acgttgaagc tgctttgttc gctgctatct tcttgttgtc tgctgctttg 60 ttgaaccact tgttgactgg taagagaagg caaaacgctt acccaccagg tccattccca 120 ttgccaatca tcggtcactt gcacttgttg ggtccaagat tgcaccacac tttccacgac 180 ttgactcaaa gatacggtcc attgatgcaa gttagattgg gttctatcag atgtgttatc 240 gctgctactc cagaattggc taaggaattc ttgaaaactt ctgaattggt tttctctgct 300 agaaagcact ctactgctat cgacatcgtt acttacgaat cttctttcgc tttctctcca 360 tacggtccat actggaagta catcaagaag ttgtgtactt acgaattgtt gggtgctaga 420 aacttgaacc acttcttgcc aatcagaact atcgaagtta agactttctt ggaagctttg 480 atgcaaaagg gtaagactgg tgaaagattg aacgttactg aagaattggt taagttgact 540 tctaacgtta tctctcaaat gatgttgtct atcagatgtt ctggtactga aggtgaaact 600 gaagctgtta gaactgttat cagagaagtt actcaaatct tcggtgaatt cgacgttgct 660 gacatcatct ggttctgtaa gaacttcgac ttccaaggta tcagaaagag atctgaagat 720 atccaaagaa gatacgacgc tttgttggaa aagatcatca ctgacagaga aaagcaaaga 780 agaactcaac acggtggtga agctaaggac ttcttggaca tgttcttgga catcatgaag 840 tctggtaagg ctgaagttaa cttcactaga gatcacttga aggctttgat cttggacttc 900 ttcactgctg gtactgacac tactgctatc gttgttggtt gggctatcgc tgaattgatc 960 aacaacccaa acgttttgaa gaaggctcaa gctgaaatcg acaaggttgt tggtttgcac 1020 agaatcttgc aagaatctga cggtccaaac ttgccatact tgaacgctgt tatcaaggaa 1080 actttcagat tgcacccacc aatcccaatg ttgtctagaa agtctatctc tgactgtgtt 1140 atcgacggtt acactatccc agctaacact ttgttgttcg ttaacatctg gtctatgggt 1200 agaaacccaa agatctggga caacccaatg gctttcagac cagaaagatt cttggaaaag 1260 gaaaagactg gtatcgacat caagggtcaa cacttcgaat tgttgccatt cggtactggt 1320 agaagaggtt gtccaggtat gttgttggct atcagagaag ttgttgttat catcggtact 1380 gttatccaat gtttcgactg gaagttgcca gttgacgacg tttctggttt ggttgacatg 1440 actgaaagac caggtttgac tgctccaaga gctgacgact tgatctgtag agttgttcca 1500 agagttgacc cattggttgt ttctggtcac taa 1533 <210> 153 <211> 506 <212> PRT <213> Scutellaria baicalensis <400> 153 Met Ser Glu Val Thr Leu Asn Val Ala Leu Leu Leu Leu Ser Ala Ala 1 5 10 15 Val Cys Leu Met Val Phe Thr Gly Lys Arg Arg Arg Arg Leu Pro Asn 20 25 30 Pro Pro Gly Pro Phe Pro Leu Pro Leu Ile Gly Asn Leu Asn Leu Val 35 40 45 Ser Pro Arg Leu His His Thr Phe His Met Leu Ala Gln Arg Tyr Gly 50 55 60 Pro Ile Met Lys Phe Arg Leu Gly Ser Ile Pro Cys Leu Val Val Ser 65 70 75 80 Thr Pro Glu Leu Ala Lys Asp Ile Leu Lys Thr His Glu Leu Ile Phe 85 90 95 Ser Ser Arg Val Lys Ser Thr Ala Ile Asp Ile Val Thr Tyr Gly Val 100 105 110 Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile Lys Lys 115 120 125 Leu Cys Thr Tyr Glu Leu Leu Gly Ser Arg Met Leu Asn His Phe Glu 130 135 140 Pro Leu Arg Ala Leu Glu Val Arg Glu Phe Leu Lys Asp Val Met Ala 145 150 155 160 Met Gly Lys Ala Gly Lys Ser Phe Asn Val Thr Glu Glu Leu Met Lys 165 170 175 Leu Thr Ser Asn Val Met Ser Asn Met Met Leu Ser Ile Arg Ala Ala 180 185 190 Glu Ser Glu Glu Gln Ala Glu Val Ala Arg Thr Leu Ile Arg Glu Val 195 200 205 Ser Gln Leu Phe Gly Glu Phe Asp Phe Gly Asp Met Leu Trp Phe Cys 210 215 220 Lys Ser Phe Asp Phe Gln Gly Ile Lys Lys Arg Ser Lys Asp Ile Lys 225 230 235 240 Val Arg Tyr Asp Ala Leu Leu Glu Lys Ile Leu Thr Asp Arg Glu Asn 245 250 255 Val Arg Arg Gln Asn Gly Val Val Glu Pro Lys Asp Met Leu Asp Met 260 265 270 Phe Leu Asp Ile Met Glu Gly Gly Lys Thr Asp Val Glu Phe Thr Arg 275 280 285 Glu His Leu Lys Ala Val Ile Leu Asp Phe Leu Thr Ala Gly Thr Asp 290 295 300 Thr Thr Ala Ile Thr Val Glu Trp Val Leu Ala Glu Leu Met Asn Ser 305 310 315 320 Pro Lys Ala Met Lys Lys Ala Gln Asp Glu Met Asp Arg Val Val Gly 325 330 335 Arg Glu Arg Met Met Ala Glu Ser Asp Ala Pro Asn Leu Pro Tyr Phe 340 345 350 Leu Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro Leu 355 360 365 Ile Ile Arg Arg Ser Ile Glu Asp Cys Val Ile Asp Gly Tyr His Ile 370 375 380 Pro Ala Asp Thr Leu Ala Phe Ile Asn Val Trp Ser Met Gly Arg Asn 385 390 395 400 Glu Lys Tyr Trp Asp Ser Pro Leu Ser Phe Arg Pro Glu Arg Phe Leu 405 410 415 Glu Gly Asp Asn Ala Ala Ile Asp Ile Lys Gly Met His Phe Glu Leu 420 425 430 Leu Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Leu Ser Ala 435 440 445 Ile Gln Glu Val Leu Ile Ile Ala Gly Thr Val Ile Gln Cys Phe Asp 450 455 460 Trp Glu Gln Ala Asp Gly Ser Gly Arg Val Asp Met Ser Glu Arg Pro 465 470 475 480 Gly Leu Thr Thr Pro Arg Glu Ile Asp Leu Val Cys Arg Val Val Pro 485 490 495 Arg Val Asp Glu Arg Val Ile Ser Gly His 500 505 <210> 154 <211> 1521 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO:153 <400> 154 atgtccgaag ttactttgaa cgttgctttg ttgttgttgt ctgctgctgt ttgtttgatg 60 gttttcactg gtaagagaag aagaagattg ccaaacccac caggtccatt cccattgcca 120 ttgatcggta acttgaactt ggtttctcca agattgcacc acactttcca catgttggct 180 caaagatacg gtccaatcat gaagttcaga ttgggttcta tcccatgttt ggttgtttct 240 actccagaat tggctaagga catcttgaaa actcacgaat tgatcttctc ttctagagtt 300 aagtctactg ctatcgacat cgttacttac ggtgtttctt tcgctttctc tccatacggt 360 ccatactgga agtacatcaa gaagttgtgt acttacgaat tgttgggttc tagaatgttg 420 aaccacttcg aaccattgag agctttggaa gttagagaat tcttgaagga cgttatggct 480 atgggtaagg ctggtaagtc tttcaacgtt actgaagaat tgatgaagtt gacttctaac 540 gttatgtcta acatgatgtt gtctatcaga gctgctgaat ctgaagaaca agctgaagtt 600 gctagaactt tgatcagaga agtttctcaa ttgttcggtg aattcgactt cggtgacatg 660 ttgtggttct gtaagtcttt cgacttccaa ggtatcaaga agagatctaa ggacatcaag 720 gttagatacg acgctttgtt ggaaaagatc ttgactgaca gagaaaacgt taggagacaa 780 aacggtgttg ttgaaccaaa ggacatgttg gacatgttct tggacatcat ggaaggtggt 840 aagactgacg ttgaattcac tagagaacac ttgaaggctg ttatcttgga cttcttgact 900 gctggtactg acactactgc tatcactgtt gaatgggttt tggctgaatt gatgaactct 960 ccaaaggcta tgaagaaggc tcaagacgaa atggacagag ttgttggtag agaaagaatg 1020 atggctgaat ctgacgctcc aaacttgcca tacttcttgg ctatcatcaa ggaaactttc 1080 agattgcacc caccaatccc attgatcatc agaagatcta tcgaagattg tgttatcgac 1140 ggttaccaca tcccagctga cactttggct ttcatcaacg tttggtctat gggtagaaac 1200 gaaaagtact gggactctcc attgtctttc agaccagaaa gattcttgga aggtgacaac 1260 gctgctatcg acatcaaggg tatgcacttc gaattgttgc cattcggttc tggtagaaga 1320 ggttgtccag gtatgttgtc tgctatccaa gaagttttga tcatcgctgg tactgttatc 1380 caatgtttcg actgggaaca agctgacggt tctggtagag ttgacatgtc tgaaagacca 1440 ggtttgacta ctccaagaga aatcgacttg gtttgtagag ttgttccaag agttgacgaa 1500 agagttatct ctggtcacta a 1521 <210> 155 <211> 510 <212> PRT <213> Dorcoceras hygrometricum <400> 155 Met Ser Asp Leu Val Gln Ile Thr Leu Ser Ala Ala Leu Leu Leu Leu 1 5 10 15 Ser Ala Ala Phe Leu His Thr Ile Phe Ala Thr Lys Arg Arg Arg Leu 20 25 30 Ser Pro Pro Pro Gly Pro Leu Ala Leu Pro Ile Ile Gly His Leu His 35 40 45 Leu Leu Gly Pro Arg Leu His Gln Thr Phe His Asp Leu Ser Leu Arg 50 55 60 His Gly Pro Ile Phe Asn Leu Arg Leu Gly Ser Val Ala Cys Ala Val 65 70 75 80 Val Ser Thr Pro Glu Leu Ala Lys Glu Cys Leu Lys Thr His Glu Leu 85 90 95 Val Phe Ser Ser Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr 100 105 110 Asp Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile 115 120 125 Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Leu His 130 135 140 Phe Gln Pro Ile Arg Thr Leu Glu Val Asn Ser Phe Val Gly Thr Leu 145 150 155 160 Met Asn Lys Ala Glu Ser Gly Glu Ser Phe Asn Val Thr Glu Glu Leu 165 170 175 Val Lys Leu Thr Ser Asn Val Ile Ser His Met Met Leu Gly Ile Arg 180 185 190 Cys Ser Gly Thr Glu Gly Glu Ala Glu Ala Ala Arg Thr Val Ile Arg 195 200 205 Glu Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ala Asp Ile Ile Trp 210 215 220 Phe Cys Lys Asn Phe Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp 225 230 235 240 Ile Gln Arg Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg 245 250 255 Glu Glu Leu Arg Arg Ser His Gly Gly Ala Ala Gly Glu Ala Arg Asp 260 265 270 Phe Leu Asp Met Phe Leu Asp Ile Met Glu Gly Gly Lys Ser Glu Val 275 280 285 Thr Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr 290 295 300 Ala Gly Thr Asp Thr Thr Ala Ile Val Thr Glu Trp Ala Ile Ser Glu 305 310 315 320 Leu Ile Asn Asn Pro Lys Val Leu Glu Lys Ala Gln Gln Glu Ile Asp 325 330 335 Lys Val Ile Gly Ser Gly Arg Leu Val Gln Glu Ser Asp Ala Pro Asn 340 345 350 Leu Pro Tyr Leu Met Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro 355 360 365 Pro Ile Pro Met Leu Ser Arg Lys Ser Ile Ser Asp Cys Val Ile Asp 370 375 380 Gly Tyr Asp Val Pro Ala Lys Ser Leu Leu Phe Val Asn Ile Trp Ser 385 390 395 400 Met Gly Arg Asn Pro Lys Ile Trp Glu Ser Pro Leu Glu Phe Arg Pro 405 410 415 Glu Arg Phe Leu Glu Arg Glu Lys Ser Ser Ile Asp Ile Lys Gly Gln 420 425 430 His Phe Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly 435 440 445 Met Leu Leu Gly Ile Gln Glu Val Val Ile Ile Ile Gly Thr Met Val 450 455 460 Gln Cys Phe Asp Trp Lys Leu Ser Asp Gly Ser Gly Gln Val Asp Met 465 470 475 480 Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala His Asp Leu Phe Cys 485 490 495 Arg Val Val Pro Arg Ile Asn Pro Val Val Val Ser Gly Asn 500 505 510 <210> 156 <211> 1533 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 155 <400> 156 atgtccgact tggttcaaat cactttgtct gctgctttgt tgttgttgtc tgctgctttc 60 ttgcacacta tcttcgctac taagagaaga agattgtctc caccaccagg tccattggct 120 ttgccaatca tcggtcactt gcacttgttg ggtccaagat tgcaccaaac tttccacgac 180 ttgtctttga gacacggtcc aatcttcaac ttgagattgg gttctgttgc ttgtgctgtt 240 gtttctactc cagaattggc taaggaatgt ttgaaaactc acgaattggt tttctcttct 300 agaaagcact ctactgctat cgacatcgtt acttacgact cttctttcgc tttctctcca 360 tacggtccat actggaagta catcaagaag ttgtgtactt acgaattgtt gggtgctaga 420 aacttgttgc acttccaacc aatcagaact ttggaagtta actctttcgt tggtactttg 480 atgaacaagg ctgaatctgg tgaatctttc aacgttactg aagaattggt taagttgact 540 tctaacgtta tctctcacat gatgttgggt atcagatgtt ctggtactga aggtgaagct 600 gaagctgcta gaactgttat cagagaagtt actcaaatct tcggtgaatt cgacgttgct 660 gacatcatct ggttctgtaa gaacttcgac ttccaaggta tcagaaagag atctgaagat 720 atccaaagaa gatacgacgc tttgttggaa aagatcatca ctgacagaga agaattgaga 780 agatctcacg gtggtgctgc tggtgaagct agagacttct tggacatgtt cttggacatc 840 atggaaggtg gtaagtctga agttactttc actagagaac acttgaaggc tttgatcttg 900 gacttcttca ctgctggtac tgacactact gctatcgtta ctgaatgggc tatctctgaa 960 ttgatcaaca acccaaaggt tttggaaaag gctcaacaag aaatcgacaa ggttatcggt 1020 tctggtagat tggttcaaga atctgacgct ccaaacttgc catacttgat ggctgttatc 1080 aaggaaactt tcagattgca cccaccaatc ccaatgttgt ctagaaagtc tatctctgac 1140 tgtgttatcg acggttacga cgttccagct aagtctttgt tgttcgttaa catctggtct 1200 atgggtagaa acccaaagat ctgggaatct ccattggaat tcagaccaga aagattcttg 1260 gaaagagaaa agtcatctat cgacatcaag ggtcaacact tcgaattgtt gccattcggt 1320 actggtagaa gaggttgtcc aggtatgttg ttgggtatcc aagaagttgt tatcatcatc 1380 ggtactatgg ttcaatgttt cgactggaag ttgtctgacg gttctggtca agttgacatg 1440 actgaaagac caggtttgac tgctccaaga gctcacgact tgttctgtag agttgttcca 1500 agaatcaacc cagttgttgt ttctggtaac taa 1533 <210> 157 <211> 507 <212> PRT <213> Antirrhinum majus <400> 157 Met Ser Ser Thr Leu Val Tyr Ser Thr Leu Phe Ile Leu Ser Thr Leu 1 5 10 15 Leu Leu Thr Leu Leu Thr Arg Thr Arg Arg Lys Thr Arg Pro Pro Gly 20 25 30 Pro Leu Ala Leu Pro Leu Ile Gly His Leu His Leu Leu Gly Pro Lys 35 40 45 Leu His His Thr Phe His Gln Phe Ser Gln Arg Tyr Gly Pro Leu Ile 50 55 60 Gln Leu Tyr Leu Gly Ser Val Pro Cys Val Val Ala Ser Thr Pro Glu 65 70 75 80 Leu Ala Arg Glu Phe Leu Lys Thr His Glu Leu Asp Phe Ser Ser Arg 85 90 95 Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala 100 105 110 Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr 115 120 125 Tyr Glu Leu Leu Gly Ala Arg Asn Leu Ser His Phe Gln Pro Ile Arg 130 135 140 Ala Leu Glu Val Asn Ser Phe Leu Arg Ile Leu Tyr Glu Lys Thr Glu 145 150 155 160 Gln Lys Gln Ser Val Asn Val Thr Glu Glu Leu Val Lys Leu Thr Ser 165 170 175 Asn Val Ile Ser Asn Met Met Leu Gly Ile Arg Cys Ser Gly Thr Glu 180 185 190 Gly Glu Ala Glu Val Ala Arg Thr Val Ile Arg Glu Val Thr Gln Ile 195 200 205 Phe Gly Glu Phe Asp Val Ser Glu Ile Val Trp Phe Cys Lys Asn Leu 210 215 220 Asp Leu Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile Arg Arg Arg Tyr 225 230 235 240 Asp Ala Leu Leu Glu Lys Ile Ile Ser Asp Arg Glu Arg Leu Arg Leu 245 250 255 Arg Gly Gly Gly Gly Gly Gly Gly Gly Glu Val Lys Asp Phe Leu Asp 260 265 270 Met Leu Leu Asp Val Met Glu Ser Glu Lys Ser Glu Val Glu Phe Thr 275 280 285 Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr 290 295 300 Asp Thr Thr Ala Ile Thr Thr Glu Trp Ala Ile Ala Glu Leu Ile Ser 305 310 315 320 Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Met Asp Lys Val Ile 325 330 335 Gly Ser Gln Arg Leu Leu Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr 340 345 350 Leu Asn Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro 355 360 365 Met Leu Thr Arg Lys Ser Ile Ser Asp Val Val Val Asn Gly Tyr Thr 370 375 380 Ile Pro Ala Lys Thr Leu Leu Phe Val Asn Leu Trp Ser Met Gly Arg 385 390 395 400 Asn Pro Asn Tyr Trp Glu Asn Pro Met Glu Phe Arg Pro Glu Arg Phe 405 410 415 Leu Glu Lys Gly Thr Gly Ser Ile Asp Val Lys Gly Gln His Phe Glu 420 425 430 Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu Leu 435 440 445 Gly Met Gln Glu Leu Phe Ser Ile Ile Gly Ala Met Val Gln Cys Phe 450 455 460 Asp Trp Lys Leu Pro Asp Gly Val Lys Ser Val Asp Met Thr Glu Arg 465 470 475 480 Pro Gly Leu Thr Ala Pro Arg Ala Asn Asp Leu Val Cys Gln Leu Val 485 490 495 Pro Arg Ile Asp Pro Val Val Val Ser Gly Pro 500 505 <210> 158 <211> 1524 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 157 <400> 158 atgtcctcta ctttggttta ctctactttg ttcatcttgt ctactttgtt gttgactttg 60 ttgactagaa ctagaagaaa gactagacca ccaggtccat tggctttgcc attgatcggt 120 cacttgcact tgttgggtcc aaagttgcac cacactttcc accaattctc tcaaagatac 180 ggtccattga tccaattgta cttgggttct gttccatgtg ttgttgcttc tactccagaa 240 ttggctagag aattcttgaa aactcacgaa ttggacttct cttctagaaa gcactctact 300 gctatcgaca tcgttactta cgactcttct ttcgctttcg ctccatacgg tccatactgg 360 aagttcatca agaagttgtg tacttacgaa ttgttgggtg ctagaaactt gtctcacttc 420 caaccaatca gagctttgga agttaactct ttcttgagaa tcttgtacga aaagactgaa 480 caaaagcaat ctgttaacgt tactgaagaa ttggttaagt tgacttctaa cgttatctct 540 aacatgatgt tgggtatcag atgttctggt actgaaggtg aagctgaagt tgctagaact 600 gttatcagag aagttactca aatcttcggt gaattcgacg tttctgaaat cgtttggttc 660 tgtaagaact tggacttgca aggtatcaga aagagatctg aagatatcag aagaagatac 720 gacgctttgt tggaaaagat catctctgac agagaaagat tgagattgag aggtggtggt 780 ggtggtggtg gtggtgaagt taaggacttc ttggacatgt tgttggacgt tatggaatct 840 gaaaagtctg aagttgaatt cactagagaa cacttgaagg ctttgatctt ggacttcttc 900 actgctggta ctgacactac tgctatcact actgaatggg ctatcgctga attgatctct 960 aacccaaacg ttttgaagaa ggctcaagaa gaaatggaca aggttatcgg ttctcaaaga 1020 ttgttgcaag aatctgacgc tccaaacttg ccatacttga acgctatcat caaggaaact 1080 ttcagattgc acccaccaat cccaatgttg actagaaagt ctatctctga cgttgttgtt 1140 aacggttaca ctatcccagc taagactttg ttgttcgtta acttgtggtc tatgggtaga 1200 aacccaaact actgggaaaa cccaatggaa ttcagaccag aaagattctt ggaaaagggt 1260 actggttcta tcgacgttaa gggtcaacac ttcgaattgt tgccattcgg tactggtaga 1320 agaggttgtc caggtatgtt gttgggtatg caagaattgt tctctatcat cggtgctatg 1380 gttcaatgtt tcgactggaa gttgccagac ggtgttaagt ctgttgacat gactgaaaga 1440 ccaggtttga ctgctccaag agctaacgac ttggtttgtc aattggttcc aagaatcgac 1500 ccagttgttg tttctggtcc ataa 1524 <210> 159 <211> 511 <212> PRT <213> Erythranthe lewisii <400> 159 Met Ser Asn Gln Thr Met Asp Leu Pro Glu Ile Cys Leu Tyr Ala Val 1 5 10 15 Ile Leu Phe Val Ser Thr Leu Leu Ile Leu Gly Ile Tyr Lys Arg Lys 20 25 30 Arg Ser His Ile Pro Ser Pro Pro Gly Pro Phe Ala Leu Pro Val Ile 35 40 45 Gly His Leu His Leu Leu Gly Pro Arg Ile His His Thr Phe His Asp 50 55 60 Leu Ser Gln Arg Tyr Gly Pro Leu Phe Gln Leu Ser Leu Gly Ser Val 65 70 75 80 Arg Cys Val Val Val Ser Thr Pro Glu Leu Ala Arg Glu Phe Leu Lys 85 90 95 Thr His Glu Leu Val Phe Ser Ser Arg Lys His Thr Thr Ala Ile Asp 100 105 110 Ile Val Thr Tyr Glu Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr 115 120 125 Trp Lys Tyr Ile Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg 130 135 140 Asn Leu Ala Asn Phe Glu Pro Val Arg Asn Val Glu Ile Lys Asp Phe 145 150 155 160 Leu Lys Val Met Ser Asn Lys Ala Asn Thr Gly Glu Ile Val Asn Val 165 170 175 Thr Glu Glu Leu Val Lys Leu Thr Ser Asn Val Ile Ser His Met Met 180 185 190 Leu Gly Ile Arg Cys Ser Gly Thr Glu Gly Glu Ala Glu Ala Ala Arg 195 200 205 Asn Val Ile Arg Asp Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ser 210 215 220 Asp Ile Ile Trp Phe Cys Lys Asn Phe Asp Leu Gln Gly Ile Arg Arg 225 230 235 240 Arg Ser Glu Asp Ile Gln Lys Arg Tyr Asp Gly Leu Leu Glu Lys Ile 245 250 255 Ile Thr Asp Arg Glu Lys Thr Arg Gly Gly Gly Gly Gly Gly Val Lys 260 265 270 Asp Phe Leu Asp Met Leu Leu Asp Val Met Asp Ser Lys Asn Ser Asp 275 280 285 Val Lys Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe 290 295 300 Thr Ala Gly Thr Asp Thr Thr Ala Ile Ala Val Glu Trp Ser Ile Ala 305 310 315 320 Glu Leu Leu Arg Asn Pro Lys Val Ile Lys Lys Ala Gln Gln Glu Ile 325 330 335 Asp Asn Val Val Gly Ser Gln Arg Leu Leu Gln Glu Ser Asp Ala Pro 340 345 350 Lys Leu Pro Tyr Ile Met Ala Ile Ile Lys Glu Thr Phe Arg Leu His 355 360 365 Pro Pro Ile Pro Met Ile Ser Arg Lys Ser Val Ser Asp Cys Ala Ile 370 375 380 Asn Gly Cys Met Ile Arg Ala Asn Thr Leu Leu Phe Val Asn Ile Trp 385 390 395 400 Ser Ile Gly Arg Asn Pro Met Tyr Trp Glu Arg Pro Met Glu Phe Arg 405 410 415 Pro Glu Arg Phe Leu Asp Pro Gly Cys Gly Ser Ile Asp Val Lys Gly 420 425 430 Gln Asn Phe Glu Leu Met Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro 435 440 445 Gly Met Leu Leu Ala Met Gln Glu Leu Val Ala Ile Ile Gly Ala Met 450 455 460 Val Gln Cys Phe Glu Trp Gln Leu Pro Asp Asp Ser Gln Asp Val Asp 465 470 475 480 Met Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala Asn Asp Leu Phe 485 490 495 Cys Arg Val Val Pro Arg Val Asp Val Ala Val Val Ser Gly Asn 500 505 510 <210> 160 <211> 1536 <212> DNA <213> artificial <220> <223> coding sequence for SEQ ID NO: 159 <400> 160 atgtccaacc aaactatgga cttgccagaa atctgtttgt acgctgttat cttgttcgtt 60 tctactttgt tgatcttggg tatctacaag agaaagagat ctcacatccc atctccacca 120 ggtccattcg ctttgccagt tatcggtcac ttgcacttgt tgggtccaag aatccaccac 180 actttccacg acttgtctca aagatacggt ccattgttcc aattgtcttt gggttctgtt 240 agatgtgttg ttgtttctac tccagaattg gctagagaat tcttgaaaac tcacgaattg 300 gttttctctt ctagaaagca cactactgct atcgacatcg ttacttacga atcttctttc 360 gctttctctc catacggtcc atactggaag tacatcaaga agttgtgtac ttacgaattg 420 ttgggtgcta gaaacttggc taacttcgaa ccagttagaa acgttgaaat caaggacttc 480 ttgaaggtta tgtctaacaa ggctaacact ggtgaaatcg ttaacgttac tgaagaattg 540 gttaagttga cttctaacgt tatctctcac atgatgttgg gtatcagatg ttctggtact 600 gaaggtgaag ctgaagctgc tagaaacgtt atcagagatg ttactcaaat cttcggtgaa 660 ttcgacgttt ctgacatcat ctggttctgt aagaacttcg acttgcaagg tatcagaaga 720 agatctgaag atatccaaaa gagatacgac ggtttgttgg aaaagatcat cactgacaga 780 gaaaagacta gaggtggtgg tggtggtggt gttaaggact tcttggacat gttgttggac 840 gttatggact ctaagaactc tgacgttaag ttcactagag aacacttgaa ggctttgatc 900 ttggacttct tcactgctgg tactgacact actgctatcg ctgttgaatg gtctatcgct 960 gaattgttga gaaacccaaa ggttatcaag aaggctcaac aagaaatcga caacgttgtt 1020 ggttctcaaa gattgttgca agaatctgac gctccaaagt tgccatacat catggctatc 1080 atcaaggaaa ctttcagatt gcacccacca atcccaatga tctctagaaa gtctgtttct 1140 gactgtgcta tcaacggttg tatgatcaga gctaacactt tgttgttcgt taacatctgg 1200 tctatcggta gaaacccaat gtactgggaa agaccaatgg aattcagacc agaaagattc 1260 ttggacccag gttgtggttc tatcgacgtt aagggtcaaa acttcgaatt gatgccattc 1320 ggtactggta gaagaggttg tccaggtatg ttgttggcta tgcaagaatt ggttgctatc 1380 atcggtgcta tggttcaatg tttcgaatgg caattgccag acgactctca agacgttgac 1440 atgactgaaa gaccaggttt gactgctcca agagctaacg acttgttctg tagagttgtt 1500 ccaagagttg acgttgctgt tgtttctggt aactaa 1536

Claims (32)

  1. - 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열; 및
    - 람노스를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치 내로 전달할 수 있는 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열; 및
    - UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열을 포함하는 재조합 미생물.
  2. 제1항에 있어서,
    플라보논 7-O-베타-D-글루코실트랜스퍼라제가 시트러스 시넨시스(Citrus sinensis)로부터, 시트러스 클레멘티나(Citrus clementina)로부터, 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터, 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis)로부터 또는 호모 사피엔스(Homo sapiens)로부터, 바람직하게는 시트러스 시넨시스 또는 스쿠텔라리아 바이칼렌시스로부터의 효소인, 재조합 미생물.
  3. 제1항 또는 제2항에 있어서,
    플라보논 7-O-베타-D-글루코실트랜스퍼라제가 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 바람직하게는 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 재조합 미생물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    플라보논 7-O-베타-D-글루코실트랜스퍼라제가 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 재조합 미생물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    6"-O-람노실트랜스퍼라제가 시트러스 속(genus Citrus) 또는 페투니아 하이브리다(Petunia hybrida), 바람직하게는 시트러스 시넨시스(Citrus sinensis), 시트러스 막시마(Citrus maxima) 또는 시트러스 클레멘티나(Citrus clementina), 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 효소인, 재조합 미생물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    6"-O-람노실트랜스퍼라제가 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고; 바람직하게는, 6"-O-람노실트랜스퍼라제가 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 재조합 미생물.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제가 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터 유래되는, 재조합 미생물.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서,
    UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제가 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고; 바람직하게는, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제가 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 재조합 미생물.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    - 플라보논 7-O-베타-D-글루코실트랜스퍼라제가 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고;
    - 6"-O-람노실트랜스퍼라제가 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고;
    - UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제가 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 재조합 미생물.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 미생물이,
    - 타이로신 암모니아 리아제(TAL)를 암호화하는 이종 핵산 서열;
    - 4-쿠마린-CoA 리가제(4CL)를 암호화하는 이종 핵산 서열;
    - 나린게닌-찰콘 신타제(CHS)를 암호화하는 이종 핵산 서열; 및
    - 찰콘 이소머라제(CHI)를 암호화하는 이종 핵산 서열;을 또한 포함하는, 재조합 미생물.
  11. 제10항에 있어서,
    - 로도토룰라 글루티니스(Rhodotorula glutinis) 또는 플라보박테리움 존소니아에(Flavobacterium johnsoniae)로부터의 타이로신 암모니아 리아제(TAL)를, 특히 서열 번호: 41 및 39로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는, 이종 핵산 서열;
    - 아라비돕시스 탈리아나(Arabidopsis thaliana), 시트러스 클레멘티나(Citrus clementina), 페트로셀리눔 크리스품(Petroselinum crispum) 또는 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 4-쿠마로일-CoA 리가제(4CL)를; 바람직하게는 서열 번호: 123, 125, 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를; 특히 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 및 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는, 이종 핵산 서열;
    - 시트러스 시넨시스, 호르데눔 불가레(Hordeum vulgare) 또는 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 찰콘 신타제(CHS)를, 특히 서열 번호: 53, 51, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 53으로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 아라비돕시스 탈리아나(Arabidopsis thaliana) 또는 스트렙토마이세스 클라부리게루스로부터의 찰콘 이소머라제(CHI)를, 특히 서열 번호: 61 및 59로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;을 포함함을 특징으로 하는, 재조합 미생물.
  12. 제10항 또는 제11항에 있어서,
    - 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 53으로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;을 포함함을 특징으로 하는, 재조합 미생물.
  13. 제10항 내지 제12항 중 어느 한 항에 있어서,
    - 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 45로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
    - 서열 번호: 53으로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;을 포함함을 특징으로 하는, 재조합 미생물.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서,
    플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열을 또한 포함함을 특징으로 하는, 재조합 미생물.
  15. 제14항에 있어서,
    미생물이 칼리스테푸스 키넨시스(Callistephus chinensis), 페릴라 프루테스센스 바르. 크리스파(Perilla frutescens var. crispa), 페투니아 엑스 하이브리다(Petunia x hybrida), 게르베라 하이브리다(Gerbera hybrida), 시트러스 시넨시스(Citrus sinensis), 아라비돕시스 탈리아나(Arabidopsis thaliana), 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르(Osteospermum hybrid cultivar), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 스트렙토마이세스 아베르미틸리스(Streptomyces avermitilis) 또는 피로셀라 오피시나룸(Pilosella officinarum)으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 7, 1, 3, 5, 9, 11, 13, 15, 17, 19, 21 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 11, 17 및 121을 갖는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드로부터 선택되는 효소를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물.
  16. 제14항 또는 제15항에 있어서,
    미생물이 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서,
    O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열을 또한 포함함을 특징으로 하는, 재조합 미생물.
  18. 제17항에 있어서,
    미생물이 시트러스, 특히 시트러스 클레멘티나 또는 시트러스 시넨시스로부터, 호모 사피엔스(Homo sapiens)로부터 또는 아라비돕시스 탈리아나로부터의 O-메틸-트랜스퍼라제(OMT), 바람직하게는 서열 번호: 119, 117, 87 및 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물.
  19. 제17항 또는 제18항에 있어서,
    서열 번호: 119, 117 및 89로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 119 및 117로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서,
    - 페닐알라닌 암모니아 리아제(PAL)를, 특히 서열 번호: 63, 65 및 77, 바람직하게는 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 PAL, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 및 보다 특히 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 신나메이트 4-하이드록실라제(C4H)를, 특히 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드를, 및 가장 특히 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 또한 포함하는, 재조합 미생물.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서,
    플라본 신타제(FNS)를 암호화하는 이종 또는 내인성 핵산 서열을 또한 포함하는, 재조합 미생물.
  22. 제21항에 있어서,
    아라비돕시스 탈리아나, 로니세라 자포니카(Lonicera japonica), 로니세라 마크란토이데스(Lonicera macranthoides), 메디카고 트룬카툴라(Medicago truncatula), 오리자 사티바(Oryza sativa), 페트로셀리눔 크리스품(Petroselinum crispum), 포풀루스 델토이데스(Populus deltoides), 제아 마이스(Zea mays), 칼리스테푸스 키넨시스(Callistephus chinensis), 아피움 그라베올렌스(Apium graveolens), 메디카고 트룬카툴라(Medicago truncatula), 쿠미눔 시미눔(Cuminum cyminum), 아에투사 시나피움(Aethusa cynapium), 안젤리카 아르칸젤리카(Angelica archangelica), 코니움 마쿨라툼(Conium maculatum), 카멜리아 시넨시스(Camellia sinensis), 시나라 카르둔쿨루스 바르 시콜리무스(Cynara cardunculus var scolymus), 사우쑤레아 메두사(Saussurea medusa), 플렉트란투스 바르바투스(Plectranthus barbatus), 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis), 도르코세라스 하이그로메트리쿰(Dorcoceras hygrometricum), 안티리눔 마주스(Antirrhinum majus), 페릴라 프루테스센스 바르 크리스파(Perilla frutescens var crispa), 다흘리아 핀나타(Dahlia pinnata) 또는 에리트란테 레위시이(Erythranthe lewisii), 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 플라본 신타제(FNS)를, 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소로부터의 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서,
    - 시토크롬 P450 리덕타제(CPR)를 암호화하는 이종 핵산 서열; 및/또는
    - S-아데노실메티오닌 신테타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열;을 또한 포함하는, 재조합 미생물.
  24. 제23항에 있어서,
    미생물이 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)로부터, 또는 식물, 예를 들면, 카타란투스 로세우스(Catharanthus roseus) 또는 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 시토크롬 P450 리덕타제(CPR)를; 바람직하게는, 서열 번호: 25, 23, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 미생물이:
    - 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
    - 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
    - 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
    - 서열 번호: 45 또는 123으로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
    - 서열 번호: 53으로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
    - 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
    - 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
    - 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 25로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호 117 및 119로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 103으로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
    - 서열 번호: 107로부터 선택된 서열을 포함하는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;을 포함함을 특징으로 하는, 재조합 미생물.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서,
    미생물이 효모 또는 세균, 바람직하게는 사카로마이세스 속의 효모, 특히 사카로마이세스 세레비지아에, 또는 세균, 예를 들면, 에스케리키아 콜라이(Escherichia coli)인, 재조합 미생물.
  27. 디오스민 및/또는 헤스페리딘의 생산을 위한, 제1항 내지 제26항 중 어느 한 항에 따른 재조합 미생물의 용도.
  28. 제1항 내지 제26항 중 어느 한 항에 따른 재조합 미생물을 배양하는 단계 및 디오스민 및/또는 헤스페리딘을 수거(harvesting)하는 단계를 포함하는, 디오스민 및/또는 헤스페리딘의 생산 방법.
  29. 헤스페리딘의 생산을 위한, 제27항에 따른 용도 또는 제28항에 따른 방법.
  30. 디오스민의 생산을 위한 제27항에 따른 용도 또는 제28항에 따른 방법.
  31. 헤스페리딘 및 디오스민의 생산을 위한, 제27항에 따른 용도 또는 제28항에 따른 방법.
  32. 나린게닌, 아피게닌, 에리오딕티올, 루테올린, 헤스페레틴 및/또는 디오스메틴이 배양 배지에 보충되지 않음을 특징으로 하는, 제27항, 제29항, 제30항 및 제31항 중 어느 한 항에 따른 용도 또는 제28항 내지 제31항 중 어느 한 항에 따른 방법.
KR1020217028541A 2019-02-11 2020-02-11 미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법 KR20210126061A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19305163.8 2019-02-11
EP19305163 2019-02-11
PCT/EP2020/053503 WO2020165189A1 (fr) 2019-02-11 2020-02-11 Methode de biosynthese de la diosmine et/ou de l'hesperidine dans un microorganisme

Publications (1)

Publication Number Publication Date
KR20210126061A true KR20210126061A (ko) 2021-10-19

Family

ID=65635605

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217028541A KR20210126061A (ko) 2019-02-11 2020-02-11 미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법

Country Status (7)

Country Link
US (1) US11987829B2 (ko)
EP (1) EP3924498A1 (ko)
KR (1) KR20210126061A (ko)
CN (1) CN113574177A (ko)
BR (1) BR112021015766A2 (ko)
CA (1) CA3129605A1 (ko)
WO (1) WO2020165189A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220031771A1 (en) * 2020-07-31 2022-02-03 Iowa State University Research Foundation, Inc. Microencapsulated and chromosome integrated compositions for l-dopa microbiome therapy
CN112391360B (zh) * 2020-11-04 2022-09-06 江南大学 黄酮3β-羟化酶还原酶突变体及其应用
CN112391397B (zh) * 2020-11-25 2023-01-31 云南中烟工业有限责任公司 一种烟草黄酮单加氧酶基因NtCYP75B2及其应用
CN112921049B (zh) * 2021-02-06 2024-01-23 石河子大学 一种用于生产香草醛的基因片段、酿酒酵母工程菌及其构建方法
CN112725256B (zh) * 2021-02-22 2023-01-20 湖南省农产品加工研究所 重组大肠杆菌及利用重组大肠杆菌生物合成香叶木素的方法
CN114181964B (zh) * 2021-11-02 2023-06-09 云南大学 一种表达盒组合、重组载体和重组酿酒酵母及其应用
CN114164161B (zh) * 2022-02-15 2022-05-13 佛山市汇腾生物技术有限公司 一种生产新橙皮苷的双酶共表达菌株及其构建方法和应用
CN114574458B (zh) * 2022-02-28 2023-07-18 江南大学 可以提高柚皮素产量的查尔酮合成酶突变体
CN117330677B (zh) * 2023-11-24 2024-02-23 成都凡微析医药科技有限公司 一种用于柑橘黄酮片生物等效性研究的香叶木素和橙皮素定量检测的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8809028B2 (en) 2011-11-07 2014-08-19 University Of Georgia Research Foundation, Inc. Biosynthesis of caffeic acid and caffeic acid derivatives by recombinant microorganisms
EP3083937B1 (en) 2013-12-20 2019-03-13 Deinove Is-targeting system for gene insertion and genetic engineering in deinococcus bacteria
ES2909313T3 (es) 2016-08-30 2022-05-06 Chengdu Okay Pharmaceutical Co Ltd Método de preparación de diosmina
CN108504680A (zh) * 2018-03-01 2018-09-07 华中农业大学 一种橙皮苷的制备方法
WO2019076021A1 (zh) * 2018-04-25 2019-04-25 邦泰生物工程(深圳)有限公司 一种橙皮素的制备方法、橙皮素中间体的制备方法和用于制备橙皮素的生物酶

Also Published As

Publication number Publication date
WO2020165189A1 (fr) 2020-08-20
US11987829B2 (en) 2024-05-21
BR112021015766A2 (pt) 2021-11-03
US20220042061A1 (en) 2022-02-10
CA3129605A1 (fr) 2020-08-20
CN113574177A (zh) 2021-10-29
EP3924498A1 (fr) 2021-12-22

Similar Documents

Publication Publication Date Title
KR20210126061A (ko) 미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법
US20210198711A1 (en) Production of steviol glycosides in recombinant hosts
US11807888B2 (en) Production of steviol glycoside in recombinant hosts
AU2020200157B2 (en) Recombinant production of steviol glycosides
CN113748204A (zh) 在微生物中生物合成香叶木素和/或橙皮素的方法
KR101827230B1 (ko) 디올의 제조 방법
KR101983115B1 (ko) 사프란 화합물의 재조합 생성을 위한 방법 및 물질
CN107771214B (zh) 用于具有增加的2,4-二羟基丁酸外排物的优化的2,4-二羟基丁酸产生的修饰的微生物
KR20170025315A (ko) 3-hp를 생산할 수 있는 재조합 효모 및 이를 이용한 3-hp의 제조방법
KR20180132696A (ko) 재조합 숙주에서의 스테비올 글리코사이드의 생산
CN114207108A (zh) 产生糖基化大麻素的基因修饰的宿主细胞
WO2018211032A1 (en) Production of steviol glycosides in recombinant hosts
US20190071474A1 (en) Production of gibberellins in recombinant hosts
AU2018200459A1 (en) Recombinant production of steviol glycosides
CN114317306B (zh) 一种合成白藜芦醇的基因工程菌株及其构建方法与应用
KR20220088729A (ko) 폴리아민 콘쥬게이트를 생산하는 효모